大语言模型的零样本自适应提示

ditihekhatun15 · 發表於 16:08:14

发布人云人工智能团队学生研究员万星辰和研究科学家孙若曦大型语言模型的最新进展非常有前途这反映在它们在少样本和零样本设置中解决一般问题的能力即使没有对这些任务进行明确的训练。这是令人印象深刻的因为在几次镜头设置中法学硕士在给出测试问题之前只看到了一些问答演示。更具挑战性的是零样本设置其中仅通过测试问题直接提示法学硕士。尽管少样本设置极大地减少了针对特定用例调整模型所需的数据量但在某些情况下生成示例提示仍然具有挑战性。例如为通用模型涵盖的广泛任务手工制作少量演示可能很困难或者对于看不见的任务来说是不可能的。例如对于长文章摘要或需要领域知识的任务例如医学问答生成示例答案可能具有挑战性。在这种情况下具有高零样本性能的模型非常有用因为不需要手动生成提示。

然而零样本性能通常较弱因为法学硕士没有提供指导因此容易出现虚假输出。在上发表的中我们提出了基于一致性的自适应提示来解决这一困境。是一种用于推 爱沙尼亚 WhatsApp 号码列表 理问题的零样本自动提示方法仅使用未标记的样本通常很容易获得和模型自己的预测来仔细选择和构建的伪演示。通过我们在很大程度上缩小了零样本和少样本之间的性能差距同时保留了零样本提示的理想通用性。我们遵循这一点提出了通用自适应提示并在上被接受我们将这一想法扩展到广泛的通用自然语言理解和自然语言生成任务中并证明了其有效性。用自己的输出提示法学硕士知道法学硕士受益于演示并且至少具有一些零样本能力我们想知道模型的零样本输出是否可以作为模型提示自身的演示。挑战在于零样本解决方案是不完美的我们冒着给法学硕士提供低质量演示的风险这可能比根本没有演示更糟糕。

确实下图表明在问题中添加正确的演示可以导致测试题的正确答案演示带问题而添加不正确的演示演示问题演示带问题会导致错误答案。因此我们需要选择可靠的自生成演示。推理任务的输入和输出示例说明了需要为上下文演示精心设计选择程序数据集和模型没有演示的零样本思想链逻辑正确但错误的答案正确演示及正确答案正确但重复的演示导致重复的输出错误的演示导致答案错误但再次组合和会得出正确答案。利用了法学硕士的一个关键观察结果自信且一致的预测更有可能是正确的。当然这一观察结果取决于法学硕士的不确定性估计有多好。幸运的是在大型模型中之前的工作表明不确定性估计是稳健的。由于测量置信度仅需要模型预测而不需要标签因此我们建议将其用作正确性的零样本代理。然后将高置信度输出及其输入用作伪演示。

		自動登錄	找回密碼
密碼			立即註冊