像这种大模型可以让你输入

mamun6846 · 發表於 16:10:33

路径制定以“从交互中发掘潜在需求”这个例子分享下我的一些思考在最开始的拆解中我分解了三个初始问题定义什么叫“潜在需求” 交互中包含什么可以利用的信息如何进行发掘的流程设计在前面我做了第一个问题的分析下面两个问题因为涉密用户和业务信息了我就简要阐述下 ① 交互中包含的可以利用的信息实际上这个是经典的信息论原理的利用一般应用到的会包括以下两点同样的我以非算法的视角阐述下我的理解信息的输入一定要大于输出存在冗余才能通过算法压缩输出需要的信息并且还原信息。通俗点比如模型完全没有学习过小学数学就不可能可以解决小学数学题。

很短的几句话就帮你写出论文原因在于本质上是一个语言模型是语马来西亚手机号码数据言模型训练过程输入压缩了相关的知识信息因此才可以在很少输入的情况下让语言模型补足需要的输出。其实从计算小学内容经常出错也可以看出这个原理因为这类信息不在的训练数据中。另一个直观的理解方式是给定的输入就最多只能有的输出不可能产生实际上需要冗余信息才可以保证压缩传递后能够输出一样的结果即的输入产生的输出因为处理就一定会损失一些东西有冗余才可以容忍更多处理空间。引入解决问题需要的更多维度尤其是正交维度的信息就可以显著提升模型效果。

其实这也是最常用的大幅优化效果的方式例如在语音类的设计中用户输入的语音音频和用户的语言表达就是两个不重叠的正交维度即使一些纯粹的语音能力例如声纹识别语音合成引入语言的维度也可以大幅提升效果因此寻找需要解决场景的更多相关正交维度就是一种最常见的优化方式。当然信息论的原理有很多条只是在这件事上我主要应用了以上两条。因为的基础是信息论即使是在大模型时代信息论的基本原理就像物理学基本法则属于目前基于统计的无法逾越的基本法则。

		自動登錄	找回密碼
密碼			立即註冊