Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 11|回復: 0

像这种大模型可以让你输入

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 16:10:33 | 顯示全部樓層 |閱讀模式
路径制定 以“从交互中发掘潜在需求”这个例子分享下我的一些思考在最开始的拆解中我分解了三个初始问题 定义什么叫“潜在需求” 交互中包含什么可以利用的信息 如何进行发掘的流程设计 在前面我做了第一个问题的分析下面两个问题因为涉密用户和业务信息了我就简要阐述下 ① 交互中包含的可以利用的信息 实际上这个是经典的信息论原理的利用一般应用到的会包括以下两点同样的我以非算法的视角阐述下我的理解  信息的输入一定要大于输出存在冗余才能通过算法压缩输出需要的信息并且还原信息。 通俗点比如模型完全没有学习过小学数学就不可能可以解决小学数学题。



很短的几句话就帮你写出论文原因在于本质上是一个语言模型是语 马来西亚手机号码数据 言模型训练过程输入压缩了相关的知识信息因此才可以在很少输入的情况下让语言模型补足需要的输出。其实从计算小学内容经常出错也可以看出这个原理因为这类信息不在的训练数据中。 另一个直观的理解方式是给定的输入就最多只能有的输出不可能产生实际上需要冗余信息才可以保证压缩传递后能够输出一样的结果即的输入产生的输出因为处理就一定会损失一些东西有冗余才可以容忍更多处理空间。  引入解决问题需要的更多维度尤其是正交维度的信息就可以显著提升模型效果。





其实这也是最常用的大幅优化效果的方式例如在语音类的设计中用户输入的语音音频和用户的语言表达就是两个不重叠的正交维度即使一些纯粹的语音能力例如声纹识别语音合成引入语言的维度也可以大幅提升效果因此寻找需要解决场景的更多相关正交维度就是一种最常见的优化方式。 当然信息论的原理有很多条只是在这件事上我主要应用了以上两条。因为的基础是信息论即使是在大模型时代信息论的基本原理就像物理学基本法则属于目前基于统计的无法逾越的基本法则。

回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|z

GMT+8, 18:31 , Processed in 0.038474 second(s), 18 queries .

抗攻擊 by GameHost X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |