Planning大揭秘 轻松拿捏多方案选用! Agent

  • 电脑网络维修
  • 2024-11-15

在人工智能的环球里,我们经常面临一个应战:如何让机器像人类一样,面对复杂义务时,能够生成多种或许的处置方案,并从当选用最优的方案呢?这正是“多方案选用”(Multi-Plan Selection)要处置的疑问。当天,我们就来聊聊这个幽默的话题。

首先,构想一下,假设我们的智能Agent面对一个复杂的疑问,它或许会生成多个方案。然而,这些方案或许各不相反,甚至有些或许基本无法行。这时刻,多方案选用就派上用场了。它包含两个重要步骤:多方案生成和最优方案选用。

在多方案生成阶段,LLMs会尝试生成一系列或许的方案。这就像是在头脑风暴,尽或许多地提出处置方案。干流的方法会应用生成模型在解码环节中的不确定性,比如经过温度采样或top-k采样来取得多个不同的推理门路。在Tree-of-thought的钻研中, 提到了2种生成planing的战略:sample、propose, sample战略与 Self-consistency战略分歧,在解码环节中,LLM会采样多个plan。propose则是经过在揭示中经常使用大指示例明白指点LLM生成各种plan。

接上去是最优方案选用阶段,这里Agent须要从多个候选方案当选用一个最好的。这个环节就像是在一堆方案中筛选出最闪亮的那一个。不同的战略会驳回不同的启示式搜查算法,比如繁难的少数投票战略,或许应用树结构来辅佐多方案搜查。在Self-consistency中经常使用了一个繁难的直觉,即复杂疑问的处置方案很少且是惟一的。Self-consistency 运行了一种豪华的少数投票战略,将得票最多的方案视为最优选用。在Tree-of-Thought中应用树状结构允许树搜查算法,如传统的bfs和dfs。在选用要裁减的节点时,经常使用LLM评价多个举措并选用最优的一个。

然而,多方案选用虽然无实践上看起来很美,实践上却面临着一些应战。首先,它会参与计算需求,尤其是关于大模型来说,计算老本或许会十分高。其次,依赖于LLM来评预方案的功能,这自身还存在不确定性,须要进一步的验证和调整。

不过,别担忧,虽然存在这些应战,多方案选用的长处也是显而易见的。它能够提供更宽泛的潜在处置方案探求,协助Agent在宽广的搜查空间中找到最佳门路。而且,随着技术的开展,我们有理由置信,这些疑问都将获取处置。

本文转载自​​,作者:

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:http://www.duobeib.com/diannaowangluoweixiu/5587.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号