的草莓模型浴火新生 AI新思索

电脑网络维修
2024-11-14

“这个模型必需比我更长于处置 AP 数学考试，而且我在大学时辅修数学，”OpenAI 的首席钻研官鲍勃·麦格鲁（Bob McGrew）通知我。他说，OpenAI 还依据国内数学奥林匹克竞赛的资历考试对 o1 启动了测试，只管 GPT-4o 只正确处置了 13% 的疑问，但 o1 的得分为 83%。

OpenAI颁布名为o1新模型，这是全新“推理”模型系列中的第一个，这些模型经过训练可以比人类更快地回答更复杂的疑问。它与o1-mini一同颁布，o1-mini是一个更小而且较为廉价的版本。这实践上就是之前炒作的奥秘版本“草莓模型”。

o1与以前的模型相比，它在编写代码和处置多步骤疑问方面做得愈加的杰出。但它也比GPT-4o的带来更多的费用。o1目前处于预览版本的形态。

商业经常使用的不要钱还是十分低廉，经常使用传统的API调用，o1-preview每100万个输入Token不要钱15美元，每100 个输入令牌不要钱60美元。相比之下，GPT-4o的老本为每100万个输入Token不要钱5美元，每 100万个输入Token不要钱15美元。

1.面前的意义

o1在针对疑问做出照应之前花更多期间思索疑问，就像一团体一样。经过培训，他们学会完善自己的思想环节，尝试不同的战略，并意识自身失误。在披露的测试中，它在数学和编码方面体现杰出。在国内数学奥林匹克竞赛（IMO）的资历考试中，GPT-4o仅正确处置了13%的疑问，而推理模型得分为83%。它的编码才干在较量中失掉了评价，并在Codeforces 较量中到达了第89个百分位。

作为早期模型，它还不具有使 ChatGPT有用的许多配置，例如阅读网页以失掉消息以及上行文件和图像。关于许多经常出现状况，GPT-4o在短期内会更有才干。但是在复杂的推理畛域，这是一个严重提高，代表了AI才干的新打破。因此OpenAI将计数重视置回1并将此系列命名为OpenAI o1。

2.实用场景

o1比拟适宜迷信、编码、数学和相似畛域的复杂疑问，这些增强的推理配置或者特意有用。例如，医疗保健钻研人员可以经常使用它来注释细胞测序数据，物理学家可以经常使用它来生成量子光学所需的复杂数学公式，一切畛域的开发人员都可以经常使用它来构建和口头多步骤上班流程。

除了考试和学术基准之外，OpenAI还评价人类对o1-preview与GPT-4o在更多宽泛畛域中的对比。在这项评价中，人类对来自o1-preview和GPT-4o 的揭示启动了匿名投票以便于选出他们更青睐哪种模型。O1-Preview在数据剖析、编码和数学等推理密集型类别中比 GPT-4O更受欢迎。但是在某些人造言语义务中，o1-preview不是首选，这标明它并不适宜一切用例。

本文转载自，作者：

关注微信

上一篇：深化留意力机制 LLM基础模型系列

下一篇：ViT篇外 Llama NVIDIA

本网站的文章部分内容可能来源于网络和网友发布，仅供大家学习与参考，如有侵权，请联系站长进行删除处理，不代表本网站立场，转载联系作者并注明出处：https://duobeib.com/diannaowangluoweixiu/5416.html

的草莓模型浴火新生 AI新思索

1.面前的意义

2.实用场景

猜你喜欢

热门标签

随便看看

TCP发送窗口接纳窗口以及其上班原理

I 如何发现 PostgreSQL 和中那些消耗 CPU

如何改良DevOps上班流

安保无大事安保防范从Nginx性能做起程序员安保规范

斯坦福学者提出Edu

热门资讯

阅读排行

对抗的发生十失业的程序员

Web开发人员有用的代码比拟工具

电脑城教你如何将本地 Windows 文件夹挂载到 Linux 系统上？

内容中心

Win8开机黑屏有鼠标的原因及解决方法

关注我们

的草莓模型 浴火新生 AI新思索

1.面前的意义

2.实用场景

猜你喜欢

热门标签

随便看看

热门资讯

阅读排行

关注我们

微信公众号

的草莓模型浴火新生 AI新思索