超GPT 阿里史上最大规模开源颁布

  • 电脑网络维修
  • 2024-11-15

当天清晨,阿里巴巴官宣了史上最大规模的开源颁布,推出了基础模型Qwen2.5、公用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。

这三大类模型一共有10多个版本,包含0.5B、1.5B、3B、7B、14B、32B和72B,实用于团体、企业以及移动端、PC等不同人群不同业务场景的模型。

假设不想启动繁琐的部署,阿里还开明了旗舰模型Qwen-Plus 和 Qwen-Turbo的API,协助你极速开发或集成生成式AI配置。

开源地址:

Github:

在线demo:

API地址:

上方「AIGC开明社区」具体为大家引见这些模型的性能特点以及测试结果。

Qwen2.5系列性能测试

本次阿里开源的最大版本指令微调模型Qwen2.5-72B在MMLU-Pro

MMLU-redux、GPQA、MATH、GSM8K、HumanEval、MBPP等世界出名基准测试平台的测试结果显示。

只管Qwen2.5只要720亿参数,但在多个基准测试中击败了Meta领有4050亿参数的最新开源Llama-3.1指令微调模型 ;片面超越了Mistral最新开源的Large-V2指令微调模型,成为目前最弱小参数的开源模型之一。

即使是没有启动指令微调的基础模型,其性能雷同超越Llama-3-405B。

阿里开明API的旗舰模型Qwen-Plus,其性能可以媲美闭源模型GPT4-o 和Claude-3.5-Sonnet。

此外,Qwen2.5系列初次引入了140 亿和320亿两种新参数模型,Qwen2.5-14B 和 Qwen2.5-32B。

指令微调模型的性能则超越了谷歌的Gemma2-27B、微软的Phi-3.5-MoE-Instruct, 与闭源模型GPT-4o mini相比,只要三项测试略低其余基准测试所有超越

自阿里颁布CodeQwen1.5 以来,吸引了少量用户经过该模型成功各种编程义务,包含调试、回答编程关系的疑问以及提供代码倡导。

本次颁布的Qwen2.5-Coder-7B指令微调版本,在泛滥测试基准中,击败了那些出名且有较大参数的模型。

前不久阿里初次颁布了数学模型Qwen2-Math,本次颁布的Qwen2.5-Math 在更大规模的高品质数学数据上启动了预训练,包含由 Qwen2-Math 生成的分解数据。同时参与了对中文的允许,并经过CoT、PoT和 TIR的才干来增强其推理才干。

其中,Qwen2.5-Math-72B的全体性能逾越了Qwen2-Math-72B指令微和谐驰名闭源模型GPT4-o。

其实从上方这些测试数据不美观出,即使是参数很小的模型,在品质数据和架构的协助下,雷同可以击败高参数模型,这在能耗和环境部署方面领有相当大的长处。而阿里本次颁布的Qwen2.5系列将小参数模型的性能施展到了极致。

Qwen2.5系列便捷引见

Qwen2.5系列允许中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文等超越29种支谣言语。与 Qwen2相似,Qwen2.5言语模型允许高达 128K tokens,并能生成最多 8K tokens的内容。

与Qwen-2相比, Qwen2.5系列的预训练数据大幅度增长到达了惊人的18万亿tokens,超越了Meta最新开源Llama-3.1的15万亿 ,成为目前训练数据最多的开源模型。

常识才干清楚增强,Qwen2.5在 MMLU 基准测试中,与 Qwen2-7/72B 相比从70.3提高到74.2,从84.2提高到86.1 。Qwen2.5 在 GPQA/MMLU-Pro/MMLU-redux/ARC-c 基准测试上也有显着改良。

Qwen2.5能够生成更合乎人类偏好的照应,与Qwen2-72B-Instruct相比,Qwen2.5-72B-Instruct的Arena-Hard分数从48.1显着提高到81.2 ,MT-Bench分数从9.12提高到9.35 。

数学才干取得增强,在融合了Qwen2-math的技术后,Qwen2.5的数学才干也获取了极速优化。在MATH基准上,Qwen2.5-7B/72B-Instruct的得分从Qwen2-7B/72B-Instruct的52.9/69.0提高到75.5/83.1。

此外,Qwen2.5在指令跟踪、生生长文本(从1k参与到超越8K标志)、了解结构化数据(例如表格)以及生成结构化输入(尤其是JSON)方面成功了显着改良。同时对系统揭示的多样性更具弹性,增强了聊天机器人的角色表演实施和条件设置。

原文链接:​ ​​ ​

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/5933.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号