性能最高优化6.9倍 字节跳动开源大模型训练框架veGiantModel

  • 电脑网络维修
  • 2024-11-15

近日,字节跳动运行机器学习团队开源了一款名为 veGiantModel 的大模型训练框架,该训练框架关键运行于人造言语处置畛域的大模型训练,最高可将大模型训练的性能优化6.9倍,大幅降落训练系统的压力。目前,字节跳动旗下的企业级技术服务平台火山引擎已在其机器学习平台上原生允许了 veGiantModel,该平台正在公测中 。

人造言语处置是人工智能研讨的一个关键畛域,旨在协助计算机了解、解释和运用人类言语。近些年,人造言语处置在运行方面取得了较为清楚的打破,关键是归功于 Bert、GPT、GPT-3 等预训练言语模型的遍及。可以说,预训练言语模型曾经成为人工智能畛域的基础设备。因为大模型的算法表现愈加出众,预训练言语模型在近几年出现出迅速向大模型开展的趋向。但是,模型体积的极速增长也对现有的训练系统带来了不小的应战,关键表现为显存压力、计算压力和通讯压力。

针对现有训练系统在大模型训练场景下的上述应战, 字节跳动运行机器学习团队提出了大模型训练框架 veGiantModel。

veGiantModel的中文称号叫做火山引擎大模型训练框架,是基于开源深度学习框架 PyTorch 、并在 Megatron 和 DeepSpeed 两大开源干流训练框架的基础之上构建的高性能大模型训练框架。

veGiantModel 可同时允许数据并行、算子切分、流水线并行 3 种散布式并行战略,并允许智能化和定制化的并行战略;基于字节自研的高性能异步通讯库 ByteCCL,veGiantModel 的训练义务吞吐相比其余干流开源框架有 1.2 倍到 3.5倍的优化,并且提供了更友好、灵敏的流水线允许,降落了模型开发迭代所须要的人力;另外,veGiantModel 可在 GPU 上高效地允许数十亿至上千亿参数量的大模型,对网络带宽要求也更低,在私有化部署时无 RDMA 强依赖。

与 Megtraon 和 DeepSpeed 的对比测试显示,veGiantModel 的性能表现最好、受网络带宽影响最小,在Tesla V100上较上述两者有1.2 倍到3.5倍的优化,在 Ampere A100上最高可优化6.9倍。

veGiantModel开源 地址:

火山引擎机器学习平台 公测地址:

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/7167.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号