蚂蚁集团,AI重大突破!
创始人
2025-03-25 09:20:49
0

蚂蚁集团使用国产AI芯片训练大模型,成本可进一步降低。

近日,蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示,蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿),两者性能均达到行业领先水平。

除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE(混合专家)大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

在低性能硬件上高效训练的自研大模型

目前,蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已发表在预印版Arxiv平台上。

据技术成果论文,虽然DeepSeek、阿里通义千问、MiniMax等系列的MoE大模型在特定任务中展现出卓越性能,但是MoE模型的训练通常依赖高性能计算资源(如英伟达H100/H800等先进GPU),高昂成本制约了在资源受限环境中的普及应用。同时,近年来英伟达高性能芯片持续短缺,相比之下,低性能加速器供应更充足且单机成本更低。这种差异凸显了构建跨异构计算单元与分布式集群无缝切换技术框架的必要性。

因此,Ling团队设定的目标是“不使用高级GPU”来扩展模型,并通过提出创新性的训练策略,旨在突破资源与预算限制实现高效大语言模型训练,从而推动AI技术向普惠化方向发展。

具体而言,团队提出的创新策略包括:1)架构与训练策略革新:动态参数分配与混合精度调度技术;2)训练异常处理机制升级:自适应容错恢复系统缩短中断响应时间;3)模型评估流程优化:自动化评测框架压缩验证周期超50%;4)工具调用能力突破:基于知识图谱的指令微调提升复杂任务执行精度。

据技术论文,Ling团队在五种不同的硬件配置上对9万亿个token进行Ling-Plus的预训练,其中使用高性能硬件配置训练1万亿token的预训练成本约为635万元人民币,但利用蚂蚁的优化方法后,使用低规格硬件的训练成本将降至508万元左右,节省了近20%,最终实现与阿里通义Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相当的性能。

此前,DeepSeek通过一系列算法创新及工程优化,使用性能较低的英伟达H800训练出了性能与顶尖模型相当的V3与R1,为大模型的训练开辟了新的道路,让更多的企业和研究机构看到了降低成本、提高效率的可能性。如果蚂蚁集团的技术成果得到验证及推广,意味着国产大模型能够寻找成本更低、效率更高的国产芯片或其他替代方案,以进一步降低对英伟达芯片的依赖。

蚂蚁持续加码AI应用与人形机器人

记者了解到,百灵大模型作为蚂蚁集团自研的大模型,重点布局在生活服务、金融服务、医疗健康等场景的应用。去年5月,蚂蚁在开放日上对外展示了多个AI创新应用产品,并首次公布了AI应用矩阵。蚂蚁集团CTO何征宇透露,基于蚂蚁百灵大模型的三个应用是蚂蚁当下重点破局方向:生活管家、就医助理及金融助手。

3月21日,蚂蚁宣布AI医疗领域的最新进展:发布面向医疗机构、医生、用户三端的AI产品体系升级,其中,面向医疗机构,我们联合华为医疗卫生军团、阿里云、苹果等推出“蚂蚁医疗大模型一体机”全栈式解决方案;面向医生,发布AI医生助手系列工具;同时,面向用户的健康应用“AI健康管家”也推出智能思考、健康自测等十余项新功能。

除了AI以外,蚂蚁近期在人形机器人领域也动作频频。今年2月,某招聘平台信息显示,蚂蚁集团开放招聘具身智能人形机器人系统和应用等岗位,年薪高达百万元。而早在去年12月,蚂蚁集团就注册成立了上海蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发。

据浦东发布消息,3月11日,上海蚂蚁灵波科技有限公司在上海浦东举行揭牌仪式。据介绍,蚂蚁灵波科技是蚂蚁集团拓展具身智能和机器人业务的主要载体,致力在家庭、养老、医疗健康等领域打造行业领先的机器人产品,此番落地将与浦东携手共进,在未来产业新赛道上相互促进、共谋发展,助力浦东加快技术引领、行业集聚、产业升级步伐,打造以人形机器人为引领的具身智能创新高地和具有行业影响力的创新产业生态。

具身智能人形机器人作为新兴领域,具有广阔的市场前景和巨大的商业潜力。蚂蚁集团可能希望通过布局该领域,探索新的增长点,并推动人机交互的新体验。此外,具身智能人形机器人技术还可以与蚂蚁集团现有的金融科技业务产生协同效应,共同推动技术创新和业务升级。

业内人士分析称,具身智能人形机器人为新兴领域,市场前景广阔。蚂蚁集团布局该领域,有助于探索新的增长点,并基于自身在人工智能、大数据、云计算等方面的技术优势和已有业务布局,加速人形机器人的研发和在相关业务场景中的应用。

责编:叶舒筠

校对:彭其华

(进入报名页面)

相关内容

热门资讯

原创 预... 从销量上来看,两千元左右的手机更受大众消费者的喜爱,这其中爆发了不少爆款手机,而国内各大手机厂商也都...
“最准最快最久最少”纷纷亮相,... 医疗器械及医药保健展区一直都是进博会上“最卷”的展区之一。要得到关注,不拿出“绝活”不行。在本届进博...
eaapp错误代码ec201怎... eaapp是许多玩家常用的游戏平台之一,像ea的体育竞技类游戏,在游戏市场中热度极高。但一些玩家在使...
新型显示产业前景广阔 ● 本报记者 康曦 12月19日-20日,以“显示无处不在·映照万千气象”为主题的世界显示产业创新发...
大模型专题:6G网络面向大模型... 今天分享的是:大模型专题:6G网络面向大模型的分布式学习白皮书 报告共计:24页 6G网络愿景是实现...
努比亚Z70 Ultra星空版... 近日,努比亚手机官方宣布,其最新旗舰机型Z70 Ultra星空典藏版将于2024年11月21日正式发...
原创 千... 在上个月联发科抢先高通,率先发布了自己的新款旗舰处理器天玑9400,并且在新机这块也比搭载高通的骁龙...
空净十大品牌IAM“净润大师”... 11月5日,第七届中国国际进口博览会在上海拉开帷幕。本届进博会立足全球视野和创新科技,为推动中国高水...
星海系列:人形机器人与AI大模... 今天分享的是:星海系列:人形机器人与AI大模型之Robot+AI的Transformer之旅 报告共...
经济日报观察:国产手机为何集体... 近1个月来,国产手机新品密集发布。华为终端负责人日前在社交媒体透露,备受关注的华为Mate70系列手...