腾讯混元团队发布高性能推理模型混元T1正式版
创始人
2025-03-24 14:41:09
0

2025-03-22 01:42:32 作者:狼叫兽

3月21日消息,腾讯混元团队正式发布了自主研发的深度推理模型——混元T1正式版。据官方介绍,这款模型具备快速响应、擅长处理超长文本的特点,是腾讯自主研发的高性能推理模型。

混元T1通过大规模强化学习技术,结合数学、逻辑推理、科学知识以及代码优化等专项训练,显著提升了其推理能力。在展示推理模型基础能力的多个基准测试中,例如大型语言模型评估数据集MMLU-PRO中,混元T1获得了87.2分,表现仅次于某知名模型o1。此外,在CEval、AIME、Zebra Logic等一系列中英文知识和竞赛级数学、逻辑推理的公开基准测试中,混元T1的表现也达到了行业领先水平。

混元T1在多种对齐任务、指令跟随任务以及工具使用任务中表现出极高的适应性。官方表示,混元T1正式版延续了混元Turbo S的创新架构,采用了Hybrid-Mamba-Transformer融合模式。这是业内首次将混合Mamba架构成功应用于超大型推理模型。这一架构不仅降低了传统Transformer结构的计算复杂度,还减少了KV-Cache的内存占用,从而大幅降低了模型训练与推理的成本。

同时,混元T1在超长文本推理领域展现了独特的优势。凭借强大的长文捕捉能力,混元T1能够有效解决长文本推理过程中常见的上下文丢失及长距离信息依赖问题。混合Mamba架构经过专项优化,采用高效的计算方式,在确保长文本信息捕捉能力的同时,大幅降低了资源消耗。在激活参数量相近的情况下,解码速度提升至原来的两倍。

相关内容

热门资讯

原创 预... 从销量上来看,两千元左右的手机更受大众消费者的喜爱,这其中爆发了不少爆款手机,而国内各大手机厂商也都...
“最准最快最久最少”纷纷亮相,... 医疗器械及医药保健展区一直都是进博会上“最卷”的展区之一。要得到关注,不拿出“绝活”不行。在本届进博...
eaapp错误代码ec201怎... eaapp是许多玩家常用的游戏平台之一,像ea的体育竞技类游戏,在游戏市场中热度极高。但一些玩家在使...
新型显示产业前景广阔 ● 本报记者 康曦 12月19日-20日,以“显示无处不在·映照万千气象”为主题的世界显示产业创新发...
大模型专题:6G网络面向大模型... 今天分享的是:大模型专题:6G网络面向大模型的分布式学习白皮书 报告共计:24页 6G网络愿景是实现...
努比亚Z70 Ultra星空版... 近日,努比亚手机官方宣布,其最新旗舰机型Z70 Ultra星空典藏版将于2024年11月21日正式发...
原创 千... 在上个月联发科抢先高通,率先发布了自己的新款旗舰处理器天玑9400,并且在新机这块也比搭载高通的骁龙...
空净十大品牌IAM“净润大师”... 11月5日,第七届中国国际进口博览会在上海拉开帷幕。本届进博会立足全球视野和创新科技,为推动中国高水...
星海系列:人形机器人与AI大模... 今天分享的是:星海系列:人形机器人与AI大模型之Robot+AI的Transformer之旅 报告共...
经济日报观察:国产手机为何集体... 近1个月来,国产手机新品密集发布。华为终端负责人日前在社交媒体透露,备受关注的华为Mate70系列手...