腾讯混元团队发布高性能推理模型混元T1正式版
创始人
2025-03-24 14:41:09
0

2025-03-22 01:42:32 作者:狼叫兽

3月21日消息,腾讯混元团队正式发布了自主研发的深度推理模型——混元T1正式版。据官方介绍,这款模型具备快速响应、擅长处理超长文本的特点,是腾讯自主研发的高性能推理模型。

混元T1通过大规模强化学习技术,结合数学、逻辑推理、科学知识以及代码优化等专项训练,显著提升了其推理能力。在展示推理模型基础能力的多个基准测试中,例如大型语言模型评估数据集MMLU-PRO中,混元T1获得了87.2分,表现仅次于某知名模型o1。此外,在CEval、AIME、Zebra Logic等一系列中英文知识和竞赛级数学、逻辑推理的公开基准测试中,混元T1的表现也达到了行业领先水平。

混元T1在多种对齐任务、指令跟随任务以及工具使用任务中表现出极高的适应性。官方表示,混元T1正式版延续了混元Turbo S的创新架构,采用了Hybrid-Mamba-Transformer融合模式。这是业内首次将混合Mamba架构成功应用于超大型推理模型。这一架构不仅降低了传统Transformer结构的计算复杂度,还减少了KV-Cache的内存占用,从而大幅降低了模型训练与推理的成本。

同时,混元T1在超长文本推理领域展现了独特的优势。凭借强大的长文捕捉能力,混元T1能够有效解决长文本推理过程中常见的上下文丢失及长距离信息依赖问题。混合Mamba架构经过专项优化,采用高效的计算方式,在确保长文本信息捕捉能力的同时,大幅降低了资源消耗。在激活参数量相近的情况下,解码速度提升至原来的两倍。

相关内容

热门资讯

无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
东风汽车集团申请阻燃柔性固态电... 金融界2025年1月31日消息,国家知识产权局信息显示,东风汽车集团股份有限公司申请一项名为“一种阻...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
我市特步5G工厂入选国家5G工... 日前,工业和信息化部发布《关于2024年5G工厂名录的公示》,我市特步5G工厂入选国家5G工厂名录,...
卫星化学获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示卫星化学(002648)新获得一项实用新型专利授权,专利名为“...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
360智脑张向征:构建安全可信... 人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京...
原创 3... 一、iQOO 12 参考价格:2659元(12G+256G)。 性能强劲,游戏无忧 首先不得...
原创 预... 从销量上来看,两千元左右的手机更受大众消费者的喜爱,这其中爆发了不少爆款手机,而国内各大手机厂商也都...
宁德时代取得温度传感器相关专利... 金融界2024年12月19日消息,国家知识产权局信息显示,宁德时代新能源科技股份有限公司取得一项名为...