阿里开源首个“混合推理模型”:集成“快思考”、“慢思考”能力
创始人
2025-04-29 16:04:14
0

阿里开源了其首个具备"快思考"与"慢思考"能力的混合推理大模型。

4月29日凌晨,阿里巴巴宣布开源新一代通义千问模型Qwen3(简称千问3),该模型集成了“快思考”与“慢思考”。阿里方面表示,Qwen3部署成本上较Deepseek等大模型显著降低。

千问3旗舰版和32B版本在部分基准测试中的得分。来源:通义千问

据介绍,Qwen3系列采用的“混合专家(MoE)架构”,能够模仿人类思考问题的方式,对复杂问题可多步骤“深度思考”,对简单需求可低算力“秒回”答案,极大节省算力消耗。阿里称,这种混合推理模型还能够灵活满足AI应用和不同场景对性能和成本的多样需求。澎湃科技注意到,Anthropic和Alphabet的谷歌以及DeepSeek等其他开发者也在模型中采用了该架构。

自从DeepSeek发布以低成本高性能著称的R1 模型抢占OpenAI风头之后,近两个多月以来,国内科技公司开始迅速向市场推出一系列成本较低的AI模型服务。比如,以百度、科大讯飞等为代表的国内科技企业也纷纷加注国产模型升级浪潮,密集推出低成本AI服务。百度发布新一代文心一言模型4.5和X1,多模态理解、文本和逻辑推理能力显著提升;火山引擎正式发布豆包1.5深度思考模型,实现更低延迟;科大讯飞全新升级深度推理大模型讯飞星火X1。

当前,阿里巴巴正围绕Qwen系列构建其AI战略版图。今年2月,阿里巴巴集团CEO吴泳铭提到,该公司的“首要目标”已转向实现通用人工智能(AGI),即打造具有人类级认知能力的智能系统。未来三年,阿里将投入超过3800亿元人民币,用于建设云和AI硬件基础设施,总额超过去十年总和。吴泳铭还表示,“阿里巴巴将加速云和AI硬件基础设施建设,助推全行业生态发展。”

阿里云方面表示,阿里通义已开源200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越美国Llama,成为全球第一开源模型。

国际科技巨头同样也在加速模型优化布局。就在阿里开源通义千问模型Qwen3,29日,OpenAI 也发布了 ChatGPT 的多项功能更新,包括对购物功能的支持和优化。

从今天开始,当用户搜索产品时,ChatGPT会提供一些推荐,展示这些产品的图片和评论,并提供指向用户购买产品的网页的直接链接。目前,OpenAI 正在尝试涵盖时尚、美妆、家居用品和电子产品等类别。ChatGPT 这次更新对更多生活场景进行了优化,继续朝着超级消费级应用的方向小步快跑。

相关内容

热门资讯

《决胜巅峰》游镰怎么玩 游镰技...   决胜巅峰游镰:技能、出装及玩法详解   在MOBA手游《决胜巅峰》中,游镰凭借其强大的法术输出能...
中国电信集团拟清仓离场!650... 【大河财立方消息】 2月13日消息,汉口银行2460万股股份在上海联合产权交易所挂牌转让,底价650...
加沙地带陷入严重水危机 以军围... 以军对加沙地带北部持续进行围困,使得当地的饮水难问题愈发严峻。在加沙城,无数家庭每日为了一桶水四处奔...
江陵县六合垸管理区举办"家国同... 荆楚网(湖北日报网)讯(通讯员 朱民)金秋送爽,丹桂飘香。9月29日下午,荆州市江陵县六合垸农垦文化...
中国农业发展银行原总监兼内部审... 2025年4月23日,贵州省黔东南苗族侗族自治州中级人民法院一审公开开庭审理了中国农业发展银行原总监...
伊朗表示不会放弃回应以色列“侵... 新华社德黑兰10月28日电(记者姚兵 陈霄)伊朗外交部发言人巴加埃28日在记者会上表示,伊朗不会放弃...
村民开小货车给农机买柴油被罚3... 极目新闻评论员 屈旌 12月13日,安徽淮南村民顾小虎(化名)反映,他开小货车去加油站购买柴油给农机...
揭开光明的希望:爱眼公益行助力... 在湘潭市分水乡,一个充满温暖与希望的活动正在进行。刘阿姨,今年72岁,自从确诊为白内障后,她的生活体...
两天对叙空袭约310次 专家称... 叙利亚正处于过渡关键期,而目前火药味却仍未散去。以色列一面声称不会干涉叙利亚内政,一面却频频对叙利亚...
黄河科技学院附属中学:适合学生... 教育的艺术不在于传授,而在于激励鼓励和唤醒。诞生于1997年的黄河科技学院附属中学,深耕特色教育20...