Sam Altman似乎真的没辙了?
继去年年底连发12天新功能,最后以Sora扑街收场后,今天早上OpenAI发布的GPT-4.5,又被各路网友骂疯。
简单概括一下GPT-4.5的关键信息。它不是推理模型,而是基础模型,OpenAI认为它的特点是知识更广、情商超高。
网友们认为,GPT-4.5虽然基准测试GPT-4o,但预训练计算量是GPT-4的10倍;代码能力虽然超越了DeepSeek-R1、o1、GPT-4o等模型,但赶不上Claude 3.7;每1M tokens输入价格为75刀,输出价格为150刀,是其他模型的10-100倍。
总之,被宣传了很久的GPT-4.5(也就是之前的Orion)一亮相,就因为价格昂贵、亮点不足,成为众矢之的。
网友们的失望或许可以理解。
毕竟,GPT-4.5是GPT-4之后的发布的新一代基座模型,大家理所当然地认为GPT-4.5也应该和GPT-4发布时一样惊艳。
再加上,中国AI公司的技术能力正在被全球认可,这让OpenAI更显尴尬。
从12月DeepSeek-V3以不到600万美元的训练成本出圈后,阿里、腾讯、字节、Kimi、阶跃、MiniMax等中国公司都在模型层和开源领域发力。甚至,前两天通义Wan2.1的发布会时间定在了晚间23点。
最新的重磅消息是,就在GPT-4.5发布的今天,百度官宣将于3月16日发布文心大模型4.5 。
2月27日,海外媒体路透社也爆料了百度文心将在3月中旬发布升级版的消息,还透露了该模型在推理等方面的能力将有所提升。
没想到今天百度就自己揭开了面纱。
公开资料显示,百度文心大模型是全球最早对标GPT的大语音大模型之一,并计划将在今年内发布5.0版本(OpenAI也预计在年内推出GPT-5)。
最近,百度的AI动作明显频繁了起来。
首先是CEO李彦宏“想开了”,开始拥抱开源。
而且,百度还打出“生态和免费”组合拳——文小言、百度搜索、百度智能云、文心智能体等产品全面接入DeepSeek;文心一言PC端和APP端将在4月1日全面免费;6月30日,开源文心大模型4.5系列。
(百度近期动态时间线)
接下来好奇的是,顶着百度史上最强大模型称号的文心4.5,会在哪些方面体现出不一样?
对比目前市面上主流的大模型,文心的特点是能力比较全面,具备深度思考、RAG、多模态、深度搜索、文生图、代码生成等功能。从这个角度,或许文心4.5会依旧坚持功能全面的路线。
(主流大模型开发能力对比,来源:百度)
其中,最值得期待的是模型的精准性。
百度基本是唯一强调RAG和iRAG的大模型公司——这和过去多年的搜索技术有关。去年百度公开的iRAG技术,主要特征就是大幅降低了图片生成的幻觉,而且成本很低。
之前百度APP的新年全球拜年的活动中,这一技术被数千万用户体验,玩出了不少“花活”。
距离上次发布也过去一年,又有不少数据和用户反馈沉淀了下来,相信这次文心大模型迭代应该会不会放过这个“杀手锏”,在去“ai味”和降低幻觉方面,应该会更加精进。
另一个好奇的点,是价格。
训练和推理成本是影响大模型价格的重要因素。一家公司是否敢开源、免费,与大模型不断降低的训练和推理成本相关。比如,DeepSeek刚刚结束的开源Week,就一直公开自家在底层Infra上的秘诀。
(DeepSeek开源Week速览,来源:钛媒体)
百度也持续布局AI Infra。
首先在芯片层它有昆仑芯万卡集群,可以在更少的计算资源下运行大规模模型(如DeepSeek-V3/R1)。另外,百度旗下百舸平台还通过高效并行化任务切分策略等方法,提升整体集群训练效率,保障集群有效训练率达到98%。飞桨也有很多大模型推理的自研技术。
李彦宏在2024年曾透露,自发布以来,文心大模型的推理成本已降低至一年前的1%。
至于马上就要面世的文心4.5,李彦宏则认为,文心大模型4.5将是百度有史以来最强大的大模型。
相信有Infra技术支撑,文心4.5的价格一定不会像GPT4.5一样离谱。
在更多细节上,李彦宏还预告文心4.5在将基础模型能力上大幅提升,还能具备原生多模态、深度思考等能力。路透社的消息中也透露,这个模型的推理能力将大幅提升。
百度至今还没有正式发布过自家的推理模型,这次预告文心4.5结合了多模态和深思考,似乎暗示它将是一个拥有高智商的基础模型。
作为国内最早对标GPT的文心,能延续中国AI卷向全球的神话吗?半个月后,答案即将揭晓。