创始人

2025-03-04 21:01:07

0次

Sam Altman似乎真的没辙了？

继去年年底连发12天新功能，最后以Sora扑街收场后，今天早上OpenAI发布的GPT-4.5，又被各路网友骂疯。

简单概括一下GPT-4.5的关键信息。它不是推理模型，而是基础模型，OpenAI认为它的特点是知识更广、情商超高。

网友们认为，GPT-4.5虽然基准测试GPT-4o，但预训练计算量是GPT-4的10倍；代码能力虽然超越了DeepSeek-R1、o1、GPT-4o等模型，但赶不上Claude 3.7；每1M tokens输入价格为75刀，输出价格为150刀，是其他模型的10-100倍。

总之，被宣传了很久的GPT-4.5（也就是之前的Orion）一亮相，就因为价格昂贵、亮点不足，成为众矢之的。

被中国AI卷到，OpenAI持续划水

网友们的失望或许可以理解。

毕竟，GPT-4.5是GPT-4之后的发布的新一代基座模型，大家理所当然地认为GPT-4.5也应该和GPT-4发布时一样惊艳。

再加上，中国AI公司的技术能力正在被全球认可，这让OpenAI更显尴尬。

从12月DeepSeek-V3以不到600万美元的训练成本出圈后，阿里、腾讯、字节、Kimi、阶跃、MiniMax等中国公司都在模型层和开源领域发力。甚至，前两天通义Wan2.1的发布会时间定在了晚间23点。

最新的重磅消息是，就在GPT-4.5发布的今天，百度官宣将于3月16日发布文心大模型4.5 。

2月27日，海外媒体路透社也爆料了百度文心将在3月中旬发布升级版的消息，还透露了该模型在推理等方面的能力将有所提升。

没想到今天百度就自己揭开了面纱。

文心4.5有什么花活？

公开资料显示，百度文心大模型是全球最早对标GPT的大语音大模型之一，并计划将在今年内发布5.0版本（OpenAI也预计在年内推出GPT-5）。

最近，百度的AI动作明显频繁了起来。

首先是CEO李彦宏“想开了”，开始拥抱开源。

而且，百度还打出“生态和免费”组合拳——文小言、百度搜索、百度智能云、文心智能体等产品全面接入DeepSeek；文心一言PC端和APP端将在4月1日全面免费；6月30日，开源文心大模型4.5系列。

（百度近期动态时间线）

接下来好奇的是，顶着百度史上最强大模型称号的文心4.5，会在哪些方面体现出不一样？

对比目前市面上主流的大模型，文心的特点是能力比较全面，具备深度思考、RAG、多模态、深度搜索、文生图、代码生成等功能。从这个角度，或许文心4.5会依旧坚持功能全面的路线。

（主流大模型开发能力对比，来源：百度）

其中，最值得期待的是模型的精准性。

百度基本是唯一强调RAG和iRAG的大模型公司——这和过去多年的搜索技术有关。去年百度公开的iRAG技术，主要特征就是大幅降低了图片生成的幻觉，而且成本很低。

之前百度APP的新年全球拜年的活动中，这一技术被数千万用户体验，玩出了不少“花活”。

距离上次发布也过去一年，又有不少数据和用户反馈沉淀了下来，相信这次文心大模型迭代应该会不会放过这个“杀手锏”，在去“ai味”和降低幻觉方面，应该会更加精进。

另一个好奇的点，是价格。

训练和推理成本是影响大模型价格的重要因素。一家公司是否敢开源、免费，与大模型不断降低的训练和推理成本相关。比如，DeepSeek刚刚结束的开源Week，就一直公开自家在底层Infra上的秘诀。

（DeepSeek开源Week速览，来源：钛媒体）

百度也持续布局AI Infra。

首先在芯片层它有昆仑芯万卡集群，可以在更少的计算资源下运行大规模模型（如DeepSeek-V3/R1）。另外，百度旗下百舸平台还通过高效并行化任务切分策略等方法，提升整体集群训练效率，保障集群有效训练率达到98%。飞桨也有很多大模型推理的自研技术。

李彦宏在2024年曾透露，自发布以来，文心大模型的推理成本已降低至一年前的1%。

至于马上就要面世的文心4.5，李彦宏则认为，文心大模型4.5将是百度有史以来最强大的大模型。

相信有Infra技术支撑，文心4.5的价格一定不会像GPT4.5一样离谱。

在更多细节上，李彦宏还预告文心4.5在将基础模型能力上大幅提升，还能具备原生多模态、深度思考等能力。路透社的消息中也透露，这个模型的推理能力将大幅提升。

百度至今还没有正式发布过自家的推理模型，这次预告文心4.5结合了多模态和深思考，似乎暗示它将是一个拥有高智商的基础模型。

作为国内最早对标GPT的文心，能延续中国AI卷向全球的神话吗？半个月后，答案即将揭晓。