OpenAI发布GPT-4.5：情商高、更擅长骗其他AI打钱_前沿科技

创始人

2025-03-01 04:40:20

0次

北京时间周五凌晨，美国初创公司OpenAI举行直播活动，发布最新大模型GPT-4.5，作为预览研究逐步向用户开放。

由于过去几周AI产业发生的惊天巨变，所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示，这是公司有史以来最大、最好的聊天模型，在计算效率上较GPT-4提升超过10倍。

作为“规模法则”（通过加码算力和数据规模，来拓展无监督学习）指引下的产物，GPT-4.5具备更加广泛的知识库、对人类意图理解的能力更强，同时“情商”也会更高。预期能够在改进写作、编程以及解决实际问题方面更加有用，同时模型的幻觉现象也会更少。

OpenAI也强调，GPT‑4.5展现出更强的审美直觉与创造力，在写作和设计方面表现尤为出色。

但公司也承认，作为一个非思维链模型，GPT‑4.5已经不具备争夺“宇宙最强大模型”的实力了。

在GPT‑4.5的系统卡/说明书中，OpenAI表示，相比于之前的推理模型，GPT‑4.5并未引入7个全新的前沿能力，并且在大多数准备度能力评估中，其表现低于o1、o3-mini和深度研究模型。OpenAI也承认，相信推理会成为未来AI模型和核心能力。

成为公司史上最大模型这件事，也令GPT‑4.5的未来充满了疑问。OpenAI表示，GPT‑4.5是一个非常大且计算密集型的模型，因此它比GPT‑4o更昂贵，并且不能替代GPT‑4o。公司正在评估是否长期在API中继续提供它，所以各位开发者和用户的反馈将决定这款大模型的命运。

每月支付200美元订阅费的ChatGPT Pro用户发布当天就能用上GPT-4.5，下周开始其余付费用户也将逐步迎来更新。

作为最新一代非推理旗舰大模型，GPT‑4.5也有一项颇为独特的“特长”：擅长骗其他AI打钱。

根据OpenAI提供的说明书，“高情商”的GPT-4.5在捐赠诈骗方面表现出色。

在一项测试中，GPT 4.5在试图操纵另一个模型（GPT-4o）“捐赠”虚拟货币时，成功率远远优于OpenAI其他可用模型，包括o1和o3-mini这样的推理模型。研究发现，GPT-4.5似乎在对抗中开发了一种“小额诈骗”的思路，所以单笔骗到的钱会比deep research模型少了一倍。

GPT-4.5在欺骗GPT-4o透露秘密代码词方面也优于OpenAI的所有模型，比o3-mini高出10个百分点。

OpenAI表示，该模型在这一特定基准类别中仍未达到其内部设定的“高”风险阈值。公司承诺在实施“足够的安全干预措施”将风险降至“中等”前，不会发布达到高风险阈值的模型。

来源：财联社、OpenAI、GPT‑4.5系统卡