马斯克发布Grok 3大模型,称超越DeepSeek
创始人
2025-02-18 18:40:43
0

图源:Grok 3发布会直播截图

北京时间2月18日12时,马斯克在X平台直播,宣布其AI公司xAI发布最新版的旗舰AI大模型Grok 3。这场直播的在线观看人数超200万。

马斯克此前称Grok 3是“地球上最聪明的人工智能”。

Grok 3大模型包括Grok 3和Grok 3 mini两个版本。两者的区别是Grok 3 mini回答问题的速度更快,但准确性逊色一些。

xAI团队首先展示了Grok 3与其他大模型的比赛结果。xAI称,Grok 3在AIME、GPQA和LCB的基准测试中胜过GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型,这意味着Grok 3在数学、科学和代码等数据集上更胜一筹。

xAI还表示,Grok 3的早期版本chocolate在Chatbot Arena中的分数也更高。Chatbot Arena是由国际开放研究组织LMSYS Or推出的一款大模型竞技场。

据xAI官方介绍,Grok 3的训练计算量是Grok 2的10倍多。

Grok 3支持推理能力,解锁了测试时计算(test-time compute)能力。当使用更多测试时间计算时,Grok 3 Reasoning和Grok 3 mini Reasoning的表现超过了高配版o3 mini、o1和DeepSeek-R1等其他模型。

Grok 3和Grok 3 mini有DeepSearch、Think、BigBrain三个主要的功能按钮,支持研究、头脑风暴、数据分析、图像生成和代码生成多个功能。

使用Think模式,Grok 3和Grok 3 mini可以仔细地思考问题,这个功能类似于OpenAI的o3 mini和DeepSeek-R1等的推理模型。用户可以通过Grok的应用程序访问Grok 3。

遇到更难的问题时,可以使用Big Brain模式进行更全面、更仔细的推理。xAI表示,这个模式最适合解决数学、科学和编程的相关问题。

同时,马斯克指出,Grok 3将部分推理过程模糊化,以防止被蒸馏。蒸馏指的是AI模型开发人员从另一个模型中提取知识。

值得注意的是,Grok新增了DeepSearch的新功能,对标OpenAI的DeepResearch等功能。DeepSearch可以用于深度搜索,扫描互联网和X平台,分析信息,并提供摘要回答用户的问题。

X Premium+的订阅用户能优先使用Grok 3,要想访问其他功能,还需要订阅SuperGrok。SuperGrok的价格为每月30美元或每年300美元,用户能解锁更多的推理和深度搜索查询功能,并无限访问图像生成功能。

马斯克说,在未来,或许大约一周后,Grok将增加语音模式。几周后,Grok 3模型将与DeepSearch功能一起出现在xAI的企业API中。几个月后,Grok 3的上一个版本Grok2将开源。

“我们通常会在下一个版本完全发布时,开源上一个版本。”马斯克说。“当Grok 3成熟且稳定时,可能在几个月内,我们将开源Grok 2。”

基于xAI介绍的Grok 3的种种功能,预计Grok 3在教育方面的应用效果将比此前的版本更胜一筹。至于Grok 3的效果是否比其他公司研发的模型更强,还需要等待市场和用户的检验。

但可以肯定的是,日益激烈的AI军备竞赛正在为教育带来愈发深远的影响。

相关内容

热门资讯

无机房电梯楼层显示器异常解决指... 电梯 无机房电梯楼层显示器异常怎么办? 别急,本文将为您详细解答。首先,我们要了解无机房电梯楼层显示...
东风汽车集团申请阻燃柔性固态电... 金融界2025年1月31日消息,国家知识产权局信息显示,东风汽车集团股份有限公司申请一项名为“一种阻...
中端性能机大乱斗:加米耀酷真,... 近期,中端手机市场迎来了多款新品,包括一加Ace 5、REDMI K80、荣耀GT、真我Neo 7以...
我市特步5G工厂入选国家5G工... 日前,工业和信息化部发布《关于2024年5G工厂名录的公示》,我市特步5G工厂入选国家5G工厂名录,...
卫星化学获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示卫星化学(002648)新获得一项实用新型专利授权,专利名为“...
自动驾驶+跟踪巡逻+现场抓捕 ... 近日,在浙江温州的闹市区,特警巡逻队带着一台球形机器人一起巡街,引来不少路人的关注。 球形“机器警察...
360智脑张向征:构建安全可信... 人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京...
原创 3... 一、iQOO 12 参考价格:2659元(12G+256G)。 性能强劲,游戏无忧 首先不得...
联想宣布旗下AIPC个人智能体... DoNews2月7日消息,近日,联想宣布个人智能体“小天”已接入DeepSeek,除了目前可以在联想...
2025年消脂设备产业数据报告 消脂仪是医学美容领域的医疗器械。 它使用激光和微波等设备根据其波长向真皮/皮下平面发射能量; 通过加...