发布时间:2025-02-22 21:45:41作者:zhoucl阅读:次
xAI发布Grok-3模型,表现优于Gemini、ChatGPT等对标模型,还包含研究、创作和思考模式。
「100%可以肯定的是,人们将会爱上Grok!」马斯克(Elon Musk)于台湾时间2月18日,在他创立的xAI模型发布直播上这么说。
由于马斯克于前一天在社群预告称即将发布的Grok-3将会是「地表最强模型」,让官方直播吸引超过200万人同时观看。
对标Google的Gemini、OpenAI的ChatGPT、Anthropic的Claude,也将中国新创「深度求索」的DeepSeek纳入比较,直播中xAI团队展示Grok-3和小参数版本Grok-3 mini,在数学、科学和电脑工程方面,测试表现皆优于其它现有模型。
Grok-3在数学、科学和程式表现皆优于对标模型。图/ xAI
在模型盲测平台Chatbot Arena(前LMSYS)上,代号Chocolate的早期Grok-3模型面对到综合性问答,也获得使用者评价1,400高分,优于Gemini 2.0和Chatgpt-4o等。马斯克强调,Grok-3的计算能力是上一代模型的10倍以上,并且上线后仍会动态调整,「这个模型每天都会更进步!」
xAI成立的其中一项目标就是解决复杂问题,包含马斯克最在意的太空旅行,以及其它需要大量数据分析和复杂计算的科学问题。加上Google、OpenAI和以AI搜寻引擎起家的Perplexity相继推出专攻科学研究的「Deep Research」功能,xAI这次也为Grok-3加上「DeepSearch」模式,能够针对复杂的问题进行全面性的研究、思考和呈现分析结果。
马斯克表示,「DeepSearch」可以视作「下个世代的搜寻引擎」,能够放手让AI在10分钟内完成过去需要数小时的研究。特别的是,使用者点选「呈现思考(Show Thinking)」功能,能够看到AI理解与处理问题的完整流程,改变了过去使用者被动接收AI生成内容的情况,让内容可溯源且透明。
Grok-3包含深度研究模式「DeepSrarch」图/ xAI
除此之外,Grok-3模型还包括「Think」和「Big Brain」模式。在直播中,xAI的工程师表示,「Think」模式擅长处理高度推理以及物理问题,像是让Grok-3撰写程式计算星体运行。
Grok-3的Think模式还可以调节思考速度。图/ xAI
至于第三种模式「Big Brain」,马斯克称之为「AI创意的起点」,可以进行相对抽象的创作,举例来说,团队在直播演示请Grok-3生成一个结合俄罗斯方块与色块消除的新游戏。
Grok-3的「Big Brain」模式能够活用创意。图/ xAI
xAI团队还表示,会尽快为Grok-3打造一款基于语音的聊天机器人。目前,Grok-3已经向X的Premium 订阅者发布,xAI也正在为应用程式和网站版推出名为「SuperGrok」的新订阅方案,涵盖Grok-3和「DeepSearch」和「Think」功能。
马斯克表示,Grok-3的API预计在数周内公开,并且按照惯例,xAI会在最新模型稳定后开源前一代模型,也就是未来几个月内预计将开源Grok-2模型。