XAI 发布了其最新的语言模型 Grok 3 。该公司称,训练过程所使用的计算能力是 Grok 2 的十倍。训练在位于孟菲斯的数据中心进行,使用了大约 200,000 个 GPU 。
Grok 3 系列包括多个变体,其中包括一个更紧凑的 “迷你” 版本,XAI 表示该版本速度更快但准确性较低。此外,还有 “推理” 模型:Grok 3 Reasoning 和 Grok 3 mini Reasoning 。这些变体经过优化,旨在系统性地思考复杂问题,类似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1 。 XAI 还新增了 DeepSearch 功能,该功能可搜索互联网和 X 平台以生成摘要。
在技术方面,XAI 声称在多个基准测试中取得了进展。该模型在 AIME 数学测试和学术问题的 GPQA 测试中表现优于 GPT-4o 。推理变体在新的 AIME 2025 基准测试中被认为特别超越了 o3-mini-high 。
这些模型首先将向 X Premium+订阅用户提供。此外,社交媒体上流传着关于即将推出 SuperGrok 订阅的传闻。该订阅将提供额外功能,如无限制的图像生成和广泛的搜索能力,价格为每月 30 美元。
XAI 宣布将在 Grok 3 稳定运行后,将 Grok 2 开源,预计在几个月内实现。此外,语音支持计划在接下来的几周内推出,随后将推出带有 DeepSearch 功能的企业 API 。
