9 月 20 日消息,埃隆?馬斯克(Elon Musk)旗下 xAI 公司今天(9 月 20 日)推出全新 AI 模型 Grok 4 Fast,在企業與消費級任務中實現接近 Grok 4 的推理表現,同時平均減少 40% 推理 tokens。
在性能測試中,Grok 4 Fast 的推理基準表現與 Grok 4 相當,但平均使用的推理 tokens 減少了 40%,價格降低 98%。

例如,在 AIME 2025 無工具測試中,其正確率達 92.0%,超越 Grok 3 Mini,并在 HMMT 2025 等數學推理任務中取得顯著優勢。


在搜索與信息獲取能力上,Grok 4 Fast 展現出前沿的多跳搜索(multihop search)表現。在 LMArena 搜索競技場中,grok-4-fast-search 以 1163 Elo 分數排名第一,領先第二名 17 分;在中文搜索、跨平臺數據整合等任務中,其準確率明顯高于同類模型。

在 LMArena 的 Text Arena 中,grok-4-fast (代號: tahoe )排名第 8 ,性能與 grok-4-0709 相當,凸顯了其卓越的智能密度。值得注意的是,所有同等大小的模型都排在第 18 位或更靠后。

架構方面,Grok 4 Fast 首次將長鏈推理模式與快速響應模式統一到同一模型中,并通過系統提示動態切換。這不僅減少了延遲,也進一步降低了 Token 成本,適用于實時搜索、代碼執行等多種場景。開發者可通過 xAI API 調整推理深度以匹配不同需求。
Grok 4 Fast 目前已對所有用戶(包括免費用戶)開放,并在 OpenRouter 和 Vercel AI Gateway 上限時免費提供。

在 API 調用方面,每 100 萬 tokens 輸入費用為 0.20 美元(IT之家注:現匯率約合 1.4 元人民幣)起,每 100 萬 tokens 輸出費用為 0.50 美元(現匯率約合 3.6 元人民幣)起。
