
賢くて速くて安い、を本気で狙いにきた。
AIモデル開発では「賢さ」と「速さ」はトレードオフだと長く信じられてきました。賢いほど遅く、速くすれば頭が悪くなる。xAIが3月10日にEnterprise APIで公開したGrok 4.20 Betaは、その常識に正面からケンカを売っています。
Artificial AnalysisのIntelligence Indexで48を記録。前世代Grok 4の42から6ポイント上昇です。GPT-5.2(xhigh)の51やGLM-5(Reasoning)の50には届かないものの、上位10モデル圏内に食い込む実力です。
ただ、このモデルの本当の衝撃は速度です。出力は毎秒265トークン。Grok 4.1 Fastの毎秒127トークンを軽々と倍以上に引き離しました。知能スコア48のモデルがこの速度で回るのは、ちょっとした事件です。
コンテキストウィンドウは2,000,000トークン、テキストと画像入力に対応します。別モデルとしてGrok 4.20 Multi-agent Betaも同時公開されており、こちらは複数エージェントの協調を前提とした設計です。公式ドキュメントでは4エージェント・16エージェント構成の例が示されていますが、標準版Grok 4.20 Betaそのものが固定エージェント構造をとるわけではありません。
価格もかなり攻めています。入力100万トークンあたり2ドル、出力6ドル。前世代の入力3ドル・出力15ドルから大幅ダウンで、出力単価は60%の値下げです。
弱点がないわけではありません。TTFTは9.18秒とやや重め。また、Intelligence Index評価時の出力トークン総数が5400万トークンと、平均の1300万を大きく超えています。用途によっては、この出力量の多さをコストや応答設計面で意識する必要があります。
TTFTとは「Time To First Token」の略で、AIに質問してから最初の1文字が返るまでの待ち時間のこと。検索ボタンを押してから結果が出始めるまでの間隔に近いイメージです。数字が小さいほど快適で、9秒超はこのクラスではやや遅めになります。
現在のIntelligence Index上位は、Gemini 3.1 Pro PreviewとGPT-5.4(xhigh)が57、GPT-5.3 Codex(xhigh)が54、Claude Opus 4.6が53、Claude Sonnet 4.6が52といった顔ぶれ。Grok 4.20の48は最上位ではありませんが、速度と価格込みで見ればかなり有力な選択肢です。
知能レースのトップは、ベンチマーク数値上ではOpenAIやGoogle系が先行中。しかし価格とスループット重視のAPI利用者にとって、Grok 4.20 Betaの訴求力は相当なものです。AIモデル選びは「最高スコア一点買い」の時代から、速度・価格・応答特性を総合判断する段階に入りました。Grok 4.20 Betaは、その変化を象徴する1モデルになるかもしれません。




















