弊誌はアフィリエイト広告を利用しています。

初の「.1刻み」。Gemini 3.1 Pro登場、推論ベンチマークで圧倒的性能向上

 Googleは2026年2月19日、AIモデル「Gemini 3.1 Pro」のプレビュー版を公開しました。Gemini 3シリーズの最新モデルで、同社は複雑なタスクをこなすための「より賢いベースモデル」だと説明しています。

 Gemini 3 Proをベースに推論性能を大幅に引き上げたモデルで、未知の論理パターンの解決能力を測る「ARC-AGI-2」ではARC Prize財団の検証済みスコアで77.1%を達成しました(モデルカード上は「Thinking (High)」設定)。これはGemini 3 Proの31.1%から2倍以上の向上です。2月12日に発表したGemini 3 Deep Think(84.6%)には及ばないものの、ベースモデルの推論力が大きく底上げされています。

 博士レベルの科学知識を問うGPQA Diamondは94.3%(Gemini 3 Proは91.9%)、学術推論のHumanity’s Last Examはツールなしで44.4%を記録しました。コーディング分野ではSWE-Bench Verifiedが80.6%、LiveCodeBench ProのEloは2887に到達。エージェント型タスクのAPEX-Agentsは33.5%とGemini 3 Proの18.4%から大幅に改善しており、多言語QAのMMMLUでは92.6%を記録するなど、全体的に性能が向上しているといいます。

 安全性評価では、Google DeepMindの「Frontier Safety Framework」に基づき、CBRN(化学・生物・放射線・核)や有害な操作、機械学習の研究開発、ミスアライメントの各領域でCCL(Critical Capability Level)のアラート閾値を下回ったといいます。

 Geminiで「.1」刻みのアップデートが実施されるのは、今回が初めてだといいます。これまでは「.5」刻みが中間アップデートの役割を担ってきましたが、より短い間隔での改良を反映している形です。同社は2月12日にもGemini 3 Deep Thinkの大型アップデートを公開。Gemini 3.1 Proを、Deep Thinkの成果を支えるコアインテリジェンスの強化版だと位置付けています。

 一般ユーザーはGeminiアプリおよびNotebookLMで利用可能です。同社はGeminiアプリにおいてGoogle AI Pro/Ultraプランユーザーの利用上限を引き上げ、NotebookLMではPro/Ultraユーザー限定で提供するといいます。開発者はGemini APIを介してGoogle AI StudioやAndroid Studioなどから、法人向けにはVertex AIなどでアクセス可能です。現在はプレビュー版として提供されており、エージェント型ワークフローの改善を経て、近日中に一般提供を始める予定だといいます。

情報元Google
詳しく読む
すまほん!!を購読しませんか?

Twitterでも最新更新を配信・通知しています

フォローする 再度表示しない