弊誌はアフィリエイト広告を利用しています。

【朗報】スマホメーカーのAIがトップ10入り!つよつよAIを作ったのは「あの会社」

 エージェント性能でGPT-5.2超え!

 スマートフォンメーカーがAIモデル開発に乗り出す流れはもはや珍しくありません。しかし、自社開発モデルで世界トップ10圏の総合知能評価を示すとなれば話は別です。Xiaomiが3月18日に公開した大規模言語モデル「MiMo-V2-Pro」は、自律型エージェント用途に特化した設計で、Artificial Analysis Intelligence Indexで49を記録しました。VentureBeatが伝えています。

 MiMo-V2-Proの総パラメータ数は1兆超、うちアクティブパラメータは420億です。前身のMiMo-V2-Flashは総パラメータ3090億、アクティブ150億で、MiMo-V2-Proはおよそ3倍の規模に拡大しました。Hybrid Attentionの比率を5:1から7:1に引き上げ、100万トークンのコンテキスト長を実現しています。

 最大の注目点は幻覚率です。MiMo-V2-Flashでは48%だった幻覚率を30%まで引き下げました。エージェントが実務に耐えるには正確性が生命線であり、この18ポイントの改善は実用上のインパクトが大きいです。

 エージェントの実務遂行力を測るベンチマークGDPval-AAではElo 1426を記録し、GLM-5の1406、Kimi K2.5の1283を上回りました。エージェント評価のClawEvalでは61.5を獲得し、Claude Opus 4.6の66.3に迫る一方、GPT-5.2の50.0を上回っています。コーディング能力についても、XiaomiはClaude 4.6 Sonnetを上回ると説明しています。

 興味深いのはトークン効率です。Artificial Analysisによると、MiMo-V2-ProがArtificial Analysis Intelligence Indexの評価に使用した出力トークン数は7700万です。GLM-5は1億900万トークン、Kimi K2.5は8900万トークンで、MiMo-V2-ProはGLM-5に1ポイント及ばない一方、Kimi K2.5を上回るスコアを、より少ないトークン数で示しました。

 価格は256Kトークンまでの入力は100万トークンあたり1ドル、出力は3ドルです。256Kを超え1Mトークンまでの入力では2ドル、出力は6ドルです。ただしモデルの重みは未公開で、現時点ではXiaomiのファーストパーティーAPIからのみ利用できます。

 このモデルがシャオミのエコシステムにどう効いてくるのか、気になりますね。

Xiaomi製品をオンラインで購入 [AD]
すまほん!!を購読しませんか?

Twitterでも最新更新を配信・通知しています

フォローする 再度表示しない