
Moonshot AIは11月5日、オープンソースの推論特化型LLM「Kimi K2 Thinking」を公開しました。 K2 Thinkingは特定の推論・エージェント系ベンチでGPT-5やClaude 4.5 Sonnet (Thinking)と同等、または上回る性能を記録しており、オープンソース分野で大きな注目を集めています。

このモデルは総パラメータ1兆規模のMoEアーキテクチャを採用し、推論時には32Bのパラメータが用いられます。 また、コンテキストウィンドウは256Kで、INT4量子化により推論速度とメモリ効率の向上が図られています。
最大の特徴は、人間の介入なしで200~300回の連続ツール呼び出しを実行し、複雑な作業を一貫して維持できること。長尺思考とツールの多段呼び出しの組み合わせで長い推論が得意となっているようです。
また、本モデルはオープンソースのため、Hugging Faceからもダウンロード可能で、ローカルにてOllamaで動作可能のため、研究者や開発者は自前の環境で検証や改変が可能。良くも悪くも256Kの長大なコンテキストなので、導入ハードルは高めです。


















