Anthropicは2025年5月22日、次世代の大規模言語モデル「Claude Opus 4」および「Claude Sonnet 4」を発表しました。価格は、Opus 4が100万トークンあたり入力15ドル/出力75ドル、Sonnet 4が100万トークンあたり入力3ドル/出力15ドルです。同時に、同社はClaude Opus 4に対してAI安全レベル3(ASL-3)の保護措置を有効にしたことも明らかにしました。
Claude Opus 4は、複雑で長時間のタスクやエージェントワークフローにおいて持続的な成果を発揮する世界最高のコーディングモデルであると位置づけます。SWE-benchでは72.5%のスコアを達成したとのこと。一方、Claude Sonnet 4はClaude Sonnet 3.7から大幅にアップグレードされ、優れたコーディング能力(SWE-benchで72.7%)と推論能力を提供しつつ、指示への応答精度も向上しているといいます。
両モデル共通の新機能として、ツール使用による思考拡張(ベータ版)が挙げられます。これにより、Claudeは推論とツール使用(ウェブ検索など)を交互に行い、応答の質を高めることができるとのこと。また、ツールの並列使用、指示追従性の向上、ローカルファイルへのアクセス権限を開発者から与えられた場合のメモリ機能の大幅な改善も実現しており、キーとなる情報を記憶し、タスクの一貫性を保つことが可能になると謳います。
開発者向けには、Claude Codeが一般提供開始。GitHub Actions経由のバックグラウンドタスクや、VS Code、JetBrainsとのネイティブ統合をサポートし、編集内容をファイルに直接表示することで、シームレスなペアプログラミング体験を提供するとしています。
さらにAnthropic APIにはコード実行ツール、MCPコネクタ、Files API、プロンプトを最大1時間キャッシュする機能など、4つの新機能が追加され、より強力なAIエージェントの構築が可能になるそうです。
AnthropicはClaude Opus 4のリリースに伴い、スケーリングポリシー(RSP)に記述されているAI安全レベル3(ASL-3)の展開およびセキュリティ基準を有効化。これはモデルが化学兵器、生物兵器、放射能兵器、核兵器(CBRN)の開発や取得に悪用されるリスクを限定することを目的としています。
Claude Opus 4がASL-3保護を必要とする能力の閾値とはまだ断定していないものの、核兵器関連の知識と能力の継続的向上のため予防的な暫定措置とのこと。「要は賢すぎるんで念のため暴走しないように強めのセーフティかけときました」ってことですね。