
来た、来ましたよ。Anthropicが米国時間4月16日、最新の一般提供フラッグシップ大規模言語モデル「Claude Opus 4.7」が提供開始しました。

コーディング、ビジョン、複雑な多段階タスクで前世代Opus 4.6から底上げを果たしたとのことです。
最大の見どころはSWE-bench Pro(実プロジェクト規模のソフトウェア課題でコーディング能力を測る評価)で64.3%を記録したこと。前世代の53.4%から約11ポイント伸び、GPT-5.4の57.7%、Gemini 3.1 Proの54.2%を上回っています。SWE-bench Verifiedでも87.6%、MCP-Atlasは77.3%と高水準です。

SWE-bench Proって何それ?と思った方に簡単にご説明しますと、要するに本物のリポジトリ由来の長めのソフトウェア課題をAIに解かせて、パッチが正しく機能するかを見るやつです。公開・非公開を含む複数リポジトリから集めた計1865件の課題で構成されており、ベンチ用の小ぶりな問題というより、実務寄りの残酷なテストといえます。
画像入力も強化。長辺2576ピクセル(約375万画素)まで受け付けるようになり、従来の1568ピクセル、約115万画素から画素数ベースで3倍超に拡大しています。UIスクショや文書、図版の読み取り精度向上が見込まれます。
新しい推論設定「xhigh」も追加されました。高より深く、最大よりは抑えめな努力レベルです。コスト管理向けのタスク予算ベータも投入されています。さらに、Claude Codeには深いコードレビューをクラウド側で走らせる/ultrareviewが追加されました。なお、/resumeピッカーも現在ディレクトリ基準になり、Ctrl+Aで全プロジェクト表示ができるようになっています。
料金は入力100万トークンあたり5ドル、出力25ドルとOpus 4.6から据え置きです。プロンプトキャッシュ併用で最大9割、バッチ処理で5割のコスト削減が可能としています。めっちゃ値上げ!と思いきや、そこは踏みとどまってくれたみたいです。
提供先はClaudeプラットフォームに加え、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryです。
さて、今日はどんなバイブコーディングしようかな……。



















