Anthropicは新しい大型言語モデル「Claude Sonnet 4.5」を発表しました。コーディングや長時間にわたる自律的な作業(エージェント運用)を念頭に開発、既に企業向けの評価や導入パートナーでの利用が始まっているとしています。
Sonnet 4.5は30時間の連続的な自律作業をこなせる事例や、複数時間にわたるコード生成・デバッグ・アーキテクチャ設計などの複雑な開発タスクで高い性能があるそうです。
実運用への入り口を広げる取り組みも進められており、GitHub Copilot向けのパブリックプレビュー対応や、IDE/ターミナル連携の強化(VS Code拡張や端末インターフェースの改良)、自律実行のためのチェックポイント機能なども対応します。
ソフトウェア工学向けの評価や実務的なテストで前世代比で改善された一方、Sonnet 4.5を自社の「AI Safety Level 3(ASL-3)」の保護下でリリースするなど安全性にも配慮します。