
怠けるClaude、データで露呈。
AIコーディングツール「Claude Code」が、どうもnerf(弱体化)されている。筆者も周りもみんな感じていましたが、気のせいではなかったようです。しかも今回、それを定量データで示した人物が現れました。The Registerが伝えています。
AMDのAIグループの責任者Stella Laurenzo氏が、自チームのセッションログを分析。対象は6852セッション、23万4760回のツール呼び出し、1万7871のthinkingブロックです。思い込みではなく、数カ月分の実データから出た結論が「Claude Codeは複雑なエンジニアリングタスクを信頼して任せられない」でした。
具体的な数字がエグいです。1月30日から2月12日の「良好期」、Claude Codeはファイルを編集する前に平均6.6回コードを読んでいました。2月13日から3月7日の「移行期」には2.8回、3月8日以降の「劣化期」には2.0回にまで低下。つまりあまり読まずに書く。さらにstop-hook violationsも3月8日以降、ゼロから1日平均約10件に急増し、部分修正ではなくファイル丸ごと書き換える頻度も増えたといいます。
Laurenzo氏は「thinkingが浅くなると、読まずに編集し、途中で停止し、責任を回避し、正しい修正ではなく最も手軽な修正に流れる」と指摘しています。結局、Laurenzo氏のチームは別のAIプロバイダに切り替え済みです。修正を期待してデータを公開しているとしつつ、Anthropicにはthinkingトークン数の可視化や、深い推論を保証する上位ティアの追加を求めています。
利用者増加の反動なんでしょうけど、なかなか深刻ですね。どうしようもないので筆者は最近はClaude Codeからcodexを呼び出して使っています。



















