ここ1ヶ月ほど、Opus 4.6が明らかにポンコツ化したと感じています。2月の神がかり的なパフォーマンスと比較すると、今のOpus 4.6はほぼ実用に耐えない状態です。最大の問題は頻繁にサボるようになったことと、本来AIがやるべきタスクを平気でこちらに丸投げしてくる点です。
コミュニティを覗いてみるとやはり不満の声が殺到しており、この状況を少しでも改善できる方法を探しました。自身のワークフローでいくつかテストし、効果のあったものを皆さんに共有します。
前置きとして:
LLMの出力には不確実性が伴う上、プラシーボ効果も多分に含まれています。また、私自身ログの厳密な解析を行ったわけではないため、効果を完全に保証することはできません。あくまで私個人の感覚に基づく判断であり、評価基準は非常に主観的です。「設定変更後に出力の質とタスクに対するエフォート(頑張り)に改善が見られたか」という点で「効果あり」と見なしています。
検証の結果、効果があったと感じた設定は以下の通りです:
- アダプティブ思考モードの無効化
CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
- 1Mコンテキストモードの無効化
CLAUDE_CODE_DISABLE_1M_CONTEXT=1
- 思考の強制有効化
alwaysThinkingEnabled: true
-
すべてのプロンプトで ultrathink を要求する
-
Claude Codeを旧バージョンにダウングレードする
curl -fsSL https://claude.ai/install.sh | bash -s 2.1.63
※注意:自動更新を禁止するために DISABLE_AUTOUPDATER=1 も併用する必要があります。
- Opus 4.5へのダウングレード(任意)
model: claude-opus-4-5-20251101
最終的な設定ファイルはこのような形になります。
{
"env": {
"DISABLE_AUTOUPDATER": "1",
"CLAUDE_CODE_EFFORT_LEVEL": "max",
"CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING": "1",
"CLAUDE_CODE_DISABLE_1M_CONTEXT": "1"
},
"alwaysThinkingEnabled": true,
"effortLevel": "high",
"model": "claude-opus-4-5-20251101"
}
逆に、あまりアテにならない設定は以下の通りです:
-
CLAUDE_CODE_EFFORT_LEVEL=max:単なるプラシーボ効果だと感じました。いわゆる「おまじない」のようなもので、信じる者は救われるといったレベルでしょう。 -
CLAUDE_CODE_AUTO_COMPACT_WINDOW=400000:効果なし。Anthropic公式がユーザーを煙に巻くために適当に返答しただけのような気がします。 -
showThinkingSummaries: true:同上です。 - プロンプトで丸投げを禁止する:個人的にはうまく機能しませんでした。
- opusplanモード:ただの気休めです。
- Sonnet 4.6に切り替える:Sonnetではエフォートが足りないと感じました。
結論として、今回は間違いなくモデル自体の性能が密かに弱体化されています。外部の設定を調整したところで得られる効果には限界があり、現状はだましだまし使っていくしかなさそうです。