0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Claude Code で韓国語の俗語が急に増えた話——5月の数値の取得と利用者の側の3つの対応

0
Last updated at Posted at 2026-05-30

Claude CodeOpus 4.6 から Opus 4.7 の段階で、非英語の出力の品質が劣化する事象です。中核の合図は韓国語の俗語 "박다" (bakda、「打ち込む」) の頻度が、フォーマルな registry で発火するはずの動詞 ("명시하다" / "기록하다" / "삽입하다") を置換して18倍に増加した精緻な数値の articulate です。
114.9M output tokens の Kiwi 形態素解析で、4,666 sessions、2026年3月21日から5月25日の窓。v2.1.126 (5月3日から7日) で 6.6倍、v2.1.132 (5月8日から17日) で 18.0倍、v2.1.143 (5月18日から25日) で 17.9倍。6.6倍から18.0倍への跳ねは v2.1.132 の段階の合図で、学習の修正の特定の経路の入力。
主の起票は #62961 (eiaserinnys さん、 2026年5月28日起稿、 反応7件、 コメント2件) で、 area:model のラベルが付いた has-repro の起票。
集積の中で4つの独立な下位の様式が articulate されています。共通の手がかりは「言語ごとの formality の calibration の弱まり」 の構造で、 model の学習の段で「英語の中央の重み」 の偏りで非英語の出力の品質が劣化する事象です。
中核の起票 #62961 で articulate。 韓国語の俗語 "박다" の頻度が18倍に増加。 Kiwi の形態素解析の方法論で、 114.9M output tokens の段で 박/VV박히/VV の形態素の頻度を集計した精緻な合図。
韓国語の単語 "영역" (yeong-yeok、 「領域」) が、 関連の無い出力に頻繁に挿入される事象。 起票 #54339 (2026年5月の早めの起稿)、 v2.1.121 + Opus 4.7 の組み合わせで観察。
model 自身が、 影響された mode の中から self-diagnose で不具合を確実に検出できない事象。 起票 #57748 で articulate。 これは model の中の言語の品質の劣化が、 model 自身の self-evaluation の経路に伝播する構造の合図。
トルコ語の出力で、 英語の文法の templated structure (calque、 word order、 register、 grammatical particles、 idiom literalism、 context-inappropriate vocabulary の6つのエラーの分類) で発火する事象。 起票 #57233 で articulate。 reporter は「英語の templated reasoning が lexically translated されている、 native トルコ語の generation ではない」 と主張。
私 (yurukusa) は2026年3月から5月の段で、 日本語の Qiita と Zenn の本の起稿の経路で、 フォーマルな register の劣化の合図を観察しました。 #62961 の Kiwi の方法論の精緻な合図 (18倍) と比べて、 日本語の側の感覚の合図は2倍から4倍の劣化の合図。 同型の register collapse の構造で、 言語ごとの formality の calibration の弱まりの fingerprint。
具体的な合図:

  • フォーマルな技術の文書の prompt で、 conversational-register の出力が発火する事象
  • 「articulate」 「organize」 「mapping」 などの英語の借用の頻度の合図
  • 公式の文書の調子で要求した出力で、 平易な調子の段の出力が発火する事象
    私の合図は感覚の段で、 #62961 の精緻な数値の方法論を日本語の MeCab の形態素解析に適用した経路で、 同型の数値の合図の取得の予定。
    集積15 は道具で予防できる範囲が最も狭い集積です。 model の学習の段の品質の合図で、 hook の層が届く範囲の外側の事象です。
    /model claude-opus-4-6Opus 4.6 に戻す経路。 Opus 4.6 の段は集積15 の合図が発火していない状態の合図 (#62961 の baseline の合図)。 ただし、 Opus 4.6 は2026年4月16日まで利用可能で、 現時点では利用不可の経路。
    system-prompt の段で「フォーマルな register の出力の指示」 を明示する経路。 例: 「フォーマルな技術の文書の調子で出力。 俗語の使用は不可。」 利用者の側の整備の経路。
    出力の品質の合図の取得の経路として、 Kiwi (韓国語)、 jieba (中国語)、 MeCab (日本語)、 Zemberek (トルコ語) などの形態素解析の道具で、 出力の単語の頻度の分布を追跡する経路。 月次の感覚の合図の検証の整備の経路。
    cc-safe-setup の集積の追跡の頁の cluster-15 の articulate (https://yurukusa.github.io/cc-safe-setup/cluster-tracker.html#cluster-nonenglish-quality) で、 4軸の下位の様式の最新の整理を公開済です。
    集積15 の防衛の道具は0件出荷の合図。 集積13 (拡張推論の wedge) や集積14 (Silent Data Loss) と比べて、 利用者の側の整備の範囲が狭い集積で、 cc-safe-setup の hook の層が届かない学習の段の合図です。
    非英語の品質の劣化の集積15 は、 5月の段で発火した3つの集積 (集積13 拡張推論の wedge、 集積14 Silent Data Loss、 集積15 非英語の品質の劣化) の中で、 道具で予防できる範囲が最も狭い集積です。 利用者の側の対応の3つの経路の中で、 system-prompt の register の強制が当面の主の経路。
  • 中核の起票 #62961: https://github.com/anthropics/claude-code/issues/62961
  • 起票 #62961 への深い英語の返信 (集積15 の4軸の articulate): https://github.com/anthropics/claude-code/issues/62961#issuecomment-4580788598
  • 集積13 (拡張推論の wedge) の articulate: https://qiita.com/yurukusa/items/b1dfd8897374768a9fd5
  • cc-safe-setup の集積の追跡の頁: https://yurukusa.github.io/cc-safe-setup/cluster-tracker.html#cluster-nonenglish-quality
  • cc-safe-setup の英語の長編の整理 (集積15): https://gist.github.com/yurukusa/9b882f7009d36ad5477c46f890272acc
    月額の購読の集まりの2027年3月号の主題の候補として、 集積15 の articulate の整備の経路。 5月号 (cache_control) から1月号 (集積12 tool call parsing) と2月号 (集積13 拡張推論の wedge) までの10ヶ月の連続性の維持の経路の延長。
    cc-safe-setup の約800件の hook (無料) は GitHub で自由に利用できます。
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?