こんにちは。くろこんです。今回は LLM (Copilot) を使って英語の記事を書いてみました。完璧に英訳をしてくれてはいない……? と思うところがあったので、メモを残しておきます。
日本語
英語
問題点1 人間っぽい表現につられて目的語を間違えた
現在いる地点の傾きを考えて、
向こうに行ったらもっとかしこくなるだろう、
と予想してAI自身を更新します。
It considers the slope of the current point,
predicts that “moving in that direction will make me smarter,”
and updates itself.
Copilot いわく、かしこくなるだろう、を人間の考え(擬人化的なもの)だと勘違いして make me になったそうです。Copilot に make itself ではないですか、と聞いたら make itself のほうが自然だと答えました(""を取って itself ということと思います)。こういうのを見ると、変な文章が出来上がっているのでは、と疑心暗鬼になります。
問題点2 ハッシュドポテトを正直に翻訳した
$SHA256$はハッシュ関数と呼ばれる関数で、
ハッシュドポテトのハッシュの名の通り
まぜこぜする機能を持つ関数です。
入力されたデータを他のデータに結び付け、
その結びつけに規則性があまり無いように設計されています。
SHA256 is a hash function,
named after “hash” as in “hashed potatoes,”
meaning it mixes things up.
It maps input data to other data,
designed so that the mapping has little regularity.
なぜハッシュを説明するかと言えば、日本語にはハッシュという動詞がないからです。英語では hash は元から存在する動詞なので、この説明はおそらく不要です。
Copilot は正直に翻訳しました。人間がチェックしないと意味のない文が含まれる可能性があります。
(おまけ) チェックしたときに結論を最初に追加した
The conclusion we reach is that Quantum AI may be remarkably lightweight and even capable of mental arithmetic,
and I would like to share the reasoning behind this idea,
illustrated through the example of an Othello AI.
これは文化の違い(と思っている著者の偏見かも)で、日本語だと最後にオチが来る書き方で認められる傾向が強いですが、英語だとそういうイメージがないので結論に軽く触れるようにしました。
言語の文化的な違いで足りない文章も存在する可能性があります。
問題点3 傾きと微分を正直に別物として翻訳した
地形の傾きなどは考えず、としましたが、
学習の方法で傾きを考慮するようにもできます。
量子コンピュータ上で微分するような方法も出てくるかもしれません
Although I said it doesn’t consider slopes,
learning methods could incorporate slope information.
Methods akin to differentiation on quantum computers may emerge.
生成AIの翻訳は「量子コンピュータが微分する方法」という意味になりました。これは前後の文脈から「量子コンピュータが微分値を活用する方法」という意味だとわかります。
この間違いは、文脈的に致命的なものとなりえます。生成AIが間違いをしないような日本語を考えたり、生成された文のチェックを十分にしたりと、対策は必須だと思います。
補足 マイナーな分野は間違いやすい
そもそも論として、LLM は大量の文章を学習して機能するため、存在確率の高い文章のほうが高い精度で翻訳できます。「技術系であって、量子関連であって、微分を扱う」などというのは LLM にとって苦手以外のなんでもなく、最初から疑って結果を確認すべきです。
一般的でメジャーな分野であれば翻訳の精度は向上すると予想されます。(とはいえ、普通は特殊な文章ほど AI で翻訳したいと思うので困ったものですが……)
まとめ
- それなりの精度で翻訳はしてくれる
- 直訳では正しくても、俯瞰して考えるとおかしいことがある
- 間違いが起こった場合に伝える意味が致命的に違う可能性がある
例えば、記事の最初に LLM での英訳であることを示すなど、情報に対する配慮があったほうが良いと思います。
今回の記事は以上となります。お読みいただきありがとうございました。