この記事は DevRel Advent Calendar 2018 の、10日目の記事です。
DevRel やDeveloper Advocate などの業務に関わっていると
- 海外の情報を日本語圏に紹介する
- 日本の情報を海外に紹介する
- 海外の技術者たちと情報交換を行う
など、言語を超えて情報をやり取りする場面も多くなってくることでしょう。
そのような場面では、AI翻訳の利用を考えたくなります。
本稿では、AI翻訳を実務に使った経験をもとに
- AI翻訳は業務に使えるのか
- AI翻訳を使用する際に気をつけたいこと
を体験ベースで書きます。
Premise
本稿は、日本語<=>英語を前提に記述します。
「言語研究」といったアカデミックな視点ではなく、「ビジネスで英語を使っている担当者の、現場の経験談」として見ていただければ幸いです。
言語間の習得難易度
最初に「言語間の習得難易度」について。
この表は、アメリカ国務省が公開しているウェブページ を抜粋して、まとめ直したものです。英語ネイティブから見た、外国語の習得にかかる時間と難易度を表しています。
英語学習者の間ではよく知られている表で、ご存知のかたも多いでしょう。
英語を母語とする人たちにとって、日本語は習得が最も難しい言語カテゴリなのだそうです。漢字・ひらがな・カタカナなどの文字種に加えて、文法が全く異なるため、習得に苦労すると聞いたことがあります。
逆に言うと、日本人にとっても、英語は習得が難しい言語の一つと言えるでしょう。AI翻訳でもその傾向はあるようです。
## 主語・述語がはっきりしている文章は得意
AI翻訳の代表的なサービスである「Google翻訳」「Bing翻訳」で、日本語<=>英語の翻訳をしてみます。
例1
私の名前はTakeshiです
Google翻訳の結果
My name is Takeshi
Bing翻訳の結果
My name is Takeshi
どちらも同じ翻訳結果となりました。
例2
キーボードからパスワードを入力してください。
Google 翻訳
Please enter the password from the keyboard.
Bing翻訳
Please enter your password from the keyboard.
微妙に違いますが、ほぼ同じ翻訳結果となりました。
これら2つの例は、そのまま使える正しい英語の文章と言って良いでしょう。
AI翻訳は、
「主語、述語がはっきりしている短文は、かなり正確に翻訳を行う」
傾向があります。
コンテキストを読む文章は苦手
次に、コラム文章を翻訳してみます。
この文章は、読売新聞の1面に掲載されている「編集手帳」の2018年9月29日付から抜粋した文章です。
例3
武田鉄矢さんは若い頃、容姿に悩んだ。コンプレックスにまつわるふしぎな体験を著書のあとがきに記している。
AI翻訳結果
Takeda Tetsuya suffered from his appearance when he was young. I wrote a mysterious experience related to complex in the book's postscript.
翻訳としてはかなり良い感じなのですが、一点、致命的な誤訳があります。
2つ目の文章が「I」、つまり、コラムの筆者に変わっている点です。
もとの日本語を見ると「不思議な体験」について書いたのは、武田鉄矢さんであることがわかります。
読売新聞の英語版、「The Japan News」では、このコラムを以下のように英訳していました。
(該当記事は公開終了しています)
When Tetsuya Takeda was young, he suffered from an inferiority complex regarding his appearance. The actor and singer mentions an extraordinary experience concerning this complex in an afterword to one of his books.
この例のように、前後のコンテキストや行間を読む必要がある文章になると、誤訳が急激に増えます。一見、文法的には正しいように見えても、よく読み返さないと誤訳に気が付かない、ということもありえます。
原文・翻訳後の文章を見比べる力がないと、誤訳に永遠に気が付かないため、注意が必要となります。
AI翻訳を使う際に気をつけたいこと
以上から、次のようなことが言えます。
- 主語、述語、目的語がはっきりしている短文はかなり正確に翻訳する
- コンテキストを読む必要がある文章は要注意
- コラムや小説、エモーショナルな文章は不得意
- かならず人間による確認を行うべきである
- チェックを怠ると、意味が変わっていることに気が付かない場合もありえる
AI翻訳を業務に使う
先述の通り、AI翻訳はコラムや小説などの文章にはあまり向いていません。一方で、技術ドキュメントやマニュアルのように
- 内容がロジカルである文章
- 主語と述語がはっきりしている文章
については、かなり良い翻訳をしてくれます。このため、自分は技術文章や資料などの「粗訳」として利用しています。
これまで自分が日本語ドキュメントの英訳を行う際は、以下のようなルーチンで回していました。
翻訳前の原稿
=> 私が粗訳
=> 海外の英語ネイティブに校正依頼
=> 校正が海外から返ってくる
=> 再チェック
=> 公開
AI翻訳を使う場合、以下のようなルーチンで回しています。
翻訳前の原稿
=> AI翻訳で粗訳
=> 私が不自然な箇所をチェック・修正
=> 海外の英語ネイティブに校正依頼
=> 校正が海外から返ってくる
=> 再チェック
=> 公開
作業が一工程増えていますが、AI翻訳で粗訳をすることで、まったく一から翻訳するよりも、工数の削減を見込むことができます。
AI翻訳で粗訳するTIPS
元の文章をAIが解釈しやすいようにする
先述の通り、コンテキストを読まなければいけない文章の場合、AI翻訳は誤訳を引き起こす場合があります。このため、日本語=>英語に訳する場合
- 元の日本語を確認する
- 場合によっては、意味を変えない範囲でAIが訳しやすい文章に変える
方が効率が良い場合があります。
以前にAI翻訳を利用した際、次のような文章の英訳がありました。
人材採用のことを考えると、スマートフォン対応のサイトが必須だと考えたが、制作費がかかる点を思案していた。
サービスの事例紹介にあった一文です。AI翻訳にかけたところ、以下のような結果が返ってきました。
Considering recruitment of staff, I thought that a smartphone compatible site was essential, but I was deeply thinking about production costs.
元の日本語をできるだけ忠実に訳そうとしていることがわかりますが、個人的に以下の2点が気になりました。
- 文が冗長で読みづらい
- 主語が変わっており、文脈が変
そこで、もとの意味を変えないように、日本語を2つに分割してAI翻訳に投入後、以下のように変更しました。
Considering recruitment, a smartphone compatible site is essential. However, Mr. 〇〇 worried about the production cost.
このように、状況によっては、元の日本語を少し変え、AI翻訳が解釈しやすいようにすることで、業務効率が上がる場合があります。
自分が英訳の作業を行う際は、元の日本語を確認しながら、気になる点は担当者に連絡を行い、元の文章を変える許可をもらったり、文の意図を確認しながら粗訳を進めています。
※「小説」や「コラム」など、もとの日本語を変えてはいけない文章の場合、この方法は使えません。
用語のばらつきに気をつける
AI翻訳を使うと、単語・用語の翻訳がバラけることがよくあります。
サービス開発やドキュメント・マニュアルの作成時には、表記の揺れや用語のばらつきがないように、用語を統一し、単語の意味を一意にする必要があります。
AI翻訳を利用した場合、「機能名」「固有名」など、表記ゆれがあってはいけない箇所にばらつきが発生していないか、確認する必要があります。
####コンフィデンシャルな文章は要注意
すでに公開されている文章の場合はあまり問題になりませんが、未公開の文章や契約関連の文章は、公開されているAI翻訳を使わないほうが無難と言えるでしょう。守秘義務が伴う文章は、情報の秘匿性が担保されているサービスを使ったほうが良いことは、言うまでもありません。
その他 (ポエムのような何か)
「AI翻訳が進歩すると、語学を学習する必要はなくなるのではないか」という意見をよく聞きます。自分はこの説に懐疑的です。
日本人どうしで、日本語を使ったやり取りをした場合でも
- 相手の意図を正確に理解する
- 文脈を読む
ことは、かなり難しい作業です。
異なる言語・異なる文化となると、どんなにAI翻訳が進化したとしても、人間によるチェックは不可欠なことでしょう。
AI翻訳をうまく使うことで、コミュニケーションコストを大きく下げることはできます。だとしても、外国語を学ぶ重要性は変わらないことでしょう。
外国語の勉強は「沼」のようなもので、どんなに頑張って勉強しても、終わりが見えません。しかもタチが悪いことに、勉強をサボると、あっという間に力が落ちていきます。
自分がまだ英語が苦手な頃、TOEICのAレベル (860点以上) や英検一級、準一級というのは、「英語の達人」のように考えていました。
実際に自分がTOEICのAレベルに達したときに感じたことは
「こんなもの?TOEICのAレベルって、まだまだ全然じゃないか?」
でした。
TOEICのサイトによると、Aレベルは「Non Native として十分なコミュニケーションができる」と書いていますが、何かの間違いではないかと思うぐらいです。英語のニュースを聞いても半分しか聞き取れません。映画も同様です。
外国語というのは、会話の背景の知識・会話に関連する用語をどこまで知っているかで、リスニング力もスピーキング能力も大きく変わるのです。
そう考えると、外国語の勉強というものは一生をかけて続けていくものだと思います。
DevRel という仕事をしていると、海外の情報や異文化コミュニケーションに関わることが良くあります。そんなDevRel 担当者にとっては、語学の勉強は欠かすことのできない勉強の一つだと言えるでしょう。
日夜外国語と戦っているDevRel の皆さん、これからも頑張って勉強していきましょう。
自分も置いてきぼりにならないように、ヒイヒイ言いながら勉強を続けたいと思います。