6月15日付で英語ドキュメントが更新された
Watson language translator でポーランド語やロシア語が翻訳できるようになったらしい、と聞いて試してみました。
ところが、リファレンスの 翻訳モデル ページを見ると、ポーランド語やロシア語載っていないですねぇ?
念のために、ページの一番下の言語を日本語から英語に変えたら、ドキュメントの更新日付が2018年2月23日ではなく6月15日になって、最新の対応状況が表示できました。ちなみに、API の Ver 2 を見ると、6月12日付けの更新で、その3日後にさらに Ver 3 に変わったんですね。
2月23日の日本語版ドキュメントと6月15日付けの英語ドキュメントを比較すると、翻訳可能言語では、下記のような変化があります。
- 2種類あったアラビア語が1つになる
- 中国語は、大陸用の簡体字(Simplified)と台湾用の繁体字(Traditional)の2種類に分かれる
- オランダ語 (Dutch)、ポーランド語 (Polish)、ロシア語 (Russian)、トルコ語 (Turkish)が追加された。
および、識別できる言語の数は変わりませんが、クメール語が中央クメール語 (Central Kumer) に変更されていました。クメール語の中央方言のこと?
非公式でヒンディー語やチェコ語にも対応?
Node-RED エディターで早速 Language Translator のノードをクリックして翻訳元 (Source) と翻訳先 (Target) の選択肢を見ると、面白いことに気づきました。
英語から・または英語へ の翻訳の場合、英語ドキュメントに掲載されているほかに下記の5種類も選択可能になっています。
- cs (チェコ語)
- da (デンマーク語)
- fi (フィンランド語)
- hi (ヒンディー語)
- sv (スウェーデン語)
ほかの組み合わせも調べてみると、ca (カタロニア語) がスペイン語との間で翻訳可能になってます。
上記の言語の翻訳も近いうちに正式対応されるのでしょうか?楽しみです。
試してみた
今年1月に書いた記事 のフローを手直しして、ロシア語、ヒンディー語、チェコ語が英語へ翻訳できるか試してみました。
以上のように、公式対応のロシア語から英語への翻訳のほか、ヒンディー語とチェコ語からも何となく翻訳できているらしいことがわかりました。
ちなみに、テストに使った Node-Red のフローは Github で公開しています。
東欧言語がさらに充実 (2019/09/19 追記)
2019/08/22版の API では、下記の言語が翻訳可能になっています。(東ヨーロッパ各国の言語のみ掲載)
エストニア語、クロアチア語、チェコ語、ハンガリー語、
スロバキア語、スロベニア語、ブルガリア語、ポーランド語、
ルーマニア語、ロシア語
現時点での EU 加盟国の言語に対応させるには、あと2種類、ラトビア語とリトアニア語も追加すると完成ですね!