4
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Custom Translator 機械翻訳のカスタマイズ

Last updated at Posted at 2019-03-04

#概要
 Microsoft Translator Text API V3 からカスタム翻訳システムを構築できる Custom Translator が利用できるようになりました。このサービスの具体的な利用方法に関して、公式ドキュメントを読んでも体系的にわかりずらかったので簡単にまとめてみました。

#辞書データの作成
 本検証では、気象庁の緊急地震速報・津波警報の多言語辞書を拝借して、フレーズ辞書(単語)、センテンス辞書(文章)を以下のように EXCEL で作成してみました。本辞書のサンプルデータは、こちらよりダウンロードも可能です。

フレーズ辞書(単語)
image.png
センテンス辞書(文章)
image.png

#翻訳サービスのデプロイ

  1. 最初に Azure ポータルで Translator Text サービスをデプロイします。無償プランでは Custom Translator 機能は利用できないので、ここでは S1 プランを選択してデプロイします。
    image.png
  2. デプロイ後に KEY 1 の値を確認し控えておきます。
    image.png
  3. 次に Custom Translator ポータルにログインし、[Settings] から [+Add key] をクリックし、先に控えて置いたキーを設定します。
    image.png
    正常に登録されると、下記のようになります。
    image.png

#プロジェクト(カスタムモデル)の作成

  1. Custom Translator ポータルで、新規プロジェクトをデプロイします。今回は日本語から英語への翻訳ペアを選択し、カテゴリは汎用の General を選択します。
    image.png

  2. 作成された Project をクリックし、Upload files から、フレーズ辞書(単語)の EXCEL ファイルをアップロードします。
    image.png

  3. 同様にセンテンス辞書(文章)をアップロードします。

  4. 2 つの辞書のアップロードが完了したら、[Data] タブで両方の辞書を選択し、モデルの作成 [Create model] を実行します。
    image.png

  5. モデルの作成には、それなりに時間がかかります。Status が Data processing から Training succeeded になるまで気長に待つ必要があります。Training succeeded になると Deploy ボタンが現れるので、ここからモデルをデプロイします。
    image.png

  6. 日本に一番近い Asia Pacific にデプロイします。近い将来全てのリージョンにデプロイ可能となる予定です。
    image.png

  7. デプロイも、それなりに時間がかかります。Status が Deploying から Deployed になるまで気長に待つ必要があります。
    image.png
    上記のステータスとなっていればカスタムモデルのデプロイが完了しています。

#アプリケーションからの呼び出し
 作成したカスタムモデルをクライアントアプリケーションから呼び出してみます。こちらは .NET Framework 4.6.1 のコンソールアプリケーションの例となります。サンプルの詳細に関してはコード後の説明をご参照ください。

Program.cs
using System;
using System.Net.Http;
using System.Text;
using Newtonsoft.Json;

namespace MSTranslator_v3
{
    class Program
    {
        static void TranslateText()
        {
            string host = "https://api.cognitive.microsofttranslator.com";
            // Text Translator サービスのキーを設定します。
            string subscriptionKey = "5c96ef12085843bbb8f4bd79c52d852d";
            // category の指定でカスタムモデルの Category ID を指定します。
            string route = "/translate?api-version=3.0&from=ja&to=en&category=f802c0a4-e498-4f81-9f99-f034acc98c7d-GENERAL";

            System.Object[] body = new System.Object[] { new { Text = @"揺れがおさまるまで身を守ってください。" } };
            var requestBody = JsonConvert.SerializeObject(body);

            using (var client = new HttpClient())
            using (var request = new HttpRequestMessage())
            {
                // Set the method to POST
                request.Method = HttpMethod.Post;
                // Construct the full URI
                request.RequestUri = new Uri(host + route);
                // Add the serialized JSON object to your request
                request.Content = new StringContent(requestBody, Encoding.UTF8, "application/json");
                // Add the authorization header
                request.Headers.Add("Ocp-Apim-Subscription-Key", subscriptionKey);
                // Send request, get response
                var response = client.SendAsync(request).Result;
                var jsonResponse = response.Content.ReadAsStringAsync().Result;
                // Print the response
                Console.WriteLine(jsonResponse);
                Console.WriteLine("Press any key to continue.");
            }
        }
        static void Main(string[] args)
        {
            TranslateText();
            Console.ReadLine();
        }
    }
}

#カスタムモデルと標準モデルの切り替え
 上記のサンプルで subscriptionKey は最初に控えた KEY1 の値となり、category の指定がカスタムモデルを呼び出す識別子となっています。この2つの識別子を実際の環境に合わせて変更いただく必要があります。
image.png
 category は Custom Translator ポータルの下記箇所で確認いただけます。
image.png

 標準モデルを利用する場合、ここのカテゴリは既定値の general となります。また category はオプショナルパラメータのため省略した場合も、標準の MS Translator v3 のモデルが利用されます。この category 識別子を切り替えてアプリケーションを実行する事で、標準モデルとカスタムモデルとで翻訳結果の違いを確認できます。

#翻訳結果
 翻訳文の中に辞書に登録されたフレーズ(単語)やセンテンス(文章)が含まれている場合、以下のように翻訳結果が標準モデルとカスタムモデルで異なるのがわかります。センテンス(文章)の場合、完全一致でなく句読点などの揺らぎは吸収します。

原文 標準モデル カスタムモデル
気象庁からの緊急速報です。 This is an emergency earthquake report from JMA. Earthquake Early Warning (EEW) from the Japan Meteorological Agency (JMA).
揺れがおさまるまで身を守ってください。 Please protect yourself until the shaking subsides. Be prepared for strong tremors.
4
4
3

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?