LoginSignup
20
17

More than 5 years have passed since last update.

小ネタ: WatsonのNatural Language Understandingが【フル】日本語対応しました

Last updated at Posted at 2018-03-22

image

:triangular_flag_on_post: 2018/5/24時点で追加があったのでアップデートします
:triangular_flag_on_post: 2018/6/26時点で正式に日本語対応されたのでアップデートします

要は: NLU機能の一部が日本語対応しました

NLUのRelease Noteで知ったのですが

  • (2018-03-16付) カテゴリーとコンセプトの機能が日本語対応しました
  • (2018-04-19) Relationsが日本語対応しました
  • (2018-05-04) SentimentとSemantic Roleが日本語対応しました
  • (2018-06-26) 一部未対応箇所1を除き、日本語をフルにサポートしました

NLUにはいろいろなフィーチャーがありますが、まだ全てが日本語対応したわけではないので、とりあえずの軽いお知らせ的な記事を書きます。(Watson Discovery等で本格的な対応ができたら、また記事書こうと思います)
2018-06-26にはWatson Discoveryも日本語のフルサポートが発表されています

NLUって何?

ドキュメントには

自然言語理解を使用して、テキストを分析し、コンテンツから概念、エンティティー、キーワード、カテゴリー、感情、関係、意味役割などのメタデータを抽出します。 Watson Knowledge Studio を使用して開発されたカスタム・アノテーション・モデルにより、非構造化テキスト内の業界固有/特定分野のエンティティーおよび関係を識別します。

とあります。要はアノテーション=メタデータの抽出、ですかね。
Watson Discoveryは内部的にNLUの機能を利用しています。NLUの意味や機能はQiitaのWatson Discoveryご紹介記事のエンリッチメント(Enrichment)の箇所に書きましたので、よろしければご参照ください。
NLUには大きく以下の7つのフィーチャーがありますが、今回は「とりあえず」①と④に対応したものです。 2018/06/26時点では(一部未対応項目を除き) ひととおり日本語対応しました。

①概念のタグ付け( Concept Tagging )
②エンティティー抽出( Entity Extraction )
③キーワード抽出( Keyword Extraction )
④カテゴリー分類( Category Classification )
⑤感情分析( Emotion Analysis )2
⑥センチメント分析( Sentiment Analysis )
⑦意味役割抽出( Semantic Role Extraction )

今までWatson Discoveryの日本語環境ではNLU自体が日本語に未対応だったためにメタデータによるエンリッチメントの醍醐味を享受できていませんでしたが、NLUの一部が日本語に対応したことで、「Discoveryの日本語フルサポートも近いかな?」と楽しみにしております。NLUが日本語に対応したことで、Discoveryの日本語フルサポートも同時に発表されました。

やってみた

:warning: 以下の「やってみた」は2018/03月時点のものです。最新のフル対応の結果ではありませんので、ご注意ください。



Watson NLUのデモ・サイトがすでに日本語に対応していましたので、触ってみました。
  • ネット上から適当に文章を拾って、NLUに解析させてみました。(コンテンツの選択に特に意図はありません)
  • 当該デモサイトでは言語を指定せずとも、日本語を自動判定のうえ、よしなに処理してくれます。

Yahooニュース

今日のトップにあった「認可保育1次選考、24%入所できず…読売調査」というニュースのテキストをコピペして「Analyze」ボタン。
image

カテゴリーとして政府、日本、子供などが出てきました。いい感じです。
image

コンセプトもよさげです。
image

ロンドン旅行記

4Travelの「娘と行くロンドン9日間 5日目」という旅行記ブログ

今度はテキストではなくページ全体のURLでやってみました。
image

カテゴリーは旅行で正解。
image

コンセプトも「旅行」「ロンドン」はいいですが、「20」は記事の周りに20万円前後のツアーのバナーが出ているので、それを持ってきたのでしょう。
image

マニュアル

キャノンさんのプリンターのWebマニュアル「かんたんな設定で印刷を行う」のページのURLを指定しました。

image

カテゴリーは「プリンター」で正解。「卒業生と再会(alumni and reunions)」はどこから導き出されたされたものか、謎。(まあ確信度は低いですが)
image

コンセプトもいい感じです。
image

いかがでしたでしょうか。NLUは単独で使うというよりは、他のWatson APIサービスのための「縁の下の力持ち」=地味な印象ですが、ニュースへのタグ付け、顧客センチセンチメント分析など、応用範囲の広い重要な機能です。NLUって何してくれるのかな?というイメージが少しでも沸きましたら幸いです。

:warning: アプリから最新のAPIを呼ぶ場合はバージョンに'2018-03-16'をセットしてください

以上です。


  1. 未対応箇所はrelease-noteに記載がありますが、Number/Percent/PhoneNumber/URL/IPv6_addressesがまだ日本語に対応だそうです。 

  2. ⑤感情分析は未対応ですが、今後も対応の予定は無いそうです。⑥のセンチメント分析があるからいいでしょ、ってことかと思います。 

20
17
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
20
17