2018/5/24時点で追加があったのでアップデートします
2018/6/26時点で正式に日本語対応されたのでアップデートします
要は: NLU機能の一部が日本語対応しました
NLUのRelease Noteで知ったのですが
- (2018-03-16付) カテゴリーとコンセプトの機能が日本語対応しました
- (2018-04-19) Relationsが日本語対応しました
- (2018-05-04) SentimentとSemantic Roleが日本語対応しました
- (2018-06-26) 一部未対応箇所1を除き、日本語をフルにサポートしました
NLUって何?
ドキュメントには
自然言語理解を使用して、テキストを分析し、コンテンツから概念、エンティティー、キーワード、カテゴリー、感情、関係、意味役割などのメタデータを抽出します。 Watson Knowledge Studio を使用して開発されたカスタム・アノテーション・モデルにより、非構造化テキスト内の業界固有/特定分野のエンティティーおよび関係を識別します。
とあります。要はアノテーション=メタデータの抽出、ですかね。
Watson Discoveryは内部的にNLUの機能を利用しています。NLUの意味や機能はQiitaのWatson Discoveryご紹介記事のエンリッチメント(Enrichment)の箇所に書きましたので、よろしければご参照ください。
NLUには大きく以下の7つのフィーチャーがありますが、今回は「とりあえず」①と④に対応したものです。 2018/06/26時点では(一部未対応項目を除き) ひととおり日本語対応しました。
①概念のタグ付け( Concept Tagging )
②エンティティー抽出( Entity Extraction )
③キーワード抽出( Keyword Extraction )
④カテゴリー分類( Category Classification )
⑤感情分析( Emotion Analysis )2
⑥センチメント分析( Sentiment Analysis )
⑦意味役割抽出( Semantic Role Extraction )
今までWatson Discoveryの日本語環境ではNLU自体が日本語に未対応だったためにメタデータによるエンリッチメントの醍醐味を享受できていませんでしたが、~~NLUの一部が日本語に対応したことで、「Discoveryの日本語フルサポートも近いかな?」と楽しみにしております。~~NLUが日本語に対応したことで、Discoveryの日本語フルサポートも同時に発表されました。
やってみた
以下の「やってみた」は2018/03月時点のものです。最新のフル対応の結果ではありませんので、ご注意ください。
[Watson NLUのデモ・サイト](https://natural-language-understanding-demo.ng.bluemix.net/)がすでに日本語に対応していましたので、触ってみました。
- ネット上から適当に文章を拾って、NLUに解析させてみました。(コンテンツの選択に特に意図はありません)
- 当該デモサイトでは言語を指定せずとも、日本語を自動判定のうえ、よしなに処理してくれます。
Yahooニュース
今日のトップにあった「認可保育1次選考、24%入所できず…読売調査」というニュースのテキストをコピペして「Analyze」ボタン。
カテゴリーとして政府、日本、子供などが出てきました。いい感じです。
ロンドン旅行記
4Travelの「娘と行くロンドン9日間 5日目」という旅行記ブログ
コンセプトも「旅行」「ロンドン」はいいですが、「20」は記事の周りに20万円前後のツアーのバナーが出ているので、それを持ってきたのでしょう。
マニュアル
キャノンさんのプリンターのWebマニュアル「かんたんな設定で印刷を行う」のページのURLを指定しました。
カテゴリーは「プリンター」で正解。「卒業生と再会(alumni and reunions)」はどこから導き出されたされたものか、謎。(まあ確信度は低いですが)
いかがでしたでしょうか。NLUは単独で使うというよりは、他のWatson APIサービスのための「縁の下の力持ち」=地味な印象ですが、ニュースへのタグ付け、顧客センチセンチメント分析など、応用範囲の広い重要な機能です。NLUって何してくれるのかな?というイメージが少しでも沸きましたら幸いです。
アプリから最新のAPIを呼ぶ場合はバージョンに'2018-03-16'をセットしてください
以上です。
-
未対応箇所はrelease-noteに記載がありますが、Number/Percent/PhoneNumber/URL/IPv6_addressesがまだ日本語に対応だそうです。
NLUにはいろいろなフィーチャーがありますが、まだ全てが日本語対応したわけではないので、とりあえずの軽いお知らせ的な記事を書きます。(Watson Discovery等で本格的な対応ができたら、また記事書こうと思います)
2018-06-26にはWatson Discoveryも日本語のフルサポートが発表されています ↩ -
⑤感情分析は未対応ですが、今後も対応の予定は無いそうです。⑥のセンチメント分析があるからいいでしょ、ってことかと思います。 ↩