センチメントの分析は、SNSの記事や、アンケート結果などの自然言語で書かれたデータを分析用に分類してくれる便利な機能です。
Oracle Analytics Cloudには、「センチメントの分析」機能があって、データの前処理を行う「データーフロー」から利用する事が可能です。
この例は実際にOACデータフローから生成したデータです。
データのReview欄のデータを解読して、「Positive」「Neutral」「Negative」の情報を生成して、emotion列に分類しています。
※ちなみに、この機能はまだ日本語に対応していませんので、英語データを使いました。
この機能の使い方は簡単です。
1.Excelでデータを準備して、データセットとして登録します。
※今回はシンプルなExcelデータを準備して、Drag&Dropし、データセットを作成しました。
2.新規に「データフロー」を作成して、いま登録したデータセットを選択します。
※登録したデータの中身が、下段にプレビュー表示されています。
3.「センチメントの分析」をフローに追加します。
※「Positive」「Negative」の判定は、新規に追加された「emotion」列に出力されます。
4.センチメントの分析対象となる列を選択します。
5.「データセットの保存」機能を追加する。
まだデータフローを実行していませんが、プレビューされて、emotion列にどのような判定データ生成されるかを確認することができます。
後は、データフローを「実行」し、生成されたデータセットを使って分析を行う流れになります。
ちなみに、日本語対応してないことはわかっているのですが、試しに日本語データを使ってみました。
残念ながら、日本語は処理できないので、すべて「Neutral」の判定になってしまいました。
現段階では、日本語を含むデータを処理したい場合は、REST APIをつかってGoogle翻訳などの翻訳エンジンで、いったん英語データを自動生成してから「センチメントの分析」を行う方法をとるしかなさそうです。