0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Microsoft Fabric の組み込みの AI モデルで自然言語に対する解析・分析をしてみる

Last updated at Posted at 2024-01-26

はじめに

Microsoft Fabricでは、生成AIを含むAIモデルを使用して、AOAIなどの構築なしにデータ処理が可能です。※F64以上の容量が必要です。

今回は、製品レビューのデータセット2万件(英語)に対して以下の操作を試みます。

  • レビューの翻訳(Azure AI Translator サービスモデルを使用)
  • レビューから感情の抽出(Azure OpenAI のモデルを使用)

注意:この情報は2025年1月時点のものです。記載されているコードや処理内容、時間は変わる可能性がありますのでご了承ください。

検証開始

1. データの確認

まず、データを確認します。データは既にレイクハウスに保存されているため、これをデータフレームに読み込みます。

レビューはレーティングとともに英語で記載されています。

image.png

およそ2万件のデータセットであることがわかります。

image.png

2. 翻訳

翻訳タスクを実行するためには、SynapseMLのTranslate()を使用します。

image.png

3. 感情の抽出

まずそれぞれプロンプトにしてやります。

image.png

ここではOpenAICompletion()を使用します。一つ一つがpromptなのでまあまあ時間かかりますね。手動でやるときはもっと絞って確認しないとやりづらそう。単純に呼び出し方自体でもうちょいいいやり方がある気もする。

image.png

4. 保存

結果をレイクハウスに保存します。

image.png

また、感情をカンマ区切りで抽出したので感情で分析するために展開と保存を行います

image.png

5. 可視化

レイクハウス上のデータを Power BI で可視化してみました。
ワードクラウドとかを使っています。よくある感情分析レポートの例ですね。なお、全体のレイアウトは Power BI Copilot の力を借りてます。

image.png

所見

複数の感情を抽出できないかなと思って生成 AI 使ってみましたが、カンマ区切りを例示しても結構出力の形式がばらついたので再現性みたいなところはやはり課題になりますね。
処理時間についても少しかかるので実装の仕方に改善の余地ありって感じ。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?