組み込みAI セルフサービス型デジタル共創体験(DSCE)とは
組み込みAI セルフサービス型デジタル共創体験に記載しておりますが、現在STT(speech-to-text)、TTS(test-to-speech)、NLU(natural-language-understanding)等のAIがサーバーに接続しなくても組み込んで利用することが可能となりました。
その情報がこちらのサイト、DSCE(Digital Self-Serve Co-Create Experience;"組み込みAI セルフサービス型デジタル共創体験"?)にて紹介されております。
今回はそのDSCEの中から、「NLP keywords extraction library using a pre-trained model」 の実施方法を説明します。
※個人的な利用は無償ですが、商用利用は有償となります。
今回は 「NLP keywords extraction library using a pre-trained model」
https://dsce.ibm.com/wizard/try/results/embed-nlp-keywords-container-pt#try
今回もPlotly社製のOSSウェブフレームワークDashを使いNLP( Natural Language Processing (自然言語処理)) を利用したウェブアプリを構築します。
1. 前提
- ターミナル環境
mac : ターミナルを使います。ココ を見てターミナルを起動できるようにしてください。
windows : powershellを使います。ココ を見てpowershellを起動できるようにしてください。 - リソース取得
下のURLにアクセスしリソースを取得します。
https://github.com/IBM/dsce-sample-apps/tree/main
※コード改変&プルリクをするのであれば「git clone」コマンドを使うのですが、今回はソースコードの入手が目的ですので以下の様に Zip 形式でリソースを入手します。
リソース取得後、zipファイルを展開すると以下のようなフォルダ構成になっていると思います。今回はその中の[sentimet-analysis]配下にあるリソースを使用します。
2. 手順
2.1. [keyword-extraction]フォルダに移動
-
zipファイルを解凍した場所を起点として[keyword-extraction]フォルダに以下のようにして移動します。
cd dsce-sample-apps-main/keyword-extraction
2.2. 必須ライブラリのインストール
pip3 install -r requirements.txt
2.3. インデックス作成
以下のコマンドを使い[hotel_review]フォルダにあるサンプルデータからインデックスを作成します。
※この操作にはマシンスペックにもよりますが、15分強時間がかかります。
python3 build_index.py
2.4. アプリ実行
python3 search.py
2.5. Access the local application
ブラウザを開き、localhost:8050 にアクセス
以下の様な画面が表示されます。
- 画面上部のテキスト欄に検索したいキーワードを入力
キーワードが複数ある場合には "," で区切ってください。 - テキスト欄右の虫眼鏡ボタンをクリック
- サンプルのホテルレビューが解析され、検索条件に合致したレビューデータが表示されます。
参照:NLP keywords extraction library using a pre-trained model