千葉県Go To EAT向けに店舗検索BOT(AI LINE BOT)を作った話(2)【概要】の続きです。
環境構築
windows10上にpythonが使える環境を準備しました。
インストールしたもの
- Anaconda 科学計算のためのPythonおよびR言語の無料のオープンソースディストリビューションです。今回はwindowsにてpythonと各種ライブラリを利用するために入れました。(インストール手順の参考:AnacondaをWindowsにインストールする)
- gensim 自然言語処理に用いられるオープンソースライブラリです。今回は、お店をサジェストするエンジン部分にgensimのdoc2vecを利用するためインストールします。
インストール手順
pip install gensim
- mecab MeCabは形態素解析のライブラリで、文章を最小単位の構成要素に分解することが出来ます。今回はgensimでへデータを入力する際の前処理として使います。(インストール手順の参考:PythonとMeCabで形態素解析(on Windows))
- Neologd mecabにて単語を精度よく分割するために辞書としてNeologdを追加しておきます(インストール手順の参考:WindowsでNEologd辞書を比較的簡単に入れる方法ーユーザー辞書編)
- Beautiful soup スクレイピングに特化したpythonモジュールです。今回は、機械学習の入力データを集めるために使います。以下のコマンドでインストールします。
インストール手順
pip install bs4
mecabの動作チェック
python
import MeCab
m = MeCab.Tagger("-Ochasen")
print(m.parse("欅坂46"))
結果
欅坂46 ケヤキザカフォーティーシックス 欅坂46 名詞-固有名詞-人名-一般
EOS
これでpython利用環境の準備は終了です。