準備・環境構築
Pythonまわり
- ローカルでPythonを動かす場合:自由度高い、煩雑
- Python:必須
- Jupyter Notebook/Lab:Pythonスクリプトを動かすソフト、(ほぼ)必須
- Anaconda:Pythonを動かすためのツールが色々入っているパッケージ(なくても可、あると便利)
- 必要に応じてNode.jsのインストール(Jupyter Labを動かすのに必要だったような)
- クラウドでPythonを動かす場合(Google Colaboratory):簡単・手軽、自由度低い
- Google Colaboratoryを使うための設定(ほんの少し)
- Googleドライブの接続
ここでのゴール
- JupyterかColabを用いてPythonのコードを動かすことができる
- ライブラリをインストールすることができる
- ある程度適切に環境が構築されている
(場合によってはPC内がごちゃごちゃになる。。)
MeCabまわり
- MeCab(Windows版)のインストール
- ユーザー辞書の追加
- 動作確認
ここでのゴール
- 任意の単語を追加できている
- それに基づいて形態素解析を行えることが確認できている
テキストの取得
- 解析したいテキストを、csvかxlsxファイルで準備(pandasで読み込むことを想定)
- (APIを用いてテキスト取得の自動化も可能)
- テキストの整形
実際に動かす
ライブラリのインストール
- 必要なライブラリーを
pip install
する - pandas, mecab, nlplot, matplotlib, seaborn, plotyなど
実装
- ライブラリのインポート
- テキストの読み込み
- 形態素解析
- nlplotで解析、可視化