More than 1 year has passed since last update.

VSCodeでテキストマイニング用の環境構築を速攻で作る

Last updated at 2023-09-01Posted at 2023-08-17

この記事は何？

VSCodeで初めてのテキストマイニングに挑戦、その学習ログです。
「pythonによるテキストマイニング入門」（山内長承）を参考図書に、環境構築してみます。

VSCode
※そもそもVSCodeをインストールしていない場合は▶こちら参照

numpy、scipy、matplotlib、pandas、sklearnはインストールされている前提

# まずpipコマンドをアップグレード
python -m pip install --upgrade pip setuptools

# 軸のラベル、凡例を日本語文字列にする
pip install japanize-matplotlib

# 回帰分析のモジュールに使用
pip install statsmodels

# Word2Vec、意味解析を行う用
pip install gensim

# 自然言語処理パッケージ
pip install nltk

【注意】ダウンロードにかなり時間かかる

import nltk
nltk.download()

以下の小窓が出てくるので、Downloadをクリック
※この切り抜きはDownloadをクリックした後

# ここ別にしなくてよし
# ダウンロード完了したら、jeitaをimportしファイル内容を確認
from nltk.corpus import jeita
jeita.readme()
jeita.fileids()

MeCabもインストール

# 形態素解析
pip install mecab-python3

これでいったん環境は整ったはず