LoginSignup
1
1

Pythonでテキストマイニング【概要】(自然言語処理/MeCab/nlplot)

Last updated at Posted at 2024-04-21

準備・環境構築

Pythonまわり

  • ローカルでPythonを動かす場合:自由度高い、煩雑
    • Python:必須
    • Jupyter Notebook/Lab:Pythonスクリプトを動かすソフト、(ほぼ)必須
    • Anaconda:Pythonを動かすためのツールが色々入っているパッケージ(なくても可、あると便利)
    • 必要に応じてNode.jsのインストール(Jupyter Labを動かすのに必要だったような)

  • クラウドでPythonを動かす場合(Google Colaboratory):簡単・手軽、自由度低い
    • Google Colaboratoryを使うための設定(ほんの少し)
    • Googleドライブの接続

ここでのゴール

  • JupyterかColabを用いてPythonのコードを動かすことができる
  • ライブラリをインストールすることができる
  • ある程度適切に環境が構築されている
    (場合によってはPC内がごちゃごちゃになる。。)

MeCabまわり

  • MeCab(Windows版)のインストール
  • ユーザー辞書の追加
  • 動作確認

ここでのゴール

  • 任意の単語を追加できている
  • それに基づいて形態素解析を行えることが確認できている

テキストの取得

  • 解析したいテキストを、csvかxlsxファイルで準備(pandasで読み込むことを想定)
  • (APIを用いてテキスト取得の自動化も可能)
  • テキストの整形

実際に動かす

ライブラリのインストール

  • 必要なライブラリーをpip installする
  • pandas, mecab, nlplot, matplotlib, seaborn, plotyなど

実装

  • ライブラリのインポート
  • テキストの読み込み
  • 形態素解析
  • nlplotで解析、可視化
1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1