0.はじめに
大学で計量テキスト分析の講義を受講している者です。
用語や概念をまとめて以下の項目に分類しています。
1.計量テキスト分析とは
テキストデータを量的データへと変換し計量的分析を行う方法のこと
定義
計量的分析手法を用いてテキスト型データを整理もしくは分類し内容分析を行う方法
不可能ではないが手作業より遥かに円滑なためPC利用
による分析が望ましい
内容分析
コミュニケーションから分類し特徴を導き出し客観化する研究方法
内容を記述するだけでなく内容を送信する側ないし受信する側の状況を鑑み推論する方法
分析において分類をする際、基準の規定が困難でこれまで誰もが簡単にできるものではなかった
手法
- 1.問題に着目
- 2.計量的なモデルに変換
- 3.モデルを数学的・統計的に分析
- 4.3を現実的な言語へと変換
種類
仮説検証型
データを探し可能な範囲のデータでできるだけの分析を行う
問題発見型
データに基づき可能な範囲のデータで結果を導く分析を行う
アプローチ法
Dictionary-basedアプローチ
分類の基準を分析者自らが指定し分類するアプローチ
Correlationalアプローチ
頻繁に発生する言葉を多く含む分類を分析し自発的に発見・分析するアプローチ
探索的解析のことをテキストマイニングという
統合アプローチによる柔軟性
第一段階でCorrelationalアプローチ
を行いデータを要約・提示する
第二段階でDictonary-basedアプローチ
でコーディング規制を図ることで仮説や検証の追及を行う
2.備考
KH Coder
テキストマイニングするためのソフトウェア
参考文献
黒橋 禎夫 (自然言語処理〔改訂版〕 (放送大学教材))
吉村賢治 (自然言語処理の基礎)
奥野 陽 (自然言語処理の基本と技術)