説明
自然言語処理と機械学習で見つけた英語の私的まとめ
自然言語処理
-
corpus(コーパス):
品詞情報が付与された大量の文章のまとまり。
または、品詞情報が含まれない文章のまとまりをさす。 -
The Curse of Dimensionality(次元ののろい)
計算処理されるベクトルの行数、または列数の増加によって
処理時間とメモリ消費が増大すること。
(しばしば指数関数的に増大する) -
Latent Semantic Indexing(LSI): 次元削減に使用される
-
Singular Value Decomposition(SVD): 次元削減に使用される
-
lemma(レマ):
見出し語, 辞書に載っている形式の単語 -
lemmatization:
見出し語に変換すること。
例 meet, meeting)
I'll attend meeting. 変換後 - meeting
I met him last night. 変換後 - meet -
punctuation:
ピリオド、カンマ、括弧などの記号, ?, ", =, ~, $, %, /, \ -
stem: 語幹、動詞の基本形のこと。 例)went のstem(語幹)はgo
-
stop word: 処理の対象にならない除外される単語のこと。
機械学習
その他
- square matrix: 行数と列数が同じ行列。
行列の形が四角形です。
例) 行数3, 列数3のsquare matrix
\begin{aligned}
A = \left(
\begin{array}{ccc}
a & b & c \\
d & e & f \\
g & h & i
\end{array}
\right)
\end{aligned}
- Hermitian matrix: square matrixであり、self-adjointである行列。
- self-adjoint: 以下をみたすとき、行列Aはself-adjointと呼ばれる。
A^{H} = \overline{A^{T}} = A
行列Aをtransposeしてcomplex conjugateしたら、もとの行列Aと同じになる。
A^H のHはAをエルミート化することを指す。
また、Tと上部のバーはAを転値(transpose)した後に複素共役(complex conjugate)を取ることを示している。
-complex conjugate: 虚数部の符号を逆にすること。
例1) 2 + j のcomplex conjugateは2 - j
例2)
\begin{aligned}
A &=& \left(
\begin{array}{ccc}
1 & 2-j & 3j \\
0 & 5+2j & j
\end{array}
\right)\\
\overline{A} &=& \left(
\begin{array}{ccc}
1 & 2+j & -3j \\
0 & 5-2j & -j
\end{array}
\right)
\end{aligned}