LoginSignup
21
19

More than 5 years have passed since last update.

自然言語と機械学習で使用される英語の私的まとめ

Last updated at Posted at 2015-03-21

説明

自然言語処理と機械学習で見つけた英語の私的まとめ

自然言語処理

  • corpus(コーパス):
    品詞情報が付与された大量の文章のまとまり。
    または、品詞情報が含まれない文章のまとまりをさす。

  • The Curse of Dimensionality(次元ののろい)
    計算処理されるベクトルの行数、または列数の増加によって
    処理時間とメモリ消費が増大すること。
    (しばしば指数関数的に増大する)

    • Latent Semantic Indexing(LSI): 次元削減に使用される
    • Singular Value Decomposition(SVD): 次元削減に使用される
  • lemma(レマ):
    見出し語, 辞書に載っている形式の単語

  • lemmatization:
    見出し語に変換すること。
    例 meet, meeting)
    I'll attend meeting. 変換後 - meeting
    I met him last night. 変換後 - meet

  • punctuation:
    ピリオド、カンマ、括弧などの記号, ?, ", =, ~, $, %, /, \

  • stem: 語幹、動詞の基本形のこと。 例)went のstem(語幹)はgo

  • stop word: 処理の対象にならない除外される単語のこと。

機械学習

その他

  • square matrix: 行数と列数が同じ行列。 行列の形が四角形です。

例) 行数3, 列数3のsquare matrix

\begin{aligned}
A = \left(
    \begin{array}{ccc}
      a & b & c \\
      d & e & f \\
      g & h & i
    \end{array}
  \right)
\end{aligned}
  • Hermitian matrix: square matrixであり、self-adjointである行列。
  • self-adjoint: 以下をみたすとき、行列Aはself-adjointと呼ばれる。
A^{H} = \overline{A^{T}} = A

行列Aをtransposeしてcomplex conjugateしたら、もとの行列Aと同じになる。

A^H のHはAをエルミート化することを指す。
また、Tと上部のバーはAを転値(transpose)した後に複素共役(complex conjugate)を取ることを示している。

-complex conjugate: 虚数部の符号を逆にすること。
例1) 2 + j のcomplex conjugateは2 - j
例2)

\begin{aligned}
A &=& \left(
    \begin{array}{ccc}
      1 & 2-j & 3j \\
      0 & 5+2j & j
    \end{array}
  \right)\\
\overline{A} &=& \left(
    \begin{array}{ccc}
      1 & 2+j & -3j \\
      0 & 5-2j & -j
    \end{array}
  \right)
\end{aligned}
21
19
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
21
19