14
14

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

機械学習の論文に出てくる記号の意味まとめ

Last updated at Posted at 2021-09-30

この記事の対象者

論文や専門書にある数式の意味を読み取りたい人。

数式に出てくる記号がどのようなことを意味を表しているのかをまとめています。厳密には異なるものを含まれているので参考程度にしてください。

はじめに

論文や専門的な本を読んだときに自分の知らない記号やなんとなくで読んでいたものをまとめてみました。
今後も追加していく予定です。いくつかは自分で解釈したものや文脈により意味が変わることがあるので、参考程度にしてください。

関数の書き方(f(x),f[x])

f[x]\\
f(x)

関数の取る値により、カッコの形が変わります。$x$が離散変数の場合$f[x]$、連続変数の場合は$f(x)$と書きます。

集合

\mathcal{g}\\
\mathbb{X} = \lbrace 小,中,大 \rbrace

質的な値を表すのに使われます。文書によって異なりますが、だいたいは花文字のアルファベットか太字のアルファベットで書かれています。

サンプリング(X~p(x))

X \verb|~| p(x)

書体が崩れてしまっていますが、大文字の$X$と関数$p(x)$の間にチルダが書かれているものです。これは実際のデータ$X$が確率密度関数$p(x)$に従って分布していることを表しています。ここで$X$は複数の値や概念を表しており、$x$は実際の値を表しています。サイコロの目を例とすると、出てくる目は1から6までの値になります。これは集合を利用して

x = \lbrace 1, 2, 3, 4, 5, 6 \rbrace

と書くことができます。サイコロの目が出る確率は全て6分の1なので、確率密度関数$f$に$x$のどの値を入れても$\frac{1}{6}$になります。なので、

X = \lbrace \frac{1}{6}, \frac{1}{6},  \frac{1}{6},  \frac{1}{6},  \frac{1}{6},  \frac{1}{6} \rbrace

となります。値が複数ある時(すなわち同時確率)の場合はまとめて

X, Y \verb|~| p(x, y)

と書くこともあります。

正規分布、ガウス分布(N)

N(0, 1)\\
N(\mu, \sigma^2)

$N(\mu, \sigma^2)$は平均$\mu$、分散$\sigma$の正規分布であることを表しています。チルダと合わせ、$x \verb|~| N(\mu, \sigma^2)$のように使用します。これは$x$が平均$\mu$、分散$\sigma^2$で生成されることを表しています。

期待値、平均(E、 ̄)

\mathbb{E}[x]\\
\mathbb{E}_{p(x)}[x]\\
\mathbb{E}_{\tau}[x]\\
\bar{x}

変数$x$の取る期待値(=平均)を表しています。中央の式は$x$が確率密度関数$p$に従っていることを表しています。$\mathbb{E}$の下の添字は期待値の対象が何であるかを表しています。$\bar{x}$は$x \in X$tとなる入力$x$の平均値であることを表しています。

ノルム(||x||)

||x|| = \sqrt{x_1^2 + x_2^2 + ... + x^2_n}

ノルムは一般的にベクトルの大きさを表すために利用されます。これは、ノルムの式の形が三平方の定理の式とよく似ていることからもイメージしやすいと思います。しかし、場合によってはベクトルの成分に重みをつけたい場合や成分を2乗ではなく3乗にしたい場合など、式を多少アレンジして使用したい場合があります。その場合、

||x||_w = \sqrt{w_1x_1^2 + w_2x_2^2 + ... + w_nx_n^2}\\
||x||_3 = \sqrt{x_1^3 + x_2^3 + ... + x_n^3}

のようにノルムの右下になにかしらの記号を書くことで、明示的に一般的なノルムとはことなることを表しています。

積分

\int x dx\\
\int_\mathcal{G} xdx

意味的には、膨大な数のなにかの総和を取りたいときや、値の間隔が短いものの総和を求めたいときに使います。ほとんどの場合、$\Sigma x$とほぼ同じ意味として解釈できます。

近似(二重の~、≒、^)

\approx\\
\fallingdotseq\\
\simeq\\
\sim\\
\hat{y} = \hat{f}(x)

近似または限りなく等しいことを表しています。日本では$\simeq$、海外では$\approx$を使用することが多いです。サンプリングを表す記号として$\sim$がありますが、この記号は近似として使用されることもあります。

一番下の式は、$\hat{y}$が近似した関数$\hat{f}$からの出力であることを表しています。この場合、「文中で求めた関数の出力である」という意味で使われることもあります。(機械学習の論文の場合、こちらの意味のほうが多いです。)

14
14
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
14
14

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?