数学
統計
統計学
統計学入門

(随時更新) 統計1級を目指すための用語集 by Team AI

はじめに

Team AIでは年に1回ずつ行われている統計検定1級(大学専門)/準1級(大学教養)についての勉強会をはじめました。
オフィシャルガイドブックを元に、単語の意味を調べながらグループワークで学習を進めています。

用語

初級

加重平均

「加重平均」とは重みつき平均ともいうそうです。
こちらに加重平均の詳しい内容が掲載されております。

[なるほど統計学園高等部 平均値]
http://www.stat.go.jp/koukou/howto/math/
https://oshiete.goo.ne.jp/qa/476273.html

幾何平均

幾何平均(きかへいきん、英: geometric mean)または相乗平均は数学における平均の一種で、数値群の代表値である。多くの人が平均と聞いて思い浮かべる算術平均と似ているが、それぞれの数値を足すのではなく掛け、その積の冪根(数値がn個ならn乗根)をとることで得られる。

https://ja.wikipedia.org/wiki/%E5%B9%BE%E4%BD%95%E5%B9%B3%E5%9D%87

調和平均

数学において、調和平均(ちょうわへいきん、英: harmonic mean, subcontrary mean)はいくつかの種類がある平均のうちの1つである。典型的には、率の平均が望まれているような状況で調和平均が適切である。

正の実数について、調和平均は逆数の算術平均の逆数として定義される。簡単な例として、3つの数 1, 2, 4 の調和平均は次のように計算できる:

スクリーンショット 2018-03-23 21.25.22.png

https://ja.wikipedia.org/wiki/%E8%AA%BF%E5%92%8C%E5%B9%B3%E5%9D%87

中級

対数計算

https://sci-pursuit.com/math/logarithm-formulae-and-calculation.html

クロスバリデーション

交差検証(交差確認)[1](こうさけんしょう、英: Cross-validation)とは、統計学において標本データを分割し、その一部をまず解析して、残る部分でその解析のテストを行い、解析自身の妥当性の検証・確認に当てる手法を指す[2] [3] [4]。データの解析(および導出された推定・統計的予測)がどれだけ本当に母集団に対処できるかを良い近似で検証・確認するための手法である。

最初に解析するデータを「訓練事例集合(training set)」などと呼び、他のデータを「テスト事例集合(testing set、テストデータ)」などと呼ぶ。

交差検証は Seymour Geisser が生み出した。特にそれ以上標本を集めるのが困難(危険だったり、コストがかかったり)な場合は、データから導いた推定は、交差検証などで慎重に裏付けを確認するべきである。
https://ja.wikipedia.org/wiki/%E4%BA%A4%E5%B7%AE%E6%A4%9C%E8%A8%BC

上級

ラッソ関数 L1正則化

リッジ関数 L2正則化

正則化

https://ja.wikipedia.org/wiki/%E6%AD%A3%E5%89%87%E5%8C%96
20150228165325.png

https://tjo.hatenablog.com/entry/2015/03/03/190000