これなに
データが、正規分布かどうかの検証を docker で簡単にできるようにしました。
使い方
ダミーデータでテストする場合
bash
python -c "import numpy; print(str(list(numpy.random.normal(size=100)))\
.strip('[]'))" | docker run -i --rm tsutomu7/test_normal > test.htm
firefox test.htm
上記のようにすると、下記のように表示されます。
ファイル(data.csv)からテストする場合
bash
docker run -i --rm tsutomu7/test_normal < data.csv > test.htm
firefox test.htm
やっていること
- データ数の確認(十分多いか)
- ヒストグラム表示(釣り鐘型か)
- QQプロット表示(直線上に並ぶか)
- シャピロウィルク検定
下記のように一様分布を使うと、正規分布と判定されません。
bash
python -c "import numpy; print(str(list(numpy.random.random(size=1000)))\
.strip('[]'))" | docker run -i --rm tsutomu7/test_normal > test.htm
firefox test.htm
以上