初めに
今現在、R の基礎を勉強しております。自己学習のため、R コマンドを Python で実装してみたらどうなるか、を書きながら R, Python どちらもある程度使えるようにしたいというのが目的です。
R のsummay
コマンド
何人かの身長に関する統計情報を表示したい場合、以下のようなコマンドを打つことになります。
コード
height <- c(173, 178, 180, 183, 182, 174, 179, 179, 174, 192)
summary(height)
出力
Min. 1st Qu. Median Mean 3rd Qu. Max.
173.0 175.0 179.0 179.4 181.5 192.0
最小値、第一四分位数、中央値、平均値、第三四分位数、最大値を表示してくれます。
Python へ
それぞれの統計量を別々に求めてもいいのですが、pandas の DataFrame の describe
が使えそうですね。
コード
import numpy as np
import pandas as pd
height = np.array([173, 178, 180, 183, 182, 174, 179, 179, 174, 192])
df = pd.DataFrame(height)
print(df.describe())
出力
0
count 10.000000
mean 179.400000
std 5.581716
min 173.000000
25% 175.000000
50% 179.000000
75% 181.500000
max 192.000000
要素数、平均、標準偏差、最小値、第一四分位、中央値、第三四分位、最大値を表示してくれます。
#おわりに
Pythonも全てをprint
文の中に放り込んでしまえば1行で書けますが、何してるか分かりやすくするため、dfという変数を定義しています。こんな感じで簡単ではありますが、R, Python ともに理解を深めていきたいと思います。