More than 3 years have passed since last update.

RのsummaryをPythonへ

Last updated at 2021-02-04Posted at 2021-02-04

初めに

今現在、R の基礎を勉強しております。自己学習のため、R コマンドを Python で実装してみたらどうなるか、を書きながら R, Python どちらもある程度使えるようにしたいというのが目的です。

R の`summay`コマンド

何人かの身長に関する統計情報を表示したい場合、以下のようなコマンドを打つことになります。

コード

height <- c(173, 178, 180, 183, 182, 174, 179, 179, 174, 192)
summary(height)

出力

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  173.0   175.0   179.0   179.4   181.5   192.0

最小値、第一四分位数、中央値、平均値、第三四分位数、最大値を表示してくれます。

Python へ

それぞれの統計量を別々に求めてもいいのですが、pandas の DataFrame の describe が使えそうですね。

コード

import numpy as np
import pandas as pd

height = np.array([173, 178, 180, 183, 182, 174, 179, 179, 174, 192])
df = pd.DataFrame(height)
print(df.describe())

出力

                0
count   10.000000
mean   179.400000
std      5.581716
min    173.000000
25%    175.000000
50%    179.000000
75%    181.500000
max    192.000000

要素数、平均、標準偏差、最小値、第一四分位、中央値、第三四分位、最大値を表示してくれます。

おわりに

Pythonも全てをprint文の中に放り込んでしまえば１行で書けますが、何してるか分かりやすくするため、dfという変数を定義しています。こんな感じで簡単ではありますが、R, Python ともに理解を深めていきたいと思います。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

RのsummaryをPythonへ

初めに

R のsummayコマンド

Python へ

おわりに

R の`summay`コマンド