0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

RのsummaryをPythonへ

Last updated at Posted at 2021-02-04

初めに

今現在、R の基礎を勉強しております。自己学習のため、R コマンドを Python で実装してみたらどうなるか、を書きながら R, Python どちらもある程度使えるようにしたいというのが目的です。

R のsummayコマンド

何人かの身長に関する統計情報を表示したい場合、以下のようなコマンドを打つことになります。

コード
height <- c(173, 178, 180, 183, 182, 174, 179, 179, 174, 192)
summary(height)
出力
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  173.0   175.0   179.0   179.4   181.5   192.0 

最小値、第一四分位数、中央値、平均値、第三四分位数、最大値を表示してくれます。

Python へ

それぞれの統計量を別々に求めてもいいのですが、pandas の DataFrame の describe が使えそうですね。

コード
import numpy as np
import pandas as pd

height = np.array([173, 178, 180, 183, 182, 174, 179, 179, 174, 192])
df = pd.DataFrame(height)
print(df.describe())
出力
                0
count   10.000000
mean   179.400000
std      5.581716
min    173.000000
25%    175.000000
50%    179.000000
75%    181.500000
max    192.000000

要素数、平均、標準偏差、最小値、第一四分位、中央値、第三四分位、最大値を表示してくれます。

#おわりに
Pythonも全てをprint文の中に放り込んでしまえば1行で書けますが、何してるか分かりやすくするため、dfという変数を定義しています。こんな感じで簡単ではありますが、R, Python ともに理解を深めていきたいと思います。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?