- データサイエンス100本ノックをやりきる会を作りました🎉
- こちらのSlack招待URLからご参加ください!!
- ぜひ一緒に励まし合いながら、データサイエンス100本ノックをやり切りたいと思っています!
##Youtube
動画解説もしています。
##問題
P-021: レシート明細データフレーム(df_receipt)に対し、件数をカウントせよ。
##解答
コード
len(df_receipt)
出力
104681
##解説
・PandasのDataFrame/Seriesにて、行数をカウントする方法です。
・行数が全部で何件あるのかを確認したい時に使用します。
※他にも、行数や列数を確認したい時によく使用する関数があります
- 行数や列数などの情報を要約して表示します
コード
df_receipt.info()
出力
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 104681 entries, 0 to 104680
Data columns (total 9 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sales_ymd 104681 non-null int64
1 sales_epoch 104681 non-null int64
2 store_cd 104681 non-null object
3 receipt_no 104681 non-null int64
4 receipt_sub_no 104681 non-null int64
5 customer_id 104681 non-null object
6 product_cd 104681 non-null object
7 quantity 104681 non-null int64
8 amount 104681 non-null int64
dtypes: int64(6), object(3)
memory usage: 7.2+ MB
- 列数を表示します
コード
len(df_receipt.columns)
出力
9
- 行数、列数を表示します
コード
df_receipt.shape
出力
(104681, 9)
- 全要素数(サイズ)を表示します
コード
df_receipt.size
出力
942129