LoginSignup
0
1

More than 3 years have passed since last update.

【Python】データサイエンス100本ノック(構造化データ加工編) 001 解説

Last updated at Posted at 2020-07-17
  • データサイエンス100本ノックをやりきる会を作りました🎉
  • こちらのSlack招待URLからご参加ください!!
  • ぜひ一緒に励まし合いながら、データサイエンス100本ノックをやり切りたいと思っています!

Youtube

動画解説もしています。

問題

P-001: レシート明細のデータフレーム(df_receipt)から全項目の先頭10件を表示し、どのようなデータを保有しているか目視で確認せよ。

解答

コード
df_receipt.head(10)

出力

sales_ymd sales_epoch store_cd receipt_no receipt_sub_no customer_id product_cd quantity amount
0 20181103 1257206400 S14006 112 1 CS006214000001 P070305012 1 158
1 20181118 1258502400 S13008 1132 2 CS008415000097 P070701017 1 81
2 20170712 1215820800 S14028 1102 1 CS028414000014 P060101005 1 170
3 20190205 1265328000 S14042 1132 1 ZZ000000000000 P050301001 1 25
4 20180821 1250812800 S14025 1102 2 CS025415000050 P060102007 1 90
5 20190605 1275696000 S13003 1112 1 CS003515000195 P050102002 1 138
6 20181205 1259971200 S14024 1102 2 CS024514000042 P080101005 1 30
7 20190922 1285113600 S14040 1102 1 CS040415000178 P070501004 1 128
8 20170504 1209859200 S13020 1112 2 ZZ000000000000 P071302010 1 770
9 20191010 1286668800 S14027 1102 1 CS027514000015 P071101003 1 680

解説

・PandasのDataFrame/Seriesにて、先頭データを確認する方法です。
・どんなデータがあるのかをざっくり知りたい時に使用します。
'<データ名>.head(n)'で、先頭n行目までを表示します。
・逆に末尾n行目までを表示したい場合は'<データ名>.tall(n)'を用います。
・いつ、どの店で、誰が、何を、どのくらい、いくらで買ったのか、という情報が含まれていることがわかります。

0
1
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1