- データサイエンス100本ノックをやりきる会を作りました🎉
- こちらのSlack招待URLからご参加ください!!
- ぜひ一緒に励まし合いながら、データサイエンス100本ノックをやり切りたいと思っています!
##Youtube
動画解説もしています。
##問題
P-003: レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示させよ。ただし、sales_ymdはsales_dateに項目名を変更しながら抽出すること。
##解答
コード
df_receipt[['sales_ymd', 'customer_id', 'product_cd', 'amount']] \
.rename(columns={'sales_ymd': 'sales_date'}).head(10)
##出力
sales_date | customer_id | product_cd | amount | |
---|---|---|---|---|
0 | 20181103 | CS006214000001 | P070305012 | 158 |
1 | 20181118 | CS008415000097 | P070701017 | 81 |
2 | 20170712 | CS028414000014 | P060101005 | 170 |
3 | 20190205 | ZZ000000000000 | P050301001 | 25 |
4 | 20180821 | CS025415000050 | P060102007 | 90 |
5 | 20190605 | CS003515000195 | P050102002 | 138 |
6 | 20181205 | CS024514000042 | P080101005 | 30 |
7 | 20190922 | CS040415000178 | P070501004 | 128 |
8 | 20170504 | ZZ000000000000 | P071302010 | 770 |
9 | 20191010 | CS027514000015 | P071101003 | 680 |
##解説
・PandasのDataFrame/Seriesにて、列を指定しつつ、列名を変更して、先頭データを確認する方法です。
・列情報を絞り、かつ、列名をわかりやすく変更して確認したい時に使用します。
・'<データ名>[[<列名A>,<列名B>,<列名C>]].rename(columns={('<列名A>':'<列名D>')}).head(n)'で、先頭n行目までの指定した列(列名A,列名B,列名C)のうち、列名A を 列名Dに変更した上で順番(列名D,列名B,列名C)に表示します。
・' \ 'は、見やすいように、コードを改行するために入れています。