LoginSignup
1
0

More than 3 years have passed since last update.

【Python】データサイエンス100本ノック(構造化データ加工編) 003 解説

Last updated at Posted at 2020-07-18
  • データサイエンス100本ノックをやりきる会を作りました🎉
  • こちらのSlack招待URLからご参加ください!!
  • ぜひ一緒に励まし合いながら、データサイエンス100本ノックをやり切りたいと思っています!

Youtube

動画解説もしています。

問題

P-003: レシート明細のデータフレーム(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示させよ。ただし、sales_ymdはsales_dateに項目名を変更しながら抽出すること。

解答

コード
df_receipt[['sales_ymd', 'customer_id', 'product_cd', 'amount']] \
.rename(columns={'sales_ymd': 'sales_date'}).head(10)

出力

sales_date customer_id product_cd amount
0 20181103 CS006214000001 P070305012 158
1 20181118 CS008415000097 P070701017 81
2 20170712 CS028414000014 P060101005 170
3 20190205 ZZ000000000000 P050301001 25
4 20180821 CS025415000050 P060102007 90
5 20190605 CS003515000195 P050102002 138
6 20181205 CS024514000042 P080101005 30
7 20190922 CS040415000178 P070501004 128
8 20170504 ZZ000000000000 P071302010 770
9 20191010 CS027514000015 P071101003 680

解説

・PandasのDataFrame/Seriesにて、列を指定しつつ、列名を変更して、先頭データを確認する方法です。
・列情報を絞り、かつ、列名をわかりやすく変更して確認したい時に使用します。
'<データ名>[[<列名A>,<列名B>,<列名C>]].rename(columns={('<列名A>':'<列名D>')}).head(n)'で、先頭n行目までの指定した列(列名A,列名B,列名C)のうち、列名A を 列名Dに変更した上で順番(列名D,列名B,列名C)に表示します。
' \ 'は、見やすいように、コードを改行するために入れています。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0