pandasをどれだけ使い倒すかが今の時代大事
最近よく売れているPython実践データ分析100本ノックに毎日挑戦しています。
今回はその中から単純なものから必要なものまで得た学びを共有させていただきます
(随時更新中です)
この本は実践的な例題が100本も載っています。(本のリンク(Amazon))
今後のトレンドとして
「PythonってVBAよりめっちゃシンプルにコード書けてめっちゃ資料作成が捗るわ!」
といったExcelとPythonの合わせ技ができるビジネスパーソンが社内でモテると思っています。
備考ですが、オライリー本より秀和システムの機械学習の本の方が軽くて実践的で安くておすすめです(オライリー本もお金があるときは買ってます。)
早速Jupyterでコピペでいけるようなサンプル付きの例題をいくつか紹介させていただきます。(本の内容とはちょっと違います。すべては紹介できません。コスパは抜群なのでぜひお買い求めください)
(2019/12/21)@konandoiruasaさんよりコードのCSVがURLから読み込めないという指摘をいただきました。もしそういったことが起こったら以下を実行ください。@konandoiruasaさんありがとうございます。
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
データを読む
シンプルにデータを読みます。
import pandas as pd
customer_data= pd.read_csv('https://microlearning.site/pydata/ch1/customer_master.csv')
customer_data.head()
いろんなデータを読みまくる
import pandas as pd
transaction_1 = pd.read_csv('https://microlearning.site/pydata/ch1/transaction_1.csv')
transaction_1.head()
import pandas as pd
transaction_2 = pd.read_csv('https://microlearning.site/pydata/ch1/transaction_1.csv')
transaction_2.head()
データを結合(ジョイン)する
transaction = pd.concat([transaction_1,transaction_2],ignore_index=True)
transaction.head()
長さを比べるとtransactionはtransaction_1とtransaction_2を合計した列数になっていると思います
print(len(transaction_1))
print(len(transaction_2)
print(len(transaction))
更新履歴
- 2019/12/21 新規作成