はじめに
写経していろいろ試してみた中でpandasの使い方をもっとうまく使えるようになりたいという動機が生まれたので応用するフェーズへ移行するために、できることの範囲や境界を認識するためにながめてみました。
URL
リファレンスながめてみた感想
サイトについて
機能について(データ入出力)
- CSV以外にもいろいろ使えるのが嬉しい!
- JSONやExcelは話には聞いていたけどもHTML?スクレイピングしてくれるらしいです
- JSONはURL指定もできる模様
- SQL , BigQueryからも直接ひっこぬけるらしいです。自動化する際にいちいちファイルやオブジェクトストレージを用意しなくとも良さそうですね!
- JSONやExcelは話には聞いていたけどもHTML?スクレイピングしてくれるらしいです
Group Byなどの集計
- 各種集計系が揃っています
- 合計、平均、最大、最小などの計算
- グループ分けした上での計算
- null考慮もされた機能もあります
- 簡単に集計して俯瞰的にデータを見れると素敵ですよね
plotの種類
- いちいちmatplotlibを使わずに直接呼び出して確認するときに何でプロットするかをみるときに便利ですよね。
- 何がプロットできるかが見えるのが非常に嬉しい
終わりに
pandasに限らず、サンプルコードで紹介されている内容は試すという観点では簡潔で満足なのですが、実務を行う際には実装されている機能の存在を知らずにロジックを書くということを避けれるので、一度リファレンスをながめるというクセを付けようと改めて思いました。
私の英語力は3のゴミですがgoogle翻訳でそれなりに理解ができるので利用してみてください。
プログラミング以外にでも概要と俯瞰の理解は最初にやっておいた方がいいですね!(自分への戒め)