こんにちは、まゆみです。
Pandasについての記事をシリーズで書いています。
今回は第33回目になります。
今までの記事では、自分のパソコンにダウンロード済みのcsvを読み込んでPandasでそのデータに計算を施したり、順番を並べ替えたりする方法を書いてきました。
ということで、今回の記事では最新のCSVファイルを読み込む方法について書いていきます。
ではさっそく始めていきます
今回の記事で使うデータ
今回は、たくさんのデータを提供してくれるサイトを紹介します
NYC Open Dataへのアクセスはこちらから
データがカテゴリー別に分かれているので、興味のある分野を選んで、調べてみたいデータを使ってくださいね。
csvデータのURLを使う
使いたいデータが決まりましたら、
「Export」➡ 「CSV」 ➡ 「リンクをコピー」の順に進みます
コピーしたリンクは下記のようになりますが、「?accessType...」以下は要らないので
下記のスクショのように、要らない部分を削除したURLのみコピーします。
.read_csv()で読み込む
今までの記事で紹介したように、Pandasの.read_csv()メソッドを使ってcsvを読み込むのですが、
今回はすでにダウンロードされたcsvではなく
常にアップロードしているweb上のcsvを読み込むので
先ほどコピーしたcsvのURLを、url= という変数に代入して、.read_csv()の引数として渡します。
最新のデータを読み込むことができました。
まとめ
今回の記事はこれで終わりにします。
次回の記事では、今回と同じデータを使って、特定のコラムをPythonのリストにしたり、辞書にする方法をお伝えしていきますね。