More than 5 years have passed since last update.

【Pandas】最新のCSVファイルを読み込む方法 .no.33

Posted at 2021-04-08

こんにちは、まゆみです。

Pandasについての記事をシリーズで書いています。

今回は第33回目になります。

今までの記事では、自分のパソコンにダウンロード済みのcsvを読み込んでPandasでそのデータに計算を施したり、順番を並べ替えたりする方法を書いてきました。

ということで、今回の記事では最新のCSVファイルを読み込む方法について書いていきます。

ではさっそく始めていきます

今回の記事で使うデータ

今回は、たくさんのデータを提供してくれるサイトを紹介します

 NYC Open Dataへのアクセスはこちらから

データがカテゴリー別に分かれているので、興味のある分野を選んで、調べてみたいデータを使ってくださいね。

使いたいデータが決まりましたら、

「Export」➡　「CSV」 ➡　「リンクをコピー」の順に進みます

コピーしたリンクは下記のようになりますが、「?accessType...」以下は要らないので

下記のスクショのように、要らない部分を削除したURLのみコピーします。

今までの記事で紹介したように、Pandasの.read_csv()メソッドを使ってcsvを読み込むのですが、

今回はすでにダウンロードされたcsvではなく

常にアップロードしているweb上のcsvを読み込むので

先ほどコピーしたcsvのURLを、url=　という変数に代入して、.read_csv()の引数として渡します。

最新のデータを読み込むことができました。

今回の記事はこれで終わりにします。

次回の記事では、今回と同じデータを使って、特定のコラムをPythonのリストにしたり、辞書にする方法をお伝えしていきますね。