1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

AIRS-LabAdvent Calendar 2021

Day 18

kaggle内でnotebookを作る

Last updated at Posted at 2022-03-04

どうも、AIRS-LabでKaggleをやっています。

データ分析コンペというとJupyter Notebookを使っている人も多いと思います。
スクリーンショット 2022-03-04 10.14.57.png

Jupyter Notebookを使っていて、うまくファイルを読み込めない時ありませんか?(やり方知らないだけですが・・w)
ドラッグアンドドロップで同じパスに入れられたらいいのに。。。と思い、Google Colaboratoryに変更しました。

2ヶ月ほどGoogle Colabで快適ライフを送っていたのですが、先日ある問題に直面してしまいました。。。!
スクリーンショット 2022-03-04 10.23.33.png
(Google Colabの利点としては、フォルダにドラッグ&ドロップしたら同じパスにあるものとして使える。)

なんと、train.csvのデータを全て読み込んでくれないではありませんか!!!(本当は80万行以上あるのに・・・)

データが大きすぎると一部しか読み取ることができなくなるようなので、Kaggle内で分析できるよう調べたので、その方法を記録しておきます。

まずは、KaggleのページにGo

スクリーンショット 2022-03-04 9.55.03.png

左上のcreateのボタンを押すと、こんな感じで初期のコードが記述されています。
デフォルトでnumpyとpandasのライブラリがインポートできるようになっています。

スクリーンショット 2022-03-04 13.44.58.png

この段階では、まだtrain.csvもtest.csvもインポートされていません。

右側のAdd dataを押すと以下のような画面になるので、Competition Dataのタブにして検索で「tabular playground series」と検索すると該当のコンペが表示されるので、addを押します。

スクリーンショット 2022-03-04 13.47.41.png

すると右側のinputのところにデータセットが入っていることがわかります。

スクリーンショット 2022-03-04 13.48.53.png

パスの書き方に少し注意が必要ですが、こんな感じできちんと848,835個のデータが入っていることがわかりました。
スクリーンショット 2022-03-04 13.55.03.png

データ分析頑張っていきましょう!

1
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?