背景
- 機械学習では、学習に使用する巨大なデータはgit管理から除外したいというニーズがある。
※学習に使用するデータ:trainやtestデータなど
git管理から除外したいファイルの設定方法
結論
「.gitignore」ファイルを使用する。
「.gitignore」ファイルとは
- git君に「このファイルに記載されているファイルはgit君管理しなくていいよ。」っていうことを記載したファイル
使い方
- git管理をしているフォルダに「.gitignore」というファイルを作る。
- 「.gitignore」ファイルにgit管理に入れなくて良いファイル名を記載しておく(下記例)
とあるフォルダ
.
├─ .git
├─ .gitignore
├─ train.csv #学習データなのでgit管理から除外したい
├─ test.csv #テストデータなのでgit管理から除外したい
└─ machine-learning.ipynb
.gitignore
train.csv
test.csv
- 上記の場合、「train.csv」と「test.csv」はgit管理から除外される。
参考資料
個人ブログ