databricksのバージョン管理
Google Colab + GitHubでnotebookの変更履歴を管理するとたまにGitHubにコピーをとり忘れたりすることがある
databricksは自動的に変更履歴を取得してくれるのでcloneをとらずに安心してnotebookを編集できる
データ分析コンペでsubmitを60回くらいやるとnotebookのバージョンとsubmissionファイルの対応が怪しくなるがdatabricksの変更履歴を使えば日付時刻をキーにして対応を探り当てることができるので便利
第2回 金融データ活用チャレンジで提供されるMLclusterを使うと学習に使ったデータも自動保存してくれるようだ