データ管理をスプレッドシートで行っていたときに CSVを一括でダウンロードしたくなったのでそのメモ。
##使用したツール
- googlecl
- xlsx2csv
##手順
- googleclをインストール
http://code.google.com/p/googlecl/downloads/list
tar xvz ./googlecl-0.9.14.tar.gz
cd ./googlecl-0.9.14
sudo python setup.py install
- ダウンロード先のデータを確認
google docs list | awk -F, '{print $1}'
google docs list は CSV形式で出力されるそうなので , 区切りで取得したい情報を抽出しています。
また、最初の実行時にはgoogleアカウントのログインとトークンの設定を行う必要があります。
- 確認したファイル名を指定しダウンロード
google docs get hogehoge ./hogehoge.xlsx
- xlsx2csvをインストール
https://github.com/dilshod/xlsx2csv
sudo easy_install xlsx2csv
- csvへ変換
xlsx2csv ./hogehoge.xlsx ./hogehoge.csv
Excelのシートが複数あるときは -s オプションを使用することでシートを指定することができます。
##所感
公開設定をしてダウンロードする方法は結構乗っていたのですが、あまり外部に公開したくないデータを扱っていることもありますので、非公開のまま取得する方法ないかなーと思い、いろいろと試してみました。
これで、CSV取得して組み込むまでの手間が多少はぶけるぞい!
##参考サイト
http://code.google.com/p/googlecl/
http://qiita.com/ynakase/items/e91da987a7b066cada28
http://shower.human.waseda.ac.jp/~asaitaku/toolsManual/python/xlsx2csv.html