はじめに
Jupyterについて約一年ぶりに投稿します。
去年の投稿はこちらです
Jupyterは主に、データサイエンスや統計処理等で主に使われているツールです。
Webブラウザ上で動き、設定次第によってローカル環境や、リモート環境からアクセス可能です。
セルと呼ばれるスペース単位で、pythonのコード1を実行でき、トライ&エラーがやりやすいです。
自分は、プログラム以外のコマンド処理等の作業はJupyterを使って、コマンドを半自動生成したりして、効率化をはかっています。(ほんとに効率化できているかは微妙ですが)
このようなことは、当然プログラムを書いて、コマンドラインから実行すれば同じ結果を得られますが
Jupyterを使って書いたほうが楽だと思います2。
今回は自分がよく 使うJupyterを1つ紹介したいと思います。3
自分はこういう風に使ってるという方はコメント欄にでも書き込んでくれると嬉しいです。
※Jupyterといいながら普段はJupyter Labをメインに使ってます
ケース1:SQL生成
insertでも updateでもとあるデータをもとにして、似たようなSQLを大量に生成するときによくやっています。
1.データを準備する
データフレームである必要はないですが、個人的には楽ちんなのでデータフレームで
csvデータを読み込んでます。
読み込むCSVファイル
2.SQLのフォーマットを準備する
Sqlのひな型を作ります。ここをいろいろ変更すれば、同一データから様々なSqlを生成できます。
3.SQLを生成
ループを回して、Sqlを生成します。
今回はprint関数で表示させて結果をコピーしてますが、特定のファイルに保存するのが再利用しやすくいいと思います。
最後に
やってることはただのデータを読み込んでSQL文を生成してるだけです。
ですが、やはり手軽に変更できて、結果をすぐに表示できるJupyterは便利です。
もし、退屈なルーティーン作業等があれば、Jupyterでやってみるのも手かもしれません。
この本と組み合わせてみると面白いかもしれません4
終わり