やりたいこと
Dr.Sumというデータベース製品はPythonと連携して大量データを柔軟に加工・分析することができます!
本記事では、Dr.Sum上でのpython開発をサポートするpython Developer Toolの使い方について解説していきます。
知っておいてほしいこと
Dr.Sumとは?
Dr.Sumとは、高速集計に特化したデータベースソフトです。
PostgreSQLやMySQL、OracleやSQL Server、SnowflakeやRedShiftなどが同じ土俵のツールになるかなと思います。
Python連携機能とは?
そんなDr.Sumにはpythonと連携できる機能があります。
Dr.Sum内の大量データを高速に処理することができます。
SQLでは難しい加工や、機械学習を使った分析などができるようになりました!嬉しいですね。
さらにさらに、pythonの開発をサポートするpython Developer Toolがあります。
今回はこのツールの使い方を紹介します!
まずは起動しよう
Enterprise Managerの画面の上部にあるアイコンから起動します。
すると、こんな画面が開きます。
できること
Python Developer Toolでは大きく分けてファイル管理とパッケージ管理の2つの機能があります。
それぞれ見ていきましょう!
ファイル管理
ファイル管理では、ローカルとDr.Sumサーバー間のファイルのやり取りや、サイズや更新日時に基づく差分比較ができます。
さながらFTPクライアントのような動きになります。
画面の構成はこのようになっています。
(A)、(B)はそれぞれPY_SCRIPT_ROOTとPY_DATA_ROOTの内のフォルダの中身を表示しています。
具体的なパスはEnterprise Managerの[サーバー]-[設定]の「Python連携ルート」から確認・変更可能です。
上記の画像でいうと、次のようになります。
PY_SCRIPT_ROOT・・・C:/DrSum56/Server/samples/udtf-py/script
PY_DATA_ROOT・・・C:/DrSum56/Server/samples/udtf-py/data
(a)、(b)はそれぞれローカル及びサーバーの内容を示しています。
ドラッグ&ドロップでファイルのコピーが可能です。
ローカルで作成したpythonファイルのデプロイを行うことができます。
画面左上の[フォルダーを比較する]をクリックすると一定のルールに基づいて比較が行われ、色分けでわかりやすく表示してくれます。
色分けのルールは以下のとおりです。
・片方にファイルが存在しない→黄色
・更新日時が新しい→緑
・サイズが異なる→赤
Python Developer ToolからはサーバーのPY_SCRIPT_ROOTまたはPY_DATA_ROOT直下しか参照できません。
特に機械学習を行う際は、外部のベンダーに予測モデルの作成などロジック部分を構築してもらうケースも考えられます。
システム管理者側からすると、意図しないファイルを閲覧されたり削除されたりといった事故を防ぐことができて良いのかなと思っています。
その他、詳しくはマニュアルをご参照ください。
パッケージ管理
プログラムを書く上では欠かせないpythonのライブラリの管理が可能です。
Python Developer Toolの画面にメニューにある[設定]-[パッケージ管理]から開くことができます。
インストール済みパッケージ と pipコマンドの実行 の2つのタブがあります。
インストール済みパッケージでは、Dr.Sumサーバー側のpython環境にインストールされているライブラリの一覧を確認できます。
pipコマンドの実行では、ライブラリのインストールを行うことができます。
requirement.txtなどでライブラリを一括でインストールしたり、アンインストールすることも可能です。
その他、詳しくはマニュアルをご参照ください。
まとめ
本記事では、python連携機能による開発をサポートするPython Developer Toolを紹介しました。
大まかにはファイル管理とパッケージ管理の2つで、デプロイやライブラリのインストールなどを行うことができます。
便利な機能が沢山あるので、ぜひ使ってみてください!