はじめに
Alteryxで、色々なデータソースとつないでみています。
今回はRDBサービスである、AWSのRDSと、GCPのCloud SQLとつなぎました。
概要
- 両方ともMySQLで試行
- ODBCを用いての接続なので、その点がちゃんとしていれば問題なく接続
- 出力オプションについては、いろいろあるので注意
- 「気づかない間にフォーカスが当たっていて、マウスホイールを回して変更してしまう」という事故をやらないように…
RDS
環境構築
以下をコンソールから作成します。
- VPC
- パブリックサブネット2つ
- サブネットグループを作る際に2つ以上必要だったため
- セキュリティグループ
- サブネットグループ
- RDS
- MySQL
以下を自PCにインストールしておきます。
- MySQLのODBCドライバ
VPC
現在のコンソールからだと、サブネットも一緒に作ってくれます。
AZ2つで、パブリックサブネットも2つにします。
他の設定はほぼデフォルトで、VPCを作成します。
セキュリティグループ作成
インバウンドに、MySQLの通信を接続元のIPで許可します。
サブネットグループ作成
RDSのコンソールから、先に作成された2つのサブネットを指定して作成します。
RDS作成
MySQLを選択します
試用なので、単一のDBインスタンスです。
インスタンスは最安価ので作成。
ストレージも最小で。
作成したVPCとサブネットグループを指定。
自PCからのアクセスなのでパブリック接続とし、セキュリティグループも作成したものを選択します。
接続はパスワード認証で。
試用なのでいろいろOFFに。
CREATE DATABASEも、この時点で出来てしまうので、一緒に作ってもらいます。
ODBCドライバ
以下のページを参考にインストールしました。
ダウンロードはアカウントを作らなくても、以下の箇所から可能です。
設定は以下のページを参考にしました。
ドライバは二つ入っていたので、Unicode Driverの方を使いました
接続先のサーバはRDSのコンソールで確認できるものをセットし、User/PasswordとDatabaseも作成時のものをセットしました。
CREATE TABLE
以下のSQLでテーブルを作ります。
私はいつも、DBeaverを使っています。
CREATE TABLE alteryx.hoshiiro2_cast
(
話数 varchar(100)
,パート varchar(100)
,ポプ子 varchar(100)
,ピピ美 varchar(100)
)
以下のデータをあらかじめ入れておきます。
話数,パート,ポプ子,ピピ美
第1話,前半,平野綾,茅原実里
第1話,後半,井上和彦,堀川りょう
第2話,前半,朴璐美,釘宮理恵
第2話,後半,檜山修之,森川智之
入力
Alteryxでデータ入力ツールをドロップし、データ接続-データソースに、MySQLを指定します。
先程作ったデータソースを選択し、ユーザ名とパスワードを入れます。
ビジュアルクエリエディタで、クエリを作成します。
閲覧ツールと繋げて実行し、取得できました。
出力
以下のCSVをAlteryxで取り込みます。
話数,パート,ポプ子,ピピ美
第3話,前半,大谷育江,犬山イヌコ
第3話,後半,榎木淳弥,内田雄馬
出力ツールをドロップし、データソースにMySQLを選択します。
入力と同じようにODBCの設定を行います。
テーブル名の指定が求められます。作成したテーブルを指定しました。
出力オプションを指定。「既存のものを付加する」で試してみます。
Alteryxで取り込んだデータが追加されていました。
出力オプションを別のものにして再実行してみます。「データを削除して付加する」で実行しました。
既に入っていたものは無くなって、取り込みデータが入りました。
既にテーブルがある状態で「新しいテーブルを作成する」のオプションで実行するとエラーになりました。
テーブルを上書きしてみると、定義が変わりました。もともとvarchar(100)で作成していましたが、サイズが254になりました。
Cloud SQL
環境構築
こちらはCloud SQLだけの作成で問題ありません。ドライバはRDSの際にインストールしたものを使います。
Cloud SQL
MySQLを選択します。
インスタンスの情報等入力します。
リージョンはシングルとしました。
インスタンスのカスタマイズは試用のため、なるべく安価にしました。
接続 の箇所で、自IPのみ接続可能に設定しました。
試用なので、データの保護などはしません。
作成後ですが、Cloud SQLはCloud Shellから接続できるよう準備されています。これを使って初期状態を作成します。
CloudShellから以下コマンドで、データベース・テーブル・初期データを作ります。
CREATE DATABASE alteryx;
USE alteryx;
CREATE TABLE alteryx.hoshiiro2_cast
(
`話数` varchar(100)
,`パート` varchar(100)
,`ポプ子` varchar(100)
,`ピピ美` varchar(100)
);
INSERT INTO alteryx.hoshiiro2_cast VALUES
('第1話','前半','平野綾','茅原実里'),
('第1話','後半','井上和彦','堀川りょう'),
('第2話','前半','朴璐美','釘宮理恵'),
('第2話','後半','檜山修之','森川智之')
;
SELECT * FROM alteryx.hoshiiro2_cast;
ODBC設定
入力
データ入力ツールから、データ接続-データソースでMySQLを選択。
ユーザ名とパスワードを入れます。
クエリエディタで作成します。
閲覧ツールと繋げて実行します。
出力
RDSと同じデータをAlteryx上に取り込みます。
データ出力ツールと繋げて、入力と同様、データソースにMySQLを選択します。
同じように、ユーザ名とパスワードを入れます。
出力テーブル名を求められますので、作成済みのテーブル名を指定しました。
RDSと同様に出力オプションがありますので、いくつか試してみます。
まずは「既存のものを付加する」から試します。
mysql> SELECT * FROM alteryx.hoshiiro2_cast;
+---------+-----------+--------------+-----------------+
| 話数 | パート | ポプ子 | ピピ美 |
+---------+-----------+--------------+-----------------+
| 第1話 | 前半 | 平野綾 | 茅原実里 |
| 第1話 | 後半 | 井上和彦 | 堀川りょう |
| 第2話 | 前半 | 朴璐美 | 釘宮理恵 |
| 第2話 | 後半 | 檜山修之 | 森川智之 |
| 第3話 | 前半 | 大谷育江 | 犬山イヌコ |
| 第3話 | 後半 | 榎木淳弥 | 内田雄馬 |
+---------+-----------+--------------+-----------------+
追加されていました。
次は「データを削除して付加する」です。
Alteryx上に取り込んだデータだけになりました。
mysql> SELECT * FROM alteryx.hoshiiro2_cast;
+---------+-----------+--------------+-----------------+
| 話数 | パート | ポプ子 | ピピ美 |
+---------+-----------+--------------+-----------------+
| 第3話 | 前半 | 大谷育江 | 犬山イヌコ |
| 第3話 | 後半 | 榎木淳弥 | 内田雄馬 |
+---------+-----------+--------------+-----------------+
次は「テーブルを上書きする(ドロップ)」です。
データは新データのみ、テーブル定義は変わりました。
mysql> SELECT * FROM alteryx.hoshiiro2_cast;
+---------+-----------+--------------+-----------------+
| 話数 | パート | ポプ子 | ピピ美 |
+---------+-----------+--------------+-----------------+
| 第3話 | 前半 | 大谷育江 | 犬山イヌコ |
| 第3話 | 後半 | 榎木淳弥 | 内田雄馬 |
+---------+-----------+--------------+-----------------+
2 rows in set (0.04 sec)
mysql> show create table hoshiiro2_cast;
+----------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+----------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| hoshiiro2_cast | CREATE TABLE `hoshiiro2_cast` (
`話数` varchar(254) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
`パート` varchar(254) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
`ポプ子` varchar(254) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
`ピピ美` varchar(254) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci |
+----------------+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.04 sec)
「新しいテーブルを作成する」も行いました。結果は(既にテーブルが存在するため)RDSと同様にエラーになりました。
おわりに
今回はAlteryxで、RDBのPaaSであるAWSのRDSとCGPのCloud SQLにつないでみました。
ODBCドライバ経由なので特に問題なく接続できました。
使っていて注意した方がよいと思った点は冒頭のほうにも書きましたが、出力オプションがかなり危険なものにもかかわらず、容易に変更できる点です。
DBに対してではないですが、「気づかずマウスホイールで変更」->「元の状態覚えていない」->「End」ということを何度もしてしまった経験があるので、運用する際は細心の注意が必要と感じます。