はじめに
株式会社ジールの @oreo_tです。
2024/9/17のアップデートで、RedshiftでAmazon Qを利用したクエリ生成ができるようになりましたので紹介しようと思います。
「こういうデータが見たい」というのを言葉で書くことによって、その内容に合わせてAmazon QがRedshiftで実行できるクエリを生成してくれるというものです。
以下、公式情報のリンクです。
https://aws.amazon.com/about-aws/whats-new/2024/09/amazon-q-generative-sql-amazon-redshift/
設定方法
まずAWSのコンソールからRedshiftの画面を開き、「クエリエディタv2」を選択します。
クエリエディタの画面が開けたら、左のメニューから歯車のアイコンを選択します。
「Q generative SQL settings」を選択します。
他の設定は特に必要なく、月に1000プロンプト(1000応答)までは無料枠を利用できるようです。
利用状況はこの画面でいつでも確認できます。
最後に設定画面の一番下まで行き、「Save」をクリックします。これでAmazon Qを利用できるようになります。
利用方法
エディタからノートブックを開き、右上の六角形のアイコンをクリックします。
画面の右に対話画面が出てきました。Amazon Qを利用した対話はこの画面を使って行います。
ちなみに、公式発表では英語にしか対応していないと書いてあったのですが、今回日本語で質問をしてもきちんと回答が返ってきました。
https://www.nstac.go.jp/use/literacy/ssdse/
こちらのサイトからお借りした統計データを使ったテーブルでクエリ生成を試します。
全国1741市区町村ごとの人口や各種事業所数などが128項目に渡ってまとめられています。
統計データを「Load Data」でアップロードし、その際にRedshiftの機能でテーブルを新規作成してそこにデータを入れます。
検証①
まずはこのテーブルで市区町村を人口順に並べるようなクエリを書いてもらおうと思います。
結果が返ってきました。狭いのでクエリエディタにコピー&ペーストで持ってきます。
この通り、指定した内容のクエリを生成してくれています。
そして実行するときちんと動きましたね。
検証②
次にもう少し複雑なクエリを作ってみたいと思います。
市区町村を都道府県ごとに集約し、人口に対する医師の数が少ない都道府県を5つ並べてもらいます。
こちらが生成結果です。GROUP BYを使った集約やSUMを使った計算、新しくできる列の名前付けなども問題なくできています。
検証③
次に、テーブルの結合を含むクエリの生成を試してみます。
先ほどのstatisticsテーブルは2024年のデータを使っていましたが、2019年のデータを使った別テーブルを作成して結合してみます。
この通り、テーブルを結合した上で両テーブルを利用した計算もやってくれました。
都道府県や市区町村のカラムは2024年のテーブルだけ、外国人人口のカラムは両テーブルのものを並べてくれているのがクエリの書き方としてきれいだと感じます。
検証④
最後に、エンジニアでない方が使用することを想定して検証③の内容を結合条件などを書かない質問でやってみます。
このように、想定していたキーとは違いましたが同じような結果が出ました。
まとめ
Amazon Qを利用すれば実用的なクエリを書けることが分かりました。
今回紹介した範囲はまだ簡単な方でしたが、開発者の方が複雑なクエリを生成するための助けになったり、あるいはSQLなどの知識があまりない方でもRedshiftを活用できるようになるかもしれません。
皆様もぜひご活用ください。
株式会社ジールでは、「ITリテラシーがない」「初期費用がかけられない」「親切・丁寧な支援がほしい」「ノーコード・ローコードがよい」「運用・保守の手間をかけられない」などのお客様の声を受けて、オールインワン型データ活用プラットフォーム「ZEUSCloud」を月額利用料にてご提供しております。
ご興味がある方は是非下記のリンクをご覧ください: