🎄2023年に発表された Amazon Redshift のアップデートまとめ🎄
AWS Analytics Advent Calendar 2023 企画
この記事を作成している時点では2023年はまだ少し残されておりますが、今年発表されたRedshiftのアップデートを一覧でまとめたいと思います。
各アップデートにはタイトル、リンク、要約、および公開日が含まれています。
❄️ 1月のアップデート
2022年末ではゼロETLの発表をはじめ、AWS内のデータソースからシームレスにデータを移動、統合できる機能が充実し始めました。re:Inventの怒濤の発表の後か1月は一息。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift 同時実行スケーリングを中国 (北京、Sinnet が運営) と中国 (寧夏、NWCD が運営) のリージョンでリリース 詳細はこちら |
|
01/31 |
💕 2月のアップデート
2022年末にMERGE、ROLLUP、CUBE、GROUPING SETSなどのSQL機能強化に加え多次元分析が便利になりますねー
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift、GROUP BY 句でロールアップ、キューブ、グループ化セットの一般提供を発表 詳細はこちら |
|
02/28 |
🌸 3月のアップデート
インスタンスの管理をしなくて済むサーバーレス版 Redshiftですが、試してみたくても初期サイズが32RPUで大きいなと思っているユーザーも多かったんじゃないかなと思います。初期サイズが8RPUになったのでグッと使いやすくなりました。
ちなみにRPUは、Redshift Processing Unitの略でコンピューティング容量をRPUという単位で指定します。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift クエリエディタ V2 が AWS GovCloud (米国) リージョンで利用可能に 詳細はこちら |
|
03/07 |
Amazon Redshift が 20 万テーブルまでサポートを拡張 詳細はこちら |
|
03/08 |
Amazon Redshift Serverless のデータウェアハウスの基本容量を下げる構成のお知らせ 詳細はこちら |
|
03/09 |
AWS が新しい Amazon Redshift 入門ガイド付きエクスペリエンスを発表 詳細はこちら |
|
03/23 |
🌱 4月のアップデート
4月もなかなか良いアップデートがありました。動的データマスキングはクエリ発行元の要件に応じてデータマスキングが使えるので、事前のETLでデータをマスクしなくて済むので便利ですね。文字列クエリのパフォーマンスが最大63倍も素晴らしいですね。大量データを高速に処理する場合にはデータを圧縮して格納・処理する事がパフォーマンスに有効です。圧縮する事でデータのサイズが小さくなるため、ストレージとメモリ間、ネットワークを介してのデータ転送が効率的になりますし、ストレージからの読み書きの時間が短縮されます。キャッシュにも多くのデータを保持できるので圧縮・解凍処理によるオーバーヘッドを加味しても全体的な処理速度が向上します。こういう地道な改善がチリツモでパフォーマンス向上に繋がりますね。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift で文字列クエリのパフォーマンスを最大 63 倍向上 詳細はこちら |
|
04/13 |
Amazon Redshift が動的データマスキングの一般提供を開始 詳細はこちら |
|
04/20 |
Amazon Redshift が MERGE SQL コマンドの一般提供を開始 詳細はこちら |
|
04/20 |
Amazon Redshift が AWS Lake Formation を使用したデータ共有の一元的なアクセスコントロールに対応 詳細はこちら |
|
04/20 |
🌷 5月のアップデート
ストアドの自動コミットも地味だけど便利なアップデートですね。大規模なデータ変換や複雑なビジネスロジックを扱う場合、エラー処理やトランザクションの管理が容易になり便利になると思います。また、中国リージョンの機能強化も粛々と進めてる感じしますね。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift が新たに中東、欧州、アジアパシフィックリージョンで ra3.xlplus インスタンスをリリース 詳細はこちら |
|
05/01 |
Amazon Redshift データ共有が AWS 中国リージョンで提供開始 詳細はこちら |
|
05/08 |
Amazon Redshift のストアドプロシージャで、ステートメントの自動コミットのサポートを発表 詳細はこちら |
|
05/23 |
🌞 6月のアップデート
Amazon Kinesis FirehoseとはリアルタイムなストリーミングデータをKinesis経由でS3やRedshiftに保存できるサービスですが、これがServerlessにも対応し、ますます便利に。そしてゼロETLのパブリックプレビュー。異種データベース間のリアルタイムレプリケーションの構成は本当に面倒で工数もかかる作業だったりするんですが、本当に簡単なステップで実現出来るのがすごいです。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Kinesis Data Firehose が Amazon Redshift Serverless へのデータストリーム配信のサポートを追加 詳細はこちら |
|
06/19 |
Amazon Redshift でデータウェアハウスを暗号化するエクスペリエンスが向上 詳細はこちら |
|
06/21 |
Amazon Redshift が ThoughtSpot とのネイティブコンソール統合を発表 詳細はこちら |
|
06/26 |
AWS が Amazon Aurora MySQL と Amazon Redshift のゼロ ETL 統合 (パブリックプレビュー) を発表 詳細はこちら |
|
06/28 |
🎆 7月のアップデート
Redshiftを通して機械学習の機能が利用できる事をご存じでしょうか?機械学習を最初から…は敷居が高いかもしれませんが、SQLインターフェースから機械学習が使えると敷居がぐっと下がりますよね。Icebergもおもしろいですね。IcebergテーブルはHadoopやSparkなどのデータ処理フレームワークで広く使用されています。Redshiftでこれらのテーブルを直接クエリできることで、大規模データ分析が便利になりますね。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift で SELECT SQL ステートメントの QUALIFY 句のサポートを開始 詳細はこちら |
|
07/17 |
Amazon Redshift ML が Amazon Forecast との統合を発表 詳細はこちら |
|
07/20 |
Amazon Redshift が AWS Glue データカタログの自動マウントを発表 詳細はこちら |
|
07/25 |
Amazon Redshift で Apache Iceberg テーブルのクエリをサポート開始 詳細はこちら |
|
07/25 |
🏖️ 8月のアップデート
Sparkはインメモリで大量のデータ処理を高速に実行できます。Sparkの開発者がRedshift上でSparkアプリを自由に構築して実行できるようになるとRedshiftの強力なデータウェアハウス機能とSparkのリッチなデータ処理機能を一元的に活用してデータ分析処理の効率が向上しそうです。
タイトル | 要約 | 公開日 |
---|---|---|
AWS が Amazon Redshift の Apache Spark との統合のオープンソース化を発表 詳細はこちら |
|
08/01 |
🍂 9月のアップデート
AWS Lake Formationを使用すると、Redshiftデータシェア内のテーブルやビューに対する権限をLake FormationのAPIやAWSコンソールを使用して表示、変更、監査できるのですが、加えて他のAWSリージョンにあるRedshiftのデータシェアを利用させることができるようになりました。複数リージョンのデータを一元分析できるのは便利。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift が AWS Lake Formation によるクロスリージョンデータ共有に対応 詳細はこちら |
|
09/12 |
Amazon Redshift がワークロード管理 (WLM) におけるロールベースのアクセスコントロールのサポートを発表 詳細はこちら |
|
09/25 |
🎃 10月のアップデート
年末のre:Inventに向けてここ数ヶ月は少なめですね(笑)。しかしVS CodeからRedshiftが利用できるのは便利中の便利。AWS Toolkit をVSCodeにインストールすることで利用可能となりますよー
タイトル | 要約 | 公開日 |
---|---|---|
AWS が Amazon Redshift と Visual Studio Code の統合を発表 詳細はこちら |
|
10/17 |
自動入力の候補が Amazon Redshift クエリエディタ V2 で利用可能に 詳細はこちら |
|
10/17 |
Amazon Redshift と AWS Secrets Manager の統合を発表 詳細はこちら |
|
10/18 |
🍁 11月のアップデート
そしてre:Inventの月!怒濤のアップデート! 全体的にクラウドの分析環境の統一やモダナイズを進めて、データを活用できるようになるまでの時間短縮や分析クオリティの最大化を目指しているように感じました。ゼロETLアプローチもそうですし、
データシェアの拡張、多次元分析の強化、GenSQL機能強化などなどなどRedshiftの進化が止まりません。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon Redshift マルチ AZ が RA3 クラスター向けに一般提供開始 詳細はこちら |
|
11/01 |
AWS が Amazon Aurora MySQL と Amazon Redshift のゼロ ETL 統合の一般提供開始を発表 詳細はこちら |
|
11/07 |
Amazon Redshift が Redshift Serverless の新しいコンピューティングコストの管理設定である MaxRPU をリリース 詳細はこちら |
|
11/09 |
Amazon Redshift で CNAME のサポートを開始 詳細はこちら |
|
11/17 |
Amazon Redshift Serverless、AWS 中国 (北京) リージョンでの一般提供を開始 詳細はこちら |
|
11/20 |
Amazon Redshift が AWS Glue の列レベルの統計との統合を発表 詳細はこちら |
|
11/20 |
Redshift でプロビジョニングされた同時実行スケーリングとサーバーレス自動スケーリングが Create Table As Select (CTAS) を新たにサポート 詳細はこちら |
|
11/26 |
Amazon Redshift、データ共有による複数のデータウェアハウスからの書き込みをサポート (プレビュー) 詳細はこちら |
|
11/26 |
AWS Analytics は IAM アイデンティティセンターによりサービスをまたぐユーザーのデータアクセスを簡素化 詳細はこちら |
|
11/26 |
Amazon Redshift がネストされたオブジェクトへの新しいきめ細かなアクセスコントロール機能を発表 (プレビュー) 詳細はこちら |
|
11/27 |
Amazon Redshift、データレイクのテーブルに対するマテリアライズドビューの増分更新をサポート (プレビュー) 詳細はこちら |
|
11/27 |
Amazon Redshift、クエリのパフォーマンスを最適化する多次元データレイアウトを発表 (プレビュー) 詳細はこちら |
|
11/27 |
Amazon Redshift Serverless、AI 主導のスケーリングと最適化を発表 (プレビュー) 詳細はこちら |
|
11/27 |
AWS が Amazon RDS for MySQL と Amazon Redshift のゼロ ETL 統合を発表 (パブリックプレビュー) 詳細はこちら |
|
11/28 |
AWS が Amazon Aurora PostgreSQL と Amazon Redshift のゼロ ETL 統合 (パブリックプレビュー) を発表 詳細はこちら |
|
11/28 |
Amazon Redshift での Apache Iceberg のサポートの一般提供開始を発表 詳細はこちら |
|
11/29 |
Amazon Redshift Serverless の管理性とユーザビリティの機能強化を発表 詳細はこちら |
|
11/29 |
Amazon Redshift が行レベルセキュリティ強化の一般提供を発表 詳細はこちら |
|
11/29 |
Amazon Q の生成系 SQL が Amazon Redshift クエリエディタで利用可能に (プレビュー版) 詳細はこちら |
|
11/29 |
Amazon Redshift がメタデータセキュリティのサポートを開始してマルチテナントアプリケーションを簡素化 詳細はこちら |
|
11/29 |
🎄 12月のアップデート
ということで12月は一息落ち着きました(笑)しかしSUPERデータタイプの列サイズの拡大も便利ですね。より大きなデータオブジェクトの取り込みができるので保管するための前処理も必要なくなるケースもあるのではないでしょうか。
タイトル | 要約 | 公開日 |
---|---|---|
Amazon RedshiftはSUPERデータ型の列サイズのサポートを16MBに拡張しました 詳細はこちら |
|
12/04 |
ということで毎年恒例?のRedshiftの年間アップデートまとめでした。
さて、この情報まとめですが、Amazon Bedrock を利用し、Bedrock上で利用可能なAnthropicのClaude 2などの複数のモデルを選択、各アップデートの内容を数行の箇条書きでサマリし、その結果を表に変換、最後にマークダウンを出力させ、それをベースにコメント等を記載して作成作業を効率化しました。(実際はインプットするプロンプトに試行錯誤して苦労し、まぁまぁ時間かかりましたが(笑))