AWS Certified Data Engineer - Associate 認定の勉強で個人的に初めて知った用語や分かりやすかったサイトなどをまとめています
ResShiftがクエリに対してどのようにリソース(メモリ/CPU/IO)を割り当てるかを決定づける仕組みのこと
そもそも…
ロングクエリ(実行に長時間かかるクエリ)があるとクラスター全体に影響が出る
そこで…!
WLMで複数のクエリキューを用意しておき、各キューに対してリソース(メモリの割合や並列度など)を割り当て優先度を定義することで、ロングクエリでクラスタリソースを無駄遣いしないようにすることができる
テーブルを作成する際に指定する分散スタイル。AUTO,EVEN,KEY,ALLの4種類があり、何も指定しないとAUTO(自動で最適な分散スタイルに割り当ててくれるもの)を使用する
クエリ実行環境を分離することによってIAMユーザーやIAMユーザーグループ毎にアクセス制御ができる
RDB、NoSQL、オブジェクトデータ、カスタムデータソースに保存されているデータにまたがってSQLを実行することができる機能
これを見るしかない