Glueを操作するチュートリアル集です
今後、随時追加していきます
公式Big Data Blog関連
Glue jobに対するCI/CDの構築。CodeシリーズのCode Commit,Code Build,Code PipelineやCloudFormationを活用。
CodeCommitのプッシュの検出でCodePipleをスタートさせ、CloudFormationやCodeBuildを使いGlueやLambdaなどが含まれたテスト環境を作りテストを実施します、次にCodePipelineのApproval機能で承認フェーズを挟んだ上で手動承認を行うとテスト環境のクリーンアップし、最後に本番デプロイを行う
CloudFormationにLambdaのコードがそのまま書かれていますがそこはチュートリアルということで;
ニューヨークのタクシーデータを使い、csv->parquetに変換するシンプルなGlue job実行。ジョブの実行結果をAthenaでクエリを行い、csvとparquetによる速度の差を確認すする
AWSでデータレイクを構築します。その過程でGlueによるETL処理を試すことができます。
re:Invent関連
TODO
ユーザーさん関連
TODO
その他
Glueの使い方まとめ
https://qiita.com/pioho07/items/32f76a16cbf49f9f712f