0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

アナリティクス強化月間 Glue DataBrew

0
Posted at

AWS エバンジェリストシリーズ AWSの基礎を学ぼう

https://awsbasics.connpass.com/event/240346/

AWS Glue

  • Serverless ETL
    • データの取り出し、変換、取り込み
  • Catalog
    • いろいろなサービスから参照するインベントリ(整理された台帳)

AWS Glue Studio

https://docs.aws.amazon.com/ja_jp/glue/latest/ug/what-is-glue-studio.html

  • ローコードで触れる

AWS Glue Databrew

https://aws.amazon.com/jp/blogs/news/announcing-aws-glue-databrew-a-visual-data-preparation-tool-that-helps-you-clean-and-normalize-data-faster/

  • ノーコードで触れる

Handson Part

教材

  • https://github.com/harunobukameda/AWS-Glue-DataBrew
    (もしこのブログを見て実施される方で、GitHubアカウントをお持ちの方は上記のリポジトリからForkしてください)
    • 実施環境(Region)はN.Virginiaのみで挙動確認
      • CloudFormation Templateがすごいよくできあがっている

実際に行った結果

  • Cloud Formation実行後に生成されるS3

image

  • レシピ でrawデータに対する変換処理ステップを定義

image

  • 順次変換したCSVの結果(S3)

image

  • オブジェクトに含まれているデータの分布状況の表示

image

  • エディタ画面を表示しようと読み込んでいる様子

image

  • エディタ画面が表示された様子

image

  • 読み込んだデータから予めどういったデータ整理をするとよいかを提示してくれる(レコメンデーション)

image

  • データ品質ルールセットですでにあるオブジェクトに対する条件付き抽出

image

  • 異なるオブジェクト同士の結合(今回はCSV同士)

image

  • S3に保存済みのデータに対して変換処理を行い、S3の別ファイルとしてエクスポート

image

参考

まとめ

AWS Glueを取り扱うのに、ほとんどGUIで簡潔することに驚きました。

また操作感としては普段AWSの画面に慣れている人は少し違和感があるように感じますが、
BIツール、マイクロソフトのPowerBIとPower Queryで操作した経験のある人は違和感なく入れると思います。

AWS Glueとその周りがすごい進化をしているので、今後もアップデートは見逃せないなぁと思いつつ、
操作のハードルが下がってきているので、もっと学んでいかなければなぁと思いました。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?