Amazon S3 Tables で Iceberg 機能と LakeFormation統合機能を試す
reInvent 2024 で発表された S3 の拡張機能 S3 Tables。 ざっくりいうと、Managed Apache Iceberg on S3。 S3上で、オープンソースのテーブルフ...
78 search resultsShowing 1~20 results
You need to log-in
reInvent 2024 で発表された S3 の拡張機能 S3 Tables。 ざっくりいうと、Managed Apache Iceberg on S3。 S3上で、オープンソースのテーブルフ...
[1] はじめに Zero-ETL統合とは? OLTP系DBとOLAP系DWHはそもそも役割が違うので、従来はOLTP DBに蓄積されてたデータをDWHにデータ連携するETLが必要だった この連...
[1] はじめに AWS GlueでETL処理の開発方法はいろいろある Glue StudioでGUIベース の NoCode/LowCode な方法 Glue Studioノートブックでコーデ...
概要 Kinesis Data Streamのストリームデータを、ニアリアルタイムで直接Redshiftに取り込む機能 Redshift内ではMaterialized Viewとして取り込まれる...
概要 企業データをベースに、自然文でQAしてくれる検索拡張生成(RAG)のソリューション ChatGPTなど一般的な生成AIの場合、それっぽいけど正しいかわからない、または誤った情報が返されるハ...
データインテグレーションサービスAWS Glueのデータカタログ生成のためのクローラー(Crawler)機能がSnowflakeをサポートしたので試してみた 何ができる? Snowflakeに登...
Amazon Redshift は Serverless版もGAされ、さらにATO:Automatic Table Optimization(自動テーブル最適化)など、従来からある Provis...
追記:2023/4/20にGAになりました https://aws.amazon.com/about-aws/whats-new/2023/04/amazon-redshift-availabi...
Amazon Athenaはデータコネクタを利用することでAWS以外の様々なサービスにライブデータアクセス(フェデレーテッドクエリ)できる。 Snowflake コネクタを利用してAthenaか...
AWS Glue DataBrewに続き、AWS Glueでも個人識別情報 (PII) やその他の機密データの自動検出に対応してます。 公式ドキュメントはこちら https://docs.aws...
顧客機微データ(PIIやPCI)をRedshift内で扱う場合の対処法には色々対策が想定される 例) クラスタの暗号化(AWS KMS) 行レベルセキュリティや列レベルセキュリティで対象データへ...
GUIでデータプレパレーションができるサービス AWS Glue DataBrew を使って、個人を特定できる情報 (PII) の検出とデータマスキング変換をできます。 GitHubのaws-s...
例えば、各自が所属する部門に関する行(レコード)だけを表示させたい場合など、ROLEに応じて操作範囲を制限したい場合に使えるRedshiftの機能 (2022年7月GA)。 RLS : Row-...
例えばPIIやPCIなどの機密情報対策として、テーブル、ビュー、マテリアライズドビューで列(カラム)レベルでGRANT/REVOKE形式のアクセス制御ができるRedshiftの機能. SQLだけ...
改めてAmazon EMRを触った際の備忘録 以下のSpark ETLのWorkshop触ってのポイントまとめ https://emr-etl.workshop.aws/spark_etl/st...
よく使うgitコマンドメモ #運用系 1) リモートリポジトリをローカルにクローン git clone [リモートリポジトリURL] [ローカルディレクトリ] 2) 通常ワークフロー: 編集〜コ...
今更ながら、k8sは使ってるがAmazon EKSはちゃんと使ったことないので気になったポイントまとめ ※2021年1月時点 [1] Amazon EKSとは AWSが提供するマネージドKube...
もともとAWSを使っていてGCPを勉強し始めた際、 AWSとの違いで一瞬「んっ?」っとなったポイントの備忘録 注意)あくまで2020年8月時点(+自身の知識範囲) [1] Cloud IAM 系...
AWS Glue python shell で ETLジョブ作成する際のハマりどころメモ 2021/1 時点 Glue Python shellとは? GlueのジョブTypeの1つ Spark...
Treasure Data社製のバルクデータローダーOSS 『embulk』 を試したメモ。 v0.8.13 S3の指定バケットに格納した複数csvファイルを、RDS(Postgresql)にL...
78 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.