はじめに
AWS認定 データアナリティクス – 専門知識に出題される各種サービスなどを自分用に少しずつまとめていこうと思います。基本的にAWS公式資料を基に作成しますが、間違いがあるかもしれませんので予めご了承ください。
試験概要
この認定によって下記の能力が検証されると定義されています。
・AWS データ分析サービスを定義し、それらが相互に統合する方法を理解する。
・収集、保管、処理、視覚化のデータライフサイクルに AWS データ分析サービスがどのように適しているかを説明する。
出題範囲と配点比率
試験ガイド(DAS-C01)を基にしています。
分野 | 出題比率 | 主なサービス |
---|---|---|
第1分野: 収集 | 18% | DMS, Kinesis |
第2分野: ストレージとデータ管理 | 22% | S3, Glue |
第3分野: 処理 | 24% | Glue |
第4分野: 分析と可視化 | 18% | Athena, Redshift, EMR, SageMaker, QuickSight |
第5分野: セキュリティ | 18% | Lake Formation |
合計 | 100% |
出題されない範囲
・機械学習アルゴリズムの設計と実装を行う
・コンテナベースのソリューションを実装する
・ハイパフォーマンスコンピューティング (HPC) を活用する
・オンライントランザクション処理 (OLTP) データベースソリューションを設計する
・AWS IoT Core
ベーシックなデータレイクアーキテクチャと対応するAWSサービス
「AWSではじめるデータレイク」出版記念 Glue, Lake Formation, Athena, EMR 最新アップデートより
AWSでのデータ収集、分析、そして機械学習より
出題される各種サービスと機能
データ分析に関連が深いサービスや機能を中心に、重要度を高く設定しています。独断と偏見でつけているので悪しからず。
アナリティクス
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon Athena | サーバーレスにS3に格納されたデータを標準SQLを使用して分析できるサービス | ★★★ | |
Amazon CloudSearch | ウェブサイトまたはアプリケーション向けの検索ソリューションを容易かつコスト効率良く設定、管理、スケールできるマネージド型サービス | ★★ | |
Amazon Elasticsearch Service (Amazon ES) | Elasticsearch を大規模かつ簡単でコスト効率の良い方法を使用してデプロイ、保護、実行する完全マネージド型サービス | ★★★ | |
Amazon EMR | Apatch Spark、Apatch Hiveなどの大規模データ分析のためのオープンソースフレームワークを活用した分析マネージドサービス | ★★★ | |
AWS Glue | 分析、機械学習、アプリケーション開発のためのデータの検出、準備、結合を簡単に行える、サーバーレスデータ統合サービス | ★★★ | |
Amazon Kinesis (Kienesis Video Streams を除く) | ストリーミングデータをリアルタイムで収集、処理、分析するサービス群 | ★★★ | |
AWS Lake Formation | セキュアなデータレイクを数日で簡単にセットアップできるサービス | ★★★ | |
Amazon Managed Streaming for Apache Kafka (Amazon MSK) | Apache Kafka をストリーミングデータの処理に使用するアプリケーションを簡単に構築・実行できようにするフルマネージド型サービス | ★★★ | |
Amazon QuickSight | スケーラブルでサーバーレス、組み込み可能な、機械学習を活用したクラウド向けのビジネスインテリジェンス (BI) サービス | ★★★ | |
Amazon Redshift | AWS自慢のクラウドデータウェアハウス(DWH)で、S3を中心としたデータレイクアーキテクチャにおいて、EMC, Athena, SageMakerといった他のサービスと組み合わせて分析ワークロードを行うことができる。 | ★★★ |
アプリケーション統合
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon MQ | メッセージブローカーの設定や運用を簡単に行えるようにしてくれる、 Apache ActiveMQ および RabbitMQ 向けのマネージド型メッセージブローカーサービス | ★ | |
Amazon Simple Notification Service (Amazon SNS) | アプリケーション対アプリケーション(A2A)間と、アプリケーション対個人(A2P)間の両方の通信に使用できる、フルマネージド型メッセージングサービス | ★ | |
Amazon Simple Queue Service (Amazon SQS) | マイクロサービス、分散システム、およびサーバーレスアプリケーションの切り離しとスケーリングが可能な完全マネージド型のメッセージキューイングサービス | ★ | |
AWS Step Functions | AWS のサービスのオーケストレーション、ビジネスプロセスの自動化、サーバーレスアプリケーションの構築に使用されるローコードの視覚的なワークフローサービス | ★ |
コンピューティング
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon EC2 | 安全でサイズ変更可能なコンピューティング性能をクラウド内で提供するサービス | ★ | |
Elastic Load Balancing | アプリケーションへのトラフィックを複数のターゲット (Amazon EC2 インスタンス、コンテナ、IP アドレス、Lambda 関数、仮想アプライアンスなど) に自動的に分散するロードバランサーサービス | ★ | |
AWS Lambda | サーバーのプロビジョニングや管理、ワークロード対応のクラスタースケーリングロジックの作成、イベント統合の維持、ランタイムの管理を行わずにコードを実行できるサーバーレスコンピューティングサービス | ★★ |
カスタマーエンゲージメント
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon Simple Email Service (Amazon SES) | デベロッパーが任意のアプリケーションでメールを送信できるようにする、費用対効果の高い、柔軟でスケーラブルなメールサービス | ★ |
データベース
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon DocumentDB (MongoDB 互換) | AWSで完全に管理・統合されており、高い耐久性を備えた大規模な JSON データ管理のためのデータベース | ★★ | |
Amazon DynamoDB | 規模に関係なく数ミリ秒台のパフォーマンスを実現する、key-value およびドキュメントデータベース | ★★ | |
Amazon ElastiCache | クラウド内の人気のオープンソース互換で、シームレスにセットアップ、実行、およびスケーリングできるインメモリデータストア | ★★ | |
Amazon RDS | AWSのリレーショナルデータベースサービス | ★★ | |
Amazon Timestream | IoT および運用アプリケーションに適した、高速かつスケーラブルなサーバーレス時系列データベースサービス | ★★ |
マネジメントとガバナンス
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
AWS Auto Scaling | 複数のサービスにまたがる複数のリソースのためのアプリケーションスケーリングを数分で簡単に設定できる機能 | ★★ | |
AWS CloudFormation | AWS やサードパーティーの関連するリソースのコレクションをモデリングし、迅速に一貫してプロビジョニングし、ライフサイクル全体での管理をInfrastructure as Code 化するサービス | ★ | |
AWS CloudTrail | AWS アカウントのガバナンス、コンプライアンス、運用監査、リスク監査を行うためのサービス | ★ | |
Amazon CloudWatch | DevOps エンジニア、デベロッパー、サイト信頼性エンジニア (SRE)、および IT マネージャーのために構築されたモニタリング/オブザーバビリティサービス | ★★ | |
AWS Trusted Advisor | AWS のベストプラクティスをフォローするためのアドバイスを提供するサービス | ★ |
機械学習
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon SageMaker | ラベル付け、データ準備、特徴エンジニアリング、統計的バイアス検出、自動 ML、トレーニング、調整、ホスティング、説明可能性、モニタリング、ワークフローなど、ML 開発のあらゆるステップのための包括的なMLサービス | ★★ |
移行と転送
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
AWS Database Migration Service (AWS DMS) | 最小限のダウンタイムでデータベースを移行できるサービス | ★ | |
AWS DataSync | オンプレミスストレージシステムと AWS ストレージサービス間で、および AWS ストレージサービス間でのデータの移動を簡素化、自動化、および高速化するオンラインデータ転送サービス | ★ | |
AWS Snowball | AWS Snow ファミリーの一部で、エッジコンピューティング、データ移行、エッジストレージデバイス | ★ | |
AWS Transfer for SFTP | Amazon S3 または Amazon EFS との間で直接ファイル転送を実行できるように、フルマネージド型サービス | ★ |
ネットワークとコンテンツ配信
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon API Gateway | 規模にかかわらず簡単に API の作成、公開、保守、モニタリング、保護を行えるフルマネージド型サービス | ★ | |
AWS Direct Connect | オンプレミスから AWS への専用ネットワーク接続の構築をシンプルにする、クラウドサービスソリューション | ★ | |
Amazon VPC (および関連機能) | 定義した論理的に分離された仮想ネットワークで AWS リソースを起動できるようにするサービス | ★ |
セキュリティ、アイデンティティ、コンプライアンス
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
AWS AppSync | GraphQL API の開発を容易にする、完全マネージド型サービス | ★ | |
AWS Artifact | AWS のコンプライアンスレポートにオンデマンドでアクセスできる無料のセルフサービスポータル | ★ | |
AWS Certificate Manager (ACM) | AWS のサービスとお客様の内部接続リソースで使用するパブリックとプライベートの Secure Sockets Layer/Transport Layer Security (SSL/TLS) 証明書のプロビジョニング、管理、デプロイを簡単にするサービス | ★ | |
AWS CloudHSM | クラウドベースのハードウェアセキュリティモジュール (HSM) | ★★ | |
Amazon Cognito | ウェブアプリケーションおよびモバイルアプリに素早く簡単にユーザーのサインアップ/サインインおよびアクセスコントロールする機能 | ★ | |
AWS Identity and Access Management (IAM) | AWS のサービスやリソースへのアクセスを安全委管理するサービス | ★★ | |
AWS Key Management Service (AWS KMS) | 暗号化キーを簡単に作成して管理し、幅広いAWSのサービスやアプリケーションでの使用を制御できる機能 | ★★ | |
Amazon Macie | 機械学習とパターンマッチングを使用して AWS の機密データを検出して保護する、フルマネージドのデータセキュリティとデータプライバシーのサービス | ★★ | |
AWS Secrets Manager | アプリケーション、サービス、IT リソースへのアクセスに必要なシークレットの保護を支援するサービス | ★★ | |
AWS Single Sign-On | AWS 上でワークフォースアイデンティティを作成、または接続し、AWS 組織全体のアクセスを一元的に管理するサービス | ★ |
ストレージ
サービス名 | サービス概要 | アイコン | 重要度 |
---|---|---|---|
Amazon Elastic Block Store (Amazon EBS) | Amazon Elastic Compute Cloud (EC2) と共に使用するために設計された、スループットとトランザクションの両方が集中するどんな規模のワークロードにも対応できる、使いやすい高性能なブロックストレージサービス | ★★ | |
Amazon S3 | スケーラビリティ、データ可用性、セキュリティ、およびパフォーマンスを提供するオブジェクトストレージサービス。データレイクアーキテクチャを構成する最重要サービス。 | ★★★ | |
Amazon S3 Glacier | Amazon S3 Glacier と S3 Glacier Deep Archive は、安全性と耐久性に優れた、きわめて低コストの Amazon S3 クラウドストレージクラスで、データのアーカイブや長期バックアップに使用できる。 | ★★★ |
AWS公式データ分析関連書籍・資料・動画
データ分析やデータレイクに関して全体像を理解したい方にお勧めです。
個別のサービスを触る前に、最初に目を通しておくといいかもしれません。
限定公開の動画が多いので、公式サイトのリンクからでないと通常は視聴できません。
その他学習コンテンツ
・AWSマンガ第 9 話:全てのデータを分析しろ!
・AWS WEB問題集で学習しよう
・AWS Certified Data Analytics Specialty 2021 - Hands On!
・データレイクハンズオン