More than 1 year has passed since last update.

AWS DBS-C01 Database Specialty 合格奮闘記

Last updated at 2023-12-03Posted at 2023-11-22

調子に乗ってもう一個認定試験受ける

無事にSolution Architect取れたのでこれで仕事探してもいいかなと思ったのですが、せっかく長年SQLで頑張ってるので、Database周りの資格も欲しくなっちゃいました。
なのでこちら受けます

DBS-C01 Database Specialty

Analyticsと迷ったのですが、どうやら廃止されて新しい資格できるみたいですね

こういう場合って、現在Analyticsの資格を持っている人は再認定など、資格を延長することはできないのでしょうか？
あとで調べてみたいと思います。

勉強方法

前回と同じでUdemyの講座にお世話になろうと思います。

追記
足りなかったのでこちらも購入しました。

あとKindleでこちらも購入しました。

個人的に

オンプレからクラウドへのマイグレーションにすごい興味があります。顧客によって状況が異なる中でどのような選択肢があるのか考えていく瞬間がとても楽しいと思っています。

以下勉強ログ

サービス別のログより、バックアップなどの機能別に見ていく方が今はいいのかもしれません

バックアップ

RDS

自動バックアップの日数に0が設定できる。最大値は35日。デフォルトは7日
0の場合はリードレプリカの設定不可(ソースにスナップショットを用いるため)。
バックアップは自動でスナップショットの作成として同じリージョン内で行われる。DRのために別リージョンに設定したい場合は、AWS BackUpを用いる。
それ以上の保持期間が必要な場合は、Lambda等を利用する必要があります。
スナップショットはS3に保管される

スナップショットの共有、復元

自動バックアップの物は共有不可。KMSキーへのアクセス許可が必要。
復元は新規のインスタンスを使用するため、エンドポイントが変更になる

ポイントインタイムリカバリ(PITR)

最短5分ごとにS3にトランザクションログを格納。復元の際はやはり新規インスタンス

DynamoDB

DynamoDBにスナップショットや自動バックアップ機能はないので、手動バックアップかポイントインタイムリカバリを設定するしかない
ポイントインタイムリカバリも最大35日までしか設定できない
ストリームの機能を使うことで過去24時間に削除されたItemを知ることができる。TTLで削除されたItemをバックアップする、などができる

Aurora

自動バックアップの日数に0が設定できない。最大値は35日。デフォルトは7日

バックトラック(MySQLのみ)

現在のインスタンスで、最大72時間変更トランザクションを遡ってDBクラスタをその時点に戻す。
テーブル単位で指定はできない。

クローニング

既存のAuroraクラスタを素早くコスト効率よく複製する機能です。スナップショットより速く作成できる。データベースのクローンではCopy-on-Writeプロトコルを使用しており、ソースデータベースかクローンデータベースで書き換えが発生した時にデータがコピーされます。
データのフルコピーは発生しないため、アドホックな分析用途などで使われる。そのためバックアップ用途ではなく、一時的なものとして考えた方が良い。

復元の速さ

速い順に
バックトラック(Aurora MySQLのみ)　＞　ポイントインタイムリカバリ　＞　スナップショットの復元

負荷分散

ElasticacheをRDSの前面に配置する方がリードレプリカやインスタンスサイズのスケールアップよりもコスト面では安い
Auroraは読み取りトラフィックの自動ロードバランシングを備えたエンドポイントをサポートしています
RDSのリードレプリカはAmazon Route 53 加重レコードセットを使用して、リクエストを複数のリードレプリカに分散させることができます。

削除保護機能

DynamoDBだけない

データローテーション

DynamoDBはTTL（TimeToLive）で有効期限を設定でき、不要なデータを自動で削除することができる。

監査

Aurora

高度な監査を有効化すると以下を記録できるようになり、CloudTrailにログをエクスポートできる

トラブルシュート

互換性のないパラメータのためMySQLを開始できませんでした

これはパラメータがRDSのエンジンまたはインスタンスクラスと互換性のない規定値以外の値に設定されているためです。この問題を解決するためにはカスタムパラメータをデフォルト値にリセットする必要があります(デフォルトパラメータは変更不可能)。

ItemCollectionSizeLimitExceededException

DynamoDBで起こるエラー。LSIを含んだテーブルは合計10GBまでなので、それを超えた際にこのエラーが出る

インデックス

DynamoDB

LSI(ローカルセカンダリインデックス)

ソートキー以外にパーティション内で絞り込みを使いたい場合に設定する。なのでパーティションキーのみでプライマリキーとしている場合は設定できない
また、このインデックスはテーブル作成時のみ設定可。後から設定や削除は不可
既存のLSIを変更したい場合はバックアップを取得し、復元の際に設定する。

GSI(グローバルセカンダリインデックス)

テーブル全体で絞り込みを使いたい場合に設定する。テーブルに対してスキャンではなくクエリになるので、消費読み込みユニットを抑える＝コストを抑えることもできる
このインデックスはテーブル作成時以外にも後から設定や削除が可能

カーディナリティ

パラメータ

デフォルトのDBパラメータは変更できないので新しくカスタムパラメータグループを作成して適用する。
動的パラメータの変更は、再起動せずに直ちに DB インスタンスに適用されます。静的パラメータの変更は、DB インスタンスの再起動後にのみ適用されます。
エンドユーザーはセッションを再接続しないと新しいパラメータが反映されない。

ストレージエンジン

RDS

MySQL

デフォルトのストレージエンジンはInnoDBとなっており、そしてMyISAMの利用は非推奨

MariaDB

MariaDB 10.2からデフォルトストレージエンジンはInnoDB、それ以前はXtraDB

Aurora

MySQL

MyISAMは使用できない
良記事

データ整合性

DynamoDB

書き込み

結果整合性のみ

読み込み

結果整合性(デフォルト)、強力な整合性の両方をサポート
ただし、強力な整合性を選択した場合はレイテンシーが高くなったりGSIがサポートされない、スループット容量の消費が多くなる＝コスト増などに注意する。

トランザクション

RDBのようなトランザクションまでは期待できないが、複数テーブルに対する操作をグループ化できます。これでDBにロールバック要件があってもDynamoDBを選択肢から除外する必要がない。
以下のような制限がある
トランザクションには、100件を超えるアクションを含めることはできない
トランザクションに 4MB を超えるデータを含めることはできない
同一テーブルに2つのアクションを実行できない
また、消費するユニットが通常の倍＝コスト2倍になる。

DynamoDBのユニット計算

読み込みが4KB以下の結果整合性で0.5,強い整合性で1,トランザクション読み込みで2ユニット
書き込みが1KB以下の結果整合性で1,トランザクション書き込みで2ユニット

Elastic Beanstalk

RDS DB インスタンスを Elastic Beanstalk 環境にアタッチすると、環境を終了した際にRDS DBインスタンスが環境によって削除されるため、データが失われます。

IAMデータベース認証

PostgreSQL、MySQL、MariaDBで利用可能

AWS Database Migration Service

RDBMS以外にも、S3やRedshift、Kinesis Data Streamsをターゲットとして使用することもできる。

障害テスト

DBインスタンスの再起動を使う。終了（Terminate）させるとDBはフェイルオーバーではなく削除されます。

ダウンタイム

OS/ハードウェアメンテナンスのダウンタイムはシングル AZ 配置は数分間、マルチAZはフェイルオーバーの数十秒程度。セカンダリからメンテナンスが始まり、メンテナンス後、フェイルオーバー(ダウンタイム)、元プライマリ(FOでセカンダリ)のメンテナンス
データベースエンジンレベルのアップグレードはプライマリとスタンバイ DB インスタンスの両方が同時にアップグレードされるので長時間のダウンタイムが必要。

セキュリティ

アクセス制御

VPC、ネットワークACL、セキュリティグループでアクセスを制御

暗号化

格納時の暗号化

AWS KMSを利用して暗号化
DBインスタンス作成時のみ設定可能。既存のものを暗号化したい場合はスナップショットを作成し、その際に設定、リストアすることで可能。
プライマリ/リード双方に同じ設定をしないといけない
Oracle、SQL Serverの場合はDB独自の暗号化(TDE)があるが、両方使用するとパフォーマンス低下する可能性があるので、どちらかのみにする。

通信時の暗号化

SSL/TLSを用いて暗号化を行う

IAMを利用したDB認証

MySQL、PostgreSQL、Aurora MySQL/Postgre SQLのみで利用可能

フェイルオーバー優先順位

Amazon Auroraでは、フェイルオーバーが発生した場合、最も高い優先度（最も低い番号）を持つRead Replicaを昇格させます。同じ優先度の場合、サイズが最も大きいレプリカを昇格させます。

レプリケーション

Amazon RDSは自動的に別のAZスタンバイインスタンスに同期的にレプリケートします。
リードレプリカは非同期的にレプリケートします。

DynamoDBテーブルの必要なパーティション数

例として、500のWCUと5000のRCU、50GBの容量を割り当てることを計画しています。
最大3,000RCUまたは1,000WCUを1パーティションとして割り当てます。
つまり、スループットをサポートするために必要なパーティション = (500WCU/1000WCU) + (5000RCU/3000RCU) = 2.3→3パーティション
一方で、1パーティションの最大サポートサイズは10GBなので、50GB/10GB = 5パーティション
3と5で大きい方は5なので、この例の計画の場合は5パーティションが必要。

Auroraカスタムエンドポイント

リードレプリカを専用にアサインできる。
分析用の重いクエリにサービス用の読み取りクエリが邪魔されない構成が実現できる

モニタリング

Aurora

データベースアクティビティストリーミング

アクティビティをCloudWatch Logsよりもリアルタイムで Amazon Kinesis データストリームにプッシュします。
これによりサードパーティの監視サービスにデータを連携する。

ElastiCache Redis/Memcachedの比較

Aurora DB クラスターの停止

まずレプリカインスタンスを停止し、次にプライマリインスタンスを停止して、フェイルオーバーメカニズムのアクティブ化を回避します

停止できないもの

Aurora グローバルデータベースの一部であるクラスター
クロスリージョンリードレプリカを持つクラスター
Aurora 並列クエリ機能を使用するクラスター
Aurora Serverless v1 クラスター(Serverless v2は可能)

スナップショットからの復元

新しいクラスターはデフォルトのパラメータグループを使用している可能性があります。元のクラスターにカスタム設定があった場合は、それらを新しいクラスターに適用する必要があります。

RDSのオプショングループとパラメータグループの違い

パラメータグループはデータベースに割り当てるメモリなどのリソースの量を指定できます。
オプショングループはバックアップや監査ログ、暗号化などのオプションを提供する。DBエンジンによってオプションはだいぶ異なる。

拡張モニタリングとPerformance Insightsの違い

拡張モニタリングは各種パフォーマンスメトリクス（CPU使用率、ディスクI/O、メモリ使用量など）を、細かいレベルで収集し、CloudWatchのメトリクスとして表示する
Performance InsightsはSQLクエリのパフォーマンスを分析するためのツールです。どのクエリがCPUを多く消費しているか、どのクエリが最も遅いか、どのクエリが最も多くのI/Oを発生させているかなどを確認

RDSインスタンスを停止する場合

リードレプリカをまずは削除しないといけない

Auroraの２種類のストレージ

永続データ用のストレージ (クラスターボリュームと呼ばれます)。このストレージタイプは、より多くのスペースが必要になると自動的に増加します。
ローカルストレージ。DBインスタンスの変更によってのみ変更できます。ログおよびInnoDB 以外の一時テーブルの保存にローカルストレージを使用します。

DynamoDBのCreateTable操作

CreateTable操作は非同期であり、テーブルのステータスがACTIVEになるまでDescribeTableを用いてステータスを定期的にチェックすることで、テーブルが使用可能になっていることを確認する必要があります。その後PutItem操作などが行えます

移行でLOBサイズが大きい場合

数メガバイトを超える LOB がある場合は、完全 LOB モードで別の AWS DMS タスクを作成します。

RDS for SQL Server DBのWindows認証

AWS Managed Microsoft AD を使用する。AD Connector の使用をサポートしていません。

RDS イベントサブスクリプション

RDSで発生する再起動、フェイルオーバー、メンテナンスの開始などの重要イベントをSNSに紐づけて通知機能を作成できる。

ElasticacheとDynamoDB DAXの選定

高速な通信がしたい、保存するデータは書き込みと読み込みが頻繁に発生するためコストが心配
->ElastiCache
データの永続化がしたい
->DynamoDB

RDSからAuroraへの移行

Aurora レプリカにデータ移行し、切り替え（カットオーバー）時にレプリカをプライマリに昇格させる

AWS DMSレプリケーションインスタンスの配置

ターゲットデータベースに非常に近いことで、最も速い書き込みパフォーマンスを実現でき、ネットワーク遅延が最小限に抑えられます。なので同じVPCやAZにあるとより高速。

RDS Proxyの役割

多数のアプリケーションの接続管理
後方のDBインスタンスのフェイルオーバー時の接続の維持(RTO（Recovery Time Objective）目標の達成に重要

Neptuneの用途

グラフDBなので、以下のような方向性を確かめる要件に向いている。
・特定のコンポーネントに障害が発生した場合、影響を受けるネットワークとルート
・ネットワーク間に冗長なルートがあるネットワーク
・ネットワーク間に冗長なルートがないネットワーク
・2つのネットワーク間の最速パス

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up