【ハンズオン】AWS DataSyncでオンプレ→S3にデータ転送するタスクを作成してみる
前回の記事で紹介した AWS DataSync を使って、実際にオンプレミス(NFSサーバ)からS3へデータを転送するタスクを作成する手順を解説します。
GUIベースで簡単に設定できますので、AWS初心者の方でも試しやすいです!
🔧 前提条件
- AWSアカウントを保有している
- S3バケットが作成済み(転送先)
- オンプレまたはEC2上に NFS共有 または SMB共有 がある
- DataSyncエージェント(仮想マシン or EC2)がデプロイ済み
✅ 手順概要
- DataSyncエージェントの登録
- ソースロケーション(NFSなど)の設定
- 宛先ロケーション(S3など)の設定
- タスクの作成とオプション設定
- タスクの実行・確認
① エージェントの登録
- AWSコンソールから「AWS DataSync」サービスを開く
- 左メニュー「エージェント」→「エージェントの作成」
- エージェントのIPアドレスを入力(HTTPS:ポート443で通信)
- VPCやセキュリティグループが適切に設定されていれば、自動で検出されます
② ソースロケーションの作成(例:NFS)
- 「ロケーション」→「ロケーションを作成」
- ロケーションタイプで「NFS」を選択
- NFSサーバーのホスト名/IP、エクスポートパスを指定
- 接続に使用するエージェントを選択し、保存
③ 宛先ロケーションの作成(例:S3)
- 同じく「ロケーションを作成」→「Amazon S3」を選択
- 対象のS3バケットとプレフィックス(オプション)を指定
- 使用するIAMロールを選択(S3書き込み権限が必要)
- または自動生成するオプションも選べます
④ タスクの作成
- 「タスク」→「タスクを作成」
- ソースロケーションと宛先ロケーションを指定
- 転送設定を構成(例:同一ファイルを上書きするか?削除するか?など)
- タグやCloudWatchログの設定も任意で可能
- 「タスクを作成」をクリック
⑤ タスクを実行・監視する
- 作成済みタスクを選択して「実行」
- 初回転送の進行状況が表示される(数分〜数時間)
- 転送結果・ログはCloudWatchやタスクの詳細から確認可能
📌 よくあるオプション設定
| 設定項目 | 説明 |
|---|---|
| ファイル更新ルール | 上書きのみ/新規のみ/すべて転送などが選べる |
| メタデータの保持 | 所有者・パーミッション情報を保持するかどうか |
| 転送除外パターン | 一部の拡張子やフォルダを除外する設定が可能(例:*.tmp) |
| スケジュール実行 | 定期実行(cron形式)も設定可能で、夜間バックアップなどに便利 |
🔗 公式ドキュメントリンク
📝 まとめ
AWS DataSyncは、GUIベースで直感的に使えるため、オンプレからの移行やバックアップ自動化に非常に便利です。
大容量データを扱うプロジェクトでの第一歩のクラウド連携にも最適です。
今後の記事では、S3転送コストの最適化Tipsや転送失敗時のトラブルシュートも取り上げていく予定です。興味のある方はぜひフォロー&いいねお願いします!