概要
弥生R&D室のsiidaです。R&D室ではSageMakerを使用して機械学習 (ML) のプロジェクトを進めています。SageMakerはMLのための様々な機能が搭載されたサービスであり、データ分析からモデル訓練、ひいてはワークフローの構築まで、SageMakerの中で完結させることができます。
今回はこれまでに投稿してきたSageMakerの使い方記事をまとめました。いわゆるAI/MLを活用したPoCの範囲で扱うSageMakerの基本的な機能を一通り網羅しています。
記事一覧
- SageMakerのはじめかた
- SageMaker Code Editorの紹介
- SageMakerでProcessingJobを使用するPythonラッパーの紹介
- SageMaker Studioの仮想マシンの容量を変更する方法
- SageMaker ProcessingJobのCLIからのジョブ管理方法
- ProcessingJobで使用可能なジョブ数を上げる方法
ユースケース毎のガイド
はじめてSageMakerを立ち上げる場合
SageMakerのはじめかた を参照します。
もし、VSCode上のUIを使用したい場合は SageMaker Code Editorの紹介 もオプションで参照してください。
クイックにデータ分析を実施する場合
SageMakerのはじめかた で作成した仮想マシンを使用すればNotebookから分析可能です。
データが大規模で仮想マシン上に配置できない場合には SageMaker Studioの仮想マシンの容量を変更する方法 を参照します。
より大規模なデータや前処理を実施する場合や、再現性のある分析プロセスを構築する必要がある場合は、後述のProcessingJobを使う記事をご覧ください。
モデル作成・パイプライン構築など大規模な処理を実施する場合
SageMakerでProcessingJobを使用するPythonラッパーの紹介 を参照してProcessingJobから処理を実行します。
またその際に SageMaker ProcessingJobのCLIからのジョブ管理方法 や ProcessingJobで使用可能なジョブ数を上げる方法 を参照することでジョブの管理に役立てることができます。
まとめ
- SageMakerの基本的な機能について、ユースケース毎にまとめてみました
- AI/MLを使うPoCで必要となる、データ分析からモデル開発までのプロセスに対応しています
- より特定のケースに向けた機能については今後紹介する予定です
本記事は下記の記事と同じ内容です。 アクセス解析を目的としてマルチポストしています。
弥生では一緒に働く仲間を募集しています。 ぜひエントリーお待ちしております。