AWS re:Invent 2019で新たなサービスがドドン!と発表されました!
特に機械学習のサービスは豊富なリリースが発表され、大注目されています。
今回は初心者の方向けに分かりやすく「Amazon SageMaker Studio」というAWSの機械学習における幅広いサービスを一つの画面で実行できる環境について、ご紹介させて頂きたいと思います。
##AWS re:Inventって?
AWSイベント 公式ページより
AWS re:Invent は、AWSやパートナーによって多くの新サービスや新機能が発表と、 1,800 を超えるセッションや最新のテクノロジーの展示やデモンストレーションが行われます。
またテクノロジーを満喫できるパーティ re:Playなどの様々なプログラムがラスベガスのエリアで開催される、AWS最大にして世界規模のカンファレンスです。
#Amazon SageMaker Studio
画像は公式サイトより。
Machine learning開発に必要なすべてのツールを統合したWebベースの統合開発環境(IDE)。
AWSが機械学習に特化した統合開発環境としては初のサービス。
ぜーんぶまるっと統合した状態で視覚的にわかりやすく、機械学習に必要になるすべての環境が自動的に用意されています。
これにより迅速に変更を加え、結果を観察し、より速く反復することができるので反映する時間を短縮できます。開発の生産性を大幅に向上できそうです!
Webベースで動作するので、Webブラウザから利用することができ、プロジェクトを作成する段階で自動的にインスタンスの作成やサーバのセットアップも完了しインフラの管理も必要がない仕様になっています。
###統合されているツール
- Notebooks
- notebookをささっと使い始められる
- Experiments
- 機械学習の実験を構成・記録・比較できる
- Debugger
- リアルタイムに自動アラートでモデルのバグを排除する
- Model Monitor
- 稼働中のモデルの監視、検出ができる
- Autopilot
- どのような判断によってモデルを構築したかを、詳細に視覚化する。ユーザーのデータから最適なモデルを自動的に作成できます。
###なぜ統合開発環境が必要か
自前で機械学習を行うすべての実行環境を行おうとすると、本来は複雑な作業をする上、ツールの行き来を手動で行うのでいちいち時間がかかるといった面倒があります。
機械学習を行う手順とそれらを実行するツール間が全て別々になっているからです。
- データの収集と前処理
- モデリング
- 学習
- 評価と最適化
- アプリケーションへの組み込み
たとえば、新しいアルゴリズム(問題を解くための計算方法や手順)を試したりハイパーパラメーター(推論や予測の枠組みの中で決定されないパラメータのこと)を設定する際、数百や数千の実験を行いますが、この実験結果をすべて手動で管理することになります。
これに時間がかかりすぎると、最善のモデルを見つけ出すことや実験の中で得た知見を活用することが非常に難しくなります。
その課題を解決するためにAmazon SageMaker Studioを使用するべきということです。
#活用法
- 作業工程、学習、訓練、データの展開や実行するプログラムを作るコードの記述。
- 実験を追跡、データの視覚化、バグを修正する作業と監視
- ノートブック、データセット、コード設定、 トレーニングの分析、アラートを管理
- モデルのチューニング、モニタリング
- データセットの前処理やパラメータを調節したり、 複製、再生したりできる
- 手順のすべては環境内で追跡
- 同じプロジェクトに対して作業している他のユーザーと、プロジェクトやフォルダを共有する機能もありそこでノートブックや成果について議論することができます。
12月12日(木)現時点ではオハイオUS Eastリージョンで使用可能です。
早く活用できるようになりたーい!
#公式サイトリンク
- [AWS re:Invent]
(https://reinvent.awsevents.com/?trk=aws.amazon.com,aws.amazon.com) - [Amazon SageMaker]
(https://aws.amazon.com/jp/sagemaker/) - [SageMakerの料金]
(https://aws.amazon.com/jp/sagemaker/pricing/)