概要
日時
2021年05月11日, 12日
場所
online
主催者
Amazon Web Services, Inc
参加方法
こちらに登録してオンデマンド配信できる
メディアコンテンツの収益化と分析を⾃動化・改善するために AIを活⽤する
メディアにおけるAI推進要因
コスト
CS改善
強化するAIサービス
Amazon Rekognition
イメージとビデオ
人検知、テキストの検出、顔検出と分析、動線検出
Transcribe
speech2text
ライブストリーミングに低遅延、フルマネージド、スケーラブル
Translate
機器翻訳
Comprehend
自然言語処理
Personalize
個人に最適化されたメディアコンテンツのレコメンド
NASCARにおける課題と解決方法
課題
毎月数百本の短編動画コンテンツをパブリッシュ
全てのコンテンツに字幕が必要で、容易に早く字幕を入れる方法が必要
マルチサイト多言語字幕に対応できる仕組みが必要
解決方法
Amazon Transcribeを利用したコンテンツマネジメントシステムを開発
ワークフロー
ビデオをS3にアップロード
Lambdaイベントトリガー
音声ファイル抽出とTranscribeジョブを起動
TranscribeジョブがJSONファイルをS3に出力
Lambdaイベントトリガー
JSONをVTT形式に変換しS3にアップロード
VTTファイルを含んだビデオのURLに更新
音声ファイルとJSONファイルをS3から削除
アーキテクチャ
ビデオ、音声 -> S3 -> AWS Lambda -> AWS step Functions -> (Amazon Rekognition, Amazon Transcribe, Amazon Translate, Amazon Comprehend) - Amazon Elasticsearch Service
機械学習モデルの開発、学習、デプロイ
ワークフロー
開発
データ収集、統合、アノテーション、分析、可視化、特徴量エンジニアリング、アルゴリズムの選定
学習
モデルの学習、評価
デプロイ管理
デプロイ、スケーリング、再学習、モデルの監視、テスト
課題
開発
時間とリソースがかかる
ツールが一般的にDevOpsフレンドリーではない
学習
大量の試行錯誤を効率化する必要
デプロイ
複数チームメンバーと連携
ワークフロー自動化
継続的にモデルを監視する必要
SageMaker studio
機械学習のための統合開発環境、SageMakerの各機能をひとつ所から呼び出して利用できるウェブベースの統合開発環境
https://aws.amazon.com/jp/sagemaker/studio
SageMaker Notebooks
Notebook instantceが利用できて、これとの大きな違いは以下のように
AWS SSOによる認証
早い起動とインスタンスタイプ変更
1クリックでノートブックを共有
SageMaker Ground Truth
機械学習用の大規模な学習データに簡単にラベル付ける
メリット
画像、動画、テキスト、3D Point Cloudなどのユースケースのための組み込みのラベリングツール
ワーカーの選択肢が多い
ワーカへのタスクの振り分け、集計などを自動化
アノテーションのワークフロー
アノテーション対象のデータをアップロード
ワーカーを指定
ラベリングジョブの作成
タスクはワーカーに自動で割り振られる
ラベリングツールでワーカーがアノテーションを行う
アノテーション結果がAmazon S3に集計される
SageMaker Data Wrangler
機械学習のためのデータを簡単に迅速に準備する
メリット
データを洗濯してクエリを実行
組み込みのデータ変換機能でデータを簡単に変換
データ変換をカスタマイズ
MLモデルの精度を早く推定
SageMaker JupStart
機械学習を簡単かつ迅速に始める
メリット
15以上の一般的なMLユースケースの構築済みソリューション
150を超えるオープンソースモデルのデプロイ時間を短縮
数クリックで始める
SageMaker Autopilot
SageMaker上でAutoML を簡単に実行
GUIでの利用が可能
データクリーニングと前処理の自動化
多いアルゴリズムを選択
ハイパーパラメータチューニングの自動化
インスタンス、クラスタサイズの自動選択
SageMaker Pipelines
MLのCI/CDを実現
データ処理や学習、モデルの最適化などの一連のステップを任意タイミングで実行可能
本番環境にデプロイするのに最適なモデルを選択可能
SageMaker Model Registry
SageMkaer Studioでモデルのバージョンを選択し詳細を確認できる
SageMaker Model Monitor
モデルの品質を維持できる
監視対象:
データの品質
モデルの性能
モデルのバイアスドリフト
Amazon CodeGuru〜機械学習で実現するコードレビュー⾃動化とアプリケーションパフォーマンス最適化
Amazon CodeGuru利用の全体象
Amazon CodeGuru Reviewer
ソースコードのクリティカルな問題や発見
改善方法、ドキュメントを合わせる
Java、Pythonに対応
Amazon CodeGuru Profiler
アプリケーションのパフォーマンス状況を可視化
改善方法、ドキュメントを合わせる
Java/JVMベースの言語、Pythonに対応
CodeGuru Reviewerの動作イメージ
管理者はAmazon CodeGuruとリポジトリと関連を付ける
AWS CodeCommitを利用すると便利
変更点をCommitしPull Requestを作成
Pull Requestに対し推奨事項をコメント
推奨事項
AWSベストプラクティス
並列処理
セキュリティ
リソースリーク防止
機密データ
コーディングベストプラクティス
リファクタリング
インプットバリデーション
コードクオリティ