はじめに
本記事は、「初めての一人アドベンドカレンダー2024 by hohe」の10日目の記事となります。
Advent Calendar 期間中は、AWSの生成AI/ML関連を中心に記事を投稿していきます。
11日目は昨日に引き続き、Amazon SageMakerについてまとめます。
Amazon SageMaker
あらゆるユースケースで高性能で低コストの機械学習 (ML) を実現する幅広いツールを統合した完全マネージド型サービス
Amazon SageMakerの組み込みアルゴリズム
Amazon SageMakerでは、AWSが提供するアルゴリズムを使った最⼩限のコードで機械学習を利⽤可能とする組み込みアルゴリズムが用意されている
アルゴリズム名 | 教師あり/なし | 詳細 |
---|---|---|
Linear Learner | 教師あり | 分類や回帰の問題を解決するために使用する |
XGBoost | 教師あり | 決定木に基づき、ランダム フォレストや勾配ブーストなどの他の手法を改善したもの |
LightGBM | 教師あり | XGBoostと同じ決定木の勾配ブースティングアルゴリズムであり,XGBoostに比べ高速(軽量) |
Seq2Seq | 教師あり | 時系列データを別の時系列データに変換する |
DeepAR | 教師あり | 反復ニューラルネットワークを使用してスカラー時系列を予測する |
BlazingText | 教師あり | Word2vec アルゴリズムとテキスト分類アルゴリズムの高度に最適化された実装を提供 |
Object2Vec | 教師あり | 高度にカスタマイズ可能な汎用ニューラル埋め込みアルゴリズムで、高次元オブジェクトの低次元高密度埋め込みを学習する |
Object Detection | 教師あり | 既知のオブジェクトカテゴリの集合から、イメージ内のオブジェクトのすべてのインスタンスを識別し、特定する |
Image Classification | 教師あり | 入力として画像を取得し、その画像に割り当てられた 1 つ以上のラベルを出力する |
Semantic Segmentation | 教師あり | イメージ内のすべてのピクセルを分類するため、イメージに含まれるオブジェクトの形状に関する情報を提供する |
Random Cut Forest (RCF) | 教師なし | データセット内の異常なデータポイントを検出 |
Neural Topic Model | 教師なし | 統計分布に基づいて単語のグループ化を含むトピックにドキュメントのコーパスを整理するために使用する |
Latent Dirichlet Allocation (LDA) | 教師なし | 一連の観測値を異なるカテゴリの混合として記述しようとする |
k-nearest neighbors (k-NN) | 教師あり | インデックスベースのアルゴリズム |
K-Means | 教師なし | データ内の個別のグループを見つける |
Principal Component Analysis (PCA) | 教師なし | 可能な限り多くの情報を保持しながら、データセット内の次元 (特徴量の数) を減少させようとする |
Factorization Machines | 教師あり | 分類タスクと回帰タスクの両方に使用できるアルゴリズム |
IP Insights | 教師あり | IPv4 アドレスの使用パターンを学習するアルゴリズム |