記事内で食べさしの画像が登場します。予めご了承ください。
はじめに
Amazon Rekognitionは、機械学習の経験がなくても利用できる画像認識・動画分析の自動化サービスです。
事前にトレーニングされたAPIで高精度な画像分析が可能ですが、特定のニッチなオブジェクトを検出したい場合、汎用のラベル検出では一般的なカテゴリ(「Food」や「Cake」など)として大まかに判定されてしまうことがあります。
そのようなケースで役立つのが「カスタムラベル」機能です。自動機械学習によって、わずか10枚の画像から独自のオブジェクト検出モデルをトレーニングできます。
本記事では、カスタムラベルを用いたモデルの作成から推論テストまでの手順と、はじめてラベリングを経験した筆者がつまづいたポイントをご紹介します。
手順1:データセットの作成とラベリング
まずは推論させたいオブジェクトを学習させます。
- 学習用の画像をS3バケットにアップロードする
- Amazon Rekognition上でS3バケットをデータセットとして登録する
- ラベル名を作成する
- 各画像内の検出したいオブジェクトを境界ボックス(Bounding Box)で囲む
- 囲んだボックスに対して、任意のラベル名を割り当てる
★ラベリング作業でつまづいた点
初めてラベリングを行ってみた際、「画像をどう用意すべきか」「どこまで細かく囲むべきか」で迷いました。精度を上げるためには以下のポイントを意識してください。
① 学習用画像は「本番と同じ環境」で撮影する
白い背景などで単体撮影した画像を用意する必要はありません。
実際の推論時に背景や周辺環境が異なると、精度が著しく低下するからです。
本番の推論時と同じ背景、同じノイズが含まれた状態の画像をデータセットとして用意します。
② ラベルは「判定に必要なもの」だけに絞る
画像内に皿や机、背景の小物などが写っていても、画面内のすべての物体にラベルを作成する必要はありません。
ロジック判定に必要な対象物(2〜3種類など)のみに絞ってラベル付けをおこないます。
③ 境界ボックスが重なっても気にしない
「対象物A」の上に「対象物B」が乗っているような画像の場合、境界ボックス同士が重なってしまっても問題ありません。
④ 複雑な形でも「全体が収まる四角」で囲む
対象物の形が複雑な場合、細かく分割して囲みたくなりますが、対象物全体がすっぽりと収まるような1つの大きな四角(Bounding Box)で囲みます。
対象物以外や余白が中に入っていても問題ありません。

ラベル付けが完了したらモデルのトレーニングを実行します。
トレーニングには30分から1時間ほどかかります。
手順2:AWS CLIによる推論テスト
モデルの学習が完了すると、画像分析APIが発行されます。
発行されたAPIを実行しAWS CLI上で検証します。
画像分析APIは「モデルを使用」タブから確認できます。
※GUI上での検証方法は2026年2月時点では確認できませんでした。
注意するポイント
使用する前に注意する点が3つあります。
①「モデルを開始」ボタンを押下した瞬間からコマンドを実行していなくても料金が発生する
→検証やテストが終わったら、すぐにモデルを停止する!
②出力結果が長いとスキップされる場合がある
→確認したいラベルの結果が出てこない場合省略されている可能性
③推論時の信頼度スコア(Confidence)の閾値はデフォルトで50%に設定されている
→すべてのオブジェクトを検出したい場合閾値の設定をコマンドで変更する必要がある
推論テスト実施方法
AWS CLIを使用する場合のコマンド例は以下の通りです。
発行された画像分析APIの他に、すべての結果を表示し、閾値を5%にするコマンドを追加しました。
aws rekognition detect-custom-labels \
--project-version-arn <モデルのARN> \
--image-bytes fileb://<画像ファイル名> \
// すべての結果を省略せず出力する
--no-cli-pager \
// 閾値を5%にする
--min-confidence 5
コマンドを実行すると、設定したラベルの物体の座標データが出力されます。
検証やテストが終わったら、必ずコンソールから 「モデルを停止(Stop Model)」 をクリックし、ステータスが停止済みになったことを確認してください。
座標データを利用することで、単なる画像認識を超えたシステムを構築できます。例えば、AWS Lambda内で以下のような判定ロジックを組むことが可能です。
- 物理判定 : 「オブジェクトAの境界ボックスが、オブジェクトBの境界ボックスの外側にはみ出していないか」を計算する 。
- 安全マージン判定 : 「オブジェクト間の距離が規定の余白(マージン)を満たしているか」を判定する
まとめ
Amazon Rekognitionのカスタムラベルを使えば、機械学習のコードを一切書かずに「画像のどこに、何があるか」をJSONデータで抽出できます。
画像認識を試してみたい方は、ぜひS3に画像をアップロードするところから始めてみてください!

