More than 1 year has passed since last update.

[Vision API] Javaで画像内のオブジェクトを検出する

Posted at 2024-03-06

Googleが提供しているVision APIをJavaで使ってみました。

APIを使用し、画像内に含まれているオブジェクトを検出します。
画像にどのようなものが写っているのかをAIで検出し、
画像内の位置とオブジェクト名前を返します。

本記事の3.結果の検証でどのようなものが検出されるか試していますが、
大きめに映り込んでいるものしか検出されないようです。
ラベルを検出するの方がより細かい情報を取得できそうです。

APIを利用する環境の準備から始める場合や、コードを実行する際は、
⧉[Vision API] Javaで画像内のいろいろなものを検出する
を参照ください。

No		目次
1		Feature.Typeの指定
2		実行結果の取得
	1	レスポンスの出力
	2	レスポンスの内容
3		結果の検証
	1	駐車場
	2	ボーリング中
	3	人物
	4	街
	5	野菜
	6	猫
	7	風景
	8	デスク

1. Feature.Typeの指定

オブジェクトを検出する場合は、
Feature.Type.OBJECT_LOCALIZATION
を指定します。

以下の記事でexecApi()にタイプを指定します。
⧉[Vision API] Javaで画像内のいろいろなものを検出する

2. 実行結果の取得

2.1. レスポンスの出力

取得した結果をコンソールに出力します。

private static void output(BatchAnnotateImagesResponse response){
    List<AnnotateImageResponse> responses = response.getResponsesList();
    
    for (AnnotateImageResponse res : responses) {
        for (LocalizedObjectAnnotation entity : res.getLocalizedObjectAnnotationsList()) {
            System.out.format("Object name: %s%n", entity.getName());
            System.out.format("Confidence: %s%n", entity.getScore());
            System.out.format("Normalized Vertices:%n");
            entity.getBoundingPoly()
                .getNormalizedVerticesList()
                .forEach(vertex -> System.out.format("- (%s, %s)%n", vertex.getX(), vertex.getY()));
        }
    }
}

2.2. レスポンスの内容

BatchAnnotateImagesResponseの
getResponsesListでAnnotateImageResponseリストが取得できます。
検出されなった場合は、空のリストが返ってきます。

AnnotateImageResponse

メソッド	戻り値	内容
getLocalizedObjectAnnotationsList	List<LocalizedObjectAnnotation>	検出されたラベル

LocalizedObjectAnnotation

メソッド	戻り値	内容
getMid	string	OpaqueエンティティID
getName	string	検出されたオブジェクトの名前
getScore	float	検出結果の信頼度。範囲は0〜1
getBoundingPoly	BoundingPoly	オブジェクトが属する画像領域