はじめに
画像認識APIが各社から提供されています。
目的は、画像を認識させてその画像に写っているものの詳細を文字列で出力することです。
例えば、シロナガスクジラの画像を入力すると「動物」ではく、「シロナガスクジラ」という文字列が出力されるようなものです。
Cloud Vision API
Googleから提供されている画像認識APIです。(Cloud Vision API)
こちらのAPIを使って、画像に写っているものを認識させてみます。
入力画像:
10 Web entities found:
Score : 1.498650074005127
Description: Three Days of Happiness
Score : 1.0687499046325684
Description: Sugaru Miaki
Score : 1.05840003490448
Description: Three Days of Happiness
Score : 0.5787000060081482
Description: Novel
Score : 0.5769000053405762
Description: Parasite in Love - Roman
Score : 0.5256999731063843
Description: Light novel
Score : 0.4254000186920166
Description: Hardcover
Score : 0.4147999882698059
Description: Media Works Bunko
Score : 0.3255000114440918
Description: Manga
Score : 0.28519999980926514
Description:
まさにやりたかったことができました。
本の名前もそうですが、著者の情報も関連で出てきていますね。
しかし、英語しか出力できないらしいので日本語で出したいのであれば翻訳を掛けるなどしないといけないですね。。
Cloud Vision APIをサンプルで試す
AWS Rekognitionのサンプルを試す
最後に
一番いいかもしれないですね😂