マルチモーダル画像検索アプリを作ってみた!
を生成するタスク 画像に写っているテキストを抽出する OCR Visual Question Answering (VQA) と呼ばれる画像や動画に対するテキストによる質問( ...
84
46
Comment2
1 search resultsShowing 1~1 results
You need to log-in
を生成するタスク 画像に写っているテキストを抽出する OCR Visual Question Answering (VQA) と呼ばれる画像や動画に対するテキストによる質問( ...
1 search resultsShowing 1~1 results
Qiita is a knowledge sharing service for engineers.