マルチモーダル学習におけるAttention機構について
解決したいこと テキストと音声のマルチモーダル学習を行っているのですが、それぞれ異なるモデルで特徴抽出をした後に、concatにより統合し、600次元の特徴を出力しています。 ...
4 search resultsShowing 1~4 results
解決したいこと テキストと音声のマルチモーダル学習を行っているのですが、それぞれ異なるモデルで特徴抽出をした後に、concatにより統合し、600次元の特徴を出力しています。 ...
エンジニアでもなく、it関係にも勤めてない料理人ですが、本当に困っており、助けてもらいたく質問しました。現在25歳で、キャリアをやり直そうと考えています。料理人としてキャリアを歩みたいと思いまし...
前提 テキストと画像のマルチモーダル深層学習モデルであるMMBTについての質問です。 テキスト側(bert)のエンコーダーのパラメータ更新が確認できず、困っ ...
放射線治療計画CT画像を加工してpythonで深層学習するときのデータ取り込みについて 出力した生成CT画像を後に市販アプリケーションへ戻して線量計算を行いたいです。 1.CT値を残したまま学習...
4 search resultsShowing 1~4 results
Qiita is a knowledge sharing service for engineers.