LoginSignup
3
10

More than 5 years have passed since last update.

Raspberry Pi 3 AI実装: Deep Learningによるリアルタイムキャプション生成と音声発話

Last updated at Posted at 2018-04-01

Raspberry Pi3にディープラーニングを実装し、カメラ映像からリアルタイムにキャプションを生成・発話するトイガジェットを作りました。
生成されるキャプション文章の品質はまだまだ改善の余地ありのレベルではありますが、Raspberry Piのような小型PCでもここまでできるというご参考としてもご覧いただければと思います。

セットアップついての詳細はGitHub repoに掲載しております。
https://github.com/yoshihiroo/programming-workshop/tree/master/image_captioning_and_speech

また、当プロジェクトでは、Indiana Universityの筒井氏のソースコードをご本人のご了承のもとで使用しています。同氏による関連論文Using Artificial Tokens to Control Languages for Multilingual
Image Caption Generation: arXiv:1706.06275
についても合わせてご参照ください。

3
10
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
10