※いろいろ敬称略です
※この記事はゲーム実況のステマじゃない、Deep Learningへのとりくみです
ゲーム実況動画
ゲーム実況動画が面白くてずっとみてます。視聴しない日が無いぐらい。HIKAKINとかマックスむらいって知ってます?YouTubeだけで食べてるHIKAKIN(ヒカキン)とか少しは一般人も知っているような・・・小学生の方が知ってるのかもしれないけど。
とにかく、面白い、面白くて時間もつぶれる、最近はコード書いているときのBGMのかわりです。前までは少し前のアニソンだったけど。大黒麻季(字が違う?)とか。今は、HIKAKINとかマックスむらいがメイン。
もし時間があったら、YouTubeとかに動画があるからみてみてください。ステマじゃないよ。
YouTubeかニコニコ動画か
ゲーム実況動画って数が多い。新人も多いし、新人発掘はたのしい。動画はだいたい5分から30分ぐらいがおおい。ただ、数が多すぎるのは問題。24時間しかないんだ、一日。昔の動画も見直したくなるしね。
動画のもりあがるポイント
動画を全部みるのも好きだけど、いいところを抜き出したいっていう欲求もあって、Deep Learningすることにした。ディープラーニングする・・・長いな。ディープラする。ディプラする。とか。
ニコニコだと、コメントがあって、コメントの頻度や内容のパターンで(wwww とか 8888 とか、あ、これは面白くて笑ったり、ぱちぱち拍手するっていみね)動画のもりあがりポイントを知ることができる。簡単だよね。コメントのデータダウンロードして、ぶんせきしたらおしまい。手前10秒ぐらいをffmpegとか使って切り出して、つなげればダイジェスト動画もかんたんにできて楽しい。ffmpeg はUbuntuがいいと思う。CentOSはバージョンによって導入が面倒だから、Ubuntuすいしょう。
YouTubeばかりみてるんですけど、つべだとニコニコみたいに時系列の視聴者からのフィードバックデータを得ることができないから、どうしようかなーって。
HIKAKINもマックスむらいも、口癖とか決め顔というか、そうゆうのがあって、それを狙ってディプラして盛り上がりのポイントを見つけるというのがしゅし。マックスむらいはのけぞってたり、ふせってたりする画面とかも見つけたい。
Deep Learning
Pythonの実装を使います
YouTubeのデータ
$ sudo apt-get install youtube-dl
みたいな感じで、つべのファイルをDLするライブラリというかツールを導入する。ダウンロードしたら、フレームの画像をffmpeg使って抜き出して、音声をビットレートを考慮して抜き出す。
学習用データ
マックスむらいのパズドラなら「○○はつどう!」みたいな音声。「はつどう」だけでうまくいくか。HIKAKINなら叫び声というか奇声というか、そういうの音声を学習用データに用意。画像の方は、好きな顔をキャプチャしておく。HIKAKINの変顔とかで学習させることになんか罪の意識を感じてるけど、好きだから仕方ないよね。マックスむらい32歳の顔も別個に学習させる。
検索
これで、ディプラしてみどころを抜き出すというか、動画の何秒目、何フレーム目にそれがあるよっていうのが得たい結果。
けつろん
書いててだんだんめんどくさくなってきたから、ソースもコマンドラインのメモも全然無い内容になっちゃった。
YouTubeにマックスむらいの「○○発動!」だけ集まった動画がアップロードされたら、うまくいったということでこの記事を思い出してもらえたら、これ幸いでございます。