執筆中
目的
- 野球中継においてシーンの検出(特に投手が投げる瞬間)について興味がある
- 中継映像からシーンを検出している先行研究がないか調査する
見つかった先行研究
- Baseball scene classification using multimedia features
- Scene-based event detection for baseball videos
- Automatic Baseball Video Tagging Based on Voice Pattern Prioritization and Recursive Model Localization
- A robust scene recognition system for baseball broadcast using data-driven approach
- Event detection in baseball video using superimposed caption recognition
- An efficient pitch-by-pitch extraction algorithm through multimodal information
Baseball scene classification using multimedia features
論文情報
https://ieeexplore.ieee.org/abstract/document/1035908
google scholarで"baseball scene"と検索して一番最初に出てくる論文。
2002年発表、被引用件数61。
概要
野球中継の映像を用いてシーン検出する際には、映像・画像・音声を複合的にみて検出することが大事であるといっている。手法としては最大エントロピー法を用いており、これを使うことで複数の情報ソースをまとめて考慮することができる。
ひとこと
シーン検出をするにあたって映像ばっかりに気を取られていたが、たしかに音声は大事だ。他にも球速だったり状況を示すフレームも検出の際に重要な要素になってくると思う。
評価関数に最大エントロピー法を使うのは分かった(機械学習でもよくつかわれる手法だし)。でも、検出のアルゴリズム自体はどうなっているのかabstractを読んだだけでは分からなかったので、そこは本文をしっかり読みたい。
Scene-based event detection for baseball videos
論文情報
https://www.sciencedirect.com/science/article/pii/S1047320306000538
google scholarで"baseball scene"と検索して二番目に出てくる論文。
2007年発表。被引用件数53.
概要
野球の中継映像は多数のカメラから成り立っている(シーンによって映しているものが全然違う)から、それを利用して物体検出をしようとする論文。手法としては隠れマルコフモデル(HMM)を使用。
ひとこと
この論文を筆頭にマルコフモデルを用いてシーン検出している論文は多い。深層学習が流行る前の時代だからそうなのか。論文に登場する画像をパッと見た感じだと、結構しっかりと細かくシーン検出を行えていそう。
Automatic Baseball Video Tagging Based on Voice Pattern Prioritization and Recursive Model Localization
論文情報
概要
ひとこと
A robust scene recognition system for baseball broadcast using data-driven approach
論文情報
概要
ひとこと
Event detection in baseball video using superimposed caption recognition
論文情報
概要
ひとこと
An efficient pitch-by-pitch extraction algorithm through multimodal information
論文情報