こんにちは,Aです.
今回は音声認識の研究に関してなぜ実際に音声データを録音して解析した論文が少ないのかについて解説していきたいと考えています.
オンライン上にデータが上がっているためという理由はもちろんなのですが,それ以上に複雑な事情が絡んでいるということを実際に体験し実感したので記事にすることにします.
音声データの法的な扱い
改正個人情報保護法施行令:個人情報の保護に関する法律及び行政手続における特定の個人を識別するための番号の利用等に関する法律の一部を改正する法律の施行に伴う関係政令の整備及び経過措置に関する政令(平成28年10月5日政令第324号)に基づく改正後の個人情報の保護に関する法律施行令
によって平成28年10月5日政令第324号に改正個人情報保護法が施行されました.この法律がなかなかの曲者で
身体的特徴(改正個人情報保護法2条2項1号)
次に掲げる身体の特徴のいずれかを電子計算機の用に供するために変換した文字、番号、記号その他の符号のうち、特定の個人を識別するに足りるものとして「個人情報保護委員会規則で定める基準」に適合するものが政令において個人識別符号と定められます(改正個人情報保護法施行令1条1号イ~ト)。
イ 細胞から採取されたデオキシリボ核酸(別名DNA)を構成する塩基の配列
ロ 顔の骨格及び皮膚の色並びに目、鼻、口その他の顔の部位の位置及び形状によって定まる容貌
ハ 虹彩の表面の起伏により形成される線状の模様
ニ 発声の際の声帯の振動、声門の開閉並びに声道の形状及びその変化
ホ 歩行の際の姿勢及び両腕の動作、歩幅その他の歩行の態様
ヘ 手のひら又は手の甲若しくは指の皮下の静脈の分岐及び端点によって定まるその静脈の形状
ト 指紋又は掌紋
ということ.
つまり,
発声の際の声帯の振動も個人情報である
になってしまったということです。そのため,研究機関でデータを扱う際は倫理審査の対象になりえる可能性があります.
世知辛い世の中ですね‥
しかし,今日でも音声認識に関わる研究をできるのは先人たちの努力のたまものです.というのは音響学会が作成した音声コーパス
http://research.nii.ac.jp/src/list.html
があるからです.多種多様な音声データが無償(一部有償)で手に入るのでやり方次第では研究可能であるといえそうです.ただし,その音をいつどんな場所で撮ったかやどのような形式で録音したのか詳細な情報が明確に記載されているものはデータ所有主によって変わってきます.また研究責任者が学生では受け取ることができないようです.学生の場合,指導教員の先生と要相談でデータの入手を行う必要があるので少し注意が必要です.