LoginSignup
1
1

More than 3 years have passed since last update.

人生初 コンテスト NNC-challenge vol.2 に参加しました。

Posted at

人生初コンテスト、NNC challenge vol.2

Qiitaに初めて投稿します、よろしくお願いいたします。

Neural Network Consoleを用いてAudiostockの音声(BGM)データを解析

NNC-challenge vol.2は以下を参照。
https://nnc-challenge.com/

参加の背景

AIに関する知識が身につけばと思い参加しました。

今回のテーマ

B.自由な発想で音声データを解析するにしました。
"プログレの音声を分類する。"

学習データ提供

学習用データ提供:Audiostock

やったこと

1.提供されたデータにタグ付けを行う。
今回、手動での設定になりますがプログレと分類してあるデータに1を、
それ以外のデータに0を設定しました。

  • 学習データ 315個
  • 検証データ 100個

内プログレタグ付きデータ

学習用 検証用
3/315個 6/100個
  1. サンプルデータ、wav_keyboard_soundを元に音声データ分析を行うNNCを組みました。 ネットワーク.PNG

結果

学習結果は以下になりました。
学習結果.PNG
かなり信憑性の薄い...というか最悪のグラフになりました...

リソース           学習時間
cpu              --:--:-- (測定不能でした)
NVIDIA® Tesla® K80 GPU x 1  00:04:41
NVIDIA® Tesla® V100 GPU x 1  00:01:54
やはり高性能なGPUほど処理時間が早いです。

※参考に サンプルデータwav_keyboard_soundによるCPU、GPU処理速度の結果
リソース           学習時間
cpu              00:07:57
NVIDIA® Tesla® K80 GPU x 1  00:00:32
NVIDIA® Tesla® V100 GPU x 1  00:00:14
CPUと比べるとGPUの使用はとても速いと感じました。

以下、評価結果です。
分類マトリックス.PNG

尤度グラフ.PNG

すべてがプログレと評価されてしまった事態に...
判断基準が曖昧、前準備が不足しすぎているためこういう結果になってしまったのではないかと推測します。

感想

初めてのコンテストおよびディープラーニング参加でした。
とても難しかったですが、動作できたことに何よりの喜びを感じます。
ほかの方を見てみるとpythonを用いて前準備を行っていたりと音声加工技術がすごいと思いました。
これを機に様々なツールに手を加えたいと思います。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1