はじめに
この記事は株式会社ナレッジコミュニケーションが運営する Amazon AI by ナレコム Advent Calendar 2019 の21日目の記事です。
今回の re:Invent で発表された DeepComposer についてご紹介します。
AWS 機械学習スキル学習のインターフェイス
機械学習モデルの学習ツールとして、DeepLens、DeepRacer、DeepComposer の三種がラインナップされたことになります。
左上がDeepLens、右上がDeepRacer。
そして下が今回の re:Invent で発表された DeepComposer
DeepLens
DeepLens は昨今社会実装が進んでいるコンピュータービジョンのモデルを搭載可能なビデオカメラです。
- 深層学習モデルに対応したビデオカメラ
- 2017年の AWS re:Invent で発表
- クラウドで深層学習モデルの学習、ローカルのカメラにモデルを搭載
- オブジェクトの検出、行動認識、顔認識、頭部姿勢の検出など、撮影した動画の分析や処理が可能
- 実機の価格は 249 ドル
DeepRacer
DeepRacer は誤解を恐れずにいえば強化学習を学ぶための最先端ラジコン。実機の値段もさることながら、モデルの学習にかなりの計算資源を要します。継続的に学習できる方は限られるのではないでしょうか?
- 強化学習のモデルを搭載できる自走型のレーシングカー
- 2018年の AWS re:Invent で発表
- 高度な機械学習テクニックである強化学習モデルのトレーニング方法を楽しみながら学習
- 世界各地でリーグ開催中。2019年11月には新モデル AWS DeepRacer Evo 発表
- 実機の価格は 399ドル
DeepComposer
DeepComposer は Generative AI を楽しみながら学べる、機械学習を搭載した世界初のキーボードです。
- **敵対的生成ネットワーク(GAN)**モデルのトレーニングと最適化を通して、オリジナルの音楽を作曲
- 2019年の AWS re:Invent で発表
- 物理的なキーボードだけではなく、仮想キーボードを用いて、どこでも作曲・学習可能
- 実機の価格は 99 ドル
DeepComposer、なにができる?
もう少し DeepComposer について見ていきましょう
無料利用枠 (12か月間)でできること
無料枠の範囲内で、事前にトレーニングされたモデルを活用でき、以下が実行可能です。
AWS クラウド上の仮想キーボードであれば、すぐにでも使えます。
- 音楽のジャンル (ロックやポップなど) のサンプルモデルを用いることで、コード記述不要でモデル構築可能
- キーボードを使ってメロディを入力すると、AWS DeepComposer はクラウドで機械学習の推論を実行し、4 つのパートの伴奏を生成
- 音源に対し、ポップ、ロック、ジャズなど編曲が可能
無料トライアル (3か月間) でできること
無料利用枠に加えて、30 日間の AWS DeepComposer 無料試用版を利用できます。
- 最大 4 つのモデルのトレーニングと、それらのモデルを使用した新しい音楽作品の生成を最大 40 回まで実行
- Amazon SageMaker を用いて、独自のGANアーキテクチャを構築可能。
- 手元の DAW (デジタルで音声の編集や編曲などできるシステム)を使用して、楽曲のカスタム可能
- Amazon.com で AWS DeepComposer キーボードを購入すると、さらに 3 か月間の無料試用期間が追加
- Generative AI Talent Show (気になりますね!)に提出する楽曲の作成
まとめ
DeepComposer は、DeepLens、DeepRacerに比べて、要する知識レベル・コストともに学習のハードルがかなり下がっている印象を受けました。今が旬の差の Generative AI (また別の記事でご紹介しようと思います) について学習できるのもポイントです。
そもそも音楽はパーソナルなものなので、アウトプットそのものに優劣をつける性質自体が希薄です。個人学習との親和性も高そうですし、モデルの派生系、例えば特定のアーティストの楽曲傾向をシュミレートするモデルや、特定ジャンル(デスメタルとかエレクトロニカとか)のモデルを作る人が出てくると面白そうです。
一刻も早く実機を触ってみたいですね。仮想キーボードであればすぐにでも使用可能なので、休暇中に遊んでみるのも良いのではないでしょうか。