WaveNet
音声合成のために Google DeepMind が開発したニューラルネットワークモデルで、
『人間の声に極めて近い音声を生成する』
ことができます。
WaveNetが従来の音声合成手法に比べて優れている点は、 音声信号の波形を直接生成する ことです。
WaveNet(音の波)=音声合成のように連想できるとよいです。
Grad-CAM
『ニューラルネットワークの判断根拠を可視化する手法』
モデルが特定のクラスに対して、注目した領域を画像上にハイライト表示 できる。
ユースケース
医療画像の診断支援において、この可視化により医師はモデルの判断に対する信頼性を確認しやすくなります。
