LoginSignup
4
5

More than 3 years have passed since last update.

Azure CognitiveServicesのSpeakerRecognition APIによる話者識別をPythonで検証してみた。#1

Last updated at Posted at 2020-01-10

はじめに

Cognitive Servicesでは、様々なAPIが提供されていますが、今回はそのうちの「Speaker Recognition API」にて話者識別を試してみました。
(日本ではあまり流行ってないっぽいですが。。)

ちなみに話者識別とは「いま誰が話しているのか」を識別してくれるもので、試した感じ、なかなかの精度かも。。と感じました。(まぁ自分の声でしか試してないんですけどね)

という訳で、早速検証していきたいと思います!

事前準備

まずはAzureにリソースを準備していきます。
Azureにログインして「リソースの作成」をクリックします。
image.png

画面左上の検索boxに Speaker Recognition と入力します。
image.png

以下の画面で「作成」をクリックします。
image.png

作成画面に移動するので、各項目を入力していきます!
ちなみにF0だと10,000 無料トランザクション / 月とのこと(検証には十分ですね)
入力が完了したら、画面下部の「Create!」をクリックします。
image.png

リソースのデプロイが完了したので、「リソースに移動」をクリックします。
image.png

サブスクリプションキーが表示されました。
これは後で使うので、コピーボタンを押して保管しておきます!
image.png

これでSpeaker Recognition APIを使用する準備が整いました。

見づらくなりそうなので、実際の処理は次の記事に記載します!

次の記事(実際の検証)

Azure CognitiveServicesのSpeakerRecognition APIによる話者識別をPythonで検証してみた。#2

4
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
5