0
0

AI/ML サービス Amazon Transcribe

Posted at

内容

・趣旨目標
・使うサービス
・参考サイト
・ハンズオン

趣旨目標

人工知能、機械学習を通じて技術、知識の向上!

使うサービス

Amazon Transcribe
簡単に言うと音声から文字起こしを行うことができるサービス。

参考サイト

ハンズオン

東京リージョンで作業を行います。
ナビゲーションバーから、「リアルタイムトランスクリプション」を選択します。

言語設定を「日本」にします。
image.png

リアルタイムに文字起こし

オレンジボタンから、文字起こしが可能です。
使った印象ですが、少人数で雑音が少ない場所であれば、リアルタイムに文字起こししてくれる感じです。
image.png

既存の音声データから文字起こし。

S3の作成から行う。
image.png

音声データをS3にアップロードする。
公式さんが準備したデータを準備しておき、アップロードする。
image.png

次にTranscribeに戻り、トランスクライブジョブを選択する。
image.png

「Createjob」をクリックして設定を進める。
image.png
FIFOキューによって効率的に文字起こしできるようです。
言語は日本語にします。
image.png

次に、音声データがあるS3のURIをS3画面からコピーしてきて、ペーストします。
image.png

出力先のS3は先程作成したバケットをブラウザボタンから選択します。
image.png
image.png
あとはデフォルトで進めます。
字幕機能もあるようです。
image.png

デフォルトで進めます。
image.png
カスタムボキャブラリーを追加できるようです。
image.png
ここで細部カスタムボキャブラリーの設定を行います。データのインポートもできるようなので、実用性がありそうです。
image.png
元の画面に戻って、ジョブを作成をクリックします。

ハンズオンで提供されている音声データは約5秒の肉声ではなく、機械音声になっておりますが、jobの作成に1分もかかりません。

赤枠から文字起こしされたjsonデータをダウンロードして確認します。
image.png
image.png
image.png
直接S3に移動しても確認しやすいかもしれませんね。

おおむね良好ではないでしょうか!伝わるし、オプションをフル活用すれば、誤りも減りそうですね!ハンズオン。。(^^;
image.png

リソースの削除

1.S3バケットから削除します。
空にしてから、削除ですね。
image.png

2.jobを削除します。
Transcribeに移動して削除します。
image.png

他のサービスと連携することで、よりよく使うことができるのではないでしょうか!

では!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0