内容
・趣旨目標
・使うサービス
・参考サイト
・ハンズオン
趣旨目標
人工知能、機械学習を通じて技術、知識の向上!
使うサービス
Amazon Transcribe
簡単に言うと音声から文字起こしを行うことができるサービス。
参考サイト
ハンズオン
東京リージョンで作業を行います。
ナビゲーションバーから、「リアルタイムトランスクリプション」を選択します。
リアルタイムに文字起こし
オレンジボタンから、文字起こしが可能です。
使った印象ですが、少人数で雑音が少ない場所であれば、リアルタイムに文字起こししてくれる感じです。
既存の音声データから文字起こし。
音声データをS3にアップロードする。
公式さんが準備したデータを準備しておき、アップロードする。
次にTranscribeに戻り、トランスクライブジョブを選択する。
「Createjob」をクリックして設定を進める。
FIFOキューによって効率的に文字起こしできるようです。
言語は日本語にします。
次に、音声データがあるS3のURIをS3画面からコピーしてきて、ペーストします。
出力先のS3は先程作成したバケットをブラウザボタンから選択します。
あとはデフォルトで進めます。
字幕機能もあるようです。
デフォルトで進めます。
カスタムボキャブラリーを追加できるようです。
ここで細部カスタムボキャブラリーの設定を行います。データのインポートもできるようなので、実用性がありそうです。
元の画面に戻って、ジョブを作成をクリックします。
ハンズオンで提供されている音声データは約5秒の肉声ではなく、機械音声になっておりますが、jobの作成に1分もかかりません。
赤枠から文字起こしされたjsonデータをダウンロードして確認します。
直接S3に移動しても確認しやすいかもしれませんね。
おおむね良好ではないでしょうか!伝わるし、オプションをフル活用すれば、誤りも減りそうですね!ハンズオン。。(^^;
リソースの削除
1.S3バケットから削除します。
空にしてから、削除ですね。
2.jobを削除します。
Transcribeに移動して削除します。
他のサービスと連携することで、よりよく使うことができるのではないでしょうか!
では!