背景・目的
音源はあったが、スクリプトが手元になく、AWSのTranscribeを使用して作成したときのメモ書きです。
概要
Transcribeの概要
以前、下記に概要をまとめました。
実践
バケットの作成
事前に、S3へ音声ファイルをアップしておきます
トランスクリプションジョブ
-
Transcribeを開きます
-
ナビゲーションペインで、トランスクリプションジョブをクリックします
-
次へ
-
ジョブを作成をクリックします
JSONを加工
そのままだと、扱いづらいのでテキストだけ抽出します
- ローカルにJSONをダウンロードします
- 下記のスクリプトを実行します
import json # TranscribeのJSONファイルを開く with open('MyTranscribeJob.json', 'r', encoding='utf-8') as f: data = json.load(f) # テキストだけを連結して表示 full_text = ' '.join([item['transcript'] for item in data['results']['transcripts']]) print(full_text)
- 文字列が抽出できました(都合上、ここには載せておりません。)
考察
次回は、OpenAIのwhisperをためしてみようとおもいまs
参考