kei6m
@kei6m (K M)

Are you sure you want to delete the question?

Leaving a resolved question undeleted may help others!

python google-cloud-speechでの文字起こしに関して

解決したいこと

長時間の音声ファイルでも文字起こし可能なプログラムを作りたいです。

google-cloud-speechを用いた文字起こしのプログラムをつくっています。
1分もない短い音声ファイルであれば文字起こし可能なのですが、それより長くなるとエラーが発生してしまいます。

解決方法を教えて下さい。

発生している問題・エラー

Traceback (most recent call last):
  File "      ", line 57, in error_remapped_callable
    return callable_(*args, **kwargs)
 File "      ", line 923, in __call__
    return _end_unary_response_blocking(state, call, False, None)
  File "      ", line 826, in _end_unary_response_blocking
    raise _InactiveRpcError(state)

作成プログラム

import os

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'secret.json'

from google.cloud import speech
import io

client = speech.SpeechClient()

speech_file = '    .wav'
with io.open(speech_file, 'rb') as f:
    content = f.read()

audio = speech.RecognitionAudio(content=content)
config = speech.RecognitionConfig(
    encoding=speech.RecognitionConfig.AudioEncoding.ENCODING_UNSPECIFIED,
    language_code="ja-JP",
)


response = client.recognize(config=config, audio=audio)
print('<認識結果>')
for result in response.results:
    print("{}".format(result.alternatives[0].transcript))

0

1Answer

下記のページによると、1 分を超える長さの音声を文字変換するには、非同期音声認識を使用する必要があるみたいです。

1Like

Comments

  1. @kei6m

    Questioner

    本当ですね笑
    見逃していました。ご丁寧にありがとうございます。

Your answer might help someone💌