Google Cloud Speech API を使った音声の文字起こし手順を読んで、自分でもできる!と思ってやってみました。
ほとんどコピペで出来たのですが、いくつかつまずいた所がありました。
##第一関門:ImportError: cannot import name speech
と表示された。
サイトを参考にpyを実行すると、ImportError: cannot import name speech
と表示されてしまった。
taratealで質問して、sudo pip install google-cloud-speech
を実行すれば解決。
##第二関門:403 Cloud Speech API
と表示された。
第一関門突破後、以下の状況に陥った。
$ python testspeech.py gs://[パケット名]/[音声ファイル名].flac
Traceback (most recent call last):
File "testspeech.py", line 42, in <module>
transcribe_gcs(args.path)
File "testspeech.py", line 21, in transcribe_gcs
operation = client.long_running_recognize(config, audio)
File "/usr/local/lib/python2.7/dist-packages/google/cloud/speech_v1/gapic/speech_client.py", line 264, in long_running_recognize
request, retry=retry, timeout=timeout, metadata=metadata)
File "/usr/local/lib/python2.7/dist-packages/google/api_core/gapic_v1/method.py", line 139, in __call__
return wrapped_func(*args, **kwargs)
File "/usr/local/lib/python2.7/dist-packages/google/api_core/retry.py", line 260, in retry_wrapped_func
on_error=on_error,
File "/usr/local/lib/python2.7/dist-packages/google/api_core/retry.py", line 177, in retry_target
return target()
File "/usr/local/lib/python2.7/dist-packages/google/api_core/timeout.py", line 206, in func_with_timeout
return func(*args, **kwargs)
File "/usr/local/lib/python2.7/dist-packages/google/api_core/grpc_helpers.py", line 56, in error_remapped_callable
six.raise_from(exceptions.from_grpc_error(exc), exc)
File "/usr/local/lib/python2.7/dist-packages/six.py", line 737, in raise_from
raise value
google.api_core.exceptions.PermissionDenied: 403 Cloud Speech API has not been used in project 618104708054 before or it is disabled. Enable it by visiting https://console.developers.google.com/apis/api/speech.googleapis.com/overview?project=618104708054 then retry. If you enabled this API recently, wait a few minutes for the action to propagate to our systems and retry.
色々sodo pip install
で実行してみたが、改善しなかった。
なぜか、project 618104708054を参照してしまうので、再度サービスアカウントを取りなして、jsonを再アップし、PATHを通した。
すると解決した。
##第三関門:文字化け
やっと、pyが実行でき、直下にoutput20180429-135541.txt
というファイルができた。
しかし、中身を見てみると文字化けしてる。
$ cat output20180429-135541.txt
ɂĕcȂǂE͑ŜĊɓČerԈ҂̏iꂩƂƂōRch͂ȔԑgƂőŌ\{Ă܂ł˂܂̌ƗǂȂ̂ł̂炻҂ĂłłނifX{Ĉ̓ZNn̎ĂȂł˂̃xłꂱĂƂȂƂ݂ƂȂƂł̂ɍ傢Ȃǂ炵ĂႾǂȂA낤ƎvAꂽǂl킩Ăł݂ɂ˂݂݂ĂoĂĂ݂ČĂǂꂾ炠Cł͎̖OĖĂȂ邢ȂĂ݂Ă
M͂ԏ~ÃXgOQiZXȂ͍̂T̏߂ĖlŖlłer̋L҂Ă̂킩ėvCčrł̂ŖOoł~ł͏tŏ̕邢łȂ炸ƑOƂȂĂłłǃeroĂ邩炷ł悻Ă̂̓e̎Ӎ߉߂Ăł{JĂ͖̂oЂĂ鎕HƉԓĂerǂŎQł0ɎĂނӖĂɂƂ̂ɏoȂł˂ɂAzȃRe[^[ZJhCvƂɎgł{ɂu̓łȐlĂł悱苩łƂ痒
̎̈ӎvŎQĂƂƑOĂƂvǂ˂ꂾ炻ƑSoȂƑʖڂł悠ҏWȂĂJłςv葤Ă̂͂˂݂ԈďĂ郁ĂΏɑkɃS~oȂĂ̂܂ȑΉǂȂƎv܂ǂԂƓŐQłقς傫ȐłȂȂ̋̓łԂ̃|Cǧʉ
S̐XFw̐^ʖڂȎ̒łȔEgłǕƈߋ1NjŐH玞Ԃ̗ꂩ炷Cx[gȕt̒ŕςȎq˂ƂǂĂĂĘ^ԎqɏoEƖؑbqłǂς肻^j[X\[XƂĂ̂QĂ邩Ȗhq̂߂ɂđ傫ႤƎvĂ܂\[XȂ璩cRɂł˖fŒĂW[iXgƂĂ͂ł˃[ᔽƎv܂ǂNASA ̕
Ƃx@ƂٌNɑkDȂƎv̐lꂵiƕ̊Włꂩ炾ƂL`͂˂ݍsĂ܂łł悿ƒjƏłł悿ƐFĈbłĊdk炱ƂȂ̂čאS̒Ӓ̂łȎvfē~̂ȂƂƂ
MԂӍ߂Ă璝ĂʐeB̖Ă܂˂ĂԂrȂĂƂȂ̂
RĂ͖̂{ǂłčǂ̎Ę^܂]扽DꂽXɍsȂƂƂ̔ޏƂĂ傱ˋĂǂǂŝ͕ςĂƂȂłŎdĂˊ撣ĂĂ邵Ŏd̂߂ɂōsȂႢȂl
ǂlĂ{炱^ꂽƂł̏ꍇʂɖ邲ѐHׂɍsƂłɑߕOɓdbĂĉvłSză}[N݂ȃvCx[gۂĉƂȂ揗tĂ܂[N݂Ȑlɑ^SꂽȂƂłƎႢCP̃fBN^[܂ƂłQĂ̐lɂ͏̐lĂȂɂƂSɍsǓe
ƕςȋL҂ĂoȂƂ܂傤ėp܂݂ȂŃZbgĒsl͕ʂɂˌ^ 悳悳Ė{ɉ̃e[ủɃbN悳ꂽ3NOŐ^RƖ̏k̕܂ႾȂĎv܂E҂ȂႪꂾZNnꂽƂȂ̏ł͑ł킩ǂ݂ɌƎv
ZNn̂ƂƂl߂đmq݂Ȋ̂łpĉĂ𗬂ĂĂƂɂȂȂΊWȂČĂ̒Œł肵Ă邯ljꂪ͎ĂȊŒǂƂ悤ȃ^CvgĂ݂
やっとできたのに文字化けでガッカリしたが、ローカルにダウンロードした所、問題なく表示できた。
今回の騒動について福田事務次官なんですけども魔界は全体を見ればこれって幾原に当たらないって言っちょーする一方テレビ赤井川道者の女性司会はこれから受けたということで抗議した辛さはいろんな番組とかで大問題家で結構怒ってますよねそうですねまあの誤解されると良くないのであのせからその者もちろん停止してるわけでも何でもないむしろ逆ナンデスボイたいのはセクハラの事件っていろんなですねあのレベルがあるんですよもうそれこそあの売れなくてあれ怖いとか逃げられなかったとかみしつだったといろんなことがあるわけですよなのに今回はもうちょいいけないんですけども暮らしも言ってるもんもも最低だしモラル良くないんですが帰ろうと思えば帰れた歯どういう人かも全部わかってるのでみんなにねみつみつってあやともしゃりしゃり出てきてみて言ってるんだけどもそれだったらあの海では自分の名前を言って名乗っていいなさいあるいは告発しなさいってみんな言ってるのに
発信力ある一番上の立場のミリアのストが名前を伏せるで寝ナンセンスなのは今週の初めだって僕で僕でさえテレビの記者だってのわかったして要するに靴皇居の公共性があるテレビですので名前出るんですよアルミでは春分最初の方がずるいですよ証明がないからずっと前だとなくてできるんですけどテレビ出てるからすぐかもわかるんですよそれでも治らないっていうのはテレ朝の謝罪会見も釈明会見も大場に言い過ぎてるんですよねボカ聞いてのは毎日出社も知ってる歯その食と花二次被害っていうの2時テレビ局で受ける被害ですよ10に持たしてくれないから取材をそういう意味だってんですよ彼女にとったのに出ないんですよねでねもう会いにもうアホなコメンテーターがセカンドレイプとか愛に使っちゃダメです本当にそういう立場に置かれてる気の毒な人っているんですよこもったり叫んでもいるんですよなかったんですかちゃんとだから嵐のこと
あの自分の意思で参ったっていうことと前から知ってるとかそういうこともあると思うんですけどねあれだったらそうするよりもっと全部出さないと駄目ですよあの編集も行けないんですよってもアメリカでもやっぱり必要相手側の油分も1億ってのはあるんだねみつ中間違って書いてあるメモしてください対処に相談を受けた時にゴミ出さなかったってのが一番まずかったんじゃないかな対応が良かったんじゃないかなと思いますけども9時間と二人で寝さしだができるとほらやっぱり非常に大きな数ですからねなかなかその級の難しでも一番のポイントの効果音
全部その森友学園の真面目な取材会話の中でこういった卑猥な発言があったらねこれアウトですけど聞くと一年半過去1年男女二人で食事だから時間の立場からするプライベートな付き合いの中で変な子ねちょっとどいている男性が女性を口説いてるとメモを取って録音されて中間子に出されて失職と木村さんの話繋がるんですけどやっぱりその録音がニュースソースとしてだったのかそれとも被害を受けてるからの自己防衛のためだったかによって大きく違うと思ってますソースだったなら朝成田山にですね無断で提供するってこれもジャーナリストとしてはですねルール違反だと思いますけどもそうで NASA の方だったら
ちゃんとしたらまずた警察とか弁護士誰かに相談するって4が好きだったなと思う回数が多くの人が苦しんでる上司と部下の関係でこれからだったとこれと言語とキムチはねただ飲み行ってまでですよちょっと男と女でですよちょっと色気のある会話でこれ出て感電北それでもなんか八かぐらことされてもおかしくないのよ橘して細心の注意張らないのでも主題歌いろんな思惑があって冬のおもちゃてから考えないということで
いっぱい呼ばれるとちょっと痛いです何が入ってんの二つあると思いつの立場もあるし今度はもう一つ財務省とうまくやってきたいって言うの忘れたねみちゃだめだしてもテレビ局でもあると思うよそこんとこもあるかもねでももう一つのことに気があると理解できますちょっと理解できんだけどただこれ週刊誌で8木曜日発売されますよねはい前日この時点でとれた野菜気づいてないここから一週間黙ってみてね本当はこの時点で家にも実はこういう被害があったってことは僕は一週間前に発信するやつあれは時間が謝罪してから喋ってくれりぬ親父達の夜にやってますねこれってんじゃまた時間が言わなかったらテレビ朝日なかったってことなのか
ロコンしたっていうのは本当かどうかでだって今どの時だって録音しますよ堀江さんだったよ何が優れた店に行かないこともできたとその彼女がとてもしょこらどね空に向かってどこどこ行くのは変じゃないかってそんなことないでもそれ以下で仕事してね頑張っていくってもあるしそこで仕事を取った時のためにそういった女性がで行かなきゃいけない人
今回のこれはどう考えてもだから六本木からこれで録音されたことがあるんですよ僕の場合別に夜ご飯食べに行ったとかじゃないですよ2に逮捕される何日か前に電話かかってきて俺が大丈夫ですか心配してマークみたいなプライベートっぽい会話だって家が大変なんですよ女性器棚付けっていうかまぁたんトークがみたいな人に送る際それ全部録音されて全部流されたんで私なんか私ごときでもよちょっと若いイケメンのディレクター着きました何とかそういう空気でそういう時慌てんじゃないんだから男の人には女の人を売ってた方がなにか白とか全巻に行くんじゃないをやられたんすけど日テレの
ちょっと変な記者がいてそいつが俺さんなんか出そうなとこお金しましょうよって利用しますみたいなでセットして提出行くじゃない人は別にね言ったら全部録画されてて本当に何のテーブルの下にロックを録画された文化3年前何で真由美さんとかちょっと明日の女性北の方がすごいまあ言うかんゆうしゃだなって思います強い女空手勇者そうなんか雪がもしそういう立場だったら行きセクハラされたとか言えないんで公の場で裏では多分でかわからないけどみたいに言うと思うけど
セクハラつのおじさんあれですよねといやらしいことをした後に詰められると言って相手の女もノリノリだった子みたいな感じのゆっくり弟じゃないですか英語と何やって何が入ってる全部を流してくれっていうことにつながるのかなもしかしたられば関係ないよって言っても家の中で中でもない喋りしてるけど何かあれが溢れそうじつは持ってるような感じで追い込んでこんなことじゃないようなタイプ導入使ってみたい
音声元:https://www.youtube.com/watch?v=NRs-JDNQkeE&t=389s
#感想
こんな私でも実行できるのだから、素晴らしいサービスと思う。
しかし、日本語の精度としてはまぁまぁという所でしょうか?