概要
この記事は、会議などの音声ファイルをWatson Speech To Textを使って自動でテキスト化するチュートリアルです。
この記事は Ⅳ.動作確認編です。
Ⅲ.プログラミング編はこちら
Watson SpeechToTextでBoxにある音声ファイルをテキスト化してみる(Ⅲ.プログラミング編)
動作確認
Boxでテキスト化したい音声ファイルを選択し、[日本語テキスト化]をクリックすると・・・
しばらく待って・・・
こんなファイルがアップロードされました!!!!
文章の最初の読み取りが少し甘いですね・・・。でも、日本語を読んでも十分に意味が通じますし、精度は高いと思っています。
ハマったポイント
ところどころハマりまくって結構苦労したので(気づけばどうってことないものばかり。。。)、エラーメッセージと解決策を残しておこうと思います。
"The request requires higher privileges than provided by the access token."
BoxのWeb Integrationで取得したauth_codeを使って、AccessTokenを取得しファイルのダウンロード、アップロードを行う予定でした。
しかし、アップロードのみできませんでした。
結論としては、エンドユーザーからの認可なしにファイルアップロードを行う場合、OAuth2.0認証ではなく、[JWTをしようしたOAuth2.0]が必要だったんだと思います。
'Cannot obtain token based on the enterprise configuration for your app'
App Userを作成せずにEnterpriseClientでアクセスしようとしていました。
App Userを作成後、正常にアクセスできることを確認しました。
'This app is not authorized by the enterprise admin'
Boxの管理コンソール>[アプリ]でアプリの承認を行うことで解決しました。
not_found: "Not Found"
音声ファイルをダウンロードする/テキスト化したファイルをBoxへアップロードする場合に、該当フォルダに対し、App Userがアクセスする権限がないと発生します。
最後に
初めて、チュートリアル的な記事を投稿してみました。
これからもクラウドサービスとCognitiveServiceを組み合わせたシステムを開発して行けたらなあと思っています。