初めまして!@rilakkuma46と申します。初投稿です。
いまだに紙のスケジュール帳を持ち歩いています。
携帯に直接入力できればいいのですが、
携帯の文字入力に慣れません(フリック入力で思う文字が選べません)
病院の予約とか一度スケジュール帳にメモして、
あとでPCからgoogleカレンダーに入力しています(見るのは携帯のカレンダーです)。
音声AIモデルのAssemblyAIとMakeというツールを使い、
Lineで音声入力 → AssemblyAIで音声認識と文字データ化 → GoogleDocに保存
という流れのLinebotを作ってみました。
Makeは使い始めて1週間くらいの初心者です。
使用ツール
- Make
- LINEbot
- AssemblyAI
- GoogleDoc
AssemblyAI
音声ファイルをアップロードすると、音声認識して文字データで出力してくれ
ます。「超人的な精度を備えた多言語音声AIモデル(AssemblyAIホームページ
より)」とのことです。有料プランもありますが、100時間の音声までは無料で
使えます。
作ってみた
Lineで音声入力すると、文字に起こしてLineに返してくれます。
さらにGoogleドライブ内にGoogleDocファイルを作成してくれます。
動画はこちら
記事を投稿しました! スケジュール帳を持ち歩くのをやめようとしてみた https://t.co/yRanlot8Vb #Qiita #protoout #Make
— Toshi82430 (@Toshi82430) August 11, 2024
LINEで音声入力するとテキストを出力するLINEBOTです。音声認識のところはテスト中です。 pic.twitter.com/3tgLKgn8uw
Makeのシナリオは次の通りです。
2個目のモジュール設定
参考:音声ファイルの設定はこちらの記事
4個目のモジュールの設定
参考:AssemblyAI音声モジュール設定はこちらの記事
AssemblyAIのサイトでアカウント登録も必要です。
6個目のモジュールの設定
使ってみた
- 自宅内でテストしてみた1 「自分の声」
今のところ誤認識・誤変換はありません - 自宅内でテストしてみた2 「ニュース番組の音声」
人名・地名や専門用語は誤変換することがありますが、体感で95%以上の認識率
です。BGMが流れてると認識率が低くなります。 - 街中でテストしてみた 「自分の声」
気持ち大きめの声で話すと正しく認識してくれます。
でもちょっとはずかしい
入力した音声の長さとほぼ同じくらいの時間でGoogleDocファイルができあがります。
想像以上の早さでびっくり
スケジュール帳手放せそう?
使い始めて数日なのでまだスケジュール帳は持ち歩いていますが、手放しても良さそうな感じがしてます。内容を判断してGoogleカレンダーに自動連携できそうですが、今回はここまでです。
そもそも携帯の入力に慣れればいいのですが・・・
Lineの音声入力もありますが、自分の携帯では都度設定変更しないと音声入力にならないので、1タップでできるこちらの方が便利です。
会議の議事録作成に応用できそうですが、Line・AssemblyAIの業務使用は社内規定で使えません。またAssemblyAIの無料の範囲を超えるので有料プランにする必要があります。
最後に、記事の書き方について先人の方々の記事を参考にいたしました。