https://aws.amazon.com/jp/getting-started/hands-on/create-audio-transcript-transcribe/
で簡単に試すことができます。
本記事では様々な音声データをどれだけの精度でtranscribeできたか?について検証結果を記載します。
【参考】youtube動画をmp3に変換するのに利用したサイト
https://ytmp3.cc/en13/
検証ケース:英語音声+BGM
https://www.youtube.com/watch?v=zD8NMw4T1TI&ab_channel=AmazonWebServices
※Amazon Web Services本家youtubeチャネルでTranscribeを解説している動画
Amazon Transcribeの出力結果(見やすさのため適宜改行いれてます。)
transcribing audio could be complex, time consuming and expensive.
You either need to hire someone to do it manually, implement applications that are difficult to maintain
or use hard to integrate services that yield poor results. Amazon transcribe takes a huge leap forward,
using deep learning technology too quickly and accurately convert live or recorded speech into text at
a fraction of the cost. It's easy to use and requires no machine learning experience and is a fully managed service. It's constantly improving to provide you with cutting edge speech recognition models.
You can transcribe customer calls to discover insights
and offer agent coaching or use it for media content to add subtitles to videos and generate metadata
to search your content. And you can use transcribe medical for clinical documentation.
Helping healthcare providers work more effectively. It provides easy to read and review transcripts with
robust features such as time stamps, punctuation, speaker labeling and automatic language identification.
You can also add custom vocabulary or create custom language models to recognize phrases and words unique
to your business. Transcribe offers user privacy by read acting personally identifiable information and
ensures data security by implementing enterprise grade technical and physical controls To prevent unauthorized
access to your content, efficiently transcribe spoken data. Better analyze audio content and lower your costs
with Amazon. Transcribe get started today.
下記が私の添削結果。(英語ヒアリング力低いので若干の添削不備はご容赦ください。)
「transcribing audio could be complex, time consuming and expensive. You either need to hire someone to do it manually, implement applications that are difficult to maintain or use hard to integrate services that yield poor results. Amazon transcribe takes a huge leap forward, using deep learning technology too quickly and accurately convert live or recorded speech into text at a fraction of the cost. It's easy to use and requires no machine learning experience and is a fully managed service. It's constantly improving to provide you with cutting edge speech recognition models. You can transcribe customer calls to discover insights
and offer agent coaching or use it for media content to add subtitles to videos and generate metadata to search your content. And you can use transcribe medical for clinical documentation. Helping healthcare providers work more effectively. It provides easy to read and review transcripts with robust features such as time stamps, punctuation, speaker labeling and automatic language identification. You can also add custom vocabulary or create custom language models to recognize phrases and words unique to your business. Transcribe offers user privacy by read actingredacting personally identifiable information and ensures data security by implementing enterprise grade technical and physical controls To prevent unauthorized access to your content, efficiently transcribe spoken data. Better analyze audio content and lower your costs with Amazon. Transcribe get started today.
」
【総評】
■ 文の区切り「,」終わり「.」も含めてほぼ識別している。「Amazon Transcribe」が「Amazon. Transcribe」と出力された部分もあったがご愛敬の範囲。明らかに意味が異なるような誤識別は一か所のみ(賢い)
誤識別のあった個所(redacting)はTranscibeジョブの出力ファイル上confidenceの%が最低値だった。下記の画面キャプチャのように33.69%。ちなみにそれ以外の単語はほとんどが100%のconfidence。マニュアル上はオプションなしではhighest confidenceを出力するが、lower confidenceの候補を出力するオプションがあり、今回の検証ではその部分が「Reid acting」「Reed acting」と出力ファイル上確認できたがいずれも不正解。尚、3候補オプションでのジョブ実行時間は57秒だった。
■ BGMの影響を受けていない。
■ ジョブの実行時間:60秒、ファイルサイズ:2433KB、audio sampling rate:44100 Hz
検証ケース:英語(UK)音声
https://www.youtube.com/watch?v=5b3FQub7c-w&ab_channel=OnDemandNews
※David Beckham relishing Manchester United tie
Amazon Transcribeの出力結果(見やすさのため適宜改行いれてます。)
you know, when I when I first heard about the, you know, the tie and the game? Um,
I think I almost cried because it is such a special place for May Manchester and I haven't returned there.
I haven't played there for seven years, so this would be the first time. And to go there is an 18 Milan player.
Makes it even more special. I think I'm gonna I made so many friends there Have got, you know,
great report with the fans on DH. You know, I love the club. You know,
it was the club that I always wanted to play for, and it was my dream club.
So to return there will be will be a special night. But, you know, it's business. We wanna we wanna win the game.
So it's it's gonna be an emotional night, but one that that I'm I'm really looking forward, Teo. Very special
下記が私の添削結果。(英語ヒアリング力低いので若干の添削不備はご容赦ください。)
「you know, when I when I first heard about the, you know, the tie and the game? Um,
I think I almost cried because it is such a special place for May me, Manchester and I haven't returned there.
I haven't played there for seven years, so this would be the first time. And to go there is as an 18 AC Milan player.
Makes it even more special. I think I'm gonna I made so many friends there Have got, you know,
great report with the fans on DH um and . You know, I love the club. You know,
it was the club that I always wanted to play for, and it was my dream club.
So to return there will be will be a special night. But, you know, it's business. We wanna we wanna win the game.
So it's it's gonna be an emotional night, but one that that I'm I'm really looking forward, Teo, to . Very special」
【総評】
■ UKについても文の区切り「,」終わり「.」も含めてほぼ識別している。「you know」等の口語で挟まれるものが多くてもtranscribeには影響しないように思われる。
■ ジョブの実行時間:81秒、ファイルサイズ:1405KB、audio sampling rate:44100 Hz
検証ケース:英語複数話者音声
https://www.youtube.com/watch?v=fVoYiAg2QVU
※Tiger Woods comments about making 10 on a par 3 | 2020 Masters Final Round Interview
【総評】
■ 複数話者認識機能が正しく動作している。話者の咳はフィルタリングされていた。最後のintervewerのセリフとTigerのセリフ(極短)がかぶった部分だけ極短部分が切り捨てられたのみ。
■ ジョブの実行時間:79秒、ファイルサイズ:2510KB、audio sampling rate:44100 Hz
検証ケース:専門性ある日本語音声+BGM
https://www.youtube.com/watch?v=6tkdK24JGzs&ab_channel=DAIWASaltLureChannel
※プロのアングラー(東京都出身)が懐古気味にゆっくりとしゃべっている動画
Amazon Transcribeの出力結果(見やすさのため適宜改行いれてます。半角ブランクはそのまま)
です 僕 が シーバスフィッシング 始め た の は 中学 生 の 頃 です ね 最初 は ね やっぱり がむしゃら でし た ね
物凄く あのー たくさん 通っ て 最初 の 一 匹 目 を 手 に し た 訳 な ん です けど どう し たら もっと 釣れる
よう に なる か どう し たら もっと 大きい 魚 が 釣れる よう に なる か って いう の を 考え 始め て そこ から
もう 一つ 釣り の 深み に 溜まっ て い た です よ ね 僕 が 始め た 当時 は ザ スロット 使っ て た です よ
もちろん 芝 スロット も 買っ て た ん? です けど ま 東京 が 多く に 適し た の を 取っ て 全く なかっ た ので
ま 色んな ロット を 試し ながら が 自分 も 通っ て いる ポイント に アウト と は どれ から って 言う の で
ま 色んな ロット 使っ て まし た ね 何 か ね 今 の シーバスロッド って ものすごく 細分 化 さ れ て いる です
よ 僕 が 始め た 当時 は ま シバ スロット あっ た けど あの モデル が 凄く 少なく て ま シチュエーション も
厳選 さ れ て た ん です よ ね で 今 と なっ て は ま 公安 部 専用 ロット も ある し ポート ロット も ある し
ま 磯 で 使う ロット も ある し さ 専用 ロット も ある し 昔、 僕 が 使っ た ロット に 比べ たら ま 今 の ラテ を
は 凄く 選び やすい し ま 取り回し も 凄く いい し ま 使える 一方 が 必ず 見つかる じゃ ない か な と 思い ます
よ ね ま そう だ な。 一つ やる こと は まあ 当時 ラティオ が あっ たら もっと たくさん 釣れ た と 思う し、
もっと うまく なる の が 早かっ た ん じゃ ない か な と 思い ます けど ね うん
下記が私の添削結果。
「です僕 が シーバスフィッシング 始め た の は 中学 生 の 頃 です ね [うーん]省略 最初 は ね やっぱり がむしゃら でし た ね 物凄く あのー たくさん 通っ て 最初 の 一 匹 目 を 手 に し た 訳 な ん です けど どう し たら もっと 釣れる よう に なる か どう し たら もっと 大きい 魚 が 釣れる よう に なる か って いう の を 考え 始め て そこ から もう 一つ**[こう]省略** 釣り の 深み に 溜 ハまっ て い た です よ ね 僕 が 始め た 当時 は ザバ スロットド 使っ て たん です よ もちろん 芝シーバ スロットド も 買っ て た ん? です けど ま 東京 が多く湾奥 に 適し た の を 取っ ロッドて 全く なかっ た ので ま 色んな ロットド を 試し ながら が 自分 も 通っ て いる ポイント に アウト合うロッド と はって どれ からな? って 言う の で ま 色んな ロットド 使っ て まし た ね 何 か ねとにかく 今 の シーバスロッド って ものすごく 細分 化 さ れ て いる です よ 僕 が 始め た 当時 は ま シーバ スロットド あっ た けど あの モデル が 凄く 少なく て ま シチュエーション も 厳選限定 さ れ て た ん です よ ね で 今 と なっ て は ま 公安 部港湾部 専用 ロットド も ある し ポート ロットド も ある し ま 磯 で 使う ロットド も ある し さサーフ 専用 ロットド も ある し 昔、 僕 が 使っ た ロットド に 比べ たら ま 今 の ラテ をラテオ(lateo) は 凄く 選び やすい し ま 取り回し も 凄く いい し ま 使える 一方本 が 必ず 見つかる じゃ ない か な と 思い ます よ ね ま そう だ な。 一つ や言える こと は まあ 当時 ラティオラテオ(lateo) が あっ たら もっと たくさん 釣れ た と 思う し、 もっと うまく なる の が 早かっ た ん じゃ ない か な と 思い ます けど ね うん」
【総評】
■「うーん」「こう」のような口癖(文脈上意味をなさないもの)をフィルタリングしている。(賢い)
■ 英語と異なり、文書の区切りや終わりが識別されない。
■ 文頭と文末にノイズが若干入る。(が、無視できる)
■ 釣り用語(バスロッド、シーバスロッド、ロッド)がズレるが釣り人が文脈上正しい単語で補えるレベル、固有名詞(lateo)は別途対応が必要だがカタカナとひらがな交じりの場合は注意が必要(◎ラティオ、×ラテを)。
■ BGMの影響を受けていない。
■ ジョブの実行時間:32秒(Custom vocabulary1単語利用時38秒)、ファイルサイズ:2829KB、audio sampling rate:44100 Hz
Phrase IPA SoundsLike DisplayAs
ロット ロッド
上記がcustom vocabularyの.txtファイル(ロットをロッドで置換された結果となる)。S3にあらかじめuploadしておき、ジョブ作成時に指定する。
制約と注意事項:Windows上のエディタで編集する際にはドキュメントの"[TAB]"をコピペでそのまま書かずにタブ文字に置き換えることと、utf8とLF(¬CRLF)にすること。アカウントで100のvocabularyが作成できるが50KBのサイズ制約(インメモリとリアルタイムを意識したものと想像)があること。
検証ケース:NHKニュース(複数話者)
https://www.youtube.com/watch?v=JdRcj_suYUw
※きれいな日本語とニュース記事読み上げスピード
【総評】
■ NHKニュースのようにきれいな日本語のやりとりについては複数話者環境においても相応のレベルで識別されている。
■ 携帯のバイブ音が「ええ」と識別された。話者認識で一部誤りあり。
■ ジョブの実行時間:38秒、ファイルサイズ:1726KB、audio sampling rate:44100 Hz
添削結果
夏の夏に
ええ携帯のバイブ音
年間に横以上年間二億円以上
検証ケース:方言(関西弁)ある複数話者の掛け合い日本語音声+BGM
https://www.youtube.com/watch?v=t8r0ojwWLxQ&ab_channel=%E3%81%8B%E3%81%BE%E3%81%84%E3%81%9F%E3%81%A1%E3%83%81%E3%83%A3%E3%83%B3%E3%83%8D%E3%83%AB
※かまいたちキングオブコント優勝ネタ
Amazon Transcribeの出力結果(見やすさのため適宜改行いれてます。半角ブランクはそのまま)
うん あ 落とし 本当 です か 審査 の です ね ま お客様 が ウエット スーツ 試着 さ れ てる ん です けど はい
あのー ピッチ ピッチ すぎ て 全く 抜け ない 状態 な ん です よ はい もう あの 四 時間 ほど 母 は 凄い ところ
です よ ね はい じゃあ 俺 言っ た よ な はい 普段 の 服 歴 や から フルサイズ の 持っ て き て ください って
はい お前 が 持っ て き た 頃 何? エクスプレス そう な で あ すい ませ ん? いや なんか 上 と ずつ って なん
結構 きつい です よ って いう か? あ あ そんな もん な ん だ って 言っ て き た なんで 曲 です いや 僕 も の
つもり で 持っ て き た ん です けど バック ヤード で なんか 取り違え た と 思い ます すい ませ ん 分かる よ
な えっ と え も 間違え ない と 分かる けど えっ くす です よ ね 聞こえ てる 申し訳 ない お前 テーマ だっ た
とき の 言い訳 を し て すい ませ ん じゃ 教え て どう する の も 苦しい 各所 穴 が 凄い こう なんか もう 皮膚
くい込み 継手 フィールド の ダンサー が ない よ 何 か 見える か な? 出さ ない で 何 個? スパイダーマン みたい
だっ た よ お前 は 笑わ ない すい ませ ん お前 の せい も なっ て ねえ よ すい ませ ん? これ どう そう ね ただ
家 です から ちょっと も そう だ けど いい ちょっと ね やばい じゃ わ わ わ わ そう じゃ ない よ 同 から チャレンジ
し て いく 訳 ない の 方 が 上 の 方 から とか そういう 問題 や 止め や 先 だ よ ホーム か な? どう いう イメージ
で やっ て も ソレ ね 今 一番 大変 ね これ すい ませ ん お前 なんか こう な ん だ けど 怖い ね そういう やつ って
すい ませ ん? ちょっと もう 僕 は これ 以降 か? 上 の ところ です ね でも お客 さん これ こっち から 行こ う って
苦しい どう し たら うれしい けど 生き よう が ない よ うまく やっ て みよ う と 思う ん です よ ね で もう 一 回
チャレンジ し て みよ より こっち わかん ない けど ね どこ で 出場 し て ここ から 以降 と し た やつ だ 俺 が 言っ
てる か 池 や ね やっ て みたい な そう は 言い ませ ん? いや そう だ ね と か 言っ て ねえ よ ね 全然 駄目 な ん
だ うん うん あ はい じゃ 何 だろ う? 今 行っ て もらえ ます 分から ない けど 俺 も まだ その 俺 的 に は こう いう
な の? 板 みたい な こう いっ て こう いっ た から どこ だっ た か ひろ なんて 思っ て そう いえ ば 違う め ちゃ 楽
だっ た ころ これ って いう ところ ね ね ね ね ね 面倒 だっ た ね 脱げる って 夢 の が もう 行ける ここ まで 行っ た
何で 期間 ずっと こう なっ て ん だ 怖い そう だ と 思う なら 自分 で そう そう だっ た ん だ そう だ いや あ そう
そう だ ね お前 これ ほれ 気楽 だ そう だ はい 今 俺 凄い こっち そう だ ま ねえ もう いい や やめ て まあ ね ね そう
そう あ そう です ね まあ どう だ ね 下さ ジャン メンズ 使う 久しぶり に あっ た ん です 広介 ソレ 維持 に しろ 俺 が
魅了 なんて 買わ なけれ ば あ そう です ね 全然 あのー 俺 って 久しぶり だ どの 辺 まで やっ て いい から ちょっと 感覚
が 分から ない この ネタ ホント で 優勝 し た 時 に し まし た けれど 彼 から も し て ない でしょ 何 回 か あの 子 だ
番組 と か で あの ウエットスーツ ネタ 言わ れ たり し た ん? です けど ちょっと 近郷 ご 我部 駅 が ねえ よ すぎ て です
か あのー 近郷 方向 と の 決勝 戦 まで に いろんな 場所 で やっぱ 値段 だけ で いい ん です けど ね あのー 受け たい 気
が すごかっ た です よ ね この 場所 で ある けど この 場所 で 受け て その 受け入れ のみ を 受け ない と 何 が? 違う って そう な って いう の が 僕 は 分から なかっ た から 不安 な は 決勝 に 臨ん だ ん? です よ ね 自分 の 時 は 日本 顔 見せる システム 一 麻生 授業 は 準決勝 準決勝 で 日本 じゃ ない って 言っ て 初日 この ベッド スーツ の ネタ を やっ て かなり 長く なっ て そう 落ち た だろ う な ぐらい の 受け やっ た ん です よ そう その 犬 で も 十 人 だっ たら はい あの で も 掴め の 告白 の 練習 の ネタ で 多分 トップ 通過 一 に 通過 する 野郎 で 有名 でし た ね それで 何 と か 一緒 だっ た そう だ けど これ は 激しい 普通 だ そう し たら アドレナリン で 全部 見 たく なかっ た バンドリ だ って いう こと の ない そう すれ ば セフレ だっ たら 全然 って 言わ れ ちゃっ た ん です ね チャンネル 登録 お願い し ます 気 を 付け て ます ね この ネタ を やる 人 は 学芸 会 とか 噴火 すれ ば やる 人 は 気 を つけ て そい じゃ ない か そう です ねうん
下記が私の添削結果。
「うん あ 落としもしもし 本当本店 です か 審査すいません。あ の です ね いま お客様 が ウエット スーツ 試着 さ れ てる ん です けど はい
あのー ピッチ ピッチ すぎ て 全く 抜けげ ない 状態 な ん です よ はい もう あの 四 時間 ほど 母 は 凄い ところ は おいっ!おいっ!ちょっとまってください。すいません 俺 言っ た よ な はい 普段 の 服
です よ ね はい じゃあ歴エル や から フエルサイズ の 持っ て き て ください って
はい お前 が 持っ て き た 頃これ 何? エクスプレスエックスエス そう な で あそれなんでなん? すい ませ ん? いや なんか 上 と ずつウェットスーツ って なんか
結構 きついん です よ って いう か? あら あ そんな もん な んかな だ って 言っ て き たやん なんで 曲 ですエックスエスなん? いや 僕 も エルの つもり で 持っ て き た ん です けど バック ヤード で なんか
取り違え た と 思い ます すい ませ ん 分かる よな えっ と え もエルとエムを 間違え ない とたら 分かる けど えっ くすエスやん! です よ ね 聞こえ てる二個いってんねん! 申し訳ございません ない お前 テーマエム だっ た
とき の 言い訳 を し て すい ませんでした」・・・以下省略・・・
【総評】
■ 二人の話者が関西弁で掛け合う(セリフが重なる)部分の識別率が低い。
■ 文頭と文末にノイズが若干入る。(が、無視できる)
■ カタカナ用語(山内氏が活舌よく強調していたにも関わらず、エックスエス等)の識別率が低い。
■ BGMの影響を受けていない。
■ ジョブの実行時間:189秒、ファイルサイズ:11708KB、audio sampling rate:44100 Hz
■ Audio identificationを試した結果が下記画面キャプチャ。話者識別の精度は単独セリフの長さに影響されているように見える。濱家さんのかぶせ気味の短いセリフが山内さん側で識別されているケースが散見され、そもそも文字起こしされないケースもあった。(単独の長セリフの識別率が高い)オプション利用により処理時間が若干長くなる。(189秒⇒252秒)
検証ケース:方言(栃木弁)ある複数話者の掛け合い日本語音声+BGM
https://www.youtube.com/watch?v=B3KH56C6qUE&ab_channel=U%E5%AD%97%E5%B7%A5%E4%BA%8B%E3%83%81%E3%83%A3%E3%83%B3%E3%83%8D%E3%83%AB
※U字工事のyoutube動画。上記ケースよりも方言がきつめ。漫才でなく通常スピードでラーメンの評価トークしているもの。
Amazon Transcribeの出力結果(見やすさのため適宜改行いれてます。半角ブランクはそのまま)
塩 って いう 何 か ね その 東 一 個 の 手前 の 形成 に も 人気 の ラーメン って 言え イタリア の 難しい 言え って
なん どう いっ た どういう 意味 が わかん ない けど すごい って どういう 意味 です か ね 分 イタリア イタリア の
店 の ラーメン 屋 さん やっぱり ある わ ね 学生 と リコイル 凄い しかし 単純 さ うん 太る だ よ ね 虫歯 でも なんか
いい や と 思っ たり さ 凄い 入れ た みたい です けど ね 違う そう 富山 市 って いう 部分 が うまい 富田 副 です
よ さ こい 踊り 手 口 そう だ よ もう 分かっ た けど 最終 的 に 含め もう いい や って 言っ たら で 今 の 話、 から
そう に 石 とか 作っ た とか そういう 話 か と 思っ たら 引っかかっ て 来 た ん? だろ う? って すごい だ って 大丈夫
だ よ 大丈夫 が 一 人 でも みんな 作っ て ただ 理想 それと カレー 買っ ちゃっ た と か さ 何 か 辿り 我慢 でき ない
から 人々 の 価値 って やつ な ん だ。 けど どんな ご存知 でしょ う か ね? 英 まで 聞こえ て き た でしょ う ね いや
結構 在庫 が ない まあ ね って やつ いや 絶対 前回 俺 も 凄い 好き じゃ お 店 行っ た よう な 感じ で やっ て い られ
ない 富田 ロケ いかさま と だっ たら 違い どんな もん か な と 思っ て 結構 面倒 そう だっ た 年 に すげ え な やっぱり
一瞬 カップル ヌードル シーフード わけ ない 彼 は 覚え て ください ね 壊れ て ください 僕 若い 子 ね 仕事 だ から 自分
は 速い シーフード ね やっぱり うまい ね お前 なんか ね ラーメン 書い てる よう な もん じゃ ない これ は 香り が 全然
違う 俺 は 思う ん です よ 切れ 香り が 恐れ が 俺 が おり 全然 は そんな 暇 が ない よう な 匂い だ ね 上映 うん 強
すぎ ない いただき ます それら じゃ 透き通っ て な 人 で も どれ が 入っ て から 僕 が ある 鳥 の 人 が 凄い 山根 私
ね 誰 が? いい です よ す そう です うん 何 か ラーメン じゃ ない じゃ ない そう ずっと スパイク 食べ てる よ 上品 さ
うん みたい ます し お前 味 が 全然 違う わ だ けど 使用 の すっきり し た の? と は これ の ほか が 出 てる だけ うまい
うん なんか これ だっ たら 強い 全部 飲ん で も いい ん じゃ ない か って いう よう な ちゃん 覚え ちゃ 同じ 考え て 薄い
わけ で パンチラ 普通 お 館 の 塩 を イメージ を 歩ける だ 配線 が あ これ 鳥 だ から まあ ちょっと 一応 疲れ て か ない
お 前 の いい ん だ よ ね ああ 便利 房 そう いえ ば 英語 だ 力強い ボール と 要する そっ か だっ たら もう 俺 一番 なんか
良かっ た な うん 俺 は 一応 ラメ より 同じ だ うん そう 同じ ぐらい か な いや 俺 は ね やっぱり しよ う ずっと さ
あんまり 伝わら ない でしょ で ちょっと 薄い イメージ な ん だ けど この よう な パンチ を 打つ の が 伝わっ て き て か
と 言っ て カップラーメン に の イメージ で ある 汁 飲める ん じゃ ない か って いう の が あんまり ない って いう こと
が 飲ん で も いい じゃ ない か な と 思う する よ 香り も いい し うん 更 なる ケネディ センター 店 店 よ ね うん 何 度
か 名古屋 ない ん だ けど 酒 の 中 で ね、 結構 凄い こと さ 昔 コミュニティ で あっ たろ う な って いう 建物 が さ で
こう 言う 台湾 台湾 料理 屋 さん だっ た よ ね 三 分 を ちょっと 分け て 意外 と ある ん です よ ね そのまま な あれ でし
た ね そう だ ね 年 前 から も これ よいしょ うん よし そう だ ね 危機 感 は うわ あら ね ダイモス 香 妻 や 子 育 も ねぶる
うん お 別れ だ ね 全部 でも な 速攻 ぐらい で 生まれ た 俺 ら 時 から そう です ね と 言い ます これ は 思っ てる 華麗
な ぐらい たち は 資金 辛く て も 俺 は もう ある 程度 無敵 と 思っ た ん だ けど さ あのー から うまい ね これ は あれ
リビング だ から 来年 名前 は ね ま 待っ てる と ちょっと 違う と 思う けど うん うん そう です ね と 同じく 俺 最後 って
やっぱ なんか ね 楽し さ が ね 買っ て わざわざ 買っ て 食べる 楽し さ あ さ おか ない って 言い ながら 食べる って いう
時 に 彼 が 好き だ な と お 目 は 俺 と し たら 会い まし た 嬉しい 嬉しい 顔 し てる もん ね 珍しい 嬉しい かも しれ
ねえ まあ まあ 全然 これ は やっぱり 八王子 ラーメン と 同じ に し た ん だ けど 理由 は 何? だろ 難しい な 理由 が よく
わかん ない けど あるいは これ これ より も あれ で いい ん じゃ ない 彼 が 分から ない もちろん そう だ 失礼 ながら そう
いう 熱い 労働 者 の の ため に 扱っ たら 熱い 関係 で 働く 人 の ため に 味付け 濃いめ で で 出前 を する から 構造 に
面 が 飲み に 行く よう に 努める スープ が 冷め にくい よう に 表面 を 背 脂 で 覆い つくす ほど 楽 だっ た ソレ の
ソレ より 先 と じゃ ない です か? 油 の 量 あ そっ か ね 背 脂 すぐ 大 だ 俺 は あれ から 僕 が 凄い す うん 水 俺 すぐ
会い たかっ た よ あと 必要 な 部分 お前 これ 働い た 特定 の メディア は やっぱ ロース 一 ね 濃い 甘味 の ある こそ うん
うまい 俺 は 好き だ ね あ これ だっ たら 米 最後 まで ここ に 入れ ちゃっ て ね 蓮華 くらい です ね 星 の ドン 大事 さ
下記が私の添削結果。
「塩 って いういってみる? 何 か ね その 東 上品な塩一 個 の 手前 の に 形成女性 に も 人気 の ラーメン って 言え 店ドゥエイタリアン の石塚シェフ 難しい 言えドゥエ って なんだ? どう いっ たドゥエって どういう 意味 が わかん ない ねえけど すごい ドゥエって 」・・・以下原型とあまりにもかけ離れすぎていたのとtranscribe前の音声も方言とイントネーションが独特で聞き取りにくいので断念・・・
【総評】
■ 二人の話者が掛け合う部分の識別率がかまいたちと比較してかなり低い。
■ 文頭と文末にノイズが若干入る。(が、無視できる)
■ カタカナ用語の識別率がかまいたちと比較してかなり低い。
■ BGMやこのmp3中に入っていたラーメンをすする音等の影響を受けていない。
■ ジョブの実行時間:185秒、ファイルサイズ:12305KB、audio sampling rate:44100 Hz