LoginSignup
2
2

AI音声合成サービス「CoeFont」

Last updated at Posted at 2021-12-25

🔵AI音声合成サービス「CoeFont」

↓サイトtop外観(スクショ) ※更新 Dec,2023
🟪CoeFont:サイトtop外観

スクショ 旧外観
↓サイトtop外観(旧概観スクショ) ※2023

↓サイトtop外観(旧概観スクショ) ※Nov 2022

 
↓サイトtop外観(旧概観スクショ) 2021

- - - //open/hide ここまで - - -

前書き

※2023/12/08:サイト外観など画像類(スクショ)ほとんど反映、全体的に上書き。
※2023/12/05:サイト外観など画像類(スクショ)一部反映。
※この記事はいま、旧スクショ類も残した状態です (「▶︎」マークで未展開状態にしてる、クリックすると展開)
※または旧スクショ類も一部そのまま使用、その場合、画像のスグ上に「(旧スクショ)」と明記あり

※2022/11/29:サイト外観やアイコンが変更されるのに伴い画像類(スクショ)一部反映
※この記事は 既出「音声合成サービス 一覧比較 =WEB APIがメイン=」からCoeFontに関しての部分を抜き出したものでもあります

※「CoeFont」はWEB APIのほか、online webサービスの側面もあります。ブラウザでTTS(Text-to-Speach)できます
※ボイスチェンジャーというアプリが新登場したみたいです (追記@2023/12/05)

※スクリーンショット(画像のこと、以下 「スクショ」と書く)多用で書いています
※文字色は重要なヶ所はこの色、または文中に このように太字 にて書いています(どちらも個人的見解による)

※本稿の情報は投稿日を過ぎるにつれ古くなり、あるいはサービスの改善やupdateに伴い、実際とはちがってくるかもしれません

 
「CoeFont」に関して
ロゴ:現ロゴ(左)※更新Nov 2022、旧ロゴ(右)

サービス名(≒サイト名≒プラットホーム名)も「CoeFont」、声種≒話者名も「CoeFont」、会社名も("Yellston"から変更され)「CoeFont」
2022年1月1日:「CoeFont STUDIO」と「CoeFont CLOUD」を統合→新プラットフォーム「CoeFont」に変更
2021年7月28日:「CoeFont CLOUD」正式リリース (2021年7月19日 先行リリース )
2021年4月23日:「CoeFont STUDIO」公開

以降、この記事では明示的に
「CoeFont (サービス名)」 や 「CoeFont (サイト)」 や 「CoeFont (声種)」 などと表記する場合もあります

↓CoeFontとは的な。英語,中国語などに対応 (引用from HP) @Dec,2023
🟪CoeFontとは的な。英語,中国語などに対応
↓CoeFontと他のサービス比較:〔低コスト・短納期・多様な声, etc...〕
🟪CoeFontなら低コスト・短納期・多様な声でナレーションが使える!

 

「CoeFont」特徴など

  • CoeFont > CoeFontを使う       * 日本語 / 英語 / スペイン語 / 中国語 / フランス語
    • いつの間にか多言語対応 (追記@2023/12/05):
      • ただし、現状スペイン語とフランス語はメニューにはあるが「検索結果が見つかりませんでした」と出る
    • サイト自体の対応言語:Ja / En
    • ボイスチェンジャー、声をリアルタイムに変更するデスクトップアプリ (追記@2023/12/05)
      • Mac版は近日登場予定
      • 費用はCoeFontの 無料プラン / 有料プランによる 〔Free / Basic / Standard / Plus / Life Suport〕 (上書き@2023/12/08)
    • 要loginだがGoogleアカウントでloginできる
    • 作成された音声データは
      →Audio保存可
      →各種調整:簡単にできる【音量/スピード/アクセント/抑揚など】

特筆すべき特徴

  • 作成された音声データの商用利用可能 (すべてのプランで)
    ※Standard、Plusプランの場合は商用利用が可能※
  • CoeFontで生成したAI音声の販売・配布は可能
    ※Freeプランはクレジットの表示が必要※
  • 音声の使用には以下のクレジット表記が必須:「Voiced by CoeFont.CLOUD」
    ※ 例) 投稿動画のナレーションに使用したときなど
    ※ ただし、料金プランが Standard / Plus の場合は任意
  • 3000種以上から選べる、圧倒的数(話者,声種)の多さ
  • 実質無料『1文字あたり 0pt (0円)のCoeFont(声種)』のCoeFont (声種) を利用するなら無料で生成音声データを利用可能
    • 例) 生成データを投稿動画のナレーションに使う
      *このとき 上記クレジットを表記/表示するのは必須*
  • ボイスチェンジャー(アプリ)を利用した場合も同様に上記クレジットの表記 (追記@2023/12/05)

 

その他の特徴

  • CoeFont (サービス名) では “ポイント”を使用して音声を生成
  • ポイントは月々付与される(加入プランによって月々付与されるpt数が異なる)
  • 1文字あたり 5pt (0.05円)~ 10pt(0.1円) などがCoeFont(声種) の使用ポイントとして設定されている
  • 1文字あたり 0pt (0円)のCoeFont(声種) もある = 無料
    →⚠︎APIとして利用する場合は無料にはならない (下記参照)
  • 有名人の声"CoeFont(声種)"も利用可能 (Liteプラン以外)
  • 一般ユーザーの声"CoeFont (声種)"も多数 (だから3000種以上もある)
  • 自分の声 をCoeFont(声種)化することも可能 & 無料 or 驚きの低料金
    • 無料で始める ➡︎|約150~450分|約1,000~3,000文|
    • ¥500 ➡︎ |約15分|約100文|
    • ¥1,000 ➡︎ |約60分|101~400文|
    • ¥2,000 ➡︎ |約150分|401~1000文|
    • ¥20,000 ➡︎ |約450分|1001~2999文|
    • ¥50,000 ➡︎ |約450分|3000文|
      料金プラン3種→|¥500- / ¥1,000- / ¥1,500-|
  • Web API 《https://docs.coefont.cloud/》:利用するにはいずれかのプラン申し込み必須
    • 有料≒アクセスキーを発行したアカウントのポイントが消費される
    • 無料のCoeFont(声種)(使用ポイントが1文字あたり0ptの分/5p以下の分)を使用するとしても、API利用の際は5pt消費される
  • 支払い方法:
    • Standardプラン:クレジットカードのみ
    • Plusプラン:銀行振込のみ

👍 +圧倒的話者数(子どもの声もある)
👍 +各種調整可(SSML相応 or more)
→(下記画像参照)
🆖 ▲抑揚や話し方の癖が多様(話者しだい)
🆖 ▲単語やイントネーションがちょいちょい不自然… 
調整で挽回可(下記画像参照)(旧スクショ)
🟠CoeFont:生成された音声の、音量,スピード,読み方・アクセントなどを調整
参照画像でいう「」部をマウスで上下して調整・修正 (ちなみに「」の位置は上か下か2択のみ)

🚨注意点
🆗「CoeFontを使う」で自由文章や編集(アクセント修正)してみるには「0pt/文字」のCoeFontを使えば無料
🆖もし例えばCoeFont (声種)5pt/文字」の分を選択中で、編集(アクセント修正)後を確認するため視聴で音声を再生(▶️)的な再生ボタンをクリックすると(=音声を生成=pt減少) ≒ 💰 料金発生(!!) になる
⇒ 読みやアクセントの修正編集そのものではポイント(pt)は消費されない
⇒ 音声を生成するのにポイント(pt)を消費するから
 「本サービスでは “ポイント”を使用して音声を生成します」

※まずは「7日間無料体験」 「30日間無料体験」を試してみるとよい (追記@2023/12/05)

 

「CoeFont」3大サービス

🔹CoeFont ボイスチェンジャー (アプリ)

※この項目は追記@2023/12/05

  • ボイスチェンジャー、声をリアルタイムに変更するデスクトップアプリ (追記@2023/12/05)
    • Mac版は近日登場予定
    • 費用はCoeFontの 無料プラン / 有料プラン などによる 〔Free / Basic / Standerd... 〕

↓CoeFont: ボイスチェンジャー Dec,2023

🔹CoeFontを使う

  • 利用できる声3000種類以上
  • すぐ使える声(7 *同一キャラ感情別)、CoeFont STUDIOの声(15 *同一キャラ感情別)
  • 利用料:無料 /有料(※ポイント消費) ※無料の声(0pt@1文字)、有料の声(5pt〜10pt@1文字)

↓CoeFont: ページ下ナビの「AI音声一覧」から Dec,2023

※下記はクリックすると展開

「AI音声一覧」 画像サムネ (clickして展開) 🌀声種 「AI音声一覧」 画像サムネとサンプル音声:
  • Coefont(サイト)ページ下ナビの「AI音声一覧」をクリックした先のページ
  • サムネ画像部分のマウスオーバーでスピーカーアイコンが表示され、クリックすると サンプル音声〈ランダムで3種〉が流れる
  • サムネ部を外れた場所(=文字部分)をクリックすると CoeFont(声種)の個別ページに移動

↓CoeFont: Coefont Pro *全33種(Dec,2023現在)

↓CoeFont: 無料で使える *全19種(Dec,2023現在)

↓CoeFont: 英語・中国語の声 (ベータ版) *全4種(Dec,2023現在)

↓CoeFont: おすすめの声 *全9種(Dec,2023現在)

↓CoeFont: CoeFont Family *全18種(Dec,2023現在)

↓CoeFont: 新着

- - - //open/hide ここまで - - -

 
WEB API キー:利用するにはいずれかのプラン申し込み必須
音声の合成:POST
URL(エンドポイント):https://api.coefont.cloud/v1/text2speech/
URL(エンドポイント):https://api.coefont.cloud/v1/text2speech/batch

🔹CoeFontを使う: ==すべてのプランで作成された音声データの商用利用可能==

↓CoeFont:料金プラン-抜粋 @Dec,2023
🟪CoeFont:料金プラン

↓CoeFont:利用方法 @Dec,2023
🟪CoeFont:利用方法

↓CoeFont:料金プラン @Dec,2023
🟪CoeFont:料金プラン

料金プラン 旧スクショ

↓CoeFont:料金プラン(スクショ) ※@Nov 2022

↓CoeFont:料金プラン=声フォントを使う(旧概観スクショ)

※ Liteの 50,000pt ←→ 約10,000文字相当 (0.05円 / 文字~)
※ Businessの 3,000,000pt ←→ 約60万文字相当 (0.05円 / 文字~)


- - - //open/hide ここまで - - -

*ポイントとは
音声を生成した文字数に応じてポイントが消費される
 ≪例≫
 約5分の動画 1,300文字 x 使うCoeFont 1文字あたり5pt (0.05円) 
 ⇒ 65,000pt(65円)消費

↓CoeFont:料金=ポイントとは(旧スクショ)

注意点(再び)
🆗「CoeFontを使う」で自由文章や編集(アクセント修正)してみるには「0pt/文字」のCoeFontを使えば無料
🆖もし例えばCoeFont (声種)5pt/文字」の分を選択中で、音声を再生(▶️)(=音声を生成)するとpt減少≒💰料金発生(!!)になる
⇒ 読みやアクセントの修正編集そのものではポイントは消費されない
⇒ 音声を生成するのにptを消費するから
 「本サービスでは “ポイント”を使用して音声を生成します」

 

🔹自分の声でCoeFont用 AI音声を作る

CoeFontを使うプランに入ってなくても作成できるっていうのがミソ。ソレとコレとは別。“CoeFontを使うプラン” と “自分の声でCoeFont用Ai音声を作るプラン” は別。
※AI音声の作成は月額プランに加入せずに行える
※AI音声の作成は月額プランとは別料金

収録は:

  • ブラウザ上での録音:PC版Chrome推奨
  • スマホを使っての録音

AI音声の作成は途中で中断:
…することも可能。途中で収録を中断し、後日収録を再開も可能

その他:
決済は収録完了後、CoeFontで生成したAI音声の販売・配布は可能(クレジット表記必要)、自分のAI音声でもポイントは消費(1文字ごとに5pt消費)、Standard、Plusプランにご登録の方は商用利用が可能、etc... (その他詳しくは よくある質問)

🔹オリジナルのAI音声を作る: ==驚きの低価格 Σ(Φ言Φ)==

↓CoeFont:HP > 料金プラン-Top Dec,2023
🟪CoeFont:料金プラン

旧スクショ:料金プラン=声フォントを作る
↓CoeFont:料金プラン=声フォントを作る(旧概観スクショ)
- - - //open/hide ここまで - - -

↓CoeFont:オリジナルのAI音声を作成する(スクショ 2連)※更新Dec,2023
「あなたの声を再現」 / 「感情を込めたい」

↓CoeFont:収録文字数・収録時間・生成時間・料金
🟪CoeFont:AI音声作成_収録文字数・収録時間・生成時間・料金

旧スクショ:オリジナルのAI音声を作成する
↓CoeFont:オリジナルのAI音声を作成する(スクショ 3連)※Nov 2022

↓CoeFont:スクショ 3連のうち1番目、

…と、3番目

- - - //open/hide ここまで - - -

 
音声を合成する
SSMLはないが、ブラウザ上で簡単に各種調整ができる【音量/スピード/アクセント/抑揚など】

↓音声合成&生成&調整の流れ(旧スクショ) cap@DEC,2021

* ブラウザ上ですべて完結


 

表としてまとめてみたらこう

▼ サービス開始時期

※比較用に「VoiceText(HOYA)」分も記載

TTS 【1】サービス開始時期、【2】音質向上時期、【3】その他
🔵VoiceText
VoiceText (HOYA)
【3】2020年:名称変更「VoiceText」→「ReadSpeaker」
【2】2012年:表現力を向上、感情表現
【2】2005年:読みの自然さが大幅に向上
【1】2004年:初の日本語音声合成が誕生(現在は販売終了)
🔵CoeFont
CoeFont (CoeFont)
【3】202X年X月X日:「ボイスチェンジャー」アプリ =いつ出たのか未確認=
【3】2022年1月1日:「CoeFont」に統合&変更
【1】2021年7月28日:「CoeFont CLOUD」正式リリース
【1】2021年4月23日:「CoeFont STUDIO」公開

補足@VoiceText:
2020年5月:名称変更「VoiceText」→「ReadSpeaker」
…製品版「ReadSpeaker」が出来て、VoiceTextは無料API化? =詳細未確認=

 

デモページ(入力テキストから視聴) - 旧外観スクショ
デモページ(入力テキストから視聴)

サイトをちょっとスクロールすればスグ、任意の文章が聴けるヶ所
サイトtopに、任意の文章 or 好きに入力した文章が聴けるヶ所

↓CoeFont:Demo(スクショ)※更新Nov 2022
* 入力制限:30文字マデ

↓CoeFont:Demo(旧概観スクショ)
* 入力制限:30文字マデ

- - - //open/hide ここまで - - -

 
🌀 使用できる話者(日本語)と共通の文章での再生結果

「➡︎リンク先」は 用意されてるtext欄に入力した文章で視聴できるページ ※2021年12月現在
※比較用に「VoiceText(HOYA)」分も記載
※話者名で濃い色…良かった分(個人的判定)
#日本語 話者-デモで聴ける話者or声種- / -利用可能な総話者or声種-

TTS 視聴できるページでの話者一覧
& 第一印象など
「名前はまだない。」
「名前はまだ無い。」ほか、表下の補足info参照
TTS名称
(企業名etc)
なまえ,性別(年齢): 印象
#ref. above
上記の違い有り/無し
- - -
「各text」:自然さの○△✖︎評価
🔵VoiceText
➡️VoiceText
(HOYA)
hikari,女性(21):
haruka,女子(?):
takeru,男性(21):
show,男性(40):
#日本語 話者4人 / 6人
違い無し
- - -
「SSML」:○
「音声合成マークアップ言語」:○
🟪CoeFont

➡️CoeFont
(CoeFont)
アナウンサー,女性(?):
男性声優,男性(?):
男性声優(喜),男性(?):
男性声優(怒),男性(?):
男性声優(哀),男性(?):
男性声優(楽),男性(?):
#日本語 声種6種 / 3000種以上
違いなし
- - -
「SSML」:✖︎
「音声合成マークアップ言語」:✖︎
- - -
※ただしloginして使用するなら、こういったことは調整で挽回可能(上記既出画像参照)

補足info
※「まだ無い」or「まだない」…ひらがな or 漢字の場合で読みに違いが出るかどうか
※「SSML」はアルファベットの読み…『エスエスエムエル』と自然に読めるか
※「音声合成マークアップ言語」…これで“ひとまとまり”として読めるかどうか
  日本語は複合名詞の場合 単語ごとのイントネーションだか高低感だかが異なる
  単に 名詞名詞 と単語を羅列するのとは違うイントネーションになるという規則性

  

■「林檎、ジュース。」「林檎ジュース。」

🌀 各パターンの読みが『名詞名詞』の羅列の発声か、ひとまとまりの『複合名詞』としての発声か。

発声が複合名詞となるパターン検証 @2021/12/25現在
※比較用に「VoiceText(HOYA)」分も記載
※「林檎 ジュース」(全角スペース)の場合も半角スペースの欄に追記
※CoeFontは「林檎」だと読みがオカシかったので「りんご」で検証 @2021/12/25現在

TTS 「林檎、ジュース。」 「林檎・ジュース。」
(※ドット)
「林檎 ジュース。」
(半角スペース)
「林檎ジュース。」
🔵VoiceText
VoiceText (HOYA)
「。」なし改行だと続いてしまう

➡️VoiceText
(HOYA)
それぞれの名詞 複合名詞 それぞれの名詞

※全角スペースでもそれぞれの名詞
複合名詞
🟪CoeFont
CoeFont(CoeFont)
「。」なし改行、区切りとして反映

➡️CoeFont (CoeFont)
それぞれの名詞 それぞれの名詞 複合名詞

※全角スペースでも複合名詞

複合名詞

WEB API類の分もcheckしたい場合は下記
https://qiita.com/Reng/items/f10265c0ee994a0b4f57#林檎ジュース林檎ジュース
フリーソフト 「VOICEVOX」「COEIROINK」「TALQu」の分もcheckしたい場合は下記
https://qiita.com/Reng/items/ca7c2ad3f031aa1e4f1a#林檎ジュース林檎ジュース

__補足info__テキスト入力欄 羅列パターン:3種
※上記表で『「。」なし改行だと続いてしまう』とあるのは下記の 3 の場合

※どのサービスにおいても、単語や文章の区切りには「、(読点)」か「。(句点)」をつけた方が、共通して安全策と言える (というか3の書き方は上記理由によりキケン)

1. 基本的に「。(句点)」で1行で羅列か

patarn1〜テキスト入力欄〜
林檎、ジュース。林檎・ジュース。林檎 ジュース。林檎ジュース。

    
2. 「。(句点)」で改行で羅列か

patarn2〜テキスト入力欄〜
林檎、ジュース。
林檎・ジュース。
林檎 ジュース。
林檎ジュース。

  
3. 「。(句点)」なし改行で羅列か

patarn3〜テキスト入力欄〜
林檎、ジュース
林檎・ジュース
林檎 ジュース
林檎ジュース

3の書き方について:
”林檎”と”ジュース”のあいだの“間”がどれくらいかの発声を確認してたのに、この書き方だと1行目と2行目の(当然区切りがあると思ってた)“間”がなく、行と行の間がなくなって「続いてしまう」という思わぬ不測の事態 (例:1行目最後と2行最初の単語間の“間”がない)

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2