どうも、カーブミラーです。
今回は、Code Interpreterで音声合成を行ないます。Text to Speechですね。
本記事は、ChatGPT(有料版)
行なっております。あしからず。
今日は、
忘れ物が多い。
財布を忘れ、
イヤフォンを忘れ、
ほかにも忘れている気がする。
まぁ、買い物は
スマホで済ますからいいけど。
スマホは忘れなかった😅
まずは、ニュース。
一昨日(2024/07/09)の記事
【NoLang】を知っていますか? ゆっくり解説動画を10秒でw
で、紹介した
MavericksのNoLang2.0ですが
そのMavericksからポストが
ありました。
【NoLang2.0の主機能
& 良い動画を生成するコツ】
だそうです。
また、この中には、
マニュアル的な記事への
リンクもあります。
次は、
Luma AIのDream Machineの
ニュースです。ポストは
少し前ですが。
DeepL翻訳
「大変なトラフィックの中、お待たせいたしました。 Dream Machineの推論能力を2倍に増強しました! 世代交代が格段に速くなり、キューも短くなるはずです。
さあ、行きましょう!🚀。」
ようは
“Dream Machineで
待たされる時間が
少なくなりました”
って話ですね。
やっぱり
動画ができるまでの時間が
少なくなるのは、
ありがたいことですね👍
さて、本題です。
今回は、
Code Interpreterで
音声合成を行ないます。
実は、
Code Interpreterで
使えるライブラリを
調べていて、
pyttsx3というものを
見つけました。
pyttsx3についての
説明を聞きました。
user
pyttsx3について詳しく
ChatGPT
pyttsx3 は、テキスト音声合成 (Text-to-Speech, TTS) 機能を提供するPythonライブラリです。以下にその詳細を説明します。
pyttsx3の特徴
-
プラットフォーム独立:
- Windows、macOS、Linuxの各プラットフォームで動作します。
- 各プラットフォームのネイティブTTSエンジンを使用します(WindowsではSAPI5、macOSではNSSpeechSynthesizer、Linuxではespeak)。
-
オフライン動作:
- インターネット接続が不要で、ローカルで音声合成が可能です。
-
シンプルなAPI:
- 簡単にテキストを音声に変換できるシンプルなAPIを提供しています。
-
音声のカスタマイズ:
- 音声の速度、音量、ピッチを変更する機能があります。
- 利用可能な音声のリストを取得し、特定の音声を選択することができます。
主な用途
- アシスタントアプリケーション
- 教育用ソフトウェア
- 読み上げ機能付きのアプリケーション
- ユーザーインターフェースのアクセシビリティ向上
- 自動応答システム
pyttsx3は、これらの用途に対してシンプルかつ効果的なソリューションを提供します。
ということで
使ってみました。
日本語は、
ヘンテコになりました😅
そこで
英語で喋らせます。
pyttsx3を使って、“Hello. My name is ChatGPT. Which one of us are you?”という音声を作成して、音声ファイルにしてください。
コードは必要ありません。
音声ファイルが必要です。
実行してください。
これで作成されます。
Qiitaは
音声ファイルを
アップできないし、
X-Twitterにポストするのも
はばかれますので
提示できません😅
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。