どうも、カーブミラーです。
今回は、Sora 2の人物の音声をできるだけ思いどおりにするためのGeneratorです。
本記事は、Sora 2について
書いております。あしからず。
本記事は、ChatGPT Plusプラン
を用いています。 あしからず。
ChatGPT等の動作状況を知らせる
OpenAIのステータスページ。
OpenAIステータス
こちらも載せますね。
ChatGPTが使えない?ログインできない・反応しない原因やエラー時の対処法を解説
著作権法については
こちらを参照するのが
良いのではないかと。
文化庁レポートをもとにした
著作権法についての動画(約20分)
かいちのAI大学 【警告】ChatGPTの画像生成は危険です...【4o Image Generation】
先日(2025/10/30)の再投です。
米国、カナダ、日本、韓国で、
招待コードなしでSoraアプリに
アクセスできるようになりました。
期間限定です(いつまでかは不明)
まずは、【ニュース】から。
(GPT-5.1翻訳)
GPT-5.1 Pro が本日すべての Pro ユーザーに提供開始されます。
執筆支援、データサイエンス、ビジネスタスクにおいて大きく向上し、複雑な作業に対してより明確で高性能な回答を提供します。
回答に10分近くかかることもある
が、間違いなく“世界最強クラス”。
という声もありました。
Proのみなさんが、
すごい結果を出すことを
待ってます😅
では、【本題】です。
今回は、
Sora 2の人物の音声を
できるだけ思いどおりに
するためのGeneratorです。
Sora 2の人物の音声は、
どんなに調整しても
ガチャ率が高いです。
どんなにいい動画も
人物の声ひとつで
気に食わないものになります。
それでも
ガチャ率を抑えるための
努力は、必要でしょう。
そこで、ChatGPTで
声質のPromptを作成する
Generatorを用意しました。
下記のPromptの
入力パラメータを書き込んで
送信すれば、声質Promptが
作成されますので、
それをSora 2のPromptに
組み込んでください。
または、
このPromptを入力し送信すれば、
質問されますので、
答えるという形も取れます。
あなたは映像生成AI(Soraなど)向けの「人物の声質プロンプト」を作る専門アシスタントです。
以下のパラメータをもとに、日本語で1つの声質プロンプトだけを生成してください。
【入力パラメータ】
- 年齢:
- 性別:
- 外見の要素(髪色・目の色・体格など):
- 話す言語・訛り(例:標準的な日本語、関西弁、英語なまりの日本語など):
- 声の高さ(低め / 中音域 / 高めなど):
- 声質の印象(落ち着いた / 明るい / クール / 元気 / 柔らかい / 透明感がある など):
- 話す速さ(ゆっくり / 普通 / 速めなど):
- 感情表現の強さ(抑えめ / 自然 / 大げさ など):
- 話し方のスタイル(丁寧 / 砕けた / 知的 / アナウンサー風 / アニメ風 など):
- その他の条件(ナレーション向き・AI的な無機質さ・子どもっぽさ 等):
【出力ルール】
- `text` のコードブロック内に、完成した声質プロンプトのみを1つ書く。
- 箇条書きや説明文、前後のコメントは一切書かない。
- 文章は1〜3文程度にまとめる。
- 映像や外見の描写は最小限にし、「声」の特徴を中心に記述する。
まず最初に、上記の入力パラメータについてユーザーに日本語で質問し、回答をもとに声質プロンプトを生成してください。
これをSora 2に入れても
使えませんよ😅
これを使わずに
できないのか、という人には、
下記をどうぞ。
{}のところを書き込んで
Sora 2で使ってください。
こちらは、
Sora 2にそのまま使えます。
{年齢}歳前後の{性別}の声。{外見の要素}のキャラクターを想定した声で、{話す言語・訛り}を自然なイントネーションで話す話者。声の高さは{声の高さ}で、{声質の印象}声質。話す速さは{話す速さ}で、感情表現は{感情表現の強さ}。話し方は{話し方のスタイル}で、発音は明瞭かつクリアに聞こえるようにする。
ちなみに
Promptで指定できる要素はほぼ網羅。
方向性や雰囲気は安定させられるが、
完全固定された一つの声を
作ることはできません。
お望みならば、
気に入った声の動画で
キャラクターカメオを
作成するといいかも。
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。