今年の re:Invet 初日のキーノートで Amazon Nova 2 が発表されました。仕事柄、音声まわりのアップデートを追っているので、Amazon Nova 2 Sonic について取り上げたいと思います。
申し遅れましたが、ジャーニーマン( @beajourneyman )と申します。長いの"ジャニ"と呼ばれています。
業務で Amazon Connect を基盤利用しているIVRシステムの開発・維持保守を担当しており、エンドユーザー様のインターフェースとして、音声を扱っているコトから Amazon Polly や、言葉そのものを扱う LLM や Amazon Bedrock に関心があります。
こちらは セゾンテクノロジー Advent Calendar 2025 シリーズ1の11日目の記事です。
Amazon Nova 2 Sonic とは
上記、AWS Blog の要約です(生成AI利用)
概要と特徴
- 業界トップクラスの会話品質、コストパフォーマンス、音声理解能力を提供し、開発者による音声アプリケーション構築を支援します
- ユーザーの発話内容だけでなく、話し方(音響コンテキスト)にも応答を適応させることができるため、人間のように直感的でスムーズな音声対話が可能です
性能と機能
- ネイティブな表現力、自然な会話の受け渡し(ターンテイキング)、ユーザーの割り込みへのシームレスな対応を実現しています
- 対応言語ごとに男性と女性の豊かな声が用意されています
- 人間の評価実験では、リスナーが他の主要モデルよりも「Nova 2 Sonic」の出力を高く評価しており、その自然さが裏付けられています
Amazon Nova Sonic から大きく進化し、ストリーミングによるシームレスな会話応答が可能になり、サポート言語としてポルトガル語とヒンズー語が拡充されています。
キーワード「東京リージョン」「日本語サポート」
先に、結論を書くと 東京リージョンで一般利用開始(GA)されていますが、日本語サポートはされていません 。やや複雑な状況で誤認された方も多かったので、順を追ってご紹介します。
日本語サポートについて観測した内容
re:Invet のマット・ガーマンCEOの発表前に、AWSマネージメントコンソールで Amazon Bedrock を開き「モデルカタログ」を覗くと「Spotlight」があり「Nova 2 Sonic」の掲載がありました。開くと、ハイライトしている通り「Japanese (JP)」の掲載がありました。「早い!日本語がきた!!」と心躍りました。
キーノートの前半で、マット・ガーマンCEOから Amazon Nova 2 の発表がありました。
早速 Amazon Nova 2 Sonic 触ってみた
早速、サポートされている東京リージョンで Amazon Bedrock に入り「チャット/テキストのプレイグラウンド」を開き「モデルを選択」で「Amazon Nova 2 Sonic」を選択します。がしかし、前述のモデルカタログあった 「Japanese (JP)」はありませんでした。
引用した AWS Blog を読み直します。日本語はなく、追加でサポートされる言語はポルトガル語とヒンズー語であるコトが分かります。
ドキュメントの記載も以下の通りです。「サポートされている言語」セクションから引用です。
Amazon Nova 2 Sonic は、 英語、スペイン語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語のユースケースでのみ正式にリリースおよびサポート されており、表現力豊かな音声は、米国英語、イギリス英語、インド英語、オーストラリア英語、スペイン語、ドイツ語、フランス語、イタリア語、ブラジルポルトガル語、ヒンディー語に最適化されています。 Amazon Nova 2 Sonic は多言語データでトレーニングされていますが、現時点では他の言語での使用はお勧めしません。サポートされていない言語を使用すると、音声認識の精度が低下したり、自然な音声応答が失われたり、コンテンツエラーが発生したりする可能性があります。
「チェット/テキストのプレイグランド」に戻り、言語「English (US)」を選択した状態で「bedrock.playground.startChatting」を押して 日本語でチャットします。日本語で応答があり、ストリーミングで流暢に会話できました。
ただ、細かくて恐縮ですが添付画像の会話だと漢字の読み上げで"大手企業"を"ダイテキギョウ"と発話しており、やはり日本語の読み上げは難しそうでした。プロダクションで音声を扱う際の"バイブル"である以下のブログを思い出しました。
なお。音声タイプ「Matthew (male,polyglot)」はラジオDJっぽい抑揚、かつ欧米の方が日本語を話される時のイントネーションに近く、プロダクションで使うにはひと工夫必要だと感ました。
まとめ
まとめ
Amazon Nova 2 Sonic 登場!でも、日本語サポートはまだです。
- Bedrock モデルカタログの言語には"Japanese (JP)"の記載あり
- プレイグラウンドの言語では"Japanese (JP)"選択不可
- AWS Blog でも日本語サポート記載なし
- サポートされていない言語の使用は非推奨
- 言語"English (US)"を選び日本語で話しかけると流暢な日本語で会話できる
- 日本語の読み上げは難しそう
Amazon Polly の日本語対応ニューラル音声エンジンは、欧米語の登場から2年半近くかかってやっと登場しました。ただ、生成AIの登場は、ニューラルネットワークによる深層学習とは桁が違う進化を遂げる可能性を感じます。すでに日本語によるリアルタイムな会話はできるので、日本語サポートも早いかも、と期待しています。
音声についてご興味をもっていただいた方は、良かったら以下のブログやスライドもご覧ください。
以上です。




