目次
Azure AI Speech
- Voice Live API デモ動画
- 音声認識・生成AI・音声合成を単一のWebSocketで扱う統合APIが提供され、150以上の言語、600を超える音声、30以上の高精細DragonHD音声を搭載
- GPT-4o RealtimeやPhiなど複数モデルの選択が可能で、ノイズ抑制、エコーキャンセル、割り込み検知、アバター同期にも対応し、Azure AI Agent Service や Semantic Kernel と連携可能
- Video Translation デモ動画
- 大規模動画を70以上の言語に翻訳し、Lip Sync機能、GenAIによる文脈および感情翻訳、マルチスピーカー検出、音声と映像の同期アルゴリズムにより、感情とトーンを保った多言語版を短時間で生成
- Voice Sync for Avatar デモ動画
- カスタムTTSアバターのセルフサービスポータルが一般提供され、音声とアバターを一括で学習可能に
- DragonHD Neural TTS
- 「HD(High Definition)音声」の基盤モデルで、高音質とLLMによる文脈および感情理解を備え、話し手のトーンや抑揚、ポーズを即座に調整し、人間らしい会話を実現
- Speech Playground
- Azure AI Foundry上で提供。Speech Studioで試していた機能をノーコードで試すことが可能に
- Fast Transcription 拡張
- デンマーク語、フィンランド語、ヘブライ語などに対応言語を拡大。マルチリンガルモデルで 15 言語を同時に認識
Azure AI Foundry Agent Service
- 旧「AI Agent Service」が「Azure AI Foundry Agent Service」に改称され、一般提供が開始されました
-
AgentOpsダッシュボードの強化
- 監視
- OpenTelemetryおよびApplication Insightsを活用し、エージェントのスレッド、実行ステップ、ツール呼び出しなどの監視
- 評価
- SDKを用いたLLMによるLLMの性能評価
- Azure AI Inference SDKの活用により、OpenTelemetry仕様に準拠したテレメトリデータが自動的に送信され、利便性が向上
- 監視
-
Azure API Center の MCPカタログ機能提供
- Azure API Management と組み合わせて既存 REST APIをMCPサーバーとして公開可能に
- MCP対応Azure製品(2025年5月23日時点)
- Azure AI Foundry Agent Service ※Bing Search、AI Searchのみ
- Function calling ※SSEのみ
- Copilot Studio、GitHub Copilot
- MCP対応Azure製品(2025年5月23日時点)
- Azure API Management と組み合わせて既存 REST APIをMCPサーバーとして公開可能に
- マルチエージェント制御
- Connected Agent:GUI上でエージェントを並列に接続し、ツールを呼び出す感覚で操作可能(swarmのイメージ)
- Visual Studio上のマルチエージェントワークフロー: Visual Studio上でマルチエージェントのワークフローを可視化・実装可能。(DeepResearch・Magentic-One のイメージ)
-
Bing Custom Search ツール
- freshness(日数・週数指定)、count、market、set_langなどのパラメータを活用したカスタム検索
- Microsoft Entra Agent ID の発表
-
VS Code 拡張
- GUI ベースでエージェントの作成が可能なエディターが登場
- その他
- Copilot Studio 連携、Logic Apps連携、A2A対応
Azure AI Search
-
ドキュメントレベルのアクセス制御
- ADLS Gen2上のPOSIX風ACLおよびAzure RBACをインデクサーが読み取り、検索インデックスに自動で適用。クエリ時にはユーザーIDに基づいて結果をフィルター
-
Agentic Retrieval
- AIエージェントがチャット履歴を含む複雑なクエリを分解し、検索対象のインデックス選択とクエリ生成を行い、必要に応じて並列でクエリを実行し、結果を統合
-
インデックス定義の拡張
- インデックス定義に description が指定可能に
-
マルチベクターサポート
- 分割不要で1ドキュメントに最大100のベクトルを付与可能。複数ベクトルの結果セットをマージし、親ドキュメント単位に集約して出力
-
GenAIプロンプトスキル
- インデックス作成時のパイプラインからAzure OpenAIやAzure AI FoundryにデプロイしたLLMを呼び出し、テキストや画像に対して要約・言い換え・説明・構造化抽出などを実行
- 検索のほか、BIダッシュボードなど、同じ抽出結果を二重利用可能
-
Document Layout skill
- PDF等の文書データに特化した簡易Azure AI Document Intelligence機能が提供され、OCRとAI Document IntelligenceのLayoutモデルを活用し、セクション階層付きMarkdown、チャンク化テキスト(位置情報付き)、抽出画像(位置情報付き)として出力
-
スコアリング プロファイルとセマンティック ランカーの統合
- セマンティック ランカーに新しいフィールド @search.rerankerBoostedScore が追加され、スコアリングプロファイルをリランクレベルで直接適用
- その他
- Azure Logic Apps でのインデクサー実行、マルチモーダル検索の簡素化など、多岐にわたる発表がございました。
Data
-
Cosmos DB (NoSQL) の進化
- Fabric統合:半構造化データを数クリックでデプロイし、OneLake上でニアリアルタイム分析に利用可能。チャットアプリのセンチメント分析などにも期待
- Azure AI Foundryとの統合、LangChainやSemantic Kernelとの連携によるAIエージェントのメモリや状態管理
- Azure AI Foundry Agent Serviceのスレッドストレージ機能により、会話履歴や状態取得およびRAGが可能に
- その他、CosmosDBの全文検索とハイブリッド検索の一般提供及び機能強化
-
Fabric data agent with Copilot in Power BI
- Fabricの全データ資産を対象に自然言語でクエリ可能。複数のレポートやデータセットを横断した分析を支援
-
Mirroring for SQL Server
- No ETLのニアリアルタイム DB複製機能であるミラーリングにSQLサーバが登場
- ミラーリング対応ソース:SQL DB/Managed Instance、Snowflake、Postgre SQL、Azure CosmosDB、Azure Databricks Catalog(プレビュー)
- まもなく対応:Oracle、Dataverse(Microsoft365データのDB)
-
Inline code completion in Fabric notebooks(プレビュー)
- 機械学習を支援するFabric Notebook上で、既存のCopilot機能によるコード生成、コード要約に加え、コード補完機能を提供
- パラメータ自動最適化・GUIデータ前処理を含む、AutoML・FLAMLの機能強化
-
OneLakeショートカット変換
- OneLakeのショートカット機能上で自動的にDelta Lake形式やAIによる要約・翻訳・文書分類などの変換を行い、分析・AI準備を高速化
- OneDriveのショートカットを貼る際にデータ加工も実行されるイメージ