Wan 2.7とは何か：世界初MoE動画AIの仕組みと海外３社の活用実例

Last updated at 2026-05-19Posted at 2026-05-12

2026年4月26日、OpenAIのAI動画生成サービス「Sora」が終了した。OpenAI公式案内によれば、ウェブ/アプリは同日廃止、APIは2026年9月24日廃止予定だ。TechCrunch等の取材報道によると、推論コストが最大で1日約1,500万ドルに達したのに対し生涯の総収益は約210万ドル、コストと収益の乖離が廃止の背景にあった。

この空白を埋めつつあるのが、Alibaba Tongyi Lab（阿里巴巴通義実験室）が2026年4月6日にリリースしたWan 2.7だ。テキスト→動画、画像→動画、参照→動画、動画編集の4モデルスイートに加え、生成前に空間的な論理を推論する「Thinking Mode」を搭載している。Wan 2.2で確立したMoE（Mixture-of-Experts）アーキテクチャの設計思想を受け継ぎながら、クリエイティブ制御と映像品質を一段引き上げた。本稿では、MoEを動画生成に持ち込んだ設計の核心、Wan 2.7の具体的な機能、海外3社の採用事例、そしてこの技術を起点にしたプロダクトアイデアを解説する。

Soraが消えた後の動画AI市場

Sora廃止の直接要因は採算の崩壊だ。2026年2月時点でダウンロード数は3ヶ月で66%減少し、コストと収益の乖離は縮まらなかった。Sora廃止後の代替として名前が挙がるのはRunway（月額$12〜$95）、Kling 3.0（API $0.10/秒）、Veo 3.1（API $0.15〜$0.40/秒）だ。いずれもクローズドで、自社インフラへのデプロイは認められない。

一方でAI動画生成市場の需要自体は拡大している。Grand View Researchの調査では2025年の7億8,850万ドルから2026年には9億4,640万ドルへの成長が予測されており、AIによる映像制作コストは1分あたり4,500ドルから約400ドルへと大幅に減少したという推計もある。

この状況でAlibabaの「Wan」シリーズが存在感を増している。Wan 2.1・Wan 2.2はApache 2.0ライセンスで公開されており、自社GPUサーバーでの完全オフライン動作が可能だ。Wan 2.7は現在APIのみの提供だが、AlibabaはWan 2.1・2.2でも「クラウドAPI先行→オープンウェイト後公開」というパターンを実施してきており、同様の展開が期待されている。

MoEアーキテクチャを動画生成に持ち込んだ設計の核心

Wan 2.2が2025年に確立したのは「MoEの動画拡散モデルへの応用」という発想だ。

動画生成のベースとなる 拡散モデル（Diffusion Model） は、ランダムなノイズを段階的に除去することで映像を作る。このノイズ除去プロセスの最初と最後では、モデルに求められる能力がまったく異なる。初期（ノイズが多い段階）は全体の構図やレイアウトを決める能力が重要で、後期（ノイズが少ない段階）は細部のテクスチャや色彩を磨く能力が重要になる。

Wan 2.2はここに 専門家の分業 を導入した。 高ノイズ専門家（high-noise expert） は生成初期のレイアウト担当、 低ノイズ専門家（low-noise expert） は生成後期の細部担当だ。2つの専門家それぞれが約14Bのパラメータを持つため合計27Bになるが、推論のどのステップでも動いているのはどちらか一方（14B相当）だけ。「27Bの表現力を保ちながら、14B分の計算コスト」を実現している。切り替えのタイミングはSNR（signal-to-noise ratio）という指標によって自動的に行われる。

Wan 2.7はこのアーキテクチャを受け継ぎ、さらに Thinking Mode（思考モード） を追加した。生成前に「被写体の空間配置・光源の方向・シーンの意味的論理」を言語的に推論し、その計画に基づいて生成を開始するアプローチだ。LLMにおけるChain-of-Thought（連鎖思考）を動画生成に応用したイメージに近い。

Wan 2.7の4モデルスイートと現在の入手方法

Wan 2.7は4つのモデルで構成される：

T2V（Text-to-Video）：テキストから最大1080P・15秒の動画を生成
I2V（Image-to-Video）：画像を起点に動きを付ける。最初と最後のフレームを指定する「first-and-last frame control」が新機能
R2V（Reference-to-Video）：参照画像の人物から音声クローニングを含む動画を生成
VideoEdit：指示文で既存動画を編集（例：「背景を砂漠に変えて」）

現在（2026年5月時点）の入手方法はAPIのみだ。Segmind・AtlasCloud・Together AI・fal.aiが対応プラットフォームとして挙げられる。重みの一般公開はまだ行われていないが、Wan 2.1・2.2の公開実績からオープンウェイト化を期待する声が多い。

Runway・Kling・Veo 3.1との違いはどこか

モデル	最大秒数	解像度	自社デプロイ	API単価の目安
Wan 2.7	15秒	1080P	2.7は未公開	約$0.10/秒
Wan 2.2	15秒	720P	可能（Apache 2.0）	セルフホスト可
Runway Gen-3	20秒	4K	不可	月額$12〜$95
Kling 3.0	15秒	1080P	不可	API $0.10/秒
Veo 3.1	8秒（Fast）	4K	不可	API $0.15〜$0.40/秒

動画の長さではRunway Gen-3（20秒）が先行しており、長尺コンテンツにはWan 2.7・Kling 3.0の15秒上限が制約になる場合がある。解像度ではRunway・Veo 3.1が4Kで先行している。Wanシリーズの独自性は「オープンウェイト（Wan 2.2）で自社デプロイができる唯一の選択肢」にある。プロンプトと生成物が外部サーバーを経由することを避けたい医療・法律・金融系組織にとって、現時点でほぼ唯一の現実的な選択肢だ。

Segmind、AtlasCloud、Artlist—海外で使われている現場

Segmind（インド）：75万人以上の開発者プラットフォームへの統合

Segmindはインドに拠点を置くAI画像・動画生成APIプラットフォームで、75万人（750,000人）以上の開発者が利用している。Wan 2.7のリリース直後の2026年4月からT2V・I2V・R2V・VideoEditの4エンドポイントを相次いで公開した。Segmindの公式ブログによると、「映像制作会社・MCN（マルチチャンネルネットワーク）・eコマースブランドが最も多い利用層」とされており、商品動画・SNSコンテンツ・マーケティング映像の生成パイプラインに組み込まれている。API単価は720P生成で約$0.06/秒を案内している。

AtlasCloud（米国）：エンタープライズAPIとして全4モデルを集約提供

AtlasCloudは米国に拠点を置くエンタープライズ向けAI APIプラットフォームで、300以上のAIモデルをOpenAI互換エンドポイント・99.99%アップタイムSLAで提供している。Wan 2.7の全4モデル（T2V/I2V/R2V/VideoEdit）をコレクションとして整備しており、「マーケティングチームが製品動画・ブランドコンテンツ制作に活用している」と説明している。自社ブログではWan 2.7のThinking Modeがコンポジション設計の精度を変えたという詳細な事例解説を複数公開している。

Artlist（イスラエル/米国）：5,000万人以上のクリエイターへのWanシリーズ統合

Artlistは動画クリエイター向けに音楽ライセンス・素材・AIツールを一括提供するグローバルプラットフォームで、5,000万人以上のクリエイターが利用している。2026年初頭にWan 2.6（Wan 2.7の直前バージョン）をAIビデオジェネレーターとしてプラットフォームに統合した。テキストからの生成・画像を起点にした生成・音声入力の3タイプに対応し、16:9/9:16/1:1など複数のアスペクト比で動画を出力できる。「ソロクリエイター・小規模チーム・ブランドストーリーテラー向けにアイデアを映像化するツール」として位置づけられている。

Wan 2.7を使ったプロダクトアイデア：3つの方向性

シナリオA：ECブランドの商品動画内製化SaaS（垂直特化型）

ベース実例：Segmindが映像制作会社・eコマースブランドへ提供している「商品写真+プロンプト→1080P動画」のAPIパイプライン。

発展アイデア：ECブランド専用の「商品動画内製化SaaS」を構築する。商品画像とキャプションをアップロードするだけで、Wan 2.7 I2Vが商品を動かした15秒の動画を自動生成する。Runway・Pikaでも類似機能は存在するが、Wanのウェイトを将来的に自社ホスティングすれば1動画あたりのコストをAPI依存の5分の1以下に抑えられる可能性がある。ブランドのカラーパレット・トーンの制御はプロンプトテンプレートとLoRAファインチューニングで実装できる。

収益モデル：月額SaaS（$200〜$1,000/月/ブランド）。月間生成本数の上限でプランを分ける。GTMの最初の仮説はD2Cブランド（マーケティングチーム10〜30人規模）への直接営業。代理店への卸売モデルにも展開しやすい構造だ。

シナリオB：ゲームスタジオのプリビズ工程を自動化するB2Bツール（既存プロダクト置換型）

ベース実例：AtlasCloudがマーケティング映像制作チームへ提供しているWan 2.7の「first-and-last frame control」活用モデル。Artlistがコンテンツクリエイターのワークフロー自動化に活用しているモデル。

発展アイデア：ゲームスタジオの「プリビズ（事前映像化）」工程に特化したB2Bツールを構築する。プリビズとは撮影・開発前にシーンを映像で確認する工程で、現在はBlender・After Effects・専門スタッフが必要だ。Wan 2.7のI2VとThinking Modeを使えば、スクリプトと人物イラスト・背景コンセプトアートだけで10〜15秒単位のプリビズ動画を自動生成できる。3Dエンジンのモーションデータから生成したレファレンスフレームをWan 2.7に渡し、実写風の質感を持つプリビズを低コストで量産するパイプラインも想定される。

収益モデル：年間ライセンス（$10,000〜$100,000/年）。インディーゲームスタジオ（10〜50人）をPLGで取り込んでからAAAスタジオへ展開する。Wan 2.2のセルフホスティングで生成コストを固定費化し、プリビズ本数が増えても限界費用が低い収益構造をとれる。

シナリオC：データガバナンス要件を持つ組織向け「内部完結型AI動画基盤」（新カテゴリ創出型）

ベース実例：SegmindがHIPAA準拠が必要な医療コンテンツ制作へのオープンウェイト活用として言及するケース。Wan 2.2（Apache 2.0）がオンプレミスで動作することを活かした用途。

発展アイデア：医療・法律・金融・政府向けの「外部にデータを送らないAI動画生成基盤」をマネージドサービスとして提供する。現在のRunway/Kling/Veo 3.1はすべて外部APIのみで、プロンプトと生成物が外部サーバーを経由する。HIPAA（米医療情報保護法）やFINRAの観点では、患者情報・取引情報が含まれる可能性のある映像プロンプトを外部に送ることは規制リスクに直結する。Wan 2.2（現在オープンウェイト）をAWS VPCやオンプレミスGPUにデプロイするSaaS基盤を整備し、「コンプライアンスを満たす動画AI」として特定業界に展開する。Wan 2.7のウェイト公開次第、より高品質な映像での同サービスへ移行できる。

収益モデル：初期導入費（$50,000〜$200,000のデプロイコンサルティング）＋月次保守（$5,000〜$20,000）。最初のGTMは病院グループや大手法律事務所への直接提案。HIPAA・SOC2準拠オペレーターとしての認定が参入障壁になり、競合が少ない。

APIから試す最初の一歩

Wan 2.7は複数のAPIプラットフォームから利用できる。以下はTogether AI Python SDKを使った実装例だ。Together AI公式ページ（https://www.together.ai/models/wan-27）でモデルIDと最新パラメータ仕様を確認してから実行すること。

import time
from together import Together  # pip install together

client = Together(api_key="YOUR_TOGETHER_API_KEY")

# Wan 2.7 T2V：高ノイズ/低ノイズ2エキスパートのMoE構成
# 27B総パラメータ / 14Bアクティブパラメータ（推論時）
job = client.videos.create(
    model="Wan-AI/wan2.7-t2v",  # ※モデルIDは公式ドキュメントで確認
    prompt=(
        "A smartwatch slowly rotating on a display pedestal, "
        "soft studio lighting, product showcase, cinematic"
    ),
    seconds="10",        # 秒数: 2〜15の範囲
    resolution="1080P",  # "720p" or "1080P"
)
print(f"Generation started: job_id={job.id}")

# 完了をポーリング（通常2〜5分で完了）
while True:
    status = client.videos.retrieve(job.id)
    if status.status == "completed":
        print(f"Done: {status.output_url}")
        break
    elif status.status in ("failed", "error"):
        raise RuntimeError(f"Generation failed: {status.error}")
    time.sleep(10)

Wan 2.2（現在オープンウェイト）を手元で試したい場合は、公式GitHubリポジトリ（https://github.com/Wan-Video/Wan2.2）が出発点になる。VRAM 24GB（RTX 4090相当）でも動作するTI2V-5Bモデルバリアントが用意されており、ComfyUIとの連携も公式でサポートされている。

もっと詳しく知りたい人へ

公式リポジトリ・モデル

Wan 2.2 GitHub: https://github.com/Wan-Video/Wan2.2
Wan-AI HuggingFace: https://huggingface.co/Wan-AI
Wan 2.7 API（Together AI）: https://www.together.ai/models/wan-27

技術解説

DeepLearning.AI The Batch（Wan 2.2 MoEアーキテクチャ解説）: https://www.deeplearning.ai/the-batch/alibabas-wan-2-2-video-models-adopt-a-new-architecture-to-sort-noisy-from-less-noisy-inputs/
Vast.ai（Wan 2.2 技術解説）: https://vast.ai/article/wan-2-2-explained-new-approach-ai-video-generation

Wan 2.7の各機能解説

Segmind Blog（T2V/I2V/R2V/VideoEditの実用レビュー）: https://blog.segmind.com/wan-2-7-text-to-video-api-review-2026/
AtlasCloud Blog（Thinking Mode事例解説）: https://www.atlascloud.ai/blog/case-studies/beyond-text-to-image-how-wan-2-7s-new-thinking-mode-redefines-ai-composition

市場・競合文脈

TechCrunch（Sora廃止の背景）: https://techcrunch.com/2026/03/29/why-openai-really-shut-down-sora/
Modern Diplomacy（Wan 2.7 APIコスト分析）: https://moderndiplomacy.eu/2026/05/03/wan-2-7-text-to-video-api-balancing-high-fidelity-output-with-0-08-sec-efficiency/

最後に──「自前化」か「API依存」か、分かれ目はどこか

Wan 2.7が示しているのは「AI動画生成の最前線はクローズドAPIに限定されない」という可能性だ。MoEアーキテクチャで表現力と推論効率を両立し、Thinking Modeで複雑なシーンの一貫性を改善するというアプローチは、動画生成AIの設計の主流になりつつある。現時点ではWan 2.7の重みは非公開だが、Wan 2.1・2.2のオープンソース化という前例がある。2026年後半に予告されているWan 3.0（60B、4K、30秒生成）の動向も含め、「APIコストを払い続けるか、オープンウェイトで内製するか」という選択が、映像コンテンツ事業のインフラ判断として現実味を帯びてきている。

参考文献

OpenAI Help Center - What to know about the Sora discontinuation https://help.openai.com/en/articles/20001152-what-to-know-about-the-sora-discontinuation
TechCrunch - Why OpenAI really shut down Sora https://techcrunch.com/2026/03/29/why-openai-really-shut-down-sora/
Medium - OpenAI Sora Shutdown: $15M/Day Costs, $2.1M Revenue https://medium.com/@shubhamnv2/openai-sora-shutdown-15m-day-costs-2-1m-revenue-the-full-story-088380118243
Grand View Research - AI Video Generator Market Report https://www.grandviewresearch.com/industry-analysis/ai-video-generator-market-report
AutoFaceless - AI Video Generation Statistics 2026 https://autofaceless.ai/blog/ai-video-generation-statistics-2026
GitHub - Wan-Video/Wan2.2 https://github.com/Wan-Video/Wan2.2
DeepLearning.AI The Batch - Wan 2.2 MoEアーキテクチャ解説 https://www.deeplearning.ai/the-batch/alibabas-wan-2-2-video-models-adopt-a-new-architecture-to-sort-noisy-from-less-noisy-inputs/
Vast.ai - Wan 2.2 Explained https://vast.ai/article/wan-2-2-explained-new-approach-ai-video-generation
FinancialContent / ABNewswire - Alibaba Launches Wan 2.7 https://www.financialcontent.com/article/abnewswire-2026-4-6-alibaba-launches-wan-27-breakthrough-ai-image-and-video-generation-model-with-thinking-mode
tellers.ai - Wan 2.7 Has a Thinking Mode and Closed Weights https://tellers.ai/blog/wan_2_7_thinking_mode_ai_video_generation_2026-04-15.mdx/
Together AI - Wan 2.7 T2V API https://www.together.ai/models/wan-27
Segmind Blog - Wan 2.7 Text to Video is Now on Segmind https://blog.segmind.com/wan-2-7-text-to-video-on-segmind/
Segmind Blog - Wan 2.7 T2V API Review 2026 https://blog.segmind.com/wan-2-7-text-to-video-api-review-2026/
Segmind Blog - Wan 2.7 I2V Review 2026 https://blog.segmind.com/ai-image-to-video-api-wan-2-7-i2v-review-real-world-use-cases-2026/
AtlasCloud - Wan 2.7 API Collection https://www.atlascloud.ai/collections/wan2.7
AtlasCloud Blog - Wan 2.7 Video Model Is Live https://www.atlascloud.ai/blog/ai-updates/wan-2-7-video-model-is-live-on-atlas-cloud-edit-videos-like-documents-with-director-level-control
AtlasCloud Blog - Wan 2.7 Thinking Mode https://www.atlascloud.ai/blog/case-studies/beyond-text-to-image-how-wan-2-7s-new-thinking-mode-redefines-ai-composition
Artlist - Wan 2.6 for creators https://artlist.io/blog/new-wan-2-6/
Artlist - Wan 2.6 AI Video Generator https://artlist.io/ai/models/wan-2-6
flaq.ai - Is Wan 2.7 Open Source? https://flaq.ai/blog/detail/Is-Wan-2-7-Open-Source-API-Only-or-Platform-First-What-to-Expect-Next-f8a95542d6cc/
Modern Diplomacy - Wan 2.7 T2V API Cost Analysis https://moderndiplomacy.eu/2026/05/03/wan-2-7-text-to-video-api-balancing-high-fidelity-output-with-0-08-sec-efficiency/
RunwayML - Pricing https://runwayml.com/pricing
AtlasCloud Blog - Kling 3.0 Review https://www.atlascloud.ai/blog/guides/kling-3.0-review-features-pricing-ai-alternatives
Veo3AI - Veo 3 Pricing 2026 https://www.veo3ai.io/blog/veo-3-pricing-2026
fal.ai - Wan 2.7 https://fal.ai/wan-2.7
HuggingFace - Wan-AI organization https://huggingface.co/Wan-AI
WaveSpeed AI - WAN 2.7 vs WAN 2.6 https://wavespeed.ai/blog/posts/wan-2-7-vs-wan-2-6/
Flowith Blog - Wan 3.0 Open Source https://flowith.io/blog/wan-3-0-world-class-text-to-video-open-source-free-2026/
Spheron Blog - Image-to-Video on GPU Cloud https://www.spheron.network/blog/image-to-video-gpu-cloud-ltx-wan-hunyuan/
Hyperstack - Best Open Source Video Generation Models 2026 https://www.hyperstack.cloud/blog/case-study/best-open-source-video-generation-models
Together AI Blog - Wan 2.7 video model suite now available on Together AI https://www.together.ai/blog/wan-2-7-now-available-on-together-ai

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up