watsonx.aiのmistral-largeモデルの後継モデルを検討する

Posted at 2025-09-16

はじめに

IBM Cloudのwatsonx.aiで提供されているMistral-Largeモデルが間もなく2025年10月8日に廃止されます。
代替モデルの検討を進める中で調査した内容をまとめておきます。
https://www.ibm.com/docs/ja/watsonx/saas?topic=model-foundation-lifecycle

現在利用しているMistral-Largeと代替候補モデルの比較

watsonx.aiをLangChainなどで利用していて、表示されるWarningメッセージに含まれる代替モデルはmistral-medium-2505です。
mistral-medium-2505と同じMistral系の小型モデル、それから最近watsonx.aiで利用可能になったを含め特徴を整理しました。
https://www.ibm.com/docs/ja/watsonx/saas?topic=solutions-supported-foundation-models
https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation

モデル名	APIモデルID	プロバイダー	入力価格(USD/1,000トークン)	出力価格(USD/1,000 トークン)	コンテキストウィンドウ（入力トークン＋出力トークン）	IBMドキュメント記載の注意及び制限	参照先URL
mistral-large	mistralai/mistral-large	Mistral AI	$0.003	$0.01	131,072	この基盤モデルには、使用時間ごとに適用される追加アクセス料金がかかります。	https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-large
mistral-medium-2505	mistralai/mistral-medium-2505	Mistral AI	$0.003	$0.010	131,072	mistral-medium-2505 は現在、チャットAPIによるツール呼び出しをサポートしていません。	https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-medium
mistral-small-3-1-24b-instruct-2503	mistralai/mistral-small-3-1-24b-instruct-2503	Mistral AI	$0.0001	$0.0003	131,072		https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-small-3-1-24b-instruct-2503
gpt-oss-120b	openai/gpt-oss-120b	OpenAI	$0.00015	$0.0006	131,072	gpt-ossはチャットAPIによるツールコールを完全にはサポートしていません。	https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#gpt-oss

各モデルごとの移行注意点

ChatGPTやPerplexyなどを利用して調べた情報をもとに留意点をまとめました。
参照した情報
https://arxiv.org/abs/2508.12461
https://blog.galaxy.ai/compare/gpt-oss-120b-vs-mistral-medium-3
https://www.rival.tips/compare/mistral-medium-3/gpt-oss-120b?utm_source=chatgpt.com

観点	Mistral-Large（現行・廃止予定）	Mistral-Medium-2505（推奨後継）	Mistral-Small-3-1-24B-Instruct-2503	GPT-OSS-120B（+20B）
性能	フラグシップ（Large 2世代）。長文理解・多言語・数理・コードに強い。コンテキスト 128k。	「Medium is the new Large」と位置付け。128k 長文対応、数理・コーディング強化、マルチモーダル（画像→テキスト）対応。Large に匹敵する性能を低コストで実現。	24B パラメータの軽量版。128k。推論力は Medium や Large に劣るが、要約や単純 QA に強い。	OpenAI 提供のオープンウェイト。120B/20B。長文・ツール利用に対応。研究やカスタマイズ性に優れるが、対話性能は Mistral Medium に劣る場面も。
コスト（watsonx.ai 指標価格)		Largeと同水準	大幅に低廉	Small より高く Medium より安い
watsonx.ai での注意点	2025-10-08 で撤去。以降は利用不可。	IBM Docs で推奨後継。長期サポート見込み。ただし提供地域やRU計算式は都度確認が必要。	コスト最適化には有効だが、出力の深みや正確性は落ちやすい。冗長な質問や複雑推論は不向き。	オープンウェイトのため責任分界点が利用者側。出力ガード（PII/HAP 検出）はアプリ側で強化する必要あり。
移行留意点 / プロンプト考慮	現状のプロンプトは強い制約や分解指示を含むケースが多い。	互換性高（関数呼び出し / JSON 出力も同等）が、Large に比べ出力冗長性が減るため、system 文は簡潔化、最大出力長を明示指定推奨。	回答が簡潔すぎる場合あり。system 文で「根拠を示す」「詳細に説明」といった明示指定が必要。	出力のばらつきが大きくなる可能性あり。プロンプトで出力形式の厳格化（JSON schema / citations 必須など）を強める必要あり。

※RU計算式…RU（Request Unit）watsonx.ai の独自の課金単位。1000tokens = 1RU として換算する。
https://www.ibm.com/docs/ja/watsonx/saas?topic=integrations-billing-details-generative-ai-assets

移行観点まとめ

Mistral-Large → Medium-2505
性能・コストともに最も近い。プロンプト互換性も高く、事実上の後継。ただし出力の冗長さや安全ガードの挙動に差異があるため、プロンプトの簡素化・最大出力長指定を再調整。
Mistral-Large → Small-24B
大幅なコスト削減が可能。ただし複雑な推論・詳細説明力は低下。FAQ系や軽量検索回答用途に適合。
Mistral-Large → GPT-OSS-120B
　性能的には Medium に近いが、オープンウェイトゆえ責任分界・セキュリティ設計が必須。

まずはMistral-Medium-2505への移行シナリオを進めて、運用しつつSmallに切り替えられるかの検証なども進めていこうと思います。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up