はじめに
IBM Cloudのwatsonx.aiで提供されているMistral-Largeモデルが間もなく2025年10月8日に廃止されます。
代替モデルの検討を進める中で調査した内容をまとめておきます。
https://www.ibm.com/docs/ja/watsonx/saas?topic=model-foundation-lifecycle
現在利用しているMistral-Largeと代替候補モデルの比較
watsonx.aiをLangChainなどで利用していて、表示されるWarningメッセージに含まれる代替モデルはmistral-medium-2505です。
mistral-medium-2505と同じMistral系の小型モデル、それから最近watsonx.aiで利用可能になったを含め特徴を整理しました。
https://www.ibm.com/docs/ja/watsonx/saas?topic=solutions-supported-foundation-models
https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation
モデル名 | APIモデルID | プロバイダー | 入力価格(USD/1,000トークン) | 出力価格(USD/1,000 トークン) | コンテキストウィンドウ(入力トークン+出力トークン) | IBMドキュメント記載の注意及び制限 | 参照先URL |
---|---|---|---|---|---|---|---|
mistral-large | mistralai/mistral-large | Mistral AI | $0.003 | $0.01 | 131,072 | この基盤モデルには、使用時間ごとに適用される追加アクセス料金がかかります。 | https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-large |
mistral-medium-2505 | mistralai/mistral-medium-2505 | Mistral AI | $0.003 | $0.010 | 131,072 | mistral-medium-2505 は現在、チャットAPIによるツール呼び出しをサポートしていません。 | https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-medium |
mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 | Mistral AI | $0.0001 | $0.0003 | 131,072 | https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-small-3-1-24b-instruct-2503 | |
gpt-oss-120b | openai/gpt-oss-120b | OpenAI | $0.00015 | $0.0006 | 131,072 | gpt-ossはチャットAPIによるツールコールを完全にはサポートしていません。 | https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#gpt-oss |
各モデルごとの移行注意点
ChatGPTやPerplexyなどを利用して調べた情報をもとに留意点をまとめました。
参照した情報
https://arxiv.org/abs/2508.12461
https://blog.galaxy.ai/compare/gpt-oss-120b-vs-mistral-medium-3
https://www.rival.tips/compare/mistral-medium-3/gpt-oss-120b?utm_source=chatgpt.com
観点 | Mistral-Large(現行・廃止予定) | Mistral-Medium-2505(推奨後継) | Mistral-Small-3-1-24B-Instruct-2503 | GPT-OSS-120B(+20B) |
---|---|---|---|---|
性能 | フラグシップ(Large 2世代)。長文理解・多言語・数理・コードに強い。コンテキスト 128k。 | 「Medium is the new Large」と位置付け。128k 長文対応、数理・コーディング強化、マルチモーダル(画像→テキスト)対応。Large に匹敵する性能を低コストで実現。 | 24B パラメータの軽量版。128k。推論力は Medium や Large に劣るが、要約や単純 QA に強い。 | OpenAI 提供のオープンウェイト。120B/20B。長文・ツール利用に対応。研究やカスタマイズ性に優れるが、対話性能は Mistral Medium に劣る場面も。 |
**コスト(watsonx.ai 指標価格) ** | Largeと同水準 | 大幅に低廉 | Small より高く Medium より安い | |
watsonx.ai での注意点 | 2025-10-08 で撤去。以降は利用不可。 | IBM Docs で推奨後継。長期サポート見込み。ただし提供地域やRU計算式は都度確認が必要。 | コスト最適化には有効だが、出力の深みや正確性は落ちやすい。冗長な質問や複雑推論は不向き。 | オープンウェイトのため 責任分界点が利用者側。出力ガード(PII/HAP 検出)はアプリ側で強化する必要あり。 |
移行留意点 / プロンプト考慮 | 現状のプロンプトは強い制約や分解指示を含むケースが多い。 | 互換性高(関数呼び出し / JSON 出力も同等)が、Large に比べ出力冗長性が減るため、system 文は簡潔化、最大出力長を明示指定推奨。 | 回答が簡潔すぎる場合あり。system 文で「根拠を示す」「詳細に説明」といった明示指定が必要。 | 出力のばらつきが大きくなる可能性あり。プロンプトで出力形式の厳格化(JSON schema / citations 必須など)を強める必要あり。 |
※RU計算式…RU(Request Unit)watsonx.ai の独自の課金単位。1000tokens = 1RU として換算する。
https://www.ibm.com/docs/ja/watsonx/saas?topic=integrations-billing-details-generative-ai-assets
移行観点まとめ
- Mistral-Large → Medium-2505
性能・コストともに最も近い。プロンプト互換性も高く、事実上の後継。ただし出力の冗長さや安全ガードの挙動に差異があるため、プロンプトの簡素化・最大出力長指定を再調整。 - Mistral-Large → Small-24B
大幅なコスト削減が可能。ただし複雑な推論・詳細説明力は低下。FAQ系や軽量検索回答用途に適合。 - Mistral-Large → GPT-OSS-120B
性能的には Medium に近いが、オープンウェイトゆえ責任分界・セキュリティ設計が必須。
まずはMistral-Medium-2505への移行シナリオを進めて、運用しつつSmallに切り替えられるかの検証なども進めていこうと思います。