1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

watsonx.aiのmistral-largeモデルの後継モデルを検討する

Posted at

はじめに

IBM Cloudのwatsonx.aiで提供されているMistral-Largeモデルが間もなく2025年10月8日に廃止されます。
代替モデルの検討を進める中で調査した内容をまとめておきます。
https://www.ibm.com/docs/ja/watsonx/saas?topic=model-foundation-lifecycle

現在利用しているMistral-Largeと代替候補モデルの比較

watsonx.aiをLangChainなどで利用していて、表示されるWarningメッセージに含まれる代替モデルはmistral-medium-2505です。
mistral-medium-2505と同じMistral系の小型モデル、それから最近watsonx.aiで利用可能になったを含め特徴を整理しました。
https://www.ibm.com/docs/ja/watsonx/saas?topic=solutions-supported-foundation-models
https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation

モデル名 APIモデルID プロバイダー 入力価格(USD/1,000トークン) 出力価格(USD/1,000 トークン) コンテキストウィンドウ(入力トークン+出力トークン) IBMドキュメント記載の注意及び制限 参照先URL
mistral-large mistralai/mistral-large Mistral AI $0.003 $0.01 131,072 この基盤モデルには、使用時間ごとに適用される追加アクセス料金がかかります。 https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-large
mistral-medium-2505 mistralai/mistral-medium-2505 Mistral AI $0.003 $0.010 131,072 mistral-medium-2505 は現在、チャットAPIによるツール呼び出しをサポートしていません。 https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-medium
mistral-small-3-1-24b-instruct-2503 mistralai/mistral-small-3-1-24b-instruct-2503 Mistral AI $0.0001 $0.0003 131,072 https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#mistral-small-3-1-24b-instruct-2503
gpt-oss-120b openai/gpt-oss-120b OpenAI $0.00015 $0.0006 131,072 gpt-ossはチャットAPIによるツールコールを完全にはサポートしていません。 https://www.ibm.com/docs/ja/watsonx/saas?topic=models-third-party-foundation#gpt-oss

各モデルごとの移行注意点

ChatGPTやPerplexyなどを利用して調べた情報をもとに留意点をまとめました。
参照した情報
https://arxiv.org/abs/2508.12461
https://blog.galaxy.ai/compare/gpt-oss-120b-vs-mistral-medium-3
https://www.rival.tips/compare/mistral-medium-3/gpt-oss-120b?utm_source=chatgpt.com

観点 Mistral-Large(現行・廃止予定) Mistral-Medium-2505(推奨後継) Mistral-Small-3-1-24B-Instruct-2503 GPT-OSS-120B(+20B)
性能 フラグシップ(Large 2世代)。長文理解・多言語・数理・コードに強い。コンテキスト 128k。 「Medium is the new Large」と位置付け。128k 長文対応、数理・コーディング強化、マルチモーダル(画像→テキスト)対応。Large に匹敵する性能を低コストで実現。 24B パラメータの軽量版。128k。推論力は Medium や Large に劣るが、要約や単純 QA に強い。 OpenAI 提供のオープンウェイト。120B/20B。長文・ツール利用に対応。研究やカスタマイズ性に優れるが、対話性能は Mistral Medium に劣る場面も。
**コスト(watsonx.ai 指標価格) ** Largeと同水準 大幅に低廉 Small より高く Medium より安い
watsonx.ai での注意点 2025-10-08 で撤去。以降は利用不可。 IBM Docs で推奨後継。長期サポート見込み。ただし提供地域やRU計算式は都度確認が必要。 コスト最適化には有効だが、出力の深みや正確性は落ちやすい。冗長な質問や複雑推論は不向き。 オープンウェイトのため 責任分界点が利用者側。出力ガード(PII/HAP 検出)はアプリ側で強化する必要あり。
移行留意点 / プロンプト考慮 現状のプロンプトは強い制約や分解指示を含むケースが多い。 互換性高(関数呼び出し / JSON 出力も同等)が、Large に比べ出力冗長性が減るため、system 文は簡潔化、最大出力長を明示指定推奨。 回答が簡潔すぎる場合あり。system 文で「根拠を示す」「詳細に説明」といった明示指定が必要。 出力のばらつきが大きくなる可能性あり。プロンプトで出力形式の厳格化(JSON schema / citations 必須など)を強める必要あり。

※RU計算式…RU(Request Unit)watsonx.ai の独自の課金単位。1000tokens = 1RU として換算する。
https://www.ibm.com/docs/ja/watsonx/saas?topic=integrations-billing-details-generative-ai-assets

移行観点まとめ

  • Mistral-Large → Medium-2505
    性能・コストともに最も近い。プロンプト互換性も高く、事実上の後継。ただし出力の冗長さや安全ガードの挙動に差異があるため、プロンプトの簡素化・最大出力長指定を再調整。
  • Mistral-Large → Small-24B
    大幅なコスト削減が可能。ただし複雑な推論・詳細説明力は低下。FAQ系や軽量検索回答用途に適合。
  • Mistral-Large → GPT-OSS-120B
     性能的には Medium に近いが、オープンウェイトゆえ責任分界・セキュリティ設計が必須。

まずはMistral-Medium-2505への移行シナリオを進めて、運用しつつSmallに切り替えられるかの検証なども進めていこうと思います。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?