はじめに
みなさん、IBM Videoというサイトをご存知でしょうか?
IBMが提供する製品をショート動画でわかりやすくご紹介している動画サイトです。
- スキルアップしたくてもなかなか時間が取れない
- 気になる製品があるけど、マニュアルを読んで理解するのはきつい
- 製品の特徴やメリットをクイックに知りたい
という方には、うってつけの動画を提供するサイトです。
興味のある方はぜひご覧いただければと思います。
今回ご紹介する動画へのリンク
概要
マルチモーダルモデルとは
- IBMの「Word Service」は、テキスト、画像、音声、動画など複数のデータ形式を扱うマルチモーダルモデルを提供。
- 大規模言語モデルだけでなく、複雑で直感的なソリューションを提供する点が特徴。
活用例とユースケース
- 製造業界:危険予測や異常検知。
- 金融業界:投資判断支援やリスク分析。
- 医療業界や建設業界:画像解析による予測や警告の発出。
利用方法
方法1:フロントラボを活用する方法
- チャット形式を選択。
- 画像をアップロード。
- 適切なモデルを選択。
- 質問や指示を入力。
方法2:APIによる活用
- サンプルアプリを使いAPI経由でモデルを呼び出す。
- 画像をアップロードして具体的な質問を入力すると、必要情報を抽出・回答。
高度な機能
- 推測機能:画像にない情報も生成AIが推測して危険性を予測し、警告を出す。
- 応用例:製造や医療分野でのリスク評価や診断補助など。
まとめ
- マルチモーダルモデルは多様な業界で活用でき、柔軟な運用方法が可能。
- リソースやAPIを活用することで、情報抽出や推測を通じた高度なソリューションが提供可能。
参考
watsonxでマルチモーダルモデルを使いましょう
文書や画像を使ったチャット
watsonx.ai での基盤モデルの選択
サンプルアプリケーション