0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

IBM Cloud VSI + Ollama で IBM Granite 4.0 Nanoシリーズのモデル性能を試してみた

0
Last updated at Posted at 2025-12-16

IBM Graniteシリーズに 「4.0 Nano」 が登場

2025年10月、IBMはエンタープライズ向けの高性能モデル「Granite 4.0」を発表しました。さらに、エッジやローカル環境でも動かせる小型モデル「4.0 Nano」がGraniteファミリーとして公開されました。
Granite 4.0 Nanoシリーズの日本語性能や、どの程度小さな構成で実行できるのかが気になったので、IBM Cloudの仮想サーバー上でOllamaを使って試してみました。

Granite 4.0 Nanoファミリー

  • Granite 4.0 H 1B:約15億のパラメーターを持つ高性能モデル。
  • Granite 4.0 H 350M:約3億5000万パラメータの超軽量モデル。
  • Granite 4.0 1B & 350M:上2つの代替。ハイブリッドアーキテクチャー非対応の環境向け

特長・ベンチマーク

Granite 4.0 Nanoモデルはすべて Apache 2.0ライセンスで提供されています。
また、ISO 42001(責任あるAI開発)の認証も取得しています。
リンク先のグラフでは、同規模モデルと比べて高いパフォーマンスを示しています。

IBM Cloud VSI + Ollama で IBM Granite 4.0 Nanoシリーズのモデル性能を試してみる

1. 環境の準備

手順① IBM Cloud VPCで 仮想サーバーを作成

今回は下記の構成で試しました。
軽量モデルの環境としても小規模な構成となっています。

  • OS:Ubuntu Linux
  • vCPU:4つ
  • メモリ:8GB

image.png

【参考リンク】

手順② 仮想サーバーに Ollama をインストール

VSIに rootユーザー としてログインした状態で、以下のコマンドを実行します。
$ curl -fsSL https://ollama.com/install.sh | sh

「GPUが検出されません」というメッセージは無視しても問題ありません。
WARNING: No NVIDIA/AMD GPU detected. Ollama will run in CPU-only mode.

正常にインストールされたことを確認するため、ollamaのバージョンを表示します。
$ ollama --version

出力例:
ollama version is 0.13.3

【ollamaのインストールについて補足】
root権限で実行
→ systemdのollama.serviceが作成され、Ollamaサーバーは OS起動時に自動起動
非rootユーザーで実行
→ systemctl で自動起動の設定と再起動が必要

【参考リンク】Granite Docs > Ollama on Linux

手順③ 使用するモデルの取得

現在取得済みのモデル一覧を表示
$ ollama list

取得済みのモデルが無い場合、空のリストが表示される
NAME ID SIZE MODIFIED

事前にモデルを取得する場合は pullコマンド
$ ollama pull ibm/granite4:350m

モデルの取得と実行を一括で行う場合は runコマンド
$ ollama run ibm/granite4:350m

取得済みのモデルを削除する時は rmコマンド
$ ollama rm ibm/granite4:350m

▼ granite4:350m-h をインストール
image.png

▼ インストール済のモデル一覧
image.png

モデルを指定しない場合は、以下のコマンドで推奨モデルをインストールできます
$ ollama pull granite4

2. Granite Nanoシリーズの各モデルと対話してみる

以下について調べてみました。

  1. サイズによるモデル性能の違い
  2. ハイブリッドアーキテクチャー対応・非対応によるモデル性能の違い
  3. 日本語タスクの精度
  4. タスクの実行速度

▼ Granite-4.0-H-1B とのチャット画面
image.png

Granite-4.0-H-1B(サイズ大きめ・Hアーキテクチャー対応)

自然な日本語で簡潔に回答してください。IBM Granite-4.0-H-1B の概要や特徴は何ですか?

IBM Granite-4.0-H-1B は、高性能な自然言語処理(NLP)モデルで、大規模なデータセットを用いて訓練されています。このモデルは、多様なテキストタスクにおいて優れた性能を発揮し、特に理解力と生成能力が高く評価されています。以下のような特徴があります。

  1. 大規模トレーニング: 多数のデータセットから学習を行い、多様な言語や文脈に対する理解力を高めています
  2. 自然な生成能力: 文法的に正確でありながら、自然な表現を用いることができます
  3. 多様なタスクへの適応性: 質問応答、翻訳、要約、分析など、さまざまな自然言語処理タスクに対応可能です
  4. ハイパフォーマンス: 高速な計算をサポートし、リアルタイムでの使用が可能です
    これらの特徴により、IBM Granite-4.0-H-1Bは多くの産業や研究分野で活用されています。

次の文章を正確に日本語訳してください。(出典
Today we are excited to share Granite 4.0 Nano, our smallest models yet, released as part of IBM's Granite 4.0 model family. Designed for the edge and on-device applications, these models demonstrate excellent performance for their size and represent IBM's continued commitment to develop powerful, useful, models that don't require hundreds of billions of parameters to get the job done.

今日、私たちは「Granic 4.0 Nano」という最小限のモデルを発表いたします。これはIBMのGranite 4.0モデルファミリの一部です。エッジ環境やオンデバイスアプリケーションに適しており、そのサイズにもかかわらず高い性能を発揮します。IBMは、数千億のパラメータではなくても効果的で実用的なモデルを開発するという取り組みにおいて、さらにそのコミットメントを示しています。

日本語訳した文章をIT初心者向けにわかりやすく要約してください。

IBMは「Granic 4.0 Nano」という小さなモデルを発表しました。これらのモデルは、エッジ環境やオンデバイスで使えるように設計されています。サイズが小さいため、どこでも活用でき、効率的な性能を発揮します。IBMは、数千億のパラメータではなくても、多様なタスクに必要な高い性能を持つモデルを開発することに力を入れています。

Granite-4.0-1B(サイズ大きめ・Hアーキテクチャー非対応)

自然な日本語で簡潔に回答してください。IBM Granite-4.0-1B の概要や特徴は何ですか?

IBMのGranite-4.0-1Bは、最新の大規模言語モデルで、1億のパラメータを持つことで高度な自然言語処理能力を実現しています。このモデルは、複雑な質問に対する正確な回答や、多様なタスクにおける人間のような理解力を持っています。また、IBMは技術革新を継続し、AIの進化を支えることで、社会全体の利益に貢献しています。

次の文章を正確に日本語訳してください。

今日、私たちはIBMのGranite 4.0モデルファミリーの一部としてリリースされた、最小サイズのModelNanoを共有します。これらのモデルはエッジやオンデバイスアプ

追加指示:全文を日本語訳してください。

今日、私たちはIBMのGranite 4.0モデルファミリーの一部として、最小サイズのModelNanoをリリースします。これらのモデルはエッジやオンデバイスアプ

(途中で止まったため以下省略)

Granite-4.0-H-350M(サイズ小さめ・Hアーキテクチャー対応)

自然な日本語で簡潔に回答してください。IBM Granite-4.0-H-350M の概要や特徴は何ですか?

IBM Granite-4.0-H-350M は、その高度な精度とスループットのために開発された大規模なトランザクションモデルです。この機器は、2022年に公式にリリースされました。特徴としては、以下の点が挙げられます:

  1. 高度な精度: IBM Granite-4.0-H-350M は、トランザクションモデル全体のパラメータを最適化することで、複雑なビジネスプロセスや機会価値を効率的に処理します。
  2. 高いスループット: このレンディオは、大規模なトランザクション数を扱うための強力なモデルであり、非常に高速かつ効率的です。
  3. 多様なパラメータ: 5,000語以上と1500特徴量が採用されており、最適化されたトランザクションモデルの設計により、さまざまなビジネス状況で高い性能を発揮します。
  4. 安全性と信頼性: IBM Granite-4.0-H-350M は、強固なセキュリティ機能を備えており、トランザクションの盗聴や不正アクセスに対しても高い信頼性を提供します。
  5. モニタリングと適応: 次世代機器であるIBM Granite-4.0-H-400M に伴い、パラメータの調整や最適化が可能となり、より高度な性能を実現します。
    これらの特徴により、IBM Granite-4.0-H-350M は大規模なトランザクションモデルであり、企業や研究機関にとって重要な支援ツールとなっています。

次の文章を正確に日本語訳してください。

今、IBMのIBM Granite-4.0系モデルファンクショナルにおいて、機能的なプロセスとして設計された小型モデルが発表されました。これらのモデルは、弱さから大規模に分かれるほどのサイズであり、お客様を対象とした非常に高いパフォーマンスを提供します。この小型化により、多くの産業や研究機関で広く利用可能です。

日本語訳した文章をIT初心者向けにわかりやすく要約してください。

今、IBMが発表した機能的なプロセスとして設計された小型モデルは、弱さから大規模に分かれるほどです。これらのモデルは、お客様を対象とする非常に高いパフォーマンスを提供し、お客様が日常的な活動やプロジェクトで利用できるように設計されています。

Granite-4.0-350M(サイズ小さめ・Hアーキテクチャー非対応)

自然な日本語で簡潔に回答してください。IBM Granite-4.0-350M の概要や特徴は何ですか?

IBM Granite-4.0-350M は、自動遊歩システムとなる大規模AIモデルで、その特性には以下のものがあります。

  1. 大きさ: IBM Granite-4.0-350M の最大サイズは350 Mで、これはIBM Granite-2.3-125B/6.5-10Tと同様です。
  2. 言語理解能力: このモデルは、テキストからの情報を効率的に処理し、理解する能力が高い設定とされています。また、多言語対応も可能です。
  3. カタカナ制御: IBM Granite-4.0-350M は、IBM Granite-2.3-125B/6.5-10Tのような大規模AIモデルと同様に、キャプション形式での情報を処理します。
  4. データソース: IBM Granite-4.0-350M は、Google DeepMind Open Graph API を利用しているため、Google Cloud Platform を使用することができます。これにより、多くのデータから学習されます。
  5. 言語理解: IBM Granite-4.0-350M は、その能力を最大限に活用しているため、英語や日本語などの多言語と同様の学習が可能です。
    IBM Granite-4.0-350M の特徴は、それぞれの設定によって大きく異なります。これらのモデルを活用することで、多くの機能的なAIタスクや自動遊歩システムとして提供されています。

次の文章を正確に日本語訳してください。

IBM Granite 4.0 Nano プロジェクトは、その最小サイズのものとしてリリースされました。今回開発されたこの模型は、アプリケーションを運用する上で効率的なデバイスにおける標準化されたモデルです。IBM Granite 4.0 model family の中でも、これらの最小サイズのモデルは、大量のパラメータを消費しない能力を持っています。IBM Granite 4.0 Nano プロジェクトは、AI技術の進化において重要な役割を果たしていると言えます。

日本語訳した文章をIT初心者向けにわかりやすく要約してください。

IBM Granite 4.0 Nanoは、最小サイズのAIモデルです。これらのモデルは、アプリケーションを運用するために効率的なデバイスで利用されており、大量のパラメータを消費しない能力が特徴です。IBM Granite 4.0 model family の中で、これらの最小サイズモデルはAI技術の進化にも大きく寄与しています。

各モデルを使ってみた印象

Granite-4.0-H-1B
反応はややゆっくりだが、日本語表現は最も自然
長めの文章作成に向いているかも?

Granite-4.0-1B
反応速度はH-1Bとほぼ同じ
翻訳タスクでは、途中で処理が止まってしまった

Granite-4.0-H-350M
1Bモデルと比べて動作が軽く、サクサク実行できる
日本語表現はやや不自然なところがある

Granite-4.0-350M
動作はH-350Mと同じくらい速い
日本語の要約が予想以上にうまくできた

まとめ

vCPU 4、メモリ 8GB というかなり小さな構成でも、特に問題なく動作しました。
汎用的な大規模モデルの代わりとして使うのは難しそうですが、社内での検証や勉強用、特定のタスクに絞った使い方であれば、十分実用的で、コストを抑えて使えると感じました。

次はGUIの導入や、RAGを使った社内文書の探索を試してみたいと思います。

参考リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?