1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

DS916+で現実的に動く軽量LLM環境

1
Posted at

前書き

手元でファイルサーバとして中古のDS916+を運用しています。
この環境で動作するLLMをChatGPT君に聞いてみました。

今回の記事の内容は検証していません。
冬休みの宿題にしています。

以下、ChatGPTの回答

了解しました。DS916+(Pentium N3710 / RAM 8GB / DSM 7.2)向けに「現実的に動く軽量LLM環境」を最適化して提案します。

結論から言うと、DS916+ なら「Docker(Container Manager)+ Ollama(3B〜7B量子化モデル)」が最も実用的です。
CPUは2016年世代でさほど強くないですが、量子化済みGGUFであれば十分動きます。


■ DS916+ でできること / 難しいこと

できる(実用レベル)

  • Docker コンテナで Ollama を動かす
  • 3Bクラス(例:Qwen2.5-3B, Phi-3-mini)を十分実用レベルで動作
  • 7B量子化モデルも「遅いけど動く」
  • API を通じて PC・Teams・Slack から利用する
  • OpenWebUI をつなげて「社内ミニGPT」構築可能

動くが遅い

  • 7B以上のモデル(Qwen2.5-7B, Llama3.1-8B など)

ほぼ無理

  • GPU アクセラレーション(NASにGPUが載らないため)
  • 14B以上のモデル
  • 長大 context(8GB RAM では厳しい)

■ 最適(おすすめ)構成

Ollama(軽量LLMランタイム)を Docker で動かす

DS916+ は Docker 対応機種なので 最も安定的な選択肢です。


■ インストール手順(DS916+専用に最適化)

以下を DSM の GUI で進めます。


1. Container Manager(旧Docker)をインストール

DSM > パッケージセンター
Container Manager をインストール。


2. モデル保存用の共有フォルダを作る(任意)

例)AI_models


3. Ollama コンテナ起動(Docker GUI で設定)

使用イメージ

ollama/ollama:latest

ポート設定

ローカルポート 11434 → コンテナポート 11434

ボリューム設定

/opt/ollama  → 共有フォルダ AI_models を割り当て

実行コマンド(環境変数 TAB で設定)

OLLAMA_HOST=0.0.0.0

これで NAS 内外からアクセス可能になります。


4. 正常動作確認

NAS の別PCから:

curl http://<NAS IP>:11434/api/tags

何らかのレスポンスが返れば起動成功です。


■ 使うべき軽量モデル(DS916+向け最適モデル)

CPU性能的に 3Bクラスが最も快適です。


★ 本当におすすめ(快適)

1. Qwen2.5-3B-Instruct(中国系モデル・高性能)

コマンド:

ollama run qwen2.5:3b-instruct
  • 質問応答、要約、説明が得意
  • 2025年現在の軽量モデルでトップ性能クラス

2. Phi-3-mini(Microsoft・高品質)

ollama run phi3:mini
  • 日本語も結構強い
  • CPUで速い
  • 小規模QAに最適

★ 動くが少し遅い(用途限定)

3. Qwen2.5-7B-Instruct(中級以上の処理)

ollama run qwen2.5:7b-instruct-q4
  • DS916+(2016年世代CPU)では 応答がゆっくり(数秒〜十数秒)
  • 文章生成タスクなら耐えられる

■ OpenWebUI と連携すれば「社内GPT」になる

Ollama をバックエンドにして、WebUI を付けると ChatGPT 風画面で使えます。

OpenWebUI を Docker で同時に起動する

docker run -d \
 -p 3000:8080 \
 -e OLLAMA_API_BASE=http://<NAS IP>:11434 \
 --name openwebui \
 ghcr.io/open-webui/open-webui:latest

ブラウザから:

http://<NAS IP>:3000

→ ChatGPT風UIで利用可能(多ユーザーにも最適)


■ DS916+ の性能目安(実測に近い目安)

モデル 応答速度(token/s) 評価
Qwen2.5-3B-instruct 5〜12 tok/s 実用的
Phi-3-mini 6〜14 tok/s 快適
Qwen2.5-7B 2〜5 tok/s 遅いが使える
8B〜14Bモデル 1〜2 tok/s 以下 非推奨

NASのCPUはPCよりかなり低速のため、3Bモデルの使用が最適解です。


■ まとめ:DS916+ 向けの最適解

★ ベスト構成

  • Ollama + Qwen2.5-3B-instruct または Phi-3-mini
  • Dockerで簡単に動く
  • 軽量でNASでもキビキビ

★ 拡張

  • OpenWebUIで社内専用ChatGPT化
  • APIをTeams、Slack BOTに連携可能

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?