LLM・LLM活用 Advent Calendar 2025

DS916+で現実的に動く軽量LLM環境

Posted at 2025-12-16

前書き

手元でファイルサーバとして中古のDS916＋を運用しています。
この環境で動作するLLMをChatGPT君に聞いてみました。

今回の記事の内容は検証していません。
冬休みの宿題にしています。

以下、ChatGPTの回答

了解しました。DS916+（Pentium N3710 / RAM 8GB / DSM 7.2）向けに「現実的に動く軽量LLM環境」を最適化して提案します。

結論から言うと、DS916+ なら「Docker（Container Manager）＋ Ollama（3B〜7B量子化モデル）」が最も実用的です。
CPUは2016年世代でさほど強くないですが、量子化済みGGUFであれば十分動きます。

■ DS916+ でできること / 難しいこと

◎ できる（実用レベル）

Docker コンテナで Ollama を動かす
3Bクラス（例：Qwen2.5-3B, Phi-3-mini）を十分実用レベルで動作
7B量子化モデルも「遅いけど動く」
API を通じて PC・Teams・Slack から利用する
OpenWebUI をつなげて「社内ミニGPT」構築可能

△ 動くが遅い

7B以上のモデル（Qwen2.5-7B, Llama3.1-8B など）

✕ ほぼ無理

GPU アクセラレーション（NASにGPUが載らないため）
14B以上のモデル
長大 context（8GB RAM では厳しい）

■ 最適（おすすめ）構成

① Ollama（軽量LLMランタイム）を Docker で動かす

DS916+ は Docker 対応機種なので 最も安定的な選択肢です。

■ インストール手順（DS916+専用に最適化）

以下を DSM の GUI で進めます。

1. Container Manager（旧Docker）をインストール

DSM > パッケージセンター
→ Container Manager をインストール。

2. モデル保存用の共有フォルダを作る（任意）

例）AI_models

3. Ollama コンテナ起動（Docker GUI で設定）

使用イメージ

ollama/ollama:latest

ポート設定

ローカルポート 11434 → コンテナポート 11434

ボリューム設定

/opt/ollama  → 共有フォルダ AI_models を割り当て

実行コマンド（環境変数 TAB で設定）

OLLAMA_HOST=0.0.0.0

これで NAS 内外からアクセス可能になります。

4. 正常動作確認

NAS の別PCから：

curl http://<NAS IP>:11434/api/tags

何らかのレスポンスが返れば起動成功です。

■ 使うべき軽量モデル（DS916+向け最適モデル）

CPU性能的に 3Bクラスが最も快適です。

★ 本当におすすめ（快適）

1. Qwen2.5-3B-Instruct（中国系モデル・高性能）

コマンド：

ollama run qwen2.5:3b-instruct

質問応答、要約、説明が得意
2025年現在の軽量モデルでトップ性能クラス

2. Phi-3-mini（Microsoft・高品質）

ollama run phi3:mini

日本語も結構強い
CPUで速い
小規模QAに最適

★ 動くが少し遅い（用途限定）

3. Qwen2.5-7B-Instruct（中級以上の処理）

ollama run qwen2.5:7b-instruct-q4

DS916+（2016年世代CPU）では 応答がゆっくり（数秒〜十数秒）
文章生成タスクなら耐えられる

■ OpenWebUI と連携すれば「社内GPT」になる

Ollama をバックエンドにして、WebUI を付けると ChatGPT 風画面で使えます。

OpenWebUI を Docker で同時に起動する

docker run -d \
 -p 3000:8080 \
 -e OLLAMA_API_BASE=http://<NAS IP>:11434 \
 --name openwebui \
 ghcr.io/open-webui/open-webui:latest

ブラウザから：

http://<NAS IP>:3000

→ ChatGPT風UIで利用可能（多ユーザーにも最適）

■ DS916+ の性能目安（実測に近い目安）

モデル	応答速度（token/s）	評価
Qwen2.5-3B-instruct	5〜12 tok/s	実用的
Phi-3-mini	6〜14 tok/s	快適
Qwen2.5-7B	2〜5 tok/s	遅いが使える
8B〜14Bモデル	1〜2 tok/s 以下	非推奨

NASのCPUはPCよりかなり低速のため、3Bモデルの使用が最適解です。

■ まとめ：DS916+ 向けの最適解

★ ベスト構成

Ollama + Qwen2.5-3B-instruct または Phi-3-mini
Dockerで簡単に動く
軽量でNASでもキビキビ

★ 拡張

OpenWebUIで社内専用ChatGPT化
APIをTeams、Slack BOTに連携可能

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up