前書き
手元でファイルサーバとして中古のDS916+を運用しています。
この環境で動作するLLMをChatGPT君に聞いてみました。
今回の記事の内容は検証していません。
冬休みの宿題にしています。
以下、ChatGPTの回答
了解しました。DS916+(Pentium N3710 / RAM 8GB / DSM 7.2)向けに「現実的に動く軽量LLM環境」を最適化して提案します。
結論から言うと、DS916+ なら「Docker(Container Manager)+ Ollama(3B〜7B量子化モデル)」が最も実用的です。
CPUは2016年世代でさほど強くないですが、量子化済みGGUFであれば十分動きます。
■ DS916+ でできること / 難しいこと
◎ できる(実用レベル)
- Docker コンテナで Ollama を動かす
- 3Bクラス(例:Qwen2.5-3B, Phi-3-mini)を十分実用レベルで動作
- 7B量子化モデルも「遅いけど動く」
- API を通じて PC・Teams・Slack から利用する
- OpenWebUI をつなげて「社内ミニGPT」構築可能
△ 動くが遅い
- 7B以上のモデル(Qwen2.5-7B, Llama3.1-8B など)
✕ ほぼ無理
- GPU アクセラレーション(NASにGPUが載らないため)
- 14B以上のモデル
- 長大 context(8GB RAM では厳しい)
■ 最適(おすすめ)構成
① Ollama(軽量LLMランタイム)を Docker で動かす
DS916+ は Docker 対応機種なので 最も安定的な選択肢です。
■ インストール手順(DS916+専用に最適化)
以下を DSM の GUI で進めます。
1. Container Manager(旧Docker)をインストール
DSM > パッケージセンター
→ Container Manager をインストール。
2. モデル保存用の共有フォルダを作る(任意)
例)AI_models
3. Ollama コンテナ起動(Docker GUI で設定)
使用イメージ
ollama/ollama:latest
ポート設定
ローカルポート 11434 → コンテナポート 11434
ボリューム設定
/opt/ollama → 共有フォルダ AI_models を割り当て
実行コマンド(環境変数 TAB で設定)
OLLAMA_HOST=0.0.0.0
これで NAS 内外からアクセス可能になります。
4. 正常動作確認
NAS の別PCから:
curl http://<NAS IP>:11434/api/tags
何らかのレスポンスが返れば起動成功です。
■ 使うべき軽量モデル(DS916+向け最適モデル)
CPU性能的に 3Bクラスが最も快適です。
★ 本当におすすめ(快適)
1. Qwen2.5-3B-Instruct(中国系モデル・高性能)
コマンド:
ollama run qwen2.5:3b-instruct
- 質問応答、要約、説明が得意
- 2025年現在の軽量モデルでトップ性能クラス
2. Phi-3-mini(Microsoft・高品質)
ollama run phi3:mini
- 日本語も結構強い
- CPUで速い
- 小規模QAに最適
★ 動くが少し遅い(用途限定)
3. Qwen2.5-7B-Instruct(中級以上の処理)
ollama run qwen2.5:7b-instruct-q4
- DS916+(2016年世代CPU)では 応答がゆっくり(数秒〜十数秒)
- 文章生成タスクなら耐えられる
■ OpenWebUI と連携すれば「社内GPT」になる
Ollama をバックエンドにして、WebUI を付けると ChatGPT 風画面で使えます。
OpenWebUI を Docker で同時に起動する
docker run -d \
-p 3000:8080 \
-e OLLAMA_API_BASE=http://<NAS IP>:11434 \
--name openwebui \
ghcr.io/open-webui/open-webui:latest
ブラウザから:
http://<NAS IP>:3000
→ ChatGPT風UIで利用可能(多ユーザーにも最適)
■ DS916+ の性能目安(実測に近い目安)
| モデル | 応答速度(token/s) | 評価 |
|---|---|---|
| Qwen2.5-3B-instruct | 5〜12 tok/s | 実用的 |
| Phi-3-mini | 6〜14 tok/s | 快適 |
| Qwen2.5-7B | 2〜5 tok/s | 遅いが使える |
| 8B〜14Bモデル | 1〜2 tok/s 以下 | 非推奨 |
NASのCPUはPCよりかなり低速のため、3Bモデルの使用が最適解です。
■ まとめ:DS916+ 向けの最適解
★ ベスト構成
- Ollama + Qwen2.5-3B-instruct または Phi-3-mini
- Dockerで簡単に動く
- 軽量でNASでもキビキビ
★ 拡張
- OpenWebUIで社内専用ChatGPT化
- APIをTeams、Slack BOTに連携可能