UbuntuでOllamaを試してみよう

Last updated at 2025-04-25Posted at 2025-03-20

環境

OS: Ubuntu 24.04.2 LTS x86_64
CPU AMD Ryzen 7 5700X
GPU NVIDIA GeForce RTX 4060 (VRAM 8GB)
メモリ 32GB

素人ですので間違いはご了承ください

インストール

NVIDIAのドライバーのインストール

ubuntu-drivers devices

$ ubuntu-drivers devices
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
udevadm hwdb is deprecated. Use systemd-hwdb instead.
== /sys/devices/pci0000:00/0000:00:03.1/0000:2b:00.0 ==
modalias : pci:v000010DEd00002882sv0000196Esd000013F2bc03sc00i00
vendor   : NVIDIA Corporation
model    : AD107 [GeForce RTX 4060]
driver   : nvidia-driver-570-server - distro non-free
driver   : nvidia-driver-535-server - distro non-free
driver   : nvidia-driver-550 - distro non-free recommended
driver   : nvidia-driver-535 - distro non-free
driver   : nvidia-driver-535-server-open - distro non-free
driver   : nvidia-driver-550-open - distro non-free
driver   : nvidia-driver-570-server-open - distro non-free
driver   : nvidia-driver-535-open - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

recommendedのやつをダウンロードします。

sudo apt install nvidia-driver-550

途中でセキュアブートの設定が出てくるのでパスワードを設定する。
再起動したときに出でくるEnroll MOKでパスワードを入れる。

確認

nvidia-smi

$ nvidia-smi
Wed Mar 19 17:55:06 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.120                Driver Version: 550.120        CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4060        Off |   00000000:2B:00.0  On |                  N/A |
|  0%   32C    P8             N/A /  115W |     637MiB /   8188MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A      2220      G   /usr/lib/xorg/Xorg                            216MiB |
|    0   N/A  N/A      2504      G   /usr/bin/gnome-shell                           98MiB |
|    0   N/A  N/A      5170      G   ...irefox/5751/usr/lib/firefox/firefox        222MiB |
|    0   N/A  N/A      6566      G   ...erProcess --variations-seed-version         20MiB |
|    0   N/A  N/A      7617      G   ...erProcess --variations-seed-version         47MiB |
|    0   N/A  N/A    171921      G   /usr/bin/gnome-text-editor                     12MiB |
+-----------------------------------------------------------------------------------------+

Ollamaのインストール

curl -fsSL https://ollama.com/install.sh | sh

モデルのインストール

ollama run llama3.1:8b

$ ollama run llama3.1:8b  
pulling manifest 
pulling 667b0c1932bc... 100% ▕████████████████▏ 4.9 GB                         
pulling 948af2743fc7... 100% ▕████████████████▏ 1.5 KB                         
pulling 0ba8f0e314b4... 100% ▕████████████████▏  12 KB                         
pulling 56bb8bd477a5... 100% ▕████████████████▏   96 B                         
pulling 455f34728c9b... 100% ▕████████████████▏  487 B                         
verifying sha256 digest 
writing manifest 
success 
>>> こんにちは
こんにちは！どうですか？

Ctrl+Dまたは/exitで抜ける

モデルの探し方

Ollamaの公式サイトから検索して探します。

パラメーター数について

パラメーター数は4Bなど数字とB(billion)で表します。
パラメーター数が大きいほど性能が良くなる傾向にあり、それに伴いモデルの容量も増えます。
DeepSeek-R1:8bの場合、容量は4.9GBです。目安としてGPUで処理するためにはVRAM容量がモデルの容量よりも少し多いくらいが目安です。

Open WebUIのインストール

Dockerが入ってない人は入れてください。

Docker

docker pull ghcr.io/open-webui/open-webui:main
docker run -d -p 3000:8080 -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main

アクセスしてみる

そしたらサインアップしろと言われるのでします。
デザインはChatGPTみたいですね

試してみます

ちゃんと動きました

試してみる

文字の読み取り

画像から文字を読み取れるのは

deepseek coder-v2:16b
deepseek-coder:6.7b
deepseek-r1:8b
gemma3:4b
llama3.1:8b
qwen2.5-coder:7b
の中ではgemma3:4bだけでした



架空のアニメを生み出してしまいました。
何回か試したところ日本語を正しく読み取ることは難しいようです。

Web検索の設定

左下のアイコンから管理者パネル > 設定 > ウェブ検索 > ウェブ検索エンジンをduckduckgoにします
無料で使えるのはおそらく

duckduckgo
brave

のみだと思います。
正しいbraveはクレカを登録しないといけませんがduckduckgoは登録不要+apikey不要です。

モデルのテスト

各モデルのresponse_token/sを計ります
使用するモデル

deepseek coder-v2:16b
deepseek-coder:6.7b
deepseek-r1:8b
gemma3:4b
llama3.1:8b
qwen2.5-coder:7b

結果

小数は四捨五入しています

/	deepseek coder-v2:16b	deepseek-coder:6.7b	deepseek-r1:8b
一回目	34t/s	50t/s	41t/s
二回目	35t/s	51t/s	38t/s
三回目	34t/s	52t/s	39t/s
prompt token/s	109t/s	25166t/s	204t/s
最高 GPU使用率	70%	100%	100%
最高 CPU使用率	55%	変化なし	変化なし
最高VRAM 使用率	7325MB	5514MB	6862MB

/	gemma3:4b	llama3.1:8b	qwen2.5-coder:7b
一回目	63t/s	42t/s	43t/s
二回目	66t/s	39t/s	43t/s
三回目	67t/s	40t/s	43t/s
prompt token/s	212t/s	417t/s	350t/s
最高 GPU使用率	100%	100%	100%
最高 CPU使用率	変化なし	変化なし	変化なし
最高 VRAM使用率	5169MB	6711MB	5928MB

gemma3がすごい速さですね。

モデルの容量がVRAM容量を超すとGPUで処理しきれなくなり、CPUで処理し始めます。
また毎秒の応答速度も下がります

/	deepseek-r1:8b(4.9GB)	deepseek-r1:14b(9GB)
一回目	40t/s	9t/s
二回目	38t/s	9t/s
三回目	39t/s	9t/s
最高 GPU使用率	100%	35%
最高 CPU使用率	変化なし	90%
最高 VRAM使用率	6862MB	7354MB

どのくらいの比率かは

ollama ps

で確認できます

$ ollama ps
NAME                     ID              SIZE     PROCESSOR          UNTIL              
deepseek-coder-v2:16b    63fb193b3a9b    10 GB    29%/71% CPU/GPU    4 minutes from now

$ ollama ps
NAME         ID              SIZE      PROCESSOR    UNTIL              
gemma3:4b    c0494fe00251    6.7 GB    100% GPU     4 minutes from now

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up