Raspberry Pi 4でBonsaiを動かしたよ

Posted at 2026-04-05

こちらを見まして、二番煎じ記事でございます。

Bonsaiという新しいLLMで、1ビットモデルなんですって。

細かいことはよくわかりませんが、 Raspberry PiでLLMが動く というところに興味がありまして、やってみました。

環境

2026/4/5時点の価格で33,110円ですって
最近のメモリ価格の高騰を受け、めっちゃ値上がりしれますね。

私はラズパイ4が出た頃に買ったのですが、確か、1万円ちょっとだった気がします。

Bonsaiの1ビットってのは、標準のllama.cppでは対応していないようで、カスタマイズ版が提供されています。

x64向けにはビルド済みのバイナリがReleaseに用意されているのですが、Raspberry Pi 4のようなarm64向けは存在しないので、ビルドします。

手順はこんな感じでした。

ビルドに必要なものをインストール

sudo apt update
sudo apt install -y git cmake build-essential libopenblas-dev

カスタマイズ版llama.cppのソースを取得

git clone https://github.com/PrismML-Eng/llama.cpp
cd llama.cpp

ビルド

cmake -B build -DGGML_BLAS=ON -DGGML_BLAS_VENDOR=OpenBLAS
cmake --build build --config Release -j2

Hugging Faceで公開されてるBonsaiをダウンロードします。HF_HUB_CACHEを指定することでダウンロード先を指定します。

HF_HUB_CACHE="$PWD/cache_hf" uvx hf download prism-ml/Bonsai-1.7B-gguf

準備は整いましたので、実行しましょう。llama-cliを使います。

./build/bin/llama-cli \
  -m cache_hf/models--prism-ml--Bonsai-1.7B-gguf/snapshots/c89c1b5578286827264c4217f40edee617f4f904/Bonsai-1.7B.gguf

起動しました！

Raspberry Piへは、Raspberry Pi Connectを使用して接続しています。
今回初めて使ってみたのですが、リモートアクセスが超絶やりやすいです！

一応動きますが、生成される内容は、まぁ、見なかったことにしましょう。日本のことを聞いた私が悪いのです。

3.3トークン/秒で生成できているようです。

実行中のtopコマンドの結果はこんな感じです。CPUはフル回転ですがメモリには余裕があります。

動画も用意しましたので、お時間ある方はご覧ください。遅いなりに、頑張ってる感があります。