LLMをAndorid純正ターミナルで完全ローカルで動かす

Last updated at 2025-05-05Posted at 2025-05-04

最近Andoridで純正のLinuxターミナルが使えるようになりましたね。(現時点ではPixel限定らしいですけど。)

ということはLlama.cppも動くはずなのでやってみました。

実行環境

Andoridからコマンドを打つことになると思うので、コピペしやすくコマンド1個1個書いていきます。

なお、AndoridでLinuxターミナルを使えるようにするまでは他の人が解説していると思うので割愛します。

sudo apt update

sudo apt upgrade -y

sudo apt install -y wget git cmake g++ libcurl4-openssl-dev

git clone https://github.com/ggml-org/llama.cpp

cd llama.cpp

cmake -B build

cmake --build build --config Release

cd ..

今回はunslothが量子化したGemma-3-1b-itを使ってみます。軽いので。

wget https://huggingface.co/unsloth/gemma-3-1b-it-GGUF/resolve/main/gemma-3-1b-it-UD-IQ1_S.gguf

./llama.cpp/build/bin/llama-server -m gemma-3-1b-it-UD-IQ1_S.gguf

実行したあとに8080番ポートの開放の通知があるので開放する。

ブラウザアプリを起動して、以下のアドレスへアクセスする。

http://localhost:8080

開いたページでこんな感じでモデルとチャットができるようになります。

めちゃくちゃ遅いですし、応答内容もこんな感じですので使い物にならないですね。