Ollamaを使ったLlama3.1、Llama3.1の使用感(GPU：RTX 3060程度)

Last updated at 2024-09-19Posted at 2024-09-19

はじめに

本記事では、Ollamaを使用してLlama3.1モデルを実行し、RTX 3060程度のGPUでの使用感を紹介します。

Ollamaは以下のコマンドで簡単にインストールできます：

curl -fsSL https://ollama.com/install.sh | sh

詳細はOllamaのGitHubをご覧ください。

インストール後、以下のコマンドでモデルを実行します：

ollama run モデル名

初回実行時、モデルが自動的にダウンロードされます。

エラー(Could not connect to ollama app, is it runnning?)が発生した場合は、以下の手順を試してください：

RTX 3060クラスのGPUでは、処理速度の観点からllama3.1 8bの使用がいいと思います。

ollama run llama3.1:8b-instruct-q3_K_S

このモデルは3.7GBで、即時応答が可能でした。