はじめに
Mac上でGemma 4をローカル実行し、VSCode、Chrome、CLIから使う方法を整理しました。
特に「Geminiの利用制限を気にせず使いたい」「ローカルファイルを扱いたい」「機密情報を外に出したくない」という用途を想定しています。
この記事で扱うこと
- Gemma 4の特徴とGeminiとの違い。
- MacでのGemma 4インストール方法。
- VSCode、Chrome、CLIからの使い方。
- セキュリティ設定で見直したいポイント。
- MCP Serverの設定方法と、ローカルファイル操作の考え方。
Gemma 4とGeminiの位置づけ
Gemma 4は、ローカル実行やエッジ用途も意識したGoogleのオープンモデル群です。
一方でGeminiは、Googleのクラウドサービスとして提供される高機能なモデル群です。
ざっくり言うと、次のような住み分けになります。
- Gemma 4: 自分のMacで動かす、機密情報を扱う、オフラインでも使いたい。
- Gemini: 高性能なクラウドモデルをそのまま使いたい、Googleサービスとの統合を重視したい。
Gemma 4は小型モデルから大きめのモデルまであり、用途に応じて選べます。
Googleの公式説明では、2B/4Bは軽量用途、26B MoEは高スループット、31Bはローカルとサーバー級の中間に近い位置づけです。
Macでの基本セットアップ
MacでGemma 4を使う場合、最も扱いやすいのはOllamaです。
OllamaのmacOS向けドキュメントでは、MacOS Sonoma以降とApple Siliconが推奨されています。
1. Ollamaをインストール
brew install ollama
または公式サイトからインストーラを使っても構いません。
2. Ollamaを起動
ollama serve
常駐起動したい場合は、環境に応じてサービス化しておくと便利です。
Ollamaのモデルは ~/.ollama に保存されます。
3. Gemma 4を取得
ollama pull gemma4:e4b
軽量モデルを試したいなら、用途に応じて小さいモデルを選ぶのも良いです。
初回はモデルサイズによってダウンロード時間とストレージ消費が大きくなります。
4. 動作確認
ollama run gemma4:e4b
対話モードが開けば、ローカルでGemma 4が動いています。
CLIでの使い方
Gemma 4はCLIでも使えます。
Ollamaを使う場合は、ollama run でそのまま対話できます。
対話CLI
ollama run gemma4:e4b
APIとして使う
OllamaはローカルでOpenAI互換APIとして扱う構成もできます。
そのため、スクリプトや他ツールから http://127.0.0.1:11434/v1 を叩く運用が可能です。
CLI運用のメリットは、次の通りです。
- 余計なUIがいらない。
- 自動化しやすい。
- ローカル完結なので機密情報を扱いやすい。
VSCodeで使う
VSCodeでは、Continue 拡張を使ってGemma 4を接続する形が実用的です。
この構成にすると、コード補完、コード修正、選択範囲のリファクタリングをローカルで行えます。
1. Continue拡張をインストール
VSCode拡張マーケットプレイスから「Continue」を検索してインストールします。
2. Gemma 4を接続する設定
Continueサイドバーの歯車アイコン → Configs → Local Config を開き、以下のように編集します。
{
"models": [
{
"title": "Gemma 4",
"provider": "ollama",
"model": "gemma4:e4b"
}
]
}
保存後、モデル選択でGemma 4を選べるようになります。
3. 使い方の例
- コード選択 → Chat / Edit でその場で修正。
-
@でエージェント呼び出し。 - コード生成・選択範囲の説明・エラー箇所の修正案出し。
-
tabAutocompleteModelを追加設定すると、コード補完もGemma 4で高速化できます。
GeminiやCopilotの代替というより、「ローカルで回せる補助AI」として考えるのが自然です。
Chromeで使う
Chromeでは、Gemma 4対応の拡張を使うことで、ブラウザ内でローカルAIを活用できます。
記事要約やページ内容の読み取りなど、Web閲覧時の補助に向いています。
Chrome側での利点は、次の通りです。
- ブラウザ上の情報をそのまま扱いやすい。
- ローカルモデルならクラウド送信を避けやすい。
- ちょっとした調査や要約に向く。
Gemma 4は料金プランがあるのか
Gemma 4自体は、Geminiのような利用プランやクレジット制のサービスではありません。
ローカル実行する限り、課金は基本的に発生せず、必要なのは自分のMacの計算資源だけです。
ただし、Google AI StudioのようなクラウドAPI経由で使う場合は、別途APIの利用条件や制限があります。
したがって、完全に無料かどうかは「どこで動かすか」で変わります。
セキュリティで見直したい設定
Gemma 4をローカルで使う場合は、ネットワーク露出を最小化するのが重要です。
特にOllamaのホスト設定は、外部公開しないように注意したいポイントです。
Ollama
-
127.0.0.1で待ち受ける。 -
0.0.0.0で外部公開しない。 - macOSファイアウォールを有効にする。
-
~/.ollamaの権限を適切に保つ。
Antigravity
- 可能ならローカルモデル接続だけにする。
- Googleアカウント連携や送信系の設定を必要最低限にする。
- 機密コードを扱うときは、外部送信前提の機能を避ける。
VSCode / Chrome
- 拡張の権限を確認する。
- 必要以上のサイトアクセスやテレメトリを減らす。
- 機密プロジェクトではワークスペース単位で分離する。
MCP Serverの設定方法
MCP Serverは、Agent系ツール全般で外部機能を拡張するための仕組みです。
VSCodeでも、MCP対応の拡張や外部サーバーを組み合わせることで、ローカルモデルやファイル操作、検索パイプラインなどを統合できます。
代表的な設定方法
1. UI/拡張機能から追加する
MCP対応ツールには、MCP Server一覧や設定画面からサーバーを追加できるものがあります。
ファイルシステム系MCPやGit系MCPを追加すると、ローカルプロジェクトの扱いが楽になります。
2. 設定ファイルを直接編集する
MCP対応ツールでは、MCPサーバー定義をJSONで管理する構成が使われることがあります。
その場合は、mcpServers にサーバー定義を書き足します。
例: Filesystem系MCP
{
"mcpServers": {
"filesystem": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-filesystem"]
}
}
}
例: Ollama連携
{
"mcpServers": {
"ollama": {
"command": "npx",
"args": ["ollama-mcp-server"],
"env": {
"OLLAMA_HOST": "http://127.0.0.1:11434"
}
}
}
}
設定後は、ツールを再起動して認識を確認します。
ローカルファイルを横断編集できるのか
はい、できます。
エージェントIDEやMCP対応ツールでは、ワークスペース内のファイルを把握し、複数ファイルをまたいだ修正を提案・実行できます。
ただし、重要なのは「モデルが勝手に全部読む」のではなく、
エージェント側がワークスペースやMCP経由でアクセスを制御している点です。
できること
- ファイル一覧の把握。
- 依存関係の確認。
- 複数ファイルの一括修正。
- Git差分の確認と適用。
注意点
- 権限を広くしすぎない。
- 機密ファイルはワークスペースから分ける。
- いきなり全ファイル修正ではなく、段階的に適用する。
使い分けのおすすめ
普段の開発では、次のような使い分けが実用的です。
- Gemma 4: ローカルのコード補助、要約、機密情報を含む作業。
- Gemini: 高度な調査、Googleサービス連携、マルチモーダル処理。
- Agent系IDE: プロジェクト横断のエージェント作業。
- VSCode: 日々の編集作業。
- Chrome: 調査やページ要約。
まとめ
Gemma 4は、Mac上でローカルに動かせるのが大きな魅力です。
Ollamaを軸にすれば、CLI、VSCode、Chromeのどれにもつなげやすく、機密情報を扱う開発にも向いています。
一方で、VSCodeやChromeでの使い方は「どう接続するか」がポイントになります。
MCP ServerやローカルAPIを組み合わせると、Gemma 4をかなり実務的に運用できます。