はじめに
前回、WindowsのデスクトップPCにOllamaを入れて、ローカルLLMを動かしてみました。
入れたモデルは以下です。
- Qwen3.6:latest
- Qwen3:8b
- Gemma4:e4b
今回はその続きとして、OllamaをVSCodeから使えるようにすることに挑戦しました。
できれば、VSCodeの中でローカルLLMを使って、
- コードの説明
- READMEの整理
- エラー文の解説
- 初心者向けの実装相談
ができるようにしたいと思っています。
結論から言うと、今回は ContinueというVSCode拡張を使ってOllama連携を試した のですが、モデル名の指定で少し詰まりました。
この記事は、同じように
Ollamaは入れたけど、VSCodeとのつなぎ方がよくわからない
という初心者向けの作業メモです。
使用環境
今回使ったPCは以下です。
| 項目 | 内容 |
|---|---|
| OS | Windows11Home |
| CPU | Intel Core Ultra 7 265K 3.90GHz |
| メモリ | 32GB |
| GPU | Intel(R) Graphics |
| GPUメモリ表示 | 共有GPUメモリ 約17.9GB |
| エディタ | VSCode |
| ローカルLLM実行環境 | Ollama |
GPUについては、タスクマネージャー上でGPUメモリが約17.9GBと表示されていました。
ただしこれは、NVIDIA RTXなどの専用GPUに載っているVRAMではなく、メインメモリの一部をGPU用に共有しているものです。
そのため、今回の環境はざっくり言うと、
メモリ32GBのCPU / 内蔵GPUマシン
として考えるのがよさそうです。
詳しくは前の記事を見てね
すでにOllamaに入れていたモデル
今回、Ollamaには以下のモデルを入れていました。
ollama list
で確認します。
入れていたモデルは以下です。
qwen3.6:latest
qwen3:8b
gemma4:e4b
この中で、VSCode連携用にまず使おうと思ったのは qwen3:8b です。
理由は、前回試したときに
-
qwen3.6:latestは強そうだが重い -
gemma4:e4bは軽め -
qwen3:8bは日本語と開発相談のバランスが良さそう
と感じたからです。
まずVSCodeのターミナルからOllamaを確認
VSCodeを開いたら、まず内蔵ターミナルを開きます。
ターミナル
→ 新しいターミナル
そこで以下を実行します。
ollama list
ここでモデル一覧が表示されれば、VSCodeのターミナルからOllamaコマンドが使える状態です。
さらに、実際にターミナルからモデルを起動してみます。
ollama run qwen3:8b
これでチャットできれば、Ollama自体は正常に動いています。
終了するときは以下です。
/bye
または Ctrl + C で終了できます。
1回だけ質問したい場合
毎回チャットモードに入らなくても、ターミナルから1回だけ質問することもできます。
たとえば以下のように実行します。
ollama run qwen3:8b "Gitのブランチとは何か、初心者向けに説明して"
ちょっとした確認なら、VSCodeのターミナルだけで完結できるので便利です。
VSCodeから使うためにContinueを入れた
次に、VSCodeからOllamaを使うために Continue という拡張機能を入れました。
Continueは、VSCode上でAIチャットやコード編集補助ができる拡張機能です。
VSCodeの拡張機能から、
Continue
で検索してインストールしました。
Continueでチャットモデルを追加する
Continueを開くと、モデルを追加する画面が出ました。
設定画面では以下のように選びました。
Provider: Ollama
Model: qwen3
ProviderにOllamaが出ていたので、
お、これは簡単そう!
と思ったのですが、ここで詰まりました。
エラー:Model "qwen3" is not found in Ollama
Continueで qwen3 を選んだところ、以下のようなエラーが出ました。
Model "qwen3" is not found in Ollama. You need to install it.
最初は、
あれ?qwen3はもう入れたはずなのに?
と思いました。
でも原因はシンプルでした。
Ollamaに入っているモデル名は qwen3 ではなく、
qwen3:8b
だったのです。
原因:Ollamaのモデル名はタグまで含めて指定する必要がある
Ollamaでは、モデル名にタグがつきます。
たとえば以下です。
qwen3:8b
gemma4:e4b
qwen3.6:latest
Continue側で qwen3 とだけ指定すると、Ollamaの中にその名前のモデルが見つからず、エラーになります。
今回の場合、正しく指定するなら以下でした。
qwen3:8b
つまり、Continueに設定するモデル名は、ollama list に表示された NAME をそのまま使うのが安全です。
正しい確認方法
まずはVSCodeのターミナルで以下を実行します。
ollama list
表示された NAME を確認します。
例:
NAME SIZE
qwen3.6:latest ...
qwen3:8b ...
gemma4:e4b ...
この場合、Continueに設定するモデル名は以下です。
qwen3:8b
qwen3 だけではありません。
yamlファイルの設定を変えてしまう
おやおや、勝手にconfig.yamlファイルが出てきたではありませんか。
でてこなければ呼び出すまでです。
歯車マークを押すとこのconfig.yamlがVSCodeで勝手に開きます。
これをいじっていきます。
models:
- name:qwen3
- provider:ollama
- model:qwen3
- capabilities:
- tool_use
から
models:
- name:qwen3:8b
- provider:ollama
- model:qwen3.8b
- capabilities:
- tool_use
に直すことです。
要はyamlファイルの中身のmodels:のところがContinueで使うモデルで
それをWindowsに落としてきた正規のお名前に書き換える作業です。
name:は文字通りお名前です。おそらく表示名。
providerは文字通りプロバイダー
(この場合はOllamaでいいんです、codexを呼ぶとなるとここはOpenAIとかになります)
そして肝心の
model:使うモデルです。さっきOllama listで出した正式なものを入力。
これで保存しましょう。ついでにVSCodeごと再起動します。
↑こうなればおk
↑無事に左側でチャットができれば問題なし!
Continueの設定ファイルをバックアップした
作業中、Continueの画面で設定ファイルの保存に関する案内が出ていました。
今後、拡張機能の仕様が変わったり、別の環境に移行したりする可能性もあるため、念のため設定ファイルをバックアップしておくことにしました。
Windowsの場合、Continueの設定フォルダはだいたい以下にあります。
%USERPROFILE%\.continue
エクスプローラーのアドレスバーにこれを貼ると開けます。
%USERPROFILE%\.continue
中には、以下のようなファイルやフォルダがある場合があります。
config.yaml
config.json
rules
prompts
assistants
今回は、この .continue フォルダを丸ごとバックアップしました。
PowerShellでバックアップする方法
手動でコピーしてもいいですが、PowerShellなら以下でバックアップできます。
$src = "$env:USERPROFILE\.continue"
$dst = "$env:USERPROFILE\Documents\Continue_backup_$(Get-Date -Format yyyyMMdd_HHmmss)"
Copy-Item -Path $src -Destination $dst -Recurse -Force
Write-Host "Backup created at: $dst"
これで、ドキュメントフォルダに日時付きのバックアップが作られます。
Continue設定例
最終的には、Continueには以下のような形でOllamaのモデルを指定するのがよさそうです。
models:
- name: Qwen3 8B Local
provider: ollama
model: qwen3:8b
roles:
- chat
- edit
- apply
- name: Gemma4 e4b Local
provider: ollama
model: gemma4:e4b
roles:
- chat
- name: Qwen3.6 Local
provider: ollama
model: qwen3.6:latest
roles:
- chat
ポイントはここです。
model: qwen3:8b
qwen3 だけではなく、qwen3:8b まで書きます。
ただし、重いモデルはVSCode常用には向かないかも
今回入れていたモデルのうち、qwen3.6:latest はかなり重めです。
前回の検証では、同じ質問への回答までに以下の時間がかかりました。
| モデル | 回答までの時間 |
|---|---|
| Qwen3:8b | 24秒 |
| Gemma4:latest | 34秒 |
| Qwen3.6:latest | 52〜98秒 |
qwen3.6:latest は回答内容はしっかりしている印象でしたが、VSCode上で頻繁に使うには少し待ち時間が長そうです。
開発中はテンポが大事なので、まずは qwen3:8b をメインで使うのがよさそうだと思いました。
VSCode連携に使うモデルの選び方
今回入れていたモデルの中では、VSCode連携には qwen3:8b が一番使いやすそうです。
| モデル | VSCode用途での印象 |
|---|---|
| qwen3:8b | 普段使い候補。日本語と開発相談のバランスが良さそう |
| gemma4:e4b | 軽め。短い質問や文章整理に良さそう |
| qwen3.6:latest | 強そうだが重い。普段使いには待ち時間が長そう |
重い相談や、じっくり考えさせたい内容は qwen3.6:latest。
普段のコード説明やREADME整理は qwen3:8b。
軽い質問や文章のたたき台は gemma4:e4b。
このように使い分けるのがよさそうです。
↑
Qwen3:8bでターミナルから会話してみた結果、CPUがグーンと使用されました。
ついでにファンがものすごい回ってます。
3:8bでこれなんだから、3.6:latestなんて回した日にはどうなるやら。
今回わかったこと
今回の作業でわかったことは以下です。
- VSCodeのターミナルからOllamaは普通に使える
-
ollama listでモデル名を確認するのが大事 - ContinueでOllamaを使うときは、モデル名を正確に書く必要がある
-
qwen3ではなくqwen3:8bのようにタグまで含める - エラーが出ても、Ollama本体が壊れているとは限らない
- Continueの設定ファイルはバックアップしておくと安心
- VSCodeで常用するなら、重すぎるモデルより軽めのモデルのほうがよさそう
特に初心者は、モデル名の違いでかなり詰まりやすいと思いました。
今日のまとめ
今回は、OllamaをVSCodeに接続するためにContinueを入れてみました。
作業自体は難しすぎるものではありませんでしたが、モデル名の指定で詰まりました。
一番大事なのはこれです。
Continueには、ollama list に出てくるモデル名をそのまま指定する
今回の場合は、
qwen3
ではなく、
qwen3:8b
でした。
ローカルLLMをVSCodeから使えるようになると、今後は
- コードの説明
- エラー解説
- READMEの整理
- 仕様書のたたき台
- 初心者向けの学習補助
に使えそうです。
次は、実際にVSCode上でコードを読ませたり、READMEを直してもらったりして、どこまで実用的に使えるか試していきたいと思います。
おまけ:今回使ったコマンドまとめ
Ollamaに入っているモデル一覧を見る。
ollama list
Qwen3:8bを起動する。
ollama run qwen3:8b
1回だけ質問する。
ollama run qwen3:8b "Gitのブランチとは何か、初心者向けに説明して"
チャットを終了する。
/bye
または Ctrl + C。
Continueの設定フォルダを開く。
%USERPROFILE%\.continue
PowerShellでContinue設定をバックアップする。
$src = "$env:USERPROFILE\.continue"
$dst = "$env:USERPROFILE\Documents\Continue_backup_$(Get-Date -Format yyyyMMdd_HHmmss)"
Copy-Item -Path $src -Destination $dst -Recurse -Force
Write-Host "Backup created at: $dst"
おわりに
ローカルLLMは、まだ初心者には少しわかりづらい部分もあります。
特に、モデル名やタグ、VSCode拡張との連携まわりは、最初にかなり迷いました。
ただ、一つずつ確認していけば、初心者でも十分試せる範囲だと感じました。
今回のポイントは、
まずは
ollama listを見ること
です。
ここに出ているモデル名をそのまま使えば、Continue側のエラーもかなり減らせそうです。
次回は、VSCode上で実際にコードを読ませたり、ローカルLLMに修正案を出してもらったりして、実務にどこまで使えるか試してみたいと思います。
あとがき
ターミナルに恐怖心がない人はContinueなど入れずに直接ターミナルから
Ollama run qwen3:8b
などで呼び出してそのまま会話した方が早そうです。








