@deyama_WFH(Ruri Deyama)

初心者がOllamaをVSCodeにつなごうとして詰まった話

Last updated at 2026-06-17Posted at 2026-06-17

はじめに

前回、WindowsのデスクトップPCにOllamaを入れて、ローカルLLMを動かしてみました。

入れたモデルは以下です。

Qwen3.6:latest
Qwen3:8b
Gemma4:e4b

今回はその続きとして、OllamaをVSCodeから使えるようにすることに挑戦しました。

できれば、VSCodeの中でローカルLLMを使って、

コードの説明
READMEの整理
エラー文の解説
初心者向けの実装相談

ができるようにしたいと思っています。

結論から言うと、今回は ContinueというVSCode拡張を使ってOllama連携を試した のですが、モデル名の指定で少し詰まりました。

この記事は、同じように

Ollamaは入れたけど、VSCodeとのつなぎ方がよくわからない

という初心者向けの作業メモです。

使用環境

今回使ったPCは以下です。

項目	内容
OS	Windows11Home
CPU	Intel Core Ultra 7 265K 3.90GHz
メモリ	32GB
GPU	Intel(R) Graphics
GPUメモリ表示	共有GPUメモリ約17.9GB
エディタ	VSCode
ローカルLLM実行環境	Ollama

GPUについては、タスクマネージャー上でGPUメモリが約17.9GBと表示されていました。

ただしこれは、NVIDIA RTXなどの専用GPUに載っているVRAMではなく、メインメモリの一部をGPU用に共有しているものです。

そのため、今回の環境はざっくり言うと、

メモリ32GBのCPU / 内蔵GPUマシン

として考えるのがよさそうです。
詳しくは前の記事を見てね

すでにOllamaに入れていたモデル

今回、Ollamaには以下のモデルを入れていました。

ollama list

で確認します。

入れていたモデルは以下です。

qwen3.6:latest
qwen3:8b
gemma4:e4b

この中で、VSCode連携用にまず使おうと思ったのは qwen3:8b です。

理由は、前回試したときに

qwen3.6:latest は強そうだが重い
gemma4:e4b は軽め
qwen3:8b は日本語と開発相談のバランスが良さそう

と感じたからです。

まずVSCodeのターミナルからOllamaを確認

VSCodeを開いたら、まず内蔵ターミナルを開きます。

ターミナル
→ 新しいターミナル

そこで以下を実行します。

ollama list

ここでモデル一覧が表示されれば、VSCodeのターミナルからOllamaコマンドが使える状態です。

さらに、実際にターミナルからモデルを起動してみます。

ollama run qwen3:8b

これでチャットできれば、Ollama自体は正常に動いています。

終了するときは以下です。

/bye

または Ctrl + C で終了できます。

1回だけ質問したい場合

毎回チャットモードに入らなくても、ターミナルから1回だけ質問することもできます。

たとえば以下のように実行します。

ollama run qwen3:8b "Gitのブランチとは何か、初心者向けに説明して"

ちょっとした確認なら、VSCodeのターミナルだけで完結できるので便利です。

VSCodeから使うためにContinueを入れた

次に、VSCodeからOllamaを使うために Continue という拡張機能を入れました。

Continueは、VSCode上でAIチャットやコード編集補助ができる拡張機能です。

VSCodeの拡張機能から、

Continue

で検索してインストールしました。

Continueでチャットモデルを追加する

Continueを開くと、モデルを追加する画面が出ました。

設定画面では以下のように選びました。

Provider: Ollama
Model: qwen3

ProviderにOllamaが出ていたので、

お、これは簡単そう！

と思ったのですが、ここで詰まりました。

エラー：Model "qwen3" is not found in Ollama

Continueで qwen3 を選んだところ、以下のようなエラーが出ました。

Model "qwen3" is not found in Ollama. You need to install it.

最初は、

あれ？qwen3はもう入れたはずなのに？

と思いました。

でも原因はシンプルでした。

Ollamaに入っているモデル名は qwen3 ではなく、

qwen3:8b

だったのです。

原因：Ollamaのモデル名はタグまで含めて指定する必要がある

Ollamaでは、モデル名にタグがつきます。

たとえば以下です。

qwen3:8b
gemma4:e4b
qwen3.6:latest

Continue側で qwen3 とだけ指定すると、Ollamaの中にその名前のモデルが見つからず、エラーになります。

今回の場合、正しく指定するなら以下でした。

qwen3:8b

つまり、Continueに設定するモデル名は、ollama list に表示された NAME をそのまま使うのが安全です。

正しい確認方法

まずはVSCodeのターミナルで以下を実行します。

ollama list

表示された NAME を確認します。

例：

NAME                SIZE
qwen3.6:latest      ...
qwen3:8b            ...
gemma4:e4b          ...

この場合、Continueに設定するモデル名は以下です。

qwen3:8b

qwen3 だけではありません。

yamlファイルの設定を変えてしまう

おやおや、勝手にconfig.yamlファイルが出てきたではありませんか。
でてこなければ呼び出すまでです。

歯車マークを押すとこのconfig.yamlがVSCodeで勝手に開きます。

これをいじっていきます。

models:
 - name:qwen3
 - provider:ollama
 - model:qwen3
 - capabilities:
  - tool_use

から

models:
 - name:qwen3:8b
 - provider:ollama
 - model:qwen3.8b
 - capabilities:
  - tool_use

に直すことです。
要はyamlファイルの中身のmodels:のところがContinueで使うモデルで
それをWindowsに落としてきた正規のお名前に書き換える作業です。
name:は文字通りお名前です。おそらく表示名。
providerは文字通りプロバイダー
(この場合はOllamaでいいんです、codexを呼ぶとなるとここはOpenAIとかになります)
そして肝心の
model:使うモデルです。さっきOllama listで出した正式なものを入力。
これで保存しましょう。ついでにVSCodeごと再起動します。

↑こうなればおｋ

↑無事に左側でチャットができれば問題なし！

Continueの設定ファイルをバックアップした

作業中、Continueの画面で設定ファイルの保存に関する案内が出ていました。

今後、拡張機能の仕様が変わったり、別の環境に移行したりする可能性もあるため、念のため設定ファイルをバックアップしておくことにしました。

Windowsの場合、Continueの設定フォルダはだいたい以下にあります。

%USERPROFILE%\.continue

エクスプローラーのアドレスバーにこれを貼ると開けます。

%USERPROFILE%\.continue

中には、以下のようなファイルやフォルダがある場合があります。

config.yaml
config.json
rules
prompts
assistants

今回は、この .continue フォルダを丸ごとバックアップしました。

PowerShellでバックアップする方法

手動でコピーしてもいいですが、PowerShellなら以下でバックアップできます。

$src = "$env:USERPROFILE\.continue"
$dst = "$env:USERPROFILE\Documents\Continue_backup_$(Get-Date -Format yyyyMMdd_HHmmss)"
Copy-Item -Path $src -Destination $dst -Recurse -Force
Write-Host "Backup created at: $dst"

これで、ドキュメントフォルダに日時付きのバックアップが作られます。

Continue設定例

最終的には、Continueには以下のような形でOllamaのモデルを指定するのがよさそうです。

models:
  - name: Qwen3 8B Local
    provider: ollama
    model: qwen3:8b
    roles:
      - chat
      - edit
      - apply

  - name: Gemma4 e4b Local
    provider: ollama
    model: gemma4:e4b
    roles:
      - chat

  - name: Qwen3.6 Local
    provider: ollama
    model: qwen3.6:latest
    roles:
      - chat

ポイントはここです。

model: qwen3:8b

qwen3 だけではなく、qwen3:8b まで書きます。

ただし、重いモデルはVSCode常用には向かないかも

今回入れていたモデルのうち、qwen3.6:latest はかなり重めです。

前回の検証では、同じ質問への回答までに以下の時間がかかりました。

モデル	回答までの時間
Qwen3:8b	24秒
Gemma4:latest	34秒
Qwen3.6:latest	52〜98秒

qwen3.6:latest は回答内容はしっかりしている印象でしたが、VSCode上で頻繁に使うには少し待ち時間が長そうです。

開発中はテンポが大事なので、まずは qwen3:8b をメインで使うのがよさそうだと思いました。

VSCode連携に使うモデルの選び方

今回入れていたモデルの中では、VSCode連携には qwen3:8b が一番使いやすそうです。

モデル	VSCode用途での印象
qwen3:8b	普段使い候補。日本語と開発相談のバランスが良さそう
gemma4:e4b	軽め。短い質問や文章整理に良さそう
qwen3.6:latest	強そうだが重い。普段使いには待ち時間が長そう

重い相談や、じっくり考えさせたい内容は qwen3.6:latest。

普段のコード説明やREADME整理は qwen3:8b。

軽い質問や文章のたたき台は gemma4:e4b。

このように使い分けるのがよさそうです。

↑
Qwen3:8bでターミナルから会話してみた結果、CPUがグーンと使用されました。
ついでにファンがものすごい回ってます。
3:8bでこれなんだから、3.6:latestなんて回した日にはどうなるやら。

今回わかったこと

今回の作業でわかったことは以下です。

VSCodeのターミナルからOllamaは普通に使える
ollama list でモデル名を確認するのが大事
ContinueでOllamaを使うときは、モデル名を正確に書く必要がある
qwen3 ではなく qwen3:8b のようにタグまで含める
エラーが出ても、Ollama本体が壊れているとは限らない
Continueの設定ファイルはバックアップしておくと安心
VSCodeで常用するなら、重すぎるモデルより軽めのモデルのほうがよさそう

特に初心者は、モデル名の違いでかなり詰まりやすいと思いました。

今日のまとめ

今回は、OllamaをVSCodeに接続するためにContinueを入れてみました。

作業自体は難しすぎるものではありませんでしたが、モデル名の指定で詰まりました。

一番大事なのはこれです。

Continueには、ollama list に出てくるモデル名をそのまま指定する

今回の場合は、

qwen3

ではなく、

qwen3:8b

でした。

ローカルLLMをVSCodeから使えるようになると、今後は

コードの説明
エラー解説
READMEの整理
仕様書のたたき台
初心者向けの学習補助

に使えそうです。

次は、実際にVSCode上でコードを読ませたり、READMEを直してもらったりして、どこまで実用的に使えるか試していきたいと思います。

おまけ：今回使ったコマンドまとめ

Ollamaに入っているモデル一覧を見る。

ollama list

Qwen3:8bを起動する。

ollama run qwen3:8b

1回だけ質問する。

ollama run qwen3:8b "Gitのブランチとは何か、初心者向けに説明して"

チャットを終了する。

/bye

または Ctrl + C。

Continueの設定フォルダを開く。

%USERPROFILE%\.continue

PowerShellでContinue設定をバックアップする。

$src = "$env:USERPROFILE\.continue"
$dst = "$env:USERPROFILE\Documents\Continue_backup_$(Get-Date -Format yyyyMMdd_HHmmss)"
Copy-Item -Path $src -Destination $dst -Recurse -Force
Write-Host "Backup created at: $dst"

おわりに

ローカルLLMは、まだ初心者には少しわかりづらい部分もあります。
特に、モデル名やタグ、VSCode拡張との連携まわりは、最初にかなり迷いました。
ただ、一つずつ確認していけば、初心者でも十分試せる範囲だと感じました。

今回のポイントは、

まずは ollama list を見ること

です。
ここに出ているモデル名をそのまま使えば、Continue側のエラーもかなり減らせそうです。

次回は、VSCode上で実際にコードを読ませたり、ローカルLLMに修正案を出してもらったりして、実務にどこまで使えるか試してみたいと思います。

あとがき

ターミナルに恐怖心がない人はContinueなど入れずに直接ターミナルから

Ollama run qwen3:8b

などで呼び出してそのまま会話した方が早そうです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up