VS CodeにContinueを使ってローカルLLMに接続する

Posted at 2026-05-02

タイトル通り、ローカルLLMをどうやってVS Codeで使うんだ？という試みです。
いろいろ調べたところ、VS Codeの拡張機能であるContinueを使えばよいことは分かったものの、どうやら最近設定方法がJSONファイルからYamlファイルに変わったようで、すごく苦労しました。

自分用のメモと同じく戸惑った方のために書き留めます。
めちゃくちゃ初心者の記事なのでご勘弁を。

LM Studioを導入

こちらも参考になる記事はすでにたくさんありますが。本体はこちらからダウンロードします。

モデルをダウンロードする

起動ができたら画面左端のロボットアイコンをクリックします。
いろいろなモデルが一覧表示されるので、選択して「Download」をクリックするだけです。

ローカルLLMなので、欲張って大きなモデルを使うと重すぎます。
あらかじめChat-GPTやCopilotなどで自分のPCの型番などを伝えて、どのモデルが適切か相談しておくとよいでしょう。

モデルを選んでサーバ起動する

今度は画面左端の上から２つ目（ターミナルのようなアイコン）をクリックして、先ほどダウンロードしたモデルのうちどれを使うかを選択します。

画面右上の「+ Load Model」をクリックします。ダウンロード済みのモデル一覧が現れるので、一つ選択します。

モデルのロードができたら、画面上部の「Status」と表示があるトグルをONにします。ステータスはRunningになって、127.0.0.1:1234　というローカルエンドポイントが表示されるのでコピーします。

VS CodeにContinueをインストールする

こんどはVisual Studio Codeに拡張機能 Continueをインストールします。
初期状態では選択できるモデルがありません。

実はここで苦労しました。　+Add Chat model　をクリックすると下のような画面に。
今回はローカルLLMをつかうので、一番下のほうにある「This will update your config file」という部分の小さいリンクをクリックします。

すると、config.yaml ファイルが開きます。
この部分、ちょっと前まで設定ファイルがJSONだったようです。

name: Local LM Studio Config
version: 1.0.0
schema: v1

models:
  - name: LM Studio Fast
    provider: lmstudio
    model: autodetect    # ✅ LM Studio側でロード中のモデルを自動認識
    apiBase: http://localhost:1234/v1
    roles:
      - chat
      - edit
      - summarize
    completionOptions:
      temperature: 0.2
      maxTokens: 512
      
tabAutocompleteModel:
  title: LM Studio Autocomplete
  provider: lmstudio
  model: autodetect