M4 MacBook ProでローカルLLMを動かしてみた話：24GBメモリでどこまでいけるのか

Posted at 2026-05-11

ローカルLLM、Macでやると「夢はあるけど簡単ではない」

jola.dev の記事「Running local models on an M4 with 24GB memory」は、24GBメモリのM4 MacBook Proでローカルモデルを動かす試行錯誤をまとめた内容です。

ここでいう「ローカルモデル」は、ChatGPTのようなクラウドサービスではなく、自分のPCの中でAIモデルを動かすこと。つまり、インターネット接続なしでも使えるし、データを外に出さずに済むのが大きな利点です。

著者は、かなり率直に「これはSOTAモデルみたいな出力ではない」と認めています。
SOTAは State of the Art の略で、要するにその時点で最先端レベルのモデルのこと。ここでは、ClaudeやGPTの上位モデルみたいな、かなり高性能なやつを想像するとわかりやすいです。

とはいえ、著者は「それでもローカルで、基本的な作業・調査・計画ができるのはかなり楽しい」と感じている。
この感覚、すごくわかります。“全部をAIに任せる” ではなく “手元の賢い相棒” として使う方向は、むしろ健全だと思うんですよね。

著者いわく、ローカルLLMは「動かすまで」がまず大変です。

候補として挙げているのは次の3つです。

それぞれに癖があり、使えるモデルも完全には同じではないそうです。
つまり、「どれでも同じでしょ」とはならないのが面倒なところ。ここはローカルAI界隈あるあるです。

しかもただのモデル選びではありません。

context window は、ざっくり言うとAIが一度に覚えておける文章の長さです。
長ければ長いほど、長文のやり取りや大きめのコードベースにも対応しやすい。

実際に試したモデルは以下の記事に掲載しました。