ローカルLLMおじさん、OpenRouterに敗北する
どうも、ローカルLLMおじさんです。 GPUにモデルを載せる。 Ollamaで動かす。 vLLMでスループットを出す。 量子化して、VRAMに押し込む。 全部、自分の手元で動く。 くぅ〜、たまら...
0
0
Comment0
4 search resultsShowing 1~4 results
You need to log-in
どうも、ローカルLLMおじさんです。 GPUにモデルを載せる。 Ollamaで動かす。 vLLMでスループットを出す。 量子化して、VRAMに押し込む。 全部、自分の手元で動く。 くぅ〜、たまら...
どうも、ローカルスタックおじさんです。 Dockerでコンテナを作る。 Kubernetesでオーケストレーションする。 これがマイクロサービスの醍醐味なんだ。 そしてヘテロジーニアスクラスタを...
要約 RAG を作っていて「検索したのに欲しい情報が出ない」とき、Vector DB や embedding model 、reranker を見直しがちです。でも、実装していて最初に踏んだのは...
元Haswellおじさん、5万円のM1 Mac miniに敗北する どうも、元Haswellおじさんです。 Haswell i7-4770K + RTX 2070 Super のまま、2025年...
4 search resultsShowing 1~4 results
Qiita is a knowledge sharing service for engineers.