safetensors形式のモデルをOllamaで立ち上げる
経緯 チューニングした safetensors モデル(Gemma 3)を Ollama で立ち上げる必要があった。 独自にチューニングしたモデルのため、Ollama のレジストリには当然無く、...
17 search resultsShowing 1~17 results
経緯 チューニングした safetensors モデル(Gemma 3)を Ollama で立ち上げる必要があった。 独自にチューニングしたモデルのため、Ollama のレジストリには当然無く、...
従来のアプリ開発との違い LLM を使ったアプリは、その性質上 ベストエフォート型 である。ゆえに、従来のシステム開発でベースとなってきた詳細設計レベルのシステム定義だけでは、十分な仕様の定義が...
経緯 Gemma 3 を使ったシステムでエージェント機能を作りたかったが、Gemma 3 は Function Calling に対応していなかった。公式ページには「関数呼び出し」って書いてある...
Dify にコントリビューションする機会があり、その時に調べたデバッグモードで起動する方法を記事に残す。 結論 公式リポジトリの /api フォルダと、 /web フォルダ内にある README...
Ollamaでモデルの名前を変えて起動する 表題の通り 経緯 Dify で Ollama モデルプロバイダーを使ってモデルを立ち上げようとした時に、とある理由で公式の名称以外のモデル名を使う必要...
前々からそろそろ更新しなきゃなーとは思っていたが、なんだかんだ期限ギリギリまで来てしまった。やってみると意外にも簡単だったので共有 Certified Scrum Master (CSM) の更...
経緯 WSL2 を新しく入れようとして wsl --install を実行したところ、以下のエラーが発生した。 必要な機能がインストールされていないため、操作を開始できませんでした。 Error...
少し前に Difyをローカルでデバッグする という記事を書いたが、Dev Container で VSCode 上でデバッグするもっと簡単なやり方があったので記事に残す。 起動手順 VSCode...
経緯 Dify には既に精度評価ツール(Langfuse / LangSmith / Opik / W&B Weave)との連携機能があり、正直これらのツールを使うのが一番手っ取り早い。...
GPU Utilization vs Saturation: どちらを測定すべきか? GPU のパフォーマンスを監視する際、主に "Utilization(使用率)" と "Saturation...
概要 Flask-RESTX のエラーハンドリングは、(バグも含めて)かなり複雑な仕様となっている。 本記事では、Flask-RESTX を使って適切にエラーハンドリングをする方法を紹介する。 ...
概要 デフォルトで Flask-RESTX は json.dumps を ASCII モードでレスポンスを返却してしまう。このため、JSON データにひらがなや漢字が含まれる場合は、内容が文字化...
目的 Vite を使うことで、ESLint + Prettier を有効にした TypeScript + React プロジェクトを迅速に作成することができる。今回はプロジェクトの作成から、ES...
概要 HuggingFace Hubに登録されているモデルをローカルにダウンロードして、LangChain経由で対話型のプログラムを作成する。 前提条件 ランタイムは Python 3.11.6...
概要 Lambda関数を使って削除を行います。 まず、条件に一致したS3オブジェクトのみを列挙し、該当するオブジェクトをS3.Client.delete_objectsメソッドで一括削除します。...
概要 CloudFrontを使ったアプリケーションを構築する中で、設定は正しいのに"Failed to load resource: the server responded with a st...
概要 セキュリティグループに設定されているインバウンドルール(アウトバウンドルール)を削除しようとするとThe specified rule does not exist in this sec...
17 search resultsShowing 1~17 results
Qiita is a knowledge sharing service for engineers.