Search result of “user:tms-ducvu”

13 search resultsShowing 1~13 results

Stocked

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/02/02

RAGのコストが高い？Intent Filterで70%のトークンを節約する方法

はじめにすべてのユーザーメッセージに対してRAGパイプラインを実行していませんか？「こんにちは」や「ありがとう」といった挨拶にも？それは私が見てきた中で最も早くお金を燃やす方法です。この記...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/01/28

Check-before-Suggest（幻覚対策 — Hallucination）

はじめにこの記事では、RAG（Retrieval-Augmented Generation）システムにおいて、LLMがトピックを提案する際に発生する幻覚（hallucination）を低減する...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/01/28

RAG + TTS のリアルタイムシステムにおけるレイテンシ最適化

こんにちは。この記事では、RAG と TTS を組み合わせたリアルタイムシステムでのレイテンシ削減にフォーカスし、実運用で使える「バンドル・オーディオ・キャッシュ」手法を紹介します。コード例と運...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/01/20

[RAG] Context-Aware Caching: 会話型 AI における「文脈を理解するキャッシュ設計」

1. 問題背景（The Problem）多くの従来型キャッシュシステムは stateless な前提で設計されています。つまり、「現在のリクエスト」だけを見ており、過去の文脈を考慮しません。...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/01/20

「RAG」「言語の“隔離”」という発想

Multilingual Vector Search における実践的な設計パターン LLM や RAG を実運用に組み込む中で、Multilingual Embedding は非常に便利な一方、...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/01/13

実運用での RAG 実装：精度を落とさず Cache Hit を向上させる Two-Phase Caching 戦略

RAG（Retrieval-Augmented Generation）を本番環境に導入して気づいたのは、問題の本質は Embedding や Vector DB ではなく、Caching 戦略...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2026/01/08

AIエージェント ≠ エージェンティックAI ― デモとプロダクションシステムを分ける境界線 ―

今のAI界隈で、最も使い倒されている言葉が「エージェント」です。あらゆるチャットボット、ラッパー、ツール呼び出しのデモが、突然「自律的」を名乗り始めました。しかし実際の開発現場では、見落とされ...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2025/12/30

読む力 vs 書く力：AIの強みと弱み！

AIの「読む力」と「書く力」の違いをわかりやすく解説 ChatGPTのようなAIを使っていて、こんな風に思ったことはありませんか？「このAI、話を理解できるし、回答も人間みたいに上手…一種類だ...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2025/12/15

NotebookLM ― AIが“ドヤ顔で喋る”のをやめて、ちゃんと資料を読んでくれる話

「このプロジェクトの資料、どこにありますか？」「……全部だよ」エンジニアなら、一度は聞いたことがあるセリフだと思います。エンジニアあるある：資料が多すぎ問題新しいプロジェクトに参加した初...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2025/11/17

AIの「ハルシネーション」？あなた専用データをAIに“参照”させるRAG (Retrieval-Augmented Generation)の仕組みとは

Retrieval-Augmented Generation (RAG) とは？ LLMの「幻覚（Hallucination）」を解決し、企業AIの必須技術となる仕組みきっとこんなこと、一度は...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2025/11/29

昔の検索エンジンはなぜこんなに頑固だったのか？ Embedding がもたらす「意味が伝わる」世界

こんにちは、みなさん。今日は、インターネット黎明期や検索機能を作ったことのあるエンジニアなら一度は経験したであろう「ある苦しみ」について話したいと思います。それは、コンピュータが「文字は理解...

Comment1

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2025/12/01

Semantic Caching 再入門：高速化・コスト削減と「文脈の罠」をどう超えるか

Semantic Caching: AIに「サブ脳」を構築する（そして、なぜそれだけでは不十分なのか）本番環境（Production）でLLMをデプロイしたことがある人なら、すでに2つの強敵と...

Comment0

@tms-ducvu(Mr. 403)in株式会社TOMOSIA VIET NAM

2025/12/01

Docling: 社内ドキュメントを“即席のAIブレイン（AI Brain）”に変える

Document Understanding（文書理解）の革命？複雑なレイアウトを構造化し、RAGの回答精度を劇的に高める仕組みもし前回の記事を読んでいれば、もう分かっているはずだ。Retr...

Comment0

13 search resultsShowing 1~13 results

Qiita is a knowledge sharing service for engineers.

You can follow users and tags
You can stock useful information
You can make edit suggestions for articles

Functions that can be used after logging in

Search article