RAG (Retrieval-Augmented Generation

# RAG (Retrieval-Augmented Generation) ## 精度向上 - [RAGとは？回答精度向上のためのテクニック集（基礎編）](https://zenn.dev/knowledgesense/articles/47de9ead8029ba) - [RAGでの回答精度向上のためのテクニック集（応用編-A）](https://zenn.dev/knowledgesense/articles/cec1cd43244524) - HyDEという手法では、ユーザーから質問が来たら、一度それに対するダミー回答を（LLMで）生成し、そのダミー回答を使ってセマンティック検索をする（回答と意味的に近いドキュメントを取得する）、ということが行われます - [ハイブリッド検索で必ずしも検索性能が上がるわけではない - Ahogrammer](https://hironsan.hatenablog.com/entry/improving-performance-of-hybrid-search) - スコア計算とリランクをチューニング ## References [【2025年5月完全版】RAG の教科書](https://zenn.dev/microsoft/articles/rag_textbook) [[【2025年5月完全版】RAG の教科書|📎]] - はじめに - 目次 - RAG の概要 - RAG のアプローチ - Agent 時代の RAG - RAG の精度改善の進め方 - RAG アプリ全体プロセス - Store の精度向上 (データ準備) - 非構造化データのテキスト化 - チャンク戦略 - チャンク化の効果を検証 (Recall@50) - 文書を「ベクトル」で扱う vs. チャンク化 - チャンクサイズを大きくするとどうなる？ - 境界戦略とオーバーラップの効果 - 実装で使える Tips - フィルタリング - カテゴリ＋フィルタリングとは？ - ざっくり説明すると... - フィルタリングの効果 - フォールバック戦略とメタフィールド設計 - フォールバック戦略 (Fallback Strategy) - 実装ポイント - メタフィールド設計 (Metadata Field Design) - 設計フロー - 使いどころ & ベストプラクティス - Retrieve の精度向上 (検索) - フルテキスト検索 - ベクトル検索 - ベクトル検索のチューニング - セマンティックハイブリッド検索 - Augment の精度向上 (拡張) - Prompt Engineering のポイント - Prompt Engineering がなぜ必要か - Generation の精度向上 (生成) - LLM のモデルの選択について - LLN の特性と使い分け - “Inference”モデルと“Reasoning”モデル - 選択ガイドライン - Evaluate (評価) - 検索精度 - 回答精度 - RAG と Fine-Tuning - RAFT (Retrieval Augmented Fine Tuning) という手法 - RAG と CAG - CAG ( Cache-Augmented Generation )とは - その他 - まとめ - 参考文献 [RAG入門: 精度改善のための手法28選 #Python - Qiita](https://qiita.com/FukuharaYohei/items/0949aaac17f7b0a4c807) [[RAG入門精度改善のための手法28選|📎]] - 全体像 - 手法一覧 - 手法詳細 - Indexing - Chunk Optimization - Level1: Fixed Size Chunking - Level2: Recursive Chunking - Level3: Document Based Chunking - Level4: Semantic Chunking - Level5: Agentic Chunking - Multi-representation indexing - Summary Embedding - Parent Document - Dense X Retrieval - Specialized Embeddings - Fine-tuning - ColBERT - Hierarchical Indexing - RAPTOR - Retrieval - Query Translation - Multi-query - RAG-Fusion - Decomposition - Step-back - HyDE - Routing - Logical Routing - Semantic Routing - Query Construction - Text-to-SQL(Relational DBs) - Text-to-Cypher(GraphDBs) - Self-query retriever(VectorDBs) - Retrieval - Ranking - Re-Rank - RankLLM - Refinement & Active Retrieval - CRAG - Generation - Self-RAG - RRR(Rewrite-Retrieve-Read) - その他 - Hybrid Search - RAFT - 参考リンク