# RAG (Retrieval-Augmented Generation)
## 精度向上
- [RAGとは?回答精度向上のためのテクニック集(基礎編)](https://zenn.dev/knowledgesense/articles/47de9ead8029ba)
- [RAGでの回答精度向上のためのテクニック集(応用編-A)](https://zenn.dev/knowledgesense/articles/cec1cd43244524)
- HyDEという手法では、ユーザーから質問が来たら、一度それに対するダミー回答を(LLMで)生成し、そのダミー回答を使ってセマンティック検索をする(回答と意味的に近いドキュメントを取得する)、ということが行われます
- [ハイブリッド検索で必ずしも検索性能が上がるわけではない - Ahogrammer](https://hironsan.hatenablog.com/entry/improving-performance-of-hybrid-search)
- スコア計算とリランクをチューニング
## References
[【2025年5月完全版】RAG の教科書](https://zenn.dev/microsoft/articles/rag_textbook)
[[【2025年5月完全版】RAG の教科書|📎]]
- はじめに
- 目次
- RAG の概要
- RAG のアプローチ
- Agent 時代の RAG
- RAG の精度改善の進め方
- RAG アプリ全体プロセス
- Store の精度向上 (データ準備)
- 非構造化データのテキスト化
- チャンク戦略
- チャンク化の効果を検証 (Recall@50)
- 文書を「ベクトル」で扱う vs. チャンク化
- チャンクサイズを大きくするとどうなる?
- 境界戦略とオーバーラップの効果
- 実装で使える Tips
- フィルタリング
- カテゴリ+フィルタリングとは?
- ざっくり説明すると...
- フィルタリングの効果
- フォールバック戦略 と メタフィールド設計
- フォールバック戦略 (Fallback Strategy)
- 実装ポイント
- メタフィールド設計 (Metadata Field Design)
- 設計フロー
- 使いどころ & ベストプラクティス
- Retrieve の精度向上 (検索)
- フルテキスト検索
- ベクトル検索
- ベクトル検索のチューニング
- セマンティックハイブリッド検索
- Augment の精度向上 (拡張)
- Prompt Engineering のポイント
- Prompt Engineering がなぜ必要か
- Generation の精度向上 (生成)
- LLM のモデルの選択について
- LLN の特性と使い分け - “Inference”モデルと“Reasoning”モデル
- 選択ガイドライン
- Evaluate (評価)
- 検索精度
- 回答精度
- RAG と Fine-Tuning
- RAFT (Retrieval Augmented Fine Tuning) という手法
- RAG と CAG
- CAG ( Cache-Augmented Generation )とは
- その他
- まとめ
- 参考文献
[RAG入門: 精度改善のための手法28選 #Python - Qiita](https://qiita.com/FukuharaYohei/items/0949aaac17f7b0a4c807)
[[RAG入門 精度改善のための手法28選|📎]]
- 全体像
- 手法一覧
- 手法詳細
- Indexing
- Chunk Optimization
- Level1: Fixed Size Chunking
- Level2: Recursive Chunking
- Level3: Document Based Chunking
- Level4: Semantic Chunking
- Level5: Agentic Chunking
- Multi-representation indexing
- Summary Embedding
- Parent Document
- Dense X Retrieval
- Specialized Embeddings
- Fine-tuning
- ColBERT
- Hierarchical Indexing
- RAPTOR
- Retrieval
- Query Translation
- Multi-query
- RAG-Fusion
- Decomposition
- Step-back
- HyDE
- Routing
- Logical Routing
- Semantic Routing
- Query Construction
- Text-to-SQL(Relational DBs)
- Text-to-Cypher(GraphDBs)
- Self-query retriever(VectorDBs)
- Retrieval
- Ranking
- Re-Rank
- RankLLM
- Refinement & Active Retrieval
- CRAG
- Generation
- Self-RAG
- RRR(Rewrite-Retrieve-Read)
- その他
- Hybrid Search
- RAFT
- 参考リンク