[推薦] Production RAG 經驗分享
Source
https://blog.abdellatif.io/production-rag-processing-5m-documents#what-moved-the-needle
Summary
- 使用 LLM 查看整個 conversation,生出語義和關鍵字,把這些結果丟給 reranker 增加搜索範圍
- 使用 reranker,50 chunks 輸出 15 個 chunks
- 客製化的 chunking 策略,確保兩個關鍵
- 區塊不會再單詞或句子的中間被截斷
- 每個區塊都是單一邏輯單元,能捕捉有效資訊
- 內文連同 metadata 一起傳給 LLM 可以取得高品質的回答( markdown 化)
- 建立一個小 router 判斷問題是否需要 RAG(總結這篇文章、這是誰寫的),針對這些問題直接走其他方式或是 LLM
發佈時間
2025-10-21