[推薦] Production RAG 經驗分享

Source

https://blog.abdellatif.io/production-rag-processing-5m-documents#what-moved-the-needle

Summary

使用 LLM 查看整個 conversation，生出語義和關鍵字，把這些結果丟給 reranker 增加搜索範圍
使用 reranker，50 chunks 輸出 15 個 chunks
客製化的 chunking 策略，確保兩個關鍵
1. 區塊不會再單詞或句子的中間被截斷
2. 每個區塊都是單一邏輯單元，能捕捉有效資訊
內文連同 metadata 一起傳給 LLM 可以取得高品質的回答（ markdown 化）
建立一個小 router 判斷問題是否需要 RAG（總結這篇文章、這是誰寫的），針對這些問題直接走其他方式或是 LLM

發佈時間 2025-10-21

#recommendation #RAG #ai

cmd + /

Toggle Theme