RAG 成本优化:减少每次 LLM 调用的上下文长度