1.4 KiB
1.4 KiB
Milestone 2: Hybrid Search
RAG 第二阶段优化规划
参考 GitHub issue "RAG 第二优化节点阶段",本阶段围绕现有 RAG 系统继续迭代,目标是提升检索效果与服务稳定性,并扩展多模型与多数据源支持。
目标
- 提升向量检索精准度与性能。
- 支持增量同步与多仓库数据接入。
- 提供多种嵌入与大模型选择,方便灵活部署。
- 加强 API/CLI 的错误处理、监控与自动化测试。
主要任务
- 向量检索优化
- 对比评估不同嵌入模型与相似度度量。
- 引入向量索引/压缩策略,减少查询延迟。
- 数据同步管道
- 实现增量更新机制,按需重建向量。
- 支持同步进度追踪与失败重试。
- 多模型与配置
- 通过 LangChainGo 统一接入本地及云端模型。
- 允许针对不同模型自定义参数与超时配置。
- API 与 CLI 稳定性
- 改进异常处理与日志记录,暴露更多诊断信息。
- 完善集成测试,覆盖 RAG upsert 与查询流程。
- 监控与观测
- 接入指标与日志上报,便于性能分析。
- 构建健康检查与告警机制。
里程碑
- M2.1:完成增量同步与检索优化的原型验证。
- M2.2:集成多模型支持并上线监控体系。
- M2.3:完善自动化测试与文档,准备下一阶段迭代。