这篇文章针对“Dify RAG 应用模型选择”这个长尾搜索需求,不做泛泛介绍,而是直接从 DeepAI API 中转站、OpenAI Compatible API、Base URL、API Key、模型 ID 和排错流程出发,给出可执行配置建议。
常见 DeepAI Base URL:
https://api.deepai.wang/v1
核心配置/排查表
| 模块 | 作用 |
| Embedding | 把文档转向量 |
| Retriever | 召回相关片段 |
| Rerank | 重排召回结果 |
| Chat Model | 根据上下文生成回答 |
| Prompt | 约束引用和风格 |
建议操作步骤
- 先把 Embedding 配好,再谈聊天模型。
- 知识库效果差时先查召回,不要只换大模型。
- Rerank 用于提升高价值检索质量。
- 长文档先优化切分策略。
FAQ
RAG 效果差一定是模型不行吗?
不一定,常见原因是切分、召回、Embedding 或提示词问题。
DeepAI 在 RAG 里负责什么?
提供可调用的聊天/Embedding/Rerank 等模型入口,具体可用模型以控制台为准。
建议为这个场景单独创建 DeepAI 令牌,方便后续看日志、查错误码和控制成本。
相关阅读:DeepAI API 中转站入门。