这篇文章针对“Dify 多模型成本控制”这个长尾搜索需求,不做泛泛介绍,而是直接从 DeepAI API 中转站、OpenAI Compatible API、Base URL、API Key、模型 ID 和排错流程出发,给出可执行配置建议。
常见 DeepAI Base URL:
https://api.deepai.wang/v1
核心配置/排查表
| 成本来源 | 优化方式 |
| LLM 节点 | 按复杂度选模型 |
| Embedding | 批量导入前先测试 |
| Rerank | 只在高价值 RAG 使用 |
| 长上下文 | 分段处理 |
| 失败重试 | 限制循环和重试次数 |
建议操作步骤
- 为 Dify 单独创建 DeepAI 令牌。
- 给测试环境使用低成本模型。
- 生产工作流不要所有节点都用最高价模型。
- 定期查看 DeepAI 请求日志。
FAQ
Dify 为什么容易成本高?
工作流节点多、知识库处理和多轮调用都会叠加 Token。
怎么判断哪个节点最贵?
结合 Dify 执行记录和 DeepAI 日志,看请求次数、输入长度和模型。
建议为这个场景单独创建 DeepAI 令牌,方便后续看日志、查错误码和控制成本。
相关阅读:DeepAI API 中转站入门。