很多用户搜索“Dify 工作流 聊天模型 Embedding 模型”,真正想解决的不是概念,而是能不能在几分钟内把客户端连上可用模型。本文按搜索意图来写:先说明该填什么,再说明为什么会报错,最后给出适合 DeepAI API 中转站的配置建议。
DeepAI 提供 OpenAI Compatible API,适合 Cherry Studio、Dify、Open WebUI、Cline、Chatbox、LobeChat、Continue、Aider 等可以自定义服务商的工具。常用 Base URL:
https://api.deepai.wang/v1
Dify 不同模型类型怎么选
- 聊天模型用于回答、推理和生成文本。
- Embedding 模型用于知识库向量化。
- Rerank 模型用于提高检索结果排序质量。
- 不要把聊天模型当 Embedding 模型用。
推荐配置速查表
| 模型类型 | 用途 | DeepAI 配置建议 |
| Chat / LLM | 对话和工作流节点 | 选择适合任务复杂度的模型 |
| Embedding | 知识库向量化 | 单独配置支持 embedding 的模型 |
| Rerank | 重排序 | RAG 精度要求高时再加 |
成本控制建议
- 测试期先用低成本聊天模型。
- 知识库批量导入前确认 Embedding 模型价格。
- 复杂工作流给每个节点选择合适模型,不要全部用最贵模型。
常见问题 FAQ
Dify 只配聊天模型可以用知识库吗?
通常不够。知识库需要 Embedding 模型把文本转成向量。
为什么知识库上传成功但回答不准?
可能是切分、Embedding、Rerank 或提示词问题,不只是聊天模型问题。
如果你正在搭建自己的 AI 工具链,建议把每个客户端都单独创建 DeepAI 令牌,这样后续看日志、控成本、定位 401/404/429 问题会更清楚。
相关阅读:OpenAI Compatible API 是什么?Base URL、API Key、模型 ID 一次讲清楚。