DeepAI Paper Dify 教程 Dify 工作流如何选择聊天模型和 Embedding 模型?DeepAI 配置建议

Dify 工作流如何选择聊天模型和 Embedding 模型?DeepAI 配置建议

很多用户搜索“Dify 工作流 聊天模型 Embedding 模型”,真正想解决的不是概念,而是能不能在几分钟内把客户端连上可用模型。本文按搜索意图来写:先说明该填什么,再说明为什么会报错,最后给出适合 DeepAI API 中转站的配置建议。

DeepAI 提供 OpenAI Compatible API,适合 Cherry Studio、Dify、Open WebUI、Cline、Chatbox、LobeChat、Continue、Aider 等可以自定义服务商的工具。常用 Base URL:

https://api.deepai.wang/v1

Dify 不同模型类型怎么选

  • 聊天模型用于回答、推理和生成文本。
  • Embedding 模型用于知识库向量化。
  • Rerank 模型用于提高检索结果排序质量。
  • 不要把聊天模型当 Embedding 模型用。

推荐配置速查表

模型类型用途DeepAI 配置建议
Chat / LLM对话和工作流节点选择适合任务复杂度的模型
Embedding知识库向量化单独配置支持 embedding 的模型
Rerank重排序RAG 精度要求高时再加

成本控制建议

  • 测试期先用低成本聊天模型。
  • 知识库批量导入前确认 Embedding 模型价格。
  • 复杂工作流给每个节点选择合适模型,不要全部用最贵模型。

常见问题 FAQ

Dify 只配聊天模型可以用知识库吗?

通常不够。知识库需要 Embedding 模型把文本转成向量。

为什么知识库上传成功但回答不准?

可能是切分、Embedding、Rerank 或提示词问题,不只是聊天模型问题。

如果你正在搭建自己的 AI 工具链,建议把每个客户端都单独创建 DeepAI 令牌,这样后续看日志、控成本、定位 401/404/429 问题会更清楚。

相关阅读:OpenAI Compatible API 是什么?Base URL、API Key、模型 ID 一次讲清楚

Related Post

Dify deepai max completion tokens reasoning model.png

Dify 接入 DeepAI API 中转站:max_tokens 不支持改用 max_completion_tokensDify 接入 DeepAI API 中转站:max_tokens 不支持改用 max_completion_tokens

Dify 使用 OpenAI-API-compatible Provider 接入 o1、GPT-5 或其他 reasoning 模型时,如果模型校验或运行报 Unsupported parameter: max_tokens,通常要改用 max_completion_tokens。本文结合 Dify Issue #10348、官方插件 Issue #1845 和 PR #2713/#2771,整理 DeepAI API 中转站场景下的排查与修复方法。

Dify deepai openai compatible 404 401 tool calling.png

Dify 接入 DeepAI API 中转站:OpenAI-Compatible 404、401 与工具调用 400 排查Dify 接入 DeepAI API 中转站:OpenAI-Compatible 404、401 与工具调用 400 排查

Dify 添加 OpenAI-compatible 模型时遇到 404、401 或 vLLM tool choice 400 怎么办?本文结合 Dify GitHub 已关闭 Issue,整理 Base URL、API Key、模型验证和工具调用的排查顺序。