在使用 Codex Desktop、CC Switch 或其他 Agent 接入 DeepAI 时,有些用户会遇到 stream disconnected before completion: stream closed before response.completed。这个错误看起来像 DeepAI 不稳定,但本质通常是客户端端点和流式输出协议不匹配。
本文从 SEO 搜索意图出发,专门解释 Codex Desktop stream disconnected、response.completed、/v1/chat/completions、/v1/responses 的区别,并给出 DeepAI 场景下的排查方法。
先说结论:这通常不是 DeepAI 本身故障
OpenAI 近年的模型和 SDK 更新很快,不同客户端可能仍在使用旧端点。对于支持流式输出的新模型,如果客户端仍然走旧的 /v1/chat/completions 或错误拼接端点,就可能出现 stream closed before response.completed。
两个常见端点有什么区别?
/v1/chat/completions
# 旧版 Chat Completions 端点,部分客户端或模型流式兼容性有限
/v1/responses
# 新版 Responses 端点,更适合支持流式输出的新模型
为什么 Codex Desktop 会报 stream disconnected?
如果你通过 DeepAI 第三方 Agent 导入 CC Switch,再由 CC Switch 写入 Codex Desktop 配置,默认 API 请求地址可能被拼接到 https://api.deepai.wang/v1/chat/completions。当你选择的模型需要 Responses API 或更完整的 stream 支持时,就可能报错。
DeepAI 场景下怎么修复?
- 先确认客户端最终请求的端点到底是
/v1/chat/completions还是/v1/responses。 - 如果输入
https://api.deepai.wang后被工具自动写成 chat/completions,可以尝试改成https://api.deepai.wang/v1。 - 保存配置后完全退出并重启 Codex Desktop 或相关 Agent。
- 换一个低成本模型测试,确认不是单个模型的流式兼容问题。
为什么有人说“加 /v1”或“去掉 /v1”就好了?
因为不同工具对 Base URL 的拼接规则不一样。有的工具会自动补 /v1/chat/completions,有的工具会根据 /v1 判断走 Responses API。所谓“加 /v1”或“去掉 /v1”,本质是在改变客户端最终使用的端点。
推荐排查表
| 现象 | 优先检查 | 处理方式 |
| stream disconnected before completion | 端点是否为旧 chat/completions | 尝试使用 /v1 触发 responses 端点 |
| response.completed 前关闭 | 模型是否需要流式输出 | 换支持 Responses API 的配置 |
| 能连接但一提问就断 | 客户端拼接规则错误 | 查看最终请求地址并重启客户端 |
FAQ
这个错误一定是 DeepAI 的问题吗?
不是。更多时候是客户端端点、模型协议和流式输出不匹配。DeepAI 只是 API 网关,最终请求路径仍取决于客户端怎么拼接。
DeepAI Base URL 填 api.deepai.wang 还是 api.deepai.wang/v1?
多数 OpenAI Compatible API 客户端建议从 https://api.deepai.wang/v1 开始测试;如果工具自动重复拼接,再改为根地址。关键是看最终请求端点。
如何避免以后再遇到?
为每个工具单独创建 DeepAI 令牌,记录该工具实际可用的 Base URL 和模型组合。不要把所有客户端混用同一个配置。