Hermes Provider 兼容性排错：reasoning_content、custom headers、上下文长度和 api_mode 继承

把 Hermes Agent 接到 DeepAI 或其他 OpenAI-compatible API 中转站时，很多人以为“兼容 OpenAI API”就等于所有行为完全一样。

实际不是。

OpenAI-compatible 主要解决的是接口形态：/v1/chat/completions、messages、model、stream、Authorization header 这些大框架。

但不同 provider、聚合商、推理模型、辅助任务路径，在细节上仍然会有差异：

有的 thinking 模型要求回放 reasoning_content；
有的中转站在 Cloudflare / WAF 后面，需要 User-Agent 或自定义 headers；
有的 custom provider 上下文长度没有被辅助压缩逻辑正确识别；
有的 delegate/subagent 切换 provider 时，不应该继承父模型的 api_mode；
有的聚合商虽然能用 Custom Endpoint，但缺少一等 provider UX。

这篇继续基于 Hermes GitHub Issues / PR，专门讲 Provider 兼容性层面的排错。

先讲清：OpenAI-compatible 不是“所有 provider 细节都一样”

DeepAI API 中转站的价值，是提供统一的 OpenAI-compatible 入口，让 Dify、Hermes、Open WebUI、LobeChat 等工具能用相似方式接入不同模型。

对 Hermes 来说，基础配置一般是：

Base URL: https://api.deepai.wang/v1
API Key: DeepAI 控制台里的 Key
Model ID: DeepAI 控制台中的可用模型

但 Hermes 是 Agent，不只是发一轮聊天请求。它还会做：

工具调用；
多轮历史回放；
context compression；
title generation；
background review；
delegate/subagent；
provider/profile 切换；
vision / non-vision 消息预处理。

这些路径都会碰到 provider 兼容性细节。

所以当你看到 400、403、上下文压缩异常、子 agent 请求失败，不要只检查 Base URL 和 Key。还要看 Hermes 是通过哪条路径调用 provider。

Issue 1：thinking 模型可能要求 reasoning_content 回传

对 Hermes 用户意味着什么

如果你用的是普通聊天模型，可能永远不会碰到这个问题。

但如果你用的是 reasoning / thinking 模型，并且 Hermes 发生了：

第一轮能回答；
工具调用后第二轮失败；
多轮历史 replay 后报 400；
错误里出现 reasoning_content；
only after tool call 才出错；

那就要怀疑：Hermes 对该 provider 的 reasoning_content echo-back 支持不完整。

这不是 DeepAI API Key 问题，也不是 Base URL 问题。

它是 provider-specific message replay 兼容性。

排查建议

换普通非 thinking 模型测试；
缩短对话，避免工具调用，看是否还报错；
查错误是否包含 reasoning_content；
查 Hermes 版本是否已支持该 provider 的 thinking mode；
如果通过 DeepAI 使用某个 reasoning 模型，确认 DeepAI 返回字段与 Hermes 当前适配是否匹配。

Issue 2：Cloudflare / WAF 后的 Custom Provider 可能需要 custom headers

怎么区分 Key 错和 Header 问题

看状态码和对比请求。

401 更像鉴权失败
403 更像被策略拒绝

如果 curl 能通，但 Hermes 403，要比较：

curl 有没有 User-Agent；
Hermes 请求有没有默认 headers；
Hermes 是否在 provider 切换时丢 headers；
base_url 是否经过 Hermes 改写；
请求到底从 main agent、auxiliary client 还是 background task 发出。

对 DeepAI 用户的实践建议

DeepAI 标准接入仍建议：

https://api.deepai.wang/v1
Authorization: Bearer YOUR_DEEPAI_API_KEY

如果 DeepAI curl 测试正常，而 Hermes 某条路径 403，就要查 Hermes 请求路径，不要急着重置 Key。

尤其是：

main agent 正常，auxiliary 失败；
当前模型正常，switch_model 后失败；
一个 provider 正常，另一个 custom provider 403；
只有某些网络环境下 403。

这都可能是 provider headers / WAF / client path 问题。

Issue 3：聚合商能用 Custom Endpoint，但缺少一等 provider 体验

Custom Endpoint 的优点

不等 Hermes 官方合并 provider；
任何 OpenAI-compatible API 都能先用；
配置简单，适合快速测试；
对 DeepAI 这类中转站非常实用。

Custom Endpoint 的限制

provider 名称、模型列表、环境变量自动识别不一定完善；
doctor/status 的提示可能不如内置 provider；
特殊 headers、特殊 api_mode、特殊 reasoning 字段可能需要 Hermes 适配；
上下文长度、vision 能力、pricing 等元信息可能无法自动识别。

所以文章里建议：生产使用 DeepAI 接 Hermes，可以先走 Custom Endpoint，但要保留 provider 兼容性排查意识。

Issue 4：custom_providers 上下文长度没传给 compression 检测

对 DeepAI 用户怎么排查

如果你用 DeepAI 接入长上下文模型，但 Hermes 表现得像上下文很小：

查 Hermes 是否识别了 custom provider 的 context length；
查 compression model feasibility 日志；
查 auxiliary compression 是否走了同一 provider 配置；
升级到包含 custom_providers forwarding 修复的版本；
临时减少上下文长度压力，观察是否稳定。

这个问题不一定是 DeepAI 模型上下文能力不足，而可能是 Hermes 辅助路径没有正确读取 custom provider 元信息。

Issue 5：delegate/subagent 切 provider 时不应继承父 api_mode

为什么这对中转站用户重要

Hermes 会用 delegate/subagent 做复杂任务。

如果主模型、辅助模型、子 agent 模型来自不同 provider，api_mode 继承错误就会导致：

主会话正常；
子任务失败；
delegate 后突然 400 / 404 / 415；
错误像“provider 不支持这个接口”；
用户误以为 DeepAI 或中转站不兼容。

实际可能只是 Hermes 把父 provider 的协议模式带到了不该带的地方。

排查建议

如果你看到“主聊天正常，delegate/subagent 失败”，优先查：

child agent 用的是哪个 provider；
child agent 是否继承了 parent api_mode；
父 provider 和子 provider 是否使用不同 wire protocol；
Hermes 版本是否包含这个修复。

Provider 兼容性问题速查表

现象	可能原因	优先检查
thinking 模型工具调用后 400	reasoning_content 未回传	Hermes 版本、provider thinking mode 支持
curl 正常但 Hermes 403	custom headers / WAF / Cloudflare	Hermes 请求 headers、provider path
Custom Endpoint 能用但 UX 不完整	非内置 provider	provider registry、doctor/status、env auto-detect
长上下文模型像短上下文	custom_providers 未传给 compression 检测	context length、compression logs
主 agent 正常，delegate 失败	api_mode 跨 provider 继承错误	child provider、api_mode、wire protocol

DeepAI 接 Hermes 的实用建议

如果你用 DeepAI API 中转站作为 Hermes 的上游模型服务，建议这样配置和排错。

1. Base URL 只填到 `/v1`

https://api.deepai.wang/v1

不要填：

https://api.deepai.wang/v1/chat/completions

2. 模型 ID 以 DeepAI 控制台为准

不要照抄别的 provider 文档里的模型名。

如果工具不能直接证明某模型在 DeepAI 可用，就不要在文章或配置里虚构。

3. 先用 curl 验证，再查 Hermes 路径

curl https://api.deepai.wang/v1/chat/completions \
  -H "Authorization: Bearer YOUR_DEEPAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "YOUR_MODEL_ID",
    "messages": [{"role": "user", "content": "reply ok"}]
  }'

curl 通，只说明 DeepAI 上游服务可用。

Hermes 仍然可能在 auxiliary、compression、delegate、thinking replay、headers 等路径出问题。

4. 对 reasoning 模型保持谨慎

如果你使用 reasoning / thinking 模型，特别要关注：

reasoning_content；
tool call history replay；
多轮对话；
Hermes 是否支持该 provider 的 thinking mode。

5. 长任务和多 agent 场景要测 auxiliary / delegate

不要只测一句 hello。

至少测试：

多轮对话；
一次工具调用；
一次长上下文压缩；
一次 delegate/subagent；
一次 title generation 或 session summary。

这样才能发现 Custom Endpoint 在 Hermes 全链路中的兼容性问题。

总结

OpenAI-compatible 不等于 provider 细节完全一致。

Hermes 作为 Agent，会在主对话之外调用辅助模型、压缩上下文、回放工具历史、切换 provider、委派子 agent。每一条路径都可能触发 provider 兼容性问题。

reasoning_content 400、Cloudflare 403、context length 误判、api_mode 继承错误，都不是简单的“DeepAI Key 错了”。

用 DeepAI 接 Hermes，最稳的方法是：先验证 /v1/chat/completions，再测试 Hermes 的主对话、工具调用、compression、auxiliary 和 delegate。只有这样，才能确认不是“能聊一句”，而是整条 Agent 链路都稳。

Hermes Provider 兼容性排错：reasoning_content、custom headers、上下文长度和 api_mode 继承

先讲清：OpenAI-compatible 不是“所有 provider 细节都一样”

Issue 1：thinking 模型可能要求 reasoning_content 回传

对 Hermes 用户意味着什么

排查建议

Issue 2：Cloudflare / WAF 后的 Custom Provider 可能需要 custom headers

怎么区分 Key 错和 Header 问题

对 DeepAI 用户的实践建议

Issue 3：聚合商能用 Custom Endpoint，但缺少一等 provider 体验

Custom Endpoint 的优点

Custom Endpoint 的限制

Issue 4：custom_providers 上下文长度没传给 compression 检测

对 DeepAI 用户怎么排查

Issue 5：delegate/subagent 切 provider 时不应继承父 api_mode

为什么这对中转站用户重要

排查建议

Provider 兼容性问题速查表

DeepAI 接 Hermes 的实用建议

1. Base URL 只填到 /v1

2. 模型 ID 以 DeepAI 控制台为准

3. 先用 curl 验证，再查 Hermes 路径

4. 对 reasoning 模型保持谨慎

5. 长任务和多 agent 场景要测 auxiliary / delegate

相关 Issue / PR

总结

Related Post

Hermes Agent 接入 DeepAI API 中转站：gpt-5 自定义端点被强制走 codex_responses 怎么排查Hermes Agent 接入 DeepAI API 中转站：gpt-5 自定义端点被强制走 codex_responses 怎么排查

Hermes Issue #1083：OpenRouter / Nvidia / MiniMax 报 400 BadRequest，别只怪 API KeyHermes Issue #1083：OpenRouter / Nvidia / MiniMax 报 400 BadRequest，别只怪 API Key

Hermes 热门 Issue #6475：Claude 订阅登录为什么还会提示 out of extra usage？Hermes 热门 Issue #6475：Claude 订阅登录为什么还会提示 out of extra usage？

1. Base URL 只填到 `/v1`