1M 上下文不是越大越好:Hermes 在 Claude Pro 上踩到的 200K 限制1M 上下文不是越大越好:Hermes 在 Claude Pro 上踩到的 200K 限制
Hermes 默认 1M context window 看似更强,但 Claude Pro 账号实际常见限制是 200K,GPT 与本地 Ollama 也可能被错误报大。本文复盘 #3577:为什么上下文窗口不是越大越好,而是越准确越好。
Hermes Agent 中模型选择、Provider、OpenAI-compatible API、认证、参数兼容等文章。
Hermes 默认 1M context window 看似更强,但 Claude Pro 账号实际常见限制是 200K,GPT 与本地 Ollama 也可能被错误报大。本文复盘 #3577:为什么上下文窗口不是越大越好,而是越准确越好。
Hermes 接入 OpenRouter、MiniMax 或 NVIDIA 模型时一发请求就 BadRequestError 400?问题可能不是 API Key,而是 reasoning extra_body 被发给了不支持 reasoning 扩展的模型。本文教你读 request_dump 并分层排查。
Hermes Agent 主模型正常,但 title_generation 报 HTTP 404?可能是 auxiliary provider:auto 没跟随主 provider,而是选到 fallback provider(如 minimax),导致 SDK、api_mode 或 endpoint path 不匹配。本文解释 provider:auto、fallback_model、WeChat 错误泄露和显式配置 workaround。
Hermes Agent 主模型能用,但 auxiliary title_generation 报 401 Missing Authentication header?可能是 provider:auto/openrouter 搭配 base_url 和空 api_key 被误判成 custom provider,跳过 OPENROUTER_API_KEY 环境变量读取。本文给出配置排查、workaround 和修复方向。
Hermes Agent 报 UnicodeEncodeError: ascii codec can't encode character?本文从 LANG=C、API Key 混入 Unicode 近似字符、OpenAI SDK Authorization header、tool schema、api_messages 和 reasoning_content 角度给出完整排错清单。
Hermes Agent 接入 Ollama 后同一会话记不住上一轮?这可能不是 memory tool 坏了,而是 Ollama num_ctx 回落到 2048 导致历史被服务端静默截断。本文解释 context_length、ollama_num_ctx、/api/show 探测失败和 PR #19613 的修复方向。
Hermes Agent 使用 Gemini 3 / preview 模型时报 Function call is missing a thought_signature?这通常不是 API Key 或网络问题,而是 tool call 历史消息丢失 extra_content / thought_signature。本文整理升级、复现和源码排查清单。
Hermes Agent 接入 DeepSeek thinking 模型时报 reasoning_content 或 content[].thinking must be passed back?这通常不是 API Key 错,而是历史 assistant message 在工具调用、fallback、cron 或 replay 时丢失 thinking 字段。本文整理 DeepSeek provider detection、reasoning_content echo 和排查清单。
Hermes Agent 使用 GPT-5.4、Copilot 或 OpenRouter 时,如果请求漂移到 /chat/completions 并报 unsupported_api_for_model,核心往往不是模型不可用,而是 GPT-5.x 必须走 Responses API / codex_responses。本文解释 provider fallback、api_mode、gateway 缓存和 OpenAI-compatible API 的正确排查顺序。
Hermes Agent 接入 Gemini provider 报 HTTP 400 Multiple authentication credentials received?这通常不是简单 API Key 粘错,而是 Google OpenAI-compatible endpoint、Bearer、x-goog-api-key、AIza legacy key 与 AQ 新 key 的认证兼容问题。本文总结排查顺序、临时绕法和 native Gemini adapter 的长期方向。
Hermes Agent 接入 Kimi for Coding 报 HTTP 400 invalid temperature: only 0.6 is allowed?这通常不是 API Key 错,而是模型固定参数契约没有覆盖主聊天、summary、memory flush、auxiliary client 等所有调用路径。本文总结 Kimi temperature 0.6 的正确排查方式。