🦞 OpenClaw 2026.5.4 更新

🦞 OpenClaw 2026.5.4 更新

本次更新速览

🧩 清理插件安装与更新机制

⚡ 优化网关启动链路,启动速度大幅提升

🛠️ 完善自检 / 修复功能提示

🪟 修复 Windows 端与 Discord 渠道稳定性问题

本次版本更新,告别拖沓,全面提速

详细更新日志

1、语音通话 / Google Meet 重大更新

  • Twilio 语音桥优化:让 Google Meet 参与者获得更流畅的 OpenClaw 语音代理体验,支持音频流控、背压感知缓冲、打断时队列清空,实时语音过程中不再回退到 TwiML

  • 语音流稳定性:限制 Twilio 音频队列大小,过载时先关闭实时流,避免音频在 websocket 背压保护后堆积

  • Google Meet 默认模式切换:mode: "agent" 成为默认通话路径(实时语音转文字 → OpenClaw 代理 → TTS 语音输出),保留 mode: "bidi" 作为直接双向模型行为

  • 回声抑制:抑制队列中的助手播放和类似助手的语音回波,避免会议中听到助手自己的语音造成循环或打断

  • Chrome 音频优化:降低默认音频缓冲从 8192 字节到 4096 字节,减少 Chrome 通话延迟

  • 支持静音语音加入:realtime.introMessage: "" 可以让 Chrome 加入时保持静默,不播放默认介绍语

  • 日志增强:记录具体的 TTS 提供商、模型、语音、输出格式和采样率,方便排查语音问题


2、性能优化

  • 网关启动加速

    • 将非就绪 sidecar 延迟到 ready 信号之后启动

    • 避免热路径通道插件 barrel 导入

    • 启动时快速路径处理受信任的捆绑插件元数据

    • 避免在原生可加载插件启动路径导入 jiti

  • 模型/插件元数据缓存

    • 在 BTW、压缩、嵌入式运行模型生成和 PDF 模型设置中传递已解析的工作区,避免冷启动插件元数据扫描

    • 让无作用域模型目录和 manifest 读取器重用当前工作区兼容的插件元数据快照

  • 减少导入开销

    • 将模型目录测试辅助、运行会话查找、QR 配对辅助、TypeBox 内存工具模式构建移出热启动导入路径

    • 优化启动导入,减少默认网关基准测试的插件加载和内存压力

  • 会话列表优化

    • sessions list 默认限制为最新 100 条,添加 --limit 参数和 JSON 分页元数据

    • 记忆重复的 thinking 选项丰富化,跳过未使用的成本回退检查


3、 插件系统改进

  • 插件迁移提示:当 plugins.entries 或 plugins.allow 引用未安装的官方外部插件时,给出目录支持的安装提示,建议 openclaw plugins install <spec> 而不是让用户删除有效配置

  • 插件安装/更新

    • 将官方外部化捆绑 npm 迁移和 ClawHub 到 npm 回退视为受信任的源链接安装

    • ClawHub 包可用时,将之前回退到 npm 的外部化插件安装切回 ClawHub

    • 重新安装切换源时删除之前的托管插件目录,避免发现时重复

    • 忽略只有 TypeScript 源条目而没有编译运行时输出的托管 npm 插件包

    • beta 通道缺失 beta 版本时,回退到 default/latest 版本

  • 插件发现/加载

    • 保留真实编译插件模块评估错误,而不是将每个抛出的 .js 模块都视为源转换回退失败

    • 原生评估已经遇到缺失依赖后,不再通过源转换器重试

    • 新配置默认情况下,捆绑提供程序发现遵守限制性 plugins.allow

  • 插件安全扫描

    • 匹配源规则上下文时忽略行内和块注释

    • 受信任的官方 OpenClaw npm 安装时抑制危险模式扫描器警告

  • 插件技能发布:将插件声明的技能发布到生成的插件技能目录 ~/.openclaw/plugin-skills/


4、各渠道支持更新

Discord

  • 添加降级传输和网关事件循环饥饿信号到状态检查

  • 首选 IPv4 进行 REST 和网关 WebSocket 启动,避免仅 IPv4 网络上的阻塞

  • 重试 Discord READY 等待并带退避,延迟启动会话列表和原生审批就绪失败

  • 将失败的最终回复传递视为失败回合,而不是已送达

  • 清理启动探测机器人/应用程序状态

Telegram

  • 接受插件拥有的数字论坛主题目标

  • 从保存的 MIME 元数据推导无标题入站媒体占位符,修复非图片附件问题

  • 长文本最终消息重用活动预览作为第一个块,避免临时额外气泡闪烁

  • 保持回复调度惰性提供程序运行时块在稳定的 dist 名称后

  • 保持显式论坛主题 requireMention 设置覆盖持久化的激活/停用状态

  • 在回复传递中渲染共享交互式回复按钮

Slack

  • 为基于结构化进度行数据的 Block Kit 进度草稿添加 streaming.progress.render: "rich"

  • Block Kit 限制修剪长进度草稿时保留最新的富进度行

  • 恢复的父消息发送保留在原始 Slack 线程中

  • 记录成功可见线程发送的线程参与,包括消息工具和媒体传递路径

  • 报告未知错误而不是 undefined,明确标记重试原因

WhatsApp

  • 支持显式 WhatsApp Channel/Newsletter @newsletter 外发消息目标

  • 规范化设置和配对白名单条目为 WhatsApp 纯数字电话 ID

  • 通过注入的运行时路由登录成功和失败消息

QQBot

  • 将框架斜杠命令作用域限制为 QQBot 通道,避免 /bot-* 命令处理泄漏

  • 保护私有命令不暴露到框架表面

Matrix

  • 保持 streaming.progress.toolProgress 作用于进度草稿模式

  • 绑定原生审批反应目标后再发布选项反应

Google Chat

  • 每个 auth 客户端创建独立的 Google auth 传输,避免拦截器突变累积

  • 规范化 Google auth 证书响应头

IRC

  • 澄清 IRC 使用原始 TCP/TLS 套接字,不在运营商管理的转发代理路由之外


5、Control UI 改进

  • 聊天界面

    • 聊天会话选择器添加代理优先过滤器

    • 保持聊天控件/编辑器在手机/平板/桌面宽度下响应式

    • 桌面聊天控件保持在一行,初始聊天加载时避免重复头像刷新

    • 向下滚动对话时隐藏该行

    • 将连续重复的文本消息折叠为带计数的单个气泡

  • Cron 界面:新建 Job 侧边栏可折叠,作业列表可回收空间

  • 表头:仪表板面包屑中显示活动代理名称,不添加当前会话键

  • 性能诊断:支持时在调试事件日志中记录浏览器长动画帧或长任务条目

  • Talk 语音界面

    • 失败的 Talk 启动错误可关闭,清除 stale Talk 错误状态

    • 关闭运行时错误横幅时停止并清除失败的实时 Talk 会话

    • 下一次 Talk 点击时从失败的实时 Talk 会话重试

  • Canvas:在浏览器 canvas 主机 URL 和启动挂载日志中保留网关 TLS 方案

  • 媒体安全:为助手媒体获取生成短期作用域票据,渲染带票据的 URL 而不是在聊天图片 URL 中暴露长期 auth token

  • 外观:将 Appearance tweakcn 浏览操作和文档指向实时 tweakcn 编辑器路由

  • Dream Diary:通过清理的 markdown 管道渲染散文文本

  • 工具输出:渲染到达为文本块数组的工具结果,为展开的工具输出提供可滚动块


6、安全性修复

  • SSRF 保护

    • 现有会话截图前强制执行严格的 SSRF 当前 URL 检查

    • 选项卡范围调试、导出和读取路由前强制执行现有选项卡 URL 导航策略

  • Windows 安全

    • 通过 Windows 安装根验证器验证 SystemRoot/WINDIR env 值,添加到危险主机环境策略

    • 固定 reg.exe 解析到规范的 Windows 安装根

    • 阻止 LOCALAPPDATA 来自工作区 .env,仅从受信任的进程本地 LOCALAPPDATA 解析可移植 Git 路径前缀

    • 通过共享的 Windows 安装根解析器路由 .cmd/.bat 进程包装器,而不是 process.env.ComSpec

  • Auth 范围:限制未绑定的 websocket auth 范围

  • 配对安全:配对命令需要配对作用域

  • 网关路由:强化后端消息动作网关路由

  • 调试代理:托管代理模式活动时禁用调试代理直接上游转发和 CONNECT 隧道


7、模型 / 提供商更新

  • OpenAI / Codex

    • 在运行时和清单元数据中通告 Codex 音频转录

    • 将活动的 Codex 聊天模型路由到 OpenAI 转录默认值,而不是发送聊天模型 ID

    • 默认直接 OpenAI Responses 模型使用 SSE 传输而不是 WebSocket 自动选择

    • 修复 OAuth 进度旋转器,手动重定向粘贴提示前停止

    • 格式错误的 /codex 控制命令和诊断确认时关闭

    • 清理 Codex 应用服务器命令读数、失败回复、审批提示等文本

    • SSRF 保护的提供程序请求继承 OpenClaw 的 undici IPv4/IPv6 回退策略

  • OpenRouter

    • 添加可选的响应缓存参数,发送 X-OpenRouter-Cache 等头

    • 扩展应用程序归因类别,通告编码、编程、写作、聊天和个人代理使用

  • DeepSeek

    • 将 DeepSeek V4 reasoning_effort 保持在 OpenRouter 支持的值上,将过时的 max thinking 覆盖映射到 xhigh

    • 通过轻量级提供程序策略表面暴露 DeepSeek V4 xhigh 和 max 思考级别

  • Claude:CLI 中传递 Claude Code 的会话范围 --effort 标志


8、 QA 和测试基础设施

  • Mantis Slack 桌面烟雾测试:在 Crabbox VNC 桌面内运行 Slack 实时 QA,打开 Slack Web 并捕获桌面截图

  • Codex harness:添加针对性的实时 Docker/Testbox 诊断、auth 预检检查、缓存挂载修复和应用服务器协议发现

  • 发布验证

    • Slack 凭据未明确配置时跳过 Slack 实时 QA

    • 允许聚焦的 QA 实时重运行选择 Matrix 和 Telegram 而不运行 Slack

    • 通过 Windows 安全的 Node/npm shims 安装跨 OS TypeScript harness

  • 诊断:添加启动阶段跨度、活动工作标签、陈旧终端桥标记和 pnpm gateway:watch 中的默认同步 I/O 跟踪


9、CLI 和 Doctor 改进

  • 插件 Doctor

    • doctor --fix 期间删除孤立或恢复的托管 npm 副本

    • 保留 active auth.profiles 元数据,修复遗留的 API-key 配置文件元数据

    • 修复缺失插件,安装已配置但尚未加载的官方外部插件

    • 清理会话存储中自动创建的陈旧会话路由状态

  • 更新命令

    • 禁用并跳过包更新插件同步失败的插件

    • 包管理器更新期间使用绝对 POSIX npm 脚本 shell

    • 使包更新后续进程显式写入完成结果并退出

    • 暂存 pnpm 检测到的 npm-layout 全局包更新通过干净的 npm 前缀交换

    • 将 OpenClaw 稳定修正版本如 2026.5.3-1 视为比基础稳定版本更新

  • 模型 Auth:添加 openclaw models auth list 命令,检查保存的每代理 auth 配置文件

  • TUI 改进

    • chat.send 解析后跟踪运行中的 runId,按 Esc 中止运行而不是重复打印无活动运行

    • 停止长令牌清理器在行内代码跨度、围栏代码块、表格边框和裸连字符/点标识符中注入文字空格

  • Cron:在 cron show、status 和运行历史中公开失败的隔离运行诊断


10、Windows 兼容性

  • 默认回环网关监听器仅绑定到 127.0.0.1,避免 libuv 双栈 ::1 行为导致 localhost HTTP 请求楔住

  • 在 resolvePreferredOpenClawTmpDir 中跳过 POSIX /tmp/openclaw 首选路径,日志和 TTS 临时文件写入 %TEMP%\openclaw-<uid>

  • fsync 前以读/写模式打开保存的附件临时文件,修复 Windows WebChat 和 chat.send 媒体卸载时的 EPERM 失败

  • 接受驱动器绝对的 Docker 绑定源,同时保持沙盒阻塞路径和允许根策略比较 Windows 大小写不敏感

  • 将写入后媒体 fsync 步骤的 EPERM 视为尽力而为,允许上传完成


11、Docker 和部署

  • 除非构建明确选择加入,否则从运行时映像中修剪包排除的插件 dist 目录

  • 固定容器端 OPENCLAW_CONFIG_DIR 和 OPENCLAW_WORKSPACE_DIR 在网关和 CLI 服务上,避免主机样式工作区路径泄漏到运行时代码

  • 修复 macOS Docker 设置上的权限拒绝问题


12、Active Memory 和内存工具

  • 解析 recall 子代理通道时跳过包含 : 的会话存储通道条目,避免 QQ c2c 代理 ID 崩溃

  • 向 recall worker 发送有界的最新消息搜索查询,避免通道/运行时元数据成为内存搜索字符串

  • 未加载内存插件时优雅地跳过内存子代理,而不是记录令人困惑的白名单错误

  • corpus=all 搜索时保留两个语料库的表示,同时回填未使用的结果容量,避免内存命中被数值更高的 wiki 整数分数饿死

  • 在 memory-core 插件运行时依赖集中包含 json5


13、 其他重要修复

  • 子代理:保留每个分组的子结果,直接完成回退必须绕过请求者代理通告回合时;刷新延迟的最终交付有效负载

  • 代理循环检测:pi-embedded-runner 中添加后压缩循环保护,相同(工具、参数、结果)三元组出现 windowSize 次(默认 3)时中止运行

  • WebSocket auth:清除活动回复运行保护后再排出队列中的同会话后续回合,避免 ReplyRunAlreadyActiveError

  • 媒体:流式回复文本在最终 MEDIA: 指令之前到达时避免发送生成的图片、视频和音乐附件两次

  • 遗留配置迁移:恢复 routing.allowFrom、routing.groupChat.* 和 channels.telegram.requireMention 的遗留群聊配置迁移

  • 网关重启:更新后重启验证期间从已安装配置解析本地网关探测 auth

  • 网关关闭:保持关闭路径在稳定运行时块之后,修复手动 npm 包替换无法干净关闭已运行网关的问题

OpenClaw被弃用?🦞和WorkBuddy到底怎么选? 2026-05-05
OpenClaw 和 Hermes Agent 设计哲学深度对比 2026-05-06

评论区