首页 网络安全 网安动态 查看内容

Hermes Agent v0.16 发布:桌面版终于能直接装了

2026-6-15 12:54 7 0

摘要: Windows 上装 Agent 工具,最容易卡在几个老问题:Python 版本不对。我看完 release,又试了一下新的桌面版安装流程后,第一反应是:Hermes Agent 终于开始认真处理“普通人怎么打开它”这件事了。
关键词:Agent, Hermes, Desktop, Windows, Issue, Surface, Release, Python, Installing, Node.js


大家好,我是 One。

Hermes Agent v0.16 发了。

这版官方叫 The Surface Release。

我看完 release,又试了一下新的桌面版安装流程后,第一反应是:Hermes Agent 终于开始认真处理“普通人怎么打开它”这件事了。

以前介绍 Hermes Agent,很容易讲到底层能力。

tool calling。
memory。
skills。
gateway。
cron。
多 Agent。
跨平台消息入口。

这些都重要。

但对很多人来说,第一道门槛不是“Agent 能不能长期记住我”。

第一道门槛是:我到底怎么把它装起来,怎么打开,怎么发第一句话。

命令行再强,如果每次都像在修服务器,普通人不会天天用。
配置再灵活,如果第一天就让人面对一堆 provider、toolsets、gateway、MCP,新用户很容易直接关掉。
模型再多,如果切换模型像背命令,最后还是只用一个。

Hermes Agent v0.16 这版,修的就是这些“每天摸到的地方”。

官方这次的数据也挺夸张。

从 v0.15.2 到 v0.16.0,合了 542 个 PR,874 个 commits,改了 1962 个文件,关闭 399 个 issues,其中包括 2 个 P0、62 个 P1、16 个 security-tagged issues,还有 170 个社区贡献者参与。

这不是一个小补丁。

这是一次把 Hermes 从“会用的人觉得很强”,往“普通人也能开始用”推的版本。

桌面版,是这次最大的变化

v0.16 最显眼的变化,是 Hermes Desktop。

官方桌面页写得很直接:Hermes Desktop 是 macOS、Windows、Linux 上的原生应用。

入口也很简单:

https://hermes-agent.nousresearch.com/desktop

页面上有三个下载入口:

macOS 12+。
Windows 10 / 11。
Linux 任意发行版,通过 terminal 安装。

我这次重点看的是 Windows 桌面版。

打开以后,第一屏不是一堆命令,也不是让你先去读文档。

就是一个很直接的安装入口:

Install Hermes

这件事看起来很小。

但对 Agent 产品很关键。

以前你要跟别人说:先装 Python,再装依赖,再配 provider,再进 CLI,再跑 setup。

听到这里,很多人已经不想继续了。

现在至少可以说:下载桌面版,点 Install Hermes,等它把环境装完。

对一个开源 Agent 来说,这就是从开发者工具往普通应用走的一步。

安装器把脏活收进去了

真正开始安装后,Hermes Desktop 会进入一个安装器流程。

我这张截图里能看到,它显示的是 0 of 16 steps,第一步是:

Installing uv package manager

后面还列了这些步骤:

Verifying Python 3.11。
Installing Git。
Detecting Node.js。
Installing ripgrep and ffmpeg。
Cloning Hermes repository。
Creating Python virtual environment。
Installing Python dependencies。
Installing Node.js dependencies。
Building desktop app。
Adding Hermes to PATH。
Writing configuration templates。

这张图其实比 release note 里的大段描述更说明问题。

Hermes Agent 不是一个纯前端聊天壳。

它背后需要 Python 环境、Git、Node.js、ripgrep、ffmpeg、虚拟环境、依赖安装、桌面应用构建、PATH 配置。

以前这些东西一旦摊到用户面前,就会变成一堆安装教程。

现在桌面安装器把它们收进一个流程里。

这不代表永远不会失败。

但它至少把“我该先装什么”这个问题从用户手里拿走了。

对 Windows 用户尤其重要。

Windows 上装 Agent 工具,最容易卡在几个老问题:

Python 版本不对。
Git 没装。
Node 找不到。
PATH 没生效。
依赖装一半失败。
当前终端认不到新命令。

桌面安装器如果能把这些前置步骤串起来,Hermes 的第一天体验会好很多。

安装完,它真的像一个应用了

安装完成后,Hermes Desktop 打开就是一个完整的桌面界面。

左侧能看到 New session、Skills & Tools、Messaging、Artifacts、Search sessions。

底部状态栏能看到 Gateway ready、Agents、Cron。

右下角能看到当前模型和版本信息:

GPT-5.5 · Med
v0.16.0

输入框里写的是:

What are we building?

这就和以前的 CLI 感觉完全不一样了。

以前 Hermes Agent 很强,但强在你愿意进入命令行以后。

现在它开始把很多核心入口放到一个桌面壳里。

New session 是会话入口。
Skills & Tools 是能力入口。
Messaging 是消息平台入口。
Artifacts 是产物入口。
Search sessions 是历史入口。
底部的 Gateway、Agents、Cron 则直接告诉你:它不是一个普通聊天窗口。

它背后还有常驻消息平台、多 Agent、定时任务这些长期能力。

我比较喜欢这个设计。

它没有把 Hermes 简化成一个“AI 聊天软件”。

它只是把原来散在 CLI、配置文件、命令里的东西,放到了更容易理解的位置。

第一句话能跑,比全功能更重要

我让它回答了一句:

用一句话介绍你自己,并说明你现在运行在 Windows 原生环境里。

它返回的是:

我是运行在 Hermes Agent 上的 AI 助手,可以帮你查资料、写代码、操作工具并验证结果;我现在运行在 Windows 原生环境中。

这一步不要小看。

对新用户来说,第一天最重要的不是把所有能力都打开。

而是确认四件事:

第一,桌面应用能启动。
第二,模型能返回。
第三,输入输出链路正常。
第四,当前环境确实不是 WSL 里绕出来的,而是 Windows 原生环境。

很多 Agent 工具的问题,不是功能不够。

是用户第一天就被配置、依赖、环境、权限、模型 key 搞到怀疑人生。

Hermes Desktop 这次至少把第一步往前推了一大截。

先让用户发出第一句话。

后面再慢慢打开 tools、skills、gateway、cron、MCP。

顺序很重要。

远程 Hermes,比桌面本身更关键

桌面版还有一个点,我觉得比 UI 更重要。

它可以连远程 Hermes gateway。

翻成人话就是:你的电脑上可以只跑一个轻量桌面壳,真正的 Agent 跑在远程服务器、家里的 homelab、团队共享机器,或者你专门放 API keys 和环境的那台机器上。

连接方式也比以前正规。

支持 OAuth。
支持用户名密码。
支持 secure WebSocket。
每个 profile 可以指向自己的远程 host。
一个窗口里可以跑多个 profile 的并发 sessions。

这个设计很实际。

因为很多人用 Agent 到后面,都会遇到同一个问题:本地电脑不是最适合长期跑 Agent 的地方。

你的 laptop 会休眠。
网络会变。
环境会乱。
API key 不想散在多台机器上。
有些任务需要服务器常驻。
有些工具链只在某个环境里稳定。

所以长期看,Agent 更像一个“后端服务”。

桌面端只是入口。

重的东西应该跑在更稳定的地方。

v0.16 把这个关系做清楚了:本地是界面,远端是工作系统。

这比单纯做一个漂亮聊天窗口要有价值。

Web Dashboard 开始像后台了

这版还有一个大变化,是 Web Dashboard。

它不再只是看 sessions 的地方。

官方这次把它往完整 admin panel 推了一步。

你可以在浏览器里处理 MCP catalog。
可以开关 MCP server。
可以配置 messaging channels。
可以管 credentials。
可以建 webhooks。
可以看 memory。
可以控制 gateway。
可以做 system check 和 debug share。

以前这类事情经常要 SSH 上去改 config.yaml

能做,但很麻烦。

更麻烦的是,一旦你把 Hermes Agent 部署成团队或长期系统,配置就不再是一次性动作。

今天要加一个 Slack。
明天要换一个 provider。
后天要看 MCP server 为什么没起来。
再过几天要查某个 gateway channel 是否正常。

全靠命令行和配置文件,就会越来越像运维活。

Dashboard 的价值在这里。

它让 Hermes Agent 从“一个开发者自己会调的工具”,往“一个可以被管理的系统”走。

Agent 真的要进入日常,不只是模型要聪明。

管理入口也要正常。

简体中文支持,别小看

这版 Hermes Desktop 已经支持完整简体中文。

官方写的是:桌面应用所有 UI surface 都有简体中文翻译,包括聊天窗口、侧边栏、设置、command center、cron、messaging、profiles、skills、agents 等。

英文还是默认语言,你可以在 Appearance settings 里切换,选择会保存到配置里的 display.language

这件事对中文用户很直接。

不是所有人都卡在英文阅读上。

但如果一个工具每天要用,界面语言会影响心理成本。

尤其是 Hermes Agent 这种系统,里面有 provider、model、profile、skills、tools、gateway、cron、memory、MCP 这些概念。

这些词单独看都不难。

但堆在一起,新用户很容易在第一天就觉得“这东西太工程化了”。

桌面端支持中文,至少把第一层阻力降了一点。

这不是决定 Hermes 能不能成功的核心技术。

但它会影响中文用户愿不愿意把它推荐给身边没那么工程背景的人。

Quick Setup,是给新用户留门

Hermes Agent 以前的问题不是不能配。

是能配的东西太多。

provider、model、toolsets、gateway、memory、skills、MCP、cron、browser、terminal、file、vision……

重度用户会觉得爽。

新用户会觉得不知道先点哪里。

v0.16 这次把首次 setup 拆成两个路径:Quick Setup 和 Full Setup。

Quick Setup 走 Nous Portal,登录、选模型,然后先开始聊天。
Full Setup 留给想把细节一次配完的人。

还加了一个更像人话的入口:

hermes portal

我觉得这个方向是对的。

Agent 工具最忌讳第一天就把所有能力摊给用户。

因为新用户第一天真正需要的,不是把所有工具都打开。

而是跑通一条最短链路。

如果你已经装了 Hermes Agent,可以这样:

hermes update
hermes doctor
hermes

或者直接测一次:

hermes chat -q "Say hello from Hermes Agent"

如果你是第一次用桌面版,就先走桌面安装器。

能打开。
能发第一句话。
能看到模型和版本。
能确认 gateway、agents、cron 这些入口在。

这比第一天把所有工具都配完更重要。

模型选择终于不用背全名

这版 model picker 也改了。

官方说桌面、Web、TUI、CLI 都支持 fuzzy search。

你输入几个模糊字符,就能找到模型。

比如官方举的例子,输入 v4fl,可以搜到 deepseek-v4-flash

多 endpoint provider 会被归到同一行,不再把列表挤得很乱。模型 catalog 也从每天刷新改成小时级刷新。

这听起来是个小功能。

但模型多了以后,这种小功能会变成刚需。

以前你换模型,常常要记完整名字。

Claude、GPT、Gemini、DeepSeek、Qwen、MiniMax、各种 flash、plus、preview、thinking、reasoning 后缀混在一起。

最后很多人干脆不换。

不是不想试。

是懒得找。

Hermes Agent 作为 provider-agnostic 的 Agent,本来就应该把模型切换做得很轻。

这版新增的模型里,官方提到 deepseek-v4-flashMiniMax-M3 1M context、qwen3.7-plus,还有 gemini-3.5-flash 进入 Gemini OAuth 和 API-key pickers。

模型越来越多以后,选择器本身就是生产力工具。

能搜到,才会真的用起来。

默认 skills 变瘦,是好事

v0.16 还有一个我很喜欢的变化:默认 skill set 变瘦了。

官方删掉了一批冗余或已经死掉的 skills。

比如 spotify 被 native Spotify plugin 的 7 个工具替代,linear 可以走 hermes mcp install linear,还有一些 stale domain、空 category markers、旧 kanban/codex lane 类内容被清掉。

一些更重、更小众的 skills,也从 bundled 移到 optional。

比如 Baoyu creative set、dspysubagent-driven-developmentminecraft-modpack-serverpokemon-player 等。

不是不能用。

而是不应该默认塞给所有人。

这个判断很重要。

Agent 的上下文不是垃圾桶。

skills 越多,不等于 Agent 越强。

默认列表越乱,picker 越难用,提示词越重,用户也越不知道该选什么。

Hermes Agent 这次还加了 environments: relevance gate。

比如 kanban、docker、s6 这类环境相关的 skills,不会对不需要的人一直出现在索引里;但你显式要加载时,它还是能加载。

这就是一个长期系统该做的事。

不是把所有能力堆到首页。

而是让默认路径干净,让高级能力在需要时出现。

NVIDIA skills 进 trusted tap

这版还有一个生态信号:NVIDIA/skills 成了默认 trusted Skills Hub tap。

它和 OpenAI、Anthropic、HuggingFace 一样,进入 Hermes 的可信技能来源。

官方提到 CUDA-X、AIQ、cuOpt 等 NVIDIA 产品栈相关 verified skills,可以通过同一套 Skills Hub 流程浏览、搜索、安装、自动更新。

这个点对普通用户可能没那么直接。

但对做 AI infra、GPU、优化、部署的人会有意义。

Agent 的 skill 系统如果只靠用户自己沉淀,会很慢。

如果大厂和生态方开始把自己的操作知识做成 skills,Agent 就不只是会查文档。

它可以开始继承一部分“官方推荐的工作方式”。

当然,skills 也不能神化。

官方 skill 不等于所有场景都能直接套。

但可信来源越多,Agent 从“会调用工具”走向“知道怎么用工具”的速度会更快。

/undo 终于来了

这版还有一个非常人类的功能:

/undo [N]

你可以撤回最近 N 轮 user turns,Hermes 会把你最后一条消息预填回来,让你编辑后重发,并软删除中间的 turns。

CLI、TUI、消息平台都支持。

这个功能看起来不大。

但真用 Agent 的人都知道,它很必要。

你经常会遇到这种情况:

一句话没说清楚,Agent 开始往错方向跑。
贴错了文件,后面上下文全乱了。
临时改了需求,但前面几轮已经把模型带偏。
工具调用出问题,你想回到前一个干净状态。

以前很多时候只能开新会话。

但开新会话又会丢掉前面有用的上下文。

/undo 解决的不是“删除聊天记录”这种表层问题。

它解决的是 Agent 工作流里很常见的一个动作:回到还没走歪的地方。

每天用的 Agent,必须允许你后悔。

安全和可靠性继续补

v0.16 不是只有界面。

这版也关了不少安全和可靠性问题。

官方提到 399 个 issues closed,其中有 2 个 P0、62 个 P1、16 个 security-tagged。

安全部分包括 CVE-2026-48710 Starlette BadHost pin 到 patched Starlette 版本,异步路径里的 URL SSRF checks 移出 event loop,subprocess env 里剥离 Bedrock inference bearer token,把 bws_cache.json 加进 file-safety read guard,还处理了一些 invisible unicode、dangerous patterns、approval/sudo context 之类的问题。

这些东西没有桌面端好传播。

但对 Agent 很关键。

因为 Agent 不是普通聊天框。

它会读文件。
会跑命令。
会接网页。
会碰凭证。
会从消息平台收任务。
会把工具输出塞回上下文。

只要它开始真的做事,安全和可靠性就不是附加项。

尤其是你把 Hermes 接进飞书、Slack、Telegram,或者放到服务器常驻以后,很多问题就不是“本地玩坏了重来”那么简单。

这版继续补这些底层洞,说明 Hermes 还是在往长期系统方向走。

新用户别一上来全开

如果你还没用过 Hermes Agent,我还是建议从最小链路开始。

不要第一天就桌面端、远程 gateway、MCP、cron、多平台消息、几十个 skills 全部打开。

可以按这个顺序来:

先安装桌面版
发出第一句话
确认模型和版本
跑一次 doctor
再开 file / terminal / skills
再接 gateway
再接 cron
再接 MCP
最后再玩多 profile、远程 Hermes 和多 Agent

不要反过来。

Agent 系统坏起来,最怕层太多。

你同时开了模型、浏览器、文件、终端、消息平台、定时任务、远程连接,最后一个环节不通,你很难判断是 key 问题、环境问题、权限问题、网络问题,还是 Agent 自己的问题。

先让它稳定回答。

再让它稳定用工具。

再让它稳定出现在你的工作入口里。

最后再让它替你长期跑任务。

这条路虽然慢一点,但不会三天新鲜感以后就废掉。

这版值得升

Hermes Agent v0.15 的关键词是 Velocity。

那版更像是在把底盘打快:核心文件瘦身、session_search 变快、多 Agent 编排变实、提示注入和密钥管理补起来。

v0.16 的关键词是 Surface。

它不是只在底层继续拧螺丝,而是在把普通人每天摸到的地方补齐。

桌面版。
安装器。
远程 gateway。
Web admin。
简体中文。
Quick Setup。
fuzzy model picker。
更瘦的默认 skills。
NVIDIA trusted tap。
/undo
安全和可靠性修复。

这些东西放在一起看,方向很清楚。

Hermes Agent 不想只停在一个强 CLI agent。

它在往一个“可安装、可打开、可管理、可远程、可长期使用”的 Agent 系统走。

Demo 拼的是惊喜。

每天用的 Agent,拼的是入口够不够顺,坏了能不能修,配置能不能管理,出了错能不能退回去。

Hermes Agent v0.16 这版,就是在这些地方继续往前走了一步。

以上,


本文出处: https://mp.weixin.qq.com/s/xzKzupwai-4usN_wma58jQ
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋
返回顶部