
文|Lambda
剪辑|晓静
4 月初,Hermes Agent 火了。这个名字平直让东说念主联思到挥霍牌爱马仕,是以也被戏称为"爱马仕 Agent "。
它由 Nous Research 在 2 月发布,定位是「The agent that grows with you」。中枢卖点是一个闭环学习系统:Agent 完成复杂任务后,自动把警戒固化成 Skill,下次遭遇雷同任务平直复用,还能在使用过程中接续立异。Skill 自动生成、越用越强——这是 Agent 领域咫尺最有蛊惑力的叙事之一。
但这个叙事讳饰了一个更基本的问题:Skill 果真是刻下 Agent 落地的主要瓶颈吗?

图片由 AI 生成
01 Skill 很性感,但它可能不是最伏击的问题
一个容易被忽略的事实是:咫尺公认体验最佳的编程 Agent 产物之一—— Claude Code,它好用的基石并不是 Skill 的自动进化,而是背后巨额塌实的 CLI 用具守旧。
用 GlobTool 找候选文献,用 GrepTool 定位酌量代码片断,用 FileReadTool 检验完了细节,用 LSPTool 作念代码绮丽跳转和援用分析。每一个王人是详情味的、零 token 蹂躏的原子操作。
但东说念主们很少为这些用具写故事。只须一提到 Agent 能自动生成 Skill、还能接续进化,悉数这个词行业坐窝就忻悦起来。
这个反差阐扬了一件事:CLI (敕令行界面)不性感,不好讲故事,但它才是 Agent 才略的真确地基。
地基不牢,Skill 再见长,也仅仅长在沙地上。
02 龙虾最被东说念主诟病的地方,Skill 自主进化贬责不了
这件事放到 OpenClaw(俗称‘龙虾") 身上会看得更明晰。
OpenClaw 最被东说念主诟病的两点,一是 token 蹂躏大、账单吃不用,二是长本事责任结实性差、经常失联。乍一看是两个问题;往下拆,会发现它们经常来自吞并个泉源:Agent 在用劣质用具——比如脆弱的浏览器自动化——去完资本该由详情味用具完成的任务。
这类资本在社区里并非详尽的悔怨,而有巨额具体案例。
Reddit 上有 OpenClaw 用户提到,我方仅仅思自动化 X 账号发帖,三次尝试就花掉了 10 好意思元,任务还没真确跑通。还有东说念主在 r/automation 里直言,咫尺许多所谓的 AI Agent 浏览器斥逐,骨子上仅仅「披着智能外套的脆弱自动化」——问题不在模子有多笨,而在底层用具本人就不可靠。页面一变、DOM 一改、按钮景色一抖,Agent 就只可一遍遍不雅察、一遍遍重试、一遍遍从新筹办。
而这些「失败但不致命」的试错过程,并不会因为任务没完建立免费——每一次不雅察页面、分析景色、决定下一步,王人在络续蹂躏 token。
于是,结实性问题和资本问题,其实是吞并个问题的两面:用具越脆弱,试错越多;试错越多,token 烧得越快;任务链越长,失联和中断的概率也越高。
从这个角度看,Skill 自主进化贬责的是「奈何更灵敏地使用一个用具」,但并莫得贬责「好用具本人稀缺」的问题。Skill 不错让 Agent 更老成地驾驭一匹跛脚马,但并不可把跛脚马变成沉马。
这才是今天许多 Agent 系统真确卡住的地方:不是 Skill 不够强,而是下面能调养的高质地原子用具太少。
03 Skill 是对模子才略的补丁
Hermes 作念的事情,骨子上是把 Skill 的生成和优化自动化——让 Agent 从警戒中蒸馏常识,不再需要东说念主手写。这确乎贬责了一个着实痛点。
但 Skill 本人有一个更深层的问题:它是当然讲话驱动的,骨子上是模子才略的蔓延,粗略说,是一种对模子才略的假贷。
近况是,巨额 Agent 在用 Skill 加上自主解题才略,完资本该由 CLI 完成的事情——比如以效果低下的浏览器自动化有酌量查一个股票价钱、下载一张图片、提交一个表单。代价很明晰:贵、慢、不结实、调试难。
这里还有一个常见的默契误区,不错叫作念「Skill 可迁徙幻觉」:许多东说念主合计,用强模子写出来的 Skill,不错无缝迁徙给弱模子用。现实上不可。Skill 是当然讲话指示,它对模子才略有隐性依赖;模子一换,行径就可能变。CLI 则不同——它是代码:雷同的输入,弥远给你雷同的输出,无论下面跑的是什么模子。
二者的区别十分昭着:
Skill 调试难,CLI 调试容易;
Skill 烧 token,CLI 近乎零蹂躏;
Skill 吃模子版块,CLI 不吃;
Skill 是语义层钞票,CLI 是扩充层钞票。
如若把 Skill 当成中枢蕴蓄所在,骨子上是把赌注压在模子才略的结实性上。至少在刻下阶段,更值得蕴蓄的是高质地 CLI。
04 当用具和高下文充足好时,Skill 的优先级会当然下落
上头的分析也能从 Anthropic 我方的产物警戒里取得印证。
Anthropic 的想象正经东说念主、Cowork 产物的想象主导者 Jenny Wen 在近期访谈中提到一个细节:她个东说念主其实不奈何用 Cowork 的 Skills 功能。原因不是她含糊 Skill,而是她在 Cowork 里挂载了一个文献夹,内部有我方持久蕴蓄的个东说念主札记、一双一会议纪录、顺手思法和责任不雅察。对她来说,Cowork 从这些材料里仍是学到了充足的信息,以至于她对 Skill 和 Memory 的需求王人被权贵收缩了。
这并不是说 Skill 莫得价值,而是说:当高下文料理充足好、底层用具充足强时,Skill 的优先级会当然下落。
换言之,nba下注Hermes 所强调的 Skill 自主进化并不是错,而是它贬责的问题很可能莫得思象中那么基础。
05 有一件事正在暗暗发生:CLI 的使用者,从东说念主变成了 Agent
如若说 Skill 贬责的是诓骗层的编排问题,那么更底层的变化发生在 CLI 上。
往日,CLI 是为东说念主想象的。给东说念主用的 CLI 不错有交互领导,不错容忍迟滞输出,也不错在文档不全的时候靠用户我方猜——因为东说念主会停驻来,会理会歧义,会重试,会去查文档。
Agent 不一样。
Agent 不睡眠,阻截忍歧义,会并发,会在莫容许预想的时机无尽重试。一个对东说念主类来说「拼集能用」的 CLI,对 Agent 来说可能等于高频事故源。
给 Agent 用的 CLI 必须得志一组十足不同的条件:
一条敕令只产出一个明确终局;
输出是结构化的 JSON;
空虚信息不仅告诉你那里错了,还要告诉 Agent 下一步该奈何办;
长任务必须维持异步,不可让 Agent 傻等;
接口自然维持幂等、重试和并发。
背后唯唯一句话:以前的软件默许使用者要睡眠、会分神、有耐性;咫尺 Agent 不得志这些前提。
一朝使用者从东说念主变成 Agent,CLI 的想象形而上学就需要从新重写。Agent 真确在乎的是 token 蹂躏、缓存射中率、幻觉斥逐、长程结实性,而不是「这个敕令看起来是否优雅」。
06 浏览器里能看到的,王人值得被 CLI 化
有一个实验很能阐扬问题:把 ChatGPT 的网页版变成一个不错被 Agent 调用的 CLI。
作念法并不玄机——通过 Chrome CDP 条约平直驱动浏览器,操作 DOM,填输入框,点发送,恭候翰墨出现,再把终局捏下来。因为复用了已有登录态,行径上和东说念主在浏览器里操作莫得骨子区别。
这个实验背后更大的瞻念察是:浏览器里能看到的,原则上王人不错被 CLI 化。
不仅仅 ChatGPT —— Gemini、音乐生成、视频生成、股票图表,只须能在浏览器里完成的经过,王人不错被代码重叠扩充,临了敛迹成一条 Agent 可调用的敕令。
一朝一个 Web 经过被 CLI 化,它就会从「需要 Agent 一步步盯着网页试错」的经过,变成「可并发、可异步、可幂等的原子操作」。正本要靠浏览器自动化蹂躏巨额 token 才能完成的事,被压缩成了一条敕令、一个结构化终局。
某种真谛上,这是一条很反直观但十分现实的优化旅途:简陋 token 的行径,不是少让 Agent 干活,而是先烧极少 token,把高频经过预制成 CLI。磨刀不误砍柴工。
这个逻辑也不单适用于 Web。桌面诓骗和手机 App,骨子上王人不错被徐徐 CLI 化,what you see is what can cli。咫尺已有不少开源形态在分手激动这三个所在,仅仅三者之间还莫得造成长入的想象讲话和引起大家充足的心疼。
07 分层才是终态
Agent 的改日,除了模子本人的普及,更取决于若何处理好两种逻辑:详情味逻辑和语义逻辑。
前者靠 CLI,后者靠 Skill 的自顺应和进化。Hermes 贬责的是后者,但前者才是今天许多系统真确缺的底座。
如若把 CLI 化推到极致,会出现一件很反直观的事:一类经过十足固定的任务,Agent 只需要判断任务类型、路由到对应 CLI、拿终局追忆——这个过程表面上以至不需要 LLM,几个 if-else 就够了。你以至不错用代码去模拟 LLM 的输入输出接口,零 token、零延迟,络续复用现存的 Agent 调养机制,只在真确需要判断的地方武艺用着实模子。
这有点像 2026 年的一场「代码的文艺回应」——东说念主们运行从新发现,不是悉数「看起来像智能」的问题王人应该交给模子来贬责。
终态的单干应该是三层:
CLI 层:详情味扩充,零 token,可并发,易测试,不依赖任何模子;
Skill 层:高下文编排和警戒蒸馏,越用越强;
LLM 层:提供智能,作念真确需要语义判断的部分。
三层不是竞争联系,而是依赖联系。
今天许多系统的问题在于,它们跳过了 CLI 层,平直让 Skill 和 LLM 去兜底。终局等于:系统又贵又慢,结实性也差。正确的旅途应该是——建立者预制 CLI,表层诓骗自动料理 Skill,LLM 在 Skill 的扶植下使用 CLI 贬降低题。
Hermes 的出现不是尽头,而是一个信号:Skill 层的问题可能正在被贬责,但下一个真确的战场,在 CLI 层。
Web 端、PC 端、挪动端,三大平台系统性的 CLI 纠正才刚刚运行。这可能才是今天 Agent 领域最值得作念、也最不性感,但最瑕玷的事情。
本文来自微信公众号"腾讯科技"nba下注app下载,作家:Lambda,36 氪经授权发布。
米兰体育MiLan(中国)官网
备案号: