888集团

蜜桃网一文看懂AI Agent的13大看法：涵盖Harness、Scaffold、Tool和Skill等

2026-06-07 11:55:29 泉源：刘奎红

字号：默认大超大 | 打印 |

ICLR 2026竣事之后，，，Hugging Face工程师Aritra Roy Gosthipaty发了一条帖子，，，精准戳中了这个问题：“在Agent语境下，，，harness和scaffold究竟是什么意思？？？？？？我在ICLR听到过许多种诠释，，，但始终不明确为什么没有收敛到一个统一的界说。。。。。。。” 这个问题很快引起共识，，，Hugging Face的两位工程师Sergio Paniego和Aritra，，，联手宣布了一篇博客，，，这是一份专门解读最容易被混用的那些看法的手册，，，我通读并编译了全文，，，把其中最焦点的框架拎了出来。。。。。。。 Model，，，就是谁人裸的大语言模子。。。。。。。Claude、GPT、Qwen、DeepSeek、Kimi，，，文本进去，，，文本出来。。。。。。。没有影象，，，没有循环，，，不会自动做任何事。。。。。。。它可以“表达”挪用工具的意图，，，但真正去执行，，，需要别人帮它。。。。。。。 Scaffolding，，，是模子所“看到”的一切。。。。。。。系统提醒词怎么写、工具怎么形貌、输出按什么名堂剖析、跨办法记着什么，，，这些组成模子眼里的天下，，，它塑造了模子的行为界线，，，但自己不认真运行。。。。。。。关于Scaffolding和Harness的区别，，，文章给了一句极其精练的区分：Scaffolding是模子可感知的部分（提醒词、工具界说、输特殊式），，，Harness是驱动模子运行的部分（挪用循环、工具执行、阻止判断）。。。。。。。两位作者也坦率体现，，，一样平常谈天这么讲无伤细腻。。。。。。。但一旦进入训练，，，把Scaffolding和Harness拆开审阅就变得至关主要，，，训练时，，，Scaffolding决议了模子学到什么；；；；；；推理时，，，Harness决议了模子怎么跑。。。。。。。 Agent这个词自己源自强化学习，，，在RL里，，，Agent就是一个函数：吸收视察，，，返回行动。。。。。。；；；；；Ｇ樾挝招卸ブ葱，，，返还视察效果，，，循环继续。。。。。。。这个循环，，，就是今天所有LLM Agent的底层逻辑。。。。。。。用编程Agent当例子最直观：系统提醒词和工具形貌是Scaffolding，，，真正完成挪用模子、执行git diff、运行测试、判断何时阻止谁人循环的，，，是Harness。。。。。。。训练的时间，，，Harness还要并行跑成百上千个这样的循环，，，把效果喂回去更新模子权重。。。。。。。两个产品就算底层用的是统一个模子，，，体感可以完全差别，，，由于它们的Harness做了差别选择。。。。。。。反过来，，，统一个Harness换一个更强的模子，，，体验也会变。。。。。。。 Context Engineering（上下文工程）的焦点问题是，，，Agent每一步看到什么。。。。。。。除了写系统提醒词，，，还要动态治理整个上下文窗口：系统提醒词、工具形貌、对话历史、检索到的知识，，，每一步都可能纷歧样。。。。。。。它和Prompt Engineering的要害区别在于：不是一次性写好就完了。。。。。。。随着Agent运行，，，前几轮的输出会影响在后续挪用中放入什么，，，Harness需要在整个运行历程中自动治理上下文，，，包括删什么、留什么、从那里检索增补，，，不是写个prompt罢了。。。。。。。关于上下文工程，，，训练和推理的蜕化价钱天差地别，，，训练时搞错上下文，，，模子学到过失的工具，，，价钱是重新训练，，，推理时搞错，，，可以修改提醒词然后重新最先即可。。。。。。。影象系统也被纳入了上下文工程的框架。。。。。。。短期影象是单次运行中留在上下文窗口里的内容：对话历史、工具返回效果、之前的推理链。。。。。。。恒久影象跨会话长期化，，，保存外部，，，需要时检索回来注入上下文。。。。。。。两者由Harness在统一套上下文治理逻辑中统一调理。。。。。。。 Policy部分受模子权重影响，，，但最终行为也取决于Scaffolding和Harness，，，统一个模子，，，换一套提醒词、工具或执行循环，，，行为可以截然差别，，，Policy不是Agent，，，Policy界说行为。。。。。。。 Tool Use是最底层。。。。。。。诸如API、代码诠释器、数据库、网络搜索、文件系统等等，，，Agent通过这些接口触及外部天下。。。。。。。模子只会以结构化的名堂表达挪用工具的意图，，，API将其作为一等工具泛起，，，Harness吸收挪用并路由到准确的位置，，，返回效果进上下文，，，然后继续循环。。。。。。。 Sub-agent是最高层。。。。。。。许多人把它当高级工具来用，，，但文章给了明确区分：Sub-agent有自己单独的模子和Scaffold，，，能自力推理、自己调工具，，，甚至能再挪用新的Sub-agent，，，这是它和Tool以及Skill的实质差别。。。。。。。 RL Environment，，，指Agent在训练时可以与之交互的任何系统。。。。。。。它的事情方法是：Agent向它发出一个行动（好比执行一条下令），，，它执行这个行动、更新自身状态，，，然后把新的状态信息返回给Agent。。。。。。。 Trainer，，，认真让Agent的能力逐步提升。。。。。。。它做的事情分三步：第一，，，让Agent重复执行完整使命，，，跑许多轮；；；；；；第二，，，对每一轮的效果打分；；；；；；第三，，，用这些分数来更新Agent内部模子的权重参数，，，让下一次执行更靠近准确谜底。。。。。。。整个历程是自动循环的。。。。。。。 Rollout，，，指Agent完成一次完整使命的全程纪录。。。。。。。内里包括三个部分：Agent在每一步看到了什么信息、它据此做出了什么行动、每一步获得了几多分。。。。。。。这份纪录也被称为trajectory或trace，，，实质上就是算法通太过析大宗这样的纪录，，，找到让分数变高的行为模式。。。。。。。 Sergio和Aritra在文章中写道：“这篇文章的目的不是推行唯一准确的词汇，，，而是提供一个适用的头脑模式。。。。。。。”当一个领域快速生长时，，，其术语的演变速率往往凌驾其共识的形成速率。。。。。。。

蜜桃网

                                蜜桃网我总体的观点是：AI时代的右翼技术加速主义，确实来自资本主义摆脱停滞宿命的冲动，来自对增长放缓的不安、对全球竞争压力的焦虑，以及对霸权滑落的恐惧；然而，正因为这种“加速”是在资本逻辑、平台垄断、金融化激励与地缘竞争框架中展开的，所以它所加速的，不只是技术进步，也包括垄断扩张、分配失衡、民主失灵、全球不平等和资源约束。特别是当下的人工智能技术加速，可能会成为资本主义完美的爆破点！2026年5月，国际期刊《食品与功能》上发表的一项最新研究颠覆了很多人的认知：每天2个鸡蛋，就能通过保护大脑神经元、抗炎，改善阿尔茨海默病患者的认知功能。蜜桃网18岁女生水乳排行榜另一方面，小鹏通过对芯片、编译器、模型的软硬件联合开发，小鹏大幅提升了车端芯片有效算力，将车端模型推理速度提升了12倍。但现在，微软用实际行动证明了，真正的AI体验必须是本地化的、全栈式的，真正的AI PC，应该能在本地读代码、跑模型、调Agent、处理大文件，甚至还能保护企业数据。
                            

                                20260607 ? 蜜桃网一袋大米，分量不重，情谊却深。它承载的，是非洲民众对一位中国科学家最质朴的敬意。它见证的，是非中农业合作惠及普通民众的生动实践。《《甜蜜的处分2》第三季动漫在哪看啊》我们谈论的是几位非常出色的球员。全世界所有豪门都想拥有他们，而我们很幸运，他们现在就在皇家马德里。他们当然会继续留在皇家马德里。
                            

蜜桃网

? 李光志记者林灿摄

                                20260607 ? 蜜桃网作为巴黎圣日耳曼青训体系培养出的后防新星，姆本巴本赛季担任青年队队长，并率队夺得了甘巴代拉杯冠军。在决赛中，他佩戴队长袖标出战，展现出了出色的领导能力和稳定表现。战败沦为玩物BY夏布多昂免费阅读全文所以我们有这些研究者。但目前还没有人在真实赛道赛车的高速行驶中证明自己比人类更快，并且在多车交互的场景下做到这一点。
                            

蜜桃网

? 张瑞海记者易传林摄

                            ? 斯洛文尼亚近5场1胜2平2负,进攻端场均0.9球、失球1.2球,数据轮廓是"防守稳但锋线难拉开"。塞浦路斯近5场2胜0平3负,分差更大、波动也更大,场均进球反而是1.5球、失球1.8球,典型攻防都打开的曲线。H2H历史是这场最有意思的反叙事点:5次最近交锋斯洛文尼亚2胜1平2负,实际只领先一场;近6场交锋扩到3胜1平2负,也并非压倒优势。把"身价5倍差"按到H2H上,塞浦路斯过去10年里始终能从斯洛文尼亚身上拿走点东西——2018年欧国联客场2-1、2021年3月主场1-0,都是含金量不低的胜局。市场把主胜挂到1.31,实际历史成色不到50%胜率,这层错位值得记下。《漫蛙MANWA2官方入口》
                        

【我要推荐】更多推荐：西安一男子杀戮前女友案：曾跟踪踩点十余日，，，谎称快递员入室行凶

扫一扫在手机翻开目今页

链接：
天下人大
|
天下政协
|
国家监察委员会
|
最高人民法院
|
最高人民审查院

国务院部分网站
|
地方政府网站
|
驻港澳机构网站
|
驻外机构

中国政府网 | 关于本网 | 网站声明 | 联系888集团 | 网站纠错

主理单位：蜜桃网　运行维护单位：中国政府网运行中心

版权所有：中国政府网　中文域名：中国政府网.政务

网站标识码bm58232452　京ICP备05070218号　京公网安备11010202000001号

welcometo接待光临888集团(中国)有限公司

国务院客户端

welcometo接待光临888集团(中国)有限公司

国务院客户端小程序

中国政府网微博、微信

主理单位：中国政府网　运行维护单位：中国政府网运行中心

版权所有：中国政府网　中文域名：中国政府网.政务

网站标识码bm58232452

京ICP备05070218号　京公网安备11010202000001号

【网站地图】【sitemap】