“龙虾”热后,各种Agent层出不穷,各种新概念也是层出不穷,颇有点招架不住的态势。不过,再怎么难,也得跟上潮流,死磕到底。
Skills图示(来源:网络)
一、Agent Skills(智能体技能)
基本概念
Agent Skills 是 AI Agent 的能力单元,指智能体能够执行的具体任务或功能模块。每个 Skill 封装了特定的工具调用、API 接口、数据处理逻辑或业务功能,使 Agent 能够完成从简单查询到复杂多步骤操作的各类任务。
核心特征
| 特征 | 说明 |
|---|---|
| 模块化 | 每个 Skill 独立封装,可插拔复用 |
| 原子性 | 单一职责,完成一个明确的功能 |
| 可组合 | 多个 Skills 可串联形成工作流 |
| 自描述 | 包含名称、描述、参数定义等元信息 |
编写规范
Agent Skill 通常包含以下结构:
# Skill 元信息
name: "skill_name" # 技能标识名(英文,小写+下划线)
description: "描述该技能的功能" # 让LLM理解何时调用该技能
version: "1.0.0"
# 输入参数定义
parameters:
- name: "param1"
type: string | number | boolean | array | object
description: "参数说明"
required: true/false
default: "默认值" # 可选
# 执行逻辑
execution:
type: "api_call" | "code" | "llm" | "workflow"
# 根据类型定义具体执行内容
# 返回值定义
returns:
type: object
description: "返回结果说明"
schema:
# JSON Schema 定义
实际示例
示例:天气查询 Skill
name: "get_weather"
description: "查询指定城市的当前天气和未来3天预报。当用户询问天气、温度、降雨情况时调用。"
version: "1.0.0"
parameters:
- name: "city"
type: string
description: "城市名称,如'北京'、'上海'"
required: true
- name: "days"
type: number
description: "预报天数,1-7天"
required: false
default: 3
execution:
type: "api_call"
endpoint: "https://api.weather.com/v1/current"
method: "GET"
headers:
Authorization: "Bearer ${WEATHER_API_KEY}"
params:
city: "{{city}}"
days: "{{days}}"
returns:
type: object
description: "天气信息"
schema:
current:
temperature: number
condition: string
humidity: number
forecast: array
二、Harness(测试/执行框架)
概念定义
Harness( harness 原意为"马具/安全带")在 AI 领域通常指测试框架或执行环境。LangChain 作者 Vivek Trivedy定义: Agent = Model + Harness
如果你不是模型,那就是 Harness。
这句话听起来有点绝对,但确实抓住了关键。Harness 本质上就是模型之外的一切:代码、配置,以及各种执行逻辑。模型本身只是能力的来源,只有通过 Harness 把状态、工具调用、反馈循环和约束机制串起来,它才真正变成一个 Agent。
harness图示(来源:知乎)
用于:
- Skill 测试:验证 Skill 的正确性和鲁棒性
- Agent 评估:评估 Agent 在多轮对话、复杂任务中的表现
- 执行控制:管理 Skill 的调用流程、错误处理、资源限制
核心功能
| 功能 | 说明 |
|---|---|
| 沙箱执行 | 隔离环境运行 Skill,防止安全风险 |
| 输入验证 | 校验参数类型、必填项、取值范围 |
| 模拟测试 | Mock 外部依赖,测试 Skill 逻辑 |
| 性能监控 | 记录执行时间、资源消耗 |
| 错误捕获 | 统一异常处理,防止 Agent 崩溃 |
传统框架解决的是"如何构建 AI 智能体",而Harness解决的是完全不同的问题:"智能体如何可靠地运行"。模型正在逐渐吸收框架约 80% 的功能(智能体定义、消息路由、任务生命周期……),但剩余 20%——持久化、确定性重放、成本控制、可观测性、错误恢复——正是驾驭层存在的价值。Harness 是整个行业正在经历的范式转移。
Birgitta Böckeler 的总结最为精辟:
"为了获得更高的 AI 自主性,运行时必须受到更严格的约束。增加信任需要的不是更多自由,而是更多限制。"就像高速公路上的护栏——正是因为有护栏,你才敢踩到 120 码。