第十一章:目标设定与监控
要让 AI 智能体真正有效且有目的性,它们不仅仅需要处理信息或使用工具的能力,更需要明确的方向感,并能够知道自己是否真的在取得成功。这就是目标设定与监控模式发挥作用的地方。该模式旨在为智能体提供要努力实现的具体目标,并配备跟踪进度和判断这些目标是否实现的手段。
想想计划一次旅行。你不会凭空就出现在目的地。你需要决定想去哪里(目标状态),弄清楚从哪里出发(初始状态),考虑可用的选项(交通、路线、预算),然后规划出一系列步骤:订票、打包行李、前往机场/车站、登上交通工具、到达、找到住宿地等。这个逐步进行的过程,通常考虑依赖关系和约束条件,基本上就是我们在智能体系统中所说的规划。
在 AI 智能体的背景下,规划通常涉及智能体接受一个高层目标,自主或半自主地生成一系列中间步骤或子目标。这些步骤可以顺序执行,或以更复杂的流程执行,可能涉及其它模式,如工具使用、路由或多智能体协作。规划机制可能涉及复杂的搜索算法、逻辑推理,或者越来越多地利用大语言模型 (LLMs) 的能力,基于它们的训练数据和任务理解来生成合理且有效的计划。
良好的规划能力,使智能体不止能够处理简单的单步查询问题。规划还使得智能体能够处理多个面向的请求,通过重新规划来适应变化,并编排复杂的工作流程。这是一个基础模式,支撑着许多高级智能体行为,将简单的反应式系统,转变为能够主动努力实现既定目标的系统。
实际应用场景
目标设定与监控模式,对于构建能够在复杂现实场景中自主可靠运行的智能体至关重要。以下是一些实际应用:
自动化客户支持: 智能体的目标可能是“解决客户的账单查询”。它监控对话,检查数据库条目,并使用工具调整账单。通过确认账单变更和收到积极的客户反馈来监控是否成功。如果问题未解决,它会升级处理。
个性化学习系统: 学习智能体的目标可能是“提高学生对代数的理解”。它监控学生在练习上的进度,调整教学材料,并跟踪准确性和完成时间等性能指标,如果学生遇到困难则调整其方法。
项目管理助手: 智能体可以被赋予“确保项目里程碑 X 在 Y 日期前完成”的任务。它监控任务状态、团队沟通和资源可用性,如果目标存在风险,则标记延迟并建议纠正措施。
自动交易机器人: 交易智能体的目标可能是“在风险容忍范围内最大化投资组合收益”。它持续监控市场数据、当前投资组合价值和风险指标,在条件符合目标时执行交易,如果违反风险阈值则调整策略。
机器人和自动驾驶车辆: 自动驾驶车辆的主要目标是“安全地将乘客从 A 点运送到 B 点”。它不断监控环境(其它车辆、行人、交通信号)、自身状态(速度、燃料)以及沿计划路线的进度,调整驾驶行为以安全高效地到达目的地。
内容审核: 智能体的目标可能是“识别并删除平台 X 上的有害内容”。它监控输入内容,应用分类模型,并跟踪误报/漏报等指标,调整过滤标准或将不确定的情况升级到人工审核。
对于需要可靠运行、实现特定结果并适应动态条件的智能体来说,这种模式是基础,它为智能化的自我管理提供了必要的框架。
实战示例
为了说明目标设定与监控模式,我们有一个使用 LangChain 和 OpenAI API 的示例。这个 Python 脚本概述了一个自主 AI 智能体,专门用于生成和优化 Python 代码。其核心功能,是为特定问题生成解决方案,并确保符合用户定义的质量基准。
它采用“目标设定和监控”模式,不只是生成一次代码,而是进入创建、自我评估和改进的迭代循环。智能体的成功,通过其自身的 AI 驱动判断来衡量,即生成的代码是否满足初始目标。最终输出一个经过润色、注释完整、可随时使用的 Python 文件,代表了这一优化过程的最终成果。
依赖项:
您可以把它想象为,一个被分配到项目的自主 AI 程序员,这样可以更好地理解这个脚本(见图 1)。当您向 AI 提供详细的项目简报时 - 就是它需要解决的特定编程问题——它就开始工作了。
除了这个简报,您还提供一个严格的质量检查清单,这代表了最终代码必须满足的目标——诸如“解决方案必须简单”、“它必须正确地运行”或“它需要处理意外的边界情况”等标准。
图 1:目标设定与监控示例
接到这个任务后,AI 程序员开始工作并生成代码初稿。然而,它不会立即提交这个初始版本,而是暂停下来,去执行一个关键步骤:严格的自我审查。它一丝不苟地,扮演自己的质量保证检查员,将自己的创作与您提供的质量检查清单逐项比较。检查完成后,它对自己的进展给出一个简单、公正的评判:如果工作符合所有标准,则为“True”,如果未达到标准,则为“False”。
如果评判结果为“False”,AI 也不会放弃。它会进入一个深思熟虑的修订阶段,利用自我批判的见解来找出弱点,并智能地重写代码。这种起草、自我审查和优化的循环持续进行,朝向目标一次次迭代。这个过程重复进行,直到 AI 满足每一个要求,最终达到“True”状态,或者达到预先设定的尝试次数限制——就像一个面对截止日期的开发者一样。一旦代码通过了最终检查,脚本就会打包经过润色的解决方案,添加有用的注释,并将其保存到一个新的 Python 文件中,以待使用。
警告和注意事项: 需要注意的是,这是一个示例性说明,而不是生产就绪的代码。对于实际应用,必须考虑几个因素。LLM 可能无法完全理解目标,可能会错误地评估其表现为成功。即使很好地理解了目标,模型也可能产生幻觉。尤其是当一个 LLM 既负责编写代码又负责判断其质量时,它可能更难发现自己走错了方向。
最终,LLM 不会神奇地产生完美无缺的代码;您仍然需要运行代码并测试。此外,示例中的“监控”很基础,存在进程永远无法结束的风险。
充当专业代码评审员,深度致力于生成整洁、正确且简单的代码。您的核心使命,是通过确保每个建议都基于实际情况和最佳实践,来消除代码“幻觉”。当我向您提供代码片段时,我希望您:-- ** 识别和纠正错误**: 指出任何逻辑缺陷、错误或潜在的运行时错误。-- ** 简化和重构**: 在不牺牲正确性的前提下,提出改善代码可读性、性能和可维护性的修改。-- ** 提供清晰的解释**: 对于每个建议的变更,引用整洁代码、性能或安全的原则,解释为什么它能改进代码。-- ** 提供更正后的代码**: 显示您建议变更的前后对比,使改进更清晰。您的反馈应该是直接的、建设性的,并且始终旨在提高代码质量。
更健壮的途径,涉及通过给一组智能体分配特定角色来分离这些关注点。例如,我使用 Gemini 构建了一个个人 AI 智能体团队,其中每个智能体都有特定角色:
程序员同伴: 帮助头脑风暴和编写代码。
代码评审员: 发现错误并提出改进建议。
文档编写员: 生成清晰简洁的文档。
测试编写员: 创建全面的单元测试。
提示词优化员: 优化与 AI 的交互。
在这个多智能体系统中,代码评审员作为与程序员智能体分离的实体,具有类似于示例中评判者的提示词,这使得评估更加客观。这种结构,自然带来更好的实践,因为测试编写员智能体可以满足为同伴程序员生成的代码编写单元测试的需求。
添加更复杂的控制并使代码更接近生产就绪,这个任务就留给感兴趣的读者了。
要点速览
是什么: AI 智能体通常缺乏明确的方向,使它们无法有目的地行动,只能执行简单的反应式任务。如果没有定义目标,它们就无法独立处理复杂的多步骤问题或编排复杂的工作流程。此外,它们没有内嵌的机制来确定自己的行动是否会带来成果。这限制了它们的自主性,阻碍了它们在动态的现实场景中真正发挥作用,因为这种场景下,仅执行任务是不够的。
为什么: 目标设定与监控模式,通过将目的感和自我评估,嵌入到智能体系统中来提供标准化解决方案。它涉及明确定义智能体要实现的清晰、可测量的目标。同时,它建立了一个监控机制,持续跟踪智能体的进度,并且对比目标与环境状态。这创建了一个关键的反馈循环,使智能体能够评估其表现,纠正其路线,并在偏离成功路径时调整其计划。通过实施这种模式,开发人员可以将简单的反应式智能体转变为能够自主可靠运行的主动的、目标导向的系统。
经验法则: 当 AI 智能体必须自主执行多步骤任务、适应动态条件,并在没有持续人工干预的情况下,可靠地实现特定的、高层次的目标时,请使用这种模式。
可视化总结 :
图 2:目标设计模式
核心要点
核心要点包括:
目标设定与监控,为智能体提供了目的感和进度跟踪机制。
目标应该是具体的、可测量的、可实现的、相关的和有时限的 (SMART)。
明确定义指标和成功标准,对于有效监控至关重要。
监控,涉及观察智能体行动、环境状态和工具输出。
来自监控的反馈循环,允许智能体适应、修订计划或升级问题。
在 Google 的 ADK 中,目标通常通过智能体指令传达,监控则通过状态管理和工具交互来完成。
结语
本章重点讨论了目标设定与监控这一关键范式。我强调了这一概念如何将 AI 智能体从纯粹的反应式系统转变为主动的、目标驱动的实体。文本强调了明确定义可测量目标和建立严格监控程序以跟踪进度的重要性。实际应用展示了这一范式如何在各个领域(包括客户服务和机器人技术)支持可靠的自主操作。一个概念性编码示例,说明了在结构化框架内实现这些原则,使用智能体指令和状态管理,来指导和评估智能体实现其指定目标的能力。最终,为智能体配备制定和监督目标的能力,是构建真正智能和负责任的 AI 系统的基石。
参考文献
SMART 目标框架 https://en.wikipedia.org/wiki/SMART_criteria