习题
提示:以下的部分习题没有标准答案,重点在于培养学习者对智能体系统批判性的深入思考和动手实践能力。
1. 请分析以下四个 case 中的主体是否属于智能体,如果是,那么属于哪种类型的智能体(可以从多个分类维度进行分析),并说明理由:
case A:一台符合冯·诺依曼结构的超级计算机,拥有高达每秒 2EFlop 的峰值算力
- 答: :不属于智能体,原因是无对环境的感知和反应
case B:特斯拉自动驾驶系统在高速公路上行驶时,突然检测到前方有障碍物,需要在毫秒级做出刹车或变道决策
- 答: :是智能体,反应型智能体,基于目标的智能体(保证安全)
case C:AlphaGo在与人类棋手对弈时,需要评估当前局面并规划未来数十步的最优策略
- 答: :是智能体,规划型智能体,学习型智能体
case D:ChatGPT 扮演的智能客服在处理用户投诉时,需要查询订单信息、分析问题原因、提供解决方案并安抚用户情绪
- 答: : 是智能体,是反应型智能体和规划型智能体的综合
2. 假设你需要为一个"智能健身教练"设计任务环境。这个智能体能够:
- 通过可穿戴设备监测用户的心率、运动强度等生理数据
- 根据用户的健身目标(减脂/增肌/提升耐力)动态调整训练计划
- 在用户运动过程中提供实时语音指导和动作纠正
- 评估训练效果并给出饮食建议
请使用 PEAS 模型完整描述这个智能体的任务环境,并分析该环境具有哪些特性(如部分可观察、随机性、动态性等)。
提示:什么是PEAS模型:PEAS 模型是人工智能领域中用于精确描述和分析智能体(Agent)任务环境的一个经典框架。你可以把它想象成一份为智能体量身定制的“工作说明书”,它通过四个维度清晰地定义了智能体的工作边界和目标。
PEAS 是四个英文单词的首字母缩写,分别代表:
-
P (Performance) - 性能度量
- 含义: 如何衡量智能体的表现是好是坏?这是评估智能体是否成功的标准。 -
E (Environment) - 环境
- 含义: 智能体在什么样的世界里运作?这是智能体所处的外部场景和条件。 -
A (Actuators) - 执行器
- 含义: 智能体能够执行哪些动作来影响环境?这是智能体的输出手段。 -
S (Sensors) - 传感器
- 含义: 智能体能够感知到环境的哪些信息?这是智能体的输入渠道。
-
答: :
p: 心率达标率、动作准确度、用户受伤率为0 (这是度量)
e;健身房/家庭环境、用户的身体状态、噪音干扰
a;扬声器(语音)、屏幕(视觉反馈)、App接口(更新计划)
s: 心率带/手表(生理)、摄像头(视觉动作)、麦克风(语音)
-
3. 某电商公司正在考虑两种方案来处理售后退款申请:
方案 A(Workflow):设计一套固定流程,例如:
A.1 对于一般商品且在 7 天之内,金额 < 100RMB 自动通过;100-500RMB 由客服审核;>500RMB 需主管审批;而特殊商品(如定制品)一律拒绝退款
A.2 对于超过 7 天的商品,无论金额,只能由客服审核或主管审批;
方案 B(Agent):搭建一个智能体系统,让它理解退款政策、分析用户历史行为、评估商品状况,并自主决策是否批准退款
请分析:
-
这两种方案各自的优缺点是什么?
答: 方案A是已规定好的逻辑,对于申请总是按照固定流程来进行。而方案B是通过智能体来进行自主决策,更加灵活
-
在什么情况下
Workflow更合适?什么情况下Agent更有优势?如果你是该电商公司的负责人,你更倾向于采用哪种方案?答: 对于情况较简单,流程单一且固定的流程可以使用A方案;而对于复制情况,要求灵活进行决策,适合使用B方案
-
是否存在一个方案 C,能够结合两种方案,达到扬长避短的效果?
答: 存在,将任务进行分片,固定部分使用方案A,其他使用方案B
4. 在 1.3 节的智能旅行助手基础上,请思考如何添加以下功能(可以只描述设计思路,也可以进一步尝试代码实现):
提示:思考如何修改
Thought-Action-Observation循环来实现这些功能。
-
添加一个"记忆"功能,让智能体记住用户的偏好(如喜欢历史文化景点、预算范围等)
-
当推荐的景点门票已售罄时,智能体能够自动推荐备选方案
-
如果用户连续拒绝了 3 个推荐,智能体能够反思并调整推荐策略
答:暂时不会代码实现
5. 卡尼曼的"系统 1"(快速直觉)和"系统 2"(慢速推理)理论[2]为神经符号主义 AI 提供了很好的类比。请首先构思一个具体的智能体的落地应用场景,然后说明场景中的:
提示:医疗诊断助手、法律咨询机器人、金融风控系统等都是常见的应用场景
- 哪些任务应该由"系统 1"处理?
答:以法律咨询机器人为例,对于某条法律的具体内容要通过快速直觉实现
- 哪些任务应该由"系统 2"处理?
答:以法律咨询机器人为例,对于一个案件,总是许多法律情况的综合,因此要进行慢速推理来给出对应法律咨询
- 这两个系统如何协同工作以达成最终目标?
答:以法律咨询机器人为例,由智能体分辨用户的问题,调用不同的工具来进行两种系统的协同工作
6. 尽管大语言模型驱动的智能体系统展现出了强大的能力,但它们仍然存在诸多局限。请分析以下问题:
11:
- 为什么智能体或智能体系统有时会产生"幻觉"(生成看似合理但实际错误的信息)?
答:因为智能体的行为和思考都是基于大模型的生成和推理,大模型的生成和推理会产生幻觉
- 在 1.3 节的案例中,我们设置了最大循环次数为 5 次。如果没有这个限制,智能体可能会陷入什么问题?
答:没有这个限制,智能体会不断的进行thought-action行动,占用大量时间,生成的答案可能由于重复内容导致最终生成的答案不如有最大循环回答好
- 如何评估一个智能体的"智能"程度?仅使用准确率指标是否足够?
答: 评测智能体不能只从准确率,还需要响应速度,回答稳定性,幻觉发生率等评测指标来测试该智能体是否能完成指定任务