什么是智能体.docx

上传人:牧羊曲112 文档编号:3256644 上传时间:2023-03-12 格式:DOCX 页数:9 大小:42.25KB
返回 下载 相关 举报
什么是智能体.docx_第1页
第1页 / 共9页
什么是智能体.docx_第2页
第2页 / 共9页
什么是智能体.docx_第3页
第3页 / 共9页
什么是智能体.docx_第4页
第4页 / 共9页
什么是智能体.docx_第5页
第5页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《什么是智能体.docx》由会员分享,可在线阅读,更多相关《什么是智能体.docx(9页珍藏版)》请在三一办公上搜索。

1、什么是智能体1、什么是智能体 所谓的Agent,在信息技术尤其是人工智能和计算机领域,可以看作是能够通过传感器感知其环境,并借助于执行器作用于该环境的任何事物。 Multi-Agent系统(MAS) 是指多个Agent成员之间相互协调,相互服务,共同完成一个任务。各Agent成员之间的活动是自治独立的,其自身的目标和行为不受其它Agent成员的限制,它们通过竞争和磋商等手段协商和解决相互之间的矛盾和冲突。MAS主要研究目的是通过多个Agent所组成的交互式团体来求解超出Agent个体能力的大规模复杂问题 2、什么是强化学习 强化学习(reinforcement learning)是人工智能中策

2、略学习的一种, 是一种重要的机器学习方法,又称再励学习、评价学习. 是从动物学习、参数扰动自适应控制等理论发展而来. 所谓强化学习是指从环境状态到动作映射的学习,以使动作从环境中获得的累积奖赏值最大该方法不同于监督学习技术那样通过正例、反例来告知采取何种行为,而是通过试错(trial and error)来发现最优行为策略。常用的强化学习算法包括TD(Temporal Difference)算法、Q学习算法、Sarsa算法等。 3、什么是自组织 如果一个系统靠外部指令而形成组织,就是他组织;如果不存在外部指令,系统按照相互默契的某种规则,各尽其责而又协调地自动地形成有序结构,就是自组织。 自组

3、织现象无论在自然界还是在人类社会中都普遍存在。 一个系统自组织功能愈强,其保持和产生新功能的能力也就愈强。 它的研究对象主要是复杂自组织系统的形成和发展机制问题,即在一定条件下,系统是如何自动地由无序走向有序,由低级有序走向高级有序的。 4、什么是协同进化 两个相互作用的物种在进化过程中发展的相互适应的共同进化。 一个物种由于另一物种影响而发生遗传进化的进化类型。 5、遗传算法 遗传算法是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。 6、什么是学习 学习是智能体适应环境的一种策略。通过和环境进行交互的经验,智能体能够把环境的某

4、些方面综合到其内部状态之中从而形成自身对具体行为应用的认识。 7、什么是进化 进化可以看作是智能体群适应其环境的策略。 8、什么是适应 适应指智能体根据其环境而作出相应调整的学习。适应性允许智能体处理内部与外部传感器的噪声以及它们的环境与其它智能体中的行为的不一致性。 学习、进化与适应使得多智能体系统中的智能体具有通过与其它智能体的竞争与合作改善自身在环境中生存的可能性的能力。 9、什么是人工生命 人工生命(AL:Artificial life)是通过人工模拟生命系统,来研究生命的领域。AL领域着眼于“通常与活的生物体有关的基本现象,譬如自我复制、寄生、进化、竞争与合作”。它试图通过“在计算机

5、、机器人与其他人造系统中模拟或者合成生命的行为”来补充传统的生物与社会科学。 人工生命是来研究具有某些生命基本特征的人工系统。人工生命包括两方面的内容 : 1. 研究如何利用计算技术研究生物现象 2. 研究如何利用生物技术研究计算问题 10、多机器人系统有哪些优点? (1)单个机器人不能完成某些任务,必须依靠多个机器人才能完成。 (2)多机器人系统可以提高工作效率。 (3)机器人的设计有更大的灵活性,完成有限任务的机器人可以设计得更完善。 (4)多机器人系统可以更有效和更精确地进行定位。 (5)多机器人系统中的成员相互协作可以增加冗余度,消除失效点,增加解决方案的鲁棒性。 (6)多机器人系统与

6、单个机器人相比,可以提供更多的解决方案 11、多机器人系统开发中遇到的主要问题? 早期的研究主要以仿真为主,但近来的研究更强调实际的物理实现。美国海军研究部和能源部也对多机器人系统的研究进行了资助。国内在该领域的研究工作很少,只有少数的研究所和大学在进行相关的研究,且大部分的研究工作仍然停留在仿真和实验室阶段。 12、智能体与环境的交互可以描述为一个马尔可夫过程,其依据是什么? 智能体与环境的交互可以描述为一个马尔可夫决策过程。其根据是: 智能体与环境可以建模为同步的有限状态自动机; 智能体与环境在离散时间间隔上进行交互; 智能体能够感知环境的状态,并利用它制定动作; 在智能体作用之后,环境转

7、移到一个新的状态; 智能体在执行一个动作之后得到一个奖励; 13、简述GA算法,流程图 概念同5,遗传算法的主要应用领域:函数优化、组合优化,此外,GA也在生产调度问题、自动控制、机器人学、图象处理、人工生命、遗传编码和机器学习等方面获得了广泛的运用。 流程图: 14、强化学习在实际应用中的困难? 强化学习吸引人的特点之一在于其形式化的基础。如果某个条件满足,智能体将收敛到一个最佳的动作选择策略。不幸的是,这些条件在复杂的环境中几乎无法满足,强化学习有下面几个困难: 不能处理随时间变化的目标,学习到的动作策略是针对一个固定目标集的; 如果目标改变,就不得不重新学习一切 对实际应用来说,状态空间

8、太大,以至于学习要花很多的时间才能变得有效 只有当接收到一个奖励的时候,智能体才能够开始学习导致那个奖励的动作序列,而且结果是花费大量的时间去学习很长的动作序列 对于错误的感知或隐藏的状态,在任何时间智能体都难于知道它处在什么情形下 很难把初始知识融入到学习中 当并行采用多个动作的时候,智能体不能够再学习 15、学习与进化之间的关系 进化与学习是生物适应的两种形式 在空间和时间上不同。进化是“一个选择性繁殖与替代的过程”,它依赖于分布式个体群的存在;学习是“一组发生在个体生命期内的修正”。 进化是“一种能抓住相对较慢的可能包括几个生物代的环境变化的适应形式”;学习“使得个体去适应在同一代层上不

9、可预测的环境变化” 相互影响 16、模拟机器人开发中会遇到的问题,为什么要使用模拟机器人? 模拟机器人开发会遇到的问题: 传感器:物理传感器不能从背景中分离对象,它们不是在稳定的坐标系统中起作用,而且不能提供关于目标绝对位置的信息。 模拟通常不考虑真实智能体在其环境中交互的所有物理规则,质量、摩擦、惯性等 物理传感器把不确定的值与命令传递给可能有不确定效果的执行器,而在模拟中通常使用格子环境以及返回正确信息的传感器。 电流与机械方面的差异,在机器人上位置不同可能有不同的性能 使用模拟机器人的原因:学习常常要求用偶尔产出不可接受的结果的行为来实验。在真实的物理系统中出错成本可能非常昂贵甚至是危险

10、的。 17、自组织的特征 信息共享 系统中每一个单元都掌握全套的“游戏规则”和行为准则,这一部分信息相当于生物DNA中的遗传信息,为所有的细胞所共享; 单元自律 自组织系统中的组成单元具有独立决策的能力,在“游戏规则”的约束下,每一个单元有权决定决定它自己的对策与下一步的行动; 短程通讯 每个单元在决定自己的对策和行为时,除了根据它自身的状态以外,往往还要了解与它临近的单元的状态,单元之间通讯的距离比起系统的宏观特征尺度来,要小得多,而所得到的信息往往也是不完整的、非良态的; 微观决策 每个单元所作出的决策只关乎它自己的行为,而与系统中其它单元的行为无关;所有单元各自的行为的总和,决定整个系统

11、的宏观行为;自组织系统一般并不需要关乎整个系统的宏观决策; 并行操作 系统中各个单元的决策与行动是并行的,并不需要按什么标准来排队,以决定其决策与行动顺序; 整体协调 在诸单元并行决策与行动的情况下,系统结构和游戏规则保证了整个系统的协调一致性和稳定性; 迭代趋优 自组织系统的宏观调整和演化并非一蹴而就,而是在反复迭代中不断趋于优化;事实上,这类系统一般无法达到平衡态,而往往处在远离平衡态的区域进行永无休止的调整和演化;一旦静止下来,就表示这类系统的“死亡”。 18、强化学习的原理 假定一个机器人在时间t遇到激励Jk,选择行为Bt。在执行了所选择的行为Bt之后,机器人依据其局部性能标准来学习。

12、所有的群体机器人由于使用共同的行为选择基础,所以都能够共享他们所学到的知识。从执行过的行为进行学习之后,行为权重向量按下面的方式更新: W是增量向量;normal规范化权重向量。 Shape是通过function1,有条件地通过function2 19、应用排斥力推箱的原理及流程 20、用外部接触力和力矩推箱的原理及流程 可以分析分别是退圆柱体的箱子和立体箱子的情况 21、集体包围的原理及流程 22、多智能体机器人技术中具有挑战性的任务是那些具有内在合作性的任务,试列举并分析人们研究的主要问题包括哪些? 将这些实际应用中多机器人合作所面临的任务加以抽象,列出了一些代表性的任务,这些任务可分三类

13、:交通控制、推箱子/协作操作、采蜜。 多机器人系统是一个复杂的系统,研究的内容涉及方方面面,主要有: (1) 群体的体系结构 (2) 通信与协商 (3) 学习 (4) 建模与规划 (5) 防止死锁与避碰 (6) 合作根源 (7) 多智能体机器人控制系统的实现 23、对合作机器人的开发,关键学科是?分别是? 由于协作机器人学是一个高度交叉的学科,其它相关学科的发展对它的影响很大,研究协作多机器人系统需要借鉴这些学科或解决某些问题的理论和方法,这是研究多机器人系统的发展方向和趋势,具体来说,这些学科有: 分布式人工智能(DAI) 分布式系统(Distributed System) 生物学(Biol

14、ogy) 24、遗传算法的特点 1、 遗传算法以决策变量的编码作为运算对象。传统的优化算法往往直接决策变量的实际值本身,而遗传算法处理决策变量的某种编码形式,使得我们可以借鉴生物学中的染色体和基因的概念,可以模仿自然界生物的遗传和进化机理,也使得我们能够方便的应用遗传操作算子。 2、 遗传算法直接以适应度作为搜索信息,无需导数等其它辅助信息。 3、 遗传算法使用多个点的搜索信息,具有隐含并行性。 4、 遗传算法使用概率搜索技术,而非确定性规则。 25、势能场的自组织 任务环境中机器人个体的位置可以用笛卡儿坐标P0(x0, y0)来表示。根据机器人的当前位置也可以建立一个相对的极坐标系。 26、

15、集体包围中行为选择机制有几种?他们是怎样选择的? 一个群体机器人可以根据其行为权重向量选择一个行为。方式有2种。 基于概率分布的选择 在这种机制中,基于一个行为权重向量种给定的概率选择一个行为反应该机制可以表示为: 基于最大权重的选择 在这种机制中,如果一个行为反应有最大的概率权重,它将被选择,即 27、反应式系统与推理式系统的区别 反应式系统 鲁棒、容易理解的 低效地、复杂的,随着规则库的增大而更加困难 推理式系统 可预测、全局行为易于理解 不鲁棒、一个组件失败导致整个系统失败。部分推理式系统执行一些困难任务时性能很差。 机器人控制最好通过推理式的手段来实现包括具体的环境描述与逻辑推理 机器人控制最好通过反应式手段来实现机器人依赖于简单的行为以及从这些行为之间的交互而自然隐现的智能

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号