《人工智能基础07自动规划系统课件.ppt》由会员分享,可在线阅读,更多相关《人工智能基础07自动规划系统课件.ppt(48页珍藏版)》请在三一办公上搜索。
1、目录,第一章绪论第二章知识表示 第三章搜索技术第四章推理技术第五章机器学习 第六章专家系统 第七章自动规划系统第八章 自然语言理解第九章 智能控制第十章 人工智能程序设计,自动规划概述基于谓词逻辑的规划STRIPS规划系统分层规划基于专家系统的机器人规划轨迹规划简介,7.1 自动规划概述,7.1.1 规划的概念及作用 1. 规划的概念 定义7.1 从某个特定的问题状态出发,寻求一系列行为动作,并建立一个操作序列,直到求得目标状态为止。这个求解过程就称为规划。 定义7.2 规划是对某个待求解问题给出求解过程的步骤。规划涉及如何将问题分解为若干相应的子问题,以及如何记录和处理问题求解过程中发现的各
2、子问题间的关系。 定义7.3 规划系统是一个涉及有关问题求解过程步骤的系统。如计算机或飞机设计、火车或汽车运输路径、财政和军事规划等问题。,7.1 自动规划概述,7.1.1 规划的概念及作用 例:救援仿真机器人系统(RoboCup Rescue Simulation System,RCRSS) 消防智能体 医疗智能体 警察智能体 普通市民 中心智能体 路障 避难所 着火建筑物 普通建筑物),7.1 自动规划概述,7.1.1 规划的概念及作用 2. 规划的作用 规划可用来监控问题求解过程,并能够在造成较大的危害之前发现差错。规划的好处可归纳为简化搜索、解决目标矛盾以及为差错补偿提供基础。 “十二
3、五”规划、城市规划、企业发展规划,7.1 自动规划概述,7.1.2 规划的分类和问题分解途径 1. 规划的分类 (1)按规划内容分 国家、地方、重大项目、企业、交通、城市、环境 (2)按规划方法分 非递阶(非分层)规划与递阶(分层)规划;线性规划与非线性规划;同步规划与异步规划;基于脚本、框架和本体的规划;基于专家系统的规划;基于竞争机制的规划; (3)按规划实质分 任务规划、路径规划、轨迹规划,7.1 自动规划概述,7.1.2 规划的分类和问题分解途径 2. 问题分解途径把某些较复杂的问题分解为一些较小的子问题。有两条实现这种分解的重要途径。第一条重要途径是当从一个问题状态移动到下一个状态时
4、,无需计算整个新的状态,而只要考虑状态中可能变化了的那些部分。第二条重要途径是把单一的困难问题分割为几个有希望的较为容易解决的子问题。,7.1 自动规划概述,7.1.2 规划的分类和问题分解途径 3. 域的预测和规划的修正 (1)域的预测 问题论域的预测。对于不可预测的论域,考虑可能的结果集合,按照它们出现的可能性以某个次序排列。然后,产生一个规划、并试图去执行这个规划。 (2)规划的修正 规划执行失败导致对规划的修正。 在规划过程中不仅要记录规划的执行步骤,而且要记录每一步必须要执行的理由。,7.2 基于谓词逻辑的规划,用谓词逻辑来描述世界模型及规划过程。 世界模型的谓词逻辑表示定义谓词确定
5、问题初始状态确定问题目标状态确定基本操作 基于谓词逻辑规划的基本过程问题分解子问题规划得到操作序列,7.3 STRIPS规划系统,7.3.1 积木世界的机器人规划求解机器人完成规定工作的动作序列,B,A,C,C,B,A,机械手,机械手,(a),(b),7.3 STRIPS规划系统,7.3.1 积木世界的机器人规划 1. 积木世界的机器人问题 机器人能够执行的动作举例如下: unstack(a,b):把堆放在积木b上的积木a拾起。在进行这个动作之前,要求机器人的手为空手,且积木a的顶上是空的。 stack(a,b): 把积木a堆放在积木b上。动作之前要求机械手必须已抓住积木a,而且积木b顶上必须
6、是空的。 pickup(a): 从桌面上拾起积木a,并抓住它不放。在动作之前要求机械手为空手,而且积木a顶上没有任何东西。 putdown(a): 把积木a放置到桌面上。要求动作之前机械手已抓住积木a。,7.3 STRIPS规划系统,7.3.1 积木世界的机器人规划 1. 积木世界的机器人问题状态描述谓词:ON(a,b): 积木a在积木b之上。ONTABLE(a): 积木a在桌面上。CLEAR(a): 积木a顶上没有任何东西。HOLDING(a): 机械手正抓住积木a。HANDEMPTY: 机械手为空手。,7.3 STRIPS规划系统,7.3.1 积木世界的机器人规划 2.用F规则求解规划序列
7、采用F规则表示机器人的动作,这是一个叫做STRIPS规划系统的规则,它由3部分组成:第一部分是先决条件。为了使F规则能够应用到状态描述中去。第二部分是一个叫做删除表的谓词。当一条规则被应用于某个状态描述或数据库时,就从该数据库删去删除表的内容。第三部分叫做添加表。当把某条规则应用于某数据库时,就把该添加表的内容添进该数据库。,7.3 STRIPS规划系统,7.3.1 积木世界的机器人规划 2.用F规则求解规划序列例: move(x, y, z): 把物体x从物体y上面移到物体z上面。 先决条件:CLEAR(x), CLEAR(z), ON(x,y) 删除表:ON(x, y), CLEAR(z)
8、 添加表:ON(x, z), CLEAR(y),7.3 STRIPS规划系统,7.3.2 STRIPS规划系统 斯坦福大学人工智能研究所于1966-72年研制的Shakey机器人是第一台能够进行行动推理的多用移动机器人,该项目融合了机器人视觉、机器人学和自动推理研究成果。机器人的任务是在一些相连的房间里,将用户指定的箱子推到指定的位置。对于用户输入的每一个任务,Shakey自主地规划完成该任务的行动并依次执行。 Shakey项目技术:规划语言STRIPS( STanford Research Institute Problem SolverSTRIPS )和A*算法等。 STRIPS语言用来描
9、述外部世界模型并支持任务规划,它提供了框架问题的一种简洁、高效的解法,但理论上并不完备。,7.3 STRIPS规划系统,7.3.2 STRIPS规划系统 STRIPS系统的组成如下:(1) 世界模型。为一阶谓词演算公式。(2) 操作符(F规则)。包括先决条件、删除表和添加表。(3) 操作方法。应用状态空间表示和中间-结局分析。规划过程每个STRIPS问题的解答为某个实现目标的操作符序列,即达到目标的规划。,A Service Robot Copes with Changes Understanding, Learning, Planning, and Acting,7.4 分层规划,探索规划时
10、首先只考虑一层的细节,然后再注意规划中比这一层低一层的细节,所以把它叫做长度优先搜索。NOAH规划系统1. 应用最小约束策略一个寻找非线性规划而不必考虑操作符序列的所有排列的方法是把最少约束策略应用来选择操作符执行次序的问题。问题求解系统NOAH采用一种网络结构来记录它所选取的操作符之间所需要的排序。它也分层进行操作运算,即首先建立起规划的抽象轮廓,然后在后续的各步中,填入越来越多的细节。,7.4 分层规划,2. 检验准则准则法已被应用于各种规划生成系统。对于早期的系统,如HACKER系统,准则只用于舍弃不满足的规划。在NOAH系统中,准则被用来提出推定的方法以便修正所产生的规划。第一个涉及的
11、准则是归结矛盾准则。第二个准则叫做消除多余先决条件准则,包括除去对子目标的多余说明。可以把分层规划和最少约束策略十分直接地结合起来,以求得非线性规划而不产生一个庞大的搜索树。,7.5 基于专家系统的机器人规划,1. 系统结构及规划机理(1)知识库:用于存储某些特定领域的专家知识和经验,包括机器人工作环境的世界模型、状态、物体描述等事实和可行操作或规则等。(2) 控制策略:包含综合机理,确定系统应当应用什么规则以及采取什么方式去寻找该规则。(3) 推理机:用于记忆所采用的规则和控制策略及推理策略。(4)知识获取:首先获取某特定域的专家知识。然后用程序设计语言把这些知识变换为计算机程序。最后把它们
12、存入知识库待用。,7.5 基于专家系统的机器人规划,(5)解释与说明:通过用户接口,在专家系统与用户之间进行对话,从而使用户能够输入数据、提出问题、知道推理结果以及了解推理过程等。2. 任务级机器人规划三要素(1)建立模型:世界模型。(2)任务说明:定义状态及状态变换次序。(3)程序综合。3. ROPES机器人规划系统,7.6 轨迹规划简介,轨迹:机械手在运动过程中的位移、速度和加速度。 轨迹规划:根据任务的要求,计算出预期的轨迹。 在机械手运动学和动力学基础上,讨论在关节空间和笛卡尔空间中机器人运动的轨迹规划和轨迹生成方法,7.6 轨迹规划简介,例:NAO机器人检球动作。,地球上的生物物种在
13、漫长的过程中形成了丰富的行为特性,并且一直不断地完善和发展,以更好地适应其所生存的环境。生物群体和自然生态系统可以通过自身的演化就能使许多在人类看起来高度复杂的优化问题得到完美解决。因此,各种模仿生物群体的智能仿生算法被相继提出,得到了深入研究和应用实践。 群智能思想的产生主要源于复杂适应系统理论以及人工生命的研究。,群智能算法群智能思想起源,群智能算法群智能思想起源,复杂适应系统( Complex Adaptive System, CAS) 理论:1994 年由 Holland 教授正式提出。CAS中成员称为具有适应性的主体, 简称主体。 主体的适应性, 是指它能够与环境以及其它主体进行交流
14、,在交流的过程中 “学习” 或 “积累经验”,并且根据学到的经验改变自身的结构和行为方式。CAS具有四个基本特点: (1)首先, 主体是主动的、活的实体。具有适应性的主体的概念把个体主动性提高到了系统进化基本动因的位置, 从而成为研究与考察宏观行为的出发点。 (2)其次, 个体与环境(包括个体之间)之间的相互影响、相互作用是系统演变和进化的主要动力。相互作用是“可记忆”的, 它表现为进化过程中每个个体的结构和行为方式的变化,以不同的方式 “存储” 在个体内部。,群智能算法群智能思想起源,(3)再次, 这种方法不像许多其他的方法那样, 把宏观和微观截然分开, 而是把它们有机地联系起来。 (4)最
15、后, 这种建模方法还引进了随机因素的作用, 使它具有更强的描述和表达能力。随机因素的影响不仅影响状态, 而且影响组织结构和行为方式。具有主动性的个体会接受教训,总结经验, 并且以某种方式把 “经历” 记住, 使之 “固化” 在自己以后的行为方式中。 CAS理论提供了模拟生物、 生态、 经济、 社会等复杂系统的巨大潜力。,群智能算法群智能思想起源,人工生命(Artificial Life, AL)是用来研究具有某些生命基本特征的人工系统。 近年来, 人工生命的研究发展非常快, 在某些方面的研究已与传统的生物科学形成了互补。人工生命包括两方面的内容: 如何利用计算技术研究生物现象; 如何利用生物技
16、术研究计算问题。 第二部分的内容的研究中,现已经有了很多源于生物现象的计算技巧,例如,人工神经网络是简化的大脑模型,遗传算法是模拟基因进化的过程,目前这一类计算技术被统称为自然计算。群智能属于自然计算中的一类,它模拟另一种生物系统:社会系统,更确切地说,是模拟由简单个体组成的群落与环境以及个体之间的互动行为,这些模拟系统利用局部信息从而可能产生不可预测的群体行为。,群智能算法群智能思想起源,群智能( Swarm Intelligence, SI): 1992年由 Beni, Hack-wood 和 Wang在分子自动机系统中提出。 1999 年, Bonabeau, Dorigo 和 Ther
17、aulaz 在 Swarm Intel-ligence: From Natural to Artificial Systems中对群智能进行了详细的论述和分析。 2003年 IEEE 第一届国际群智能研讨会在美国印第安纳州首府召开。 群智能定义:任何一种由昆虫群体或其它动物社会行为机制而激发设计出的算法或分布式解决问题的策略均属于群智能。,群智能算法群智能思想起源,Swarm 可被描述为一些相互作用相邻个体的集合体, 蜂群、蚁群、鸟群、鱼群都是Swarm的典型例子。社会性动物群体所拥有的这种特性能帮助个体很好地适应环境,个体所能获得的信息远比它通过自身感觉器官所取得的多,其根本原因在于个体之间
18、存在着信息交互能力。信息的交互过程不仅仅在群体内传播了信息,而且群内个体还能处理信息,并根据所获得的信息 (包括环境信息和附近其它个体的信息)改变自身的一些行为模式和规范, 这样就使得群体涌现出一些单个个体所不具备的能力和特性, 尤其是对环境的适应能力。这种对环境变化所具有的适应能力可以被认为是一种智能, 也就是说动物个体通过聚集成群而涌现出了智能。,群智能算法群智能思想起源,SI 的定义进一步推广(Bonabeau): 无智能或简单智能的主体通过任何形式的聚集协同而表现出智能行为的特性。 群智能理论还非常不成熟, 但已成为有别于传统人工智能中连接主义、 行为主义和符号主义的一种新的关于智能的
19、描述方法, 并成为人工智能领域的新研究热点。,群智能算法群智能理论,James Kennedy 和 Russell C.Eberhart 在 2001 年出版的Swarm Intelligence 是群智能发展的一个重要历程碑。他们不反对Bonabeau 关于 SI 的定义,赞同其定义的基本精神,但反对定义中使用 “主体” 一词。 其理由是 “主体” 所带有的自治性和特殊性是许多 Swarm的个体所不具备和拥有的,这将大大限制 Swarm的定义范围。 Mark Millonas( 1994) 构建一个 SI 系统所应满足的五条基本原则: Proximity Principle: 群内个体具有能
20、执行简单的时间或空间上的评估和计算的能力。,群智能算法群智能理论,Quality Principle: 群内个体能对环境(包括群内其它个体)的关键性因素的变化做出响应。 Principle of Diverse Response: 群内不同个体对环境中的某一变化所表现出的响应行为具有多样性。 Stability Principle: 不是每次环境的变化都会导致整个群体的行为模式的改变。 Adaptability Principle: 环境所发生的变化中, 若出现群体值得付出代价的改变机遇, 群体必须能够改变其行为模式。,群智能算法群智能理论,以上五条原则现在成为了群智能的最基本理论,现有的群智
21、能方法和策略都符合这些原则。 Swarm Intelligence 最重要的观点是:Mind is social, 也就是认为人的智能是源于社会性的相互作用,文化和认知是人类社会性不可分割的重要部分,这一观点成为了群智能发展的基石。 群智能模拟的是社会系统的变化,其最基本单位是 “敏因”(Meme) ,这一词由 Dawkin 在 The Selfish Gene中提出,它是指思想文化传播中的基本单位,个体在社会中会根据环境来改变自身的思想,敏因的传播途径是在个体与个体之间,在人类社会中它还可以在人脑与书本之间、 人脑与计算机、 计算机与计算机之间传播。当然,“敏因” 应该如何严格描述和定义还没
22、有定论。,群智能算法群智能理论,群智能研究的更进一步目标是对人类思想变化的社会行为的模拟。人类心理中存在着群体性、习惯性、一致性, 常常是习惯性地遵循一些习俗和规则。无论什么时候, 人们思想和行为总是因相互影响而变得非常近似, 道德规范以及文化的形成就是这种通过相互间影响而导致近似的结果。 人类的社会思想行为并不简单类似鸟群或鱼群的行为, 人类思想的形成过程是一种在高维认知空间的探索历程。 两种思想意见在认知空间上聚集到一点上, 被称为 “一致” 或 “认同” , 而不是鸟群或鱼群系统中的 “碰撞” 。如果某人认同认知空间某个点, 那么就努力靠近它, 反之则尽量远离它, 这里认知空间中的某个点
23、就是某个人的思想。人类通过这种社会行为达成社会的共识: 习俗、道德规范等。 目前, 群智能理论研究处于基本思想描述阶段, 还未能提出一些较为明确的概念和定义, 尽管已经有人提出广义群智能的模型。,蚁群算法(Ant Colony OptimizationACO)由 Colorni, Dorigo 和 Maniezzo 于 1991 年提出,它是通过模拟自然界蚂蚁社会的寻找食物的方式而得出的一种仿生优化算法。 自然界种蚁群寻找食物时会派出一些蚂蚁分头在四周游荡, 如果一只蚂蚁找到食物, 它就返回巢中通知同伴并沿途留下 “信息素” ( pheromone)作为蚁群前往食物所在地的标记。 信息素会逐渐
24、挥发, 如果两只蚂蚁同时找到同一食物,又采取不同路线回到巢中, 那么比较绕弯的一条路上信息素的气味会比较淡, 蚁群将倾向于沿另一条更近的路线前往食物所在地。ACO算法设计虚拟的 “蚂蚁” , 让它们摸索不同路线, 并留下会随时间逐渐消失的虚拟 “信息素” 。根据 “信息素较浓的路线更近” 的原则, 即可选择出最佳路线。,群智能算法蚁群算法,ACO算法首先应用于 TSP 问题中, 这里以 TSP 问题为例对算法作简单介绍。当某一个蚂蚁走到一个城市, 下一步可选的路径集合为 E, 集合中任一条路径 eE 上的信息素浓度为e, 走这条路的代价为 e, 那么选择某一条路径 vE 的几率为:,群智能算法
25、蚁群算法,其中, 和 两个参数分别用来控制信息素和路径长度的相对重要程度。当蚂蚁在所有城市走过一遍之后,路径上的信息素浓度将变为: e( t+1) =( 1- )e( t) +e 其中,0 1 用于控制信息素随时间挥发的速度,e是上次蚂蚁经过此路段所留下的信息素,未经过则为 0。上式以及e可以根据问题进行设计。 目前,ACO算法已被广泛应用于组合优化问题中,在车辆调度问题、 机器人路径规划问题、 路由算法设计等领域均取得了良好的效果。 由于 ACO算法具有广泛实用价值,成为了群智能领域第一个取得成功的实例,曾一度成为群智能的代名词,相应理论研究及改进算法近年来不断取得新的成果。,群智能算法蚁群
26、算法,粒子群优化算法(Particle Swarm OptimizationPSO)源于 1987 年 Reynolds 对鸟群社会系统boids的仿真研究,boids 也是一个 CAS。 在 boids 中, 一群鸟在空中飞行, 每个鸟遵守以下三条规则: (1)避免与相邻的鸟发生碰撞冲突; (2)尽量与自己周围的鸟在速度上保持协调和一致; (3)尽量试图向自己所认为的群体中心靠近。 仅仅通过使用这三条规则, boids 系统就出现非常逼真的群体聚集行为, 鸟成群地在空中飞行, 当遇到障碍时它们会分开绕行而过, 随后又会重新形成群体。不过 Reynolds 仅仅将其作为 CAS的一个实例作仿真
27、研究, 而并未将它用于优化计算中, 也无任何实用价值。,群智能算法粒子群优化算法,Kennedy和 Eberhart (1995年)在 boids 中加入了一个特定点, 定义为食物, 鸟根据周围鸟的觅食行为来寻找食物。他们的初衷是希望通过这种模型来模拟鸟群寻找食源的现象, 然而实验结果却揭示这个仿真模型中蕴涵着很强的优化能力, 尤其是在多维空间寻优中。 由于最初的仿真系统中每个鸟在计算机屏幕上表示为一个点, 而 “点( Points)” 这个词在数学领域具有非常多的意义, 因此作者用了 “粒子( Particle)” 来表示每一个个体。于是也就得到了基本 PSO算法。,群智能算法粒子群优化算法
28、,群智能算法粒子群优化算法,粒子群特性,群智能算法粒子群优化算法,在PSO系统初始化为一群随机粒子( 随机解),然后通过迭代找到最优解。在每一次迭代中, 粒子通过跟踪两个 “极值”来更新自己, 同时也通过跟踪它们实现粒子间的信息交换。第一个就是粒子本身所找到的最优解, 这个解叫作个体极值pBest( “自身经验” )。另一个极值是整个群体目前找到的最优解, 这个极值是群体极值 gBest(群体的 “社会经验” )。,群智能算法粒子群优化算法,1998 年,Shi 和 Eberhart 正式给出标准 PSO算法的数学描述如下: 设搜索空间为 M维, 粒子数为 N。第 i 个粒子位置表示为向量 X
29、i=( xi1, xi2, , xiD) ; 第 i 个粒子“飞行” 历史中的过去最优位置(即该位置对应解最优)为 Pi=( pi1, pi2, , piD)也就是 pBest,其中所有 Pi( i=1, , N)中的最优个体被记作 Pg 也就是 gBest;第 i 个粒子的位置变化率(速度)为向量 Vi=( vi1, vi2, , viD)。每个粒子的位置按如下公式进行变化( “飞行” ) :,群智能算法粒子群优化算法,其中, c1, c2 为正常数, 称为加速因子; rand( )为0, 1之间的随机数; w称惯性因子。第d( 1dM)维的位置变化范围和速度变化范围分别为- xd,max,
30、 xd,max和- vd,max, vd,max( 变化范围可通过平移处理使之对称) , 迭代中若某一维的 xid 或 vid 超过边界则取边界值。粒子群初始位置和速度随机产生, 然后按公式进行迭代, 直至满足停止条件。,群智能算法粒子群优化算法,2003 年李晓磊、 邵之江等提出的人工鱼群算法(Artificial Fish-Swarm AlgorithmAFSA),它利用自上而下的寻优模式模仿自然界鱼群觅食行为, 主要利用鱼的觅食、聚群和追尾行为, 构造个体底层行为; 通过鱼群中各个体的局部寻优, 达到全局最优值在群体中凸现出来的目的。在基本运算中引入鱼群的生存机制、竞争机制以及鱼群的协调
31、机制,提高算法的有效效率。李晓磊等又采用分解协调的思想构造一种改进的人工鱼群算法, 并以换热器系统为例, 验证了该算法,结果表明该算法具有较好的收敛性。 AFSA只使用目标函数的函数值,无需目标函数的梯度值等特殊信息,对搜索空间具有一定的自适应能力。算法对初值无要求,对各参数的选择也不很敏感。,群智能算法人工鱼群算法,群智能算法人工鱼群算法,基于 SI 的优化算法和 EC都是基于群体迭代的启发式随机优化算法, 有着非常多相似之处, 它们都是对自然中随机系统的仿真, 都具有本质并行性。另外, 与 EC还一样的是, SI 的目的并不是为了忠实地模拟自然现象, 而是利用它们的某些特点去解决实际问题。
32、ACO和 PSO也一度曾被归类于 EC之中,但它们与 EC之间的区别也是明显的。ACO、 PSO在本质上不能用广义 EC算法的流程进行描述。 首先,EC和 SI 所模拟的自然随机系统不一样。EC是模拟生物系统进化过程, 其最基本单位是基因(Gene) , 它在生物体的每一代之间传播; 已有的基于 SI 的优化算法都是源于对动物社会通过协作解决问题行为的模拟, 它主要强调对社会系统中个体之间相互协同作用的模拟, 其最基本单位是敏因。,群智能算法与进化计算比较,其次, EC中强调“适者生存” , 不好的个体在竞争中被淘汰; SI 强调 “协同合作” , 不好的个体通过学习向好的方向转变,不好的个体
33、被保留还可以增强群体的多样性。EC中最好的个体通过产生更多的后代来传播自己的基因, 而 SI 中的优秀个体通过吸引其它个体向它靠近来传播自己的敏因。 最后,EC的迭代由选择、变异和交叉重组操作组成,而 SI的迭代中的操作是 “跟随”,ACO中蚂蚁跟随信息素浓度爬行,PSO中粒子跟随最优粒子飞行。在某种程度上看,SI 的跟随操作中隐含了选择、 变异和交叉重组操作。,群智能算法与进化计算比较,例如,PSO中 gBest 和pBest 的更新可以类似一种弱选择;而粒子位置更新则类似于3 个父代:Xi、gBest 和 pBest 的之间重组,其中还包含了变异的成分。SI 中所隐含的变异是有偏好的,而并非通常 EC中的完全随机变异,这与最近对实际生物系统变异行为的新研究成果相符。 Kennedy认为,EC和 SI 所分别模拟的两个伟大的自然随机系统:Evolution 和 Mind 之间存在着显著的差异,尽管它们都是基于群体的,都是由其中的随机成分带来创新,但其本质是不同的,因此不能将 SI 简单地归类于 EC中。现在,人工智能领域已将 SI 作为一个独立方向,与 EC的地位是同等的。,群智能算法与进化计算比较,