多机器人系统ppt课件.ppt

上传人:小飞机 文档编号:1640789 上传时间:2022-12-12 格式:PPT 页数:51 大小:1.24MB
返回 下载 相关 举报
多机器人系统ppt课件.ppt_第1页
第1页 / 共51页
多机器人系统ppt课件.ppt_第2页
第2页 / 共51页
多机器人系统ppt课件.ppt_第3页
第3页 / 共51页
多机器人系统ppt课件.ppt_第4页
第4页 / 共51页
多机器人系统ppt课件.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《多机器人系统ppt课件.ppt》由会员分享,可在线阅读,更多相关《多机器人系统ppt课件.ppt(51页珍藏版)》请在三一办公上搜索。

1、第11章 多机器人系统,第11章 多机器人系统,11.1 多机器人系统的概述11.2 多机器人系统的体系结构11.3 多机器人系统的协调控制11.4 网络机器人11.5 多机器人系统的应用,11.1 多机器人系统的概述,典型的多机器人系统主要有以下几种:群智能机器人系统:由许多无差别的自治机器人组成的分布式系统。它主要研究如何使能力有限的个体机器人通过交互产生群体智能。自重构机器人系统:以一些具有不同功能的标准模块为组件,根据目标任务的需要,对这些模块进行相应的组合,进而形成具有不同功能的系统。协作机器人系统:由多个具有一定智能的自治机器人组成,机器人之间通过通信实现相互间的协作以完成复杂的任

2、务。机器人足球赛:前述几类机器人系统中,机器人之间的关系是合作的、互助的。而在机器人足球赛中,不同球队的机器人之间的关系是对抗的、竞争的。同队的机器人之间则是合作的、互助的。,多机器人系统的特点主要包括其空间分布、功能分布、时间分布、信息分布和资源分布。利用多机器人系统的目的主要是:利用多机器人系统的空间分布特性,通过各个机器人并行工作以提高完成任务的效率。利用多机器人系统内资源(信息、知识、物理装置等)的共享来弥补个体能力的不足,扩大完成任务的能力范围。利用系统内机器人资源的冗余性、各机器人功能的互补性提高完成任务的可能性,增强系统的容错性、鲁棒性和灵活性。利用多机器人系统功能分布、资源分布

3、的特点来降低单个机器人系统的成本和系统设计的难度,减少执行危险任务过程中机器人系统的损失。,多机器人系统中存在的问题包括:分布式的结构使多机器人系统在进行全局优化时存在一定困难或无法找到最优解。多机器人系统中各机器人之间由于资源的分配和使用不合理可能发生冲突或死锁现象。随着多机器人系统中机器人数量的增加,多个机器人之间进行组织和相互协调协作的困难也随之以指数倍数增长。多机器人系统中,功能、信息和资源的分布在增强机器人系统灵活性、适应性的同时,也增加了机器人对可用功能、信息、资源进行搜索和信息交换的时间。多机器人系统由此而产生的通信问题为系统快速响应外界环境的变化造成了一定的困难。,多机器人系统

4、研究的主要内容包括:群体体系结构:研究多机器人系统的群体体系结构是为了实现多个机器人相互间的合作。多机器人系统的群体体系结构可以分为集中式(centralized)和分散式(decentralized)两种。感知:机器人的感知包括感觉和理解两方面问题。通信:通信是机器人之间进行交互和组织的基础。通过通信,多机器人系统中各机器人了解其他机器人的意图、目标和动作以及当前环境状态等信息,进而进行有效的磋商,协作完成任务。一般来说,机器人之间的通信可以分成隐式通信和显式通信两类。,学习:多机器人系统的学习可以根据其结构的不同有所区别。集中式体系机构中,学习发生在主控单元上,其过程类似于个体机器人的学习

5、;在分散式体系结构中,所有机器人都参与到学习中,它们可能会相互影响。多机器人系统通过学习可以获得较强的适应性和灵活性等智能特性。多机器人系统的学习按学习过程划分为:独立学习和交互学习。多机器人系统的学习按反馈类型划分为:监督式学习、增强式学习和无监督式学习。多机器人系统作为一个群体进行学习时,依据不同的学习目的其内部存在以下几种学习类型:机器人某种特定能力的学习;对群体组合特性的学习;对任务模式的学习;对环境特性的学习。,协调协作机制:多机器人系统的协调协作机制与系统的群体体系结构、个体体系机构、感知、通信和学习等方面的研究密切相关。协调协作按主观意愿来划分,可以分为有意识协作和无意识协作;按

6、协作的类型来划分,可以分为合作型和竞争性。多机器人系统的协调协作反映了在多机器人系统不同层次上对系统控制与交互提出的不同要求。W.Rausch等提出多机器人系统不同层次的协调协作:隐含协作关系,机器人按其自有的规划模型考虑其它机器人规划的影响;异步协调关系,多个机器人在同一环境下存在相互间干涉的条件下为完成各自目标而产生协作;同步协作关系,多个机器人为完成一个共同目标而产生的协作。,在多机器人系统的设计中,通常采用的是自顶向下的设计方法。即将复杂的多机器人系统的功能和目标要求逐层分割分解,逐步细化多机器人系统各功能模块,集成实现目标所必需的控制算法和协作策略。,自顶向下设计方法的流程,11.2

7、 多机器人系统的体系结构,体系结构主要研究如何组织和控制机器人的硬件和软件系统来实现机器人所需完成的功能。体系结构通常分为群体体系结构和个体体系结构。群体体系结构为实现预定的行为如何把个体联系到一起的形式。它表示个体之间所能存在的问题:知识、信息、控制等方面长远的、静态的关系模式,并从全局角度定义每个个体在系统整体行为的高级观点,从而有助于引导局部控制实现协作,增强系统的全局一致性。多机器人系统是由个体机器人组成的。作为个体机器人的核心部分,机器人控制系统决定了多机器人系统中机器人的协作能力。机器人个体体系结构将决定其适应环境的能力及其智能的复杂程度。,多机器人系统的体系结构可以分为集中式(c

8、entralized) 结构和分散式(decentralized)结构两种。分散式结构又可以进一步划分为分层式(hierarchical)结构和分布式(destributed)结构。,a集中式结构 b分布式结构 c分层式结构,几种多机器人系统体系结构示意图,集中式结构通常由一个主控单元掌握全部环境及受控机器人的信息,运用规划算法和优化算法。主控单元对任务进行分解和分配,向各受控机器人发布命令,并组织多个受控机器人共同完成任务。集中式结构的优点在于,理论背景清晰,实现起来较为直观,但存在以下缺点:(1) 容错性差 一个机器人的简单错误可能会造成整个系统的瘫痪。(2) 灵活性差 系统中机器人的个数

9、增加或者减少时,原有的规划结果无效,需重新进行规划。(3) 适应性差 由于在实际环境中所有信息对于主控单元并不完全已知,所以主控单元在复杂多变的环境中无法保证各受控机器人快速响应外界的变化,以做出适当的决策,因此该结构不适合动态、开放的环境。另外集中式结构还存在主控单元和其它机器人之间的通信瓶颈问题。,相对于集中式结构来说,尽管分散式结构很难或者无法全局目标的优化,但是它以故障冗余、可靠性等诸多优点引起人们对分散式结构的兴趣。分布式的结构中没有主控单元,各机器人之间的关系是平等的,各机器人均能通过通信手段与其它机器人进行信息交流,自主进行信息交流,自主进行决策。这种方式具有灵活性和适应性强的优

10、点。但是,要注意避免各个个体片面强调“个性”,过分强调自己任务的重要性,而导致过多占有资源的情况,使得任务完成效率低下。分层式与分布式的区别在于前者存在局部集中,它是介于集中式和分布式之间的一种混合结构。下面介绍几种较为典型的多机器人系统的体系结构。,11.2.1 分层式结构面向多机器人协作系统(Multi-Robot Cooperative System,MRCS)为了满足自主性和协作性要求,多机器人体系分层式结构设计成三层结构形式,分别为协作规划层(cooperation planning layer,CpPL)、协调规划层(coordination planning layer,CdPL

11、)及行为控制层(behavior control layer,BCL)。,分层式体系结构框图,1 协作规划层协作规划层是为了满足机器人的任务协作要求设计的。在MRCS中,许多复杂的任务需要多个机器人协同完成,而协作层赋予机器人协作能力、组织能力等。协作层可以实现:1)任务的承接、分解和分配;2)机器人之间的通信、协商等功能的管理。对于需要协作执行的任务,将任务分解为若干子任务后,按某种协议与其它机器人磋商,制定联合行动计划。若是决定独立执行,则将任务交给协调规划层处理。协作规划层的各个模块:协作通信模块(communication module of cooperation layer,CMC

12、oL)负责机器人之间任务级的信息传递,如任务的承接、发布等。 待规划的任务模块(task module of be panned,TMP)存放来自用户或其它机器人的招标任务。 待发布任务模块(task module of be announced,TMA)存放任务分解后需其它机器人协作执行的任务。,组织知识库(organization knowledge base,OKB)组织模块中存放社会规则、谈判策略以及组织结构重组等方面的知识。领域知识库(domain knowledge base,DKB)领域问题求解知识,包括规划任务的规则、前提数据等。协作规划器(cooperation planne

13、r,CpP) 协作规划器是协作规,划层的核心,协作规划器根据领域知识将承接的任务分解(若不需分解则将任务交给协调层处理)。基于确定的协商策略和协商协议以协商方式实现机器人之间任务的动态分配,协调机器人之间的合作,建立机器人之间的协作关系。,协作规划层结构框图,2 协调规划层,协调规划层是为了解决机器人之间协作关系确定下来以后具体的运动控制问题,协作层确定了机器人的任务/子任务后,机器人根据当前目标(任务)、自身状态、以往经验、传感信息等来规划自身行为。另外,它在动作执行的过程中负责检查冲突和采取有效的措施消解冲突。对于协调层中无法处理的问题,则返回协作规划层,由协作规划层重新规划。,协调规划层

14、结构框图,主要模块包括如下:协调通信模块(communication module of coordination layer,CMCdL) 负责机器人之间运动规划信息的传递。建模模块(modeling module,MM) 根据传感器信息和通信信息对外部环境进行建模,目的是为了对其它机器人的运动状态做出预测,作为自己动作的参考。其中建模模型包括世界模型和其它机器人的状态模型。 冲突检测模块(conflict inspecting module, CIM) 随着时间的推移及外部环境的变化,原来的计划在执行过程中可能会产生冲突。冲突检测模块则检测冲突的发生、判断冲突发生的类型以及推测冲突发生的原

15、因等。 冲突识别库(conflict type base, CTB) 存放各种冲突类型,如目标冲突、资源冲突等。冲突消解模块(conflict reconciling module ,CRM) 根据冲突类型提供相应的冲突消解策略。消解策略库(conflict reconciling strategy base ,CRCS) 存放冲突消解策略。 协调规划器(coordination planner , CdP) 是协调层的核心,它负责机器人运动协调的局部规划。根据任务(目标)、自身状态及外部环境信息,规划自身的行为,产生近期的运动序列,并负责与机器人规划层之间的协商,实现机器人之间冲突的消解。,

16、3 行为控制层行为控制层的设计有两个目的:一是为了使机器人对紧急情况或简单任务迅速做出反应(如避障),它直接由传感信息映射到某种行为,基本上不作推理或根据简单规则直接推理;二是执行协调规划层产生的运动控制命令,产生相应的动作。通过反应产生的运动具有最高的优先级,动作模块立即执行,而将从协调规划层送来的动作中断。如果发生中断,则协调规划模块将决定是否重新进行规划。,f:(*)表示从传感信息到运动控制的映射关系,可以由神经网络、分类器、规则推理等实现。,行为控制层结构框图,11.2.2 基于行为的混合分层式结构,基于行为的机器人混合分层式体系结构,行为模块层由多个行为模块组成。行为管理层的主要功能

17、是根据机器人当前任务、状态、周围环境及合作要求,对机器人的行为进行调整。行为模式指的是机器人控制系统对所获信息的反应模式。行为模式决定了控制系统在收到信息后,将做出何种行为决策。对行为模式的调整包括改变行为模块激活状态、改变行为算法的参数、改变行为综合方式和参数等。通过这种在线调整,可提高机器人的适应性,同时为机器人之间协作的顺利进行提供一定的保证。行为综合层处于结构的最下层,其目的是对各个激活的行为模块的输出做出综合决策,控制机器人最终的运动。,行为管理层概念框图,11.2.3 任务级协作式结构1 任务级协作集中式任务分配分布式任务分配熟人网分配合同网分配将熟人网和合同网结合在一起可以形成一

18、种更加灵活的多机器人系统任务分配机制。一般来说,熟人/合同网任务分配机制比较适合小型的多机器人系统。为了使这两种机制能够适应于大型机器人群体系统,系统应该具有一定的组织形式,创建一种分层式组织形式可分三步进行:,(1) 对于一个多机器人系统,根据机器人所具有的技能等因素将其分解为数目相当的若干小组,同时各个小组选出自己的管理者作为系统的最底层的管理成员,并且各个小组管理者建立自己的熟人表;(2) 对各小组管理者继续分组,选出各个新组的管理者作为上一层成员并建立下属表(一种简单的熟人表,只包含下属机器人的名称);(3) 循环执行步骤2,直到该层所有机器人个数n满足1nGmax,式中Gmax为形成

19、一个小组所需要的最大机器人个数。创建系统最高管理者,并建立下属表。当某些机器人加入、离开系统以及接受了一定任务或完成任务后返回系统时,系统局部做出一些改变,必要时系统进行重组,实现了对机器人群体的有机管理和控制。,2 具体设计控制体系结构包括系统监控层、协作规划层和行为控制层三个层次。通信是协作的机器人之间交互的基本手段,机器人之间相互交换的信息包括任务、有关的内部状态和一些运动数据等。,多移动机器人系统框架结构,系统监控层(system-monitoring,SML)当系统发生不可预见的情况使得协作规划层和行为控制层都无法解决时,由系统监控层通知操作人员处理这些异常、冲突和死锁,如改变任务的

20、执行状态和机器人运动的方向。另外,操作人员可以通过系统监控层直接对任务或者运动规划进行干预。协作规划层(coorperation planning layer,CpPL)协作规划层的主要功能是建立机器人之间的分层式组织关系,根据任务的要求创建和组织合适的机器人群体,解决多机器人之间的任务级协作问题。它还承担处理一些异常、无法解决的冲突和死锁,同时作为系统监控层和行为控制层信息传递的媒介。,协作规划层结构框图,行为控制层,采用基于行为的方法,根据当前的任务状态,综合感知模块检测到的环境信息,通过通信获得的相关信息及来自上层的有关命令,结合对工作环境的了解进行决策,为机器人规划出具体的运动方向和运

21、动速度,实现具体的运动控制。,行为控制层结构框图,11.2.4 并行处理混合式结构,基于多DSP并行处理的混合式体系结构利用DSP高速的数字信号处理能力来提高机器人的响应速度,有助于提高机器人运动的平稳性。基于这种体系结构设计制造的轮式移动机器人CASIA-I。,CASIA-I体系结构,11.3 多机器人系统的协调控制,11.3.1 协调控制策略1 多机器人协调合作的主要研究方法协商和反应式方法分布式人工智能方法学习与进化方法,2 多机器人协调合作的一些知名模型最著名的就是Bratman 等人提出的BDI ( Belief Desire Intention)模型。Cohen和Levesque又

22、将“承诺( Commitment )”和“公约 (Convention )”的概念补充进来,后又经Jennings, Wooldridge等人的进一步发展,形成了一套目前最为系统和成熟的多智能体协调理论框架联合意图理论。基本要点是:多个智能体在完成一个共同任务时会形成一个共同承诺,如果不出现“任务已完成”、“任务无法完成”和“任务不必完成”三种情况之一,智能体就应该遵守公约,即坚持承诺,直到成功完成共同任务;否则,智能体就会设法通知正在合作执行共同任务的其它智能体,自己将要退出承诺。这样,其它智能体就能够适时做出调整。该理论只是侧重于智能体在完成任务时的一致性参与及坚持承诺上面,没有提出具体分

23、工上的协作,所以该理论只是提出了一个框架,针对不同的问题还应该有相关的领域问题需要解决。,V1OSZ等提出了共享计划理论,它是建立在一种联合精神状态之上的,其中最重要的概念就是它引入的概念算子:“打算”( Intention that)和“打算做”( Intention to ),它们通过一系列原子操作符定义,引导智能体采取包括通信在内的行动来使得个体、子团体和整个合作团体能够协调一致的执行所赋予的任务。对策论(Game Theory)的研究始于上个世纪四十年代,多智能体系统中对基于对策论的协商模型也展开了广泛的研究。最早提出基于对策论协商模型的是Rosenschein,他首先应用对策论来分析

24、MAS的协商过程。Shoham等人提出为智能体制定一套社会规则(Social Laws ),要求每个主体都必须遵守,而且相信别的主体也会遵守。利用社会规则可以大量减少求解问题时的搜索空间,降低控制的复杂度,而且减少了智能体间的交互,但同时也会伴随着一些合理解的丢失。,合同网模型是针对资源不足的多智能体动态环境的情况,采用了任务分解、任务分配、任务监督和任务评价等要素构成的一种协商策略。合同网模型源于1980年Smith提出的合同网协议,合同网包括三个节点:管理者、投标者和合同者。基于行为主义的多智能体系统的协调机制是以Brooks的基于行为的系统分析与设计方法为基础的。行为主义者认为智能体只需

25、具有最基本的动作行为,智能体的智慧表现来源于对外界环境和变化的及时反应。这种协调机制也在许多方面得到了成功的应用,典型的应用就是多机器人的编队。,11.3.2 协调控制平台针对协调控制问题,人们开发了多种协调控制平台。这些平台主要有两类。一类是针对集中式协调控制策略,另一类是针对分布式协调控制策略。随着网络技术的发展,基于网络的协调控制平台得到了很大的发展。人们希望通过网络实现多机器人的协调行为,并且融合不同机器人的智能,基于对多机器人系统建立的模型和网络平台实现多机器人系统的智能协调行为。例如,本书作者之一的研究小组开发了一种基于知识模型的智能协调网络平台K-ICNP (Knowledge

26、Model-Based Intelligent Coordinative Network Platform)。该平台采用Java编程语言进行开发。基于这一网络平台并采用知识模型的方法,可以有效地实现了多机器人系统的智能协调控制。,11.3.3 协调控制中的学习多机器人协调系统是一个极其复杂非线性动态系统,不可能具有完备的先验知识,而必须依赖其自学习和自适应能力。通过自学习和再励学习建模,动态调整控制参数来优化系统性能适应环境变化。有不少文献对多机器人协调系统的自学习和再励学习作了研究,并提出了一些学习算法。大致可分为四类:个体再励学习、群体再励学习、基于遗传算法的学习算法和基于模糊神经元的学习

27、算法。多机器人学习方法中还包括行为控制参数的学习、增强式学习和学习分类器系统。行为控制参数的学习又有基于遗传算法的行为控制参数学习和基于案例的空间时间推理的行为参数学习。,11.4 网络机器人,11.4.1 网络机器人的组成与特点把标准通信协议和标准人-机接口作为基本设施, 再将它们与有实际观测操作技术的机器人融合在一起,即可实现无论何时何地,无论是谁都能使用的远程环境观测操作系统,这就是网络机器人。基于Web服务器的网络机器人技术以Internet为构架, 将机器人与Internet连接起来, 采用客户端/服务器(C/S) 模式, 允许用户在远程终端上访问服务器, 把高层控制命令通过服务器传

28、送给机器人控制器, 同时机器人的图像采集设备把机器人运动的实时图像再通过网络服务器反馈给远端用户, 从而达到间接控制机器人的目的, 实现对机器人的远程监视和控制。,1 网络机器人的硬件结构,网络机器人硬件结构图,2 网络机器人的软件结构自主机器人,基于网络的自主机器人软件结构,网络服务器,网络服务器的软件结构,客户,客户的软件结构,3 网络机器人的特点(1) 基于网络的机器人技术涵盖了现代网络技术和机器人控制技术两方面的内容, 并且将两者有机地结合起来;(2) 基于网络的机器人建立在Internet的基础上, 相应地具有Internet特有的一些功能, 拥有良好的人机界面,可以实现人机交互功能

29、;(3) 基于网络的机器人以HTTP作为控制系统的标准通信协议,其系统控制软件具有良好的可移植性和互用性,可以使用一个服务器供不特定的多个用户在网络上任意使用;(4) 由于网络的存在,网络机器人技术使得机器人系统中必需的多数控制软件可以分散配置,机器人的软件开发也可以分散进行,更容易实现。,11.4.2 网络机器人的控制,网络机器人远程实时控制框架,最上层为智能与人机交互层,用于进行人机交互、任务规划、与CAD系统的联接以及视觉、语音等信号的处理。该层形成了机器人运动所需的空间直线、圆弧的特征参数,其中空间直线只需要起点和终点的位姿参数,空间圆弧只需要起点、终点和一个中间点的位姿参数。其次是运

30、动规划层,根据空间直线、圆弧的特征参数,进行在线运动规划、逆运动学求解、选出控制解等,形成各关节电机的位置。下一层为运动控制层,给定从运动规划层接收到的关节电机位置,反馈测量到的关节电机的实际位置,通过插值和D/A转换形成模拟量的速度信号。该层实现位置闭环控制。最下层为伺服控制层,给定运动控制层的速度信号,反馈以测量到的关节电机的实际速度,由伺服控制与放大器实现速度伺服控制。,11.4.3 网络机器人的应用虽然网络和机器人的结合才刚刚开始, 但网络机器人技术在工业、空间、海洋、战场等远程控制方面, 以及远程教学等领域有着广泛的应用前景。远程制造遥操作娱乐领域远程健康监控,10.5 多机器人系统

31、的应用,11.5.1 机器人足球机器人足球比赛已经成为当前人工智能和机器人领域的研究热点之一,其目的是通过提供一个标准的、易于评价的比赛平台,促进多智能体系统、分布式人工智能及机器人学等领域的研究与发展。机器人足球比赛要解决分散存在的多智能体在复杂动态环境下,通过相互通信和协调,以实时方式进行的知识处理问题。目前,举办全自主机器人足球比赛的国际组织有两个:RoboCup联合会和FIRA组织。,1 足球机器人控制系统的体系结构单机器人系统的体系结构在中型组比赛中,单个机器人的控制系统广泛采用混合式的体系结构,控制系统的上层采用规划技术,底层采用基于行为的反应是控制技术,这样既保证了系统的鲁棒性和

32、快速性,又使系统具有较高的决策智能。,单机器人系统的体系结构,多机器人系统的体系结构各队普遍采用基于无线局域网(遵守IEEE802. 11标准)的通信技术。每个机器人和场外计算机作为网络的节点,共同构成一个无线局域网络系统。,本文将球队的体系结构分为两种:集中与分布式结合的混合型结构和完全分布式的结构。,机器人系统的体系结构(完全分布式的结构),多机器人的协作是指多个机器人通过协调各自的行为,合作完成共同目标。机器人的协作策略在很大程度上决定了一支球队的强弱,也是机器人智能的一个集中体现。2 足球机器人目前存在的难题(1) 如何充分利用多个机器人的传感器信息以获得对环境相对完整的感知;(2)

33、如何设计协作策略以提高机器人球队的整体性能;(3) 如何通过学习技术来获得或发展单机器人的控球技巧甚至多个机器人的配合策略,并应用于真实的机器人系统。,11.5.2 多移动机器人协作围捕Yamaguchi提出一种包含反馈控制和反应式控制的混合框架系统,将反馈控制律用于协调多个移动机器人的运动,采用队形矢量控制群体队形。韩学东等提出一种快速收敛的机器人部队包围“入侵者”的队形分布式控制算法。Denzinger等利用最邻近规则(nearest-neighbor rule)对当前状态进行分类,对每一个状态用遗传算法搜索为实现围捕智能体应当采取的最优动作。Osawa提出metalevel协调策略,协作抓捕智能体实现围捕。作者提出一种在连续未知环境中实现围捕任务的整体方案。用强化学习实现机器人的包围行为,通过和其它行为的综合实现多个机器人围捕共同目标实现围捕任务的整体方案。,围捕流程图,11.5.3 多机器人协作装配基于多智能体概念实现的多机器人协作装配系统MRCAS (Multi-Robot Cooperative Assmbly system )由组织级计算机、三台工业机器人和一台全方位移动小车(ODV )组成,采用分层递阶体系结构。,MRCAS系统体系结构,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号