《多智能体控制概述课件.pptx》由会员分享,可在线阅读,更多相关《多智能体控制概述课件.pptx(51页珍藏版)》请在三一办公上搜索。
1、提纲,什么是多智能体系统应用研究意义研究方法分类 基于图的离散方法基于PDE的连续方法研究进展-多智能体队形控制,多智能体系统,什么是多智能体系统,What kind of systems?什么是多智能体系统Groups of agents with control,sensing,communication and computing能控制,感知能力,能相互通讯,能计算Each individual senses its immediate environment 感知周围环境communicates with others 交互能力processes information gathere
2、d 信息处理,计算能力takes local action in response 响应,决策能力,生物界的群体自组织行为,Able to 控制目标,deploy over a given region 将多个自主体部署到指定区域assume specified pattern 形成指定的队形,队形控制rendezvous at a common point 所有智能体集合到一个点jointly initiate motion/change direction in a synchronized way 协同的运动模式,同步运动方向,Species achieve synchronized b
3、ehaviorwith limited sensing/communication between individualswithout apparently following group leader(Couzin et al,Nature 05;Conradt et al,Nature 03),多智能体系统的应用,Embedded robotic systems and sensor networks forhigh-stress,rapid deployment|e.g.,disaster recovery networks(在危险的地方工作)Distributed environme
4、ntal monitoring|e.g.,portable chemical(分布式环境下的监视)and biological sensor arrays detecting toxic pollutantsAutonomous sampling for biological applications|e.g.,monitoring of species in risk,validation of climate and oceanographic models 自主采样 Science imaging|e.g.,multispacecraft distributed interferomet
5、ers flying in formation to enable imaging at microarcsecond resolution 科学成像,嵌入式机器人飞机编队飞行,队形控制小卫星群无线传感网络,Local agent interactions giving rise to global behavior,哈佛大学的研究团队公布,他们应用多智能体协同控制技术开发了小机器人协同建造系统,模仿白蚁处理信息的方式,系统可以自动产生底层个体的简单规则,建造指定的复杂结构。每个自主小机器人,功能简单只感应局部的信息,并通过共享的环境来协同他们的行为,实现分布式控制。研究发表在2019年2月1
6、4日的科学杂志上。J.Werfel,K.Petersen,and R.Nagpal,“Designing collective behavior in a termite-inspired robot construction team,”Science,vol.343,no.6172,pp.754758,2019.,2019年科学杂志十大科学进展之一news.sciencenet/htmlnews/2019/12/309623.shtm,Termites机器人的特点,没有中央控制(整体规划)的情况下,依靠个体之间相互作用的简单规则,完成复杂的建造任务。机器人只拥有觉察到附近有块砖或有一个机器
7、人的能力,就能决定自己下一步的行动。它们是在没有详细的规划或中央通讯的情况完成这些工作的;而为这些机器人所设的程序只是若个简单的规则。由用户定义的结构,来决定机器人需要遵循的规则.独立且具有分散性控制的机器人有众多的优点。冗余性:个别的机器人可能会出毛病,但其余的机器人可继续运行。整个系统不会因为有一处关键环节出现了故障而瘫痪。灵活性:这样的系统也具可缩放性。“如果要从事更大规模的工作,人们只需要增加更多的机器人(甚至在工作进行中)而无需对它们的编程进行改动。”,让机器人合作:新的软件和互动机器人正向人们证明,机器人终于能在无需人监督的情况下一同工作;例如,指示成群的受到白蚁启发的机器人来构建
8、一种简单的结构,或提示一千个25美分硬币大小的机器人形成方块、字母及其它二维形状等。,应用例子,例子 robotic submarine 寻找马航失联客机autonomous underwater vehicle在海底寻找,多个水下机器人形成协同搜索,效率更好,每个搜索一片区域,相互之间传递消息。应用于无人驾驶机群的编队飞行,可移动机器人的定位和位置部署,可移动传感网络的布局,运输车辆的协调,飞行器或者小卫星群的空间布局等无人网络系统的控制,在人类难以到达或者危险的地方,完成环境探索、科学采样、地图绘制、监测和侦查、搜索和营救以及分布式传感等协同任务。多智能体协同控制的研究可派生出各种分布式算
9、法,解决不同领域的科学问题,例如异步网络通讯、分布式协同决策、信息融合以及耦合振子系统等。,Research program:what are we after?,Design of provably correct,distributed coordination algorithms 分布式协同算法设计Mathematical tools to study convergence,stability,and robustness of coordination algorithms 对算法性能进行分析Coordination tasks 执行协同任务exploration,map buil
10、ding,search and rescue,surveillance,odor localization,monitoring,distributed sensing 勘探,绘制地图,搜索营救,侦查,气味定位,监视,分布式传感。,要用到的方法和技术,Optimization Methods 优化方法resource allocationgeometric optimizationload balancingGeometry&Analysis 算法结构,非光滑分析Control&Robotics 机器人技术和控制algorithm designcooperative controlstabil
11、ity theoryDistributed Algorithms 分布式算法,图论,PDE,Cooperative robotic networksDistributed coordination algorithmsLocal agent interactions giving rise to global behaviorLimited information,Veriably correct,rigorous assessment of properties要实现的目标:构建机器人协同网络;采用分布式协同控制律;能够通过有限的信息,局部的作用规则实现全局复杂的行为。,Consider r
12、endezvous/deployment/agreement scenarioConsensus=reach common value for some variable 一致性算法Rendezvous=get together at certain locationDeployment=deploy over a given region,目前的研究方法分类,离散的一致性控制律研究多智能体协同控制的传统方法是基于图论的离散分析方法,即以代数图论为框架,以谱分析、矩阵论、控制理论与最优化为工具进行建模、分析和设计控制器。等价于连续的扩散方程(偏微分,包含空间变量),研究进展多智能位置部署,图1
13、 Agent系统分析和设计过程,网络拓扑通讯图:其中的一个实例,图2 412个agent映射到连续空间单位圆上的通讯拓扑图,用PDE建模,因此agent的动态特性就可以用PDE来描述一阶积分的动态关系可以用抛物PDE表示:,,,二阶积分的动态关系可以用双曲的PDE表示:,,,(5),PDE的平衡点,PDE的平衡点对应系统的稳定状态我们令PDE的状态量表示agent的位置,可以得到agent的稳态位置方程通过变化参数 和边界输入(也是领导者agent的位置),可以实现系统的不同稳态解,对应不同的部署流形。Jie Qi,Rafael Vazquez*,Miroslav Krstic,Multi-a
14、gent Deployment in 3-D via PDE Control,IEEE Transaction on Automatic Control.Accept available online:http:/ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=6914569&queryText%3Dmultiagent+deployment+in+3-D+via+PDE+control,两个二维复值方程确定的位置部署流形,边界条件如下,其中f(theta)是一个2pi为周期的周期函数,图 3 多智能体三维位置部署,多智能体系统边
15、界控制器设计的基本思路,这些流形由PDE的边界输入驱动,即改变领导者agent的位置可实现系统在不同部署队形之间的转换。在实际应用中,大多数需要部署的流行对应的平衡状态不稳定。我们将采用backstepping方法设计边界反馈控制器使系统稳定。,图2 基于PDE的方法设计多智能体控制律实现位置部署与队形控制,PDE描述的多智能体模型,边界条件,也可看作边界控制器,控制器设计,最后用傅立叶级数对全部子系统求和,得到整体系统的控制器如下:,通过采用傅立叶级数展开,得到与theta独立的子系统,然后再对简单的子系统设计控制器,其backstepping的核函数如下:,证明系统在L2,H1和H2空间稳
16、定,对于二维的系统,如果要确保系统状态具有较好的函数性质,例如连续性,需要证明H2范数下稳定。连续性使得在通讯拓扑网络上相邻的智能体在物理空间上也相邻,这个特性对于系统的实际应用非常重要,因为agent的通讯范围是有限的,这样agent就不会跑出与邻居的通讯范围之外,使系统失效。,观测器设计,为了实现真正的分布式控制,即每个agent只需要局部邻居的信息就能完成整体的控制目标,我们设计的观测器,能够估计所有agent的状态,也就是leader agent能够通过测量最近邻居的状态,计算出所有agent的状态。观测的设计与控制器的设计是对偶的,我们得到了精确的封闭表达式,证明带观测器的系统在L2
17、,H1和H2空间稳定,估计系统中也有一个核函数在角度0-2pi上积分 将估计的状态作为状态反馈进行边界控制,可实现级联系统的稳定控制,离散化获得分布式控制律,用有限差分方法离散化,离散化的误差取决于agent的数目和离散方法。用三点中心法离散化,得到各个agent的分布式控制律,中间的智能体,离散化获得分布式控制律,得到一组常微分方程,描述每个agent的控制律(行为规则)。,领导者智能体,靠近极点的智能体,仿真,仿真,仿真,仿真,Khepera III机器人,Khepera III机器人,小型机器人 Khepera III机器人上安装的多传感器阵列,可以有效的检测出不同距离范围的物体。自身携带可更换充电电池,可使它高度自主。机器人装有9个用于障碍检测的红外传感器,5个远距离障碍物检测的超声传感器。前面装有一组寻线传感器以及边缘检测。电机模块使用的是瑞士生产的高质量传动模块。高精度伺服电机保证了它移动的准确性和高效性,Khepera 4,用多个Khepera 4 小机器人作为多智能体协同控制的实验载体,验证算法的有效性。,48,Thanks,谢谢大家!,