《单神经元PID控制器设计毕业论文.doc》由会员分享,可在线阅读,更多相关《单神经元PID控制器设计毕业论文.doc(48页珍藏版)》请在三一办公上搜索。
1、单神经元PID控制器设计摘 要常规PID控制器具有结构简单、易于实现、鲁棒性强等优点,但实际的生产过程中,控制对象一般都具有延迟大、非线性强、干扰大的特点。因此当工况改变时,对象的动态特性也发生改变,控制品质就会随之下降,所以采用常规PID控制器很难获得令人满意的控制效果。神经网络具有强鲁棒性、容错性、并行处理、自学习、逼近非线性关系等特点,在解决非线性和不确定系统控制方面有很大潜力,近年来已广泛应用于工业过程控制领域。由于单神经元模型具有自适应和自学习的能力,使得它可以作为一种很好的方法而得以应用,因此本文将单神经元模型与常规PID控制器相结合,形成了具有自适应能力的单神经元PID控制器。本
2、文讨论了单神经元自适应PID控制器和多变量单神经元PID控制器的结构,控制算法,并MATLAB仿真软件给出了实例仿真。MATLAB仿真结果表明,该控制系统既保持了常规PID控制的优点,又有自学习的智能特性,因而具有良好的控制品质和较强的自适应能力。关键词:PID控制器;数学模型;自适应控制;单神经元;MATLAB仿真;多变量The Design of Single Neuron PID ControllerAbstractConventional PID controller is simple in structure, easy to implement, robust and other
3、 advantages. However, in the actual production process control targets have delayed the general, non-linear strong, and the heavy characteristics of the disturbance, so when the situation changes, the object of dynamic change, quality control will be declined. Therefore, the conventional PID control
4、 method is difficult to obtain satisfactory performance.Neural network has stronger robust, fault-tolerant, parallel processing, self-learning, approaching the characteristics of non-linear relationship, and uncertainty in solving nonlinear control system there is great potential, in recent years ha
5、s been widely used in controlled areas. In single-neuron model is self-adaptive and self-learning ability , it can be regarded as an effective intelligent way for application ,so this article will be use single-neuron model with the conventional PID controller combine to form the adaptive capacity o
6、f a single-neuron PID controller. This paper discusses the structure andthe control algorithm of the single neuron adaptive PID controller and the variable single neuron PID controller,besides,giving the simulation examples by MATLAB simulation software.The MATLAB simulation results indicated that t
7、he control system both maintained the conventional cascade PID control merit, and has from the self-learning intelligent characteristic, thus has the good control quality and the strong auto-adapted ability.Key words:PID controller;Parameters of the model;Adaptive control;Single-neuron;MATLAB simula
8、tion;multivariable 目 录第1章 引 言11.1 单神经元PID控制的产生背景11.2 单神经元PID控制研究现状11.3 本论文的主要内容2第2章 神经网络理论基础32.1 单神经元模型32.2 神经网络的拓扑结构52.3 神经网络的学习方法62.3.1 神经网络学习方式62.3.2 神经网络学习规则72.4 感知器9第3章 单神经元自适应PID控制器的设计及仿真实现123.1 传统PID控制123.2 单神经元自适应 PID 控制器133.2.1 自适应控制系统133.2.2 控制结构163.2.3 控制算法183.2.4 仿真程序及分析193.3 采用二次型性能指标的的
9、单神经元自适应PID控制器27第4章 多变量单神经元PID控制器的设计及实现294.1 二变量控制系统框图294.2 控制算法294.3 SIMULINK仿真30第5章 结 论32参考文献33谢 辞34第1章 引 言1.1 单神经元PID控制的产生背景PID控制具有结构简单、稳定性能好、可靠性高等优点,尤其适用于不能建立精确数学模型的不确定性控制系统。PID控制中一个关键的问题便是PID参数的整定。但是在实际的应用中,许多被控过程机理复杂,具有高度非线性、时变不确定性和纯滞后等特点。在噪声、负载扰动等因素的影响下,过程参数甚至模型结构均会随时间和工作环境的变化而变化。这就要求在PID控制中,不
10、仅PID参数的整定不依赖于对象数学模型,并且PID参数能够在线调整,以满足实时控制的要求。神经网络主要用来解决那些传统方法难以解决的控制对象参数在大范围变化的问题,其思想是解决PID参数在线调整问题的有效途径。单神经元是构成神经网络的基本单位,神经元构成的单神经元PID控制器不但结构简单、学习算法物理意义明确、计算量小,而且具备自学习、自适应、自组织的能力,能够自动辨识被控过程参数,自动整定控制参数、能够适应被控过程参数的变化,鲁棒性强、可靠性高,这类控制器已在实际问题中得到了应用。1.2 单神经元PID控制研究现状神经网络控制是基于结构模拟人脑生理结构而形成的智能控制和辨识方法。随着人工神经
11、网络应用研究的不断深入,新的模型不断推出。在智能控制领域中,应用最多的是BP网络、RBF网络、Hopfield网络等。BP网络是目前应用最为广泛的一种网络模型,通常BP算法是通过一些学习规则来调整神经元之间的连接权值,学习的规则和网络的拓扑结构不变。然而,一个神经网络的信息处理功能不仅取决于神经元之间的连接强度,而且与神经元的连接方式即网络的结构有关。合理的选择网络结构可以加快了网络的收敛速度,改善了学习速率和网络的适应能力。单神经元PID控制是神经网络应用于PID控制并与传统PID控制器相结合而产生的一种改进型控制方法,是对传统的PID控制的一种改进和优化。单神经元PID控制器具有现场调整参
12、数少、易于现场调试的重要特点,能较大地改善典型非线性时变对象的动态品质,能够适应过程的时变特性,保证控制系统在最佳状态下运行,控制品质明显优于常规PID控制器。 在最优控制理论中, 采用二次型性能指标计算控制规律可以得到所期望的优化效果。根据线性二次型最优控制(LQR)理论,在单神经元控制器中引入二次型性能指标,借助最优控制中二次型性能的思想,使输出误差和控制增量加权平方和为最小来调整加权系数,从而间接的实现对输出误差和控制增量加权的约束控制。由此构成的单神经元PID控制为一变系数的比例积分微分复合控制器。它通过自身的学习了解系统的结构、参数和不确定性,并改变控制参数;加权系数调整中引入二次型
13、性能指标,利用输出误差和控制增量加权平方和最小来调整加权系数,加快了学习速率, 因此控制器具有很强的鲁棒性和实时性。1.3 本论文的主要内容基于数字PID控制器设计原理,首先,分析讨论PID控制及单神经元PID控制器设计方法,进而,对于给定对象设计单神经元PID控制器,要求推理论证、分析设计、关键点探讨、仿真及其结果分析;讨论比起传统PID控制方法,单神经元PID控制器的改进之处;适当分析探讨优点与尚存在的有关问题。 运用于对象,对输出结果做仿真。对仿真结果进行分析。使其仿真试验表明:单神经元PID控制器拥有杰出的参数自整定能力,抗干扰能力强,超调量小,只需要选择适当的学习速率参数就可以让系统
14、的超调达到理想状态。此外,单神经元控制器的控制方法简单,动态参数较少,性能出色,依靠软件实现,能够适应控制对象的时变性,在工业控制过程中的应用前景良好。第2章 神经网络理论基础2.1 单神经元模型根据生物神经元的结构和功能,从20世纪40年代开始,人们提出了大量的人工神经元模型,其中影响较大的是1943年美国心理学家W.McCulloch和数理逻辑学家W.Pitts共同提出的形式神经元模型,通常称之为MP模型。该模型结构如图2.1所示。图2.1 MP模型设有N个神经元互联,每个神经元的活化状态(j=1,2,N)取0或l,分别代表抑制和兴奋。第i个神经元的状态按下述规则受其它神经元的制约 (2.
15、1) (2.2)其中,表示神经元j和神经元i之间的连接强度,或称权值; 为阈值;为阶跃函数,称为神经元激发函数或变换函数,其函数表达式为 (2.3)为该神经元的输出,其值为0或1,即1代表该神经元被激活;0代表神经元被抑制。有时也将看成是恒等于1的输入的权值,这时(2.1)式可写成(2.4)其中,。这就是最初的MP模型。其输入、输出均为二值量,权值固定。利用该神经元模型,可以实现一些简单的逻辑关系。将MP模型中的阶跃激发函数step()用其它一些非线性离散或连续函数代替,用于反映神经元的非线性特性,便得到更为一般的神经元模型。图2.2列出了几种常见激发函数f(.)。图2.2 常见激发函数a.阶
16、跃函数此即为MP神经元模型中使用的激发函(2.5)b.符号函数(2.6)a,b均为阈值函数,也叫开关函数,常用于模式分类。c.饱和函数 (2.7)d.双曲函数 (2.8)e.S型函数神经元状态与输入作用之间的关系是在(O,l)内连续取值的单调可微函数,参数u0可控制其斜率,称为sigmoid函数,简称S型函数。(2.9)f.高斯函数在径向基函数构成的神经网络中,神经元的结构可用高斯函数描述如下(2.10)可以看出神经元模型是对生物神经元的一种模拟与简化。具有人类神经元的某些基本反应特性。神经元模型的建立,对于人工神经网络理论的研究具有重要意义,其创建方式一直启发着后人,并发扬贯穿至今,直接影响
17、着这一研究领域的全过程。2.2 神经网络的拓扑结构人工神经网络的信息处理由神经元之间的相互作用来实现,并以大规模并行分布方式进行,信息的存储体现在网络中神经元的互联分布形式上。利用神经元可以构成各种不同拓扑结构的网络。目前,己有数十种不同的网络模型,其中前馈型网络和反馈型网络是两种典型的结构模型。(1)前馈型神经网络前馈型神经网络,又称前向网络 (FeedforwardNN)。神经元分层排列,每层只接受与之相连的前一层神经元的输出。从实现的观点来看,前馈网络结构简单、易于编程。从系统的观点看,前馈网络是一种静态非线性映射,通过简单非线性处理单元的复合映射,可获得复杂的非线性处理能力。它们的分类
18、能力和模式识别能力较强。(2)反馈型神经网络若总节点(神经元)数为N,则每个节点有N个输入和一个输出,所有节点都是一样的,它们之间都可以互相连接。反馈型神经网络是一种反馈动力学系统,它需要工作一段时间才能达到稳定。2.3 神经网络的学习方法所谓神经网络学习,是指在一组给定信息(学习样本)输入下,各处理单元状态不变,但各连接权值不断得到修正,使网络达到一个期望输出的过程。学习算法是体现人工神经网络具备人工智能特性的主要标志,离开了学习算法,人工神经网络就失去了诱人的自适应、自组织和自学习能力。2.3.1 神经网络学习方式神经网络的学习方式有多种,按有无导师来分类,可分为有导师学习(Supervi
19、sed Learning)、无导师学习(Unsupervised Learning)和再励学习 (ReinforeementLearning)等几个大类。(l)有导师学习(监督学习)如图2.3所示,这种学习方式需要外界存在一个“教师”信号,它可对给定的一组输入提供应有的输出结果(正确答案),这组己知的输入输出数据称为训练样本集,学习系统(NN)可根据己知输出与实际输出之间的差值(误差信号)来调节系统参数。图2.3 有导师学习框图(2)无导师学习(非监督学习)如图2.4所示,无导师学习不存在外部教师信号,学习系统完全按照环境提供数据的某些统计规律来调节自身参数或结构(这是一种自组织过程),以表示
20、出外部输入的某种固有特性(如聚类或某种统计上的分布特征)。环境输入学习系统图2.4 无导师学习框图(3)再励学习(强化学习)如图2.5所示,这种学习介于上述两种情况之间,外部环境对系统输出结果只给出评价信息(奖或惩)而不是给出正确答案。学习系统通过强化那些受奖的动作来改善自身的性能。图2.5 再激励学习框图2.3.2 神经网络学习规则(1)Hebb学习规则1949年,神经心理学家D.0.Hebb基于对生物学和心理学的研究,提出了具有学习行为的突触联系和神经群理论。他根据心理学中条件反射机理,研究神经网络中合适的学习方式,探讨了神经细胞间连接强度的变化规律,概括成了著名的Hebb学习规则。其基本
21、思想是,当两个神经元同时兴奋或同时抑制时,他们之间的连接强度将得到增强。用数学方式可表示为 (2.11)式中,和分别为两端神经元的状态。Hebb学习规则是一种无教师的学习方法,它只根据神经元连接间的激活水平改变权值,因此又称之为相关学习或并联学习。Hebb学习规则可写为(2.12)另外,根据神经元状态变化来调整权值的Hebb学习方法称为微分Hebb学习方法,可描述为(2.13)(2)Delta学习规则假设误差准则函数为(2.14)其中,代表期望的输出(教师信号);训练样本数p=1,2,,P;为网络的实际输出;W为网络所有权值组成的向量W=;为输入模式。为使误差准则函数E最小,利用梯度下降法,沿
22、着E的负梯度方向不断修正w值,直到E达到最小,这种方法的数学表达式为(2.15)用表示,则有 (2.16)W的修正规则为 (2.17)上式称为学习规则,又称误差修正规则,定义误差传播函数为(2.18)规则实现了E中的梯度下降,因此使误差函数达到最小值。但占规则只适用于线形可分函数,无法用于多层网络。(3)竞争式学习竞争式学习属于无教师学习方式。这种学习方式是利用不同层间的神经元发生兴奋性联接,以及同一层内距离很近的神经元间发生同样的兴奋性联接,而距离较远的神经元产生抑制性联接。在这种联接机制中引入竞争机制的学习方式称为竞争式学习。它的本质在于神经网络中高层次神经元对低层次神经元的输入模式进行竞
23、争识别。竞争式机制的思想来源于人脑的自组织能力。大脑能够及时地调整自身结构,自动地向环境学习,完成所需执行的功能,而并不需要教师训练。竞争式神经网络亦是如此,所以也把这类网络称为自组织神经网络(自适应共振网络模型一 AdaptiveResonanCeTheory,ART)。自组织神经网络要求识别与输入最匹配的节点,定义距离几为接近距离测度,即 (2.19)其中,u为N维输入向量,具有最短距离的节点选作胜者,它的权向量经修正,使该节点对输入u敏感。定义Nc,其半径逐渐减小至接近于零,权值学习规则(2.20)在这类学习规则中,关键不在于实节点的输出怎样与外部的期望输出相一致,而在于调整权向量以反映
24、观察事件的分布,提供基于检测特性空间的活动规律的性能描写。从上述几种学习规则不难看出,要使神经网络具有学习能力,就是使神经网络的知识结构变化,即使神经元间的结合模式变化,这同把连接权向量用什么方法变化是等价的。所以,所谓神经网络的学习,目前主要是指通过一定的学习算法实现对突触结合强度(权值)的调整,使其具有记忆、识别、分类、信息处理和问题优化求解等功能。2.4 感知器(Pereeptron)本章开始介绍的单神经元模型中,由于神经元权值呜固定,使得该结构不具备自学习、自适应功能。1958年美国学者F.Rosenblatt利用闭值型人工神经元模型和Hebb学习规则,提出一种具有自学习能力的单层前向
25、神经元网络模型,结构如图2.6所示,称为感知器(Perceptron)模型.其基本思想是将一些类似生物神经元的处理单元构成一个计算网络,该网络能够自动地学习如何对模式进行识别和分类。图2.6 单层感知器网络单层单个神经元的感知器模型与图2.1所示MP模型结构相同,它们的不同之处仅在于单层单个神经元的感知器模型假定神经元间的祸合程度(联接权值)可变,这样它就可以学习。感知器的学习是有导师学习,它可以通过多次训练达到学习的目的。训练的要素有两个:训练样本和训练规则。训练规则就是误差修正规则;训练样本集是由若干个输入一输出模式对构成的集合,这里输出模式指对应于输入模式的期望输出。学习过程的基本思想,
26、是针对给定的输入一输出模式,求出输入模式的实际输出与期望输出之间的误差,用迭代方法调整联接权值和闽值,直到使各样本的实际输出与期望输出间完全一致。学习算法的具体实现步骤为:I 设置连接权的初值为较小的随机非零值II 给定输入输出样本对,和;III 计算感知器的实际输出 (2.21)IV 利用下式调整权值 (2.22)V 若和不一致,则令k=k+1,并转向步骤III,否则转向步骤II,直到联接权向量 对一切样本均稳定不变为止。这样,学习过程结束后,样本模式将以联接权和闽值形式,分布存储于网络中。理论证明,单层感知器能解决一阶谓词逻辑问题,如逻辑“与”、“或,“非”。但不能解决像异或这样的二阶谓词
27、逻辑问题。感知器学习算法保证收敛的条件是,要求函数是线性可分的。关于单层感知器算法收敛的问题,学术界己经进行过大量研究,有人指出是否可以通过改变神经元激活函数的方法(如采用较复杂的非线性函数)解决该问题。但结果表明,不论用什么样的激活函数,只要是单层网络,都只能解决线性可分问题。同时理论证明还指出,增强分类能力的出路是采用多层网络,即在输入和输出间加上隐层,构成多层前向网络,在单层感知器网络中加入一个隐层,就可实现任何布尔函数,三层感知器可以识别任一凸多边形或无界的凸区域。第3章 单神经元自适应PID控制器的设计及仿真实现3.1 传统PID控制常规PID控制是最早发展起来的控制策略之一,由于其
28、算法简单、调整方便、鲁棒性好和可靠性高,被广泛应用于工业控制。目前,大多数工业对象的动态特性尚未被完全掌握,得不到精确的数学模型,难以满足控制理论分析的要求,在决定系统参数时,往往还需要依靠现场调试及经验,而PID调节器就充分显示了它的威力。所以它的应用经久不衰,而且有所发展,应用范围更加广泛。至今它仍是一种最基本的控制算法。目前,大多数工业对象的动态特性尚未被完全掌握,得不到精确的数学模型,难以满足控制理论分析的要求,在决定系统参数时,往往还需要依靠现场调试及经验,而PID调节器就充分显示了它的威力。所以它的应用经久不衰,而且有所发展,应用范围更加广泛。至今它仍是一种最基本的控制算法。在模拟
29、控制系统中,控制器最常用的控制规律是 PID 控制,它实际上是一种线性控制器,它根据给定值 r(t)与实际输出值 y(t)构成控制偏差e (t ) = r (t ) - y (t ) (3.1)将偏差的比例(P)、积分(I)和微分(D)通过线性组合构成控制量,对被控对象进行控制,故称 PID 控制器。其控制规律为: (3.2)式中K比例系数,T 积分时间常数,T微分时间常数。误差、误差的积分与微分, 分别代表了系统输出的当前、过去和未来三个状态;PID各个校正环节的作用如下:1.比例环节 即时成比例地反映控制系统的偏差信号 e(t),偏差一旦产生,控制器立即产生控制作用,以减少偏差。2.积分环
30、节 主要用于消除静差,提高系统的无差度。积分作用的强弱取决于积分时间常数T,T越大,积分作用越弱,反之则越强。3.微分环节 能反映偏差信号的变化趋势(变化速率),并能在偏差信号值变得太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减小调节时间。由于计算机控制是一种采样离散控制,它只能根据采样时刻的偏差值计算控制量,因此积分和微分项不能直接使用,需要进行离散化处理。按模拟 PID 控制算法的算式,现以一系列的采样时刻点KT代表连续时间t,以和式代替积分,以增量代替微分,可得离散位置式 PID 表达式为: (3.3)而它的增量式PID控制算法为: (3.4)式中 k采样序号,
31、k0,1,2;u(k)第k 次采样时刻的计算机输出值;e(k)第k 次采样时刻输入的偏差值;e ( k-1)第(k-1)次采样时刻输入的偏差值;KI-积分系数;T为采样周期。3.2 单神经元自适应 PID 控制器3.2.1 自适应控制系统自适应控制系统是一个具有一定适应能力的系统,它能够认识系统环境条件的变化,井自动校正控伟动作,从而使系统达到最优的控制效果,其具有以下功能:(l)系统本身可以不断地检测和处理信息,了解系统当前状态。(2)进行性能准则优化,产生自适应控制规律。(3)可调环节(控制器),使整个系统始终自动运行在最优工作状态。自适应是现代控制的重要组成部分,它同一般反馈控制相比较有
32、如下突出特点:(l)一般反馈控制主要适用于确定性对象或事先确知的对象,而自适应控制主要研究不确定对象或事先难以确知的对象。(2)一般反馈控制能够消除状态扰动引起的系统误差。而自适应控制因为有辨识对象和在线修改参数的能力,因而不仅能消除状态扰动引起的系统误差,而且还能消除系统结构扰动引起的系统误差。(3)一般反馈控制系统的设计必须事先掌握描述系统特性的数学模型及其环境变化状况,而自适应控制系统设计则很少依赖数学模型全部,仅需要较少的前验知识,但必须设计出一套自适应算法,因而将更多地依靠计算机技术实现。(4)自适应控制是更复杂的控制,它在一般反馈控制的基础上增加了自适应机构或辨识器,还附加了可调系
33、统。自适应系统与其他系统的显著区别是它有性能指标闭环。从实用角度讲自适应控制大致可以分为两类:模型参考自适应控制和自校正控制。模型参考自适应控制系统的结构如图3.1所示。在这个系统中,采用了称为参考模型的辅助系统,可调系统的参考输入;也加到参考模型输入端,参考模型的输出可用规定的或期望的性能指标设计。为了比较规定的性能指标和可调系统实测的性能指标,用减法器将参考模型和可调系统的输出相减,得到广义误差信号。自适应机构按一定的准则利用广义误差信号来修改可调系统的调节器参数,产生一个辅助输入信号,使广义误差的某个泛函指标达到极小。当可调系统特性与参考模型特性渐进逼近,广义误差就趋于极小或下降为零,调
34、节过程结束。其设计目标是使系统在运行过程中力求保持被控过程的响应特性与参考模型的动态性能的一致性,而参考模型始终具有所期望的闭环性能。模型参考自适应控制系统的主要技术问题是实现性能比较和自适应控制器的设计。自校正控制又称自优化控制或模型辨识自适应控制。典型的自校正控制系统如图3.2所示。自校正控制系统具有三大要素:过程信息采集,控制性能准则优化,调整控制器。过程信息采集是指在测量过程输入、输出或状态信号基础上,连续确定被控过程的实际状态。过程模型辨识和参数估计及不可测量信号(如随机噪声信号)估计,是信息采集的相应方法。根据信息采集和估计方法的不同,形成各类自校正系统。辨识完全建立在对控制过程输
35、入和输出信号测量的基础上。控制器参数的计算则来自于被辨识的过程模型或估计参数,而且辨识和控制器设计算法都是在闭环实时在线下实现的。性能准则优化是指回路性能计算和决策如何调整自适应控制器。控制器调整是指新的控制器参数组计算及控制回路中旧参数的更换。自校正控制系统的设计目标是在所有输入信号和过程条件下,确定最优化过程模型和获得闭环系统的最优控制品质。在设计中,大多数自校正控制系统使用了分离原理,使过程或信号估计与控制器最优化设计分离进行。图3.1 模型参考自适应控制系统的基本结构图3.2 自校正控制系统的基本结构3.2.2 控制结构(1)神经元模型在本文中研究的单神经元自适应PID控制器中的单神经
36、元模型如下图3.3所示。单神经元的输出为: (3.5)图3.3 单神经元的模型其中分别对应神经元第i个输入、第i个输入所对应的连接权值,K为神经元的增益(比例系数),它对系统的快速跟踪和抗干扰能力有较大的影响。写为向量形式为:A=XW (3.6)其中X、W分别为输入向量、输入向量的连接权值向量。 (3.7)经元控制器的输出: (3.8)(2)神经元的学习理论连接权的可塑性。神经元的记忆、学习都是以神经网络结构的变化为基础的,神经网络结构的变化又是靠连接权的变化来实现的,这就是说,连接权有可塑性。Hebb假设。关于神经元连接权的变化,心理学家赫布(D.o.Hebb)的假设是著名的,这个假设的内容
37、是:只有当神经元兴奋时,神经元的连接权值才被强化而增大。学习环境的信息构造。神经元学习的好与坏,学习完成之后具有什么能力,与其所处的学习环境有关。学习环境包括学习内容、教师的指导内容、学习内容出现的频度。对于学习的神经元,学习环境相应地应包括:输入信号向量、教师信号、输入信号向量重复出现的程度。神经元学习规则学习规则是修正神经元之间的连接强度或加权系数的算法,使获得的知识结构适应周围环境的变化,学习过程由学习期和工作期两个阶段组成。在学习期中,执行学习规则,修正加权系数。在工作期内,连接权值固定,计算神经元的输出。单神经元控制器的自适应功能是通过学习改变连接权值来实现的。学习算法就是调整连接权
38、值哄的规则,它是单神经元控制器的核心,并反映了其学习的能力。学习算法如下: (3.9)式中为随过程递减的学习信号,为学习速率。常用的三种主要学习规则是:(1)无监督Hebb学习规则。Hebb学习是一种相关学习,它的基本思想是:如果有两个神经元同时兴奋,则它们之间的连接权值的增强与它们的激励的乘积成正比。用表示单元i的激励值(输出),表示单元j的激励值,表示单元j到单元i的连接权值系数,则Hebb学习规则可用下式表示: (3.10)式中n为学习速率。(2) 有监督Delta学习规则。在Hebb学习规则中引入教师信号,将上式中的换成网络期望目标输出与实际输出之差,即为有监督Delta学习规则。 (
39、3.11)上式表明,两神经元间的连接权值的变化量与教师信号和网络实际输出之差成正比。(3) 有监督Hebb学习规则。将无监督Hebb学习规则和有监督Delta学习规则两者结合起来,组成有监督Hebb学习规则,即 (3.12)这种学习规则使神经元通过关联搜索对未知的外界做出反应,即在教师信号-的指导下,对环境信息进行相关学习和自组织,使相应的输出增强或削弱。(3)控制结构单神经元自适应PID控制器是通过对加权系数的调整来实现自适应、自组织功能的,权系数的调整是按有监督的Hebb学习规则实现的,控制算法结构如图3.4所示。状态变换器学习算法rK对象uy-图3.4 单神经元自适应PID控制系统结构3
40、.2.3 控制算法(1)由单个神经元构成的PID控制算式为 (3.13)式中,神经元控制器的加权系数,分别对应为自适应PID的积分、比例、微分系数;K为神经元的比例系数,一般情况下去K0。自适应控制器通过对加权系数,的调整来实现自适应功能,权系数的调整是按有监督的Hebb学习规则实现的。其控制算法及学习算法为:式中,,分别为比例、积分、微分的学习速率。对比例P、积分I、微分D分别采用了不同的学习速率,以便对不同的权系数进行调整。调整规则如下:a. K值的选择非常重要,K越大,则快速性越好,但超调量大,甚至可能使系统不稳定,应减小K值,若过渡时间过长,则增大K值。b. 若过程过渡时间太长,增大;
41、若超调迅速下降至稳定值,而后升值稳态时问过长,可以减少增加积分作用;对于大延时系统,为减少超调,可以适当大些;若系统过渡时问太长,可以适当增大。(2) 单神经元自适应 PID 控制器学习算法改进在大量工程应用实际中,人们通过实践总结出 PID 控制器三个参数的在线学习修正,主要与 e ( k )和e ( k)有关,因此可以将单神经元自适应 PID 控制算法中连接权值的学习修正部分作些修改,即将x改为 e(k) +e(k),改进后的算法如下: (3.14)式中e(k) = e(k)-e(k-1),z(k)=e(k)。采用上述改进算法后,连接权值的在线学习修正就不完全是根据神经网络学习原理,同时参
42、考了实际经验。3.2.4 仿真程序及分析设被控对象为: (3.15)输入指令为一个方波信号:rin(k)=0.5sgn(sin(4),采样时间为1ms,仿真结果如下图3.5-3.16所示。图3.5 无监督Hebb学习规则的方波响应图3.6 无监督Hebb学习规则的误差曲线图3.7 无监督Hebb学习规则的控制器输出曲线图3.8 有监督Delta学习规则的方波响应图3.9 有监督Delta学习规则的误差曲线图3.10 有监督Delta学习规则的控制器输出曲线图3.11 有监督Hebb学习规则的方波响应图3.12 有监督Hebb学习规则的误差曲线图3.13 有监督Hebb学习规则的控制器输出曲线图
43、3.14 改进学习规则的方波响应图3.15 改进学习规则的误差曲线图3.16 改进学习规则的控制器输出曲线仿真程序见附录1仿真结果分析如下:(1)初始加权系数的选择对输出结果影响较大,若初始权值选择不当,可能导致系统不稳定。而初始权值的选择主要是依靠经验,被控对象不同,的大小也应该不同。由于权值分别相当于积分系数、比例系数、微分系数,可取其为PID的参数初值。(2)比例、积分、微分的学习速率应选择不同的数值,以便对不同的权系数分别调节。可以简单地根据整定的PID参数,来设置,然后再根据响应做微量的调整,基本就能满足要求了。由于采用规范化学习算法,学习速率可以取得较大,并且仿真过程中发现,参数具有一定的裕度,即在一定的范围内都有较好的控制效果。(3)增益K的选择非常重要,如果K值偏大将引起系统响应超调过大,而K值偏小则使过渡过程变长。因此,具体仿真时,我们是先根据经验确定一个K的初值,再根据仿真结果来调整。另外调试时还发现,当被控对象的延迟增大时,必须减小K值,否则易引起系统振荡。(4)在仿真调试中发现,无论是NNPID1还是NNPID2,试图通过调节初始权值和学习速率来降低系统的超调量,则必会引起调节时间增大,反之,试图减小调节时间则必引起超调增大,所以