毕业设计（论文）基于BP神经网络的PID控制系统设计.doc

资源描述

《毕业设计（论文）基于BP神经网络的PID控制系统设计.doc》由会员分享，可在线阅读，更多相关《毕业设计（论文）基于BP神经网络的PID控制系统设计.doc（33页珍藏版）》请在三一办公上搜索。

1、基于BP神经网络的PID控制系统设计摘要本文主要研究一个基于神经网络的自适应PID控制系统的设计方法，利用BP神经网络对被控对象进行在线辨识和控制。基于BP神经网络学习算法设计出两个神经网络模型：一个利用神经网络（NNM）对非线性映射的逼近能力，对被控对象进行辨识，另一个构成具有PID结构的控制器（NNC）。通过神经网络NNM的在线学习和修正，产生对被控对象输出的预测作用，然后由网络NNC实施控制作用，从而实现对辨识对象的PID控制。在利用神经网络对系统进行辨识时，选用白噪声信号作为系统的输入信号，以提高系统的辨识精度；另外，为了得到神经网络控制器的初始化权值，本文在自整定过程中采用常规PI

2、D控制器整定方法之一的稳定边界法。在设计过程中运用MATLAB语言工具箱进行编程，并通过SIMULINK动态仿真工具对一阶非线性对象进行了仿真。仿真结果表明了利用神经网络对系统进行辨识的有效性，并用经辨识所得到的输出值取代系统的实际输出值，利用神经网络NNC对系统进行控制，获得了满意的控制效果。关键词：神经网络，BP学习算法，自适应，参数优化，辨识1 综述PID调节器从问世至今已历经了半个多世纪，在这几十年中，人们为它的发展和推广做出了巨大的努力，使之成为工业过程控制中主要的和可靠的技术工具。近几十年来，现代控制理论迅速发展，出现了许多先进的控制算法，但到目前为止，即使在微处理技术迅速发展的

3、今天，过程控制中大部分控制规律都未能离开PID，这充分说明PID控制仍具有很强的生命力。过程工业控制中实际应用最多的仍是常规的PID控制算法，这是因为PID控制具有结构简单、容易实现、控制效果好和鲁棒性强等特点，且PID算法原理简明，参数物理意义明确，理论分析体系完整，为广大控制工程师所熟悉。但在生产现场往往由于参数整定不好而使PID控制器控制效果欠佳，整定的好坏不但会影响到控制质量，而且还会影响到控制器的性能。PID控制中一个至关重要的问题，就是控制器三参数(比例系数、积分时间、微分时间)的整定。在工业控制中，传统的PID控制至今仍处于主导地位，尤其适用于能建立数学模型的确定性控制系统，然而

4、大量的工业过程往往具有非线性、时变不确定性等因素，难以建立其精确的数学模型，而且，在实际生产现场，由于条件常常受到限制，比如缺乏有关仪器、不允许附加扰动和调试时间短等，因此，PID参数的整定往往难以达到最优状态。并且即使针对某一工作点获得了PID控制的最优参数，由于工业过程对象一般具有时变性，仍存在整个工作范围和保持长期工作最优的问题。PID控制是工业控制中最常用的方法，但用其对具有复杂非线性特性的对象或过程进行控制难以达到满意的效果。针对上述问题，已提出过多种自适应PID控制方法，但由于自适应控制是在被控对象为线性对象的前提下进行研究的，面对工业过程的非线性对象，仍存在不尽人意之处。由于神经

5、网络可在一定条件下逼近非线性，人们自然地将神经网络的方法与PID控制的结构相结合，产生了基于神经网络的PID控制方法。人工神经网络(Artificial Neural NetworkANN)是近十几年来迅速地发展起来的一门新兴交叉学科1。所谓“人工神经网络”实际上是以一种简单计算处理单元（即神经元）为节点，采用某种网络拓扑结构构成的活性网络，可以用来描述几乎任意的非线性系统；不仅如此，ANN还具有学习能力、记忆能力、计算能力以及各种智能处理能力，在不同程度和层次上模仿人脑神经系统的信息处理、存储和检索的功能。神经网络具有许多优异的性能，它的可塑性、自适应性和自组织性使它具有很强的学习能力；它的

6、并行处理机制使它求解问题的时间很短，具有满足实时性要求的潜力；它的分布存储方式使它的鲁棒性和容错性都相当好。不同领域的科学家，对ANN有着不同的理解、不同的研究内容，并且采用不同的研究方法。对于控制领域的研究工作者来说，ANN的魅力在于：1、能够充分逼近任意复杂的非线性关系，从而形成非线性动力学系统，以表示某些被控对象的模型或控制器模型；2、能够学习和适应不确定性系统的动态特性；3、所有定量或定性的信息都分布存储于网络内的各神经单元，从而具有很强的容错性和鲁棒性；4、采用信息的分布式并行处理,可以进行快速大量计算。神经网络能够充分逼近任意复杂的非线性关系，具有高度的自适应和自组织性，能够学习和

7、适应严重不确定性系统的动态特性，在解决高度非线性和严重不确定系统的控制方面具有巨大的潜力。正因为如此，近年来在控制理论的所有分支几乎都能看到ANN的引入及应用，对于传统的PID控制当然也不例外，以各种方式应用于PID控制的新算法大量涌现，其中有一些取得了明显的效果。系统建模与辨识是进行控制系统设计的基本前提2，传统的系统建模方法是在理论分析的基础上，建立对象的机理模型，而对复杂系统，要得到这样的模型是非常困难的。因此，人们常依靠实验的方法，从实验观测数据中建立能够反映系统输入输出关系的模型，用这种方法得到的模型，其参数可能不具有明确的物理意义，然而这并不影响利用该模型进行控制系统的设计。系统辨

8、识实际上是一个最优化问题，优化准则的选择依赖于辨识的目的与辨识算法的复杂性等因素，传统辨识算法的基本原理就是通过建立系统的依赖于参数的模型，把辨识问题转化为对模型参数的估计问题，这类算法能较为成功地应用于线性系统或本质线性系统，但是对于本质非线性，上述辨识算法已难以付诸应用。由于神经网络在逼近任意非线性连续函数方面具有巨大的优越性，考虑将神经网络作为一种崭新的非线性模型引入复杂系统的辨识中，利用神经网络所具有的对任意非线性映射的任意逼近能力，来模拟实际系统的输入输出关系；而利用神经网络的自学习、自适应能力，可以方便地给出工程上易于实现的学习算法，经过训练得到动态系统的模型。神经网络辨识不受非线

9、性模型的限制，它依据被控系统的输入输出数据对，通过学习得到一个描述系统输入与输出关系的非线性映射，给定一个输入，即可得到一个输出，而不需要确切地知道输入与输出之间存在着怎样的数学关系。神经网络用于系统辨识的一个优点就是不需要预先建立实际系统的辨识格式，它对系统的辨识过程就是直接学习系统的输入输出数据的过程。神经网络学习的目的是使所要求的误差准则函数达到最小，从而归纳出隐含在系统输入输出数据中的映射关系，这个关系就是描述系统动态或静态特性的算子。当学习完成后，隐含在神经网络内部，其表现形式如何，对外界而言是不可知的，这一点与神经网络辨识的目的是一致的。因为所关心的并不是神经网络以什么样的形式去逼

10、近实际系统，而只要神经网络的输出能够逼近系统在同样输入信号激励下的输出，则认为神经网络已充分描述了实际系统的特性并完成了对原系统的辨识。神经网络具有的自学习、自组织功能和联想记忆、并行处理等优点，使其在复杂的工业控制中得到了广泛应用3，4，对于长期困扰控制界的非线性系统和不确定性系统来说，ANN无疑是一种解决问题的有效途径。神经网络控制是智能控制的重要方法之一，是为了处理实际系统中的不确定性、不精确性等引起的用传统控制方法难以解决的问题。神经网络PID控制不仅包含有常规PID的控制思想，而且具有神经网络的非线性映射能力、学习能力和自适应性，使之成为不依赖模型的控制方式5，随着控制系统的日益复杂

11、，基于神经网络的智能PID控制算法日益受到关注。神经网络技术和PID控制器的结合，实际上属于智能PID控制器的一类，可以通过对系统性能的学习来实现具有最佳组合的PID控制，其基本思想主要是利用神经网络的自学习功能和非线性函数的表示能力，遵从一定的最优指标，在线智能式地调整PID控制器的参数，使之适应被控对象参数以及结构的变化和输入参考信号的变化，并抵御外来扰动的影响。由于神经网络形式的多样性，应用于PID控制器的形式也就千变万化，目前应用较多的神经网络是基于BP算法的多层前馈神经网络，这种网络反映的是系统静态的输入、输出映射关系。近年来，采用BP神经网络的控制方法已日益引起人们的重视，由于BP

12、网络可以表示任意非线性函数6，并具有自适应学习、并行分布处理和有较强的鲁棒性及容错性等特点，因此适用于对复杂非线性系统进行建模和控制。BP网络即误差反向传播(Back PropagationBP)神经网络，是一种有隐含层的多层前馈网络，当参数适当时，此网络能够收敛到较小的均方差，是目前被广泛应用的网络之一。BP神经网络所用反向传播训练算法是一种迭代梯度算法，用于求解前馈网络的实际输出与期望输出间的最小均方差值，在BP神经网络中的神经元多采用S型函数作为活化函数，在网络学习过程中，使网络的输出与期望输出的误差边向后传播边修正连接强度（加权系数），以期使其误差均方值最小。基于BP神经网络的PID控

13、制器根据系统的运行状态，调节PID控制器的参数，以期达到某种性能指标的最优化。BP神经网络具有逼近任意非线性函数的能力，而且结构和学习算法简单明确，通过神经网络自身的学习，可以找到某一最优控制律下的P、I、D参数，即使输出层神经元的状态对应于PID控制器的三个可调参数、，通过神经网络的自身学习、加权系数调整，从而使其稳定状态对应于某种最优控制律下的PID控制器参数。PID控制要取得好的控制效果，就必须通过调整好比例、积分和微分三种控制作用，形成控制量间相互配合又相互制约的关系，这种关系不一定是简单的“线性组合”，从变化无穷的非线性组合中可以找出最佳的关系7。神经网络所具有的任意非线性表达能力，

14、可以通过对系统性能的学习来实现具有最佳组合的PID控制，采用BP网络，通过调整自身加权系数，可以建立参数、自学习的PID控制器。将神经网络用于控制器的设计或直接学习计算控制器的输出（控制量），一般都要用到系统的预测输出值或其变化量来计算加权系数的修正量，但实际上，系统的预测输出值是不易直接测得的，采用BP网络对系统进行辨识，建立被控对象的预测数学模型，用该模型所计算的预测输出来取代预测输出的实测值，以提高控制效果。设计过程中参考了文献8中自适应控制实现的有关思想，在此基础上进行了部分变化。本设计的主要设计任务是设计一个自适应神经网络PID控制系统，通过辨识系统来辨识被控对象，由被控对象参数来设

15、计神经网络PID控制器，从而控制系统的输出，在辨识系统和PID控制器中灵活运用了BP神经网络。采用BP学习算法，对神经网络PID控制器中的权值进行修正，即得到满意的、，从而使得输入信号经过被控对象后，能使整个闭环系统具有良好的性能指标，实现有效的控制目的。2 神经网络理论基础2.1 人工神经元模型及其特性人工神经网络是由大量处理单元广泛互连而成的网络，是人脑的抽象、简化、模拟，反映人脑的基本特性9。一般来说，作为神经元模型应具备三个要素：1、具有一组突触或联接，常用表示神经元和神经元之间的连接强度，或称之为权值。与人脑神经元不同，人工神经元权值的取值可在负值与正值之间。2、具有反映生物神经元时

16、空整合功能的输入信号累加器。3、具有一个激励函数用于限制神经元输出。激励函数将输出信号压缩（限制）在一个允许范围内，使其成为有限值，通常，神经元输出的扩充范围在0，1或-1，1闭区间。连接机制结构的基本处理单元与神经生理学类比往往称为神经元。每个构造起网络的神经元模型模拟一个生物神经元，一个典型的人工神经元模型10，如图2.1所示： f x1wj1 -1 x2wj2yjwjn :xn图2.1 人工神经元模型该神经元单元由多个输入和一个输出组成。中间状态由输入信号的权和表示，而输出为： (2.1)式中，为神经元单元的偏置（阈值），为连接权系数（对于激发状态，取正值，对于抑制状态，取负值），为输入

17、信号数目，为神经元输出，为时间，为输出变换函数，有时叫做激励函数。MATLAB神经网络工具箱提供了三种传递函数作为BP网络激励函数：线性传递函数（PURELIN），对数S型传递函数（LOGSIG），双曲正切S型函数（TANSIG）。1、线性传递函数PURELIN（见图2.2左上方）函数调用格式为：其中，为节点纯输入矩阵，为节点数，为数据样本，为节点输出。该函数执行下面表达式： (2.2)2、对数S型传递函数LOGSIG（见图2.2右上方）函数调用格式为：其中意义同上。该函数执行下面表达式： (2.3)3、双曲正切S型函数TANSIG（见图2.2左下方）函数调用格式为：该函数执行下面表达式

18、： (2.4)当时用MATLAB语言绘制出的输出曲线如图2.2所示。2.2 神经网络的基本特性和结构2.2.1 人工神经网络的基本特性人脑内含有极其庞大的神经元，它们互连组成神经网络，并执行高级的问题求解智能活动。人工神经网络由神经元模型构成，这种由许多神经元组成的信息处理网络具有并行分布结构。每个神经元具有单一输出，并且能够与其他神经元连接；存在许多输出连接方法，每种连接方法对应于一个连接权系数。严格地说，人工神经网络是一种具有下列特性的有向图：1、对于每个节点存在一个状态变量；2、节点至节点，存在一个连接权系数；图2.2 节点传递函数3、对于每个节点，存在一个阈值；4、对于每个节点，定义一

19、个变换函数；对于最一般的情况，此函数取形式。2.2.2 神经网络的拓扑结构神经网络是由若干个上述的神经元以一定的连接形式连接而成的复杂的互连系统,神经元之间的互连模式将对神经网络的性质和功能产生重要的影响。应用于不同的领域时，互连模式有着繁多的种类。下面介绍两种常用于控制系统中的网络结构，即反馈网络和前馈网络，简介如下：1、反馈网络在反馈网络中，多个神经元互连以组织一个互连神经网络。有些神经元的输出被反馈至同层或前层神经元，因此，信号能够从正向和反向流通。在此神经网络中，每个节点都表示一个计算单元，同时接受外加输入和其他节点的反馈输入，甚至包括自环反馈，每个节点也都直接向外部输出。反馈型神经网

20、络中，第个神经元对于第个神经元的反馈与第至第神经元反馈的连接加权系数是相等的，即。2、前馈网络前馈网络具有递阶分层结构，由一些同层神经元间不存在互连的层级组成，从输入层至输出层的信号通过单向连接来流通，神经元从一层连接至下一层，不存在同层神经元间的连接。该网络可以分为若干“层”，各层依次排列，第层的神经元只接受第层神经元的输出信号，各神经元之间没有反馈。在前馈网络中，输入节点没有计算功能，只是为了表示输入矢量各元素值；以后各层节点表示具有计算功能的神经元，称为计算单元，每个计算单元可以有任意个输入，但只有一个输出，它可送到多个节点作为输入。输入节点层与输出节点层统称为“可见层”，而其他中间层则

21、称为“隐含层(hidden layer)”，隐含层中的神经元称为隐单元。2.2.3 神经网络的学习规则学习是神经网络的主要特征之一。学习规则是修正神经元之间连接强度或加权系数的算法，使获得的知识结构适应周围环境的变化。在学习过程中，执行学习规则，修正加权系数，在工作期内，由学习所得的连接加权系数参与计算神经元的输出。学习算法可分为有监督学习和无监督学习两类。有监督学习是通过外部教师信号进行学习，即要求同时给出输入和正确的期望输出的模式对，当计算结果与期望输出有误差时，网络将通过自动调节机制调节相应的连接强度，使之向误差减少的方向改变，经过多次重复训练，最后与正确的结果相符合。无监督学习则没有外

22、部教师信号，其学习表现为自适应于输入空间的检测规则，其学习过程为对系统提供动态输入信号，使各个单元以某种方式竞争，获胜的神经元本身或其相邻域得到增强，其他神经元则进一步被抑制，从而将信号空间分为有用的多个区域。常用的三种主要规则是：1、无监督Hebb学习规则Hebb学习是一类相关学习，它的基本思想是：如果有两个神经元同时兴奋，则它们之间的连接强度的增强与它们的激励的乘积成正比。用表示单元的激活值（输出），表示单元的激活值，表示单元到单元的连接加权系数，则Hebb学习规则可用下式表示： (2.5)式中学习速率。2、有监督学习规则或Widow-Hoff学习规则在Hebb学习规则中引入教师信号，将公

23、式（2.5）中的换成网络期望目标输出与实际输出之差，即为有监督学习规则。 (2.6)上式表明，两神经元间的连接强度的变化量与教师信号和网络实际输出之差成正比。3、有监督Hebb学习规则将无监督Hebb学习规则和有监督学习规则两者结合起来，组成有监督Hebb学习规则，即 (2.7)这种学习规则使神经元通过关联搜索对未知的外界作出反应，即在教师信号的指导下，对环境信息进行相关学习和自组织，使相应的输出增强或削弱。2.3 BP神经网络及其学习过程2.3.1 BP神经网络BP神经网络是一种有隐含层的多层前馈网络，其典型结构包括一个输出层和一个输入层，一个或多个隐含层。如果把具有M个输入节点和L个输出节

24、点的BP神经网络看成是从M维欧氏空间到L维欧氏空间的非线性映射，则对于具有一定非线性因素的工业过程被控对象，采用BP网络来描述，不失为一种好的选择。2.3.2 BP神经网络的学习过程1、BP学习过程描述BP神经网络的学习过程可分为前向网络计算和反向误差传播两个部分，这两部分是相继连续反复进行的，直至误差满足要求，其学习过程可以描述如下：(1) 工作信号正向传播：输入信号从输入层经隐单元，传向输出层，在输出层产生输出信号，这是工作信号的正向传播。在信号的向前传递过程中网络的权值是固定不变的，每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出，则转入误差信号反向传播。(2)

25、误差信号反向传播：网络的实际输出与期望输出之间差值即为误差信号，误差信号由输出端开始逐层向前传播，这是误差信号的反向传播。在误差信号反向传播的过程中，网络的权值由误差反馈进行调节，通过权值的不断修正使网络的实际输出更接近期望输出。2、BP神经网络的前向计算以具有M个输入、L个输出、1个隐含层（个神经元）的BP神经网络为例，作为训练网络的学习的第一个阶段，用某一训练样本的输入和输出对网络进行训练，则对隐含层的第个神经元的输入可写成 (2.8)第个神经元的输出为 (2.9)式中S型活化函数。输出向前传播到第个神经元作为输入之一，对输出层第个神经元的总输入为 (2.10)则输出层的第个神经元的总输

26、出为 (2.11)在神经网络的正常工作期间，上面的过程即完成了一次前向计算。3、BP神经网络的误差反向传播和加权系数的调整在前向计算中，若与样本的期望输出不一致，就要将其误差信号从输出端反向传播回来，并在传播过程中对加权系数不断修正，使输出层神经元上得到所需要的期望输出为止。为了对加权系数进行调整，对样本引入二次型误差函数 (2.12)学习调整加权系数，按使误差函数减少最快的方向调整，即使加权系数按的负梯度方向调整，使网络逐渐收敛，直到获得加权系数集为止。(1) 输出层加权系数的调整根据上述思想，加权系数的修正公式为 (2.13)学习速率，0。其中 (2.14)定义 (2.15)式中， (2.

27、16)由上述推导可得输出层的任意神经元加权系数的修正公式为 (2.17)(2) 隐含层加权系数的调整由于不能直接计算隐含层的输出，需要借助于网络的最后输出量，对于隐含层的加权系数的调整与上面的推导过程基本相同。由公式(2.17)可知 (2.18)式中经整理可得 (2.19)式(2.17)和式(2.19)即为修正BP网络连接强度的计算式，其中分别表示隐含节点、输入节点和输出节点的输出。为加快收敛速度，采用增加惯性项的办法，对于输出层和隐含层，其计算公式分别为 (2.20) (2.21)式中惯性系数，通常取。3 神经网络辨识与控制3.1 神经网络系统辨识基础辨识就是在输入和输出数据的基础上，从一组

28、给定的模型中，确定一个与所测系统等价的模型。这个定义明确了辨识的三个基本要素：1、合适的模型集。从中可选出一个合适的模型，能在某种期望的程度上代表被辨识系统。模型集可以是根据机理模型所得到的具有某些未知参数的模型结构，也可以是参数待定的黑箱模型结构。2、合适的观测数据。辨识系统时，要有一组能反映系统特性的输入输出可观测数据，观测数据可通过对具体对象进行实验获得。一般地，要求在满足系统约束的前提下，尽可能使观测数据具有最大的信息量。3、合适的评价准则。用以从模型集中确定一个特定的模型，使之与当前观测数据达到最佳逼近，也即辨识的优化目标。实际上我们不可能寻找到一个与实际系统完全等价的模型。从实用的

29、角度来看，辨识就是从一组模型中选择一个模型，按照某种准则，使之能最好地拟合由系统的输入/输出观测数据体现出的实际系统的动态或静态特性。非线性系统辨识模型采用如下的NARMAX模型这一模型称为系统的估计模型，也是系统的并行模型，式中取决于模型自身的输入输出值，因此比较适合于含有噪声的系统，可避免实际系统输出含有噪声而造成的有偏问题。神经网络用于系统辨识的实质是选择适当的神经网络模型来逼近实际系统，与基于算法的辨识方法一样，神经网络辨识也离不开模型、数据和误差准则等三大要素。1、模型的选择从某种意义上讲，模型是对实际系统的一种近似描述，越精确越好，但一味追求精确，模型就会变得复杂，以至没有实际意义

30、，如果适当降低模型的精度要求，忽略次要因素，模型就可以简单些，在计算量和求解上就体现出优势。在建立实际系统的模型时，要兼顾精确性和复杂性两方面的因素，既要考虑到模型能对系统进行精确逼近，又不至过于复杂而使运算量剧增，这就需要在二者之间作些折中处理。反应到神经网络模型的构造上，主要是网络层数和各层节点数的确定，一般地，网络输入和输出层节点数可由具体问题而定，一种最直接的方法是将模型的输入输出结构选得与系统的一样，这样输入和输出层节点数就确定下来了。至于隐层及其节点数的确定，目前尚无较好的理论指导，通常还是通过仿真实验来确定，从而找出能在给定的准则下逼近原系统的最简单的网络模型。2、输入信号的选择

31、对动态系统而言，为了得到系统的辨识模型，输入信号必须满足一定的条件。通常要求在辨识时间内，输入信号能持续激励系统的动态过程，即系统的所有模态都能被所选择的输入信号充分激励；从频谱上讲，即要求输入信号的频谱必须足以覆盖系统的频谱。其次，要求输入信号的选择能使给定系统的辨识模型精度最高，即所谓最优输入信号设计问题。为此在利用神经网络辨识非线性动态系统的研究中，一般选择白噪声或伪随机信号作为系统的输入信号。3、误差准则的选择误差准则是用来衡量模型接近实际系统的标准，通常表示为误差的泛函，即其中是的函数。当实际系统和神经网络模型的输出分别记做和时，则称为输出误差。它通常是模型参数的非线性函数（神经网络

32、模型的参数表现为其权值），因此在这种误差准则意义下，辨识问题归结成非线性最优化问题。利用传统的辨识算法确定最优解时，辨识过程比较复杂，而神经网络具有处理非线性优化问题的能力，且其信息处理的并行化决定了这种方法具有较快的速度，因此在神经网络辨识中，通常采用这种误差准则。3.2 控制器算法实现3.2.1 BP网控制器算法经典增量式数字PID的控制算式为 (3.1)式中：、分别为比例、积分、微分系数；为当前采样时刻的期望输出与实际输出之差；为当前采样时刻的控制量。将、视为依赖于系统运行状态的可调参数时，可将上式描述为 (3.2)式中是与、等有关的非线性函数，可以用BP神经网络NN通过训练和学习来找到

33、这样一个最佳控制规律。3.2.2 基于BP网络的自适应PID控制器设BP神经网络NN是一个三层BP网络，有M个输入节点、Q个隐层节点、3个输出节点。输入节点对应所选的系统运行状态量，如系统不同时刻的输入量和输出量等，必要时要进行归一化处理。输出节点分别对应PID控制器的三个可调参数、。由于、不能为负值，所以输出层神经元的活化函数取非负的Sigmoid函数，而隐含层神经元的活化函数可取正负对称的Sigmoid函数。BP神经网络NN的输入为 (3.3) (3.4)其中M为输入变量的个数，取决于被控系统的复杂程度。网络隐含层输入输出为 (3.5) (3.6) (3.7)式中为隐含层加权系数；为阈值，

34、；取双曲正切函数，即；上标（1）、（2）、（3）分别代表输入层、隐含层、输出层；网络输出层三个节点的输入、输出分别为 (3.8) (3.9)则有 (3.10)其中为输出层加权系数，输出层神经元活化函数为，为阈值，且。引入性能指标函数为 (3.11)依最速下降法修正网络的加权系数，即按对加权系数的负梯度方向进行搜索调整，并附加一使搜索快速收敛全局极小的惯性项，则有 (3.12)式中为学习速率，为惯性系数。 (3.13)由于未知，所以近似用符号函数取代，由此带来的计算不精确的影响可以通过调整学习速率来补偿。由公式(3.1)可以求得 (3.14) (3.15) (3.16)由此可得BP神经网络NN输

35、出层的加权系数计算公式为 (3.17) (3.18)依据上述推算办法，可得隐含层加权系数的计算公式为 (3.19) (3.20)式中，4 神经网络PID控制系统设计采用BP神经网络构成的PID控制系统如图4.1所示NNM学习算法 NNCMM学习算法被控对象PID控制器euy r + 图4.1 神经网络PID控制系统结构其中网络NNM完成被控对象的系统辨识，建立参考模型，另一个网络NNC完成PID参数自学习控制，整个控制系统构成一个闭环反馈控制结构，保证了系统的稳定性。4.1 神经网络系统辨识4.1.1 基于神经网络的系统辨识设被控对象参数估计的离散传递函数模型为 (4.1)则相应的差分方程为

36、(4.2)其中式(4.2)中表示系统第次输入信号，表示系统第次输出信号。假设式(4.2)中未知，仅知和的一系列测量信号，于是(4.2)式的系统动态特性可通过神经网络输入和输出样本之间的非线性映射得以反映，即已知输入和输出测量值为学习样本，训练网络的权值，使网络输出对期望输出的误差最小，则结束学习，建立神经网络模型，以达到动态系统的辨识。这里采用一个具有个输入节点、Q个隐含层节点和1个输出节点的三层BP神经网络模型(NNM)作为非线性系统的预报模型，为了便于对非线性系统进行辨识，输出层神经元的活化函数取为线性函数，而隐含层神经元的活化函数仍取为Sigmoid函数。BP神经网络模型(NNM)的前向

37、计算过程为，以被控对象的输入输出过程量和作为NNM的模式特征，即对于输入层有 (4.3)网络的隐含层为 (4.4)式中隐含层加权系数；阈值，；活化函数，。最后，网络输出层的输出为 (4.5)式中输出层加权系数；阈值，。4.1.2 NNM网络学习算法设网络NNM在输入模式向量作用下，输出向量与目标向量的误差为 (4.6) (4.7)其中，表示网络的权值，为输入模式组数，系统辨识的目的是为了使在所有输入模式作用下，输出的二次函数(4.7)式最小。BP神经网络模型(NNM)的反向学习计算过程为，利用BP学习算法来修正加权系数和阈值，使指标函数 (4.8)最小化，可得相应的修正公式(4.9)为(

38、4.9)式中学习速率；惯性系数，均在(0，1)上取值。活化函数的导数为4.2 BP神经网络PID控制器4.2.1 采用非线性预测模型的NNC网络算法实现由上一节可以导出的计算式，即 (4.10)从而可实现用来代替。采用来代替，并结合第三章相关知识可得，输出层权值修正公式为 (4.11)隐含层加权系数的计算公式不变，即 (4.12)4.2.2 基于NNC的PID参数自学习控制设常规PID控制算式为离散化为对于上式，只要确定好调节参数，则可以对被控对象进行有效控制。为了实现参数的自校正，达到自学习控制，采用一个3-1-1的三层BP神经网络(NNC)，通过网络的学习功能进行自适调整参数，令为一个放

39、大增益，相应的神经网络PID控制算式为其中T为采样周期，网络权值()的调整是使被控对象输出与给定的期望值之间的误差为最小。调整权值的性能指标为经过学习，因此实际训练控制器的参数（权值）采用如下性能指标学习算法仍采用梯度法进行最优化，求得最佳参数。4.3 计算机仿真流程实现步骤采用非线性预测模型的BP神经网络PID控制系统的算法步骤可归纳如下：1、事先选定BP神经网络（NNC）的结构，即选定输入层和隐含层节点数，并给出各层加权系数的初值、；选定学习速率和惯性系数；;2、采样得到和，计算；3、对进行归一化处理，作为NNC的输入；4、根据式（3.3）（3.10）前向计算BP神经网络的各层神经元的输

40、入和输出，NNC输出层的输出即为PID控制器的三个可调参数、；5、根据式（3.1），计算PID控制器的控制输出,参与控制和计算；6、根据式（4.3）（4.5）前向计算NNM的各层神经元的输入和输出，NNM的输出为；由式（4.9）计算修正隐含层和输出层的加权系数；7、由式（4.10），计算；8、由式（4.11），计算修正输出层的加权系数；9、由式（4.12），计算修正隐含层的加权系数；10、置，返回到2。5 PID参数优化控制系统仿真5.1 基于BP网络系统辨识仿真本设计中被控对象选为，由于0.6171，可等效为。本设计中辨识系统BP网络采用2-3-1的网络结构，其输入层为2个时间序列隐层3个神

41、经元，传递函数都选用tansig，输出层一个神经元选用pureline函数。系统辨识的输入信号为白噪声序列，网络NNM根据辨识对象的输入，输出信号进行学习和训练，时间序列由MATLAB系统仿真得到，如图5.1所示。图5.1 辨识对象的仿真系统在命令窗口中运行bs.m源程序，得到的曲线为：神经网络辨识系统误差变化曲线和辨识曲线，如图5.2所示和5.3所示。clfP=p1，p2；/网络输入T=t；/网络目标输出PR=-10，11；-0.4，0.1；/网络输入(p1，p2)的最小值和最大值net=newff(PR，3，1，tansig，purelin，trainlm)；/BP网络生成函数netTra

42、inParamshow = 50；/训练显示间隔次数netTrainParamepochs=10000；/最大训练循环次数netTrainParamgoal=0.0001；/性能目标值net=train(net，P，T)；/网络直接训练函数figure(1)；clfy=sim(net，P)；/网络仿真函数，P为网络输入，y为网络输出plot(clock，T，r，clock，y，b)；/绘出目标曲线（红色），辨识输出曲线（蓝色）griddisp(netiw)/隐层权值celldisp(netiw)disp(netlw)/输出层权值celldisp(netlw)disp(netb)/隐层和输出层的阈值celldisp(netb)图5.2 神经网络辨识系统误差变化曲线图5.3 神经网络辨识曲线5.2 基于BP网络PID参数优化5.2.1 基于BP网络PID控制器算法在前一章基于BP网络的自适应控制的基础上，通过适当简化，得到BP网络自适应PID控制器。BP网络控制器结构选为3-1-1，其输入层有三个节点，其输入分别为， (5.1)其输出节点数为1，且令 (5.2)式中，NNC的权值。设准则函数为： (5.3)NNC网络权值调整算法，用梯度下降法： (5.4)由公式(5.2)，可得代入上式，则有： (5.5)又因为： (5.6) (5.7) (5.8)

展开阅读全文