1、5)神经网络的硬件实现愈趋方便。大规模集成电路技术的发展为神经网络的硬件实现提供了技术手段。第五章 神经网络控制论一、神经网络控制的优越性用神经网络理论来研究和模仿人类的活动是相当有潜力的。(如骑车问题是无法建模的,但人处理此问题相当出色)。1)神经网络可以处理那些难以用模型或规则描述的过程或系统。2)神经网络采用并行分布式信息处理方式,具有很强的容错性。3)神经网络是本质的非线性系统。它可以实现任何非线性映射。第一节引言4)神经网络具有很强的信息综合能力。它能够同时处理大量不同类型的输入。二、神经网络控制器分类1、神经控制:以神经网络为基础而形成的独立智能控制系统;按作用不同分为两类:2、混
2、合神经网络控制:利用神经网络学习和优化能力来改善传统控制的现代控制方法(如:自适应神经控制)。典型的神经网络的控制结构:特点:采用专家的控制经验来训练网络权值,一旦训练达到要求,网络训练结束。(1)导师指导下的控制器动力学系统专家经验控制器神经网络动力学系统图5-1导师指导下的神经控制结构图缺点:网络训练只涉及静态过程,缺乏在线学习机制。(2)逆控制器图a 直接逆建模动态系统 (F)e+yuNN-待辨识训练目的(即作用):通过学习建立系统的逆模型。缺点:学习过程不是目标导向的。动态系统 (F)e+yuNN-正向模型eydyN待辨识期望输出图b 正逆建模正向模型作用:辨识作用优点:学习过程是有目
3、标导向的(即e(k)受yd影响)。动态系统yde2yuNN1NN2+-e2V+-e1图c 直接逆控制(双网结构)NN1:前馈控制器(NNC);NN2:神经网络辨识器(NNI)要求:NN1、NN2结构相同(输入层、隐含层、输出层节点数目相同)第三节 神经网络控制的学习机制学习机制:通过什么学习方法来调整网络连接权值或网络结构,从而使网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出。学习模式分类 监督式学习(有导师指导)增强式学习:(无导师指导)离线学习法在线学习法反馈误差学习法多网络学习法通过某一评价函数来对网络的权值进行更新非线性系统神经网络NN非线性系统神经网络NN监督式学习算法:
4、一、离线学习法1、建逆模型:学习过程不是目标导向的。步骤:2、进行在线控制:学习结束后,把这个网络作为此系统的控制器直接连接在非线性系统的输入端从而构成一个逆动力学模型的控制系统。缺点:一旦离线学习结束,神经网络控制器NNC的学习能力就停止。因此这种控制系统在变化的环境下是无法适用的。性能指标为u-uc的平方误差极小,不能保证系统的最终性能yd-y的平方误差极小。逆模型做控制器NNC二、在线学习法特点:控制器具备自适应、自学习的能力。神经网络非线性系统性能指标函数:梯度下降法(权值的学习算法)公式:要求:已知对象 信息(即系统模型已知)。其中:可利用广义的Delta规则来计算。固定增益控制器非
5、线性系统神经网络NNC图5-22反馈误差学习结构特点:把反馈控制的输出作为网络控制器的训练误差信号;一旦训练结束,整个控制系统将主要由前馈神经网络控制器来实现,而反馈控制只用来解决诸如扰动之类的问题。组成:前馈控制器NNC(作用:加快控制速度)、反馈控制器。三、反馈误差学习法(对象 未知时采用)四、多网络学习法特点:针对未知非线性系统;用神经网络辨识的手段在线识别出未知系统的动态模型,并利用此模型进行神经网络控制的设计和学习。神经网络控制器非线性系统神经网络辨识器图5-23前向建模多网络控制结构图非线性系统神经网络控制器神经网络逆模型辨识器图5-24逆模型建模的多网络控制结构图习题和思考题(P87)4.如图424所示的多层前向传播神经网络,假设对期望输入 ,其期望输出为 。网络权系数初始值如图所示。试用BP算法训练此网络,并详细写出第一次迭代学习的计算结果。这里取神经元激励函数为 。图424 习题4图