人工智能课件第七章神经网络.ppt
《人工智能课件第七章神经网络.ppt》由会员分享,可在线阅读,更多相关《人工智能课件第七章神经网络.ppt(67页珍藏版)》请在沃文网上搜索。
1、1人工智能ARTIFICIAL INTELLIGENCE版本:2.02010年1月第七章人工神经网络7.1 概述7.2 感知器7.3 前馈神经网络7.4 反馈神经网络7.5 随机神经网络7.6 自组织神经网络27.1 概述在广义上,神经网络可以泛指生物神经网络也可以指人工神经网络。所谓人工神经网络(Artificial Neural Network)是指模拟人脑神经系统的结构和功能,运用大量的处理部件,由人工方式建立起来的网络系统。人脑是ANN的原型,ANN是对人脑神经系统的模拟。在人工智能领域中,在不引起混淆的情况下,神经网络一般都指的是ANN。37.1.1 人脑神经系统人脑神经系统 187
2、5年意大利解剖学家C.Golgi用银渗透法最先识别出单个神经细胞。1889年Cajal创立神经元学说,认为整个神经系统都是由结构上相对独立的神经细胞构成。神经细胞即神经元是神经系统中独立的营养和功能单元。生物神经系统,包括中枢神经系统和大脑,均是由各类神经元组成。其独立性是指每一个神经元均有自己的核和自己的分界线或原生质膜。生物神经系统是一个有高度组织和相互作用的数量巨大的细胞组织群体。据估计,人脑神经系统的神经细胞约为10111013个。它们按不同的结合方式构成了复杂的神经网络。通过神经元及其联接的可塑性,使得大脑具有学习、记忆和认知等各种智能。4生物神经元生物神经元神经细胞是构成神经系统的
3、基本单元,称之为生物神经元,或者简称为神经元。神经元主要由三个部分组成:细胞体、轴突、树突。5神经元解剖结构生物神经元生物神经元细胞体(Cell Body或者Soma):由细胞核、细胞质、细胞膜等组成。细胞膜内外有电位差,称为膜电位,大小约为几十微伏。膜电压接受其它神经元的输入后,电位上升或者下降。若输入冲动的时空整合结果使膜电位上升,并超过动作电位阈值时,神经元进入兴奋状态,产生神经冲动,由轴突输出。若整合结果使膜电位下降并低于动作电压阈值时,神经元进入抑制状态,无神经冲动输出。轴突(Axon):细胞体向外伸出的最长的一条分枝,即神经纤维,相当于神经元的输出端。一般一个神经元只有一个轴突,有
4、个别神经元没有。树突(Dendrite):细胞体向外伸出的触轴突之外其它分枝。一般较短,但分枝很多,相当于神经元的输入端。6生物神经元兴奋脉冲生物神经元兴奋脉冲神经元的兴奋过程电位变化 7生物神经元突触结构生物神经元突触结构突触结构8突触传递过程9生物神经元生物神经元生理学的研究表明,突触可以有以下几个方面的变化:(1)突触传递效率的变化。首先是突触的膨胀以及由此产生的突触后膜表面积扩大,从而突触所释放出的传递物质增多,使得突触的传递效率提高。其次是突触传递物质质量的变化,包括比例成分的变化所引起传递效率的变化。(2)突触接触间隙的变化。在突触表面有许多形状各异的小凸芽,调节其形状变化可以改变
5、接触间隙,并影响传递效率。(3)突触的发芽。当某些神经纤维被破坏后,可能又会长出新芽,并重新产生附着于神经元上的突触形成新的回路。由于新的回路的形成,使得结合模式发生变化,也会引起传递效率的变化。(4)突触数目的增减。由于种种复杂环境条件的刺激等原因,或者由于动物本身的生长或衰老,神经系统的突触数目会发生变化,并影响神经元之间的传递效率。10神经元的整合功能神经元的整合功能神经元对信息的接受和传递都是通过突触来进行的。单个神经元可以从别的细胞接受多个输入。由于输入分布于不同的部位,对神经元影响的比例(权重)是不相同的。另外,各突触输入抵达神经元的先后时间也不一祥。因此,一个神经元接受的信息,在
6、时间和空间上常呈现出一种复杂多变的形式,需要神经元对它们进行积累和整合加工,从而决定其输出的时机和强度。正是神经元这种整合作用,才使得亿万个神经元在神经系统中有条不紊、夜以继日地处理各种复杂的信息,执行着生物中枢神经系统的各种信息处理功能。多个神经元以突触联接形成了一个神经网络。研究表明,生物神经网络的功能决不是单个神经元生理和信息处理功能的简单叠加,而是一个有层次的、多单元的动态信息处理系统。它们有其独特的运行方式和控制机制,以接受生物内外环境的输入信息,加以综合分折处理,然后调节控制机体对环境作出适当的反应。11人脑神经系统的特征(人脑神经系统的特征(1)从信息系统研究的观点出发,对于人脑
7、这个智能信息处理系统,有如下一些固有特征:(1)并行分布处理的工作模式。实际上大脑中单个神经元的信息处理速度是很慢的,每次约1毫秒(ms)。但是人脑对某一复杂过程的处理和反应却很快,一般只需几百毫秒。可见,大脑信息处理的并行速度已达到了极高的程度。(2)神经系统的可塑性和自组织性。神经系统的可塑性和自组织性与人脑的生长发育过程有关。这种可塑性反映出大脑功能既有先天的制约因素,也有可能通过后天的训练和学习而得到加强。神经网络的学习机制就是基于这种可塑性现象,并通过修正突触的结合强度来实现的。(3)信息处理与信息存贮合二为一。大脑中的信息处理与信息存贮是有机结合在一起的,而不像现行计算机那样存贮地
8、址和存贮内容是彼此分开的。由于大脑神经元兼有信息处理和存贮功能,所以在进行回亿时,不但不存在先找存贮地址而后再调出所存内容的问题,而且还可以由一部分内容恢复全部内容。12人脑神经系统的特征(人脑神经系统的特征(2)(4)信息处理的系统性大脑是一个复杂的大规模信息处理系统,单个的元件“神经元”不能体现全体宏观系统的功能。实际上,可以将大脑的各个部位看成是一个大系统中的许多子系统。各个子系统之间具有很强的相互联系,一些子系统可以调节另一些子系统的行为。例如,视觉系统和运动系统就存在很强的系统联系,可以相互协调各种信息处理功能。(5)能接受和处理模糊的、模拟的、随机的信息。(6)求满意解而不是精确解
9、。人类处理日常行为时,往往都不是一定要按最优或最精确的方式去求解,而是以能解决问题为原则,即求得满意解就行了。(7)系统的恰当退化和冗余备份(鲁棒性和容错性)。137.1.2 人工神经网络研究内容与特点人工神经网络研究内容与特点 人工神经网络的研究方兴末艾,很难准确地预测其发展方向。但就目前来看,人工神经网络的研究首先须解决全局稳定性、结构稳定性、可编程性等问题。14基本研究内容(1)(1)人工神经网络模型的研究。神经网络原型研究,即大脑神经网络的生理结构、思维机制;神经元的生物特性如时空特性、不应期、电化学性质等的人工模拟;易于实现的神经网络计算模型;利用物理学的方法进行单元间相互作用理论的
10、研究,如:联想记忆模型;神经网络的学习算法与学习系统。(2)神经网络基本理论研究。神经网络的非线性特性,包括自组织、自适应等作用;神经网络的基本性能,包括稳定性、收敛性、容错性、鲁棒性、动力学复杂性;神经网络的计算能力与信息存贮容量;结合认知科学的研究,探索包括感知、思考、记忆和语言等的脑信息处理模型。15基本研究内容(2)(3)神经网络的软件模拟和硬件实现。在通用计算机、专用计算机或者并行计算机上进行软件模拟,或由专用数字信号处理芯片构成神经网络仿真器。由模拟集成电路、数字集成电路或者光器件在硬件上实现神经芯片。软件模拟的优点是网络的规模可以较大,适合于用来验证新的模型和复杂的网络特性。硬件
11、实现的优点是处理速度快,但由于受器件物理因素的限制,根据目前的工艺条件,网络规模不可能做得太大。仅几千个神经元。但代表了未来的发展方向,因此特别受到人们的重视。(4)神经网络计算机的实现。计算机仿真系统;专用神经网络并行计算机系统,例如数字、模拟、数模混合、光电互连等。光学实现;生物实现;16重要应用神经网络智能信息处理系统的一些重要应用:认知与人工智能:包括模式识别、计算机视觉与听觉、特征提取、语音识别语言翻译、联想记忆、逻辑推理、知识工程、专家系统、故障诊断、智能机器人等。优化与控制:包括优化求解、决策与管理、系统辨识、鲁棒性控制、自适应控制、并行控制、分布控制、智能控制等。信号处理:自适
12、应信号处理(自适应滤波、时间序列预测、谱估计、消噪、检测、阵列处理)和非线性信号处理(非线性滤波、非线性预测、非线性谱估计、非线性编码、中值处理)。传感器信息处理:模式预处理变换、信息集成、多传感器数据融合。nANN擅长于两个方面:对大量的数据进行分类,并且只有较少的几种情况;必须学习一个复杂的非线性映射。17人工神经网络的特点人工神经网络的特点 具有大规模并行协同处理能力。每一个神经元的功能和结构都很简单,但是由大量神经元构成的整体却具有很强的处理能力。具有较强的容错能力和联想能力。单个神经元或者连接对网络整体功能的影响都比较微小。在神经网络中,信息的存储与处理是合二为一的。信息的分布存提供
13、容错功能由于信息被分布存放在几乎整个网络中。所以当其中的某一个点或者某几个点被破坏时信息仍然可以被存取。系统在受到局部损伤时还可以正常工作。并不是说可以任意地对完成学习的网络进行修改。也正是由于信息的分布存放,对一类网来说,当它完成学习后,如果再让它学习新的东西,这时就会破坏原来已学会的东西。具有较强的学习能力。神经网络的学习可分为有教师学习与无教师学习两类。由于其运算的不精确性,表现成“去噪音、容残缺”的能力,利用这种不精确性,比较自然地实现模式的自动分类。具有很强的普化(Generalization)能力与抽象能力。是大规模自组织、自适应的非线性动力系统。具有一般非线性动力系统的共性,即不
14、可预测性、耗散性、高维性、不可逆性、广泛连接性和自适应性等等。18物理符号系统和人工神经网络系统的差别项目项目物理符号系统物理符号系统人工神经网络人工神经网络处理方式逻辑运算模拟运算执行方式串行并行存储方式局部集中全局分布处理数据离散为主连续为主基本开发方法设计规则、框架、程序,用样本数据进行调试定义结构原型,通过样本完成学习自适应性由人根据已知环境构造模型,依赖于人为适应环境自动从样本中抽取内涵,自动适应应用环境适应领域精确计算:符号处理、数值计算非精确计算:模拟处理、感觉、大规模数据并行处理模拟对象左脑(逻辑思维)右脑(形象思维)197.1.3 人工神经网络基本形态人工神经网络基本形态MP
15、模型MP模型是由美国McCulloch和Pitts提出的最早神经元模型之一。MP模型是大多数神经网络模型的基础。它属于一种非线性阈值元件模型。20MP模型21wij 代表神经元i与神经元j之间的连接强度(模拟生物神经元之间突触连接强度),称之为连接权;ui代表神经元i的活跃值,即神经元状态;yj代表神经元j的输出。对于多层网络而言,也是另外一个神经元的一个输入;i代表神经元i的阈值。MP模型 函数f表达了神经元的输入输出特性。在MP模型中,f定义为阶跃函数:如果把阈值i看作为一个特殊的权值,则可改写为:其中,w0i-i,v01 22MP模型为用连续型的函数表达神经元的非线性变换能力,常采用s型
16、函数:MP模型在发表时并没有给出一个学习算法来调整神经元之间的连接权。但是,我们可以根据需要,采用一些常见的算法来调整神经元连接权,以达到学习目的。23PDP模型模型Rumellhart,McClelland,Hinton提出的并行分布处理(Parallel Distributed Processing)模型是一个通用的神经网络模型。1)一组处理单元;2)处理单元的激活状态(ai);3)每个处理单元的输出函数(fi);4)处理单元之间的联接模式;5)传递规则(wijoi);6)把处理单元的输入及当前状态结合起来产生激活值的激活规则(Fi);7)通过经验修改联接强度的学习规则;8)系统运行的环境
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 课件 第七 神经网络