第二章 微机体系结构.ppt
《第二章 微机体系结构.ppt》由会员分享,可在线阅读,更多相关《第二章 微机体系结构.ppt(50页珍藏版)》请在沃文网上搜索。
1、 第第2章章 微机体系结构微机体系结构 目的要求:目的要求:1、了解、了解CPU的技术指标、指令系统、内的技术指标、指令系统、内 部结构与封装技术。部结构与封装技术。2、了解内存储器的分类、发展与应用。、了解内存储器的分类、发展与应用。3、了解系统总线种类、性能批标。、了解系统总线种类、性能批标。重点难点:重点难点:1、CPU的技术指标与内部结构以及内存的技术指标与内部结构以及内存 储器的分类、应用。储器的分类、应用。2、系统总线、系统总线PCI类型性能。类型性能。内内 容:容:2.1 微处理器微处理器lCPU是微机系统的核心部件,其性能的高低往是微机系统的核心部件,其性能的高低往往代表了微机
2、的档次。微机体系结构中的许多往代表了微机的档次。微机体系结构中的许多先进技术是在先进技术是在CPU中体现出来的。中体现出来的。l衡量衡量CPU性能的主要技术指标有以下几方面:性能的主要技术指标有以下几方面:2.1.1 主频主频 主频是指主频是指CPU内部电路工作的时钟频率,主频内部电路工作的时钟频率,主频越高,意味着越高,意味着CPU的运行速度越快。的运行速度越快。1主频信号的产生主频信号的产生 CPU的工作频率是从主板上获得的。在主板上有一块时的工作频率是从主板上获得的。在主板上有一块时钟电路和一个石英振荡器,当给石英晶体两极加上电压后,钟电路和一个石英振荡器,当给石英晶体两极加上电压后,便
3、产生出某一固定频率的振荡信号,该周期信号先经过时便产生出某一固定频率的振荡信号,该周期信号先经过时钟电路进行放大和整波处理,再进行分频或倍频处理,最钟电路进行放大和整波处理,再进行分频或倍频处理,最后产生出后产生出CPU所需要的主频信号。所需要的主频信号。2主频与系统频率的关系主频与系统频率的关系 系统总线的工作频率一般称为系统频率,也叫基频系统总线的工作频率一般称为系统频率,也叫基频或外频。或外频。CPU主频是通过倍频的方法来实现的,即时钟主频是通过倍频的方法来实现的,即时钟倍频电路将系统频率按某个倍数提高,这种倍数关系也叫倍频电路将系统频率按某个倍数提高,这种倍数关系也叫倍频系数。倍频系数
4、。CPU CPU主频系统频率主频系统频率倍频系数倍频系数3主频与系统的稳定性主频与系统的稳定性 一方面是由于制造工艺的限制,各器件的反应速度存在极一方面是由于制造工艺的限制,各器件的反应速度存在极限值,当达到或超过极限值后,器件就不能正常工作,机器限值,当达到或超过极限值后,器件就不能正常工作,机器会出现不稳定或死机现象。另一方面会出现不稳定或死机现象。另一方面CPU在高速运行过程中在高速运行过程中随着主频的增高发热量也会加剧,热量的积累会导致随着主频的增高发热量也会加剧,热量的积累会导致CPU过过热而不能正常工作。因此热而不能正常工作。因此CPU在出厂前会标定出额定工作频在出厂前会标定出额定
5、工作频率。率。4超频超频 让让CPU在超出额定频率的条件下工作,这就是所谓的超频。在超出额定频率的条件下工作,这就是所谓的超频。5前端总线频率前端总线频率 前端总线(前端总线(Front Side Bus,FSB)是指是指CPU的外部总线,的外部总线,也就是也就是CPU与主板北桥芯片之间的数据传输通道,也可以认与主板北桥芯片之间的数据传输通道,也可以认为它是为它是CPU与主板之间的接口。与主板之间的接口。2.1.2 位宽位宽 位宽又叫基本字长,俗称线宽,是指位宽又叫基本字长,俗称线宽,是指CPU一次操作一次操作所能处理的二进制数据长度。通常用所能处理的二进制数据长度。通常用CPU内部内部ALU
6、的的位数来代表,字长往往与位数来代表,字长往往与CPU内部寄存器以及地址线内部寄存器以及地址线和数据线相当。和数据线相当。数据线是数据线是CPU与内存及与内存及I/O端口交换数据的通道,端口交换数据的通道,宽度代表了一次交换数据的能力。地址线决定了宽度代表了一次交换数据的能力。地址线决定了CPU的寻址能力,内存访问控制方式在微机发展历史上起的寻址能力,内存访问控制方式在微机发展历史上起了重要作用。寄存器位数代表了各指令的功能和执行了重要作用。寄存器位数代表了各指令的功能和执行效率,是效率,是CPU具体能力的体现。具体能力的体现。2.1.3 指令系统指令系统 指令系统是指令系统是CPU性能的集中
7、体现,任何型号的性能的集中体现,任何型号的CPU都有都有属于自己的指令系统,它是由属于自己的指令系统,它是由CPU制造商设计决定的。指制造商设计决定的。指令的格式、种类、寻址方式、指令的多少以及完善程度和令的格式、种类、寻址方式、指令的多少以及完善程度和执行速度都能反映出该执行速度都能反映出该CPU的设计水平和性能优劣。的设计水平和性能优劣。18086/8088指令系统指令系统280286指令系统指令系统380386/80486指令系统指令系统4Pentium/Pentium MMX指令系统指令系统5K6-2指令系统指令系统6Pentium Pro/PentiumII指令系统指令系统7Pent
8、iumIII指令系统指令系统8Pentium4指令系统指令系统 Pentium4指令系统在原指令系统在原MMX的基础上增加和扩充了的基础上增加和扩充了144条用于多媒体的条用于多媒体的SIMD扩展指令集,简称扩展指令集,简称SSE2指令集。指令集。其中其中68条是对原有指令的增强,并将条是对原有指令的增强,并将64位的位的MMX指令扩展指令扩展为为128位操作,另外位操作,另外76条是新增加的。条是新增加的。Prescott核心的新核心的新Pentium4处理器在处理器在SSE2指令集的基指令集的基础上又增加了础上又增加了13条新指令,称为条新指令,称为SSE3扩展指令集。其中一扩展指令集。其
9、中一条指令专门用于视频解码,两条指令用于线程处理,另外条指令专门用于视频解码,两条指令用于线程处理,另外10条指令则用于单指令多数据浮点运算以及其他更为复杂条指令则用于单指令多数据浮点运算以及其他更为复杂的运算。的运算。9K7-4指令系统指令系统 K7-4指令系统在原指令系统在原“增强型增强型3Dnow!”的基础上,又增加的基础上,又增加了类似了类似SSE的的52条指令,这些指令称为条指令,这些指令称为“3Dnow!-Professional”,简称简称“3Dnow!-P”。10Itanium指令系统指令系统 Itanium是采用是采用IA-64指令系统的第一代指令系统的第一代CPU。Itan
10、ium处理器具有处理器具有64位寻址能力位寻址能力和和64位的内部寄存器,所以称为位的内部寄存器,所以称为64位位CPU。Itanium指令长度固定为指令长度固定为40位,其中指令操作码占位,其中指令操作码占13位,位,预测寄存器地址占预测寄存器地址占6位(可寻址位(可寻址64个预测寄存器),每个寄个预测寄存器),每个寄存器地址占存器地址占7位(可寻址位(可寻址128个寄存器)。三个寄存器地址个寄存器)。三个寄存器地址中,两个输入寄存器,一个输出寄存器,指令只能对寄存中,两个输入寄存器,一个输出寄存器,指令只能对寄存器操作。如图器操作。如图2-1所示。所示。指令指令1 1(4040位)位)指令
11、指令2 2(4040位)位)指令指令3 3(4040位)位)模板(模板(8 8位)位)预测预测 寄存器寄存器1 1 寄存器寄存器2 2 寄存器寄存器3 3 操作码操作码 图图2-1 2-1 ItaniumItanium指令示意图指令示意图 Itanium采用超长指令字,每个指令字是一个采用超长指令字,每个指令字是一个128位长位长的指令数据包,它包含的指令数据包,它包含3条条40位指令和位指令和1个个8位模板。指令位模板。指令编译器分析各条指令的数据相关性和指令依赖情况,把能编译器分析各条指令的数据相关性和指令依赖情况,把能够并行执行的一系列指令放在一起,重新排序并打包后交够并行执行的一系列指
12、令放在一起,重新排序并打包后交给给CPU执行。执行。8位模板包含了不同指令间的并行信息,编译位模板包含了不同指令间的并行信息,编译器使用模板来告诉器使用模板来告诉CPU,哪些指令可以同时执行。模板还哪些指令可以同时执行。模板还包含了包的结束位,以告知包含了包的结束位,以告知CPU这个包是否结束。这个包是否结束。2.1.4 CPU内部结构内部结构 1内置协处理器内置协处理器 在在486之前,之前,CPU中只有一个定点运算器。为了将中只有一个定点运算器。为了将CPU从繁重的计算任务中解脱出来,另外设计了一个专门进行从繁重的计算任务中解脱出来,另外设计了一个专门进行数值计算的部件数值计算的部件协处理
13、器。从协处理器。从486DX开始,协处理器开始,协处理器直接与直接与CPU制作在一块集成电路中,称为内置协处理器。制作在一块集成电路中,称为内置协处理器。一般来说,协处理器只担负那些计算过程相对复杂的浮点一般来说,协处理器只担负那些计算过程相对复杂的浮点运算任务,所以又称之为浮点运算器。运算任务,所以又称之为浮点运算器。2.片内高速缓存技术片内高速缓存技术 随着随着CPU速度的不断提高,相比之下内存的工作速度速度的不断提高,相比之下内存的工作速度显得越来越慢,因此显得越来越慢,因此CPU的高效率很难得以充分发挥。的高效率很难得以充分发挥。通常的解决办法是,在通常的解决办法是,在CPU和内存之间
14、设置速度更快的和内存之间设置速度更快的存储器,称为高速缓冲存储器(存储器,称为高速缓冲存储器(Cache),),虽然虽然Cache的速度很快,但容量与普通内存相比要小得多。的速度很快,但容量与普通内存相比要小得多。CPU内部高速缓存被称为一级高速缓存(内部高速缓存被称为一级高速缓存(L1),),主板主板上安装的高速缓存被称为二级高速缓存(上安装的高速缓存被称为二级高速缓存(L2););从从PII开开始,又将二级高速缓存与始,又将二级高速缓存与CPU制作在一起,形成了一级制作在一起,形成了一级高速缓存在高速缓存在CPU核心,二级高速缓存在核心,二级高速缓存在CPU周边的局面。周边的局面。3超标量
15、设计超标量设计 标量就是指一个标准的运算处理部件。超标量设计就标量就是指一个标准的运算处理部件。超标量设计就是在是在CPU内部设置多个相互独立的运算处理部件,使各内部设置多个相互独立的运算处理部件,使各部件能够并行或串行工作,目的是使部件能够并行或串行工作,目的是使CPU能够同时执行能够同时执行多条指令,在时钟频率不变的情况下,多条指令,在时钟频率不变的情况下,CPU执行程序的执行程序的速度自然会大大增加,这是一种用增加部件来换取速度速度自然会大大增加,这是一种用增加部件来换取速度的方案。的方案。4并行处理技术并行处理技术 将原多任务的部件拆分成若干个并行的独立部件,将原多任务的部件拆分成若干
16、个并行的独立部件,每个部件只负责某个单一类型的任务,这样各部件就每个部件只负责某个单一类型的任务,这样各部件就可以同时并行地进行各自的工作,可以同时并行地进行各自的工作,CPU的效率自然成的效率自然成倍地增加,这就是并行处理技术。倍地增加,这就是并行处理技术。5流水线技术流水线技术 每个部件在具体执行某条指令时必然要分成若干步每个部件在具体执行某条指令时必然要分成若干步骤,如何高效地执行各指令又是一个值得研究的问题,骤,如何高效地执行各指令又是一个值得研究的问题,流水线技术是解决这一问题的好办法。流水线技术是解决这一问题的好办法。流水线技术是另一种并行处理技术,其原理是将一流水线技术是另一种并
17、行处理技术,其原理是将一条指令的执行过程分解成若干个更小的子过程,每个条指令的执行过程分解成若干个更小的子过程,每个子过程的操作可以与其他子过程同时进行。由于这种子过程的操作可以与其他子过程同时进行。由于这种工作方式类似于工厂中的生产流水线,因此,把它称工作方式类似于工厂中的生产流水线,因此,把它称为流水线工作方式。为流水线工作方式。2.1.5 CPU性能评价性能评价 通过前面的介绍我们已经知道,主频的高低只反映了通过前面的介绍我们已经知道,主频的高低只反映了CPU电路动作的快慢。除此之外,其他方面也会对性能电路动作的快慢。除此之外,其他方面也会对性能产生一定影响,因此应该更为全面客观地对产生
18、一定影响,因此应该更为全面客观地对CPU性能加性能加以评价。以评价。1运算速度运算速度 运算速度,即每秒钟能够执行的指令数,单位为运算速度,即每秒钟能够执行的指令数,单位为MIPS(百万条指令百万条指令/秒)目前秒)目前Pentium4的运算速度已经的运算速度已经超过超过1000MIPS(10亿次亿次/秒)。秒)。2.生产工艺生产工艺 集成电路的生产技术水平一般用集成电路的生产技术水平一般用“工艺线宽工艺线宽”来表示,来表示,即电路中线条的宽度。即电路中线条的宽度。工艺线宽数值越小,电路的工作频率就越高,功耗和工艺线宽数值越小,电路的工作频率就越高,功耗和发热量也就越小,同时还可以进一步提高芯
19、片的集成度,发热量也就越小,同时还可以进一步提高芯片的集成度,使使CPU内部电路更趋复杂。目前的内部电路更趋复杂。目前的CPU生产工艺已经小生产工艺已经小于于0.10微米。微米。3.工作电压工作电压 目前目前Pentium4工作电压已经降到工作电压已经降到1.5伏以下,并有伏以下,并有可能进一步降低。可能进一步降低。CPU工作电压下降,芯片发热量自然减少,另一个工作电压下降,芯片发热量自然减少,另一个好处是可以增大芯片的面积,提高集成度。好处是可以增大芯片的面积,提高集成度。4.封装技术封装技术(1)DIP封装封装 双列直插式(双列直插式(Dual In-line Package)封装封装(2
20、)QFP封装封装 四方扁平(四方扁平(Quad Flat Package)封装封装(3)PGA 封装封装 针栅阵列(针栅阵列(Pin Grid Array Package)封装封装(4)BGA封装封装 球栅阵列(球栅阵列(Ball Grid Array Package)封装封装(5)FC-PGA和和mPGA封装封装 反转芯片针栅阵列反转芯片针栅阵列(Flip Chip PGA)封装和微型针栅封装和微型针栅阵列(阵列(micro PGA)封装封装(6)LGA封装封装 栅格阵列栅格阵列(Land Grad Array)封装封装2.1.6 有关有关CPU的其他技术的其他技术1.动态执行技术动态执行技
21、术(1)数据流分析)数据流分析(dataflow analysis)(2)多路分支预测(多路分支预测(multiple branch prediction)利用先进的转移预测技术,对译码后的几条指令进行分利用先进的转移预测技术,对译码后的几条指令进行分支预测,如需跳转,则将跳转处的指令调入处理器执行,支预测,如需跳转,则将跳转处的指令调入处理器执行,一般情况下预测准确率可高达一般情况下预测准确率可高达90%。(3)推测执行()推测执行(speculative execution)根据数据流分析后得到的结果,将优化的指令序列送往根据数据流分析后得到的结果,将优化的指令序列送往处理器的执行部件,并
22、推测出下一步需要执行的指令。处理器的执行部件,并推测出下一步需要执行的指令。2双重独立总线技术双重独立总线技术其核心是采用两条总线,一条连接二级缓存,称为后端总线;其核心是采用两条总线,一条连接二级缓存,称为后端总线;一条连接系统内存,称为前端总线。这种结构称为双重独一条连接系统内存,称为前端总线。这种结构称为双重独立总线立总线(Dual Independent Bus,DIB),优点是两条总线可优点是两条总线可同时独立工作,显著地提高了数据的传输速度。该技术也同时独立工作,显著地提高了数据的传输速度。该技术也用于后续的用于后续的PentiumIII和和Pentium4处理器。如图处理器。如图
23、2-2所示。所示。3执行跟踪缓存技术执行跟踪缓存技术 与一般的指令缓存不同的是,跟踪缓存中存放的不是原与一般的指令缓存不同的是,跟踪缓存中存放的不是原始指令,而是经过处理器解码单元解码后的微操作指令,始指令,而是经过处理器解码单元解码后的微操作指令,这就避免了重复解码带来的延迟。这就避免了重复解码带来的延迟。4SMP技术技术 对称多处理器对称多处理器(Symmetrical Multi-Processing,SMP)技术就是在同一块主板上安装两个、四个、八个技术就是在同一块主板上安装两个、四个、八个处理处理器,各处理器协调工作,并行处理。器,各处理器协调工作,并行处理。5TLB技术技术 编译后
24、备缓冲区编译后备缓冲区(Translation Lookaside Buffer,TLB)技术的特点是处理器不直接访问数据的物理地址,而技术的特点是处理器不直接访问数据的物理地址,而是先建立比较简单的虚拟地址,处理器直接访问的是虚拟是先建立比较简单的虚拟地址,处理器直接访问的是虚拟地址,并将结果存放在编译后备缓存区中,由此来提高系地址,并将结果存放在编译后备缓存区中,由此来提高系统的性能。统的性能。6CISC技术和技术和RISC技术技术 CISC(Complex Instruction Set Computer,复杂指令复杂指令系统计算机)技术和系统计算机)技术和RISC(Reduced In
25、struction Set Computer,精简指令系统计算机精简指令系统计算机)技术是两种不同的指令系技术是两种不同的指令系统设计风格。统设计风格。lCISC是增加指令系统的复杂程度,使原来必须用几条指令才是增加指令系统的复杂程度,使原来必须用几条指令才能完成的操作用一条指令来完成,这样的话,一方面减小了能完成的操作用一条指令来完成,这样的话,一方面减小了编程难度使源程序缩短,另一方面程序总指令数减少,自然编程难度使源程序缩短,另一方面程序总指令数减少,自然就会加快程序的执行速度。就会加快程序的执行速度。lRISC,其指导思想就是其指导思想就是“简单性简单性”,主要表现在指令数少且,主要表
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 微机体系结构 第二 微机 体系结构
