计算机系统结构(第2版(课后习题答案.doc
《计算机系统结构(第2版(课后习题答案.doc》由会员分享,可在线阅读,更多相关《计算机系统结构(第2版(课后习题答案.doc(153页珍藏版)》请在沃文网上搜索。
1、 你计算机系统结构清华第2版习题解答1 目录1.1 第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)1.2 第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)1.3 第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法-实存状况图)1.4 第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)1.5 第五章(P343)5.9(流水
2、线性能/时空图),5.15(2种调度算法)1.6 第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)1.7 第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)1.8 第八章(P498)8.12(SISD/SIMD算法)1.9 第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。有下划线者为推荐的主要知识点。)2 例, 习题2.1 第一章(P33)例1.1,p10假设将某系统的某
3、一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:Fe=0.4, Se=10,根据Amdahl定律 例1.2,p10采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20%。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计方案。解:分别计算出这两种设计方案所能得到的加速比:Fe FPSQR=0.20,
4、Se FPSQR=10Fe FP=0.50,Se FP=2例1.3,p11如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%, FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。解:原系统的CPIFP=4.0, =25%CPI2=1.33, =1-25%CPI原 = CPIFP + CPI2=4.025% + 1.3375%=2方案1(使FPSQR操作的CPI为2)系统 CPI=CP
5、I原 - CPIFPSQR原 + CPIFPSQR新=CPI原 - (CPIFPSQR原 - CPIFPSQR新)=2-2%(20-2)=1.64方案2(提高所有FP指令的处理速度, 使FPSQR操作的CPI为2)CPI=CPI原 - CPIFP原 + CPIFP新=CPI原 - (CPIFP原 - CPIFP新)=2-25% (4-2)=1.5我们也可以根据以下公式计算出方案2系统(同求CPI原)CPI= 75%1.33+25%2=1.5显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。方案2的加速比=2/1.5=1.33例1.4假设两台机器的指令系统中,执行条件转移
6、指令需2个时钟周期,而其它指令只需1个时钟周期。CPUA:采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行测试,以确定是否进行转移。显然实现一次条件转移要执行比较和测试两条指令。条件转移指令占总执行指令条数的20%。由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。CPUB采用比较功能和判别是否实现转移功能合在一条指令的方法,这样实现一条件转移就只需一条指令就可以完成。由于CPUB在转移指令中包含了比较功能,因此它的时钟周期就比CPUA要慢25%。现在要问,采用不同转移指令方案的CPUA和CPUB,那个工作速度会更快些?解:CPIA=0.22+0.81=1
7、.2TCPUA=ICA1.2tA= 1.2 ICAtACPUB转移指令占20%80%=25%CPIB = 0.252+0.751=1.25由于CPUB中没有比较指令,因此ICB = 0.8ICACPUB时钟周期就比CPUA要慢25%tB = 1.25tATCPUB = ICBCPIBtB = 0.8 ICA1.251.25tA = 1.25 ICAtATCPUATCPUB所以CPUB比CPUA运行得更快些。例1.A1计算Pentium II 450(IPC2)处理机的运算速度。解:由于PentiumII 450处理机的IPC2 (或CPI0.5)Fz450MHz,MIPSPentium II
8、450FzIPC450 MHz2900(MIPS)例1.A2我国最早研制的小型计算机DJS-130,定点16位,加法每秒50万次,但没有硬件乘法和除法指令,用软件实现乘法和除法,速度低100倍左右。求等效速度。解:定点等效速度为:即每秒2万次,由于乘法和除法用软件实现,等效速度降低了25倍。例1.A3假设在程序中浮点开平方操作FPSQR的比例为2,它的CPI为100;其他浮点操作FP的比例为23,它的CPI 4.0;其余75指令的CPI1.33,计算该处理机的等效CPI。如果FPSQR操作的CPI也为4.0,重新计算等效CPI。解:等效CPI10024231.33753.92等效CPI2425
9、1.33752.001.1解释下列术语层次结构,计算机系统结构,计算机组成,计算机实现,透明性,由上而下设计,由下而上设计,由中间向两边设计,软件兼容,向上兼容,固件,系列机,兼容机,模拟,仿真,虚拟机,宿主机,指令流,数据流,单指令流单数据流,多指令流多数据流,Amdahl定律,CPI,MIPS,MFLOPS。1.2每一级为了执行一条指令需要下一级的N条指令解释,若执行第一级的一条指令需kns,那么执行第2级、第3级、第4级的指令需要多少时间?第1级 1条1级指令 k ns第2级 1条2级指令 N条1级指令 1Nk ns = Nk ns第3级 1条3级指令 N条2级指令 1NNk ns =
10、N2k ns第4级 1条4级指令 N条3级指令 1NNNk ns = N3k ns1.4每一级指令能完成下一级的M条指令的工作量,且每一级指令需要下一级的N条指令解释,若执行第一级的一条指令需kns,那么执行第2级、第3级、第4级的等效程序需要多少时间?第1级 1条1级指令 k ns第2级 等效程序为1/M条2级指令 需N/M条1级指令解释 N/Mk ns第3级 等效程序为1/M/M条3级指令 需NN/M/M条1级指令解释 N2/M2 ns第4级 等效程序为1/M/M/M条4级指令 需NNN/M/M/M条1级指令解释 N3/M3 ns1.6试以实例说明计算机系统结构、计算机组成与计算机实现之间
11、的相互关系与相互影响。系统结构、组成和实现是三个不同的概念,它们各自包含不同的内容,但又有紧密的关系。以存储系统为例,主存储器容量和寻址方式的确定属计算机系统结构,主存的速度应多高,在逻辑结构上采用什么措施属计算机组成,而主存的物理实现,如存储器采用什么样器件,逻辑电路设计和微组装技术则属计算机实现。1.7什么是透明性概念?对计算机系统结构,下列哪些是透明的?哪些是不透明的?n 存贮器的模m交叉存取;透明(组成)n 浮点数据表示;不透明(系统结构)n I/O系统是采用通道方式还是I/O处理机方式;不透明n 数据总线宽度;透明(组成)n 阵列运算部件;透明(组成)n 通道是采用结合型的还是独立型
12、的;透明(组成)n PDP-11系列中的单总线结构;不透明(系统结构)n 访问方式保护;不透明(系统结构)n 程序性中断;不透明(系统结构)n 串行、重叠还是流水控制方式;透明(组成)n 堆栈指令;存贮最小编址单位;不透明(系统结构)n Cache存贮器。透明(组成)(1)从指定角度来看,不必要了解的知识称为透明性概念。(2)见下表,“”为透明性概念。模m交叉,浮点数据,P4通道与I/O处理机,P4总线宽度,阵列运算部件,结合型与独立型通道,单总线,访问保护,中断,指令控制方式,堆栈指令,最小编址单位,Cache存储器,1.8从机器(汇编)语言程序员看,以下哪些是透明的?n 指令地址寄存器;指
13、令缓冲器;时标发生器;条件码寄存器;乘法器;主存地址寄存器;磁盘外设;先行进位链;移位器;通用寄存器;中断字寄存器。见下表,“”为透明性概念指令地址寄存器,指令缓冲器,时标发生器,条件码寄存器,乘法器,主存地址寄存器,磁盘,先行进位链,移位器,通用寄存器 ,中断字寄存器,1.9见下表,“”表示都透明,“应”表示仅对应用程序员透明,“”表示都不透明。数据通路宽度,虚拟存储器,应,Cache存储器,程序状态字,“启动I/O”指令,应,“执行”指令,指令缓冲寄存器,1.12如果某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用向量方式求解部分所花费时间占总的时间的百分比为可向量化百分比。请
14、画出加速比与可向量化比例两者关系的曲线。解:可向量化百分比为Fe, Se=20,根据Amdahl定律 将Se代入Amdahl定律得1.13在题1.12中,为达到加速比2, 可向量化的百分比应为多少?=2则可向量化的百分比Fe=0.5261.14在题1.12中,为获得采用向量方式最大加速比的半值(即10)时,所需可向量化的百分比为多少。=10则可向量化的百分比Fe=0.9471.15在题1.12中,如果某程序可向量化部分为70%,硬件设计组认为可以通过加大工程投资,使向量处理速度加倍来进一步增加性能;而编译程序编写组认为只需设法增加向量工作方式的百分比就同样可使性能得到相同的提高,问:此时需使可
15、向量化成分再增加多少百分比就可实现。你认为上述硬、软件两种方法中,哪一种方法更好?(1)用硬件组方法,已知Se=2 X 20 =40,Fe=0.7解出Sn=40/12.73.1496(2)用软件组方法,已知Se=20,得到硬件组方法的相同性能Sn=40/12.7解出Fe=27.3/380.7184(3)结论:软件组方法更好。因为硬件组需要将Se再提高100%(2040),而软件组只需将Fe再提高1.84%(0.70.7184)。1.16某计算机的高速小容量存储器能存储2000条指令。假设10的指令承担了90%的指令访问且对这10的指令的使用是均匀的(即其中每条指令的执行时间相同)。如果要执行的
16、某程序共有50 000条指令且已知其中的10%是频繁使用的,则当该计算机执行该程序时,在高速小容量存储器中能访问到的指令会占多少百分比?解: 对该应用程序来说,在90%的时间里,只有50000*10%=5000条指令在运行,其他的45000条指令的平均运行次数很少,因此,可以假设对它们来说,Cache总是缺失的 对频繁访问的这10%的指令,假设它们访问均匀,这样,Cache的行为便可以认为是均匀覆盖了这些指令所以,10的指令承担了90%的指令访问, 指令访问次数(50000*10%)/90%命中次数2000Cache的命中率为:H=2000/(50000*10%)/90%=0.361.17假设
17、高速缓存Cache 工作速度为主存的5倍,且Cache被访问命中的概率为90%,则采用Cache后,能使整个存储系统获得多高的加速比?解:1.18设计指令存储器有两种不同方案:一是采用价格较贵的高速存储器芯片,另一是采用价格便宜的低速存储芯片。采用后一方案时,用同样的经费可使存储器总线带宽加倍,从而每隔2个时钟周期就可取出2条指令(每条指令为单字长32位);而采用前一方案时,每个时钟周期存储器总线仅取出1条单字长指令。由于访存空间局部性原理,当取出2个指令字时,通常这2个指令字都要使用,但仍有25%的时钟周期中,取出的2个指令字中仅有1个指令字是有用的。试问采用这两种实现方案所构成的存储器带宽
18、为多少?解:方案一:采用高速缓冲存储器,使每个时钟周期存储器总线取出1条指令,则 存储器带宽=1字/时钟周期=32位/时钟周期方案二:使存储器总线带宽加倍,从而每隔2个时钟周期就可取出2条指令(每条指令为单字长32位),但仍有25%的时钟周期中,取出的2个指令字中仅有1个指令字是有用的,则1.19用一台40MHz处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:指令类型 指令数 时钟周期数 整数运算 45000 1数据传送 32000 2浮点 15000 2控制传送 8000 2求有效CPI、MIPS速率和程序的执行时间。1.20某工作站采用时钟频率为15MHz、处理速率为1
19、0MIPS的处理机来执行一个已知混合程序。假定每次存储器存取为1周期延迟、试问:(a) 此计算机的有效CPI是多少?(b) 假定将处理机的时钟提高到30MHz,但存储器子系统速率不变。这样,每次存储器存取需要两个时钟周期。如果30%指令每条只需要一次存储存取,而另外5%每条需要两次存储存取,还假定已知混合程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。 解:(a) f=15MHz , MIPS=10, 每次存取时间为2个时钟周期(b)30%指令每条只需要一次存储存取,改进前共需1周期,改进后共需2周期而另外5%每条需要两次存储存取,改进前共需2周期,改进后共需4周期1.21假设在一
20、台40MHz处理机上运行200000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下:指令类型 CPI 指令混合比算术和逻辑 1 60%高速缓存命中的加载/存储 2 18%转移 4 12%高速缓存缺失的存储器访问 8 10%(a) 计算在单处理机上用上述跟踪数据运行程序的平均CPI(b) 根据(a)所得CPI,计算相应的MIPS速率。解:(1)(2)1.24假定你是一个计算机设计者,对高级语言结构的使用研究表明,过程调用是最常用的操作之一。你已设想了一个优化设计方案,它能减少过程调用和返回所需的取/存指令次数。为了进行验证,对未加优化和已
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 课后 习题 答案