西安交大计算机系统与应用复习.docx
《西安交大计算机系统与应用复习.docx》由会员分享,可在线阅读,更多相关《西安交大计算机系统与应用复习.docx(15页珍藏版)》请在沃文网上搜索。
1、1. 程序访问的局部性原理 n 局部访问性u 程序总是趋向于重用最近使用过的指令和数据u 在程序的执行过程中,CPU访问内存中的指令和数据总是趋向于成簇或成块的。l 程序中包含大量的循环体和子程序,会对这组指令重复访问l 程序中包含大量的表数据和数组,涉及对同一数据块的重复访问n 经验法则u 90%的执行时间花在10%的代码上n 局部访问性包括:u 时间局部性:最近访问过的指令或数据不久的将来还可能被访问u 空间局部性:被访问子附近的子,重用的概率大n 这个原理是设计计算机存储系统的理论基础n 指令局部性强于数据局部性2. 优化处理经常性事件n 在进行计算机设计或者项目设计时,我们必须优化处理
2、经常性事件u 事件经常发生u 优化经常性事件可以提高整个系统性能u 优化处理非经常性事件没有意义n 怎么优化?u 并行处理,更快的算法u 用更快的组件n 提高多少性能?u Amdahl定律3. Amdahl定律n Amdahl定律u 通过使用某种更快速的执行方式而获得的性能改进u 受限于这种快速方式的使用时间在总执行时间中的比例u 它定义了由于使用特殊技术所获得的加速比的大小n 加速比u 一种比值u 采用改进措施后整个任务的性能/没有采用改进措施整个任务的性能u 未采用改进措施时整个任务的执行时间/采用改进措施后整个任务的执行时间n Amdahl定律算加速比改进后整个任务的执行时间:改进后整个
3、系统的加速比:n 加速比和Fe=0的关系u Fe=0, Sn=1,没有可改进的地方u Se=, Sn=1/(1-Fe)u 可获得的性能改善的极限值也受可改进部分所占的比例限制n 例子:假定想改进用于Web服务的处理器。新的处理器在计算Web服务应用时,比原来处理器的速度快10倍。假定原处理器用于计算的时间占总时间的40%,等待I/O的时间占60%,则改进后总的加速比是多少?u 收益递减规律:只改进计算的某一部分而获得的加速比的增量随改进的增加而逐渐减少。u 如果只能对任务的一部分进行改进,对整个任务加速不会超过1/(1-Fe)n 例子:假定浮点平方根(EPSQR)运算占图形测试程序执行时间的2
4、0%,一种建议是改进浮点平方根运算的硬件,使平方根运算的速度提高到10倍;另一种方法是加快图形处理器中所有浮点指令,使FP指令的执行速度提高到1.6倍。浮点指令占整个应用程序执行时间的一半。请比较这两种方案。4. 处理器的性能公式n CPU时间 = 程序的CPU周期数 * 时钟周期n CPU时间 = 程序的CPU周期数 / 时钟频率n CPU时间 = CPI * IC * 时钟周期n CPU时间 = CPI * IC / 时钟频率u CPI:每条指令的平均时钟周期数 IPC:每周期执行的指令数u IC:指令数u CPU性能依赖于三个要素:时钟周期或频率;每条指令所花的时钟周期数;指令条数。5.
5、 可靠性和可用性n 通常用平均无故障时间(MTTF)表示一种可靠性u MTTF:平均无故障时间u 故障率:1/MTTFl 每10亿运行小时发生的故障数l FIT:实时故障数n MTBF:平均故障间隔时间u MTBF=MTTF+MTTRu MTTR:平均修复时间n 集合的故障率为各模块的故障率之和n 可用性:服务完成状态相对于服务完成和服务中断间隔的一种度量u 模块可用性=MTTF/MTTF+MTTRn 例子:假定一个磁盘子系统的构成和各自的MTTF如下(1)10个磁盘,每个磁盘的MTTF为1000000小时(2)一个SCSI控制器,MTTF为500000小时(3)一个电源,MTTF为20000
6、0小时(4)一个风扇,MTTF为200000小时(5)一组SCSI线,MTTF为1000000小时;假定寿命是指数分布的,且故障是独立的。计算整个系统的MTTFn 解决故障问题的主要方法是采用冗余技术n 例子:假定再增加一个电源,组件的寿命指数分布,故障间不相关。如果电源故障的平均修复时间是24小时,计算冗余电源组的可靠性(小时)6. 芯片功耗n 动态功率:静态功率: 电池泄露功耗占总功耗的25%动态能量:u 降低时钟频率可以减少动态功率,但不能减少动态能耗n 芯片成本限制晶体管数量增加和体积减小1. Cache系统组成n Cache设计理论基础u 局部访问性u 90%的执行时间花在10%的代
7、码上u 将这10%代码装入Cache中n 低一级的Cache总是比高一级的Cache容量大一个量级,速度慢一个量级n 上一级的Cache里存放下一级Cache的部分内容n Cache和CPU之间传送单位是字,Cache和Cache、主存和Cache之间传送单位是块或行n 命中:字传给CPUn 未中:CPU从低一级Cache载入字,包含字的块装入所有高级Cache,可能会发生替换2. Cache系统的性能参数n 平均访问时间:或者:u H:M1(Cache)的命中率u T1:访问M1的时间u T2:访问M2(主存)的时间u 三级存储结构:n 访问效率:二级存储访问效率:n 提高存储系统的访问效率
8、途径:u 提高快速存储器的命中率u 两级存储器的速度不要差别太大n 未中率4C模型u 强制未中型:初始时Cache为空,不管Cache的容量多大,最开始的Cache访问一定不会命中,需要从主存装入块。u 容量未中型:由于Cache的容量不够大,不能装入一个程序执行所需要的全部块,所访问的块被淘汰回了主存,从而未实现命中。u 冲突未中型:在直接映射和组关联映射方式中,不同的主存块可以对应同一Cache行,新装入的主存块会将对应的Cache行淘汰,此时访问被淘汰的数据,就会出现不命中。u 数据一致未中型:多机系统中,当一个CPU更新自己的Cache数据项时,其他Cache中对应的数据项变为无效。此
9、时,对这个无效数据访问就会导致未中。u =命中时间+未中率*未中损失u 减少平均访问时间:l 降低未中率。增加行大小、增加Cache容量、提高关联度l 减少未中损失。使用多级Cache、让读的优先级高于写l 减少Cache命中时间。当判决Cache命中与否时,避免地址变换n 加速比l:Cache的访问周期,:主存的访问周期3. Cache系统设计的关键问题n Cache容量u 小Cache:低功耗,低命中率,快速u 大Cache:高功耗,高命中率,更大的CPU占有,慢u 没有最优值:L1 Cache 1KB,L2 Cache 8 MB,L3 Cache 36MBu 容量与命中率:n 行大小u
10、太小:访问的局部性弱,高替换率,低命中率u 太大:命中率逐渐降低l 新装入数据的使用概率,比被替换数据重用率低l 行中部分字和被请求的字距离太远u 8-64B比较合理n 映射机制u 组关联映射:主存和Cache分成等大小的块,把主存块与Cache行分成相同大小的组,主存中每组的块数和Cache中每组的行数一样。主存的组和Cache的组之间直接映射,组内的块与行之间全关联映射。u K路组关联:每组k行,m行=v组*kl 地址长度=(s+w)位l 主存的容量=2s+w字l 块大小=行大小=2w字l 主存的块数=2s块l Cache的组数=2d组l 组内的行数=k行l Cache的总行数,m=k*2
11、d行l Cache的容量=k*2d+w 行l 例题:在一个四路组关联的Cache系统中,主存的大小为4KB个块,Cache的大小为128行,块大小是16个字。请画出Cache的地址结构Cache的组数v=128/4=32,组号为5;块大小16个字,字号位w=4。主存容量=4k*16,地址长度为16。n 替换算法:u FIFO:先进先出u RAND:随机数发生器确定被替换的行u LFU:最不经常使用u LRU:最近最少使用u OPT:最优替换算法n 写策略u 写命中策略:l 写直达:同时写Cache和主存。一致性较好,写的代价比较大l 写回:只更新Cache,需要替换它时再写回主存。设置脏位=1
12、,替换前检查,为1写回,为0直接替换。写的代价小,一致性差u 未中的写策略l 写分配法:把地址所对应的主存块装入Cache,然后更新。l 写不分配法:直接更新主存里的数据,更新后数据不装入Cache。4. Cache基本优化方法n 增加行大小、容量和关联度,减少未中率;多级Cache减少未中损失;写缓存5. Cache应用: 1. SDRAM和DDR-DRAM:n 同步内存(SDRAM)与CPU交换数据同步于一个外部时钟信号,以CPU和系统总线时间的最大带宽传送数据,没有强制的等待状态。读写都是在时钟控制下。n DDR-DRAM是双倍数据速率的SDRAM,每个时钟周期发送两次数据,一次在上升沿
13、,一次在下降沿2. 高性能存储器n 多体交叉主存:多个存储体连接在一起,形成一个交叉的存储系统n 并行访问主存:u 单体多字主存:字加长,一个存储体内放n个字,一次读写n个字。u 双端口存储器:两组相互独立的写控制线路和两个端口,每一个端口都有自己的片选控制信号和输出使能控制信号,允许两个独立的CPU或控制器同时异步地访问存储单元。n 关联存储器:把存储单元里内容的一部分作为关键字,来检验存储器,并将与关键字匹配的存储单元的内容读出或写入。3. 硬盘读写规则:n 读:磁头静止,磁盘旋转。n 写:电流脉冲送给写磁头,会产生不同方向的磁场,磁化磁盘的小区域,从而录0或1. T:平局访问时间,:平均
14、寻道时间,r:转速,b:要传送的字节,N:每个磁道的字节数4. RAID和平行存储器n RAID:独立磁盘冗余阵列,提高存储系统可靠性和性能的一种新技术。三个特征:物理上一组磁盘,在操作系统的管理下逻辑上成为一个磁盘 数据条带化、轮转分布到阵列的所有磁盘上 冗余的磁盘容量用来存放校验信息,在磁盘故障时用以恢复数据u RAID0:没有冗余。条带化的数据按照阵列方式轮转分布到所有盘上,强调的是容量和吞吐率,不强调可靠性。u RAID1:两套RAID0组成,其中一套作为镜像,有两份相同的数据。采用数据条带,每个逻辑条带映射到两个独立的物理硬盘上。l 特点:一个读请求可以由两个盘中的任意一个响应; 写
15、请求要求两个相应的条带同时更新,没有写损失; 故障恢复简单。当一个盘故障,可以从另一个盘访问数据。l 性能是RAID0的两倍,成本高。u RAID5:数据条带形式是数据块,将校验块轮转式、平均分不到所有盘上。当要写一个数据块时,阵列控制器需要计算校验块放到哪个盘上。较低开销,适合全盘数据的读写。较高性价比。u RAID7:高I/O请求率和高数据传输率的最优异步阵列。结构中包含了阵列管理计算机和阵列操作系统,具有数据缓冲Cache,可完全独立于主机运行,不占用主机CPU资源。它的存储计算机的OS是一套实时事件驱动的操作系统,用来进行系统初始化、调度数据传输,并把它们转换到相应的物理存储驱动器上。
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 西安 交大 计算机系统 应用 复习