计算机体系结构重点总结

计算机体系结构重点总结
计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。

F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间

整个任务在老计算机上运行得时间

同时将S定义为先进高速部件与老部件得性能,则

S= 老部件完成该功能得时间

先进高速部件完成该功能得时间

而采用了高速部件后整机性能提高比,即

Speedup = T old = 1

T new (1-F)+F/S

某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算:

⑴采用增强技术后计算机性能加速比就是多少?

⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。

2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。

(2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性

(3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。

3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断)

4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。

5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断)

6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。

提高计算机性能就就是提高CPU性能与减少等待时间。

cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction),

CPI=CPU花费得时钟数/CPU执行得总指令数

CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ

8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空)

CPU性能 =1/CPU time= f / ( I×CPI )

计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。

MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 )

MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106

10、工作负载基准程序(workload benchmark):

(1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空)

11、基准程序得一般设计原则:

(1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。

(3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。

(5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。

12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序

13、指令设计时主要以下几个方面来考虑: (考填空)

⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

14、正向条件转移大部分就是不成功得,它满足条件得概率较低。 (考判断)

15、一般基本传送指令包含Load,Store与Move三类。(考填空)

16、从操作数存放得位置来说,至少有三类地址:(1)存储器地址(2) I/O地址(3)寄存器地址

如果不加特殊说明,我们称地址就就是指存储器地址或I/O地址。

17、主存储器编址:计算机有两种习惯使用方法,即在字单元地址内有两种字节排列次序:

第一种为低位收尾(little endian),其字节次序就是低字节在最低位得排列; DEC Intel公司

第二种为高位收尾(big endian),其字节次序就是高字节在最低位得排列。 IBM Motorola公司操作码得信息源熵(系统包含得平均信息量)公式(H=-Σp i log2p i )式中pi为事件出现得频率,由此我们可以

比较压缩前后得信息冗余量或时间冗余量。

“Simple is fast”与“Small is fast”,即:简单事件可以更快速处理;小规模器件得速度可以做得更快,

体现了RISC思想得精髓。

20、构成计算机得成本组合:(1)器件成本(2)直接成本(3)间接成本(4)报价单价格 (考填空)

21、计算机得三种机器结构:堆栈、累加器、通用寄存器

22、处理器(CPU)可分为两部分:

(1、)数据通路(ALU(arithmetic logic unit)+寄存器)为处理器工作时数据实际流过得路径。

(2)控制器(解释计算机机器指令代码,并按这些代码发出控制信号控制数据通道得工作以完成指令)就是处理器

中得主控部分,就是将指令转换为实际硬件动作得桥梁,设计最复杂。

23、数据通路组成图

24、寄存器:专用寄存器

+通用寄存器

专用寄存器:(1)PC

(Program Counter) 程

序计数器

(2)MAR(memory

address register) 存

储器地址寄存器

MDR(memory data

register) 存储器数据

寄存器

(4)IAR(interrupt

address register)

中断地址寄存器

(5)Temp 暂存寄存器:

数据访问中起暂存作用

得寄存器。

不知道存在:MAR、MDR、

Temp 用户透明:PC、IAR

通用寄存器:能被用户自由地用于数据计算得寄存器

寄存器堆(register file)由多个通用寄存器合起来得。存储器层次结构中得最高层,属于最小也就是最快得暂存

部件。

25、指令得执行分为以下五个步骤:

(1)取指令IF(2、)指令译码/寄存器读出ID(3)执行/有效地址计算EX

(4)存储器访问/完成转移:a、访存指令b、转移指令 MEM(5)写回 WB

26、微指令编制方式:(1)垂直微代码:加一些硬件电路来解释这些信号,而不就是直接使用它们

(2)水平微代码:完全不编码得微指令

27、中断在不同得计算机系统中有不同得叫法,Intel与IBM仍将所有得都称为中断,而Motorola将它们称为例外,DEC则根据不同得情况,将它们称作异常、出错、自陷、放弃或中断。

28、流水线得作用:提高硬件功能部件得使用率, 减少指令得平均执行时间。

流水线(pipeline)就是指在程序执行时多条指令重叠进行操作得一种准并行处理实现技术(流水线得并行处理就是指完成一条指令得各个部件在时间上可以重叠工作)。

29、

30、流水线竞争有三种:⑴结构竞争(资源竞争):由资源缺乏引起。⑵数据竞争(data hazard) :由指令间数据相关而引起。⑶控制竞争(control hazard) :由程序指针PC值得改变而引起。 (考填空)

31、为什么计算机设计者允许结构竞争存在

(1)减少成本。(2)降低单元电路得延时时间。(3)减少电路得复杂程度。

32、三种数据竞争:(1)先写后读相关 RAW (read after write)(2)写写相关 WAW (write after write)

(3)先读后写相关 WAR (write after read)

指令从ID级流入EX级,一般称指令发射(instruction issue)。一条指令已建立了这一过程,称为已发射(issued)。

34、

35、浮点乘法:15个周期,执行周期7个。浮点加法:执行周期4个。浮点除法:15个周期

36、

37、集中式动态调度。记分牌有以下四级流水步骤:

⑴发射级(issue) 处理结构竞争与WAW竞争⑵读操作数(read operands) 动态解决RAW竞争

⑶执行(execution) ⑷写结果(write result) 处理WAR竞争

记分牌重点掌握:

38、下面我们来分析如图4-30所示得5个功能部件得记分牌数据结构与工作过程。表4-24给出了执行下列简单

得指令序列时记分牌得组成信息:

LD F6,34(R2)

LD F2,45(R3)

MULTD F0,F2,F4

SUBD F8,F6,F2

DIVD F10,F0,F6

ADDD F6,F0,F2

表4-24 记分牌得组成结构指令状态

记分牌构成分三个部分:

1、指令状态。指出指令工作处在上述四级中得哪一级。

2、功能部件工作状态。指出功能部件得工作情况,每个功能部件需要指出九项相关参数。 Busy—指出功能部件地忙或空闲状态。

Op—功能部件所执行得操作类型。

F i—目得寄存器。

F j,F k—源操作数所用得寄存器。

Q j,Q k—产生源寄存器数据得功能单元。

R j,R k—指示源寄存器Fj,Fk准备就绪。

3、寄存器结果状态。如果有一条已激活指令有一个目得操作数就是寄存器,则指出那个功能单元将写(操作)这个寄存器。

相应流水线记分牌得工作过程也分三步。从表4-24可以瞧到,每条指令不论有没有发射,只要已取入流水线,在指令状态表中就有记录。而每个功能部件在其状态表中只保持一条记录。

对于上述指令序列:

指令状态寄存器表明第一条LD指令已经完成并且将结果写入了寄存器,而第二条LD指令已经执行完成,但还没有写结果。第三、四、五条指令MULTD,SUBD与DIVD已经发射,但被暂停在读操作数这一级,等候其操作数得到来。

功能部件工作状态则表明第一个乘法单元在等整数单元取操作数F2,同样加法单元在等整数减法部件得操作数F2,除法部件在等第一个乘法部件得操作数F0。

加法指令ADDD被暂停发射,因为存在一个结构竞争,这个结构竞争就是减法指令引起得,等加法功能部件得减法指令执行完,功能部件竞争就会消除。

[例4-8] 我们假定浮点功能部件在EX级流水级其等待延迟时间,加法部件就是2时钟周期,乘法部件就是10时钟周期,则对表4-24记分牌记录得代码序列与初值数据结构,分析当前指令MULTD与指令DIVD继续执行各自进入写结果状态时记分牌得数据结构。

解:第二条指令LD给MULTD与SUBD指令带来了RAW型数据竞争,而指令MULTD给指令DIVD、指令SUBD给指令ADDD也带来了RAW型数据竞争。在指令DIVD与ADDD之间存在着WAR数据竞争。对加法指令ADDD要用到得加法功能单元还存在结构竞争。因此,乘法指令进入写结果状态与除法指令DIVD进入写结果状态就是不同得,分别如表4-25与表4-26所示。

表4-25 指令MULTD进入写结果级前得记分牌数据结构

表4-26就是指令DIVD进入写结果级前记分牌得数据结构。此时加法指令已完成,同时除法指令DIVD通过读操作数级获得操作数F6。最后完成除法指令。

表4-26 指令DIVD进入写结果级前记分牌得数据结构

表4-26 指令DIVD进入写结果级前记分牌得数据结构

39、评价存储器性能得参数主要有三个方面:容量、性能、价格

高速度、大容量、低价格始终就是存储体系得设计目标。

40、存储器层次结构设计中得四大基本问题:(1)映象方式(2)映象机构(3)替换策略(4)写策略

41、最基本得Cache/主存映象方式有三种:

(1)直接映象(主存中得一信息块只能对应Cache得一个特定行)

(2)全关联映象(主存中得一信息块可对应Cache中得任意一行)

(3)组关联映象(主存中得第i块可以对应Cache中得某一特定组中得任意一行)

42、

如图5-12,当Cache读命中时,Cache得工作流程可分为五大步骤,这五个步骤就是在一个CPU时钟周期内完成得。

(1)来自CPU得地址被分为29位块帧地址与3位块内偏移地址,块帧地址又分成20位标志与9位索引。

(2)根据索引选择Cache中得一个组,读取组内各行标志以判定要访问得数据块就是否在Cache中。

(3)块帧地址得标志域与步骤2中读取得两个行标志作相等比较。

(4)假设有一行标志与块帧地址得标志相匹配,则由2选1多路转换器选取相应得数据行。

(5)读出得字送往CPU。

43、按导致Cache失配得原因划分,Cache失配可分成以下三类。这种分析失配得方法也称之为3C模型。

(1)被迫(pulsory)失配:第一次访问存储块时,由于该块不在Cache中,所以必须首先将此存储块从主存取入Cache中。

(2)容量(capacity)失配:如果Cache不能容纳程序执行过程中所需得所有存储块, 那么当程序再次访问到曾装入Cache又已被替换出去得某存储块时,就会出现容量失配。

(3)冲突(conflict)失配:在采用组关联与直接映象方式得Cache中,主存得很多块都将映象到Cache得某一行。如果因为这个原因,当程序再次访问到曾装入Cache又被替换出去得某存储块时,就会出现冲突失配,也称为碰撞失配(collision miss)。

44、越靠近CPU得存储器容量越小、速度越快、价格越高,离CPU越远得容量越大、速度越慢、价格越低;

45、平均存储访问时间(average memory_access time,AMT)

平均存储访问时间=命中率+失配率×失配时间表示为:AMT=HT+M×MP

46、两级Cache:

(1)一级Cache,一般做在CPU芯片上(也称片内Cache)。它容量较小,速度与CPU得时钟周期相匹配。

(2)二级Cache,一般做在CPU芯片上(也称为片外Cache),它容量大,速度在CPU与主存之间,以便尽可能多得访问二级Cache中完成而不必再去访问主存。

47、主存组织方式:(1)单体单字主存结构(2)单体多字主存结构(3)多体交叉主存结构

48、输入/输出(简称I/O)设备可分为三大类:数据表示设备、网络通讯设备、存储设备。

49、网络通讯设备得种类,按连接处理器得距离分,MPP网、局域网、广域网等;

50、根据网上节点数目与它们连接得紧密程度,可以把互连网络分为三种不同得类型:

(1)大规模并行处理器(massively parallel processors,MPP)网络。

MPP网=SAN(store area network)存储区域网

(2)局域网(local area network, LAN)

(3)广域网(wide area network, WAN)

51、根据机器最关键部位得指令与由指令引起数据流得并行性,把所有得计算机分为四类:

(1)单指令流,单数据流(SISD)——这就就是一个单处理器。

(2)单指令流,多数据流(SIMD)——同一指令由多个处理器执行,这些处理器使用不同数据流,有各自得数据内存,但共享一个指令内存与控制处理器(负责存取与发送指令)。处理器通常就是专用得,不要求通用性。

(3)多指令流,单数据流(MISD)——这种类型得商用机器目前尚未出现,今后也许有可能。

(4)多指令流,多数据流(MIMD)——每个处理器存取自己得指令,操作自己得数据。通常采用普通得微处理器。

52、现有得MIMD机器基于使用得处理器数目,可以分为两类:

(1)集中共享存储器式体系结构(2)分布式存储器得机器

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于:(1) 电路技术的发展;(2) 计算机体系结构技术的发展。 2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机->第二级:机器语言(传统机器级) -> 第一级:微程序机器级。 3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。 4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系? 答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。 9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的 各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。 11、兼容机:不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。 13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律:集成电路密度大约每两年翻一番。 15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。(b)流量:单位时间内所完成的工作量。(c )假定两台计算机x 、y;x 比y 快意思为:对于给定任务,x 的响应时间比y少。x的性能是y的几倍是指:响应时间x / 响应时间y = n ,响应时间与性能成反比。

计算机体系结构解

计算机体系结构解

————————————————————————————————作者:————————————————————————————————日期:

第一章计算机组成原理 本部分要求掌握计算机方面的基础知识,包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂,尤其是有关计算机硬件方面的内容,很细而且灵活性不高,知识量相当大,掌握这部分一定要多下功夫,学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求 考试要求: 1 掌握数据表示、算术和逻辑运算; 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示(原码、反码、补码、移码表示,整数和实数的机内表示,精度和溢出)?非数值表示(字符和汉字表示、声音表示、图像表示) ?校验方法和校验码(奇偶校验码、海明校验码、循环冗余校验码) 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2.计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能,以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式(中断系统、DMA、I/O 处理机方式) ?CISC/RISC,流水线操作,多处理机,并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理,多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例: (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

软件体系结构总结

第一章:1、软件体系结构的定义 国内普遍看法: 体系结构=构件+连接件+约束 2、软件体系结构涉及哪几种结构: 1、模块结构(Module) 系统如何被构造为一组代码或数据单元的决策 2、构件和连接件结构(Component-And-Connector,C&C) 系统如何被设计为一组具有运行时行为(构件)和交互(连接件)的元素 3、分配结构(Allocation) 展示如何将来自于模块结构或C&C结构的单元映射到非软件结构(硬件、开发组和文件系统) 3、视图视点模型 视点(View point) ISO/IEC 42010:2007 (IEEE-Std-1471-2000)中规定:视点是一个有关单个视图的规格说明。 视图是基于某一视点对整个系统的一种表达。一个视图可由一个或多个架构模型组成 架构模型 架构意义上的图及其文字描述(如软件架构结构图) 视图模型 一个视图是关于整个系统某一方面的表达,一个视图模型则是指一组用来构建 4、软件体系结构核心原模型 1、构件是具有某种功能的可复用的软件结构单元,表示了系统中主要的计算元素和数据存储。 2.连接件(Connector):表示构件之间的交互并实现构件

之间的连接 特性:1)方向性2)角色3)激发性4)响应特征 第二章 1、软件功能需求、质量属性需求、约束分别对软件架构产生的影响 功能性需求:系统必须实现的功能,以及系统在运行时接收外部激励时所做出的行为或响应。 质量属性需求:这些需求对功能或整个产品的质量描述。 约束:一种零度自由的设计决策,如使用特定的编程语言。 质量原意是指好的程度,与目标吻合的程度,在软件工程领域,目标自然就是需求。 对任何系统而言,能按照功能需求正确执行应是对其最基本的要求。 正确性是指软件按照需求正确执行任务的能力,这无疑是第一重要的软件质量属性。质量属性的优劣程度反映了设计是否成功以及软件系统的整体质量。 系统或软件架构的相关视图的集合,这样一组从不同视角表达系统的视图组合在一起构成对系统比较完整的表达

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机系统结构复习总结

计算机系统结构复习总结

计算机系统结构复习总结 一、计算机系统结构概念 1.1 计算机系统结构:程序员所看到的计算机的基本属性,即概念性结构与功能特性。 *注意:对不同层次上的程序员来说,由于使用的程序设计语言不同,可能看到的概念性结构和功能特性会有所不同。 1.2 计算机系统的层次结构 现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。 现代计算机结构图 *注意:计算机结构的层次模型 依据计算机语言广义的理解,可将计算机系统看成由多级“虚拟”计算机所组成。

从语言层次上画分可得下图: 计算机结构的层次模型 1.3计算机系统结构组成与实现 计算机系统结构:是计算机系统的软件与硬件直接的界面 计算机组成:是指计算机系统结构的逻辑实现 计算机实现:是指计算机组成的物理实现*计算机系统结构、组成与实现三者间的关系: 计算机系统结构不同会影响到可用的计算机组成技术不同,而不同的计算机组成又会反过来影响到系统结构的设计。因此,计算机系统结构的设计必须结合应用来考虑,要为软件和算法的实现提供更多更好的硬件支持,同时要考虑可

能采用和准备采用哪些计算机组成技术,不能过多或不合理地限制各种计算机组成、实现技术的采用与发展。 计算机组成与计算机实现可以折衷,它主要取决于器件的来源、厂家的技术特长和性能价格比能否优化。应当在当时的器件技术条件下,使价格不增或只增很少的情况下尽可能提高系统的性能。 1.4 计算机系统结构的分类 计算机结构分类方式主要有三种: (1)按“流”分类 按“流”分类法是Flynn教授在1966年提出的一种分类方法,它是按照计算机中 指令流(Instruction Stream)和数据流(Data Stream)的多倍性进行分类。指令流是指机 器执行的指令序列,数据流是指指令流调用 的数据序列。多倍性是指在计算机中最受限 制(瓶颈最严重)的部件上,在同一时间单 位中,最多可并行执行的指令条数或处理的 数据个数。 *注意:按“流”分类法,即Flynn分类法的逻

计算机体系结构知识点

目录 第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念 什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法 冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流 付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能 改进后 系统性能 改进前 = 总执行时间 改进前 总执行时间 改进后 加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间 可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成 付志强

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

计算机系统结构学习心得

计算机系统结构学习心得 姓名: 班级: 学号:

在大四上学期课程中对于计算机系统结构的学习已经结束,老师细心的讲解,耐心的辅导,是我从中学到很多的知识。 从中我了解到计算机系统结构(Computer Architecture)也称为计算机体系结构,它是由计算机结构外特性,内特性,微外特性组成的。经典的计算机系统结构结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它是软件和硬件固件的主要交界面,是由机器语言程序、汇编语言源程序和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所应具有的界面结构和功能。计算机系统结构指的是什么? 是一台计算机的外表? 还是是指一台计算机内部的一块块板卡安放结构? 都不是,那么它是什么? 计算机系统结构就是计算机的的机器语言程序员或编译程序编写者所看到的外特性。所谓外特性,就是计算机的概念性结构和功能特性。用一个不恰当的比喻一,比如动物吧,它的"系统结构"是指什么呢? 它的概念性结构和功能特性,就相当于动物的器官组成及其功能特性,如鸡有胃,胃可以消化食物。至于鸡的胃是什么形状的、鸡的胃部由什么组成就不是"系统结构"研究的问题了。系统结构只管到这一层。关于计算机系统的多层次结构,用"人"这种动物的不恰当的例子列表对比如下。计算机系统,人,应用语言级,为人民服务级,高级语言级,读书、学习级,汇编语言级,语言、思维级,操作系统级,生理功能级,传统机器级,人体器官级,微程序机器级,细胞组织级,电子线路级,分子级。传统机器级以上的所有机

器都称为虚拟机,它们是由软件实现的机器。软硬件的。功能在逻辑上是等价的,即绝大多部分硬件的功能都可用软件来实现,反之亦然。计算机系统结构的外特性,一般应包括以下几个方面(这也就是我们要分章学习的几个章节)把这几个方面弄清了,系统结构也就基本明确了:(1)指令系统 (2)数据指令 (3)作数的寻址方式 (4)寄存器的构成定义 (5)中断机构和例外条件 (6)存 储体系和管理 (7)I/O结构 (8)机器工作状态定义和切换 (9)信息保护。所以在以后的学习中常回头想想这是系统结构的哪一方面,这对把握全局有好处。这里提一下计算机系统结构的内部特性,计算机系统结构的内特性就是将那些外特性加以"逻辑实现"的基本属性。所谓"逻辑实现"就是在逻辑上如何实现这种功能,比如"上帝"给鸡设计了一个一定大小的胃,这个胃的功能是消化食物,这就是鸡系统的某一外特性,那怎么消化呢,就要通过鸡喙吃进食物和砂石,再通过胃的蠕动、依靠砂石的研磨来消化食物,这里的吃和蠕动等操作就是内特性。还有一个就是计算机实现,也就是计算机组成的物理实现。它主要着眼于器件技术和微组装技术。拿上面的例子来说,这个胃由哪些组织组成几条肌肉和神经来促使它运动就是"鸡实现"。据此我们可以分清计算机系统的外特性、内特性以及物理实现之间的关系。在所有系统结构的特性中,指令系统的外特性是最关键的。因此,计算机系统结构有时就简称为指令集系统结构。我们这门课注重学习的是计算机的系统结构,传统的讲,就是处在硬件和软件之间介面的描述,

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机体系结构知识点汇总

第一章计算机体系结构的基本概念 1.计算机系统结构的经典定义 程序员所看到的计算机属性,即概念性结构与功能特性。 2.透明性 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 3.系列机 由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 4.常见的计算机系统结构分类法有两种:Flynn分类法、冯氏分类法Flynn分类法把计算机系统的结构分为4类: 单指令流单数据流(SISD) 单指令流多数据流(SIMD) 多指令流单数据流(MISD) 多指令流多数据流(MIMD) 5. 改进后程序的总执行时间

系统加速比为改进前与改进后总执行时间之比 6.CPI(Cycles Per Instruction):每条指令执行的平均时钟周期数 CPI = 执行程序所需的时钟周期数/IC 7.存储程序原理的基本点:指令驱动 8.冯·诺依曼结构的主要特点 1.以运算器为中心。 2.在存储器中,指令和数据同等对待。 指令和数据一样可以进行运算,即由指令组成的程序是可以修改的。 3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。 4.指令的执行是顺序的 5.指令由操作码和地址码组成。 6.指令和数据均以二进制编码表示,采用二进制运算。 9.软件的可移植性 一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。差别只是执行时间的不同。我们称这两台计算机是软件兼容的。 实现可移植性的常用方法:采用系列机、模拟与仿真、统一高级语言。 软件兼容: 向上(下)兼容:按某档机器编制的程序,不加修改就能运行于比它高(低)档的机器。 向前(后)兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前(后)投入市场的机器。 向后兼容是系列机的根本特征。 兼容机:由不同公司厂家生产的具有相同系统结构的计算机。

计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。 F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间 整个任务在老计算机上运行得时间 同时将S定义为先进高速部件与老部件得性能,则 S= 老部件完成该功能得时间 先进高速部件完成该功能得时间 而采用了高速部件后整机性能提高比,即 Speedup = T old = 1 T new (1-F)+F/S 某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算: ⑴采用增强技术后计算机性能加速比就是多少? ⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。 2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。 (2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性 (3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。 3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断) 4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。 5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断) 6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。 提高计算机性能就就是提高CPU性能与减少等待时间。 cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction), CPI=CPU花费得时钟数/CPU执行得总指令数 CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ 8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空) CPU性能 =1/CPU time= f / ( I×CPI ) 计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。 MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 ) MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106 10、工作负载基准程序(workload benchmark): (1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空) 11、基准程序得一般设计原则: (1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。 (3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。 (5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。 12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序 13、指令设计时主要以下几个方面来考虑: (考填空) ⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

计算机系统结构论文

计算机系统结构论文 计算机系统结构中多处理机技术 摘要:多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。 关键词:多处理机;体系结构;总线 微电子技术和封装技术的进步,使得高性能的VLSI 微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的物质基础。 计算机系统性能增长的根本因素有两个:一是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。

1 微处理器的发展 20 世纪80 年代中期,RISC 精简指令集计算机,用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面,RISC 采用了超级流水线、超级标量、超长指令字并行处理结构;多级指令Cache;编译优化等技术,充分利用RISC 的内部资源,发挥其内部操作的并行性,从而提高流水线的执行效率。20 世纪80 年代后期,RISC 处理机的性能指标几乎以每年翻一番的速度发展,它对于提高计算机系统的性能和应用水平起着巨大的作用。 目前,由Intel 和HP 两家公司联合开发的基于IA—64 架构的Merced 芯片,并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing ),将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对整个程序的代码作出优化安排,编译器分析指令间的依赖关系,将没有依赖关系的指令(最多3 个)组成一“组”,由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲,EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术,可以显著地减少实际执行程序的长度,同时增强语句执行的并行性,经过代码的重组,程序的执行时间比基于传统体系结构

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

第一部分计算机系统组成及说明

第一部分:计算机系统组成及说明 一、计算机系统组成 一个完整的计算机系统通常是由硬件系统和软件系统两大部分组成的。(一)硬件(hardware) 硬件是指计算机的物理设备,包括主机及其外部设备。具体地说,硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 ①存储器。存储器是计算机用来存放程序和原始数据及运算的中间结果和最后结果的记忆部件。 ②运算器。运算器对二进制数码进行算术或逻辑运算。 ③控制器。控制器是计算机的“神经中枢”。它指挥计算机各部件按照指令功能的要求自动协调地进行所需的各种操作。 ④输入/输出设备(简称I/O设备)。计算机和外界进行联系业务要通过输入输出设备才能实现。输入设备用来接受用户输入的原始数据和程序,并将它们转换成计算机所能识别的形式(二进制)存放到内存中。输出设备的主要功能是把计算机处理的结果转变为人们能接受的形式,如数字、字母、符号或图形。 (二)软件(software) 软件是指系统中的程序以及开发、使用和维护程序所需要的所有文档的集合。包括计算机本身运行所需的系统软件和用户完成特定任务所需的应用软件(三)硬件和软件的关系

硬件是计算机的基础,软件对硬件起辅助支持作用,二者相辅相成,缺一不可,只有有了软件的支持,硬件才能充分发挥自己的作用。 二、计算机工作原理 (一)冯·诺依曼设计思想 计算机问世50年来,虽然现在的计算机系统从性能指标、运算速度、工作方式、应用领域和价格等方面与当时的计算机有很大的差别,但基本体系结构没有变,都属于冯·诺依曼计算机。 冯·诺依曼设计思想可以简要地概括为以下三点: ①计算机应包括运算器、存储器、控制器、输入和输出设备五大基本部件。 ②计算机内部应采用二进制来表示指令和数据。每条指令一般具有一个操作码和一个地址码。其中,操作码表示运算性质,地址码指出操作数在存储器的位置。 ③将编好的程序和原始数据送入内存储器中,然后启动计算机工作,计算机应在不需操作人员干预的情况下,自动逐条取出指令和执行任务。 冯·诺依曼设计思想最重要之处在于他明确地提出了“程序存储”的概念。他的全部设计思想,实际上是对“程序存储”要领的具体化。

计算机系统结构复习(个人总结)

第一章: 计算机系统的层次结构:(按照计算机语言从低级到高级) 微程序机器,传统机器语言机器,操作系统机器,汇编语言机器,高级语言机器和应用语言机器。 计算机系统结构: 传统机器程序员所看到的计算机属性,即概念属性和功能特性。 计算机组成: 计算机系统结构的逻辑实现,包括物理机器级中的数据流和控制流的组成和逻辑设计等。计算机实现: 计算机组成的物理实现,包括处理机,主存等物理结构及整机装配技术。(器件技术和微组装技术) 透明性: 在计算机技术中,把这种本来存在的事物和属性,但从某种角度看又好像不存在的概念称为透明性。 Flynn分类法是依旧:指令流和数据流的多倍性进行分类的。 冯氏分类发:是按照计算机系统的最大并行度来分类的。 计算机系统设计的定量原则: 1,以经常性事件为重点:在计算机系统中对于经常发生的事件,赋予它优先的处理权和系统使用权。 2,Amdahl定律:加快某部件的执行速度所获得的系统性能的加速比。S n=1 1?F e+F e e (注: Fe=可改进时间比例,Se=性能提高倍数) 3,CPU性能公式:执行一个程序所需要的CPU时间=IC*CPI*时钟周期时间(CPI指令平均时 钟周期=执行程序所需要的时钟周期数/所执行的指令数)CPI=(CPI i?IC i IC ) n i=1 4,程序的局部属性:程序执行时,所访问的存储器地址不是随机分布的,而是相对簇聚的。 包括时间局部性和空间局部性。 计算机系统设计者的主要任务: 1,确定用户对计算机系统的功能,价格和性能的要求。 2,软硬件功能的分配。 3,设计出生命周期长的系统结构。 软件兼容: 一台计算机上的程序不加修改或只需要少量的修改就可以由一台计算机一直到另一台计算机上运行,差别只是执行时间的不同 从中间开始设计:

计算机体系结构名词解释总汇

集中式共享存储器结构(centralized shared memory architecture):这类多处理机在目前至多有几十个处理器,可通过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。 物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址,每个处理器可以访问任何一个其他的局部存储器。这类机器的结构被称为分布式共享存储器(DSM,distributed shared memory)或可缩放共享存储器(SSM,scalable shared memory)体系结构。 整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。在这种机器的不同处理器中,相同的物理地址指向不同存储器的不同单元,每一个处理器、存储器模块实际上是一个单独的计算机,因而这种机器也称为多计算机(multicomputers)。 通讯延迟:发送开销+跨越时间+传输延迟+接收开销。 迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用,从而可降低对远程共享数据的访问延迟。 复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用,复制不仅降低了访存的延迟,也减少了访问共享数据时的产生的冲突。 目录(directory):物理存储器中用来保存共享数据块的状态及相关信息的数据结构。 监听(snooping):每个cache除了包含物理存储器中块的数据拷贝外,也保存着各个块的共享状态信息。Cache通常连在共享存储器的总线上,各个cache控制器通过监听总线来判断它们是否有总线请求的数据块。 在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权,对应这种方法的协议称为写作废(write invalidate)协议。cache块拥有唯一的拷贝的处理器通常称为这个cache 块的拥有者(ower)。处理器的写操作使其成为对应cache块的拥有者。 原子性(atomic),即操作运行过程中不能被打断,例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。基于目录的相关性协议称为全映射(full map)。 原子交换(atomic change):将一个存储单元的值和一个寄存器的值进行交换。建立一个锁,锁值为0表示开锁,为1表示上锁。 旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。 栅栏(barrier)同步:是一个同步操作,它强制所有到达该栅栏的进程进行等待,直到全部的进程到达栅栏,然后释放全部的进程,从而形成同步。 组合树是多个请求在局部结合起来形成树的一种分级结构,它降低冲突的原因是将大冲突化解成为并行的多个小冲突。排队记录等待的进程,当锁释放时送出一个已确定的等待进程,这种机制称为排队锁(queuing lock)。一个处理器对变量的写和另一个处理器对该变量的访问(读或写)由一对同步操作分开,其中一个在写操作后执行,另一个在别的处理机访问之前执行,则称数据访问有序。 无同步操作排序变量可能提前被刷新,这种情况称为数据竞争(data race),从而对于同步的程序可称之为无数据竞争(data-race-free)。 称与解锁相对应的同步操作为释放(release)与加锁相对应的则称为获取(acquire)。防护(fence)是计算过程中的固定点,用来保证无读或写穿过防护点。预取能返回最新数据值,并且保证对数据实际的存储器访问返回的是最新的数据项,则被称为非绑定的(nonbinding)。 互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络,这些结点可能是处理器、存储模块或其它设备,它们通过互连网络进行信息交换。静态网络由点和点直接相连而成,这种连接方式在程序执行过程中不会改变。 动态网络是用开关通道实现的,它可动态地改变结构,使其与用户程序中通信要求匹配。

《计算机系统结构》课程教学大纲

《计算机系统结构》课程教学大纲 一、课程基本信息 课程代码: 课程名称:计算机系统结构 英文名称:Computer Architecture 课程类别: 专业课 学时:72(其中实验18学时) 学分: 3.5 适用对象: 计算机科学与技术、网络工程专业 考核方式:考试(其中平时成绩占30%,期末考试成绩占70%) 先修课程:计算机组成原理、操作系统 二、课程简介 本课程是计算机专业一门重要的专业基础课,对于培养学生的抽象思维能力和自顶向下、系统地分析和解决问题的能力有非常重要的作用。其目标是使学生掌握计算机系统结构的基本概念、基本原理、基本结构、基本设计和分析方法,并对计算机系统结构的发展历史和现状有所了解。通过学习本课程,能把在“计算机组成原理”等课程中所学的软、硬件知识有机地结合起来,从而建立起计算机系统的完整概念。 This course is a computer professional important foundation for the professional class, for training students in abstract thinking, and top-down, System analysis and the ability to solve problems is a very important role. The goal is to enable students to master computer system structure the basic concepts, basic principles and basic structure, basic design and analysis methods and computer system architecture and the history of the development of an understanding of the status quo. Through the study of this course, can in "Principles of Computer Organization", y the school curriculum of the software and hardware knowledge combined organic, Computer systems in order to establish the integrity of the concept. 三、课程性质与教学目的 《计算机系统结构》的教学对象为计算机相关专业的高年级本科生专业技术基础课程,目的是介绍计算机体系结构的概念、技术和最新动态,着重介绍软,硬件功能分配以及如何最佳、最合理地实现软、硬件功能分配。要求了解基本概念、基本原理、基本结构和基本分析方法。使学生对计算机系统结构、组成和实现有一个整体掌握。 四、教学内容及要求 第一单元计算机系统结构的基本概念

计算机系统结构知识点复习考点归纳总结

0.从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构 1、从计算机系统执行程序的角度看,并行性等级由低到高分为(指令内部)、(指令之间)、(任务或进程之间)和(作业或程序之间)四级。 2、从计算机系统中处理数据的并行性看,并行性等级从低到高分为(位串字串)、(位并字串)、(位串字并)和(全并行)。 3、存储器操作并行的典型例子是(并行存储器系统和相联处理机),处理机操作步骤并行的典型例子是(流水线处理机),处理机操作并行的典型例子是(阵列处理机),指令、任务、作业并行的典型例子是(多处理机)。 4、开发并行的途径有(时间重叠),资源重复和资源共享。 5、计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是(微程序机器级,传统机器语言机器级,汇编语言机器级)。 6、对系统程序员透明的应当是(CACHE存储器、系列机各档不同的数据通路宽度、指令缓冲寄存器) 7、对机器语言程序员透明的是(主存地址寄存器) 8、计算机系统结构包括(机器工作状态、信息保护、数据表示) 9、对汇编语言程序员透明的是(I/O方式中的DMA访问) 10、属计算机系统结构考虑的是(主存容量和编址方式) 11、从计算机系统结构上讲,机器语言程序员所看到的机器属性是(编程要用到的硬件组织) 12、计算机组成设计考虑(专用部件设置、控制机构的组成、缓冲技术) 13、在多用户机器上,应用程序员能使用的指令是(“执行”指令、“访管”指令、“测试与置定”指令) 14、软硬件功能是等效的,提高硬件功能的比例会(提高解题速度、提高硬件成本、减少所需存储器用量) 15、下列说法中正确的是(软件设计费用比软件重复生产费用高、硬件功能只需实现一次,而软件功能可能要多次重复实现、硬件的生产用比软件的生产费用高) 16、在计算机系统设计中,比较好的方法是(从中间开始向上、向下设计)。 17、推出系列机的新机器,不能更改的是(原有指令的寻址方式和操作码)。 18、不同系列的机器之间,实现软件移植的途径包括(用统一的高级语言、模拟、仿真)。 19、在操作系统机器级,一般用(机器语言)程序(解释)作业控制语句。 20、高级语言程序经(编译程序)的(翻译)成汇编语言程序。 21、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。 22、汇编语言程序经(汇编程序)的(解释)成机器语言程序。 23、微指令由(硬件)直接执行。 24、系列机软件必须保证(向后兼容),一般应做到(向上兼容) 25、在计算机系统的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和 数据结构)的集合体 26、优化性能价格比指(在某种价格情况下尽量提高性能)或(在满足性能前提下尽量降低价格)。 27、目前,M0由(硬件)实现,M1用(固件)实现,M2至M5大多用(软件)实现。 28、系列机中(中档机)的性能价格比通常比(低档机、高档机)的要高 29、(计算机组成)着眼于机器级内各事件的排序方式,(计算机体系结构)着眼于对传统机器级界面的确定,(计算机组成)着眼于机器内部各部件的功能,(计算机实现)着眼于微程序设计。 30、计算机系统结构也称(计算机体系结构),指的是(传统机器级)的系统结构。 31、用微程序直接解释另一种机器指令系统的方法称为(仿真),用机器语言解释

相关文档
最新文档