计算机系统结构试题及答案

计算机系统结构试题及答案
计算机系统结构试题及答案

2009-2010学年度第一学期2007级

《计算机系统结构》期末考试试卷(A)(闭卷)

姓名:学号:专业:

(注:①考试时间为120分钟;②所有解答必须写在答题纸上。)

一、单项选择题(每小题3分,共30分)

1.在系列机中发展一种新型号机器,你认为下列()设想是不行的?

【A】新增加字符数据类型和若干条字符处理指令

【B】将中断分级由原来的4级增加到5级

【C】在CPU和主存之间增设Cache存贮器

【D】将浮点数的下溢处理法由原来的恒置“1”法,改为查表舍入法

2.对计算机系统结构来说,不透明的是()。

【A】存储器采用交叉存取还是并行存取

【B】CPU内部的数据通路的宽度是8位还是16位

【C】采用浮点数据表示还是标志符数据表示

【D】指令采用硬联逻辑实现还是微程序实现

3.一个平衡的计算机系统,应该是()。

【A】1MIPS的CPU速度【B】1MB的主存容量

【C】1Mb/s的I/O吞吐率【D】A、B和C

4、()设计是现代计算机系统设计所采用的方法。

【A】由上往下【B】由下往上【C】由中间开始【D】上下同时开始

5.当今微型机中实现软件移植最好的方法是()。

【A】系列机【B】兼容机【C】仿真技术【D】统一高级语言

6、不能够对向量数据结构提供直接支持的是()数据表示。

【A】向量【B】堆栈【C】描述符【D】A和C

7、采用整数边界存储技术,其主要目的是()。

【A】节约主存空间【B】提高数据的访问速度

【C】一个主存周期可取多条指令【D】一个主存周期至少可取到一条指令

8、在指令的操作码编码方式中,优化实用的编码是()。

【A】Huffman编码【B】等长编码【C】Huffman扩展编码【D】BCD码

9、流水计算机中将指令Cache和数据Cache分开,主要是为了()。

【A】提高存储系统的速度【B】增加主存容量

【C】解决功能部件冲突【D】解决访存冲突

10、当N=16时,能描述4组4元交换的函数是()。

【A】C1+C2 【B】C0+C1 【C】C0+C2 【D】C2+C3

假若编译器优化后能去掉50%的ALU指令,但不能去掉其它三类指令。求优化后的MIPS与优化前的MIPS速率比。

三、(10分)设某机器系统指令字长12位,每个操作码和地址均占3位,试提出一种分配方案,使该指令系统有4条三地址指令,8条二地址指令和180条单地址指令。 四、(10分)设通道在数据传送期中,选择设备需4.9μS ,传送一个字节数据需0.l μS 。 (1)其低速设备每隔250μS 发出一个字节数据传送请求,问最多可接多少台这种设备? (2)若有A ~E 共5种高速设备,要求字节传送的间隔时间如下表所示,其时间单位为μS 。

(1)求平均延迟最小的最佳调度方案;

(2)画出按最佳方案之一连续输入3个任务的时空图。 六、(10分)有一四段线性流水线,每功能段延时时间分别是: △t 1=△t 3=△t 4=△t 0, △t 2=3△t 0。若在这个流水线上执行40个任务。求实际吞吐率、效率和加速比。 七、(10分)N=8个结点的三级立方体网络如下图所示。当K 1=0时,试说明输入4号结点不能实现和哪些输出结点相连?

八、(10分)在8个PE 构成的双向环互连的并行处理机中,计算点积 S=

∑=?n

i i

i

b a 1

(n=8)

所需要的时间。设初始化时将A,B 各分量已分配到各PE 中,且设相邻处理单元之间传送一次数据需要时间△t ,完成一次加法需要时间2△t ,完成一次乘法需要时间4△t 。

K 0

K 1

K 2

C 0

C 2

C 1

C 3

0 1 2 3 4

5 6 7

输 入 端 0 1 2

3 4 5 6 7

输 出 端

(全部试题完)

武汉大学计算机学院

2009-2010学年度第二学期2007级

《计算机系统结构》期末考试试卷(A )参考答案

一、(每小题3分,共30分) [解]:1-10:BCDCA BDCDB 二、(10分) [解]:

三、(10分) [解]:

000 ××× ××× ××× 011 ××× ××× ××× 100 000 ××× ××× 100 111 ××× ××× 101 000 000 ××× 101 111 111 ×××

110 000 000 ××× 111 110 011 ××× 四、(10分) [解]:

(1)低速设备应接字节多路通道

所以,n ≤50台,即最多可接50台 (2)根据题意,此通道为选择通道

其中,n ≥1024,应使?select ?i ≤?max ?select ,由此可得出通道工作周期为:T≈0.1014(us) 所以,只有A 、C 、D 、E 可挂在此通道上,B 则不行。 五、(10分) [解]:

(1)状态图略。最佳调度方案为(3)和(1,5) (2)输入3个任务时空图略。

64+116=180

9.01.73.571101066≈==???=new old c old new c old new

CPI CPI R CPI CPI R MIPS MIPS 250

1

1.09.411.max ?≥+=+=n T T f D s byte n n

S T D T select f 9.41.01

1.max ++==

六、(10分) [解]:

七、(10分)

[解]:不能与输出的2、3、6、7结点相连。

八、(10分)

[解]:需要8次乘法,7次加法; 共14△t

计算机系统结构

姓名: 学号:

一、名词解释(每题3分,共15分)

1. Cache 2:1 经验规则 3. 同构型多处理机 5. 堆栈型机器

2. 计算机体系结构 4. 通道处理机

)

(175ns 540355ns 8)43(5384TP MIPS =?=??+++?=t

t t t t TP j ?=??+?=?-+?=12340

339640)140(640%8.481234640≈????=t

t

E 95.1123640≈???=t t

S P

二、填空(每空1分,共20分)

1.设计I/O系统的三个标准是()、()和()。

2.存储器层次结构设计技术的基本依据是程序的()。

3.相联度越高,()失效就越少;()失效不受Cache容量的影响,但()失效却随着容量的增加而减少。

4.在虚拟存储器中,一般采用()地址映象方法和()更新策略。

5.计算机系统中提高并行性的技术途径有()、()和()三种。在高性能单处理机的发展中,起主导作用的是()。

6.在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现()相关,否则就有可能出现()、()和()相关。

7.对向量的处理有()方式、()方式、()方式。

三、简答题(每题6分,共24分)

1.任写出三种Cache的优化技术,并简述其基本思想。

2.在指令集结构设计中,应该考虑哪些主要问题?

3.数据相关有哪几种类型?解决数据相关有哪些主要方法?

4.试以系列机为例,说明计算机体系结构、计算机组成和计算机实现三者之间的关系。

四、计算题

1. 给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?

(1)理想Cache情况下的CPI为2.0,时钟周期为2 ns,平均每条指令访存1.4次。

(2)两者Cache容量均为128 KB,块大小都是32字节。

(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%。

(4)这两种Cache的失效开销都是80 ns。

(5)命中时间为1个时钟周期。

(6)128 KB直接映象Cache的失效率为1.0%,128 KB两路组相联Cache的失效率为0.7%。(15分)

2. 计算机系统字长64位,包含三个选择通道和一个多路通道,每个选择通道上连接了两台磁盘机和三台磁带机,多路通道上连接了了两台行式打印机,两台读卡机、10台终端,假定各设备的传输率如下:磁盘机:600 KBps,磁带机:200 KBps,行打机:6.6 KBps,读卡机:1.2 KBps,终端:1 KBps。计算该计算机系统的最大I/O数据传输率。(6分)

3. 某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。(5分)

4. 动态多功能流水线由6个功能段组成,如下图所示:

其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间为:s1、s3、s4、s6为△t,s2、s5为2△t,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai+Bi)(其中i=1..4,∏为连乘符号)(1)画出其处理过程的时空图。

(2)计算其实际的吞吐率和效率。(15分)

2003~2004学年度第2学期《计算机系统结构》试题A答案

一、填空题:()

1.由软件实现的机器称为虚拟机器;由硬件和微程序(固件)实现的机器称为实际机器。

2.软件和硬件在逻辑上是等效的。

3.由于软、硬件紧密相关,软硬界面常常是模糊不清的。

4.计算机组成设计主要是围绕:1.提高速度,2.提高操作的并行度、重叠流水,3.分散功能,4.设置专用功能部件来进行。

5.具有相同“系统结构”(如指令系统相同)的计算机可以因为速度要求等因素的不同而采用不同的组成。

6.一种“计算机组成”可以采用多种不同的“计算机实现”。

7.“计算机组成”反过来也会影响“系统结构”。

8.计算机系统结构设计的主要任务是:进行软、硬件的功能分配。

9.计算机系统设计,从多级层次结构出发,可以分为:由上往下、由下往上和从中间开始三种不同的设计思路。

10.计算机应用可以归纳为向上升级的四类它们分别是:

(1)数据处理(Data Processing)。

(2)信息处理(Information Processing)。

(3)知识处理(Knowledge Processing)。

(4)智能处理(Intelligence Processing)。

二、简答题:

1 .计算机实现(Computer Implementation)?:是指计算机组成的物理实现,包括:处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。

2 .计算机组成(Computer Organization)?:是指计算机系统结构的逻辑实现,包括:机器级内的数据流和控制流的组成以及逻辑设计等。

3.软件的可移植性?是指软件不用修改或只需经少量加工就能由一台机器搬到另一台机器上运行,即同一软件可以不同的系统环境。

4.向上(下)兼容?:是指按某档机器编制的软件,不加修改就能运行于比它高(低)档的机器上。

5.向前(后)兼容?:指的是,在按某个时期投入市场的该型号机器上编制的软件,不加修改就能运行在它之前(后)投入市场的机器上。

6.兼容机(Compatible Machine)?:具有同一系统结构的计算机称为~。采用兼容机的思想与采用系列机的思想实际上是一致的。

7.模拟(Simulation):用机器语言程序解释实现软件移植的方法称为~。

8.仿真(Emulation):用微程序直接解释另一种机器指令系统的方法称为~。

9.现场片:使用户可根据需要改变器件内部的功能或内容,以适应结构和组成变化的需要。

10.全用户片:完全按用户要求设计的用户片称为全用户片。

三、简述题:

1.算机系统结构研究的是什么?

答:软、硬件之间的功能分配以及对传统机器级界面的确定。

2.计算机组成设计要解决的问题是什么?

答:在所希望能达到的性能和价格比的前提下,怎样最佳、最合理地把各种设备和部件组织成为一台计算机,以实现所确定的系统结构。

3.器件的发展对系统结构的影响?

(1)器件的发展改变了逻辑设计的传统方法。

(2)器件的发展也使系统结构的“下移”速度加快。

(3)器件的发展还促进了算法、语言和软件的发展。

4.什么是并行性?只要在同一时刻或是在同一时间间隔内完成两种或

两种以上性质相同或不同的工作,它们在时间上能相互重叠,都体现了并行性。

5.CISC指令系统的含义?

复杂指令系统计算机,即机器指令系统变得越来越庞杂,这就是所谓的CISC指令系统。

6.什么是页式存贮管理?

页式存贮管理是把主存空间和程序空间都机械地等分成固定大小的页,按页顺序编号。(页面大小随机器而异,一般在512到几KB)。

7.什么是向量流水处理机?

向量流水处理机是将向量数据表示和流水线技术结合在一起,构成向量流水处理机,简称向量流水处理机。

8.什么是相联处理机?

相联处理机是以相联存贮器为核心,配上必要的中央处理部件、指令存贮器、控制器和I/O接口,就构成一台以存贮器操作并行为特点的相联处理机。

四、计算题:

1.设一台模型机有7条指令,其使用频度为:

____________________________________________________ 指令使用频度 | 指令使用频度

I1 0.03 | I4 0.05

I2 0.03 | I5 0.15

I3 0.04 | I6 0.3

| I7 0.4

_____________________________________________________

求出:(1)利用哈夫曼(Huffman)压缩技术,构造哈夫曼树;(2).操作码平均码长和扩展码长。

要求:哈夫曼树节点为

(2) H=2.17

H=2.2

2. 如果设一个系统有四个中断级,个级中断响应次序为1->2->3->4。见中断级屏蔽位表

求当把中断次序改为1->4->3->2时,画出中断级屏蔽位表。

3. 计算流水线实际吞吐率TP 和效率η。设有两个向量C 和D ,各有4个元素,在图中的静态双功能流水线上工作。其中,1->2->3->5组成加法流水线,1->4->5组成乘法流水线。设每个流水线所经过的时间均为Δt ,而且流水线的输出结果可以直接返回到输入或暂存于相应的缓冲寄存器中,其延迟时间和功能切换所需要的时间都可以忽略不计。求:该流水线的实际吞吐率TP 和效率η。 空间 5 4 3 2 1

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 时间Δt

实际吞吐率TP=7/(15Δt)

η=32%

4. 计算多级立方体互连网络。见图N=8多级立方体互连网络,求当输入端级控制信号为S2S1S0=010时,输入端为0 1 2 3 4 5 6 7时,输出端为:23016745 。

输入输出

5. 由表达式:E= a +bx+cx2+dx3,利用减少树高的办法来加速运算,要求(1)画出树形流程图;(2)确定T P、P、S P、E P诸值

b x x x x x

p=3 , T P =4, S P =3/2, E P =1/2

计算机系统结构试题

第一部分选择题

一、单项选择题(每小题1分,共10分)在每小题的四个备答案中有一个正

确的答案,将正确答案的序号写在题干后的括号内)

1.计算机使用的语言是( )

A.专属软件范畴,与计算机体系结构无关

B.分属于计算机系统各个层次

C.属于用以建立一个用户的应用环境

D.属于符号化的机器指令

2.动态数据流机最突出的特点是使( )

A.数据流令牌无标号

B.需要程序记数器来实现

C.令牌带上标号

D.同步由门(Latch)寄存器来实现

3.多处理机上两个程序段之间若有先写后读的数据相关,则( )

A.可以并行执行

B.不可能并行

C.任何情况均可交换串行

D.必须并行执行

4.多处理机的各自独立型操作系统( )

A.要求管理程序不必是可再入的

B.适合于紧耦合多处理机

C.工作负荷较平衡

D.有较高的可靠性

5.输入输出系统硬件的功能对( )是透明的。

A.操作系统程序员

B.应用程序员

C.系统结构设计人员

D.机器语言程序设计员

6.“启动I/O”指令是主要的输入输出指令,是属于( )

A.目态指令

B.管态指令

C.目态、管态都能用的指令

D.编译程序只能用的指令

7.全相联地址映象是指( )

A.任何虚页都可装入主存中任何实页的位置

B.一个虚页只装进固定的主存实页位置

C.组之间是固定的,而组内任何虚页可以装入任何实页位置

D.组间可任意装入,组内是固定装入

8.( )属于MIMD系统结构。

A.各处理单元同时受同一个控制单元的管理

B.各处理单元同时接受同一个控制单元送来的指令

C.松耦合多处理机和多计算机

D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10

号处理机与第( )号处理机相联。

A.11

B.8

C.14

D.2

10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )

A.可获得高的吞吐率和效率

B.流水线的效率和吞吐率恶化

C.出现瓶颈

D.可靠性提高

第二部分非选择题

二、填空题(每空1分,共20分)

11.标志符与每个数据相连,合存于_______,用于描述单个数据的_______。

12.总线仲裁算法有:静态优先级算法、固定时间片算法、_______算法和_______算法。

13.计算机仿真用_______解释,计算机模拟用_______解释。

14.按弗林(Michael J.Flynn)的观点,计算机系统可分为单指令流单数据流、

_______、多指令流单数据流和_______四大类。

15.要实现两条指令在时间上重叠解释,首先需要付出_______,其次,要

处理好指令之间可能存在的_______。

16.与重叠机器一样,流水机器在遇到_______指令,尤其是_______指令时,

效率也会显著下降。

17.超长指令字(VLIW)结构是将_______和_______两者相结合。

18.互连网络的交换方法主要有线路交换、包交换、线路/包交换,SIMD互

连网络多采用_______交换,多处理机常采用_______交换。

19.数据流机采用_______,执行的操作序列取决于输入数据的可用性;归

约机则采用_______,执行的操作序列取决于对数据的要求,对数据的需求又来源于函数式程序设计语言对表达式的归纳。

20.输入输出系统包括输入输出设备、设备_______及与输入输出操作有关的_______件。

三、改错题(每小题2分,共10分)(下列每小题划线部分A、B、C中有一

处错误,请先写出错处,并在括号中写出正确文字)

21.对操作码进行优化编码时,在了解每种指令在程序中出现的概率后,使

用Huffman算

A B

法构造Huffman树,这样获得的Huffman编码是唯一的。( )

C

22.多处理机中,两个程序段之间若同时有先写后读和先读后写2种相关,

以交换数据为目的时,则必须并行执行,读写要完全同步,允许顺序串行和交换串行。( )

A B C

23.计算机仿真适合在两种结构差距大的机器间运用。( )

A B C

24.主存空间数相关是相间隔的两条指令之间出现对主存同一单元要求先

写而后读的关联。

A B

C

( )

25.由于Cache存贮器的地址变换和块替换算法是用软件实现的,因此

Cache存贮器对应用

A

程序员是透明的,而且Cache对处理机和主存间的信息交往也是透明的。

( )

B C

四、简答题(每小题6分,共30分)

26.简述标志符数据表示的主要优点。

27.简述设计RISC结构用了哪些基本技术?

28.设P i和P j程序段都是一条语句,且P i在P j之前执行,试举出P i和P j间

存在3种可能的数据相关。

29.简述控制驱动的控制流方式的特点?

30.模拟与仿真的主要区别和适合场合是什么? 五、应用题(共30分)

31.(12分)假设某模型机共有7条指令,7条指令I 1—I 7使用的频度分别为:

0.35,0.25,0.20,0.10,0.04,0.03,0.03。 (1)利用Huffman 算法,构造Huffman 树,并给出Huffman 编码和平均码长。

(2)给出Huffman 扩展码编码。 32.(10分)多级混洗交换网络是如何组成的?它与间接二进制n 立方体网络有何差异?并画出N=8时的多级混洗交换网络图。

33.(8分)设向量A 和B 各有4个元素在下图所示的静态双功能流水线上计

算向量点积A ·B=

a b i i i =∑1

4

,其中1→2→3→5组成加法流水线,1→4

→5组成乘法流水线。若假定流水线的各段所经过的时间均为△t=2.5,流水线输出可直接送回输入或暂存于相应缓冲寄存器中,其延迟时间

和功能切换所需的时间都可忽略。求出吞吐率和加速比。

计算机系统结构试题参考答案

一、单项选择题(每小题1分,共10分)

1.B

2.C

3.B

4.D

5.B

6.B

7.A

8.C

9.D 10.A 二、填空题(每空1分,共20分) 11.同一存储单元 类型特征 12.动态优先级 先来先服务 13.微程序 机器语言

14.单指令流多数据流 多指令流多数据流 15.空间代价 关联 16.转移 条件转移

17.水平型微码 超标量处理 18.线路 包

19.数据驱动 需求驱动 20.控制器 软硬

三、改错题(每小题2分,共10分) 21.(C 错 改为“不是唯一的”

)

22.(C错改为“不允许顺序串行和交换串行”)

23.(B错改为“差距不大”)

24.(A错改为“相邻”)

25.(A错改为“硬件”)

四、简答题(每小题6分,共30分)

26.(1)简化了指令系统和程序设计;

(2)简化了编译程序;

(3)便于实现一致性校验;

(4)能由硬件自动变换数据类型;

(5)支持数据库系统的实现与数据类型无关的要求;

(6)为软件调试和应用软件开发提供了支持。

27.(1)按RISC一般原则设计;(2)逻辑实现用硬联和微程序结合;(3)

用重叠寄存器窗口(4)指令用流水和延迟转移;(5)优化设计编

译系统。

28.(1)若P i的左部变量在P j的右部变量集内,且P i必须取出P i运算

的结果来作为操作数,则称P i“数据相关”于P i。

(2)若P j的左部变量在P i的右部变量集内,且当P i未取用其变量

的值之前,是不允许被P j所改变,则称P i“数据反相关”于

P j。

(3)若P i的左部变量也是P j的右部变量,且P j存入其算得的值必

须在P i存入之后,则称P j“数据输出相关”于P i。

29.控制驱动的控制流方式的特点是:通过访问共享存储单元让数据

在指令之间传递;指令的执行顺序隐含于控制流中,可以显式

地使用专门的控制操作符来实现并行处理,指令执行顺序受程

度计数器的控制,即受控制令牌所支配。

30.模拟与仿真的主要区别在于解释用的语言。仿真是用微程序解释,

其解释程序存在控制存储器中,而模拟是用机器语言程序解释,

其解释程序存在主存中。模拟灵活,可实现不同系统间的软件移

植,但结构差异太大时,效率、速度会急剧下降。仿真在速度上

损失小,但不灵活,只能在差别不大的系统之间使用,否则效率

也会过低且难以仿真,需与模拟结合才行。

五、应用题(共30分)

31.

指令频度(Pi)操作码使用

Huffman编码

OP长度(Li)利用Huffman

概念的扩展操

作码

OP长度(Li)

I1 0.35 0 1 0 0 2

I2 0.25 1 0 2 0 1 2

I3 0.20 1 1 0 3 1 0 2

I4 0.10 1 1 1 0 0 5 1 1 0 0 4

I5 0.04 1 1 1 0 1 5 1 1 0 1 4

I6 0.03 1 1 1 1 0 5 1 1 1 0 4

I7 0.03 1 1 1 1 1 5 1 1 1 1 4

32.多级混洗交换网络由n级相同的网络组成,每一级都包含一个全混拓扑

和随后一列2n-1个四功能交换单元,采用单元控制方式。多级混洗交换网

络与间接二进制n方体网络只有两点差别:前者数据流向的级号顺序

n-1,n-2,…,1,0,用四功能交换单元,后者数据流向相反,其级号顺序

0,1,…,n-1,用二功能交换单元。

33.实际吞吐率为=

7

15

7

1525

187%

?t

=

?

=

.

.

因顺序方式所需时间为4?+?=

33424

???

t t t,

因此加速比S P=24??

t t

/15=1.6

1.(30分)解释下列术语

(1)冯·诺依曼结构:冯·诺依曼等人于1946年提出了一个完整的现代计算机雏型,它由运算器、控制器、存储器和输入输出设备组成,这种结构称为冯·诺依曼结构。

(2)数据表示:数据表示研究的是计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型。数据表示是数据类型中最常用,也是相对比较简单,用硬件实现相对比较容易的几种。如定点数(整数)、逻辑数(布尔数)、浮点数(实数)、十进制数、字符、字符串、堆栈和向量等。

(3)CISC:复杂指令系统计算机

(4)存储系统:两个或两个以上速度、容量和价格各不相同的存储器用硬件、软件、或软件与硬件相结合的方法连接起来成为一个系统,这就是存储系统。

(5) 时空图:描述流水线的工作,最常用的方法是采用“时空图”。在时空图中,横坐标表示时间,也就是输入到流水线中的各个任务在流水线中所经过的时间。当流水线中的各个功能部件的执行时间都相等时,横坐标被分割成相等长度的时间段。纵坐标表示空间,即流水线的各个子过程。在时空图中,流水线的一个子过程通常称为“功能段”。

(6)多功能流水线:多功能流水线(Multifunction Pipelining)是指流水线的各段可以进行不同的连接。在不同时间内,或在同一时间内,通过不同的连接方式实现不同的功能。

(7)加速比:完成一批任务,不使用流水线所用的时间与使用流水线所用的时间之比称为流水线的加速比(Speedup ratio)。

(8)链接技术:链接是当从一个流水线部件得到的结果直接送入另一个功能流水线的操作数寄存器时所发生的连接过程。换句话说,中间结果不必送回存储器,而且甚至在向量操作完成以前就使用。链接允许当第一个结果一变成可用的操作数时就马上发出相继的操作。

(9)存储转发寻径:存储转发寻径(store and forward) 在存储转发网络中包是信息流的基本单位。每个结点有一个包缓冲区。包从源结点经过一系列中间结点到达目的结点。

(10)虫蚀寻径(wormhole) :新型的多计算机系统很多采用的是虫蚀寻径方式,把包进一步分成更小的片。与结点相连的硬件寻径器中有片缓冲区。消息从源结点传送到目的结点要经过一系列寻径器。

2.(20分,每空一分)填空

(1) 衡量流水线性能通常有三种主要指标,它们是吞吐率、加速比和效率。

(2) 按照Flynn分类法,根据指令流和数据流的不同组织方式,计算机系统的结构可以分为SISD(单指令流单数据流)、__ SIMD MISD MIMD或

者单指令流多数据流多指令流单数据流多指令流多数据流___。

(3) 三种向量处理方式指___横向处理方式__、_纵向处理方式____和___纵横处理方式__。

(4) 在CISC中,各种指令的使用频度相差悬殊,大致有以下的结果。大约有__20%___(比例)的指令使用频度较高,占据了__80%___(比例)的处理机时间。

(5) 从不同的角度,我们可以把流水线分成不同的类别。如果根据流水线各功能段是否有反馈信号来划分,可以分为线性流水线和非线性流水线;多功能流水线可以分为两种,即根据它在同一时间内是否能连成多种方式,可以分为静态流水线和动态流水线____。

(6) 消息寻径方式包括两种,即线路交换和包交换。其中包交换又包括存储转发寻径、虚拟直通寻径和虫蚀寻径等方式。

(7) RISC思想的精华是_减少指令平均执行周期数_____。我们通常用__时空图___来描述流水线的工作过程。

3 (25分) 在一个Cache存储系统中,主存储器的访问周期、存储容量和单位价格分别为60ns、64MB和10元/MB,Cache的访问周期、存储容量和单位价格分别为10ns、512KB和100元/MB,Cache的命中率为0.98。

(1)(15分)计算这个Cache存储系统的等效访问周期、存储容量和单位价格。

(2)(10分)计算这个Cache存储系统的访问效率。

解:(1)这个Cache存储系统的等效访问周期:

T=Tc H +Tm(1-H)=10ns×0.98 +60ns×(1-0.98)=11ns 等效存储容量:S=64MB

等效单位价格:C=(Cc Sc +Cm Sm)/(Sc +Sm)

=(100×0.5+10×64)/(0.5+64)=10.7(元/MB)

(2)这个Cache存储系统的访问效率:

e=Tc/T=10/11=0.91

4.(25分).一条浮点加法流水线由对阶、尾数加和规格化三个流水段组成,每个流水段的时间均为2ns。流水线的输出端有直接数据通路与输入端相连,并且设置有缓冲寄存器用以保存中间运算结果。用这条流水线计算8个浮点数的和:S=A1+A2+A3+A4+A5+A6+A7+A8。画出流水线的时空图,并计算流水线的吞吐率、加速比和效率。

解:S=A1+A2+A3+A4+A5+A6+A7+A8

=[(A1+A2)+(A3+A4)]+[(A5+A6)+(A7+A8)]

1 2 3 4 5 6 7 8 9 10 11 12

规格化1 2 3 4 5 6 7

尾数加1 2 3 4 5 6 7

对阶1 2 3 4 5 6 7

加数A1 A3 A5 A7 A1+A2 A5+A6 A1+A2+A3+A4 加数A2 A4 A6 A8 A3+A4 A7+A8 A5+A6+A7+A8 流水线的吞吐率为:

流水线的加速比为:

流水线的效率为:

计算机系统结构模拟试题(5)

计算机组成原理模拟试题(2) 一、填空题:04分,每题02分 1、X=-0.1001 [X]原=_____________ [X]补=_____________[-X]补=_____________ Y=0.0101 [Y]原=_____________ [Y]补=_____________ [-Y]补=_____________ [X+Y]补=_____________ 2、对西文输出的字符设备,在计算机的内存储器中存储的是字符数据的每个字符的_____________码,输出(包括显示或打印)的则是每个字符的_____________,设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。 二、单选题:20分,每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位,采用原码定点整数表示,符号位为1位,数值位为31位,则可表示的最大正整数为,最小负整数为。 A: B: C: D: 5、在定点二进制运算器中,减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少,不得不舍弃最低有效位 7、无论如何划分计算机的功能部件,控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 B: 地址线为32根,数据线为16根

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案 填空题 1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。 2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。 3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。 4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。 5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。 6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。 7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。 8、微指令由(硬件)直接执行。 9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。 10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。以(软件)为主实现的机器成为虚拟机。(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。 11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。 12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。 13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成逻辑设计等。计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。 14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。 15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。 16、设计何种系列机属于(计算机系统结构),系列机内不同型号计算机的组织属于(计算机组成)。 17、是否采用通道方式输入输出的确定属于(计算机系统结构),通道采用结合型还是独立型属于(计算机组成)。 18、对PDP-11或VAX-11来说,单总线结构属于(计算机系统结构),其机器级的I/O连接和使用方式属于(计算机组成)。 19、由于计算机组成和计算机实现关系密切,有人称它们为(计算机实现),即计算机系统的(逻辑实现)和(物理实现)。 20、计算机系统结构可有(由上而下)、(由下而上)和(由中间开始)三种不同的设计思路。 21、“由中间开始”设计的“中间”是指(层次结构中的软硬交界面),目前多数是在(传统机器级)与(操作系统级)之间。 22、除了分布处理,MPP和机群系统外,并行处理计算机按其基本结构特征可分为(流水线计算机)、(阵列处理机)、(多处理机)、(数据流计算机)四种不同的结构。 23、费林按指令流和数据流的多倍性把计算机系统分类,这里的多倍性指(系统瓶颈部件上

计算机系统结构模拟试题5

计算机组成原理模拟试题(2)一、填空题:04分,每题02分 =_____________ [X]补=_____________补-X][1、 X=-0.1001 [X]原 =_____________ =_____________ =_____________ [-Y]补Y]原=_____________ []补 Y=0.0101 [Y ]补=_____________ [X+Y对西文输出的字符设备,在计算机的内存储器中存储的是 字符数据的每个字符的、 2,设备中的字符_____________(包括显示或打印)的则是每个字 符的码,输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分,每题02 。3、 32 x 32点阵汉 字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位,则可表示位,数值位为314、某机字长32位,采 用原码定点整数表示,符号位为1 。,最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中,减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少,不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件,控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 根16根,数据线为32地址线为B: C: 地址线为15根,数据线为16根 D: 地址线为15根,数据线为32根 9、在统一编址方式下,存储单元和I/O设备是靠指令中的来区分的。

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题 课程代码:02325 一、单项选择题(本大题共10小题,每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1.在计算机系统结构设计中,提高软件功能实现的比例可( ) A.提高解题速度B.减少需要的存储器容量 C.提高系统的灵活性D.提高系统的性能价格比 2.浮点数表示的尾数的基r m=16,尾数长度p=8,可表示的规格化最大正尾数的值是( ) A.1/256 B.1/2 C.15/16 D.255/256 3.下列数据存储空间为隐含寻址方式的是( ) A.CPU中的通用寄存器B.主存储器 C.I/O接口中的寄存器D.堆栈 4.当计算机系统执行通道程序完成输入输出工作时,执行通道程序的是( ) A.CPU B.通道 C.CPU和通道D.指定的外设 5.下列有关中断的叙述正确的是( ) A.中断响应的次序是由硬件决定的B.中断处理的次序是由硬件决定的 C.中断处理的次序是不可改的D.中断响应的次序是可灵活改变的 6.与虚拟存储器的等效访问速度无关 ..的是( ) A.访存页地址流B.页面替换算法 C.主存的容量D.辅存的容量 7.非线性流水线的特征是( ) A.一次运算中使用流水线中的多个功能段 B.一次运算中多次使用流水线中的某些功能段 C.流水线中某些功能段在各次运算中的作用不同 D.流水线的各功能段在不同的运算中可以有不同的连接 8.属于集中式共享存储器结构的SIMD计算机是( ) A.ILLIAC IV B.BSP C.CM-2 D.MP-1 1

计算机系统结构模拟题

《计算机系统结构》模拟题 一.判断是非题,对的打√,错的打× 1.系列机是指由一个厂家生产的具有相同组成,但具有不同系统结构和实现的一系列不同型号的机器。 ( × ) 2.Cray 1向量处理机中,由于每个向量寄存器的长度为64,当实际需要处理的向量长度大于64时,它就不能够处理了。 ( × ) 3.按照Flynn 分类法,Illiac IV 阵列处理机是MIMD 计算机。 ( × ) 4.多级混洗交换网络是阻塞网络。 ( √ ) 二.填空题 1.多机系统的互连网络的通信模式可分为4种,其中,一对一的通信模式称为____单播_____模式,一对全体的通信模式为_____广播____模式,多对多的通信模式为____会议_____模式。 2.SIMD 计算机和流水线向量处理机都可以执行向量指令,前者采用___资源重复______并行性,后者采用___时间重叠______并行性。 3.系列机软件兼容必须做到___向后_____兼容,力争做到___向上_____兼容。 4.流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段(可交换次序)_____2种方法。 5.设通道数据传送过程中,选择一次设备的时间为 s T ,传送一个字节的时间为D T ,则字 节多路通道最大流量等于____ D s T T 1 _____。 6.Illiac IV 8×8阵列中,网络直径为____7_____。 7.对堆栈型替换算法,增大分配给程序的___主存页面______,对第一级存储器的命中率就会单调____上升_____。 8.从网络的任何结点看,若网络拓扑结构都是相同的,则称这样的网络是___对称______网络。 三.单项选择题 1.在计算机系统层次结构中,从下层到上层,各层相对顺序正确的是( B )。 A.汇编语言机器级-操作系统机器级-高级语言机器级 B.微程序机器级-传统机器语言机器级-汇编语言机器级 C.传统机器语言机器级-高级语言机器级-汇编语言机器级 D.汇编语言机器级-应用语言机器级-高级语言机器级 2.Illiac IV 阵列处理机中,PE 之间所用的互连函数是( A )。

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机系统结构模拟题

《计算机系统结构》模拟题(补)一.单项选择题 1. SIMD是指()。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到()。 A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 3. 下列()存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由()。 A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的,而组任何虚页可以装入任何实页位置 D.组间可任意装入,组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11.流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12.指令优化编码方法,就编码的效率来讲,方法最好是()。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13.RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14.相联存储器的访问方式是( )。 A.先进先出顺序访问B.按地址访问 C.无地址访问D.按容访问 15.存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( )。 A.多级存储体系结构B.并行存储器 C. Cache D.缓冲技术 16.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17.对系统程序员不透明的是()。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18.在计算机系统设计中,比较好的方法是()。

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的容都是其下一层(离CPU更远的一层)存储器中容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务 3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机体系结构实验报告二

实验二结构相关 一、实验目的: 通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。 二、实验内容: 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行 周期数的百分比。 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程 打开软件,load structure_d.s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(R-stall 数据相关Stall- 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面的数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关的部件:译码部件。 2)第二个结构相关:ADDI R2, R2, #8,与第一个结构相关类似。由于数据相关, 上一条指令暂停在ID阶段,所以导致下一条指令发生结构相关。

相关文档
最新文档