超标量流水线

超标量流水线
超标量流水线

PPT第二张

超标量流水线思想:多条流水线并行工作,提高指令级并行度。

超标量流水线由12个功能段组成:以RISC指令缓冲池(再定序缓冲器)为核心实现。

PPT第三张

IFU1 取指单元段1

每次从L1 I-Cache取一32字节的行装入预取流式缓冲器。

IFU2 取指单元段2

每次从预取流式缓冲器取16字节块;

在16字节中标志指令边界(预译码);

若发现转移指令,指令地址交BTB进行动态预测(针对命中的转移指令,不命中时的预测留给静态转移预测完成)。

IFU3取指单元段3

每次旋转送来的16字节中3条指令,按一定次序(复杂/简单、简单、简单)同时递交给DEC1。

取指段特征:各段不按时钟动作,而是需要时产生动作;指令按序流动。

DEC1 译码段1

每次3个译码器同时可将3条IA指令译码成最多6个RISC的微操作(μop);微操作翻造由MIS实现。

DEC2 译码段2

每次最多接收6个μop,并按原始程序顺序排成队列;

若μop为转移型且BTB未命中(BTB未处理),则交静态转移预测机构(替换/生成BTB 项、预测转移方向)。

静态预测转移规则:

对转移地址非相对PC方式,属返回/调用指令的预测转移,否则不转移;

对转移地址是相对PC,地址增加的预测不转移,否则转移。

RAT 寄存器重命名和分配段(按序发射)

每时钟取3个μop,检查是否使用IA寄存器,若有则转为内部寄存器(ROB项的值域段,又称别名寄存器),然后将3个μop送ROB。

此段消除了绝大多数RAW、W AW、W AR数据相关。

ROB再定序缓冲器段

ROB(有40个项的环形缓冲器)接收μop;

负责管理每项的各种标志位(如是否已到保存站等)。

译码段特征:CISC→RISC,指令按序流动,

需要时动作→按时钟发射。

DIS派遣段(保存站RS实现)

RS能以任意顺序从ROB拷贝μop到相应端口;

RS从端口调度到ALU的原则是操作数已就绪(已排除RAW相关)且执行单元可用(指令执行完时);

对MEM的读、写的动态MEM地址判别在DIS段实现。

EX 执行段(各功能部件实现)

执行μop,结果经CDB返回ROB;

MEM写将产生两个μop,写地址μop即建立SDB项;

若μop是转移指令,则结果同时返回BTB(更新/猜错)和ROB。

WB 写回段

μop执行结果写回或L1 D-Cache数据读入ROB,并进行错误检查和修正,同时将结果或数据送到RS。

执行段特征:乱序流动、并行执行,EX部件可不同时长。

RR 回收就绪段(确认段)

每时钟回收3个μop;

按程序顺序以IA指令为单位,对μop进行确认,可消除W AW、W AR相关;

对分支和异常的确认处理可能需清除部分或全部ROB。

RET 回收段

按程序顺序以IA指令为单位,将回收就绪的IA指令对应结果写回IA寄存器及设置EFLAGS标志;通知MOB将相应结果写入L1的D-Cache,ROB中清除IA指令对应的μop。

回收段特征:RISC→CISC,按序回收。

PPT第四张

软硬件实现:

超标量机要求相同操作的指令能够相对均匀地分布在程序中,避免发生资源冲突,硬件方面通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。主要是以避免、消除相关为主

PPT第五张

优点:与一般的流水机器相比,超标量处理器的特点主要表现在:

(1)配置有多个性能不同的处理部件,采用多条流水线并行处理。

(2)能同时对若干条指令进行译码,将可并行执行的指令送往不同的执行部件,从而达到在每个时钟周期启动多条指令的目的。

(3)在程序运行期间由硬件(通常是状态记录部件和调度部件)完成指令调度。

PPT第六张

缺点:相应的硬件较为复杂

相同操作的指令序列连续出现时,会发生资源冲突

指令级并行性自身存在很大限制

PPT第七张

第一个超标量的设计是在1965年Seymour Cray开发的CDC 6600。1988 年的Intel i960CA 与1990 的AMD 29050处理器是第一个量产的单晶粒超标量处理器。这些RISC系统的CPU 使用超标量架构,是由于当时RISC的设计的核心较简单,能够直接发送指令与调度多种功能性的单位(像是ALU)。这也是在八、九十年代RISC处理器比CISC处理器的运算速度更快的主要原因。

除了那些低功率CPU、嵌入式CPU、以及使用电池电源的CPU,1998年以后开发的CPU设计都已经是超标量体系结构。第一种采用了超标量技术的X86处理器是Pentium。第一批采用了把CISC指令异步解码为微指令序列技术的处理器是Nx586, P6体系结构的Pentium Pro 以及AMD K5。这使得被缓存的微指令可以动态调度(dynamic scheduling)执行,使得P6架构的并行性更优于P5架构的Pentium; 这也使得预测执行(speculative execution)更易实现,CPU的时钟频率也可以更高。

工业循环冷却水系统设计规范标准

《》 条文说明 1总则目录 1.01为了控制工业循环冷却水系统由水质引起的结垢、污垢和腐蚀,保证设备的换热效率和使用年限,并使工业循环冷却水处理设计达到技术先进、经济合理,制定本规。 1.02本规适用于新建、扩建、改建工程中间接换热的工业循环冷却水处理设计。 1.03工业循环冷却水处理设计应符合安全生产、保护环境、节约能源和节约用水的要求,并便于施工、维修和操作管理。 1 总则全文 1.0.1本条阐明了编制本规的目的以及为了达到这一目的而执行的技术经济原则。 在工业生产中,影响水冷设备的换热器效率和使用寿命的因素来自两个方面,一是工艺物料引起的沉积和腐蚀;二是循环冷却水引起的沉积和腐蚀。后者是本规所要解决的问题。 因循环冷却水未加处理而造成的危害是很严重的,例如,某化工厂,原来循环水的补充水是未经过处理的深井水,每小时的循环量9560t。由于井水硬度大、碱度高,每运行50h后,有50%的碳酸盐在设备、管道沉积下来,严重影响换热器效率。据统计,空分透平压缩机冷却器,在运转3个月后,结垢厚度达20㎜。打气减少20%。该厂不少设备、在运转3个月后,必须停车酸洗一次,不但影响生产,而且浪费人力、物力。为了防止设备管道产生结垢,该厂在循环水中直接加入六偏磷酸钠、EDTMP和T—801水质稳定剂之后,机器连续3年运行正常。虽然每年需要增加药剂费用2万元,但综合评价经济效益还是合算的。又如某石油化工厂,常减压车间设备腐蚀与结垢现象十分严重,Φ57×3.5面碳钢排管平均使16-20个月后,垢厚达15-40㎜。后经投加聚磷酸盐+膦酸盐+聚合物的复合药剂进行处理,对腐蚀、结垢和菌藻的控制取得了良好的效果。每年可节约停车检修费用约60万元,延长生产周期增产的利润约70万元。减少设备更新费用约4.7万元。现将该厂水质处理前后的冷却设备更新情况列表如下: 某厂冷却设备更新情况统计(单位:台)表1 从上述情况可以看出,循环冷却水采取适当的处理方法,能够控制由水质引起的

Intel系列CPU流水线技术的发展与展望

Intel系列CPU流水线技术的发展与展望流水线技术是指在程序执行时多条指令重叠进行操作的一种准并行处理实 现技术。在计算机中,把一个重复的过程分解为若干子过程,每个子过程由专门的功能部件来实现。将多个处理过程在时间上错开,依次通过各功能段,这样,每个子过程就可以与其他子过程并行进行。其中,流水线中的每个子过程及其功能部件称为流水线的级或段,段与段相互连接形成流水线。流水线的段数称为流水线的深度。把流水线技术应用于指令的解释执行过程,就形成了指令流水线。其中可以把指令的执行过程分为取指令、译码、执行、存结果4个子过程。把流水线技术应用于运算的执行过程,就形成了运算操作流水线,也称为部件级流水线。 Inter Pentium 系列中采用的流水线技术 流水线技术早在Intel的X86芯片中均得到了实现。而Pentium系列CPU产品更是一个高级的超标量处理器。奔腾处理器可以在一个时钟周期内完成两条指令,一个流水线完成一条指令。具有MMX技术的奔腾处理器为整型流水线增加了一个额外的处理阶段。在486芯片中,一条指令一般被划分为五个标准的部分,奔腾亦是如此,而在P6中,由于采用了近似于RISC的技术,一条指令被划分成了创纪录的十四个阶段,这极大地提高了流水线的速度。P6系列处理器使用动态执行结构,该结构通过硬件寄存器重命名和分支预测的方法,将乱序执行和推测执行合成在一起。奔腾Ⅲ处理器使用了P6中的动态执行技术,增加了超标量双流水线结构、分支预测技术、通过乱序来优化指令流水线、将指令划分为更细的阶段。而奔腾Ⅳ新增的技术有使用高级动态执行、执行跟踪缓存、快速执行引擎、超长管道处理技术、超线程技术。它基本的指令流水线长度达到了20级,更长的流水线可以使处理器运行在更高的主频下,从而提高处理器的性能,但有可能带来一些指令执行上的延迟。 提高流水线性能的方法及相关技术 从不同的角度和观点,可以把流水线分成多种不同的种类。按照流水线所完成的功能来分,可以分为单功能流水线和多功能流水线。按照同一时间段内各段之间的连接方式来对多功能流水线进一步的分类,可以分成静态流水线和动态流水线。若是按照流水的级别来分类,则可以分成部件级、处理机级和处理机间流水线。若按照流水线中是否有回馈回路来分,又可以分为线性流水线和非线性流水线。按照任务流入和流出的顺序是否相同可以分为顺序流水线和乱序流水线。 衡量一个流水线性能的主要指标有吞吐率、加速比和效率。吞吐率是指在单位时间内流水线所完成的任务数量或者输出的结果数量。完成一批任务,不使用流水线所花的时间与使用流水线所用时间直比即为流水线的加速比。流水线的效

生产流水线的原理与设计

第三节流水生产组织 研究生产过程组织的目的,是为了在空间上和时间上合理地组织生产过程,提高劳动生产率和设备利用率,缩短生产周期,加速资金周转,降低产品成本。采用对象专业化的空间组织形式和平行移动的时间组织方式,是达到此目的的两个重要方法。而流水生产把高度的对象专业化的生产组织和劳动对象的平行移动方式有机地结合 起来,成为一种先进的生产过程组织形式。特别是在大量生产企业和成批生产企业中,流水生产占有十分重要的地位。 2.3.1流水生产的特征、形式和组织条件 一、流水生产的特征 流水生产是指劳动对象按一定的工艺路线和统一的生产速度,连续不断地通过各个工作地,顺序地进行加工并出产产品(零件)的一种生产过程组织形式。典型的流水生产线具有以下特点: 1、工作地专业化程度高,在流水线上固定生产一种或有限几种产品(零件),在每个工作地上固定地完成一道或几道工序。 2、生产具有明显的节奏性,即按照规定的节拍进行生产。 3、流水线上各工序之间的生产能力是平衡的,成比例的,即各道工序的工作地(设备)数同各道工序单件时间的比例相一致。设流水线上各道工序的工作地(设备)数分别为s1,s2,s3,…,s m,各道工序的单件时间分别为t1,t2,t3,…,t m,流水线节拍为r,为使流水线各工序之间保持平衡,必须有: (2.1) 4、工艺过程是封闭的,并且工作地(设备)按工艺顺序排列成链状,劳动对象在工序间作单向移动。 5、劳动对象流水般地在工序之间移动,生产过程具有高度的连续性。 将一定的设备、工具、传送装置和人员按照上述特征组织起来的生产线称为流水线。如果工作地(设备)是按工艺顺序排列,但不满足上述特征的要求,只能称为生产线。 二、流水线分类 1、按生产对象的移动方式 ①固定流水线。即生产对象固定不动,由不同工种的工人(组或队)携带工具按规定的节拍轮流到各个产品上去完成自己所担任的工序。这种生产组织形式适用于装配特别笨重、巨大的产品,以及在造船、建筑、工程施工等部门中采用。 ②移动流水线。即生产对象移动,工人和设备、位置固定,生产对象顺次经过各道工序的工作地进行加工或装配。这种生产组织形式在机械制造、服装等工业部门广泛采用。 2、按生产对象的数目 ①单一对象流水线。即一条流水线只固定生产一种产品。故又称为大量或不变流水线。 ②多对象流水线。即一条流水线上生产两种以上制品,并且按轮换方式不同,又可分为可变流水线、成组流水线和混合流水线。 3、按生产过程的连续程度

体系结构名词解释

1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。 存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能运行于在它之后(前)投入市场的计算机。 兼容机:由不同公司厂家生产的具有相同系统结构的计算机。 模拟:用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(称为虚拟机)的指令系统。 仿真:用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。 并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。 时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。 资源重复:在并行性概念中引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能。 资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。 耦合度:反映多机系统中各计算机之间物理连接的紧密程度和交互作用能力的强弱。 紧密耦合系统:又称直接耦合系统。在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。 松散耦合系统:又称间接耦合系统,一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。计算机之间的相互作用是在文件或数据集一级上进行。 异构型多处理机系统:由多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。 同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时 处理同一作业中能并行执行的多个任务。 2.1 解释下列术语 堆栈型机器:CPU 中存储操作数的单元是 堆栈的机器。 累加器型机器:CPU 中存储操作数的单元 是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的 单元是通用寄存器的机器。 CISC:复杂指令集计算机 RISC:精简指令集计算机 寻址方式:指令系统中如何形成所要访问 的数据的地址。一般来说,寻址方式可以 指明指令中的操作数是一个常数、一个寄 存器操作数或者是一个存储器操作数。 数据表示:硬件结构能够识别、指令系统 可以直接调用的那些数据结构。 3.1解释下列术语 流水线:将一个重复的时序过程,分解成 为若干个子过程,而每一个子过程都可有 效地在其专用功能段上与其它子过程同时 执行。 单功能流水线:指流水线的各段之间的连 接固定不变、只能完成一种固定功能的流 水线。 多功能流水线:指各段可以进行不同的连 接,以实现不同的功能的流水线。 静态流水线:指在同一时间内,多功能流 水线中的各段只能按同一种功能的连接方 式工作的流水线。当流水线要切换到另一 种功能时,必须等前面的任务都流出流水 线之后,才能改变连接。 动态流水线:指在同一时间内,多功能流 水线中的各段可以按照不同的方式连接, 同时执行多种功能的流水线。它允许在某 些段正在实现某种运算时,另一些段却在 实现另一种运算。 部件级流水线:把处理机中的部件进行分 段,再把这些部件分段相互连接而成。它 使得运算操作能够按流水方式进行。这种 流水线也称为运算操作流水线。 处理机级流水线:又称指令流水线。它是 把指令的执行过程按照流水方式进行处 理,即把一条指令的执行过程分解为若干 个子过程,每个子过程在独立的功能部件 中执行。 处理机间流水线:又称为宏流水线。它是 把多个处理机串行连接起来,对同一数据 流进行处理,每个处理机完成整个任务中 的一部分。前一个处理机的输出结果存入 存储器中,作为后一个处理机的输入。 线性流水线:指各段串行连接、没有反馈 回路的流水线。数据通过流水线中的各段 时,每一个段最多只流过一次。 非线性流水线:指各段除了有串行的连接 外,还有反馈回路的流水线。 顺序流水线:流水线输出端任务流出的顺 序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺 序与输入端任务流入的顺序可以不同,允 许后进入流水线的任务先完成。这种流水 线又称为无序流水线、错序流水线、异步 流水线。 吞吐率:在单位时间内流水线所完成的任 务数量或输出结果的数量。 流水线的加速比:使用顺序处理方式处理 一批任务所用的时间与按流水处理方式处 理同一批任务所用的时间之比。 流水线的效率:即流水线设备的利用率, 它是指流水线中的设备实际使用时间与整 个运行时间的比值。 数据相关:考虑两条指令i和j,i在j的前 面,如果下述条件之一成立,则称指令j 与指令i数据相关: (1)指令j使用指令i产生的结果; (2)指令j与指令k数据相关,而指令k 又与指令i数据相关。 名相关:如果两条指令使用了相同的名, 但是它们之间并没有数据流动,则称这两 条指令存在名相关。 控制相关:是指由分支指令引起的相关。 它需要根据分支指令的执行结果来确定后 面该执行哪个分支上的指令。 反相关:考虑两条指令i和j,i在j的前面, 如果指令j所写的名与指令i所读的名相 同,则称指令i和j发生了反相关。 输出相关:考虑两条指令i和j,i在j的前 面,如果指令j和指令i所写的名相同,则 称指令i和j发生了输出相关。 换名技术:名相关的两条指令之间并没有 数据的传送,只是使用了相同的名。可以 把其中一条指令所使用的名换成别的,以 此来消除名相关。 结构冲突:因硬件资源满足不了指令重叠 执行的要求而发生的冲突。 数据冲突:当指令在流水线中重叠执行时, 因需要用到前面指令的执行结果而发生的 冲突。 控制冲突:流水线遇到分支指令或其它会 改变PC值的指令所引起的冲突。 定向:用来解决写后读冲突的。在发生写 后读相关的情况下,在计算结果尚未出来 之前,后面等待使用该结果的指令并不见 得是马上就要用该结果。如果能够将该计 算结果从其产生的地方直接送到其它指令 需要它的地方,那么就可以避免停顿。 写后读冲突:考虑两条指令i和j,且i在 j之前进入流水线,指令j用到指令i的计 算结果,而且在i将结果写入寄存器之前就 去读该寄存器,因而得到的是旧值。 读后写冲突:考虑两条指令i和j,且i在 j之前进入流水线,指令j的目的寄存器和 指令i的源操作数寄存器相同,而且j在i 读取该寄存器之前就先对它进行了写操 作,导致i读到的值是错误的。 写后写冲突:考虑两条指令i和j,且i在 j之前进入流水线,,指令j和指令i的结果 单元(寄存器或存储器单元)相同,而且j 在i写入之前就先对该单元进行了写入操 作,从而导致写入顺序错误。这时在结果 单元中留下的是i写入的值,而不是j写入 的。 链接技术:具有先写后读相关的两条指令, 在不出现功能部件冲突和Vi冲突的情况 下,可以把功能部件链接起来进行流水处 理,以达到加快执行的目的。 分段开采:当向量的长度大于向量寄存器 的长度时,必须把长向量分成长度固定的 段,然后循环分段处理,每一次循环只处 理一个向量段。 半性能向量长度:向量处理机的性能为其 最大性能的一半时所需的向量长度。 向量长度临界值:向量流水方式的处理速 度优于标量串行方式的处理速度时所需的 向量长度的最小值。 4.1解释下列术语指令级并行:简称ILP。 是指指令之间存在的一种并行性,利用它, 计算机可以并行执行两条或两条以上的指 令。 指令调度:通过在编译时让编译器重新组 织指令顺序或通过硬件在执行时调整指令 顺序来消除冲突。 指令的动态调度:是指在保持数据流和异 常行为的情况下,通过硬件对指令执行顺 序进行重新安排,以提高流水线的利用率 且减少停顿现象。是由硬件在程序实际运 行时实施的。 指令的静态调度:是指依靠编译器对代码 进行静态调度,以减少相关和冲突。它不 是在程序执行的过程中、而是在编译期间 进行代码调度和优化的。 保留站:在采用Tomasulo算法的MIPS处 理器浮点部件中,在运算部件的入口设置 的用来保存一条已经流出并等待到本功能 部件执行的指令(相关信息)。 CDB:公共数据总线。 动态分支预测技术:是用硬件动态地进行 分支处理的方法。在程序运行时,根据分 支指令过去的表现来预测其将来的行为。 如果分支行为发生了变化,预测结果也跟 着改变。 BHT:分支历史表。用来记录相关分支指 令最近一次或几次的执行情况是成功还是 失败,并据此进行预测。 分支目标缓冲:是一种动态分支预测技术。 将执行过的成功分支指令的地址以及预测 的分支目标地址记录在一张硬件表中。在 每次取指令的同时,用该指令的地址与表 中所有项目的相应字段进行比较,以便尽 早知道分支是否成功,尽早知道分支目标 地址,达到减少分支开销的目的。 前瞻执行:解决控制相关的方法,它对分 支指令的结果进行猜测,然后按这个猜测 结果继续取指、流出和执行后续的指令。 只是指令执行的结果不是写回到寄存器或 存储器,而是放到一个称为ROB的缓冲器 中。等到相应的指令得到“确认”(即确实 是应该执行的)后,才将结果写入寄存器 或存储器。 ROB:ReOrder Buffer。前瞻执行缓冲器。 超标量:一种多指令流出技术。它在每个 时钟周期流出的指令条数不固定,依代码 的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条 指令。 超长指令字:一种多指令流出技术。VLIW 处理机在每个时钟周期流出的指令条数是 固定的,这些指令构成一条长指令或者一 个指令包,在这个指令包中,指令之间的 并行性是通过指令 显式地表示出来的。 循环展开:是一种增加指令间并行性最简 单和最常用的方法。它将循环展开若干遍 后,通过重命名和指令调度来开发更多的 并行性。 5.1解释下列术语 多级存储层次:采用不同的技术实现的存 储器,处在离CPU不同距离的层次上,各 存储器之间一般满足包容关系,即任何一 层存储器中的内容都是其下一层(离CPU 更远的一层)存储器中内容的子集。目标 是达到离CPU最近的存储器的速度,最远 的存储器的容量。 全相联映象:主存中的任一块可以被放置 到Cache中任意一个地方。 直接映象:主存中的每一块只能被放置到 Cache中唯一的一个地方。 组相联映象:主存中的每一块可以放置到 Cache中唯一的一组中任何一个地方 (Cache分成若干组,每组由若干块构 成)。 替换算法:由于主存中的块比Cache中的 块多,所以当要从主存中调一个块到Cache 中时,会出现该块所映象到的一组(或一 个)Cache块已全部被占用的情况。这时, 需要被迫腾出其中的某一块,以接纳新调 入的块。 LRU:选择最近最少被访问的块作为被替 换的块。实际实现都是选择最久没有被访 问的块作为被替换的块。 写直达法:在执行写操作时,不仅把信息 写入Cache中相应的块,而且也写入下一 级存储器中相应的块。 写回法:只把信息写入Cache中相应块, 该块只有被替换时,才被写回主存。 按写分配法:写失效时,先把所写单元所 在的块调入Cache,然后再进行写入。 不按写分配法:写失效时,直接写入下一 级存储器中,而不把相应的块调入Cache。 命中时间:访问Cache命中时所用的时间。 失效率:CPU访存时,在一级存储器中找 不到所需信息的概率。 失效开销:CPU向二级存储器发出访问请 求到把这个数据调入一级存储器所需的时 间。 强制性失效:当第一次访问一个块时,该 块不在Cache中,需要从下一级存储器中 调入Cache,这就是强制性失效。 容量失效:如果程序在执行时,所需要的 块不能全部调入Cache中,则当某些块被 替换后又 重新被访问,就会产生失效,这种失效就 称作容量失效。 冲突失效:在组相联或直接映象Cache中, 若太多的块映象到同一组(块)中,则会 出现该组中某个块被别的块替换(即使别 的组或块有空闲位置),然后又被重新访问 的情况。 2:1Cache经验规则:大小为N的直接映 象Cache的失效率约等于大小为N /2的两 路组相联Cache的实效率。 相联度:在组相联中,每组Cache中的块 数。 Victim Cache:位于Cache和存储器之间的 又一级Cache,容量小,采用全相联策略。 用于存放由于失效而被丢弃(替换)的那 些块。每当失效发生时,在访问下一级存 储器之前,先检查Victim Cache中是否含 有所需块。 故障性预取:在预取时,若出现虚地址故 障或违反保护权限,就会发生异常。 非故障性预取:在预取时,若出现虚地址 故障或违反保护权限,不发生异常。 非阻塞Cache:Cache在等待预取数据返回 时,还能继续提供指令和数据。 尽早重启动:在请求字没有到达时,CPU 处于等待状态。一旦请求字到达,就立即 发送给CPU,让等待的CPU尽早重启动, 继续执行。 请求字优先:调块时,首先向存储器请求 CPU所要的请求字。请求字一旦到达,就 立即送往CPU,让CPU继续执行,同时从 存储器调入该块的其余部分。 虚拟Cache:地址使用虚地址的Cache。 多体交叉存储器:具有多个存储体,各体 之间按字交叉的存储技术。 存储体冲突:多个请求要访问同一个体。 TLB:一个专用高速存储器,用于存放近 期经常使用的页表项,其内容是页表部分 内容的一个副本。 6.1 解释以下术语 响应时间:从用户键入命令开始,到得到 结果所花的时间。 可靠性:指系统从某个初始参考点开始一 直连续提供服务的能力,它通常用平均无 故障时间来衡量。 可用性:指系统正常工作的时间在连续两 次正常服务间隔时间中所占的比率。 可信性:指服务的质量,即在多大程度上 可以合理地认为服务是可靠的。 通道:专门负责整个计算机系统输入/输出 工作的专用处理机,能执行有限的一组输 入输出指令。 通道流量:指一个通道在数据传送期间, 单位时间内能够传送的数据量。 虚拟DMA:它允许DMA设备直接使用虚 拟地址,并在DMA传送的过程中由硬件 将虚拟地址转换为物理地址。 异步I/O:允许进程在发出I/O请求后继续 执行,直到该进程真正访问这些数据而它 们又尚未就绪时,才被挂起。

冷却水系统设计选用及施工说明

冷却水系统设计选用及施工说明 1空调冷却水系统的定义与分类 1.1空调冷却水系统的定义:吸收空调制冷设备冷凝器排热,并将此热量排入大气,低温水体,低温土壤,传递给显热回收装置,传递给水——水热泵机组或是几种状态兼而有之的循环水系统. 1.2空调冷却水系统分类 1.2.1按照流经空调制冷设备冷凝器的冷却水是否与大气接触分为开式冷却水系统 和闭式冷却水系统. 1.2.2按照空调制冷设备冷凝器排热渠道分为单一型系统(如仅通过冷却塔向大气排热)和耦合型系统(如设有冷却塔的井水抽灌型与埋管型地源热泵系统) 1.2.3按照冷却水低位热能是否利用分为单纯冷却型(冷凝热不利用)和热回收型.1.2,4冬季供冷型,冬季不经空调制冷设备由冷却塔直接制备空调冷水. 2空调冷却水系统设计原则 2.1系统形式的确定 2.1.1除非水质要求严格,冷却水宜采用开式系统. 2.1.2对井水抽灌型地源热泵空调系统.当按设计制热工况负荷确定的水浑流量不能满足设计制冷工况的排热要求时,经技术经济分析可考虑采用耦合式冷却水系统.2.,.3对地埋管地源热泵空调系统,属于下列条件之一时,应采用耦合式冷却水系统:1)当按制热设计工况负荷确定的地埋管换热器热交换能力不能 满足制冷设计工况的排热要求时; 2)空调设备全年向土壤的总排热量大于总取热量25%时. 2.1.4空调制冷设备制冷工况运行时间长,且有集中生活热水需要,可采用热回收空调冷却水系统,常用形式有两种:一种是空调制冷设备设有专门用于热回收的冷凝器,用于自来水预热;一种是设有热泵热水机组的空调冷却水系统. 2.1.5空调系统冬季有供冷需求,当地冬季气象参数能使冷却塔出水温度满足冬季空调系统要求,且持续时间足够长时,宜考虑采用能实现冷却塔冬季直接供冷的冷却水系统形式. 2.2系统的设计要点 2.2.1空调冷却水系统由空调制冷设备水冷式冷凝器,循环水泵、冷却塔,除污器和水处理装置等组成.通常无需设置冷却水箱或水池. 2.2.2提倡实现冷却塔风机的集中控制.以在系统部分负荷运行时,能充分利用冷却塔组的自然冷却能力,减少冷却塔风机的运行时间.降低能耗. 2.2.3通过共用集管连接的冷却塔.其冷却水管道系统的设计应实现各塔间的流量平衡.并使接水盘水位相同。 2,2.4通过共用集管连接的多台空调制冷设备与多合冷却塔组成的冷却水系统的设 计应采取措施,避免系统在“减”合数运行时,冷却水在冷却塔与冷凝器处的‘旁流’:即冷却水流过风机不工作的冷却塔和停止工作的冷机冷凝器. 2.2.5冷却塔的设置位置,应保证: 1)其接水盘的最低水位成为冷却水系统的最高点; 2)额定流量运行时冷却水循环泵进口处不应产生负压;

生产线设计方案

生产线设计方案 一、设计目的。 1.1检测产品生产中的过程数据 根据每个工位的生产特点配置不同的传感器和控制元件,控 制生产设备检测生产过程中的性能数据存入产品数据库 1.2根据产品序列号查询产品数据。 记录方式以数据库表格和曲线为主,记录内容以产品序列号 做为唯一的记录索引,通过查询数据库,对产品进行质量追 述,质量管理人员可以把产品数据具体到生产线上的每道工 序,每个人,从而进行综合的数据分析更好的质量控制,提 高产品的合格率。 1.3在生产中监控生产过程,进行防错处理。防错内容如下: (1)前道工序检测:在操作本工序时根据流水号检测与本工序相关的其他工序的生产数据是否存在,如果存在则启 动设备进行生产操作,否则禁止启动设备,并在工作站 计算机界面进行报警提示。 (2)操作重复性检测: 在操作本工序时根据流水号检测本工位数据是否存,如果不存在则启动设备进行生产操作, 否则禁止启动设备,并在工作站计算机界面进行报警提 示。 (3)产品合格判定:检测本工位的相关数据根据设定的参数,判定合格与不合格,合格则存入产品数据库,进入下道

工序,不合格则存入不良品数据库并且根据流水号删除 前工序的所有检测数据。 1.4零部件批次号管理。 对产品装配过程中的零部件进行实时记录,并且存入产品数据库,根据产品序列号可以查询出每个零部件的批次,从而 更好的进行质量分析和供应商管理。 1.5管理权限设定 (1)根据不同的功能设定不同的操作操作等级:做工级,工艺员级,部门级。 ·操作工级可以输入产品类型参数,班组信息,扫描产 品条码数据,启动设备检测产品。 ·工艺员级可以输入修改产品检测的艺参数,调整产品 检测流程,编辑产品序列号,配置操作工操作属性。 ·部门级可以根据产品序列号查询产品数据,生成数据报表供部门编辑汇总及打印输出,配置工艺员操作属 性。 (2)数据信息权限管理。 ·产品数据信息的查询打印,必须通过部门级领导的授 权。 ·产品序列号信息包含了产品测量的所有数据,因此产 品数据库信息生成后产品数据就不能更改删除。二、实现方法

标准流水线测测试试题

第五章 标量处理机与流水线 1 选择题 ★ 1. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为t ?、t ?2和t ?3,顺序执行n 条指令至少需要花费的时间为: A. t n ?https://www.360docs.net/doc/6317976979.html, B. 生产流水线t n ?2 C. t n ?6装配流水线 D. t n ?苏州流水线 答案:C ★★ 2. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间均为t ?,连续执行n 条指令所需要花费的最短时间约为(假设仅有“取指令”和“执行”可重叠并假设n 足够大): A. t n ?3流水线设备 B. t n ?2上海流水线 C. t n ?2 3 无锡流水线 D. t n ?杭州流水线 答案B ★★

3.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每 一段的执行时间均为t?,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“分析”可重叠并假设n足够大): A. t n? 3 B. t 2 n? 3 C. t n? 2 D. t n? 答案B ★★ 4.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每 一段的执行时间分别为t?、t?2和t?3,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“执行”可重叠并假设n足够大): A. t 6 n? B. t n? 5 C. t 3 n? D. t n? 答案B ★★ 5.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每 一段分别只有一个部件可供使用并且执行时间分别为t?、t?2和t?3,连续执行n条指令所需要花费的最短时间约为(假设“取指令”、“分析”和“执行”可重叠并假设n足够大):

计算机系统结构简答题复习

计算机系统结构简答题复习(1) 1、如果外设要求的通道实际流量十分接近或等于通道具有的最大流量时, 则可能发生局部的数据丢失问题,我们怎样解决(三种方法)? 答: 1. 增大通道最大流量。 2. 动态改变设备优先级。 3. 增加一定数量的缓存器,尤其是优先级比较低的设备 2、解决软件移植最好的办法有哪些? 1.采用系列机 2.采用模拟与仿真 3.采用统一的高级语言 3、证明在浮点数的字长和表数范围一定时,尾数基值rm取2或4具有最高 的表数精度 4、假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段 的时间分别为△t、2△t和3△t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。 (1)顺序执行方式。 (2) "取指令"、"分析"和"执行"重叠。 计算机系统结构简答题复习(2) 5、RISC处理机的关键技术有哪四种? 1. 延时转移技术 2. 指令取消技术 3. 重叠寄存器窗口技术 4. 指令流调整技术 6、多处理机有那些基本特点?发展这种系统的主要目的有哪些?多处理机 着重解决那些技术问题? 1. 结构灵活 2. 程序并行 3. 并行任务派生 4. 进程同步 5. 多处理机工作时,要根据任务的多少来调用资源,因此,所需要的资源变化复杂 目的是:利用多台处理机并发执行一个作业,使得执行速度比单处理机块着重解决的问题 着重解决的技术问题:

1. 硬件结构上多处理机,主存,I/O子系统之间应有高带宽,低价格,灵活无规则互联,尽可能不发生信息传送冲突 2. 从并行语言并行算法编译等,最大限度的开发程序并行性 3. 大的任务如何分成多个子任务 4. 从操作系统上解决并行任务分配,调度和资源分配;任务或进程间的同步,死锁竞争等问题的解决 7、向量的处理方式有哪三种?各有何特点? 1. 横向处理方式。向量计算是按行的方式从左至右横向地进行。 2. 纵向处理方式。向量计算是按列的方式自上而下纵向地进行。 3. 纵横处理方式。横向处理和纵向处理相结合的方式。 8、向量处理机实现链接的条件是什么? 1.没有向量寄存器冲突和运算部件冲突。 2. 只有第一个结果送入向量寄存器的那一个周期可以链接。 3. 先行的两条指令产生运算结果的时间必须相等。 4.两条向量指令的向量长度必须相等。 9、提高向量处理机性能的常用技术有那些? 1.链接技术 2.向量循环或分段开采技术 3. 向量递归技术 4.稀疏矩阵的处理技术 10、列出互连网络中四种寻径方式?并指出它们各自优缺点? 1.线路交换。在传递一个信息前需要频繁的建立从源结点到目地结点的物理通路,开销将会很大。 2.存储转发寻址。包缓冲区大,不利于VLSI的实现;时延大,与结点的距离成正比 3.虚拟直通。没有必要等到整个消息全部缓冲后再做路由选择,只要接收到用作寻址的消息头部即可判断,通信时延与结点数无关;同样不利于VLSI 的实现。 4.虫蚀寻址。每个结点的缓冲区小,易于VLSI实现;较低的网络时延。 计算机系统结构简答题复习(3) 11、采用并行处理机的SIMD 计算机主要特点是什么?▲ 1.速度快,而且潜力大 2.模块性好,生产和维护方便 3.可靠性高,容易实现容错和重构 4.效率低。与流水线处理机,向量处理机等比较。依靠是资源重复,而 不是时间重叠,所以其效率要低一些。 5.潜力大。主要依靠增加PE个数,与流水线处理机主要依靠缩短时钟 相比,其提高速度的潜力要大得多。

流水线设计步骤

1.计算流水线的节拍 流水线、自动化流水线的节拍就是顺序生产两件相同制品之间的时间间隔。 它表明了流水线生产率的高低,是流水线最重要的工作参数。其计算公式如下:r=F/N 其中:r—流水线的节拍(分/件),F—计划期内有效工作时间(分),N—计划期的产品产量(件).这里:F=F0K,F0—计划期内制度工作时间(分),K—时间利用系数。 确定系数K时要考虑这样几个因素:设备修理、调整、更换模具的时间,工人休息的时间。一般K取0.9—0.96,两班工作时间K取0.95,则F为:F=FOK=306×2×8×0.95 ×60=279072(分) 计划期的产品产量N.除应根据生产大纲规定的出产量计算外,还应考虑生产中不可避免的废品和备品的数量。 当生产线、生产线制造上加工的零件小,节拍只有几秒或几十秒时,零件就要采用成批运输,此时顺序生产两批同样制品之间的时间间隔称为节奏,它等于节拍与运输批量的乘积。流水线采取按批运输制品时,如果批量较大,虽然可以简化运输工作,但流水线的在制品占用量却要随之增大。所以对劳动量大、制件重量大、价值高的产品应采用较小的运输批量;反之,则应扩大运输的批量。 进行工序同期化,计算工作地(设备)需要量 流水线的节拍确定以后,要根据节拍来调节工艺过程,使各道工序的时间与流水线的节拍相等或成整数倍比例关系,这个工作称为工序同期化。工序同期化是组织流水线的必要条件,也是提高设备负荷和劳动生产率、缩短生产周期的重要方法。 进行工序同期化的措施有: ①提高设备的生产效率。可以通过改装设备、改变设备型号、同时加工几 个制件来提高生产效率; ②改进工艺装备。采用快速安装卡具、模具,减少装夹零件的辅助时间; ③改进工作地布置与操作方法,减少辅助作业时间; ④提高工人的工作熟练程度和效率; ⑤详细地进行工序的合并与分解。首先将工序分成几部分,然后根据节拍 重新组合工序,以达到同期化的要求,这是装配工序同期化的主要方法。 工序同期化以后,可以根据新确定的工序时间来计算各道工序的设备需要量,它可以用下式计算: m(i)=t(i)/r 式中:mi—第i道工序所需工作地数(设备台数),ti—第i道工序的单件时间定额(分)包括工人在传送带上取放制品的时间。一般来说,计算出的设备数不是整数,所取的设备数为大于计算数的邻近整数。若某设备的负荷较大,就应转移部分工序到其它设备上或增加工作时间来减少设备的负荷。

第八章 大大量生产与流水生产

企业生产管理网上辅导(8-10章) 第八章大批大量生产与流水生产 大批大量生产的基本特征是基于某一品种或很少几个品种,进行大量的重复性生产,适宜采用流水线生产方式。 第一节大量流水生产概述 流水线生产是指加工对象连续不断地像流水似的,按既定的工艺顺序以规定的节拍,通过各道工序的加工。 一、流水生产线具有以下几个特征: 1.流水生产线按对象专业化原则组织,线上的加工对象是固定的,工作地的专业化程度较高,因此流水线一般具有较高的生产率。 2.线上的设备和工艺、装备是针对加工对象的工艺要求配置的,一般能封闭地完成加工对象的全部生产工艺,线上各工序的工作地数量与各该工序单件工时的比值保持一致,即各工序的生产能力符合比例性的要求。 3.流水线的各工作地按工艺过程的顺序排列,前后工序在空间紧密衔接,工件沿流水线作单向流动,运输距离短,生产过程的连续性好。 4.经过周期化工作,线上各道工序具有大体相等的生产率,且使各道工序的加工时间等于或接近于流水线的节拍,或与节拍或整数比。 由于流水生产线具有良好的连续性、比例性、平等性和节奏性,所以流水生产能取得良好的经济效益。 二、流水线的分类 流水生产线,有多种形式,通常按以下标志进行分类: 1.按加工对象的移动方式来分,可分为固定流水线和移动流水线。 2.按流水线生产对象的种数分,有单对象流水线和多对象流水线。 3.按加工对象的轮换方式,有不变流水线、可变流水线和成组流水线等形式。 4.按生产过程的连续程度则有连续流水线和间断流水线之分。 5.按流水线的节奏性来衡量,则有强制节拍流水线、自由节拍流水线和粗略节拍流水线之分。 第二节流水生产线的组织设计 一、组织流水线的必要条件 不是任何情况下流水生产线都能取得良好的经济效益,要使流水线取得良好的经济效益,需要具备一定的条件:

体系结构名词解释

1.1解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。 存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能运行于在它之后(前)投入市场的计算机。 兼容机:由不同公司厂家生产的具有相同系统结构的计算机。 模拟:用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(称为虚拟机)的指令系统。 仿真:用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。 并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。 时间重叠:在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。 资源重复:在并行性概念中引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能。 资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。 耦合度:反映多机系统中各计算机之间物理连接的紧密程度和交互作用能力的强弱。 紧密耦合系统:又称直接耦合系统。在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。 松散耦合系统:又称间接耦合系统,一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。计算机之间的相互作用是在文件或数据集一级上进行。 异构型多处理机系统:由多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重叠原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。 同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时 处理同一作业中能并行执行的多个任务。 2.1解释下列术语 堆栈型机器:CPU中存储操作数的单元是堆 栈的机器。 累加器型机器:CPU中存储操作数的单元是 累加器的机器。 通用寄存器型机器:CPU中存储操作数的单 元是通用寄存器的机器。 CISC:复杂指令集计算机 RISC:精简指令集计算机 寻址方式:指令系统中如何形成所要访问 的数据的地址。一般来说,寻址方式可以 指明指令中的操作数是一个常数、一个寄 存器操作数或者是一个存储器操作数。 数据表示:硬件结构能够识别、指令系统 可以直接调用的那些数据结构。 3.1解释下列术语 流水线:将一个重复的时序过程,分解成 为若干个子过程,而每一个子过程都可有 效地在其专用功能段上与其它子过程同时 执行。 单功能流水线:指流水线的各段之间的连 接固定不变、只能完成一种固定功能的流 水线。 多功能流水线:指各段可以进行不同的连 接,以实现不同的功能的流水线。 静态流水线:指在同一时间内,多功能流 水线中的各段只能按同一种功能的连接方 式工作的流水线。当流水线要切换到另一 种功能时,必须等前面的任务都流出流水 线之后,才能改变连接。 动态流水线:指在同一时间内,多功能流 水线中的各段可以按照不同的方式连接, 同时执行多种功能的流水线。它允许在某 些段正在实现某种运算时,另一些段却在 实现另一种运算。 部件级流水线:把处理机中的部件进行分 段,再把这些部件分段相互连接而成。它 使得运算操作能够按流水方式进行。这种 流水线也称为运算操作流水线。 处理机级流水线:又称指令流水线。它是 把指令的执行过程按照流水方式进行处 理,即把一条指令的执行过程分解为若干 个子过程,每个子过程在独立的功能部件 中执行。 处理机间流水线:又称为宏流水线。它是 把多个处理机串行连接起来,对同一数据 流进行处理,每个处理机完成整个任务中 的一部分。前一个处理机的输出结果存入 存储器中,作为后一个处理机的输入。 线性流水线:指各段串行连接、没有反馈 回路的流水线。数据通过流水线中的各段 时,每一个段最多只流过一次。 非线性流水线:指各段除了有串行的连接 外,还有反馈回路的流水线。 顺序流水线:流水线输出端任务流出的顺 序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺 序与输入端任务流入的顺序可以不同,允 许后进入流水线的任务先完成。这种流水 线又称为无序流水线、错序流水线、异步 流水线。 吞吐率:在单位时间内流水线所完成的任 务数量或输出结果的数量。 流水线的加速比:使用顺序处理方式处理 一批任务所用的时间与按流水处理方式处 理同一批任务所用的时间之比。 流水线的效率:即流水线设备的利用率, 它是指流水线中的设备实际使用时间与整 个运行时间的比值。 数据相关:考虑两条指令i和j,i在j的 前面,如果下述条件之一成立,则称指令j 与指令i数据相关: (1)指令j使用指令i产生的结果; (2)指令j与指令k数据相关,而指令k 又与指令i数据相关。 名相关:如果两条指令使用了相同的名, 但是它们之间并没有数据流动,则称这两 条指令存在名相关。 控制相关:是指由分支指令引起的相关。 它需要根据分支指令的执行结果来确定后 面该执行哪个分支上的指令。 反相关:考虑两条指令i和j,i在j的前 面,如果指令j所写的名与指令i所读的 名相同,则称指令i和j发生了反相关。 输出相关:考虑两条指令i和j,i在j的 前面,如果指令j和指令i所写的名相同, 则称指令i和j发生了输出相关。 换名技术:名相关的两条指令之间并没有 数据的传送,只是使用了相同的名。可以 把其中一条指令所使用的名换成别的,以 此来消除名相关。 结构冲突:因硬件资源满足不了指令重叠 执行的要求而发生的冲突。 数据冲突:当指令在流水线中重叠执行时, 因需要用到前面指令的执行结果而发生的 冲突。 控制冲突:流水线遇到分支指令或其它会 改变PC值的指令所引起的冲突。 定向:用来解决写后读冲突的。在发生写 后读相关的情况下,在计算结果尚未出来 之前,后面等待使用该结果的指令并不见 得是马上就要用该结果。如果能够将该计 算结果从其产生的地方直接送到其它指令 需要它的地方,那么就可以避免停顿。 写后读冲突:考虑两条指令i和j,且i 在j之前进入流水线,指令j用到指令i 的计算结果,而且在i将结果写入寄存器 之前就去读该寄存器,因而得到的是旧值。 读后写冲突:考虑两条指令i和j,且i 在j之前进入流水线,指令j的目的寄存 器和指令i的源操作数寄存器相同,而且j 在i读取该寄存器之前就先对它进行了写 操作,导致i读到的值是错误的。 写后写冲突:考虑两条指令i和j,且i 在j之前进入流水线,,指令j和指令i的 结果单元(寄存器或存储器单元)相同, 而且j在i写入之前就先对该单元进行了 写入操作,从而导致写入顺序错误。这时 在结果单元中留下的是i写入的值,而不 是j写入的。 链接技术:具有先写后读相关的两条指令, 在不出现功能部件冲突和Vi冲突的情况 下,可以把功能部件链接起来进行流水处 理,以达到加快执行的目的。 分段开采:当向量的长度大于向量寄存器 的长度时,必须把长向量分成长度固定的 段,然后循环分段处理,每一次循环只处 理一个向量段。 半性能向量长度:向量处理机的性能为其 最大性能R的一半时所需的向量长度。 向量长度临界值:向量流水方式的处理速 度优于标量串行方式的处理速度时所需的 向量长度的最小值。 4.1解释下列术语指令级并行:简称ILP。 是指指令之间存在的一种并行性,利用它, 计算机可以并行执行两条或两条以上的指 令。 指令调度:通过在编译时让编译器重新组 织指令顺序或通过硬件在执行时调整指令 顺序来消除冲突。 指令的动态调度:是指在保持数据流和异 常行为的情况下,通过硬件对指令执行顺 序进行重新安排,以提高流水线的利用率 且减少停顿现象。是由硬件在程序实际运 行时实施的。 指令的静态调度:是指依靠编译器对代码 进行静态调度,以减少相关和冲突。它不 是在程序执行的过程中、而是在编译期间 进行代码调度和优化的。 保留站:在采用Tomasulo算法的MIPS处 理器浮点部件中,在运算部件的入口设置 的用来保存一条已经流出并等待到本功能 部件执行的指令(相关信息)。 CDB:公共数据总线。 动态分支预测技术:是用硬件动态地进行 分支处理的方法。在程序运行时,根据分 支指令过去的表现来预测其将来的行为。 如果分支行为发生了变化,预测结果也跟 着改变。 BHT:分支历史表。用来记录相关分支指令 最近一次或几次的执行情况是成功还是失 败,并据此进行预测。 分支目标缓冲:是一种动态分支预测技术。 将执行过的成功分支指令的地址以及预测 的分支目标地址记录在一张硬件表中。在 每次取指令的同时,用该指令的地址与表 中所有项目的相应字段进行比较,以便尽 早知道分支是否成功,尽早知道分支目标 地址,达到减少分支开销的目的。 前瞻执行:解决控制相关的方法,它对分 支指令的结果进行猜测,然后按这个猜测 结果继续取指、流出和执行后续的指令。 只是指令执行的结果不是写回到寄存器或 存储器,而是放到一个称为ROB的缓冲器 中。等到相应的指令得到“确认”(即确实 是应该执行的)后,才将结果写入寄存器 或存储器。 ROB:ReOrder Buffer。前瞻执行缓冲器。 超标量:一种多指令流出技术。它在每个 时钟周期流出的指令条数不固定,依代码 的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条 指令。 超长指令字:一种多指令流出技术。VLIW 处理机在每个时钟周期流出的指令条数是 固定的,这些指令构成一条长指令或者一 个指令包,在这个指令包中,指令之间的 并行性是通过指令 显式地表示出来的。 循环展开:是一种增加指令间并行性最简 单和最常用的方法。它将循环展开若干遍 后,通过重命名和指令调度来开发更多的 并行性。 5.1解释下列术语 多级存储层次:采用不同的技术实现的存 储器,处在离CPU不同距离的层次上,各 存储器之间一般满足包容关系,即任何一 层存储器中的内容都是其下一层(离CPU 更远的一层)存储器中内容的子集。目标 是达到离CPU最近的存储器的速度,最远 的存储器的容量。 全相联映象:主存中的任一块可以被放置 到Cache中任意一个地方。 直接映象:主存中的每一块只能被放置到 Cache中唯一的一个地方。 组相联映象:主存中的每一块可以放置到 Cache中唯一的一组中任何一个地方 (Cache分成若干组,每组由若干块构 成)。 替换算法:由于主存中的块比Cache中的 块多,所以当要从主存中调一个块到Cache 中时,会出现该块所映象到的一组(或一 个)Cache块已全部被占用的情况。这时, 需要被迫腾出其中的某一块,以接纳新调 入的块。 LRU:选择最近最少被访问的块作为被替换 的块。实际实现都是选择最久没有被访问 的块作为被替换的块。 写直达法:在执行写操作时,不仅把信息 写入Cache中相应的块,而且也写入下一 级存储器中相应的块。 写回法:只把信息写入Cache中相应块, 该块只有被替换时,才被写回主存。 按写分配法:写失效时,先把所写单元所 在的块调入Cache,然后再进行写入。 不按写分配法:写失效时,直接写入下一 级存储器中,而不把相应的块调入Cache。 命中时间:访问Cache命中时所用的时间。 失效率:CPU访存时,在一级存储器中找不 到所需信息的概率。 失效开销:CPU向二级存储器发出访问请求 到把这个数据调入一级存储器所需的时 间。 强制性失效:当第一次访问一个块时,该 块不在Cache中,需要从下一级存储器中 调入Cache,这就是强制性失效。 容量失效:如果程序在执行时,所需要的 块不能全部调入Cache中,则当某些块被 替换后又 重新被访问,就会产生失效,这种失效就 称作容量失效。 冲突失效:在组相联或直接映象Cache中, 若太多的块映象到同一组(块)中,则会 出现该组中某个块被别的块替换(即使别 的组或块有空闲位置),然后又被重新访问 的情况。 2:1Cache经验规则:大小为N的直接映象 Cache的失效率约等于大小为N/2的两路 组相联Cache的实效率。 相联度:在组相联中,每组Cache中的块 数。 Victim Cache:位于Cache和存储器之间的 又一级Cache,容量小,采用全相联策略。 用于存放由于失效而被丢弃(替换)的那 些块。每当失效发生时,在访问下一级存 储器之前,先检查Victim Cache中是否含 有所需块。 故障性预取:在预取时,若出现虚地址故 障或违反保护权限,就会发生异常。 非故障性预取:在预取时,若出现虚地址 故障或违反保护权限,不发生异常。 非阻塞Cache:Cache在等待预取数据返回 时,还能继续提供指令和数据。 尽早重启动:在请求字没有到达时,CPU 处于等待状态。一旦请求字到达,就立即 发送给CPU,让等待的CPU尽早重启动,继 续执行。 请求字优先:调块时,首先向存储器请求 CPU所要的请求字。请求字一旦到达,就立 即送往CPU,让CPU继续执行,同时从存储 器调入该块的其余部分。 虚拟Cache:地址使用虚地址的Cache。 多体交叉存储器:具有多个存储体,各体 之间按字交叉的存储技术。 存储体冲突:多个请求要访问同一个体。 TLB:一个专用高速存储器,用于存放近期 经常使用的页表项,其内容是页表部分内 容的一个副本。 6.1解释以下术语 响应时间:从用户键入命令开始,到得到 结果所花的时间。 可靠性:指系统从某个初始参考点开始一 直连续提供服务的能力,它通常用平均无 故障时间来衡量。 可用性:指系统正常工作的时间在连续两 次正常服务间隔时间中所占的比率。 可信性:指服务的质量,即在多大程度上 可以合理地认为服务是可靠的。 通道:专门负责整个计算机系统输入/输出 工作的专用处理机,能执行有限的一组输 入输出指令。 通道流量:指一个通道在数据传送期间, 单位时间内能够传送的数据量。 虚拟DMA:它允许DMA设备直接使用虚拟地 址,并在DMA传送的过程中由硬件将虚拟 地址转换为物理地址。 异步I/O:允许进程在发出I/O请求后继续 执行,直到该进程真正访问这些数据而它 们又尚未就绪时,才被挂起。

相关文档
最新文档