ARM内核

ARM架构服务器

2月27日在上一篇关于ARM和x86在数据中心应用的较量，已经不是一个新话题了。我们经常看到功耗、性能数字，以及应用软件和生态系统丰富程度的讨论。《华为UDS对象存储：ARM自组织硬盘满足CERN功耗》一文里面，笔者曾经提到“功耗和成本正是UDS使用ARM而不是Intel Atom等处理器的原因，据了解华为此前在这一系列的产品中使用过Atom。” 现在我想以大型用户的实际研发和部署进度为切入点，继续谈谈ARM和x86之间各自的优势，以及可能存在的不足。本文的两个主要论点是：ARM在用于数据中心的SoC方面，目前相对于x86的功能和集成度有一定优势；另外百度与Facebook主导的Open Compute Project（开放计算项目），其存储（服务器）设计的密度和灵活性也有些差别。那为什么标题中还说两家“异曲同工”呢？先来看看百度的情况。百度ARM云存储支持纯x86/ARM，或两者混布 ChinaByte比特网：关于百度的ARM云存储节点，是否方便透露使用了来自哪家的处理器？系统来自哪个ODM？以我的了解，华为UDS对象存储（云存储）也使用了ARM，在存储节点上每颗ARM （应该是单核）对应一个硬盘，而管理（元数据）节点仍然是x86。我看到百度也是每个ARM核心对应一个硬盘，因此想了解下整套系统的组成，是否也需要x86的管理节点搭配使用？ARM在这里是什么样的角色（承担着哪些处理工作）？百度：我们与ARM、Marvell 等业界领导者共同设计开发了这款ARM 云存储服务器，并拥有相关专利。完整的系统架构不方便透露。可以明确的是，我们的这套系统可以支持纯X86，或者纯ARM，或者两者混布。点评：我想这个答复还算简单清楚，下面再看看实物照片：

ARM处理器体系架构详细说明

ARM处理器体系架构详细说明 ARM 体系结构是构建每个 ARM 处理器的基础。ARM 体系结构随着时间的推移不断发展，其中包含的体系结构功能可满足不断增长的新功能、高性能需求以及新兴市场的需要。 ARM 体系结构支持跨跃多个性能点的实现，并已在许多细分市场中成为主导的体系结构。ARM 体系结构支持非常广泛的性能点，因而可以利用最新的微体系结构技术获得极小的 ARM 处理器实现和极有效的高级设计实现。实现规模、性能和低功耗是 ARM 体系结构的关键特性。已经开发了体系结构扩展，从而为 Java 加速 (Jazelle)、安全性 (TrustZone)、SIMD 和高级 SIMD (NEON) 技术提供支持。A RMv8-A 体系结构增加了密码扩展作为可选功能。 ARM 体系结构通常描述为精简指令集计算机 (RISC) 体系结构，因为它包含以下典型 RISC 体系结构特征： ?统一寄存器文件加载/存储体系结构，其中的数据处理操作只针对寄存器内容，并不直接针对内存内容。 ?简单寻址模式，所有加载/存储地址只通过寄存器内容和指令字段确定。对基本 RISC 体系结构的增强使 ARM 处理器可以实现较高性能、较小代码大小、较低功耗和较小硅面积的良好平衡。 ARMv8 体系结构 ARMv8-A 将 64 位体系结构支持引入 ARM 体系结构中，其中包括： ?64 位通用寄存器、SP（堆栈指针）和 PC（程序计数器） ?64 位数据处理和扩展的虚拟寻址 ?两种主要执行状态： ?AArch64 - 64 位执行状态，包括该状态的异常模型、内存模型、程序员模型和指令集支持

?AArch32 - 32 位执行状态，包括该状态的异常模型、内存模型、程序员模型和指令集支持这些执行状态支持三个主要指令集： ?A32（或 ARM）：32 位固定长度指令集，通过不同体系结构变体增强部分 32 位体系结构执行环境现在称为 AArch 32 ?T32 (Thumb)，以 16 位固定长度指令集的形式引入，随后在引入 Thumb-2 技术时增强为 16 位和 32 位混合长度指令集。部分 32 位体系结构执行环境现在称为 AArch32 ?A64：提供与 ARM 和 Thumb 指令集类似功能的 32 位固定长度指令集。随 ARMv8-A 一起引入，它是一种 AArch64 指令集。 ARM ISA 不断改进，以满足前沿应用程序开发人员日益增长的要求，同时保留了必要的向后兼容性，以保护软件开发投资。在ARMv8-A 中，对 A32 和 T32 进行了一些增补，以保持与 A64 指令集一致。 A32(ARM) ARM（通常称为 A32）是一种固定长度（32 位）的指令集。它是 ARMv4T、ARMv5TEJ 和 ARMv6 体系结构中使用的基础 32 位ISA。在这些体系结构中，该指令集用于需要高性能的应用领域，或用于处理硬件异常，如中断和处理器启动。对于性能关键应用和旧代码，Cortex 体系结构的 Cortex-A 和 Cortex-R 配置文件也支持 ARM ISA。其多数功能都包括在与Thumb-2 技术一起引入的 Thumb 指令集中。Thumb (T32) 从改进的代码密度中获益。 ARM 指令的长度为 32 位，需要 4 字节边界对齐。可以对大多数 ARM 指令进行“条件化”，使其仅在以前的指令设置了特定条件代码时执行。这意味着，如果应用程序状态寄存器中的 N、Z、C 和 V 标志满足指令中指定的条件，则指令仅对程序员的模型操作、内存和协处理器发挥其正常作用。如果这些标记不满足此条件，则指令会用作 NOP，即执行过程正常进入下一指令（包括将对异常进行任意相关检查），但不发挥任何其他作用。此条件化指令允许对 if 和 while 语句的一小部分进行编码，而无需使用跳转指令。条件代码包括： T32(Thumb)

cortexm3内核与arm7tdmi区别

低成本ARM 32位MCU，开发人员面临的两种选择要使用低成本的 32位微控制器，开发人员面临两种选择，基于Cortex-M3内核或者ARM7TDMI内核的处理器。如何做出选择？选择标准又是什么？本文主要介绍了ARM Cortex-M3内核微控制器区别于ARM7的一些特点，帮助您快速选择。 1．ARM实现方法 ARM Cortex-M3是一种基于ARM V7架构的最新ARM嵌入式内核，它采用哈佛结构，使用分离的指令和数据总线（冯诺伊曼结构下，数据和指令共用一条总线）。从本质上来说，哈佛结构在物理上更为复杂，但是处理速度明显加快。根据摩尔定理，复杂性并不是一件非常重要的事，而吞吐量的增加却极具价值。 ARM公司对Cortex-M3的定位是：向专业嵌入式市场提供低成本、低功耗的芯片。在成本和功耗方面，Cortex-M3具有相当好的性能，ARM公司认为它特别适用于汽车和无线通信领域。和所有的ARM内核一样，ARM公司将内该设计授权给各个制造商来开发具体的芯片。迄今为止，已经有多家芯片制造商开始生产基于Cortex-M3内核的微控制器。 ARM7TDMI（包括ARM7TDMIS）系列的ARM内核也是面向同一类市场的。这类内核已经存在了十多年之久，并推动了ARM成为处理器内核领域的主导者。众多的制造商（据ARM宣称，多达16家）出售基于ARM7系列的处理器以及其他配套的系统软件、开发和调试工具。在许多方面，ARM7TDMI 都可以称得上是嵌入式领域的实干家。 2．两者差异除了使用哈佛结构， Cortex-M3还具有其他显著的优点：具有更小的基础内核，价格更低，速度更快。与内核集成在一起的是一些系统外设，如中断控制器、总线矩阵、调试功能模块，而这些外设通常都是由芯片制造商增加的。 Cortex-M3 还集成了睡眠模式和可选的完整的八区域存储器保护单元。它采用THUMB-2指令集，最大限度降低了汇编器使用率。 3．指令集 ARM7可以使用ARM和Thumb两种指令集，而 Cortex-M3只支持最新的 Thumb-2指令集。这样设计的优势在于：免去 Thumb和ARM代码的互相切换，对于早期的处理器来说，这种状态切换会降低性能。 Thumb-2指令集的设计是专门面向C语言的，且包括If/Then结构（预测接下来的四条语句的条件执行）、硬件除法以及本地位域操作。

ARM处理器结构

ARM处理器结构体系结构 1CISC（Complex Instruction Set Computer ，复杂指令集计算机）在CISC 指令集的各种指令中，大约有20%的指令会被反复使用，占整个程序代码的80%。而余下的80%的指令却不经常使用，在程序设计中只占20%。 2RISC（Reduced Instruction Set Computer ，精简指令集计算机） RISC结构优先选取使用频最高的简单指令，避免复杂指令；将指令长度固定，指令格式和寻地方式种类减少; 以控制逻辑为主，不用或少用微码控制等RISC体系结构应具有如下特点： 1采用固定长度的指令格式，指令归整、简单、基本寻址方式有2,3 种。 2使用单周期指令，便于流水线操作执行。 3大量使用寄存器，数据处理指令只对寄存器进行操作，只有加载/ 存储指令可以访问存储器，以提高指令的执行效率。除此以外，ARM体系结构还采用了一些特别的技术，在保证高性能的前提下尽量缩小芯片的面积，并降低功耗： 4所有的指令都可根据前面的执行结果决定是否被执行，从而提高指令的执行效率。 5可用加载/ 存储指令批量传输数据，以提高数据的传输效率。 6可在一条数据处理指令中同时完成逻辑处理和移位处理。 7在循环处理中使用地址的自动增减来提高运行效率。寄存器结构 ARM处理器共有37个寄存器，被分为若干个组（BANK），这些寄存器包括： 1 31个通用寄存器，包括程序计数器（PC指针），均为32位的寄存器。 2 6个状态寄存器，用以标识CPU勺工作状态及程序的运行状态，均为32位,

目前只使用了其中的一部分。指令结构 ARM微处理器的在较新的体系结构中支持两种指令集：ARM指令集和Thumb旨令集。其中，ARM旨令为32位的长度，Thumb指令为16位长度。Thumb指令集为ARM 指令集的功能子集，但与等价的 ARM弋码相比较，可节省30%,403以上的存储空间，同时具备32位代码的所有优点。 x86是cisc构架，arm是rise构架用途一个是pc，—个是电子产品 X86架构方案与ARh架构方案区别，山水网讯MID方案 X86架构：通俗的将就是能够装Windows 2000、XP'Tablet \windows 7 操作系统的方案架构(CPU) 目前全球仅有3家公司有实力做出这样的架构，他们分别是:In tel 中国台湾威盛(VIA)和AMD而目前在低功耗领域AMD甚少介入，也就是在X86架构平板电脑市场仅仅是In X86架构：通俗的将就是能够装Windows 2000、XP'Tablet \windows 7 操作系统的方案架构(CPU) 目前全球仅有3 家公司有实力做出这样的架构，他们分别是：Intel 中国台湾威盛(VIA)和AMD 而目前在低功耗领域AMD#少介入，也就是在X86架构平板电脑市场仅仅是 Intel 和威盛的角逐而X86架构体系分高性能和低功耗版本，山水网讯科技主要研发基于X86架构低功耗系统的方案及产品：MID、UMP、C NetBook 低功耗X86架构体系优点：

ARM处理器的三大特点

ARM处理器的三大特点是：耗电少功能强、16位/32位双指令集和合作伙伴众多。 1、体积小、低功耗、低成本、高性能； 2、支持Thumb（16位）/ARM（32位）双指令集，能很好的兼容8位/16位器件； 3、大量使用寄存器，指令执行速度更快； 4、大多数数据操作都在寄存器中完成； 5、寻址方式灵活简单，执行效率高； 6、指令长度固定。编辑本段ARM处理器的历史 1978年12月5日，物理学家赫尔曼·豪泽（Hermann Hauser）和工程师Chris Curry，在英国剑桥创办了CPU公司（Cambridge Processing Unit），主要业务是为当地市场供应电子设备。1979年，CPU公司改名为Acorn计算机公司。起初，Acorn公司打算使用摩托罗拉公司的16位芯片，但是发现这种芯片太慢也太贵。"一台售价500英镑的机器，不可能使用价格100英镑的CPU！"他们转而向Intel公司索要80286芯片的设计资料，但是遭到拒绝，于是被迫自行研发。 1985年，Roger Wilson和Steve Furber设计了他们自己的第一代32位、6M Hz的处理器， Roger Wilson和Steve Furber [1] 用它做出了一台RISC指令集的计算机，简称ARM（Acorn RISC Machine）。这就是ARM这个名字的由来。 RISC的全称是"精简指令集计算机"（reduced instruction set computer），它支持的指令比较简单，所以功耗小、价格便宜，特别合适移动设备。早期使用ARM芯片的典型设备，就是苹果公司的牛顿PDA。 20世纪80年代后期，ARM很快开发成Acorn的台式机产品，形成英国的计算机教育基础。 1990年11月27日，Acorn公司正式改组为ARM计算机公司。苹果公司出资150万英镑，芯片厂商VLSI出资25万英镑，Acorn本身则以150万

ARM微处理器体系结构及其发展趋势

ARM微处理器体系结构及其发展趋势摘要：嵌入式微处理器是体系结构研究领域的一个热点。本文从微处理器设计者的角度出发，对在嵌入式系统当中应用广泛的32位ARM微处理器系列的体系结构作了研究和探讨，同时分析了其发展趋势。关键词： ARM；体系结构；嵌入式微处理器；发展趋势 1. 概述嵌入式系统一般指非PC系统，它包括硬件和软件两部分。硬件包括处理器/微处理器、存储器及外设器件和I/O端口、图形控制器等。软件部分包括操作系统软件（OS）（要求实时和多任务操作）和应用程序编程。有时设计人员把这两种软件组合在一起。应用程序控制着系统的运作和行为；而操作系统控制着应用程序编程与硬件的交互作用。嵌入式系统的核心是嵌入式微处理器。嵌入式微处理器一般具备以下4个特点：（1）对实时多任务有很强的支持功能，能完成多任务并且有较短的中断时间；（2）具有功能较强的存储区保护功能；（3）可扩展的处理器结构，以能最迅速地开发出满足应用的各种性能的嵌入式微处器；（4）功耗很低。嵌入式处理器的基础是通用计算机中的CPU。但在工作温度、抗电磁干扰、可靠性等方面一般都作了各种增强。具有体积小、重量轻、成本低、可靠性高的优点，芯片中往往包括少量ROM和RAM甚至一定容量的FLASH，一般还包括总线接口、常用设备的控制器、各种外设等器件，从而极大的减少了构成系统的复杂性，因此又称之为片上系统（SystemOnchip,SOC）。 ARM（AdvancedRISCMachine）是英国ARM公司设计开发的通用32位RISC微处理器体系结构，其主要优势在于简单的设计和高效的指令集。ARM的设计目标是微型化、低功耗、高性能的微处理器实现。目前，ARM微处理器家族在嵌入式系统、掌上电脑、智能卡和GSM中断控制器等领域获得了广泛地应用，几乎占据了嵌入式处理器的半壁江山。 2. ARM体系结构作为一种RISC体系结构的微处理器，ARM微处理器具有RISC体系结构的典型特征。还具有以下特点：（1）在每条数据处理器指令当中，都控制算术逻辑单元（ALU）和移位器，以使ALU 和移位器获得最大的利用率；（2）自动递增和自动递减的寻址模式，以优化程序中的循环；（3）同时Load和Store多条指令，以增加数据吞吐率；（4）所有指令都条件执行，以增大执行吞吐量。这些是对基本RISC体系结构的增强，使得ARM处理器可以在高性能、小代码尺寸、低功耗和小芯片面积之间获得好的平衡。作为一种RISC微处理器，ARM指令集的效率比基于CISC的系统高得多。指令集由11个基本指令类型组成，两种用于片上ALU、环形移位器和乘法器，3种用于控制存储器和寄存器之间的数据传送，另外3种控制执行的数据流和特权级别。最后3种指令用于控制外部协处理器，这使得指令集的功能可以在片外得到扩展。对于一些高级语言的编译器来说，ARM 的指令集是比较理想的。而且汇编器的编码也非常简单。ARM指令集的另一个特征是所有的

stm32与arm7比较(经典)

我觉得ARM7会被STM32取代，STM32偏向不带系统的工业控制，外围设备甚至比ARM7、ARM9更丰富，而ARM7带不了大系统，想带系统至少也要从ARM9开始。要么直接上ARM9学学系统，要么就顺便学学STM32裸奔，ARM7不上不下没必要去学。追问stm32有什么好书籍吗？发现资料挺少的回答《ARM微控制器应用设计与实践》个人觉得还是先学习ARM7 ，等学会了之后你自然也就会动的STM32! 两者肯定是有区别的，但是这是基本的学习过程。我也是这样走过来的 coretex-m3 是现在企业用的最多的cpu ，是arm7的升级版，我觉得arm7 ---- 微内核------arm9 -----Linux 是做好的学习路径 stm32是armv7内核arm7是armv4内核，构架不同。进阶学习，是选择STM32好还是ARM7，还是ARM9?本人会51，而且做过相应的开发项目，最近想提升自己的能力，但是不知道是选择哪一个为好，是STM32、arm7,arm9,msp430,dsp???没有头绪，请大神指点我建议您选择转向STM32，从开发角度来讲，STM32比51的编程更加简单，厂家的工程代码中提供了很多的库函数来操作GPIO，UART，SPI，AD，TIMER等资源，不需要像51一样

去记忆各个特殊寄存器的属性和用途。 STM32是现在市场上性价比非常高的一款ARM产品，使用的是Cortex-M3内核，在同等价位下，其内部资源比51要丰富更多。STM32同系列的产品，在软件和硬件上兼容性很好，尤其是从PIN脚少的芯片更换为PIN脚多的芯片的时候，代码都无需修改就能直接应用。基于价格和使用性能的因素，STM32在很多产品中得到广泛应用，市场供货基本没有问题，现货相当充足，目前我们公司95%的产品都是基于STM32的。如果你想从事嵌入式应用程序的开发，直接上ARM9开发，学习LINUX或安卓去。如果你想从事嵌入式驱动程序的开发，或者想成为一名博学多才的主管，又或者未来你想成为一名架构师，你需要单片机给你打下硬件基础，那你可以以“低端单片机-高端单片机-低端ARM-高端ARM”来学。我现在就是工作中用STM32，晚上回去自学ARM9。楼主的进阶是指从51到ARM还是指已经基本掌握32位单片机？如果有单片机基础，但是没有玩过ARM，建议学习STM32，甚至说没有玩过单片机想入门的也可以选择STM32，因为STM32例程丰富，资源比较多，市面上成熟的开发板也比较多，而且基本价格都在300以内。而如果楼主已经对32位单片机比较了解，想学习嵌入式系统Linux/WIN CE等，可以考虑6410，或者楼主预算非常充足，可以考虑Cortex-A8/A9的开发板。我个人是比较熟悉STM32，没有玩过ARM9，稍稍玩过ARM7，现在是在学飞凌的6410了。追问我玩的是51系列的单片机，感觉想提升一下，玩32位的，stm32貌似跑不起LINUX系统和WINCE系统，所以就是比较纠结选择哪一个开始作为学习回答其实从51跨到LINUX还是有一定难度的，楼主可以考虑玩ARM9。我个人的学习轨迹是AVR-STM32（UCOSII）- 6410（LINUX）循序渐进，先易后难追问谢谢你，我现在正式在自学ARM9和LINUX系统中两者肯定是有区别的，但是这是基本的学习过程。我也是这样走过来的 coretex-m3 是现在企业用的最多的cpu ，是arm7的升级版，我觉得arm7 ---- 微内核------arm9 -----Linux 是做好的学习路径 stm32使用的是ARM公司开发的Cortex-M3内核，就是ARM芯片的一种，使用的是最新的ARM V7内核架构，Cortex还有A、R两个系列专家的建议，初学者学三星的S3C44B0很好，虽然这块芯片被业界用烂了，不是处理器越高的就一定越好，学ARM9，要学Linux，精通Linux内核，这比精通ucosII难度大多了，专家建议先学ucosII，一个非常好的小的嵌入式实时操作系统。相对来说STM32应用更广泛一些，既适合ARM也适合X86。嗯，之前我也纠结过；后来我退回去把51学的烂熟；然后就上了ARM9linux；一路走过来累的半死；就是因为一下上的太多先学完了RAM9的基础，然后又上linux系统移植和内核实在是差的太多吃不透；偶然的一次机会接触了ARM7和stm32；觉得STM32是我用过最好用的ARM芯片；但是缺点也有不能上大系统（也有上大系统的，但是去研究不又从蹈覆辙了吗），主要用于工控。

ARM架构

ARM架构（过去称作进阶精简指令集机器（Advanced RISC Machine），更早称作Acorn RISC Machine）是一个32位元精简指令集（RISC）中央处理器（processor）架构，其广泛地使用在许多嵌入式系统（embedded）设计。由于节能的特点，ARM处理器非常适用于行动通讯领域，符合其主要设计目标为低耗电的特性。在今日，ARM家族占了所有32位元嵌入式处理器75%的比例[1]，使它成为占全世界最多数的32位元架构之一。ARM处理器可以在很多消费性电子产品上看到，从可携式装置（PDA、移动电话、多媒体播放器、掌上型电玩，和计算机）到电脑周边设备（硬盘、桌上型路由器）甚至在导弹的弹载计算机等军用设施中都有他的存在。在此家族中衍伸的重要产品还包括 Marvell的XScale架构和德州仪器的OMAP系列。编辑本段历史 ARM的设计是Acorn电脑公司（Acorn Computers Ltd）于1983年开始的开发计划。这个团队由Roger Wilson和Steve Furber带领，着手开发一种新架构，类似进阶的MOS Technology 6502处理器。Acorn有一大堆建构在6502架构上的电脑，因此能设计出一颗类似的芯片即意味着对公司有很大的优势。团队在1985年时开发出ARM1 Sample版，而首颗"真正"的产能型ARM2于次年量产。ARM2具有32位的数据总线、26位的寻址空间，并提供64 Mbyte 的寻址范围与16个32-bit的暂存器。这些暂存器其中有一颗做为（word 大小）程式计数器，其前面6 bits和后面2 bits用来保存处理器状态标记（Processor Status Flags）。ARM2可能是全世界最简单实用的32位微处理器，其仅容纳了30,000个晶体管（相较于Motorola六年后的68000 其包含了70,000颗）。之所以精简的原因在于它不含微码（请参阅microcode）（这表示大概只有68000的1/3至1/4），而与现今大多数的 CPU 不同，它没有包含任何的高速缓存。这个精简的特色使它只需消耗很少的电能，却能发挥比 Intel 80286 更好的效能。后继的处理器ARM3更备有4KB的高速缓存，使它能发挥更佳的效能。在1980年代晚期，苹果电脑开始与Acorn合作开发新版的ARM核心，由于这专案非常重要，Acorn甚至于1990年将设计团队另组成一间名为安谋国际科技（Advanced RISC Machines Ltd.）的新公司。也基于这原因，使得ARM有时候反而称作Advanced RISC Machine而不是Acorn RISC

ARM处理器与嵌入式系统_沈建华

ARM处理器与嵌入式系统沈建华 (华东师范大学计算机科学技术系,上海200241) 业界论坛INDUSTRY FORUM 62010年第11期adv@https://www.360docs.net/doc/898845493.html,(广告专用) 可以用散热器加风扇散热。ARM针对嵌入式应用,在满足性能要求的前提下,力求最低的功率消耗。ARM结构的优点是能兼顾到性能、功耗、代码密度、价格等几个方面,而且做得比较均衡。在性能/功耗比(MIPS/W)方面, ARM处理器具有业界领先的性能。基于ARM核的芯片价格也很低,目前ARM Cortex-M的芯片价格可低至10 元人民币左右。 2.2丰富的可选择芯片 ARM只是一个核,ARM公司自己不生产芯片,采用授权方式给半导体生产商。目前,全球几乎所有的半导体厂家都向ARM公司购买了各种ARM核,配上多种不同的控制器(如LCD控制器、SDRAM控制器、DMA控制器等)和外设、接口,生产各种基于ARM核的芯片。目前, 基于ARM核的各种处理器型号有好几百种,在国内市场上,常见的有ST、TI、NXP、Atmel、Samsung、OKI、Sharp、 Hynix、Crystal等厂家的芯片。用户可以根据各自的应用需求,从性能、功能等方面考察,在许多具体型号中选择最合适的芯片来设计自己的应用系统。由于ARM核采用向上兼容的指令系统,用户开发的软件可以非常方便地移植到更高的ARM平台。 2.3广泛的第三方支持以如今的技术,设计一个处理器并非难事,但要使这个处理器得到大家认可,并取得市场成功却是非常困难的,其中涉及许多技术与非技术的因素和环节,还包括时机、运气。因为现在许多产品的开发,不是一个简单的处理器加几百条指令、语句就可以解决的。要用到32位处理器,一般都要有编译器、高效的开发工具(仿真器及调试环境)、操作系统、协议栈等,这些东西都不是一个芯片生产商可以解决的,而需要许多第三方的支持。这就像一粒种子,需要土壤、空气、水等环境才能发芽、成长。这也是我们的一些“中国芯”该反思之处。 ARM通过近20年的培育、发展,得到了广泛的第三方合作伙伴支持。目前,除通用编译器GCC,ARM有自己的高效编译、调试环境(MDK、Keil),全球约有50家以

第二章ARM_Cortex-M3内核结构

第二章ARM Cortex-M3内核结构教学目标通过本章的学习，要理解ARM Cortex-M3内核结构，结合MCS-51单片机，分析其优缺点；掌握ARM Cortex-M3内核寄存器组织、处理器运行模式、存储器映象、异常及其操作；了解存储器保护单元及应用；了解ARM Cortex-M3调试组件的工作原理及应用。本章是ARM Cortex-M3微控制器体系结构分析，内容涉及内核结构、CPU寄存器组织、存储器映射、异常形为及操作，在学习过程中与8位单片机（MCS-51单片机、PIC系列单片机等）结合分析，以期达到良好学习效果。 ARM Cortex-M3处理器简介 2.1.1 概述 ARM公司成立于上个世纪九十年代初，致力于处理器内核研究，ARM 即 Advanced RISC Machines 的缩写，ARM公司本身不生产芯片，只设计内核，靠转让设计许可，由合作伙伴公司来生产各具特色的芯片。这种运行模式运营的成果受到全球半导公司以及用户的青睐。目前ARM体系结构的处理器内核有：ARM7TDMI、ARM9TDMI、ARM10TDMI、ARM11以及Cortex等。2005年ARM推出的ARM Cortex系列内核，分别为：A系列、R系列和M系列，其中A系列是针对可以运行复杂操作系统（Linux、Windows CE、Symbian 等）的处理器；R系列是主要针对处理实时性要求较高的处理器（汽车电子、网络、影像系统）；M系列又叫微控制器，对开发费用敏感，对性能要求较高的场合。 Cortex-M系列目前的产品有M0、M1、M3，其中M1用在FPGA中。Cortex-M系列对微控制器和低成本应用提供优化，具有低成本、低功耗和高性能的特点，能够满足微控制器设计师进行创新设计的需求。其中，ARM Cortex-M3处理器的性能是ARM7的两倍，而功耗却只有ARM7的1/3，适用于众多高性能、极其低成本需求的嵌入式应用，如微控制器、汽车系统、大型家用电器、网络装置等，ARM Cortex-M3提供了32位微控制器市场前所未有的优势。 Cortex-M3内核，内部的数据路径为32位，寄存器为32位，存储器接口也是32位。Cortex-M3采用了哈佛结构，拥有独立的指令总线和数据总线，可以让取指与数据访问分开进行。Cortex-M3还提供一个可选的MPU，对存储器进行保护，而且在需要的情况下也可以使用外部的cache。另外在Cortex-M3中，存储器支持小端模式和大端存储格式。Cortex-M3内部还附赠了很多调试组件，用于在硬件水平上支持调试操作，如指令断点，数据观察点等。另外，为支持更高级的调试，还有其它可选组件，包括指令跟踪和多种类型的调试接口。 2.1.2 内核结构组成及功能描述 Cortex-M3微控制器内核包括处理核心和许多的组件，目的是用于系统管理和调试支持。如图为Cortex-M3内核方框图。

Arm技术发展历史与趋势分析

A backward glance and a forward view Arm技术发展历史与趋势分析

Arm update A Backward Glance: Progress ?Financials ?Investments / hiring ?Meltdown / Spectre A Forward View: ?Market forecasts ?Arm China JV ?New technology for smartphones and IoT

Licensing

$0m $100m $200m $300m $400m $500m $600m $700m 20052006200720082009201020112012201320142015201620173%2%20%4%

$0m $100m $200m $300m $400m $500m $600m $700m 2005200620072008200920102011201220132014201520162017 10%

2017 Licensing: 141 is the mid-point of normal range 110 130150 17019015 16 17 14 Historic licensing 14161715Year 1313 Cortex-A Cortex-R Cortex-M Mali Classic 0451658Average = 39Average = 70Withdrawn from licensing Av.=1522Av.=22

浅谈ARM Cortex系列处理器之区别

浅谈ARM Cortex系列处理器之区别市面上ARM Cortex系列包括3个系列，包括ARM Cortex-A, ARM Cortex-R, ARM Cortex-M,Z这三种系列，并且每个系列又分多种子版本，每个子版本都有各自的特点。很好的为设计人员提供非常广泛的具有可扩展性的性能选项，从而有机会在多种选项中选择最适合自身应用的内核，而非千篇一律的采用同一方案。其中， 1，Cortex-A—面向性能密集型系统的应用处理器内核 2， Cortex-R—面向实时应用的高性能内核 3， Cortex-M—面向各类嵌入式应用的微控制器内核 Cortex-A处理器为利用操作系统（例如Linux或者Android ，IOS）的设备提供了一系列解决方案，这些设备被用于各类应用，从低成本手持设备到智能手机、平板电脑、机顶盒以及企业网络设备等。早期的Cortex-A系列处理器（A5、A7、A8、A9、A12、A15和A17）基于ARMv7-A架构。每种内核都共享相同的功能集，例如NEON媒体处理引擎、Trustzone安全扩展、单精度和双精度浮点支持、以及对多种指令集（ARM、Thumb-2、Thumb、Jazelle 和DSP）的支持。与此同时，这些处理器也具有极高的设计灵活性，能够提供所需的最佳性能和预期的功效。介绍过Cortex-A，下面介绍Cortex-R系列——衍生产品中体积最小的ARM处理器，这一点也最不为人所知。Cortex-R处理器针对高性能实时应用，例如硬盘控制器（或固态驱动

控制器）、企业中的网络设备和打印机、消费电子设备（例如蓝光播放器和媒体播放器）、以及汽车应用（例如安全气囊、制动系统和发动机管理）。Cortex-R系列在某些方面与高端微控制器（MCU）类似，但是，针对的是比通常使用标准MCU的系统还要大型的系统。例如，Cortex-R4就非常适合汽车应用。Cortex-R4主频可以高达600MHz（具有2.45DMIPS/MHz），配有8级流水线，具有双发送、预取和分支预测功能、以及低延迟中断系统，可以中断多周期操作而快速进入中断服务程序。Cortex-R4还可以与另外一个Cortex-R4 构成双内核配置，一同组成一个带有失效检测逻辑的冗余锁步（lock-step）配置，从而非常适合要求安全系数的系统。最后，我们来讨论Cortex-M系列，自首款Cortex-M处理器于2004年发布以来，此系列处理器Cortex-M4、Cortex-M3、Cortex-M1 FPGA 和Cortex-M0 Cortex-M7等几种相关处理器。特别设计针对竞争已经非常激烈的MCU市场。Cortex-M系列基于ARMv7-M架构（用于Cortex-M3和Cortex-M4）构建，而较低的Cortex-M0+基于ARMv6-M架构构建。当一些主流MCU供应商选择这系列内核，并开始生产MCU器件后，Cortex-M处理器迅速受到市场青睐。可以肯定的说，Cortex-M之于32位MCU就如同8051之于8位MCU——受到众多供应商支持的工业标准内核，各家供应商采用该内核加之自己特别的开发，在市场中提供差异化产品。例如，Cortex-M系列能够实现在FPGA中作为软核来用，但更常见的用法是作为集成了存储器、时钟和外设的MCU。在该系列产品中，有些产品专注最佳能效、有些专注最高性能、而有些产品则专门应用于诸如智能电表这样的细分市场其中，Cortex-M3和Cortex-M4是非常相似的内核。二者都具有1.25DMIPS/MHz 的性能，配有3级流水线、多重32位总线接口、时钟速率可高达200MHz，并配有非常高效的调试选项。最大的不同是，Cortex-M4的内核性能针对的是DSP。Cortex-M3和Cortex- M4具有相同的架构和指令集（Thumb-2）。然而，Cortex-M4增加了一系列特别针对处理DSP算法而优化的饱和运算和SIMD指令。以每0.5秒运行一次的512点FFT 为例，如果分别在同类量产的Cortex-M3 MCU和Cortex-M4 MCU上运行，完成同样的工作，Cortex-M3所需功耗约是Cortex-M4所需功耗的三倍。而对于成本特别敏感的应用或者正在从8位迁移到32位的应用而言，Cortex-M系列的最低端产品可能是最佳选择。虽然Cortex-M0+的性能为0.95DMIPS/MHz，比Cortex-M3和Cortex-M4的性能稍稍低一些，但仍可与同系列其他高端产品兼容。

ARM和MIPS分析与比较.

ARM与MIPS分析与比较 2008-04-06 10:37:21 阅读474 评论0 字号：大中小 [前言］这是一个几年以来我一直想做的“功课”，之所以称之为“功课”，而不能说是“文章”，是因为我觉得自己的知识还远远不够，不管是深度还是广度，也不管是全面性还是透彻性，我都不敢。但是我实在是很想把我的一些理解写出来，然后能和其他朋友一起探讨，纠正错误，补充完善，最终目的就是要加深对ARM和MIPS 这两种CPU架构的认识。这里的目前最多只能算个草稿吧，请大家不断的补充。 [正文] 1.流水线结构 pipeline - MIPS 是最简单的体系结构之一，所以使大学喜欢选择 MIPS 体系结构来介绍计算体系结构课程。 - ARM has barrel shifter shifter是两面性的，一方面它可以提高数学逻辑运算速度，另一方面它也增加了硬件的复杂性。所以和可以完成同样功能的adder/shift register相比，效率更高，但是也占用更多的芯片面积。 - MIPS have "branch delay slot" and "load delay slot" MIPS使用编译器来解决上面的两个问题。因为MIPS最初的设计思想就是使用简单的RISC硬体，然后靠编译器及其他软体技术，来达成RISC的完整概念。 2.指令结构 instruction - MIPS have 32bit and 64bit architecture,but ARM only have 32bit architecture ARM11 局部64位 - MIPS是开放式的架构,用户可以在开发的内核中加入自己的指令， - ARM has 4-bit condition code in every instruction ARM 在这一点很像x86。MIPS在MIPS IV也加入"conditional move"指令，来提高pipeline的效率。 - ARM has pre- and post-increment addressing modes auto-increment/decrement on load/store instructions - 在节省代码空间方面，MIPS16很类似ARM Thumb 3.寄存器 register - 由于MIPS内核中有32个寄存器（Register），而ARM只有16个，这种结构设计上的先天优势，决定了在同等性能表现下，MIPS的芯片面积和功耗会更小。

Cortex系列ARM核心及体系结构简介.

众所周知，英国的ARM公司是嵌入式微处理器世界当中的佼佼者。ARM一直以来都是自己研发微处理器内核架构，然后将这些架构的知识产权授权给各个芯片厂商，精简的CPU架构，高效的处理能力以及成功的商业模式让ARM公司获得了巨大的成功，使他迅速占据了32位嵌入式微处理器的大部分市场份额，甚至现在，ARM芯片在上网本市场的也大有与INTEL的ATOM处理器一较高低的实力。目前，随着对嵌入式系统的要求越来越高，作为其核心的嵌入式微处理器的综合性能也受到日益严峻的考验，最典型的例子就是伴随3G网络的推广，对手机的本地处理能力要求很高，现在一个高端的智能手机的处理能力几乎可以和几年前的笔记本电脑相当。为了迎合市场的需求，ARM公司也在加紧研发他们最新的ARM架构，Cortex系列就是这样的产品。在Cortex之前，ARM核都是以ARM 为前缀命名的，从ARM1一直到ARM11，之后就是 Cortex系列了。Cortex在英语中有大脑皮层的意思，而大脑皮层正是人脑最核心的部分，估计ARM公司如此命名正有此含义吧。一．ARMv7架构特点下表列出了ARM微处理器核心以及体系结构的发展历史：表一: ARM微处理器核心以及体系结构的发展历史我们可以看到，Cortex系列属于ARMv7架构，这是ARM公司最新的指令集架构，而我们比较熟悉的三星的S3C2410芯片是ARMv4架构，ATMEL公司的 AT91SAM9261芯片则是ARMv5架构。

ARMv7架构是在ARMv6架构的基础上诞生的。该架构采用了Thumb-2技术，Thumb-2技术是在ARM的Thumb代码压缩技术的基础上发展起来的，并且保持了对现存ARM解决方案的完整的代码兼容性。Thumb-2技术比纯32位代码少使用 31％的内存，减小了系统开销。同时能够提供比已有的基于Thumb技术的解决方案高出38％的性能。ARMv7架构还采用了NEON技术，将DSP和媒体处理能力提高了近4倍，并支持改良的浮点运算，满足下一代3D图形、游戏物理应用以及传统嵌入式控制应用的需求。此外，ARMv7还支持改良的运行环境，以迎合不断增加的JIT(Just In Time)和DAC(DynamicAdaptive Compilation)技术的使用。另外，ARMv7架构对于早期的ARM处理器软件也提供很好的兼容性。 ARMv7架构定义了三大分工明确的系列：“A”系列面向尖端的基于虚拟内存的操作系统和用户应用；“R”系列针对实时系统；“M”系列对微控制器和低成本应用提供优化。下图为v5至v7架构比较：图一：v5至v7架构比较由于应用领域不同，基于v7架构的Cortex处理器系列所采用的技术也不相同，基于v7A的称为Cortex-A系列，基于v7R的称为Cortex-R系列，基于v7M的称为Cortex-M系列。下面一一介绍。二．Cortex-A8 Cortex-A8第一款基于ARMv7构架的应用处理器。Cortex-A8是ARM公司有史以来性能最强劲的一款处理器，主频为600MHz到1GHz。A8可以满足各种移动设备的需求，其功耗低于300毫瓦，而性能却高达2000MIPS。 Cortex-A8也是ARM公司第一款超级标量处理器。在该处理器的设计当中，采用了新的技术以提高代码效率和性能，采用了专门针对多媒体和信号处理的NEON

主流ARM处理器架构对比

主流ARM处理器架构对比架构名称指令集核心数量性能/频率比评分 ARM9 AR Mv5 单核心 1.1 DMIPS/MHz ★ ARM11 AR Mv6 单核心 1.25 DMIPS/MHz ★★ Cortex-A5 AR Mv7 1～4核心 1.57 DMIPS/MHz ★★☆ Cortex-A8 AR Mv7 单核心 2.0 DMIPS/MHz ★★★ Cortex-A9 AR Mv7 1～4核心 2.5 DMIPS/MHz ★★★ ★ Cortex-A15 AR Mv7 4核以上 3.5 DMIPS/MHz ★★★ ★★ 火速链接 ARM官网对Cortex-A5架构的解释：https://www.360docs.net/doc/898845493.html,/75efm56 ARM架构处理低功耗优势(ARM官网) 65nm 45 nm 40 nm 32 nm 28 nm 20 nm NVIDIA Tegra 3三星猎户座4412 话说性能最强的cpu还是来自三星的猎户座4412，性能非常强大，比tegra3的性能更强。毕竟猎户座4412和tegra3在工艺制程上还是有差别的，所以纯粹的探究性能的话还是猎户座更为强大了。但是从待机来说tegra3要更强大一些，无进程的时候tegra 3采用了专门的芯片待机，在待机上更强大一些。

最强四核之战Tegra 3对比Exynos 4412 4412处理器是其中较新并且被应用在三星i9300、三星Note II，三星Note 10.1这三大旗舰产品中蓝魔四核W30平板 T7 现代欧魅四核X3 1.主流中的主流-高通很多手机都采用了高通的cpu，比较先进的高通s4迟迟不上市，让大家大失所望，像我们熟知的小米、索尼lt26i、htc 大多数机型都采用了高通的cpu。高通应该算是应用最广的cpu了。 2.强大的三星-猎户座我们熟知的三星i9300、三星i9100、三星i9220这几款大红大紫的机型都采用了三星的猎户座cpu，三星i9100和三星i9220都采用了双核的猎户座4210cpu，三星i9300采用了三星最先进的四核猎户座4412，魅族mx采用的也是猎户座哦！

DSP与ARM技术比较

DSP： DSP（digital singnal processor）是一种独特的微处理器，有自己的完整指令系统，是以数字信号来处理大量信息的器件。一个数字信号处理器在一块不大的芯片内包括有控制单元、运算单元、各种寄存器以及一定数量的存储单元等等，在其外围还可以连接若干存储器，并可以与一定数量的外部设备互相通信，有软、硬件的全面功能，本身就是一个微型计算机。DSP采用的是哈佛设计，即数据总线和地址总线分开，使程序和数据分别存储在两个分开的空间，允许取指令和执行指令完全重叠。也就是说在执行上一条指令的同时就可取出下一条指令，并进行译码，这大大的提高了微处理器的速度。另外还允许在程序空间和数据空间之间进行传输，因为增加了器件的灵活性。其工作原理是接收模拟信号，转换为0或1的数字信号，再对数字信号进行修改、删除、强化，并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式。它不仅具有可编程性，而且其实时运行速度可达每秒数以千万条复杂指令程序，源源超过通用微处理器，是数字化电子世界中日益重要的电脑芯片。它的强大数据处理能力和高运行速度，是最值得称道的两大特色。 DSP芯片，由于它运算能力很强，速度很快，体积很小，而且采用软件编程具有高度的灵活性，因此为从事各种复杂的应用提供了一条有效途径。其主要应用是实时快速地实现各种数字信号处理算法。根据数字信号处理的要求，DSP芯片一般具有如下主要特点：（1）在一个指令周期内可完成一次乘法和一次加法；（2）程序和数据空间分开，可以同时访问指令和数据；（3）片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问；（4）具有低开销或无开销循环及跳转的硬件支持；（5）快速的中断处理和硬件I/O支持；（6）具有在单周期内操作的多个硬件地址产生器；（7）可以并行执行多个操作；（8）支持流水线操作，使取指、译码和执行等操作可以重叠执行。当然，与通用微处理器相比，DSP芯片的其他通用功能相对较弱些。