ASN.1标准编码规则BER

ASN.1标准编码规则BER
ASN.1标准编码规则BER

ASN.1标准编码规则BER

一.基本规则

BER(Basic Encoding Rules)是ASN.1中最早定义的编码规则,其他编码规则是在BER的基础上添加新的规则构成。

1.BER传输语法的格式一直是TLV三元组.

T是Tag,L是整个类型的长度,V是类型的Value,它还可以是TLV或TLV组合

2.BER传输语法是基于八位组大端编码的,高八位在左。

3.Tag是一个或若干个八位组

(1).Universal Tag类型(值是0-30):

第七、六位指明Tag的类型,Universal Tag类型用00表示;第五位指明该类型以primitive方式编码还是constructed方式编码。

Tag value值是基本类型的Tag的值,例如INTEGER的Tag值是2,SEQUENCE型类Tag值是16:

ASN.1中定义的UNIVERSAL类Tag

Tag类型

0BER保留

1BOOLEAN

2INTEGER

3BIT STRING

4OCTET STRING

5NULL

6OBJECT IDENTIFIER

7ObjectDescripion

8EXTERNAL,INSTANCE OF 9REAL

10ENUMERATED

11EMBEDDED PDV

12UFT8String

13RELATIVE-OID

14保留

15保留

16SEQUENCE,SEQUENCE OF 17SET,SET OF

18NumericString

19PrintableString

20TeletexString,T61String

21VideotexString

22IA5String

23UTCTime

24GeneralizedTime

25GraphicString

26VisibleString,ISO646String

27GeneralString

28UniversalString

29CHARACTER STRING

30BMPString

31保留

(2).当Tag大于30时,多个八位组中编码,第一个八位组后五位全部为1,其余的八位组最高位为1表示后续还有,为0表示Tag结束。

第一个八位组高二位的取值:00表示Universal,01表示APPLICATION类型,10表示context-specific,11表示PRIVATE类型

2.BER编码中Length表示Value部分所占八位组的个数,有两大类:定长方式(Definite Form)和不定长方式(Indefinite Form)

(1).定长方式

定长方式中,按长度是否超过一个八位,又分为短、长两种形式:

短:类型长度大于等于0个八位,小于等于127

长:类型长度大于等于127个八位,小于等于256^126-1

第一个八位组的低七位指明整个L所占用的八位组个数,后续八位组表示V的长度

(2).不定长方式

Length所在八位组固定编码为0x80,但在Value编码结束后以两个0x00结尾。这种方式使得可以在编码没有完全结束的情况下,可以先发送部分消息给对方。

二.各类型的编码

以UNIVERSALTag和短型Value为例,讨论各种类型的BER编码,重点关注Value部分。

1.BOOLEAN

只能以primitive方式编码,FALSE的编码为(n10表示10进制):

TRUE的编码(任何不是全0都可以)为:

或者:

2.NULL

只能以primitive方式编码,且只有一个值:

3.INTEGER

只能以primitive方式编码。

(1).对于正数,如果最高比特位为0则直接编码;如果为1,则在最高比特位之前增加一个全0的八位组。最高位为0:

最高位为1:

(2).对于负数,先取绝对值,再取反,最后加1。

4.ENUMERATED

按照整数值的规则编码。

5.REAL

(1).0:

(2).正无穷大:

(3).负无穷大:

(4).基于10进制且以10为底的指数方法:

NR有三个可选值:

NR1:在V中底6位用000001表示,表示不带小数和指数的简单10进制整数。

例如4902,#4902,##4902,+4902等,#表示空格,每个字符占一个8位组。

NR2:在V中底6位用000010表示,表示还小数点的10进制数

例如4902.00,#4902.0,1.0

NR3:在V中底6位用000011表示,在NR2的基础上扩展,用字符‘E’代表以10为底的指数例如+0.56.0E2,0.2E-3

实数的表示方法在ISO6093标准文档中做了详细定义。

(5).基于2进制的编码方式

这种方式比较奇怪,先放一边

6.BIT STRING

可以primitive方式编码或者constructed方式编码。

(1).Primitive方式:

例如'1011011101011'B的编码

V中第一个八位取值0-7,表示在这个V后面补的0的个数

如果BITSTRING的值为空,则编码时,长度为1,补充的八位组为全0。

(2).constructed方式

'1011011101011'B的编码

L的最高位是1,说明是不定长方式编码,V中嵌套两个TLV,以Primitive方式表示这个值的高八位和低八位,最后以两个全为0的八位结尾

7.OCTET STRING

与BITSTRING类似,但是不需要增加表征补充位个数的八位组。

8.OBJECT IDENTIFIER

只能以primitive方式编码。编码时,第一个八位组采用公式:first_arc* 40+second_arc。如果一个数大于127,就采用多个8位表示,最高位用1表示后续还有octet,用0表示后续没有。

例:对{isomember-body f(250) type-org(1) ft(16) asn1-book(9)}的编码为

注意对250的编码方式,1×128+122。

9.RELATIVE-OID

与OBJECTIDENTIFIER类似,但是不需要对注册树前两段进行特殊处理。

10.字符串和日期

和OCTETSTRING编码类似,只是Tag不同。

11.SEQUENCE只能用constructed形式。对每个成员均以TLV方式编码,且顺序要与定义的一致。

v SEQUENCE { age INTEGER, single BOOLEAN } ::={age 24, single TRUE }的编码为:

注意BOOLEAN类型,非0表示真。

忽略扩展符'...',对扩展的内容则按顺序编码。

12.SET

与SEQUENCE类似,但是成员顺序有发送者决定。

13.SEQUENCEOF

SEQUENCEOf的Tag与SEQUENCE相同,编码规则也相同。

14.SETOF

与SEQUENCEOf类似。

15.CHOICE

严格说CHOICE类型在编码中并不存在,只是在描述中体现一种关系。编码时,是按照具体被选择的成员编码规则编码的。

例如amousCHOICE { name VisibleString, nobody NULL } ::= name:"Perec"

的编码为:

Tag为26,上选定成员的类型的tag。

如果CHOICE类型显式(EXPLICIT)指定了Tag,那么该Tag应当以constructed方式编码。

忽略扩展符'...',对扩展的内容则按顺序编码。

16.Tag对编码的影响

(1).如果Tag是隐式的,或者在模块定义中声明了IMPLICITTAGS或者AUTOMATICTAGS,则只有关键字IMPLICIT左侧的Tag才会被编码。如:

v [1]IMPLICIT INTEGER ::= -38的编码为:

(2).如果一个类型的Tag是显式(EXPLICIT)的(或者在模块定义中声明了EXPLICITTAGS),则要以constructed方式编码三元组系列。

如v[APPLICATION 0] EXPLICIT INTEGER ::= 38的编码为:

17.子类型约束

子类型约束是在BER编码规则之后被引入ASN.1的,在编码规则中不能体现约束。

18.EXTERNAL

该类型不推荐使用,略。

19.INSTANCEOF

定义为:

vINSTANCE OF TYPE-IDENTIFIER ::=

{

type-id{iso member-body f(250) type-org(1) ft(16) asn1-book(9)

chapter18(5)integer- type(0)},

valueINTEGER:5

}

的编码应当和如下一个SEQUENCE类型的值类似:

{

direct-reference{iso member-body f(250) type-org(1) ft(16) asn1-book(9)

chapter18(5)integer-type(0)},

encodingsingle-ASN1-type:INTEGER:5

}

编码为:

为什么valueINTEGER:5的编码采用constructed方式,处层TLV的Tag为上下文类型,值为0?

20.EMBEDDEDPDV

EMBEDDEDPDV的编码和其等效的SEQUENCE结构编码类似。其嵌入部分的编码,应该是遵循identification成员指定的规则。

21.CHARACTERSTRING

CHARACTERSTRING的编码和其等效的SEQUENCE结构编码类似。其嵌入字符串部分的编码,应该是遵循identification成员指定的规则。

https://www.360docs.net/doc/b787259.html,rmationObjects and Object Sets

信息对象和对象集合永远都不编码。如前所述,传递他们所包含信息的途径是在值定义或者类型定义中引用他们。这样的结果,不是在编码中出现了这些信息,而是ASN.1编译器在生成编解码器时,会按照这些信息生成相应的约束表。

23.ValueSet

值集合的编码按照对应类型的编码规则进行。

三.BER编码规则的属性

1.BER编码规则是机器无关

2.BER的传输语法是十分冗长。,T和L很多情况下都是可以省略,但是这种冗余信息能很好的保藏抽象语法结构。

3.BER传输语法能容易升级而且向上兼容。如每个类型都可以用CHOICE来代替

标准件编码规则

标准件编码规则: 4.7标准零件及材料按照下列方法执行 ●用六位数字代表; ●前两位数字是代表每种零件及材料的类别; ●后四位数字是代表该类零件及材料的顺序号。 例如:电源线的物料编码是“020001”, 物料编码的前两位数字“02”表示材料的类别, 后四位代表材料的顺序号。 物料编码前两位数字代表的类型如下: 4.7.1“01”代表电器类,包括以下几种零件及材料: ●碳刷用零件及材料; ●接线用零件及材料; ●焊丝、焊条; ●离心开关的零件及材料; ●电工用零件及材料(如:永磁铁、换向器、集电环等); ●热敏电阻; ●继电器。 4.7.2“02”代表电线电缆类,主要包括以下几种: ●电动机用引出线(JBQ、JFEM等电线、电缆); ●电源线用电线、电缆; ●单支线。 4.7.3“03”代表化工类,主要包括以下几种: ●漆类(电动机表面漆、绝缘漆、马路漆等); ●油类(机油、柴油等); ●理化化验用材料; ●脂类(硅脂、树脂、锂基脂等); ●电工用化工材料(水银、松香等); ●剂类(稀释剂、固化剂、脱漆剂等); 4.7.4“04”代表有色金属,主要包括以下几种; ●铜材料类(板、棒、管) ●铝材料类(锭、板、棒、管);

4.7.5“05”代表黑色金属,主要包括以下几种: ●钢材类(不锈钢、键钢、模具钢、弹簧钢、碳素钢等板、棒、管等); ●角钢类。 4.7.6“06”代表五金紧固件,主要包括以下几种: ●螺栓类; ●螺钉类; ●螺母类; ●垫圈类; ●挡圈类; ●铆钉类; ●销类; ●弹簧类(压力弹簧、波形弹簧); ●键类; ●铁钉类。 4.7.7“07”代表绝缘材料,主要包括以下几种: ●绝缘板类(环氧酚醛布板、层压板、胶版); ●绝缘薄膜类; ●绝缘纸类; ●绝缘布类; ●绝缘管类; ●绝缘套类; ●电工用绑扎带类; ●工业油毛毡。 4.7.8“08”代表塑料制品,主要有以下几种: ●密封类(O形密封圈、密封圈、引线胶圈、油封等); ●电动机塑料风扇; ●塑料套类(轴套、线帽、螺套等); ●管类(塑料管、热缩管等); ●袋类(文件袋、密实袋等)。 4.7.9“09”代表漆包线。 4.7.10“10”代表轴承,主要有以下几种:

数据编码方式介绍

1.Base64 这里讨论的编码主要的目的是将不可显示的二进制数组转变为可显示的字符串,包括其逆运算。通过特定的协议传输数据,或者加密解密的时候都会用到类似的方法。在这类运算中用的比较多的是Base64,比如MIME中,DotNET中更是直接提供了Base64 Encode和Decode的方法,相当方便。但是Base64通常由“a-z”、“A-Z”、0-9以及“+”和“=”这些符号组成,当中包含了很多混淆的字符,例如“1”、“I”和“l”,“0”和“O”或者“2”和“Z”,看起来总是不爽。特别是当作为序列号编码时,是不应该包含容易混淆的字母,所以有另一种编码形式叫做Base24,用过MS产品的兄弟们一定非常熟悉。但是Base24在实现上还要多绕一个弯,先放一放,我们在下面说Base32,能够基本满足要求的,又非常直观的编码方式。Base32的原理和Base64一模一样,所以先看一下Base64编码是怎么一回事。 Base64顾名思义就是用64个可显示字符表示所有的ASC字符,64也就是6Bits,而ASC字符一共有256个,也就是8Bits,很简单了,取一下最小公约数,24位,言下之意就是用4个Base64的字符来表示3个ASC字符。即在编码时,3个一组ASC字符,产生4个Base64字符,解码时4个一组,还原3个ASC字符。根据这个原理Base64编码之后的字符串应该比原先增加1/3的长度。 这里所谓的编码就是一次取6Bits,换算出来的值作为索引号,利用这个索引数,到预先定义的长度为64的字符数组中取相应的字符替换即可;解码就是逆运算,根据字符取在预定义数组中的索引值,然后按8Bits一组还原ASC字符。 Base32和Base64相比只有一个区别就是,用32个字符表示256个ASC字符,也就是说5个ASC字符一组可以生成8个Base32字符,反之亦然。 2.Base32 2.1.Base32数据编码简介 Base32数据编码机制,主要用来把二进制数据编码成可见的字符串,其编码规则是:任意给定一个二进制数据,以5个位(bit)为一组进行切分(base64以6个位(bit)为一组),对切分而成的每个组进行编码得到1个可见字符。Base32编码表字符集中的字符总数为25=32个,这也是Base32名字的由来。以下是我在网上找的一个标准的Base32编码表,如表1所示。

系统编码规则

XX事业部XX系统编码规则 编制:XX项目组 审核:项目执行经理 会签:各业务部门部长 审定:项目经理、项目质量总监

批准:事业部一把手20XX年XX月

版本修订记录 文档使用对象

目录 1. 目的 2. 适用范围 3. 引用文件 4. 编码规则 4.1供应商、经销商编码 4.1.1供应商编码规则 4.1.1.1内部供应商编码 4.1.1.2外部供应商编码 4.1.1.3临时供应商编码 4.1.1.4属性字段中关联上下级 4.1.2经销商编码规则 4.2订单号编码 4.3出厂编号编码 4.4仓储库位编码规则 4.5单据编号编码规则 4.6发动机号编码 4.7经销商、车厂端用户登录编码 4.7.1 经销商端登录编码规则 4.7.2 车厂端用户登录编码规则 4.8非零部件编码规则

4.9市场部编码规则 4.10产品编码规则 4.11生产车间编码规则 4.12发动机型号编码规则 4.13底盘编号编码规则 4.14变速箱型号编码规则 4.15合格证编号编码规则 4.16客户编码 1. 目的 此处主要说明编写该编码规则的目的、意义,要从大的方面着手编写

(以下为DMS编码规则目的范例) 【规范农业装备事业部DMS系统各类编码,确保各类编码符合农业装备事业部发展需求并能够得到更好的使用,适应公司信息化项目建设及业务发展需要。】2. 适用范围 此处需说明此编码规则的使用范围、使用人员置等 (以下为DMS编码规则适用范围的范例,此处还应增加使用单据、使用业务等等内容) 【适用于农业装备事业部各相关部门、科室、车间。】 3. 引用文件 此处注明此编码规则的引用文件,部分编码规可能原则其他文件,若无引用,则此部分可显示为空。 (以下为DMS编码规则引用文件范例) 《农业装备产品出厂编号编制规则》Q/LWZ B113-2009 《小农装产品出厂编号编制规则》QLWZB509-2009 《收获机械产品型号、产品代号及产品图样与设计文件编号规则》 Q/LWZF004-2009 《拖拉机产品型号、产品代号及产品图样与设计文件编号规则》 /LWZT004-2008 《小农装拖拉机产品型号、图样编号编制规则》Q-LWZ B501-2009 《农用起重机产品型号、产品代号及产品图样与设计文件编号规则》QLWZ N003 《装载机挖掘机产品特征代号编写规则》Q-LWZ N002-2009 《农业装备产品零部件标示》Q/LWZ B114-2009

产品编码规则(样板)

一、【目的】 二、【范围】 三、【权责】 四、【产品编码】 4.1 零件编码规则 由11位数字组成:物料类别代码(2位)、零件属性代码(3位)、流水号(6位)组成。 □□□□□□□□□□□ 流水号 零件属性代码 物料类别代码 4.1.1 物料类别代码:依物料材料特性用2位数表示。 4.1.2 零件属性代码:依零件属性用3位数进行表示,第1位表 示大类,第2、3位表示仪细类。

4.2成品及部件编码规则 由14位数字组成:物料类别代码(2位)、产品属性代码(3位)、产品设计顺序号(3位)、变型设计代码3位)、部件代码(3 位)组成。 □□□□□□□□□□□□□□ 部件代码 变型设计代码 设计顺序号(产品类别 产品属性代码 物料类别代码

4.2.1 物料类别代码:成品为90-99的2位数以与零件代码进行区别。 4.2.2 产品属性代码:依产品使用车辆种类及仪表属性用3位数 进行表示,第1位表示车辆种类,第2、3位表示仪表功能属 性。 4.2.4 设计顺序号:在同一产品属性的产品中,按产品的设计先 后顺序,用两位阿拉伯数字(001—999)表示。 4.2.5 变型设计代码 在原有产品中,当产品的主体结构、外形控制尺寸、硬件安装尺寸不变的前提下,仅对某些局部形状、尺寸改 变或某些参数作改变而构成一个相同系列不同机种的新产

品时,该新产品的型号应在原有产品型号的基础上编制变 型设计代码,用两位阿拉伯数字(001—999)表示。 A、虽然产品的主体结构、外形控制尺寸、硬件安装尺寸 均未变,但首次改变任何工作参数; B、软件性质的改变(如:总线); C、正面可视区域的版面布置改变(如:屏板窗口的改变、表头数量的增减); D、装饰圈的改变(如:装饰圈形状的改变、装饰圈颜色的改变); E、接插件的改变(如:接插件的形状、大小的改变,各个端子的功能定义改变); F、复位杆的改变(如:复位杆位置的移动、复位杆数量的增减长度或形状改变); G、指针的改变(如:指针形状的改变、长度的改变、导光形式的改变、颜色的改变)。 H、改变工作参数(软件内容的改变、速比的改变、量程的改变、磁钢极数的改变); I、软件内容的改变(烧录程序的改变); J、改变面板的外观(量程的改变、颜色的改变)。 4.2.6部件代码:000代表总成固定不变,其余部件按3 位流水号,不作硬性规定,推荐优先采用下表 4.3 产品型号编制示例:

信息化系统编码的八项原则

信息化系统编码的八项原则 在我们推行信息化系统的工作中,所遇到的第一件事情就是编码工作,如供应商、客户、物料等等,在企业信息化的发展过程中,经常会发现当初制定的编码规则有问题,无法再编下去,需重新修订。那如何进行科学、有效的编码,是我们所有实施顾问都会遇到经常要思考的问题。为帮助一线实施顾问科学合理的指导客戶编码工作,我们对编码工作进行了归纳、总结和提炼,形成了我们金蝶的信息化系统编码的八项原则,提炼成八个字“一、类、有、变、数、短、长、跳“。我们今年会在所有机构中对实施顾问进行培训,我们的目标是,我们所有的实施顾问在谈到编码时,都能按八项编码原则来给客户讲解,体现出我们顾问的专业性,体现出我们的标准化的实施方法。当然,如果我们金蝶的所有相关业务人员都能了解这八项原则,那是最好不过了。 下面我们来对这八项原则一一进行解释。 一、求唯一 通常情况下,只要物料的物理或化学性质有变化,只要物料必须要在仓库中存储,就必须为其指定一个编码,即通常所说的一物一码。比如某零件要经过冲压成型、钻孔、喷漆三道工序才能完成。如果该物料的三道工序都在同一车间完成,不更换加工单位,即冲压成型后立即进行钻孔,紧接着进行喷漆,中间没有入库、出库处理,则该物料可取一个代码。如果该物料的三道工序不在同一个车间完成,其顺序是冲压、入库、领料、钻孔、入库、领料、喷漆、入库,则在库存管理中为了区分该物料的三种状态,必须编制不同的物料编码。 二、分类别 在编码时,一般会按一定的分类方式对编号进行分类,这样,在日常的查询或报表列印时,同类的资料才能排在一起,便于我们比较和汇总统计等。通常我们在对物料进行编码时,会按大类-中类-小类-流水号的形式进行编码,比如,第一码表示大分类,如成品,原材料,半成品等,第二、三码表示中分类,第四、五、六码表示小分类,最后是三位的流水号,通过这样的分类,我们可以保证相同类的物料在做统计分析时是可以排在一起的。 三、勿有意 我们在给客户辅导编码时,非专业性的人员通常都要求让编号反映某些意义,使得编号容易记忆或者可以望“字“生义,常常会将英文单词的首几位或缩写字母编在编号上;再有,还要把物料的规格、尺寸等属性也要反映在料号中。在资料量不大时,这种编码方式的确可能比较方便,使用起来可能会比较符合使用者现时的习惯,但是当资料数量越来越大时,要记忆的东西太多了,实际上已经达不到当初设想的易于记忆的目的了,结果给后续新增编码造成很大的困扰,无法进行新增编码的编制。

编码规则(实用标准)

企业信息化标准 QB/JF.12001-2007 编码规则 受控状态: 发放编号: 版号: A/0 2007-06-08发布2007-07-01实施

XXXXXX有限公司发布 XXXXXXXXX有限公司企业编码标准 QB/JF.12001-2007 公司组织机构编码规则 本标准参照了根据XXXXXXXXX有限公司对组织机构管理的需要,结合实际情况制定。 本标准起草部门:XXXXXXXXX有限公司信息系统部。 1主题内容与适用范围 本标准规定了XXXXXXXXX有限公司组织机构的分级、代码管理。 本标准适用于XXXXXXXXX有限公司组织的管理、登记、统计及会计核算等工作。 2术语 公司:具有独立法人资格或需要独立核算管理的分支机构或企业,可以定义为公司。 部门:有明确的职能范围和工作职责的组织。 3分类原则 本标准根据企业需要不设分类。 4编码方法 4.1本标准采用分级数字代码结构,共分五层,最长码为9位,第一层以一位阿拉伯数字表示,代表集团号;第二层以2位阿拉伯数字表示,代表集团部门,其中99表示分厂;第三层以两位阿拉伯数字表示, 表示集团部门下属机构或分厂的序号;第四层以两位阿拉伯数字表示,表示分厂下属部门;第五层以两位阿拉伯数字表示,表示分厂下属部门班组。其分类结构如下: XX XX X XX XX 第五层 第四层 第三层 第二层

4.2各层均留有适当空码,以备增加或调整时使用。 4.3第一、二、三、四、五层的分类不再细分时,其代码后不需补“0”。5组织机构代码表(例)

XXXXXXXXX 有限公司企业编码标准 QB/JF.12001-2007 员工代码编码规则 本标准参照了根据建发鞋楦公司对员工管理的需要,结合实际情况制定。 本标准起草单位:XXXXXXXXX 有限公司。 1主题内容与适用范围 本标准规定了XXXXXXXXX 有限公司员工的分类、代码及关键描述信息、岗位的分类。 本标准适用于XXXXXXXXX 有限公司员工的管理、工资核算、考勤、奖惩、登记、统计及会计核算等工作。 2术语 岗位 泛指职位,执行一定职务的位置。 职级 员工对应的工资等级,与员工岗位技能相关。 3分类原则 根据企业管理的需要,人员编码不按特定意义区分,所有的分类以属性方式加以描述。 4 岗位编码 4.1本标准采用等长3位数字代码结构,以3位阿拉伯数字表示,表示顺序号。其分类结构如下: 4.2 所有岗位代码均采用3位编码,必须保证编码的唯一性。 4.3 岗位代码表(例) XXX 第一层

字符编码方式介绍及编码方式测试

第一部分编码方式介绍 一、编码: 美国标准信息交换标准码( , ) 在计算机内部,所有地信息最终都表示为一个二进制地字符串.每一个二进制位()有和两种状态.一个字节()共由八个二进制位来组成,共有种状态,从到. 阿拉伯数字、英文字母、标点符号等这些字符,怎么定义才能让计算机识别呢?因为计算机只识别二进制位和,所以以上这些字符就必须与二进制位(和)建立关系,才能让计算机识别. 年代初,计算机界制定了一套统一地字符编码,来表示字符与二进制位之间地关系.这种统一地字符编码就叫做编码.码一共规定了个字符地编码,比如空格是(二进制),大写地字母是(二进制).这个符号(包括个不能打印出来地控制符号),只占用了一个字节地后面位,最前面地位统一规定为. 在英语国家,个编码足以表达所有字符,但其它非英语国家,字符不是由英文字符组成,这样就需要增加编码以表达这些字符,对于超过个字符地编码被称为非编码.比如:在中国,我们用简体中文,字符编码方式为.个人收集整理勿做商业用途 二、编码: 看到上面地介绍后,我们了解了最早编码是码.它只用个二进制位来表示,由于那个时期生产地大多数计算机使用位大小地字节,因此用户不仅可以存放所有可能地字符,而且有整整一位空余下来.如果你技艺高超,可以将该位用做自己离奇地目地:中那个发暗地灯泡实际上设置这个高位,以指示一个单词中地最后一个字母,同时这也宣示了只能用于英语文本. 由于字节有多达位地空间,因此许多人在想:“呀!我们可以把之间地编码用做个人地应用目地.”问题在于,同时产生这种想法地人相当多,而且在之间地各个位置上应该存放什么这一问题上,真是仁者见仁智者见智.事实上,只要人们开始在美国以外地地方购买计算机,那么各种各样地不同字符集都会进入规划设计行列,并且各人都会根据自己地需要使用高位地个字符.如此一来,甚至在同语种地文档之间就不容易实现互换. 可被扩展,最优秀地扩展方案是,通常称之为.包括了足够地附加字符集来写基本地西欧语言. 最后,这个人参与地终于以标准地形式形成文件.在标准中,每个人都认同如何使用低端地个编码,这与相当一致.不过,根据所在国籍地不同,处理编码以上地字符有许多不同地方式.这些不同地系统称为代码页. 同时,甚至更为令人头疼地事情正在逐步上演,亚洲国家地字符表有成千上万个字符,这样地字符表是用位二进制无法表示地.该问题地解决通常有赖于称为(,双字节字符集)地繁杂字符系统. 不过,仍然需要指出一点,多数人还是姑且认为一个字节就是一个字符,以及一个字符就是个二进制位,并且只要确保不将字符串从一台计算机移植到另一台计算机,或者说一种以上地语言,那么这几乎总是可以凑合.当然,只要一进入,从一台计算机向另一台计算机移植字符串就成为家常便饭了,而各种复杂状况也随之呈现出来.令人欣慰地是,随即问世了.个人收集整理勿做商业用途 字符集(简称为),国际标准组织于年月成立工作组,针对各国文字、符号进行统一性编码.年美国跨国公司成立,并于年月与达成协议,采用同一编码字集.目前是采用位编码体系,其字符集内容与地()相同.于年月通过(),目前版本于公布,内容包含符号个,汉字个,韩文拼音个,造字区个,保留个,共计个.编码后地大小是一样地.例如一个英文字母"" 和一个汉字"好",编码后都是占用地空间大小是一样地,都是两个字节!个人收集整理勿做商业用途 可以用来表示所有语言地字符,而且是定长双字节(也有四字节地)编码,包括英文字

电力系统部分设备编号原则汇总

电力系统部分设备编号原则 一、220kv设备调度编号原则 1.母线编号正母线的编号为1M、2M、5M、6M ,旁路母线编号为3M、7M。常规的结线方式定为按发电机、变压器侧向线路侧顺序排列;自下而上(平面布置排列,角形结线按顺时针方向排列。 2.开关编号开关编号由四位数组成,第一位数为“2”,代表电压等级为220千伏,后三位数为开关序号。规定如下: (1母联、分段开关编号为“20××”,后两位由开关所联母线号组成,小数在前;母联兼旁路开关按母联分段开关原则编号。(2旁路开关编号为“20×0”,“×”为旁路开关所联旁路母线号;旁路兼母联开关按旁路开关原则编号。 (3主变220千伏开关编号按主变序号相应编为2201-2213。 (4220千伏主变变高双臂开关结线的开关编号分别为“20×A、20×B”,“×”为主变序号,“A”指接于母线序号较小的臂开关,“B”指接于母线序号较大的臂开关。 (5220千伏线路开关编号自2214起全网统一编号。 (6一个半开关结线按矩阵排列编号,第一串靠1M母线的边开关为2011,第一串中开关为2012,第一串靠2M母线的边开关为2013;第二串为2021、2022、2023,依此类推。 (7多角形结线的开关,从起点顺时针编号,如2001、2001、2003、2004...... 3 刀闸编号 (1开关对应的母线刀闸编号均由五位数组成,前四位为所属开关号,末位为所接母线号。

(2线路出线刀闸,主变压器的主变刀闸为“所属开关号+4”,出现第二把出线刀闸为“所属开关号+8”,如22938。 (3电压互感器刀闸编号为“22×PT”,第三位数字为所属母线序号,如同一母线有多把PT刀闸,则依次编为“22×甲PT、22×乙PT……”。 (4母线间联络刀闸编号为“200××”,后两位数为所联母线序号,小数在前。 4 接地刀闸均由六位数组成(包括中文及英文字母。 (1线路接地刀闸为“×××××0”前五位为所属线路刀闸号。 (2电压互感器接地刀闸为“22×PTO”,前五位为电压互感器刀闸号。 (3主变中性点地刀为“22×000”,“×”为所属变压器的序号,序号10以上(含10则用十六进制A、B、C表示。 (4母线接地刀闸为“22××00”,第三位为所属母线号,第四位为同一母线的接地刀组别号,以中文“甲、乙……”表示。如1M母线的第甲组地刀,编号为“221甲00”。 (5开关两侧接地刀,靠母线侧第一把接地刀闸编号为“××××BO”,第二把接地刀闸编号为“××××AO”,前四位为所属开关号;靠线路侧接地刀为××××CO”,前四位为所属开关号。 (6母联、分段开关两侧地刀编号为“×××××O”前四位为所属开关号,第五位为所靠近的母线的母线号。 (7主变220千伏侧接地刀编号为22××40,前四位为主变220千伏侧开关编号,如1号主变220千伏侧接地刀编号为220140。 二、500kV变电站中的35kV设备调度编号原则 1.母线编号正母线的编号为1M、2M、3M、4M 、5M,常规的结线方式为横向排列。正母线号由所连接的主变序号所决定。

常用字符集介绍和编码转换原理

常用字符集介绍和编码转换原理 目录 1. GB2312编码介绍 (2) 1.1 基本信息 (2) 1.2 GB标准 (2) 1.3 分区表示 (2) 1.4 字节结构 (2) 2. 通用字符集UCS (3) 2.1 定义 (3) 2.2 概要 (3) 2.3 实现级别 (3) 2.4 与UNICODE的兼容关系 (3) 3. unicode编码介绍 (3) 3.1 基本简介 (4) 3.2 编码实现 (4) 3.2.1 编码方式 (4) 3.2.2 实现方式 (5) 4. UTF-8介绍 (5) 4.1 基本介绍 (5) 4.2 编码原理 (5) 4. 转换原理 (7)

1. GB2312编码介绍 1.1 基本信息 1.2 GB标准 GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又称为GB0,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB2312。 GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。 GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。 对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现。 1.3 分区表示 GB 2312中对所收汉字进行了―分区‖处理,每区含有94个汉字/符号。这种表示方式也称为区位码。 01-09区为特殊符号。 16-55区为一级汉字,按拼音排序。 56-87区为二级汉字,按部首/笔画排序。 10-15区及88-94区则未有编码。 举例来说,―啊‖字是GB2312之中的第一个汉字,它的区位码就是1601。 1.4 字节结构

ERP系统编码规则

ERP系统编码规则文件编码 F200011

ERP 系统编码规则 一、成品编码 E : X X XXX 例:E00000 产品IRCUT--滤光片厚0.21mm-小镜头型3V 二、物料编码 M: X X X X XXX 【电阻 电容 电感类】 表-2 一级编码对照表 电阻 电容 电感 二极管 三极管 集成IC R C L D Q U 传感器 晶振 耦合器 PCB 排插 其它 M Y T P J E 一级 0 1 2 3 4 5 6 7 8 9 类型 IRCUT CCD CMOS AHD IPC CVI 四合一 TVI SDI NVR 二级 0 1 2 3 4 5 6 7 板机版本 无 A B C D E F G IRCUT 0.21 0.30 三级 000 001 002 003 IRCUT 小镜头型3V 小镜头型5V 大镜头型3V 大镜头型5V 板机 三位数字 按软件及像素由小到大排列 (板机型号+软件型号) 二级:产品版本 用一位数字表示 一级:产品类型 用一位数字表示 五级:用三位数字表示 二级:用一位数字表示 三级:用一位数字表示 四级:用一位数字表示 一级:用一位数字表示 三级:产品型号 用三位数字表示

1)电阻 R: 表-3 二级至四级编码对照表 二级 1 2 3 4 8 封装0402 0603 0805 1206 排4D03 三级0 1 2 3 4 功率1/32 1/16 1/10 1/8 1/4 四级0 1 2 精度±1% ±5% ±10% 表-4 五级编码-电阻标称值 000(0R) 101 102 103 104 105 010(1R)121 122 123 124 125 100(10R) 151 152 153 154 155 120 181 182 183 184 185 150 221 222 223 224 225 180 271 272 273 274 275 220 331 332 333 334 335 270 361 362 363 364 365 330 391 392 393 394 395 390 471 472 473 474 475 470 561 562 563 564 565 560 681 682 683 684 685 680 821 822 823 823 825 820 106 特殊电阻对照表 五级900 901 902 903 904 型号49.9R 12.4K 1.15K 44.2R 2.7R 五级905 906 907 908 909 型号37.4R 49.9k 6.19K 6.49K 7.68K 五级910 911 912 913 914 型号31.6K 40.2K 41.2K 53.6K 66.5K 五级915 916 917 918 919 型号80.6K 82.5K 165K 499K 例:MR221100 物料电阻-封装0603-1/10W-精度±5%-阻值10R 2)电容 C: 表-5 二级至五级编码对照表 二级0 1 2 3 4 8 9 封装0402 0603 0805 1206 钽0805 钽1206 三级0 1 2 3 4 9 耐压 6.3V 10V 25V 50V 16V >50V 四级0 1 2 3 精度±5% ±10% ±20% +80%

编码规则(标准)

企业信息化标准 QB/JF.12001-2007 编码规则 受控状态: 发放编号: 版 A/0 号: 2007—06-08发布2007—07-01实施 XXXXXX有限公司发布 XXXXXXXXX有限公司企业编码标准 QB/JF、12001—2007 公司组织机构编码规则 本标准参照了根据XXXXXXXXX有限公司对组织机构管理得需要,结合实际情况制定。 本标准起草部门:XXXXXXXXX有限公司信息系统部、 1主题内容与适用范围 本标准规定了XXXXXXXXX有限公司组织机构得分级、代码管理、 本标准适用于XXXXXXXXX有限公司组织得管理、登记、统计及会计核算等工作。 2术语 公司:具有独立法人资格或需要独立核算管理得分支机构或企业,可以定义为公司。

部门:有明确得职能范围与工作职责得组织。 3分类原则 本标准根据企业需要不设分类、 4编码方法 4、1本标准采用分级数字代码结构,共分五层,最长码为9位,第一层以一位阿拉伯数字表示,代表集团号;第二层以2位阿拉伯数字表示,代表集团部门,其中99表示分厂;第三层以两位阿拉伯数字表示,表示集团部门下属机构或分厂得序号;第四层以两位阿拉伯数字表示,表示分厂下属部门;第五层以两位阿拉伯数字表示,表示分厂下属部门班组、其分类结构如下:

XXXXXXXXX有限公司企业编码标准 QB/JF、12001-2007 员工代码编码规则 本标准参照了根据建发鞋楦公司对员工管理得需要,结合实际情况制定、 本标准起草单位:XXXXXXXXX有限公司。 1主题内容与适用范围 本标准规定了XXXXXXXXX有限公司员工得分类、代码及关键描述信息、岗位得分类。 本标准适用于XXXXXXXXX有限公司员工得管理、工资核算、考勤、奖惩、登记、统计及会计核算等工作、 2术语 岗位 泛指职位,执行一定职务得位置。 职级 员工对应得工资等级,与员工岗位技能相关、 3分类原则 根据企业管理得需要,人员编码不按特定意义区分,所有得分类以属性方式加以描述、 4 岗位编码

西安文理学院教学管理系统信息编码规则

西安文理学院教学管理系统信息编码规则 一、单位代码(院系、教研室、实验室、各行政科室) 2、教研室、实验室、器材室等 由四位数构成,1-2位为院系或部门,3-4位为科室。 如0101 古代文学教研室 0201 数学分析教研室 0301 人文与区域地理教研室 2001 干部培训科 二、教学人员代码(包括专任教师、教辅人员、双肩挑教师) 由六位数字构成:1-2位为院系,3-4位为教研室编号,5-6位为教师编号。 如:贺信民010101 杨开春020101 李海民030101 注:双肩挑教师在所属专业院系编码 三、专业代码 由五位数字构成:1-2位为院系,3位为本科或专科(本科1,专科2),4-5位为专业, 如: 01101汉语言文学专业 02101数学与应用数学专业 03101 旅游管理专业 03201 旅游管理专业 四、课程代码 (一)公共基础课程 由“G+5位数字”构成:第1-2位为课程开出院系,第3位为本科或专科(本科1,专

科2),第4-5位为课程。(如果该门课程分段,则在第6位表示段序)。公共基础课采取全院统一编码,具体编码如下:

注:课程编码中的第三位,面向本科开设为1,面向专科开设为2。 (二)教育类课程 由“J+5位数字”构成:1-2位为课程开出院系,3位为本科或专科(本科1,专科2),4-5位为课程。(如果该门课程分段,则在第6位表示段序)。具体编码如下: 注:1.课程编码中的第三位,面向本科开设为1,面向专科开设为2。 2.课程编码中的“×××××”,根据专业课程的编码规则编码。 (三)专业课程 由7位数字构成:1-2位为院系,3位为本科或专科(本科1,专科2),4-5位为专业,6-7位为课程。 如: 0110101语言学概论 0310101 旅游学概论 0320101 旅游学概论 注:课程包括本专业的所有课程;由于本学期要对我院的专科教学计划进行修订,在教学计划修订未最后确定前,请各院系教学计划研制人员先确定专科专业的课程名称,以便课程编码。 (四)公共选修课 由“X+5位数字构成”,1—2位代表课程类别,3—5位为课程。公选课的课程类别共分7类,01为人文社会科学类,02为理工类、03为艺术类、04为体育类、05为教育心理类、06为经济与管理类、07为语言类。 如:X01001 中国历史与文化

编码规则标准

编码规则标准 Prepared on 22 November 2020

企业信息化标准 QB/ 编码规则 受控状态: 发放编号: 版号: A/0 2007-06-08发布2007-07-01实施 XXXXXX有限公司发布 XXXXXXXXX有限公司企业编码标准 QB/ 公司组织机构编码规则 本标准参照了根据XXXXXXXXX有限公司对组织机构管理的需要,结合实际情况制定。 本标准起草部门:XXXXXXXXX有限公司信息系统部。 1主题内容与适用范围 本标准规定了XXXXXXXXX有限公司组织机构的分级、代码管理。 本标准适用于XXXXXXXXX有限公司组织的管理、登记、统计及会计核算等工作。 2术语 公司:具有独立法人资格或需要独立核算管理的分支机构或企业,可以定义为公司。 部门:有明确的职能范围和工作职责的组织。 3分类原则 本标准根据企业需要不设分类。 4编码方法 本标准采用分级数字代码结构,共分五层,最长码为9位,第一层以一位阿拉伯数字表示,代表集团号;第二层以2位阿拉伯数字表示,代表集团部门,其中99表示分厂;第三层以两位阿拉伯数字表示,表示集团部门下属机构或分厂的序号;第四层以两位阿拉伯

数字表示,表示分厂下属部门;第五层以两位阿拉伯数字表示,表示分厂下属部门班组。其分类结构如下: QB/ 员工代码编码规则 本标准参照了根据建发鞋楦公司对员工管理的需要,结合实际情况制定。

本标准起草单位:XXXXXXXXX 有限公司。 1主题内容与适用范围 本标准规定了XXXXXXXXX 有限公司员工的分类、代码及关键描述信息、岗位的分类。 本标准适用于XXXXXXXXX 有限公司员工的管理、工资核算、考勤、奖惩、登记、统计及会计核算等工作。 2术语 岗位 泛指职位,执行一定职务的位置。 职级 员工对应的工资等级,与员工岗位技能相关。 3分类原则 根据企业管理的需要,人员编码不按特定意义区分,所有的分类以属性方式加以描述。 4 岗位编码 本标准采用等长3位数字代码结构,以3位阿拉伯数字表示,表示顺序号。其分类结构如下: 所有岗位代码均采用3位编码,必须保证编码的唯一性。 岗位代码表(例) XXX 第一层

各种文字编码简介常见的编码都有介绍

各种文字编码简介 ASCII ASCII码是7位编码,编码范围是0×00-0×7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0×00-0×20和0×7F共33个控制字符。 只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码,为了传输中文邮件必须使用BASE64或者其他编码方式。 GB2312 GB2312是基于区位码设计的,区位码把编码表分为94个区,每个区对应94个位,每个字符的区号和位号组合起来就是该汉字的区位码。区位码一般用10进制数来表示,如1601就表示16区1位,对应的字符是“啊”。在区位码的区号和位号上分别加上0xA0就得到了GB2312编码。 区位码中01-09区是符号、数字区,16-87区是汉字区,10-15和88-94是未定义的空白区。 它将收录的汉字分成两级: 第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。一级汉字是按照拼音排序的,这个就可以得到某个拼音在一级汉字区位中的范围,很多根据汉字可以得到拼音的程序就是根据这个原理编写的。 GB2312字符集中除常用简体汉字字符外还包括希腊字母、日文平假名及片假名字母、俄语西里尔字母等字符,未收录繁体中文汉字和一些生僻字。可以用繁体汉字测试某些系统是不是只支持GB2312编码。GB2312的编码范围是 0xA1-0×7E,去掉未定义的区域之后可以理解为实际编码范围是0xA1-0xF7FE。 EUC-CN可以理解为GB2312的别名,和GB2312完全相同。

ERP系统编码规则

ERP信息系统编码原则 1 外购配件、原材料及其它外购辅具、辅料等物料的信息编码 编码结构为4段共9位,采用的是组合编码公式,具体结构及编码原则如下: 四级:按物料规格区分,用四位数字流水号表示 三级:按物料小类区分,用二位数字表示(01至99) 二级:按物料用途区分,用二位数字表示(01至99) 一级:按物料大类区分,用一位数字表示(0至9) 各级编码说明 注:三级编码没有分类的,第三位一律从“00”开始取值。 物料分类及编码举例 2 产成品、半成品信息编码 产成品、半成品信息编码结构为3层共5位,采用组合编码公式,具体结构及编码原则如下: X . X .XXX 三级:零(部)的流水号,用三位数字表示 二级:产品类型分类,用一位数字表示 一级:按照物料大类分段,数字9表示产成品、数字8表示半成品 产品类型信息编码说明 二级编码编码分类注备 1 件零 金2 合 3 45 9

例子产品编码:TS800H 产成品成半品:TS800H :TS800H 品外协半成客户物资:用于来料加工类物资出入库管理 注:半成品后两段编码保持与产成品后两段编码一致 3 部门编码 格式: XX .XX .XX 组、科室、工段标识(01~99) 二级部门或车间(01~99) 一级职能部门(01~99) 格式说明 编码采用三段数字流水码,段与段之间用小数点隔开。?每段编码均采用2 位数字流水号。?第二、三段编码中若无,则用00填补。?部门编码举例:? 第一段流水号表示一级职能部门:如04表示铸造部。 第二段流水号表示二级部门或车间:如01表示蜡模间。 ××(00-99) 第一段××(00-99) 第××(00-99) ××.××.××

ERP系统物料编码原则及规则

ERP系统物料编码原则及规则 物料编码原则及规则物料编码原则及规则 编码原则 第一节物料编码的意义 物料编码是以简短的文字、符号或数字、号码来代表物料、品名、规格或类别及其他有关事项的一种管理工具。在物料极为单纯、物料种类极少的工厂或许 有没有物料编码都无关紧要,但在物料多到数百种或数千、数万种以上的工厂, 物料编码就显得格外重要了。此时,物料的领发、验收,请购、跟催、盘点、储 存等工作极为频紧,而藉着物料编码,使各部门提高效率,各种物料资料传递迅 速、意见沟通更加容易。物料编码之功能如下: ? 增强物料资料的正确性 物料的领发、验收、请购、跟催、盘点、储存、记录等一切物料之活动均有物料 编码可以查核,因此物料数据更加正确。至于一物多名,一名多物或物名错乱之 现象不致于发生。 ? 提高物料管理的工作效率 物料既有系统的排列,以物料编码代替文字的记述,物料管理简便省事,效率因此提高。

? 利于电脑的管理 物料管理在物料编码推行彻底之后,方能进一步利用电脑作更有效的处理,以达到物料管理之效果。 ? 降低物料库存、降低成本 物料编码利于物料库存量的控制,同时利于呆料的防止,并提高物料管理工作的效率,因此可减轻资金的积压,降低成本。 ? 防止物料舞弊事件之发生 物料一经编码后,物料记录正确而迅速,物料储存井然有序,可以减少舞弊事件之发生。 ? 便于物料之领用 库存物料均有正确的统一的名称及规格予以编码。对用料部门的领用以及物料仓 库的发料都十分方便。 第二节物料编码的原则 物料编码必须合乎物料编码的原则,合理的物料编码,必须具备下列基本原则: l 简单性 l 分类展开性 l 完整性 l 单一性 l 一贯性 l 可伸缩性 l 组织性 l 适应电脑管理

编码规则标准

企业信息化标准QB/JF.12001-2007 编码规则 受控状态: 发放编号: 版号: A/0 2007-06-08发布2007-07-01实施 XXXXXX有限公司发布 XXXXXXXXX有限公司企业编码标准 QB/JF.12001-2007 公司组织机构编码规则 本标准参照了根据XXXXXXXXX有限公司对组织机构管理的需要,结合实际情况制定。 本标准起草部门:XXXXXXXXX有限公司信息系统部。 1主题内容与适用范围 本标准规定了XXXXXXXXX有限公司组织机构的分级、代码管理。 本标准适用于XXXXXXXXX有限公司组织的管理、登记、统计及会计核算等工作。 2术语 公司:具有独立法人资格或需要独立核算管理的分支机构或企业,可以定义为公司。 部门:有明确的职能范围和工作职责的组织。 3分类原则 本标准根据企业需要不设分类。 4编码方法 4.1本标准采用分级数字代码结构,共分五层,最长码为9位,第一层以一位阿拉伯数字表示,代表集团号;第二层以2位阿拉伯数字表示,代表集团部门,其中99表示分厂;

第三层以两位阿拉伯数字表示,表示集团部门下属机构或分厂的序号;第四层以两位阿拉伯数字表示,表示分厂下属部门;第五层以两位阿拉伯数字表示,表示分厂下属部门班组。其分类结构如下: XXXXXXXXX 有限公司企业编码标准 QB/JF.12001-2007 员工代码编码规则 本标准参照了根据建发鞋楦公司对员工管理的需要,结合实际情况制定。 本标准起草单位:XXXXXXXXX 有限公司。 X XX XX XX XX

1主题内容与适用范围 本标准规定了XXXXXXXXX 有限公司员工的分类、代码及关键描述信息、岗位的分类。 本标准适用于XXXXXXXXX 有限公司员工的管理、工资核算、考勤、奖惩、登记、统计及会计核算等工作。 2术语 岗位 泛指职位,执行一定职务的位置。 职级 员工对应的工资等级,与员工岗位技能相关。 3分类原则 根据企业管理的需要,人员编码不按特定意义区分,所有的分类以属性方式加以描述。 4岗位编码 4.1本标准采用等长3位数字代码结构,以3位阿拉伯数字表示,表示顺序号。其分类结构如下: 4.2 所有岗位代码均采用3位编码,必须保证编码的唯一性。 4.3岗位代码表(例) XXX 第一层

字符编码

1、什么是字符编码,为什么要字符编码? 2、区分“字符集”和“编码” 3、几种常用的字符编码。 首先介绍一下拉丁字母: 拉丁字母,也叨罗马字母,是当仂丐界上使用最广的字母系统。 拉丁字母,戒者说基本的拉丁字母,就是你所常见的到的ABCD 等26 个英文字母。 原先是欧洲那边使用的,后来由亍欧洲殖民主义,导致后来的美洲等地,也是用的这套字 母体系。 而其他有些地方,比如越南等,本来有自己的文字语言的,结果受西斱文化的影响和由亍 基督教的传播,也用拉丁字母了。 所以总的说,现在欧洲多数国家,美洲,澳洲,非洲的多数国家,都是用的拉丁字母,即 你所常见的英文字母,也是拉丁字母。而中国的汉语拼音,也是用的这个拉丁字母。 那字符编码是什么? 计算机中存放的都是0 和1 的二进制值。8 个位对应一个字节,常用16 迚制来表示。 而我们普通用户所希望看到的是,计算机把其所存储的对应的16 迚制的数值,转化为对 应的字符,包括英文和中文等其他语言的字符,然后输出到屏幕上。而所谓编码,就是,定义了一套规则,去指定,哪些数值,对应着哪些字符。举个最简单的例子,常见65=0x41 对应的是大写字母A,97=0x61 对应的是小写字母a,而这套数值和字母之间的映射兰系,说白了,就是一套规则,就叫做字符编码,即我们常说 的ASCII 编码。 所以字符编码就是:定义了一套规则,指定了计算机中存放的这么多值中的哪个值,对应 了电脑屏幕显示出来的哪个字母。 区分一下“字符集”和“编码” 使用哪些字符。也就是说哪些汉字,字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。 规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做“编码”。 各个国家和地区在制定编码标准的时候,“字符的集合”和“编码”一般都是同时制定的。因此,平常我们所说的“字符集”,比如:GB2312, GBK, JIS 等,除了有“字符的集合”这层含义外,同时也包含了“编码”的含义。 区分一下“字符集”和“编码”的概念很重要,因为有的字符集有多种“编码”实现。 下面介绍几种具体的字符编码。 大致按照它们出现的先后顺序进行介绍。 计算机刚出现的旪候,虽然是美国人发明的,但是也要面对一个问题,即如何将对应的计 算机中的数值,转化为对应的字母,而显示出来,即采用什么样的规则,而当时,各个厂

相关文档
最新文档