常用汉字的Unicode码表

常用汉字的Unicode码表
常用汉字的Unicode码表

包含汉字:

的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之

都好看起发当没成只如事把还用第样道想作种开美总从无情己面最女但现前些所同日手又行意动方期它头经长儿回位分爱老因很给

名法间斯知世什两次使身者被高已亲其进此话常与活正感见明问力理尔点文几定本公特做外孩相西果走将月十实向声车全信重

三机工物气每并别真打太新比才便夫再书部水像眼等体却加电主界门利海受听表德少克代员许稜先口由死安写性马光白或住难

望教命花结乐色更拉东神记处让母父应直字场平报友关放至张认接告入笑内英军候民岁往何度山觉路带万男边风解叫任金快原

吃妈变通师立象数四失满战远格士音轻目条呢病始达深完今提求清王化空业思切怎非找片罗钱紶吗语元喜曾离飞科言干流欢约

各即指合反题必该论交终林请医晚制球决窢传画保读运及则房早院量苦火布品近坐产答星精视五连司巴奇管类未朋且婚台夜青

北队久乎越观落尽形影红爸百令周吧识步希亚术留市半热送兴造谈容极随演收首根讲整式取照办强石古华諣拿计您装似足双妻

尼转诉米称丽客南领节衣站黑刻统断福城故历惊脸选包紧争另建维绝树系伤示愿持千史谁准联妇纪基买志静阿诗独复痛消社算

义竟确酒需单治卡幸兰念举仅钟怕共毛句息功官待究跟穿室易游程号居考突皮哪费倒价图具刚脑永歌响商礼细专黄块脚味灵改

据般破引食仍存众注笔甚某沉血备习校默务土微娘须试怀料调广蜖苏显赛查密议底列富梦错座参八除跑亮假印设线温虽掉京初

养香停际致阳纸李纳验助激够严证帝饭忘趣支春集丈木研班普导顿睡展跳获艺六波察群皇段急庭创区奥器谢弟店否害草排背止

组州朝封睛板角况曲馆育忙质河续哥呼若推境遇雨标姐充围案伦护冷警贝著雪索剧啊船险烟依斗值帮汉慢佛肯闻唱沙局伯族低

玩资屋击速顾泪洲团圣旁堂兵七露园牛哭旅街劳型烈姑陈莫鱼异抱宝权鲁简态级票怪寻杀律胜份汽右洋范床舞秘午登楼贵吸责

例追较职属渐左录丝牙党继托赶章智冲叶胡吉卖坚喝肉遗救修松临藏担戏善卫药悲敢靠伊村戴词森耳差短祖云规窗散迷油旧适

乡架恩投弹铁博雷府压超负勒杂醒洗采毫嘴毕九冰既状乱景席珍童顶派素脱农疑练野按犯拍征坏骨余承置臓彩灯巨琴免环姆暗

换技翻束增忍餐洛塞缺忆判欧层付阵玛批岛项狗休懂武革良恶恋委拥娜妙探呀营退摇弄桌熟诺宣银势奖宫忽套康供优课鸟喊降

夏困刘罪亡鞋健模败伴守挥鲜财孤枪禁恐伙杰迹妹藸遍盖副坦牌江顺秋萨菜划授归浪听凡预奶雄升碃编典袋莱含盛济蒙棋端腿

招释介烧误

unicode 编码

的一是了我不人在他有这%u4e2a上们来

到时大地为子中你说生国%u5e74着就那和要她出也得里后自以会%u5bb6可下而过天去能对小多然于心学%u4e48之都好看起发当没成只如事把还%u7528第样道想作种开美总从无情己面%u6700女但现前些所同日手又行意动方%u671f它头经长儿回位分爱老因很给名%u6cd5间斯知世什两次使身者被高已亲%u5176进此话常与活正感见明问力理尔%u70b9文几定本公特做外孩相西果走将%u6708十实向声车全信重三机工物气每%u5e76别真打太新比才便夫再书部水像%u773c等体却加电主界门利海受听表德%u5c11克代员许稜先口由死安写性马光%u767d或住难望教命花结乐色更拉东神%u8bb0处让母父应直字场平报友关放至%u5f20认接告入笑内英军候民岁往何度%u5c71觉路带万男边风解叫任金快原吃%u5988变通师立象数四失满战远格士音%u8f7b目条呢病始达深完今提求清王化%u7a7a业思切怎非找片罗钱紶吗语元喜%u66fe离飞科言干流欢约各即指合反题%u5fc5该论交终林请医晚制球决窢传画%u4fdd读运及则房早院量苦火布品近坐%u4ea7答星精视五连司巴奇管类未朋且%u5a5a台夜青北队久乎越观落尽形影红%u7238百令周吧识步希亚术留市半热送%u5174造谈容极随演收首根讲整式取照%u529e强石古华諣拿计您装似足双妻尼%u8f6c诉米称丽客南领节衣站黑刻统断%u798f城故历惊脸选包紧争另建维绝树%u7cfb伤示愿持千史谁准联妇纪基买志%u9759阿诗独复痛消社算义竟确酒需单%u6cbb卡幸兰念举仅钟怕共毛句息功官%u5f85究跟穿室易游程号居考突皮哪费%u5012价图具刚脑永歌响商礼细专黄块%u811a味灵改据般破引食仍存众注笔甚%u67d0沉血备习校默务土微娘须试怀料%u8c03广蜖苏显赛查密议底列富梦错座%u53c2八除跑亮假印设线温虽掉京初养%u9999停际致阳纸李纳验助激够严证帝%u996d忘趣支春集丈木研班普导顿睡展%u8df3获艺六波察群皇段急庭创区奥器%u8c22弟店否害草排背止组州朝封睛板%u89d2况曲馆

育忙质河续哥呼若推境遇%u96e8标姐充

围案伦护冷警贝著雪索剧%u554a船险烟

依斗值帮汉慢佛肯闻唱沙%u5c40伯族低

玩资屋击速顾泪洲团圣旁%u5802兵七露

园牛哭旅街劳型烈姑陈莫%u9c7c异抱宝

权鲁简态级票怪寻杀律胜%u4efd汽右洋

范床舞秘午登楼贵吸责例%u8ffd较职属

渐左录丝牙党继托赶章智%u51b2叶胡吉

卖坚喝肉遗救修松临藏担%u620f善卫药

悲敢靠伊村戴词森耳差短%u7956云规窗

散迷油旧适乡架恩投弹铁%u535a雷府压

超负勒杂醒洗采毫嘴毕九%u51b0既状乱

景席珍童顶派素脱农疑练%u91ce按犯拍

征坏骨余承置臓彩灯巨琴%u514d环姆暗

换技翻束增忍餐洛塞缺忆%u5224欧层付

阵玛批岛项狗休懂武革良%u6076恋委拥

娜妙探呀营退摇弄桌熟诺%u5ba3银势奖

宫忽套康供优课鸟喊降夏%u56f0刘罪亡

鞋健模败伴守挥鲜财孤枪%u7981恐伙杰

迹妹藸遍盖副坦牌江顺秋%u8428菜划授

归浪听凡预奶雄升碃编典%u888b莱含盛

济蒙棋端腿招释介烧误

的范围分布在多个区段中,u4e00~u9fff是整个CJK Unicode Unicode 中区块表,带有 CJK 的区块名中都拥有汉字。但最常用的范围是 U+4E00~U+9FA5,即名

为:CJK Unified Ideographs 的区块,但 U+9FA6~U+9FFF 之间的字符还属于空码,

暂时还未定义,但不能保证以后不会被定义。

下面这个是 Unicode 中 U+4E00~U+9FFF 的码表:

在这里可以根据 Unicode 码查到所有的字符:

另:在正则表达式中使用 [一-龥] 这种方式属于写死的代码,并不能根据平台所提供的字符集范围不同而改变,不过对于要求不是很高的话的是可以了。如果对字符集的要求很高,可以采用下面的这种 Unicode 块的方式:

[java]view plaincopyprint?

1.String regex = [\\p{InCJK Unified Ideographs}&&\\P{Cn}]];

在当前的 JDK 版中与 [一-龥] 的意义一致。但这样可以匹配 Java 平台所支持Unicode 块名为 CJK Unified Ideogrpahs 中已定义的字符,这种方式就属于“活”代码

今后的 JDK 版本升级了,定义到了 ? 的字符,同样能够满足匹配。

简单几句话总结Unicode,UTF-8和UTF-16

概念 先说一说基本的概念,这包括什么是Unicode,什么是UTF-8,什么是UTF-16。 Unicode,UTF-8,UTF-16完整的说明请参考Wiki(Unicode,UTF-8,UTF-16)。用比较简单的话来说就是,Unicode定义了所有可以用来表示字符的数值集合(称之为Code Point)。UTF-8和UTF-16等UTF标准定义了这些数值和字符的映射关系。 UTF-8 优势 UTF-8最大的优势是,没有字节序的概念。所以特别适合用于字符串的网络数据传输,不用考虑大小端问题。 劣势 本地字符串处理过程中,如果使用UTF-8,对于英文字符的处理没有太大的问题。一个char 变量表示一个英文字符。但是对于中文等远东字符集来说,就比较坑爹了。char str[]; str[0]并不能完整表示一个汉字。UTF-8编码格式下,一个汉字需要至少3个char才能表示。这对于通过下标来操作字符串的操作来说是非常痛苦的一件事情。 另外,一个汉字需要至少3个char来表示,也让汉字在网络传输上存在劣势,占用太多流量。 UTF-16 优势 UTF-16 LE是windows上默认的Unicode编码方式,使用wchar_t表示。所有wchar_t *类型的字符串(包括硬编码在.h/.cpp里的字符串字面值),VC都自动采用UTF-16的编码(字符串字面值,literal string,存在很多坑。特别是char *类型的字面值,最终内存使用何种编码方式完全取决于当前文件的编码方式。也就是说当前文件如果是GBK编码的,那么文件里char * str = "中午",str指向的内存字符串二进制是使用GBK编码的。如果文件编码是UTF-8,那么内存是使用UTF-8编码。所以为什么一直要强调字符串应该放在资源文件里,而不是硬编码在.h/.cpp文件里!)。 UTF-16另外一个优势就是常用字符都可以使用两个个字节表示,也就是一个wchar_t(这里指Windows平台)。所以,在Windows平台上,特别适合使用wchar_t来作为字符串的存储基类型。一个wchar_t表示一个字符。操作使用非常方便。 劣势 没有统一的表示UTF-16编码的字符类型。C++98/03里对wchar_t的定义是非常宽泛的。这导致在Windows平台上,wchar_t是2字节的;在Unix-like系统上是4字节的。代码移植上,可能会遇到挑战(我没移植过,所以不确定会有什么难度,以及难度有多大)。 即使最新的C++11里已经定义除了char16_t表示UTF-16,MS的VS2013还不支持char16_t。所以目前使用char16_t还不具移植性。 据我了解,UTF-16编码和GBK编码相比,还存在一个排序的劣势。也就是说,如果要按照

常用汉字及其内码表

常用汉字及其内码表 一画 一D2BB 乙D2D2 二画 二B6FE 十CAAE 丁B6A1 厂B3A7 七C6DF 卜B2B7 人C8CB 入C8EB 八B0CB 九BEC5 几BCB8 儿B6F9 了C1CB 力C1A6 乃C4CB 刀B5B6 又D3D6 三画 三C8FD 于D3DA 干B8C9 亏BFF7 士CABF 工B9A4 土CDC1 才B2C5 寸B4E7 下CFC2 大B4F3 丈D5C9 与D3EB 万CDF2 上C9CF 小D0A1 口BFDA 巾BDED 山C9BD 千C7A7 乞C6F2 川B4A8 亿D2A2 个B8F6 勺C9D7 久BEC3 凡B7B2 及BCB0 夕CFA6 丸CDE8 么C3B4 广B9E3 亡CDF6 门C3C5 义D2E5 之D6AE 尸CAAC 弓B9AD 己BCBA 已D2D1 子D7D3 卫CEC0 也D2B2 女C5AE 飞B7C9 刃C8D0 习CFB0 叉B2E6 马C2ED 乡CFE7 四画丰王井开夫天元无云专扎艺木五支厅不太犬区历友尤匹车巨牙屯比互切瓦止少日中贝内水冈见手午牛毛气升长仁什片仆化仇币仍仅斤爪反介父从今凶分乏公仓月氏勿风欠丹匀乌勾凤六文方火为斗忆计订户认心尺引丑巴孔队办以允予劝双书幻 丰:B7E1王:CDF5井:BEAE开:BFAA夫:B7F2天:CCEC无:CEDE元:D4AA专:D7A8云:D4C6扎:D4FA 艺:D2D5 木:C4BE 五:CEE5 支:D6A7 厅:CCFC 不:B2BB 太:CCAB 犬:C8AE 区:C7F8 历:C0FA 尤:D3C8 友:D3D1 匹:C6A5 车:B3B5 巨:BEDE 牙:D1C0 屯:CDCD 比:B1C8 互:BBA5

Unicode汉字编码表

Unicode汉字编码表 1 unicode编码表 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。 编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode 对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用4个字节来编码字符,不过现在普遍采用的还是UCS-2,只用两个字节来编码,看一下Unicode对汉字的编码: ------------------------------------------------------------------------ 2 汉字编码表 U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一丁丂七丄丅丆万丈三上下丌不与丏 4e10 丐丑丒专且丕世丗丘丙业丛东丝丞丟 4e20 丠両丢丣两严並丧丨丩个丫丬中丮丯

汉字编码

汉字编码 1.汉字的区位码由一个汉字的区号和位号组成,其区号和位号的范围各为______。 A、区号 1-95 ,位号 1-95 B、区号 1-94 ,位号 1-94 C、区号 0-94 ,位号 0-94 D、区号 0-95 ,位号 0-95 2.下列4个4位十进制数中,属于正确的汉字区位码的是______。 A、5601 B、9596 C、9678 D、8799 3.区位码输入法的最大优点是______。 A、一字一码,无重码 B、易记易用 C、只用数码输入,简单易用 D、编码有规律, 不易忘记 4.根据汉字国标GB2312-80的规定,一级常用汉字个数是_____。 A、3000个 B、7445个 C、3008个 D、3755个 5.在微型机中,普遍采用的字符编码是______。 A、BCD码 B、ASCII码 C、EBCD码 D、补码 6.一个汉字的内码码长为______。 A、8 bits B、12 bits C、16 bits D、24 bits 7.根据国标GB2312-80的规定,总计有各类符号和一、二级汉字编码______。 A、7145个 B、7445个 C、3008个 D、3755个 8.根据汉字国标GB2312-80的规定,二级次常用汉字个数是____。 A、3000个 B、7445个 C、3008个 D、3755个 9.若已知一汉字的国标码是5E38H,则其内码是______。 A、DEB8H B、DE38H C、5EB8H D、7E58H 10.显示或打印汉字时,系统使用的是汉字的______。 A、机内码 B、字形码 C、输入码 D、国标交换码 11.已知”装”字的拼音输入码是”zhuang”,而”大”的拼音输入码是”da”,则存储它们的内码分别需要的字节个数是______。 A、6,2 B、3,1 C、2,2 D、3,2 12.根据汉字国标码GB2312-80的规定,将汉字分为常用汉字和次常用汉字两级。次常用汉字按______排列。 A、偏旁部首 B、汉语拼音字母 C、笔划多少 D、使用频率多少 13.已经知汉字”中”的区位码是5448,则其国标码是______。 A、7468D B、3630H C、6862H D、5650H 14.汉字国标码(GB2312-80)把汉字分成______等级。 A、简化字和繁体字两个 B、一级汉字,二级汉字,三级汉字共三个 C、一级汉字,二级汉字共二个 D、常用字,次常用字,罕见字三个 15.要存放10个24×24点阵的汉字字模,需要______存储空间。 A、72B B、320B C、720B D、72KB 16.用16×16点阵来表示汉字的字型,存储一个汉字的字型需用______个字节。 A、16×1 B、16×2 C、16×3 D、16×4 17.一个汉字的国标码用2个字节存储,其每个字节的最高二进制位的值分别为______。 A、0,0 B、1,0 C、0,1 D、1,1 18.根据汉字国标码GB2312-80的规定,将汉字分为常用汉字(一级)和非常用汉字(二级)两级汉字。一级常用汉字按______排列。

常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、...

ASCII ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。 只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码,为了传输中文邮件必须使用BASE64或者其他编码方式。 GB2312 GB2312是基于区位码设计的,区位码把编码表分为94个区,每个区对应94个位,每个字符的区号和位号组合起来就是该汉字的区位码。区位码一般用10进制数来表示,如1601就表示16区1位,对应的字符是“啊”。在区位码的区号和位号上分别加上0xA0就得到了GB2312编码。 区位码中01-09区是符号、数字区,16-87区是汉字区,10-15和88-94是未定义的空白区。它将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。一级汉字是按照拼音排序的,这个就可以得到某个拼音在一级汉字区位中的范围,很多根据汉字可以得到拼音的程序就是根据这个原理编写的。 GB2312字符集中除常用简体汉字字符外还包括希腊字母、日文平假名及片假名字母、俄语西里尔字母等字符,未收录繁体中文汉字和一些生僻字。可以用繁体汉字测试某些系统是不是只支持GB2312编码。 GB2312的编码范围是0xA1A1-0x7E7E,去掉未定义的区域之后可以理解为实际编码范围是0xA1A1-0xF7FE。 EUC-CN可以理解为GB2312的别名,和GB2312完全相同。 区位码更应该认为是字符集的定义,定义了所收录的字符和字符位置,而GB2312及EUC-CN是实际计算机环境中支持这种字符集的编码。HZ和ISO- 2022-CN是对应区位码字符集的另外两种编码,都是用7位编码空间来支持汉字。区位码和GB2312编码的关系有点像Unicode和UTF-8。 GBK GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。同GB2312一样,GBK也支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。GBK还收录了GB2312不包含的汉字部首符号、竖排标点符号等字符。 GBK的整体编码范围是为0x8140-0xFEFE,不包括低字节是0×7F的组合。高字节范围是0×81-0xFE,低字节范围是0x40-7E和0x80-0xFE。

unicode中的中文编码说明

编码表 平面0 (0000–FFFF): 基本多文种平面(Basic Multilingual Plane, BMP). 平面1 (10000–1FFFF): 多文种补充平面(Supplementary Multilingual Plane, SMP). 平面2 (20000–2FFFF): 表意文字补充平面(Supplementary Ideographic Plane, SIP). 平面3 (30000–3FFFF): 表意文字第三平面(Tertiary Ideographic Plane, TIP). 平面4 to 13 (40000–DFFFF)尚未使用 平面14 (E0000–EFFFF): 特别用途补充平面(Supplementary Special-purpose Plane, SSP) 平面15 (F0000–FFFFF)保留作为私人使用区(Private Use Area, PUA) 平面16 (100000–10FFFF),保留作为私人使用区(Private Use Area, PUA) 注意1 现在网上大多数用于判断中文字符的是U+4E00..U+9FA5这个范围是只是“中日韩统一表意文字”这个区间,但这不是全部,如果要全部包含,则还要他们的扩展集、部首、象形字、注间字母等等; 2E80-A4CF加上F900-FAFF加上FE30-FE4F。 其中: 2E80-A4CF 包含了中日朝部首补充、康熙部首、表意文字描述符、中日朝符号和标点、日文平假名、日文片假名、注音字母、谚文兼容字母、象形字注释标志、注音字母扩展、中日朝笔画、日文片假名语音扩展、带圈中日朝字母和月份、中日朝兼容、中日朝统一表意文字扩展A、易经六十四卦符号、中日韩统一表意文字、彝文音节、彝文字根 F900-FAFF 中日朝兼容表意文字 FE30-FE4F 中日朝兼容形式 所以,一般用4E00-9FA5已经可以,如果要更广,则用2E80-A4CF || F900-FAFF||FE30-FE4F 注意2 全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF

汉字编码表

附表二:常用汉字输入3位数码表 001 002 003 004 A:安暗按案 005 006 007 008009 010 011 012013 014 015 B:吧八白百败班般板半包办016 017 018 019020 021 022 023024 025 026 棒帮薄保报北备被本泵比 027 028 029 030031 032 033 034035 036 037 闭边编变标表滨宾丙病并 038 039 040 041042 043 044 玻播波补不布部 C:045046 047 048049 050 051 052053 054055 裁材财彩菜餐参仓藏操草056057 058 059 060 061 062 063064 065 066 厕策侧册测层茶查察差柴067068 069 070 071072 073 074 075076 077 产场常长厂超朝巢车陈称078079 080 081082 083 084 085086 087 088 城成程吃持池此充冲初出089090 091 092093 094 095 096097 098 099 厨除储处川传船串窗春磁

100101 102 103 104105 106 次从粗翠存错萃 D:107 108 109 110 111 112 113 114 115 116 117 达打答大带代待丹单当党 118 119 120 121 122 123 124 125 126 127 128 档岛导到道盗德得的等登129 130 131 132 133 134 135 136 137 138 139 灯低笛迪底地第点电店吊140 141 142 143 144 145 146 147 148 149 150 调碟顶定订东动栋都督毒151 152 153 154 155 156 157 158 杜度段断堆队对多 E:159 160 161 162 儿耳尔二 F:163 164 165 166 167 168 169 170 171 172 173 发阀法返范芳方房防访放 174 175 176 177 178 179 180 181 182 183 184 非啡肥费分粉封风凤否 185 186 187 188 189 190 191 192 193 194 195 符扶服福副复付负附芙赋 196 197 翡翻

汉字区位码表

汉字区位码表 — 查找说明 所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。在此介绍的是《国家标准信息交换汉字编码》。这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。 ()按音序查 常用汉字按音序几乎都可查到,例如:“白”字,首先,按其发音查在汉字编码表中的位置,然后在范围内查“白”字,找到“白”字后,其汉字右侧的数字就是“白”的汉字编码。 ()关于多音字的查找 由于汉字编码是一种无重码的汉字编码,所以多音字只有一个编码。在查多音字时,如果用某个音查不到,可换另外的音去查。例如:重庆的“重”和重量的“重”,字同音不同,汉字“重”的编码是按音编码的。 ()生僻字的填涂方法 对于姓名汉字或单位不在给定的编码表中的情况的考生,让考生涂写编码代替该字。 啊阿吖嗄腌锕埃挨哎唉哀皑癌蔼矮艾碍爱隘捱 嗳 嗌 嫒 瑷 暧 砹 锿 霭 鞍 氨 安 俺 按 暗 岸 胺 案 谙 埯 揞 犴 庵 桉 铵 鹌 黯 肮 昂 盎 凹 敖 熬 翱 袄 傲 奥 懊 澳 坳 拗 嗷 岙 廒 遨 媪 骜 獒 聱 螯 鏊 鳌 鏖 芭 捌 扒 叭 吧 笆 八 疤 巴 拔 跋 靶 把 耙 坝 霸 罢 爸 茇 菝 岜 灞 钯 粑 鲅 魃 白 柏 百 摆 佰 败 拜 稗 捭 呗 掰 斑 班 搬 扳 般 颁 板 版 扮 拌 伴 瓣 半 办 绊 阪 坂 钣 瘢 癍 舨 邦 帮 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 蒡 浜 苞 胞 包 褒 剥 薄

雹保堡饱宝抱报暴豹鲍爆葆孢煲鸨褓趵龅杯碑悲卑北辈背贝钡倍狈备惫焙被孛陂邶埤 萆 蓓 悖 碚 鹎 褙 鐾 鞴 奔 苯 本 笨 畚 坌 贲 锛 崩 绷 甭 泵 蹦 迸 嘣 甏 逼 鼻 比 鄙 笔 彼 碧 蓖 蔽 毕 毙 毖 币 庇 痹 闭 敝 弊 必 辟 壁 臂 避 陛 匕 俾 芘 荜 荸 薜 吡 哔 狴 庳 愎 滗 濞 弼 妣 婢 嬖 璧 睥 畀 铋 秕 裨 筚 箅 篦 舭 襞 跸 髀 鞭 边 编 贬 扁 便 变 卞 辨 辩 辫 遍 匾 弁 苄 忭 汴 缏 煸 砭 碥 窆 褊 蝙 笾 鳊 标 彪 膘 表 婊 骠 杓 飑 飙 飚 镖 镳 瘭 裱 鳔 髟 鳖 憋 别 瘪 蹩 彬 斌 濒 滨 宾 摈 傧 豳 缤 玢 槟 殡 膑 镔 髌 鬓 兵 冰 柄 丙 秉 饼 炳 病 并 禀 邴 摒 玻 菠 播 拨 钵 波 博 勃 搏 铂 箔 伯 帛 舶 脖 膊 渤 泊 驳 亳 啵 饽 檗 擘 礴 钹 鹁 簸 跛 踣 捕 卜 哺 补 埠 不 布 步 簿 部 怖 卟 逋 瓿 晡 钚 钸 醭 擦 嚓 礤 猜 裁 材 才 财 睬 踩 采 彩 菜 蔡 餐 参 蚕 残 惭 惨 灿 孱 骖 璨 粲 黪 苍 舱 仓 沧 藏 操 糙 槽 曹 草 嘈 漕 螬 艚 厕 策 侧 册 测 恻

常用汉字的Unicode码表

包含汉字: 的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之 都好看起发当没成只如事把还用第样道想作种开美总从无情己面最女但现前些所同日手又行意动方期它头经长儿回位分爱老因很给 名法间斯知世什两次使身者被高已亲其进此话常与活正感见明问力理尔点文几定本公特做外孩相西果走将月十实向声车全信重 三机工物气每并别真打太新比才便夫再书部水像眼等体却加电主界门利海受听表德少克代员许稜先口由死安写性马光白或住难 望教命花结乐色更拉东神记处让母父应直字场平报友关放至张认接告入笑内英军候民岁往何度山觉路带万男边风解叫任金快原 吃妈变通师立象数四失满战远格士音轻目条呢病始达深完今提求清王化空业思切怎非找片罗钱紶吗语元喜曾离飞科言干流欢约 各即指合反题必该论交终林请医晚制球决窢传画保读运及则房早院量苦火布品近坐产答星精视五连司巴奇管类未朋且婚台夜青 北队久乎越观落尽形影红爸百令周吧识步希亚术留市半热送兴造谈容极随演收首根讲整式取照办强石古华諣拿计您装似足双妻 尼转诉米称丽客南领节衣站黑刻统断福城故历惊脸选包紧争另建维绝树系伤示愿持千史谁准联妇纪基买志静阿诗独复痛消社算 义竟确酒需单治卡幸兰念举仅钟怕共毛句息功官待究跟穿室易游程号居考突皮哪费倒价图具刚脑永歌响商礼细专黄块脚味灵改 据般破引食仍存众注笔甚某沉血备习校默务土微娘须试怀料调广蜖苏显赛查密议底列富梦错座参八除跑亮假印设线温虽掉京初 养香停际致阳纸李纳验助激够严证帝饭忘趣支春集丈木研班普导顿睡展跳获艺六波察群皇段急庭创区奥器谢弟店否害草排背止 组州朝封睛板角况曲馆育忙质河续哥呼若推境遇雨标姐充围案伦护冷警贝著雪索剧啊船险烟依斗值帮汉慢佛肯闻唱沙局伯族低 玩资屋击速顾泪洲团圣旁堂兵七露园牛哭旅街劳型烈姑陈莫鱼异抱宝权鲁简态级票怪寻杀律胜份汽右洋范床舞秘午登楼贵吸责 例追较职属渐左录丝牙党继托赶章智冲叶胡吉卖坚喝肉遗救修松临藏担戏善卫药悲敢靠伊村戴词森耳差短祖云规窗散迷油旧适 乡架恩投弹铁博雷府压超负勒杂醒洗采毫嘴毕九冰既状乱景席珍童顶派素脱农疑练野按犯拍征坏骨余承置臓彩灯巨琴免环姆暗 换技翻束增忍餐洛塞缺忆判欧层付阵玛批岛项狗休懂武革良恶恋委拥娜妙探呀营退摇弄桌熟诺宣银势奖宫忽套康供优课鸟喊降 夏困刘罪亡鞋健模败伴守挥鲜财孤枪禁恐伙杰迹妹藸遍盖副坦牌江顺秋萨菜划授归浪听凡预奶雄升碃编典袋莱含盛济蒙棋端腿 招释介烧误 unicode 编码 的一是了我不人在他有这%u4e2a上们来

汉字区位码表

附表 附表1:汉字区位码表: 汉字区位码共收汉字6763个,分成两级。第一级汉字3755个,置于16区至55区;第二级汉字3008个,置于56区至87区。 汉字区位码为4位数,每个汉字都有一个对应的4位数码。查表时,首先在目录里按拼音字母在第一级找到所需汉字的对应编码。如果在第一级汉字表中找不到所需的汉字,可在第二级汉字表目录中按部首查找所需汉字对应的区位,再到该区中查找所需汉字的对应编码。 第一级汉字按汉语拼音字母顺序排列,同音字以笔画顺序横、竖、撇、点、折为序;起 第二级汉字按部首排列,本表采用的部首与一般字典用的部首基本相同。部首次序及同部首字按笔划数排列,同划数的字以笔画顺序横、竖、撇、点、折为序;起笔相同,按 第1 区 1601 1602 1603 1604 1605 1606 1607 1608 1609 1610 啊阿埃挨哎唉哀皑癌蔼 1611 1612 1613 1614 1615 1616 1617 1618 1619 1620 矮艾碍爱隘鞍氨安俺按

1621 1622 1623 1624 1625 1626 1627 1628 1629 1630 暗岸胺案肮昂盎凹敖熬1631 1632 1633 1634 1635 1636 1637 1638 1639 1640 翱袄傲奥懊澳芭捌扒叭1641 1642 1643 1644 1645 1646 1647 1648 1649 1650 吧笆八疤巴拔跋靶把耙1651 1652 1653 1654 1655 1656 1657 1658 1659 1660 坝霸罢爸白柏百摆佰败1661 1662 1663 1664 1665 1666 1667 1668 1669 1670 拜稗斑班搬扳般颁板版1671 1672 1673 1674 1675 1676 1677 1678 1679 1680 扮拌伴瓣半办绊邦帮梆1681 1682 1683 1684 1685 1686 1687 1688 1689 1690 榜膀绑棒磅蚌镑傍谤苞1691 1692 1693 1694 胞包褒剥 第2 区 1701 1702 1703 1704 1705 1706 1707 1708 1709 1710 薄雹保堡饱宝抱报暴豹1711 1712 1713 1714 1715 1716 1717 1718 1719 1720 鲍爆杯碑悲卑北辈背贝1721 1722 1723 1724 1725 1726 1727 1728 1729 1730 钡倍狈备惫焙被奔苯本1731 1732 1733 1734 1735 1736 1737 1738 1739 1740 笨崩绷甭泵蹦迸逼鼻比1741 1742 1743 1744 1745 1746 1747 1748 1749 1750 鄙笔彼碧蓖蔽毕毙毖币1751 1752 1753 1754 1755 1756 1757 1758 1759 1760 庇痹闭敝弊必辟壁臂避1761 1762 1763 1764 1765 1766 1767 1768 1769 1770 陛鞭边编贬扁便变卞辨1771 1772 1773 1774 1775 1776 1777 1778 1779 1780 辩辫遍标彪膘表鳖憋别1781 1782 1783 1784 1785 1786 1787 1788 1789 1790 瘪彬斌濒滨宾摈兵冰柄1791 1792 1793 1794 丙秉饼炳 第3 区 1801 1802 1803 1804 1805 1806 1807 1808 1809 1810 病并玻菠播拨钵波博勃1811 1812 1813 1814 1815 1816 1817 1818 1819 1820

汉字取内码.区位码及拼音简码源代码

汉字取内码.区位码及拼音简码源代码 汉字内取、码位区码拼及音码简源码代汉字 取码、内区码及位音简码拼 .本版2 . 子程序取字汉内码, 文型本, 开公 .参待数汉字查 ,文型本 局部.变量字高节整,型 数.部变局低字节,量整型数 局部.量变内, 文本码 '型代源中的“码字高”和“节字节”可低直以用字接节数据型而不用,数型整这,样不就用“位与”运算做了。 高节=字与位 (取码代(待汉查字 ,1, )25)5 低字=位节与(取码代(待汉字, 2)查 ,55)2内码 =取六十制进本文高(字) +节取十六制文进本 (低字节) 返回( 码内) .子序程取字区汉位,码文型, 本公 .开参数待查字,汉本文型 局.变部量高字 ,节数型 .整部局变量低节字,整数 型.部局变量内码, 文本 .型部局量区码, 变数型整 .局部量变码位,整数型 局部变量区位码. 文本, 型

字高节位= (取代码与待(查汉, 1字, 255))低字 节位= (与取代 (待码查汉字, 2, )255 )码=取内十六制进本文高(节)字+取六进十制文本低字节() 码区=高节字-160 码位=低字节- 1 06 区码=位到本文(区码×10 +0 码位) 返回(区位码) 子程序取汉.字音拼码简文本,,型公 , 开GB28取2-18一级0字汉库拼音简字码.参数待 汉查字, 文型 本.部变局高字节量,整数型 .局部量变低节字, 数型整 局部.量内变码 ,文本型 .局部变量区码, 整数型 .局部量变位码 ,整型 .局数变量部位码区, 整数型 字高节=与 (取代码位待(查汉字 ,1,)2 5)5 字节低=位与( 代取码(查待字,汉2 ), 525) 码内=十六取制文进 (高字本节 ) +十六进制取本 (文低字节 )码=区高字节-1 0 位码=6 低字节- 16 0区位码=区码1×0 +0位码 .判断开始(位码区1≥061 且位码区1≤63) 6回返(A”)“ .判断(位区码≥637 1且区位码≤ 1 38)2返回

Java中编码以及Unicode总结

Java中编码以及Unicode总结 1.基本概念 ●bit 位只能是0或者1 ●byte 字节一个字节是8位,1 byte=8 bits 计算机表示的基本单位 ●KB,MB,GB,TB,PB是以1024与byte进行换算 ●进制用符号进行计数十进制、二进制、八进制(011)、十六进制(0xFF) 字符文字和符号的总称 ●字符集多个字符集合的总称。ASCII字符集、GB2312字符集、GBK字符集、BIG5 字符集、GB18003字符集、Unicode字符集 ●byte可表示2^8=256个字符的表示 0 0×00 0000,0000 1 0×01 0000,0001 2 0×01 0000,0010 127 0×7F 0111,1111 -128 0×80 1000,0000 -2 0xFE 1111,1110 -1 0xFF 1111,1111 ●以补码的形式表示的二进制编码。 -2的表示,2=0000,0010,反码1111,1101,补码=反码+1= 1111,1110表示的就是1111,1110-1=1111,1101,取反就是0000,0010也就是2,所以 就是-2 2.字符集和编码 2.1.字符(Character) 字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。 2.2.字符集(Character Set) 一组抽象字符的集合就是字符集(Character Set)。字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。一组有共同特征的字符也可以组成字符集,比如繁体汉字字符集、日文汉字字符集。字符集的子集也是字符集。 计算机要处理各种字符,就需要将字符和二进制内码对应起来,这种对应关系就是字符编码(Encoding)。制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。根据字符集内字符的多少,会确定用几个字节来编码。每种编码都限定了一个明确的字符集合,叫做被编码过的字符集(Coded Character Set),这是字符集的另外一个含义。通常所说的字符集大多都是指编码字符集(Coded Character Set)。

最新汉字区位码表

汉字区位码表 说明 本表包含了汉字国标码中所包含的6768个汉字的区位码,汉字排列时按汉字的汉语拼音音序顺序排列,供参加普通高校、中专(中师),成人高校、中专,自学考试(中小学教师专业合格证书考试)填涂信息卡中的汉字信息使用。 多音字只在一处出现,例如:汉字“单”读?DAN,在第10页DAN这一列下,可查到其区位码为2105,但该字也读SHAN,当用作 SHAN字读音时,也在DAN字下面查其区位码,其余类推。

A 啊 1601 阿 1602 吖 6325 嗄 6436 腌 7571 锕 7925 AI 埃 1603 挨 1604 哎 1605 唉 1606 哀 1607 皑 1608 癌 1609 蔼 1610 矮 1611 艾 1612 碍 1613 爱 1614 隘 1615 捱 6263 嗳 6440 嗌 6441 嫒 7040 瑷 7208 暧 7451 砹 7733 锿 7945 霭 8616 AN 鞍 1616 氨 1617 安 1618 俺 1619 按 1620 暗 1621 岸 1622 胺 1623 案 1624 谙 5847 埯 5991 揞 6278 犴 6577 庵 6654 桉 7281 铵 7907 鹌 8038 黯 8786 ANG 肮 1625 昂 1626 盎 1627 AO 凹 1628 敖 1629 熬 1630 翱 1631 袄 1632 傲 1633 奥 1634 懊 1635 澳 1636 坳 5974 拗 6254 嗷 6427 岙 6514 廒 6658 遨 6959 媪 7033 骜 7081 獒 7365 聱 8190 螯 8292 鏊 8643 鳌 8701 鏖 8773 BA 芭 1637 捌 1638 扒 1639 叭 1640 吧 1641 笆 1642 八 1643 疤 1644 巴 1645 拔 1646 跋 1647 靶 1648 把 1649 耙 1650 坝 1651 霸 1652 罢 1653 爸 1654 茇 6056 菝 6135 岜 6517 灞 6917 钯 7857 粑 8446 鲅 8649 魃 8741 BAI 白 1655 柏 1656 百 1657 摆 1658 佰 1659 败 1660 拜 1661 稗 1662 捭 6267 呗 6334 掰 7494 BAN 斑 1663 班 1664 搬 1665 扳 1666 般 1667 颁 1668 板 1669 版 1670 扮 1671 拌 1672 伴 1673 瓣 1674 半 1675 办 1676 绊 1677 阪 5870 坂 5964 钣 7851 瘢 8103 癍 8113 舨 8418 BANG 邦 1678 帮 1679 梆 1680 榜 1681 膀 1682 绑 1683 棒 1684 磅 1685 蚌 1686 镑 1687 傍 1688 谤 1689 蒡 6182 浜 6826 BAO 苞 1690 胞 1691 包 1692 褒 1693 剥 1694 薄 1701 雹 1702 保 1703 堡 1704 饱 1705 宝 1706 抱 1707 报 1708 暴 1709 豹 1710 鲍 1711 爆 1712 葆 6165 孢 7063 煲 7650 鸨 8017 褓 8157 趵 8532 龅 8621 BEI 杯 1713 碑 1714 悲 1715 卑 1716 北 1717 辈 1718 背 1719 贝 1720 钡 1721 倍 1722 狈 1723 备 1724 惫 1725 焙 1726 被 1727 孛 5635 陂 5873 邶 5893 埤 5993 萆 6141 蓓 6177 悖 6703 碚 7753 鹎 8039 褙 8156 鐾 8645 鞴 8725 BEN 奔 1728 苯 1729 本 1730 笨 1731 畚 5946 坌 5948 贲 7458 锛 7928 BENG 崩 1732 绷 1733 甭 1734 泵 1735 蹦 1736 迸 1737 嘣 6452 甏 7420 BI 逼 1738 鼻 1739 比 1740 鄙 1741 笔 1742 彼 1743 碧 1744 蓖 1745 蔽 1746 毕 1747 毙 1748 毖 1749 币 1750 庇 1751 痹 1752 闭 1753 敝 1754 弊 1755 必 1756 辟 1757 壁 1758 臂 1759 避 1760 陛 1761 匕 5616 俾 5734 荜 6074 荸 6109 薜 6221 吡 6333 哔 6357 狴 6589 庳 6656 愎 6725 滗 6868 濞 6908 弼 6986 妣 6994 婢 7030 嬖 7052 璧 7221 畀 7815 铋 7873 秕 7985 裨 8152 筚 8357 箅 8375 篦 8387 舭 8416 襞 8437 跸 8547 髀 8734 BIAN 鞭 1762 边 1763 编 1764 贬 1765 扁 1766 便 1767 变 1768 卞 1769 辨 1770 辩 1771 辫 1772 遍 1773 匾 5650 弁 5945 苄 6048 忭 6677 汴 6774 缏 7134 飚 7614 煸 7652 砭 7730 碥 7760 窆 8125 褊 8159 蝙 8289 笾 8354 鳊 8693 BIAO 标 1774 彪 1775 膘 1776 表 1777 婊 7027 骠 7084 杓 7228 飑 7609 飙 7613 镖 7958 镳 7980 瘭 8106 裱 8149 鳔 8707 髟 8752 BIE 鳖 1778 憋 1779 别 1780 瘪 1781 蹩 8531 BIN 彬 1782 斌 1783 濒 1784 滨 1785 宾 1786 摈 1787 傧 5747 豳 6557 缤 7145 玢 7167 槟 7336 殡 7375 膑 7587 镔 7957 髌 8738 鬓 8762 BING 兵 1788 冰 1789 柄 1790 丙 1791 秉 1792 饼 1793 炳 1794 病 1801 并 1802 禀 5787 邴 5891 摒 6280 BO 玻 1803 菠 1804 播 1805 拨 1806 钵 1807 波 1808 博 1809 勃 1810 搏 1811 铂 1812 箔 1813 伯 1814 帛 1815 舶 1816 脖 1817 膊 1818 渤 1819 泊 1820 驳 1821 亳 5781 啵 6403 饽 6636 檗 7362 擘 7502 礴 7771 钹 7864 鹁 8030 簸 8404 跛 8543 踣 8559 BU 捕 1822 卜 1823 哺 1824 补 1825 埠 1826 不 1827 布 1828 步 1829 簿 1830 部 1831 怖 1832 卟 6318 逋 6945 瓿 7419 晡 7446 钚 7848 钸 7863 醭 8519 CA 擦 1833 嚓 6474 礤 7769 CAI 猜 1834 裁 1835 材 1836 才 1837 财 1838 睬 1839 踩 1840 采 1841 彩 1842 菜 1843 蔡 1844 CAN 餐 1845 参 1846 蚕 1847 残 1848 惭 1849 惨 1850 灿 1851 孱 6978 骖 7078 璨 7218 粲 8451 黪 8785 CANG 苍 1852 舱 1853 仓 1854 沧 1855 藏 1856 伧 5687 CAO 操 1857 糙 1858 槽 1859 曹 1860 草 1861 嘈 6448 漕 6878 螬 8309 艚 8429 CE 厕 1862 策 1863 侧 1864 册 1865 测 1866 恻 6692 CEN 岑 6515 涔 6825 CENG 层 1867 蹭 1868 噌 6465 CHA 插 1869 叉 1870 茬 1871 茶 1872 查 1873 碴 1874 搽 1875 察 1876 岔 1877 差 1878 诧 1879 猹 6610 馇 6639 汊 6766 姹 7017 杈 7230 楂 7311 槎 7322 檫 7363 锸 7942 镲 7979 衩 8135 CHAI 拆 1880 柴 1881 豺 1882 侪 5713 钗 7846 瘥 8091 虿 8218 CHAN 搀 1883 掺 1884 蝉 1885 馋 1886 谗 1887 缠 1888 铲 1889 产 1890 阐 1891 颤 1892 冁 5770 谄 5838 蒇 6159 廛 6660 忏 6667 潺 6893 澶 6904 羼 6981 婵 7031 骣 7086 觇 7472 禅 7688 镡 7966 蟾 8324 躔 8580 CHANG 昌 1893 猖 1894 场 1901 尝 1902 常 1903 长 1904 偿 1905 肠 1906 厂 1907 敞 1908 畅 1909 唱 1910 倡 1911

常用汉字的Unicode码表精修订

常用汉字的U n i c o d e 码表 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

包含汉字: 的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之 都好看起发当没成只如事把还用第样道想作种开美总从无情己面最女但现前些所同日手又行意动方期它头经长儿回位分爱老因很给 名法间斯知世什两次使身者被高已亲其进此话常与活正感见明问力理尔点文几定本公特做外孩相西果走将月十实向声车全信重 三机工物气每并别真打太新比才便夫再书部水像眼等体却加电主界门利海受听表德少克代员许棱先口由死安写性马光白或住难 望教命花结乐色更拉东神记处让母父应直字场平报友关放至张认接告入笑内英军候民岁往何度山觉路带万男边风解叫任金快原 吃妈变通师立象数四失满战远格士音轻目条呢病始达深完今提求清王化空业思切怎非找片罗钱紶吗语元喜曾离飞科言干流欢约 各即指合反题必该论交终林请医晚制球决窢传画保读运及则房早院量苦火布品近坐产答星精视五连司巴奇管类未朋且婚台夜青 北队久乎越观落尽形影红爸百令周吧识步希亚术留市半热送兴造谈容极随演收首根讲整式取照办强石古华諣拿计您装似足双妻 尼转诉米称丽客南领节衣站黑刻统断福城故历惊脸选包紧争另建维绝树系伤示愿持千史谁准联妇纪基买志静阿诗独复痛消社算 义竟确酒需单治卡幸兰念举仅钟怕共毛句息功官待究跟穿室易游程号居考突皮哪费倒价图具刚脑永歌响商礼细专黄块脚味灵改

据般破引食仍存众注笔甚某沉血备习校默务土微娘须试怀料调广蜖苏显赛查密议底列富梦错座参八除跑亮假印设线温虽掉京初 养香停际致阳纸李纳验助激够严证帝饭忘趣支春集丈木研班普导顿睡展跳获艺六波察群皇段急庭创区奥器谢弟店否害草排背止 组州朝封睛板角况曲馆育忙质河续哥呼若推境遇雨标姐充围案伦护冷警贝着雪索剧啊船险烟依斗值帮汉慢佛肯闻唱沙局伯族低 玩资屋击速顾泪洲团圣旁堂兵七露园牛哭旅街劳型烈姑陈莫鱼异抱宝权鲁简态级票怪寻杀律胜份汽右洋范床舞秘午登楼贵吸责 例追较职属渐左录丝牙党继托赶章智冲叶胡吉卖坚喝肉遗救修松临藏担戏善卫药悲敢靠伊村戴词森耳差短祖云规窗散迷油旧适 乡架恩投弹铁博雷府压超负勒杂醒洗采毫嘴毕九冰既状乱景席珍童顶派素脱农疑练野按犯拍征坏骨余承置臓彩灯巨琴免环姆暗 换技翻束增忍餐洛塞缺忆判欧层付阵玛批岛项狗休懂武革良恶恋委拥娜妙探呀营退摇弄桌熟诺宣银势奖宫忽套康供优课鸟喊降 夏困刘罪亡鞋健模败伴守挥鲜财孤枪禁恐伙杰迹妹藸遍盖副坦牌江顺秋萨菜划授归浪听凡预奶雄升碃编典袋莱含盛济蒙棋端腿 招释介烧误 unicode 编码 \u7684\u4e00\u662f\u4e86\u6211\u4e0d\u4eba\u5728\u4ed6\u6709\u8fd9\u4e2a\u4e 0a\u4eec\u6765 \u5230\u65f6\u5927\u5730\u4e3a\u5b50\u4e2d\u4f60\u8bf4\u751f\u56fd\u5e74\u77 40\u5c31\u90a3 \u548c\u8981\u5979\u51fa\u4e5f\u5f97\u91cc\u540e\u81ea\u4ee5\u4f1a\u5bb6\u53 ef\u4e0b\u800c

汉字区位码分别用十进制的区号和位号范围

区号分别为1到94、位号分别为1到94。 一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字。 其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。 扩展资料 通常,在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。 如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字,用区位码还可以很轻松地输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。 在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等 汉字区位码分别用十进制的区号和位号表示。其区号和位号的范围分别是()。 A.0~94,0~94 B.1~95,1~95

C.1~94,1~94 D.0~95,0~95 正确答案:C 区位码:94×94阵列,区号范围:1~94,位号范围:1~94。 汉字的区位码、国标码和机内码是三个不同的概念,假设某个汉字的区号是30(十进制),位号是63(十进制),则在PC机中它的内码(十六进制)是______。 正确答案:BEDFH BEDFH 解析:区位码是3063B=1E3FH,所以机内码:国标码+8080H=区位码+2020H+8080H=1E3FH+A0A0H=BEDFH 汉字的区位码、国标码和机内码(又称内码)是3个不同的概念,假设某个汉字的区号是30 (十进制),位号是63(十进制),则在PC机中它的内码(十六进制)是( )。 A.BEDF B.3E5F C.9EBF D.BOE3 正确答案:A 解析:该汉字的区号是30(十进制),位号是63(十进制)。则该汉字区位码为1E3FH,因机内码=国标码+8080H=(区位码的十六进制表示)+AOAOH。则答案为BEDFH。

相关文档
最新文档