最新编码试题合编

最新编码试题合编
最新编码试题合编

四川省ICD-10培训班试题答案(2005.8.都江堰)

一、名词解释(每题5分,共20分)

1.FIC的中文意思

2.后遗症类目

3.主导词

4.主要情况

二、填空(每空5分,共15分)

1.剑号编码表示疾病的_________,星号编码表示_________。

2.ICD分类轴心可变,但强调以_________为主,__________________为辅的原则。

3.后遗症类目用于表明__________________________。

三、判断题(每题5分,共20分)

1.ICD-10作为统计分类,不能包括全部疾病及损伤中毒的情况。()

2.在第三卷查找到有“剑号星号”编码时,应采用剑号编码进行统计分析。()

3.ICD-10书中圆括号围起的内容是同义词、其他词或解释短语。()

4.当主要情况记录为:脑出血、冠心病、糖尿病,又没有任何其他说明时,主要情况应采选择脑出血。()四、选择题(每题5分,共15分)

1.ICD-10书中对“不可归类于它处者”使用的英文缩写为:()

A.ICF B.NCE C.NEC D.NOS

2.ICD-10书中对“其他未特指”使用的英文缩写为:()A.ICF B. NCE C. NEC D.NOS

3.缩写FIC代表的中文名称为:()

A.疾病和有关健康问题国际分类家族 B.手术和医学操作分类

C. 国际功能、残疾和健康分类

D.国际疾病

命名法

五、确定主导词,并查找ICD-10编码(每空3分,共30分)

1.急性风湿性全心炎

2.随后性前侧壁急性心肌梗死

3.新生儿创伤性青光眼

4.下肢滑膜肉瘤

5.风湿性主动脉瓣狭窄闭锁不全

答案:

一、1.国际健康分类家族

2.用于表明某种情况是某种疾病或损伤中毒的后遗症

3.书中出现并排列在最左侧的每个医学诊断或术语

4.在医疗事件结束时所诊断的、造成病人需要治理或调查的主要原因

二、1.原因临床表现

2.病因解剖部位及其他

3.某种情况是某疾病或损伤中毒的后遗症

三、1.错2.对 3 .错 4.对

四、1.C 2.D 3.A

五、1.全心炎I01.8

2.梗死I22.0

3.青光眼P15.3

4.肉瘤M9040/3 肿瘤C49.2

5.狭窄I0

6.2

南宁国际疾病分类能力认证考试答案2006-06-05

一、填空题(共26分,每空1分)

1.疾病名称按照一定的规则分组称为__________,最详

尽的分类就是一个__________的列表。

2.在国际疾病分类中,疾病分类的特征可以归类为四大

类,即__________、__________、__________、__________,因此国际疾病分类称之为__________。

3.双重分类中的__________表明疾病的

__________,__________表明疾病的__________。

4.第一章是典型的__________,它首先强调的不是

__________,而是__________。

5.肿瘤的编码由__________和__________组成。

6.在产程开始之后还存在__________、__________的情

况称为梗阻性分娩。

7.肿瘤编码在__________之间且部位标有#号,则肿瘤

的部位编码要放到该部位的__________中。

8.在肿瘤表中,当部位标有◇时,表明任何类型的

__________都被认为是__________的肿瘤。

9.心肌梗死在ICD-10中的分类按__________,

__________,__________三组。

10.急性心肌梗死I21的分类是__________,透壁性下的

分类是以__________为轴心。

二、选择题(共7分,每题1分)

1.主导词最常见的是由诊断中的什么成分担任()。

A.临床表现 B. 疾病名称 C. 病理改变 D. 解剖部位

2. 正确使用国际疾病分类编码的方法是()。

A.用卷一疾病查找

B.用卷二查找

C.卷一和卷二配合查找

D.用卷三查找

3. 肿瘤编码首先应查找()。

A.良性肿瘤

B.恶性肿瘤

C.解剖部位

D.组织学名称

4. 第一章是典型的__________,它首先强调的不是__________,而是__________。

5. 良性肿瘤的恶性变,要改变()。

A.形态学编码

B.组织学编码

C.解剖部位

D.组织学名称

6. 如果囊肿不能找到某一部位,则可以转换主导词查()。

A.异常

B.损害

C.病

D.并发症

7. 新生儿肺炎应分类到()。

A.呼吸系统疾病

B.起源于围生期的某些情况

C.妊娠、分娩和产褥期

D.先天性畸形、变形和染色体异常

三、判断题(共7分,每题1分)

1. NEC的含义是如果能够分类到其他编码,则不要采用此编码。()

2. NOS的含义是其他方面未特指,NOS只出现在第三卷。()

3. 在主导词之后出现“见情况”,且无任何修饰词,则表示主导词错误,必须另行选择。()

4. 慢性疾病的急性发作,没有特异性治疗的,按慢性病编码。()

5. ICD-10中的U编码可用于暂时不能归类的疾病。()

6. 任何列于A09而无进一步说明的情况,将被假定为非传染性病因而分类于K52.9。()

7. 继发性肿瘤的形态学编码应改变其组织学和动态编码。()

四、简答题(10分)

精品文档

1.细菌学和组织学检查对呼吸道结核病分类的影响?

(2.5分)

2.什么是双重分类?统计时使用哪个编码?(2.5分)

3.肿瘤形态学编码的构成,如何表达动态编码的意义?

(5分)

五、查编码:请注明查找过程(1-19题,每题2分,共

38分)

例:急性化脓性阑尾炎伴穿孔

阑尾炎

—急性

——伴有

———穿孔、腹膜炎或破裂 K35.0

1、雅-克二氏病伴痴呆

2、骨髓脂肪瘤

3、上颌骨纤维肉瘤

4、子宫颈及宫颈内膜平滑肌肉瘤

5、肩部鳞状细胞癌

6、面部嗜酸细胞性肉芽肿

7、睾丸女性化

8、快慢综合征

9、非Q波性心肌梗死 10、创伤性湿肺 11、心因性肠激惹综合征 12、阴囊皮脂腺瘤

13、肥大性酒渣鼻 14、输卵管妊娠术后延迟性出血15、先天性内脏反应16、创伤性眼前房出血

17、新生儿凝血异常 18、手术后缺氧性脑损害 19、妊娠合并单纯胆汁郁积症

六、根据下列病例,选择主要诊断,按顺序排列并给予编

码(手术码不编)(每题4分,共12分)。

1.患者男性,70岁,3年前患霍奇金病经多次治疗病情

稳定。此次因膀胱肿物入院,膀胱镜检查取活检,病理回报:检出先癌细胞。手术:经尿道膀胱肿物电切术。后因肺部感染,呼吸衰竭而死亡。

出院诊断:呼吸衰竭 J96.9

霍奇金病 C81.901 M9650/3

膀胱腺癌 C67.901 M8140/3

肺部感染 J98.4

2.患者女性,58岁,于2002年外伤致右侧股骨颈骨折,

当时行切开复位内固定术,骨折对位佳,1年后内固定取出,骨折愈合良好。近半年来出现右侧髋骨疼痛,活动后加重。

出院诊断:右侧陈旧性股骨颈骨折 T93.1

右侧股骨头缺血性坏死 M87.9

上呼吸道感染 J06.9

高甘油三脂血症 E78.1

3.患者女性,28岁,急性腹痛伴休克入院,腹部压痛、

反跳痛(+++)后穹窿穿刺抽出不凝血,考虑宫外孕。

急行剖腹探查术。

出院诊断:休克 O08.3

输卵管异位妊娠破裂 O00.1

失血性贫血 D62

慢性子宫颈炎 N72

答案:

一、1.疾病分类疾病命名

2.病因部位临床表现病理多轴心分类

3.星号临床表现剑号原因

4.特殊组合张发生部位病因

5.形态学编码部位编码

6.头盆不称横产位(此处答案灵活,只要是O32-O34之间的情况都对)

7.M801-M808 皮肤

8.癌或腺癌从另一部位转移到骨

9.急性心肌梗死随后性心肌梗死慢性心肌梗死

10.双轴心部位二、1.A 2.C 3.D 4. 5.D 6.C 7.B

三、1.对 2.错 3.对 4.对 5.对 6.对 7.错

四、1.答:呼吸道结核病分为经细菌学和组织学检查证实

和未证实两类,分别的编码是A15和A16。没有指

出经过证实的将被假定分类于未经证实的A16类

目中。

2.星剑号编码是双重分类系统,由于剑号编码是明确

的病因编码,因此要严格的选择建好编码为统计编

码。

3.肿瘤形态学编码是采用组织学+动态编码构成。

其动态编码的意义表示如下:/0 良性,/1 交界恶

性(动态未定)或性质未特指,/2 原位癌,原发

性,/3 恶性,原发部位,/6恶性,继发部位。

五、1. 雅-克二氏病伴痴呆 A81.0+ F02.1*

查:雅-克

—伴痴呆 A81.0+ F02.1*

2. 骨髓脂肪瘤 D17.7 M8870/0

查:骨髓脂肪瘤 M8870/0

查:脂肪瘤

—特质部位 D17.7

3.上颌骨纤维肉瘤 C41.0 M9330/3

查:纤维肉瘤

—牙源性 M9330/3

——上颌骨 C41.0

4.子宫颈及宫颈内膜平滑肌肉瘤 C53.8 M8890/3

查:平滑肌肉瘤 M8890/3

查:肿瘤表宫颈 C53.9

宫颈内膜 C53.0

核对卷一:部位交搭跨越的编码 C53.8

5.肩部鳞状细胞癌 C44.6 M8070/3

查:鳞状细胞癌 M8070/3

查:肿瘤

—肩 NEC #

—皮肤

——肩 C44.6

6.面部嗜酸细胞性肉芽肿 L92.2

查:肉芽肿

—嗜酸细胞性

——皮肤

7.睾丸女性化 E34.5

查:综合征

—睾丸女性化

8.快慢综合征 I49.5

查:心脏搏动快慢交替

9. 非Q波性心肌梗死 I21.4

查:梗死

—心肌

——非透壁性

10.创伤性湿肺 J81

查:水肿

—肺

——急性

11.心因性肠激惹综合征 F45.3

查:易激

—肠

——心因性

12.阴囊皮脂腺瘤 L72.1

查:瘤(另见囊肿)

囊肿

—皮脂腺

——阴囊

13.肥大性酒渣鼻 L71.1

查:鼻赘

精品文档

14.输卵管妊娠术后延迟性出血 O08.1

查:出血

—延迟性

——后

———异位妊娠

15.先天性内脏反位 Q89.3

查:错位

—内脏

16.创伤性眼前房出血 S05.1

查:前房出血

—创伤性

17.新生儿凝血异常 P61.6

查:异常的

—凝血

——新生儿

18.手术后缺氧性脑损害 G97.8

查:损害

—脑

——缺氧性

———操作所致

19.妊娠合并单纯胆汁郁积症 O26.6

查:胆汁郁积症

—单纯性 K71.0

查:妊娠

—并发

——在下列类目中的情况

———K70—K77 O26.6

六、20.主要诊断:膀胱腺癌 C67.901 M8140/3 复合癌C97 M8001/3

21.主要诊断:右侧股骨头缺血性坏死 M87.9

22.输卵管异位妊娠破裂 O00.1

北京国际疾病分类能力认证考试答案2009

一、填空(每空1分,共20分)

1、其它和未特指传染病的肠炎、胃肠炎原分类于__新

版ICD-10将其分类于__

2、疾病分类轴心是分类的__,它取自于疾病的某一种

__.

3、编码时对病案进行分析,最低限度应当分析的部分包

括__、__、__、__等

4、第十五章妊娠、分娩、产褥期是对其__的分类,

从时间上可分为__,此章最佳主导词分别是__、__、__。

5、ICD-10有肿瘤部位编码在索引的形态学之后直接列

出,他们是__的肿瘤、__的肿瘤、__的肿瘤和

某些__肿瘤。

6、我国对围生期时间的规定是从__的第__开始至

产后的__结束。

二、选择题(共5分,每题1分)

1、分类开影响健康状态和保健机构接触的因素的一

章是()

A、肾功能实验异常

B、乙肝表面抗原携带者

C、血粮水平升高

D、颅内占位性病变

2、禽流感性肺炎被分类开()

A、传染病与寄生虫病

B、呼吸系统疾病

C、用于特殊目的的编码

D、消化系统疾病

3、第二版ICD-10各章排列是()

A、严格按照英文字母排序

B、完全打乱字母顺序

C、个别章没有按字母顺序排列

D、与第一版一样的顺序4、“骨疡型中耳炎”的主导词查()

A、中耳炎

B、耳炎、

C、炎

D、骨疽

5置入血管支架的血管根数的编码可以()

A、作为主要编码B作为附加编码

C、省略编码

D、只作冠状血管的附中编码

三、判断题(共5分,每题1分)

1、宫颈人乳头瘤病毒(HPV)感染需要编附加编码说时感染的病原体()

2、组织和器官的活组织查应分类开第十七章各种诊断性和治疗性操作()

3、所有药物制剂的使用都可以编码于ICD-9-CM-3中的00.1药物制剂的类目()

4、起源于原发部位的癌称为原发癌()

5、急性盆腔炎的疾病编码不需要区分性别()

四、简答题

1、SARS与肺炎的分类区别?

2、肺癌切除术的编码方法?

五、查编码,请注明查找过程

1、股骨中心性黏液表皮样癌

2、孕40W产钳助产失败

3、阴茎单纯疱疹

4、计算机CT导航颅内肿瘤切除术

5、成人隐匿性自身免疫性糖尿病

6、经尿道前列腺吸消融术

7、冠状动脉肌桥

8、皮肌炎伴肺间质纤维化

9、脑血管母细胞瘤10、小脚骨折伴有异物,骑摩托车与行人碰撞所致

11脐带绕颈,影响胎儿受到压迫12、准分子激光角膜切削术

13、Sweet综合征14、骶尾部脊索瘤15、异位妊娠后尿毒症昏迷

六、根据下列病例,选择主要诊断,按顺序排列,并对主要诊断给予编码

1、某老年病人以慢性阻塞性肺病合并肺炎入院,治疗期间心肌酶增高、TNT升高,ECG示:II、IIIavf的R波较前减低,三日后凌晨患者心率突然迅速减至0次/分,同时呼吸停止,经抢救无效,临床死亡。

出院诊断:猝死

冠心病

急性前间壁心肌梗死、

慢性阻塞性肺炎肺病合并肺炎、

DIC

主要诊断:

2、患者于四年前患系统性红斑狼疮,近期侵及肺部

形成狼疮性肺炎,同时有舍格伦综合征。

出院诊断:系统红斑狼疮

狼疮性肺炎

舍格伦综合征

主要诊断:

3、患者因癫痫发作入院检查,经头部核磁共振检查,

报告有脑瘤,以药物治疗癫痫好转出院。

出院诊断:脑恶性肿瘤

周期性癫痫

主要诊断:

4、患者主要症状状昏迷入院,其他诊断:糖尿病酮

症酸中毒、2型糖尿病、高血压

出院诊断:昏迷、

酮症酸中毒、

2型糖尿病、

高血压

主要诊断:

5、产妇孕38周,前置胎盘出血,失血性休克,播散

性血管内凝血,行剖宫产术。

精品文档

出院诊断:妊娠38周,枕前位

前置胎盘

失血性休克

播散性血管内凝血

主要诊断:

参考答案

一.填空题

1、K52.9,A09

2、尺度,特征

3、出院小结,手术报告,病案首页,病理和组织学

报告

4、并发症,三个阶段,妊娠,分娩,产娠期

5、无法区分部位,不区分部位,特殊组织或部位,

某些未指出部位

6、妊娠,第28周,7整天

二、选择题

1、B

2、B

3、C

4、D

5、B

三、判断题

1、错

2、错

3、错

4、错

5、错

四(略)

五查编码

1、C79.5 M8430/6

2、O66.5 73.3(手术码)

3、B00.9

4、01.59

5、E10.9

6、查:破坏

—前列腺

——经尿道针吸消融

7、Q24.5

8、M33.1+J99.1*

9、D43.2 M9161/1

10、S89.1 V20.-

11、P02.5

12、矫正术

—角膜

——折射术

———屈光性角膜成形术,角膜磨镶术

13、L98.2

14、C72.0 (形态码自找)

15、O08.4

六、

1、主要诊断:急性心肌梗死I21.0

2、主要诊断:重叠综合征

3、主要诊断:脑恶性肿瘤

4、主要诊断:2型糖尿病酮酸中毒伴昏迷E11.0

5、主要诊断:O44.1

柳州国际疾病分类能力认证考试答案2008.4

一、填空题

1、国际疾病分类家族的核心是__。

2、一个好的疾病分类系统要保证分类的准确性,要

求类目__,类目之间__,不能__。

3、在ICD-10中使用5位数细目编码的章节有第_

_、__和__。

4、当肿瘤涉及两个或两个以上的原发部位不明确

时,使用的是____的原则。

5、肿瘤编码正确的查找步骤是先查找__,然后根

据指示查找__。

6、动态未定和性质未特指肿瘤的区分方法是患者是

否__。

7、发生于围生期的传染病和寄生虫病不应分类于_

_章。8、同一身体区域的同种类型的多处损伤应分类于_

_的__。

9、损伤和中毒的外部原因编码在__统计使用时不

可以作为__。

10、症状名称可为__所共有,疾病名称为__所共

有。

11、重叠综合征是指病人患有__的__病。

二、选择题

1、O80-O84一节是对分娩方式的编码,当存在其他并发症时,本节的编码作为()。

A、主要编码

B、选择性附加编码

C、合并编码

D、不予编码

2、当没有指出中毒的具体原因时,外因编码被假定为()。

A、加害

B、故意

C、意外

D、不明

3、B95-B97编码用于标明被感染的“细菌、病毒和其他传染性病原体”,分类中它是作为()。

A、主要编码

B、附加编码

C、感染部位不明时作为主要编码

D、病原本明时作为主要编码

4、指出下列哪个疾病属于结缔组织疾病()

A、盘状红斑狼疮

B、多形性网织细胞增多症

C、过敏性脉管炎

D、结节病

5、近期外伤性白内障首次就医的编码原则()

A、以损伤为主要编码

B、以白内障为主要编码

C、损伤为附加编码

D、损伤后遗症为主要编码

6、星号或剑号出现在的类目标题上说明整个类目中的亚目都适用于()

A、剑号编码

B、星号编码

C、多数编码

D、星剑号编码

三、判断题

1、脂肪瘤在ICD-10的编码中不区分部位的()

2、鸦片、吗啡吸食者分类中毒的第十九章。()

3、杵状指应分类于症状及体征这一章,不包括先天性杵状指。()

4、Z编码只能作为附加编码,不能作为主要编码。()

5、ICD-10中没有使用的类目、亚目在实际工作中可以添加()

四、问答题

1、给出特殊组合章的定义并解释强烈优先分类章的使用方法

2、请列出肿瘤表中的五类结缔组织的名称

五、查编码并注明查找过程

1、膝关节寒性脓仲

2、食管上中段腺鳞癌

3、青铜色综合症

4、鸦片戒断综合征

5、膝滑膜间质性软骨肉瘤

6、腰椎间盘脱出伴脊髓病

7、母亲梅毒的新生儿8、小腿绀红病9、低密度脂蛋白型高脂血症

10、抗肿瘤药意外中毒11、前臂恶性上皮瘤12、分娩伴播散性血管内凝

13、更换输液泵14、大腿开放性外伤伴异物,出于扎入碎玻璃15、子宫内避孕环嵌顿

六、根据下列病例,选择主要诊断并给予编码。

参考答案:

一、

二、填空题

1、ICD-10

2、独立,互相排斥,互相包括

3、十三,十九和二十

4、肿瘤的交搭跨越

5、形态学编码,部位编码

6、做病理检查

精品文档

7、第一章8、同一类目,.7亚目

9、疾病分类,主要编码10、多种疾病,一种疾病

11、两种以上,结缔组织

三、选择题

1、B

2、C

3、B

4、C

5、A

6、D

三、判断题

1.对2、错3、对4、对5、错6、错

四、略

五、查编码

1、A18.0+M01.1*

2、C15.8 M8560/3

3、查:病

—青铜色

4、F11.3

精品文档

信息论与编码试卷与答案

一、(11’)填空题 (1)1948年,美国数学家香农发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。 (2)必然事件的自信息是 0 。 (3)离散平稳无记忆信源X的N次扩展信源的熵等于离散信源X的熵的 N倍。 (4)对于离散无记忆信源,当信源熵有最大值时,满足条件为__信源符号等概分布_。 (5)若一离散无记忆信源的信源熵H(X)等于2.5,对信源进行等长的无失真二进制编码,则编码长度至少为 3 。 (6)对于香农编码、费诺编码和霍夫曼编码,编码方法惟一的是香农编码。(7)已知某线性分组码的最小汉明距离为3,那么这组码最多能检测出_2_______个码元错误,最多能纠正___1__个码元错误。 (8)设有一离散无记忆平稳信道,其信道容量为C,只要待传送的信息传输率R__小于___C(大于、小于或者等于),则存在一种编码,当输入序列长度n足够大,使译码错误概率任意小。(9)平均错误概率不仅与信道本身的统计特性有关,还与___译码规则____________和___编码方法___有关 三、(5')居住在某地区的女孩中有25%是大学生,在女大学生中有75%是身高1.6米以上的,而女孩中身高1.6米以上的占总数的一半。 假如我们得知“身高1.6米以上的某女孩是大学生”的消息,问获得多少信息量? 解:设A表示“大学生”这一事件,B表示“身高1.60以上”这一事件,则 P(A)=0.25 p(B)=0.5 p(B|A)=0.75 (2分) 故 p(A|B)=p(AB)/p(B)=p(A)p(B|A)/p(B)=0.75*0.25/0.5=0.375 (2分) I(A|B)=-log0.375=1.42bit (1分) 四、(5')证明:平均互信息量同信息熵之间满足 I(X;Y)=H(X)+H(Y)-H(XY) 证明:

信息论与编码试题-精选.

模拟试题一 一、概念简答题(共10题,每题5分) 1.简述离散信源和连续信源的最大熵定理。 2.什么是平均自信息(信息熵)?什么是平均互信息?比较一下两个概念的异同之处。 3.解释等长信源编码定理和无失真变长信源编码定理,说明对于等长码和变长码,最佳码的每符号平均码长最小为多少?编码效率最高可达多少? 4.解释最小错误概率译码准则,最大似然译码准则和最小距离译码准则,说明三者的关系。 5.设某二元码字C={111000,001011,010110,101110}, ①假设码字等概率分布,计算此码的编码效率? ②采用最小距离译码准则,当接收序列为110110时,应译成什么码字? 6.一平稳二元信源,它在任意时间,不论以前发出过什么符号,都按 发出符号,求

和平均符号熵 7.分别说明信源的概率分布和信道转移概率对平均互信息的影响,说明平均互信息与信道容量的关系。

8.二元无记忆信源,有求:(1)某一信源序列由100个二元符号组成,其中有m个“1”,求其自信息量?(2)求100个符号构成的信源序列的熵。 9.求以下三个信道的信道容量:

,,

10.已知一(3,1,3)卷积码编码器,输入输出关系为:

试给出其编码原理框图。 二、综合题(共5题,每题10分) 1.二元平稳马氏链,已知P(0/0)=0.9,P(1/1)=0.8,求: (1)求该马氏信源的符号熵。 (2)每三个符号合成一个来编二进制Huffman码,试建立新信源的模型,给出编码结果。 (3)求每符号对应的平均码长和编码效率。 2.设有一离散信道,其信道矩阵为,求:(1)最佳概率分布?

常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、...

ASCII ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。 只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码,为了传输中文邮件必须使用BASE64或者其他编码方式。 GB2312 GB2312是基于区位码设计的,区位码把编码表分为94个区,每个区对应94个位,每个字符的区号和位号组合起来就是该汉字的区位码。区位码一般用10进制数来表示,如1601就表示16区1位,对应的字符是“啊”。在区位码的区号和位号上分别加上0xA0就得到了GB2312编码。 区位码中01-09区是符号、数字区,16-87区是汉字区,10-15和88-94是未定义的空白区。它将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。一级汉字是按照拼音排序的,这个就可以得到某个拼音在一级汉字区位中的范围,很多根据汉字可以得到拼音的程序就是根据这个原理编写的。 GB2312字符集中除常用简体汉字字符外还包括希腊字母、日文平假名及片假名字母、俄语西里尔字母等字符,未收录繁体中文汉字和一些生僻字。可以用繁体汉字测试某些系统是不是只支持GB2312编码。 GB2312的编码范围是0xA1A1-0x7E7E,去掉未定义的区域之后可以理解为实际编码范围是0xA1A1-0xF7FE。 EUC-CN可以理解为GB2312的别名,和GB2312完全相同。 区位码更应该认为是字符集的定义,定义了所收录的字符和字符位置,而GB2312及EUC-CN是实际计算机环境中支持这种字符集的编码。HZ和ISO- 2022-CN是对应区位码字符集的另外两种编码,都是用7位编码空间来支持汉字。区位码和GB2312编码的关系有点像Unicode和UTF-8。 GBK GBK编码是GB2312编码的超集,向下完全兼容GB2312,同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。同GB2312一样,GBK也支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。GBK还收录了GB2312不包含的汉字部首符号、竖排标点符号等字符。 GBK的整体编码范围是为0x8140-0xFEFE,不包括低字节是0×7F的组合。高字节范围是0×81-0xFE,低字节范围是0x40-7E和0x80-0xFE。

信息论与编码试卷及答案

一、概念简答题(每题5分,共40分) 1.什么是平均自信息量与平均互信息,比较一下这两个概念的异同? 平均自信息为:表示信源的平均不确定度,表示平均每个信源消息所提供的信息量。 平均互信息:表示从Y获得的关于每个X的平均信息量;表示发X前后Y的平均不确定性减少的量;表示通信前后整个系统不确定性减少的量。 2.简述最大离散熵定理。对于一个有m个符号的离散信源,其最大熵是多少? 最大离散熵定理为:离散无记忆信源,等概率分布时熵最大。 最大熵值为 3.解释信息传输率、信道容量、最佳输入分布的概念,说明平均互信息与信源的概率分布、信道的传递概率间分别是什么关系? 信息传输率R指信道中平均每个符号所能传送的信息量。信道容量是一个信道所能达到的最大信息传输率。信息传输率达到信道容量时所对应的输入概率分布称为最佳输入概率分布。 平均互信息是信源概率分布的∩型凸函数,是信道传递概率的U型凸函数。 4.对于一个一般的通信系统,试给出其系统模型框图,并结合此图,解释数据处理定理。 数据处理定理为:串联信道的输入输出X、Y、Z组成一个马尔可夫链,且有, 。说明经数据处理后,一般只会增加信息的损失。

5.写出香农公式,并说明其物理意义。当信道带宽为5000Hz,信噪比为30dB时求信道容量。香农公式为 ,它是高斯加性白噪声信道在单位时间内的信道容量,其值取决于信噪比和带宽。 由得,则 6.解释无失真变长信源编码定理。只要,当N足够长时,一定存在一种无失真编码。 7.解释有噪信道编码定理。答:当R<C时,只要码长足够长,一定能找到一种编码方法和译码规则,使译码错误概率无穷小。 8.什么是保真度准则?对二元信源,其失真矩阵,求a>0时率失真函数的和?答:1)保真度准则为:平均失真度不大于允许的失真度。 2)因为失真矩阵中每行都有一个0,所以有,而。 二、综合题(每题10分,共60分) 1.黑白气象传真图的消息只有黑色和白色两种,求: 1)黑色出现的概率为0.3,白色出现的概率为0.7。给出这个只有两个符号的信源X的数学模型。假设图上黑白消息出现前后没有关联,求熵;

信息论与编码试题集与答案

一填空题(本题20分,每小题2分) 1、平均自信息为 表示信源的平均不确定度,也表示平均每个信源消息所提供的信息量。 平均互信息 表示从Y获得的关于每个X的平均信息量,也表示发X前后Y的平均不确定性减少的量,还表示通信前后整个系统不确定性减少的量。 2、最大离散熵定理为:离散无记忆信源,等概率分布时熵最大。 3、最大熵值为。 4、通信系统模型如下: 5、香农公式为为保证足够大的信道容量,可采用(1)用频带换信噪比;(2)用信噪比换频带。 6、只要,当N足够长时,一定存在一种无失真编码。 7、当R<C时,只要码长足够长,一定能找到一种编码方法和译码规则,使译码错误概率无穷小。 8、在认识论层次上研究信息的时候,必须同时考虑到形式、含义和效用三个方面的因素。 9、1948年,美国数学家香农发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。 按照信息的性质,可以把信息分成语法信息、语义信息和语用信息。 按照信息的地位,可以把信息分成客观信息和主观信息。 人们研究信息论的目的是为了高效、可靠、安全地交换和利用各种各样的信息。 信息的可度量性是建立信息论的基础。 统计度量是信息度量最常用的方法。 熵是香农信息论最基本最重要的概念。 事物的不确定度是用时间统计发生概率的对数来描述的。 10、单符号离散信源一般用随机变量描述,而多符号离散信源一般用随机矢量描述。 11、一个随机事件发生某一结果后所带来的信息量称为自信息量,定义为其发生概率对数的负值。 12、自信息量的单位一般有比特、奈特和哈特。 13、必然事件的自信息是 0 。 14、不可能事件的自信息量是∞。 15、两个相互独立的随机变量的联合自信息量等于两个自信息量之和。 16、数据处理定理:当消息经过多级处理后,随着处理器数目的增多,输入消息与输出消息之间的平均互信息量趋于变小。 17、离散平稳无记忆信源X的N次扩展信源的熵等于离散信源X的熵的 N倍。 18、离散平稳有记忆信源的极限熵,。 19、对于n元m阶马尔可夫信源,其状态空间共有 nm 个不同的状态。 20、一维连续随即变量X在[a,b]区间内均匀分布时,其信源熵为 log2(b-a)。

信息交换用汉字编码字符集

〇信息交换用汉字编码字符集--基本集〈—即国家标准 GB2312-80 从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。 1980年颁布了〇信息交换用汉字编码字符集—基本集〈的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。 〇GB2312-80〈对 7445 个图形字符作了二进制数编码,这些图形字符是: 6763 个汉字,字体为简化字,分成两级。第一级汉字 3755 个,按拼音排序,约占近代文献汉字累计使用频度 99.9% 左右;二级汉字 3008 个,按部首、笔画排序。一、二级汉字约占累计使用频度 99.99% 以上。 202 个一般符号。其中包括 1.~20.,(1)~(20),?~?,(-)~(+) 等。 22 个数字。其中 0~9 共 10 个,‥~‰ 共 12 个。 52 个拉丁字母。其中大写字母A~Z 26 个,小写字母a~z 26 个。 169 个日文假名。其中平假名 83 个,片假名 86 个。 48 个希腊字母。其中大写字母Α~Χ24 个,小写字母α~ω24 个。 66 个俄文字母。其中大写字母А~Я33 个,小写字母а~я 33 个。 26 个汉语拼音符号,包括带声调符号和其它符号的字母。 37 个汉语注音字母,?~ㄗ。 GB2312简体中文编码表 code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A1A0 、。? í ì ¨ 〃?—~‖ … ‘ ’ A1B0 “ ” 【】々〆〇〈〉《》「〒〓」『 A1C0 a ? ? ? ?  ̄ ? ? ? ? ‵ ? ? ? ? ※ A1D0 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A1E0 ? ? ? ? ? ? ? $¤ ??? § ? ? ? A1F0 ? ? ? ? ? ? ? ? ? ? ″ ? ′ ? 』 code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F A2A0 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ A2B0 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

信息论与编码试题集概要

1. 在无失真的信源中,信源输出由 H (X ) 来度量;在有失真的信源中,信源输出由 R (D ) 来度量。 2. 要使通信系统做到传输信息有效、可靠和保密,必须首先 信源 编码, 然后_____加密____编码,再______信道_____编码,最后送入信道。 3. 带限AWGN 波形信道在平均功率受限条件下信道容量的基本公式,也就是有名的香农公式是log(1)C W SNR =+;当归一化信道容量C/W 趋近于零时,也即信道完全丧失了通信能力,此时E b /N 0为 -1.6 dB ,我们将它称作香农限,是一切编码方式所能达到的理论极限。 4. 保密系统的密钥量越小,密钥熵H (K )就越 小 ,其密文中含有的关于明文的信息量I (M ;C )就越 大 。 5. 设输入符号表为X ={0,1},输出符号表为Y ={0,1}。输入信号的概率分布为p =(1/2,1/2),失真函数为d (0,0) = d (1,1) = 0,d (0,1) =2,d (1,0) = 1,则D min = 0 ,R (D min )= 1bit/symbol ,相应的编码器转移概率矩阵[p(y/x )]=1001?? ???? ;D max = 0.5 ,R (D max )= 0 ,相应的编码器转移概率矩阵[p(y/x )]=1010?? ???? 。 二、判断题 1. 可以用克劳夫特不等式作为唯一可译码存在的判据。 (√ ) 2. 线性码一定包含全零码。 (√ ) 3. 算术编码是一种无失真的分组信源编码,其基本思想是将一定精度数值作为序列的 编码,是以另外一种形式实现的最佳统计匹配编码。 (×) 4. 某一信源,不管它是否输出符号,只要这些符号具有某些概率特性,就有信息量。 (×) 5. 离散平稳有记忆信源符号序列的平均符号熵随着序列长度L 的增大而增大。 (×) 6. 限平均功率最大熵定理指出对于相关矩阵一定的随机矢量X ,当它是正态分布时具 有最大熵。 (√ ) 7. 循环码的码集中的任何一个码字的循环移位仍是码字。 (√ ) 8. 信道容量是信道中能够传输的最小信息量。 (×) 9. 香农信源编码方法在进行编码时不需要预先计算每个码字的长度。 (×) 10. 在已知收码R 的条件下找出可能性最大的发码i C 作为译码估计值,这种译码方 法叫做最佳译码。 (√ ) 三、计算题 某系统(7,4)码 )()(01201230123456c c c m m m m c c c c c c c ==c 其三位校验 位与信息位的关系为:

中文字符集

最近一直被这个字符集问题,弄的头疼。想不到一个很好的办法去解决。问题是这样的:“在超链接中传递参数的时候总是出现乱码”在Action中用debug查的时候就是乱码,在Tomcat 中把Service.xml将字符集改成UTF-8,GBK,GB2312都试过了,仍然没有解决这个问题。很是郁闷!~~~ 在现实工作中我们会经常遇到字符转换的问题:有的时候还会出现乱码.因为工作需要我从别人的静态网页上抓取数据.用到的方法是传一个uri进去,然后取出你所想得到的字符串.代码如下: public static String getData(String url1) throws Exception { String result = ""; URL url = new URL(url1); HttpURLConnection connection = (HttpURLConnection) url.openConnection(); connection.setDoOutput(true); PrintWriter out = new PrintWriter(connection.getOutputStream()); out.close(); BufferedReader in = new BufferedReader(new InputStreamReader(connection. getInputStream(),"UTF-8")); //特别注意这里,后面的编码格式,一般都是用UTF-8,因为这是通用的.如果用汉字可以用GBK.不要用gb2312.因为它是GBK的子集. String line; while ( (line = in.readLine()) != null) { result = result + "\n" + line; } in.close(); String html =replaceFunc2(replaceFunc2(result,""); return html; } public static String replaceFunc2(String str_source, String str_start,String str_end) { String info = "", rep_str = "", rep_str2 = ""; int startFlag = 0, endFlag = 0; startFlag = str_source.indexOf(str_start); endFlag = str_source.indexOf(str_end); info = str_source; if (startFlag >= 0 && endFlag >= 0 && startFlag < endFlag) { rep_str = info.substring(0, startFlag); rep_str2 = info.substring(endFlag + str_end.length()); info = rep_str + rep_str2; } // System.out.print("==========="+info+"=========="); return info; }

信息论与编码习题参考答案(全)

信息论与编码习题参考答案 第一章 单符号离散信源 1.1同时掷一对均匀的子,试求: (1)“2和6同时出现”这一事件的自信息量; (2)“两个5同时出现”这一事件的自信息量; (3)两个点数的各种组合的熵; (4)两个点数之和的熵; (5)“两个点数中至少有一个是1”的自信息量。 解: bit P a I N n P bit P a I N n P c c N 17.536log log )(361 )2(17.418log log )(362)1(36 662221111 616==-=∴====-=∴== =?==样本空间: (3)信源空间: bit x H 32.436log 36 62log 3615)(=??+?? =∴ (4)信源空间: bit x H 71.3636 log 366536log 3610 436log 368336log 366236log 36436log 362)(=??+?+?+??= ∴++ (5) bit P a I N n P 17.11136 log log )(3611333==-=∴==

1.2如有6行、8列的棋型方格,若有两个质点A 和B ,分别以等概落入任一方格,且它们的坐标分别为(Xa ,Ya ), (Xb ,Yb ),但A ,B 不能同时落入同一方格。 (1) 若仅有质点A ,求A 落入任一方格的平均信息量; (2) 若已知A 已落入,求B 落入的平均信息量; (3) 若A ,B 是可辨认的,求A ,B 落入的平均信息量。 解: bit a P a P a a P a I a P A i 58.548log )(log )()(H 48log )(log )(481 )(:)1(48 1 i i i i i ==-=∴=-=∴= ∑=落入任一格的概率 bit b P b P b b P b I b P A i 55.547log )(log )()(H 47 log )(log )(47 1 )(:B ,)2(48 1i i i i i ==-=∴=-=∴=∑=落入任一格的概率是落入任一格的情况下在已知 bit AB P AB P AB H AB P AB I AB P AB i i i i i i i 14.11)4748log()(log )()() (log )(47 1 481)()3(47481 =?=-=-=∴?=∑?=是同时落入某两格的概率 1.3从大量统计资料知道,男性中红绿色盲的发病率为7%,女性发病率为0.5%.如果你问一位男士:“你是否是红绿色盲?”他的回答可能是:“是”,也可能“不是”。问这两个回答中各含有多少信息量?平均每个回答中各含有多少信息量?如果你问一位女士,则她的答案中含有多少平均信息量? 解: bit w P w P w P w P m m P m I w P w I bit m P m P m P m P m bit m P m I bit m P m I n n y y n n y y n n y y n n y y 0454.0log99.5%99.5%-log0.5%-0.5% )(log )()(log )()(H % 5.99log )(log )(%5.0log )(log )(36 6.0log93%93%-log7%-7% )(log )()(log )()(H 105.0%93log )(log )(84.3%7log )(log )(: =??=?-?-=-=-=-=-==??=?-?-==-=-==-=-=平均每个回答信息量::回答“不是”的信息量回答“是”的信息量:对于女: 平均每个回答信息量::回答“不是”的信息量回答“是”的信息量:对于男士

(完整版)信息论与编码习题参考答案

1.6为了使电视图象获得良好的清晰度和规定的对比度,需要用5×105个像素和10个不同的亮度电平,并设每秒要传送30帧图象,所有的像素是独立的,且所有亮度电平等概出现。求传输此图象所需要的信息率(bit/s )。 解: bit/s 104.98310661.130)/)(()/(R bit/frame 10661.1322.3105)(H 105)(H bit/pels 322.310log )(log )()(H 76650510 10?=??=?=∴?=??=??====∑=frame bit X H s frame r x X a p a p x i i i 所需信息速率为:每帧图像的熵是:每个像素的熵是:,由熵的极值性: 由于亮度电平等概出现 1.7设某彩电系统,除了满足对于黑白电视系统的上述要求外,还必须有30个不同的色彩度。试证明传输这种彩电系统的信息率要比黑白系统的信息率大 2.5倍左右。 证: . 5.2,,5.25.2477.210 log 300log )(H )(H pels /bit 300log )(log )()(H bit 3001030,10,,3001300 11倍左右比黑白电视系统高彩色电视系统信息率要图形所以传输相同的倍作用大信息量比黑白电视系统彩色电视系统每个像素每个像素的熵是:量化 所以每个像素需要用个亮度每个色彩度需要求下在满足黑白电视系统要个不同色彩度增加∴≈====∴=?∑=x x b p b p x i i i Θ 1.8每帧电视图像可以认为是由3×105个像素组成,所以像素均是独立变化,且每像素又取128个不同的亮度电平,并设亮度电平是等概出现。问每帧图像含有多少信息量?若现在有一个广播员,在约10000个汉字中选1000个字来口述这一电视图像,试问若要恰当地描述此图像,广播员在口述中至少需要多少汉字? 解: 个汉字 最少需要数描述一帧图像需要汉字每个汉字所包含信息量每个汉字所出现概率每帧图象所含信息量556 6 5 5 10322.6/10322.61 .0log 101.2)()()()(,log H(c):1.010000 1000 symble /bit 101.2128log 103)(103)(: ?∴?=-?=≥ ≤-=∴== ?=??=??=frame c H X H n c nH X H n p p x H X H 1.9 给 定 一 个 概 率 分 布 ) ,...,,(21n p p p 和一个整数m , n m ≤≤0。定义 ∑=-=m i i m p q 1 1,证明: )log(),,...,,(),...,,(2121m n q q p p p H p p p H m m m n -+≤。并说明等式何时成立? 证: ∑∑+==- -=>-=<-=''-=''∴>- =''-=''>-=n m i i i m i i i n p p p p p p p H x x x x f x e x x x f x x e x x x f x x x x f 1 121log log ),...,,( )0(log )( 0log )log ()(0 log )log ()()0(log )(ΘΘ又为凸函数。即又为凸函数,如下:先证明 时等式成立。 当且仅当时等式成立。当且仅当即可得: 的算术平均值的函数,函数的平均值小于变量由凸函数的性质,变量n m m m m m n m m m i i i m m m m m m i i i n m i i i m i i i n n m m m m m n m i i i m m n m i i n m i i n m i i n m i i n m i i i p p p m n q q p p p H p p p H q q p p q p p p H m n q q q p p p p p p p p p H p p p m n q q q p p m n q q m n p m n p m n m n p f m n m n p f m n p p ===-+≤--=-+--≤- -=∴===-+-≤- --=----=---≤---=- ++==+==+++=+=+=+=+=+=∑∑∑∑∑∑∑∑∑ ∑...)log(),,...,,(),...,,(log log ),,...,,() log(log log log log ),...,,(...) log(log log log log )()()() ()(log 2121211 211 1 1 21211 1111 1 ΘΘ 2.13把n 个二进制对称信道串接起来,每个二进制对称信道的错误传输概率为p(0

信息论与编码理论习题答案

第二章 信息量和熵 2.2 八元编码系统,码长为3,第一个符号用于同步,每秒1000个码字,求它的 信息速率。 解:同步信息均相同,不含信息,因此 每个码字的信息量为 2?8log =2?3=6 bit 因此,信息速率为 6?1000=6000 bit/s 2.3 掷一对无偏骰子,告诉你得到的总的点数为:(a) 7; (b) 12。问各得到多少信 息量。 解:(1) 可能的组合为 {1,6},{2,5},{3,4},{4,3},{5,2},{6,1} )(a p =366=6 1 得到的信息量 =) (1 log a p =6log =2.585 bit (2) 可能的唯一,为 {6,6} )(b p =361 得到的信息量=) (1 log b p =36log =5.17 bit 2.4 经过充分洗牌后的一副扑克(52张),问: (a) 任何一种特定的排列所给出的信息量是多少? (b) 若从中抽取13张牌,所给出的点数都不相同时得到多少信息量? 解:(a) )(a p =! 521 信息量=) (1 log a p =!52log =225.58 bit (b) ???????花色任选 种点数任意排列 13413!13 )(b p =13 52 134!13A ?=135213 4C 信息量=1313 52 4log log -C =13.208 bit

2.9 随机掷3颗骰子,X 表示第一颗骰子的结果,Y 表示第一和第二颗骰子的 点数之和,Z 表示3颗骰子的点数之和,试求)|(Y Z H 、)|(Y X H 、 ),|(Y X Z H 、)|,(Y Z X H 、)|(X Z H 。 解:令第一第二第三颗骰子的结果分别为321,,x x x ,1x ,2x ,3x 相互独立, 则1x X =,21x x Y +=,321x x x Z ++= )|(Y Z H =)(3x H =log 6=2.585 bit )|(X Z H =)(32x x H +=)(Y H =2?( 361log 36+362log 18+363log 12+364log 9+365log 536)+36 6 log 6 =3.2744 bit )|(Y X H =)(X H -);(Y X I =)(X H -[)(Y H -)|(X Y H ] 而)|(X Y H =)(X H ,所以)|(Y X H = 2)(X H -)(Y H =1.8955 bit 或)|(Y X H =)(XY H -)(Y H =)(X H +)|(X Y H -)(Y H 而)|(X Y H =)(X H ,所以)|(Y X H =2)(X H -)(Y H =1.8955 bit ),|(Y X Z H =)|(Y Z H =)(X H =2.585 bit )|,(Y Z X H =)|(Y X H +)|(XY Z H =1.8955+2.585=4.4805 bit 2.10 设一个系统传送10个数字,0,1,…,9。奇数在传送过程中以0.5的概 率错成另外一个奇数,其余正确接收,求收到一个数字平均得到的信息量。 解: 8,6,4,2,0=i √ );(Y X I =)(Y H -)|(X Y H 因为输入等概,由信道条件可知,

(国内标准)国标(GB)汉字编码对照表

汉字编码简明对照表 说明: 1、下列汉字取自国标(GB 2312-80)中的分级与排列内容;包含所有的第一级汉字和第二级汉字中的常用部分。 2、第一级汉字(16—55区的汉字)以拼音字母为序进行排列,同音字以笔形顺序横、竖、撇、捺、折为序,起笔相同的按第二笔,依次类推;第二级汉字(56-87区的汉字)按部首为序进行排列。 3、对于多音字,仅在表中出现一次。如:柏,音(bai,bo),表中仅出现在“bai”中。 4、汉字区位码用阿拉伯数字表示,每个汉字对应4个数字。 5、本汉字代码表摘自《字符集和信息编码国家标准汇编》,(中国标准出版社,1998年编)。 a 啊 1601 阿 1602 吖 6325 嗄 6436 腌 7571 锕 7925 ai 埃 1603 挨 1604 哎 1605 唉 1606 哀 1607 皑 1608 癌 1609 蔼 1610 矮 1611 艾 1612 碍 1613 爱 1614 隘 1615 捱 6263 嗳 6440 嗌 6441 嫒 7040 瑷 7208 暧 7451 砹 7733 锿 7945 霭 8616 an 鞍 1616 氨 1617 安 1618 俺 1619 按 1620 暗 1621 岸 1622 胺 1623 案 1624 谙 5847 埯 5991 揞 6278 犴 6577 庵 6654 桉 7281 铵 7907 鹌 8038 黯 8786 ang 肮 1625 昂 1626 盎 1627 ao

凹 1628 敖 1629 熬 1630 翱 1631 袄 1632 傲 1633 奥 1634 懊 1635 澳 1636 坳 5974 拗 6254 嗷 6427 岙 6514 廒 6658 遨 6959 媪 7033 骜 7081 獒 7365 聱 8190 螯 8292 鏊 8643 鳌 8701 鏖 8773 ba 芭 1637 捌 1638 扒 1639 叭 1640 吧 1641 笆 1642 八 1643 疤 1644 巴 1645 拔 1646 跋 1647 靶 1648 把 1649 耙 1650 坝 1651 霸 1652 罢 1653 爸 1654 茇 6056 菝 6135 岜 6517 灞 6917 钯 7857 粑 8446 鲅 8649 魃 8741 bai 白 1655 柏 1656 百 1657 摆 1658 佰 1659 败 1660 拜 1661 稗 1662 捭 6267 呗 6334 掰 7494 ban 斑 1663 班 1664 搬 1665 扳 1666 般 1667 颁 1668 板 1669 版 1670 扮 1671 拌 1672 伴 1673 瓣 1674 半 1675 办 1676 绊 1677 阪 5870 坂 5964 钣 7851 瘢 8103 癍 8113 舨 8418 bang 邦 1678 帮 1679 梆 1680 榜 1681 膀 1682 绑 1683 棒 1684 磅 1685 蚌 1686 镑 1687 傍 1688 谤 1689 蒡 6182 浜 6826 bao 苞 1690 胞 1691 包 1692 褒 1693 剥 1694 薄 1701 雹 1702 保 1703 堡 1704 饱 1705 宝 1706 抱 1707 报 1708 暴 1709 豹 1710 鲍 1711 爆 1712 葆 6165 孢 7063 煲 7650 鸨 8017 褓 8157 趵 8532 龅 8621 bei 杯 1713 碑 1714 悲 1715 卑 1716 北 1717 辈 1718 背 1719 贝 1720 钡 1721 倍 1722 狈 1723 备 1724 惫 1725 焙 1726 被 1727 孛 5635 陂 5873 邶 5893 蓓 6177 悖 6703 碚 7753 鹎 8039 褙 8156 鐾 8645 鞴 8725 ben 奔 1728 苯 1729 本 1730 笨 1731 畚 5946 坌 5948 贲 7458 锛 7928 beng 崩 1732 绷 1733 甭 1734 泵 1735 蹦 1736 迸 1737 嘣 6452 甏 7420 bi

信息论与编码试卷及答案

一、概念简答题(每题5分,共40分) 二、1.什么是平均自信息量与平均互信息,比较一下这两个概念的异同? 平均自信息为:表示信源的平均不确定度,表示平均每个信源消息所提供的信息量。 平均互信息:表示从Y获得的关于每个X的平均信息量;表示发X前后Y的平均不确定性减少的量;表示通信前后整个系统不确定性减少的量。 2.简述最大离散熵定理。对于一个有m个符号的离散信源,其最大熵是多少? 最大离散熵定理为:离散无记忆信源,等概率分布时熵最大。 最大熵值为 3.解释信息传输率、信道容量、最佳输入分布的概念,说明平均互信息与信源的概率分布、信道的传递概率间分别是什么关系? 信息传输率R指信道中平均每个符号所能传送的信息量。信道容量是一个信道所能达到的最大信息传输率。信息传输率达到信道容量时所对应的输入概率分布称为最佳输入概率分布。 平均互信息是信源概率分布的∩型凸函数,是信道传递概率的U型凸函数。 4.对于一个一般的通信系统,试给出其系统模型框图,并结合此图,解释数据处理定理。

数据处理定理为:串联信道的输入输出X、Y、Z组成一个马尔可夫链,且有, 。说明经数据处理后,一般只会增加信息的损失。 5.写出香农公式,并说明其物理意义。当信道带宽为5000Hz,信噪比为30dB时求信道容量。香农公式为 ,它是高斯加性白噪声信道在单位时间内的信道容量,其值取决于信噪比和带宽。 6.由得,则 7.解释无失真变长信源编码定理。只要,当N足够长时,一定存在一种无失真编码。 8.解释有噪信道编码定理。答:当R<C时,只要码长足够长,一定能找到一种编码方法和译码规则,使译码错误概率无穷小。 9. 10.8.什么是保真度准则?对二元信源,其失真矩阵,求a>0时率失真函数的和?答:1)保真度准则为:平均失真度不大于允许的失真度。 11.2)因为失真矩阵中每行都有一个0,所以有,而。

中文字符集、编码

前言
由于工作的需要,参考了好多资料整理出来一份计算机汉字处理报告,不敢独享,希 望与大家共享。Ziggler 现代计算机技术虽然先进, 但大多数人只知录入 GB-2313 字符集内的 6763 个简体汉字, 对包含 21003 个简繁体汉字的 GBK 字符集的文字录入、字体 显示就已不甚了解(市面上 绝大多数所谓的繁体字体,其实采用的是 GB2313 字符集简体字的编码,用字体显示为繁体 字,而不是直接用 GBK 字符集中繁体字 的编码,错误百出) 。而汉字总数至少有近 10 万 个,目前计算机能处理的,也有 70244 个,已非一般人所能知能用了。 由于汉字总数非常庞大。 汉字总共有多少字?到目前为止, 恐怕没人能够答得上来精确 的数字。据估计,汉字数量达到 11 万左右。 这里所说的七万多汉字, 是指 UNICODE 超大字集全部七万多中日韩汉字。 (注: Unicode 是指用两个字节表示每个字符的字符编码方案。 ) 那一般计算机能够显示多少个汉字呢?比如大陆这边普遍安装简体 Windows 系统,而 简体 windows 以宋体为系统字型,宋体支持 GBK 编码,所以能显示 20902 个汉字。 要显示 71564 个汉字, 可以采取多种方案, 如: 宋体-方正超大字符集+新细明体 EXTB、 宋体-方正超大字符集+中易宋体 EXTB、宋体 GB18030+新细明体 ExtB、宋体 18030+宋体 ExtB 等等。
中文字符集、编码
字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符 集是多个字符的集合,字符集 种类较多,每个字符集包含的字符个数不同。 计算机要准确的处理各种字符集文字, 需要进行字符编码, 以便计算机能够识别和存储 各种文字。 中文文字数目大, 而且还分为简体中文和繁体中文两种不同书写规则的文字, 而计算机 最初是按英语单字节字符设计的, 因此, 对中文字符进行编码, 是中文信息交流的技术基础。 以下是常见的一些字符集介绍,部分字符集中包括编码介绍。
GB2312 字符集
1.名称的由来 GB2312 又称为 GB2312-80 字符集,全称为《信息交换用汉字编码字符集·基本集》 ,由原中 国国家标准总局发布,1981 年 5 月 1 日实施。 2.特点 GB2312 是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖 99.75%的使用频率,

信息论与编码考试题(附答案版)

1.按发出符号之间的关系来分,信源可以分为(有记忆信源)和(无记忆信源) 2.连续信源的熵是(无穷大),不再具有熵的物理含义。 3.对于有记忆离散序列信源,需引入(条件熵)描述信源发出的符号序列内各个符号之间的统计关联特性 3.连续信源X,平均功率被限定为P时,符合(正态)分布才具有最大熵,最大熵是(1/2ln (2πππ2))。 4.数据处理过程中信息具有(不增性)。 5.信源冗余度产生的原因包括(信源符号之间的相关性)和(信源符号分布的不均匀性)。 6.单符号连续信道的信道容量取决于(信噪比)。 7.香农信息极限的含义是(当带宽不受限制时,传送1bit信息,信噪比最低只需-1.6ch3)。 8.对于无失真信源编码,平均码长越小,说明压缩效率(越高)。 9.对于限失真信源编码,保证D的前提下,尽量减少(R(D))。 10.立即码指的是(接收端收到一个完整的码字后可立即译码)。 11.算术编码是(非)分组码。 12.游程编码是(无)失真信源编码。 13.线性分组码的(校验矩阵)就是该码空间的对偶空间的生成矩阵。 14.若(n,k)线性分组码为MDC码,那么它的最小码距为(n-k+1)。 15.完备码的特点是(围绕2k个码字、汉明矩d=[(d min-1)/2]的球都是不相交的每一个接受吗字都落在这些球中之一,因此接收码离发码的距离至多为t,这时所有重量≤t的差错图案都能用最佳译码器得到纠正,而所有重量≤t+1的差错图案都不能纠正)。 16.卷积码的自由距离决定了其(检错和纠错能力)。

(对)1、信息是指各个事物运动的状态及状态变化的方式。 (对)2、信息就是信息,既不是物质也不是能量。 (错)3、马尔可夫信源是离散无记忆信源。 (错)4、不可约的马尔可夫链一定是遍历的。 (对)5、单符号连续信源的绝对熵为无穷大。 (错)6、序列信源的极限熵是这样定义的:H(X)=H(XL|X1,X2,…,XL-1)。 (对)7、平均互信息量I(X;Y)是接收端所获取的关于发送端信源X的信息量。(对)8、信源X,经过处理后,输出为Y,H(Y)小于H(X),说明信息不增。 (对)9、如果一个消息包含的符号比表达这个消息所需要的符号多,那么该消息存在冗余度。 (错)10、有噪无损离散信道的输入为X,输出为Y,那么其信道容量C=maxH(Y)。(错)11、非高斯噪声信道的信道容量比高斯噪声信道的信道容量小。 (对)12、信息率失真函数具有单调递减性。 (错)13、异前缀码不能及时可译。 (对)14、用码树构造的一定是及时码。 (对)15、香农编码压缩了符号相关造成的冗余。 (对)16、有失真信源编码指的是保真度准则下的信源编码。 (对)17、变长无失真信源编码比定长编码的编码效率高。 (错)18、香农编码是最佳编码。 (对)19、卷积、交织都可以达到差错随机化的目的。。 (错)20、卷积码的序列距离决定了其检错和纠错能力。 信息、消息、信号的定义是什么?三者的关系是什么? 答:定义:信息是指各个事物运动的状态及状态变化的方式。

相关文档
最新文档