最新医学统计学实验指导

最新医学统计学实验指导
最新医学统计学实验指导

医学统计学实验指导

医用统计方法练习

1、某医师研究用春雷素治疗小儿急性菌痢的疗效,实验组治疗患儿30例(4-5岁)都已用过氯霉素加痢特灵治疗无效,其中10例还曾用过OQPST(羟喹酞磺胺噻唑)加TMP治疗无效;对照组用OQPST加TMP治疗患儿50例(4-5岁)。结果试验组治愈率83%,对照组治愈率80%。是否可以说明两组疗效近似?

2、指出下表不足之处,并进行修改。

3、某医院传染科用侧柏叶注射合并化疗(简称合并组,34例)与单纯化疗(简称化疗组,34例)治疗肺结核的疗效比较如下表,指出下表绘制的缺点,并加以修正。

两组病例主要症状及体症恢复正常所需平均日数

4、用下表中资料绘成统计图

身高(厘米)122

126

130

134

138

142

146

150

154

158

合计

人数 4 9 10 22 33 20 11 6 4 1 120

6、用下表所列资料绘图

传染病病死率(%)

白喉

流行性乙型脑炎流行性脑脊髓膜炎伤寒及副伤寒

痢疾

急性脊髓灰质炎10.9 18.0 11.0 2.7 1.2 3.4

7、根据下表所列资料绘成统计图

某地某年3~4岁儿童急性传染病构成

疾病病例数构成比(%)

猩红热麻疹百日咳白喉痢疾2920

2640

1450

530

470

36.5

33.0

18.1

6.6

5.8

合计8010 100.0

8、某医师检查了21名从事作业工人的血红蛋白量(g/100ml),资料如下表,试计算均数及标准差。

14.8 14.7

15.4

14.4

13.7

13.7

14.1

15.4

14.4

16.4

15.3

12.5

14.2

17.0

14.8

14.4

14.9

14.4

12.8 15.6 15.9 9、某市110名健康男工人的血红蛋白(g/100ml)列于下表,将此资料编

制频数表,并计算均数,标准差及标准误。

11.8 14.9 13.8 15.6 14.8

13.3

14.5 14.5 14.6 12.3 14.8

16.5

14.8

14.9

13.5

12.7

13.4

14.1

12.1

14.3

15.8

16.0

13.9

13.5

14.6

13.8

14.3

15.0

14.3

14.0

16.3

11.9

16.8

14.8

15.8

15.5

12.8

15.2

13.0

14.0

13.8

17.4

16.0

13.8

13.7

13.4

14.7

12.5

14.1

14.7

15.6

13.7

12.0

13.8

15.3

13.8

13.7

14.7

15.0

13.0

13.4

15.2

15.1

15.0

14.2

13.9

14.2

14.4

12.8

14.1

14.0

15.4

10.1

13.2

15.5

13.1

11.9

13.1

14.2

12.6

15.2

14.0

14.6

15.3

11.4

14.8

13.9

16.2

15.0

15.1

13.2

12.2

13.5

14.0

14.7

13.5

13.1

13.8

10.7

14.9

14.0 13.9 14.0 12.5 14.7 12.9 14.9 14.2 15.4 15.1

10、调查某地107名正常人尿铅含量(毫克/升)结果列于下表,计算平均数(及第95百分位数)

尿铅含量(毫克

/升)

0~4~8~12~16~20~24~28~合计例数14 22 29 18 15 6 1 2 107

11、102名健康人的钩端螺旋体血凝抗体滴度分布如下表,试计算平均滴度。

抗体滴度1:100 1:200 1:400 1:800 1:1600 合计

人数7 19 34 29 13 102

12、有100个健康成年男子,用甲方法进行血钙值测定,得均数为10毫克/100毫升,标准差为2毫克/100毫升。

(1)根据此资料可否推测所有健康成年男子血钙值总体数可能的所在范围?

(2)现有一批成年男子血钙值为8毫克/100毫升,问此人的血钙值是否正常?

(3)另有120个健康成年男子,用乙方法进行血钙值测定,得均数为12毫克/100毫升,标准差为1.8毫克/100毫升。问甲、乙两方法均数差别有无显著性?

13、调查健康男性工人625人的血液红细胞,均数为475万/毫米3,标准差为50万/毫米3。如健康男性工人血液红细胞数呈正态分布。

(1)试求X+1.96S范围,并说明其意义;

(2)试求全体男性工人总体均数的95%可信区间。

14、某地1980年测定正常新生儿脑血脂(毫克/100毫升),结果如下表,试比较各项指标有无性别差异。

血脂

男女

人数均数标准差标准误人数均数标准差标准误

胆固醇378

375

71.4

37.6

21.6

22.5

1.1

1.2

373

367

79.3

38.8

24.0

25.8

1.2

1.3

甘油三脂

?脂蛋白

121 955.5 38.6 3.5 173 94.7 37.6 2.8

15、用雌鼠两组分别给以高蛋白或低蛋白饲料,实验期间自生后28天至84

天止共计8周,观察各鼠所增体重,结果列于下表。问两组膳食对雌鼠增加体

重有无不同。

饲料鼠数各鼠所增体重(克)

高蛋白 12 134 146 104 119 124 161 107 83 113 129 97 123

低蛋白 7 70 118 101 85 107 132 94

16、某医师治疗黑热病贫血病人7名,在治疗前后血红蛋白质如下,问治

疗前后病人血红蛋白的差别有无显著性?

病人编号

血红蛋白(g/100ml)

治疗前治疗后

1 2 3 4 5 6 7 36

45

65

55

42

60

65

45

65

70

65

51

60

63

17、某工厂保健站在“职工健康状况报告”中写到:“在946名工人中,慢性性病的有274人,其中女性219人,占80%,男性55人占20%,所以女工易患慢性病。”你认为是否正确?为什么?

18.审查以下表中的资料计算方法是否正确?

某医院各科病死率

科别患者数死亡数病死率

外科内科传染科1500

500

400

180

20

24

12.0

4.0

6.0

合计2400 224 7.3

19、在“锑剂短程疗法治疗血吸病15例死亡病例的临床分析”一文中,根据下表资料认为:“其中10—岁组死亡率最高,其次为20—岁组”,你是否同意?为什么?

20、某文章作者根据下表资料,说明沙眼20—岁组患病率最高,年龄大的反而患病率少。你同意吗?说明理由。

某医院门诊沙眼病人年龄构成比

年龄组沙眼人数构成比(%)

0- 10- 20- 30- 40- 50- 60- 70- 47

198

330

198

128

80

38

8

4.6

19.3

32.1

19.3

12.4

7.8

3.7

0.8

21、今有两个煤矿工人尘肺患病率资料如下表,是以标准化患病率进行比较,并作出结论。

工令(年)

甲矿乙矿

检查人数尘肺人数患病率检查人数尘肺人数患病率

6以下6—9 10以上14029

4285

2542

120

168

316

0.86

3.92

12.43

992

1905

1014

2

8

117

0.20

0.41

11.54

合计20856 604 2.9 3911 127 3.25

22、某地检查钩虫感染情况如下表,试问该地不同性别的人感染率有无差别?

性别检查人数阳性人数感染率(%)

男女200

150

60

20

30.0

13.3

合计350 80 22.9

23、某地疗法治疗乙型脑炎重症患者治愈率如下表,问两种疗法疗效有无差别?

分组病例数治愈数治愈率(%)

中西医结合组中医组100

200

50

70

50

35

24、某地对甲乙两零售点的猪肉,检查其表层沙门氏菌如下表,问两零售点带菌率的差别有无显著性?

采样地点采样例数阳性例数带菌率(%)甲零售点28 2 7.14

乙零售点14 5 35.71

25、某市重污染区,一般市区和农村的出生婴儿的情况见下表,问3个地区出生的致畸率有无差别?

某市三个地区出生婴儿的致畸率比较地区畸形数无畸形数合计致畸率(%)

重污染区一般市区农村114

444

67

3278

40103

8275

3392

40547

8342

33.61

10.95

8.03

合计625 51656 52281 11.95

26、根据下表资料,问我国南、北方鼻咽癌患者(按籍贯分)的病理学分类的构成比是否相同?

我国南北方鼻咽癌患者病理组织学分类构成

淋巴上皮癌未分化癌鳞癌其他合计

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学学时的次实验要求及习题

实验一定量资料的统计描述 实验目的及要求: (1)掌握定量资料统计描述的概念、公式、意义及应用条件。 (2)熟悉正态分布的概念和特点。 (3)了解:正态分布的应用及医学参考值的制定方法。 实验内容:《实验指导与练习》p6 4.某地120名12岁健康男孩身高(cm)资料如下表。计算x、S、CV及正常值范围。 表2-4某地12岁健康男孩身高数据 身高分组120~125~130~135~140~145~150~155 人数8 15 23 29 22 22 16 四、思考题 1.算术均数、几何均数、中位数应用条件是什么? 2.标准差、四分位数间距各自应用条件是什么? 3.简述正态分布的特点及应用? 实验二t、u检验与方差分析 实验目的及要求: (1)掌握:均数t检验和u检验适用条件及计算方法,方差分析的基本思想。 (2)熟悉:总体均数区间估计的概念、意义及计算方法。 (3)了解:方差齐性检验的概念。 实验内容:《实验指导与练习》p9-10 1.据下表问:中草药治疗后舒张压有否变化? 表3-1某医院用中草药治疗10名高血压病人的舒张压值 治疗前115 110 129 109 110 116 116 116 120 104 治疗后116 90 108 87 92 90 110 120 88 96 5.健康成年男子脉搏平均次数为72次/分。现调查25名某山区健康成年男子脉搏平均次数为74.2次/分,标准差为 6.5次/分。问:山区健康成年男子脉搏数与一般健康成年男子脉搏数有否不同? 10.调查18岁泰安市区及乡村男生各60名的身高数据(cm),市区平均身高170.6cm,标准差5.62cm;乡村的平均身高166.86cm,标准差为5.08cm, ①试比较泰安城乡之间男生身高有无显着差别? ②试估计泰安城区男生身高总体均数的95%及99%可信区间。 四、思考题 1.标准差与标准误的区别主要有哪几点? 2.参考值范围与可信区间的区别是什么? 3.简述假设检验的基本思想。

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

医学统计学重点要点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

医学统计学名词解释

1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学 2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。 3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示 4.同质:是指事物的性质、影响条件或背景相同或相近。 5.变异:是指同质的个体之间的差异 6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 13.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 14.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量 15.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。16随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B ) A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是(A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验,其目的是检验(C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

统计学实验指导书(Excel)

《统计学》实验指导书 【试验目的】 通过实验教学,使学生验证并加深理解和巩固课堂教学内容,掌握常用统计分析方法在Excel、SPSS 的应用,理解和掌握统计分析方法的应用原理、基本条件、实现步骤、结果的内涵等问题。通过实验,使学生能够结合具体任务和条件对社会经济问题进行初步的调查研究,结合自己的专业,在定性分析基础上做好定量分析,提高学生的科研能力和解决实际问题的能力,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。 【试验内容】 一、Excel中的统计分析功能 包括: 1、数据的整理与显示,包括数据的排序与筛选、数据透视表与分类汇总、制作频数分布表和绘制各种统计图。 2、计算描述统计量,选择适合的描述统计量反映统计数据的集中和离中趋势。 3、利用Excel进行推断统计。 4、利用Excel进行相关回归分析。 试验一:数据的整理与显示 (一)数据的筛选和排序 1、数据的筛选 在对统计数据进行整理时,首先需要进行审核,以保证数据的质量。对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。 数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。数据筛选可借助于计算机自动完成。 下面通过一个实例说明用Excel进行数据筛选的过程。 【例】下表是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程都高于70分的学生。 8名学生的考试成绩数据 首先,选择“工具”菜单,并选择“筛选”命令。如果要筛选出满足给定条件的数据,可使用自动筛选命令。如图所示。

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

华中科技大学医学统计学试题

医学统计学试题(A )卷(闭卷) 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布 B.发病率的变化意味着并因因素的变化 C.发病率的高低取决于疾病报告、登记制度以及诊断的正确 D.发病率的准确性取决于疾病报告、登记制度以及诊断的正确

医学统计学 课后问题详解

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数 2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用围广,可适用于任何类型资料 参数检验 ?优点:资料信息利用充分;检验效能较高 ?缺点:对资料的要求高;适用围有限 2.非参数检验 ?优点:适用围广,可适用于任何类型的资料 ?缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验 对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观

医学统计学各种资料比较_选择方法小结

医学统计学各种资料比较选择方法小结 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验; (2)大样本时:用U检验。

2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

相关文档
最新文档