(整理)医学统计学实验指导.

(整理)医学统计学实验指导.
(整理)医学统计学实验指导.

医用统计方法练习

1、某医师研究用春雷素治疗小儿急性菌痢的疗效,实验组治疗患儿30例(4-5岁)都已用过氯霉素加痢特灵治疗无效,其中10例还曾用过OQPST(羟喹酞磺胺噻唑)加TMP 治疗无效;对照组用OQPST加TMP治疗患儿50例(4-5岁)。结果试验组治愈率83%,对照组治愈率80%。是否可以说明两组疗效近似?

2、指出下表不足之处,并进行修改。

两个治疗组对比

并发症

西药组中西结合组

例数

结果

例数

结果

良好死亡良好死亡

休克13 6 7 10 10 0

3、某医院传染科用侧柏叶注射合并化疗(简称合并组,34例)与单纯化疗(简称化疗组,34例)治疗肺结核的疗效比较如下表,指出下表绘制的缺点,并加以修正。

两组病例主要症状及体症恢复正常所需平均日数

症状体征例数组别

咳嗽吐痰潮热肺部湿罗音痰结核菌转阴

例平均差% 例平均差% 例平均差% 例平均差%

化疗34例

合并34例

4、用下表中资料绘成统计图

身高

(厘米)

122~126~130~134~138~142~146~150~154~158~合计人数 4 9 10 22 33 20 11 6 4 1 120

6、用下表所列资料绘图

传染病病死率(%)

白喉

流行性乙型脑炎流行性脑脊髓膜炎伤寒及副伤寒10.9 18.0 11.0 2.7

痢疾

急性脊髓灰质炎1.2 3.4

7、根据下表所列资料绘成统计图

某地某年3~4岁儿童急性传染病构成

疾病病例数构成比(%)

猩红热麻疹百日咳白喉痢疾2920

2640

1450

530

470

36.5

33.0

18.1

6.6

5.8

合计8010 100.0

8、某医师检查了21名从事作业工人的血红蛋白量(g/100ml),资料如下表,试计算均数及标准差。

14.8 14.7

15.4

14.4

13.7

13.7

14.1

15.4

14.4

16.4

15.3

12.5

14.2

17.0

14.8

14.4

14.9

14.4

12.8 15.6 15.9 9、某市110名健康男工人的血红蛋白(g/100ml)列于下表,将此资料编制频数表,

并计算均数,标准差及标准误。

11.8 14.9 13.8 15.6 14.8

13.3

14.5 14.5 14.6 12.3 14.0 14.8

16.5

14.8

14.9

13.5

12.7

13.4

14.1

12.1

14.3

13.9

15.8

16.0

13.9

13.5

14.6

13.8

14.3

15.0

14.3

14.0

14.0

16.3

11.9

16.8

14.8

15.8

15.5

12.8

15.2

13.0

14.0

12.5

13.8

17.4

16.0

13.8

13.7

13.4

14.7

12.5

14.1

14.7

14.7

15.6

13.7

12.0

13.8

15.3

13.8

13.7

14.7

15.0

13.0

12.9

13.4

15.2

15.1

15.0

14.2

13.9

14.2

14.4

12.8

14.1

14.9

14.0

15.4

10.1

13.2

15.5

13.1

11.9

13.1

14.2

12.6

14.2

15.2

14.0

14.6

15.3

11.4

14.8

13.9

16.2

15.0

15.1

15.4

13.2

12.2

13.5

14.0

14.7

13.5

13.1

13.8

10.7

14.9

15.1

10、调查某地107名正常人尿铅含量(毫克/升)结果列于下表,计算平均数(及第95百分位数)

尿铅含量(毫克/升)0~4~8~12~16~20~24~28~合计例数14 22 29 18 15 6 1 2 107

11、102名健康人的钩端螺旋体血凝抗体滴度分布如下表,试计算平均滴度。

抗体滴度1:100 1:200 1:400 1:800 1:1600 合计

人数7 19 34 29 13 102

12、有100个健康成年男子,用甲方法进行血钙值测定,得均数为10毫克/100毫升,标准差为2毫克/100毫升。

(1)根据此资料可否推测所有健康成年男子血钙值总体数可能的所在范围?

(2)现有一批成年男子血钙值为8毫克/100毫升,问此人的血钙值是否正常?

(3)另有120个健康成年男子,用乙方法进行血钙值测定,得均数为12毫克/100毫升,标准差为1.8毫克/100毫升。问甲、乙两方法均数差别有无显著性?

13、调查健康男性工人625人的血液红细胞,均数为475万/毫米3,标准差为50万/毫米3。如健康男性工人血液红细胞数呈正态分布。

(1)试求X+1.96S范围,并说明其意义;

(2)试求全体男性工人总体均数的95%可信区间。

14、某地1980年测定正常新生儿脑血脂(毫克/100毫升),结果如下表,试比较各项指标有无性别差异。

血脂

男女

人数均数标准差标准误人数均数标准差标准误

胆固醇甘油三脂?脂蛋白378

375

121

71.4

37.6

955.5

21.6

22.5

38.6

1.1

1.2

3.5

373

367

173

79.3

38.8

94.7

24.0

25.8

37.6

1.2

1.3

2.8

15、用雌鼠两组分别给以高蛋白或低蛋白饲料,实验期间自生后28天至84天止共计8周,观察各鼠所增体重,结果列于下表。问两组膳食对雌鼠增加体重有无不同。

饲料鼠数各鼠所增体重(克)

高蛋白12 134 146 104 119 124 161 107 83 113 129 97 123

低蛋白7 70 118 101 85 107 132 94

16、某医师治疗黑热病贫血病人7名,在治疗前后血红蛋白质如下,问治疗前后病人血红蛋白的差别有无显著性?

病人编号

血红蛋白(g/100ml)

治疗前治疗后

1 2 3 4 36

45

65

55

45

65

70

65

5 6 7 42

60

65

51

60

63

17、某工厂保健站在“职工健康状况报告”中写到:“在946名工人中,慢性性病的有274人,其中女性219人,占80%,男性55人占20%,所以女工易患慢性病。”你认为是否正确?为什么?

18.审查以下表中的资料计算方法是否正确?

某医院各科病死率

科别患者数死亡数病死率

外科内科传染科1500

500

400

180

20

24

12.0

4.0

6.0

合计2400 224 7.3

19、在“锑剂短程疗法治疗血吸病15例死亡病例的临床分析”一文中,根据下表资料认为:“其中10—岁组死亡率最高,其次为20—岁组”,你是否同意?为什么?

20、某文章作者根据下表资料,说明沙眼20—岁组患病率最高,年龄大的反而患病率少。你同意吗?说明理由。

某医院门诊沙眼病人年龄构成比

年龄组沙眼人数构成比(%)

0- 10- 20- 30- 40- 50- 60- 70- 47

198

330

198

128

80

38

8

4.6

19.3

32.1

19.3

12.4

7.8

3.7

0.8

21、今有两个煤矿工人尘肺患病率资料如下表,是以标准化患病率进行比较,并作出结论。

工令(年)

甲矿

乙矿

检查人数尘肺人数患病率

检查人数

尘肺人数

患病率

6以下

6—9 10以上14029

4285

2542

120

168

316

0.86

3.92

12.43

992

1905

1014

2

8

117

0.20

0.41

11.54

合计20856 604 2.9 3911 127 3.25 22、某地检查钩虫感染情况如下表,试问该地不同性别的人感染率有无差别?

性别检查人数阳性人数感染率(%)

男女200

150

60

20

30.0

13.3

合计350 80 22.9 23、某地疗法治疗乙型脑炎重症患者治愈率如下表,问两种疗法疗效有无差别?

分组病例数治愈数治愈率(%)

中西医结合组中医组100

200

50

70

50

35

24、某地对甲乙两零售点的猪肉,检查其表层沙门氏菌如下表,问两零售点带菌率的差别有无显著性?

采样地点采样例数阳性例数带菌率(%)

甲零售点28 2 7.14

乙零售点14 5 35.71

25、某市重污染区,一般市区和农村的出生婴儿的情况见下表,问3个地区出生的致畸率有无差别?

某市三个地区出生婴儿的致畸率比较

地区畸形数无畸形数合计致畸率(%)

重污染区一般市区农村114

444

67

3278

40103

8275

3392

40547

8342

33.61

10.95

8.03

合计625 51656 52281 11.95

26、根据下表资料,问我国南、北方鼻咽癌患者(按籍贯分)的病理学分类的构成比是否相同?

我国南北方鼻咽癌患者病理组织学分类构成

淋巴上皮癌未分化癌鳞癌其他合计

南方四省东北三省71

89

6

18

16

22

18

51

111

180

合计160 24 38 69 291

27、某医师用甲乙疗法治疗小儿单纯消化不良,治疗结果如下,问两种疗法的治愈率是否相同?

疗法痊愈率未全愈数合计治愈率(%)

甲乙26

36

7

2

33

38

78.79

94.74

合计62 9 71 87.32

28、某地区随机抽取30名糖尿病患者、IGT异常和正常人进行载脂蛋白(mg/dl)测定,结果见下表,问三种人的载脂蛋白有无差别?

糖尿病患者、IGT异常及正常人载脂蛋白测定结果

糖尿病IGT 正常人

85.7 105.2 109.5 96.0 96.0

124.5

105.1

76.4

144.0

117.0

110.0

109.0

115.2 95.3 110.0 100.0 125.6 111.0 106.5

95.3

110.0

95.2

99.0

120.0

103.0

123.0

127.0

121.0

159.0

115.0 附题

1 .根据1999 年某地某单位的体检资料,116 名正常成年女子的血清甘油三酯(mmol/L )测量结果见表1:

表1 某单位1999 年正常成年女子血清甘油三酯(mmol/L )测量结果

组段频数

0.6 ~ 1

0.7 ~ 3

0.8 ~9

0.9 ~13

1.0 ~19

1.1 ~25

1.2 ~18

1.3 ~13

1.4 ~9

1.5 ~ 5

1.6 ~1.7 1

合计116

问题 1 :描述集中趋势应选择何指标?并计算。

问题2 :描述离散趋势应选择何指标?并计算。

问题3 :求该地正常成年女子血清甘油三酯的95% 参考值范围。

问题4 :试估计该地正常成年女子血清甘油三酯在0.8 mmol/L 以下者及 1.5 mmol/L 以下者各占正常女子总人数的百分比。

问题5 :该地90% 正常成年女子血清甘油三酯集中在哪个范围。

SPSS 程序

程序:

FREQUENCIES

VARIABLES= 甘油三酯

/NTILES= 4

/PERCENTILES= 2.5 97.5

/STATISTICS=STDDEV SEMEAN MEAN SKEWNESS SESKEW KURTOSIS SEKURT

/HISTOGRAM NORMAL

/ORDER= ANALYSIS .

2. 某医生应用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮(SLE )患者14 人。治疗前后血清Sil-2R (U/ml )数据见表2:

表2治疗前后血清Sil-2R (U/ml )数据

No. 1 2 3 4 5 6 7

治疗前1410.37 893.54 1569.45 936.51 529.94 477.23 999.4

治疗后1353.57 876.88 1534.42 879.98 468.66 427.23 971.56 No. 8 9 10 11 12 13 14

治疗前474.85 873.04 252.61 1227.20 595.40 359.81 1097.99 治疗后446.67 825.06 175.30 1110.19 470.83 337.75 1022.31

问题1 :该医生对此数据应用两组独立样本的t 检验,结果为t =0.3737 ,自由度为26 ,P =0.7116 。于是,该医生的结论是治疗前后血清Sil-2R 的差异没有统计学意义。你是否同意这种分析结果?

问题2 :有人提议做配对资料的t 检验,如果治疗前后的差异有统计学意义就可以说明治疗有效。你是否同意这样做?

SPSS 程序

1、一本题为例做配对t 检验

程序:

T-TEST

PAIRS = x1 WITH x2 (PAIRED)

/CRITERIA = CI(.95)

/MISSING = ANALYSIS.

2、以本题为例做两样本均数比较的t 检验

数据格式:2 列28 行,1 个反应变量,变量名为“ x ”;1 个分组变量,变量名为“ group ”,有 2 个水平。

程序:

T-TEST

GROUPS = group(1 2)

/MISSING = ANALYSIS

/VARIABLES = x

/CRITERIA = CI(.95) .

3. 《脑积液磷酸己糖异构酶检测用于脑膜炎诊断的探讨》一文为比较三组患儿CST 中PHI 值是否不同,数据及分析结果见表3。

表3三组患儿CST 中PHI 值的比较

组别n t P

PM 15 407.0±294.7 5.34 <0.01

WM 、VE 14 15.0±13.1 6.47 <0.01

对照组23 7.0±4.8

问题1 :该资料采用的是何种统计分析方法?

问题2 :使用的统计分析方法是否正确?若不正确,可以采用何种正确的统计分析方法。

问题3 :采用该统计分析方法应满足什么条件?该资料是否满足?

SPSS 程序

本题做完全随机设计资料的方差分析

数据格式:2列52行,1个反应变量,变量名为“PHI 值”;1个分组变量,变量名为“ group ”,有3个水平。

程序:

ONEWAY

PHI 值BY group

/STATISTICS DESCRIPTIVES HOMOGENEITY

/PLOT MEANS

/MISSING ANALYSIS

/POSTHOC = SNK LSD ALPHA(.05).

4. 某研究者欲比较某药物与对照药的疗效,将类似病情的患者随机分成两组,分别接受该药物和对照药,结果见表 4 :

表 4 某药物治疗某病人疗效结果

疗效治疗组对照组合计

恶化 1 1 2

无变化 5 14 19

进步13 10 23

显著进步9 5 14

基本痊愈 2 0 2

合计30 30 60

对于该资料研究者作了列联表检验:

= 5.79 ,,,

在的检验水准上,不能认为某药物对治疗组与对照组的疗效不同。

问题1 :该资料的分析方法是否合适?为什么?

问题2 :应该如何分析该资料?

SPSS 程序

1、本题行列表资料的χ 2 检验

数据文件:“例13.sav”。

数据格式:3列8行。2个分类变量,“ 年份”和“ 医疗质量”;1个频数变量“ f ”。

程序:

WEIGHT

BY f .

CROSSTABS

/TABLES= 年份BY 医疗质量

/FORMAT= AVALUE TABLES

/STATISTIC=CHISQ

/CELLS= COUNT ROW

/COUNT ROUND CELL .

2、以本题为例做两组等级资料比较的秩和检验

数据格式:3列8行。1个分组变量“ 年份”,1个反应变量“ 医疗质量”,1个频数变量“ f ”。

程序:

WEIGHT

BY f .

NPAR TESTS

/M-W= 医疗质量BY 年份(1 2)

/MISSING ANALYSIS.

5.某地10 名一年级女大学生的胸围(cm )与肺活量(L )数据见表5所示。

表 5 10 名一年级女大学生的胸围(cm )与肺活量(L )学生编号1 2 3 4 5 6 7 8 9 10

胸围X 72.5 83.9 78.3 88.4 77.1 81.7 78.3 74.8 73.7 79.4

肺活Y 2.51 3.11 2.72 3.38 2.83 2.86 2.72 1.91 2.98 3.28

问题1 :按此资料绘制散点图?

问题2 :求直线回归方程并对回归系数作假设检验。

问题3 :求直线相关系数,相关系数的假设检验结果与直线回归系数会一致吗?为什么?

问题4 :试估计胸围为75cm 时的平均肺活量,计算其95 %的可信区间,并说明其含义。

问题5 :求胸围为75cm 时,某地一年级大学生肺活量的95 %的散布范围,并解释其含义。

SPSS 程序

以本题为例做直线相关回归分析(含散点图)。

数据格式:2列10行。1个自变量“ x ”,1个因变量“ y ”。程序:

REGRESSION

/MISSING LISTWISE

/STATISTICS COEFF OUTS CI R ANOVA

/CRITERIA=PIN(.05) POUT(.10)

/NOORIGIN

/DEPENDENT y

/METHOD=ENTER x .

GRAPH

/SCATTERPLOT(BIVAR)=x WITH y

/MISSING=LISTWISE .

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

SPSS数据分析的医学统计方法选择

SPSS数据分析得医学统计方法选择 目录 数据分析得统计方法选择小结........................................................................错误!未定义书签。目录 (1) ●资料1 (2) 完全随机分组设计得资料 (2) 配对设计或随机区组设计 (3) 变量之间得关联性分析 (4) ●资料2 (5) 1、连续性资料 (5) 1、1两组独立样本比较 (5) 1、2两组配对样本得比较 (5) 1、3多组完全随机样本比较 (5) 1、4多组随机区组样本比较 (6) 2.分类资料 (6) 2、1四格表资料 (6) 2、2 2×C表或R×2表资料得统计分析 (6) 2、3 R×C表资料得统计分析 (7) 2、4 配对分类资料得统计分析 (7) ●资料3 (8) 一、两个变量之间得关联性分析 (8) 二、回归分析 (8) ●资料4 (9) 一.统计方法抉择得条件 (9) 1.分析目得 (9) 2.资料类型 (10) 3.设计方法 (11) 4.分布特征及数理统计条件 (11) 二.数据资料得描述 (12) 1.数值变量资料得描述 (12) 2.分类变量资料得描述 (13) 三.数据资料得比较 (13) 1.假设检验得基本步骤 (14) 2.假设检验结论得两类错误 (14) 3.假设检验得注意事项 (15) 4.常用假设检验方法 (15) 四.变量间得相关分析 (17) 1.数值变量(计量资料)得关系分析 (17) 2.无序分类变量(计数资料)得相关分析 (17) 3.有序分类变量(等级资料) 等级相关 (18)

医学统计学学时的次实验要求及习题

实验一定量资料的统计描述 实验目的及要求: (1)掌握定量资料统计描述的概念、公式、意义及应用条件。 (2)熟悉正态分布的概念和特点。 (3)了解:正态分布的应用及医学参考值的制定方法。 实验内容:《实验指导与练习》p6 4.某地120名12岁健康男孩身高(cm)资料如下表。计算x、S、CV及正常值范围。 表2-4某地12岁健康男孩身高数据 身高分组120~125~130~135~140~145~150~155 人数8 15 23 29 22 22 16 四、思考题 1.算术均数、几何均数、中位数应用条件是什么? 2.标准差、四分位数间距各自应用条件是什么? 3.简述正态分布的特点及应用? 实验二t、u检验与方差分析 实验目的及要求: (1)掌握:均数t检验和u检验适用条件及计算方法,方差分析的基本思想。 (2)熟悉:总体均数区间估计的概念、意义及计算方法。 (3)了解:方差齐性检验的概念。 实验内容:《实验指导与练习》p9-10 1.据下表问:中草药治疗后舒张压有否变化? 表3-1某医院用中草药治疗10名高血压病人的舒张压值 治疗前115 110 129 109 110 116 116 116 120 104 治疗后116 90 108 87 92 90 110 120 88 96 5.健康成年男子脉搏平均次数为72次/分。现调查25名某山区健康成年男子脉搏平均次数为74.2次/分,标准差为 6.5次/分。问:山区健康成年男子脉搏数与一般健康成年男子脉搏数有否不同? 10.调查18岁泰安市区及乡村男生各60名的身高数据(cm),市区平均身高170.6cm,标准差5.62cm;乡村的平均身高166.86cm,标准差为5.08cm, ①试比较泰安城乡之间男生身高有无显着差别? ②试估计泰安城区男生身高总体均数的95%及99%可信区间。 四、思考题 1.标准差与标准误的区别主要有哪几点? 2.参考值范围与可信区间的区别是什么? 3.简述假设检验的基本思想。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

医学统计学习题

第一章绪论习题一、选择题 1.统计工作和统计研究的全过程可分为以下步骤: A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2. 在统计学中,习惯上把()的事件称为小概率事件。 A. P 0.10 D. P 0.05 B. P 0.05或P E. P 0.01 0.01 C.P 0.005 3?8 A. 计数资料 B.等级资料C?计量资料 D. 名义资料 E.角度资料 3. 某偏僻农村144 名妇女生育情况如下:0 胎5 人、1 胎25 人、2 胎70 人、3 胎30 人、4胎14 人。该资料的类型是()。 4. 分别用两种不同成分的培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录 48 小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是()。 5. 空腹血糖测量值,属于()资料。 6. 用某种新疗法治疗某病患者41 人,治疗结果如下:治愈8 人、显效23 人、好转6 人、恶 化 3 人、死亡 1 人。该资料的类型是()。 7. 某血库提供6094 例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是()。 8. 100 名18 岁男生的身高数据属于()。 二、问答题 1.举例说明总体与样本的概念 2.举例说明同质与变异的概念 3.简要阐述统计设计与统计分析的关系 一、选择题 1. D 2.B 3.A 4. C 5.C 6.B 7.D 8.C 二、问答题 1.统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951 年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

医学统计学名词解释

1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学 2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。 3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示 4.同质:是指事物的性质、影响条件或背景相同或相近。 5.变异:是指同质的个体之间的差异 6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 13.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 14.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量 15.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。16随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

统计学实验指导书(Excel)

《统计学》实验指导书 【试验目的】 通过实验教学,使学生验证并加深理解和巩固课堂教学内容,掌握常用统计分析方法在Excel、SPSS 的应用,理解和掌握统计分析方法的应用原理、基本条件、实现步骤、结果的内涵等问题。通过实验,使学生能够结合具体任务和条件对社会经济问题进行初步的调查研究,结合自己的专业,在定性分析基础上做好定量分析,提高学生的科研能力和解决实际问题的能力,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。 【试验内容】 一、Excel中的统计分析功能 包括: 1、数据的整理与显示,包括数据的排序与筛选、数据透视表与分类汇总、制作频数分布表和绘制各种统计图。 2、计算描述统计量,选择适合的描述统计量反映统计数据的集中和离中趋势。 3、利用Excel进行推断统计。 4、利用Excel进行相关回归分析。 试验一:数据的整理与显示 (一)数据的筛选和排序 1、数据的筛选 在对统计数据进行整理时,首先需要进行审核,以保证数据的质量。对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。 数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。数据筛选可借助于计算机自动完成。 下面通过一个实例说明用Excel进行数据筛选的过程。 【例】下表是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程都高于70分的学生。 8名学生的考试成绩数据 首先,选择“工具”菜单,并选择“筛选”命令。如果要筛选出满足给定条件的数据,可使用自动筛选命令。如图所示。

医学统计学重点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

医学统计学知识点

实用标准 文档大全第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB 等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。

常用医学统计学方法的选择

常用医学统计学方法的选择 1. 多组率的比较用卡方检验(χ2检验,chi-square test) 直接用几个率的数值比较,与直接用原始数据录入比较,结果会有什么不同?卡方值会受样本量的影响,样本越多,卡方值越大。 2.多组计量资料比较采用方差分析(F检验) ,不能用t检验。当方差分析结果为P<0.05时,只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的多重比较,即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。 3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验(符号检验和Wilcoxon 检验)、双样本中位数检验(Mann-Whitney 检验)、方差分析(Kruskal-Wallis、Mood 中位数和Friedman 检验) 4.按血糖水平从低到高分成多组,进行多组之间死亡率的比较,由于死亡率同样受年龄、性别、病史、您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较(由血糖从低到高分成的4组)”。 ①年龄是定量变量(是数值),调整年龄的方法可在Logistic回归中运用,连续性变量年龄加入covariate中,当成协变量,就可以调整年龄,age-adjusted odds ratio就能得到了。 ②性别性别是二分类变量,不是定量变量,不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。 如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中,可选入年龄等进入covariate,观察年龄的配比情况。可把性别选入factors(自变量)。这样可以实现调整年龄、性别等危险因素。 5.回顾性研究(1)临床妊娠率和女性年龄的关系+(2)男性影响临床妊娠的精子参数比较: 数据类型及变量的说明:y:计量 拟采用的分析方法:卡方检验 拟采用的分析软件:spss 原始数据附件及格式:word表 能否用其他方法统计分析:可用卡方分割,调整检验水准(根据比较的次数N,校正后的检验水准为0.05/N)。 6.重复t检验:多个样本均数间的两两比较(又称多重比较)不宜用t检验,因为重复数次,t 检验将增加第一类错误的概率,使检验效率降低。此时宜用方差分析,并在此基础上用两两比较方法(如.SNK、LSD、Duncan法等)。 对于同一对均数间的差异,用t检验无显著性,而两两比较可能有显著性,可见错误选用统计方法将推出错误结论。 统计方法的选择: 分计量、计数、等级资料三

医学统计学知识点梳理

医学统计学知识点梳理公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P (A)= m/n。 随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

医学统计学 课后问题详解

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数 2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用围广,可适用于任何类型资料 参数检验 ?优点:资料信息利用充分;检验效能较高 ?缺点:对资料的要求高;适用围有限 2.非参数检验 ?优点:适用围广,可适用于任何类型的资料 ?缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验 对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果

为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确** (3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。2.分类资料 2.1 四格表资料 2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。 2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的检验或Fisher’s确切概率法检验。 2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。 2.2 2×C表或R×2表资料的统计分析

《医学统计学》学习指南

《医学统计学》课程 ——学习指南 第一章医学统计学概论 教学要求: 1.能够了解“医学统计学”的概念以及统计工作的一般步骤。 2.能够解释并举例说明医学统计学中所涉及的基本概念。 3.能够识别医学资料的类型。 教学重点、难点: 重点: 1.统计学中的几个基本概念。 2.医学研究中常见的资料类型。 难点: 1.小概率事件与小概率原理。 第二章计量资料的统计描述 教学要求: 1.能够了解频数分布表的编制方法及分布图的绘制,并以此描述资料的频数分布特征。 2.能够了解正态分布的概念、特征及应用,掌握标准正态分布的基本规律。 3.能够掌握各种平均数指标的计算,特点及其适用条件。 4.能够掌握各种离散趋势指标的计算,特点及其适用条件。 教学重点、难点: 重点: 1. 集中趋势与离散趋势指标的特点与适用范围。 2. 正态分布的基本概念和特征。 难点: 1. 95%参考值范围的计算。 第三章计数资料的统计描述 教学要求: 1.能够识别常用相对数指标的概念和计算方法,并能举例说明。 2.能够理解应用相对数的注意事项。 3.能够了解动态数列的作用和常用指标。

4.能够了解Simpson悖论的原理和标准化率的计算方法。 教学重点、难点: 重点: 1.常用相对数指标的类型与计算方法。 2.应用相对数指标的注意事项。 难点: 1.应用相对数指标的注意事项。 第四章统计表与统计图 教学要求: 1.了解统计表的基本结构和绘制的基本要求。 2.了解统计图的基本结构、绘制的基本要求。 3.能够选用正确的统计图描述数据资料。 4.能够运用统计软件绘制常用的统计图。 教学重点、难点: 重点: 1.错误统计表的修改。 2.常用统计图绘制及其图形选择。 难点: 1.统计图的正确选用。 第五章参数估计 教学要求: 1.掌握样本均数(率)抽样误差基本概念及计算。 2.掌握总体均数(率)置信区间的概念和估计方法。 3.了解t分布的分布特征和应用。 4.了解标准误和标准差的区别。 教学重点、难点: 重点: 1. 抽样误差的概念和计算。 2. 单个总体均数置信区间和两个总体均数差的置信区间的估计方法。难点: 1. 单个总体均数置信区间基于的理论分布。 2. 两个总体均数差的置信区间的估计方法的理论分布。

医学统计学题库1

绪论知识点 1. 只要增加例数就可以避免抽样误差。 A. + B. – 2. 等级资料也可认为是一种计数资料。 A. + B. - 3. 概率的取值一定在0~1范围内,频率的取值则不一定。 A. + B. - 4. 客观事物中同质是相对的,变异是绝对的。 A. + B. - 5. 观察单位数不确定的总体称为有限总体。 A. + B. - 6. 统计量针对于样本,参数针对于总体。 A. + B. - 7. 统计描述就是用样本推断总体的统计过程。 A. + B. - 8. 有序分类资料就是等级资料。

A. + B. - 9. 统计分析一般包括统计描述和统计推断。 A. + B. - 10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。 A. + B. - 11. 对于统计资料的描述可用统计指标和统计图表两种手段。 A. + B. - 12. 有序变量也称连续型变量,变量值可取连续不断的实数。 A. + B. - 13. 分类资料中的各类别必须互相排斥,不能相互包含。 A. + B. - 14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。 A. + B. - 15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。

A. + B. - 16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高 血压患者, 这是________。 a.计量资料b.还不能决定是计量资料还是计数资 料 c.计数资料d.既可作计量也可作计数资料 e.等级资料 17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见 下表。 病 人号 1 2 3 4 5 6 7 治疗前 11 5 11 12 9 11 11 6 10 9 10 9 治疗后 11 6 90 10 8 92 90 11 0 87 欲比较治疗前后有无差异, 这是_________。 a.计量资料b.还不能决定是计量资料还是 计数资料 c.计数资料d.既可作计量也可作计数资料e.等级资料 18. 一批病人的血球沉降率(%)是________。 a.计量资料b.还不能决定是计量资料还是

相关文档
最新文档