卫生学 10分类变量资料的统计推断PPT课件
最新卫生学6版PPT课件

第十章 分类变量资料的统计分析
(1) 第一节 分类变量资料的统计描述 第二节 分类变量资料的统计推断 第三节 χ2 检验
2
构成比的特点
(1) 各部分构成比之和等于1。 若因四舍五入造成构成比之和不等于1,则应进行适
当的调整,使其等于1。
(2) 当事物内部某一部分的构成比发生变化时,其它各部 分的构成比也会相应地发生变化。
上述数据为构成比,它并不说明40~59岁组肿瘤发 生情况最严重。只说明40~59岁组中因患肿瘤而死亡人 数在全部死亡人数中所占的比例比其它两个组要大。
◆频率指标才能说明某事物发生频率的高低。 三个年龄组的肿瘤发生率分别为12.35/十万、149.14/ 十万和341.5/十万,60岁以上的肿瘤发生率最高。
(三) 标准化率的计算步骤:
23
直接法计算标准化率
P ' ( N N i P i ) 或 P ' N N i P i 1 0 - 4
式中: P’ 为标化率, Ni 为第i组标准人口数,N为标准组总人口数, Ni /N为第i组标准人口构成比例。
例10-3 表10-3的资料已包括各年龄组的发病率,故选择直 接法计算标准化率,用甲、乙两地各年龄组人口数的合计 数作为共同的标准,采用(10-4)式计算标准化率,计算过 程见表10-4。
14
(二) 分析时构成比和率不能混淆
分析时常见的错误:以构成比代替率来说明问题。 ◆构成比说明事物内部各部分所占的比重或分布,不
能说明某现象发生的强度或频率大小。 例如,某地某年40岁以下、40~59岁和60岁以上三
个年龄组的人口中肿瘤死亡人数占全死亡原因的构成比 分别为21.9%、24.4%和9.4%。
该大学有240人获博士学位,356人获硕士学位,820人获 学士学位。 总人数为1416。获得各种学位人数的构成比:
实习十 分类变量资料的统计分析—卫生学第七版

实习十 分类变量资料的统计分析——卫生学第七版(P393-394)实习目的:1.掌握率、构成比、相对比的计算及应用;正确区分率和构成比。
2.熟悉率的标准化意义、基本思想及计算方法;掌握率的标准误、总体率可信区间估计方法及率的u 检验适用条件和方法。
3.掌握χ2检验基本思想;掌握一般四格表资料、配对资料及行×列表资料χ2检验各种公式的适用条件和检验方法。
5. 某地随机抽查了初中生300人,其中近视学生有71人,计算该地初中生近视眼患病率的标准误,并估计其总体率的95%置信区间。
P =71/300×100%=23.67%()n p p s P -=1 = ()3002367.012367.0- = 0.0245n 足够大时(n >50);样本率p 或1-p 均不太小时 [ 如n p 和n (1-p )均大于5 ],按正态分布原理估计总体率的可信区间。
总体率的95%的置信区间:P ± 1.96 S P = 0.2367 ± 1.96 ×0.0245 = 0.2367 ± 0.0480 = (18.87%, 28.47%)6. 根据以往经验,一般胃溃疡患者有20%发生胃出血症状。
现某医院观察65岁以上胃溃疡患者304例,有 31.6% 发生胃出血症状,问老年胃溃疡患者是否较易出血?分析:本题中样本率为31.6 %,np 和n (1-p )≥5,可认为呈近似正态分布,故可用 u 检验 ⑴ 建立检验假设H 0:老年胃溃疡患者和一般胃溃疡患者出血发生率相同,即π=π0。
H 1:中药和西药有效率不同,即π>π0。
单侧α= 0.05⑵ 计算检验统计量u 值np p u p)1(πππσπ--=-==304)2.01(2.02.0316.0-- = 5.056⑶ 确定P 值,做出统计推断 查U 界值表,u0005.0= 3.2905,u >u0005.0,p <0.0005,按α= 0.05水准,拒绝H 0,接受H 1,差异有统计学意义,可认为老年胃溃疡患者较易出血。
分类变量资料的推断ppt课件

推断两个样本所代表的总体率〔或
总体构成比〕是否相等。
根本公式:
(A - T) 2
2 = —————
T
专用公式:
( ad - bc) 2 n 2 = ————————————
(a + b)(c + d)(a + c)(b + d)
=1
甲乙两种疗法治疗肺癌生存率比较的四格表 常见心律失常心电图诊断的误区诺如病毒感染的防控知识介绍责任那些事浅谈用人单位承担的社会保险法律责任和案例分析现代农业示范工程设施红地球葡萄栽培培训材料
总体构成
比〕之间有
无差异,以及配对资料的
2. 2 检比验较的。根本思想
例: 甲乙两种疗法治疗肺癌的2年生存率
疗法 治疗人数 生存人数 2年生存率%
甲
46
22
47.83
乙
58
35
60.34
合计 104
57
54.81
两种疗法的2年生存率是否不同?
甲乙两种疗法治疗肺癌生存率比较的四格表 常见心律失常心电图诊断的误区诺如病毒感染的防控知识介绍责任那些事浅谈用人单位承担的社会保险法律责任和案例分析现代农业示范工程设施红地球葡萄栽培培训材料
两个率或构成比比较的四格表格式
方法 阳性数
阴性数
合计
甲
a
b
a+b
乙
c
d
c+d
合计
a+c
b+d
n
2 值、P 值与统计结论
2值
P值
统计结论
<
2
0.05( )
> 0.05
2
0.05( )
0.05
医学统计学--变量的分类与统计资料的类型 PPT课件

医学课件 18
二、统计学中的几个基本概念
• 研究单位:一个人 • 变量:红细胞数 • 同质:同某地、同2002年、同成年男子、 同正常。 总体:1)某地所有的正常成年男子 2)某地所有的正常成年男子的 红细胞数
医学课件
37
三、统计资料的类型
变量与统计资料的分类方法 1.概述 2.数值变量(numerical variable)和计量资料 (measurement data) 3.无序分类变量(unordered categories variable ) 和计数资料 (enumeration data) 4.有序分类变量(ordinal categories variable)和等 级资料(ranked data)
医学课件 19
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围 • 2)无限总体(infinite population):研 究单位数是无限的 • 例如:高血压患者←无时间、空间限制。
Prop(2001.5~2011.5)=0.11, 结合Mendel历次报告的其它实 6 医学课件 验结果,每次都有如此好的吻合的概率约 10万分之4。
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题
第十七章分类资料的统计推断

H0 :1=2,… H1 :12,… =0.05
(2)求检验统计量值
c2
a
ad bc n /
bc da
22 n
cb
d
251 7 27 60 / 22 60
32 28528
2.89 (2 1)(2 1) 1
(3) 确定P 值,作出推断结论
2 0.05,1
3.84
P>0.05….
• n ≥ 40,且Tmin ≥ 5时,用2检验基本公式和专用公式
• n≥ 40,但1≤Tmin<5时,用2检验校正公式 • n<40,或Tmin<1时,或P≈α用四格表Fisher确切概率法
校正公式:
2 c
( A T 0.5)2 T
( ad bc n)2 n
2 c
(a
b)(c
d )(a
阴性
b d
b+d
合计
a+b
c+d a+b + c+d
2
(ad bc)2 n
, 1
(a b)(c d )(a c)(b d )
为了不计算理论频数T, 可由基本公式推导出,直接由各 格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式abc
❖(3) 确定P 值,作出推断结论
查2界值表:
2 0.05,1
3.84
2 0.025,1
5.02
2 0.01,1
6.63
故P < 0.01,按=0.05的检验水准,拒绝 H0,接受H1,差别有统计学意义,可认为 女生的患病率高于男性。
二、四格表资料2检验的专用公式
组别 A组 B组
最新第十六章分类变量的统计介绍教学讲义PPT课件

医学统计学
第十六章 分类变量的统计分析 主讲:黄志碧
第一节 常用的相对数
对分类变量进行统计描述常采用相对数。
收集到的分类资料,首先表现为绝对数。 绝对数说明事物发生的实际水平,是进行统 计分析的基础,但不便于事物进行深入地分 析比较。
一、率
率(Rate)又称频率指标,是指在一定 时间内发生某现象的观察单位数与可能 发生该现象的总观察单位数之比。它说 明某现象发生的频率或强度。
率
发生某现象的观察单位数 可能发生该现象的观察单位总数
K
K为比例基数,可以是百分率(%)、千分率 (‰)、万分率(1/万)或十万分率(1/10万), 可根据习惯或使计算出的率保持一、二位整数。
习惯用法:
人口出生率、死亡率、自然增长率、婴 儿死亡率等采用千分率;
肿瘤的死亡率采用十万分率。
注意
计算率时,注意分母和时间。只有可 能发生某事件的观察单位才能做分母。时 间一般以年为间期,也有月、周等。
总
体
抽样误差
抽样
p
样 本
p
统计推断
1、率的抽样误差
在率的抽样研究中,由于总体中存在个 体变异,所以由抽样得到的样本率(P)与
总体率( )之间存在差异,这种差异称
抽样误差。 在抽样研究中,抽样误差是不可避免
的,但可以用统计方法计算或估计其大小。
总体均数=
标准差=σ
n , p1
n , p2 …
n , pn
医院
有转移
无转移
甲医院 710/755=0.940 45/755=0.060
乙医院 83/383=0.2167 300/383=0.7833
5、率或构成比的比较要做假设检验。
预防医学-分类变量的统计分析PPT

9
某正常人的白细胞分类计数构成比
白细胞分类 中性粒细胞 淋巴细胞 单核细胞 嗜酸粒细胞 嗜碱粒细胞
合计
分类计数 140 50 5 4 1 200
构成比(%) 70.0 25.0 2.5 2.0 0.5
100.0
10
构成比的特点
各组成部分的构成比之和 为100%。
特
点
事物内部某一部分构成比发生 变化,其它部分的构成比也相
20
第三节 率的标准化法
率的标准化的概念与基本思想:
为了消除相比较组间因内部构成不同对所比 较指标的影响,采用统一的标准构成对总率进行 调整,使算得的标准化率具有可比性,得出科学 的结论。
21
甲、乙两医院的治愈率
科别
住院人数
甲医院 乙医院
内科 1500
500
外科 500 传染病科 500
1500 500
前已算得 S p 00..000388,则其95%CI为:
p 1.96Sp = 0.90.±041.916.×960.003.0=0(880.(8401.022,280,.9508.085)72)
即该新药有效率95%置信区间为84.12%~95.88%。
43
2.查表法
如果n、p不满足上述条件(n≤50),可根据二 项分布的原理估计总体率的置信区间。
计算
构成比=
事物内部某一组成部分的观察单位数 事物内部所有组成部分的观察单位总数
100%
8
2000年某医院某病的住院人数和死亡人数
病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%)
轻
300
12
26.7
4.0
中
350
《预防医学》分类变量资料的统计分析PPT

1
当 b+c <40 时 : 2 (| b c | 1)2 ,
bc
1
❖ 行×列(R×C)表资料的 2 检验
适用于成组设计的二项或多项分类资料 (1) 公式选用条件:不能有一个格子的 T < 1 ,且
1T5 的格子数不超过总格子 数的1/5
专用公式为: 2 n( A2 1) nr nc
分类变量资料的统计分析
一、 2 –test的主要用途
➢推断成组设计两个总体率或构成比有无差别 ➢推断配对设计两个总体率有无差别 ➢推断成组设计多个总体率或构成比有无差别 ➢双向有序分类资料的关联性检验(相关分析) ➢检验频数分布的拟合优度
二、 2 –test的基本原理 四格表资料 表1 两组人群尿棕色素阳性率比较
疗法 药物 安慰剂 合计
发生 不发生
合计
62 (58.62) 79 (82.38) 141
12 (15.38) 25 (21.62)
3774Biblioteka 104178发生率 (%) 43.97 32.43 35.96
实际频数Arc
列合计数nC
行合计数nr
理论频数Trc:Trc
nr nc n
周边合计数
四格表资料的一般形式
❖四格表资料的 2 检验
专用公式
适用于成组设计的二项分类资料
• 当 n40 且所有 T5 时: 2
(ad bc)2 n
(a b)(c d)(a c)(b d)
基本公式为: 2 (A T )2 T
• 当 n40 但有 1T<5 时: 2 (| ad bc | n / 2)2 n
1)增大样本例数使理论频数增大 (首选) 2)删去理论数太小的行或列 3)将理论数太小的行或列与性质相近的邻行或
医学统计学分类变量资料的统计推断

率的标准误的意义
▪ 率的标准误小,说明抽样误差较小,表示 样本率与总体率越接近;
▪ 率的标准误大,说明抽样误差较大,表示 样本率与总体率相距较远。
▪ 有研究者在某地采用随机整群抽样法获得 642名青少年,调查其留守情况,得出留守 率为16.98%,求其留守率的标准误。
▪ 已知n=642,p=0.1698,则
单侧α= 0.05
本例,n=304,p=0.316,π0=0.2,则有
u=5.06>1.645,p<0.05,则拒绝H0,接受H1,老年 胃溃疡患者出血率高于一般胃溃疡患者。
案例
▪ 某地调查了50岁以上吸烟者200人中患慢 性支气管炎者41人,患病率为20.5%;不 吸烟者162人中患慢性支气管炎者15人, 患病率为9.3%。
案例
▪ 2003年,某学校欲了解大学生乙肝表面抗原 携带情况以评价防控措施,随机抽取1000名 大学生,做乙肝表面抗原检查,查得乙肝表 面抗原阳性者52人,乙肝表面抗原阳性率为 5.2%,欲用此率推断该校大学生乙肝表面抗 原总体阳性率。
例
▪ 某校大学生乙肝表面抗原总体阳性率的 95%的可信区间:
分类变量资料的 统计推断
二项分布
▪ 考虑一系列彼此独立的随机试验,每次试 验只有两个可能发生的结果,且每种结果 发生的可能性是一定的,即发生和不发生 的概率分别是:和1- ,那么这n次试验 中发生或者不发生的次数服从二项分布。 (没有“排列”的意义,而体现了“组合” 的意义)
只有两个可能发生的结果
▪ 问题
➢ 据以上资料能否下结论说吸烟者慢性支气管炎 患病率高于不吸烟者?
➢ 用什么方法对两个率进行比较?
吸烟组和不吸烟组慢性支气管炎患病率比较
卫生学 10.分类变量资料的统计推断

40 6 2 16 64 / 2
42 22 56 8
2
64
4.79
自由度υ=(行数-1)(列数-1)
=(2-1)(2-1)=1
查X2界值表,得 P<0.05,按α=0.05水准, 拒绝H0,可认为两组有效率差别有统计学意 义。
三、配对设计分类变量资料的X2检验
H0:π= π0
H1:π≠ π0
α=0.05 P=0.26
u p 0 0.30 0.26 0.3(1 0.3) 385
0 (1 0 )
n
1.713
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
1 n2
)
0.0854 0.1486 1 1 0.1258(1 0.1258) 8207 14585
0.0046
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节
x2 检 验
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正 态分布 • 当nP和n(1-P)都大于5时,二项分布近 似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
表10-9 两种血清学方法对肝癌检测的结果比较
甲法 + 乙法 合计
+
合计
50(a)
卫生统计学分类变量资料的统计描述PPT演示文稿

直接法
条件 ➢ 被标化的人群中各分组的死亡率(或发病率、治愈
率等)资料 ➢ 标准组的年龄别人口数或构成比资料 标准组选择: 具有代表性,内部构成较稳定的较大人群; 要比较的两组资料内部各相应小组的观察单位数相
加,作为共同的标准; 两组中任选一组的内部构成作为标准。
21
年龄组
1 2 … i … k 合计
第四章 分类资料的统计描述
1
在调查或实验研究中清点分类资料得到的数 据被称为绝对数。绝对数是研究客观事物或 现象本质的基本信息,不便于相互之间进行 比较,因此,根据研究目的对分类资料计算 相应的相对数指标,以便进行统计学描述和 分析。
2
甲市100例HIV/AIDS N1=1000,000 P1=10/10万
447.1615
2485780
393.4008
26
甲县实际死亡人数 r=2528471×43.12/10 万=1090, 乙县实际死亡人数 r=2485780×39.46/10 万=981 甲县的标准化死亡比 SMR= r = 1090 2.4376
ni Pi 447.1615 乙县的标准化死亡比 SMR= r = 981 2.4936
卫生工作好坏 年龄
粗死亡率(crude mortality rate) 上海 9.0‰ 深圳 6.0‰
16
表 2 某三甲医院与某乡镇医院急性心肌梗塞治愈率比较
严重程度
轻 重 合计
某三甲医院
治愈人数 治疗人数
16
20
48
80
64
100
治愈率(%) 80 60 64
某乡镇医院
治愈人数 治疗人数
56
80
ni Pi 393.4008 甲县的标准化死亡率 p' P r 14.59 2.4376 35.56 /10 万
医学统计学课件:分类资料的统计推断

n 较大时,正态近似法
p
u
n 较小时,直接计算概率法
p (1 )
n
6.3 两样本率的比较
➢目的: 推断两总体率是否不等 ➢两样本率比较的u 检验(u test)
➢两样本率比较的2检验 (chi-square test)
两样本率的比较的u 检验
– 正态近似法
当n1, n2均较大,p1, p2, (1-p1), (1-p2)均不太小, 如n1p1, n2p2, n1(1-p1), n2(1-p2)均大于5时,可用u 检验。
例6.1
• 有人调查29名非吸毒妇女,出狱时有1名HIV阳 性,试问HIV阳性率的95%的可信区间是多少?
• 本例 n=29,X=1,查附表7得0.1~17.8,即该HIV 阳性率的95%的可信区间为:0.1%~17.8%。
总体率的区间估计 (二)
正态近似法
– n足够大,p与1-p不太小,如np>5和n(1பைடு நூலகம்p)>5 样本率p的抽样分布近似正态分布。
衡量理论数与实际数的差别
2 ( A T )2
T
2 43 40.362 10 12.642 40 42.642 16 13.362 1.41
40.36
12.64
42.64
13.36
第四步:确定 P 值,下结论
表 四格表资料的基本形式
χt检2验检验
率的抽样误差
• 由于总体中个体变异的存在,在抽样过 程中产生的样本率与总体率的差异或样 本率间的差异 ,称为率的抽样误差。
率的标准误(SE of Rate)
• 率的抽样误差大小的衡量指标
1
p
n
p1 p
sp
分类变量资料的统计推断

u p1 p2
p1 p2
S p1 p2
pc (1 pc )(1 n1 1 n2 )
pc
x1 x2 n1 n2
12
例2 某中药研究所试用某种草药预防流 感,观察用药组和对照组(未用药组) 的流感发病率,其结果见表1。问两组流 感发病率有无差别?
13
表1 用药组和对照组流感发病率比较
9 1
• (3)确定P值及推断结论
• 本 例 X2=4.90>X2=3.84,P<0.05 在 α=0.05
的水准上,拒绝H0,接收H1,差异有统计学意
义。可认为甲、乙两种白喉杆菌培养基的效果 有差别,甲培养基培养效果优于乙培养基。
45
三、行×列表的2检验
行×列表(R×C表)的检验主要用于解决多个
样本率或多个样本构成比的比较以及有序分类 资料的关联性检验。
基本公式
2
(A T )2 T
=(R-1)(C-1)
46
简化公式:
2 n
A2 nR nC
1
=(R-1)(C-1)
• 式中n为总例数,A为每格子的实际频数,nR、nC 分别为与某格子实际频数(A)同行、同列的合
组 别 观察人数 发病人数 发病率(%)
用药组
100
14
14
对照组
120
30
25
合计
220
44
20
14
计算结果
本例n1=100,p1=14%,n2=120,p2=25%, pc=20%,1-pc=80%,代入公式
0.14 0.25
u
2.031
分类变量资料的统计推断PPT课件

54.81
2021/两3/7 种疗法的2年生存率是否不同?
12
甲乙两种疗法治疗肺癌生存率比较的四格表
疗法 甲
生存 22
死亡 合计(nC) 生存率%
24
46
47.83
乙
35
23
58
60.34
合计(nR) 57
47 104 (n) 54.81
假设:两疗法生存率一致为 57/104 = 54.81%
甲疗法的生存人数 T1.1 : 46×57/104=25.21 乙疗法的生存人数 T2.1 : 58×57/104=31.79 假设: 两疗法病死率一致为 47/104 = 45.19%
2021/3/7
5
二、率的u检验
1. 样本率与总体率比较
目的:推断样本率所代表的总体率 与某总体
率 0 是否相等。
公式:
| p-0 |
u=
p
| p - 0 |
u=
0 (1- 0) /n
条件:np > 5 和 n (1 - p ) > 5
2021/3/7
6
例:某地城镇25岁以上居民高血压患病率为 11%,随机抽查该地矿区25岁以上居民598 人,确诊高血压者有82人。矿区居民与城镇 居民高血压患病率有何不同?
2021/3/7 BMI与糖尿病有关
11
三、 2检验
1. 用途:推断两个或多个总体率(或总体构成 比)之间有无差别,以及配对资料的 比较。
2. 2 检验的基本思想
例: 甲乙两种疗法治疗肺癌的2年生存率
疗法 治疗人数 生存人数 2年生存率%
甲
46
22
47.83
乙
58
35
《卫生统计学》课件

健康状况评价的统计方法
总结词
健康状况评价的统计方法包括描述性统计、推论性统 计和多元统计分析等,用于描述和解释健康数据。
详细描述
描述性统计是健康状况评价的基础,主要包括数据的 收集、整理、描述和呈现。推论性统计则是在描述性 统计的基础上,利用样本数据推断总体特征和变化趋 势。多元统计分析则可以处理多个变量之间的关系, 深入挖掘数据背后的规律和联系。这些统计方法在评 价健康状况时相互补充,为理解和解释健康数据提供 有力支持。
通过健康调查数据的统计分析,了解人群健康状 况,评价干预措施效果。
医学研究与实践
在医学研究和实践工作中,卫生统计学方法的应 用可以提高研究质量和数据可靠性。
卫生统计学的发展历程
基础阶段
20世纪初,数理统计学的发展为卫生统计学奠定了基础。
应用阶段
二战后,随着计算机技术的发展和流行病学数据的积累,卫生统 计学在公共卫生领域得到广泛应用。
可能性。
生存率的估计与比较
估计方法
乘积极限法、寿命表法、Kaplan-Meier法等。
比较方法
log-rank检验、Tarone-Ware检验、Breslow检验等。
Cox比例风险模型
模型建立
基于比例风险假设,将生存时间与协变量之间的关系 用比例风险函数来描述。
模型应用
用于分析多因素对生存时间的影响,预测不同个体在 不同条件下的生存概率。
03
描述性卫生统计学
频数与频率分布
频数
每个数据值出现的次数。
频率
频数与总数之比,用于描述数据分布特征。
相对频率
某一类别的频率与所有类别的总频率之比,用于 比较不同类别的分布情况。
图形表示方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统统计计分分析析
统计描述
统计推断
内容
• 率的抽样分布 • 率的抽样误差与标准误 • 总体率的置信区间估计 • 两个率比较的U检验 • X2检验
要求
掌握: •U检验适用条件 •x2检验的用途、四格表资料(配对资料)的x2检验应 用条件 •行×列表资料的x2检验及其注意事项; 熟悉: •U检验计算方法 •x2检验计算方法 了解: •率的抽样分布、x2分布
P(2)=0.3087 P(3)=0.1323 P(4)=0.0283 P(5)=0.0024
• 二项分布的形状取决于π和n的大小,高 峰在m=np处。当p接近0.5时,图形是对 称的;p离0.5愈远,对称性愈差,但随着 n的增大,分布趋于对称。当n→∞时, 只要p不太靠近0或1,特别是当nP和n(1 -P)都大于5时,二项分布近似于正态分 布。
二、两样本率的比较
1、正态近似法
n足够大,p或1-p均不太小(np和n(1-p)均 大于5)。
up1p2
p1p2
Sp1p2
pc(1pc)(n11
1) n2
pc
X1 n1
X2 n2
例10-8
为了解某地小学生蛔虫感染率的城乡差异,抽样调查 了该地小学生,其中城镇小学生8207人,粪检蛔虫卵 阳性数701人,蛔虫感染率为8.54%,乡村小学生 14585人,粪检蛔虫卵阳性数2167人,蛔虫感染率为 14.86%,试比较该地小学生蛔虫感染率城乡之间有
问该院直肠癌患者围术期并发症发生率与一般情况 有无差异。
H0:π= π0 H1:π≠ π0 α=0.05
P=0.26
u p0
0.300.26
1.713
0(10) 0.3(10.3)
n
385
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
一、率的抽样分布
• 在医学领域中,有一些随机事件是只具有两种 互斥结果的离散型随机事件,称为二项分类变 量(dichotomous variable),如对病人治疗结 果的有效与无效,某种化验结果的阳性与阴性 ,接触某传染源的感染与未感染等。二项分布 (binomial distribution)就是对这类只具有两 种互斥结果的离散型随机事件的规律性进行描 述的一种概率分布。
1 n2
)
0.08540.1486
0.0046
0.1258(10.1258)
1 8207
145185
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节 x2 检 验
卡方检验(Chi-square test )主要用于分 类资料的统计分析,研究的变量是分类变量, 而观察值以频数表示。
总体率95%的可信区间为:
查表法
p1.96sp
总体率99%的可信区间为:
正态近似法
p2.58sp
p1.96sp
例 试估计例10-6中结核菌素试验阳性 率的95%和99%的置信区间。 已知阳性率0. 3847,标准误为0.0116
( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) , ( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) 0 .3 6 2 0 ~ 0 .4 0 7 4
该方法可用于推断两个及多个总体率(或构 成比)之间有无差别、分类资料的关联度分 析以及频数分布的拟合优度检验等。
一 、x2 检验的基本思想 (chi-square test for fourfold data)
四格表x2检验的基本结构
发生数
未发生数
合计
A组
a
b
a+b
B组
c
d
c+d
合计
a+c
b+d
n
X2检验的基本思想
例10-9 某医生欲比较甲、乙两种药物对动脉 粥样硬化的疗效,甲药治疗71例,有 效52例,乙药治疗42例,有效39例。 问两种药物的有效率是否有差别?
P(X) n! X(1)(nX)
X!(nX)!
• 例10-5 已知①π=0.3,n=5; ②π=0.3, n=10; ③π=0.3,n=15; ④ π=0.5,n=10 。求阳性事件的概率并作概率分布图。
P (0) 5! 0.30(10.3 )(5 0)0.1681 0!(50)!
P (1 ) 5! 0.31(10.3)(5 1)0.3602 1!(51 )!
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正
态分布 • 当nP和n(1-P)都大于5时,二项分布近
似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
p
(1)
n
sp
p(1 p) n
例
结核菌素试验阳性率,检测1773人,结核菌 属阳性者682人,阳性率为38.47%,试计算标准 误。
spp (1 n p )0 .3 8 4 7 1 (1 7 7 3 0 .3 8 4 7 )0 .0 1 1 6
适用于小样本资料
三、总体率的估ran和计t足( 分 间en)(够(n布 表1≤-大pe参5)s,0均pt数)i或,大mπ1于查a置-pt5均i二信)o不n项区太of小(np
无差H异0:。π1= π2 H1:π1≠ π2 α=0.05
本例:n1=8207,X1=701,P1=0.0854 n2=14585,X2=2167,P2=0.1486
pcX n1 1 n X 2287 20 01 7 1 24 15 68 750.1258
u
p1 p2
pc
(1
pc
)( 1 n1
( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) , ( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) 0 .3 5 4 8 ~ 0 .4 1 4 6
四、两率比较的u检验
一、样本率与总体率的比较
u p0 p0
p
0(10)
n
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者, 围术期出现并发症有100例,并发症发生率为26%,