8.1 独立样本四格表资料的卡方检验

第八章c 2 检验

一、独立样本四格表资料的c 2 检验

问题的提出:

通过前面两章的学习,我们知道可以采用t检验比较两个样本均数的差别是否有统计学意义,可以采用F检验多个样本均数之间的差别是否有统计学意义。在医学研究中,还 常需对比两组或多组定性变量资料之间的差别,例如比较两 种或多种治疗方法的治愈率是否不同。该怎么办?

表 8-1 两种药物治疗消化道溃疡 4周后疗效

处理 愈合 未愈合 合计 愈合率(%)

洛赛克64 21 85 75.29

雷尼替丁51 33 84 60.71

合计115 54 169 68.05

(57.84)(57.16) (26.84)(27.16) ( )2

2 2222 (6457.84)(2127.16)(5157.16)(3326.84) 4.13

57.8427.1657.1626.84 A T T

c - = ---- =+++= ? 1.1 c 2 检验的基本思想

1.2 2×2列联表c 2 检验的基本步骤

1.建立检验假设,确定检验水准

H 0: 2 1 p p = ,即两种药物治疗消化道溃疡的愈合率相同

H 1: 12 p p 1 ,即两种药物治疗消化道溃疡的愈合率不同

a = 0.05

2.计算统计量 ( ) 2

2 2222

(6457.84)(2127.16)(5157.16)(3326.84) 4.13

57.8427.1657.1626.84 A T T

c - = ---- =+++= ?

3.确定P值,做出推断

n自由度为ν=(行数―1)×(列数―1)

n按自由度等于1 , 检验水准等于0.05, 查附表8,得c 2 0.05, 1 = 3.84。

本例c 2 = 4.13,可知P<0.05。在α=0.05水平上拒绝H 0 ,两样本频率的差异具有统计学意义。

n因为洛赛克的样本愈合率为75.29%,雷尼替丁的愈合率为

60.71%,可以认为洛赛克的愈合率比雷尼替丁的愈合率高。

1.3 2×2列联表c 2 检验的专用公式

)

)( )( )( ( ) ( 2

2 d b c a d c b a n

bc ad + + + + - = c ( ) 2

2 2222

(6457.84)(2127.16)(5157.16)(3326.84) 4.13

57.8427.1657.1626.84 A T T

c - = ---- =+++= ?

2×2列联表c 2 检验的校正公式

? - - = T

T A 2

2 ) 5 . 0 ( c )

)( )( )( ( ) 2 / | (| 22 d b c a d c b a n

n bc ad + + + + - - = c

0.0

0.1 0.2 0.3

0.4

0 3 6 9 12 15

v =1

v =4

v =6

v =9

图8-1 4种自由度c 2 分布的概率密度曲线

1.4 2×2列联表c 2 检验的注意事项

1.c 2 校正公式仅用于四格表资料,对多组样本分布,一般不作校正。2.当n<40或T<1时,校正c 2 值也不恰当,这时可以用Fisher确切概率法检验,见本章第四节。

3.两组疗效对比的必要前提之一,是两组患者“病情相似”,这一点非常重要,只有在两组对象其他方面“同质”的前提下才能比较两个频 率,才能进行列联表的c 2 检验。

配对卡方检验及Kappa检验一致性检验

一、配对卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择McNemanr复选框,进行McNemanr检验。即配对卡方检验,只能针对方形表格进行。不能给出卡方值,只能给出P值。 二、一致性检验(Kappa检验) 诊断试验的一致性检验经常用在下列两种情况中:一种是评价待评价的诊断实验方法与金标准的一致性;另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作 出的诊断的一致性等等。 Kappa值即内部一致性系数(inter-rater,coefficient of internal consistency),是作为评价判断的一致性程度的重要指标。取值在0~1 之间。Kappa≥两者一致性较好;>Kappa≥两者一致性一般;Kappa<两者一致性较差。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择Kappa复选框。计算Kappa值。 如果选择Risk复选框,则计算OR值(比数比)和RR值(相对危险度)。 病例对照研究(case control study)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显着高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系。究竟是否是因果联系,须根据一些标准再加以衡量判断。 所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。

统计软件配对卡方检验教程

1. 配对四格表的卡方检验 (1) 当b+c≥40 c b c b +-=2 2 )(χ 1=υ (2) 当b+c<40 c b c b +--= 2 2 )1(χ 1=υ 例.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等? 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计 20 8 28 例6.某医院用三种方案治疗急性无黄疸型病毒性肝炎结果如下,问三种疗法的有效率是否一致? 表6 三种方案治疗肝炎疗效的结果比较 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西结合 59 15 74 79.73 145 109 254 57.09 卡方分割:(а必须校正,然后P 值和α’进行比较) 多个实验组间的两两比较:1 2' += k C α α 实验组与同一个对照组比较:() 12' -= k α α 1 输入值 2. 权重 3.计算卡方值 4.结果 Asymp.sig.的那一列就是P 值:表示三者间不全相同 5.卡方分割 输入条件 选择相应的组别计算相应的卡方值 例7. 测得某地5801人的ABO 血型和MN 血型结果如表7-10,问两种血型系统之间是否有关联? 表7 某地5801人的血型 ABO 血型 MN 血型 合计 M N MN O 431 490 902 1823

A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计1451 1666 2684 5801 此题为双向无序,用卡方检验,计算列联系数: 计算步骤相同 唯一不同之处:多选两项(contigency coefficient为列联系数) 结果 结果解释:卡方值显示两者间有联系,Linear-by- Linear Association 中P<0.0001,所以数据符合线性;论文统计时还需要计算偏离线性回归分量=213.162-51.336即可,相应的自由度为6-1=5,算出的P值越大越说明符合线性。 例8. 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势? 表8 年龄与冠状动脉硬化的关系 年龄(岁) (X) 冠状动脉硬化等级(Y) 合计—+ ++ +++ 20~70 22 4 2 98 30~27 24 9 3 63 40~16 23 13 7 59 ≥50 9 20 15 14 58 合计122 89 41 26 278 双向有序但属性不同,进行线性趋势检验(test for linear trend): 1. 计算总的X 2值 2. 计算线性回归分量X 2回归 3. 计算偏离线性回归分量X 2偏 4. 列2x分解表,确定p值 变异来源df p 总变异(R-1)(C-1) 线性回归分量若小于0则相 关 偏离线性回归分量若小于0则为非直线相关 输入值进行线性趋势检验 结果 结果解释:卡方值即总变异为71.432 回归值为63.389 然后在EXCEL手工计算 配对四格表的扩展即例9 例9. 以血清法作为金标准评价滤纸片法的准确性,检测指标为检测标本的抗体阳性反应等级,结果如下表33-4,试进行效度评价。 表9 滤纸片法与血清法比较

5习题-卡方检验

计数资料统计分析————习题 1.220.05,n x x ≥ 则( ) A.P ≥0.05 B.P ≤0.05 C.P <0.05 D.P =0.05 E.P >0.05 2.2x 检验中,自由度v 的计算为( ) A.行×列(R ×C ) B.样本含量n C.n-1 D.(R -1)(C -1) E.n 2.四格表卡方检验中,2x <20.05(1)x ,可认为 A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显著性检验方法是( ) A.t 检验法 B.正态检验法 C.秩和检验法 D.2 x 检验法 E.方差分析 4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( ) A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文 2x >20.01(1)x 2x >2 0.05(1)x 。若甲乙两论文的样本量相同,则可认为( ) A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是( ) A. 22 ()()()()()ad bc n x a b a c b d c d -=++++ B. B. 2 2 ()b c x b c -=+ C . 2 2 1R C A x n n n ??=- ???∑ D. ()220.5b c x b c --=+ E. 2 2 ()A T x T -=∑

15-2配对四格表资料差别检验的精确概率方法_刘玉秀

南京大学学报(自然科学) 第34卷 第5期 JOU RN AL OF NAN JING U NIV ERSIT Y Vol.34,No.5 1998年9月 (N ATU RAL SCIENCES ) Sept .,1998 配对四格表资料差别检验的精确概率方法 刘玉秀 刘 钧 ( 南京大学医学院临床学院 南京军区南京总医院  医务部,210002,南京) 摘 要 探讨用于配对四格表资料差别检验的精确概率方法。方法:在配对四格表资料两组率差为0的无效假设下,根据两项分布的原理,可导出假设检验用的精确概率计算公式,借此公式经逐一计算,给出b ≤20和c ≤10不同组合时的单、双侧检验精确概率值。提供了配对四格表资料差别检验的精确概率计算公式,并构造出b ≤20和c ≤10的精确概率速查表。结论:M cN emar 卡方检验方法仅适于b +c >20情形,当b +c ≤20时宜用本文介绍的精确概率方法:或通过公式计算或直接查表。 关键词 配对四格表,假设检验,精确概率分类法 R311a 0 引 言 医学研究中经常会遇到配对形式的四格表资料,该类资料数据处理的目的一般为推断两因素(处理)间有无关联或两处理的结果间有无差异(此种情况更为多见),前者可采用通常四格表资料处理的卡方检验法或Fisher 精确概率法,后者常规应用的方法为M cNem ar 卡方检验法,但此方法需满足一定的条件,当配对四格表中(b+c)较小(<20)时不宜使用,应考虑选用配对四格表资料差别检验的精确概率计算方法。 表1 A 、B 两种检验方法对血中某抗体的检出情况T able 1 T he o utcome o f two test matho ds A B +-合 计+ 461460-43640合计 50 50 100 1 举 例 欲比较两种检验方法对血样中某抗体的检出率,将100份血样同时用两种方法进行检测,结果为阳性或阴性。根据检测的结果,应以血样本为基本单位,整理成数据对子数为100的配对形式的四格表资料(表1)进行两方法间检出率 a 收稿日期:1997-07-14;修回日期:1998-03-03 第一作者简介:刘玉秀,男,1966年2月生,主治医师,现从事科研管理,曾发表“生物检定数据效价比 值的广义线性模型估计”等论文

配对卡方检验及Kappa检验一致性检验完整版

配对卡方检验及K a p p a 检验一致性检验 集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]

一、配对卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择McNemanr复选框,进行McNemanr检验。即配对卡方检验,只能针对方形表格进行。不能给出卡方值,只能给出P 值。 二、一致性检验(Kappa检验) 诊断试验的一致性检验经常用在下列两种情况中:一种是评价待评价的诊断实验方法与金标准的一致性;另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作出的诊断的一致性等等。 Kappa值即内部一致性系数(inter-rater,coefficientofinternalconsistency),是作为评价判断的一致性程度的重要指标。取值在0~1之间。Kappa≥0.75两者一致性较好;0.75>Kappa ≥0.4两者一致性一般;Kappa<0.4两者一致性较差。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择Kappa复选框。计算Kappa值。 如果选择Risk复选框,则计算OR值(比数比)和RR值(相对危险度)。 病例对照研究(casecontrolstudy)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显着高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系。究竟是否是因果联系,须根据一些标准再加以衡量判断。 所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。 例如,对一组肺癌病人(病例组)和一组未患肺癌但有可比性的人(对照组)调查他们的吸烟(暴露)历史(可包括现在吸烟否,过去吸过烟否,开始吸烟年龄,吸烟年数,最近每天吸烟支数;如已戒烟则为戒烟前每日吸烟支数,已戒烟年数,等等)。其目的为通过比较两组吸烟史的差别,检验吸烟(可疑病因)与疾病(肺癌)有因果联系的假设。这就是病例对照研究。 如果选择Cochran'sandMantel-Haenszelstatistics复选框,则可以为两个二分类变量进行独立性检验和同质性(齐性)检验,同时可进行分层因素的调整。包括:χ2MH统计量(分层卡

Q:如何在SPSS中实现四格表的卡方检验

Q:如何在SPSS中实现四格表的卡方检验? A:在多数统计软件中,四格表(和行*列表)的数据格式均为行变量、列变量和频数变量。如下面这个四格表的数据及相应格式如下: 分析时首先选择菜单Data->Weight Cases,将频数变量选入Frequency格中,按OK确认。此时系统就会以频数表的形式来读取所输入的数据,既记录数应为34+12+23+26=95例,而不是4例。然后选择菜单Analyze->Descriptive Statistics->Cross Tables,将行、列变量分别选入相应的Row、Column格中,再按下方的Statistics钮,选中左上角的Chi-square复选框,按Continue钮,最后按OK即可。 Spss电脑实验-第三节(1) 您要打印的文件是:Spss电脑实验-第三节(1) 打印本文 Spss电脑实验-第三节(1) 作者:佚名转贴自:本站原创点击数:74

第三节不同对象有关指标发生率 (百分比)间的比较 Ⅰ.两种对象率(百分比)间的比较—四格表χ2 检验 χ 2 检验(chi-square test),χ为希腊文字母,读作 [kai](卡); chi-square读作“卡方”;χ2 检验即“卡方检验”。它是一种用途较广的假设检验方法,是分析计率或百分 比及某些等级资料常用的方法,可分析两个或两个以上率(或百分比)差别的显著性。 1. 两个样本率(百分比)比较—一般四格表的χ2检验 四格表的χ2检验用于分析两组或两组以上率(或百分比)差别的显著性。 χ2 = ∑[(∣A - T∣)2 / T ] .....................................(3-1) 式中 A 为四格表各格子中的实际数,T 为理论数。 χ2 =(ad-bc)2 n / [(a+b)(c+d)(a+c)(b+d)] .........................(3-2) 例如: 某医院用两种疗法(drug)治疗慢性肾炎病人,结果(effect)西药 组有效率为 79.7%(63/79);中药组有效率为 87.0(47/54),见表 3-1-a。问中药治疗的有效率是否较高?(引自何清波等 主编,医学统计学及其软件包,2002 年,P.183)。 表3-1-a 两种疗法治疗慢性肾炎病人的结果 治疗用药治疗例数有效例数有效率(%) 西药 79 63 79.7中药 54 47 87.0--------------------------------------------------------------------- -----------合计 133 110 82.7 表 3-1是学术论文或总结报告中的常用形式;而在进行χ2检验时,不能用这 个表的形式,必须列出象表 3-1-b 的表格形式,其中要从“治疗例数合计”中分出“无效例数”,这才是所谓著 名的“四格表”(fourfold table,或2×2表,即 a = 63、b = 16、c = 47、d = 7 这 4 格),而不是表 3-1-a 中的 79、63、54、 47 这 4 格! 表3-1-b 两种疗法治疗慢性肾炎病人的结果 治疗结果(effect)治疗用药 ---------------------------------(drug)有效例数 (1) 无效 例数 (2) 治疗例数合计有效率(%) 西药 (1) 63 (a) 16 (b) 79 (a+b) 79.7中药 (2) 47 (c) 7 (d) 54 (c+d)

习题卡方检验图文稿

习题卡方检验 集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

计数资料统计分析————习题 1.220.05,n x x ≥ 则( ) A.P ≥0.05 B.P ≤0.05 C.P <0.05 D.P =0.05 E.P >0.05 2.2x 检验中,自由度v 的计算为( ) A.行×列(R ×C ) B.样本含量n C.n-1 D.(R -1)(C -1) E.n 2.四格表卡方检验中,2x <20.05(1)x ,可认为? A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显着性检验方法是( ) A.t 检验法 B.正态检验法 C.秩和检验法 D.2x 检验法 E.方差分析 4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( ) A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文 2x >20.01(1)x ,乙论文2x >20.05(1)x 。若甲乙两论文的样本量相同,则可认为( ) A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是( ) A. 22 ()()()()()ad bc n x a b a c b d c d -=++++

B. B. 2 2 () b c x b c - = + C. 2 21 R C A x n n n ??=- ? ?? ∑ D. ()2 2 0.5 b c x b c -- = + E. 2 2 () A T x T -=∑ 7.关于行×列表2x检验,正确的应用必须是() A.不宜有格子中的实际数小于5 B.不宜有格子中的理论数小于5 C.不宜有格子中的理论数小于5 或小于1 D.不宜有1/5 以上的格子中的理论数小于5 或有一个格子中的理论数小于l E.不宜有1/5 以上的格子中的实际教小于5 或有一个格子中的实际数小于1 8.R×C 表的2x检验中,P<0.05 说明() A.被比较的n 个样本率之间的差异有显着性 B.样本率间差别没有显着性 C.任何两个率之间差别均有显着性 D.至少某两个样本率是差别有显着性 E.只有两个样本率间差别有显着性 9.四个样本率作比较, 22 0.01,(3) χχ >,可认为() A.各总体率不等或不全相等 B.各总体率均不相等 C.各样本率均不相等

卡方检验习题

2 χ检验 练习题 一、最佳选择题 1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。 A.增大B.减小C.不变 D.不确定E.随a格子实际频数增减而增减 2.有97份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA法对轮状病毒进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用()统计方法? 两种诊断方法的诊断结果 血凝试验法 ELISA法 合计符合不符合 符合74 8 82 不符合14 1 15 合计88 9 97 A.连续性校正2 χ检验B.非连续性校正2 χ检验C.确切概率法D.配对2 χ检验(McNemar检验)E.拟合优度2 χ检验 3.做5个样本率的χ2检验,每组样本量均为50,其自由度为()。 A 249 B 246 C 1 D 4 E 9 4.对四格表资料做2 χ检验时,如果将四格表的行与列对调,则对调前后的()。 A.校正2 χ值不等B.非校正2 χ值不等 C.确切概率检验的P值不等D.非校正2 χ值相等 E.非校正2 χ值可能相等,也可能不等 二、问答题

1.简述2 χ检验的基本思想。 2.四格表2 χ检验有哪两种类型?各自在运用上有何注意事项? 3.什么情况下使用Fisher确切概率检验两个率的差别? 4.在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比? 三、计算题 1.前列腺癌患者121名中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症者1人。试分析两种手术的合并症发生率有无差异? 2.苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同? 两地献血人员的血型分布 地区 血型 合计A B O AB Eskdale 33 6 56 5 100 Annandale 54 14 52 5 125 合计87 20 108 10 225 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见下表,问4种镇痛方法的效果有无差异? 4种镇痛方法的效果比较 镇痛方法例数有效率(%) 颈麻100 41 注药100 94 置栓100 89 对照100 27

配对卡方检验及Kappa检验(一致性检验)教学提纲

配对卡方检验及 K a p p a检验(一致性检 验)

精品文档 一、配对卡方检验 把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此时要用配对卡方检验。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择McNemanr复选框,进行McNemanr检验。即配对卡方检验,只能针对方形表格进行。不能给出卡方值,只能给出P值。 二、一致性检验(Kappa检验) 诊断试验的一致性检验经常用在下列两种情况中:一种是评价待评价的诊断实验方法与金标准的一致性;另一种是评价两种化验方法对同一个样本(化验对象)的化验结果的一致性或两个医务工作者对同一组病人的诊断结论的一致性或同一医务工作者对同一组病人前后进行两次观察作出的诊断的一致性等等。 Kappa值即内部一致性系数(inter-rater,coefficient of internal consistency),是作为评价判断的一致性程度的重要指标。取值在0~1之间。Kappa≥0.75两者一致性较好;0.75>Kappa≥0.4两者一致性一般;Kappa<0.4两者一致性较差。 操作方法:单击【Statistics钮】,在弹出的Statistics对话框中选择Kappa复选框。计算Kappa值。 如果选择Risk复选框,则计算OR值(比数比)和RR值(相对危险度)。 病例对照研究(case control study)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显著高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系。究竟是否是因果联系,须根据一些标准再加以衡量判断。 所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。 例如,对一组肺癌病人(病例组)和一组未患肺癌但有可比性的人(对照组)调查他们的吸烟(暴露)历史(可包括现在吸烟否,过去吸过烟否,开始 收集于网络,如有侵权请联系管理员删除

统计软件配对卡方检验教程

统计软件配对卡方检验 教程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

1.配对四格表的卡方检验 (1) 当b+c≥40 c b c b +-=2 2 )(χ 1=υ (2) 当b+c<40 c b c b +--= 2 2 )1(χ 1=υ 例.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计 20 8 28 例6.某医院用三种方案治疗急性无黄疸型病毒性肝炎结果如下,问三种疗法的有效率是否一致 表6 三种方案治疗肝炎疗效的结果比较 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 中药组 35 45 80 中西结合 59 15 74 145 109 254 卡方分割:(а必须校正,然后P 值和α’进行比较) 多个实验组间的两两比较:1 2'+= k C α α 实验组与同一个对照组比较:() 12'-= k α α 1 输入值

2. 权重 3.计算卡方值 4.结果 .的那一列就是P值:表示三者间不全相同 5.卡方分割 输入条件 选择相应的组别计算相应的卡方值 例7. 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联 表7 某地5801人的血型 ABO血型 MN血型 合计M N MN O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计1451 1666 2684 5801 此题为双向无序,用卡方检验,计算列联系数: 计算步骤相同 唯一不同之处:多选两项(contigency coefficient为列联系数) 结果 结果解释:卡方值显示两者间有联系,Linear-by- Linear Association 中P<,所以数据符合线性;论文统计时还需要计算偏离线性回归分量=即可,相应的自由度为6-1=5,算出的P值越大越说明符合线性。 例8. 某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势 表8 年龄与冠状动脉硬化的关系 年龄(岁) 冠状动脉硬化等级(Y) 合计

卡方检验习题

2检验 练习题 一、最佳选择题 1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。 A.增大B.减小C.不变 D.不确定E.随a 格子实际频数增减而增减 2.有97 份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA 法对轮状病毒进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用()统计方法? 两种诊断方法的诊断结果 血凝试验法 ELISA 法 合计符合不符合 符合74882 不符合14115 合计88997 A.连续性校正2检验B.非连续性校正2检验 C .确切概率法 D .配对2检验(McNemar 检验) E .拟合优度2检验 3.做5 个样本率的2检验,每组样本量均为50,其自由度为()。 A 249 B 246 C 1 D 4 E 9 4.对四格表资料做2检验时,如果将四格表的行与列对调,则对调前后的()。 A.校正2值不等B.非校正2值不等 C.确切概率检验的P 值不等D.非校正2值相等 E.非校正2值可能相等,也可能不等 二、问答题 1.简述2检验的基本思想。

2.四格表2检验有哪两种类型?各自在运用上有何注意事项? 3.什么情况下使用Fisher 确切概率检验两个率的差别? 4.在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比? 三、计算题 1.前列腺癌患者121 名中,82 名接受电切术治疗,术后有合并症者11 人;39 名接受开放手术治疗,术后有合并症者 1 人。试分析两种手术的合并症发生率有无差异? 2 .苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同? 地区 血型 合计A B O AB Eskdale336565100 Annandale5414525125 合计872010810225 3. 某医院以400 例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4 组,每组 100 例,分别给予不同的镇痛处理,观察的镇痛效果见下表,问4 种镇痛方法的效果有无差异? 4 种镇痛方法的效果比较 镇痛方法例数有效率(%) 颈麻10041 注药10094 置栓10089 对照10027

统计学教案习题08卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H : 21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的 检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格 表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算 表8-1 2检验的用途、假设的设立及基本计算公式 01四格表 ①独立资料两 样本率的比较 ②配对资料两 样本率的比较 0H :两总体率相等 1H :两总体率不等 ①专用公式 )(22 n bc ad -= χ

5习题-卡方检验

计数资料统计分析————习题 1. 22 0.05,n x x ≥ 则() A.P≥0.05 B.P≤0.05 C.P<0.05 D.P=0.05 E.P>0.05 2.2x检验中,自由度v的计算为( ) A.行×列(R×C) B.样本含量n C.n-1 D.(R-1)(C-1) E.n 2.四格表卡方检验中,2x< 2 0.05(1) x ,可认为 A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显著性检验方法是() A.t 检验法 B.正态检验法 C.秩和检验法 D.2x检验法 E.方差分析 4.在卡方界值(2x)表中,当自由度一定时,2x值愈大,P 值() A.不变 B.愈大 C.愈小 D.与2x值相等 E.与2x值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x检验结果,甲论文 2x > 2 0.01(1) x ,乙论文 2x> 2 0.05(1) x 。若甲乙两论文的样本量相同,则可认为() A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R×C 表的专用公式是() A. 2 2 () ()()()() ad bc n x a b a c b d c d - = ++++ B. B. 2 2 () b c x b c - = + C. 2 21 R C A x n n n ??=- ? ?? ∑ D. ()2 2 0.5 b c x b c -- = + E. 2 2 () A T x T -=∑

SPSS 卡方检验

卡方检验 1.四格表的卡方检验 例1.某药品检验所随机抽取了574名成年人,研究某抗生素的耐药性。其中 用该抗生素,其耐药率为40.78%;而在395例曾用过该药的人群中,耐药率为,结果见表1,试兑现人和上人群的耐药率是否一样? 表1 某抗生素的人群耐药性情况 用药史不敏感敏感合计 曾服该药180(174.10)215(220.90)395 未服该药73(78.90)106(100.10)179 合计253 321 574 建立变量名:

录入数值: 加权

统计分析 指定横标目和纵标目,注意不要选反了,选反了会有什么后果?

择分析方法:卡方检验 Chi-square 结果:实际频数理论频数

表一:总例数为574,没有数值遗漏 表二:可观察实际频数,理论频数,各组实际频数占各行各列及总数的百分比。此例题总例数n=574≥40,且所有理论频数T≥5用基本公式或四个表专用公式计算卡方值,结果参照表三第一行。P=0.285≥0.05还不能认为两组耐药率不同。 表三: (1)总例数n=574≥40,且所有理论频数T≥5用基本公式或四格表专

(2)如果n≥40但有1<T<5用校正公式计算卡方值或用Fisher确切概率法直接计算概率,结果分别参照第二行和第四行。 (3)n<40或T<1时用Fisher确切概率法直接计算概率,结果参照第四行。 2.配对四格表的卡方检验 例5.有28份咽喉涂片标本,把每份标本一分为二,分别接种在甲、乙两种白喉杆菌培养基上,观察白喉杆菌生长的情况,其结果如表5,问两种培养基的阳性检出率是否相等? 表5 两种白喉杆菌培养基培养结果比较 甲培养基 乙培养基 + - 合计 + 11 1 12 - 9 7 16 合计20 8 28 建立变量名: 录入数值:

Excel实现配对资料比较的卡方检验

Excel实现配对资料比较的卡方检验 (该Excel文件pzhh@https://www.360docs.net/doc/6e13471652.html,免费提供,欢迎e-mail索取) 视频例1 χ2检验多用于推断两个或两个以上样本率(或构成比)之间有无差异。 对于配对资料,应采用分析结果不同部分有无差别的McNemar χ2 检验。 例:有28份痰液样本,依同样条件分别接种于甲、乙两种结核杆菌培养基上,同+11例同-7例甲+乙-9例甲-乙+1例,问两种培养基的结果有无联系、有无差别(α=0.05)? 在B3,C3,B4,C4格分别输入实际例数11、9、1、7。在E1格输入0.05。 因本例中B组的两个理论频数低于5,故采用校正公式3、4的结论,在α=0.05的水准上,行属性与列属性独立(无相关,也就是说两行上的频数分布是相同的,甲培养的阳性、阴性与乙培养的阳性、阴性之间无关)(χ2=2.658,P=0.103)。如采用未校正公式1、2,将得到如下错误结论:在α=0.05的水准上,行属性与列属性不独立(相关)(χ2=4.215,P=0.040)。 因本例为配对资料,要判断甲与乙之间有无差异时,应采用分析结果不同部分有无差别的McNemar χ2 检验:在α=0.05的水准,结果不同部分有显著的统计学意义(Mc Nemarχ2=4.900,P=0.027)。专业结论:甲乙两种培养基的结果无相关(χ2=2.658,P=0.103)。甲乙两种培养基上结核杆菌生长率不同(Mc Nemarχ2= 4.90,P=0.027),甲培养基上结核杆菌生长率较高(71.4%>42.9%)。

在列的第4至8行分别输入方法1的各级疗效的实际例数;在C列的第4至8行分别输入方法2的各级疗效的实际例数;在G1输入显著性水准0.05,因本例数据等级Ⅰ为疗效最好的“治愈”,所以在G13格录入1(如数据等级Ⅰ为疗效最差的“恶化”时录0)。 原始数据录入后就可得到结果如下图所示。 图中两组值显示在16行,C列,检验u值显示在B19格,值显示在E19格。如值<显著水准α,显示为亮蓝色,否则为桔红色。B20、B21为统计结论。 统计结论:两组数据的值之间差异有非常显著的统计学意义(u=4.05,= 5.1×10-5)。 专业结论:两种治疗方法的治疗效果差异有非常显著的统计学意义(u=4.05,= 5.1×10-5)。1=0. 576,2=0.405;1﹥2,因数据等级是按疗效由好至差排列,所以治疗方法2优于治疗方法1。 双击Excel文件“常用统计”。单击工作表“Ridit分析”。 在列的第4至8行分别输入方法1的各级疗效的实际例数;在C列的第4至8行分别输入方法2的各级疗效的实际例数;在D列的第4至8行分别输入方法3的各级疗效的实际例数;在L1输入显著性水准0.05。因本例数据等级Ⅰ为疗效最好的“治愈”,所以在G13格录入1(如数据等级Ⅰ为疗效最差的“恶化”时录0)。 工作表中最多可录入6个组,每组数据最多可分为9个等级。 图中各组值显示在16行列至G列,多组检验χ2值显示在B23格,值显示在E23格,为桔红色。当值<显著水准α时,显示为亮蓝色,B24显示统计结论:行属性(疗效)与列属性(治疗方法)之间不独立,有相关性。要进一步作各组间两两比较。两个组行列交叉的C27格至G31格显示这两组值两两比较的F值,C33格至G37格是对应的值。当值<显著水准α时,显示为亮蓝色,说明相对应的两治疗方法之间疗效差异有显著的统计学意义。依据G13格录入的数据等级所表示的好差方向,C39格至G43格显示对应交叉格两方法比较的统计结论,哪一方法优于另一方法。 专业结论:各治疗方法与疗效之间不独立(χ2=16.521,=2.59×10-4)。1=0.575,2=0.403;3 =0.503。多组R值均数的两两之间比较显示疗法1与疗法2疗效差异有非常显著的统计学意义(F=8.255,

相关文档
最新文档