卡方检验及校正卡方检验的计算

卡方检验及校正卡方检验的计算
卡方检验及校正卡方检验的计算

2X 检验或卡方检验和校正卡方检验的计算

私立广厦学校 郭捷思

在教育学量的研究中,各种各样的统计方法已经被广泛的应用,特别是由于统计软件(如:SPSS )的不断成熟,给教育研究者提供了多种量的研究方法。但是,这并不是无论什么量的研究都要通过统计软件来实现,也不是所有量的研究一定要运用统计软件才能快捷,简便的实现。本文将教给大家几种简便的方法来实现卡方检验。

2X 检验(chi-square test )或称卡方检验方法可以根据

样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的零假设是样本来自的总体分布与期望分布或某一理论分布无显著差异。根据卡方检验基本思想的理论依据,对变量总体分布的检验就可以从对各个观察频数的分析入手。为检验实际分布与理论分布(期望分布)之间是否存在显著差异,可采用卡方检验统计量。典型的卡方统计量是pearson 卡方,其基本公式为:

∑=-=k

i o i e i o i f f f X 12)( 式中k 为子集个数,o f 为观察频数,e f 为期望频数,2X 服从k —1个自由度的卡方分布。如果2X 值较大,则说明观测频数分布与期望频数分布差距较大;反之,如果2X 值较小,

则说明观测频数分布与期望频数分布较接近。我们将通过代入数据运算这条公式,计算出2X 统计量的观测值,并依据卡方分布表计算观测值对应的概率p 值。下面,将通过几个实际例子来探究如何进行卡方检验。

一、四格表资料的卡方检验

例1:某学校分别运用传统教学和多媒体教学在两个平行班的数学课上进行试验,目的为了检测两种教学方法对学生的成绩影响是否有差异。本实验把学生的成绩划分为优秀人数(80分以上)和非优秀人数。

表1: 两种教学方法学生成绩优秀率的比较

表内这四个数据(斜体)是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table ),或称2行2列表(2×2 contingency table )从该资料算出的;两种教学的优秀率分别为40%和68.6%,两者的差别可能是抽样误差所致,亦可能是两种教学效果确有所不同。这里可通过卡方检验来区别其差异有无统计学意义,

检验步骤: 组别

优秀人数 非优秀人数 合计 优秀率(%) 传统教学班

20 30 50 40 多媒体教学班

35 16 51 68.6 合计 55 46

101 52.5

1.建立检验假设:

H0:π1=π2 (表示样本来自的总体分布与期望分布无显著差异,即传统教学和多媒体教学对学生成绩的影响并没有存在差异)

H1:π1≠π2(传统教学和多媒体教学对学生成绩的影响存在差异)

α=0.05(显著性水平;该值将用于与求出2X的概率p值进行比较,如果2X的概率p值小于显著水平α,则应拒绝零假设;反之则不能拒绝零假设)

2.计算理论(期望)频数(TRC),计算公式为:

T RC=

n n

n

C

R

公式(20.13)

式中TRC是表示第R行C列格子的理论数,

R

n为理论数

同行的合计数,

C

n为与理论数同列的合计数,n为总例数。(这里期望频数精确到0.0001是为了减小误差)第1行1列:50×55/101=27.2277

第1行2列:50×46/101=22.7723

第2行1列:51×55/101=27.7723

第2行2列:51×46/101=23.2277

以推算结果,可与原四项实际数并列成表2:

表2:某学校分别运用传统教学和多媒体教学在两个平行班的数学课的试验结果比较

组别

优秀人数 非优秀人数 合计 传统教学班 20(27.2277) 30(22.7723) 50

多媒体教学班 35(27.7723) 16(23.2277) 51

合计 55 46

101 因为上表每行和每列合计数都是固定的,所以只要用

TRC 式求得其中一项理论数(例如T1.1=27.2277),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:

第1行1列:27.2277

第1行2列:50-27.2277=22.7723

第2行1列:55-27.2277= 27.7723

第2行2列:51-27.7723=23.2277

3.计算x2

值按公式∑=-=k i o i e i o i f f f X 12)(代入 2787.82277

.23)2277.2316(7723.27)7723.2735(7723.22)7723.2230(2277.27)2277.2720()(2222412=-+-+-+-=-=∑=i o i

e i o i

f f f X 4.查2X 值表求P 值

在查表之前应知本题自由度。按2X 检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查2X 界值表(附表1),找到2X 0.01(1)=6.63,2X 0.001(1)=10.83而本题2X =8.2787即2X 0.001(1)>2X >2X 0.01(1),所以0.001<P <0.01,按α=0.05水准,p <α,拒绝H0,差

异有高度统计学意义,可以认为传统教学和多媒体教学对差生成绩的影响存在显著差异。通过2X 界值表可以看出,2X 越大,p 值就会越小,那么试验中的差异具有的统计学意义越大。而从这个实例中,我们可以得到期望频数和实际频数相差越大,2X 值就会越大。另一方面,2X 值的大小又跟子集个数的多少有关,格子数越多,2X 也会越大。也就是说2X 随自由度的增大也增大。

二、用专用公式计算卡方2X 值

对于四格表资料,还可用以下专用公式求2X 值。首先把四个表依次表上字母。如图所示:

表3: 两种教学方法学生学习成绩的比较 组别

优秀人数 非优秀人数 合计 传统教学班 20(a ) 30(b ) 50(a+

b)

多媒体教学班 35(c ) 16(d ) 51(c+

d)

合计 55(a+c) 46(b+d) 101

然后套用专用公式:)

)()()(()(22d b c a d c b a n bc ad X ++++-= 式中a 、b 、c 、d 各表示四个表中四个实际数,n 表示总例数。

结果可以得到:2787.846

555150101)35301620(2=?????-?=X

计算结果与前述用基本公式一致,这种方法的更为简

便。

三、四格表2X 值的校正算法。

上面讲解的例子中的2X 值是根据正态分布中

∑=-=k i o i e i o i f f f X 12)(的定义计算出来的。但是当自由度为1时(即

在四格表中),如果出现期望频数e i f 小于5而总例数又大于

40,应用以下的校正公式:

∑=--=k i o i e i o i f f f X 122)5.0( 如果用四格表专用公式,亦应用下式校正:

)

)()()(()2(22d b c a d c b a n n bc ad X ++++--= 例2,对某学校的学生是否在课外时间请家教进行调查,目的是为了检测课外辅导是否对学生的成绩有影响,结果如表4。

表4: 学生是否在课外时间请家教的对成绩的影响的卡方校正计算

优秀的人数 非优秀的人数 合计 有请家

32(30.4478) 2(3.5522) 34 没请家

28(29.5522) 5(3.4478) 33

合计 60 7 67

从表4可见,T1.2和T2.2数值都<5,且总例数大于

40,故宜用校正公式检验。步骤如下:

1.检验假设:

H0:π1=π2(表示样本来自的总体分布与期望分布无显著差异,即有请家教和没请家教对学生成绩的影响并没有存在差异)

H1:π1≠π2(即有请家教和没请家教对学生成绩的影响存在差异)

α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算x2值:应用公式∑=--=k i o i e i o i f f f X 122)5.0(运算如下:

∑=--=4122

)5.0(i o i e i o i f f f X =2(3230.44780.5)30.4478

--+2(2 3.55220.5)3.5522--+2(2829.5520.5)3.5522--+2(5 3.44780.5)3.4478--=0.7067

则该题的自由度v=(2-1)(2-1)=1,查2X 界值表(附表1),找到2X 0.05(1)=3.84,而本题2X =0.7067即2X <2X 0.05(1),P>0.05,按α=0.05水准,接受H0,无统计学意义。实验结果表明是否参加课外辅导对学生的学习成绩影响并不存在差异。

四、行×列表的卡方检验(2X test for R ×C table )

前面所阐述的是适用于两个组的率或百分比差别的显

著性检验,而对于两个组以上的卡方检验。其检验步骤与上述相同,简单计算公式如下: 2

11o k i i R C f X n n n =??=- ???∑ 式中n 为总例数;o i f 为各观察值;R n 和C n 为与各o i f 值相

应的行和列合计的总数。

例3:许多教育学专家提出母亲的教育背景跟学生的学习成绩有很大的关系,通过以下的实验来验证该理论在某个学校中是否成立。首先把母亲教育水平分为本科及本科以上、专科、中学和小学及小学以下;学生分为优秀(80分以上)和非优秀。

表5:母亲的教育背景与孩子的学习成绩的优秀率的比较 成绩 母亲教育背景

合计 本科及本科以

专科 中学 小学及小学以下 优秀

80 60 30 25 195 非优秀

30 35 60 80 205 合计

110 95 90 105 400 优秀率

(%) 47.4 46.7 58.8 66.3 53.2

该表资料由2行4列组成,称2×4表,可用公式

??? ??-=∑=1812

i n n f C R o i n X 检验。 式中k 为子集个数,o f 为观察频数,R n 为理论数同行的合

计数,C n 为与理论数同列的合计数,n 为总例数。

1.检验假设

H0:不同母亲的教育背景下学生学习成绩的优秀率相同 H 1:不同母亲的教育背景下学生学习成绩的优秀率不同 α=0.05

2.计算2X 值

??? ??-=∑=1812

i n n f C R o i n X =400(280195110?+26019595?+23019590?+225105195?+230205110

? +23512595?+26020590?+280205105

?)=67.92 3.确定P 值和分析

本例v=(2-1)(4-3)=3,据此查附表1:2X 0.001(3)=16.27,本题2X =67.92,2X >2X 0.001(3),P <0.001,按α=0.05水准,拒绝H0,可以认为不同教育水平的母亲,孩子的优秀率存在差异。

五.行×列表2X 检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处

理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。 2.如检验结果拒绝检验假设,只能认为各总体百分比或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

附表1:

v

P

V

P

0.05 0.01 0.001 0.05 0.01 0.001

1 3.84 6.63 10.83 16 26.30 32.00 39.25

2 5.99 9.21 13.81 17 27.59 33.14 40.79

3 7.81 11.3

4 16.27 18 28.87 34.18 42.31

4 9.49 13.28 18.47 19 30.14 36.19 43.82

5 11.07 15.09 20.52 20 31.41 37.57 45.32

6 12.59 16.81 22.46 21 32.6

7 38.93 46.80

7 14.07 18.48 24.32 22 33.92 40.29 48.27

8 15.51 20.09 26.12 23 35.17 41.64 49.73

9 16.92 21.67 27.88 24 36.42 42.98 51.18

10 18.31 23.21 29.59 25 37.65 44.31 52.62

11 19.68 24.72 31.26 26 38.89 45.64 54.05

12 21.03 26.22 32.91 27 40.11 46.96 55.48

13 22.36 27.69 34.53 28 41.34 48.28 56.89

14 23.68 29.14 36.12 29 42.56 49.59 58.30

15 25.00 30.58 37.70 30 43.77 50.89 59.70

(作者:私立广厦学校郭捷思jessekwork@https://www.360docs.net/doc/1a13724366.html, )

卡方检验习题

2 检验 练习题 一、最佳选择题 1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。 A.增大 B.减小 C.不变 D.不确定 E.随a格子实际频数增减而增减 2.有97份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA法对轮状病毒进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用()统计方法 两种诊断方法的诊断结果 血凝试验法ELISA法 合计符合不符合 符合74882

不符合14115 合计88997 A.连续性校正2χ检验 B.非连续性校正2χ检 验 C.确切概率法 D.配对2χ检验 (McNemar检验) E.拟合优度2χ检验 3.做5个样本率的2检验,每组样本量均为50,其自由度为 ()。 A 249 B 246 C 1 D 4 E 9 4.对四格表资料做2χ检验时,如果将四格表的行与列对调,则对 调前后的()。 A.校正2χ值不等 B.非校正2χ值不等 C.确切概率检验的P值不等 D.非校正2χ值相等 E.非校正2χ值可能相等,也可能不等

二、问答题 1.简述2χ检验的基本思想。 2.四格表2χ检验有哪两种类型各自在运用上有何注意事项 3.什么情况下使用Fisher确切概率检验两个率的差别 4.在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比 三、计算题 1.前列腺癌患者121名中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症者1人。试分析两种手术的合并症发生率有无差异 2.苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同 两地献血人员的血型分布 地区血型 合计A B O AB

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计 最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加

最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广. 个独立样本率比较的χ2检验属四格表资料χ2检验。这类资料在医学研究中较为多见。 例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下: 有效无效有效率(%) 试验组 12 1 对照组 3 8 可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件。在读取统计结果时,应当注意χ2检验的适用条件,正确选择Pearson卡方检验、Yates校正卡方检验、Fisher 精确概率法(本法不属于χ2检验)。 第三节四格表资料的Fisher确切概率法 前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由年)提出的,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。 下面以例8-1介绍其基本思想与检验步骤。 例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。问两组新生儿的HBV总体感染率有无差别?

卡方检验及校正卡方检验的计算

2X 检验或卡方检验和校正卡方检验的计算 私立广厦学校 郭捷思 在教育学量的研究中,各种各样的统计方法已经被广泛的应用,特别是由于统计软件(如:SPSS )的不断成熟,给教育研究者提供了多种量的研究方法。但是,这并不是无论什么量的研究都要通过统计软件来实现,也不是所有量的研究一定要运用统计软件才能快捷,简便的实现。本文将教给大家几种简便的方法来实现卡方检验。 2X 检验(chi-square test )或称卡方检验方法可以根据 样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的零假设是样本来自的总体分布与期望分布或某一理论分布无显著差异。根据卡方检验基本思想的理论依据,对变量总体分布的检验就可以从对各个观察频数的分析入手。为检验实际分布与理论分布(期望分布)之间是否存在显著差异,可采用卡方检验统计量。典型的卡方统计量是pearson 卡方,其基本公式为: ∑=-=k i o i e i o i f f f X 12)( 式中k 为子集个数,o f 为观察频数,e f 为期望频数,2X 服从k —1个自由度的卡方分布。如果2X 值较大,则说明观测频数分布与期望频数分布差距较大;反之,如果2X 值较小,

则说明观测频数分布与期望频数分布较接近。我们将通过代入数据运算这条公式,计算出2X 统计量的观测值,并依据卡方分布表计算观测值对应的概率p 值。下面,将通过几个实际例子来探究如何进行卡方检验。 一、四格表资料的卡方检验 例1:某学校分别运用传统教学和多媒体教学在两个平行班的数学课上进行试验,目的为了检测两种教学方法对学生的成绩影响是否有差异。本实验把学生的成绩划分为优秀人数(80分以上)和非优秀人数。 表1: 两种教学方法学生成绩优秀率的比较 表内这四个数据(斜体)是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table ),或称2行2列表(2×2 contingency table )从该资料算出的;两种教学的优秀率分别为40%和68.6%,两者的差别可能是抽样误差所致,亦可能是两种教学效果确有所不同。这里可通过卡方检验来区别其差异有无统计学意义, 检验步骤: 组别 优秀人数 非优秀人数 合计 优秀率(%) 传统教学班 20 30 50 40 多媒体教学班 35 16 51 68.6 合计 55 46 101 52.5

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算 x2检验(chi-square test)或称卡方检验 x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。 一、四格表资料的x2检验 例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表 20-11,问两种疗法有无差别? 表20-11 两种疗法治疗卵巢癌的疗效比较 表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为: TRC=nR.nc/n 公式(20.13) 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。 第1行1列: 43×53/87=26.2 第1行2列: 43×34/87=16.8 第2行1列: 44×53/87=26.8 第2行2列: 4×34/87=17.2 以推算结果,可与原四项实际数并列成表20-12: 表20-12 两种疗法治疗卵巢癌的疗效比较

SPSS 确切概率法(1)

SPSS 确切概率法 1.什么时候使用确切概率? 当n很小时,因为不服从卡方分布(不能有单元格的期望小于1,不能有20%以上的单元格期望值小于5),所以不能用卡方检验,这时系统会在分析结果的最后给出警告(WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test),提示用户采用确切概率法分析。 2.确切概率的思想是什么? fisher精确检验其思想是在固定各边缘和的条件下,根据超几何分布(见概率分布),可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列,以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加,若所得结果小于给定的显著性水平(比如给定的显著水平为0.05),则判定所考虑的两个属性存在关联,从而拒绝h0。 3.怎么操作? 例1.(1)录入数据

(1)加权:Data——Weight Cases:Weight case by(选入“频数”) (3)卡方检验:Analyze——Descriptive

Statistics——Crosstabs:Row(选入性别),Column(选入咨询内容);点击Statistics:选择Chi-square;点击Continue,点击OK。见图3,4。 4 分析结果:χ2值与P值,依次看“Chi-Square Tests”表的第1行,红色字体部分。

补充:第2行是校正的卡方值与P值,第4行是Fisher确切概率法计算的P值。 通常规定: (1)当两组总样本量n≥40且所有的单元格的理论频数T≥5时,看第1行的结果;当P≈检验水准时,看第4行的结果。(2)当两组总样本量n≥40但有1≤理论频数T<5时,看第2行的结果;或者看第4行的结果。 (3)当两组总样本量n<40,或最小理论频数T<1时,看第4行的结果。 例2某研究者调查了一匹高血压患者的血压控制情况和肥胖度,数据见文件tables.sav,为列举格式。汇总如下表,试分析两者之间有无关系。

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

卡方分布

卡方分布 (重定向自卡方分布(Chi-square Distribution)) 卡方分布(Chi-square Distribution) [编辑] 什么是卡方分布 卡方分布(χ2分布)是概率论与统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验和置信区间的计算。 [编辑] 卡方分布的数学定义 若k 个随机变量Z1、……、Zk 相互独立,且数学期望为0、方差为1(即服从标准正态分布),则随机变量X 被称为服从自由度为k 的卡方分布,记作 [编辑] 卡方分布的特征 卡方分布的概率密度函数为: 其中x≥0, 当x≤0时fk(x) = 0。这里Γ代表Gamma 函数。

卡方分布的累积分布函数为: 其中γ(k,z)为不完全Gamma函数 在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如https://www.360docs.net/doc/1a13724366.html, Calc和Microsoft Excel中都包括卡方分布函数。 卡方分布可以用来测试随机变量之间是否相互独立,也可用来检测统计模型是否符合实际要求。 自由度为k 的卡方变量的平均值是k,方差是2k。卡方分布是伽玛分布的一个特例,它的熵为: 其中ψ(x) 是Digamma function。

[编辑] 卡方变数与Gamma变数的关系 当Gamma变数频率(λ)为1/2 时,α 的2倍为卡方变数之自由度(Degree of freedom) 即: 卡方变数之期望值=自由度卡方变数之方差=两倍自由度 卡方分布 , , ,

k-2, if, , , , 定义:N个服从正态分布(均值为0,方差为1)的独立随机变量的平方和X服从自由度为N的卡方分布。 问题:证明D(X)=2N 二、 定义:假设X服从均值为0方差为1的正态分布,Z服从自由度为N的卡方分布,如果X和Z独立,那么T=[X/根号(Z/N)]服从自由度为N的t分布。 问题:证明D(T)=N/(N-2) 要求:1.只要有一题证明正确者追加分数! 2.请各位兄弟证明不到的不要乱回答,但可以说说自己的想法。 辛苦各位了~ 问题补充:

卡方

2χ检验 概述 卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。 卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,它的基本的无效假设是: H0:行分类变量与列分类变量无关联 H1:行分类变量与列分类变量有关联 α=0.05 统计量 ,其中Ai 是样本资料的计数,Ti 是在H0为真的情况下的理论数(期望值)。 在H0为真时,实际观察数与理论数之差Ai -Ti 应该比较接近0。 所以在H0为真时,检验统计量 服从自由度为k-1的卡方分布。即: ,拒绝H0。 上述卡方检验由此派生了不同应用背景的各种问题的检验,特别最常用的是两个样本率的检验等。 计算方法及使用条件 卡方在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 1、四格表资料的卡方检验 四格表资料的卡方检验用于进行两个率或两个构成比的比较。 1)专用公式: 若四格表资料四个格子的频数分别为a ,b ,c ,d ,则四格表资料卡方检验的卡方值=(ad ? bc )2 * n /(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1) 2)应用条件: 2 21()k i i P i i A T T χ=-=∑221()k i i P i i A T T χ=-=∑22,P v αχχ>

要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。 2、行X列表资料的卡方检验 行X列表资料的卡方检验用于多个率或多个构成比的比较。 1)专用公式: r行c列表资料卡方检验的卡方值 = 2)应用条件: 要求每个格子中的理论频数T均大于5或1

卡方检验

第16章无序分类变量的统计推断——卡方检验 通过前面的介绍可以知道,变量可以被分为连续性变量(定距、定比)和分类变量,后者又被细分为有序、无序变量两种。对于各组所在总体的定量变量(即连续性变量)的平均水平,可以使用t检验和方差分析方法进行比较,秩和检验则用于比较各组所在总体为有序分类变量的分布情况是否相同。这里将要介绍的卡方检验主要用于 是在应用的程度上可以和t检验相媲美的另一种常用检验方法。 连续变量两组t检验 多组方差分析 分类变量有序秩和检验 无序卡方检验 16.1 卡方检验概述 16.1.1 卡方检验的基本原理 1. 卡方检验的基本思想 卡方检验是以χ2分布为基础的一种常用假设检验方法, 它的无效假设为H0是:观察频数与期望频数没有差异。 卡方检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确H0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著差异;否则不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。 2.卡方值的计算与意义 见复印资料柯惠新等人编著《调查研究中的统计分析法》 卡方统计量,由于它最初是由英国统计学家Karl Pearson 在1900年首次提出的,因此也称之为Pearson χ2。 由卡方的计算公式可知,当观察频数与期望频数完全一致时,χ2值为0;观察频数与期望频数越接近,两者之间的差异越小,χ2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ2值越大。换言之,大的χ2值表明观察频数远离期望频数,即表明远离假设。 3.卡方检验的样本量要求 一般认为,对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有4/5的单元格期望频数大于5,此时使用卡方分布计算出的概率值才是准确的。 16.1.2 卡方检验的用途 卡方检验最常间的用途就是考察无序分类变量各水平在两组或多组之间的分布是否一致。实

相关文档
最新文档