卡方检验习题说课讲解

卡方检验习题

χ检验

练习题

一、最佳选择题

1．四格表的周边合计不变时，如果实际频数有变化，则理论频数（）。

A．增大 B．减小 C．不变

D．不确定 E．随a格子实际频数增减而增减

2．有97份血液标本，将每份标本一分为二，分别用血凝试验法和ELISA 法对轮状病毒进行诊断，诊断符合情况见下表，欲比较何种诊断方法的诊断符合率较高，用（）统计方法？

两种诊断方法的诊断结果

血凝试验法

ELISA法

合计符合不符合

符合74 8 82

不符合14 1 15

合计88 9 97

A．连续性校正2χ检验 B．非连续性校正2χ检验

C．确切概率法 D．配对2χ检验（McNemar检验）

E．拟合优度2χ检验

3．做5个样本率的χ2检验，每组样本量均为50，其自由度为（）。

A 249

B 246

C 1

D 4

E 9

4．对四格表资料做2χ检验时，如果将四格表的行与列对调，则对调前后的（）。

A．校正2χ值不等 B．非校正2χ值不等

C．确切概率检验的P值不等 D．非校正2χ值相等

E．非校正2χ值可能相等，也可能不等

二、问答题

1．简述2χ检验的基本思想。

2．四格表2χ检验有哪两种类型？各自在运用上有何注意事项？

3．什么情况下使用Fisher确切概率检验两个率的差别？

4．在回顾性研究和前瞻性研究的四格表中，各自如何定义优势比？

三、计算题

1．前列腺癌患者121名中，82名接受电切术治疗，术后有合并症者11人；39名接受开放手术治疗，术后有合并症者1人。试分析两种手术的合并症发生率有无差异？

2．苏格兰西南部两个地区献血人员的血型记录见下表，问两地的血型分布是否相同？

两地献血人员的血型分布

地区

血型

合计A B O AB

Eskdale 33 6 56 5 100

Annandale 54 14 52 5 125

合计87 20 108 10 225

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象，将其分为4

组，每组

100例，分别给予不同的镇痛处理，观察的镇痛效果见下表，问4种镇痛方法的效果有无差异？

4种镇痛方法的效果比较

镇痛方法例数有效率（%）

颈麻100 41

注药100 94

置栓100 89

对照100 27

第5章-假设检验课后习题解答

第五章假设检验一、选择题 1.单项选择题（1）将由显著性水平所规定的拒绝域平分为两部分，置于概率分布的两边，每边占显著性水平的 1 ／2，这是（B ）。 A.单侧检验 B.双侧检验 C.右单侧检验 D.左单侧检验（2）检验功效定义为（B ）。 A.原假设为真时将其接受的概率 B.原假设不真时将其舍弃的概率 C.原假设为真时将其舍弃的概率 D.原假设不真时将其接受的概率（3）符号检验中，（＋）号的个数与（－）号的个数相差较远时，意味着（C ）。 A.存在试验误差（随机误差） B.存在条件误差 C.不存在什么误差 D.既有抽样误差，也有条件误差（4）得出两总体的样本数据如下：甲：8，6，10，7，8；乙：5，11，6，9，7，10 秩和检验中，秩和最大可能值是（C ）。 A.15 B.48 C.45 D.66 2.多项选择题（1）显著性水平与检验拒绝域的关系是（ABD ）。 A.显著性水平提高（α 变小），意味着拒绝域缩小 B.显著性水平降低，意味着拒绝域扩大 C.显著性水平提高，意味着拒绝域扩大 D.显著性水平降低，意味着拒绝域扩大化 E.显著性水平提高或降低，不影响拒绝域的变化（2）β 错误（ACDE ）。A. 是在原假设不真实的条件下发生的 B.是在原假设真实的条件下发生的 C.决定于原假设与实际值之间的差距 D. 原假设与实际值之间的差距越大，犯β 错误的可能性就越小 E.原假设与实际值之间的差距越小，犯β错误的可能性就越大二、计算题 1.某牌号彩电规定无故障时间为10000 小时，厂家采取改进措施，现在从新批量彩电中抽取100 台，

ο n ο n 60 16 测得平均无故障时间为 10150 小时，标准差为 500 小时，能否据此判断该彩电无故障时间有显著增加（α ＝0.01）？解：假设检验为H 0：μ0＝10000，H 1：μ0＜10000（使用寿命应该使用单侧检验）。n ＝100 可近似采用 x - μ0 正态分布的检验统计量z ＝。查出α＝0.01 水平下的反查正态概率表得到临界值 2.34 到 2.36 之间（因为表中给出的是双侧检验的接受域临界值，因此本题的单侧检验显著性水平应先乘以 2，再查到对应的临界值）。计算统计量值 z = 3 。因为z ＝3＞2.36（＞2.34），所以拒绝原假设。 2. 假设某产品的重量服从正态分布，现在从一批产品中随机抽取 16 件，测得平均重量为 820 克，标准差为 60 克，试以显著性水平 α＝0.01 与 α＝0.05，分别检验这批产品的平均重量是否是 800 克。解：假设检验为H 0：μ0＝800，H 1：μ0≠800（产品重量应该使用双侧检验）。采用t 分布的检验统计量 t = x - μ0 。查出α＝0.05 和 0.01 两个水平下的临界值（df ＝n －1＝15）为 2.131 和 2.947。t ＝ 820 - 800 ＝1.667。因为 t < 2.131 < 2.947 ，所以在两个水平下都接受原假设。 3. 某市全部职工中，平常订阅某种报纸的占 40％，最近从订阅率来看似乎出现降低的现象，随机抽 200 户职工家庭进行调查，有 76 户职工订阅该报纸，问报纸的订阅率是否显著降低（α＝0.05）？解：假设检验为H ：P ＝40％，H ：P ＜40％。采用成数检验统计量 z = α＝0.05 1 水平下的临界值为 1.64 和 1.65 之间。计算统计量值 z ≈ -0.577 ，z ＝－0.577＞－ 1.64，所以接受原假设。p 值为 0.48 和 0.476 之间［因为本题为单侧检验， p 值= (1- F ( z )) 2 ］。显然 p 值＞0.05，所以接受原假设。 4. 某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内，他随机地抽取 100 名驾车人士调查，得到如下结果：平均加油量等于 13.5 加仑，样本标准差是 3.2 加仑，有 19 人购买无铅汽油。试问：（1）以 0.05 的显著性水平，是否有证据说明平均加油量并非 12 加仑？（2）计算（1）的 p -值；（3）以 0.05 的显著性水平来说，是否有证据说明少于 20％的驾车者购买无铅汽油？（4）计算（3）的 p -值；（5）在加油量服从正态分布假设下，若样本容量为 25，计算（1）和（2）。

5习题-卡方检验

计数资料统计分析————习题 1.220.05,n x x ≥ 则（） A.P ≥0．05 B.P ≤0．05 C.P ＜0．05 D.P ＝0．05 E.P ＞0．05 2.2x 检验中，自由度v 的计算为( ) A.行×列（R ×C ） B.样本含量n C.n-1 D.（R －1）（C －1） E.n 2.四格表卡方检验中，2x <20.05(1)x ,可认为 A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时，最常用的显著性检验方法是（） A.t 检验法 B.正态检验法 C.秩和检验法 D.2 x 检验法 E.方差分析 4.在卡方界值（2x ）表中，当自由度一定时，2x 值愈大，P 值（） A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中，查到同类的两个率比较的四格表资料以及2x 检验结果，甲论文 2x >20.01(1)x 2x >2 0.05(1)x 。若甲乙两论文的样本量相同，则可认为（） A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是（） A. 22 ()()()()()ad bc n x a b a c b d c d -=++++ B. B. 2 2 ()b c x b c -=+ C ． 2 2 1R C A x n n n ??=- ???∑ D. ()220.5b c x b c --=+ E. 2 2 ()A T x T -=∑

(完整版)假设检验习题及答案

第三章假设检验 3.2 一种元件,要求其使用寿命不低于1000（小时）,现在从一批这种元件中随机抽取25件,测得其寿命平均值为950（小时）。已知这种元件寿命服从标准差 100σ=（小时）的正态分布，试在显著水平0.05下确定这批元件是否合格。 {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设：构造统计量：此问题情形属于u 检验，故用统计量：此题中：代入上式得：拒绝域：本题中：0.950.950 u 1.64u 0.0u H =>∴即，拒绝原假设认为在置信水平5下这批元件不合格。 3.4某批矿砂的五个样品中镍含量经测定为（%）： 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布，问在0.01α=下能否接受假设，这批矿砂的镍含量为 010110 2: 3.25 H :t 3.252, S=0.0117, n=5 0.3419 H x μμμμσ==≠==提出假设：构造统计量：本题属于未知的情形，可用检验，即取检验统计量为：本题中，代入上式得：否定域为：1-20.99512 0 V=t>t (1)0.01,(4) 4.6041, 3.25n t t t H ααα- ??-?? ?? ==<∴Q 本题中，接受认为这批矿砂的镍含量为。

3.5确定某种溶液中的水分，它的10个测定值0.452%,0.035%,X S == 2N(,),μσ设总体为正态分布试在水平5%检验假设： 0101() H :0.5% H :0.5%() H :0.04% H :0.0.4% i ii μμσσ≥<≥< {}0.95()0.452% S=0.035%-4.1143 (1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量：本文中未知，可用检验。取检验统计量为X 本题中，代入上式得： 0.452%-0.5% 拒绝域为： V=t >t 本题中，0 1 4.1143H <=∴t 拒绝 {}2 2 2 002 2 2212210.95 2()nS S 0.035% n=10 0.04%100.035%7.65630.04% V=(1)(1)(9)16.919 ii n n αα μχσσχχχχ χ χ--= ==*==>--==Q 2 构造统计量：未知，可选择统计量本题中，代入上式得：（）（）否定域为：本题中， 210 (1)n H αχ-<-∴接受 3.9设总体116(,4),,,X N X X μ:K 为样本，考虑如下检验问题：

假设检验spss操作例题

单样本T检验按规定苗木平均高达1.60m以上可以出圃，今在苗圃中随机抽取10株苗木，测定的苗木高度如下： 1.75 1.58 1.71 1.64 1.55 1.72 1.62 1.83 1.63 1.65 假设苗高服从正态分布，试问苗木平均高是否达到出圃要求？(要求α=0.05) 解：1）根据题意，提出：虚无假设H0：苗木的平均苗高为H0=1.6m; 备择假设H1：苗木的平均苗高H1>1.6m； 2）定义变量：在spss软件中的“变量视图”中定义苗木苗高, 之后在“数据视图”中输入苗高数据； 3)分析过程在spss软件上操作分析，输出如下：

表1.1:单个样本统计量表1.2:单个样本检验由图1.1和表1.1数据分析可知，变量苗木苗高成正态分布，平均值为1.6680m，标准差为0.0843，说明样本的离散程度较小，标准误为0.0267，说明抽样误差较小。由表1.3数据分析可知，T检验值为2.55，样本自由度为9，t检

验的p值为0.031<0.05,说明差异性显著，因此，否定无效假设H0，取备择假设H1。由以上分析知：在显著水平为0.05的水平上检验，苗木的平均苗高大于1.6m，符合出圃的要求。独立样本T检验从两个不同抚育措施育苗的苗圃中各以重复抽样的方式抽得样本如下：样本1苗高（CM）：52 58 71 48 57 62 73 68 65 56 样本2苗高（CM）：56 75 69 82 74 63 58 64 78 77 66 73 设苗高服从正态分布且两个总体苗高方差相等（齐性），试以显著水平α=0.05检验两种抚育措施对苗高生长有无显著性影响。解：1）根据题意提出：虚无假设H0：两种抚育措施对苗木生长没有显著的影响；备择假设H1：两种抚育措施对苗高生长影响显著； 2）在spss中的“变量视图”中定义变量“苗高1”，“抚育措施”，之后在“数据视图”中输入题中的苗高数据，及抚育措施，其中措施一定义为“1”措施二定义为“2”； 3）分析过程在spss软件上操作分析输出分析数据如下;

第7章卡方检验

卡方检验(Chi-square test) stat9@https://www.360docs.net/doc/254448750.html,

检验(Chi-square test)是现代统计学的创始人 K. Pearson 提出的一种具有广泛用途的统计方法。该检验可用于两个及多个率（或者构成比）之间的比较，分类资料的关联度分析，拟合优度检验等。 2

一、卡方检验的基本思想首先介绍一个抽样分布：卡方分布 ?属连续型分布 ?可加性是其基本性质 ?唯一参数，即自由度

(1) 自由度为1的χ2 分布若Z N ~(,),01则Z 2 的分布称为自由度为1的χ2分布. (Chi-square distribution),记为χ()12或χ2 1(). 图形: 0246810 0.0 0.1 0.2 0.3 2 2 2 0.05(1)0.05/2 2 2 2 0.01(1) 0.01/2 3.84(1.96)6.63(2.5758)Z Z χχ ======

(2) νZ Z Z ,...,,21互相独立,均服从N (,)01, 则22221...νZ Z Z +++的分布称自由度为　ν的χ2 分布, 记为χν()2或)(2νχ,或简记为χ2 . ● 图形: ● 自由度ν很大时,2 () νχ近似地服从正态分布.有 2()2 (),22Z ννχνχννν -=服从均数为，方差为的正态分布

0.0 0.10.20.3 0.40.50 3 6 912 1518 ?¨·??μ ×Y ·?×?óé?è￡?1 ×?óé?è￡?2×?óé?è￡?3×?óé?è￡?6 2 /) 12/(2 2 22 )2/(21 )(χνχνχ--??? ? ??Γ= e f 3.84 7.81 12.59 P ＝0.05的临界值 χ2分布（Chi-square distribution ）

SPSS非参数检验之一卡方检验资料讲解

S P S S非参数检验之一卡方检验

SPSS 中非参数检验之一：总体分布的卡方（Chi-square ）检验在得到一批样本数据后，人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断，则需要使用非参数检验的方法。其中总体分布的卡方检验（也记为χ2检验）就是一种比较好的方法。一、定义总体分布的卡方检验适用于配合度检验，是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0：样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。总体分布的卡方检验的原理是：如果从一个随机变量尤中随机抽取若干个观察样本，这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布，这个多项分布当k 趋于无穷时，就近似服从X 的总体分布。因此，假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数，并依据下面的公式计算统计量Q () 2 1 k i i i i O E Q E =-=∑ 其中，Oi 表示观察频数；Ei 表示期望频数或理论频数。可见Q 值越大，表示观察频数和理论频数越不接近；Q 值越小，说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量，由于Q 统计量服从K-1个自由度的X 平方分布，因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平，则应拒绝零假设H0，认为样本来自的总体分布形态与期望分布或理论分布存在显著差异；如果相伴概率值

卡方检验及校正卡方检验的计算

2X 检验或卡方检验和校正卡方检验的计算私立广厦学校郭捷思在教育学量的研究中，各种各样的统计方法已经被广泛的应用，特别是由于统计软件（如：SPSS ）的不断成熟，给教育研究者提供了多种量的研究方法。但是，这并不是无论什么量的研究都要通过统计软件来实现，也不是所有量的研究一定要运用统计软件才能快捷，简便的实现。本文将教给大家几种简便的方法来实现卡方检验。 2X 检验（chi-square test ）或称卡方检验方法可以根据样本数据，推断总体分布与期望分布或某一理论分布是否存在显著差异，是一种吻合性检验，通常适于对有多项分类值的总体分布的分析。它的零假设是样本来自的总体分布与期望分布或某一理论分布无显著差异。根据卡方检验基本思想的理论依据，对变量总体分布的检验就可以从对各个观察频数的分析入手。为检验实际分布与理论分布（期望分布）之间是否存在显著差异，可采用卡方检验统计量。典型的卡方统计量是pearson 卡方，其基本公式为： ∑=-=k i o i e i o i f f f X 12)( 式中k 为子集个数，o f 为观察频数，e f 为期望频数，2X 服从k —1个自由度的卡方分布。如果2X 值较大，则说明观测频数分布与期望频数分布差距较大；反之，如果2X 值较小，

则说明观测频数分布与期望频数分布较接近。我们将通过代入数据运算这条公式，计算出2X 统计量的观测值，并依据卡方分布表计算观测值对应的概率p 值。下面，将通过几个实际例子来探究如何进行卡方检验。一、四格表资料的卡方检验例1：某学校分别运用传统教学和多媒体教学在两个平行班的数学课上进行试验，目的为了检测两种教学方法对学生的成绩影响是否有差异。本实验把学生的成绩划分为优秀人数（80分以上）和非优秀人数。表1：两种教学方法学生成绩优秀率的比较表内这四个数据（斜体）是整个表中的基本资料，其余数据均由此推算出来；这四格资料表就专称四格表（fourfold table ），或称2行2列表（2×2 contingency table ）从该资料算出的；两种教学的优秀率分别为40%和68.6%，两者的差别可能是抽样误差所致，亦可能是两种教学效果确有所不同。这里可通过卡方检验来区别其差异有无统计学意义，检验步骤：组别优秀人数非优秀人数合计优秀率（%）传统教学班 20 30 50 40 多媒体教学班 35 16 51 68.6 合计 55 46 101 52.5

卡方检验习题说课讲解

卡方检验习题

2 χ检验练习题一、最佳选择题 1．四格表的周边合计不变时，如果实际频数有变化，则理论频数（）。 A．增大 B．减小 C．不变 D．不确定 E．随a格子实际频数增减而增减 2．有97份血液标本，将每份标本一分为二，分别用血凝试验法和ELISA 法对轮状病毒进行诊断，诊断符合情况见下表，欲比较何种诊断方法的诊断符合率较高，用（）统计方法？两种诊断方法的诊断结果血凝试验法 ELISA法合计符合不符合符合74 8 82 不符合14 1 15 合计88 9 97 A．连续性校正2χ检验 B．非连续性校正2χ检验 C．确切概率法 D．配对2χ检验（McNemar检验） E．拟合优度2χ检验 3．做5个样本率的χ2检验，每组样本量均为50，其自由度为（）。 A 249 B 246 C 1 D 4 E 9 4．对四格表资料做2χ检验时，如果将四格表的行与列对调，则对调前后的（）。 A．校正2χ值不等 B．非校正2χ值不等 C．确切概率检验的P值不等 D．非校正2χ值相等

E．非校正2χ值可能相等，也可能不等二、问答题 1．简述2χ检验的基本思想。 2．四格表2χ检验有哪两种类型？各自在运用上有何注意事项？ 3．什么情况下使用Fisher确切概率检验两个率的差别？ 4．在回顾性研究和前瞻性研究的四格表中，各自如何定义优势比？三、计算题 1．前列腺癌患者121名中，82名接受电切术治疗，术后有合并症者11人；39名接受开放手术治疗，术后有合并症者1人。试分析两种手术的合并症发生率有无差异？ 2．苏格兰西南部两个地区献血人员的血型记录见下表，问两地的血型分布是否相同？两地献血人员的血型分布地区血型合计A B O AB Eskdale 33 6 56 5 100 Annandale 54 14 52 5 125 合计87 20 108 10 225 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象，将其分为4 组，每组 100例，分别给予不同的镇痛处理，观察的镇痛效果见下表，问4种镇痛方法的效果有无差异？ 4种镇痛方法的效果比较镇痛方法例数有效率（%）颈麻100 41 注药100 94 置栓100 89 对照100 27

假设检验-例题讲解

假设检验一、单样本总体均值的假设检验 .................................................... 1 二、独立样本两总体均值差的检验 ................................................ 2 三、两匹配样本均值差的检验 ........................................................ 4 四、单一总体比率的检验 ................................................................ 5 五、两总体比率差的假设检验 .. (7) 一、单样本总体均值的假设检验例题：某公司生产化妆品，需要严格控制装瓶重量。标准规格为每瓶250 克，标准差为1 克，企业的质检部门每日对此进行抽样检验。某日从生产线上随机抽取16 瓶测重，以95%的保证程度进行总体均值的假设检验。 x t μ-= data6_01 样本化妆品重量 SPSS 操作：（1）打开数据文件，依次选择Analyze （分析）→Compare Means （比较均值）→One Sample T Test （单样本t 检验），将要检验的变量置入Test Variable(s)（检验变量）；（2）在Test Value （检验值）框中输入250；点击Options （选项）按钮，在

Confidence Interval（置信区间百分比）后面的框中，输入置信度（系统默认为95%，对应的显著性水平设定为5%，即0.05，若需要改变显著性水平如改为0.01，则在框中输入99 即可）；（3）点击Continue（继续）→OK（确定），即可得到如图所示的输出结果。图中的第2~5 列分别为：计算的检验统计量t 、自由度、双尾检验p-值和样本均值与待检验总体均值的差值。使用SPSS 软件做假设检验的判断规则是：p-值小于设定的显著性水平?时，要拒绝原假设（与教材不同，教材的判断标准是p

有关假设检验的习题及详解

§假设检验基本题型Ⅰ 有关检验统计量和两类错误的题型【例8.1】u 检验、t 检验都是关于的假设检验.当已知时，用u 检验；当未知时，用t 检验. 【分析】由u 检验、t 检验的概念可知，u 检验、t 检验都是关于均值的假设检验，当方差2σ为已知时，用u 检验；当方差2 σ为未知时，用t 检验. 【例8.2】设总体2 (,)X N u σ ，2 ,u σ未知，12,,,n x x x 是来自该总体的样本，记 11n i i x x n ==∑，21 ()n i i Q x x ==-∑，则对假设检验0010::H u u H u u =?≠使用的t 统计量 t = （用,x Q 表示）；其拒绝域w = . 【分析】2 σ未知，对u 的检验使用t 检验，检验统计量为 (1)t t n = = - 对双边检验0010::H u u H u u =?≠，其拒绝域为2 {||(1)}w t t n α=>-. 【例8.3】设总体2 11(,)X N u σ ，总体2 22(,)Y N u σ ，其中2 2 12,σσ未知，设 112,,,n x x x 是来自总体X 的样本，212,,,n y y y 是来自总体Y 的样本，两样本独立，则对于假设检验012112::H u u H u u =?≠，使用的统计量为，它服从的分布为 . 【分析】记1111n i i x x n ==∑，2 1 2 1 n i i y y n == ∑,因两样本独立，故,x y 相互独立，从而在0 H 成立下，()0E x y -=，2 2 12 1 2 ()()()D x y D x D y n n σσ+=+= + ，故构造检验统计量 (0,1)x y u N = . 【例8.4】设总体2 (,)X N u σ ，u 未知，12,,,n x x x 是来自该总体的样本，样本方差为2 S ，对2 2 01:16:16H H σσ≥?<，其检验统计量为，拒绝域为 .

统计学假设检验习题答案

1．假设某产品的重量服从正态分布，现在从一批产品中随机抽取16件，测得平均重量为820克，标准差为60克，试以显著性水平α=0.01与α=0.05，分别检验这批产品的平均重量是否是800克。解：假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α＝0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947，所以在两个水平下都接受原假设。 2．某牌号彩电规定无故障时间为10 000小时，厂家采取改进措施，现在从新批量彩电中抽取100台，测得平均无故障时间为10 150小时，标准差为500小时，能否据此判断该彩电无故障时间有显著增加(α=0.01)？解：假设检验为10000:,10000:0100>=μμH H （使用寿命有无显著增加，应该使用右侧检验）。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α＝0.01水平下的反查正态概率表得到临界值2.32到2.34之间（因为表中给出的是双侧检验的接受域临界值，因此本题的单侧检验显著性水平应先乘以2，再查到对应的临界值）。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32)，所以拒绝原假设，无故障时间有显著增加。 3.设某产品的指标服从正态分布，它的标准差σ已知为150，今抽了一个容量为26的样本，计算得平均值为1637。问在5％的显著水平下，能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,

习题卡方检验图文稿

习题卡方检验集团文件版本号：（M928-T898-M248-WU2669-I2896-DQ586-M1988）

计数资料统计分析————习题 1.220.05,n x x ≥ 则（） A.P ≥0．05 B.P ≤0．05 C.P ＜0．05 D.P ＝0．05 E.P ＞0．05 2.2x 检验中，自由度v 的计算为( ) A.行×列（R ×C ） B.样本含量n C.n-1 D.（R －1）（C －1） E.n 2.四格表卡方检验中，2x <20.05(1)x ,可认为? A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时，最常用的显着性检验方法是（） A.t 检验法 B.正态检验法 C.秩和检验法 D.2x 检验法 E.方差分析 4.在卡方界值（2x ）表中，当自由度一定时，2x 值愈大，P 值（） A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中，查到同类的两个率比较的四格表资料以及2x 检验结果，甲论文 2x >20.01(1)x ，乙论文2x >20.05(1)x 。若甲乙两论文的样本量相同，则可认为（） A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是（） A. 22 ()()()()()ad bc n x a b a c b d c d -=++++

B. B. 2 2 () b c x b c - = + C． 2 21 R C A x n n n ??=- ? ?? ∑ D. ()2 2 0.5 b c x b c -- = + E. 2 2 () A T x T -=∑ 7.关于行×列表2x检验，正确的应用必须是（） A．不宜有格子中的实际数小于5 B．不宜有格子中的理论数小于5 C．不宜有格子中的理论数小于5 或小于1 D．不宜有1／5 以上的格子中的理论数小于5 或有一个格子中的理论数小于l E．不宜有1／5 以上的格子中的实际教小于5 或有一个格子中的实际数小于1 8.R×C 表的2x检验中，P＜0．05 说明（） A.被比较的n 个样本率之间的差异有显着性 B.样本率间差别没有显着性 C.任何两个率之间差别均有显着性 D.至少某两个样本率是差别有显着性 E.只有两个样本率间差别有显着性 9.四个样本率作比较， 22 0.01,(3) χχ >，可认为（） A．各总体率不等或不全相等 B.各总体率均不相等 C.各样本率均不相等

关于高中数学教材中卡方检验公式的解释

关于高中数学教材中卡方检验公式的解释统计案例教学中如何让思路来得自然一些王文彬 (江西省抚州市第一中学 344000) 2统计案例的教学内容主要有三项:线性回归、线性相关与独立性检验(检验).笔者在,教学中发现(所使用的教材是北师大版《高中数学选修教材2-3》)，回归方程、相关系数公 2式与检验公式得出的思路在某些地方显得不自然，有突兀之感(人教版教材的这些内容与, 北师大版相近).如何让这些知识来得更自然一些，值得我们作进一步的探讨. 1.线性回归方程为了说明问题，不妨将教材(指北师大版教材，下同)有关内容摘录如下: 设有个样本点，并设其线性回归方程为.这个(,),(,),(,)xyxyxy？nnyabx,，1122nn 点与回归直线的“距离”平方和为 n2 ? Qabyabx(,)(),,,,ii,1i 引入以下记号 nnn22，，，不难知道， lxx,,()lxxyy,,,()()lyy,,(),,,xxixyiiyyi,,1,1i1iinnnn ，，从而 ()0xxxnx,,,,()0yyyny,,,,,,,,iiii,,11,,11iiii n2，， ? Qabyyyabxbxx(,)()()(),,，,，,,,,,ii，，,1i22llxyxy2，， ? ()(),,，,，，,,？lnyabxlbyyxx，，llxxxx lxy显然当且时，取最小值. 0b,,Qab(,)yabx,，,()0lxx

由此可得出的计算公式，由此可求出线性回归方程. ab, 在这里，教材通过求的最小值而得出的值，总体思路是比较自然的，但为 Qab(,)ab, 什么要将?改写成?，其中的原因却不易说清.为此我们可作如下改进: 22对于含有两个变量的函数，应通过配方将其化成形如“(常数)”Qab(,)( )( )C，，的式子，这样，只要令两个括号都为零即可求出的最小值以及的值. Qab(,)ab, n2222事实上， Qabyabxaybxyabx(,)(+222),，,,，,iiiiii,1i nnnnn2222 ,，,,， ynabxaybxyabx+222,,,,,iiiiii,,,,,11111iiiiinnnn222(常数) ,，,，,，naabxaybxbxyC222,,,,1iiiii,,,,1111iiiinn222,，,，,， nanabxnaybxbxyC222,,1iii,,11ii nn222 ,，,，,，naabxaybxbxyC(22)2,,1iii,,11ii 1 nn222，， naaybxbxbxyC2()2,,,，,，,,1iii，，,,11iinn22222，，naaybxybxnybxbxbxyC2()()()2,,,，,,,，,，,,1iii，，,,11ii nn22222，，(常数) naybxbxnxbxynxyC()()2(),,,，,,,，,,2iii，，,,11ii2n，， xynxy),,iin,,22222,i1，，(常数) ,,naybxxnxbC()(),,,，,,，,i3n，，22,,,i1xnx,,i,,,i1，， n22显然，如果有(可用数学归纳法证明)，令两个中括号都为零即可得出xnx,,0,i,1i 的计算公式了. ab,

卡方检验习题

2 χ检验练习题一、最佳选择题 1．四格表的周边合计不变时，如果实际频数有变化，则理论频数（）。 A．增大B．减小C．不变 D．不确定E．随a格子实际频数增减而增减 2．有97份血液标本，将每份标本一分为二，分别用血凝试验法和ELISA法对轮状病毒进行诊断，诊断符合情况见下表，欲比较何种诊断方法的诊断符合率较高，用（）统计方法？两种诊断方法的诊断结果血凝试验法 ELISA法合计符合不符合符合74 8 82 不符合14 1 15 合计88 9 97 A．连续性校正2 χ检验B．非连续性校正2 χ检验C．确切概率法D．配对2 χ检验（McNemar检验）E．拟合优度2 χ检验 3．做5个样本率的χ2检验，每组样本量均为50，其自由度为（）。 A 249 B 246 C 1 D 4 E 9 4．对四格表资料做2 χ检验时，如果将四格表的行与列对调，则对调前后的（）。 A．校正2 χ值不等B．非校正2 χ值不等 C．确切概率检验的P值不等D．非校正2 χ值相等 E．非校正2 χ值可能相等，也可能不等二、问答题

1．简述2 χ检验的基本思想。 2．四格表2 χ检验有哪两种类型？各自在运用上有何注意事项？ 3．什么情况下使用Fisher确切概率检验两个率的差别？ 4．在回顾性研究和前瞻性研究的四格表中，各自如何定义优势比？三、计算题 1．前列腺癌患者121名中，82名接受电切术治疗，术后有合并症者11人；39名接受开放手术治疗，术后有合并症者1人。试分析两种手术的合并症发生率有无差异？ 2．苏格兰西南部两个地区献血人员的血型记录见下表，问两地的血型分布是否相同？两地献血人员的血型分布地区血型合计A B O AB Eskdale 33 6 56 5 100 Annandale 54 14 52 5 125 合计87 20 108 10 225 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象，将其分为4组，每组100例，分别给予不同的镇痛处理，观察的镇痛效果见下表，问4种镇痛方法的效果有无差异？ 4种镇痛方法的效果比较镇痛方法例数有效率（%）颈麻100 41 注药100 94 置栓100 89 对照100 27

卡方检验法

记数数据统计法—卡方检验法在各个研究领域中，有些研究问题只能划分为不同性质的类别，各类别没有量的联系。例如，性别分男女，职业分为公务员、教师、工人、……，教师职称又分为教授、副教授、……。有时虽有量的关系，因研究需要将其按一定的标准分为不同的类别，例如，学习成绩、能力水平、态度等都是连续数据，只是研究者依一定标准将其划分为优良中差，喜欢与不喜欢等少数几个等级。对这些非连续等距性数据，要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用：拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同，适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。在计数数据进行统计分析时要特别注意取样的代表性。我们知道，统计分析就是依据样本所提供的信息，正确推论总体的情况。在这一过程中，最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中，所搜集到的有些数据属于定性资料，它们常常是通过调查、访问或问卷获得，除了少数实验可以事先计划外，大部分收集数据的过程是难于控制的。例如，某研究者关于某项教育措施的问卷调查，由于有一部分教师和学生对该项措施存有意见，或对问卷本身有偏见，根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点，所以它是一个有偏样本，若据此对总体进行推论，就会产生一定的偏差，势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时，要特别小心谨慎，防止样本的偏倚性，只有具有代表性的样本才能作出正确的推论。第一节卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析，对于总体的分布不作任何假设，因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明，实际观察次数（f o）与理论次数（f e），又称期望次数）之差的平方再除以理论次数所得的统计量，近似服从卡方分布，可表示为：这是卡方检验的原始公式，其中当f e越大（f e≥5）,近似得越好。显然f o与f e相差越大，卡方值就越大；f o与f e相差越小，卡方值就越小；因此它能够用来表示f o与f e相差的程度。根据这个公式，可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况：卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题，这里的观测次数是根据样本数据得多的实计数，理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

卡方检验习题

2检验练习题一、最佳选择题 1．四格表的周边合计不变时，如果实际频数有变化，则理论频数（）。 A．增大B．减小C．不变 D．不确定E．随a 格子实际频数增减而增减 2．有97 份血液标本，将每份标本一分为二，分别用血凝试验法和ELISA 法对轮状病毒进行诊断，诊断符合情况见下表，欲比较何种诊断方法的诊断符合率较高，用（）统计方法？两种诊断方法的诊断结果血凝试验法 ELISA 法合计符合不符合符合74882 不符合14115 合计88997 A．连续性校正2检验B．非连续性校正2检验 C ．确切概率法 D ．配对2检验（McNemar 检验） E ．拟合优度2检验 3．做5 个样本率的2检验，每组样本量均为50，其自由度为（）。 A 249 B 246 C 1 D 4 E 9 4．对四格表资料做2检验时，如果将四格表的行与列对调，则对调前后的（）。 A．校正2值不等B．非校正2值不等 C．确切概率检验的P 值不等D．非校正2值相等 E．非校正2值可能相等，也可能不等二、问答题 1．简述2检验的基本思想。

2．四格表2检验有哪两种类型？各自在运用上有何注意事项？ 3．什么情况下使用Fisher 确切概率检验两个率的差别？ 4．在回顾性研究和前瞻性研究的四格表中，各自如何定义优势比？三、计算题 1．前列腺癌患者121 名中，82 名接受电切术治疗，术后有合并症者11 人；39 名接受开放手术治疗，术后有合并症者 1 人。试分析两种手术的合并症发生率有无差异？ 2 ．苏格兰西南部两个地区献血人员的血型记录见下表，问两地的血型分布是否相同？地区血型合计A B O AB Eskdale336565100 Annandale5414525125 合计872010810225 3. 某医院以400 例自愿接受妇科门诊手术的未产妇为观察对象，将其分为4 组，每组 100 例，分别给予不同的镇痛处理，观察的镇痛效果见下表，问4 种镇痛方法的效果有无差异？ 4 种镇痛方法的效果比较镇痛方法例数有效率（%）颈麻10041 注药10094 置栓10089 对照10027

卡方检验法

第八章记数数据统计法—卡方检验法知识引入在各个研究领域中，有些研究问题只能划分为不同性质的类别，各类别没有量的联系。例如，性别分男女，职业分为公务员、教师、工人、……，教师职称又分为教授、副教授、……。有时虽有量的关系，因研究需要将其按一定的标准分为不同的类别，例如，学习成绩、能力水平、态度等都是连续数据，只是研究者依一定标准将其划分为优良中差，喜欢与不喜欢等少数几个等级。对这些非连续等距性数据，要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用：拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同，适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。在计数数据进行统计分析时要特别注意取样的代表性。我们知道，统计分析就是依据样本所提供的信息，正确推论总体的情况。在这一过程中，最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中，所搜集到的有些数据属于定性资料，它们常常是通过调查、访问或问卷获得，除了少数实验可以事先计划外，大部分收集数据的过程是难于控制的。例如，某研究者关于某项教育措施的问卷调查，由于有一部分教师和学生对该项措施存有意见，或对问卷本身有偏见，根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点，所以它是一个有偏样本，若据此对总体进行推论，就会产生一定的偏差，势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时，要特别小心谨慎，防止样本的偏倚性，只有具有代表性的样本才能作出正确的推论。第一节卡方拟合性检验一、卡方检验的一般问题卡方检验应用于计数数据的分析，对于总体的分布不作任何假设，因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明，实际观察次数（f o）与理论次数（f e），又称期望次数）之差的平方再除以理论次数所得的统计量，近似服从卡方分布，可表示为：这是卡方检验的原始公式，其中当f e越大（f e≥5）,近似得越好。显然f o与f e相差越大，卡方值就越大；f o与f e相差越小，卡方值就越小；因此它能够用来表示f o与f e相差的程度。根据这个公式，可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况：卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题，这里的观测次数是根据样本数据得多的实计数，理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

趋势卡方检验SAS程序及完整例题解析

趋势卡方检SAS程序及例题解析趋势卡方检验主要是用于对一些数据的趋势行变化进行检验，在医学上常用于同一地区连续多年小学生龋齿率、肥胖率，疾病的发病率、死亡率等。例如，某高校口腔执业医师考试基础知识掌握率情况，是否存在一定的趋势。表1基础知识各学科掌握率（%）及趋势分析 2007年2008年2009年2010年2011年Z P 药理51.83 61.31 49.86 63.7 62.87 1.5674 0.117 口腔解剖49.71 64.49 60.38 66.44 70.68 2.8645 0.0042 这种数据进行结构整理，如下：表2 药理学掌握率通过率不通过率 2007年51.83 48.17 2008年61.31 38.69 2009年49.86 50.14 2010年63.7 36.3 2011年62.87 37.13 通过率不通过率 2007年49.71 50.29 2008年64.49 35.51 2009年60.38 39.62 2010年66.44 33.56 2011年70.68 29.32 SAS程序：表2数据 data trend; do r=1to5; do c=1to2;

input f@@; output; end; end; cards; 51.83 48.17 61.31 38.69 49.86 50.14 63.7 36.3 62.87 37.13; proc freq; weight f; tables r*c /trend nocol norow nopct（这三项可以不选择）; run; 表3结果 FREQ 过程 r * c 表 r c 频数| 1| 2| 合计 --------+--------+--------+ 1 | 49.71 | 50.29 | 100 --------+--------+--------+ 2 | 64.49 | 35.51 | 100 --------+--------+--------+ 3 | 60.38 | 39.62 | 100 --------+--------+--------+ 4 | 66.44 | 33.56 | 100 --------+--------+--------+ 5 | 70.68 | 29.32 | 100 --------+--------+--------+ 合计311.7 188.3 500 r * c 表的统计量 Cochran-Armitage 趋势检验