高考数学1.2独立性检验专题1
吴川一中1.2独立性检验的基本思想--题型分类讲解1

• 一、选择题
• 1.可以粗略地判断两个分类变量是否有关系的是( ) • A.散点图 • B.三维柱形图和二维条形图 • C.独立性检验的思想 • D.以上都不对 • [答案] B • [解析] 用三维柱形图和二维条形图可以粗略地判断两个
分类变量是否有关系,但无法精确给出结论的可靠程度.
• 2.下表是一个2×2列联表:
72
228
300
由表中数据计算K2的观测值k≈4.513。在 多大程度上可以认为高中生的性别与是否喜 欢数学课程之间有关系?为什么?
解:在假设“性别与喜欢数学课程之间无关 系”的前提下K2应该很小,并且
P(K 2 3.841) 0.05,
而 我 们 所 得 到 的 K2 的 观 测 值 k≈4.513 超 过 3.841,这就意味着“性别与喜欢数学课程 之间无关系” 可能性约为0.05(或小于 0.05) ,即有95%(或大于 95%)的把握 认为“性别与是否喜欢数学课程之间有关 系”。
P(K 2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例1.在某医院,因为患心脏病而住院的665
名男性病人中,有214人秃顶,而另外772名 不是因为患心脏病而住院的男性病人中有 175人秃顶.独立性检验方法判断是否有关? 你所得的结论在什么范围内有效?
[点评] 1.为了使不同样本容量的数据有统一的评判 标 准 , 我 们 构 造 一 个 随 机 变 量 : K2 = (a+b)(cn+ (add- )(ab+c)c2)(b+d),其中 n=a+b+c+d 为样本容 量.
高中数学第一章1.2独立性检验的基本思想及其初步应用学案含解析新人教A版选修7

马鸣风萧萧整理
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
然后代入随机变量 K2 的计算公式求出观测值 k,将 k 与临界值 k0 进行对比,确定有多大的
把握认为“两个分类变量有关系” .
[活学活用 ]
某医院对治疗支气管肺炎的两种方案 A,B 进行比较研究,将志愿者分为两组,分别采
6分
此处易犯错误有两点:①计算失误;②将公式中的数据搞错
[活学活用 ]
电视传媒公司为了解某地区观众对某类体育节目的收视情况,
随机抽取了 100 名观众进
行调查,其中女性有 55 名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频
率分布直方图:
将日均收看该体育节目时间不低于 10 名女性.
40 分的观众称为“体育迷” ,已知“体育迷”中有
》》》》》》》》》积一时之跬步 臻千里之遥程《 《《《《《《《《《《《
1.2 独立性检验的基本思想及其初步应用
独立性检验的有关概念
[提出问题 ] 问题 1:观察教材第 10 页的探究,其中的频数表叫什么? 提示:列联表.
问题 2:由表中数据,你能说吸烟对患肺癌有影响吗? 提示:能. 问题 3:如何用数字分析此类问题? 提示:利用随机变量 K 2 进行分析.
[导入新知 ]
独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界
后查右表确定临界值 k0. P(K2≥ k0)
0.50
0.40
0.25
0.15
0.10
k0
0.455 0.708 1.323 2.072 2.706
α,然
P(K2≥ k0)
0.05 0.025 0.010 0.005 0.001
高中数学 专题1.2 独立性检验的基本思想及初步应用练习(含解析)新人教A版选修1-2(2021年

2016-2017学年高中数学专题1.2 独立性检验的基本思想及初步应用练习(含解析)新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学专题1.2 独立性检验的基本思想及初步应用练习(含解析)新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学专题1.2 独立性检验的基本思想及初步应用练习(含解析)新人教A版选修1-2的全部内容。
独立性检验的基本思想及初步班级:姓名:_____________1。
与表格相比,能更直观地反映出相关数据总体状况的是()A。
列联表 B.散点图C。
残差图D。
等高条形图2.分类变量X和Y的列联表如下:Y1Y2总计X1a b a+bX2c d c+d总计a+c b+d a+b+c+d则下列说法中正确的是()A。
ad—bc越小,说明X与Y关系越弱B。
ad—bc越大,说明X与Y关系越强C。
(ad-bc)2越大,说明X与Y关系越强D。
(ad—bc)2越接近于0,说明X与Y关系越强【解析】选C.因为K2=,所以(ad—bc)2越大,则K2越大,X与Y关系越强,故选C.3。
下面是2×2列联表。
y1y2总计x1332154x2a1346总计b34则表中a,b处的值应为( )A.33,66B.25,50 C。
32,67 D.43,56【解析】选A。
由2×2列联表知a+13=46,所以a=33,又b=a+33,所以b=33+33=66。
4。
研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:硕士博士总计男16227189女1438151总计30535340根据以上数据,则( )A.性别与获取学位类别有关B.性别与获取学位类别无关C。
高中数学复习提升-1.2.2独立性检验

第4课时独立性检验1.通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究.了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.2.过程与方法:引导学生形成“自主学习”“合作学习”等良好的学习方式,培养学生的归纳概括能力.重点:了解独立性检验的基本思想.难点:独立性检验的基本思想、随机变量χ2的含义及独立性检验的步骤.经常上网会影响学习吗?下表为教育部对1000名中学生进行调查的结果.经常上网影响学习吗?如何判断?经常上网不经常上网合计不及格80120200及格120680800合计2008001000问题1:(1)通过上述数据经常上网的人成绩及格的比例为60%,不经常上网的人成绩及格的比例为85%,这个数据可以初步判断经常上网对学习成绩是有影响的,但这种说法的把握性有多大,还需要进行独立性检验才知道.(2)独立性检验的概念用统计量χ2的大小来研究两个变量是否有关系的方法,称为独立性检验.问题2:两个分类变量A和B的2×2列联表一般地,假设有两个分类变量A和B,它们的可能取值分别为{A1,A2}和{B1,B2},其样本频数列联表(称为2×2列联表)为:BB1B2总计AA1a b a+bA2c d c+d总计a+c b+d a+b+c+d问题3:统计量χ2的计算公式是怎样的?若有如下列联表所示的抽样数据:类1类2总计类A a b a+b类B c d c+d总计a+c b+d a+b+c+d则χ2= (其中n=a+b+c+d).问题4:根据χ2判断两变量是否有关联当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;当χ2>2.706时,有90%的把握判定变量A、B有关联;当χ2>3.841时,有95%的把握判定变量A、B有关联;当χ2>6.635时,有99%的把握判定变量A、B有关联.独立性检验的必要性为什么不能只凭列联表中的数据和由其绘出的图形下结论?由列联表可以粗略地估计出两个分类变量是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用独立性检验的方法确认所得结论在多大程度上适用于总体.1.在吸烟与患肺病是否相关的研究中,有下面的说法:①若χ2=6.7,我们有99%的把握判定吸烟与患肺病有关联,那么在100个吸烟的人中必有99个患肺病;②从独立性检验可知有99%的把握判定吸烟与患肺病有关联时,若某人吸烟,那么他有99%的可能患有肺病;③从统计量中求出有95%的把握判定吸烟与患肺病有关联,是指有5%的可能性使得推断出现错误.其中说法正确的个数为().A.0B.1C.2D.3【解析】χ2是检测吸烟与患肺病相关程度的量,是一种相关关系,而不是确定关系,只能反映有关和无关的概率.故①②错误,③正确.【答案】B2.分类变量X和Y的2×2列联表如下,则().YY1Y2总计XX1a b a+bX2c d c+d总计a+c b+d a+b+c+dA.其他值一定时,ad-bc越小,说明X与Y的关系越弱B.其他值一定时,ad-bc越大,说明X与Y的关系越强C.其他值一定时,(ad-bc)2越大,说明X与Y的关系越强D.其他值一定时,(ad-bc)2越接近于0,说明X与Y的关系越强【解析】由统计量χ2的计算公式χ2=可知其他值一定的情况下,(ad-bc)2越大,则χ2的值越大,则X与Y的关系越强,故选C.【答案】C3.在对某小学的学生吃零食的调查中,得到数据如下表:吃零食不吃零食总计男学生243155女学生82634总计325789根据上述数据分析,我们可以得出χ2=.【解析】χ2=≈3.689.【答案】3.6894.某高校《统计》课程的教师随机给出了主修该课程的一些情况,具体数据如下:非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关,根据表中数据,得χ2=≈4.844,若判定主修统计专业与性别有关,则这种判断出错的可能性有多大?【解析】根据样本数据计算χ2≈4.844>3.841,即有95%以上的把握认为主修统计专业与性别有关,即这种判断出错的可能性为1-0.95=0.05.1.如果有95%以上的把握说事件A与事件B有关,那么具体算出的数据应满足().A.χ2>3.841B.χ2<3.841C.χ2>6.635D.χ2<6.635【解析】根据对变量的独立性进行判断的结果知选A.【答案】A2.对于独立性检验,下列说法错误的是().A.两事件频数相关越小,χ2就越小B.两事件频数相关越小,χ2就越大C.χ2≤2.706时,事件A与事件B无关D.χ2>6.635时,有99%的把握说事件A与事件B有关【解析】由χ2及对变量的独立性进行检验可以判断A、C、D正确,B不正确.【答案】B3.若由一个2×2列联表中的数据计算得χ2=4.013,那么有以上的把握认为两个变量有关系.【答案】95%4.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下列联表:合格不合格总计甲线973100乙线955100总计1928200请问甲、乙两条生产线生产的产品合格率在多大程度上有关系?【解析】根据列联表中的数据,可以求得χ2=≈0.521<2.706.因此没有充分的证据判定甲、乙两条生产线生产的产品合格率有关系.5.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是().A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人99%患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有【解析】独立性检验的结果是可能值,而不是确定的,故选D.【答案】D6.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为:Yy1y2总计Xx1a b a+bx2c d c+d总计a+c b+d a+b+c+d对同一样本,以下数据能说明X与Y有关的可能性最大的一组为().A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=3,b=2,c=4,d=5【解析】通过计算可知选D.【答案】D7.下列关于χ2的说法中,正确的是.①χ2在任何相互独立问题中都可以用于检验是否相关;②χ2越大,两个事件的相关性越大;③χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题.【解析】①错,不是任何相互独立问题都能用χ2检验;②错,χ2的值只能体现把握性的大小,不能体现相关性.【答案】③8.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%以上的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要提供帮助的老年人的比例约为=14%.(2)χ2=≈9.967.由于9.967>6.635,所以有99%以上的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样的方法更好.9.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是.①若χ2=6.7,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③用独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.【解析】χ2值是支持确定有多大的把握认为“吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.【答案】③10.为检验回答一个问题的对错是否和性别有关,有人做了一次调查,其中女生人数是男生人数的,男生答对人数占男生人数的,女生答错人数占女生人数的.(1)若有99%以上的把握认为回答结果的对错和性别有关,则男生至少有多少人?(2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人?【解析】设男生人数为x,依题意得2×2列联表如下:对错总计男生x女生总计x(1)若有99%以上的把握认为回答结果的对错和性别有关,则χ2>6.635.由χ2==>6.635,解得x>17.69.∵,为整数,∴若有99%以上的把握认为回答结果的对错和性别有关,则男生至少有18人.(2)没有充分的证据显示回答结果的对错和性别有关,则χ2≤2.706.由χ2==≤2.706,解得x≤7.216.∵,为整数,∴若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.。
高中数学 第一章 统计案例 1.2 独立性检验 1.2.2 独立

1.2 独立性检验1.2.2 独立性检验 1.2.3独立性检验的基本思想 1.2.4 独立性检验的应用自主整理1.两个变量是否相关联,可通过对这一问题的调查数据,进行_______________.2.统计学选取统计量_______________的大小来检验变量之间是否独立. 高手笔记1.变量的不同值表示个体所属的不同类别,这样的变量叫作分类变量,可以用列联表来表示.2.在统计中,用以下结果对变量的独立性进行判断:其中χ2=))()()(()(2d b c a d c b a bc ad n ++++-.(1)当χ2≤2.706时,没有充分的证据判定变量A 、B 有关联,可以认为变量A 、B 是没有关联的.(2)当χ2>2.706时,有90%的把握判定变量A 、B 有关联.(3)当χ2>3.841时,有95%的把握判定变量A 、B 有关联.(4)当χ2>6.635时,有99%的把握判定变量A 、B 有关联.3.一般地,假设两个分类变量A 和B,它们的值域分别为{x 1,x 2},{y 1,y 2}.其样本频数列联表如可以利用独立性检验来计算出χ的值来判断A 与B 的有关系的可能性大小,独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量A 、B 有关系,这个结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2很大,则在一定程度上说明假设不合理.根据随机变量χ2的含义,可以通过P(χ2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%. 名师解惑为什么统计学中用χ2=))()()(()(2d b c a d c b a bc ad n ++++-的大小来检验变量之间是否独立呢?剖析:设A 、B 为两个变量,每个变量都可以取两个值. 变量A:A 1,A 2=1A ,变量B:B 1,B 2=1B .则P(A 1B 1)=n a ,P(A 1)=n b a +,P(B 1)=nc a +. 若n a =n b a +·nc a +,即P(A 1B 1)=P(A 1)P(B 1),则A 1、B 1相互独立. 同理,若n b =n b a +·n db +,则A 1、B 2相互独立.若n c =n d c +·n c a +,则A 2、B 1相互独立.若n d =n b a +·n d b +,则A 2、B 2相互独立. 但是n a ,n b a +,nc a +等表示的是频率,不同于概率.即使变量之间相互独立,式子两边也不一定恰好相等,但是当两边相差很大时,变量之间就不独立,即|n a n b a +-·nca +|很大时,变量之间不独立.同理,|n b a n b +-·n d b +|,|n d c n c +-·nc a +|,|nd c n d +-·n db +|很大时,变量之间也不独立.可用χ2=n[n b a n b a n c a n b a n a +•++•+-2)(+ndb n b a n d b n b a n b +•++•+-2)(+n c a n d c n c a n d c n c +•++•+-2)(+nd b n d c n d b n d c n d +•++•+-2)(]=))()()(()(2d b c a d c b a bc ad n ++++-的大小来检验变量之间是否独立.检验结果标准为: (1)当χ2≤2.706时,变量A 、B 没有关联.(2)当χ2>2.706时,有90%的把握判定变量A 、B 有关联.(3)当χ2>3.841时,有95%的把握判定变量A 、B 有关联.(4)当χ2>6.635时,有99%的把握判定变量A 、B 有关联. 讲练互动 【例1】对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.分析:从所给的列联表中可知病人有两种类型:做过心脏搭桥手术和做过血管清障手术,每种类型又有两种情况:又发作心脏病和未发作心脏病.问题是用表中所给出的数据来检验上述两种状态是否有关系,这是一个独立性检验问题,解决的方法是先计算随机变量χ2的观测值k,用k 的大小来决定是否又发作心脏病与心脏搭桥手术有关还是无关. 解:假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得χ2的观测值为χ2=))()()(()(2d b c a d c b a bc ad n ++++-=32468196196)2915716739(3922⨯⨯⨯⨯-⨯⨯=1.78.因为χ2=1.78<2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系. 绿色通道本题可利用χ2=))()()(()(2d b c a d c b a bc ad n ++++-求出χ2的值,再利用临界值的大小关系来判断,解题时应注意准确代入数据进行计算. 变式训练请问能有多大把握认为药物有效?解:a=10,b=45,c=20,d=30,a+b=55,c+d=50,a+c=30,b+d=75,n=105,χ2=))()()(()(2d b c a d c b a bc ad n ++++-=30755055)20453010(1052⨯⨯⨯⨯-⨯⨯=6.11,因为χ2=6.11>3.841,从而有95%的把握认为药物有效.【例2】甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如利用列联表的独立性检验估计,认为“成绩与班级有关系”犯错误的概率是多少?分析:求出χ2,然后查表求概率.解:假设成绩优秀与班级无关系,则有a=10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90,代入χ2公式得χ2的值.χ2=))()()(()(2d b c a d c b a bc ad n ++++-=73174545)3573810(902⨯⨯⨯⨯-⨯⨯=0.653,由于χ2=0.653<2.706,所以没有充分证据说明优秀与班级有关系,认为成绩与班级有关系犯错误的概率为99%. 绿色通道从本题可知,学习成绩主要取决于个人努力的结果,与所在班级的关系不大.所以同学们要从自身找原因,不要强调外界环境.利用公式计算χ2的值时,一定要计算准确. 变式训练2.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下列联表:请问甲、乙两线生产的产品合格率在多大程度上有关系?解:χ2=))()()(()(2d b c a d c b a bc ad n ++++-=)53)(9597)(595)(397()953597(2002++++⨯-⨯⨯=0.520 8<2.706.∴甲、乙两条生产线生产的产品合格率在很大程度上没有关系. 【例3】通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联请问性别和读营养说明之间在多大程度上有关系?分析:计算χ2,然后查表求概率.解:a=16,b=28,c=20,d=8,a+b=44,c+d=28,a+c=36,b+d=36,n=72.因此χ2的观测值为χ2=))()()(()(2d b c a c d b a bc ad n ++++-=36362844)2028816(722⨯⨯⨯⨯-⨯⨯=8.416.因为8.416>6.635从而有99%的把握认为性别与读营养说明之间有关系. 绿色通道统计方法是可能犯错误的,好的统计方法就是要降低犯错误的概率.两变量之间有无关联,可通过计算χ2的值来衡量. 变式训练3.调查某公司销售员的业绩与性别的关系,得到下表,试问能有多大的把握认为销售员的业解:χ2=29424823)2562317(712⨯⨯⨯⨯-⨯⨯≈3.067>2.706.因此,有90%的把握认为销售员的业绩与性别有关系.试问新措施对防治猪白痢是否有效?分析:利用χ2计算有多大把握认为新措施对防治猪白痢是有效果的. 解:设新措施对防治猪白痢没有效果. 由题意,可知a=114,b=36,c=132,d=18,a+b=150,c+d=150,a+c=246,b+d=54,n=300,代入公式,可得χ2=))()()(()(2d b c a d c b a bc ad n ++++-=54246150150)1323618114(3002⨯⨯⨯⨯-⨯⨯=7.317.因为χ2=7.317>6.635,因此我们有99%的把握认为新措施对防治猪白痢是有效果的.绿色通道利用独立性检验,我们可以对新药对治病是否有效作出合理的推断,避免凭主观意愿作出结论. 变式训练试分析新药对防治小白兔的这种疾病是否有效?解:由公式χ2=58230149139)1293820101(2882⨯⨯⨯⨯-⨯⨯≈8.658>6.635,可以判定新药对防治小白兔这种疾病是有效的.。
高中数学1-2独立性检验的基本思想及其初步应用同步课件新人教A版选修1-2.ppt

与性别是有关的.
根据列联表中所给的数据,有 a=38,b=442,c=6,
d=514,a+b=480,c+d=520,a+c=44,b+d=956,n
=1000,得 K2 的观测值
k=(a+b)(cn+(add-)(ab+c)c2)(b+d)
=
1000×(38×514-442×6)2 480×520×44×956
第一种剂量 第二种剂量
合计
死亡 14 6 20
存活 11 19 30
合计 25 25 50
三、解答题
7.在500个人身上试验某种血清预防感冒的作用,把一年中的记录与另外500个未用血 清的人作比较,结果如下表所示.
试画出列表的条形图,并通过图形判断这种血清能否起到预防感冒的作用?并进行独立
性检验.
[答案] 0.005
[解析] k=8.654>7.879,就推断“X与Y有关”犯错误的 概率不超过0.005.
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射 照射小白鼠.在照射后14天内的结果如下表所示:
进行统计分析时的统计假设是__________________. [答案] 假设电离辐射的剂量与人体受损程度无关.
≈27.1.
由
于
k≈27.1>10.828,所以我们有 99.9%的把握认为色盲与性
别有关系.这个结论只对所调查的 480 名男人和 520 名
女人有效.
[点评] 本题应首先作出调查数据的列联表,再根据列联 表画出二维条形图或三维柱形图,并进行分析,最后利用 独立性检验作出判断.
1.利用图形来判断两个分类变量是否有关系,可以画出三 维柱形图,也可以画出二维条形图,仅从图形上只可以粗 略地判断两个分类变量是否有关系,可以结合所给的数值 来进行比较.作图应注意单位统一,图形准确,但它不能 给我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.
备战2025年高考 文科数学考点一遍过:独立性检验

独立性检验统计案例了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用,并能解决一些实际问题.1.22⨯列联表设X ,Y 为两个变量,它们的取值分别为12{}x x ,和12{}y y ,,其样本频数列联表(22⨯列联表)如下:1y 2y 总计1x a b a +b 2x cdc +d总计a +cb +da b c d+++2.独立性检验利用随机变量2K (也可表示为2χ)2()()()()()n ad bc a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验.3.独立性检验的一般步骤(1)根据样本数据列出22⨯列联表;(2)计算随机变量2K 的观测值k ,查下表确定临界值k 0:20()P K k ≥0.500.400.250.150.1000.0500.0250.0100.0050.0010k 0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828(3)如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过()20P K k ≥;否则,就认为在犯错误的概率不超过()20P K k ≥的前提下不能推断“X 与Y 有关系”.【注意】(1)通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.考向一两类变量相关性的判断已知分类变量的数据,判断两类变量的相关性.可依据数据及公式计算2K ,然后作出判断.典例1为了判断高中生选修理科是否与性别有关.现随机抽取50名学生,得到如下22⨯列联表:根据表中数据,得到2K 的观测值()22501320107 4.84423272030K ⨯⨯-⨯=≈⨯⨯⨯,若已知()23.8410.05P K ≥≈,()2 5.0240.025P K ≥≈,则认为选修理科与性别有关系出错的可能性约为A .25%B .5%C .1%D .10%【答案】B【解析】由观测值2 4.844K ≈,对照临界值得4.844>3.841,由于P (X 2≥3.841)≈0.05,∴认为选修理科与性别有关系出错的可能性为5%.故选B .【名师点睛】本题考查了独立性检验的应用问题,解题的关键是正确理解观测值对应的概率意义.根据条件中所给的观测值,与所给的临界值进行比较,即可得出正确的判断.1.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:男女合计无403575有151025合计5545100附:()()()()()22n ad bcKa b c d a c b d-=++++.()2P K k≥0.500.400.250.150.10 0k0.4550.708 1.323 2.072 2.706据此表,可得A.认为机动车驾驶技术与性别有关的可靠性不足50%B.认为机动车驾驶技术与性别有关的可靠性超过50%C.认为机动车驾驶技术与性别有关的可靠性不足60%D.认为机动车驾驶技术与性别有关的可靠性超过60%考向二独立性检验与概率统计的综合独立性检验是一种统计案例,是高考命题的一个热点,多以解答题的形式出现,试题难度不大,多为中档题,高考中经常是将独立性检验与概率统计相综合进行命题,解题关键是根据独立性检验的一般步骤,作出判断,再根据概率统计的相关知识求解问题.典例2某中学对高三甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:现规定平均成绩在80分以上(不含80分)的为优秀.(1)试分别估计两个班级的优秀率;(2)由以上统计数据填写下面22⨯列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.20()P K k ≥0.400.250.150.1000.0500.0250.0100k 0.7081.3232.0722.7063.8415.0246.635【答案】(1)甲、乙两班的优秀率分别为60%和50%;(2)列联表见解析,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.【解析】(1)由题意知,甲、乙两班均有学生50人,甲班优秀人数为30人,优秀率为3060%50=,乙班优秀人数为25人,优秀率为2550%50=,所以甲、乙两班的优秀率分别为60%和50%.(2)22⨯列联表如下:因为22100(30252025)100 1.010 1.323 5050554599K⨯⨯-⨯==≈<⨯⨯⨯,所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.2.某医院治疗白血病有甲、乙两套方案,现就70名患者治疗后复发的情况进行了统计,得到其等高条形图如图所示(其中采用甲、乙两种治疗方案的患者人数之比为5:2).(1)补充完整22⨯列联表中的数据,并判断是否有99%的把握认为甲乙两套治疗方案对患者白血病复发有影响;复发未复发总计甲方案乙方案2总计70(2)为改进“甲方案”,在甲方案中按分层抽样组成了由5名患者构成的样本,求随机抽取2名患者恰好是复发患者和未复发患者各1名的概率.附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.2()P K k 0.050.010.0050.001k 3.841 6.6357.87910.8281.某市对公共场合禁烟进行网上调查,在参与调查的2500名男性市民中有1000名持支持态度,2500名女性市民中有2000人持支持态度,在运用数据说明市民对在公共场合禁烟是否支持与性别有关系时,用什么方法最有说明力A.平均数与方差B.回归直线方程C.独立性检验D.概率2.某城市地铁一号线全线开通,在一定程度上缓解了出行的拥堵状况.为了了解市民对地铁一号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论中不一定正确的是A.样本中男性比女性更关注地铁一号线全线开通B.样本中多数女性是35岁以上C.35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁一号线的开通关注度更高3.在研究打酣与患心脏病之间的关系中,通过收集数据、整理分析数据得“打酣与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是A.100个心脏病患者中至少有99人打酣B.1个人患心脏病,那么这个人有99%的概率打酣C.在100个心脏病患者中一定有打酣的人D.在100个心脏病患者中可能一个打酣的人都没有4.为研究某两个分类变量是否有关系,根据调查数据计算得到215.968K ≈,因为2(10.828)0.001P K ≥=,则断定这两个分类变量有关系,那么这种判断犯错误的概率不超过A .0.1B .0.001C .0.01D .0.055.某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体检每年未体检合计老年人a7c年轻人6bd合计ef50已知抽取的老年人、年轻人各25名.则完成上面的列联表数据错误的是A .18a =B .19b =C .50c d +=D .1f e -=6.给出如下列联表:患心脏病患其他病合计高血压201030无高血压305080合计5060110已知()210.8280.001P K ≥≈,()26.6350.010P K ≥≈,参照公式()()()()()22n ad bc K a b c d a c b d -=++++,得到的正确结论是A .有99%以上的把握认为“高血压与患心脏病无关”B .有99%以上的把握认为“高血压与患心脏病有关”C .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D .在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关”7.假设有两个分类变量X 和Y 的22⨯列联表为:XY1y 2y 总计1x 5b 5b +2x 15d 15d +总计204060对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢抖音的人数占男生人数的16,女生喜欢抖音的人数占女生人数的23,若有99%的把握认为是否喜欢抖音和性别有关,则男生至少有参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k >0.100.050.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828A .12人B .18人C .24人D .30人9.某校为了研究学生的性别与对待某一活动的态度(支持和不支持两种态度)的关系,运用22⨯列联表进行独立性检验,经计算2 6.669K =,则所得到的统计学结论是:有______%的把握认为“学生性别与是否支持该活动有关系”.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2P K k >0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.82810.已知下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.11.某品牌经销商在一广场随机采访男性和女性用户各50名,其中每天玩微信超过6小时的用户列为“微信控”,否则称其为“非微信控”,调查结果如下:微信控非微信控合计男性262450女性302050合计5644100(1)根据以上数据,能否有95%的把握认为“微信控”与“性别”有关?(2)现从调查的女性用户中按分层抽样的方法选出5人,求所抽取的5人中“微信控”和“非微信控”的人数;(3)从(2)中抽取的5位女性中,再随机抽取3人赠送礼品,试求抽取3人中恰有2人为“微信控”的概率.参考数据:()2P K k >0.100.0500.0250.0100.001k2.7063.8415.0246.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.12.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关,该学校对100名高一新生进行了问卷调查,得到如下22⨯列联表:喜欢游泳不喜欢游泳合计男生40女生30合计已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为3 5.(1)请将上述列联表22⨯补充完整,并判断是否可以在犯错误的概率不超过0.001的前提下认为喜欢游泳与性别有关.(2)已知在被调查的学生中有6名来自高一(1)班,其中4名喜欢游泳,现从这6名学生中随机抽取2人,求恰有1人喜欢游泳的概率.附:()()()()()22=n ad bcKa b c d a c b d-++++()2P K k≥0.100.0500.0250.0100.0050.001 0k 2.706 3.841 5.024 6.6357.87910.82813.某工厂每年定期对职工进行培训以提高工人的生产能力(生产能力是指一天加工的零件数).现有A 、B 两类培训,为了比较哪类培训更有利于提高工人的生产能力,工厂决定从同一车间随机抽取100名工人平均分成两个小组分别参加这两类培训.培训后测试各组工人的生产能力得到如下频率分布直方图.(1)记M 表示事件“参加A 类培训工人的生产能力不低于130件”,估计事件M 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为工人的生产能力与培训类有关:生产能力130<件生产能力130≥件总计A 类培训50B 类培训50总计100(3)根据频率分布直方图,判断哪类培训更有利于提高工人的生产能力,请说明理由.参考数据:20()P K k ≥0.150.100.0500.0250.0100.005k 2.072 2.706 3.841 5.024 6.6357.879参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.1.(2019年高考全国Ⅰ卷文数)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.8282.(2017年高考新课标Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P (2≥)0.0500.0100.001k3.8416.63510.82822()()()()()n ad bc K a b c d a c b d -=++++.3.(2018年高考新课标Ⅲ卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,()2P K k≥0.0500.0100.001k 3.841 6.63510.828变式拓展1.【答案】A【解析】由表中数据,计算K2()2 1001040351555457525⨯⨯-⨯=≈⨯⨯⨯0.3367<0.455,∴认为机动车驾驶技术与性别有关的可靠性不足50%.故选A.【名师点睛】本题考查独立性检验的应用,关键是理解独立性检验的思路.由表中数据计算观测值,对照临界值得出结论.2.【答案】(1)见解析;(2)3 5.【解析】(1)根据题意知,70名患者中采用甲种治疗方案的患者人数为50人,采用乙种治疗方案的患者人数为20人,补充完整22⨯列联表中的数据,如下所示:复发未复发总计甲方案203050乙方案21820总计224870计算得,2270(2018302) 5.966 6.63522485020K⨯⨯-⨯=≈<⨯⨯⨯,所以没有99%的把握认为甲、乙两套治疗方案对患者白血病复发有影响.(2)在甲种治疗方案中按分层抽样抽取5名患者,复发的抽取2人,记为A、B;未复发的抽取3人,记为c、d、e,从这5人中随机抽取2人,基本事件为:AB、Ac、Ad、Ae、Bc、Bd、Be、cd、ce、de,共10种,其中2人恰好是复发患者和未复发患者各1名的基本事件为:Ac、Ad、Ae、Bc、Bd、Be,共6种,则所求的概率为63=105 P .【名师点睛】本题考查列联表、卡方计算、分层抽样以及古典概型的概率计算,考查基本分析求解能力,属中档题.求解时,(1)根据条件确定对应项数据,填入表格得列联表,根据卡方公式得2K值,对照参考数据确定把握率,(2)先根据分层抽样确定样本数,再根据枚举法确定样本总数以及所求事件包含的样本数,最后根据古典概型概率公式得结果.专题冲关1.【答案】C【解析】独立性检验研究的是两个分类变量之间的相关关系,所以市民对在公共场合禁烟是否支持与性别有关系时,用独立性检验最有说明力.【名师点睛】本题考查对独立性检验概念的理解,属于简单题.2.【答案】C【解析】由左图知,样本中的男性数量多于女性数量,A正确;由右图知女性中35岁以上的占多数,B正确;由右图知,35岁以下的男性人数比35岁以上的女性人数少,C错误;由右图知样本中35岁以上的人对地铁一号线的开通关注度更高,D正确.故选C.【名师点睛】本题考查了等高条形图的应用问题,也考查了对图形的认识问题,是基础题.根据两幅图中的信息,对选项中的命题判断正误即可.3.【答案】D【解析】利用独立性检验的结论可得:若“打酣与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的,则在100个心脏病患者中可能一个打酣的人都没有.本题选择D选项.【名师点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.4.【答案】B【解析】由题意,根据调查数据计算得到215.968K ≈,因为2(10.828)0.001P K ≥=,所以这种判断犯错误的概率不超过0.001,故选B .【名师点睛】本题主要考查了独立性检验的应用,其中解答中熟记独立性检验的概念和含义是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.5.【答案】D 【解析】因为725,625,6,7,50,50a c b d a e b f c d e f +==+==+=+=+=+=,所以18,19,50,24,26,2a b c d e f f e ==+===-=.故选D.【名师点睛】本题考查列联表有关概念,考查基本求解能力.先根据列联表列方程组,解得a ,b ,c ,d ,e ,f 再判断各选项.6.【答案】B【解析】由列联表中的数据可得()22110205010307.486 6.63530805060K ⨯⨯-⨯=≈≥⨯⨯⨯,()2 6.6350.01P K ≥= ,∴有10.0199%-=的把握认为高血压与患心脏病有关,即有99%的把握认为高血压与患心脏病有关,故选B.【名师点睛】本题考查独立性检验的应用,属于基础题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3)查表比较2K 与临界值的大小关系,作统计判断.7.【答案】D【解析】将表格中的数据和选项中提供的数据代入公式:22()()()()()n ad bc K a b c d a c b d -=++++中并计算可得,选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,所以222431K K K >>22K >,即由选项D 中的数据得到的2K 值最大,也就能说明X 与Y 有关系的可能性最大,故选D.8.【答案】B 【解析】设男生人数为x ,则女生人数为2x,喜欢抖音不喜欢抖音总计男生16x 56x x 女生13x 16x 2x 总计2x x32x 所以2235326636 6.63517.69822x x x x x x K x x x x x ⎛⎫⋅-⋅ ⎪⎝⎭==>⇒>⋅⋅⋅,又男女人数为整数,故选B.【名师点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.9.【答案】99【解析】因为2 6.669K =>6.635,2 6.6697.879K =<,对照表格得到有99%的把握认为学生性别与是否支持该活动有关系.故答案为99.【名师点睛】本题考查独立性检验,解题时注意利用表格数据与观测值比较,这是一个基础题.10.【答案】①②③【解析】①相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于1,表示回归效果越好,是正确的;②两个变量相关性越强,则相关系数r 的绝对值就越接近于1,是正确的;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位是正确的,因为回归方程,并不是样本点都落在方程上,故只能是估计值,所以说是平均增长;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越小,故原命题错误.故答案为:①②③.11.【答案】(1)没有95%的把握认为“微信控”与“性别”有关;(2)“微信控”有3人,“非微信控”有2人;(3)35.【解析】(1)由2×2列联表可得:()2210026203024500.649 3.8415050564477K ⨯⨯-⨯==≈<⨯⨯⨯,所以没有95%的把握认为“微信控”与“性别”有关.(2)根据题意所抽取的5位女性中,“微信控”有3人,“非微信控”有2人.(3)设事件M =“从(2)中抽取的5位女性中,再随机抽取3人,抽取3人中恰有2人是’微信控’”.抽取的5位女性中,“微信控”的3人分别记为,,A B C ;“非微信控”的2人分别记为,D E .则再从中随机抽取3人构成的所有基本事件为:,,,,,,,,,ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE ,共有10种;抽取3人中恰有2人为“微信控”所含基本事件为:,,,,,ABD ABE ACD ACE BCD BCE ,共有6种,所以()63105P M ==.【名师点睛】本小题主要考查22⨯联表、独立性检验的知识,考查分层抽样,考查利用列举法求古典概型,属于中档题.求解时,(1)计算2K 的值,对比题目所给参考数据可以判断出没有95%的把握认为“微信控”与“性别”有关.(2)女性用户中,微信控和非微信控的比例为30:203:2=,由此求得各抽取的人数.(3)利用列举法以及古典概型的概率计算公式,即可求得抽取3人中恰有2人是“微信控”的概率.12.【答案】(1)列联表见解析,可以;(2)815.【解析】(1)根据条件可知喜欢游泳的人数为3100605⨯=人.完成22⨯列联表:喜欢游泳不喜欢游泳合计男生401050女生203050合计6040100根据表中数据,计算()221004030201016.66710.82860405050K ⨯-⨯=≈>⨯⨯⨯所以可以在犯错误的概率不超过0.001的前提下认为喜欢游泳与性别有关.(2)设“恰有一人喜欢游泳”为事件A ,设4名喜欢游泳的学生为1234,,,a a a a ,不喜欢游泳的学生为12,b b ,基本事件总数有15种:1213141112,,,,,a a a a a a a b a b 23242122343132414212,,,,,,,,,a a a a a b a b a a a b a b a b a b b b ,其中恰有一人喜欢游泳的基本事件有8种:1112212231324142,,,,,,,a b a b a b a b a b a b a b a b ,所以()815P A =.【名师点睛】本题考查了独立性检验与运算求解能力,同时考查通过列举法求概率的应用,属于中档题.(1)根据题意计算喜欢游泳的学生人数,求出女生、男生多少人,完善列联表,再计算观测值2K ,对照临界值表即可得出结论;(2)设“恰有一人喜欢游泳”为事件A ,设4名喜欢游泳的学生为1234,,,a a a a ,不喜欢游泳的学生为12,b b ,通过列举法即可得到答案.13.【答案】(1)0.28P =;(2)见解析;(3)见解析.【解析】(1)由频率分布直方图,用频率估计概率得,所求的频率为(0.0200.008)100.28+⨯=,估计事件M 的概率为0.28P =.(2)A 类培训生产能力130<件的人数为(0.0160.0320.024)105036++⨯⨯=,A 类培训生产能力130≥件的人数为(0.0200.008)105014+⨯⨯=,B 类培训生产能力130<件的人数为(0.0200.004)105012+⨯⨯=,B 类培训生产能力130≥件的人数为(0.0520.024)105038+⨯⨯=,可得列联表如下:生产能力130<件生产能力130≥件总计A 类培训361450B 类培训123850总计4852100由列联表计算22100(36381214)23.077 6.63548525050K ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为工人的生产能力与培训类有关.(3)根据频率分布直方图知,A 类生产能力在130以上的频率为0.28,B 类培训生产能力在130以上的频率为0.76,判断B 类培训更有利于提高工人的生产能力.【名师点睛】本题考查了频率分布直方图与独立性检验的应用问题,是基础题.求解时,(1)由频率分布直方图用频率估计概率,求得对应的频率值,用频率估计概率即可;(2)根据题意填写列联表,计算观测值,对照临界值得出结论;(3)根据频率分布直方图,判断A 、B 类生产能力在130以上的频率值,比较得出结论.直通高考1.【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.850=,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.650=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得22100(40203010) 4.76250507030K ⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.【解析】(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466K2=2 2006266343815.705 10010096104⨯⨯-⨯⨯⨯⨯()≈.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1.(2)频率分布直方图中均值等于组中值与对应概率乘积的和.(3)均值大小代表水平高低,方差大小代表稳定性.3.【答案】(1)第二种生产方式的效率更高,理由见解析;(2)见解析;(3)能.【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m+==.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.。
高中数学 专题1.2 独立性检验的基本思想及初步应用测试题(含解析)新人教A版选修1-2(2021

2016-2017学年高中数学专题1.2 独立性检验的基本思想及初步应用测试题(含解析)新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学专题1.2 独立性检验的基本思想及初步应用测试题(含解析)新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学专题1.2 独立性检验的基本思想及初步应用测试题(含解析)新人教A版选修1-2的全部内容。
独立性检验的基本思想及初步班级:姓名:_____________1.下面说法正确的是( )A.统计方法的特点是统计推断准确、有效B.独立性检验的基本思想类似于数学上的反证法C.任何两个分类变量有关系的可信度都可以通过查表得到D.不能从等高条形图中看出两个分类变量是否相关答案B2.用独立性检验来考察两个分类变量x与y是否有关系,当统计量K2的观测值()A.越大,“x与y有关系”成立的可能性越小B.越大,“x与y有关系”成立的可能性越大C.越小,“x与y没有关系”成立的可能性越小D.与“x与y有关系"成立的可能性无关答案B3.在一个2×2列联表中,由其数据计算得K2的观测值k=7。
097,则这两个变量间有关系的可能性为( )A.99% B.99.5%C.99.9%D.无关系答案A4.对两个分类变量A、B的下列说法中正确的个数为( )①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.1 B.2C.3 D.4答案A解析①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,也可借助三维柱形图、二维条形图等.故选A.5.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是( )A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0。
高中数学选修1-2 《独立性检验的基本思想及其初步应用》课件1

甲班 乙班 总计
优秀 10 7 17
不优秀 35 38 73
总计 45 45 90
试问能有多大把握认为“成绩与班级有关系”?
K2=90×17(×107×3×384-5×7×4535)2=0.653, 0.653<3.841, 所以没有充分证据认为成绩与班级有关.
• 二、填空题
• 5.如果K2的观测值k为8.654,可推断“X 与Y有关”犯错误的概率不超过______.
55 08 3 2 06 1
5
8
(1)若观测值K2>10.828. 则有99.9%的把握认为“吸烟与肺癌有关系” (2)若观测值K2>6.635, 则有99%的把握认为;“吸烟与肺癌有关系
(3)若观测值K2>2.706,则则有90%的把握认为“吸烟与肺癌有关系”
(4)若观测值K2<2.706, 则没有充分的证据显示“吸烟与肺癌 有关系”,但也不能作出结论“吸烟 与肺癌没有关系。
例1
在某医院,因为患心脏病而住院的665名病人中, 有214人秃顶,而另外772名不是因为患心脏病而 住院的男性病人中有175人秃顶。利用图形判断秃 顶与患心脏病是否有关系。能够以99%的把握认为 秃顶与患心脏病有关系吗?为什么?
秃顶 不秃顶 总计
患心脏病 214 451 665
患其他病 175 597 772
总计 122 178 300
由表中数据计算得到 K 2的观测值 k 4.514 。
能够以95%的把握认为高中生的性别与是否喜 欢数学课程之间有关系吗?为什么?
解:在假设“性别与是否喜欢数学之间没有关系” 的前提下,K2应该很小,并且
P(K 2 3.841) 0.05 而K 2的观测值k 4.514超过了3.841,这就意味着 “性别与是否喜欢数学课程之间有关系”这一结论 是错误的可能性约为0.05,即有95%的把握 认为“性别与是否喜欢数学课程之间有关系”
高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用预习导航 新人教A版选修1-2(

航新人教A版选修1-2编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用预习导航新人教A版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例1.2 独立性检验的基本思想及其初步应用预习导航新人教A版选修1-2的全部内容。
习导航新人教A版选修1-21.分类变量和列联表(1)分类变量变量的不同“值"表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表,称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为思考1提示:分类变量的不同取值仅表示个体所属的不同类别,如性别变量只取男、女两个值.有时也可以把分类变量的不同取值用数字来表示,但这时的数字除了分类以外没有其他的含义.如用“0”表示“男”,“1”表示“女”,性别变量就变成取值为0和1的随机变量,但是这些数字并没有其他的含义.定量变量的取值一定是实数,其取值的大小具有特定的含义,如身高、体重、考试成绩等.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现错误!和错误!相差很大,就判断两个分类变量之间有关系.思考2 通过等高条形图可精确地给出这种判断犯错误的概率吗?提示:不能,等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出这种判断犯错误的概率.3.独立性检验和P(K2≥7.879)≈0。
高中数学课件第一章 1.2 独立检验的基本思想及其初步应用

链接——生活中的素材 北京市教委透露,2016 年高考改革要点中,语文从 150 分上调到 180 分。 高考语文分数增加 30 分,这不仅是一种简单的分值调整,意味着高考指挥棒的 价值导向终于进行了调整和偏转:语文学科在基础教育中的重要性得到了强化。 这会让孩子们学习语文、学习国语的积极性、自觉性和趣味性,得到空前推进 和提升,正如歌曲《中国话》所唱到的,“最爱说的话永远是中国话,字正腔圆 落地有声说话最算话;最爱写的字是先生教的方块字,横平竖直堂堂正正做人 要像它”。高考语文分数增加,可以让祖国语言文字自豪感、民族文化自豪感、 民族文化自信力,得到现代化的继承和发扬光大。
背诵——相关名言警句 1.捐躯赴国难,视死忽如归。
——曹植 2.以身许国,何事不敢为?
——岳飞 3.我爱我的祖国,爱我的人民,离开了它,离开了他们,我就无法生存, 更无法写作。
——巴金
4.我荣幸地以中华民族一员的资格,而成为世界公民。我是中国人民的儿 子。我深情地爱着我的祖国和人民。
——邓小平
[知识·梳理]
联表)为
y1 y2
x1
a
b
总计 a+b
x2
c
d
c+d
总计 a+c b+d a+b+c+d
(3)等高条形图 ①图形与表格相比,更能直观地反映出两个分类变量间是 否 相互影响 , 常 用 等 高 条 形 图 展 示 列 联 表 数 据 的 频率特征 . ②通过直接计算或观察等高条形图发现a+a b和c+c d相差很 大,就判断两个分类变量之间有关系.
(1)作 2×2 列联表时,关键是对涉及的变量分清类 别.计算时要准确无误.
(2)利用 2×2 列联表分析两个分类变量间的关系时, 首先要根据题中数据获得 2×2 列联表,然后根据频率特 征,即将a+a b与c+c da+b b与c+d d的值相比,直观地反映出 两个分类变量间是否相互影响,但方法较粗劣.
选修1-2《独立性检验》课件

(2)分类变量的取值有时可用数字来表示,但这时 的数字除了分类以外没有其他的含义,如用“0” 表示“男”,用“1”表示“女”.
某医疗机构为了了解患肺癌与吸烟是否有 关,进行了一次抽样调查,共调查了9965 个成年人,其中吸烟者2148人,不吸烟者 7817人,调查结果是:吸烟的2148人中49 人患肺癌, ;不吸烟的7817人中42人患肺 癌.
由观测 数据计算 得到随机变量K 2的观测 值k.
(3)如果k≥k0 ,就以(1-P(K2≥k0)) ×100%的把握 认为“X与Y有关系”;否则就说样本观测数据 没有提供“X与Y有关系”的充分证据.
反证法原理与假设检验原理
反证法原理:
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
问题3:能否用数量刻画出“有关”的程度?
独立性检验
通过数据和图表分析,得到 结论是:吸烟与患呼吸道疾 病有关
H0: 吸烟和患肺癌之间没有关系
结论的可靠 程度如何?
不吸烟 吸烟 总计
吸烟与呼吸道疾病列联表
不患肺癌
患肺癌
a
b
c
d
a+c
b+d
不吸烟的人中不患肺癌的比例: 吸烟的人中不患肺癌的比例:
a ab
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例题解析:
例1、在某医院,因为患心脏病而住院的665名男性病 人中,有214人秃顶,而另外772名不是因为患心脏病而住 院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患 心脏病是否有关系;(2)能否在犯错误的概率不超过0.01 的前提下认为秃顶与患心脏病有关系?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。
如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。
㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。
(2 列出开发利用方案编制所依据的主要基础性资料的名称。
如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。
对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。
二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。
2、国内近、远期的需求量及主要销向预测。
㈡产品价格分析
1、国内矿产品价格现状。
2、矿产品价格稳定性及变化趋势。
三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。
2、矿区矿产资源概况。
3、该设计与矿区总体开发的关系。
㈡该设计项目的资源概况
1、矿床地质及构造特征。
2、矿床开采技术条件及水文地质条件。