专题七 第3讲 统计与统计案例(理)(教师)资料讲解

专题七  第3讲 统计与统计案例(理)(教师)资料讲解
专题七  第3讲 统计与统计案例(理)(教师)资料讲解

专题七第3讲统计与统计案例

(理)(教师)

专题七概率与统计(理)

概率与统计应以随机变量及其分布列为中心,求解时应抓住建模、解模、用模这三个基本点.

排列组合是求解概率的工具,利用排列组合解题时应抓住特殊元素或特殊位置,注意元素是否相邻及元素是否定序,同时还应注意题中是否还涉及两个计数原理.

随机变量的均值和方差是概率初步的关键点,解决概率应用问题时,首先要熟悉几种常见的概率类型,熟练掌握其计算公式;其次还要弄清问题所涉及的事件具有什么特点、事件之间有什么联系;再次要明确随机变量所取的值,同时要正确求出所对应的概率.

统计的主要内容是随机抽样、样本估计总体、变量的相关性,复习时应关注直方图、茎叶图与概率的结合,同时注意直方图与茎叶图的数据特点.

第3讲 统计与统计案例

考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.

1.明确直方图的三个结论 (1)小长方形的面积=组距×

频率

组距

=频率. (2)各小长方形的面积之和等于1.

(3)小长方形的高=频率组距,所有小长方形高的和为1

组距.

2.把握统计中的四个数据特征

(1)众数:在样本数据中,出现次数最多的那个数据.

(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即 x =1

n (x 1+x 2+…+x n ).

(4)方差与标准差

方差:s 2=1

n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].

标准差: s =

1

n [(x 1

-x )2+(x 2-x )2+…+(x n -x )2].

热点一 抽样方法

1.(1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为() A.11 B.12 C.13 D.14

(2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.

思维启迪(1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例.

答案(1)B(2)200

解析(1)由840

42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为

720-480

20=240

20=12.

(2)本题属于分层抽样,设该学校的教师人数为x,所以

160

3 200=

160-150

x,所以x=200.

思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.

2.(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为()

A.15 B.16 C.17 D.18

(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()

A.200,20 B.100,20

C.200,10 D.100,10

答案(1)C(2)A

解析(1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17,故选C.

(2)该地区中、小学生总人数为3 500+2 000+4 500=10 000,

则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.

热点二用样本估计总体

3.(1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()

A.6 B.8 C.12 D.18

(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()

A.甲B.乙

C.甲乙相等D.无法确定

甲乙

20.04123 6

930.059

6210.0629

3310.079

640.087

70.09246

思维启迪(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频

率和无疗效人数计算;(2)直接根据公式计算方差.答案(1)C(2)A

解析(1)志愿者的总人数为

20

(0.16+0.24)×1

=50,

所以第三组人数为50×0.36=18,

有疗效的人数为18-6=12.

(2)x甲=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷12≈0.068 9,

x乙=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷12≈0.067 5,

s2=1

12

[(0.042-0.068 9)2+(0.053-0.068 9)2+…+(0.097-0.068 9)2]≈0.000 212.

s2=1

12

[(0.041-0.067 5)2+(0.042-0.067 5)2+…+(0.096-0.067 5)2]≈0.000 429.

所以甲、乙两地浓度的方差较小的是甲地.

思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.

(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.

4.(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为 2.5万元,则11时至12时的销售额为________万元.

(2)(2014·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4

D .1,4+a

答案 (1)10 (2)A

解析 (1)由频率分布直方图可知: 0.100.40=2.5

x

,所以x =10. (2)x 1+x 2+…+x 1010

=1,y i =x i +a ,

所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4. 故选A.

热点三 统计案例

5.(1)以下是某年2月某地区搜集到的新房屋的销售价格y 和房屋的面积x 的数据.

根据上表可得线性回归方程y =b x +a 中的b =0.196 2,则面积为150 m 2的房屋的销售价格约为________万元.

(2)(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )

表1

表3

表4

A.成绩 B .视力 C 思维启迪 (1)回归直线过样本点中心(x ,y ); (2)根据列联表,计算K 2的值 答案 (1)31.244 2 (2)D

解析 (1)由表格可知x =1

5(115+110+80+135+105)=109,

y =1

5(24.8+21.6+18.4+29.2+22)=23.2.

所以a ^

=y -b ^

x =23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y ^

=0.196 2x +1.814 2.

故当x =150时,销售价格的估计值为y ^

=0.196 2×150+1.814 2=31.244 2(万元).

(2)A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=

52×(6×22-14×10)220×32×16×36

=13

1 440. B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=

52×(4×20-16×12)220×32×16×36

=637360. C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=

52×(8×24-12×8)220×32×16×36

=1310.

D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2

=52×(14×30-6×2)220×32×16×36

=3 757160.

131 440<1310<637360<3 757

160

, ∴与性别有关联的可能性最大的变量是阅读量.

思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K 2(χ2)计算公式求其值,根据K 2(χ2)取值范围求解即可. 6.(1)已知x 、y 取值如下表:

从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a 等于( ) A .1.30 B .1.45 C .1.65 D .1.80

(2)某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:

(附:

)

答案 (1)B (2)0.01

解析 (1)依题意得,x =1

6×(0+1+4+5+6+8)=4,

y =1

6

(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;

又直线y ^

=0.95x +a ^

必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ^

,由

相关主题
相关文档
最新文档