高中数学必修3第二章 2.2.2
2.2.2用样本的数字特征估计总体的数字特征
学习目标
1.理解样本数据标准差的意义和作用,学会计算数据的标准差.
2.会用样本的基本数字特征来估计总体的基本数字特征.
知识点一 众数、中位数、平均数
思考 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大. 梳理 众数、中位数、平均数定义 (1)众数:一组数据中出现次数最多的数.
(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1
n (x 1+x 2+…+x n )叫做这n 个数的平均数.
知识点二 方差、标准差 标准差、方差的概念及计算公式
(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s = 1
n [(x 1
-x )2+(x 2-x )2+…+(x n -x )2]. (2)标准差的平方s 2叫做方差.
s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均
数).
(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x . 知识拓展:平均数、方差公式的推广
(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的
平均数是m x +a .
(2)设数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则 a .s 2=1n [(x 21+x 22
+…+x 2n )-n x 2
]; b .数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; c .数据ax 1,ax 2,…,ax n 的方差为a 2s 2.
1.中位数是一组数据中间的数.( × )
2.众数是一组数据中出现次数最多的数.( √ )
3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( √ )
类型一 众数、中位数、平均数的应用 命题角度1 众数、中位数、平均数的计算
例1某公司的各层人员及工资数构成如下:
人员:经理1人,周工资22 000元;高层管理人员6人,周工资均为1 800元;高级技工5人,周工资均为1 500元;工人10人,周工资均为1 000元;学徒1人,周工资为500元.
(1)计算该公司员工周工资的众数、中位数、平均数;
(2)这个问题中,平均数能客观地反映这个公司的工资水平吗?
考点众数、平均数、中位数的综合
题点具体数据中的众数、平均数、中位数
解(1)众数为1 000,中位数为1 500,平均数为
22 000×1+1 800×6+1 500×5+1 000×10+500×1
≈2 209.
1+6+5+10+1
(2)虽然平均数为2 209,但由给出的数据可见,只有经理的周工资在平均数以上,其余的都在平均数以下,故用平均数不能客观地反映该公司的工资水平.
反思与感悟(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.
(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.
(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.
跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩(单位:m)
1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数
2
3
2
3
4
1
1
1
分别求这些运动员成绩的众数、中位数与平均数. 考点 众数、平均数、中位数的综合 题点 具体数据中的众数、平均数、中位数
解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是x =1
17(1.50×2+1.60×3+…+
1.90×1)=28.75
17
≈1.69(m).
答 17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m. 命题角度2 用频率分布直方图估算众数、中位数、平均数 例2 已知一组数据:
125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:
分组 频数 频率 [121,123) [123,125) [125,127) [127,129) [129,131] 合计
(2)作出频率分布直方图;
(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 考点 众数、平均数、中位数的综合
题点 频率分布直方图中的众数、平均数、中位数 解 (1)频率分布表如下:
分组 频数 频率 [121,123)
2
0.10
[123,125)30.15
[125,127)80.40
[127,129)40.20
[129,131]30.15
合计20 1.00
(2)频率分布直方图如下:
(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实
=126.25,事实上中位数为125.5.上,众数的精确值为125.图中虚线对应的数据是125+2×5
8
使用“组中值”求平均数:x=122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,
平均数的精确值为x=125.75.
反思与感悟(1)利用频率分布直方图估计数字特征
①众数是最高的矩形的底边中点的横坐标;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
跟踪训练2一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.
考点 众数、平均数、中位数的综合
题点 频率分布直方图中的众数、平均数、中位数 解 众数=39.99+40.01
2=40;
中位数为39.99+0.2
25
=39.998;
四个矩形的面积分别是0.02×5=0.1, 0.02×10=0.2, 0.02×25=0.5, 0.02×10=0.2. 平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996. 类型二 标准差、方差的应用
例3 计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1). 考点 方差与标准差 题点 求方差与标准差
解 ①x =90+18[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+1
8×0=90;
②计算x i -x (i =1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3; ③计算(x i -x )2(i =1,2,…,8),得各数据为1,9,4,1,16,0,4,9; ④计算方差:s 2=18(1+9+4+1+16+0+4+9)=44
8=5.5;
⑤计算标准差:s = 5.5≈2.3.
所以这组数据的方差为5.5,标准差约为2.3.
反思与感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.
(3)若样本数据都相等,则s=0.
(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.
跟踪训练3某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:10210199981039899
乙:110115908575115110
试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定.
考点方差与标准差
题点求方差与标准差
解x甲=1
7(102+101+99+98+103+98+99)=100;
x乙=1
7(110+115+90+85+75+115+110)=100;
s2甲=1
7[[(102-100)2
+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99
-100)2]
=1
7(4+1+1+4+9+4+1)≈3.43;
s2乙=1
7[(110-100)2
+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110
-100)2]
=1
7(100+225+100+225+625+225+100)≈228.57. 所以s2甲<s2乙,故甲车间产品较稳定.
1.某市2017年各月的平均气温(℃)数据的茎叶图如图:
则这组数据的中位数是()
A.19
B.20
C.21.5
D.23
考点中位数
题点求茎叶图中的中位数
答案 B
解析由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.
2.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若y i=x i+a(a为非零常数,i =1,2,…,10),则y1,y2,…,y10的平均数和方差分别为()
A.1+a,4
B.1+a,4+a
C.1,4
D.1,4+a
考点平均数
题点由两组数的关系求平均数和方差
答案 A
解析∵x1,x2,…,x10的平均数x=1,方差s21=4,且y i=x i+a(i=1,2,…,10),∴y1,y2,…,y10的平均数
y=1
10·(y1+y2+…+y10)=
1
10·(x1+x2+…+x10+10a)=
1
10·(x1+x2+…+x10)+a=x+a=
1+a,
其方差s22=1
10·[(y1-y)
2+(y2-y)2+…+(y10-y)2]=110[(x1-1)2+(x2-1)2+…+(x10-1)2]=s21=4.
故选A.
3.某校从高一年级参加期末考试的学生中抽出60名,其成绩(均为整数)的频率分布直方图如图所示,由此估计此次考试成绩的中位数、众数分别是()
A.73.3,75
B.73.3,80
C.70,70
D.70,75
考点中位数
题点求频率分布直方图中的中位数
答案 A
解析由图可知小于70的有24人,大于80的有18人,则在[70,80)之间的有18人,所以
中位数落在[70,80)这组内,且为70+10
3≈73.3;众数就是频率分布直方图中最高的矩形底
边中点的横坐标,即70+80
2
=75.
4.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________. 考点 方差与标准差 题点 求标准差 答案 16
解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8, 可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s =16. 5.某校医务室抽查了高一10位同学的体重(单位:kg)如下: 74,71,72,68,76,73,67,70,65,74.
(1)求这10个学生体重数据的平均数、中位数、方差、标准差; (2)估计高一所有学生体重数据的平均数、中位数、方差、标准差. 考点 平均数与方差的综合应用 题点 利用定义求平均数与方差
解 (1)这10个学生体重数据的平均数为x =1
10
×(74+71+72+68+76+73+67+70+65+74)=71.
这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,
∴这10个学生体重数据的中位数为71+72
2=71.5.
这10个学生体重数据的方差为 s 2=
1
10
×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11, 这10个学生体重数据的标准差为s =s 2=11.
(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为11.
1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.
2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.
一、选择题
1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数,众数,中位数分别为()
A.85分,85分,85分
B.87分,85分,86分
C.87分,85分,85分
D.87分,85分,90分
考点 众数、平均数、中位数的综合
题点 具体数据中的众数、平均数、中位数 答案 C
解析 平均数为100+95+90×2+85×4+80+75
10
=87,众数为85,中位数为85,故选C.
2.某台机床加工的五批同数量的产品中次品数的频率分布如表:
次品数 0 1 2 3 4 频率
0.5
0.2
0.05
0.2
0.05
则次品数的平均数为( ) A.1.1 B.3 C.1.5 D.2 考点 平均数
题点 由表或图估计平均数 答案 A
解析 设数据x i 出现的频率为p i (i =1,2,…,n ),则x 1,x 2,…,x n 的平均数为x 1p 1+x 2p 2+…+x n p n =0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1,故选A.
3.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( ) A.
65
B.65
C.2
D. 2 考点 方差与标准差 题点 求方差与标准差 答案 D
解析 ∵样本a,0,1,2,3的平均数为1, ∴a +65
=1,解得a =-1.
则样本的方差s 2=1
5×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为 2.
故选D.
4.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是( )
A.甲棉种;甲棉种
B.乙棉种;甲棉种
C.甲棉种;乙棉种
D.乙棉种;乙棉种
考点用样本数字特征估计总体数字特征
题点平均数与方差的综合应用
答案 C
解析根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71.
∴甲棉种的平均值x甲=1
5×(68+69+70+71+72)=70;
乙棉种的平均值x乙=1
5×(68+68+69+69+71)=69.
甲的方差s2甲=1
5×[(68-70)
2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,
乙的方差s2乙=1
5×[(68-69)
2+(68-69)2+(69-69)2+(69-69)2+(71-69)2]=1.2.
∴甲棉种平均产量较高,乙棉种产量较稳定.故选C.
5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为()
A.62,62.5
B.65,62
C.65,62.5
D.62.5,62.5
考点 众数、中位数的综合应用 题点 频率分布直方图中的众数、中位数 答案 C
解析 ∵最高的矩形为第三个矩形, ∴时速的众数的估计值为65.
前两个矩形的面积为(0.01+0.03)×10=0.4. ∵0.5-0.4=0.1,0.1
0.4
×10=2.5,
∴中位数的估计值为60+2.5=62.5.故选C.
6.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( ) A.a >b >c B.b >c >a C.c >a >b
D.c >b >a 考点 众数、平均数、中位数的综合 题点 具体数据中的众数、平均数、中位数 答案 D
解析 由已知得a =1
10×(15+17+14+10+15+17+17+16+14+12)=14.7,
b =1
2
×(15+15)=15,c =17,∴c >b >a .故选D. 7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x ,y,105,109,110.已知
该同学五次数学成绩数据的平均数为108,方差为35.2,则|x -y |的值为( ) A.15 B.16 C.17 D.18 考点 平均数与方差的综合应用 题点 平均数与方差中的方程问题 答案 D
解析 由题意得,x +y +105+109+110
5=108,
① (x -108)2+(y -108)2+9+1+4
5
=35.2,
②
由①②解得????? x =99,y =117,或?????
x =117,
y =99,
所以|x -y |=18.故选D.
8.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ) A.57.2,3.6 B.57.2,56.4 C.62.8,63.6
D.62.8,3.6
考点 平均数与方差的综合应用 题点 平均数与方差中的方程问题 答案 D
解析 每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.
9.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示.若甲、乙两人的平均成绩分别是x 甲,x 乙,则下列结论正确的是( )
A.x 甲<x 乙;乙比甲成绩稳定
B.x 甲>x 乙;甲比乙成绩稳定
C.x 甲>x 乙;乙比甲成绩稳定
D.x 甲<x 乙;甲比乙成绩稳定 考点 平均数与方差的综合应用 题点 平均数和方差在决策中的意义 答案 A
解析 甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95, 所以x 甲=
1
5
×(78+77+72+86+92)=81, x
乙=
1
5
×(78+82+88+91+95)=86.8. 所以x 甲<
x 乙,从叶在茎上的分布情况来看,乙同学的成绩更集中于平均值附近,这说
明乙比甲成绩稳定. 二、填空题
10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________. 考点 方差与标准差 题点 求方差与标准差 答案 2 2
解析 ∵一组数据2,x,4,6,10的平均数是5, ∴2+x +4+6+10=5×5,解得x =3,
∴此组数据的方差s 2=1
5×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8,
∴此组数据的标准差s =2 2.
11.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a =________;甲、乙两组学生的成绩相对稳定的是________.
考点 平均数与方差的综合应用 题点 平均数和方差在决策中的意义 答案 5 甲组
解析 由题意可知75+88+89+98+90+a
5=
76+85+89+98+97
5=89,
解得a =5.
因为s 2甲=15×[(-14)2+(-1)2+0+92+62
]=3145,s 2乙=15×[(-13)2+(-4)2+0+92+82]=3305
, 所以s 2甲<s 2
乙,故成绩相对整齐的是甲组.
12.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为________. 考点 平均数与方差的综合应用 题点 求平均数与方差 答案 5
743
解析 ∵-1,0,4,x,7,14的中位数为5, ∴4+x 2
=5,∴x =6.
∴这组数据的平均数是-1+0+4+6+7+14
6=5,
这组数据的方差是16×(36+25+1+1+4+81)=74
3.
三、解答题
13.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.
(1)求直方图中x 的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)内的用户中应抽取多少户? 考点 用样本的数字特征估计总体的数字特征的综合应用 题点 众数、平均数、中位数的综合应用
解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得x =0.007 5,