高中数学必修3第二章 2.2.2

高中数学必修3第二章 2.2.2
高中数学必修3第二章 2.2.2

2.2.2用样本的数字特征估计总体的数字特征

学习目标

1.理解样本数据标准差的意义和作用,学会计算数据的标准差.

2.会用样本的基本数字特征来估计总体的基本数字特征.

知识点一 众数、中位数、平均数

思考 平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大. 梳理 众数、中位数、平均数定义 (1)众数:一组数据中出现次数最多的数.

(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.

(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1

n (x 1+x 2+…+x n )叫做这n 个数的平均数.

知识点二 方差、标准差 标准差、方差的概念及计算公式

(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s = 1

n [(x 1

-x )2+(x 2-x )2+…+(x n -x )2]. (2)标准差的平方s 2叫做方差.

s 2=1

n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均

数).

(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x . 知识拓展:平均数、方差公式的推广

(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的

平均数是m x +a .

(2)设数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则 a .s 2=1n [(x 21+x 22

+…+x 2n )-n x 2

]; b .数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; c .数据ax 1,ax 2,…,ax n 的方差为a 2s 2.

1.中位数是一组数据中间的数.( × )

2.众数是一组数据中出现次数最多的数.( √ )

3.一组数据的标准差越小,数据越稳定,且稳定在平均数附近.( √ )

类型一 众数、中位数、平均数的应用 命题角度1 众数、中位数、平均数的计算

例1某公司的各层人员及工资数构成如下:

人员:经理1人,周工资22 000元;高层管理人员6人,周工资均为1 800元;高级技工5人,周工资均为1 500元;工人10人,周工资均为1 000元;学徒1人,周工资为500元.

(1)计算该公司员工周工资的众数、中位数、平均数;

(2)这个问题中,平均数能客观地反映这个公司的工资水平吗?

考点众数、平均数、中位数的综合

题点具体数据中的众数、平均数、中位数

解(1)众数为1 000,中位数为1 500,平均数为

22 000×1+1 800×6+1 500×5+1 000×10+500×1

≈2 209.

1+6+5+10+1

(2)虽然平均数为2 209,但由给出的数据可见,只有经理的周工资在平均数以上,其余的都在平均数以下,故用平均数不能客观地反映该公司的工资水平.

反思与感悟(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.

(2)众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中部分数据多次重复出现时,众数往往更能反映问题.

(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能在所给的数据中,也可能不在所给的数据中.

(4)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动.

(5)因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.

跟踪训练1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:

成绩(单位:m)

1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数

2

3

2

3

4

1

1

1

分别求这些运动员成绩的众数、中位数与平均数. 考点 众数、平均数、中位数的综合 题点 具体数据中的众数、平均数、中位数

解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是x =1

17(1.50×2+1.60×3+…+

1.90×1)=28.75

17

≈1.69(m).

答 17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m. 命题角度2 用频率分布直方图估算众数、中位数、平均数 例2 已知一组数据:

125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128 (1)填写下面的频率分布表:

分组 频数 频率 [121,123) [123,125) [125,127) [127,129) [129,131] 合计

(2)作出频率分布直方图;

(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数. 考点 众数、平均数、中位数的综合

题点 频率分布直方图中的众数、平均数、中位数 解 (1)频率分布表如下:

分组 频数 频率 [121,123)

2

0.10

[123,125)30.15

[125,127)80.40

[127,129)40.20

[129,131]30.15

合计20 1.00

(2)频率分布直方图如下:

(3)在[125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实

=126.25,事实上中位数为125.5.上,众数的精确值为125.图中虚线对应的数据是125+2×5

8

使用“组中值”求平均数:x=122×0.1+124×0.15+126×0.4+128×0.2+130×0.15=126.3,

平均数的精确值为x=125.75.

反思与感悟(1)利用频率分布直方图估计数字特征

①众数是最高的矩形的底边中点的横坐标;

②中位数左右两侧直方图的面积相等;

③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.

(2)利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.

跟踪训练2一批乒乓球,随机抽取100个进行检查,球的直径频率分布直方图如图.试估计这个样本的众数、中位数和平均数.

考点 众数、平均数、中位数的综合

题点 频率分布直方图中的众数、平均数、中位数 解 众数=39.99+40.01

2=40;

中位数为39.99+0.2

25

=39.998;

四个矩形的面积分别是0.02×5=0.1, 0.02×10=0.2, 0.02×25=0.5, 0.02×10=0.2. 平均数为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996. 类型二 标准差、方差的应用

例3 计算数据89,93,88,91,94,90,88,87的方差和标准差(标准差结果精确到0.1). 考点 方差与标准差 题点 求方差与标准差

解 ①x =90+18[(-1)+3+(-2)+1+4+0+(-2)+(-3)]=90+1

8×0=90;

②计算x i -x (i =1,2,…,8),得各数据为-1,3,-2,1,4,0,-2,-3; ③计算(x i -x )2(i =1,2,…,8),得各数据为1,9,4,1,16,0,4,9; ④计算方差:s 2=18(1+9+4+1+16+0+4+9)=44

8=5.5;

⑤计算标准差:s = 5.5≈2.3.

所以这组数据的方差为5.5,标准差约为2.3.

反思与感悟 (1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.

(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.

(3)若样本数据都相等,则s=0.

(4)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度是由标准差来衡量的.

跟踪训练3某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):

甲:10210199981039899

乙:110115908575115110

试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定.

考点方差与标准差

题点求方差与标准差

解x甲=1

7(102+101+99+98+103+98+99)=100;

x乙=1

7(110+115+90+85+75+115+110)=100;

s2甲=1

7[[(102-100)2

+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99

-100)2]

=1

7(4+1+1+4+9+4+1)≈3.43;

s2乙=1

7[(110-100)2

+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110

-100)2]

=1

7(100+225+100+225+625+225+100)≈228.57. 所以s2甲<s2乙,故甲车间产品较稳定.

1.某市2017年各月的平均气温(℃)数据的茎叶图如图:

则这组数据的中位数是()

A.19

B.20

C.21.5

D.23

考点中位数

题点求茎叶图中的中位数

答案 B

解析由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.

2.设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若y i=x i+a(a为非零常数,i =1,2,…,10),则y1,y2,…,y10的平均数和方差分别为()

A.1+a,4

B.1+a,4+a

C.1,4

D.1,4+a

考点平均数

题点由两组数的关系求平均数和方差

答案 A

解析∵x1,x2,…,x10的平均数x=1,方差s21=4,且y i=x i+a(i=1,2,…,10),∴y1,y2,…,y10的平均数

y=1

10·(y1+y2+…+y10)=

1

10·(x1+x2+…+x10+10a)=

1

10·(x1+x2+…+x10)+a=x+a=

1+a,

其方差s22=1

10·[(y1-y)

2+(y2-y)2+…+(y10-y)2]=110[(x1-1)2+(x2-1)2+…+(x10-1)2]=s21=4.

故选A.

3.某校从高一年级参加期末考试的学生中抽出60名,其成绩(均为整数)的频率分布直方图如图所示,由此估计此次考试成绩的中位数、众数分别是()

A.73.3,75

B.73.3,80

C.70,70

D.70,75

考点中位数

题点求频率分布直方图中的中位数

答案 A

解析由图可知小于70的有24人,大于80的有18人,则在[70,80)之间的有18人,所以

中位数落在[70,80)这组内,且为70+10

3≈73.3;众数就是频率分布直方图中最高的矩形底

边中点的横坐标,即70+80

2

=75.

4.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________. 考点 方差与标准差 题点 求标准差 答案 16

解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8, 可知数据2x 1-1,2x 2-1,…,2x 10-1的标准差为2s =16. 5.某校医务室抽查了高一10位同学的体重(单位:kg)如下: 74,71,72,68,76,73,67,70,65,74.

(1)求这10个学生体重数据的平均数、中位数、方差、标准差; (2)估计高一所有学生体重数据的平均数、中位数、方差、标准差. 考点 平均数与方差的综合应用 题点 利用定义求平均数与方差

解 (1)这10个学生体重数据的平均数为x =1

10

×(74+71+72+68+76+73+67+70+65+74)=71.

这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,

∴这10个学生体重数据的中位数为71+72

2=71.5.

这10个学生体重数据的方差为 s 2=

1

10

×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11, 这10个学生体重数据的标准差为s =s 2=11.

(2)由样本估计总体得高一所有学生体重数据的平均数为71,中位数为71.5,方差为11,标准差为11.

1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.

2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.

3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.

一、选择题

1.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数,众数,中位数分别为()

A.85分,85分,85分

B.87分,85分,86分

C.87分,85分,85分

D.87分,85分,90分

考点 众数、平均数、中位数的综合

题点 具体数据中的众数、平均数、中位数 答案 C

解析 平均数为100+95+90×2+85×4+80+75

10

=87,众数为85,中位数为85,故选C.

2.某台机床加工的五批同数量的产品中次品数的频率分布如表:

次品数 0 1 2 3 4 频率

0.5

0.2

0.05

0.2

0.05

则次品数的平均数为( ) A.1.1 B.3 C.1.5 D.2 考点 平均数

题点 由表或图估计平均数 答案 A

解析 设数据x i 出现的频率为p i (i =1,2,…,n ),则x 1,x 2,…,x n 的平均数为x 1p 1+x 2p 2+…+x n p n =0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1,故选A.

3.样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为( ) A.

65

B.65

C.2

D. 2 考点 方差与标准差 题点 求方差与标准差 答案 D

解析 ∵样本a,0,1,2,3的平均数为1, ∴a +65

=1,解得a =-1.

则样本的方差s 2=1

5×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为 2.

故选D.

4.某省农科所经过5年对甲、乙两棉种的实验研究,将连续5年棉花产量(千克/亩)的统计数据用茎叶图表示,如图所示,则平均产量较高与产量较稳定的分别是( )

A.甲棉种;甲棉种

B.乙棉种;甲棉种

C.甲棉种;乙棉种

D.乙棉种;乙棉种

考点用样本数字特征估计总体数字特征

题点平均数与方差的综合应用

答案 C

解析根据茎叶图的数据知,甲棉种产量为68,69,70,71,72;乙棉种产量为68,68,69,69,71.

∴甲棉种的平均值x甲=1

5×(68+69+70+71+72)=70;

乙棉种的平均值x乙=1

5×(68+68+69+69+71)=69.

甲的方差s2甲=1

5×[(68-70)

2+(69-70)2+(70-70)2+(71-70)2+(72-70)2]=2,

乙的方差s2乙=1

5×[(68-69)

2+(68-69)2+(69-69)2+(69-69)2+(71-69)2]=1.2.

∴甲棉种平均产量较高,乙棉种产量较稳定.故选C.

5.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值为()

A.62,62.5

B.65,62

C.65,62.5

D.62.5,62.5

考点 众数、中位数的综合应用 题点 频率分布直方图中的众数、中位数 答案 C

解析 ∵最高的矩形为第三个矩形, ∴时速的众数的估计值为65.

前两个矩形的面积为(0.01+0.03)×10=0.4. ∵0.5-0.4=0.1,0.1

0.4

×10=2.5,

∴中位数的估计值为60+2.5=62.5.故选C.

6.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( ) A.a >b >c B.b >c >a C.c >a >b

D.c >b >a 考点 众数、平均数、中位数的综合 题点 具体数据中的众数、平均数、中位数 答案 D

解析 由已知得a =1

10×(15+17+14+10+15+17+17+16+14+12)=14.7,

b =1

2

×(15+15)=15,c =17,∴c >b >a .故选D. 7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x ,y,105,109,110.已知

该同学五次数学成绩数据的平均数为108,方差为35.2,则|x -y |的值为( ) A.15 B.16 C.17 D.18 考点 平均数与方差的综合应用 题点 平均数与方差中的方程问题 答案 D

解析 由题意得,x +y +105+109+110

5=108,

① (x -108)2+(y -108)2+9+1+4

5

=35.2,

由①②解得????? x =99,y =117,或?????

x =117,

y =99,

所以|x -y |=18.故选D.

8.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( ) A.57.2,3.6 B.57.2,56.4 C.62.8,63.6

D.62.8,3.6

考点 平均数与方差的综合应用 题点 平均数与方差中的方程问题 答案 D

解析 每一个数据都加上60,所得新数据的平均数增加60,而方差保持不变.

9.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示.若甲、乙两人的平均成绩分别是x 甲,x 乙,则下列结论正确的是( )

A.x 甲<x 乙;乙比甲成绩稳定

B.x 甲>x 乙;甲比乙成绩稳定

C.x 甲>x 乙;乙比甲成绩稳定

D.x 甲<x 乙;甲比乙成绩稳定 考点 平均数与方差的综合应用 题点 平均数和方差在决策中的意义 答案 A

解析 甲同学的成绩为78,77,72,86,92,乙同学的成绩为78,82,88,91,95, 所以x 甲=

1

5

×(78+77+72+86+92)=81, x

乙=

1

5

×(78+82+88+91+95)=86.8. 所以x 甲<

x 乙,从叶在茎上的分布情况来看,乙同学的成绩更集中于平均值附近,这说

明乙比甲成绩稳定. 二、填空题

10.一组数据2,x,4,6,10的平均数是5,则此组数据的标准差是________. 考点 方差与标准差 题点 求方差与标准差 答案 2 2

解析 ∵一组数据2,x,4,6,10的平均数是5, ∴2+x +4+6+10=5×5,解得x =3,

∴此组数据的方差s 2=1

5×[(2-5)2+(3-5)2+(4-5)2+(6-5)2+(10-5)2]=8,

∴此组数据的标准差s =2 2.

11.如图所示的茎叶图是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a =________;甲、乙两组学生的成绩相对稳定的是________.

考点 平均数与方差的综合应用 题点 平均数和方差在决策中的意义 答案 5 甲组

解析 由题意可知75+88+89+98+90+a

5=

76+85+89+98+97

5=89,

解得a =5.

因为s 2甲=15×[(-14)2+(-1)2+0+92+62

]=3145,s 2乙=15×[(-13)2+(-4)2+0+92+82]=3305

, 所以s 2甲<s 2

乙,故成绩相对整齐的是甲组.

12.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数为________,方差为________. 考点 平均数与方差的综合应用 题点 求平均数与方差 答案 5

743

解析 ∵-1,0,4,x,7,14的中位数为5, ∴4+x 2

=5,∴x =6.

∴这组数据的平均数是-1+0+4+6+7+14

6=5,

这组数据的方差是16×(36+25+1+1+4+81)=74

3.

三、解答题

13.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图所示.

(1)求直方图中x 的值;

(2)求月平均用电量的众数和中位数;

(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)内的用户中应抽取多少户? 考点 用样本的数字特征估计总体的数字特征的综合应用 题点 众数、平均数、中位数的综合应用

解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得x =0.007 5,

相关主题
相关文档
最新文档