第五章统计量及其分布

第五章统计量及其分布
第五章统计量及其分布

第五章统计量及其分布

一、教材说明

本章内容包括:总体与样本,样本数据的整理与显示,统计量及其分布,三大抽样分布.本章的基本概念和重要结论是学习数理统计的基础.

1、教学目的与教学要求

1)掌握数理统计的总体、样本、样本经验分布函数、统计量及常用统计量等基本概念.

2)掌握三大分布的定义,并能熟练应用来求随机变量的分布.

3)牢记Fisher定理的内容及其三大推论.

4)使学生了解数理统计研究问题的方法与概率论研究问题方法的不同.

5)了解如何对样本数据进行整理与现实.

2、本章重点与难点

本章重点是数理统计的基本概念、三大分布的定义、Fisher定理及其推论.难点是Fisher 定理结合三大分布来求随机变量的分布.

二、教学内容

本章共分总体与样本、样本数据的整理与显示、统计量及其分布、三大抽样分布等4节来讲述本章的基本内容.

§5.1总体与样本

教学目的:要求学生理解数理统计的两个基本概念:总体和样本,以及与这两个基本概念相关的统计基本思想和样本分布.

教学重点:掌握数理统计的基本概念和基本思想.

教学难点:掌握数理统计的基本概念和基本思想.

5.1.1总体与样本

在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体.对于实际问题,总体中的个体是一些实在的人或物.比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体.事实上,每一个学生有许多特征:性别、年龄、身高、体重等等,而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不考虑.这样,每个学生(个体)所具有的数量指标——身高就是个体,而所有身高全体看成总体.这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:

总体就是一个分布,而其数量指标就是服从这个分布的随机变量.

例5.1.1 考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p表示不合格品率,则各总体可用一个二点分布表示:

不同的p反映了总体间的差异.

在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机

向量及其联合分布来描述总体.这种总体称为多维总体.

若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体.实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象.

5.1.2 样本与简单随机样本

样本

为了了解总体的分布,从总体中随机地抽取n 个体,记其指标值为 n x x x ,,,21 , 则n x x x ,,,21 称为总体的一个样本,n 称为样本容量或简称为样本量,样本中的个体称为样品.

首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母 n X X X ,,,21 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母

n x x x ,,,21 表示.简单起见,无论是样本还是其观测值,均用n x x x ,,,21 表示.

每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本.从而知道分组样本与完全样本相比在信息上总有损失,但在实际中,若样本量特别大,用分组样本既简明扼要,又能帮助人们更好地认识总体.

例5.1.4 略. 简单随机样本

从总体中抽取样本可有不同的抽法,为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体.这就需要对抽样方法提出一些要求,最常用的有如下两个要求:

1)样本具有随机性:要求每一个个体都有同等机会被选入样本,这便意味着每一样品

i x 与总体X 有相同的分布.

2)样本要求有独立性:要求每一样品的取值不影响其它样品的取值,这便意味着

n x x x ,,,21 相互独立.

若样本n x x x ,,,21 是n 个相互独立的具有同一分布的随机变量,则称该样本为简单随机样本,简称为样本.

注(1)若总体X 的分布函数为)(x F ,则其样本的联合分布函数为)(1i n

i x F =∏

(2)若总体X 的密度函数为p (x ),则其样本的联合密度为)(1

i n

i x p =∏

(3)若总体X 的分布列为 )(i x p ,则其样本的联合分布列为)(1

i n

i x p =∏

(4)对有限总体不放回抽样,若总体中有几个个体,抽取样本容量为n ,当N n << (

1.0≤N

n

)时,不放回抽样得到的样本可认为是简单随机样本. 例5.1.5 设有一批产品共N 个,需进行抽样检验以了解其不合格品率p ,现从中抽出n

个逐一检查它们是否是不合格品,记合格品为0,不合格品为 1.则总体为一个二点分布:

p X P p X P -1)0(,1(====).设 1,...,n x x 为该总体的一个样本,采用不放回抽样得到.

这时,第二次抽到不合格品的概率依赖于第一次抽到的是否是不合格品:

11

)11(12--=

==N Np x x P 1

)01(12-===N Np

x x P

但当N 很大时,上述两个概率近似都等于p ,所以当N 很大,而n 不大时,不放回抽样得到的样本可近似看成简单随机样本.

§5.2样本数据的整理与显示

教学目的:要求学生熟练掌握样本数据整理与显示的常用方法.

教学重点:熟练掌握求经验分布函数的方法,会用直方图和茎叶图的方法求频率分布. 教学难点: 样本数据整理与显示的常用方法的灵活应用.

教学内容:本节内容包括经验分布函数,频数频率分布表,直方图和茎叶图. 5.2.1 经验分布函数

定义 设n x x x ,,,21 是取自总体分布函数为)(x F 的样本,若将样本观测值从小到大进行排列为)()2()1(,,,n x x x ,则)()2()1(n x x x ≤≤为有序样本,如下函数

(1)

()(1)()

0,(),,1,2,

,11,n k k n x x k

F x x x x k n n x x +?当当当

称为经验分布函数.

显然,)(x F n 是单调非降右连续的跳跃函数(阶梯函数),在点*

k x x =处有间断,在每

个间断点的跃度为),,3,2,1,1

n k n

=(

,且1)(0≤≤x F n ,0)(lim =-∞

→x F n x ,1)(lim =+∞

→x F n x ,它满足分布函数的三个性质,所以必是一个分布函数.

例5.2.1某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重为:351 347 355 344 351,求此样本的经验分布函数.

略.

例 某厂从一批荧光灯中抽出10个,测其寿命的数据(单位千时)如下:

95.5, 18.1, 13.1, 26.5, 31.7, 33.8, 8.7, 15.0, 48.8, 48.3

求该批荧光灯寿命的经验分布函数)(x F n (观察值).

解:将数据由小到大排列得:

8.7,13.1,15.0,18.1,26.5,31.7,33.8,48.8,49.3,95.5, 则经验分布函数为:

?

?????

???

???

??

???=1

9.08.07

.06.05

.04.03

.02

.01.00

)(x F n 5.955.953.493.498.488.488.338.337.317.315.265

.261.181.180.150.151.131.137.87.8≥<≤<≤<≤<≤<≤<≤<≤<≤<≤

01 对每一个固定的x ,)(x F n 是事件“X x ≤”发生的频率,当n 固定时,)(x F n 是

样本的函数,是一个随机变量,且)()(x F x F P

n ?→?.

02定理5.2.1(格里纹科定理):设n x x x ,,,21 是取自总体分布函数为)(x F 的样本,

)(x F n 是经验分布函数,有

1)0)()(sup lim (==-+∞

<<∞-∞→x F x F P n x n .

注 此定理表明,当n 相当大时,经验分布函数是总体分布函数的一个良好的近似.

5.2.2 频数频率分布表

样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其频数分布表或

频率分布表,其基本步骤是:

1、对样本进行分组:首先确定组数k ,作为一般性原则,组数通常在5-20个.对容量较小的样本,通常将其分为5组或6组,容量为100左右的样本可分7到10组,容量在200左右的样本可分9~13组,容量为300左右级以上的样本可分12到20组.

2、确定每组组距:每组组距可以相同也可以不同.但实际中常选用长度相同的区间,以d 表示组距.

3、确定每组组限.

4、统计样本数据落入每个区间的个数——频数,并列出其频数频率分布表. 具体例子略.

5.2.3 样本数据的图形显示:

常用的样本数据的图形显示主要有直方图和茎叶图,具体例子略.

设),,,(21n X X X 为来自总体X 的一个样本,其样本观察值为),,,(21n x x x ,将该组数值n x x x ,,,21 分成l 组,可作分点:l a a a a ,,,,210 (各组距可以不相等),则各组为:

(0a ,1a ],(1a ,2a ],……,(1-l a ,l a ],若样本观察值中每个数值落在各组中的频数分别为1m ,2m ,3m ,…,l m ,则频率分别为:

n m 1,n

m

2……n m l ;以各组为底边,以相应组的频率除以组距为高,建立l 个小矩形,即得总体X 的直方图.

由上分析可知:直方图中每一矩形的面积等于相应组的频率

设总体X 的密度函数为)(x f ,则:总体X (真实值)落在第k 组(1-k a ,k a ]的概率为:

?-k

k a a dx x f 1

)(.

由伯努利大数定理可知:当n 很大时,样本观察值(单个)落在该区间的频率趋近于此概率;即:(1-k a ,k a ]上矩形的面积接近于)(x f 在此区间上曲边梯形的面积,当n 无限增大时,分组组距越来越小,直方图就越接近总体X 的密度函数)(x f 的图象.(这与定积分的意义具有同样的道理).

§5.3统计量及其分布

教学目的:理解数理统计的基本概念:统计量,熟练掌握样本均值、样本方差、样本原点

矩、样本中心矩等常用统计量的计算公式,掌握次序统计量及其抽样分布.

教学重点:样本均值、样本方差、样本原点矩、样本中心矩等常用统计量的求法;次序统

计量的抽样分布.

教学难点:次序统计量的抽样分布.

教学内容:本节内容包括统计量与抽样分布,样本均值及其抽样分布,样本方差与标准差,

样本矩及其函数,次序统计量及其分布,样本分位数与中位数

5.3.1 统计量与抽样分布

样本来自总体,含有总体各方面的信息,但这些信息较为分散,有时不能直接利用.为将这些分散的信息集中起来以反映总体的各种特征,需要对样本进行加工,最常用的加工方法是构造样本的函数,为此:

定义5.3.1 设n x x x ,,,21 为取自某总体的样本,若样本函数),,(1n x x T T =中不含有任何未知参数,则称T 为统计量,统计量的分布为抽样分布.

按上述定义:设n x x x ,,,21 为样本,则21

1,i n

i i n i x x ==∑∑都是统计量,当2

,σμ未知时,

σ

μ1

1,

x x -等都不是统计量.

注 统计量不依赖于未知参数,但其分布一般是依赖于未知参数的.

5.3.2 样本均值及其抽样分布

样本均值、样本方差、样本k 阶矩及k 阶中心矩 定义5.3.2 设n x x x ,,,21 是来自某总体的样本.称

∑==n

i i x n x 11 为样本均值

∑=-=n

i i x x n S

1

2*)(12

为样本方差 2

**

S

S = 为样本标准差

∑=--=n

i i x x n S 1

22

)(11 为样本(无偏)方差 2S S = 为样本(无偏)标准差

∑==n i k

i k x n a 11 为样本k 阶(原点)矩

∑=-=n

i k i k x x n b 1

)(1为样本k 阶中心矩

注(1)∑=--=n i i x x n S 122

)(11=][111

22

∑=--n

i i

x n x n (2)在分组样本场合下:若i x 为第i 组的组中值,i f 为该i 组的个数,k 为组数,则

∑==++=k

i i k k f n n f x f x x 1

11,其中 .

∑=--=k i i i x x f n S 122

)(11=][11122

∑=--k i i

i x n x f n . 例 从某班级的英语期末考试成绩中,随机抽取10名同学的成绩分别为:100,85,70,65,90,95,63,50,77,86

(1)试写出总体,样本,样本值,样本容量;(2)求样本均值,样本方差及二阶原点矩.

解:(1)总体:该班级所有同学的英语期末考试成绩X ;

样本:(1X ,2X ,3X ,…,10X )

样本值:)x ,,x ,x (n 21=(100,85,70,65,90,95,63,50,77,86) 样本容量:n =10

(2)10111

1010

i

i x x ===∑(100+85+……+86)=78.1 2

2222111()[21.9 6.97.9]252.519

n i

i s x x n ==-=+++=-∑

10222222211111

(100857086)6326.91010

n i i i i a x x n =====+++

+=∑∑

次序统计量

定义 5.3.7设n x x x ,,,21 是取自总体X 的样本,将其从小到大排序得到

(1)(2)()n x x x ≤≤≤.定义)(i X :不论n x x x ,,,21 取怎样的一组观测值,)(i X 总取()i x 为

其观测值,称)(i X 为第i 个次序统计量,从而有)()2()1(n X X X ≤≤.

{}i n

i X X ≤≤=11min ,{}i n

i n X X ≤≤=1)(max 分别称为样本的最小、最大次序统计量.

注 样本n x x x ,,,21 独立同总体分布,但)()2()1(,,,n X X X 既不独立又不同分布. 三、统计量X 与2

S 的性质 定理5.3.1 0)(1

=-∑=n

i i

x x

.

证明 略.

定理 5.3.2数据观察值与均值的偏差平方和最小,即在形如

∑=-n

i i

c x

1

2)(的函数中,

∑=-n

i i

x x

1

2)(最小,其中c 为任意给定常数.

证明 略.

定理5.3.3 设n x x x ,,,21 是来自某个总体X 的样本,x 为样本均值.

1) 若总体分布为),(2

σμN ,则x 的精确分布为)1,(2

σμn

N .

2) 若总体分布未知或不是正态分布,但2

)(,)(σμ==X Var X E ,则n 较大时的渐近分

布为)1,(2σμn N ,记为x .~)1,(2

σμn

N .

证明 略.

例5.3.3 略.

定理 5.3.4 设总体X 具有二阶矩,即2

)(,)(σμ==X Var X E <∞+, n x x x ,,,21 为

从该总体中得到的样本,x 和2

s 分别是样本均值与样本方差,则

22211

()(),()(),(s )()E x E X Var x Var X E Var X n n

μσσ======.

证明 略.

5.3.5 次序统计量及其分布

定义 5.3.7 设n x x x ,,,21 是来自总体为X 的一个样本,将其由小到大排序为

(1)(2)()n x x x ≤≤

≤,(若i x =j x 则其先、后次序可任意排)

,称i x 为该样本的第i 个次序统计量.

特别地,称(1)=1min()i i n

x x ≤≤ 为最小次序统计量,(n)=1max()i i n

x x ≤≤为最大次序统计量.

单个次序统计量的分布

定理5.3.5 设总体X 的密度函数为()p x ,分布函数为()F x ,n x x x ,,,21 为样本,则第k 个次序统计量()k x 的密度函数为-1-!

()=

(())(1-())()(k-1)!(n-k)!

k n k k n p x F x F x p x .

例5.3.7 利用定理5.3.5 ,先求出(2)x 的密度函数为(2)()p x ,再求概率(2)1(<)2

P x 多个次序统计量的联合分布

定理5.3.6 设总体X 的密度函数为()p x ,分布函数为()F x ,n x x x ,,,21 为样本,次序

(i

),

)

(<)x x i j (的联合

密度函数为

i

-

1

j -i

-1-!(

y

,

z )=((y ))((z )

-

F

(

i -

1)

!

(j

-i -1)!(n -j

)

!

n j ij n p F F F z p ≤. 例5.3.9 略

§5.4三大抽样分布

教学目的:掌握2χ分布,-F 分布,-t 分布的定义,分位数的定义及性质,会查分位数表 教学重点:三大分布的定义,性质 及应用 教学难点:三大分布的性质

教学内容:本节内容包括2χ分布,-F 分布,-t 分布及一些重要结论.

5.4.1 2χ分布(卡方分布)

定义5.4.1设n X X X ,,,21 独立同标准正态分布)1,0(N ,则∑==n

i i

X

1

22

χ的分布称为

自由度为n 的2χ分布,记为)(~

22n χχ.

)(2

n χ的密度函数为:1122

2

1()2()

2

n x n p x x

e

n --=

Γ,x >0.

性质

1 可加性 若)(~),(~22m Y n X χχ且X 与Y 独立,则.)(~2n m Y X ++χ.

类似的,若k X X X ,,,21 相互独立,分别服从,,,2,1),(2k i n i =χ 可以证明:

)(~1

2

1

∑∑==k

i i k

i i

n x X

2 若)(~2n X χ, 则 n X E =)(,()2Var X n =

证明:设n X X X ,,,21 为独立同分布于)1,0(N 的随机变量,则X 与

∑=n

j j

X

1

2

同分布,且

∑∑∑=======n

i n

i i i

n

i i

n X D X E X E X E 1

1

21

2)()()()(

又由i X 独立并注意到)1,0(N 的四阶矩为3,可得

∑∑∑====-=-==n

i n i n i i

i

i

n X E X E X Var X Var 1

1

1

2

2422)13(]))(()([)()(

32χ分布的分位数

定义 若)(~22

n χχ,对给定的α,10<<α,

称满足

αχχα-=≤-1))((212n P

的)(2

1n αχ-是自由度为n 的

2χ分布的α-1分位数.

2χ分布的上α分位数已制成表格.如10,01.0==n α,则查表可得209.23)(2

01.0=n χ,又如6,005.0==n α,则548.18)6(2

005.0=χ

α图6-2 分布的上 分位点

-2

χα

1 要会查2χ分位数.

2 -t 分布、-F 分布仍有相应的分位数定义.

5.4.2 -F 分布

定义5.4.2 设2212~(),~()X m X n χχ,且X 与Y 独立,则称12//X m

F X n

=

的分布为自由度为(,)m n 的F 分布,记为~(,)F F m n ,,m n 分别为分子、分母的自由度.

(,)F m n 的密度函数可由商的分布来推导,此处略. F 分布的上α分位点,我们称满足

{}ααα==>?+∞

)

,()(),(m n F

dy y f m n F F P

的点),(m n F α为),(m n F 分布的上α分位点.

性质 (1)

若),(~1

),,(~m n F F

n m F F 则

. (2)

)

,(1

),(1m n F n m F αα=

-.

事实上,设~(,)F F m n ,则 ),,(~1

m n F F

{},

),(1

11),(111),(1

1),(?

?????≥-=??????≥-=??

????≤=≥=m n F F P m n F F P m n F F P m n F F P ααααα

于是

αα-=?

?????≥1),(1

1m n F F P , 由α分位点的定义,显然

α图6-7 F 分布的上 分布点

α

)

,(1

),(1m n F n m F αα=

-

成立.

例5.4.1 利用公式)

,(1

),(1m n F n m F αα=

-查表即可.

5.4.3 t —分布

定义5.4.3 设212~(0,1),~()X N X n χ,且1X 与2X 相互独立,则称随机变量

T =

服从自由度为n 的t 分布,记为)(~n t T .

t 分布的密度可由商的分布公式来推导,此处略,但必须注意:

注 (1)、);(n x t 关于0=x 对称; (2)、);(n x t 在0=x 达最大值; (3)、);(n x t 以x 轴为水平渐近线; (4)、2

2

21),(lim x x e

n x t -

→=

π

;即∞→n 时,t 分布)1,0(N →,一般地,当n >30时,

t 分布与)1,0(N 非常接近.

(5)若)(~n t T ,则1>n 时,()0;2,()2

n

E T n Var T n =>=-时 性质

(1) 若),1(~),(~2

n F t n t t 则; (2)1()().t n t n αα-=- 补例 求下列上分位数:

(1) 分位数的为其中。αα)1,0(,90N u u ; (2) )4(25.0t ; (3) )10,14(1.0F ; (4)

)50(2

025.0χ.

解:(1) 从)(x Φ表中,查不到9000.0=α,取表中接近的数应在0.8997与0.9015

之间,从附表查出相应的αu 为1.28与1.29,故取285.19.0≈u .

(2) t 分布表没有25.0=α.但利用对称性,可查出7407.0)4(75.0=t ,故

7407.0)4(25.0-=t .

(3) 从F 分布表中,查不到)10,14(1.0F ,可查出10.2)10,14(9.0=F ,故

.476.010

.21

)10,14(1.0≈=

F (4) 表上查不到)50(2

025.0χ,需利用式(5.7)

.查出96.1025.0-=u , (1) 29.31)150296.1(2

1

)50(22

025.0≈-?+-≈

χ

5.4.4一些重要结论

Fisher 定理及其推论

定理 5.4.1 设n x x x ,,,21 是来自正态总体),(2σμN 的样本,2

s x 和分别是样本均值与样本方差,则

(1)2

s x 与独立.

(2))1,(~2

σμn

N x ;

(3)

∑=--=-n

i i n x x

x s n 1

222

2

)1(~)(

)1(σ

σ;

证明 略.

注(1) 在证明Th5.4.1的过程中有一重要结论即:独立同)1,0(N 分布的随机变量经过正交变换后得到的仍是独立同)1,0(N 分布的随机变量.

(2) 证明思路:,,,,,,,,,,212121n n n z z z y y y x x x ??→???→?正交化

标准化而后研究经过两步变换得到的随机变量之间的关系. 三个推论

推论5.4.1 设n x x x ,,,21 是来自正态总体),(2

σμN 的样本,2,s x 为样本均值、样本方差,则)1(~)

(--=

n t s

x n t μ. 分析 按t —分布定义来证. 证明 略.

推论 5.4.2设m x x x ,,,21 是来自),(211σμN 的样本, n y y y ,,,21 是来自),(2

22σμN

的样本,且两样本相互独立,记

21

211221)(11,1,)(11,1∑∑∑∑====--==--==n i i y n i i m i i x m i i y y n s y n y x x m s x m x , 则有)1,1(~22

22

12

--=

n m F s s F y x

σσ.特别当22

21

σσ=时,).1,1(~22--=n m F s s F y

x

分析 据F —分布的定义结合Th5.4.1. 证明 略.

推论5.4.3 在推论5.4.2的记号下,设22

221σσσ==,则有

)2(~112

)1()1()(22

21-++-+-+----n m t n

m n m s

n s m y x y

x

μμ.

证明 略.

补例 从正态总体),(2σμN 中抽取容量为16的样本,试求: (1) 已知252

;(2) 2σ未知,但已知样本方差8.202=S 的情况下,样本均值x 与

总体均值 μ 之差的绝对值小于2的概率.

解 (1) 由于统计量

),1,0(~N n

x σ

μ

μ-=

因此在2

σ已知时,

{}

{};

8904.019452.021)6.1(2)6.1()6.1(6.15424522=-?=-=--=<=??

??

???????????<-=???

???????????<-=<-φφφμμμu P x P n n x P x P

(2) 由于2

σ未知,但8.202

=S ,这时统计量

),1(~--=

n t n

S x t μ

因此

{}

{}{}754.11754

.11656.4222≥-=<=??

?

?

?

?????<-=??????????<-=<-t P t P n S x P n S n S x P x P μμμ查t 分布表得t 0.05(16-1)=1.753,P (t ≥1.753)=0.05.由此可得

{}

90.005.0212=?-≈<-μx P

补例4 设总体X 服从正态分布)100,72(N N (72,100),为使样本均值大于70的概率不小于90%,则样本容量应取多少?

解 设所需样本容量为n ,由于 )1,0(~N n x σ

μ

-,

{}

()()

9

.02.02.012.010721107270107270≥=--=?

?

????-<--=???

???->-=>n n n n X P n n X P X P ??

查标准正态分布得

29.12.0≥n ,

即6025.41≥n ,故样本容量至少为42,才能使样本均值不大于90%.

§5.5 充分统计量

教学目的:要求学生理解充分性的概念,掌握因子分解定理.

教学重点:掌握因子分解定理. 教学难点:因子分解定理的应用.

教学内容: 本节内容包括充分性的概念,因子分解定理. 5.5.1 充分性的概念

统计量是把样本中的信息进行加工处理的结果,它可以简化数据,便于统计推断,这样的新如果不损失原样本中的信息当然更好.不损失信息的统计量就是充分统计量.

例5.5.1 为研究某个运动员的打靶命中率θ,我们对该运动员进行测试,观测其10次,发现除第三,六次未命中外,其余8次都命中.这样的观测结果包含了两种信息: (1) 打靶10次命中8次

(2) 2次不命中分别出现在第3次和第6次.

第二种信息对了解该运动员的命中率没有什么帮助.

一般地,设对该运动员进行n 次观测,得到n x x x ,,,21 ,每个j x 非0即1,命中为1,不命中为0,令12=++

+n T x x x ,T 为观测到的命中次数,这样仅仅记录使用T 不会丢

失任何与命中率θ有关的信息,统计上将这种“样本加工不损失信息”称为“充分性”. 设样本12=(,,

,)n X x x x 有一个样本分布()F X θ,

统计量12T=T(,,,)n x x x 也有一个抽

样分布(t)T F θ,当我们期望用统计量T 代替原始样本X 并且不损失任何有关的信息是,也就是期望抽样分布(t)T F θ像()F X θ一样概括了有关的一切信息.换言之,我们在考察统计量T 的取值为t 的情况下样本X 的条件分布(|=)F X T t θ,可能会有两种情况: (1)(|=)F X T t θ依赖于参数θ,此条件分布仍含有θ的信息. (2)(|=)F X T t θ不依赖于参数θ,此条件分布不含有θ的信息.

情况(2)表明条件=T t 的出现使得从样本分布()F X θ到条件分布(|=)F X T t θ,有关θ的信息消失了,这说明θ的信息都含在统计量T 之中.当已知统计量T 的取值后,也就知道

了有关θ的所有信息,这就是统计量具有充分性的含义. 例5.5.2

定义 5.5.1 设n x x x ,,,21 是来自某个总体的样本,总体分布函数为(x,)F θ,统计量

12T=T(,,

,)n x x x 称为θ的充分统计量,如果在给定T 的取值后,n x x x ,,,21 的条件分

布与θ无关. 例5.5.3

5.5.2 因子分解定理

下面的因子分解定理可以判断统计量是否充分.首先引入概率函数的概念:f(x)称为随机变量X 的概率函数,在连续型场合,f(x)表示X 的概率密度函数,在离散型场合,f(x)表示X 的概率分布列.

定理5.5.1 设总体概率函数为f(x,)θ,12,,

,n X X X 为样本,则12T=T(,,,)n X X X 为充

分统计量的充分必要条件是:存在两个函数g(t,)θ和12(,,,)n h x x x 使得对任意的θ和任一

祖观测值n x x x ,,,21 ,有121212f (,,,;)=g (T (,,,),)(,,,)n n n

xx x xx x

hxx x θθ,其中g(t,)

θ

是通过统计量T的取值而依赖于样本的.

例5.5.4

例5.5.5利用因子分解定理判断统计量的充分性.

常用统计量

统计学基本概念 13.3常用统计量 统计量 设想你参加了一次考试,在知道自己得到了78分后,希望了解自己的成绩在班级上处于什么水平。你会怎样做? 你对自己未来工作收入的预期是什么? 定义:设,,,12n X X X 为取自某总体的样本,若样本函数(),,,12n T T X X X = 中不含有任何未知参数,则称T 为统计量。统计量的分布称为抽样分布。********************************************************** 强国知十三数:境内仓口之数,壮男壮女之数,老弱之数,官士之数,以言说取食者之数,利民之数,马牛刍藁之数。欲强国,不知国十三数,地虽利,民虽众,国愈弱至削。国无怨民曰强国。兴兵而伐,则武爵武任,必胜;按兵而农,粟爵粟任,则国富。兵起而胜敌,按兵而国富者,王。 (秦·商鞅《商君书》) 商鞅(前390~前338年),卫国家,思想家,著名法 家代表人物。应秦孝公求贤令入秦,说服秦孝公变法图强。孝公死后,受到贵族诬害以及秦惠文王的猜忌,车裂而死。其在秦执政二十余年,秦国大治,史称“商鞅变法”。 **********************************************************

统计量是对样本的一种加工。常用的统计量有样本均值、样本方差等。 定义设,,,12n X X X 为取自某总体的样本,则12n X X X X n +++= =1 1n i i X n =∑称为样本均值。 定理设,,,12n X X X 是来自某个总体X 的样本,X 为样本均值, (1)若总体()2,~σμN X ,则~,2X N n σμ?? ?? ?;证明:,,,12n X X X 相互独立,()2~,1,2,k X N k n μσ= ()()()1212n n E X E X E X X X X n E n n n μμ++++++??=== ??? ()()()22121222n n Var X Var X Var X X X X n Var n n n n σσ++++++??=== ??? (2)若总体分布不是正态分布,已知()μ=X E ,()2σ=X D ,则n 较大时,X 的渐近分布为??? ? ??n N 2,σμ,常记为~,2X N n σμ?? ??? 。**********************************************************定义设,,,12n X X X 是来自某个总体X 的样本,X 为样本均值,则 ()22 111n i i S X X n ==--∑称为样本方差。定理设总体X 具有二阶中心矩,()μ=X E ,()2Var X σ=<+∞,,,,12n X X X 为来自该总体的样本,X 和2S 分别是样本均值和样本方差,则()22E S σ=。样本方差是总体方差的无偏估计,样本均值是总体期望的无偏估计。**********************************************************

@统计量与抽样分布习题

统计量与抽样分布习题 1.调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差σ=1.0盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。 2.第1题中,如果我们希望Y 与μ的偏差在0.3盎司之间的概率达到0.95,应当抽取多大的样本? 3.在第1题中,假定装瓶机对瓶子的灌装量服从方差2 σ=1的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差2S ()??? ??--=∑=n i i Y Y n S 12211,确定一个合适的范围使得有较大的概率保证2S 落入其中是有用的,试求1b 和2b ,使得() 90.0221=≤≤b S b P 。 4.621,,,Z Z Z Λ表示从标准正态总体中随机抽取的容量6=n 的一个样本,试确定常数b , 使得95.0612=?? ? ??≤∑=i i b Z P 选择题: 1. 设n X X X ,,,21Λ是从某总体X 中抽取的一个样本,下面哪一个不是统计量? ()∑∑==-==n i i n i i X X n S B X n X A 122 11.1. ()[] 21.∑=-n i i X E X C ()∑=--=n i i X X n S D 122 11. 2. 下面不是次序统计量的是? A .中位数 B .均值 C .四分位数 D .极差 3.抽样分布是指? A .一个样本各观测值的分布 B .总体中各观测值的分布 C .样本统计量的分布 D .样本数量的分布 4.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为? A .μ B .X C .2 σ D .n 2 σ 5.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为?

第39讲统计量和常用统计量

第39讲统计量与常用统计量

110,,X X 在上一讲例3中,为了估计指数分布的参数,进行抽样观测,得到样本和样本值6394,1105,4717,1399,7952,17424,3275,21639,2360,2896. 样本中包含了许多信息。 对于推断总体的参数或分布而言,有些是有用的,重要的信息,有些则并不重要。上例的样本至少提供了两种信息:1)10个灯泡的平均寿命; 2)灯泡寿命的序号(如6394是第1个).—有用且重要的信息—不重要信息

从样本中提取有用的信息来研究总体的分布及各种特征数.——构造统计量.12,12,,...,,,...,). (n n x x x g x x x 一旦有了样本观察值就可以算出统计量的具体值121212,,...,),,...,),,...,) (, (, (. n n n X X X g X X X g X X X 设为样本若不含任何未知参数则称为统计量统计量:样本的不含任何未知参数的函数。 1210(...)10X X X +++10.6916.1. 比如个灯泡的平均寿命是统计量平均寿命的观测值是小时

常用统计量: 2 21 2 2.,1()1 n i i S X X n S S ==--=∑样本方差样本标准差1 .,11 n i i X X n ==∑样本均值

常用统计量: 1 1 11(3.1,2,...)n k k i i n k k i i A X n B X k k k X n ====-=∑∑ 样本矩阶矩: 阶中心矩:2 2,,,11. Excel X S B 根据样本数据,用计算见实验

常用的统计量抽样分布总结

常用的统计量抽样分布 一.正态分布 1. ∑==n i i X n X 1 1EX → 2. 2 12)(11∑=--=n i i X X n S ][112 1 2∑=--=n i i X n X n DX → 3. 定理: X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~), (2 n N σμ, (2). 2 2 )1(σ S n -~)1(2-n χ, (3). X 与2S 相互独立。 二.2χ分布 1. 定义 设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122 n X n i i χχ∑== 2. 性质: (1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。 (2). 若X ~)(2n χ,则n EX =,2DX n =。 三.t 分布 1. 定义 设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则n Y X T =~)(n t 。 2. 定理: 设n X X X ,,,21 独立同分布,且~),(2σμN ,则

n S X μ -σ σ μS n X )(-=1 )1() (2 2 ---= n S n n X σσ μ~)1(-n t (因为 n X σ μ-~)1,0(N , 2 2 )1(σ S n -~)1(2-n χ)。 3. 定理: 设1,,,21n X X X 为总体X ~),(21σμN 的样本, 1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则 2 12111)()(n n S Y X w +---μμ~)2(21-+n n t ,其中 2 )1()1(212 2 22112 -+-+-=n n S n S n S w 。 证:因为 2 2 11)1(σ S n -~)1(12 -n χ, 2 2 2 2)1(σ S n -~)1(22-n χ, 所以 2 2 2 2211)1()1(σS n S n -+-~)2(212-+n n χ; 又X ~), (1 2 1n N σμ,Y ~), (2 2 2n N σμ, 所以X Y -~), (2 2 1 2 21n n N σσμμ+ +, 所以 2 12111) ()(n n Y X +---σ μμ~)1,0(N ,所以 2 12111)()(n n S Y X w +---μμ 2 12111) ()(n n Y X +---= σμμ/ )2/()1()1(212 2 2 2211-+-+-n n S n S n σ ~)2(21-+n n t 。

统计学第二章 统计量及其分布 习题及答案

第二章 统计量及其分布 习题 一、填空题 1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。 2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 (注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=) 3、若(5)X t ,则2X 服从_______分布。 4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。 , 二、选择题 1、中心极限定理可保证在大量观察下 A 样本平均数趋近于总体平均数的趋势 B 样本方差趋近于总体方差的趋势 C 样本平均数分布趋近于正态分布的趋势 D 样本比例趋近于总体比例的趋势 2、设随机变量()(1)X t n n > ,则21/Y X =服从21/Y X = 。 A 正态分布 B 卡方分布 C t 分布 D F 分布 3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。 A 68.27% B 90% C 95.45% D 99.73% 4、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A 、样本容量为10 B 、抽样误差为2 C 、样本平均每袋重量是统计量 D 、498是估计值 5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从 A (100/,25)N n B (100,N C (100,25/)N n D (100,N 三、判断题 1、所有可能样本平均数的方差等于总体方差。 ( ) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。( ) 3、设),0(~2σN X ,则对任何实数,a b 均有:22 ~(,)aX b N a b a σ++.( ) 4、样本方差就是样本的二阶中心距。 ( ) 5、设随机变量X 与Y 满足X ~ N(0,1), Y ~2()n χ, 则/X 服从自由度为n 的t 分

spss教程-常用的数据描述统计:频数分布表等--统计学

第二节常用的数据描述统计 本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1.数据 这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。 图2-2:数据输入格式示例 1.Frequencies语句 (1)操作 打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。 图2-3: Frequencies定义窗口 把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一

些统计量,及统计图表,还需要进一步设置。

①Statistics选项 单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下: (ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: ●Quartiles四分位数,即显示25%、50%、75%的百分位数。 ●把数据平均分为几份。如本例中要求平均分为3份。 ●Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有: ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和 (ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有:●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误 (ⅳ)描述数据分布(Distribution)的统计量 ●Skewness 偏度,非对称分布指数。 ●Kurtosis 峰度,CASE围绕中心点的扩展程度。 另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

常用的统计量抽样分布总结

常用的统计量抽样分布 一.正态分布 1. ∑==n i i X n X 1 1EX → 2. 2 12 )(11∑=--=n i i X X n S ][112 1 2∑=--=n i i X n X n DX → 3. 定理: X ~),(2σμN ,n X X X ,,,21Λ为X 的样本,则 (1). X ~), (2 n N σμ, (2). 2 2 )1(σS n -~)1(2-n χ, (3). X 与2S 相互独立。 二.2χ分布 1. 定义 设n X X X ,,,21Λ独立同分布,且~)1,0(N ,则)(~2122 n X n i i χχ∑== 2. 性质: (1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。 (2). 若X ~)(2n χ,则n EX =,2DX n =。 三.t 分布 1. 定义 设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则n Y X T =~)(n t 。 2. 定理: 设n X X X ,,,21Λ独立同分布,且~),(2σμN ,则

n S X μ -σ σ μS n X )(-=1 )1() (2 2 ---= n S n n X σσ μ~)1(-n t (因为 n X σ μ-~)1,0(N , 2 2 )1(σS n -~)1(2-n χ)。 3. 定理: 设1,,,21n X X X Λ为总体X ~),(21σμN 的样本, 1,,,21n Y Y Y Λ为总体Y ~),(22σμN 的样本,且Y X ,独立,则 2 12111)()(n n S Y X w +---μμ~)2(21-+n n t ,其中 2 )1()1(212 2 22112-+-+-=n n S n S n S w 。 证:因为 2 2 11)1(σS n -~)1(12 -n χ, 2 2 2 2)1(σS n -~)1(22-n χ, 所以 2 2 2 2211)1()1(σ S n S n -+-~)2(212-+n n χ; 又X ~), (1 2 1n N σμ,Y ~), (2 2 2n N σμ, 所以X Y -~), (2 2 1 2 21n n N σσμμ+ +, 所以 212111) ()(n n Y X + ---σμμ~)1,0(N ,所以 2 12111)()(n n S Y X w +---μμ 2 12111) ()(n n Y X +---= σ μμ/ )2/()1()1(212 2 2 2211-+-+-n n S n S n σ ~)2(21-+n n t 。

次序统计量及其分布

§5.3次序统计量及其分布 次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。gjzsj 设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。 定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。 显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。 如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。 定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为 g i (y)=?? ???≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i (5.24) 例5.3 设母体ξ有密度函数 ? ??<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)2 1()3(>ξP 。

常用的统计量抽样分布总结

常用的统计量抽样分布 3.定理: X ?N(~;「2 ) , X 1,X 2,…,X n 为X 的样本,则 2 (1). X ?NO,), n 2 (2). ?2 (n-1), a ⑶? X 与S 2 相互独立 二. 2 分布 1. 定义 n 设X 「X 2,…,X n 独立同分布,且?N(0,1),贝U 2 八 X i 2 ~ 2 (n) i=1 2?性质: (1). 若X ?2 (nJ , Y ?2 (门2),且X , Y 独立,则X +Y ?20 (2).若 X ?2 (n),则 EX =n ,DX =2n 。 三. t 分布 1.定义 设X ?N(0,1), Y ?2 (n),且X , Y 独立, 2. 定理: 设X 「X 2, X 独立同分布,且?N(「2 ),则 1. 2. X 』X 「EX n i 4 S 2 二一、(X i n -1 i 4 -X)2 1 n _ [' X -nX ] > DX n -1 i^ 压)。

t(“-1) (n -1)S 2 ◎2 z /“ —1 3. 定理: 设X i ,X 2, ,X n 为总体X ?N (」1,;「2 )的样本, 丫1, 丫2, ,丫为总体Y ?N (J,二2 )的样本,且X,Y 独立,则 2 2 S 2 _ (“1 …1)S ' (“2 1)S 2 S w = 所以(X —?N (0,1),所以 (“1 吊 2(“2—1)S 2 /(“1 “2-2) 计1 t (“「“2 - 2)。 (X - J “ S CJ (因为 a N(0,1), CT 2 (“ -1))。 (X -丫)-( 叫-切?"“1 ?2),其中 S w [丄+丄 n i “2 - 2 证:因为 2 (“1 -1)S 1 (n 1 -1), 2 (“2 -1)S 2 (n 2 - 1), 所以(01 -1)S 12 -(“2 -1)S 2 2 (Ri n 2 2); 2 N(7,), “1 Y ?N (」 所以X -Y ?N(S 」2,—, “2

常用的统计量抽样分布总结

常用的统计量抽样分布 总结 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

常用的统计量抽样分布 一.正态分布 1. ∑==n i i X n X 1 1EX → 2. 2 12 )(11∑=--=n i i X X n S ][112 1 2∑=--=n i i X n X n DX → 3. 定理: X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~), (2 n N σμ, (2). 2 2 )1(σS n -~)1(2-n χ, (3). X 与2S 相互独立。 二.2χ分布 1. 定义 设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122 n X n i i χχ∑== 2. 性质: (1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。 (2). 若X ~)(2n χ,则n EX =,2DX n =。 三.t 分布 1. 定义 设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则n Y X T = ~)(n t 。 2. 定理:

设n X X X ,,,21 独立同分布,且~),(2σμN ,则 n S X μ -σ σ μS n X ) (-=1 )1() (2 2 ---= n S n n X σσ μ~)1(-n t (因为 n X σ μ-~)1,0(N , 2 2 )1(σS n -~)1(2-n χ)。 3. 定理: 设1,,,21n X X X 为总体X ~),(21σμN 的样本, 1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则 2 12111)()(n n S Y X w +---μμ~)2(21-+n n t ,其中 2 )1()1(212 2 22112-+-+-=n n S n S n S w 。 证:因为 2 2 11)1(σ S n -~)1(12 -n χ, 2 2 2 2)1(σ S n -~)1(22-n χ, 所以 2 2 2 2211)1()1(σS n S n -+-~)2(212-+n n χ; 又X ~), (1 2 1n N σμ,Y ~), (2 2 2n N σμ, 所以X Y -~), (2 2 1 2 21n n N σσμμ+ +, 所以 2 12111) ()(n n Y X +---σ μμ~)1,0(N ,所以 2 12111)()(n n S Y X w +---μμ

说明6个基本统计量

说明6个基本统计量(平均数、众数、中位数、极差、方差、标准差) 的数学内涵,学生学习过程中可能产生的困难及主要原因、应对策略; 一.平均数、众数、中位数都是描述一组数据集中趋势的统计量, 它们从不同角度描述一组数据的集中趋势。如某班45名学生在一次考 试的成绩中,平均数为85分,表示全班45名学生的平均成绩为85分; 众数是90分,表示全班得90分的人最多;中位数是87分,表示该班 45名学生成绩中在87分以下和87分以上的数目一样多。 平均数的概念:把一组数据的总和除以这组数据的个数所得的商,叫做这组数据的平均数。 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。 二.数据的集中趋势只是数据分布的一个特征,它所反映的是数据向 其中心值(平均数)聚集的程度,而各数据之间的差异情况如何呢?这 就需要考察数据的分散程度,也称波动情况。数据的分散程度是数据分 布的另一个重要特征,它所反映的是各个数据远离其中心值的程度,因 此也称离中趋势,极差、方差、标准差就是对数据集散程度所作的描述。 极差概念:是一组数据在最大值与最小值的差,它反映了一组数据的波动范围,是刻画数据离散程度的最简单的统计量。 方差是统计中常用的:是指在一组数据中,各数据与它们的平均数的差的平方的平均数。

标准差:是方差的算数平方根。 方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小,目前所研究的是这两组数据的个数相等、平均数相等或比较接近时的情况;并且二者都是在求出平均数的基础上计算的,也就是说,欲求标准差→需求方差,欲求方差→需求平均数。 三.学生学习时可能产生的困难、原因及措施: 1.概念不能顾名思义,不好理解,如①平均数中的加权平均数,可采取方法: 先重点理解“权”的意思,可联系“权力”,有大小;结合英文“权”的单词weight,表示重量,所以“权”是表示数据重要程度的意思。再理解加权平均数的概念:是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。 接下来,举简单例子来运用理解。例如:你的平时成绩是80分,期末考成绩是90分,要计算总的平均成绩,平时占40%、期末占60%的比例来算,所以你的平均成绩是:80×40%+90×60%=86(分)最后的86就是加权平均数,40%、60%分别为平时和期末的权。再如:你所在小组同学一块儿吃西瓜,有1人吃了7块,另外三人都吃了3块,平均每人吃几块?(7+3*3)/4=4(块),其中的1和3为本题的权。 再总结:“权”可以是整数,可以是小数(分数,百分数),“权”即权重、各个数据所占的比例。 ②方差的概念同样是难点,理解方法:解释如下:在表示各个数据与其平均数的偏离程度时,为了防止正偏差与负偏差的相互抵消,取各

常见统计量

?一、T检验 ?用途:?比较两组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1 H1: μ0≠μ1 SPSS中对应?方法: 1、单样本T检验(One-sample Test) (1)??目的:检验单个变量的均值与给定的某个常数是否?一致。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 2、独?立样本T检验(Independent-Samples T Test) (1)??目的:检验两个独?立样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 3、配对样本T检验(Paired-Samples T Test) (1)??目的:检验两个配对样本均值是否相等。 (2)判断标准:p<0.05;t>1.98即认为是有显著差异的。 ! ?二、?方差分析 ?用途:?比较多组数据之间的差异 前提:正态性,?方差?齐次性,独?立性 假设:H0: μ0=μ1=…… H1: μ0,μ1,……不全相等 SPSS中对应?方法: 1、单因素?方差分析(One-way ANOVA) (1)??目的:检验由单?一因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。 2、多因素?方差分析(Univariate) (1)??目的:检验由多个因素影响的多组样本均值差异。 (2)判断标准:p>0.05;t<1.98即认为是有显著差异的。 (3)特别说明:可以进?一步使?用LSD,Tukey?方法检验两两之间的差异。! 三、?非参数检验 ?用途:?比较多组数据之间的差异,独?立性等

常用统计量及其应用

第四章常用统计量及其应用 第一节平均数与标准差的概念 一、平均数 反映一组性质相同的观测值的平均水平或集中趋势的统计量,其数学定义为 x丄X i n i 4 平均数在一定程度上代表一组数据的整体水平,体育工作中,常用这一概念来反映事物 的某些特征。 例如,某中学的体育平均达标率,学生的平均身高,年龄某地区高考体育加试平均分数—、标准差 样本平均数描述数据的集中趋势,反映样本数据的平均水平。但是,平均数对整体的代 表性是有条件的。 例如,吉斯莫先生经营一家工厂,规模不大,现欲招聘一名工人,汤姆先生参加面试, 老板告诉他,本厂全体人员的工资入平均每人每周300元,汤姆一听,欣然接受,上班一天 后,来找老板,声称受骗,老板算了一笔帐,汤姆听了无话可说。 平均工资300元/周 说明:该厂平均工资尽管较高,但由于各个工资相差太大,平均数对整体的代表性较差。这就说明在实际应用中,仅有平均数是不够的,还要考虑到数据的离散程度。在数据相对比 较集中时,平均数才具有代表性。 反映样本离散程度的统计量,称之为标准差 设样本观测值为x,,x2…x n,平均数为X,看看如何来定量计算标准差? 样本的离散程度自然是相对平均数x而言的为此构造出 n '' (X i -x) i m

但上式各项有正有负,正负抵消 7 (X j - x) = 0 i 4 所以要反映离散程度的大小可以让上式各项加以绝对值或求平方, 但带绝对值后不便于 处理,所 以,选择后者从而有 n ' (X i -X)1 2 i 丄 上式与样本含量的大小有关,所以,求平均的 1 n —' (X i-X)2 n i 4 在实际应用中,上式对总体离散程度的估计往往偏小若以自由度( 是无偏的因此,构 造 n ' (X i -X)2 ?s 2 i 4 S 称为标准差,反映样本的离散程度。 结束语: 样本平均数反映样本数据的整体水平, 但是要结合标准差,标准差反映样本数据的离散 程度对于运动成绩,表现为成绩的稳定性。 第6次课(3学时) 教学目的: 通过本次课的教学, 使学生了解平均数和标准差在体育中的具体应用, 掌握利用 平均数和标准差制定评分评价标准的方法。 教学内容: 平均数和标准差在体育中的应用 教学难点:累进计分法 教学内容的组织安排: 标准百分和累进计分是体育统计的重要内容, 在体育评分和评价中有 重要应用,为了让学生在实际工作中能正确地运用, 教学中重点讲授 1 ?标准百分 2 ?累进计分 3. 离差法制定评价标准 4. 在制定离差评价表中的应用 教学重点:1 ?标准百分和累进计分的计分思想 2 .离差评价表的制定过程 n 一1 )代替n ,则 1 n -1 上式中s 2称为样本方差,还原成原来的量纲 则有 (X i -X)2 n i =1

常用统计量及其应用

第四章 常用统计量及其应用 第一节 平均数与标准差的概念 一、平均数 反映一组性质相同的观测值的平均水平或集中趋势的统计量,其数学定义为 n x 1= ∑=n i i x 1 平均数在一定程度上代表一组数据的整体水平,体育工作中,常用这一概念来反映事物的某些特征。 例如,某中学的体育平均达标率,学生的平均身高,年龄某地区高考体育加试平均分数等等。 二、标准差 样本平均数描述数据的集中趋势,反映样本数据的平均水平。但是,平均数对整体的代表性是有条件的。 例如,吉斯莫先生经营一家工厂,规模不大,现欲招聘一名工人,汤姆先生参加面试,老板告诉他,本厂全体人员的工资入平均每人每周300元,汤姆一听,欣然接受,上班一天后,来找老板,声称受骗,老板算了一笔帐,汤姆听了无话可说。 平均工资 300元/周 说明:该厂平均工资尽管较高,但由于各个工资相差太大,平均数对整体的代表性较差。这就说明在实际应用中,仅有平均数是不够的,还要考虑到数据的离散程度。在数据相对比较集中时,平均数才具有代表性。 反映样本离散程度的统计量,称之为标准差 设样本观测值为21,x x …,n x 平均数为x ,看看如何来定量计算标准差? 样本的离散程度自然是相对平均数x 而言的为此构造出 )(1 x x i n i -∑ =

但上式各项有正有负,正负抵消 )(1 x x i n i -∑ ==0 所以要反映离散程度的大小可以让上式各项加以绝对值或求平方,但带绝对值后不便于处理,所以,选择后者从而有 21 )(x x i n i -∑ = 上式与样本含量的大小有关,所以,求平均的 n 121 )(x x i n i -∑ = 在实际应用中,上式对总体离散程度的估计往往偏小若以自由度(1-n )代替n ,则是无偏的因此,构造 221 ?)(11s x x n i n i =--∑= 上式中2 s 称为样本方差,还原成原来的量纲 则有 21 )(11x x n S i n i --= ∑= S 称为标准差,反映样本的离散程度。 结束语: 样本平均数反映样本数据的整体水平,但是要结合标准差,标准差反映样本数据的离散程度对于运动成绩,表现为成绩的稳定性。 第6次课(3学时) 教学目的:通过本次课的教学,使学生了解平均数和标准差在体育中的具体应用,掌握利用 平均数和标准差制定评分评价标准的方法。 教学内容:平均数和标准差在体育中的应用 1.标准百分 2.累进计分 3.离差法制定评价标准 4.在制定离差评价表中的应用 教学重点:1.标准百分和累进计分的计分思想 2.离差评价表的制定过程

统计量及其抽样分布习题答案

第六章 统计量及其抽样分布 6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。 解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布: x ()0,1N ,因此,样本均值不超过总体均值的概率P 为: ()0.3P x μ-≤ =P ?≤ =x P ??≤≤ =()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,() 0.3P x μ-≤=0.6318 6.2 ()0.3P Y μ-≤ =P ?≤ =x P ??≤≤ =(||P z ≤ =(21φ-=0.95 查表得: 1.96= 因此n=43 6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使 得6210.95i i P Z b =??≤= ??? ∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量 222212χ=+++n Z Z Z 服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令622 1i i Z χ==∑,则()62 22 16i i Z χχ==∑,那么由概率6210.95i i P Z b =??≤= ???∑,可知: b=()210.956χ-,查概率表得:b=12.59 6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差2221 1(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤= 解:更加样本方差的抽样分布知识可知,样本统计量: 2 22(1)~(1) n s n χσ-- 此处,n=10,21σ=,所以统计量 2 2222(1)(101)9~(1)1 n s s s n χσ--==- 根据卡方分布的可知: ()()2212129990.90P b S b P b S b ≤≤=≤≤= 又因为:

相关文档
最新文档