[1,N]离散均匀分布样本第i顺序统计量-描述统计

[1,N]离散均匀分布样本第i顺序统计量-描述统计
[1,N]离散均匀分布样本第i顺序统计量-描述统计

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其 抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量 如果随机变量X的概率密度为 2 2 () 2 1 (), 2 x f x e x μ σ πσ -- =-∞<<∞ 则称X服从正态分布。 记做 2 (,) X Nμσ : ,读作:随机变量X服从均值为 μ ,方差为2 σ的正态分布 其中, μ -∞<<∞ ,是随机变量X的均值,0 σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥, 即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定: σ 越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以 x轴为其渐近线。 标准正态分布

当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值 ()1() x x Φ-=-Φ

次序统计量理论及应用

顺序统计量的分布及其应用探究 学生姓名:杨道圣 指导教师:刘宇民 摘要 顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。经过总结得出了关于顺序统计量的离散型最大顺序统计量分布,最小顺序统计量分布,连续性第i 个顺序统计量ξ(i)的密度函数,连续性随机变量任意两个顺序统计量ξ(i )<ξ(j)的密度函数: 1.离散型随机变量子样最小值的分布律为 )(])1()!(!![)(11 ) 1(I r pi r p l n l n x X P n l l n r l l r ∈--==∑∑=-= 2.离散型随机变量子样最大值的分布律为 )(])1()!1()!1(![)(111 1 1 ) (I r pi r p j n j n x X P n j j r l j n r n ∈-+--==∑∑=--=+- 3.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则第i 个顺序统计量ξ(i)的密度函数 4.设母体ξ有密度函数f(x)>0,a ≤x ≤b(这里可以设a=-∞,b=+∞),并且ξ1,ξ2,…,ξn 取自这一母体的一个子样,则任意两个个顺序统计量ξ(i )<ξ(j)的密度函数为 关键词 最小顺序统计量,最大顺序统计量,第i 个顺序统计量ξ(i)的密度函数,任意两个个顺序统计量ξ(i )<ξ(j)的密度函数 引言 顺序统计量在近代统计推断中起着重要的作用,这是由于顺序统计量有一些性质不依赖于母体的分布,并且计算量很小,使用起来较方便,因此在质量管理、可靠性等方面得到广泛的应用。顺序统计量在近代统计推断中起着很重要的作用,在水文,地震,气象和建筑等领域都有重要作用。

样本均值的抽样分布

抽样分布 根据样本统计量去估计总体参数,必须知道样本统计量分布。 定义6.2 某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n 的样本时,由每一个样本算出的该统计量数值的相对数频数分布或概率分布。 由于现实中我们不可能将所有的样本都抽出来,因此,统计的抽样分布实际上是一种理论分布。 (一)样本均值的抽样分布 从单位数为N 的总体中抽取样本容量为n 的随机样本,在重复抽样的条件下 共有n N 个可能的样本,在不重复抽样条件下,共有!!()! n N N C n N n =-个可能样本。对于每一个样本,我们都可以计算出样本的均值2()x s 或或p ,因此,样本均值是一个随机变量。所有的样本均值形成的分布就是样本均值的抽样分布。 [例6.4]设一个总体含有4个个体(元素),即N=4,取值分别为: 12341234x x x x ==== 总体分布为均匀分布,如图6.1所示。 图6.1 总体均值:10 2.54X μ== = 总体方差:22() 1.25x x n σ-==∑ x

若重复抽样,n=2 则共有2416=个可能样本。具体列示如表5.1.1。 表6.1 可能的样本及其均值 每个样本被抽中的概率相同,均值为116 样本均值的抽样分布如表5.1.2和图5.1.2所示。 样本均值x 抽样分布的形状与原有总体的分布有关,如果原有总体是正态分布,样本均值也服从正态分布。 如果总体分布是非正态分布,当x 为大样本(30n ≥)时,样本均值的分布趋于服从正态分布;当x 为小样本时,其分布不是正态分布。 下面再让我们来看看样本均值x 抽样分布的特征:数学期望和方差。 设总体共有N 个元素,其均值为μ,方差为2σ,从中抽取容量为n 的样本。 E()x x X μ=== (6.1) 22 x n σσ=(重复抽样) (6.2) 22 ()1x N n n N σσ-=-(不重复抽样) (6.3) 对于无限总体,样本均值的方差,不重复抽样也可按重复抽样来处理;对于有限总体,当N 很大,而/n N 又很小,修正系数 1 N n N --会趋于1,不重复抽样也可按重复抽样来处理。 样本均值x 抽样分布的特征—数学期望和方差的计算公式,可以通过[例6.4]加以验证。 样本均值的均值 1.0 1.5 3.5 4.040 2.51616x μ++++====

常用的统计量抽样分布总结

常用的统计量抽样分布 一.正态分布 1. ∑==n i i X n X 1 1EX → 2. 2 12)(11∑=--=n i i X X n S ][112 1 2∑=--=n i i X n X n DX → 3. 定理: X ~),(2σμN ,n X X X ,,,21 为X 的样本,则 (1). X ~), (2 n N σμ, (2). 2 2 )1(σ S n -~)1(2-n χ, (3). X 与2S 相互独立。 二.2χ分布 1. 定义 设n X X X ,,,21 独立同分布,且~)1,0(N ,则)(~2122 n X n i i χχ∑== 2. 性质: (1). 若X ~)(12n χ,Y ~)(22n χ,且X ,Y 独立,则X +Y ~)(212n n +χ。 (2). 若X ~)(2n χ,则n EX =,2DX n =。 三.t 分布 1. 定义 设X ~)1,0(N ,Y ~)(2n χ,且X ,Y 独立,则n Y X T =~)(n t 。 2. 定理: 设n X X X ,,,21 独立同分布,且~),(2σμN ,则

n S X μ -σ σ μS n X )(-=1 )1() (2 2 ---= n S n n X σσ μ~)1(-n t (因为 n X σ μ-~)1,0(N , 2 2 )1(σ S n -~)1(2-n χ)。 3. 定理: 设1,,,21n X X X 为总体X ~),(21σμN 的样本, 1,,,21n Y Y Y 为总体Y ~),(22σμN 的样本,且Y X ,独立,则 2 12111)()(n n S Y X w +---μμ~)2(21-+n n t ,其中 2 )1()1(212 2 22112 -+-+-=n n S n S n S w 。 证:因为 2 2 11)1(σ S n -~)1(12 -n χ, 2 2 2 2)1(σ S n -~)1(22-n χ, 所以 2 2 2 2211)1()1(σS n S n -+-~)2(212-+n n χ; 又X ~), (1 2 1n N σμ,Y ~), (2 2 2n N σμ, 所以X Y -~), (2 2 1 2 21n n N σσμμ+ +, 所以 2 12111) ()(n n Y X +---σ μμ~)1,0(N ,所以 2 12111)()(n n S Y X w +---μμ 2 12111) ()(n n Y X +---= σμμ/ )2/()1()1(212 2 2 2211-+-+-n n S n S n σ ~)2(21-+n n t 。

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

统计量及其抽样分布

《统计学》课程教学大纲 课程编号:×××××××× 课程类别:学科基础课 授课对象:经济管理类各专业、社会学专业、档案学专业、新闻学专业等 开课学期:第3、4、5、6学期 学分:4学分 主讲教师:……等 指定教材:贾俊平、何晓群、金勇进编著,《统计学》(第六版),中国人民大学出版社,2015年教学目的: 《统计学》是为我校非统计专业本科生开设的一门基础必修课,总课时约54学时。设置本课程的目的在于培养学生有关统计知识方面的基本技能,培养学生应用统计方法分析和解决问题的实际能力。教学应达到的总体目标是: 使学生能系统地掌握各种统计方法,并理解各种统计方法中所包含的统计思想。 使学生掌握各种统计方法的不同特点、应用条件及适用场合。 培养学生运用统计方法分析和解决实际问题的能力。 第1章导论 课时:1周,共3课时 教学内容 第一节统计及其应用领域 一、什么是统计学 统计学的概念。描述统计。推断统计。 二、统计的应用领域 统计在共生管理中的应用。统计在其他领域的应用。统计的误用与正确使用。 三、历史上著名的统计学家 一些主要的统计学家。 第二节统计数据的类型 一、分类数据、顺序数据、数值型数据 分类数据。顺序数据。数值型数据。 二、观测数据和实验数据 观测数据。实验数据。 三、截面数据和时间序列数据 截面数据。时间序列数据。 第三节统计中的几个基本概念 一、总体和样本 总体。有限总体和无限总体。样本。样本容量。 二、参数和统计量 参数。统计量。 三、变量 变量。变量的类型。 第2章数据的收集 课时:1周,共3课时

第一节数据来源 一、数据的间接来源 二手数据。 二、数据的直接来源 统计调查方式。数据的收集方法。 第二节调查设计 一、调查方案的结构 调查目的。调查对象和调查单位。调查项目和调查表。 二、调查问卷设计 问卷的结构。提问项目设计。回答项目的设计。问题顺序的设计。第三节数据质量 一、数据的误差 抽样误差。非抽样误差。 二、数据的质量要求 第3章数据的图表展示 课时:1周,共3课时 教学内容 第一节数据的预处理 一、数据审核 原始数据的审核。二手数据的审核。 二、数据筛选 数据筛选的意义。用Excel进行数据筛选。 三、数据排序 数据排序的作用。用Excel进行数据排序。 第二节分类和顺序数据的整理与显示 一、分类数据的整理与显示 频数与频数分布。用Excel制作频数分布表。分类数据的图示方法。 二、顺序数据的整理与显示 累积频数与累积频率。顺序数据的图示方法。 第三节数值型数据的整理与显示 一、数据分组 分组方法。 二、数值型数据的图示 直方图。茎叶图和箱线图。线图。雷达图。 第四节统计表 一、统计表的构成 二、统计表的设计 第4章数据的概括性度量 课时:1周,共3课时 教学内容 第一节集中趋势的度量

次序统计量及其分布

§5.3次序统计量及其分布 次序统计量在近代统计推断中起着重要的作用,这是由于次序统计量有一些性质不依赖于母体的分布并且计算量很小,使用起来较方便。因此在质量管理、可靠性等方面得到广泛的应用,现在我们在本节中扼要地介绍有关次序统计量的内容。gjzsj 设1ξ,2ξ,…,n ξ是取自分布函数为F (x )的母体ξ的一个子样,x 1,x 2,… ,x n 表示这子样的一组观测值。这些观测值,由小到大的排列用x )1(,x )2(,… ,x )(n 表示,即x )1(≤x )2(≤… ≤x )(n ,若其中有两个分量x 1与x 2相等,它们先后次序的安排是可以任意的。 定义5.3 第i 个次序统计量ξ)(i 是上述子样1ξ,2ξ,…,n ξ这样的一个的一个函数,不论子样1ξ,2ξ,…,n ξ取得怎样一组观测值x 1,x 2,… ,x n ,它总是取其中的x )(i 为观测值。 显然,对于容量为n 的子样可以得到n 个次序统计量ξ)1(≤ξ)2(≤… ≤ξ)(n ,其中ξ)1(称做最小次序统计量,ξ)(n 称做最大次序统计量。 如果1ξ,2ξ,…,n ξ是来自同一母体的n 个相互独立随机变量,那么次序统计量1ξ,2ξ,…,n ξ是否也相互独立呢?这可以从下述例子中看出(例略)。 定理5.5 设母体ξ有密度函数f (x)>0,a ≤x ≤b ,并且1ξ,2ξ,…,n ξ为取自这母体的一个子样,则第i 个次序统计量的密度函数为 g i (y)=?? ???≤≤-----其他,0),()](1][)([)!()!1(!1b y a y f y F y F i n i n i n i (5.24) 例5.3 设母体ξ有密度函数 ? ??<<=其他,010,2)(x x x f 并且ξ)1(<ξ)2(<ξ)3(<ξ)4(为从ξ取出的容量为4的子样的次序统计量。求ξ)3(的密度函数)(3x g 和分布函数)(3x G ,并且计算概率)2 1()3(>ξP 。

统计学第5-6章 正态分布、 统计量及其抽样分布

第5-6章 统计量及其抽样分布 正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的 标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥,即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时,

2 2 1 () 2x f x e π- = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N,求以下概率

统计量与抽样分布

第6章统计量与抽样分布 【引例】1899年,戈塞特(1876-1937)进入都柏林A.吉尼斯父子酿酒公司担任酿酒化学技师,主要从事统计和实验工作。他在工作中发现,供酿酒的每批麦子质量相差很大,而同一批麦子中能抽样供试验的麦子又很少,每批样本在不同的温度下做实验,其结果相差很大。这就决定了不同批次和温度的麦子样本是不相同的,不能进行样本合并。这样一来,实际上取得的麦子样本,不可能是大样本,只能是小样本。他在工作中还发现,利用小样本得出的结果,和正态分布有较大的差异,特别是两端尾部的概率,比正态分布明显高。因此1907年戈塞特决心把小样本和大样本之间的差别搞清楚。为此,他试图把一个总体中的所有小样本的平均数的分布刻画出来。做法是:在一个大容器里放了一批纸牌,把它们弄乱,随机地抽若干张(小样本),对这一样本记录观察值,然后再把纸牌弄乱,抽出几张,对相应的样本再记录观察值。大量地记录这种随机抽样的小样本观察值,就可以获得小样本观察值的分布。1908年,戈塞特以“学生(Student)”为笔名在《生物计量学》杂志发表了论文《平均数的规律误差》。这篇论文开创了小样本统计理论的先河,为研究样本分布理论奠定了重要基础。被统计学家誉为统计推断理论发展史上的里程碑。 那么总体和样本是如何联系的?大样本和小样本下究竟有什么差异?什么是t分布?它和正态分布有什么不同?它有什么作用?统计推断中常用的分布还有哪些?这些问题都将在本章中找到答案。 统计研究的目的是为了探索现象内在的数量规律性。为了解总体的数量特征,可以直接对总体进行全面调查,得到总体数据,进而归纳出数量特征;也可以对总体进行抽样,利用样本对总体进行推断,后一种方法称为统计推断。抽样分布是进行统计推断的理论基础。本章将主要介绍统计推断所涉及的总体、 分布,t分布样本、统计量及抽样分布等概念,以及在统计推断中最常用的2 和F分布和抽样分布定理。

几个关于次序统计量的典型例题

几个关于次序统计量的典型例题 摘要:次序统计量作为一类重要的统计量在很多领域中都有关泛的应用。本文 在前人研究的基础上总结了有关次序统计量若干重要的例题,主要包括:特殊形 式的多个次序统计量联合密度函数的求法;均匀分布样本极差的密度函数的求法;有关次序统计量独立性的证明。希望对读者学习研究次序统计量起到微薄的帮助。 关键词:次序统计量雅可比行列式次序统计量独立性 一、引言 次序统计量是一类很重要的统计量,被广泛地应用在统计推断、可靠性理论、应用概率等很多领域。其优点在于次序统计量有一些性质不依赖母体分布,且计 算量较小,这样可以根据相关的理论快速得到目标统计量的分布情况。现有的理 论研究已经非常充分,如,文章[3]中,作者描述了均均分布及指数分布的相关统 计量性质;文章[4]中,作者就几个常见分布次序统计量的随机比较进行了详细地 说明。文章[5]中,作者详细描述了均匀分布的次序统计量的性质;本文旨在前人 的基础上对次序统计量几个常见但没有被系统总结的例题做一详细说明。 二、次序统计量的基本知识 定义1:设x1,x2…,xn是取自总体x的样本,x(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。(x(1),x(2)…,x(n))称为该样本的次序统计量。其中,x(1)是该样本的最小次序统计量,x(n)是 该样本的最大次序统计量。R=x(n)-x(1)称为样本极差。 引理1:设总体x的密度函数为f(x),分布函数为F(x),x1,x2…,xn为样本, 则第k个次序统计量x(k)的密度函数为: f(x(k))=[F(x)]k-1[1-F(k)]n-kf(x) 引理2:(x(1),x(2)…,x(n))是总体样本的次序统计量,f(x(k))是第k个次 序统计量(x(k))的密度函数,则次序统计量xk的联合密度函数为:f(x(1),x(2)…,x(n))=n!f(x(k)) 引理3:设总体x的密度函数为f(x),分布函数为F(x),x1,x2, (x) 为样本,则次序统计量(x(i),x(j))(i

统计量及其抽样分布习题答案

第六章 统计量及其抽样分布 6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。 解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布: x ()0,1N ,因此,样本均值不超过总体均值的概率P 为: ()0.3P x μ-≤ =P ?≤ =x P ??≤≤ =()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,() 0.3P x μ-≤=0.6318 6.2 ()0.3P Y μ-≤ =P ?≤ =x P ??≤≤ =(||P z ≤ =(21φ-=0.95 查表得: 1.96= 因此n=43 6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使 得6210.95i i P Z b =??≤= ??? ∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量 222212χ=+++n Z Z Z 服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令622 1i i Z χ==∑,则()62 22 16i i Z χχ==∑,那么由概率6210.95i i P Z b =??≤= ???∑,可知: b=()210.956χ-,查概率表得:b=12.59 6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差2221 1(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤= 解:更加样本方差的抽样分布知识可知,样本统计量: 2 22(1)~(1) n s n χσ-- 此处,n=10,21σ=,所以统计量 2 2222(1)(101)9~(1)1 n s s s n χσ--==- 根据卡方分布的可知: ()()2212129990.90P b S b P b S b ≤≤=≤≤= 又因为:

第六章 从样本统计量估计整体参数

第六章从样本统计量估计整体参数 学习要点 第一节点估计 第二节区间估计 第三节总体均数的估计 第四节其他总体参数的估计 本章小结 学习要点 掌握推断统计的内容和前提条件 理解统计估计的原理,掌握统计估计的方法 能够运用总体均数估计的方法解决实际问题 第一节点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。 一、什么是推断统计 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。 具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。 推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的(μ,2 情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。 二、统计推断的基本问题 没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。 一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。 二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强体(即N 样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。 三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。 第二节区间估计 一、参数估计的定义 所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数 σ),根据样本(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2 的相关系数(r)去估计总体相关系数(ρ)等等。

统计量及抽样分布

第六章 统计量及抽样分布 概率论和数理统计都是研究随机现象规律性的数学分支。 (1) 概率论特点:先提出随机现象的数学模型,然后研究其特性和规律 (2) 数理统计: (3) I )以概率论为理论前提,从实际观测或试验出发; II) 研究如何有效的收集、整理和分析受到随机因素影响的数据,并为之建立适当的 数学模型; III)对其进行检验,在此基础上对所研究的问题作出推断和预测,为采取行动和决策 提供依据和建议。 §1总体、样本与统计量 一、总体与样本 在实际问题中,我们往往只能通过观察和试验来获取研究对象的信息,但是,如果要把 全体研究对象逐个一一检查,常常是不必要或不可能的. 如:(1)对自动生产线上高速生产的零件逐个检查,要耗费很多的人力、物力、财力及时间,且非必要; (2)为考察某些产品如灯泡的寿命,横梁的耐冲击强度等而进行的破坏性试验,逐个检查将使生产失去意义 所以,实际问题中,只能也只需通过测试部分对象的数据,由此来推断全体研究对象的性质,由部分推断总体。这是数理统计面对的基本问题。 1、 总体:研究对象的全体,如一批灯泡的寿命 具体:研究对象的某个或某几个特性的数量指标,所有的可能取值所构成的集合。 如,研究对象:一个城市的居民家庭;X :人均收入;Y :人均支出;Z :人均居住面积, 则三个总体:{} ()()(){} ()()(){} 121 1 2 2 1 1 1 2 2 2 ,, ...,,,,,,,,,,,,,n X X X X X Y X Y X Y X Y Z X Y Z X Y Z == = 通常我们学习研究对象的一个特性的数量指标,所有可能取值所构成的集合。如,X :灯泡寿命,总体{}12,, X x x =,其中灯泡是研究对象,寿命是数量指标。 2、 个体:组成总体的每一个基本单元(集合中的元素) 3、 样本:从总体中随机地抽取几个个体所组成地集合,称为总体地一个样本: ()12,,n X X X ,通常看为n 维随机变量 (1) 样本容量:样本中所含个体地个数n ,()1,2,n =≤总体中个体元素个数 (2) 样本值:12,, n X X X 的一个观测,记为:12,, n x x x 4、 抽样:从总体中抽取样本的过程。这里指随机抽样。目的:通过样本得到总体的相应情 况。 (1)简单随机抽样:数理统计最常用的抽样方法。 满足特点:代表性:总体中每个个体被抽入样本的机会均等,即每个i X (个体)与总体X 具有相同分布;

相关文档
最新文档