统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享
统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其

抽样分布

第5-6章统计量及其抽样分布

5.1正态分布

5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。

概率密度曲线图

例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量

如果随机变量X的概率密度为

2

2

()

2

1

(),

2

x

f x e x

μ

σ

πσ

--

=-∞<<∞

则称X服从正态分布。

记做

2

(,)

X Nμσ

:

,读作:随机变量X服从均值为

μ

,方差为2

σ的正态分布

其中,

μ

-∞<<∞

,是随机变量X的均值,0

σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点:

()0

f x≥,

即整个概率密度曲线都在x轴的上方。

曲线

()

f x相对于xμ

=对称,并在xμ

=

处达到最大值,

1

()

2

πσ

=

1

μ<

2

μ<

3

μ

曲线的陡缓程度由

σ

决定:

σ

越大,曲线越平缓;σ越小,曲线越陡峭当

x

趋于无穷时,曲线以

x轴为其渐近线。

标准正态分布

0,1

μσ

==

时,

2

2

1

()

2

x

f x e

π

-

=

x

-∞<<∞

(0,1)

N

为标准正态分布。

标准正态分布的概率密度函数:

()x

?

标准正态分布的分布函数:

()x

Φ

任何一个正态分布都可以通过线性变换转化为标准正态分布

2

(,)

X Nμσ

:

,则

(0,1)

X

Z N

μ

σ

-

=:

变量

2

11

(,)

X Nμσ

:与变量2

22

(,)

Y Nμσ

:相互独立,则有

22

1212

+(+,+)

X Y Nμμσσ

:

5.1.3 正态分布表:可以查的正态分布的概率值

()1()

x x

Φ-=-Φ

例:设(0,1)X N :,求以下概率

(1)( 1.5)P X <

(2) (2)P X >

(3)

(13)P X -<≤

(4)

(2)P X ≤

解:

(1) 1.5

( 1.5)()(1.5)0.9332P X t dt ?-∞<==Φ=?

(2)

(2)1(2)1210.97730.0227

P X P X >=-≤=-Φ=-=() (3)

(13)(3)(1)(3)(1)

(3)(1(1))0.9987(10.8413)0.84

P X P X P X -<≤=≤-≤-=Φ-Φ-=Φ--Φ=--= (4)

(2)(22)(2)(2)

(2)(1(2))2(2)10.9545

P X P X ≤=-≤≤=Φ-Φ-=Φ--Φ=Φ-=

一般,若

(0,1)X N :,则有

()()()P a X b b a <≤=Φ-Φ

()2()1P X a a ≤=Φ-

例 设2

(5,3)X N :,求以下概率

(1)(10)P X ≤

(2)

(210)P X <<

(3)

(28)P X ≤≤

(4)

(56)P X -≤ (5)

(59)P X -≤

解:由2

(5,3)X N :,

5

(0,1)3

X N -: (1)

1.675105

(10)()

33

5( 1.67)

3()(1.67)0.9522

X P X P X P t dt ?-∞

--≤=≤-=≤==Φ=?

(2) 255105

(210)()

333

5

(1 1.67)

3(1.67)(1)0.7938

X P X P X P ---<<=<<-=-<<=Φ-Φ-=

(3)

25585

(28)()

333

5

(11)

32(1)120.841310.6826

X P X P X P ---≤≤=≤≤-=-≤≤=Φ-=?-=

(4)

56

(56)()

33

5(2)

32(2)120.977210.9544

X P X P X P --≤=≤-=≤=Φ-=?-=

(5)

5

(59)(

3)

3

2(3)120.998710.9974

X P X P --≤=≤=Φ-=?-=

一般,若

2

(,)X N μσ:,则有 ()()()b a P a X b μμ

σσ

--<≤=Φ-Φ

5.1.4 3σ

准则

(0,1)X N :,则有

(1)2(1)10.6826P X ≤=Φ-=

(2)2(2)10.9545P X ≤=Φ-=

(3)2(3)10.9973P X ≤=Φ-=

即,X 的取值几乎全部集中在[]3,3-区间内,超出这个范围的可能不到0.3%

至一般正态总体,即

2

(,)X N μσ:,有

()0.6826P X μσ-≤=

(2)0.9545P X μσ-≤=

(3)0.9973P X μσ-≤=

显然(3)P X μσ->的概率很小,因此可以认为X 的值几乎一定落在

区间(3,3)μσμσ-+内——统计学的“3σ准则”

5.1.5 正态分布函数的一个重要性质

设变量211(,)X N μσ:,2

22(,)Y N μσ~,X 与Y 相互独立,则有

2

21212

+(+,+)X Y N μμσσ:221212

-(-,+)X Y N μμσσ:

5.1.6 求分位数

Z α

()0,1X N :

()()Z P X Z x dx α

α?α∞

≥==?

1-=-Z Z αα

常用的几个Z 分位数:

0.050.0251.64, 1.96Z Z ==

0.950.975-1.64,-1.96Z Z ==

5.2 由正态分布导出的几个重要分布

三大分布:

2

,,t F χ分布

5.2.12χ分布

1 定义:设随机变量

12,,,n X X X L 相互独立,且

(0,1)

i X N :(1,2,,)i n =L ,则它们的平方和服从自由度为

n 的

2

x

分布。

记做,

2

2

()i X

n χ∑:

2 2

x 分布的密度函数图形

图形特点:

(1)

2

x

分布的变量值始终为正。

(2)

2

x

分布的形状取决于其自由度n 的大小,通常为不对称的右偏分布,

随着自由度的增大逐渐趋于对称。

(3)

2

x

分布的期望为2

()E n χ

=,方差为2

()2D n χ

=(n 为自由

度)。

(4)

2

x

分布具有可加性。

若X Y

与是相互独立的随机变量, 21

~(),X x n 2

2~()Y x n ,则它们的和服从于自由度为

12n n +的

2

x

分布,即

212~()X Y x n n ++。

3

2

x

分布临界值表的使用,求得

2

x

分布的分位数

2

x

分布临界值表中给出的是概率为

α

时,

2

x α的取值,k 是自由度。

22

2

()()x P x x f x dx α

αα+∞

≥==?

x α

例如,若随机变量

2

(10)X χ:,

则查表可得

20.05

(10) 3.94χ

=,20.95

(10)18.307χ

=,

5.2.2 t 分布(student 分布)

设随机变量

,X Y

互相独立,

2

~(0,1),~()X N Y x n ,则随机变量

~()X t t n =——自由度为n 的t 分布

t 分布概率密度函数图

特点:

① 关于y 轴对称,与标准正态分布的密度函数的图像非常相似。

② 厚尾:当

x →∞时,t 分布的密度函数趋于0的速度要比标准正态

分布密度函数慢,所以t 分布的密度函数的尾部要比(0,1)N 密度

的尾部厚些。

③ 当自由度n 无限增大时,t 分布将趋近于标准正态分布。

所以,当n 很大时,t 分布可以用标准正态分布近似。记()t n α为分

()t n 的α

分位数。

在实际使用中,当

30n ≥,就近似有 ()t n Z αα≈

α

由于t 分布密度曲线的对称性,可得

1()()t n t n αα-=-

例如,若随机变量(15)T t :,查表可得,0.05(15) 1.7531t =,

而0.95

0.05(15)(15) 1.76531t

t =-=-

0.05(40) 1.6839t =,0.05(45) 1.6794t = 0.95 1.645Z =

可见随着自由度n 的增大,t 分位数与z 分位数越来越接近。

5.2.3 F分布

设随机变量X与Y相互独立且分别服从自由度为m

n

2

χ

布。则随机变量

/

/

X m

F

Y n

=服从第一自由度为m第二自由度为n的F

分布。记为

()

F F m n

:,

x

F分布的概率密度函数的图

设随机变量

(,) F F m n :

(,)

F m n

α表示分布

(,)

F m n

α

分位数,

α可以证明

11

(,)(,)

F m n F n m αα-=

例如查表得

0.95F (8,9)=3.23,

则0.050.950.31F F =11

(9,8)==(8,9) 3.23

5.6 小概率原理

指发生概率很小的随机事件在一次实验中几乎不可能出现。

6.1 统计量

定义:设

12,,,n X X X L 是从总体X

中抽取的容量为

n

的一个样

本,如果由此样本构造一个不依赖于任何未知参数的函数

12(,,,)n T X X X L ,则称函数12(,,,)n T X X X L 是一个统计量。

特点:

由样本构造而得,是样本的函数 不含任何未知的参数

当获得样本的一组具体观测值

12(,,,)n x x x L ,带入T

,计算出

12(,,,)n T x x x L 的数值,称为统计量的值

常用的统计量

2,X S

6.2 抽样分布

抽样分布:统计量的分布 随机变量X

精确分布:可以得到分布的数学表达式

渐近分布:难以得到精确分布时,借助于极限工具,求得抽样分布的近似分布,称为渐近分布。

定理1:

设()12,,,n X X X L 是取自总体X

的一个样本,记()i E X μ=,

2()i D X σ=,那么

①()E X μ=,2

()D X n

σ=

②2

2

()E s

σ

=,2

2

1()n

n E s n

σ-= ③ 当n →∞时,

P

X μ??→ lim ()1n P X με→∞

-<=

④ 当n →∞时,22

P s σ??→,

2

2P n s σ??→

定理2:

设()12,,,n X X X L 是取自正态总体

2

(,)N μσ的一个样本 ①2

(,)X N n σμ:

,或等价地(0,1)X N μ

-:

② 2

22

22

2

2

()(1)(1)i

n X X ns

n s

n χσσ

σ--=

=

-∑:

③ X

2

s

相互独立

推论1:

设()

12

,,,

n

X X X

L

是取自正态总体

2

(,)

Nμσ

的一个样本,那么

(1)

X

t n

μ

-

-

:

简要证明:

2

(,)

X Nμσ

:(0,1)

X

N

?:

2

2

2

(1)

(1)

n s

n

χ

σ

-

-

:

(1)

X

t n

-

?-

:

独立(t分布的定义)

(1)

X

t n

μ

-

-

:

推论2

()

12

,,,

m

X X X

L

是取自正态总体

2

11

(,)

Nμσ

的一个样本,()

12

,,,

n

Y Y Y

L

是取自正态总体

2

22

(,)

Nμσ

的一个样本,

X

与Y 相互独立,那么

()()

(0,1)

X Y N μμ---:

简要证明:

211

(,)X N μσ:21

1(,)

X N m σ

μ?:

222

(,)

Y N μσ:22

2(,

)

Y N n

σ

μ?:

独立,

221

2

12(,

)

X Y N m

n

σ

σ

μμ--+

:

12()()

(0,1)

X Y N μμ---:

推论3:

()

12,,,m X X X L 是取自正态总体

21(,)

N μσ的一个样本,

()12,,,n Y Y Y L 是取自正态总体22

(,)

N μσ

的一个样本,

X 与Y 相互独立,那么

()()

(2)

X Y t m n μμ---+-:

其中,

222

12

(1)(1)(2)p

m s n s s m n -+-=

+-

简要证明:

2

1(,)X N μσ:2

1(,

)X N m

σ

μ?:

2

2(,)

Y N μσ:2

2(,

)

Y N n

σ

μ?:

独立,

2

2

12(,

)

X Y N m

n

σ

σ

μμ--+

:

22

1

2

(1)(1)

m s

m χσ

--:

22

2

2

(1)(1)n s

n χσ

--:

可加性

222

12

2

2

(1)(1)(2)

m s

n s

m n χσ

σ

--+

+-:

()()

(2)

X Y t m n μμ---?

+-:

整理得

()()(2)

X Y t m n μμ---?

+-:

设2221

2

(1)(1)(2)

p

m s n s s m n -+-=+-

即()()

(2)

X Y t m n μμ---+-:

推论4:

设()12,,,m X X X L 是取自正态总体

2

11(,)N μσ的一个样本, ()12,,,n Y Y Y L 是取自正态总体2

22

(,)N μσ

的一个样本,

X

Y 相互独立,那么

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

统计学 第六章 抽样与参数估计

《统计学》 第六章 抽样与参数估计 1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。 解: 已知n=300,概率保证程度95.45%,Z 0.0455/2 =2 P=300195=65% 区间范围P n )1(2 p p -Z ±α=0.65300 ) 65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间 2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示: 耐用时间(小时) 灯管数(只) 800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计 100 根据上述资料: (1)试计算抽样总体灯管的平均耐用时间 (2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。 (4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验? 解: 耐用时间(小时) 灯管数(只)f 组中值x xf f x x 2)(- 800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上 15 1150 17250 486000

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学答案 第四章 抽样分布

第四章 抽样分布 4.1 第四章的习题读者可以照常练习。在这里,利用SAS 软件包中的“正态分布随机数函数”做一抽样试验,进行一个类似的演示。假定总体平均数 μ =8,标准差 σ =2,用下式:Y =8+2×正态分布随机数,获得一个服从N (8,22)分布的正态总体。从该正态总体中随机抽取含量为100的样本,共抽取10 000个样本。计算每一样本的s s y 和2,,然后计算样本平均数、样本方差和样本标准差的平均数(s s y ,,2)以及它们的标准差(s s y s s s ,,2)。用上述结果与s s y 和2 ,分布的特征数[分别见(4.1),(4.2)式;(4.14),(4.15)式以及(4.18),(4.19)式] 比较。看一看抽样的结果是否能够很好地估计总体参数。 抽样试验还可以进一步深入,计算每一样本的t 。然后计算t 的平均数和标准差,用计算的结果与t 分布的特征数比较,[见(4.8),(4.9) 式]。看一看抽样的结果与总体参数的一致性是否很好。 为了与问题的要求一致,抽样分两部分进行,下面先讨论样本平均数、样本方差和样本标准差的分布。SAS 程序如下: options nodate; data value; n=100; m=10000; df=n-1; do i=1 to m; retain seed 3053177; do j=1 to n; y=8+2*normal(seed); output; end; end; data disv; set value; sqy=y*y; by i; if first.i then sumy=0; sumy+y; if first.i then sumsqy=0; sumsqy+sqy; my=sumy/n; vacey=(sumsqy-my*sumy)/df; stdy=sqrt(vacey); if last.i then output; run; proc means mean var std; var my stdy vacey; title 'Sampling Distribution: Mu=8 sigma=2'; run; 程序运行的结果见下表: Sampling Distribution: Mu=8 sigma=2 Variable Mean Variance Std Dev -------------------------------------------------- MY 8.0005218 0.0394867 0.1987126

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学简答题

1. 什么是生物统计学?生物统计学的主要容和作用是什么? 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别? 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性?平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S的观测值个数占总个数的68.26%,X-+2s的观测值个数占总个数的95.49%,x-+3s 的观测值个数占总个数的99.73%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布?什么是标准正太分布?正态分布曲线有什么特点?μ和σ对正态分布曲线有何影响?

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相 比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3个阶段。 生物学研究中,一般将样本容量n≥30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 样本标准差的计算公式s=。 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P(AB)=P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,μ确定曲线在x轴上的中心位置,σ确定曲线的展开程度。 等于σ/√n。 样本平均数的标准误 x t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。 统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计。 假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作μ-uασ?x_ μ+uασ?x 在频率的假设检验中,当np或nq<30时,需进行连续性矫正。 2 χ检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2 χ检验中,在自由度df=(1)时,需要进行连续性矫正,其矫正的2 χ=(p85)。 c 2 χ分布是连续型资料的分布,其取值区间为[0.+∞)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]。

统计学答案 第八章 抽样与抽样分布

第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

生物统计学期末复习题库及答案

生物统计学期末复习题 库及答案 https://www.360docs.net/doc/036322443.html,work Information Technology Company.2020YEAR

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )(

判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空

相关文档
最新文档