生物统计学 复习资料
目录
计算部分 (1)
第一章 (1)
第二章 (2)
第三章 (5)
第四章 (7)
第五章 (9)
第六章 (9)
第八章 (12)
第十章 (13)
操作部分 (14)
一、T test (14)
1、One-sample T Test (14)
2、Independent T test (14)
3、paired-samples T Test (15)
二、ANOV A (15)
1、One-Way ANOV A (15)
2、Univariate (16)
三、Correlate and Regression (16)
1、Correlate (16)
2、Regression (17)
生物统计学
计算部分
第一章
1、次数分布表
统计表由标题、横标目、纵标目、线条、数字及合计构成,其基本格式如下表:
表2-3 50枚受精种蛋出雏天数的次数分布表
2、求全距、组距、组中值
全距:资料中最大值与最小值之差,又称为极差(range ),用R 表示,即 R=Max(x)-Min(x)
本例 R =65.0-37.0=28.0(kg )
组距:每组最大值与最小值之差(即全距和组数的比值)记为 i 。分组时要求各组的组距相等。 组距(i)=全距/组数 本例 i =28.0/10≈3.0
组中值=(组下限+组上限)/2=组下限+1/ 2组距=组上限-1/2组距 3、平均数、标准差、变异系数计算
平均数:
(直接法) (加权法)(组中值*频数) 样本标准差:
n x n
x x x x n
i i
n
∑
==+++=1
21 ∑
∑∑
∑
=
=++++++===f
fx f x f f f f x f x f x f x k i i
k
i i
i k k k 11
212211
总体标准差:
变异系数:
标准差的计算方法 (一)直接法
【例3.9】 计算10只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600(g )的标准差。
此例n=10,经计算得:Σx=5400,Σx2=2955000,代入(3—12)式得:
(g)
即10只辽宁绒山羊产绒量的 标准差 为65.828g 。
第二章
4、正态分布的定义 若连续型随机变量x 的概率分布密度函数为
5、由(4-11) 式及正态分布的对称性可推出下列关系式, 再借助附表1 , 便能很方便地计算有关概率: P (0≤u <u1)=Φ(u1)-0.5 P (u ≥u1) =Φ(-u1) P (|u |≥u1)=2Φ(-u1) (式4-12) P (|u |<u1)=1-2Φ(-u1) P (u1≤u <u2)=Φ(u2)-Φ(u1)
6、【例4.6】 已知u ~N(0,1),试求: (1) P (u <-1.64)=? (2) P (u ≥2.58)=? (3) P (|u |≥2.56)=? (4) P (0.34≤u <1.53) =?
7、利用(4-12)式,查附表1得: (1) P (u <-1.64)=0.05050
(2) P (u ≥2.58)=Φ(-2.58)=0.024940 (3) P (|u |≥2.56)
=2Φ(-2.56)=2×0.005234 =0.010468 (4) P (0.34≤u <1.53)
=Φ(1.53)-Φ(0.34)
=0.93669-0.6331=0.30389
8、u 变量在上述区间以外取值的概率分别为:
828.651
1010
/540029550001/)(222=--=--=∑∑
n n x x S =--=∑1)(2
n x x S 12)(
2
-∑
-∑n x n
x ∑
-=N x /)(2μσ%100?=?x
S
V C 2
22)(21)(σμπ
σ--=x e x f
P (|u |≥1)=2Φ(-1)=1- P (-1≤u <1) =1-0.6826=0.3174
P (|u |≥2)=2Φ(-2)=1- P (-2≤u <2)=1-0.9545=0.0455 P (|u |≥3)=1-0.9973=0.0027 P (|u |≥1.96)=1-0.95=0.05 P (|u |≥2.58)=1-0.99=0.01
9、设x 服从μ=30.26,σ2=5.102的正态分布,试求P (21.64≤x <32.98)。
令
则u 服从标准正态分布,故
=P (-1.69≤u <0.53) =Φ(0.53)-Φ(-1.69) =0.7019-0.04551 =0.6564 10、【例4.8】 已知猪血红蛋白含量x 服从正态分布 N ( 12.86,1.332 ), 若 P (x < ) =0.03, P (x ≥ )=0.03,求 , 。
由题意可知,α/2=0.03,α=0.06 又因为
P (x ≥ )=
故 P (x < )+ P (x ≥ )
= P (u <- ) + P (u ≥ ) =1- P (- ≤u < )=0.06=α 由附表2查得: =1.880794 , 所以 ( -12.86)/1.33=-1.880794 ( -12.86)/1.33=1.880794 即 ≈10.36, ≈15.36 11、【例4.9】 纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论 , 子二代中白猪与黑猪的比率为3∶1。求窝产仔10头,有7头白猪的概率。
根据题意,n =10,p =3/4=0.75,q =1/4=0.25。设10头仔猪中白色的为x 头,则x 为服从二项分布B(10,0.75)的随机变量。于是窝产10头仔猪中有7头是白色的概率为:
12、【例4.11】 仔猪黄痢病在常规治疗下死亡率为20%,求5 头病猪治疗后死亡头数各可能值相应的概率。
设5头病猪中死亡头数为x ,则x 服从二项分布B(5,0.2),其所有可能取值为0,1,…,5,按二项式计算概率,用分布列表示如下:
0 1 2 3 4 5 0.3277 0.4096 0.2048 0.0512 0.0064 0.0003
10
.526.30-=
x u )10.526.3098.3210.526.3010.526.3064.21()98.3264.21(-<-≤-=<≤x P x P 03.0)()33.186.1233.186.12()(11=-<=-<-=<αu u P l x P l x P 03.0)()33
.186.1233.186.12(2=≥=-≥-αu u P l x P 2
l 2l 1l αu αu αu αu 06.0u 1l 2l 1l 2l 2503.025.075.0!3!7!1025.075.0)7(373
7710=??===C x P 1l 2l 2l 2l 1l
13、【例4.13】 调查某种猪场闭锁育种群仔猪畸形数,共记录200窝, 畸形仔猪数的分布情况如表4-3所示。试判断畸形仔猪数是否服从波松分布。 表4-3 畸形仔猪数统计分布
样本均数和方差S 2计算结果如下: =Σfk/n =(120×0+62×1 +15×2+2×3+1×4)/200 =0.51
=0.51,S2=0.52,这两个数是相当接近的,因此可以认为畸形仔猪数服从波松分布。 14、【例4.14】 为监测饮用水的污染情况, 现检验某社区每毫升饮用水中细菌数 , 共得400个记录如下:
试分析饮用水中细菌数的分布是否服从波松分布。若服从,按波松分布计算每毫升水中细菌数的概率及理论次数并将頻率分布与波松分布作直观比较。
经计算得每毫升水中平均细菌数 =0.500,方差S 2=0.496。两者很接近, 故可认为每毫升水中细菌数服从波松分布。以 =0.500代替(4-23)式中的λ,得
(k =0,1,2…)
计算结果如表4—5所示。
表4—5 细菌数的波松分布
52.01
200200
/102)41322151620120(1/)(2
222222
22=--?+?+?+?+?=
--=
∑∑n n fk fk s x x
5.0!5.0)(-==e k k x P k x x
可见细菌数的频率分布与λ=0.5的波松分布是相当吻合的 , 进一步说明用波松分布描述单位容积(或面积)中细菌数的分布是适宜的。
15、其平均数和标准差分别记为 和 。 是样本平均数抽样总体的标准差,简称标准误(standard error),它表示平均数抽
样误差的大小。统计学上已证明总体的两个参数与x 总体的两个参数有如下关系:
=μ,
16、例如,当df =15时,查附表4得两尾概率等于0.05的临界t 值为 =2.131,其意义是: P (-∞ 由附表4可知,当df 一定时,概率P 越大,临界t 值越小;概率P 越小,临界t 值越大 。 当 概 率 P 一定时,随着df 的增加,临界t 值在减小,当df =∞时,临界t 值与标准正态分布的临界u 值相等。 第三章 1、用山楂加工果冻儿,传统工艺平均每100g 山楂出果冻儿500g .现采用一种新工艺进行加工,测定了16次,得知每100g 山楂出果冻儿平均数为520g ,标准差为S=12g ,问新工艺与传统工艺之间有无显著差异? 在此例中,总体方差未知,而样本容量又不大,所以应该用t 测验。其测验步骤如下: A 提出假设.H0:μ=μ0,即新工艺和传统工艺之间无显著差异;对HA:μ≠μ0,即新工艺和传统工艺之间存在显著差异. B 确定显著水平α. C 检验计算 均数标准差: 统计量t 值: 自由度:df =n-1=16-1=15(t 0.01(df=15)=2.947) D 统计推断.本例推断否定H0而接受HA.即新工艺和传统工艺之间存在极显著差异. 2、某地区的当地小麦品种一般667m 2产300kg ,即当地品种这个总体的平均数μ0=300kg ,并从多年种植结果获得其标准差=75kg ,而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m 2/330kg ,那么新品种样本所在总体与原当地品种这个总体是否有显著差异呢? 在此例中,总体方差已知,故用u 测验 查附表3,当u=2时,概率P 介于0.04和0.05之间,即这一试验结果属于误差的概率介于0.04和0.05之间,根据小概率事件不可能发生的原理可以推断此差异是由于本质的原因引起的,即新品种比原品种能高产30kg/667m 2。 15 2575===n y σσ215300330=-=-=y y u σμ31612===n S S y 667 .63 5005200=-=-=y S y t μx μ x σ x σ x μ n x σσ= 3.某食品厂在甲、乙两条生产线上各测了30个日产量,试检验两条生产线的平均日产量有无显著差异。 (Independent T test) A 提出假设。H0:u 1-u 2=0,即两条生产线的平均日产量无显著差异.对HA :u 1-u 2≠0,即两条生产线上的平均日产量有显著差异. B 确定显著水平.α=0.01. C 检验计算. D 统计推断.由于 u ?=3.28>u0.01=2.58,故推断接受HA 否定H0,即两条生产线日产量达极显著差异. 4.海关检查某罐头厂生产的出口红烧花蛤罐头时发现存在质量问题,故抽取了6个罐头并随机抽取6个正常罐头测定其SO2含量,结果如下,试检验两种罐头的SO2含量是否有显著差异(参见教材58 公式) 解法同3 Independent T test 3.为研究电渗处理对草莓果实中钙离子含量的影响,选用10个草莓品种来进行电渗处理与对照的对比试验,结果如下,问电渗处理对草莓钙离子含量是否有影响? Paired samples T Test 83.651=y 7299.5921=S 77.592=y 8747 .4222=S 8494 .1308747.42307299.5922212121=+=+=-n S n S S y y 28.38494.177.5983.65)()(212121=-=---=-y y S y y u μμ 电渗处理草莓果实钙离子含量 解:参见教材60 公式 或 使用SPSS 第四章 【例5.1】 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为 116、 115、113、 112、 114、 117、 115、 116、 114、 113(天),试检验所得样本的平均数与总体平均数114天有无显著差异? 根据题意,本例应进行双侧t 检验。 A 提出无效假设与备择假设 B 计算t 值 经计算得: =114.5,S =1.581 所以 = = =1.000 C 查临界t 值,作出统计推断 由 =9,查t 值表(附表3)得t0.05(9)=2.262,因为|t | 【例5.2】 按饲料配方规定,每1000kg 某种饲料中维生素C 不得少于246g ,现从工厂的产品中随机抽测12个样品,测得维生素C 含量如下:255 、 260、 262、 248、244、245、 250、 238、 246、 248、 258、270g/1000kg ,若样品的维生素C 含量服从正态分布,问此产品是否符合规定要求? 按题意,此例应采用单侧检验。 A 提出无效假设与备择假设 H0: = 246,HA : > 246 B 计算 t 值 经计算得: =252,S =9.115 所以 = = = 2.281 C 查临界t 值,作出统计推断 t=2.281 > 单侧t 0.05(11), P < 0.05 , 否定H0 : =246,接受HA : >246,可以 认为该批饲料维生素C 含量符合规定要求。 x x S u x t 0 -= 10581.11145.114-5 .05.09 1101=-=-=n df df μμx x S x t μ -=12115.9246252-631.26111121=-=-=n df μμμ 【例5.3】 某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg 时的背膘厚度,测定结果如表5-3所示。设两品种后备种猪90kg 时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg 时的背膘厚度有无显著差异? 表5-3 长白与蓝塘后备种猪背膘厚度 A 提出无效假设与备择假设 B 计算t 值 此例n1=12、n2=11,经计算得: =1.202、 =0.0998、 =0.1096, =1.817、 =0.123、 =0.1508 分别为两样本离均差平方和。 =0.0465 =21 C 查临界t 值,作出统计推断 当df =21时,查临界值得:t 0.01(21)=2.831,|t |>2.831,P <0.01,否定 接受 表明长白后备种猪与蓝塘后备种猪90kg 背膘厚度差异极显著,这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度。 【例5.4】 某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如表5-4,问两种饲料对粤黄鸡的增重效果有无显著差异? 表5-4 粤黄鸡饲养试验增重 210μμ=:H 21μμ≠:A H 1x 1S 1SS 2x 2S 2SS 1SS 2SS )1 1()1()1()()(2 21121222211n n n n x x x x S x x +?-+--+-= ∑ ∑-)111 121()111()112(1508.01096.0+?-+-+=00216 .0=2 121 x x S x x t --=**226.130465.0817 .1202.1-=-=)1()1(21- +-=n n df 210μμ=:H 21μμ≠ :A H 此例 ,经计算得 A 提出无效假设与备择假设 B 计算t 值 因为 于是 C 查临界值,作出统计推断 当df=14时,查 临 界 值 得 : t 0.05(14) = 2.145 ,|t| < 2.145, P > 0.05,故不能否定无效假设 ,表明 两 种饲料饲喂粤黄鸡的增重效果差异不显著,可以认为两种饲料的质量是相同的。 第五章 【例6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。表6-2 饲喂不同饲料的鱼的增重(单位:10g ) 解答:参见单因素方差操作 One Way ANOV A 第六章 【例6.1】 在进行山羊群体遗传检测时,观察了 260只白色羊与黑色羊杂交的子二代毛色,其中181只为白色,79只为黑色,问此毛色的比率是否符合孟德尔遗传分离定律的3∶1比例? 检验步骤如下: (一)提出无效假设与备择假设 821==n n 、625.7051=x ,839.2882 1=S 、125.6962=x 125.13822=S 210μμ=:H 21μμ≠:A H 306 .78125.138839.2882 2212 1=+=+=-n S S S x x 2121x x S x x t --=300.1306.7125 .696625.705=-= 141818)1()1(21=-+-=-+-=)()(n n df 210μμ=:H H0:子二代分离现象符合3∶1的理论比例。 HA :子二代分离现象不符合3∶1的理论比例。 (二)选择计算公式 由于本例是涉及到两组毛色(白色与黑色),属性类别分类数k =2,自由度df =k -1=2-1=1,须使用(6—4)式来计算 。 (三)计算理论次数 根据理论比率3∶1求理论次数: 白色理论次数:T 1=260×3/4=195 黑色理论次数:T 2=260×1/4=65 或 T 2=260-T 1=260-195=65 (四)计算 (五)查临界χ2值,作出统计推断 当自由度 df =1 时, 查 得 χ20.05(1) =3.84,计算的χ2c <χ20.05(1),P >0.05,不能否定H 0,表明实际观察次数与理论次数差异不显著,可以认为白色羊与黑色羊的比率符合孟德尔遗传分离定律3∶1的理论比例。 【例6.2】 在研究牛的毛色和角的有无两对相对性状分离现象时 ,用黑色无角牛和红色有角牛杂交 ,子二代出现黑色无角牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头,共360头。试 问这两对性状是否符合孟德尔遗传规律中9∶3∶3∶1的遗传比例? 检验步骤: (一)提出无效假设与备择假设 H0:实际观察次数之比符合9∶3∶3∶1的理论比例。 HA :实际观察次数之比不符合9∶3∶3∶1的理论比例。 (二)选择计算公式 由于本例的属性类别分类数 k =4:自由 度df =k -1=4-1=3>1,故利用(6—1)式计算χ2。 (三)计算理论次数 依据各理论比例9:3:3:1计算理论次数: 2c χ2 c χ739.365 )5.0|6579(|195)5.0|195181(|)5.0|(|222 2=--+--=--∑=T T A C χ =0.5444+1.6333+1.6333+0.9 =4.711 (五)查临界χ2值,作出统计推断 当df =3时,χ20.05(3)=7.81,因χ2<χ20.05(3) ,P >0.05,不能否定H0,表明实际观察次数与理论次数差异不显著, 可以认为毛色与角的有无两对性状杂 交 二 代 的 分 离 现 象 符 合 孟 德 尔遗传规律中9∶3∶3∶1的遗传比例。 【例6.7】 某猪场用80头猪检验某种疫苗是否有预防效果。结果是注射疫苗的44头中有 12 头发病,32头未发病;未注射的36头中有22头发病,14头未发病,问该疫苗是否有预防效果? 1、 先将资料整理成列联表 2、 提出无效假设与备择假设 H0:发病与否和注射疫苗无关,即二因子相互独立。 HA :发病与否和注射疫苗有关,即二因子彼此相关。 3、 计算理论次数 根据二因子相互独立的假设,由样本数据计算出各个理论次数。二因子相互独立,就是说注射疫苗与否不影响发病率。也就是说注射组与未注射组的理论发病率应当相同,均应等于总发病率34/80=0.425=42.5%。依 此计算出各个理论次数如下: 注射组的理论发病数:T 11=44×34/80=18.7 注射组的理论未发病数:T 12=44×46/80=25.3, 或 T 12=44-18.7=25.3; 未注射组的理论发病数:T 21=36×34/80=15.3, 或 T 21=34-18.7=15.3; 未注射组的理论未发病数:T 22=36×46/80=20.7, 或 T 22=36-15.3=20.7。 从上述各理论次数T ij 的计算可以看到,理论次数的计算利用了行、列总和, 总总和,4个理论次数仅有一个是独立的。表6-11括号内的数据为相应的理论次数。 4、 计算 值 将表6-11中的实际次数、理论次数代入(6—4)式得: ∑ -=T T A x 22 )(2 c χ3 .15)5.0|3.1522(|3.25)5.0|3.2532(|7.18)5.0|7.1812(|2222--+ --+ --=c χ7 .20)5.0|7.2014(|2 --+ 5、 由自由度df =1查临界χ2值,作出统计推断 因 为 χ20.01(1)= 6.6 3而 =7.944>χ20.01(1),P <0.01,否定H0,接受HA ,表明发病率与是否注射疫苗极显著相关,这里表现为注射组发病率极显著低于未注射组,说明该疫苗是有预防效果的。 【例6.8】 在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣 四个等级分类,其结果见表7—13,问两地水牛体型构成比是否相同。 两地水牛体型分类统计 这是一个2×4列联表独立性检验的问题。 检验步骤如下: 1. 提出无效假设与备择假设 H0:水牛体型构成比与地区无关,即两地水牛体型构成比相同。 HA :水牛体型构成比与地区有关,即两地水牛体型构成比不同。 2. 计算各个理论次数,并填在各观察次数后的括号中 计算方法与2×2表类似,即根据两地水牛体型构成比相同的假设计算。 如优等组中,甲地、乙地的理论次数按理论比率20/135计算;良等组中,甲地、乙地的理论次数按理论比率15/135计算;中等、劣等组中,甲地、乙地的理论次数分别按理论比率80/135和20/135计算。 甲地优等组理论次数: T 11=90×20/135=13.3, 乙地优等组理论次数:T 21=45×20/135=6.7, 或T 21=20-13.3=6.7; 其余各个理论次数的计算类似。 3.计算χ2值 4. 由自由度df =3查临界χ2值,作出统计推断 因 为 χ20.05(3) = 7 . 8 1 , 而χ2=7.582<χ20.05(3),p>0.05,不能否定H 0,可以认为甲、乙两地水牛体型构成比相同。 第八章 【例8.1】在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g )与70日龄重(g) 的 2 c χ582 .76 .6)6.610(7.26)7.2620(10)1010(3.13)3.1310(2 2222 =-+ -++-+-= χ 数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。 表8-1 四川白鹅雏鹅重与70日龄重测定结果(单位:g) 解答:参见回归分析操作 【例8.6】计算10只绵羊的胸围(cm)和体重(kg) 的相关系数。 表8-3 10只绵羊胸围和体重资料 第十章 【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12 次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表10—2,试作分析。 表10—2 不同食欲增进剂仔猪生长情况表 (单位:kg) 解答:参见协方差分析操作 实验设计(3因素3水平)正交表 表格设计例: 表一两种化肥对花卉的增重量 水平因素 样品编号 1 2 3 4 1 65 45 90 80 2 75 55 82 98 操作部分 一、T test 1、One-sample T Test ①、输入 ②、操作 执行菜单Analyze—compare means—One-sample T Test 弹出One-sample T Test对话框 将V AR002(数据)放入Test Variable中,在Test Value框中输入待与之比较的值。点击”OK” 2、Independent T test ① ②、操作 A 执行菜单Analyze—compare means—Independent-samples T Test B 弹出Independent-samples T Test对话框,将V AR002(数据)放入Test Variable中,V AR001(分组)放入Grouping Variable 中 C 点Define Groups,在弹出的对话框中的Group1和Group2中分别填入V AR001中的两个数,点continue D 点击OK 3、paired-samples T Test ① ②操作 A 执行菜单Analyze—compare means—paired-samples T Test B 弹出paired-samples T Test对话框,同时选定VAR001和V AR002放入paired Variables 中 C 点击OK 二、ANOVA 1、One-Way ANOV A ①输入 ②操作 A 执行菜单Analyze—compare means—One-Way ANOV A B 弹出One-Way ANOV A对话框,选定V AR001放入Factor框中,V AR002放入Dependent List 中 C 设置选项卡: a :保持默认设置,执行Continue b :选择LSD或Duncan,执行Continue c :勾选Descriptive和Homogeneity of Variance test,执行Continue D 点击OK 2、Univariate 协方差 ①输入 (即初重),V AR002中输入第二组数据(即饲喂后的体重),V AR003一列为分组标记(即对照,处理1、……)。 ②操作 A 执行菜单Analyze—General Linear Model—Univariate,弹出Univariate对话框 B 将V AR002(因变量)放入Dependent Variable中,V AR003(固定因素)放入Fixed Factor(s) 中,V AR001(协变量)放入Covariate(s)中。 C 设置选项卡:a :选择Custom,将V AR001和V AR003同时选中后放入 Model框中,并选择Main effects,执行Continue b :将Contrast设为simple,并选中first,点选Change,执行 Continue c :将V AR003放入Display Means for框中,并勾选Compare main effects,在Display中选中Homogeneeity tests,执行 Continue D 点击OK 三、Correlate and Regression 1、Correlate ①输入 定义变量:如羊的体重和胸围的关系,分两列 ②操作 A 执行菜单Analyze—Correlate—Bivariate,弹出Bivariate Correlations对话框 B 将V AR001(体重)和V AR002(胸围)同时放入Variable框中 C 选中Correlation Coefficients中的Pearson,默认Two-tailed D 点击OK 2、Regression ①输入 定义变量:如:天鹅的雏重和70日龄重,以两列输入 ②操作 A 执行菜单Analyze—Regression—Curve Estimation,弹出Curve Estimation对话框 B 将V AR002(70日龄重)放入Dependent中,V AR001(雏重)放入Independent的Variable框中 C 勾选Model中的一到若干个模型 D 点击OK 云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0 ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm ) 生物统计学复习 一、选择题(在每小题给出的四个选项中,选择正确的一项。每小题2分,共计20分) 1.某一变数Y 服从正态分布()10,10N ,当以10n =进行随机抽样时,样本平均数大于12 的概率为( B )。 A 、0.005 B 、0.025 C 、0.05 D 、0.01 2.偏态分布资料的集中趋势描述宜用( C )。 A 、算术均数 B 、标准差 C 、中位数 D 、四分位数间距 3.单个方差的假设测验用( B )测验。 A 、u B 、2χ C 、t D 、F 4.两样本均数不一致,t 检验时P>0.05,可以说这种差异是( A )。 A 、抽样误差 B 、总体均数不同 C 、样本均数不同 D 、样本数不同 5.正态分布曲线与横轴之间的总面积等于( D )。 A 、次数总和n B 、次数总和n +1 C 、0.95 D 、1 6.对一批棉花种子做发芽试验,抽样1000粒,得发芽种子850粒,若规定发芽率达90% 为合格,测验这批种子是否合格的显著性为( A )。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 7.对于一组呈正态分布的计量资料,若对每一个个体同减去一个不为零的数,则( B )。 A 、均数、标准差均不变 B 、均数变、标准差不变 C 、均数、标准差均改变 D 、均数不变、标准差改变 8. 下列哪个P 值通常推论为差异有统计意义( D )。 A 、P>0.1 B 、P>0.05 C 、P<0.5 D 、 P<=0.05 9. 方差分析的主要目的是比较( A )。 A 、总体均数之间的差异性 B 、样本均数之间的差异性 C 、总体方差之间的差异性 D 、总体变异系数之间的差异性 10. 对于同一组资料,哪个指标没有考虑到每个观察值的变异( D )。 A 、方差 B 、总体标准差 C 、变异系数 D 、四分位差 11. 在统计分析中,最常用的反映变量集中趋势的统计数是( A )。 A 、算术平均数 B 、几何平均数 C 、调和平均数 D 、众数 12. 试验误差主要是由( D )的差异引起。 A 、水平 B 、处理 C 、供试因素 D 、非试验因素 重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16] 生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同? 生物统计学考试题及答案 重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96 统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x 第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )( 《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是 考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128 生物统计学 姓名: 班级: 学号: 第一章概论 一、填空 1 变量按其性质可以分为_______变量和_______变量。 2 样本统计数是总体_______的估计量。 3 生物统计学是研究生命过程中以样本来推断_______的一门学科。 4 生物统计学的基本内容包括_______、_______两大部分。 5 统计学的发展过程经历了_______、_______、_______3个阶段。 6 生物学研究中,一般将样本容量_______称为大样本。 7 试验误差可以分为_______、_______两类。 二、判断 ()1 对于有限总体不必用统计推断方法。 ()2 资料的精确性高,其准确性也一定高。 ( ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。()4 统计学上的试验误差,通常指随机误差。 三、名词解释 样本 总体 连续变量 非连续变量 准确性 精确性 第二章试验资料的整理与特征数的计算 一、填空 1 资料按生物的性状特征可分为_______变量和_______变量。 2 直方图适合于表示_______资料的次数分布。 3 变量的分布具有两个明显基本特征,即_______和______。 4 反映变量集中性的特征数是_______,反映变量离散性的特征数是_______。 5 样本标准差的计算公式s=_______。 二、判断 ( ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。( ) 2 条形图和多边形图均适合于表示计数资料的次数分布。 ()3 离均差平方和为最小。 ()4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。()5 变异系数是样本变量的绝对变异量。 三、名词解释 资料 数量性状资料 质量性状资料 计数资料 计量资料 普查 抽样调查 全距(极差) 组中值 算数平均数 中位数 众数 几何平均数 方差 标准差 变异系数 生物统计学复习题库新 编 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 1.统计推断主要包括(假设检验)和(参数估计)两个方面。 2.参数估计包括(点)估计和(区间)估计。 3.假设检验首先要对总体提出假设,一般要作两个:(无效)假设和(备择)假设。 4.在频率的假设检验中,当np 或nq (<)30时,需进行连续性矫正。 1.根据对处理效应的不同假定,方差分析中的数学模型可以分为(固定模型)、(随机模型)和(混合模型)3类。 2.在进行两因素或多因素试验时,通常应设置(重复),以正确估计试验误差,研究因素间的交互作用。 3.在方差分析中,对缺失数据进行弥补2时,应使补上来数据后,(误差平方和)最小。 4.方差分析必须满足(正态性)、(可加性)和(方差同质性)3个基本假定。 5.如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有(平方根转换)、(对数转换)、(反正弦转换)等。 6.一个试验的总变异依据变异来源分为相应的变异,将总平方和分解为:(处理间平方和)与(处理内平方和)。 变量之间的关系分为(函数关系)和(相关关系),相关关系中表示因果关系的称为回归。 2、一元线性回归方程 中,a 的含义是(样本回归截距),b 的含义是(样本回归系数)。 可用个体间的(相似程度)和(差异程度)来表示亲疏程度。 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 1.事件A 的发生和事件B 的发生毫无关系,则事件A 和事件B 为互斥事件。(× ) 2.二项分布函数C n x p x q n-x 恰好是二项式(p+q )n 展开式的第x 项,故称二项分布。( × ) 1 2 2--∑∑n n x x )(n /σx σ?y a bx =+ 生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计 上称为( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F分布的临界值为 0.25 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15. 已知随机变量x服从 N (8,4),P(x < 4.71)= 0.05 。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450, 450,500, 550, 550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000 生物统计学期末复习题 库及答案 https://www.360docs.net/doc/261549619.html,work Information Technology Company.2020YEAR 第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )( 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空 《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 ) 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 [ 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 1.统计推断主要包括(假设检验)和(参数估计)两个方面。 2.参数估计包括(点)估计和(区间)估计。 3.假设检验首先要对总体提出假设,一般要作两个:(无效)假设和(备择)假设。 4.在频率的假设检验中,当np 或nq (<)30时,需进行连续性矫正。 1.根据对处理效应的不同假定,方差分析中的数学模型可以分为(固定模型)、(随机模型)和(混合模型)3类。 2.在进行两因素或多因素试验时,通常应设置(重复),以正确估计试验误差,研究因素间的交互作用。 】 3.在方差分析中,对缺失数据进行弥补2时,应使补上来数据后,(误差平方和)最小。 4.方差分析必须满足(正态性)、(可加性)和(方差同质性)3个基本假定。 5.如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有(平方根转换)、(对数转换)、(反正弦转换)等。 6.一个试验的总变异依据变异来源分为相应的变异,将总平方和分解为:(处理间平方和)与(处理内平方和)。 变量之间的关系分为(函数关系)和(相关关系),相关关系中表示因果关系的称为回归。 2、一元线性回归方程 中,a 的含义是(样本回归截距),b 的含义是(样本回归系数)。 可用个体间的(相似程度)和(差异程度)来表示亲疏程度。 1.对于有限总体不必用统计推断方法。(×) ' 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 1 2 2--∑∑n n x x )(n /σx σ?y a bx =+ 《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()生物统计学期末考试上机考试部分 复习试卷B
生物统计学复习
生物统计学考试题及答案
生物统计学期末考试题
生物统计学考试题及答案
生物统计学期末复习题
生物统计学期末复习题库及答案
《生物统计学-2019》复习题
生物统计学考试试卷及答案
生物统计学习题集
生物统计学复习题库新编完整版
生物统计学试题及答案
生物统计学期末复习题库及答案
《生物统计学》期末考试试卷
生物统计学复习题库
《生物统计学》试题A