统计学试卷2008a

统计学试卷2008a
统计学试卷2008a

中国科学院武汉教育基地

2007—2008学年第一学期期末考试试卷

课程名称:生物统计学

考试时间:2008年1月21日下午2:30-5:00

一、选择题(每题选择一个最佳答案。每小题1分,共17分)

1、为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地

2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()。

A、该地所有20-29的健康女性

B、该地所有20-29的健康女性的血红蛋白测量值

C、抽取的这2000名20-29岁女性

D、抽取的这2000名20-29岁女性的血红蛋白测量值

2、下列说法正确的是()。

A.系统误差可以完全消除B.随机误差可以完全消除

C.两种误差都可以完全消除D.两种误差都不可以完全消除

3、算术均数与中位数相比,()。

A、抽样误差更大

B、不易受极端值的影响

C、更充分利用数据信息

D、更适用于分布不明及偏态分布资料

4、在一个右偏(峰在左边,右边有较长的尾巴)的分布中,反映集中趋势的数值

最大的是()。

A.中位数B.算数平均数C.众数D.几何平均数

5、对于标准正态分布变量,()范围内有90%变量值。

A、0~1.96

B、-1.96~1.96

C、-1.645~∞

D、-1.645~1.645

6、在抽样方式和样本容量不变的条件下,置信区间愈大,则()。

A.可靠性愈大B.可靠性愈小

C.估计的效率愈高D.估计的效率愈低

7、利用t分布构造置信区间的条件是()。

A.总体服从正态分布,且方差已知

B.总体服从正态分布,且方差未知

C.总体不一定服从正态分布,但要求是大样本

D.总体不一定服从正态分布,但要求方差已知

8、比较两药的疗效时,哪种情况应做单侧检验()。

A. 已知甲乙两药均有效

B. 不知甲乙两药哪种好

C. 已知甲药不会优于乙药

D. 不知甲乙两药是否有效

9、作两样本均数差别的t检验中,P值与α值中()。

A、α值是研究者指定的

B、P值是研究者指定的

C、两者意义相同,数值不同

D、两者意义相同,数值相同

10、对一批经过长途运输的货物损坏率是否超过0.003进行假设检验。假设途中

实际损坏率为0.0025,而决策人根据检验结果认为损坏率超过了0.003,这时()。

A.出现了第一类错误B.出现了第二类错误C.可能出现第一类错误,也可能出现第二类错误D.无法判断

11、当假设检验的显著性水平为α=0.01时,H

被拒绝,则当显著性水平改为

α=0.05时,H

()。

A.一定会被拒绝B.一定不会被拒绝

C.可能被拒绝,也可能不被拒绝D.无法判断

12、在两组资料比较的t检验中,结果为P < 0.05,差别有显著性。P愈小,则()。

A.说明两样本均数差别愈大B.愈有理由认为两总体均数不同

C.说明两总体均数差别愈大D.愈有理由认为两样本均数不同

13、完全随机设计的方差分析中,用SS表示离均差平方和,MS表示均方差,则必

有()。

A、SS组内

B、MS组内< MS组间

C、MS总=MS组间+MS组内

D、SS总=SS组间+SS组内

14、协方差分析中,根据各组的x平均数对y进行矫正,要求x与y之间()。

A.相关 B.建立回归方程C.独立D.有显著回归关系

15、将100名病人随机等分成两组后分别给予A、B方案治疗,疗效按等级

划分为治愈、好转和无效。欲知两种方案的疗效何者较优,宜作()。

A.两样本均数比较的t检验B.两组多类构成比比较的2检验

C.两样本率比较的假设检验D.两样本比较的秩和检验

16、变量x和y的相关系数r = 0.5,如果建立y对x的回归模型,则y的变异中

由于引入了自变量x而使总平方和减小的部分占了()。

A.25% B.50% C.75% D.45%

17、在多元线性回归模型y=A+B

j x

j

中,若自变量x

j

对因变量y的影响不显著,则

它的回归系数B

j

的取值可能是()。

A.0 B.1 C.小于0 D.大于1

二、填空题(每空1分,共18分)

1、在对连续型变量进行统计描述时,平均水平指标,如均数、 ,反映变量的 趋势;而变异指标,如标准差、 ,则反映变量的 趋势。

2、若)(~2l χξ、)(~2k χη,且ξ、η相互独立,则ξ + η服从 分布。

3、某地大规模调查显示健康人血清总胆固醇的99%置信区间为 4.742~5.258 mmol/L ,则它的95%置信区间为 。

4、对于有14个样本的双变量正态分布资料,对其回归系数b 进行F 检验,结果F =4.0。如果这两个变量的相关系数r 进行t 检验,则t = ,这两个变量 (是/不是)相关的(注t 0.05, 12=1.782)。

5、为了建立最优多元线性回归方程,则其中应该包含所有对因变量 的自变量,而不包含 的自变量。

6、研究样品或变量的亲疏程度的数量指标有两种,一种是 ,另一种是 。

7、在进行聚类分析时,既可以对 进行聚类,也可以对 进行聚类。

8、在生存分析中,生存时间是指从起始事件至 事件所经历的时间间隔,截尾数据是指从起点至 所经历的时间。

9、因子分析利用某个问题中可直接测量的、 的诸指标间接反应少数几个在专业上有意义、但不可直接测量且 的因子的状态。

三、是非题(在小题号后面分别打“√”和“×”,每小题1分,共15分) 1、个体间的变异是抽样误差的主要来源。

2、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。

3、即使变量X 偏离正态分布,只要样本含量相当大,从X 抽取的样本均数也近似正态分布。

4、Possion 分布的拟合优度检验结果p>0.05,就证明该事物的分布是随机的。

5、在嵌套设计中,次要因素的各个水平是嵌套在主要因素的水平下的,因而在统计时不能分析其交互作用。

6、k 组(k ≥ 3)均数经方差分析不全相等时,其中两组均数的差数用LSD 法检验显著,用Duncan 法或S-N-K 法检验则一定显著。

7、由于样本观察结果具有不确定性,故不能根据样本推论总体。 8、正态分布资料也可用非参数统计方法作分析,但平均统计效能偏低。 9、在单因素方差分析中,要求各组均数相差不大。

10、单因素随机区组实验资料的方差分析,实质上就是两因素不具重复观察值的

方差分析。

11、在正交设计中,通过方差分析得到的不同变量的不同水平的最优组合可以不

包含在试验设计的水平组合中。

12、两样本率的比较可采用u检验,也可采用四格表2检验。

13、如果X与Y存在相关关系,则一定存在回归关系。

14、在建立判别函数时,训练样本的分类准确程度对其判别效率没有太大的影响。

15、在主成分分析中,数据越相关,降维效果就越好。

四、简答题(每小题5分,共10分)

1.与标准正态分布比较,t分布的图形有什么特点?(3分)t分布有哪些应用?(2分)

2.某研究人员采用不同浓度的含铅饲料喂养大白鼠幼鼠,以观察铅污染对幼鼠脑铅含量的影响,资料如表4-1:

表4-1 不同铅浓度的饲料对幼鼠脑铅含量的影响

组别染毒剂量(mg/L)N脑铅x± SD(10-4

高剂量组306 6.418 ± 0.772

低剂量组106 5.226 ± 0.627

对照组06 4.778 ± 0.579

研究者用成组比较t检验对三组脑铅浓度做假设检验,结果表明:高剂量组与对照组差别有统计学意义(P < 0.05),而低剂量组与对照组、高剂量组的差别均无统计学意义(P > 0.05)。

你认为此分析方法是否合理,为什么?(3分)如果此分析方法不合理,请提出你认为合理的分析方法(根据此例的情况写出基本步骤,不必给出公式和具体计算)(2分)。

五.计算分析题(每小题5分, 共10分)

1. 应用两种药物治疗心血管病的疗效比较如表5-1。

表5-1 两种药物治疗后心血管病病人的病死率

药物死亡生存合计病死率(%)

甲药15 (a)25 (b)40 (a+b)37.5 (p1)

乙药 5 (c)25 (d)30 (c+d)16.7 (p2)

合计20 (a+c)50 (b+d)70 (n) (pc)

1)本次试验中,所有被观察病人的平均病死率(pc )是多少?(1分) 2)经甲、乙药两药治疗后,心血管病的病死率是否有区别?(2分) 提示:四格表2

检验的专用公式:

3)如果用SPSS 的crosstable 过程中的2

检验比较两种药物治疗后心血管病的

病死率是否相同,请将表5-1中数据填入下表,并给变量栏(Variables )的各变

量以合适的命名。(2分)

2. 随机抽取某种3年龄鱼100尾,测量他们的体长(x )和体重(y ),经过计算得到如下结果:平均体长21cm ,方差(mean square deviation )是9cm 2;平均体重120g ,标准差(standard deviation )是5g ,这两个变量的相关系数r = 0.9。

1)计算该样本中鱼体长和体重的变异系数(Coefficient of Variation ,CV ),并说明哪个变量的变异程度更大。(2分)

2)计算这两个变量的回归系数b ,并建立体重对体长的回归方程。(提示:XX YY l l r b =)

(2分) 3)试估计一尾体长27cm 的3年龄鱼的体重。(1分)

六、综合分析题(每小题10分, 共30分)

1、为了评价三种中风患者的康复方案,收集50名中风患者,按他们个人的意愿进行康复治疗,用康复量表评价他们的康复程度,收集资料如下表,利用SPSS 软件对三个康复方案组的语言功能的评分、肢体功能评分的正态性检验的结果见表6-1(score1为语言功能的评分,score2为肢体功能评分,sex=1为男性,sex=2为女性)。

。84.31)

)()()(()(2

1,05.022

==++++?-=

χνd b c a d c b a n

bc ad χVariables:

p x12p x12p x12 116352216345317449 126348215545318253 126238226559326857 127441228440326985 124948217143316945 116041217136315859 116643217250318559 126549226863327952 126540217642327055 126532216741327655

2)对语言功能评分进行康复方案组和性别组的两因素方差分析(不考虑两者

的交互作用),方差齐性检验的结果见表6-2,方差分析表见表6-3。请问两固定变

量的不同水平组合间方差是否齐同?不同性别患者的语言功能评分均数间是否相

等?不同康复方案组的语言功能评分均数间是否相等?(指出判断根据)(3分)表6-2SPSS output: Univariate Analysis of Variance

第3

表6-4 SPSS output: Univariate Analysis of Variance

Homogeneous Subsets

是否相

同?(指出判断根据)(2分)

表6-5SPSS output: NPar Tests

Kruskal-Wallis Test

如果不考虑康

? (2分)

2、在饮酒与食道癌(1=病例,0=对照)的成组病例对照研究中,共有200例食道癌患者和774例非食道癌对照,按年龄分组后资料如下:

年龄age 食道癌病例

饮酒(drink=1) 不饮酒(drink=0)

合计 25--34 1 1 0 1 0 9 106 115 35--44 1 4 5 9 0 26 164 190 45--54 1 25 21 46 0 29 138 167 55--64 1 42 34 76 0 27 138 165 65--74 1 19 36 55 0 18 88 106 75-- 1 5 8 13 1)用SPSS 对本例资料进行二分类变量logistic 回归分析的部分结果如表6-6。请问年龄与是否饮酒对食道癌的发病是否有交互作用?(指出判断根据)(2分)

表6-6 SPSS output: Logistic Regression

Block 1: Method = Enter

Variables in the Equation

.061.00951.8051.000 1.0631.737.877 3.9261.048 5.681.001

.016.0021.962 1.001-5.010

.484

107.016

1

.000

.007

age drink age by d rink Constan t

Step 1

a

B

S.E.

Wald df

Sig.

Exp(B)

Variable(s ) entered on s tep 1: age, dri nk, age * dri nk .

a.

型的各自变量的偏回归系数、Wald

2

检验以及OR 值的输出结果见表6-8。请问

这个模型是否有统计学意义(指出判断根据)?饮酒组的食道癌发病率是不饮酒组的多少倍?表6-8中年龄组一栏中Exp(B)=1.064的生物学意义是什么?(6分)

表6-7 SPSS output: Logistic Regression

Block 1: Method = Enter

Block 1: Method = Enter

在回过分析前应该进行怎样的设置?(2分)

3. 某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(week,周)如下:

甲疗法组(treat = 1): 1 3 3 7 10 15 15 23 30

乙疗法组(treat = 2): 5 7+ 13 13 23 30 30+ 38 42 42 45+生存时间右上角带“+”者为截尾数据(result = 0),其余数据为完全数据(result = 1)。

1)如果用SPSS的lifetable过程对此例进行生存分析,生命表的部分输出结果如表6-9,请完成表中最后一栏累计生存率的计算(保留小数点后两位)。(2分)

表6-9SPSS output: Survival Analysis

Survival Variable: week

3061 5.5002.36.64()

4031 2.5002.80.20()

2)欲用SPSS的Kaplan-Meier过程比较不同疗法脑瘤患者的生存时间,试将下图左边方框中的各变量名填入右边对应的方框中。(3分)

3)Kaplan-Meier过程的部分结果如表6-10,请问不同疗法组脑瘤患者的半数生存期(ST

50

)分别是多少?(2分)

表6-10SPSS output: Survival Analysis

Kaplan-Meier

Means and Medians for Survival Time

treat

Mean (a)Median

Estimat

e

Std.

Error

95% CI

Estimate

Std.

Error

95% CI

Lower

Bound

Upper

Bound

Lower

Bound

Upper

Bound

111.889 3.281 5.45918.31910.000 5.0000.20019.800 229.520 4.35220.98938.05138.00010.00018.40057.600 Overal

l

21.347 3.36714.74727.94715.000 5.341 4.53225.468

4)假设本例所得到的各组半数生存期是对其总体的无偏估计,请问不同疗法

组脑瘤患者的ST

50

是否相同?(请给出假设检验的步骤和具体的计算过程)(3分)

(注:两总体均数比较的u 检验公式:2

2

2

121σσu u u +-=

(全卷完)

如有侵权请联系告知删除,感谢你们的配合!

相关主题
相关文档
最新文档