统计学试卷2008a
中国科学院武汉教育基地
2007—2008学年第一学期期末考试试卷
课程名称:生物统计学
考试时间:2008年1月21日下午2:30-5:00
一、选择题(每题选择一个最佳答案。每小题1分,共17分)
1、为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地
2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()。
A、该地所有20-29的健康女性
B、该地所有20-29的健康女性的血红蛋白测量值
C、抽取的这2000名20-29岁女性
D、抽取的这2000名20-29岁女性的血红蛋白测量值
2、下列说法正确的是()。
A.系统误差可以完全消除B.随机误差可以完全消除
C.两种误差都可以完全消除D.两种误差都不可以完全消除
3、算术均数与中位数相比,()。
A、抽样误差更大
B、不易受极端值的影响
C、更充分利用数据信息
D、更适用于分布不明及偏态分布资料
4、在一个右偏(峰在左边,右边有较长的尾巴)的分布中,反映集中趋势的数值
最大的是()。
A.中位数B.算数平均数C.众数D.几何平均数
5、对于标准正态分布变量,()范围内有90%变量值。
A、0~1.96
B、-1.96~1.96
C、-1.645~∞
D、-1.645~1.645
6、在抽样方式和样本容量不变的条件下,置信区间愈大,则()。
A.可靠性愈大B.可靠性愈小
C.估计的效率愈高D.估计的效率愈低
7、利用t分布构造置信区间的条件是()。
A.总体服从正态分布,且方差已知
B.总体服从正态分布,且方差未知
C.总体不一定服从正态分布,但要求是大样本
D.总体不一定服从正态分布,但要求方差已知
8、比较两药的疗效时,哪种情况应做单侧检验()。
A. 已知甲乙两药均有效
B. 不知甲乙两药哪种好
C. 已知甲药不会优于乙药
D. 不知甲乙两药是否有效
9、作两样本均数差别的t检验中,P值与α值中()。
A、α值是研究者指定的
B、P值是研究者指定的
C、两者意义相同,数值不同
D、两者意义相同,数值相同
10、对一批经过长途运输的货物损坏率是否超过0.003进行假设检验。假设途中
实际损坏率为0.0025,而决策人根据检验结果认为损坏率超过了0.003,这时()。
A.出现了第一类错误B.出现了第二类错误C.可能出现第一类错误,也可能出现第二类错误D.无法判断
11、当假设检验的显著性水平为α=0.01时,H
被拒绝,则当显著性水平改为
α=0.05时,H
()。
A.一定会被拒绝B.一定不会被拒绝
C.可能被拒绝,也可能不被拒绝D.无法判断
12、在两组资料比较的t检验中,结果为P < 0.05,差别有显著性。P愈小,则()。
A.说明两样本均数差别愈大B.愈有理由认为两总体均数不同
C.说明两总体均数差别愈大D.愈有理由认为两样本均数不同
13、完全随机设计的方差分析中,用SS表示离均差平方和,MS表示均方差,则必
有()。
A、SS组内 B、MS组内< MS组间 C、MS总=MS组间+MS组内 D、SS总=SS组间+SS组内 14、协方差分析中,根据各组的x平均数对y进行矫正,要求x与y之间()。 A.相关 B.建立回归方程C.独立D.有显著回归关系 15、将100名病人随机等分成两组后分别给予A、B方案治疗,疗效按等级 划分为治愈、好转和无效。欲知两种方案的疗效何者较优,宜作()。 A.两样本均数比较的t检验B.两组多类构成比比较的2检验 C.两样本率比较的假设检验D.两样本比较的秩和检验 16、变量x和y的相关系数r = 0.5,如果建立y对x的回归模型,则y的变异中 由于引入了自变量x而使总平方和减小的部分占了()。 A.25% B.50% C.75% D.45% 17、在多元线性回归模型y=A+B j x j 中,若自变量x j 对因变量y的影响不显著,则 它的回归系数B j 的取值可能是()。 A.0 B.1 C.小于0 D.大于1 二、填空题(每空1分,共18分) 1、在对连续型变量进行统计描述时,平均水平指标,如均数、 ,反映变量的 趋势;而变异指标,如标准差、 ,则反映变量的 趋势。 2、若)(~2l χξ、)(~2k χη,且ξ、η相互独立,则ξ + η服从 分布。 3、某地大规模调查显示健康人血清总胆固醇的99%置信区间为 4.742~5.258 mmol/L ,则它的95%置信区间为 。 4、对于有14个样本的双变量正态分布资料,对其回归系数b 进行F 检验,结果F =4.0。如果这两个变量的相关系数r 进行t 检验,则t = ,这两个变量 (是/不是)相关的(注t 0.05, 12=1.782)。 5、为了建立最优多元线性回归方程,则其中应该包含所有对因变量 的自变量,而不包含 的自变量。 6、研究样品或变量的亲疏程度的数量指标有两种,一种是 ,另一种是 。 7、在进行聚类分析时,既可以对 进行聚类,也可以对 进行聚类。 8、在生存分析中,生存时间是指从起始事件至 事件所经历的时间间隔,截尾数据是指从起点至 所经历的时间。 9、因子分析利用某个问题中可直接测量的、 的诸指标间接反应少数几个在专业上有意义、但不可直接测量且 的因子的状态。 三、是非题(在小题号后面分别打“√”和“×”,每小题1分,共15分) 1、个体间的变异是抽样误差的主要来源。 2、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。 3、即使变量X 偏离正态分布,只要样本含量相当大,从X 抽取的样本均数也近似正态分布。 4、Possion 分布的拟合优度检验结果p>0.05,就证明该事物的分布是随机的。 5、在嵌套设计中,次要因素的各个水平是嵌套在主要因素的水平下的,因而在统计时不能分析其交互作用。 6、k 组(k ≥ 3)均数经方差分析不全相等时,其中两组均数的差数用LSD 法检验显著,用Duncan 法或S-N-K 法检验则一定显著。 7、由于样本观察结果具有不确定性,故不能根据样本推论总体。 8、正态分布资料也可用非参数统计方法作分析,但平均统计效能偏低。 9、在单因素方差分析中,要求各组均数相差不大。 10、单因素随机区组实验资料的方差分析,实质上就是两因素不具重复观察值的 方差分析。 11、在正交设计中,通过方差分析得到的不同变量的不同水平的最优组合可以不 包含在试验设计的水平组合中。 12、两样本率的比较可采用u检验,也可采用四格表2检验。 13、如果X与Y存在相关关系,则一定存在回归关系。 14、在建立判别函数时,训练样本的分类准确程度对其判别效率没有太大的影响。 15、在主成分分析中,数据越相关,降维效果就越好。 四、简答题(每小题5分,共10分) 1.与标准正态分布比较,t分布的图形有什么特点?(3分)t分布有哪些应用?(2分) 2.某研究人员采用不同浓度的含铅饲料喂养大白鼠幼鼠,以观察铅污染对幼鼠脑铅含量的影响,资料如表4-1: 表4-1 不同铅浓度的饲料对幼鼠脑铅含量的影响 组别染毒剂量(mg/L)N脑铅x± SD(10-4 高剂量组306 6.418 ± 0.772 低剂量组106 5.226 ± 0.627 对照组06 4.778 ± 0.579 研究者用成组比较t检验对三组脑铅浓度做假设检验,结果表明:高剂量组与对照组差别有统计学意义(P < 0.05),而低剂量组与对照组、高剂量组的差别均无统计学意义(P > 0.05)。 你认为此分析方法是否合理,为什么?(3分)如果此分析方法不合理,请提出你认为合理的分析方法(根据此例的情况写出基本步骤,不必给出公式和具体计算)(2分)。 五.计算分析题(每小题5分, 共10分) 1. 应用两种药物治疗心血管病的疗效比较如表5-1。 表5-1 两种药物治疗后心血管病病人的病死率 药物死亡生存合计病死率(%) 甲药15 (a)25 (b)40 (a+b)37.5 (p1) 乙药 5 (c)25 (d)30 (c+d)16.7 (p2) 合计20 (a+c)50 (b+d)70 (n) (pc) 1)本次试验中,所有被观察病人的平均病死率(pc )是多少?(1分) 2)经甲、乙药两药治疗后,心血管病的病死率是否有区别?(2分) 提示:四格表2 检验的专用公式: 3)如果用SPSS 的crosstable 过程中的2 检验比较两种药物治疗后心血管病的 病死率是否相同,请将表5-1中数据填入下表,并给变量栏(Variables )的各变 量以合适的命名。(2分) 2. 随机抽取某种3年龄鱼100尾,测量他们的体长(x )和体重(y ),经过计算得到如下结果:平均体长21cm ,方差(mean square deviation )是9cm 2;平均体重120g ,标准差(standard deviation )是5g ,这两个变量的相关系数r = 0.9。 1)计算该样本中鱼体长和体重的变异系数(Coefficient of Variation ,CV ),并说明哪个变量的变异程度更大。(2分) 2)计算这两个变量的回归系数b ,并建立体重对体长的回归方程。(提示:XX YY l l r b =) (2分) 3)试估计一尾体长27cm 的3年龄鱼的体重。(1分) 六、综合分析题(每小题10分, 共30分) 1、为了评价三种中风患者的康复方案,收集50名中风患者,按他们个人的意愿进行康复治疗,用康复量表评价他们的康复程度,收集资料如下表,利用SPSS 软件对三个康复方案组的语言功能的评分、肢体功能评分的正态性检验的结果见表6-1(score1为语言功能的评分,score2为肢体功能评分,sex=1为男性,sex=2为女性)。 。 。84.31) )()()(()(2 1,05.022 ==++++?-= χνd b c a d c b a n bc ad χVariables: p x12p x12p x12 116352216345317449 126348215545318253 126238226559326857 127441228440326985 124948217143316945 116041217136315859 116643217250318559 126549226863327952 126540217642327055 126532216741327655 2)对语言功能评分进行康复方案组和性别组的两因素方差分析(不考虑两者 的交互作用),方差齐性检验的结果见表6-2,方差分析表见表6-3。请问两固定变 量的不同水平组合间方差是否齐同?不同性别患者的语言功能评分均数间是否相 等?不同康复方案组的语言功能评分均数间是否相等?(指出判断根据)(3分)表6-2SPSS output: Univariate Analysis of Variance 表 第3 表6-4 SPSS output: Univariate Analysis of Variance Homogeneous Subsets , 是否相 同?(指出判断根据)(2分) 表6-5SPSS output: NPar Tests Kruskal-Wallis Test 如果不考虑康 ? (2分) 2、在饮酒与食道癌(1=病例,0=对照)的成组病例对照研究中,共有200例食道癌患者和774例非食道癌对照,按年龄分组后资料如下: 年龄age 食道癌病例 饮酒(drink=1) 不饮酒(drink=0) 合计 25--34 1 1 0 1 0 9 106 115 35--44 1 4 5 9 0 26 164 190 45--54 1 25 21 46 0 29 138 167 55--64 1 42 34 76 0 27 138 165 65--74 1 19 36 55 0 18 88 106 75-- 1 5 8 13 1)用SPSS 对本例资料进行二分类变量logistic 回归分析的部分结果如表6-6。请问年龄与是否饮酒对食道癌的发病是否有交互作用?(指出判断根据)(2分) 表6-6 SPSS output: Logistic Regression Block 1: Method = Enter Variables in the Equation .061.00951.8051.000 1.0631.737.877 3.9261.048 5.681.001 .016.0021.962 1.001-5.010 .484 107.016 1 .000 .007 age drink age by d rink Constan t Step 1 a B S.E. Wald df Sig. Exp(B) Variable(s ) entered on s tep 1: age, dri nk, age * dri nk . a. 型的各自变量的偏回归系数、Wald 2 检验以及OR 值的输出结果见表6-8。请问 这个模型是否有统计学意义(指出判断根据)?饮酒组的食道癌发病率是不饮酒组的多少倍?表6-8中年龄组一栏中Exp(B)=1.064的生物学意义是什么?(6分) 表6-7 SPSS output: Logistic Regression Block 1: Method = Enter 表 Block 1: Method = Enter 在回过分析前应该进行怎样的设置?(2分) 3. 某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(week,周)如下: 甲疗法组(treat = 1): 1 3 3 7 10 15 15 23 30 乙疗法组(treat = 2): 5 7+ 13 13 23 30 30+ 38 42 42 45+生存时间右上角带“+”者为截尾数据(result = 0),其余数据为完全数据(result = 1)。 1)如果用SPSS的lifetable过程对此例进行生存分析,生命表的部分输出结果如表6-9,请完成表中最后一栏累计生存率的计算(保留小数点后两位)。(2分) 表6-9SPSS output: Survival Analysis Survival Variable: week 3061 5.5002.36.64() 4031 2.5002.80.20() 2)欲用SPSS的Kaplan-Meier过程比较不同疗法脑瘤患者的生存时间,试将下图左边方框中的各变量名填入右边对应的方框中。(3分) 3)Kaplan-Meier过程的部分结果如表6-10,请问不同疗法组脑瘤患者的半数生存期(ST 50 )分别是多少?(2分) 表6-10SPSS output: Survival Analysis Kaplan-Meier Means and Medians for Survival Time treat Mean (a)Median Estimat e Std. Error 95% CI Estimate Std. Error 95% CI Lower Bound Upper Bound Lower Bound Upper Bound 111.889 3.281 5.45918.31910.000 5.0000.20019.800 229.520 4.35220.98938.05138.00010.00018.40057.600 Overal l 21.347 3.36714.74727.94715.000 5.341 4.53225.468 4)假设本例所得到的各组半数生存期是对其总体的无偏估计,请问不同疗法 组脑瘤患者的ST 50 是否相同?(请给出假设检验的步骤和具体的计算过程)(3分) (注:两总体均数比较的u 检验公式:2 2 2 121σσu u u +-= ) (全卷完) 如有侵权请联系告知删除,感谢你们的配合!