重庆医科大学医学统计学1

重庆医科大学医学统计学1
重庆医科大学医学统计学1

一. 名词解释

1. 调查研究与实验研究

调查研究是指研究者较被动地进行观察,希望尽可能减少或控制非实验因素干扰的研究。调查研究可以在相应的人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组,与实验研究相比,调查中涉及的混杂因素较多,所需样本量较大,资料必须做多因素分析。 实验研究是指研究者主动安排实验因素,控制实验条件,排除非实验因素干扰的研究。也是指对研究对象人为施加干预的研究。在干预前,研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间的差异。 调查研究常为实验研究提供线索,实验研究成果又须回到现场实践中去验证。 两者的区别为:1.处理因素能否由研究者主动设置。2.对象能否随机分组。3.样本大小不同。4.混杂因素多少不同。5.统计方法应用不同。6.严谨性,重现性不同。

2. 分层抽样,整群抽样,分层整群抽样

分层抽样:是先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。 整群抽样:是先将总体分成若干群体,形成一个抽样框,从中随机抽取几个群体组成样本,对抽中群体的全部个体进行调查。 分层整群抽样:先将总体全部个体按某种特征分为若干层,在所有层内实施整群随机抽样的方法。 分层抽样的优点:抽样误差小;对不同层可采用不同抽样方法;可对不同层独立进行分析。缺点:需要掌握对抽样对象的分层特征;抽样工作量大。使用范围:主要用于控制重要混杂因素影响。 整群抽样的优点:便于组织;节省经费;容易控制调查质量。缺点:抽样误差较大;群间变异较大;抽样误差较大。使用范围:适用抽样总体很大的情况。

3. 数值变量资料与分类变量资料

数值变量资料(计量资料):是指通过度量衡的方法,测量每一个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位和多为连续性资料。 分类变量资料(计数变量):指将全体观察单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量衡单位和多为间断性资料。

4. 点估计值与95%可信区间

点估计值:就是直接用样本统计量的一个数值来估计总体参数,例,基于一份随机样本,用均数x 作为总体均数u 的一个估计,用样本的标准S 作为总体标准差o 的一个估计,即直接用样本统计量X+_S 作为总体参数u+-0的估计值。点估计方法简单,但未考虑抽样误差,故难以反映估计值对其真值的代表性。 区间估计:将样本统计量和标准误结合起来,按预先给定的概率(1—a )所确定的一个包含未知总体参数的范围,该范围为总体参数的置信区间(CI )。预先给定的概率(1—a )称为可信度或置信度,常取95%或99%。 95%可信区间:按预先给定的概率0.95用一个区间来估计总体均数,这个区间称为可信度0.95的可信区间(CI )或置信区间,预先给定的0.95称为可信度或置信度。

5. X+-1.96S 与X+-Ta/2 S x

s x 96.1±:表示从正态总体中抽样,样本含量较大时,观测值双侧95%的波动范围,常用来制定参考范围,判断某人的某一指标是否正常。 x v s t x ?±)(2/α:从正态总体中抽样,样本含量较大(小)时,按照预先给定的概率a 确定的总体均值的(1—a )的可信区间,表示该区间有(1—a )的可能性包括总体均数。

6. OR 与 RR

RR :相对危险度,表示暴露于某种危险因素观察对象的发病(死亡)危险度(P1)与无暴露因素组(或低暴露)观察对象发病危险度(P0)的比值。 当RR=1时,表示该因素对疾病的发病无影响; 当RR>1时,表示该因素为危险因素,它使发病危险度增大; 当RR<1时,表示该因素为保护因素,它使发病危险度减小。 优势:指某病患者组(或非患者组)中某种危险因素存在的比例P (e )与不存在的比例(1-P(e))的比值称为优势。 OR :优势比,病例组有暴露因素的优势与对照组有暴露因素的优势比值。 OR>1表示有暴露因素的人患某病的机会或优势与对照组相比增加,为危险因子。 OR<1表示有暴露因素的人患疾病的机会(或优势)减少,为保护因子。 OR=1意味无论暴露出线与否,与疾病关系不大。 OR 为比值比,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。是反映疾病与暴露之间关联强度的指标。 RR 为相对危险度,是反映暴露与发病(死亡)关联强度的最有用的指标。表明暴露组发病或死亡的危险是非暴露组的多少倍。RR 值越大,表明暴露的效应越大,暴露与结局关联的强度越大。 两者都是指暴露者的疾病危险性为非暴露者疾病危险性的多少倍,但是RR 多用于队列研究,OR 用于病例对照研究。

7. r 与 b

r :描述样本资料的两个变量之间线性相关性的相关系数称样本线性相关系数,用符号r 表示。在实际工作中,总体线性相关系数是未知的,通常用样本线性相关系数r 进行估计,其取值范围为-1到1,r>0表示正相关;r<0表示负相关,r=0表示不相关。相关系数的绝对值越接近1,来那个个变量 的线性相关程度越强;相关系数越接近0,两个变量的线性关系越弱,r=1时称完全正相关,r=-1称完全负相关。其资料条件为双变量正态分布或Y 为正态分布。 b :样本直线回归系数,当X 变换一个单位时Y 的平均改变的估计值,b>0,Y 随X 的增大而增大,b<0,Y 随X 的减小而减小。b=0,X 与Y 无直接关系。其资料条件为双变量正态分布。 两者相同点:1.均为数量协同变化研究2.同一资料,两者方向一致3,同一资料,两者假设检验一致4均有一定的线性范围5bxy 。Byx=r2 两者不同点:1含义不同2两者表达式不同3两者应用范围不同:直线相关应用于流行病学,探索性实验研究,直线回归应用于实验室工作曲线研究。 b r (1)概念 样本直线回归系数 样本直线相关系数

(2)计算公式 ∑∑∑∑∑--=n X X n Y X XY b /)(/))((22 r=∑∑----22)()())((y y x x y y x x

(3)统计意思 当X 变化一个单位时Y 的平均改变的估计值。b>0,Y 随X 的增大而增大;b<0,Y 随X 的增大而减小。 具有直线关系的两变量间相关的密切程度与相关方向。r>0为正相关,r<0为负相关。

(4)资料条件 双变量正态分布,或Y 为正态分布。 双变量正态分布

8. 1-a 与1- b

1-a :在假设检验中,拒绝Ho ,犯I 类错误的概率,1-a 越大,所需样本量越小,一般要求1-a 在0.95以上。 1-b :在假设检验中,不拒绝Ho ,犯II 类错误的概率,1-b 越大,所需样本量越大一般要求1-b 在0.8以上,b 一般只取单侧。 假设检验中,无论是接受还是拒绝原假设均有可能犯错。如拒绝了一个实际成立的原假设,所犯错误称为Ⅰ类错误,其概率记为α(1分);如接受了一个实际不成立的原假设,所犯错误称为Ⅱ类错误,其概率记为β(1分);当样本含量确定时,α越大,则β越小,反之,α越小,则β越大(1分),如拟同时降低α与β,则需增大样本含量(1分)。

9. 完全随机设计与随机区组设计

完全随机设计:是指将同质的受试对象随机分到各处理组进行实验观察或从不同总体中随机抽样进行对比的研究。优点:设计及统计分析简单。缺点:试验效率不高,只能分析单因素。 随机区组设计:讲受试对象按某些特征或条件配成对子,然后分别把每对中的两个受试对象随机分配到实验组和对照组,再给予每对中的个体以不同的处理,连续试验若干对,观察对子间的差别无意义。优点:把条件一致的研究对象编入同一区组并分配于各研究组,使各研究组之间的可比性更强,能改善组间均衡性,即缩小了误差,又可分析处理组间和配伍组间两因素的影响,试验效率较高。缺点:分组较繁,临床几乎不可能做的。 完全随机设计将全部实验对象完全随机分配到处理因素各水平,通过比较各组均数来判定处理结果(2分);随机区组设计指全部实验对象按区组与处理分配,即先根据对象的自然属性或对实验有影响的非处理因素分为几个区组,再于每一组中随机抽取分配到各处理水平的分配方式(2分)。

10. LR(+)与LR (-)

LR(+):阳性释然比,是筛查结果的真阳性率与假阳性率之比。表示正确判断阳性的可能性是错误判断阳性可能性的倍数。其比值越大,试验结果阴性时为真阳性的可能性越大。 LR(-):阴性释然比,是筛查结果的假阴性率与真阴性率之比。表示错误判断阴性的可能性是正确判断阴性可能性的倍数。其比值越小,试验结果阴性时为真阴性的可能性越大。 筛检的阳性预报率:表示某种诊断方法预测阳性结果的正确率,即诊断结果为阳性者实际患病的概率。 筛检的阴性预报率:表示某种诊断方法诊断结果为阴性者实际未患病的概率。

11. 定量测量的一致性 与 定性测量一致性

定量测量的一致性:

定性测量的一致性:、

12. 信度和效度

信度:即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具能否稳定地测量所测得事务或变量。信度指标多以相关系数表示。

效度:即有效性,它是指测量工具或手段能够测量出所需测量的事物的程度。效度分为三种类型:内容效度,准则效度和结构效度。

13.定量测量的精密度与准确度

精密度:是指对同一个标本进行多次重复测定时,测量值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。此值越小,说明测定方法重现性越好。

准确度:是指测量值与真值的接近程度,用于说明测定方法有无系统误差。一般偏离100%较大时,则测定方法存在系统误差。

精密度与准确度均为评价检测方法可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使精密度高,也不能采用此方法;当测量方法的精密度差时,其准确度也不会高。

14.独立测定与重复测定

独立测定:对一群观察指标独立测定一次,形成一个群体数据,观察值间相互独立,不互相影响。

重复测定:是指对同一研究对象的某一观察指标在不同的场合进行的多次测量。各测量数据之间有关联。

15.关联分析与趋势分析

关联分析:是研究有相互作用(对称关系)或单向作用(不对称关系)的两变量取值或取值频数是否存在影响与联系的统计分析方法。较趋势分析内涵广,适用资料广,但量化含义相对粗狂。适用于社会调查资料分析,对于定量变量一般不计方向。特点:1变量搭配形式多2多为静态3统计量关联系数无量纲4关联或影响不分正负5统计量只表达关联程度6一般区分愿意变量和结果变量7原因变量不参与计算分析

趋势分析:针对一个变量随另一个变量的数量变化有规律地发生线性,非线性数量协边关系,研究其协变关系规律的统计分析方法,存在自变量和应变量。特点:1简单分析变量搭配形式少,复杂分析变量搭配形式多2静态和动态分析3相关统计量无量纲,回归统计量有量纲4相关联或影响的正负之分5相关统计量表达密切回归统计量表达协变比例6回归分析要区分原因和结果变量,相关分析不区分7两个变量同参与计算分析

16.诊断试验的敏感度和特异度

诊断试验的敏感度:是指某处理因素存在时所选指标能反应出一定效应。某病中真病人的阳性率,表示对真病人的确诊能力。

诊断实验的特异度:是指某处理因素不存在时所选指标不显示处理效应。某病人中非病人的真阴性率,表示对非病人的鉴别和排除能力。

17.筛查试验的结构预报率与人群预报率

筛查试验的结构预报率包括:阳性预测值和阴性预测值

筛查试验的阳性预测值:指试验阳性结果中真正患病(真阳性)的比例

阳性预测值=A/(A+B) 100%

筛查试验的阴性预测值:指试验阴性者不患目标疾病的可能性。

阴性预测值=C/(C+D) 100%

人群预报率:PV’(+)=Sen.Po/Sen.Po+(1-Spe)(1-Po)

PV’(- ) =Spe.(1-Po)/Spe.(1-Po)+(1-Spe)Po

18..原因变量与结果变量

原因变量:原因变量是指研究者主动操纵,而引起结果变量发生变化的因素或条件,因此原因变量被看作是结果变量的原因。原因变量有连续变量和类别变量之分。如果实验者操纵的原因变量是连续变量,则实验是函数型实验。如实验者操纵的原因变量是类别变量,则实验是因素型的

结果变量:

二.填空

(1).三项思维:1从研究主体自身方向思考;2从研究客体方向思考;3从研究工具和方法方向思考

(2)设计原则的目的:随机化——1代表性 2避免混杂因素;设置均衡对照——1选定参照物2避免混杂;足够的n——1增加代表性2提高科学性;盲法运用——避免各类人的心灵因素的影响

(3)十种变量:性质——数值,分类,等级,哑;作用——原因,结果,协,混;测量——表象,潜

(4)诊断方法设计的四原则:随机化,设置均衡对照,足够的n,盲法运用。

(5)临床论文具有普遍性的要点:均衡性检验,纳入数据集汇总与描述,效果分析,安全性评价,偏性分析

①均衡性检验(影响结果的对比组结构性要一致);

②纳入数据集汇总与描述;

③效果分析:包括统计差异性检验和临床差异性检验(优效性检验、等效性检验、非劣效性检验);

④安全性评价(医学伦理学要求)。

(6)生存分析方法各有几种及各自特点:1.寿命表法-大样本描述2小样本资料的Kaplan-Meier法-小样本描述3生存曲线比较的非参数假设检验log-rank法——两样本比较4 Cox回归法—多样本比较

种类:寿命表法、Kaplan-Meier法、log-rank生存曲线比较法、Cox回归法

使用条件:有某慢性病患者从起点事件(最初确诊、开始正规治疗)到终点事件(出现某种治疗反应、治疗失效或死亡)过程经历的时间记录。

(7)三个基本要素各有什么要求:处理或观察因素(处理或观察因素是什么,观察因素必须标准化、维持不变,处理因素施加途径,混杂因素)、对象(研究客体对象的随机性、同质性、独立性、数量性、反应性、依从性;客体对象分组对比结构均衡性、可比性、混杂与偏倚;客体对象在研究中的安全性及评价、效应指标

(客体对象效应指标客观性、特异性、量效关系、方法精准度;客体对象效应指标性质、分布、特征数(集中、离散)、参考值)

(8 )方差分析的条件和两两比较:①各样本是相互独立的随机样本,均服从正太分布;②各样本的总体方差相等,即方差齐性

(9)直线回归分析的条件:①因变量Y与自变量X呈线性关系;

②每个个体观察值之间相互独立;

③在一定范围内,任意给定X值,对应的随机变量Y都服从正态分布;

④在一定范围内,不同的X值所对应的随机变量Y的方差值相等。

(10)影响样本含量的条件:1鉴别大小2波动性鉴别3矛盾性有多大4 。。5单双侧

统计选择:①欲比较的两总体参数的差值;②有关总体变异的信息;③第一类错误概率的大小;④第二类错误概率或检验功效的大小。

1单向有序列联表:原因变量为等级变量资料,结果变量为二值变量资料可做趋势性卡方分析。双向有序列联表:双向等级列联表可做相关分析。

2诊断实验准确度的三类评价指标:(1)基本指标:①敏感度;②特异度;(2)综合指标:①准确度;②尤登(金)指数;③阳性似然比;④阴性似然比;(3)其他指标:①结构预报率,包括阳性预报率及阴性预报率;②人群预报率,包括人群阳性预报率及人群阴性预报率。

3、医学参考值范围:①抽取足够例数的同质“正常人”样本;②确定具有实际意义的统一测量标准;③根据指标的性质确定是否要分组;④根据指标含义确定单、双侧范围;⑤选择适当的百分范围,一般常用95%或99%医学参考值范围;⑥根据资料的分布类型选择相应的计算制定医学参考值范围的方法。

4 测定方法学研究指标系统

系统误差指在一定条件下,由于某种偏因,使测量结果倾向性偏大或偏小而形成的较大测定误差,包括恒定误差和比例系统误差。

抽样误差:由于抽样原因引起的样本均数与总体均数的差别。

5 P值的意义为:从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际欲拒绝3 \* MERGEFORMAT 0H可能犯I类错误的概率。

6 二项分布与泊松分布概率表达式(P63---65)

7变量分类思维与变量关系

(1)不考察原因变量,只对单结果变量进行分析:参数估计和参考值制定;分布拟合和聚积性分析;自相关分析(2)考察一个(或综合)原因变量,推断或分析其对单结果变量的影响①对比性分析:完全随机与两组、随机区组与配对、重复测定、分层分析;②趋势预报分析:一重直线回归(曲线回归)、2×C表3 \* MERGEFORMAT 2x 趋势。

(3)考察多个原因变量,推断或分析其相对或共同对单结果变量的影响①对比性分析:交叉、析因、裂区系统、正交、协调性分析;②趋势预报分析:多重线性或非线性回归。

1、方差分析的两两比较

方差分析是用于两个及两个以上样本均数差别的显著性检验。

(1)多个https://www.360docs.net/doc/651136717.html,/view/5826246.htm" \t "_blank" 样本均值间两两比较

多个样本均值间两两比较常用q检验的方法,即Newman-keuls法,其基本步骤为:建立检验假设-->样本均值排序-->计算q值-->查q界值表判断结果。

(2)多个实验组与一个对照组均值间两两比较

多个https://www.360docs.net/doc/651136717.html,/view/1547248.htm" \t "_blank" 实验组与一个对照组均值间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q'界值表。

2、四格表和双向有序分析

(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料,就根据各格的理论值T和总例数n的大小选择不同的χ2计算公式:

①当n≥40且所有的T≥5时,用χ2检验的基本公式χ2=∑(A-T)2÷T (A为实际频数 T为理论频数)

或四格表资料检验的专用公式χ2=[(ad-bc)2*n]/[(a+b)(c+d)(a+c)(b+d)];

②当n≥40但有1≤T<5时,用四格表资料χ2检验的校正公式χc2=Σ[(|A-T|-0.5)/T]或改用四格表资料的Fisher确切概率法;

③当n<40或T<1时,用四格表资料的Fisher确切概率法。或资料满足两样本率的u检验的条件,也可用u检验。

(3)对于配对设计的四格表资料,若检验两种方法的检测结果无差别时:①当(b+c)≥40时,χ2=(b-c)2/(b+c);②当(b+c)<40时,χc2=(|b-c|-1)2/(b+c)。

3、诊断实验研究的指标系统

Sen=a/(a+c) 真阳性率, 1-Sen=c/(a+c) 假阴性率

(2)特异度

Spe=d/(b+d) 真阴性率, 1-Spe=b/(b+d) 假阳性率

综合指标:

(1)准确度(a+d)/N

(2)尤登(金)指数 YI=Sen+Spe-1=Sen-(1-Spe) 真阳性率-假阳性率

(3)阳性似然比LR(+)真阳性率/假阳性率=Sen/1-Spe

(4)阴性似然比 LR(-)假阴性率/真阴性率1-Sen/spe

其它指标P86

(1)结构预报率 PV(+)=a/a+b;PV(-)=d/c+d

(2)人群预报率PV(+)’=Sen*P0/Sen*P0+(1-Spe)(1-P0) PV(-)’=Spe*(1-P0)/Spe*(1-P0)+(1-Sen)P0

4、医学参考值范围

医学参考值:是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值.由于个体间存在差异,生物数据在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。

正态分布法:

双侧:平均值+ us

单侧:小于平均值--uαS 或大于平均值+ uαS

百分位数法:

常用u值表

5、P值的含义

P值(P value):假设检验中的P值是指由原假设H0所规定的总体做同样的重复试验,获得等于及大于(或等于及小于)当前检验统计量的概率。(即原假设为真时所得到的样本观察结果或更极端结果出现的概率)。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据https://www.360docs.net/doc/651136717.html,/view/640673.htm" \t "_blank" 小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P 值的大小和实际问题来解决

6. 测试方法学的研究指标系统P84

随机误差:

m轮,每轮n次测定的批内精密度

批间精密度

日间精密度连续20天的固定标本随机插入实验结果离散度表达

工作曲线精密度(1)重复性精密度(2)再现性精密度

系统误差:

回收率%=(基底样品加标后测量-原样品值)/ 加标值 x 100%

7.二次分布与泊松分布的概率表达式

二项分布的概率表达式:

P=C(X,n)*π^X*(1-π)^(n-X)

式中的n为独立的试验次数,π为成功的概率,(1-π)为失败的概率,X为在n次试验中出现成功的次数,表示在n次试验中出现X的各种组合情况,在此称为二项系数。

所以含义为:含量为n的样本中,恰好有X例阳性数的概率。

泊松分布的概率表达式::

p://https://www.360docs.net/doc/651136717.html,/baike/s%3D220/sign=047a7e59810a19d8cf03830703f882c9/50da81cb39dbb6fd9aa3c2ce0824ab18

962b3759.jpg" \* MERGEFORMATINET

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。泊松分布适合于描述单位时间内随机事件发生的次数。

泊松分布的期望和方差均为https://www.360docs.net/doc/651136717.html,/view/504485.htm" \t "_blank" λ。

8.定量与定性的一致性 P 72

Kappa分析 Kappa=(P A-Pe)/(1-Pe)

0.75

0.4

0

P A实际一致率 Pe期望一致率

9样品的含量分析P88

(1)单一敏感度(特异度)估计

m=1.962Sen(1-Sen) ÷敏感度估计误差一半L2

mˊ=1.962Spe(1-Spe)÷Lˊ2

(2)ROC曲线下面积估计

10.变量分类思维

变量分为数值变量、分类变量(分类变量又分为无序分类变量和有序分类变量)

数值变量:变量值是定值,表现为数值大小,一般有度量衡单位。如:身高。体重。血压。

计量资料:由一群个体的数值变量值构成的资料,即一群变量值。如:身高170cm

无序分类变量:变量值是定性的,有类别。特点:类别客观存在,无秩序,可任意排列。如:性别:男、女。血型:O、A、B、AB

计数资料:一群个体按无序分类的类别清点每类有多少个个体,即分类个体数。如:男10女8.血型:O20、A35、B11、AB13

四.问答题

1.三要素及其基本内容

三要素包括:处理或观察因素,对象,效应指标

处理或观察因素(处理或观察因素是什么,观察因素必须标准化、维持不变,处理因素施加途径,混杂因素)、对象(研究客体对象的随机性、同质性、独立性、数量性、反应性、依从性;客体对象分组对比结构均衡性、可比性、混杂与偏倚;客体对象在研究中的安全性及评价、效应指标(客体对象效应指标客观性、特异性、量效关系、方法精准度;客体对象效应指标性质、分布、特征数(集中、离散)、参考值)

2.问卷的评价

(1).提问方式“十不要”的检查1过于专业化的问题;2多项提问;3诱导提问4否定提问5提问敏感性问题6问题叙述不能过长7提出脱离对象所处环境和水平的未知领域问题8提出抽象概念问题9违背顺序10跳跃式问题过多

(2)信度和效度的考核。信度考察稳定性和可重复性,包括:重测信度(时间间隔重测,同时重本重测),分半信度,内部一致性信度;效度考察有效性和准确性,包括:表面效度,内容效度,结构效度,标准关联效度

(3)关于反应度的考评

(4)可接受性评价:1简单性2对象对问题的熟悉性3利益相关性-积极性,参与性4易填写性5时间短促。考察指标为:回收率,有效回收率(合格率),平均填表时间。

3.诊断方法评价的基本指标及综合运用

诊断方法评价的基本指标:(1)敏感度Sen=a/a+c真阳性率,1-Sen=c/a+c假阴性率(2)特异度

Spe=d/b+d真阴性率,1-Spe=b/b+d假阳性率

诊断方法指标系统的综合运用-估算求医者诊断验后概率

验前比数=验前概率/1-验前概率

验后比数=验前比数*S释然比

验后概率=验后比数/1+验后比数

4.为什么多组资料不能用独立样本的t检验

多组计量资料比较时,若按预先给定的检验水准a采用t检验的方法时,其检验水准a的计算公式为a=1-(1-a)k,k假设检验次数。当k>=2,即比较的样本数多于两个时,a会增大,超过研究者设定的检验水准a,则会犯第一类错误的概率增大,即拒绝实际上成立的HO,接受H1,可能将实际上无差异的两个总体误判为有差异,造成了假阳性。

5.比例系统误差与恒定系统误差

系统误差指在一定条件下,由于某种偏因,使测量结果倾向性偏大或偏小而形成的较大测量误差,包括恒定误差和比例系统误差。

比例系统误差是在系统误差中与真实值固定形成比例的一种误差,常表现为周期性,非线性。

恒定系统误差是不随某些测量条件变化的系统误差,常表现为恒定,线性。

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

研究生医学统计学试题

试卷编号:卷课程名称:医学统计学适用专业:科学学位专业:班级 姓名:学号:学院 (系 ):考试日期:题号一二三四五六七八九十总分统分题分30152530100签名得分 考生注意事项: 1、本试卷共6 页,请查看试卷中是否有缺页或破损。如有立即举手报告以 便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题(每题 2 分,共 30 分) 得评阅 把每题的答案填入下表中: 123456789101112131415 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势,以指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料,X +1.96S,所对应的面积占总面积的。 A. 95% ; B. 99% ; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、大,表示用该样本均数估计总体均数的可靠性小。 A. S X; B. S; C.CV; D. Q U—Q L 6、某地 1992年随机抽取 100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为 4g/L ,则其 95%的可信区间为。

7、两样本均数比较的t 检验,分别取以下检验水准,以所取第二类错误最大。 A. α =0.01; B. α=0.05; C. α =0.10; D.α=0.20 8、两样本均数比较的t 检验结果, P<0.05 ,可认为。 A. 两样本均数不等; B. 两样本均数相等; C. 两总体均数不等; D. 两总体均数相等 9、完全随机设计的方差分析结果,P≤ 0.05,可认为。 A. 各样本均数不等或不全等; B. 各样本均数都不相等; C. 各总体均数不等或不全等; D. 各总体均数都不相等 10、某地某年肝炎发病人数占总人数的5%,这是该地该年肝炎的。 A. 年发病率; B. 年患病率; C. 患病构成比; D. 患者平均数 11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是。 A.将两县的总死亡率直接比较; B.对年龄进行标准化后,再比较两县总死亡率; C.将两县的总死亡率进行 t 检验后再比较; D.将两县的总死亡率进行χ2检验后再比较 12、下面哪一点不是Poisson 分布的性质。 A. λ =σ2; B. 当λ≥ 20 时,近似正态分布; C. 可加性; D. 相互影响性 13、χ2检验中理论数T 的计算式为。 A. n r (1 n c ) ; B. (1 n r ) n c; C. n r n c; D. n r n c N N N N 14、已知两组计量资料方差不齐,可用检验。 A. t 检验; B. U 检验; C. F 检验; D. 秩和检验 15、对一组既做相关分析又做回归分析的资料,有。 A. b=r ; B. t b=t r; C. b=a; D. r=1

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学教学大纲

医学统计学教学大纲 一、课程的性质、任务 《医学统计学》是开展医学研究的重要手段,是认识和揭示医学领域里各种数量特征的科学分析方法,是使医学科研得以成功的一种重要辅助工具。科技的迅速发展,大量信息的产生要求我们面对纷乱复杂的数据世界能够正确、科学地去认识和处理,医学统计分析是医学生教育培训必修课程,特别是中、高级医学人才的培养,应该使其懂得和掌握一些基本的医学科研设计原则或实验研究方法,能正确处理医学信息和数据,在未来的实践工作中发挥作用。医学统计是一种有力工具。它同科研的总体设计、资料采集、整理、分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。数据作为信息的主要载体广泛存在。我们就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。 (本大纲规定教学时数为62学时,理论讲授38学时,实习或讨论24学时) 二、课程教学目标 本教学大纲适用于大专检验专业学生。同学在具备一定医学基础知识后,再通过本课程的学习使学生理解和知道随着现代医学的发展,正确地运用统计学方法和理念,进行实验设计和实验数据处理,系统地学习统计学使学员对医学科研工作的认识和提高自身文化素质和业务水平,具有十分重要的实际意义。 大纲中应当体现理论联系实际的原则,教学过程中完全采用医学中的实例,讲述基本概念及基本原理,注意贯彻启发式教学原则,把统计思维方法的训练作为课堂教学的内容,对于统计公式着重讲解其意义、使用方法、应用条件和应用时注意事项,不必追究公式的数学原理和推导过程。本课程通过讲授、课堂实习、课堂讨论,使学生熟悉统计的基本理论、掌握统计方法的应用,通过课后复习、完成作业,加深对基本理论和基本概念的理解,进一步掌握基本方法。理论讲授38学时,实习或讨论24学时 【教学内容分作三级要求】 第一级是学生必须掌握的内容,教师应于理论课详细讲授,亦为实习课与考试的重点。 第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。 第三级为一般了解内容,供学有余力的学生自学,教师亦可选择性讲授,但不在考试范围内。 三、教学内容和要求

2001级研究生医学统计学试卷

2001级研究生卫生统计学试卷 2002.1.5. 姓名学号得分 一.选择题:(每小题2分,共30分) ( d )1.在众多的变异指标中,有一种可以用以比较单位不同的两组定量资料(同一组内的数据单位相同)的变异性大小,它就是: (A)标准差(B)相关系数 (C)标准误(D)变异系数 (d )2.在进行显著性检验时,通常要先给定α值,根据样本数据计算出某统计量的值之后便可计算出一个p值来。可以说α值与p值之间有如下关系: (A)p=2α(B)p=α (C)p与α值在数量上有关,但无法简单地将其表达出来 (D)p与α值在数量上无关,但可按它们之间的大小作出统计推断 ( d )3.有些人在处理定量资料时习惯于用多次t检验代替方差分析和两两比较,这样做将会导致: (A)计算量增大(B)假阴性错误率增大 (C)试验误差大(D)假阳性错误率增大 ( b )4.为了解两种治疗方法对原发性肝癌的疗效,随机把病人分成两组,一组用5-氟尿嘧啶+辅助治疗,另一组用安慰剂+辅助治疗。治疗结果按缓解、死亡划分。第 一组12人,7人缓解、5人死亡;第二组11人,4人缓解、7人死亡,要分析两 种疗法的治疗效果之间的差别有无显著性意义,应选用的统计方法是: (A)χ2检验(B)Fisher的精确概率 (C)t检验(D)秩和检验 (a )5.某医生测得男、女各50人淋巴细胞计数L(%)(即占白细胞数的百分比),想用成组设计资料的t检验分析男、女两性之间的差别有无显著性意义,在作检验前 最好对数据作()变换。 (A)平方根(B)对数(C)平方根反正弦(D)倒数 ( a )6.有5份血清的抗体效价分别为:1:80、1:20、1:320、1:40、1:640,最合适反映此资料平均水平的指标是: (A)几何均数(B)算术均数(C)中位数(D)标准差 ( b )7.若分析肺活量和身高之间的数量关系,拟用身高值预测肺活量值,则采用(A)相关分析(B)直线回归分析 (C)方差分析(D)χ2检验 ( c )8.用二项分布直接计算概率法检验,H0:π=0.45,H1:π<0.45,当随机样本含

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

《医学统计学》样题一

《医学统计学》样题一 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 1. 样本率与总体率差别的假设检验可用。 A 四格表直接概率法计算 B 四格表χ2检验 C 不能检验 D 由样本率制定总体率的可信区间来判断 E 以上都不是 2.在抽样研究中,当样本例数逐渐增多时_____。 A 标准误逐渐加大 B 标准差逐渐加大 C 标准差逐渐减小 D 标准误逐渐减小 E 标准差趋近于0 3.2008年某乡卫生院接诊结核病患者100人,其中男性76人,女性24人,分别占76%和24%,则可以推断出的结论为。 A 该病男性易患 B 该病男女患病率不同 C该病女性易患 D 该病男女发病率不同 E 尚不能得出男女间患病率孰高孰低的结论 4.要减少抽样误差,通常的做法是_____。 A 适当增加样本例数 B 将个体变异控制在一个范围内 C 减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P<0.05 P值越小,则获得的结论是。

A 两样本均数差别越大 B 两总体均数差别越大 C 越有理由说两总体均数不同 D 越有理由说两样本均数不同 E 越有理由说两总体均数差别很大 6 在两样本均数比较的t检验中,无效假设是_____。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E样本均数等于总体均数 7.要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是。 A 用该市8岁女孩身高的95%或99%正常值范围来评价????????? B 作身高差别的假设检验来评价 C 用身高均数的95%或99%可信区间来评价 D 不能作评价 E 以上都不是 H是_____。 8.两个独立样本秩和检验时的 A 两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D 两总体分布相同 E 两总体分布没有关联 9.在配对设计数值变量资料的对比分析中,配对的目的是为了。 A 提高测量精度 B 操作方便 C 应用t检验 D 提高组间可比性 E 减少实验误差 10.配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数据,两次t检验的结果_____。 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E 结论可能相同或相反 11. 总体是由组成的。 A 部分个体 B 全部个体 C 相同的观察指标 D 全部研究对象 E 同质个体的所有观察值 12.关于构成比,不正确的是。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小

医学统计学样题一

《医学统计学》样题一 班别:___________ 姓名:________________ 学号:________________ 《中山大学授予学士学位工作细则》第六条:“考试作弊不授予学士学 位。” 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 4. 要减少抽样误差,通常的做法是______ 。 A适当增加样本例数 B 将个体变异控制在一个范围内 C减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P v P值越小,则获得的结论是_________ 。 A两样本均数差别越大 B 两总体均数差别越大 C越有理由说两总体均数不同 D 越有理由说两样本均数不同 E越有理由说两总体均数差别很大 6在两样本均数比较的t检验中,无效假设是________ 。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E 样本均数等于总体均数 7. 要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是_________

A用该市岁女孩身高的95%或99%E常值范围来评价 B作身高差别的假设检验来评价 C用身高均数的95%£ 99刑信区间来评价 D不能作评价 E以上都不是 8. 两个独立样本秩和检验时的H。是_____ 0 A两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D两总体分布相同 E 两总体分布没有关联 9. 在配对设计数值变量资料的对比分析中,配对的目的是为了___________o A提高测量精度 B 操作方便 C 应用t检验 D提高组间可比性E减少实验误差 10. 配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数 据,两次t检验的结果 ______ 0 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E结论可能相同或相反

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学研究生题库

医学统计学复习练习题库 研究生教材使用 一、最佳选择题 1.卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距

E.方差

7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ 12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标 (如血糖水平)的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. x s x μ- 2.统计分析的主要内容有

医学统计学样题及答案

1、某市1974年为了解该地居民发汞的基础水平,调查了留住该第一年以上,无明显肝、 肾疾病,无汞作业接触史的居民238人的发汞含量如下: 发汞值~~~~~~~~~~(mol/kg): 人数 20 66 60 48 18 16 6 1 0 3 (1)说明此频数分布的特征。 (2)选用何种指标描述其集中趋势和离散趋势 (3)估计该地居民发汞值的95%参考值范围 答:(1)偏态分布 (2)选用中位数描述集中趋势,四分位间距描述离散趋势 (3) 频数相对频数累积频数累积相对频数 ~2020 ~660.86 ~600.146 ~480.194 ~18212 ~16228 ~6234 ~1235 ~00235 ~32381合计238 =+(238×%-0)×2/20= =+(238×%-228)×2/6=

所以估计该地居民发汞值的95%参考值范围(,) 2、某市场出售一批番茄汁罐头,罐头内vc平均含量(mg/100g)是未知的。今从中抽取16 个罐头,经测定含量如下: 16,22,21,23,21,19,15,13,23,17,20,29,18,22,16,25 计算:(1)试问这批罐头内vc平均含量及95%区间估计 (2)假如另一批罐头vc平均含量为22mg/100g,试问这两批罐头vc含量是否相同 答:(1)样本平均值=20 样本标准差= 16开方=4 20-×4= 20+×4= , (2) 22∈, 所以含量相同 3、某药厂为了解其生产的某药物(同一批)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为,标准差,试估计该批药物有效成分的平均含量 答:该批药物有效成分的平均含量的95%可信区间为: (样本均值标准误,样本均值+标准误) 即:(,)

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

《医学统计学》教学大纲

《流行病学》教学大纲供临床医学专业使用 锦州医学院教务处 2003年5月

《流行病学》教学大纲 适用专业: 临床医学 总学时:24,其中理论学时:18、实验学时:6 一、课程的性质和任务 流行病学(Epidemiology)是研究特定人群中与健康相关的状态和事件的分布和决定因素并用以控制健康问题的学科。近数十年来,随着危害人类生命和健康疾病谱的变化,随着医学模式由单纯生物学向生物学、心理学、社会医学相结合模式的转变,流行病学的研究对象、研究方法、研究内容也在不断发展。到现在为止,比较一致认可的流行病学定义为:流行病学是研究人群中疾病与健康状态的分布及其影响因素,制定和评价预防、控制和消灭疾病的对策和措施,并评价这些对策和措施的效果。其研究对象已由仅研究传染病扩大到非传染性疾病,又从疾病扩大、引伸到健康和与健康有关的事件;研究内容既包括了描述“分布”,分析“决定因素”,又包括了研究、提出、评价预防、保健的对策与措施。由此可见流行病学既是一门方法学,又是一门应用性很强的学科。其研究范围已包括了与人类疾病和健康有关的一切问题。 通过本课程的教学使学生掌握流行病学的基本原理、方法和技能,拓宽学生的思路,开阔学生的视野,提高学生能够应用流行病学方法,在疾病的预防、健康促进、病因研究和预防效果评价等方面独立分析问题和解决问题的能力,为今后从事疾病预防和控制工作打下基础。 二、相关课程的衔接 本门课程的前继课程是:基础医学相关课程、计算机基础和医学统计学。 三、教学的基本要求 教学目的 培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为学习预防医学各类卫生专业课程奠定流行病学理论基础,也为今后在卫生防疫实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。 教学要求 1、基本理论理论课教学要根据教学大纲的要求,重点突出教授基本理论和基本知识,详细讲授和解释,同时注意教授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。内容精练,条理清楚,合理使用教学设备和教具。也可根据本章节的特点规定学生必要的自学内容。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

【免费下载】医学统计学课程教学大纲

《医学统计学》课程教学大纲 课程编号:140087 学分:1.5 总学时:34 大纲执笔人:刘艺敏大纲审核人: 一、课程性质与目的 使学生掌握医学统计学的基本理论知识、方法和技能,为其运用到医学实践,进行科学研究,学习其它课程和阅读专业书刊打下必要的统计学基础。 二、面向专业 临床医学专业、口腔医学专业五年制 采用多媒体演示教学和学生每人一台计算机操作,要求学生通过实习课重点掌握统计学的基本概念和不同资料的统计分析思路,同时要求学生基本掌握国际流行统计软件SAS或SPSS的使用方法,能用软件来完成课后的习题。并通过接触真实的科研资料,逐步引导学生提出分析思路、分析方法,直至用计算机软件完成统计分析的全过程。使学生在掌握统计学基本理论知识的基础上,进一步培养他们综合分析问题、动手解决问题的能力,拓宽学生的知识面,有利于学生实践能力和创新精神的培养。 三、课程基本要求 学习医学统计学应着重理解基本概念、基本理论,掌握收集资料、整理资料和分析资料的基本知识、基本技能。培养科学的统计思维方法。 四、实验基本要求 采用多媒体演示教学和学生每人一台计算机操作,要求学生通过实习课重点掌握统计学的基本概念和不同资料的统计分析思路,同时要求学生基本掌握能用软件来完成课后的习题。并通过接触真实的科研资料,逐步引导学生提出分析思路、分析方法,直至用计算机软件完成统计分析的全过程。使学生在掌握统计学基本理论知识的基础上,进一步培养他们综合分析问题、动手解决问题的能力,拓宽学生的知识面,有利于学生实践能力和创新精神的培养。 五、课程基本内容 第一章绪论 第一节统计学与医学统计方法 了解统计学与医学统计学的定义、医学统计学在医学研究中的应用。 第二节统计学基本概念 重点掌握内容:随机变量的概念及其分类-离散型变量及连续型变量;误差的定义,系统误差与随机误的概念;三种数据类型-计数资料、计量资料、等级资料及三者间的转换;总体与样本的概念,总体参数与样本统计量的概念,抽样误差的概念;概率与频率的概念。

研究生医学统计学试题

南昌大学医学院硕士生试卷 试卷编号: 卷 课程名称:医学统计学 适用专业: 科学学位 专业: 班级 姓名: 学号: 学院 (系 ): 考试日期: 题号 一 二 三 四 五 六 七 八 九 十 总分 统 分 题分 30 15 25 30 100 签名 得分 考生注意事项: 1、本试卷共 6 页,请查看试卷中是否有缺页或破损。如有立即举手 报告以便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题 (每题 2 分,共 30 分) 得 评 阅 把每题的答案填入下表中: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势,以 指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用 。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料, X +1.96S ,所对应的面积占总面积的 。 A. 95% ; B. 99% ; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述 资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、 大,表示用该样本均数估计总体均数的可靠性小。 A. S X ; B. S ; C.CV ; D. Q U —Q L 6、某地 1992 年随机抽取 100 名健康女性,算得其血清总蛋白含量的均数为 74g/L ,标准 差为 4g/L ,则其 95%的可信区间为 。

医学统计学试题及答案

《医学统计学》试题 一、选择题(1 —13题为单选,每小题 2分;14—16题为多选,每小题 3分,共35分) (一)单选题(选一个最佳答案;共 15题) 1. _______________________________________________ 比较身高和体重的变异度,应采用的 指标是 ______________________________________________________ A .标准差 B. 方差 C. 变异系数 D. 四分位数间距 E. 全距 2 .某地100名健康人血清总胆固醇的 95%丁信区间为4.804 ~ 5.196 mmol/L ,则相应的双侧 常值范围是 _______________ A. 5.00 ± 1.645 X 10 B. 5.00 ± 1.645 X 10 C. 5.00 ± 1.96 X 10 D. 5.00 ± 1.960 X 1 E. 5.00 ± 1.645 X 1 3. __________________________________________________ 比较两药的疗效时,哪种情况应 做单侧检验 ______________________________________________________ A.已知甲乙两药均有效 B. 不知甲乙两药哪种好 C.已知甲药不会优于乙药 D. 不知甲乙两药是否有效 E. 当a = 0.01时 4. 将100名病人随机等分成两组后分别给予 A 、B 方案治疗,疗效按等级划分为治愈、好 转、有效和无效。欲知两种方案的疗效何者较优,宜作 __________ A ?两样本均数比较的 t 检验 B ?两组多类构成比比较的 2 检验 E.观测值为计数资料 7.从样本得到变量 X 与Y 的相关系数r =0.92,则 ____________________ A. X 与Y 之间一定存在因果关系 B. 若对此份资料作回归分析, 其回归系数是正值 C. 若对此份资料作回归分析, 其回归系数是负值 95%正 C ?两样本率比较的假设检验 E ?线性相关分析 5. 作符号秩和检验时,记统计量 A. R 值越大P 值越小 B. C. P 值与R 值毫无联系 D. E.以上都不对 6. 以下 ____________ 不是析因分析的特点 A. 2 个以上因素 B. 2 C. 2个以上重复 D. D .两样本比较的秩和检验 R 为较小的秩和,则正确的是 R 值越大越有理由拒绝 H o R 值越小P 值越小 个以上水平 每次试验涉及全部因素,因素同时施加

相关文档
最新文档