医学统计学问答题(含答案)知识交流

医学统计学问答题(含答案)知识交流
医学统计学问答题(含答案)知识交流

简答题

0. 算术均数、几何均数和中位数各有什么适用条件?

答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。

(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。

(3)中位数:适用各种类型的资料,尤其以下情况:

A 资料分布呈明显偏态;

B 资料一端或两端存在不确定数值(开口资料或无界资料);

C 资料分布不明。

1.对于一组近似正态分布的资料,除样本含量n 外,还可计算

S X ,和S X 96.1±,问各说明什么?

(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势

(2)S 为标准差,说明正态分布或近似正态分布的离散趋势

(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。

2.试述正态分布、标准正态分布的联系和区别。 正态分布

标准正态分布 原始值X 无需转换

作u=(X-μ)/σ转换 分布类型 对称

对称 集中趋势 μ

μ=0 均数与中位数的关系

μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。

3.说明频数分布表的用途。

1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理

4.变异系数的用途是什么?

多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。

5.试述正态分布的面积分布规律。

(1)X 轴与正态曲线所夹的面积恒等于1或100%;

(2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。

6.试举例说明均数的标准差与标准误的区别与联系。

7.标准正态分布(u 分布)与t 分布有何不同?

t分布为抽样分布,标准正态分布(u分布)为理论分布。t分布比正态分布的峰值低,且尾部翘得更高。随着自由度的增大,t分布逐渐趋近于标准正态分布。即当自由度ν→∞时,t分布→标准正态分布。

8.均数的可信区间与参考值范围有何不同?

9.假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?

10.假设检验中 和P的区别何在?

11.t检验的应用条件是什么?

12.I 型错误与II 型错误有何区别与联系?

I 型错误是指拒绝了实际上成立的0H 所犯的“弃真”错误,其概率大小用α表示。II 型错误则是“接受”了实际上不成立的0H 所犯的“取伪”错误,其概率大小用β表示。当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小。

13.假设检验和区间估计有何联系?

假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。两者既互相联系,又有区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ;若不包含0H ,则按α水准,拒绝0H ,接受1H 。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。

14.为什么假设检验的结论不能绝对化?

因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝0H 时,有可能犯I 型错误;“接受” 0H 时可能犯II 型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。

15.方差分析的基本思想和应用条件是什么?

方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分 解为两个或多个组成部分,其总自由度也分解为相应的几个部分。例如完全随机设计的方差 分析,可把总变异分解为组间变异和组内变异,即SS 总=SS 组内+SS 组间,总的自由度也 分解为相应的两部分,即ν 总=ν 组内+ν 组间。 离均差平方和除以自由度得均方MS ,组间 均方(MS 组间)与误差均方(MS 误差)之比为F 值;如果各组处理的效应一样,则组间均方等 于组内均方,即 F =1;但由于抽样误差,F 值不正好等于1,而是接近 1;如果F 值较大, 远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义, 至于F 值多大才能认为差别有意义,可查F 界值表(方差分析用)来确定。

方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。

16.在完全随机设计方差分析中SS 组间、SS 组内各表示什么含义?

组间SS 表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;组内SS 表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。

17. 随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?

区别点

完全随机设计 随机区组设计 设计 采用完全随机化的分组方法,将全部试验

对象分配到g 个处理组(水平组),各组

分别接受不同的处理。

随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个受试对象数量相同,区组内均衡。 变异分解

三种变异:

总SS =组间SS +组内SS 四种变异:总SS =处理SS +区组SS +误差SS

18.以实例说明为什么不能以构成比代替率?

19.秩和检验的优缺点?

20.简述直线回归与直线相关的区别与联系。

联系:1对于既可做相关又可做回归分析的同一组数据,计算出的b 与r 正负号一致。

2相关系数与回归的假设检验等价,即对于同一样本,tb=tr

3同一组数据的相关系数和回归系数可以互相换算:r=by ,x*Sx/Sy

4用回归解释相关:由于决定系数总回ss ss r /2=,当总和平方和固定时,回归平方和的

大小决定了相关的密切程度,回归平方和越接近总平方和,则2r 越接近1,说明相关的效果越好。

二者的区别:(1)资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;胡桂要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y 如何依赖于X 而变化。(3)意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。

(4)计算上:xy xx xy l l l r //=,xx xy l l b /=

(5)取值范围:-1≤r ≤1,-∞

2、 二项分布、Poission 分布的应用条件 二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传 病除外),但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立 的结果;(2) n 次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。 Poisson 分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合 Poisson 分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n 次试验 相互独立;(3) n 应很大, P 应很小。

3、极差、四分位数间距、标准差、变异系数的适用范围有何异同? 答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点 为: 极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变 异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来 比较资料

的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。

4.中位数、均数、几何均数的适用条件有何异同。(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

5.第一类错误与第二类错误的区别与联系。当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。

6.运用相对数时要注意哪些问题?应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

7.方差分析后进行两两比较能否用t 检验?为什么?t 检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k 水平设计(k≥3)和多因素设计的定量资料的均值检验场合。方差分析有十几种,不同的方差分析取决于不同的设计类型。t 检验进行两两比较其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t 检验进行两两比较。误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。

参数检验与非参数检验的区别何在?各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。(2)优缺点:参数检验:优点是符合条件时,检验效能高。缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。故符合参数统计条件的资料,要首先选用参数统计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。

11.对于同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以何种结果为准。当资料满足参数检验方法的条件时,应使用参数检验方法,当资料不满足参数检验方法的条件时,必须采用非参数检验方法。

12、常见的统计图有哪些?如何根据资料的性质选用适当的统计图?常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。⑥散点图: 适用于成对数据,反映散点分布的趋势。

14.极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。

t检验、u检验和F检验的应用条件各是什么?

t检验的应用条件是:①σ未知而且n较小时,要求样本来自正态总体;②两小样本均数比较时,还要求两

样本所属总体的方差相等。u检验的应用条件是:①σ已知;②σ未知但样本含量较大。方差分析的应用条件是:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等。

2.普通线图和半对数线图在制作和应用中有何主要区别?

普通线图绘制时,纵轴的尺度为算术尺度,并且一般应从“0”开始;而半对数线图纵坐标的尺度为对数尺度,起点没有0。应用上,普通线图反映某事物随时间变动的趋势或某现象随另一现象变迁的情况;而半对数线图用来比较两种或两种以上事物物随时间变动的速度(相对比)。

应用相对数的注意事项应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。

简述非参数检验的适用资料。(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性。

简述进行直线相关回归分析应注意的事项(1)相关分析注意的事项相关系数r是用来描述两个变量间线性相关关系的密切程度和方向的统计指标。所以,如果目的是想定量地描述两个变量间相互关系的密切程度和方向,则应作相关分析。而且,r的绝对值大小,对利用回归方程进行变量预测具有指导意义,如果r 的绝对值很小,利用回归方程从一个变量预测另一个变量的值是没有多大意义的。应用相关分析时应注意的问题:①进行相关分析时要有实际意义,不能把毫无关联的两事物或现象作相关分析。②相关关系不一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响。③不能只根据相关系数绝对值的大小来推断两事物现象之间有无相关以及相关的密切程度,而必须进行相关系数的显著性检验。另外,不要把相关系数的显著性误解为两事物或现象相关的强度。④关于相关分析的样本的合并与分层问题,应审慎对待。⑤散点图在相关分析中具有重要作用,要充分利用。(2)回归分析的注意事项①作回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律。②直线回归分析的资料,一般要求因变量Y是来自正态分布总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严格控制的值。③进行回归分析时,应先绘制散点图。④绘制散点图后,若出现一些特大特小的离群值(异常点),则应及时复核检查。⑤回归直线不要外延。

均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

1、统计资料可以分成几类?

答: 根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。

2、不同类型统计资料之间的关系如何?

答: 根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资

料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。

3、频数分布有哪两个重要特征?

答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。

4、标准差有什么用途?

答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。

5、变异系数(CV)常用于哪几方面?

答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。

6、制定参考值范围有几种方法?各自适用条件是什么?

答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正态分布的原理,依据公式:

X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按: X±1.96S计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-1.645S,过高为异常者,计算X+1.645S。若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。②百分位数法。用P2.5~P97.5估计95%双侧参考值范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。

7、计量资料中常用的集中趋势指标及适用条件各是什么?

答: 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。

8、标准差,标准误有何区别和联系?

答: 标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。

9、统计推断包括哪几方面内容?

答: 统计推断包括: 参数估计及假设检验两方面。参数估计是指由样本统计量( 样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσX或

X±uS X来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。

10、假设检验的目的和意义是什么?

答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。

何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤: ①建立假设:包括: H0,称无效假设;H1: 称备择假设;②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。

12、假设检验有何特点?

答: 假设检验的特点是: ①统计检验的假设是关于总体特征的假设;②用于检验的方法是以检验统计量的抽样分布为理论依据的;③作出的结论是概率性的,不是绝对的肯定或否定。

13、如何正确理解差异有无显著性的统计学意义?

答: 在假设检验中,如P≤α,则结论是: 拒绝H0,接受H1,习惯上又称“显著”,此时不应该误解为相差很大,或在医学上有显著的(重要的)价值;相反,如果P>α,结论是不拒绝H0。习惯上称“不显著”,不应理解为相差不大或一定相等。有统计学意义( 差异有显著性)不一定有实际意义;如某药平均降低血压5mmHg,经检验有统计学意义,但在实际中并无多大临床意义,不能认为该药有效。相反,无统计学意义,并不一定无实际意义。如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。

15、X2检验有何用途?

答: X2检验有以下应用: ①推断两个或两个以上总体率(或构成比)之间有无差别;②检验两变量之间有无相关关系;③检验频数分布的拟合优度。

16、四格表资料的u检验和X2检验的应用条件有何异同?

答:(1) 相同点:四格表资料的u检验是根据正态近似原理进行的,凡能用u检验对两样本率进行检验的资料,均能使用X2检验,两者是等价的,即u2=X2;u检验和X2检验都存在连续校正的问题。(2) 不同点:由于u分布可确定单、双侧检验界值,可使用u检验进行单侧检验;满足四格表u检验的资料,可计算两率之差的95%可信区间,以分析两率之差有无实际意义;X2检验可用于2×2列联表资料有无关联的检验。

18、非参数检验适用于哪些情况?

答: 非参数检验应用于以下情况: ①不满足参数检验的资料,如偏态分布资料;②分布不明的资料;

③等级资料或开口资料。

20、常用的统计图有哪几种?它们的适用条件是什么?

答: 常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及园图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。⑥散点图: 适用于成对数据,反映散点分布的趋势。

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学基本概念

习题-医学统计学基本概念 选择题: 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压,调查某地1000 人,记录每人是否患有高血压。最后清点结果,其中有10 名高血压患者,有990 名非高血压患者。() A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指() A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是() A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级(轻、中、重) E.疾病疗效(有效、无效) 4、总体是由() A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是() A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是() A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样,下列哪一项说法是正确的() A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是() A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是:() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

医学统计学名词解释问答题

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

第二节 医学统计学的基础知识习题及答案

【单项选择题】 1. 医学统计学的主要内容不包括()。 A. 变量计算 B. 统计设计 C. 统计描述 D. 统计推断 【答案】A 【解析】P111;医学统计学的主要内容; 1)统计设计; 2)统计描述; 3)统计推断。 2. 医学统计工作的基本步骤不包括()。 A. 研究设计

B. 健康教育 C. 收集资料 D. 整理资料 【答案】B 【解析】P112;医学统计工作的基本步骤:研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。这4个步骤是紧密联系不可分割的,某一环节发生问题,都将影响最终的统计分析结果。 3. 描述集中趋势的指标有()。 A. 算数均数 B. 方差与标准差 C. 极差 D. 百分位数 【答案】:A 【解析】:P115;描述集中趋势的指标:

1)算术均数,简称均数; 2)中位数(median); 3)几何均数(geometry mean)。 4. 统计学中的总体是指()。 A. 根据研究目的确定的同质观察单位的全体 B. 根据地区划分的研究对象的全体 C. 根据时间划分的研究对象的全体 D. 根据人群划分的研究对象的全体 【答案】A 【解析】P114;总体( population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 5. 下列不属于离散趋势的描述指标是()。 A. 极差

B. 百分位数 C. 方差与标准差 D. 几何均数 【答案】D 【解析】P116;描述离散趋势的指标; 1)方差与标准差; 2)极差:亦称全距(range),用符号R表示; 3)百分位数(percentile):是一个位置指标,用符号Px表示;4)变异系数(coefficient of variation):用符号CV表。 而几何均数是描述集中趋势的指标。 6. 血清学滴度资料最常用来表示其平均水平的指标是()。 A. 算术平均数 B. 中位数

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

医学统计学名词解释及问答题

1、 总^(population):就是根据研究目得确泄得同质研究对象得全体。 2、 样本(sample):从总体中抽取得一部分有代表性得个体。 3、 同质(homogeneity):就是指所研究得观察对象具有某些相同得性质或特征。 4、 变异(variation):指同质个体得某项指标之间得差异。 5、 参数(parameter):反映总体特征得指标称为参数。 6、 统计量(statistic):通过样本资料il ?算出来得相应指标称为统计量。 7、 抽样误差(sampling error):由随机抽样造成得样本指标与总体指标之间、样本指标与样本指标 Z 间得差异。 8、 概率(probability):某事件发生得可能性大小。 9、 正态分布(normal distribution):高帐位于均数处冲间高两边低,左右完全对称地下降,但永远不与 横轴相交得钟形曲线。 10、 平均数(average):就是描述一组同质变量值得平均水平或集中趋势得指标。 11、 中位数(median):将一组数据由小到大排列,位于中间位置得观测值。 12、 医学参考值范@(medical reference range):X 称正常值范饥医学上常将包括绝大多数正常人得 某项指标得波动范围称为该指标得正常值范鬧。 13、 方差他I 伽CC):就是徉个数据与平均数之差得平方得平均数。 14、 标准差(standard deviation):就是各数据偏离平均数得距离得平均数,它就是离均差平方与平均 后得方根,用0表示。 15、 标准i^tstandard error):样本均数得标准差,等于原变量总体标准差除以例数得平方根,用以说明 均数抽样误差得大小。 16、 均数得抽样误差(sampling error of mean):由个体差异与抽样所导致得样本均数与样本均数之 间,样本均数与总体均数之间得差异。 17、 假设检验(hypothesistesting):先对总体做出某种假设,然后根据样本信息来推断其就是否成立 得一类统计方法得总称。 18、 统计推断(statistical inference):就是根据已知得样本信息来推断未知得总体,就是统计分析得目 得,包括参数估计与假设检验。 19、 I 型错误(type I error):拒绝了实际上成立得Hu.这类弃真错误,发生得槪率为Q,为已知。 20、 II 型错误(type II error):不拒绝实际上不成立得Ho,这类存伪错误,发生得概率为B ,未知。 21、 检验效能(power of test):又称把握度,为意义就是两总体确有差别,按a 水准能发现它们 有差别得能力。 可信区间(confidence interval):指总体参数可能所在得范围。 率(血⑹:说明某现象发生得频率或强度。 构成比(constituent ratio):^示某事物内韶^$组成部分所占得比重或分布,常以百分数表示。 相对比(relative ratio):表示两个有关事物指标之比,常以百分数与倍数表示,用以说明一个指标 就是另一个指标得几倍或百分之几。 26、 标准化率(standardized 臥C):亦称调整率,就是采用统一得标准对内部构成不同得各组频率进行 调整与对比得方法。 27、 参数检验(paramchic test):—类依赖于总体分布得具体形式得统计推断方法。 28、 非参数检验(non parametric test):-类不依赖总体分布类型得检验,在应用中可以不考虑被研究 对象为何种分布以及分布就是否已知,检验假设中没有包括总体参数得统计方法。 22 、 23、 24

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学 问答题

1、标准正态分布(u分布)与t分布有何异同? 相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。 3、简述直线回归与直线相关的区别。 1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。 2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。 第一章医学统计中的基本概念 2、抽样中要求每一个样本应该具有哪三性? 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。 3、什么是两个样本之间的可比性? 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 实习一统计研究工作的基本步骤 1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别? 医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科 统计学:是研究数据的收集、整理、分析与推断的科学。 卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。 2、医学统计的资料主要来源于那些方面?有何要求? 医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。 这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。 3、医学统计学的资料类型有哪些? (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数

相关文档
最新文档