卫生统计学考前复习材料

卫生统计学考前复习材料
卫生统计学考前复习材料

基本概念

总体(population):根据研究目的确定同质观察单位(亦称个体)的全体。

样本(sample):从总体中随机抽取部分观察单位,其实测值的集合。

抽样:必须遵循随机化原则,从总体中抽取有代表性的部分观察值,使样本具有代表性。目的是为了用样本的信息(或统计量)推断总体的特征(或参数)。

同质与变异homogeneity & variation:统计学要求研究对象具有同质性,即研究对象的观察值具有相同属性。同一总体内的个体存在差异,这种现象称为变异,变异是绝对存在的。

概率(probability):是描述随机事件发生的可能性大小的数值,常用P表示,范围在0与1之间。

P越接近1,标明某事件发生的可能性越大;P越接近0,表明某事件发生的可能性越小;P≤0.05的事件称为小概率事件。

统计资料的类型:

1 . 定量资料(measurement data)用定量方法测量观察对象的某项指标所得的数值资料。一般有度量衡

单位。如身高、体重、浓度。

2 . 分类资料(enumeration data)将观察单位按某种属性或类别分组所得各组的观察单位数。

(1)二项分类:阳性、阴性。

(2)多项分类:A、B、O、AB血型。

3 . 等级资料(ranked data)将观察单位按某种属性的不同程度分组所得各组的观察单位数。如血清反应

分为-,+,++,+++,++++五级。

资料可以由高级向低级转化

计量资料:个体的血红蛋白(g/dl)

计数资料:正常人数、异常人数(按正常异常分组)

等级资料:0~,重度贫血

6~,中度贫血

9~,輕度贫血

12~,正常

16~,增高

(按血红蛋白量的多少分组)

统计工作的基本步骤:

1 . 设计,design

2 . 资料收集,collection data

3 . 资料整理,sorting data

4 . 资料分析,analysis data

统计描述、参数估计、假设检验、统计结论。

统计表:

基本要求:

1 . 标题

概括表达中心内容,简练、确切、必要时注明资料来源、事件,位于表的上方。

2 . 标目

文字简明,注明单位

3 . 线条

力求间接,上面顶线、下面底线,纵标目下面、合计上面横线,不需要竖线与斜线。

4 . 数字

表内数字一律用阿拉伯数字表示,同一指标的小数位数一致,位次对其,暂缺、无数据的用“-”或

“…”表示。数字左端对齐。

5 . 备注

如有备注,用“*”标出,注在表外下面。

统计图

基本要求:

1 . 根据资料性质和分析目的,正确选用图形。

2 . 要有确切的标题,说明资料内容。标题位于图的下方。

3 . 纵横两轴交点为起点。纵横轴尺度应等距,纵横轴长度比例5︰7。条图、直方图的纵坐标必须从“0”

开始。

4 . 同一图内比较几种不同事物时,用不同的线条或颜色表示,并附图例说明。

(1)线图:适用于表现连续变量资料的趋势变化

(2)直方图:以面积表示数量,适用于表示连续变量的频数分布。画直方图组距一定要相等。

(3)直条图:用等宽直条的长短来表示相互独立的各指标指数数值的大小。

(4)构成图:①圆图:各扇形面积表示全体中各部分所占的比重。

②百分条图:全长为100%,按构成比分段。

定量资料的统计描述

频数表:即频数分布表,是对样本量较大的资料进行统计描述的常用方法,通过频数表可以现实数据分布的范围与形态。

编著频数表时组距可等可不等,一般取相等组距;分组数与样本量有关,应适宜,不多也不少。

一、集中趋势的指标,平均数是用于描述一组同质计量资料的集中趋势或反应一组观察值的平均水平。

常用的平均数有算术均数、几何均数及中位数三种。

1 . 算术均数,简称均数。X表示变量X的样本均数,μ(希腊字母)表示总体均数,均数适用于对称分布资料,正态或近似正态分布资料。

直接法:样本量较小时用:

2.几何均数,用G表示,适用于对数正态分部的资料,例如抗体的滴度和平均效价。

直接法:样本量较小时用:

频数表法:当样本量较大时,编制频数表进行计算;

例题:某地6人接种某疫苗后,其抗体滴度如下:1︰2;1︰4;1︰4;1︰8;1︰16;1︰32,请问其平均

抗体滴度是多少?

平均抗体滴度是1︰7.13

例题:某地102名健康人的钩端螺旋体血清抗体滴度如表7-2,计算平均滴度。

3.中位数:将一组观察值从小到大按顺序排列,位次居中的观察值就称中位数,用M表示。

中位数适用于任何一种分布的计量数据,一般多用于描述偏态分布活数据一端无界资料的集中趋势。4.百分位数:是一种位置指标,用P x表示。

百分位数是一个有序数列百等分的分割值。第50百分位数(P50)也就是中位数,中位数是一个特定的百分位数。

二、离散趋势指标

描述离散趋势的常用指标有全距、四分位间距、方差和标准差等。

对于描述偏态资料的离散趋势宜用四分位间距,对于正态或近似正态资料宜用标准差。

标准差应用:

1.表示观察值的变异程度:在两组(或几组)均数相近、单位相同的条件下,标准差大,表示变量值的

变异程度法,均数的代表性较差;反之,标准差小,表示变量组变异度小,数据多集中在均数周围,则均数的代表性较好。

2.计算变异系数:单位不同时,不能用标准差表示变量值的离散趋势,只能用变异系数,单位相同但是

均数相差较大时,用标准差不太合理,用变异系数更好,变异系数用CV表示。变异系数是一种相对

的离散程度指标,它无单位:

3.结合均数描述频数分布的特征和制定医学参考值范围。

4计算标准误

例题:某地随即抽样调查了255名成年女性的红细胞数和血红蛋白,红细胞均数为4.18,标准差为0.29;

血红蛋白均数为117.6,标准差为10.2,请问女性红细胞数与血红蛋白的变异程度何者为大?

红细胞:

血红蛋白:

血红蛋白的变异程度大于红细胞数。

正态分布:

正态分布是一种连续型分布。正态分布以均数为中心,左右两侧对称,靠近均数两侧的频数较多,而距离均数两个较远处,频数逐渐减少,形成钟形分布。正态曲线下的面积分布有一定的规律。

正态分布的主要特征:①以均数μ为中心,左右对称。②Χ2取值范围理论上没有边界。Χ2离μ越远,函数f(X)值越接近0,但不会等于0。③正态分布曲线下的面积分布有一定的规律。④正态分布完

全由参数μ和σ决定。μ是位置参数(即平均水平),决定分布曲线在横轴的偏移位置。当σ一定后,μ增大,曲线右移;反之μ减小,曲线左移。σ是变异参数,决定分布曲线的形态。σ越大,曲线的形态越“矮胖”,表示数据分布越分散;σ越小,曲线的形态越“瘦高”,表示数据分布越集中。

标准正态分布(standard normal distribution)标准正态分布是均数μ为0、标准差σ为1的正态分布,即(μ,σ)=(0,1),亦称μ分布。

正态曲线下面积的分布规律:①曲线下横轴上的总面积为100%或1。②下面是应用较多的三个区间的面积分布规律:a.正态分布区间(μ-σ,μ+σ)下的面积,即μ±σ范围的面积占总面积为68.27%。

b.正态分布区间(μ-1.96σ,μ+1.96σ),即μ±1.96σ范围的面积占总面积为95.00%。

c.正态分

布区间(μ-2.58σ,μ+2.58σ),即μ±2.58σ范围的面积占总面积为99.00%。

正态分布的应用(医学参考值范围的估计)正态分布或样本含量较大的数据资料,95%的医学参考值范围为:(Χ-1.96S,Χ+1.96S)。对于偏太分布的数据资料,宜采用百分位数的方法进行确定。95%的医学参考范围为:P2.5~P97.5;单侧上界:P95;单侧下界:P5。

均数的抽样误差:由于存在变异,样本均数往往不够于总体均数μ。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。若要减

小抽样误差,只有增加样本含量。

标准误计算:标准误(理论值)是反映抽样误差大小的指标,用σX表示。

用某一样本标准差S来代替σ,得到标准误的估计值S X(通常也简称为标准误),其计算公式为:

t分布的特征:①t分布是以0为中心的左右对称分布曲线;②曲线形态变化与自由度υ的大小有关(υ与n有联系,这里υ=n-1)。自由度υ越大,t分布越接近于正态分布;自由度υ越小,t分布越低平,两端向外伸展。

t分布不是一条曲线,而是一簇曲线,因此,t分布曲线下面积的95%或99%界限不是一个常量,而是随着自由度大小而变化的。为便于使用,可根据t值表查找。

总体均数的可信区间亦称置信区间(CI),即按预先给定的概率(1-α,可信度)估计未知总体均数的所在范围。习惯上用总体均数的95%(或99%)可信区间,表示该区间包含总体均数μ的概率为95%(或99%)。用此估计范围估计总体均数,表示100次抽样中,有95(99)次包含总体均数。

σ未知,但样本例数n足够大,总体均数95%的可信区间可近似的表达为:

例题:测得某地101名30~49岁正常成年男子血清总胆固醇(mmol/L)平均值为4.735,标准差为0.882,求:①该地健康男子血清总胆固醇的正常值范围?②试估计该地健康成年男子血清总胆固醇均数。

①95%医学参考值范围为:

②95%均数可信区间:

假设检验的一般步骤:

⑴建立假设和确定检验水准——H0:无效假设,即样本均数所代表的总体均数μ与假设的总体均数μ0

相等,与μ0的差异是抽样误差所致。H1:被择假设,即样本均数所代表的总体均数μ与μ0不相等,与μ0差异是本质性差异。

假设检验有双侧检验和单侧检验之分,一般选用双侧检验。H0︰μ=μ0 ;H1︰μ≠μ0

确定检验水准:检验水准,用α表示,是假设检验时发生的一类错误的概率。α常取0.05

⑵选定检验方法和计算统计量——要根据研究设计的类型、统计推断的目的,选择适当的统计量。如

成组设计的两样本均数比较选择t检验,大样本时可选用近似的u检验。不同的检验统计量有不同的公式。

⑶确定P值,作出统计推论——根据P值大小作出拒绝或者不拒绝H0的结论。当P>0.05,则按0.05

水准不拒绝H0,(即H0存在的可能性是个大概率时间)。差别无统计学意义;当P≤0.05,则按0.05水准拒绝H0,不拒绝H1(即H0存在的可能性时个小概率时间),差别具有统计学意义。

t检验

一、样本均数与总体均数的比较(单样本t检验)总体标准差σ未知且n较小,应选用t检验。

⑴建立假设:H0︰μ=μ0 ;H1︰μ≠μ0α=0.05

⑵计算统计量t值:

⑶确定临界值(t

α):计算自由度υ,查t值表中t0.05(υ),t0.01(υ)

⑷以统计量(t)与临界值(t

α)比较,作出判断结论,按下列规则确定P值:若︱t︱<t0.05(υ),P>0.05,差别无统计学意义。︱t︱≥t0.05(υ),P<0.05,差别有统计学意义。

例题:假设肺炎病人的平均住院期为4.4天。25例用某药治疗的病人住院的平均时间为3天,标准差为

1.5天。试以5%的水准检验此药的效果。

H0︰μ=μ0 ;H1︰μ≠μ0α=0.05

υ=n-1=25-1=24,查t界值表,得t0.05(υ)=2.064,现︱t︱=4.67>2.064,故P<0.05。按α=0.05水准,不接受H0,接受H1,可以认为此药有效。

二、配对资料的比较——配对t检验

配对设计:①同一受试对象试验(或治疗)前后的比较②同一样本用两种方法检验结果的比较③配对的两种受试对象分别接受两种处理后的数据比较。

三、完全随即设计的两样本均数的比较

目的是推断两样本各自代表的总体均数μ1与μ0是否相等。t检验可用于两样本含量n1,n2较小时,同时要求两样本方差齐性。

假设检验的注意事项:①严密的抽样设计及资料正态性②选用正确的检验方法,且药注意方差齐性。成组比较的t检验,要求两组资料具有方差齐性③结论不能绝对化④单侧和双侧检验:选用单侧检验的条件是在研究开始之前,表明不会出现μ<μ0的情况(或不会出现μ>μ0的情况),才能选用单侧检验。若没有这方面的依据,一般选用双恻检验⑤差别有无统计意义与有无专业上的实际意义是两个不同的概念⑥假设检验和可信区间的关系是两个不同的概念。

Ⅰ型错误和Ⅱ型错误:做建设检验时,有可能发生两种错误,现以样本均数和总体均数的t检验为例说明:

①Ⅰ型错误是指拒绝了实际上成立的H0,即“弃真”的错误。在H0成立的前提下,由于抽样的偶然

性,得到了较大的t值,若t≥t0.05(υ)则P<0.05,按α=0.05水准拒绝H0,则犯了Ⅰ型错误。确定以t0为临界值时,犯Ⅰ型错误的概率就是α②Ⅱ型错误是指接受了实际上不成立的H0,即“取伪”的错误。在实际上H1成立的前提下,由于抽样误差的偶然性得到了较小的t值若t<t0.05(υ)则P>0.05,按α=0.05水准接受H0。这就犯了Ⅱ型错误。Ⅱ型错误的概率用β表示

样本量确定后,犯两类错误的概率不可能同时减少,α越小,β越大;反之α越大,β越小。

方差分析

一、方差分析的目的:方差分析主要用于检验数值变量资料中两个或两个以上均数间差别的显著性。

二、基本思想:将总的变量分析成若干部分,每一部分都与某一种效应相对应;总的自由度也被分为相

应的各个部分。●方差分析的统计量为F值。

三、变量的关系:SS总=SS组间+SS组内df总=df组间+df组内

四、方差分析应用条件:①各样本是相互独立的随即样本②各样本来自正态总体③各处理组方差齐性

分类资料的统计描述

一、常用相对数

1.构成比:又称构成指标,说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。

2.率:又称频率指标,说明某现象发生的频率或强度。K为比例基数,常用百分率(%)、千分率、万分

率等表示

①死亡率:也叫粗死亡率:

②死因构成比:某类死因的死亡数占总死亡数的百分数。按死因构成比由高到低排出位次即死因顺位。用

于观察何种疾病是造成当地居民死亡的主因。

③发病率:常用于研究疾病发生的因果和评价预防措施的效果。

④患病率:指在某时点(或短时期内)检查某一定人群中某病现患严重程度。最用于病程较长的疾病统计

研究。这是一个时点的指标。

3.相对比:是A、B两个有关联指标之比,说明A为B的若干倍或百分之几,两个指标可以是性质相同,

也可以是性质不同的。

二、应用相对数时的注意事项

1.构成比与率是意义不同的两个统计指标,分析时不能以构成比代替率。

2.计算相对数时,分母不宜过小,即应有足够例数。

3.对观察单位数不等的几个率,不能直接相加求其平均率。

4.资料的对比应注意可比性:即除了研究因素外,其余的重要影响因素应相同或相近。

5.对比不同时期资料时,应注意客观条件是否变化。

6.对样本率(或构成比)的比较应遵循随便抽样,要做假设检验。

三、率的标准化法

标准化法的意义和基本思想:

率的标准化法:就是在一个指点的标准构成条件下进行率的对比的方法

标准化率:用标准化法加以校正后的率称为标准化率,简称标准化率。

四、总体概率的置信区间:

正态近似法:当n足够大,且样本率p和(1-p)均不太小,如np与n(1-p)均大于等于5时,p的抽样分布逼近正态分布,则总体率的可信区间为:95%:p±1.96s p99%:p±2.58s p

χ2检验

卡方检验用途:可以对两个率或构成比以及多个率或构成比的差异做统计学检验。

卡方检验基本公式:

A:实际数T:理论数

一、四格表资料的χ2检验

1.建立假设:H0︰π=π0 ;H1︰π≠π0α=0.05

2.计算理论数:由于理论数的计算方法是分母都是一样,所以

理论数的计算:

3.计算χ2值:

4.确定p值,作出统计推论:自由度υ=(行-1)(列-1)=1。χ2≥χ20.05(υ)则P≤0.05:H0不成立,接受H1,差别有统计学意义;χ2≤χ20.05(υ)则P≥0.05:H0成立,差别无统计学意义。

四格表χ2检验的基本结构:

二、四格表专用公式:

a,b,c,d各代表四个表

中的四个实际数

例题:50只经过处理的老鼠中23只出现某种阳性反应。两组的阳性反应率有统计学意义吗?

数据整理成表:

H0︰π=π0 ;H1︰π≠π0α=0.05

υ=1,χ20.05(1)=3.84。χ2=7.64>χ20.05(1),P<0.05

按α=0.05的水准可以认为两组的阳性反应率差别有统计学意义。

三、四格表的校正——条件:当n≥40且1≤T<5

校正公式:或:

注意:当n<40或出现T<1时,校正法也不行,要用精确检验法直接计算概率。

例题:为比较槟榔煎剂和阿的平驱绦虫的效果,对45名绦虫患者进行治疗,其结果如下,问两药疗效是

否相同?

转换成计算表格如下:

H0︰π=π0 ;H1︰π≠π0α=0.05

υ=1,χ20.05(1)=3.84。χ2=0.61<χ20.05(1),P>0.05

按α=0.05的水准可以认为两药的疗效差别无统计学意义。

四、行×列表的卡方检验:适用于多个(两个组以上)的率或构成比差别的显著性检验。

H0︰π1=π2=π 3 ;H1︰三种药物的疗效不同或不全相同。

注意事项:

1.不宜有1/5以上的格子的理论数小于5,或有小于1的理论数。

处理方法:①增加样本含量②去除理论数过小的行或列③合并理论数过小的性质相近的行或列。

2.如检验结果拒绝检验假设,职能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此

之间有差别或量量之间有差别。

秩和检验

非参数统计的概念:不知道所研究样本来自总体的分布型或已知总体分布与检验所要求的条件不符,此时可用非参数统计进行假设检验。

使用资料:①总体分布为偏态或分布形式未知②等级资料③个别数据偏大或数据的某一端无确定的数值

④各总体方差不齐

直线回归:

直线回归方程的一般表达式为:

a为回归直线在Y轴上的截距

①a>0:直线与纵轴的交点在原点的上方②a<0:则交点在原点的下方③a=0:则回归线通过原点

b为回归系数,即直线的斜率

①b>0:表示直线从左下方走向右上方②b<0:表示直线从左上方走向右下方,即Y随X增大而减少③b =0:表示直线与X轴平行,即X与Y无直线关系。

直线相关

一、直线相关的概念:

当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确的求出另一个变量的数值,我们称这类变量之间的关系为相关关系,简称相关。

二、相关系数的意义:

相关系数又称积差相关系数,以符号r表示,它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。相关关系没有单位,其值为:-1<r<1。r>0:正相关,r<0:负相关,r=0:零相关,︱r︱=1:完全相关。

直线回归与相关的区别和联系

1.区别

①在资料要求上,回归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量;相关要求两个变量X、Y服从双变量正态分布。②在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。

2.联系

①方向一直:对一组数据若同时计算r与b,他们的正负号是一致的。r为正号说明两变量间的相互关系是同向变化的。b为正,说明X增(减)一个单位,r平均增(或减)b个单位②假设检验等价:r和b的假设检验是等价的,即对同一样本,二者的t值相等。

卫生统计学简答题

卫生统计学简答题 方差分析的基本思想和应用条件是什么? 答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。 多组定量资料比较时,统计处理的基本流程是什么? 答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。 简述秩和检验的优缺点 秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。 试述假设检验与置信区间的联系与区别。 答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。 试述两类错误的意义及其关系。 答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅱ类错误(type Ⅱerror):假设检验的另一类错误称为Ⅱ类错误(type Ⅱerror),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β表示。在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。 什么资料适合用秩和检验进行检验?简述秩和检验步骤。 答:提示:进行有序资料的比较时宜采用秩和检验。 (1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。 秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

卫生统计学-重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差 异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值 的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集 合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表 示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表 示,如样本 均数x 、样本率等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属 性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大 小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相 容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料; ②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后 采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察 单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i 号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将 总体分成若干层,该特征的测定值在层内变异较小,层间变异

卫生统计学复习题5

卫生统计学复习题 选择题 一、A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。(1′) 1、统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、收集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 2、统计学中所说的样本是指 A.从总体中随意抽取一部分 B.依照研究者的要求选取有意义的一部分 C.有意识地选择总体中的典型部分 D.从总体中随机抽取有代表性的一部分 E.以上都不对 3、统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 4、μ确定后,δ越大,则正态曲线: A.越陡峭 B.形状不变 C.越平缓 D.向左移动 E.向右移动 5、抽样误差指的是: A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是 6、治疗效果判定资料属于: A.计量资料 B.技术资料 C.等级资料 D.无序分类资料 E.以上都不是 7、平均数可用于分析下列哪种资料: A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料 8、一组正态或近似正态分布资料的平均水平用: A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 9、对于同一份正偏峰的资料,求得的几何均数与算术均数: A.几何均数大于算数均数 B. 几何均数小于算数均数 C. 几何均数等于算数均数 D. 几何均数可以大于算数均数,也可以小于算数均数 E. 以上说法都不对 10、原始数据加上一个不为0的常数后: A.x不变,CV变 B. x变或CV变 C. x不变,CV不变 D. x变,CV不变 E. x、CV均改变 11、血清学滴度资料最常计算______以表示其平均水平 A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12、表示变量值变异情况的指标最常用的是: A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 13、变异系数CV的数值 A.一定小于1 B.一定大于1 C.可大于1;也可小于1 D.一定不会等于零 E.一定比S小 14、若成年人血铅含量近似对数正态分布,拟用300名正常成人血铅确定99%正常值范围,最好采用下列哪个公式: A. x+2.58S B.lg-1(x lgx+2.58S lgx) C. x±2.58S D.P99=L+i/f99(300*99/100-f L) E. lg-1(x lgx+2.33S lgx) 15、_______小,表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C.σx D.R E.四分位数间距 16、两样本均数比较时,分别取以下检验水准,以_______所对应的第二类错误最小。 A.α=0.01 B.α=0.05 C.α=0.10 D.α=0.20 E.α=0.25 17、方差分析中,当P﹤0.05时,结果_________。 A.可认为各样本均数都不相等 B.可认为各总体均数不等或不全等 C.可认为总体均数都不相等 D.证明总体均数不等或不全相等 E.以上都不对 18、正态性检验中,按α=0.10水准,认为总体服从正态分布,此时若推断有错,此错误的概率为__________。

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4.总体(population):根据研究目的所确定的同质观察单位的全体。 5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size):样本中包含的观察单位个数。 7.参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均 数、总体率等。 8.统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母 表示,如样本均数、样本率等。 9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。 10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data):变量值的集合称之为资料。 12.定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、 量、衡单位,一般属连续性资料。 13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点: 一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点 各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的 研究方法。 17.抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。 18.概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小 介于0与1之间,即0≤P ≤1。 19.小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

卫生统计学1复习参考资料

(一).单选题(共”题,每题2 分) 1 ,某次研究进行随机抽样,测量得到该市110 名健康成年男子的血清总胆固醉值,则研 究总体为( D ) A .所有成年男子 B .该市所有成年男子 C . 110 名该市健康成年男子 D .该市所有健康成年男子 2 .关于随机抽样,下面说法正确的是( D ) A .抽样时样本量越大越好 B .选取符合研究者意愿的样本 C .抽样时应精心挑选个体,使得样本更好地代表总体 D .抽样时要求总体中每一个个体都有同等机会被抽取 3 .下列选项中,属于计数资料类型的是( C ) A .身高资料 B .舒张压资料 C .某病患病率资料 D .血清总胆固醉资料 4 .要全面描述正态总体分布或近似正态总体分布资料的分布特征,可采用( A ) A .均数和标准差 B .中位数和四分位间距 C .极差和中位数 D .均数和变异系数 5 .均数X 是描述一组同质数值变量数据(A)的统计指标 A .集中趋势 B .离散趋势 C .变化范围 D .频数分布 6 .标准差S 是描述一组同质数值变量数据(C)的统计指标 A .集中趋势 B .变化范围 C.变异程度 D. 频数分布 7 .一组观察值15 , 20 , 30 , 50 , 40 , 90 , 20 ,95. 其中位数为( B ) A . 30 B . 35 C .40 D 70 8 ·某组织资料共15 例,∑X2=1535, ∑X=45 , 则标准差S 为( D ) A . 100 . 00 B . 93 . 33 C . 9 . 66 D . 1 0 . 00 9 .将75 个观测值从小到大排列后,这75 个观测值中有10 %的观测值比50 小,有90 % 的观测值比50 大,则50 是( A )

卫生统计学试题汇总

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

卫生统计学复习资料及答案

一、最佳选择题 1、统计量是指(C )。 A.统计的数量 B.总体中的观察单位数 C. 样本的统计指标 D.总体的统计指标 2、表示某地某年各种死因的死亡率,可绘制( A )。 A.条图 B.半对数线图 C.圆图 D.普通线图 3、各观察值均加同一数后,( D )。 A.均数变,标准差也变 B.均数不变,标准差变 C.均数变,中位数不变 D.均数变,中位数也变 4、经调查得甲乙两地的冠心病粗死亡率相同,按年龄构成标化后,标化死亡率 甲地比乙地高,由此可认为( B )。 A.甲地冠心病的诊断较乙地准确 B.甲地年龄别人口构成较乙地年轻 C.甲地年轻人患冠心病较乙地多 D.乙地年龄别人口构成较甲地年轻 5、在标准差与标准误的关系中,说法正确的是( D )。 A.样本例数增大时,标准差减小,标准误不变 B.可信区间大小与标准差有关,而正常值范围与标准误有关 C.样本例数增大时,标准差增大,标准误也增大 D.从同一总体抽样,增大样本例数会减小标准误 6、比较甲乙两药的疗效时,已知甲药不会比乙药好,应作单侧检验,如用了双 侧检验,会出现( C )。 A.Ⅰ型错误增大 B.Ⅱ错误增大 C. Ⅰ型错误减少 D.Ⅱ错误减少 7、下列有关配对设计计量资料差值的t检验与成组设计的两样本均数比较的t 检验的描述中,哪一项是错误的( B ) 。 A.对配对设计的资料采用成组t检验,一般会降低统计效率 B.成组设计的资料用配对t检验一般可提高统计效率 C.成组设计的资料,无法用配对t检验 D.作配对t检验或成组t检验,应根据实验设计类型而定 8、要对配对设计计量资料作两样本均数的比较,若满足条件可选择( A )。 A.随机区组设计的方差分析 C. 成组比较的t检验

卫生统计学试题6含答案

统计试题题库 1、下列那个就是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2、两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3、四格表资料的卡方检验时无需校正,应满足的条件就是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4、总体应该就是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5、两样本均数比较的t检验中,结果为P<0、05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6、抽样误差就是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7、抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8、以舒张压≥12、7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9、实验设计中要求严格遵守四个基本原则,其目的就是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少与抵消非实验因素的干扰 E.以上都不对 10、两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件就是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11、同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV E.S2

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

《卫生统计学》考试重点复习资料

08生物技术曾洋and林阳第一章绪论 名词解释 统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。 总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 抽样:从研究总体中抽取少量有代表性的个体,称为抽样。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性的任何特征或属性。 随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

相关文档
最新文档