卫生统计学考试重点总结复习

卫生统计学考试重点总结复习
卫生统计学考试重点总结复习

一、绪论

1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。

2.样本:从总体中随机抽取部分观察单位所组成的集合。

3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。

4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。

5.变量的类型及其转换:

①定性变量:a.分类变量(计数资料)i.二分类变量

ii.多项无序分类

b.有序变量(等级资料)

②定量变量:a.连续型变量

b.离散型变量

变量只能由“高级”向“低级”转化:定量→有序→分类→二值。

6.概率:是描述随机事件发生的可能性大些的数值。

7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。

9.卫生统计学的研究对象:有变异的事物。

10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。

11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。

12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。

13.误差可分为:系统误差、随机测量误差、抽样误差。

14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。

二、定量资料的统计描述

1.频率分布表的编制步骤:

①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。

2.频率分布表的用途:

①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。

②便于进一步计算统计指标和进行统计分布处理。

③便于发现某些特大和特小的可疑值。

④当样本含量比较大时,可用各组段的频率作为概率的估计值。

3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。

4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。

5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。

6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。

三、定性资料的统计描述

1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。

=某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

①频率型指标:近似的反映某一事件出现的机会大小,如发病率、死亡率。

=某事件发生的个体数/可能发生某事件的个体数×K

②强度型指标:反映单位时间段内某现象发生的频率,多用于大人群长时间随访的资料,如人时发病率、人时感染率。

=某事件发生的个体数/∑(可能发生某事件的个体数×时间)×K

③相对比型指标:是AB两个有联系的指标之比,对比的两个指标可以性质相同,也可以不同。

=A指标/B指标(常见男女性别比)

3.应用相对数时的注意事项:

①防制概念混淆。

②计算相对数时,分母应有足够的数量。

③正确的合并估计频率型指标。

④相对数的对比应注意可比性。

⑤对样本相对数的统计推断,应进行参数估计和假设检验。

⑥注意率和构成比之间的差别。

4.标准化法的基本思想:

标准化法是指当比较两个或多个总率时,若比较的两组或多组内部构成明显不同,需按统一指标进行调整,使之具有可比性的方法。

基本思想:采用统一标准构成以消除某因素的内部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。

四、统计表和统计图

1.统计表的种类:简单表、复合表。

2.统计图的分类:

①条图:用等宽直条的长度来表示参与比较的指标的大小,分为单式和复式两种。表示指标数值的坐标尺度必须从0点开始。

②百分条图:用于表示事物中各部分的比重或构成。

③圆图:同上。

④线图:用线段的升降来表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续型变量资料。纵横的尺度可以不从0开始,一般纵横比例5:7。

⑤对半数线图:用于表示事物的发展速度(相对比)。

⑥散点图:用点的密集程度、趋势表示两变量间的相对关系,

⑦直方图:常用于表示连续型变量资料的频数或频率分布。纵轴的刻度必须从0点开始。

⑧统计地图:主要用于表示某种现象在地域空间上的分布,根据不同地方某种现象的数值大小,采用不同密度的线条或不同颜色绘在地图上,有助于分析该现象的地理分布特征,为进一步研究提供线索。

⑨箱式图:用于描述连续型变量资料的分布特征,它表现连续型变量资料的5个百分位数,即P2.5、P25、P50、P75、P97.5。

3.统计表的构成:标题、标目、线条、数字和备注。

五、常用的概率分布:

1.二项分布的图形特征:

①高峰在μ=nπ处或附近。

②π为0.5时,图形是对称的。π离0.5愈远,对称性愈差。

③对同一π,随着n的增大,分布趋于对称。当n→∞时,只要π不太靠近0或者1,二项分布趋于对称。

2.Poisson分布的特性:

①Poisson分布的总体均数与总体方差相等,均为λ。

②Poisson分布的观察结果有可加性。

3.正态分布的图形特点:

①关于x=μ对称。

②在x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点。

③曲线下面积为1。

④μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ越小,曲线沿横轴向左移。

⑤σ决定曲线的形状,当μ均衡定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。

4.正态分布的应用:

①概率估计②确定医学参考值范围③实验误差的质量控制④统计处理方法的理论基础

5.95%医学参考值范围:指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中95%个体的取值所在的范围。

6.二项分布的应用:概率估计、累积概率计算。

7.Poisson的应用:概率估计、累积概率计算。

8.二项分布、Poisson分布、正态分布的区别与联系:

二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。Poisson分布可以视为n很大而π很小的二项分布。当n很大而π和1-π都不是很小的时候二项分布渐近正态分布,但λ≥20的时候Poisson分布渐近正态分布。

六、参数估计基础

1.抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差。

2.标准误:用于表示均数抽样误差的指标叫样本均数的标准差,也称样本均数的标准误。

3.参数估计:统计学中通过抽样来估计总体参数,称为参数估计。

4.样本均数的标准误与原变量的标准差的区别:

样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。样本均数的标准误与原变量的标准差的区别在于:前者是表示均数变异的指标,后者是表示观察值变异的指标。两者的联系是,当样本量n一定时,标准误随标准差的大小而变化。

5.t分布是总体均数的区间估计和假设检验的基础。

6.t分布图形的特征:①单峰分布,以0为中心,左右对称。

②ν越小,t值越分散,曲线的峰部越矮,尾部越高。

③随着ν逐渐增大,t分布逐渐接近标准正态分布。

④t分布不是一条曲线,而是一簇曲线,当n确定时,t分布为一条曲线。

7.置信区间:按预先给定的概率1-α,估计总体参数的可能范围,该范围就称为总体参数的1-α置信区间。

8.区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。

9.CI的两个要素:①准确度:反映置信度1-α的大小,即区间包含总体均数的概率大小。

②精度:反映区间的长度,在置信区间确定的情况下,提高样本例数可以提高精度。

七、假设检验基础

1.假设检验:由样本信息对相应总体进行推断时,对所估计的总体首先提出假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验,即检验样本指标与总体指标或样本指标与样本指标之间有无差别。

2.假设检验的原理:

①反证法思想:首先提出假设,用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它,如果可能性大,还不能认为它不成立。

②小概率原理:是指小概率事件在一次随机试验中基本不会发生。

3.假设检验的步骤:

①建立检验假设,确定检验水准

②选择检验方法,计算统计量

③确定P值

④做出推断

4.假设检验应注意的问题:

①要有严密的研究设计。

②应用检验方法必须符合其适用条件。

③适当选择检验水准α。

④正确理解P值的意义。

⑤做结论不能绝对化。

⑥统计结论与专业结论相结合。

5.Ⅰ类错误:如果实际情况与H。一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝了原本正确的H。,导致推断结论错误,这样的错误称为Ⅰ类错误。

6.Ⅱ类错误:如果实际情况与H。不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,接受了原本错误的H。,导致推断结论错误,这类错误称为Ⅱ类错误。

7.t检验的应用条件:

①来自正态分布总体。

②两独立样本。

③均数比较时要求两总体方差相等。

④定量资料。

8.配对设计的种类:异体配对、自身配对。

9.小概率事件:在一次观察或实验中某事件发生的可能性很小,可以看作很可能不发生,通常取P≤0.05。

10.P值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。

11.假设检验功效:1-β称为假设检验的功效,其意义是,当所研究的总体与H。确有差别时,按检验水平α能够发现它(拒绝H。)的概率。

12.检验水准的确定:

需要根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。

八、方差分析

1.方差分析的基本思想:

根据资料的设计类型及研究目的,即按变异的不同来源将全部观察值间的总变异分为两部分或多个部分,其自由度也分解为相应的部分,除随机误差外,其余每个部分的变异也可由某个因素的作用加以解释,通过比较可能由某因素所致变异的均方与随机误差的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。

2.方差分析的应用条件:

①各样本是相互独立的随机样本。

②各样本来自正态总体。

③个处理组总体方差相等。

3.方差分析是用于研究定量变量数据的统计方法。

九、卡方检验

1.卡方检验的主要应用:

常用于分类变量资料的统计推断。推断两个或对个样本率及构成比之间有无差别,检验分类变量配对设计下的卡方检验,以及频数分布的拟合优度。

2.卡方检验的注意事项:

拟合优度:a.一般要求分组时每组中的理论频数不小于5;b.需要有足够的样本含量,不够时须经连续性校正。

2×2列联表:a.校正公式仅用于ν=1的四格表资料,对于ν≥2时的多组样本分布,一般不作校正;b.当n<40或T<1时,校正公式也不适用,可以用Fisher确切检验。

R×C列联表:a.一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理论频数小于1。解决方法:①增加样本含量;②结合专业知识合并该格所在行或列;③改用Fisher确切概率法。

3.卡方检验理论频数太小的解决方法:

①增大样本例数

②删除理论数太小的行或列

③将理论数太小的行或列进行合理的合并

④直接用Fisher确切概率法计算

十、基于秩次的非参数检验

1.参数检验:以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验,也叫参数统计。

2.非参数检验:不依赖于总体的分布类型,也不对总体参数进行推断时的假设检验。

3.参数检验和非参数检验的区别及优缺点:

分布对象优点缺点

参数检验总体分布已知总体参数精确性高,检验效

能高对资料要求高,计算繁琐,理解困难

非参数检验总体分布类型未知,

难以用某种具体的函

数形式表达总体分布适用范围广,资料

收集,分析简便

易犯Ⅱ类错误,检验

效能低,易损失信息

4.非参数检验的适用范围:

①分布类型未知。

②能以严重程度优劣等级效果大小和名次先后等表示的等级资料。

③分布极度偏态。

④个别变量值偏离过大远离本组其他变量值(极大值、极小值)或开口资料。

⑤方差不齐时。

⑥筛选或只需获得初步结果时。

5.配对设计资料编秩次的步骤:

依差值的绝对值由小到大编秩,并按差值的正负标上正负号,遇差值为0,舍去不计,n 随之减少,遇绝对值相等差值,取平均秩次。

6.秩和检验的优缺点:

优点:①适用范围广。②方法简便、易于理解和掌握。

缺点:损失信息量,适用于参数检验条件的非参数检验,检验效能降低。

十一、两变量关联性分析

1.线性相关:如果两个随机变量中,一个变量由小到大变化时,另一个变量也相应地由小到大(或由大到小)地变化,并且直线趋势,就称这两个变量存在直线相关关系。

2.线性(积距)相关系数及其特点:定量描述两个变量间线性关系密切程度和相关方向的统一指标。ρ≠0两变量线性相关,ρ=0两变量不相关。

3.线性相关应注意的问题:

①样本的相关系数接受零时并不意味着两变量间一定无相关性。

②一变量的数值人为选定时莫作相关。

③出现异常点时慎用相关。

④相关未必真有内在联系。

⑤分层资料盲目合并易出现假象。

4.秩相关的条件:

①不服从双变量正态分布不宜作积差相关。

②总体分布类型未知。

③用等级表示的原始资料。

5.秩相关和线性相关有何异同:

联系:①两者都可用于两变量间线性相关的方向与密切程度,其取值范围与数值大小的统计学意义解释也相同。

②两者都要求个体间满足独立性。

③Spearman 秩相关系数的计算可采用对秩次的Pearon 积距相关系数的计算来实现。相关系数的含义、单位、取值范围一致,且计算公式相同,不同一个直接用原始的定量数据,另一个则要用等级数据。

区别:①Pearon 积距相关要求数据服从二元正态分布,属于参数统计量;而Spearman 秩相关不要求正态分布,属于非参数统计量。

②两者总体参数的假设检验方法不完全相同(主要是ρ和ρs 的分布不同)。

6.线性相关和线性回归的区别与联系:

区别:①资料要求:线性相关要求X 、Y 服从双变量正态分布,对这种资料进行回归分析称为Ⅱ型回归,即可以把X 当自变量,也可以当因变量,反之亦然。线性回归要求Y 在给定X 值时服从正态分布,X 可以是精确测量和严格控制的变量,这时的回归称为Ⅰ型回归,即不可以把X 当因变量,Y 当自变量进行回归分析。

②应用:线性相关用来表达两个变量间的互依关系,两个变量的研究地位是相等的,谁做X ,谁做Y 都可以;线性回归用来表达两个变量间的依存关系,即一个变量如何依存于另一个变量而变化,两个变量的研究地位是不相等的。

③意义:相关系数r 说明具有线性关系的两个变量之间的密切程度和相关方向;回归系数b 表示X 每变化一个单位所导致Y 的变化量。

④取值范围:-1≤r ≤1,-∞

联系:①符号:对于既可做相关又可作回归的同一组资料,计算出的r 和b 正负号相同。 ②假设检验:对于同一组资料,相关系数和回归系数的假设检验等价。即tr=tb 。 ③相互换算:对于同一组资料,相关系数和回归系数可通过下式换算:b=r x

S Sy ,式中的Sx 、Sy 分别为X 、Y 数据的标准差。

④用回归解释相关:有决定系数R 2=总

回SS SS 可知,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则R 2越接近1,相关的效果

越好。说明回归效果越好,相关的密切程度也越高。

十二、简单回归分析

1.回归系数:b 为回归直线的斜率,也是通过X 推算Y 的回归系数,表示当X 变动一个单位时,Y 平均变动b 个单位。

2.直线相关与回归的区别与联系:

区别:⑴资料:回归:①Y 为正态随机变量,X 为选定变量②X 、Y 服从双变量正态分布 相关:X 、Y 服从双变量正态分布

⑵应用:回归:由一个变量值推算另一个变量值

相关:只反应两变量间互依关系

⑶回归系数与原变量单位有关,而相关系数无关

联系:⑴方向一致,r 与b 的正负号一致

⑵假设检验等价tr=tb

⑶r=b Lyy Lxx /

⑷相关回归可以相互解释

3.线性回归模型的适用条件:线性;正态性;方差相等;独立。

4.最小二乘原则:但ab 取不同值获取不同获选直线时,使所有实测值到这条直线的纵向距离平方和最小时的ab 值即为最小二乘估计。

5.残差:是P 点与回归直线的纵向距离,即实测值Y 与其估计值?之差

6.决定系数:回归平方和总离均差平方和之比称为决定系数。取值在0到1之间,且无单位,它反映了回归贡献的相对程度,即在因变量Y 的总变异中回归关系所能解释的比例。 线性回归的应用:①研究因素间的依存关系②估计与预测③统计控制

十三、实验设计

1.实验设计的三要素:受试对象、处理因素、实验效应。

①受试对象时处理因素作用的客体,受试对象选择的合适与否,也是一项实验是否成功的关键,因此应保证受试对象的同质性和代表性。

②处理因素是研究者根据研究目的而施加的特定措施,又称受试因素,实验过程中同一处理因素应始终保持不变,即处理因素应当标准化,同时控制和削弱非处理因素的影响。 ③实验效应是处理因素作用于受试对象产生的反应或结局。其通过观察指标表达出来,在指标的选择上,考虑客观性、精确性、灵敏性和特异性。

2.实验设计的基本原则:对照原则;随机化原则;重复原则。

①对照原则:安慰剂对照、空白对照、实验对照(标准对照和自身对照)

②随机化原则:体现在三个方面:随机抽样、分组的随机、实验顺序随机

③重复原则:作用:估计实验误差、减小实验误差

3.随机化:是采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。是对资料进行统计推断的前提,各种统计分析方法都是建立在随机化的基础上。

4.样本含量估计的四要素:

①容许误差δ

②有关总体变异性(总体标准差σ与总体概率π)

③第Ⅰ类错误概率α的大小

④第Ⅱ类错误概率β或检验功效1-β的大小

5.常用的实验设计方案:

①完全随机设计:是最为常见的一种考察单因素两水平或多水平效应的实验设计方法。它是采用完全随机分组的方法将同质的受试对象分配到各处理组,观察其实验效应。

②交叉设计:是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。

③配对设计:将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。(主要有以下情形:a.将两个条件相同或相近的受试对象配成对子,通过随机化,是对子内个体分别接受两种不同的处理。b.同一受试对象的两个部分配成对子,分别随机地接受两种不同的处理。c.自身前后配对,即同一受试对象,接受某种处理之前和接受该处理之后视为配对)。

④随机区组设计:是配对设计的扩展,通常是将受试对象按性质相同或相近分为b个区组,再将每个区组中的k个受试对象随机分配到k个处理组。设计时应遵循“区组间差别越大越好,区组内差别越小越好”的原则。

6.双盲法:受试对象和实验执行者均不知道受试对象分在哪一组。

十四、调查设计

1.常用的抽样方法及其优缺点:

①非概率抽样:立意抽样、偶遇抽样、雪球抽样。

②概率抽样:单纯随机抽样、系统抽样、整群抽样、分层抽样。

单纯随机抽样系统抽样整群抽样分层抽样

优点简单直观,是其他

抽样方法的基础;

均数及其标准误计

算简便易理解,简便易

行;可得到按比

例分配的样本;

样本在总体分

布较均匀

便于组织调

查;节省经费,

容易控制调查

质量

减少抽样误差;

可对不同层采用

不同的抽样方

法;可对不同层

进行独立分析

缺点例数较多时,编号

麻烦,实际工作中

难以办到,当总体

变异大时,代表性

不如分层抽样,难

以组织调查观察单位按顺

序有周期趋势

或递增(减)时

易产生偏差

样本例数一定

时,抽样误差

大于单纯随机

抽样

若分层变量选择

不当,层内变异

较大,层间变异

小,分层抽样就

失去意义

适用范围

2.调查表的构成:标题、说明、被访者基本情况、主要内容、编码、作业证明的记载。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学-重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差 异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值 的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集 合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表 示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表 示,如样本 均数x 、样本率等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属 性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大 小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相 容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料; ②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后 采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察 单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i 号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将 总体分成若干层,该特征的测定值在层内变异较小,层间变异

卫生统计学复习题5

卫生统计学复习题 选择题 一、A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。(1′) 1、统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、收集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 2、统计学中所说的样本是指 A.从总体中随意抽取一部分 B.依照研究者的要求选取有意义的一部分 C.有意识地选择总体中的典型部分 D.从总体中随机抽取有代表性的一部分 E.以上都不对 3、统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 4、μ确定后,δ越大,则正态曲线: A.越陡峭 B.形状不变 C.越平缓 D.向左移动 E.向右移动 5、抽样误差指的是: A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是 6、治疗效果判定资料属于: A.计量资料 B.技术资料 C.等级资料 D.无序分类资料 E.以上都不是 7、平均数可用于分析下列哪种资料: A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料 8、一组正态或近似正态分布资料的平均水平用: A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 9、对于同一份正偏峰的资料,求得的几何均数与算术均数: A.几何均数大于算数均数 B. 几何均数小于算数均数 C. 几何均数等于算数均数 D. 几何均数可以大于算数均数,也可以小于算数均数 E. 以上说法都不对 10、原始数据加上一个不为0的常数后: A.x不变,CV变 B. x变或CV变 C. x不变,CV不变 D. x变,CV不变 E. x、CV均改变 11、血清学滴度资料最常计算______以表示其平均水平 A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12、表示变量值变异情况的指标最常用的是: A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 13、变异系数CV的数值 A.一定小于1 B.一定大于1 C.可大于1;也可小于1 D.一定不会等于零 E.一定比S小 14、若成年人血铅含量近似对数正态分布,拟用300名正常成人血铅确定99%正常值范围,最好采用下列哪个公式: A. x+2.58S B.lg-1(x lgx+2.58S lgx) C. x±2.58S D.P99=L+i/f99(300*99/100-f L) E. lg-1(x lgx+2.33S lgx) 15、_______小,表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C.σx D.R E.四分位数间距 16、两样本均数比较时,分别取以下检验水准,以_______所对应的第二类错误最小。 A.α=0.01 B.α=0.05 C.α=0.10 D.α=0.20 E.α=0.25 17、方差分析中,当P﹤0.05时,结果_________。 A.可认为各样本均数都不相等 B.可认为各总体均数不等或不全等 C.可认为总体均数都不相等 D.证明总体均数不等或不全相等 E.以上都不对 18、正态性检验中,按α=0.10水准,认为总体服从正态分布,此时若推断有错,此错误的概率为__________。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学知识点

卫生统计学考点整理(一) 2017年11月24日 一、绪论: 1、什么是卫生统计学: 卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研究进行 设计,以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些? ①卫生统计学的基本理论和方法,包括研究设计和数据分析中的统计理论和方法。 ②健康统计,包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等的统计 问题。 3、什么是计量资料? 用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值)成为 计量资料(计量资料含有单位) 4、什么是计数资料? 将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到的数据 成为计数资料(也称分类资料)(不含单位) 5、什么是等级资料? 将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。 6、什么是总体? 根据研究目的的确定的同质观察单位的全体。(是同质的所有观察单位某种变量值的集合) 7、什么是同质? 研究对象具有相同的背景、条件、属性 8、什么是变异? 同一性质的事物,其个体观察值(变量值)之间的差异。 9、什么是样本? 从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。 10、什么是抽样研究? 对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么? 通过用样本资料计算的指标去推论总体。 12、什么是参数? 参数是指总体指标。(如:总体均数μ、总体率π、总体标准差σ等) 13、什么是统计量? 统计量是指样本指标。(如:样本均数、样本率p、样本标准差S等) 14、什么是统计描述? 用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断? 根据样本资料的特性对总体的特性作估计或者推论的方法。(常用方法是参数估计和假设检验)16、什么是系统误差? 不是偶然机遇造成的,而是某种必然因素所致,具有一定的倾向性。 常见情况:①操作方法不正确或对调查问卷理解有误;②医生掌握疗效标准偏高或偏低。③周 围环境的改进。④仪器不准或试剂不合格。 17、什么是随机测量误差? 偶然机遇所致,无方向性,不可避免的。

卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4.总体(population):根据研究目的所确定的同质观察单位的全体。 5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size):样本中包含的观察单位个数。 7.参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均 数、总体率等。 8.统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母 表示,如样本均数、样本率等。 9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。 10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data):变量值的集合称之为资料。 12.定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、 量、衡单位,一般属连续性资料。 13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点: 一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点 各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的 研究方法。 17.抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。 18.概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小 介于0与1之间,即0≤P ≤1。 19.小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

卫生统计学1复习参考资料

(一).单选题(共”题,每题2 分) 1 ,某次研究进行随机抽样,测量得到该市110 名健康成年男子的血清总胆固醉值,则研 究总体为( D ) A .所有成年男子 B .该市所有成年男子 C . 110 名该市健康成年男子 D .该市所有健康成年男子 2 .关于随机抽样,下面说法正确的是( D ) A .抽样时样本量越大越好 B .选取符合研究者意愿的样本 C .抽样时应精心挑选个体,使得样本更好地代表总体 D .抽样时要求总体中每一个个体都有同等机会被抽取 3 .下列选项中,属于计数资料类型的是( C ) A .身高资料 B .舒张压资料 C .某病患病率资料 D .血清总胆固醉资料 4 .要全面描述正态总体分布或近似正态总体分布资料的分布特征,可采用( A ) A .均数和标准差 B .中位数和四分位间距 C .极差和中位数 D .均数和变异系数 5 .均数X 是描述一组同质数值变量数据(A)的统计指标 A .集中趋势 B .离散趋势 C .变化范围 D .频数分布 6 .标准差S 是描述一组同质数值变量数据(C)的统计指标 A .集中趋势 B .变化范围 C.变异程度 D. 频数分布 7 .一组观察值15 , 20 , 30 , 50 , 40 , 90 , 20 ,95. 其中位数为( B ) A . 30 B . 35 C .40 D 70 8 ·某组织资料共15 例,∑X2=1535, ∑X=45 , 则标准差S 为( D ) A . 100 . 00 B . 93 . 33 C . 9 . 66 D . 1 0 . 00 9 .将75 个观测值从小到大排列后,这75 个观测值中有10 %的观测值比50 小,有90 % 的观测值比50 大,则50 是( A )

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点总结

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利 用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2常用相对数类型:频率型、强度型和相对比型指标。 指标频率型指标强度型指标相对比型指标 两个有关联的指标A和B之比概念近似反映某一时间出现概单位时间内某现象的 生频率 计算 A/B 公式 无有可有、可无 有无 量纲 【0,1】可大于1无限制 取值 范围

卫生统计学复习资料及答案

一、最佳选择题 1、统计量是指(C )。 A.统计的数量 B.总体中的观察单位数 C. 样本的统计指标 D.总体的统计指标 2、表示某地某年各种死因的死亡率,可绘制( A )。 A.条图 B.半对数线图 C.圆图 D.普通线图 3、各观察值均加同一数后,( D )。 A.均数变,标准差也变 B.均数不变,标准差变 C.均数变,中位数不变 D.均数变,中位数也变 4、经调查得甲乙两地的冠心病粗死亡率相同,按年龄构成标化后,标化死亡率 甲地比乙地高,由此可认为( B )。 A.甲地冠心病的诊断较乙地准确 B.甲地年龄别人口构成较乙地年轻 C.甲地年轻人患冠心病较乙地多 D.乙地年龄别人口构成较甲地年轻 5、在标准差与标准误的关系中,说法正确的是( D )。 A.样本例数增大时,标准差减小,标准误不变 B.可信区间大小与标准差有关,而正常值范围与标准误有关 C.样本例数增大时,标准差增大,标准误也增大 D.从同一总体抽样,增大样本例数会减小标准误 6、比较甲乙两药的疗效时,已知甲药不会比乙药好,应作单侧检验,如用了双 侧检验,会出现( C )。 A.Ⅰ型错误增大 B.Ⅱ错误增大 C. Ⅰ型错误减少 D.Ⅱ错误减少 7、下列有关配对设计计量资料差值的t检验与成组设计的两样本均数比较的t 检验的描述中,哪一项是错误的( B ) 。 A.对配对设计的资料采用成组t检验,一般会降低统计效率 B.成组设计的资料用配对t检验一般可提高统计效率 C.成组设计的资料,无法用配对t检验 D.作配对t检验或成组t检验,应根据实验设计类型而定 8、要对配对设计计量资料作两样本均数的比较,若满足条件可选择( A )。 A.随机区组设计的方差分析 C. 成组比较的t检验

《卫生统计学》考试重点复习资料

08生物技术曾洋and林阳第一章绪论 名词解释 统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。 总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 抽样:从研究总体中抽取少量有代表性的个体,称为抽样。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性的任何特征或属性。 随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

四川大学卫生统计学 考研复习提纲

四川大学卫生统计学 卫生检验、卫生管理、医药企业管理专业用 四川大学华西公共卫生学院 卫生统计学教研室编200512001 一、课程基本信息 课程名称:卫生统计学III(Health Statistics III ) 课程号:50401740 课程类别:专业课/类级平台课 学时:64 学分:4 二、教学目的及要求 卫生统计学是以医学,特别是预防医学的理论为指导,用统计学原理和方法研究医学,侧重预防医学中数据的搜集、整理与分析的一门应用性学科,它是公共卫生工作者必不可少的工具,是医学院校卫生检验、卫生管理和医药企业管理专业学生的一门必修课程,为考试课。 讲授本课程的目的是使学生掌握卫生统计学的基本概念,基本原理、基本方法和基本技能,培养统计思维方法和科学思维能力;掌握统计设计的原则,培养搜集、整理、分析统计资料的能力;掌握群体健康的评价方法。通过本课程的学习,应能为学习其它课程,阅读专业书刊,以及毕业后从事卫生检验、卫生管理和医药企业管理等工作和科研奠定牢固的统计学基础。 本课程通过课堂讲授与实习,自学与讨论,见习与生产实习等方式进行教学。在教学过程中,突出对学生统计思维能力和动手能力的培养,贯彻循序渐进、理论联系实际的原则,反映本学科发展的新动向,避免与相关学科(特别是流行病学,儿少卫生学和社会医学)重复。 理论讲授尽量从实例入手,讲清卫生统计学的基本概念、基本原理、基本知

识和基本方法,以及统计方法的应用条件、优缺点,阐明各种方法的内在联系,培养正确的统计思维方法。对有关统计公式,只要求了解其意义,用途和应用条件,不必深究其数学推导 实习课要联系讲授的理论知识,结合医学和预防医学等实例,针对不同内容采用选择题,填空题,计算分析题,讨论题,思考题等多种形式,进行统计分析基本技能的训练。让学生独立完成习题,以利于活跃思想,培养及开发学生智能。提倡自学与讨论。可安排部分内容让学生自学,教师提供思考问题,学生独立回答。讨论课应结合医学科研和论文中存在的主要统计问题进行,力求充分发挥学生的主观能动性,让每位学生都有参与的机会,培养学生发现问题,分析问题和解决问题的能力。鼓励学生提出阅读专业期刊中遇到的统计问题来进行讨论。 在见习中应加强学生计算机应用知识和技能的培养,让其了解国内外常见统计软件包的用途,应结合实习题进行上机训练。生产实习应结合指导教师安排的课题进行,使学生将所学的理论知识与实际相结合,对整个统计工作的全过程有所了解,培养对数据处理严肃认真的科学作风,保证统计资料的准确性,反对伪造和篡改统计数字。 三、教学内容:(下划双线示掌握内容,下划单线示熟悉内容;句尾的“*”示教学难点) 第一章绪论 卫生统计学的定义和内容。 统计工作的步骤:设计,搜集资料,整理资料和分析资料。 统计学中的几个基本概念:变量(数值变量和分类变量),总体与样本,概率。 学习统计学应注意的问题。 第二章计量资料的统计描述 频数分布表和频数分布图:频数表的编制,频数分布的两个特征(集中趋势

卫生统计学期末复习重点

卫生统计学期末复习重 点 Revised as of 23 November 2020

《卫生统计学》期末复习提要 一、期末考试有关问题的说明 <一>出题的指导思想、原则及题目类型 出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。 出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。凡自学的章节不考。 <二>答题要求 选择题:要求选择无误,每题只选一个最佳答案。 计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。 二、期末复习范围和重点 绪言 <一>重点复习的名词: 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。 总体(population):表示大同小异的对象(某个测量值)全体。 样本(sample):从研究总体中随机抽取的一部分有代表性的个体 变异(variation):同一总体内的个体间存在差异。 抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。 概率: 某事件出现机会大小的量。 <二>重点复习的问题: 1、根据计量、计数、等级资料的概念正确识别统计资料的类型。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2、统计工作的步骤及搜集资料的来源和要求。 1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

相关文档
最新文档