简述计量资料统计描述指标及其应用条件

简述计量资料统计描述指标及其应用条件

计量资料统计描述指标是用于对具有数量特征的数据进行概括和描述的统计量。常见的计量资料统计描述指标包括平均值、标准差、方差、中位数、最大值、最小值等。

1.平均值(Mean):计量资料的平均值是所有观测值的总和

除以观测值的数量。平均值是描述数据集集中趋势的常用指标。

2.标准差(Standard Deviation):标准差是测量数据的离散程

度。标准差越大,数据的变异程度越大;标准差越小,数据的变异程度越小。

3.方差(Variance):方差是标准差的平方。它衡量数据集点

与平均值之间的差异。

4.中位数(Median):中位数是将数据集按从小到大或从大

到小排列后,位于中间位置的值。中位数表示数据的中心位置,相对于平均值而言较为稳健。

5.最大值(Maximum)和最小值(Minimum):最大值是数

据集中最大的观测值,而最小值则是数据集中最小的观测值。

这些计量资料统计描述指标可以帮助给出关于数据分布、集中趋势和离散程度的定量信息。它们可以用于研究数据的分布形态、评估数据集的稳定性和变异性、进行比较和推断等。

应用条件包括:

1.数据类型:这些指标适用于计量数据,即具有数量特征的

连续或离散数据。

2.数据的总体性质:这些指标的应用条件通常基于数据的总

体性质。例如,当数据服从正态分布时,平均值和标准差是有效的描述指标。

3.数据的假设:有些指标对数据的假设有一定要求。例如,

中位数对于数据的对称性和单峰性有一定的要求。

需要根据具体的数据和分析目的来选择适当的计量资料统计描述指标。同时,需要注意数据集的特点以及所使用的指标的局限性,并结合其他相关指标和图表进行综合分析和解读。

统计概述计量描述习题

实习二计量资料的统计描述 名词解释 1. 均数 答:均数是能反映全部观察值的平均水平的统计指标,适用于对称分布尤其是正态分布资料。 2. 标准差 答:标准差是用于描述资料离散趋势的统计指标,适用于对称分布资料,尤其正态分布资料的。标准差大,表明资料的变异度大,组内数据参差不齐的程度较明显。 填空题 1 计量资料的分布特征有____和____。 答:集中趋势和离散趋势。 2 描述计量资料集中趋势的常用指标有____ 、____和____ 答:均数、几何均数和中位数。 3 描述计量资料离散趋势的常用指标有____ 、_______和____ 答:极差、方差与标准差和变异系数 是非题 1. 频数表中组数越多越好。(?) 解释:频数表中组数不宜过多也不宜过少。 2. 对称分布资料理论上均数和中位数一致(∨) 解释:对于对称分布的资料,两者的计算结果在理论上是相同的。但在实际计算中往往也会存在一定偏差。 选择题 1 有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是 A.1:40 B.1:80 C.1:160 D.1:320 答:应选B。描述平均滴度宜用几何均数。 2.一组变量值,其大小分别为10,12,9,7,11,其中位数是 A.9 B.7 C.10 D.11 答:应选C。先将观察值由小到大顺序排列,7,9,10,11,12。n为奇数时,M=X3=10 3.一组变量值,其大小分别为 10,12,9,7,11,39,其中位数是 A.9 B.7 C.10.5 D.11 答:应选C。先将观察值由小到大顺序排列,7,9,10,11,12,39。n为偶数时, M=( X3 +X4)/2 =(10+11)/2=10.5 4. 某组资料共5例, ∑X2=190, ∑X=30, 则均数和标准差分别是 1

统计学

1.统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。具体的讲,是按照设计方案去收集,整理,分析数据,并对数据的结果进行解释,从而做出比较正确的结论。 2.统计描述:用统计指标、统计表或统计图的方法描述及总结一组数据的重要特征,其目的是使试验或观察得到的数据表达清楚并便于分析。 3.统计推断:由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 4.变异(variation):观察同一指标,各观察单位之间由于存在个体差异,也会使测量结果不同,这种差异称为变异。 5.计量资料(quantitative data):定量数据,对每个观察对象的观察指标,用定量的方法测定其数值大小所得的资料。特点是能用数值大小衡量其水平的高低,一般有计量单位。 6.计数资料(quanlitative data):定性数据,先将观察对象按性质或类别分组,然后计数各组观察指标的数目所得的资料。 7.等级资料(ordinal data):又称半定量数据和有序数据,既有计数资料的特性又有半定量性质的资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 8.总体(population):是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。 9.样本(sample):是从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 10.参数:描述总体特征的指标称为参数。 11.误差(error):是指观测值与真实值、样本统计量与总体参数之间的差别。根据差别的性质和来源主要可以分为系统误差、随机测量误差和抽样误差几种类型。 12.系统误差(systematic error):由一些固定因素产生,如仪器未进行归零校正,标准试剂校准不好或医生对疗效掌握偏高或偏低等原因。系统误差的大小通常恒定或按照一定规律变化,具有明确的方向性。这类误差可以消除或控制。 13.随机测量误差:测量过程中由于各种偶然因素的影响造成同一测量对象多次测定的结果不完全相同,主要原因是生物体的自然变异和各种不可预知因素产生的误差,这种误差往往没有固定的大小和方向,到具有一定的统计规律,不可避免。 14.抽样误差(sampling error):由抽样引起的样本统计量与总体参数之间的差异称为抽样误差。 15.均数的抽样误差:统计学上对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。 16.概率P(probability):描述某事件发生的可能性大小的度量。 17.小概率事件:统计学上习惯将P≤0.05的事件称为小概率事件,表示在一次试验中发生的可能性很小。 18.平均数(average):描述一组观察值集中位置或平均水平的统计指标,常作为一组数据的代表值用于分析和进行组间的比较。 19.中位数M(median):将一组观察值从小到大按顺序排列,居中心位置的数值即为中位数。 20.标准正态分布:均数为0,标准差为1的正态分布。 21.医学参考值范围:指“正常”人的解剖、生理、生化指标等数据大多数个体值的波动范围。确切含义是,从选择的参照总体中获得的所有个体观察值,用统计学方法建立百分位数界限,由此得到个体观察值的波动区间。通常情况,使用的是95%参考值范围。 22.相对数(relative number):两个有关的绝对数之比,也可以是两个有关联统计指标之比。 23.率(rate):在一定空间或时间范围内某现象的发生数与可能发生的总数之比,说明某现象出现的强度或频率。

统计背诵版(三份整合)

统计学资料背诵版 一、单选题: 第二章:计量资料的统计描述 1、描述一组偏态分布资料的变异度,以四分位数间距指标较好。 2、用均数和标准差可以全面描述正态分布资料的特征。 3、各观察值均加(或减)同一数后标准差不变。 4、比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用变异系数。 5、偏态分布宜用中位数描述其分布的集中趋势。 6、各观察值同乘以一个不等于0的常数后,变异系数不变。 7、正态分布的资料,均数等于中位数。 8、对数正态分布是一种右偏态分布(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何 种分布?) 9、横轴上,标准正态曲线下从0到2.58的面积为49.5% 10、当各观察值呈倍数变化(等比关系)时,平均数宜用几何均数。 第三章:总体均数的估计与假设检验 1、均数的标准误反映了样本均数与总体均数的差异。 2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明越有理由认为两总体均数不同。 3、甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X 1 和 S 12、X 2 和S 2 2,则理论上由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 4、在参数未知的正态总体中随机抽样,丨X-μ丨≥t 0.05/2,v S X的概率为5% 5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围为74±1.96×4 6、关于以0为中心的t分布,叙述错误的是相同v时,丨t丨越大,P越大。 7、在两样本均数比较的t检验中,无效假设为两总体均数相等。 8、两样本均数比较作t检验时,分别取以下检验水准,犯第二类错误概率最小的是α=0.30 9、正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率等于β,而β未知。 10、关于假设检验,说法正确的是采用配对t检验还是两样本t检验是由试验设计方案所决定的。第四章:多个样本均数比较的方差分析 1、完全随机设计资料的方差分析中,必然有SS 总=SS 组间 +SS 组内 2、随机区组设计资料的方差分析中,对其各变异关系表达正确的是SS 总=SS 处理 +SS 区组 +SS 误差 3、当组数等于2时,对于同一资料,方差分析结果与t检验结果完全等价且t=F 4、方差分析结果,F 处理>F 0.05,(v1,v2) ,则统计推论是各总体均数不全相等 5、完全随机设计方差分析中的组间均方是表示某处理因素的效应和随机误差两者综合影响的结果的统计量。 6、配对设计资料,若满足正态性和方差齐性,要对两样本均数的差别作比较,可选择随机区组设计的方差分析 7、k个组方差齐性检验有统计学意义,可认为σ12、σ22、...σk2不全相等 第五章、计数资料的统计描述 1、医院日门诊各科疾病分类资料,可作为计算构成比指标的基础。

医学统计学重点概要

第一章 绪论 总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。 总体包括有限总体和无限总体。 样本:从总体中随机抽取的部分观察单位,其实测值的集合。 获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。 资料的类型计量资料、计数资料和等级资料。 误差包括随机误差、系统误差和非系统误差。 抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计 量之间的差异称为抽样误差。 概率:是描述随机事件发生可能性大小的一个度量。取值范围0≤P ≤1。 小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可 能不发生。P ≤0.05或P ≤0.01。 医学统计学的步骤:设计、收集资料、整理资料和分析资料。 统计分析包括:统计描述和统计推断。 统计推断包括:参数估计和假设检验。 第二章计量资料的统计描述 频数表和频数分布图的用途: (1)描述频数分布的类型,以便选择相应的统计指标和分析方法。对称分布: 集中位置在中间,左右两侧頻数基本对称。偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。 (2)描述頻数分布的特征; (3)便于发现资料中的可疑值; (4)便于进一步计算统计指标和进行统计分析。 计量资料集中趋势包括算术均数、几何均数和中位数。 算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =n fx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f f x f G ∑∑∑--==(常用于等比资料或对数正态分布资料) 中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f i L M 。 中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1) 偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。 百分位数:頻数表法:)%(∑-⋅+=L x x x f x n f i L P

医学统计学解答题

简答题 1、统计资料可以分成几类? 答: 根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。 2、不同类型统计资料之间的关系如何? 答: 根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。 3、频数分布有哪两个重要特征? 答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。 4、标准差有什么用途? 答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。 5、变异系数(CV)常用于哪几方面? 答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。 6、制定参考值范围有几种方法?各自适用条件是什么? 答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正态分布的原理,依据公式: X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按: X±1.96S 计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-1.645S,过高为异常者,计算X+1.645S。若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。②百分位数法。用P2.5~P97.5估计95%双侧参考值范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。 7、计量资料中常用的集中趋势指标及适用条件各是什么? 答: 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数

简述计量资料统计描述指标及其应用条件

简述计量资料统计描述指标及其应用条件 计量资料统计描述指标是用于对具有数量特征的数据进行概括和描述的统计量。常见的计量资料统计描述指标包括平均值、标准差、方差、中位数、最大值、最小值等。 1.平均值(Mean):计量资料的平均值是所有观测值的总和 除以观测值的数量。平均值是描述数据集集中趋势的常用指标。 2.标准差(Standard Deviation):标准差是测量数据的离散程 度。标准差越大,数据的变异程度越大;标准差越小,数据的变异程度越小。 3.方差(Variance):方差是标准差的平方。它衡量数据集点 与平均值之间的差异。 4.中位数(Median):中位数是将数据集按从小到大或从大 到小排列后,位于中间位置的值。中位数表示数据的中心位置,相对于平均值而言较为稳健。 5.最大值(Maximum)和最小值(Minimum):最大值是数 据集中最大的观测值,而最小值则是数据集中最小的观测值。 这些计量资料统计描述指标可以帮助给出关于数据分布、集中趋势和离散程度的定量信息。它们可以用于研究数据的分布形态、评估数据集的稳定性和变异性、进行比较和推断等。 应用条件包括:

1.数据类型:这些指标适用于计量数据,即具有数量特征的 连续或离散数据。 2.数据的总体性质:这些指标的应用条件通常基于数据的总 体性质。例如,当数据服从正态分布时,平均值和标准差是有效的描述指标。 3.数据的假设:有些指标对数据的假设有一定要求。例如, 中位数对于数据的对称性和单峰性有一定的要求。 需要根据具体的数据和分析目的来选择适当的计量资料统计描述指标。同时,需要注意数据集的特点以及所使用的指标的局限性,并结合其他相关指标和图表进行综合分析和解读。

(完整版)统计简答题

统计简答题 请写岀三种常用的描述统计资料离散趋势的统计量,以及分别在什么情况下,使用这些统计量。 1、以估计总体均数为例,回答以下问题:(1)什么是抽样误差?(2)引起抽样误差的原因?(3)如何估计抽样误差的水平? ①抽样误差是由抽样造成的样本统计量与总体参数之间,样本统计量之间的差异 (2分)②造成抽样误差的原因是个体差异的存在(2分)③样本均数的标准差也就是标准误常用来估计抽样误差的大小(2分) 3请回答关于两组独立样本的非参数检验的问题:(1)什么时候用非参数检验?(2 )为什么不管原始数据的分布情 况而直接采用非参数检验对我们是不利的?(3)在两独立样本的秩和检验中H o的内容? ①当总体分布未知或者资料为等级资料不满足参数检验的条件时,可用非参数检验。(2分)②因为非参数检验丢弃了观察值的具体数值而只保留了其大小次序的信息,而当资料满足参数检验时用非参数检验就损失了数据信息,也降低了检验效能,所以不管数据的分布直接使用非参数检验对我们是不利的。(2分)③非参数检验的H0内容 是假设两样本所在总体中位数相同或假设两样本总在的总体分布相同。 4简述针对数值变量资料制作频数表的过程? 答:(1)计算极差2分 (2)确定组数、组段和组距2分

(3)列表划记 2 分 5 两个样本均数或多个样本均数比较时为何要作假设检验?答:两个样本均数或多个样本均数比较时之所以要作假设检验,是因为均数之间的差异有两种可能,一是由于抽样误差引起,解释一下抽样误差( 3 分)二是均数之间的确实存在差异,尤其是多个样本均数之间存在差别时,有必要进行两两之间的比较(3 分)假设检验可以判断引起这种差异的原因。 6 参数检验和非参数检验的区别是什么? 答(1)参数检验、非参数检验的定义 2 分 (2)无严格的条件限制,适用范围广,计算简便 2 分 (3)秩次代替变量值 2 分 样题2 1 以总体均数的估计为例,试说明何为点估计,何为区间估计?点估计:以样本均数作为总体均数的点(值)估计区间估计:以预先给定的概率(或可信度)估计总体参数在哪个范围内的估计方法 3系统抽样的具体做法是什么?有何优、缺点?系统抽样也称为间隔抽样或机械抽样。方法是按照一定顺序机械地间隔若干个观察单位抽取一个观察单位组成样本。 优点:易于理解、简单易行,容易得到一个按比例分配的样本。一般情况下,其抽样误差小于简单随机抽样。 缺点:当总体的观察单位按顺序有周期或单调增(或减)趋势时,则系统抽样将产生明显的偏性。 4请举一个医学领域中观测结果为泊松分布的例子。如果是泊松分布,则观察结果的均值和方差有什么关系? 例如:每毫升饮用水中细菌数。对于泊松分布,均值=方差。 5非参数统计检验的优点和缺点。 对资料的分布类型没有特殊的要求,只利用秩次(损失信息),不受分布限定,计算简 单、方便,检验效能低6以t检验或X检验为例,说明假设检验的基本逻辑。 以两独立样本t检验为例:

计量资料描述

计量资料的统计描述 描述性统计分析是进行统计分析的第一步,做好这一步是正确进行统计推断的先决条件。 计量资料常用的统计描述指标和方法主要有: 1、集中趋势指标(Central Tendency):包括均数、几何均数、中位数等。其中均数适用于正态分布和对称分布资料;几何均数适用于对数正态分布和呈等比的数据资料;中位数适合于所有分布类型的资料,但在实际中,中位数主要应用于偏态分布资料、分布不明资料和开口资料。 2、离散趋势指标(Dispersion):包括全距、四分位数间距、方差、标准差、变异系数、标准误等。方差、标准差用于正态分布资料,四分位数间距用于偏态分布资料,变异系数用于度量单位不同和均数相差悬殊的资料,标准误用于反映样本均数的离散程度,说明均数抽样误差大小。 SPSS的许多模块均可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程: Frequencies过程:产生频数表;按要求给出某百分位数。对计量资料、计数资料和等级资料的描述都适用 Descriptives过程:进行一般性的统计描述,用于服从正态分布的资 料,计算产生均数、标准差等; Explore过程:用于对数据概况不清时的探索性分析;

Crosstabs过程:完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。 本次实习练习前3个过程:Frequencies过程,Descriptives过程,Explore过程。Crosstabs过程在X2检验实习讲述。 Frequencies过程 案例: 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5。 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05 一、建立数据文件 1、定义变量:在数据窗口,点击,定义一个变量,变量名(Name)“x”,类型(Type)“数值()8,小数位数(Decimals)2,变量标签(Label):“血清总胆固醇”。 (2)输入数据:

定量资料统计学方法小结

计量资料分析常用的统计学方法小结 第二章、定量资料的统计描述 频率分布表与频率分布图: 描述平均水平的统计指标(描述集中趋势):算数均数、几何均数、中位数与百分位数、众数 描述变异程度的统计指标(描述离散趋势):极差、四分位数间距、方差、标准差、变异系数 描述分布形态的统计指标:偏度系数、峰度系数 第一节频率分布表与频率分布图 离散型定量变量和连续型定量变量的频率分布 离散型定量变量的取值是不连续的。直接清点各变量值出现的频数计算相应的频率,即为频率分布表。离散型定量变量的频率分布图可用直条图表达,以各等宽矩形直条的高度表示各组频率的大小。 连续型定量变量的取值是连续的。将数据适当分组,清点各组频数,并计算相应频率,即为频率分布表。连续型定量变量的频率分布图可用直方图表达,纵坐标为频率密度,即频率/组距,直方图面积之和等于1. 1、离散型定量变量的频率分布 步骤:(1)直接清点各变量值出现的频数 (2)计算各组频率,累计频数,累计频率 2、连续型定量变量的频率分布 步骤: (1)求极差(range):即最大值与最小值之差,又称为全距。 (2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一, 再略加调整。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。 编制频率表的注意事项:

(1)分组不宜过粗,也不宜过细。通常分为10~15个组。 (2)为计算方便,组段下限一般取较整齐的数值。确定各组段上下限时,各组段要连续但不重叠。除去最后一个组段,其余组段应包含下限值,不包含上限值。 (3)第一组段应包含最小值,最后一组段应包含最大值。 3、频数表和频数分布图用途 (1)描述频数分布的类型 对称分布 :若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布 正偏态分布:右侧的组段数多于左侧的组段数, 频数向右侧拖尾。 偏态分布 : 负偏态分布:左侧的组段数多于右侧的组段数,频 数向左侧拖尾。 (2)描述频数分布的特征 随机变量的分布具有两个特征——集中趋势与离散趋势。 ①数据集中(平均):总体中的个体具有某些同性质,这些同性质是的数据趋向同一数值,表现为变量值聚集在某个中心值的周围,称为集中趋势。 ②数据变异(离散):同一总体中的个体之间又普遍存在各种差别,使得变量值向平均水平左右离散,称为离散趋势。 (3)便于发现某些离群值或极端值。 (4)便于进一步做统计分析和处理 第二节 描述平均水平的统计指标(描述集中趋势的指标) 统计上使用平均数(average )这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有三种——算数均数、几何均数、中位数。 1、算术均数:简称均数(mean ) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位 置的特征值。常用μ表示总体均数,用 表示样本均数。 均数适用于对称分布,特别是正态分布资料。 直接计算法(利用原始数据): 12n X X X X X n n +++= = ∑12n X X X X X n n +++== ∑

统计学重点知识点

基本统计方法 第一章概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter):反映总体特征的统计指标,如总体均数、标 准差等,用希腊字母表示,是固定的常数;统计量(Statistic):反映 样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR=P75-P25 )、标准差(或方差)、变异系数(CV) 3. 正态分布特征:①X轴上方关于X=对称的钟形曲线;②X=时, f(X)取得最大值;③有两个参数,位置参数和形态参数:④曲线下面积为1,区间士的面积为68.27%,区间士1.96的面积为95.00%, 区间士2.58的面积为 99.00%。 4. 医学参考值范围的制定方法:正态近似法:X u /2S ;百分位数法: P2.5-P97.5。

第三章总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM):样本均数的标准 差,计算公式:X/用。反映样本均数间的离散程度,说明抽样 误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少 S。 4. t分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度,越小,t值越分散,t分布的峰部越矮而尾部翘得越 高; ③当逼近X,S X逼近X, t分布逼近U分布,故标准正态分布是t 分布的特例。 5. 置信区间(Con fide nee In terval , Cl):按预先给定的概率(1-) 确定的包含总体参数的一个范围,计算公式:X t /2, S X或X u /2, S X。 95%CI含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H o)出发间接判断要解决的问题(H i) 是否成立。 ②小概率事件:在H0 成立的条件下计算检验统计量,根据

统计书练习题简答题

第二章计量资料的统计描述 1 对于一组近似正态分布的资料,除样本含量n外,还可计算X,S 和x±1.96S,问各说明什么? 答:(1)X为算术均数,说明正态分布或近似正态分布资料的集中趋势;(2)S 为标准差,说明正态分布或近似正态分布资料的离散趋势;(3)x±1.96S可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含总体的95%的个体值。 2试述正态分布、标准正态分布及对数正态分布的联系和区别? 答:(1)描述频数分布的类型;(2)描述频数分布的特征;(3)便于发现一些特大或特小的可疑值;(4)便于进一步做统计分析和处理。 4 变异系数的用途是什么? 答:多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5 描述正态分布的面积分布规律? 答:(1)X轴与正态曲线所夹面积恒等于1或100%;(2)区间u±σ的面积为68.27%,区间u±1.96σ的面积为95.00%,区间u±2.58σ的面积为99.00%。 第三章总体均数的估计与假设检验 1试举例说明均数的标准差与标准误的区别与联系? 答:例如某医生从某地2000年的正常成年男子中,随机抽取25人,算的其血红蛋白的均数X为138.5g/l,标准差S为5.20g/l,标准误S X为1.04 g/l。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这 25个说据对其算术均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误为 1.04,此式将标准差和标准误从数学上联系起来了。同时还可以看出,当标准差不变时,通过增加样本含量可以减少标准误。 2 标准正态分布(u分布)与t分布有何不同? 答:t分布为抽样分布,标准正态分布(u分布)为理论分布。t分布比t分布的峰值低,且尾部翘得更高。随着自由度的增大,t分布逐渐趋近于标准正态趋于分布。即当自由度v趋于无穷大时,t分布趋于标准正态分布。 3均数的可信区间与参考值范围有何不同? 答:

卫生统计学

五、填空题 1、统计工作的基本步骤是 设计 、 收集 、 整理 、 分析 。 2、统计分析包括 统计描述 和 统计推断 。 3、四分位数间距是(P75和P25)的差。 4、描述正态分布的计量资料两个参数是 u 和 6 。 5、常用的统计资料类型分 数值变量 、无序分类变量 和 有序分类 。 6、常用平均数有均数、(几何均数)和中位数。 7、常用相对数有率、 构成比 和相对比。 8、总体均数区间估计的两个要素是 可信度 和 精度 。 9、t 检验分布曲线的形状与(自由度)有关。 10、四格表资料的χ2 检验的自由度为(1)。 11、成组t 检验的自由度为 n-1 ,2χ检 验的自由度为 (c-1)(R-_1) 。 12、统计学上一般将P ≤ 0.05 或P ≤ 0.01 定为小概率事件。 13、随机区组设计的方差分析,可将总变异分解为(SS 总=SS 组间+SS 配伍+SS 误差) 14、医学统计中常用相对数有 率、 构成比 相对比 15、血清学滴度资料最常用来表示其平均水平的指标是(几何均数) 16、变异系数用于①(度量衡单位不同); ②(两均数相差悬殊)。 17、横轴上,正态曲线下,从μ-1.96σ到μ+2.58σ的面积为 0.97 。 18、S — X 大小与 S 成正比。 19、用最小二乘法原理确定回归直线是使(∑(y-y ))为最小。 20、统计表的结构包括 标题 标目 线条 数字 四个方面。 21、确定医学正常值范围,习惯上以95%为界值。若资料是正态分布,应计算(双侧)_x+-1.96s__,若资料呈偏态分布,应计算__p2.5____及___p97.5__。 22、X 服从N (5,2 2)的正态分布,X 的50P 为(5 )。 24、对于任何分布的资料,955 P ~P 的范围 包含了 90% 变量值。 25、秩和检验的优点 使用范围 、 计算简单 、 不分变量的类型 。 27、比较甲乙两地血型的构成比有无差别,宜用(χ2 )检验。 28、比较某地区某时期三种疾病的发病率在各年度的发展速度,应该绘制 半对数线图。 29、Sp p 96.1±表示。 以样本率估计总体率 30、完全随机设计的方差分析,可将总变异分解为。SS 总=SS 组间+SS 组内 31、一组变量值为:1、3、5、9、12、12,均数为 7 _;其中位数为 7 _。 32、完全随机设计多组差别比较的方差分析,其应用条件为:⑴ 随机样本 ; ⑵ 正态分布的总 ;⑶ 各样平方差齐同。 33、两个样本均数比较的t 检验,其应用条件为: 正态总体 和 方差齐同 34、变量系数常用于: ○1 度量衡单位不同 ;○2 观察属性或特征 。 35、两个率比较的χ2 检验,其自由度为( 1 )。 36、四个率比较的χ2检验,其自由度为( 3)。 37、根据资料的( 性质 )和 分析目的 选用合适的统计图。 38相关系数r 的假设检验,H 0表示为(P=0)。39、回归系数b 的假设检验,H 0表示为(β=0)。 40、t 检验的应用条件(1小样本两均数比较,总体方差齐同,下态分布)。 41、收集资料的任务是取得(及时、准确、完整)的原始资料,而整理资料的目地是使原始数据处理(系统化、条理化)便于进一步计算和分析指标。 42、对于多个样本的秩和检验,当R=3,ni>5时,应查__χ2 分布_表。 44、σ是指(变量值)对μ的离散程度;X σ是指(样本均数)对μ的离散程度。 45、完全随机设计多组差别比较的秩和检验,计算统计量H 的公式为:式中 i R 表示(各 组秩和)∑+-+=) 1(3)1(12 2N n R N N H i i 1抽样误差:由于抽样造成的样本统计量与总体参数的差异,称为抽样误差,是由个体变异产生的。 2标准误:反映抽样误差大小的统计量。 3标准差:是描述一组变量值离散程度的统 计指标。常用于正态分布或近似正 态分布的资料,标准差小,均数的代表性好。 4变异:同一体中不同个体之间的离散 5极差亦称全距,即最大值与最小值之差,用于资料的离散程度的粗略分析,其计算简便但稳定性较差。 6参数:整体的指标称参数。 7参数估计:指用样本统计量估计总体参数称参数估计。参数估计有两种方法:点估计和区间估计。 8中位数:将一组观察值按从小到大的顺序排列,位置居中的数称中位数。 9四分位数间距:是上四分位数Qu 与下四分位数Qu 之差。 10率:又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为: , 表示方式有:百分率(%)、千分率(‰)等。、 11构成比:指事物内部各组成部分所占的比重或分布。 12。直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。 13直线相关:是分析两个变量间是否存在线性相关关系的方法。 14相关系数:是描述两个变量间相关关系的密切程度与相关方向指标。 统计量:由观察资料计算出来的量称统计量 16非参数检验:是一种不依赖总体分布的具 体形式的统计检验方法。检验的是分布,不是参数。 17可信区间:结合样本统计量和标准误可以确定一个具有较大置信度的包含总体参数的区间,区间称为总体参数的1—a 置信区间(CI ),就是可信区间。 18回归系数:回归系数:在直线回归方程中用b 表示,是描述变量间依存关系的方向和变化幅度的统计指标,b 的统计意义为X 每增(减)一个单位时,Y 平均改变b 个单位。 19正态分布:是一条高峰位于中央,两侧 逐渐下降并完全对称,曲线两端永远不与横抽相交的钟型曲线 20标准正态分布;u 变换将均数为u,标准差为6的正态分布转变为均数0,标准差为1的正态分布,称标准正态分布. 21. X σ:均数的标准误。样本均数的标准差 % 100⨯= 单位总数可能发生某现象的观察数 发生某现象的观察单位率

统计学知识点(完整)

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2。 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3。 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1。 集中趋势:均数(算术、几何)、中位数、众数 2。 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3。 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X )取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1。96σ的面积为95.00%,区间μ±2.58σ的面积为99。00%. 4。 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法:P 2.5-P 97.5。 第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2。 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: /X σσ= 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例. 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1—α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)是否成立。 ②小概率事件:在H 0成立的条件下计算检验统计量,根据概率分布确定检验水准α下P

医学统计学简答题总结 必考大题总结 考前必看

描述计量资料得集中趋势与离散趋势得指标有哪些?各指标得适用范围如何?答:描述计量资料集中趋势得统计指标常见得有算数均数、几何均数、中位数。算数均数适用于描述对称分布资料得集中位置,尤其就是正态分布得资料;几何均数一般用来描述等比资料与对数正态分布资料得集中位置;中位数可以使用于任何分布得资料,尤其就是偏态分布。分布不明或分布末端无确定值得资料。描述离散趋势得指标常见得有极差、四分位数间距、方差、标准差与变异系数.极差与四分位数间距可以用于任何分布,后者比前者稳定,但就是这两个指标都不能综合反映各观察值得变异程度;方差与标准差最常用,但要求资料近似正态分布;变异系数可以用于多组资料间量纲不同或均数相差较大得时候变异程度得比较。 频数分布表(图)得用途有哪些?1描述资料得分布类型,就是对称分布还就是偏态分布;2描述变量得分布特征:集中趋势与离散趋势;3便于发现某些离群值或异常值;4便于进一步得统计分析与处理;5当样本含量够大得时候,我们还可以以频率作为概率得估计值。 变异系数与标准差有何异同?答:不同点:变异系数主要用于量纲不同得变量间,或均数相差较大得变量间得变异程度得比较.所以变异系数就是没有量纲得,而标准差就是方差得平方根,标准差得量纲与原指标得一致,它适用于近似正态分布得资料。相同点与联系:变异系数与标准差都就是用于对称分布资料,尤其就是正态分布得资料,且还可以知道变异系数就是由标准差计算得到得。 应用相对数得注意事项:1、防止概念混淆2、频率型指标得解释要紧扣总体与属性3、计算相对数时分母应有足够数量4、正确计算合计频率5、注意资料得可比性6、正确进行相对数得统计推断。 为什么不能以构成比代率?请联系实际加以说明。 率与构成比所说明得问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分得比重或分布,而不能说明某现象发生得频率或强度。 、二项分布:如果每个对象阳性结果得发生概率为π,阴性结果得概率为1-π,而且各个观察对象得结果就是相互独立得,那么,重复观察N个人,发生阳性次数得概率分布为二项分布。适用条件:1试验只会出现两种对立得结果2每次试验阳性与阴性结果概率固定不变3每次试验相互独立。性质与特征:1形态取决于π与n,当π接近于0、5时,分布对称,离0、5越远,分布对称性越差,当n增大时,分布趋于对称2,高峰在μ=nπ处3、二项分布得总体均数μ=nπ,方差=nπ(1-π),nπ与n(1—π)都大于5时,近似服从正态分布 Poission分布:可以瞧作就是每个观察对象阳性结果得发生发生概率π很小,而观察例数n很大时得二项分布。特征:1、它得分布属于离散型分布2、当总体均数入值小于5时为偏锋,入愈小分布愈偏,随着入增大,分布趋向对称3、总体均数与总体方差相等。 正态分布得概念,图形特征与应用:A正态分布就是自然界最常见得一种分布,特点就是中间频数最多,两边频数渐少且对称;B表现为钟形曲线,曲线下面积为1;μ决定曲线在横轴上得位置,u增大,曲线沿横轴向右移,反之曲线沿横轴向左移;σ决定曲线得形状,当u恒定时它越大数据越分散,曲线越矮胖;σ越小数据越集中,曲线越瘦高;C 正态分布得应用:A确定医学参考值范围:指特定得“正常”人群得解剖,生理,生化指标及组织代谢产物含量等数据中大多数个体得取值所在得范围。范围有两种:百分位数,适用于任何分布类型得资料.正态分布法,若X服从正态分布,可以依赖正态分布规律计算。B质量控制图C计算频率、频数D作为统计学基础。 标准误与标准差得区别:1)标准差反映个体值散布得程度,标准误反映精确知道总体参数得程度2)标误小于标差3)样本含量越大,标误越小,其样本均数更有可能接近于总体均数,但标差不随样本含量得改变而有明显方向性改变,随着样本含量得增大,标差可能增大也可能减小。 t分布特点:1、t分布就是以0为中心得单峰分布,左右完全对称。2、v越小,t值越分散,曲线得峰部越矮,尾部越高,3当自由度v逐渐增大时。t分布逐渐逼近标准正态分布,当v趋于无穷时,t分布就完全成为标准正态分布. 假设检验:也称显着性检验,利用小概率反证法思想,首先根据设计与研究目得提出某种假设,再根据现有得资料提供得信息,推断此假设应当拒绝还就是不拒绝。步骤:1,建立检验假设确定检验水准2,计算检验统计量3,确定P值,做出推断。 假设检验注意事项:A要有严密得抽样研究设计,样本得代表性与组间得均衡性;B正确选用检验方法。根据研究目得,设计类型,变量类型与样本得大小选择恰当得检验方法C、正确理解P值得含义.差别有统计学意义,不能理解为两者差异大,也不能理解为所分析得指标在实际应用中就有“显着效果”。D应结合专业知识理解统计推断得结论,即统计学差异显着得意义与实际意义得差别。E写研究报告时,应写出检验统计量,检验水准α,并注明单双侧及p值得确切范围. 假设检验中P值涵义:就是指在零假设成立得条件下,出现统计量目前值及更不利于零假设数值得概率。(课本).就是指从Ho规定得在体内中进行随机抽样,所观察到得等于及大于现有样本检验统计量得概率。 检验水准α:无效假设为真时,拒绝无效假设得概率。α就是由研究者事先确定得,常用α值有0、05,0、01、假设检验中检验水准α与P值得关系?以t检验为例,α与P都可用t分布得尾部得面积大小表示,所不同得就是:α值就是指在统计推断时预先设定一个小概率值,即原假设H0成立,经检验被拒绝得概率。P值就是由实际样本计算得到得,就是指在Ho成立得前提下,出现等于或大于现有检验统计量得概率。 假设检验就是如何确立单双侧?1)假设检验中根据专业知识与研究目得来确定采用单侧还就是双侧2)若根据专业知识有充分把握可以排除某一侧,可采用单侧检验3)在没有充分理由进行单侧检验时,为稳妥起见,应选用双侧检验. 简述两类错误及其关系?假设检验就是由样本信息对总体特征进行推断,因此无论做出那种推断结论,都有可能发生错误。假设检验时,拒绝原本正确得H0,犯第I类错误,称为弃真错误;不能拒绝原本错误得H0,犯第II类错误,称存伪错误.犯第一类错误得概率用α表示,其数值根据研究者得要求来确定;犯第二类错误得概率用β表示,

相关文档
最新文档