样本量计算(DOC)

1. 估计样本量的决定因素

1.1 资料性质

计量资料如果设计均衡 ,误差控制得好 ,样本可以小于 30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些 ,需要30-100 例。

1.2 研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。

1.3 研究因素的有效率

有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显著性，反之就要越大。

1.4 显著性水平

即假设检验第一类（a）错误出现的概率。为假阳性错误出现的概率。a越小，所需的样本量越大，反之就要越小。a水平由研究者具情决定，通常a取0.05 或 0.01 。

1.5 检验效能

检验效能又称把握度，为1-B，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的a水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，B越小，检验效能越高，所需的样本量越大，反之就要越小。B水平由研究者具情决定，通常取

B为0.2，0.1或0.05。即1—B =0.8，0.1或0.95，也就是说把握度为80% 90%或95%。

1.6容许的误差（S）

如果调查均数时，则先确定样本的均数（）和总体均数（m）之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1— a ）可信限的一半。

1.7 总体标准差（s）

一般因未知而用样本标准差 s 代替。

1.8 双侧检验与单侧检验

采用统计学检验时 ,当研究结果高于和低于效应指标的界限均有意义时 , 应该选择双侧检验 , 所需样本量就大 ; 当研究结果仅高于或低于效应指标的界限有意义

时,应该选择单侧检验，所需样本量就小。当进行双侧检验或单侧检验时，其a或

B的Ua界值通过查标准正态分布的分位数表即可得到

2. 样本量的估算

由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。

护理中的量性研究可以分为3种类型：①描述性研究：如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：其目的是分析比较发病的相关因素或影响因素；③实验性研究：即队列研究或干预实验。研究的类型不同，则样本量也有所不同。

2.1描述性研究

护理研究中的描述性研究多为横断面研究，横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。

例.要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调

查，采用分层多级抽样，选用的是均数抽样的公式捋二V戸滲『，込为检验水准a对应的u值，c为总体标准差，S为容许误差，根据预实验得出标准差（T

=1.09，取a =0.05，S =0.1，样本量算得520例，考虑到10%-15%勺失访率和抽样误差，样本扩展到690例。

2.2分析性研究

2.2.1探索有关变量的影响因素研究

有关变量影响因素研究的样本量大多是根据统计学变量分析的要求，样本数至

少是变量数的5-10倍。例如，如果研究肺结核患者生存质量及影响因素，首先要考虑影响因素有几个，然后通过文献回顾，可知约有12个预测影响变量，如

年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持，那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法，在获得相关文献支持下，最好根据公式

计算，计量资料的样本量估算可用公式，根据预实验中的数据（也

可以依据其他文献的结果）得出标准差S和容许误差S ,代入公式最终计算出样本量，计数资料资料可用公式'■| -'? 1 r，P为样本率。

222研究某变量对另一变量的影响

对于研究某变量对另一变量的影响来说，样本量可以根据直线相关的公式

]}2+3获得，―与卩B与分别为检验水准a和第U类错误的概率B相对应的U值，p为总体相关系数。

例.要做一项血透患者自我管理水平对其健康状况影响的研究，

假设 a =0.05，power=0.80，

查表得卩a =1.96，卩B =0.84，总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分相关系数为0.274，代入公式就可算出所需样

本量为103例。

2.2.3两变量或多变量的相关研究

对于两变量或多变量相关的研究，样本量与自变量的多少有关，一般是其10倍, 也可以采用公式计算。5为检验水准a相对应的U值，S为标准

差，S为容许误差。

例.研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的关系.

设定显著性水平a = 0.05，则U a=1.96，标准差和容许误差可从预实验中获

得，根据预实验的S和S值，算出S/ S =5,样本量则为99例.

2.3实验性研究

实验性研究样本量的估算公式，也分计量资料和计数资料两种。计量资料可采用两样本均数的计算公式 N1=N2曇丨匸I弋hymtL，计数资料可采用率的计算公式1【认厂：加：].八字。式中NI、N2分别为两样本含量，一般要求相等，S为两总体标准差的估计值，一般假设其相等或取合并方差的平方根，S为两均数之差值（若为自身对照，S也可以写为d）, t a / 2和t

B /2分别为检验水准a和第U类错误概率B相对应的t值。a有单双侧之

分，而B只取单侧。

例?一项心肌梗死患者院外自助式心脏康复的效果研究，可以采用此公式计算，其中的d 可以选取文献中报道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康

问卷GHQ 的得分：d=10.7-5.3=5.4，计算Sc 为8.78,双侧a =0.05, 3 =0.1,查表得t a /

2=1.96, t3 =1.282，代入公式得出两组各需样本为56例。

附临床研究样本量的估计：

1.计量资料

1.1对总体平均数m做估计调查的样本估计

公式：公式：n= (/ 0 (式2.1.2.1 )

式中：n为所需样本大小；Ua为双侧检验中，a时U的界值，当a=0.05 时，

U0.05 =1.96,a=0.01 时,U 0.01 =2.58 ; s为总体标准差；0为容许的误差。例1 :某学校有学生3500人，用单纯随机抽样调查学生的白细胞水平，根据预查标准差为950个/ mm，允许误差不超过100个/mm，应调查多少人？

N=3500 d=100 个 /mm s=950 个/mm

a=0.05 (双侧)Ua=1.96

n=(1.96 X 950/100)?347

1.2对样本均数与总体均数的差别做显著性检验时，所需样本的估计。

单侧检验用：单侧检验用：n=[ (U2 a + U 2 3 ) s/ 3](式1.2-1 )

双侧检验用：n=[ (U a + U 2 3)s/ 3](式 1.2-2 )

式中：a与3分别为第一类错误及第二类错误出现的概率，

U a、U2 a、U2 3分别为a、2a、23检验水准的t值。

2计数资料

2.1对总体率n 做估计调查的样本大小

公式：n= ( U a / 3 /P ( 1 —P) (式 2.1 )

式中：3为容许的误差：即允许样本率(p)和总体率(P)的最大容许误差为多少P为样本率。

例2:对某地HBsAg阳性率进行调查，希望所得的样本率(p)和总体率(P)之差不超过2%基于小规模预调查样本率 P=14%应调查多少人？(规定a=0.05)

已知：S =0.02, P=0.14 , a=0.05 , Ua=1.96

n=(1.96/0.02)2/ X 0.14(1 —0.14) =1156

需调查约1160人.

2.2对样本率与总体率的差别做显著性检验时，所需样本的估计。

单侧检验用：n= (U2 a+ U 2 3 / # )(式 2.2-1 )

双侧检验用：n= (U a+ U 2 3 / 3 )(式 2.2-2 )

式中：a与3分别为第一类错误及第二类错误出现的概率，

U %、U2 a、U2 3分别为a、2a、23检验水准的t值。

2.3对样本均数与总体均数的差别做显著性检验时，所需样本的估计。

单侧检验用：n=[ (U2 a + U 2 3)S/ 3 ]P1 —P)式 2.3-1 )

双侧检验用：n=[ (U a + U 2 3 ) s/ 3 ] P1 —P) (2.3-2 )

式中：a与3分别为第一类错误及第二类错误出现的概率，

U a、U2 a、U2 3 分别为a、2a、2 3检验水准的U值。

3病例对照研究的样本量估计

选择患有特定疾病的人群作为病例组，和未患这种疾病的人群作为对照组，调查两组人群过去暴露于某种(些)可能危险因素的比例，判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。

3.1设置估算样本量的相关值

①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率)；

②比值比(odds ratio，OR)估计出的各研究因素的相对危险度或暴露的比值比

(即RR或OR

③a值，检验的显著性水平，通常取 a =0.01或0.05 ;