样本量计算DOC

样本量计算DOC
样本量计算DOC

1.估计样本量的决定因素

1.1 资料性质

计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。

1.2 研究事件的发生率

研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。

1.3 研究因素的有效率

有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。

1.4 显著性水平

即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05

或0.01。

1.5 检验效能

检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。

1.6 容许的误差(δ)

如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。

1.7 总体标准差(s)

一般因未知而用样本标准差s代替。

1.8 双侧检验与单侧检验

采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选

择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

1 / 7

或其α应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,时, Ua 界值通过查标准正态分布的分位数表即可得到。β的

2.样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,借鉴他人的经验或进行预实验确定估计样本量决定因素的参只有通过查阅资料,数,便可进行估算。型:①描述性研究:如横断面调查,目的是种类护理中的量性研究可以分为3 况或现况调查;②分析性研究:其目

的是分析比较发病的相描述疾病的分布情研究的类型不同,关因素或影响因素;

③实验性研究:即队列研究或干预实验。则样本量也有所不同。描述性研究

2.1横断面研究的抽样方法主要包括单纯护理研究中的描述性研究多为横断面

研究,分层抽样的样本量大小取决于作者分层抽样和整群抽样。随机抽样、系统抽样、选用的对象是用均数还是率进行抽样调查。要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调. 例查,采用分层多级抽样,选

用的是均数抽样的公式,U为检验水α准α对应的υ值,σ为总体标准差,δ为

容许误差,根据预实验得出标准差σ=1.09,取α=0.05,δ=0.1,样本量算得520例,考虑到 10%-15%的失访率和抽样误差,样本扩展到690例。

2.2分析性研究

2.2.1 探索有关变量的影响因素研究

有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计量资料的样本量估算可用公式也(计算,根据预实验中的数据,2 / 7

代入公式最终计算出样和容许误差δ,可以依据其他文献的结果)得出标准差

S为样本率。,P本量,计数资料资料可用公式研究某变量对

另一变量的影响2.2.2

对于研究某变量对另一变量的影响来说,样本量可以根据直线相关的公式与分别为检验水获得,μ与μβα值,ρ为总体相关系数。α准和第Ⅱ类错误的概率β相对应的U 要做一项血透患者自我管理水平对其健康状况影响的研究,例. power=0.80,假设α=0.05,,总体相关系数可选用文献报道中血液透析患者=1.96,μ=0.84 查表得μβα代入公式就可算出所需样,自我管理水平与健康调查简表得分相关系数为0.274 例。本量为103 两变量或多变量的相关研究2.2.3

倍,一般是其样本量与自变量的多少有关,10对于两变量或多变量相关的研究,为标准U值,S也可以采用公式为检验水准计算。Uα相对应的α差,δ为容许误差。.

关系研究慢性腰背痛患者认知-情感应对、自我和谐与适应水平的例.

,标准差和容许误差可从预实验中获,则0.05U=1.96设定显著性水平α= α. 99S/值,算出δ=5,样本量则为例S得,根据预实验的和δ 2.3 实验性研究计量资料可采用实验性研究样本量的估算公式,也分计量资料和计数资料两种。,计数资料可采用率的计算两样本均数的计算公式N1=N2=公式分别为两样本含量,N1。式中、N2为两总体标准差的估计值,一般假设其相等或取合并方差的平一般要求相等,S t和也可以写为d),tδδ方根,为两均数之差值(若为自身对照,2α/分别为检验水准α和第Ⅱ类错误概率β相对应的t值。α有单双侧之2/β分,而β只取单侧。

3 / 7

d 梗死患者院外自助式心脏康复的效果研究,可以采用此公式计算,其中的例.一项心肌机对照研究中的干预组和对照组在普通健康可以选取文献中报道的、自助式康复手册的随t 得,

d=10.7-5.3=5.4,计算Sc为8.78双侧α=0.05,β=0.1,查表问卷GHQ的得分:/αt=1.96,β=1.282,代入公式得出两组各需样本为56例。2附临床研究样本量的估计: 1.计量资料 m做估计调查的样本估计对总体平均数1.1

公式:(式2.1.2.1)公式: n=(Uασ/δ)

,

的界值,当a=0.05时式中:n为所需样本大小;Ua为双侧检验中,a时U:某学例1为容许的误差。 =1.96,a=0.01U时,U =2.58;s为总体标准差;δ0.010.05人,用单纯随机抽

样调查学生的白细胞水平,根据预查标准差为校有学生3500? /mm ,应调查多

少人950个/ mm ,允许误差不超过100个/mm /mm s=950个N=3500 d=100个

Ua=1.96 a=0.05(双侧)347 ≈n=(1.96×950/100)

所需样本的估计。1.2对样本均数与总体均数的差别做显著性检验时, )(式

1.2-1s/δ] + U )单侧检验用:U(n=[单侧检验用:βα22)(式1.2-2s/δ] ) + U双侧检验用:U(n=[βα2分别为第一类错误及第二类错误出现的概率,式中:α与β。t值 2α、2α、β检验水准的分别为 U 、、UUβαα22计数资料2 做估计调查的样本大小π

2.1 对总体率(式2.1))/PP(1- /δ)公式:

Un=(α式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为样本率。

4 / 7

之差不(P)(p):对某地HBsAg阳性率进行调查,希望所得的样本率和总体率例

2a=0.05) 规定,基于小规模预调查样本率P=14%,应调查多少人? (超过

2%a=0.05 , Ua=1.96 ,已知:δ=0.02, P=0.140.14) =1156 n=(1.96/0.02)2/ ×0.14(1-.

需调查约1160人 2.2 对样本率与总体率的差别做显著性检验时,所需样本的估

计。(式2.2-1)2) + U /δ单侧检验用:U(n=βα22(式2.2-2)) /δ+ U 双侧检验用:Un=(βα2分别为第一类错误及第二类错误出现的概率,α与β式中:值。β检验水准的tα分别为、2α、2 U 、、UUβα2α2所需样本的估计。2.3对样本均数与总体均数的差别做显著性检验时, )式2.3-1))s/δ] P(P1- + U 单侧检验用:Un=[(β2α2(2.3-2))-P)s/δ] P(1 + U 双侧检验用:Un=[(βα2分别为第一类错误及第二类错误出现的概率,α与β式中:分别为α、2α、2β检验水准的U值。 U 、、UUβαα223 病例对照研究的样

本量估计

选择患有特定疾病的人群作为病例组,和未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。

3.1设置估算样本量的相关值

①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率);

②比值比 (odds ratio,OR) 估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)

③α值,检验的显著性水平,通常取α=0.01或0.05;

④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。

根据以上有关参数查表或代公式计算

公式为:

5 / 7

2 ) -pn=(U +U ) /(p 3.1)(式01 =p ×OR/1-p +OR×Pp0001 =1-p=1-q =1-p q(p +p ) =1/20

11001与P1分别为对照组及病例组人群估计的暴露率;p0 或OR)。OR为主要暴露因子的相对危险度或暴露的比值比(RR; , q1 =1-P1 q0 =1-P0

,

为两组暴露史比例的平均值; )/2, Q1 =1-P1 既 =(P1 +P2

估例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。95%2时,即能在计孕妇有30%暴露于此因子。现要求在暴露造成相对危险度为 90%的把握度查出,病例组和对照组各需多少例?的显著性水平以=0.10, =0.05, βp0=0.3 OR=2,设α=1.282 Uα=1.96 Uβ用双侧检验2)/[1+0.3(2-1)]=0.46 ×p1 =(0.3=1-0.3=0.7 =1/2(0.3+0.46)=0.38 q0

=1-0.46=0.54 =1-0.38=0.62

q1

. 人192 ,即病例组与对照组各需192n=(1.96 +1.282 )2/(0.46-0.3)2 ≈实验研究的样本量计算4 计量资料指身高、体重、血压、血脂和胆固醇等数值变量。4.1 计量资料:

估计公式为:(式4.1)

为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本n 大小为2n;U为显著性水平相应的标准正态差;αU为β相应的标准正态差;

βδ为估计的标准差,δ2 =(δ1 2 +δ2 2 )/2;

d为两组数值变量均值之差,

例题:某新药治疗高血压,将研究对象随机分为治疗组和对照组。假设:a=0.05, β=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。查表:zα =1.96,

zβ =1.282(双侧检验),需要多大样本。

4.2 计数资料:即非连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。当现场试验的评价指标是非连续变量时,按下式计算样本大小:

n=[U +U ] /(P -P ) (式4.2)

P :对照组发生率

P :实验组发生率

5 诊断试验的样本量估计

6 / 7

5.1 设置估算样本量的相关值 60%;①灵敏度 60%;②特异度;0.05值,检验的显著性水平,通常取α=0.01或③α。;即把握度为90%或80%β),通常区β=0.10或0.20④期望的把握度(1- 计算公式5.2

)(式5.2))/P(1-P /δ公式:Un=(α式中:U为显著性水平相应的U值,

通常取α=0.01或0.05;αδ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。

P为诊断试验的灵敏度或特异度;

例:预计所评价的诊断试验的灵敏度为90%,特异度85%;

δ=0.025,规定a=0.05,病例组和对照组应调查多少人?

已知:δ=0.02, a=0.05 , Ua=1.96

n=(1.96/0.025)2/ ×0.85(1-0.85) =783

n=(1.96/0.025)2/ ×0.90(1-0.90) =553

对照组需783人, 病例组需553人。

参考文献

[1] 胡修周.医学科学研究学[M].北京:高等教育出版社.2006,76.

[2] 刘娜,倪平,陈京立. 护理研究中量性研究的样本量估计[J]. 中华护理杂志, 2010, 45(4): 378-379.

7 / 7

临床试验样本量的估算

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=0.05,β=0.2)时:

计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=12.365×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=12.365× (S/δ)2 等效性试验(α=0.05,β=0.2)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=17.127×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=17.127× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率,

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需 样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 2.1描述性研究 例. =0.1, 2.2 2.2.1探索有关变量的影响因素研究 有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量

最新【科研】如何确定临床实验设计中的样本量资料

科研】如何确定临床实验设计中的样本量? 在临床实验研究中,无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能。而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性(bias) 。所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本量。由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计。但在个别情况下,也可能要求各组样本含量按一定比例来估计。 1 与样本含量估计有关的几个统计学参数在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计。 1.1规定有专业意义的差值3,即所比较的两总体参数值相差多大以上才有专业意义。3 是根据实验目的人为规定的, 但必须有一定专业依据。习惯上把8称为分辨力或区分度。 8值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大。

1.2确定作统计推断时允许犯I类错误(“弃真”的的误率a,即当对比的双方总体参数值没有差到8。但根据抽样观测 结果错误地得出二者有差别的推断结论的可能性,a 确定的 越小,所需样本含量越大。在确定a时还要注意明确是单侧 检验的a,还是双侧检验的a。在同样大小的a条件下;双侧检验要比单侧检验需要更大的样本含量。 1.3提出所期望的检验效能power,用1- B表示。B为允许犯H类错误(“取伪”的错误概率。检验效能就是推断结论不犯H类错误的概率1- B称把握度。即当对比双方总体参数值间差值确实达到8以上时,根据抽样观测结果在规定的a水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1- B定为0.90或0.80。一般来说1- B不宜低于0.75 , 否则可能出现非真实的阴性推断结论。 1.4给出总体标准差c或总体率n的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据, 可通过预实验取得样本的标准差s或样本率P分别作为c和n的估计值。c的估计值越大,n的估计值越接近0.5 ,所需样本含量越大。 在对以上统计学参数作出规定或估计的前提下,就可以根据不同的推断内容选用相应的公式计算出所需样本含量。由于在同样的要求和条件下完全随机设计(成组设计)所需样本含 量最大,故一般都要按完全随机设计作出样本含量的估计。

样本量计算方法

样本量及其计算依据: 根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840],功能性消化不良患者接受伊托必利50mg组治疗后,其NDI改善值的均数为18.0,本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0,本研究共设了6个组别,检验水准α=0.05,检验效能1-β=0.90,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算,每组所需样本数n=77例,按15%的脱失率计算,每个组应不少于89例,6组应不少于534例。 样本量及其计算依据: 若分为三组或三组以上,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数,?X j, s i各为每组的均数与标准差的估计值,x=Ε?X j/k,ψ为界值,可通过查阅ψ值表得到。

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。 1.5 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 1.6 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

样本量计算

样本量计算 调查研究中样本量的确定 在社会科学研究中,研究者常常会遇到这样得问题:“要掌握总体(population)情况,到底需要多少样本量(sample)?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在调查研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式: Z2 S2 n = ------------ (1) d2 其中: n代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中: n :所需样本量 z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68

p:目标总体的比例期望值 d:置信区间的半宽 关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。 而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公

t检验计算公式

t 检验计算公式: 当总体呈正态分布,如果总体标准差未知,而且样本容量n <30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈t 分布。 t 检验是用t 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。t 检验分为单总体t 检验和双总体t 检验。 1.单总体t 检验 单总体t 检验是检验一个样本平均数与一已知的总体平均数的差异是否显 著。当总体分布是正态分布,如总体标准差σ未知且样本容量n <30,那么样本平均数与总体平均数的离差统计量呈t 分布。检验统计量为: X t μ -= 。 如果样本是属于大样本(n >30)也可写成: X t μ -= 。 在这里,t 为样本平均数与总体平均数的离差统计量; X 为样本平均数; μ为总体平均数; X σ为样本标准差; n 为样本容量。 例:某校二年级学生期中英语考试成绩,其平均分数为73分,标准差为17分,期末考试后,随机抽取20人的英语成绩,其平均分数为79.2分。问二年级学生的英语成绩是否有显著性进步? 检验步骤如下: 第一步 建立原假设0H ∶μ=73 第二步 计算t 值 79.273 1.63X t μ --= = = 第三步 判断 因为,以0.05为显著性水平,119df n =-=,查t 值表,临界值 0.05(19)2.093t = ,而样本离差的t = 1.63小与临界值 2.093。所以,接受原假设, 即进步不显著。

2.双总体t 检验 双总体t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t 检验又分为两种情况,一是相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。二是独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。 现以相关检验为例,说明检验方法。因为独立样本平均数差异的显著性检验完全类似,只不过0r =。 相关样本的t 检验公式为: t = 在这里,1X ,2X 分别为两样本平均数; 1 2 X σ,2 2X σ分别为两样本方差; γ为相关样本的相关系数。 例:在小学三年级学生中随机抽取10名学生,在学期初和学期末分别进行了两次推理能力测验,成绩分别为79.5和72分,标准差分别为9.124,9.940。问两次测验成绩是否有显著地差异? 检验步骤为: 第一步 建立原假设0H ∶1μ=2μ 第二步 计算t 值 X X t -= =3.459。 第三步 判断 根据自由度19df n =-=,查t 值表0.05(9) 2.262t =,0.01(9) 3.250t =。由于实际计算出来的t =3.495>3.250=0.01(9)t ,则0.01P <,故拒绝原假设。 结论为:两次测验成绩有及其显著地差异。 由以上可以看出,对平均数差异显著性检验比较复杂,究竟使用Z 检验还是使用t 检验必须根据具体情况而定,为了便于掌握各种情况下的Z 检验或t 检验,

临床样本量统计

1、样本量计算公式 根据统计学原理,经预试验的两组结果,对照组率Pc=100%,治疗组率Pi=99%,两组率差=1%。 根据离散响应变量样本量计算公式(等效性/非劣性),每组样本量N=2(Zα+Z2/β)2×(Pc+Pi)/2×{1-(Pc+Pi)/2}/Δ2。取α=0.05,β=0.10,按照临床意义的界值Δ(一般为10%),取对照组有效率的10%,即Δ=10%。 根据以上公式和设定值,每组样本量N=2×(1.96+1.645)2×0.995×0.005/0.12=12.9,即至少需要13例。如果按20%的脱落率计算,即临床样本量为15例。 2、统计分析 1、样本数的确定 本研究欲考察该产品的临床治愈率不差于对照组产品,即设定为非劣效性试验,试验组与对照组按1:1的比例安排病例数,评价指标采用定性指标,根据以往的该类产品的疗效和统计学的一般要求,取α=0.05,β=0.20,等效标准δ=0.15,平均有效率p=0.95,由传统计算公式N=12.365×P(1-P)/ δ2 N:每组的估算例数N1=N2,N1和N2分别为试验组和对照组的例数, P:平均有效率 δ:等效标准 α显著性水平,也是假阳性率,α=0.05,表示将来自同一总体的两样本可能为来自不同总体的概率为5% β:1-β称为检验效能把握度,β=0.20时表示当两总体确有差异时,按α水准有80%的把握能发现他们有所差别。 根据以往的该类产品的疗效和统计学的一般要求,取α=0.05,β=0.20,等效标准δ=0.15, 平均有效率p=0.95,由上述公式计算得到每组需要完成26例,试验设计每组完成30例。 同时为了弥补传统的样本量估计方法的不足,在非劣效性评价的临床试验中,当疗效指标为离散变量时,可以采用相对率可信区间的方法,SAS下编写宏,由SAS.FREQ过程提供的CMH检验和计算相对率的功能解决。随机模拟路线:(1)产生若干符合两项分布的随机数,进行CNH检验,估计相对率的可信区间(可信区间下限不低于0.9),并判断是否符合非劣效的标准;(2)重复N 次,以计算得到非劣效结论的次数,从而计算检验效能;(3 )循环使用上述工具K次,用以寻找符合规定检验效能(0.8)的样本量。模拟结果每组需29例。由此我们每组设计完成30例可以达到80%的效能水平。 2 统计分析计划 2.1 基线评价方法 对于两组定量指标在基线的比较,采用成组设计定量资料所对应的统计分析方法,首先考查资料是否满足正态性及方差齐性的前提条件,若满足,采用成组设计定量资料的t检验,否则,选用成组设计定量资料的wilcoxon秩和检验。

怎样确定统计量的样本容量

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

样本量计算(DOC)

1. 估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡 ,误差控制得好 ,样本可以小于 30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些 ,需要30-100 例。 1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(a)错误出现的概率。为假阳性错误出现的概率。a越小,所需的样本量越大,反之就要越小。a水平由研究者具情决定,通常a取0.05 或 0.01 。 1.5 检验效能 检验效能又称把握度,为1-B,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的a水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,B越小,检验效能越高,所需的样本量越大,反之就要越小。B水平由研究者具情决定,通常取 B为0.2,0.1或0.05。即1—B =0.8,0.1或0.95,也就是说把握度为80% 90%或95%。 1.6容许的误差(S) 如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1— a )可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差 s 代替。 1.8 双侧检验与单侧检验 采用统计学检验时 ,当研究结果高于和低于效应指标的界限均有意义时 , 应该选择双侧检验 , 所需样本量就大 ; 当研究结果仅高于或低于效应指标的界限有意义

实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量 作者:张耀文 小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。 小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥: 小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。 小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢? 小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。 小玲:原来是这样啊,那我赶紧再去读一读这两个文件。 小玲读完后,又来找小咖。 小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。 小咖:很好。你先总结一下大意。 小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。 小咖:很好,你get 到了所有的point 。以本研究为例,计算样本量时,需要

6 样本量估计 - 中国临床试验注册中心

广州市社区2型糖尿病人群血清标志物与骨折风险早期 预测的前瞻性队列研究 临床研究负责单位:南方医科大学珠江医院 主要研究者:杨力、张桦、程彦臻、许雯、李婉媚、欧春泉 参加单位及负责人:南方医科大学珠江医院杨力 统计分析单位:南方医科大学生物统计学系 CRO公司:无 方案版本号:1.0 方案定稿日期:2017年4月25日

研究方案摘要

目录 1研究背景与目的 (6) 1.1研究背景 (6) 1.2研究目的 (8) 1.3研究假设 (9) 2试验设计 (9) 3研究对象(队列人群选择) (9) 3.1诊断标准 (9) 3.2入选标准 (10) 3.3排除标准 (10) 4观察指标(变量定义及观测的时间与节点) (11) 4.1一般临床特征指标(含人口学指标) (11) 4.2主要暴露因素/影响预后因素(包括对照选择) (11) 4.3研究终点 (11) 4.4潜在混杂变量 (12) 5样本量估计 (12) 6数据采集与数据管理 (14) 6.1数据来源 (14) 6.2数据采集 (14) 6.3数据库 (15) 6.4数据管理计划与质量控制 (15) 7统计分析 (15) 8伦理考虑 (16) 9质量控制和质量保证 (16) 10组织实施(时间进度) (16) 11参与各方责任及签名 (17) 12参考文献 (17)

1研究背景与目的 1.1研究背景 根据2014 年一项《近十年我国各地区骨质疏松症流行病学状况》报告[1],目前我国约2.1亿人存在低骨量问题,全国 40 岁以上的骨质疏松患者已达到 1.12 亿,随老龄化社会的进展,这一比例还将逐步增加;国际骨质疏松基金会(IOF)报告[2]也指出,在 2010 年,中国 50 岁及以上的人口中发生了大约 230 万例骨折,这一数字预计将在 2050 年上升到 600 万例。骨质疏松骨折是老年人致死、致残最常见的原因[3],《2013 年中国骨质疏松骨折防治蓝皮书》中指出:50岁以上女性椎体骨折的发病率达到15%,髋骨骨折1年内,可导致死亡率增加10~20%[4]。因此骨质疏松骨折成为影响人民身体健康和医疗支出的重大社会卫生问题。 糖尿病是造成骨质疏松的最主要的危险因素之一,随着经济水平飞速发展及生活方式的变化,我国的2型糖尿病发病率急剧升高,上海交通大学医学院附属瑞金医院宁光教授与中国疾病预防控制中心赵文华带领的研究团队的最新研究结果显示[5]:我国18岁及以上成人样本中,根据国际最新临床诊断标准进行诊断的糖尿病估测患病率为11.6%。糖尿病导致骨质量恶化所引发的骨质疏松可使髋部、腕部、脊柱骨折风险增加2~7倍[6],致残、致死率明显升高,严重威胁中国老年人群的健康和生活质量,并造成沉重的家庭、社会和经济负担。 早期防治糖尿病性骨质疏松,提高糖尿病患者对骨量丢失及相关危险因素的知晓率、寻找能早期有效预测骨折风险和生化标志物是预防和尽早治疗的重要前提,将会极大地提高糖尿病病人的生活质量和节省社会资源。而且,构建以社区为基础,建立患者社区档案与综合医院常规诊疗相结合,在社区进行糖尿病骨质疏松高风险人群筛查、教育、治疗的模式是有效防治糖尿病所致骨折的策略。本项目参照国外前瞻性研究的成功经验,开展2型糖尿病骨质疏松骨折风险预测因素的前瞻性研究,以期达到减少并延缓骨折及再次骨折的发病率、降低致残率的目的,为今后建立有效的糖尿病相关性骨质疏松早期筛查、疾病发展监控与干预体系提供理论依据与技术支持。 国内外概况 糖尿病导致骨质损伤涉及高血糖渗透性利尿导致钙磷代谢异常、胰岛素促成骨作用减弱、胰岛素样生长因子(insulinlike growth factor, IGF)缺乏,及AGEs-RAGE 途径[7]等多种因素。在糖尿病人群,常伴有其他的危险因子和糖尿病发生协同作用,使糖尿病相关骨质疏松的风险大大增加。l型糖尿病患者骨质疏松的患病率高达

抽样调查的样本容量的确定方法

抽样调查的样本容量的确定方法 摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。 关键词:样本容量;抽样调查;抽样误差;极限误差 抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。 1.确定样本容量的必要性 1.1样本容量大小影响抽样估计的精确度 抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。 1.2样本容量大小影响抽样调查的成本和效益 样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。 因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。 2.影响必要样本容量的主要因素 影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。从理论上说,影响样本容量的因素有以下几个方面: 2.1单位标志变异程度 或成数方差P(1-P)的大小来表示。在其他单位标志变异程度一般用方差2

样本量的确定方法.

如对你有帮助,请购买下载打赏,谢谢!样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城

临床试验样本量的估算

临床试验样本量得估算 样本量得估计涉及诸多参数得确定,最难得到得就就是 预期得或者已知得效应大小(计数资料得率差、计量资料得均数差值),方差(计量资料)或合并得率(计数资料各组得合并率),一般需通过预试验或者查阅历史资料与文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不就是想做就能做得。SFDA得规定主要就是从安全性得角度出发,保证能发现多少得不良反应率;统 计得计算主要就是从power出发,保证有多少把握能做出显著来。 但就是中国得国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组与对照组得 有效率分别为65、0%与42、9%,则每个治疗组中能接受评价得病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%得情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人得总样本例数为250例。 非劣性试验(α=0、05,β=0、2)时:

计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=12、365×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=12、365× (S/δ)2 等效性试验(α=0、05,β=0、2)时: 计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=17、127×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=17、127× (S/δ)2 上述公式得说明: 1) 该公式源于郑青山教授发表得文献。 2) N 就是每组得估算例数N1=N2,N1 与N2 分别为试验药与参比药得例数; 3) P 就是平均有效率,

t检验计算公式

t 检验计算公式: 当总体呈正态分布,如果总体标准差未知,而且样本容量n <30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈t 分布。 t 检验是用t 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。t 检验分为单总体t 检验和双总体t 检验。 1.单总体t 检验 单总体t 检验是检验一个样本平均数与一已知的总体平均数的差异是否显 著。当总体分布是正态分布,如总体标准差σ未知且样本容量n <30,那么样本平均数与总体平均数的离差统计量呈t 分布。检验统计量为: X t μ σ-= 。 如果样本是属于大样本(n >30)也可写成: X t μ σ-= 。 在这里,t 为样本平均数与总体平均数的离差统计量; X 为样本平均数; μ为总体平均数; X σ为样本标准差; n 为样本容量。 例:某校二年级学生期中英语考试成绩,其平均分数为73分,标准差为17分,期末考试后,随机抽取20人的英语成绩,其平均分数为79.2分。问二年级学生的英语成绩是否有显著性进步? 检验步骤如下: 第一步 建立原假设0H ∶μ=73 第二步 计算t 值 79.273 1.6317X t μ σ--= = = 第三步 判断 因为,以0.05为显著性水平,119df n =-=,查t 值表,临界值0.05(19) 2.093t =, 而样本离差的t =1.63小与临界值2.093。所以,接受原假设,即进步不显著。 2.双总体t 检验

双总体t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t 检验又分为两种情况,一是相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。二是独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。 现以相关检验为例,说明检验方法。因为独立样本平均数差异的显著性检验完全类似,只不过0r =。 相关样本的t 检验公式为: X X t = 。 在这里,1X ,2X 分别为两样本平均数; 1 2X σ,22 X σ分别为两样本方差; γ为相关样本的相关系数。 例:在小学三年级学生中随机抽取10名学生,在学期初和学期末分别进行了两次推理能力测验,成绩分别为79.5和72分,标准差分别为9.124,9.940。问两次测验成绩是否有显著地差异? 检验步骤为: 第一步 建立原假设0H ∶1μ=2μ 第二步 计算t 值 t = = =3.459。 第三步 判断 根据自由度19df n =-=,查t 值表0.05(9) 2.262t =,0.01(9) 3.250t =。由于实际计算出来的t =3.495>3.250=0.01(9)t ,则0.01P <,故拒绝原假设。 结论为:两次测验成绩有及其显著地差异。 由以上可以看出,对平均数差异显著性检验比较复杂,究竟使用Z 检验还是使用t 检验必须根据具体情况而定,为了便于掌握各种情况下的Z 检验或t 检验,我们用以下一览表图示加以说明。

临床试验样本量的估算

样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=,β=)时:

计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=× (S/δ)2 等效性试验(α=,β=)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率,

相关文档
最新文档