方差分析的统计检验力和效果大小的常用方法比较.

方差分析的统计检验力和效果大小的常用方法比较.
方差分析的统计检验力和效果大小的常用方法比较.

心理学探新2011,Vol.31,No.3,254-259

PSYCHOLOGICAL EXPLORATION

方差分析的统计检验力和效果大小的常用方法比较*

胡竹菁戴海琦

(江西师范大学心理学院,南昌330022

摘要:本文对用方差分析统计检验力和效果大小进行估计的几种不同方法作了简要的介绍和比较。

关键词:方差分析的效果大小;方差分析的统计检验力

中图分类号:B841.2文献标识码:A文章编号:1003-5184(201103-0254-06

1方差分析的统计检验力和效果大小的含义

关于统计检验力(The power of a statistical test

的含义,美国著名心理统计学家J.Cohen曾指出:

“当虚无假设为假时…,关于虚无假设的统计检验

力是指导致拒绝虚无假设的概率。”[1]

关于效果大小(effect size,ES的含义,J.Cohen

在同一本专著中指出:“当虚无假设为假时…,它总

是在一定程度上的虚假。效果大小(effect size,ES

是指某个特定总体中的某种特殊的非零的数值。这

个数值越大,就表明由研究者所处理的研究现象所

造成的效果越大…效果大小本身可以被视为是一

种参数:当虚无假设为真时,效果大小的值为零;当

虚无假设为假时,效果大小为某种非零的值。因此, 可以把效果大小视为某种与虚无假设分离程度的指标。”[1]

最近几年,我国心理学界也有越来越多的学者

注意到这一领域研究成果的重要性并加以介绍和评述:如权朝鲁对“效果量的意义及测定方法”作了简

要述评[2];胡竹菁曾以平均数差异显著性检验为例,对实验数据进行假设检验后继续对其统计检验

力和效果大小进行估计的基本原理和方法作了简要介绍[3]。甘怡群[4]、舒华[5]等也在各自主编的教科书中有专门论述统计检验力的章节。本文拟以单因素和两因素完全随机实验设计的方差分析为例,对

方差分析后的统计检验力进行估计的几种不同方法作一简要介绍和比较。

在心理统计学中,方差分析(即F检验中的虚

无假设一般是H

0:μ

1

=…=μ

k

,其备择假设

则是指H

a :μ

1

2

,…μ

k

不完全相等,方差分析的统

计检验力(power of test,即1-β的含义与平均数差异显著性检验的统计检验力1-β的含义在实质上都是一样的,都是指在虚无假设H

为假(备择假

设H

a

为真时,正确拒绝H

的概率。

方差分析效果大小(effect size的含义也基本上与Z检验或t检验的效果大小的含义相同,只不过它反映的是多组实验处理下不同组之间实验效果差异大小的指标。

由于J.Cohen提出的方差分析统计检验力的估计方法需要先计算其效果大小,因此,本文将先介绍方差分析效果大小的估计方法,而后再介绍方差分析统计检验力的估计方法。

2单因素方差分析效果大小的估计

目前,学术界对于如何评估方差分析效果大小至少存在两类不同的指标体系:一类以η2作为指标,另一类以粗体小写字母f值作指标。

J.Cohen认为,可以用η2来作为方差分析效果大小的指标,其计算公式为[1]:

η2=

SS

组间

SS

总体

目前,西方较多学者采用这种方法来估计方差分析的效果大小[6-8]。

我国学者舒华等则认为,可以使用η2的平方根即eta作为方差分析效果大小的指标,其计算公式为[5]:η=

SS

组间

SS

槡总体(注:原书的表达形式为:eta=SS组间

SS

槡总体第二类以小写字母f值作指标体系评估方差分析效果大小的方法包含以下两种:

1有些学者(如甘怡群等认为,可以用下列公式来计算方差分析的效果大小f值[4]:

f=

F

槡n

*基金项目:江西省高等学校教学改革研究省级立项课题(JXJG-10-2-27。

式中,根号内大写字母F 是该次方差分析后得到的检验统计量,

n 是指各组人数相等时每个组的人数,如果各组人数不相等,则需要计算各组人数的调和平均数n H 。

2美国纽约大学的学者B.H.Cohen 认为,用f =

F

n

计算得到的f 值是效果大小的有偏估计,因此采用下列公式来计算方差分析效果大小

[9]

:

f =

k -1(

k

F

n 这一公式用粗体小写字母f 来表示方差分析效果大小,以示与f 区别。式中,根号内大写字母F 和小写字母n 的含义与上一公式相同,

k 指分组数。在上述两类估计方法中,第一类估计方法是以“实验处理之后各组间平方和在总体平方和中所占的比重”的计算方法为基础,第二类方法则是以F 检验中备择假设分布的期望F 值作为理论基础来评估效果大小的f 值或期望f 值。J.Cohen 指出,这两类估计方法的相互关系是

[1]

:

f =

η

2

1-η槡

2

美国心理统计学家Runyon 等人编写的《心理统计》一书就用f =

η

2

1-η槡

2的计算结果作为方差

分析效果大小的指标

[10]

J.Cohen 认为,当用η2

或其平方根η作方差分析效果大小的指标时,η2

=0.01时属于小的效果,在η2=0.06时属于中等效果,在η2=0.14时属于

大的效果。当用f 值(或期望f 值作指标时,在f =0.10时属于小的效果,在f

=0.25时属于中等效果,在f =0.40时属于大的效果。

下面,以一个实例来对上述计算方差分析效果大小的不同方法作一比较。

例1有人研究了个人表现的反馈类型对其自尊的影响。让15名被试参加一项知识测验,每组各5名被试。不管被试在测验中的实际表现如何,对积极反馈组,都告诉他们水平很高;对消极反馈组,都告诉他们表现很差;对控制组,不提供任何反馈信息。最后,让所有的被试都参加一个自尊测验,测验总分为100分,得到的分数越高,表明自尊越强。实验结果如表1所示,问不同反馈类型的各组被试的自尊水平是否存在显著差异?

表1不同反馈类型条件下被试自尊水平测试得分表

积极反馈组

控制组消极反馈组

84.071.059.074.075.064.081.073.062.075.074.069.084.069.075.070.0

82.0

67.0

对表1的数据进行方差分析后可以得到如表2

所示的方差分析表。

表2

不同反馈类型对被试自尊水平影响的方差分析表

变异来源平方和自由度均方F 组间44822247.814**

组内4301528.67

总变异

878

17

以表2的数据为基础可以计算出上述不同估计方法得到的效果大小的值分别为:

(1η2=SS 组间SS 总体=448

878=0.51(2η=SS 组间

SS 槡

总体

=0.槡51=0.714(3

f =F

槡n =

7.814槡6

=1.槡30=1.14

(4f =

(k -1k ·

F

槡n

=(3-13·7.814

6

=0.67?1.槡30=0.93(5f = η

2

1-η槡

2

=

0.51

1-0.槡

51

=

0.51

0.槡

49

=1.02

由上面的计算结果可知,不同的估计方法得出

的方差分析效果大小的结果是不一样的,需要注意的是,两类方法之间由于计算方法所依赖的理论基础不一样,因此所用指标的量纲是不一样的。问题是,

在众多的效果大小指标中,我们应该选择哪一个作为对表1所述实验数据进行方差分析后的效果大小更为合适呢?我们认为,就理解效果大小这一概

念的含义上说,上述以η2

作为实验处理后效果大小的指标较易为人所理解,因为η2

的含义是“实验处理之后各组间平方和在总体平方和中所占的比重”[1],η2的指标值大,反映实验效果大,η2的指标值小,则反映实验效果小,因此这一指标所反映的效果大小的内涵最容易让人们所理解。就表1的实验数据而言,方差分析后用η2

的结果作为效果大小的指标说明,在该实验中,总体变异中约有51%是来

5

52第31卷第3期胡竹菁等方差分析的统计检验力和效果大小的常用方法比较

自反馈类型的实验处理。由于用η2的结果作效果大小指标的便于理解性,著名的统计软件SPSS就采用η2作为该软件“一般线性模型”模块中有关效果大小的指标。将表1中的数据输入SPSS运行后, SPSS给出的效果大小值是“η2=0.51”(注:英文版SPSS给出的结果标为“Partial Eta Squared”;中文版SPSS18.0给出的结果标为“偏eta方”,与上述用η2作为效果大小的指标计算出的结果完全一样。

如前所述,J.Cohen认为,当用η2作方差分析效果大小的指标时,在η2=0.14时就属于大的效果。因此,虽然用η2作为方差分析效果大小的估计值在上述各种计算方法的结果中其值最小,但0.51的效果大小还是远远大于0.14,因此有的统计学家认为用η2作为实验处理在总变异中所占比重的估计方法一般会高估实验处理的效果,提出另外一个含义与η2大致相同的指标ω2来反映实验处理效果大小,其计算公式为:

ω2=SS

组间

-(k-1MS

e SS

总体

+MS

e

还是以表1和表2的数据为例,将已知数据代入公式后可得:

ω2=SS

组间

-(k-1MS

e

SS

总体

+MS

e

=

448-(3-1?28.67

878+28.67

=0.43

虽然ω2=0.43比η2=0.51的值更小,但被认为能更准确地反映反馈类型对被试自尊水平实验中的效果。

3单因素方差分析统计检验力的估计方法

方差分析备择假设的期望分布值通常用希腊字母Φ表示。J.Cohen指出,方差分析统计检验力的计算公式是:

Φ=f槡n

其中,小写英文字母f值就是效果大小的指标值。

求方差分析统计检验力的过程一般是,先求方差分析效果大小,而后或者根据效果大小直接查相应的转换表求统计检验力,或者根据效果大小值求Φ值后再查相应的转换表求统计检验力。

如前所述,由于估计效果大小的方法不同,得出的效果大小的值也就不一样。由此转换的统计检验力也会不一样。目前,根据方差分析效果大小求其统计检验力的方法主要有以下三种:

1当用η2来作为方差分析效果大小的指标时,可以根据η2值,各组人数和分组数直接查相应的换算表求统计检验力1-β的值,Aron等的《心理统计》一书使用的就是这种方法[6]。以表1的数据为例,分组数k=3的相应换算表有如表3所示。

表3分组数为k=3的统计检验力换算表

n

效果大小

η2=0.01η2=0.06η2=0.14 100.070.210.51

200.100.430.85

300.130.610.96

400.160.760.99

500.190.851.0

1000.360.991.0

如表1所示,各组人数是n=6,在表3中最接近的值是n=10那一行,效果大小

η2=0.51,虽然其值远远大于η2=0.14,也只能查最接近的η2= 0.14那一列,结果为对本次实验数据进行方差分析的统计检验力1-β为51%。

2当用f或者用粗体小写字母f值来作为方差分析效果大小的指标时,也可以根据f或f值,各组人数和分组数直接查相应的换算表求统计检验力1-β的值,甘怡群编写的《心理与行为科学统计》一书使用的就是这种方法[4]。以表1的数据为例,分组数k=3的相应换算表有如表4所示。

表4分组数为k=3的统计检验力换算表

n

效果大小

f=0.10f=0.25f=0.40 100.070.200.45

200.090.380.78

300.120.550.93

400.150.680.98

500.180.790.99

1000.320.981.0

例如,由表1可知,各组人数是n=6,在表4中最接近的值是n=10那一行,通过表2的数据计算的三种f或f值分别为,f=1.14,f=0.93和f= 1.02,虽然效果大小的f或f 值都远大于f=0.40,也只能查最接近的f=0.40那一列,由此认为对本次实验方差分析的统计检验力1-β为45%。

3根据J.Cohen提出的Φ=槡

f n的计算公式计算出Φ值后,再根据Φ值,方差分析表中的组内自由度和分组数查相应的换算表求统计检验力1-β的值,B.H.Cohen编写的《心理统计学详解》一书使用的就是这种方法[9]。以表1的数据为例,分组数k=3的相应换算表有如表5所示。

652心理学探新2011年

表5方差显著性检验的统计检验力表

K=3 df

w

(Φ 1.01.21.41.61.82.02.22.63.0

40.180.230.300.380.460.540.620.760.86 80.230.320.420.520.630.720.800.920.97……

160.270.380.490.610.720.810.880.960.99……

?0.320.440.570.700.800.880.9499*

通过表2的数据可知,组内自由度是15,在表5中最接近的是df

w

=16那一行。将前述五种效果大小的值代入公式后可以得到五个不同的Φ值,然后根据Φ值在表5中可以查到相应的反映这次方差分析的5个不同的统计检验力值:

Φ1=槡

0.516=1.23,相应的统计检验力介于0.38 0.49之间;

Φ2=槡

0.7146=1.75,相应的统计检验力介于0.61 0.72之间;

Φ3=1.槡

146=2.79,相应的统计检验力介于0.96 0.99之间;

Φ4=0.槡

936=2.28,相应的统计检验力介于0.88 0.96之间;

Φ5=1.槡

026=2.50,相应的统计检验力介于0.88 0.96之间;

与前面所提众多效果大小指标应选哪一个合适的问题一样,这里也存在着一个在众多的统计检验力指标中选哪一个更为合适的问题。我们认为,对这一问题的回答要注意以下两个方面:

一方面,任何一种对方差分析统计检验力的评估结果都只是一个粗略的估计,不存在完全准确的答案,就目前的情况而言,上述各种反映统计检验力的指标都有一定的理论基础,也都有专家在使用,因此,都可以作为方差分析统计检验力的指标来使用,只是在选用某种指标时要清楚其理论基础是什么。

另一方面,可以用在我国广为使用的统计软件包上给出的方差分析统计检验力的指标来对上述各种指标作一比较。将表1中的数据输入SPSS(中文版18.0后,点击“分析”的下拉菜单中对应的“一般线性模型”,再点击“单变量(U…”后会出现一个对话框,按正确方式输入“因变量(即自尊水平”和“固定因子(即反馈类型”后,点击“选项”,在出现的各选项中选中“功效估计”和“检验效能”两项,点击“继续”后再点击“确定”,SPSS运行后给出的统计检验力的值是“观测到的效力=0.91”。若将上述各种

统计检验力结果与SPSS给出的这个结果作一比较,可以知道:

用上述第一种方法即η2=0.51(或eta= 0.714直接查相应的转换表求得的统计检验力是0.51;

用第二种方法即三种f或f值(f=1.14,f= 0.93和f=1.02直接查相应的转换表求得的统计检验力是0.45。

这两种方法计算的统计检验力都远远小于SPSS给出的0.91的值。

用第三种方法即用J.Cohen[1]给出的Φ=槡

f n 的计算公式进行计算时,将五种效果大小值代入公式后的计算的统计检验力的结果又分三种情况:第一种情况是将η2=0.51和eta=0.714这两种效果大小的指

标代入公式后求得的统计检验力分别是介于0.38 0.49之间或介于0.61 0.72之间,远低于SPSS给出的0.91的值;

第二种情况是用公式f=

F

槡n求出效果大小的指标为f=1.14,代入公式后求得的统计检验力介于0.96 0.99之间,远高于SPSS给出的0.91的值;

第三种情况是用公式f=

(k-1

k

·

F

槡n求出效果大小的指标为f=0.93,或者用公式f=η2

1-η

槡2求出效果大小的指标为f=1.02,将这两个f值代入公式后求得的统计检验力都介于0.88 0.96之间,基本符合SPSS给出的0.91的值。

根据上述比较,笔者建议,在对方差分析的统计检验力进行估计时,先用公式f=

(k-1

k

·

F

槡n或公式f=

η2

1-η

槡2求出效果大小的指标,而后代入公式Φ=槡

f n求Φ值,再根据Φ值,方差分析表中

752

第31卷第3期胡竹菁等方差分析的统计检验力和效果大小的常用方法比较

的组内自由度和分组数查相应的换算表求方差分析统计检验力的值。

4两因素方差分析效果大小和统计检验力的估计方法

两因素方差分析效果大小和统计检验力的估计原理与单因素方差分析效果大小和统计检验力的估计原理基本相似,下面的例子将说明其计算过程和方法。

例2有人想采用2?2两因素完全随机实验方法来研究专业知识对记忆的影响,其中因素A为被试的专业性质(含新手-专家两个水平,因素B为棋局类型(含随机摆放-比赛中盘两个水平。实验结果如表6所示。请检验专业知识和棋局类型对记忆成绩是否有显著影响,二者是否存在交互作用;方差分析后各因素和两因素交互作用的效果大小及统计检验力各为多少。

表6专家与新手对不同棋局棋子位置的记忆成绩

棋局类型

人员类型

Ⅰ(随机摆放Ⅱ(比赛中盘Ⅰ(新手2,4,4,3,48,1,2,4,4

Ⅱ(专家1,5,6,3,69,9,11,11,11将表6中的数据输入SPSS(中文版18.0运行并经整理后有如表7所示。

表7专家与新手对不同棋局棋子位置的记忆成绩方差分析表

变异来源平方和自由度均方F偏η2统计检验力因子A(人员64.8164.818.65**0.5380.982

因子B(棋局51.2151.214.73**0.4790.949

交互作用A?B39.2139.211.28**0.4140.883误差E55.6163.475

总变异T210.819

根据J.Cohen的观点,方差分析后各因素及它

们之间的交互作用的效果大小可以用以下公式来计

算[11]:

η2effect=

SS

effect SS

effect

+SS

w

将表7中的相关数据代入这一公式可分别得到:

η2A=

SS

A

SS

A

+SS

w

=

64.8 64.8+55.6 =0.5382

η2B=

SS

B

SS

B

+SS

w

=

51.2

统计学五几种常见的假设检验

定义 假设检验就是用来判断样本与样本,样本与总体的差异就是由抽样误差引起还就是本质差别造成的统计推断方法。其基本原理就是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还就是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而就是基于小概率原理:概率很小的事件在一次试验中几乎就是不可能发生的,若发生了,就就是不合理的。至于怎样才算就是“小概率”呢?通常可将概率不超过0、05的事件称为“小概率事件”,也可视具体情形而取0、1或0、01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它就是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设, H1——备择假设 双侧检验:H0:μ = μ0 , 单侧检验: ,H1:μ < μ0 或, H1:μ > μ0假设检验就就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1、T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ与已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法; 1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值

医学统计学 检验方法

医学统计学检验方法(转) 医学论文中统计方法的正确应用 医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。 1.1 多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、主成分分析和因子分析等。多因素分析多用于计量资料。 1.2 单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验,样本率与总体率的比较用u 检验;两个样本率的比较可用u 检验或四格表的x 检验,多个样本率的比较可用行乘列的卡方检验或2XC 表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T 检验和F 检验,T 检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F 检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有: 2.1 某现象发生的频率或比例如人群中重复癌的发生率,采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。

医学统计学检验方法

医学统计学检验方法(转) 医学论文中统计方法的正确应用 医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现 一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。 1、所选统计方法脱离了资料的性质不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。 1.1多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、 主成分分析和因子分析等。多因素分析多用于计量资料。 1.2单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首 先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本间的比较则采用计数资料的显著性检验,样本率与总体率的比较用 u检验;两个样本率的比较可用u检验或四格表的x检验,多个样本率的比较可用行乘列的卡方检验或2XC表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T检验和F检验,T检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。 2、根据研究目的选用统计分析方法不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有: 2.1某现象发生的频率或比例如人群中重复癌的发生率,采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。

统计学常用检验方法

统计中经常会用到各种检验,如何知道何时用什么检验呢,根据结合自己的工 作来说一说: t检验有单样本t检验,配对t检验和两样本t检验。单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对 象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受 试对象处理前后。 u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样 本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t 分布),当x为未知分布时应采用秩和检验。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。 简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。 在t检验中,如果是比较大于小于之类的就用单侧检验,等于之类的问题就用双侧检验。 卡方检验 是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。 方差分析 用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家,以F命名其统计量,故方差分析又称F检验。其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括 单因素方差分析即完全随机设计或成组设计的方差分析(one-way ANOVA): 用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。 两因素方差分析即配伍组设计的方差分析(two-way ANOVA): 用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对象不同时间(或部位)重复多次测量所得到的资料称为重复测量数据

统计学分析方法

统计分析方法总结 分享 胡斌 00:06分享,并说:统计 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确** (3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。 2.分类资料

统计分析的八种方法

统计分析的八种方法 统计分析的八种方法一、指标对比分析法指标对比分析法,又称比较分析法,是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标,只能说明总体的某些数量特征,得不出什么结论性的认识;一经过比较,如与国外、外单位比,与历史数据比,与计划相比,就可以对规模大小、水平高低、速度快慢作出判断和评价。 指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。这两种方法既可单独使用,也可结合使用。进行对比分析时,可以单独使用总量指标或相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数,如百分数、倍数、系数等,也可用相差的绝对数和相关的百分点(每1%为一个百分点)来表示,即将对比的指标相减。 二、分组分析法指标对比分析法是总体上的对比,但组成统计总体的各单位具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求,把所研究的总体按照一个或者几个标志划分为若干个部分,加以整理,进行观察、分析,以揭示其内在的联系和规律性。 统计分组法的关键问题在于正确选择分组标值和划分各组界限。 三、时间数列及动态分析法时间数列。是将同一指标在时间上变化和发展的一系列数值,按时间先后顺序排列,就形成时间数列,又称动态数列。它能反映社会经济现象的发展变动情况,通过时间数列的编制和分析,可以找出动态变化规律,为预测未来的发展趋势提供依据。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。 时间数列速度指标。根据绝对数时间数列可以计算的速度指标:有发展速度、增长速度、平均发展速度、平均增长速度。 动态分析法。在统计分析中,如果只有孤立的一个时期指标值,是很难作出判断的。如果编制了时间数列,就可以进行动态分析,反映其发展水平和速度的变化规律。 进行动态分析,要注意数列中各个指标具有的可比性。总体范围、指标计算方法、计算价格和计量单位,都应该前后一致。时间间隔一般也要一致,但也可以根据研究目的,采取不同的间隔期,如按历史时期分。为了消除时间间隔期不同而产生的指标数值不可比,可采用年平均数和年平均发展速度来编制动态数列。此外在统计上,许多综合指标是采用价值形态来反映实物总量,如国内生产总值、工业总产值、社会商品零售总额等计算不同年份的发展速度时,必须消除价格变动因素的影响,才能正确的反映实物量的变化。

10第十章效应量和统计检验力-刘红云版心理统计教材课后习题

练习题 1.什么叫效应值?它在实际研究中有何作用? 2.Cohen d值是如何表达的?在单样本t检验、独立样本t检验和相关样本t检验中,d值的公式是如何变化的? 3.统计量r2描述了什么?它在实际研究中有何作用? 4.从一个均值为40的正态总体中选择一个n=16的样本。对样本施测,处理后,评价处理效应的大小。 a.假设总体的标准差为8,计算Cohen d系数来评价一个样本均值为?x=42的样本的效应大小; b.假设总体的标准差为2,计算Cohen d系数来评价一个样本均值为?x=42的样本的效应大小; c.假设总体的标准差为8,计算Cohen d系数来评价一个样本均值为?x=48的样本的效应大小; d.假设总体的标准差为2,计算Cohen d系数来评价一个样本均值为?x=48的样本的效应大小; 5.五年级学生的阅读成绩测验形成了一个均值为60,标准差为10的正态分布。一个研究者想要评价一个新的阅读项目。他对五年级学生的样本进行这个项目的培训,然后测量他们的阅读成绩。 a.假设研究者使用了一个n=16的样本,得到的测验分数均值为?x=62。使用α=0.05的假设检验来确定项目是否有显著的作用。用Cohen d系数来测量效应大小; b.现在假设研究者使用了一个n=100的样本,得到的测验分数均值为?x=62。再使用假设检验来评价项目效果的显著性,计算Cohen d系数来测量效应大小; c.比较a和b得到的结果,解释样本大小怎样随机影响假设检验和Cohen d系数的。 6.从一个均值为100的总体中得到一个随机样本,对样本施测。处理后,样本均值为?x=104,样本方差为S2=400。 a.假定样本包括n=16名被试,计算Cohen d系数和r2测量处理效应大小; b.假定样本包括n=25名被试,计算Cohen d系数和r2测量处理效应大小; c.比较在a和b部分得到的结果,样本量是如何影响效应大小的? 7.下图是垂直一水平错觉的一个例子。尽管两条线是一样长的,垂直的线看起来更长。为了考察这个错觉,一个研究者准备了一个例子,这个例子中两条线都是10英尺长。给每个被试展示这个例子,告诉他们水平线有10英尺长,然后让他们估计垂直线的长度。一个n=25的样本,估计的平均值为?x=12.2英尺,标准差为S=1.00。 a.使用0.01水平的单侧假设检验证明样本中的个体显著高估了线段的真实长度。(注

1统计学的基本方法包括有(

试卷2 一、单选题 1.统计学的基本方法包括有( ) ①调查方法、整理方法、分析方法、预测方法 ②调查方法、汇总方法、预测方法、实验设计 ③相对数法、平均数法、指数法、汇总法 ④实验设计、大量观察、统计描述、统计推断 2.要了解某市国有工业企业生产设备情况,则统计总体是( ) ①该市国有的全部工业企业 ②该市国有的每一个工业企业 ③该市国有的某一台设备 ④该市国有制工业企业的全部生产设备 3.有意识地选择三个农村点调查农民收入情况,这种调查方式属于() ①典型调查②重点调查③抽样调查④普查 4.2000年11月1日零点的第五次全国人口普查是() ①典型调查②重点调查③一次性调查④经常性调查 5.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为() ①动态相对指标②结构相对指标 ③比例相对指标④比较相对指标 6.一个企业产品销售收入计划增长8%,实际增长20%,则计划超额完成程度为() ①12%②150%③111.11%④11.11% 7.众数是总体中下列哪项的标志值() ①位置居中②数值最大 ③出现次数较多④出现次数最多 8.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为() ①600元②533.33元③466.67元④500元 9.抽样调查和重点调查的主要区别是() ①选取调查单位的方式不同②调查的目的不同 ③调查的单位不同④两种调查没有本质区别 10.若销售量增加,销售额持平,则物价指数( ) ①降低②增长③不变④趋势无法确定 二、多选题 1.某企业是总体单位,数量标志有( ) ①所有制②职工人数③月平均工资 ④年工资总额⑤产品合格率 2.相对指标数值的表现形式有() ①比例数②无名数③结构数④抽样数⑤复名数 3.在直线相关和回归分析中() ①据同一资料,相关系数只能计算一个 ②据同一资料,相关系数可以计算两个 ③据同一资料,回归方程只能配合一个 ④据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个

利用SPSS进行统计检验

第四节利用SPSS进行统计检验 在教育技术研究中,经常需要利用不同的教学媒体或教学资源对不同的对象进行教学改革 试验,但教学试验的总体往往都有较大数量,限于人力、物力与时间,通常都采用抽取一定的 样本作为研究对象,这样,就存在样本的特征数量能否反映总体特征的问题,也存在着两种不 同的样本的数量标志的参数是否存在差异的问题,这就必需对样本量数进行定量分析与推断, 在教育统计学中称为“统计检验”。 一、统计检验的基本原理 统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策。如果现要检验实验组和对照组的平均数(μ1和μ2)有没有差异,其步骤为: 1.建立虚无假设,即先认为两者没有差异,用表示; 2.通过统计运算,确定假设成立的概率P。 ⒊根据P 的大小,判断假设是否成立。如表6-12所示。 二、大样本平均数差异的显著性检验——Z检验 Z检验法适用于大样本(样本容量小于30)的两平均数之间差异显著性检验的方法。它是 通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显著的一种差异显著性检验方法。其一般步骤: 第一步,建立虚无假设,即先假定两个平均数之间没有显著差异。 第二步,计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。 (1)如果检验一个样本平均数()与一个已知的总体平均数()的差异是否显著。其 Z值计算公式为:

其中是检验样本的平均数; 是已知总体的平均数; S是样本的方差; n是样本容量。 (2)如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异 是否显著。其Z值计算公式为: 其中,1、2是样本1,样本2的平均数; 是样本1,样本2的标准差; 是样本1,样本2的容量。 第三步,比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表 作出判断。如表6-13所示。 第四步,根据是以上分析,结合具体情况,作出结论。 【例6-5】某项教育技术实验,对实验组和控制组的前测和后测的数据分别如表6-14所示,比较两组前测和后测是否存在差异。

问卷调查的常用统计分析方法

问卷调查的常用统计分析方法 问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS 的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。 调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal 是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤,

以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正, 调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal 是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 1 、单选题:答案只能有一个选项 例一当前贵组织机构是否设有面向组织的职业生涯规划系统? A有 B 正在开创C没有D曾经有过但已中断 编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。

住院医师培训课程-常用医学科研中的统计学方法1

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验() *c ? A.t值变小 ? B.t值变大 ? C.t值不变 ? D.t值变小或变大 2、作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是() *c ? A.A.统计量t越大,说明两总体均数差别越大 ? B.B.统计量t越大,说明两总体均数差别越小 ? C.C.统计量t越大,越有理由认为两总体均数不相等 ? D.D.P值就是αa 3、随机区组设计的方差分析用于() * ? A.多个样本均数间的两两比较 ? B.比较各个区组间的样本均数有无差别 ? C.比较各个区组间的总体均数有无差别 ? D.比较各个处理组间的样本均数有无差别 4、各组数据方差不齐时,可以做() *D ? A.近似检验 ? B.秩和检验 ? C.数据转换 ? D.ABC均可 5、第I类错误的概念是() *D ? A.H0是不对的,统计检验结果未拒绝H0 ? B.H0是对的,统计检验的结果未拒绝H0 ? C.H0是不对的,统计检验结果拒绝H0 ?

6、下列哪种说法是错误的() *B ? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数 ? B.分析大样本数据时可以构成代替率 ? C.应分别将分子和分母合计求合计率或平均率 ? D.相对数的比较应注意其可比性 7、配对计量资料进行假设检验时() *Dd ? A.仅能用配对t检验 ? B.仅能用成组t检验 ? C.仅能用随机区组设计的方差分析 ? D.用配比t检验和随机区组设计的方差分析均可 8、方差分析的前提条件是() *A ? A.计量资料非参数统计的 ? B.正态性 ? C.随机性 ? D.方差齐性 9、设配对设计资料的变量为X1与X2,则配对设计的符号的秩检验() *B ? A.把X1与X2的差数军队之从小到大编秩,排好后秩次保持原差数的正负号 ? B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号 ? C.把X1与X2综合按绝对值从小到大编秩 ? D.把X1与X2的差数从小到大编秩 10、对于配对t检验和成组t检验,下列哪一种说法是错误的() *B ? A.对于配对设计资料应作配对t检验,如果作成组t检验,不但不合理,而且平均起来统计效率降低 ? B.成组设计的资料用配对t检验,不但合理,而且平均起来可以提高统计效率 ? C.成组设计的资料,无法用配对t配对t检验 ?

常用医学科研中的统计学方法(1)

正确答案错误答案 1.从同一总体抽样,则样本标准差() A随着样本含量增大而增大 B样本含量增大而标准差不变 C随着样本含量减少而减少 D随着样本含量增大而减小 2.用图表示某地区近30年三种疾病的发病率,在各年度的动态发展速度情况,宜绘制() A普通线性图 B.直方图 C.百分条图 D.半对数线图。 3.均数与标准误的关系() A.均数越大,标准误越大 B.均数越大,标准误越小 C标准误越小,用均数推测总体均数的可靠性越大。 E标准误越大,用均数推测总体均数的可靠性越大。 4.多重线性回归分析中,度量一组自变量与应变量线性相关程度的统计量是() A.负相关系数 B.决定系数 C.偏相关系数 D.偏回归系数 5.变异系数cv的数值() A.一定大于1 B.一定小于1 C.可以大于1,也可以小于1 D.一定小于标准差。 6.在样本量为n,自变量个数为3的线性回归方程的假设检验中,回归变异和剩余变异的

自由度分别为() A. 3和n-3 B. 3和n-4 C. 2和n-2 D. 2和n-3 7.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制() A.半对数线图 B.圆图 C.直方图 D.普通线图 8.在同一总体中随机抽取多个样本,用样本均数估计总体均数95%的可信区间,则估计精 密度高的是() A.均数小的样本 B.标准差小的样本 C.标准误大的样本 D.标准误小的样本 9.均数的标准误反映了() A.个体的变异程度 B.集中趋势的位置 C.指标的分布规律 D.样本均数与总体均数的差异 10.由样本均数估计总体均数可靠性大小的指标是() A.标准差 B.标准误 C.方差 D.变异系数 11.表示血清抗体滴度资料平均水平最常用的指标是()

统计分析方法适用条件

统计分析方法适用条件 统计学方法一直以来都是我们专业的必修课,也是我们的基本功,可是现在滥用方法 的人很多,现在总结一些前人的资料供大家参考学习! 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验, 如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检 验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni 法,tukey法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal- Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检 验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni 法,tukey法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题:

统计检验的基本思想是什么

统计检验的基本思想是什么? 先从一个例子谈起. 某公社种植的小麦,根据往年生产情况,平均每亩产量为μ0=350斤,标准差为σ0=75斤.今年,该公社引进新的小麦品种,试种了100亩,在田间管理大致相同的情况下,其平均亩产量为x=368斤,能否认为该品种可以推广呢? 显然,新品种的亩产量比原品种的亩产量高.就是说,新品种与原品种存在差异,但如果不引进新品种,还用原品种种植,这100亩的小麦平均亩产量不一定仍旧还是350斤,而可能会增加或减少.因此,新品种与原品种的差异,可能是由于品种不同引起,也可能是由于其它因素引起的.前者称为条件差异,后者称为随机差异,这两种差异经常纠缠在一起,要解决上述问题,关键在于正确区分这两种差异.统计检验就是帮助我们处理这类问题的一种科学方法. 首先,我们假定新品种对亩产量没有影响(称为统计假设,简称假设),就是说不存在条件差异,x 与0μ的差异纯粹是随机差异,样本仍可认为是从原总体抽出来的。 根据统计理论指导,x 应该遵从正态分布( 0μ,20n σ),因而x 落在区间(0μ-1.962σ, 0μ-1.962σ=(335,364)的概率为95%,现x =368在区间之外,样本落在上述区间外的概率只有5%,极难由偶然因素造成.因为概率5%相当于二十次才能出现一次,这种事件称为小概率,小概率事件在一次试验中是很难发现的,因此我们认为x 来自正态分布 (0μ,20n σ)的可能性小,不能相信开始提出的统计假设是正确的,从而否定原假设. 我们否定假设的根据是因为样本均值x 与总体均值相差较大,这时我们说,新品种与原品种有显著性差异.其标准是在区间(335,364)外的概率只有5%,数值5%叫做显著性水平,通常用α表示,上述判断就是在α=5%下作出的.显著性水平变了,判断也可能随着改变,例如,取α=1%,u 0.01=2.58,因而将上述区间的1.96换成2.53.这时,区间变为 否定原假设,现在算得:

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe 法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe 法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题:

方差分析的统计检验力和效果大小的常用方法比较.

心理学探新2011,Vol.31,No.3,254-259 PSYCHOLOGICAL EXPLORATION 方差分析的统计检验力和效果大小的常用方法比较* 胡竹菁戴海琦 (江西师范大学心理学院,南昌330022 摘要:本文对用方差分析统计检验力和效果大小进行估计的几种不同方法作了简要的介绍和比较。 关键词:方差分析的效果大小;方差分析的统计检验力 中图分类号:B841.2文献标识码:A文章编号:1003-5184(201103-0254-06 1方差分析的统计检验力和效果大小的含义 关于统计检验力(The power of a statistical test 的含义,美国著名心理统计学家J.Cohen曾指出: “当虚无假设为假时…,关于虚无假设的统计检验 力是指导致拒绝虚无假设的概率。”[1] 关于效果大小(effect size,ES的含义,J.Cohen 在同一本专著中指出:“当虚无假设为假时…,它总 是在一定程度上的虚假。效果大小(effect size,ES 是指某个特定总体中的某种特殊的非零的数值。这 个数值越大,就表明由研究者所处理的研究现象所

造成的效果越大…效果大小本身可以被视为是一 种参数:当虚无假设为真时,效果大小的值为零;当 虚无假设为假时,效果大小为某种非零的值。因此, 可以把效果大小视为某种与虚无假设分离程度的指标。”[1] 最近几年,我国心理学界也有越来越多的学者 注意到这一领域研究成果的重要性并加以介绍和评述:如权朝鲁对“效果量的意义及测定方法”作了简 要述评[2];胡竹菁曾以平均数差异显著性检验为例,对实验数据进行假设检验后继续对其统计检验 力和效果大小进行估计的基本原理和方法作了简要介绍[3]。甘怡群[4]、舒华[5]等也在各自主编的教科书中有专门论述统计检验力的章节。本文拟以单因素和两因素完全随机实验设计的方差分析为例,对 方差分析后的统计检验力进行估计的几种不同方法作一简要介绍和比较。 在心理统计学中,方差分析(即F检验中的虚 无假设一般是H 0:μ

数学建模中统计学常用方法.

1.1多元回归 1、方法概述: 在研究变量之间的相互影响关系模型时候, 用到这类方法, 具体地说:其可以定量地描述某一现象和某些因素之间的函数关系,将各变量的已知值带入回归方程可以求出因变量的估计值,从而可以进行预测等相关研究。 2、分类 分为两类:多元线性回归和非线性线性回归; 其中非线性回归可以通过一定的变化转化为线性回归, 比如:y=lnx 可以转化为 y=u u=lnx来解决;所以这里主要说明多元线性回归应该注意的问题。 3、注意事项 在做回归的时候,一定要注意两件事: (1 回归方程的显著性检验(可以通过 sas 和 spss 来解决 (2 回归系数的显著性检验(可以通过 sas 和 spss 来解决 检验是很多学生在建模中不注意的地方, 好的检验结果可以体现出你模型的优劣, 是完整论文的体现, 所以这点大家一定要注意。 4、使用步骤: (1根据已知条件的数据,通过预处理得出图像的大致趋势或者数据之间的大致关系; (2选取适当的回归方程; (3拟合回归参数; (4回归方程显著性检验及回归系数显著性检验 (5进行后继研究(如:预测等

这种模型的的特点是直观,容易理解。 这体现在:动态聚类图可以很直观地体现出来! 当然,这只是直观的一个方面! 2、分类 聚类有两种类型: (1 Q 型聚类:即对样本聚类; (2 R 型聚类:即对变量聚类; 聚类方法: (1 最短距离法 (2 最长距离法 (3 中间距离法 (4 重心法 (5 类平均法 (6 可变类平均法 (7 可变法 (8 利差平均和法 在具体做题中,适当选取方法; 3、注意事项

在样本量比较大时,要得到聚类结果就显得不是很容易,这时需要根据背景知识和相关的其他方法辅助处理。还需要注意的是:如果总体样本的显著性差异不是特别大的时候,使用的时候也要注意! 4、方法步骤 (1首先把每个样本自成一类; 2选取适当的衡量标准,得到衡量矩阵,比如说:距离矩阵或相似性矩阵,找到矩阵中最小的元素,将该元素对应的两个类归为一类, (4重复第 2步,直到只剩下一个类; (4重复第 2步,直到只剩下一个类; 补充:聚类分析是一种无监督的分类,下面将介绍有监督的“分类” 。 我简单说明下,无监督学习和有监督学习是什么 无监督学习:发现的知识是未知的 而有监督学习:发现的知识是已知的 有监督学习是对一个已知模型做优化,而无监督学习是从数据中挖掘模型 他们在分类中应用比较广泛 (非数值分类 如果是数值分类就是预测了,这点要注意 1.3数据分类 1、方法概述

显著性分析用SPSS进行统计检验

显著性分析用S P S S进 行统计检验 文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

用SPSS进行统计检验 在教育技术研究中,经常需要利用不同的教学媒体或教学资源对不同的对象进行教学改革试验,但教学试验的总体往往都有较大数量,限于人力、物力与时间,通常都采用抽取一定的样本作为研究对象,这样,就存在样本的特征数量能否反映总体特征的问题,也存在着两种不同的样本的数量标志的参数是否存在差异的问题,这就必需对样本量数进行定量分析与推断,在教育统计学中称为“统计检验”。 一、统计检验的基本原理 统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策。如果现要检验实验组和对照组的平均数(μ1和μ2)有没有差异,其步骤为: 1.建立虚无假设,即先认为两者没有差异,用表示; 2.通过统计运算,确定假设成立的概率P。 ⒊根据P 的大小,判断假设是否成立。如表6-12所示。 二、大样本平均数差异的显着性检验——Z检验 Z检验法适用于大样本(样本容量小于30)的两平均数之间差异显着性检验的方法。它是通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显着的一种差异显着性检验方法。其一般步骤: 第一步,建立虚无假设,即先假定两个平均数之间没有显着差异。 第二步,计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。

(1)如果检验一个样本平均数()与一个已知的总体平均数()的差异是否显着。其Z值计算公式为: 其中是检验样本的平均数; 是已知总体的平均数; S是样本的方差; n是样本容量。 (2)如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显着。其Z值计算公式为: 其中,1、2是样本1,样本2的平均数; 是样本1,样本2的标准差; 是样本1,样本2的容量。 第三步,比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显着性关系表作出判断。如表6-13所示。 第四步,根据是以上分析,结合具体情况,作出结论。 【例6-5】某项教育技术实验,对实验组和控制组的前测和后测的数据分别如表6-14所示,比较两组前测和后测是否存在差异。 由于n>30,属于大样本,应采用Z检验。由于这是检验来自两个不同总体的两个样本平均数,看它们各自代表的总体的差异是否显着,所以采用双总体的Z 检验方法。 计算前测Z的值 = ∵=<

统计学:几种常见的假设检验

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢通常可将概率不超过的事件称为“小概率事件”,也可视具体情形而取或等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设,H1——备择假设 双侧检验:H0:μ = μ0, 单侧检验:,H1:μ < μ0 或,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1.T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法; 1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T 值的计算公式为: 2)如果要评断两组样本平均数之间的差异程度,其统计量T值的计算公式为: 3、根据自由度df=n-1,查T值表,找出规定的T理论值并进行比较。理论值差异的显

相关文档
最新文档