9.非参数检验

9.非参数检验
9.非参数检验

9 非参数检验

当总体分布类型已知时,对总体参数作假设检验称为参数检验。总体分布未知时,可用不依赖总体分布类型、不对总体参数进行统计推断的非参数检验。如果已知计量资料满足或近似满足t 检验或F 检验的条件,应该选择t 检验或F 检验,因为这是如果选用非参数检验,会降低检验的效能。SPSS 中使用菜单Analyze →Nonparametric Tests 作非参数检验,Nonparametric Tests 的下拉菜单如表9-1所示。

表9-1 Nonparametric Tests 下拉菜单

Chi-Square … χ2检验… Binomial … 二项分布检验… Runs… 游程检验… 1-Sample K-S … 单样本K-S 检验… 2 Independent Samples … 两个独立样本检验… K Independent Samples … 多个独立样本检验… 2 Related Samples … 两个相关样本检验… K Related Samples … 多个相关样本检验…

9.1 χ2检验

χ2检验用于检验观测频数与期望频数是否一致。

例9-1 有一个六面体,六个面上分别标有1、2、3、4、5、6,将这个六面体投了300次,结果见表9-2,问这个六面体是否均匀?

表9-2 六个面出现的频数 面上数字 1 2 3 4 5

6 频数

43 49 56 45

66

41

解 本例就是检验六个面出现的期望频数都是50。如图9-1建立数据文件。

1.指定频数变量 选择菜单Data→Weight cases ,在弹出的Weight cases 对话框中,将freq 送入Frequency V ariable 框中;单击OK 。

2.进行χ2检验 选择菜单Analyze →Nonparametric Tests →

Chi-Square ,弹出Chi-Square Test 对话框,如图9-2所示。将x 送

入Test V ariable (检验变量)框中;在下面的Expected V alues (定义期望值)框中,由于本例6个类别的期望值相同,所以使用默认的All categories equal (所以类别期望值相等),如果各个类别的期望值不同,将选用下面的V alues ,输入各个类别所对应的期望值;单击OK 。

计算结果见图9-3,χ2 =8.960,P=0.111,不拒绝原假设,故可以认为这个六面体是均匀的。

本例也可以不用指定频数变量,直接用freq 作为检验变量,结果相同。

图9-1 例9-1数据文件

图9-2 Chi-Square Test对话框图9-3 χ2检验结果

9.2 二项分布检验

二项分布检验是对二分类变量的拟合优度检验,它考察观

察值的频数与特定二项分布下的预期频数是否有统计学差异。

例9-2用常规疗法治疗某病的有效率为65%,今用新疗

法治疗该病20人,结果19人有效,问新疗法的有效率是否比

常规疗法高?

解H0:总体有效率=0.65。如图9-4,建立数据文件,注

意数据行的顺序,要将有效人数放在第一行,如果将无效人数放在第一行,则计算的是无效率的比较。

1.指定频数变量同例9-1。

2.进行二项分布检验选择菜单Analyze→Nonparametric Tests→Binomial,弹出

Binomial

Test(二项分布检验)对话框,如图9-5,将a送入Test Variable(检验变量)框中,在Test (检验概率值)框中输入0.65;单击OK。

在左下角Define Dichotomy(定义二分值)框中,如果检验变量只有两个值,选中Get from data(从数据得到),直接从原始数据读取;如果检验变量超过两个值,选择Cut point(分割点),键入分割界值,小于或等于界值的数据构成一组,大于界值的数据构成另一组。

图9-5 Binomial Test对话框图9-6 二项分布检验结果输出结果见图9-6。样本有效率0.95,总体有效率0.65,单侧P=0.002<0.01,按 =0.01水准拒绝H0,新疗法总体有效率与常规疗法的总体有效率0.65的差异有统计学意义,可以认为

图9-4 例9-2数据文件

新疗法比常规疗法好。

9.3 游程检验

游程检验是对二分类变量的随机检验,主要用于推断数据序列中两类数据的发生过程是否随机,例如临床试验所关心的病例入组顺序是否随机。许多统计学检验都是假设样本中的观察值都是独立的,即收集到的数据样本的顺序是不相关的。如果数据的收集顺序十分重要,那么样本就可能不是随机的,这将使研究者不能得出关于抽样总体的准确结论。

例9-3 某病的病死率(%)如表9-3所示,判断20年间病死率的变化是否随机。

表9-3 某病20年的病死率

解 H 0:病死率的变化是随机的。将20个病死率输入在一列中,该列变量名为x 。 选择菜单Analyze →Nonparametric Tests →Runs ,弹出Runs Test (游程检验)对话框,如图9-7所示。将x 送入Test V ariable (检验变量)框中;在Cut Point (分割点)框中,选中Median (中位数)为分割点;单击OK 。

确定分割点有4种选择:检验变量的中位数、均值、众数以及自定义。变量被分割点分为两类,小于分割点的是一类,大于或等于分割点的为另一类。

输出结果见图9-8。游程个数为6,检验统计量Z=-2.068,双侧P =0.039<0.05,拒绝H 0,病死率的变化不是随机的,可以认为20年间病死率的变化是逐年下降的。

图9-7 Runs Test 对话框

图9-8 游程检验结果

9.4 单样本K-S 检验

单样本Kolmogorov-Smirnov (K-S )检验是一种分布拟合优度检验,用来检验样本的分布是否服从某种理论分布。这里提供检验的理论分布是正态分布(Normal )、均匀分布(Uniform )、泊松分布(Poisson )和指数分布(Exponential )。

例9-4 某大学对六味地黄丸进行显微定量研究,镜检67组载玻片中熟地的特征物个数

如下:

56 57 59 59 60 60 60 61 61 62 62 62 62 62 63 63 63 63 63 64 64 64

64 64 64 64 64 65 65 65 65 65 65 65 65 65 65 65 65 65 66 66 66 66

66 66 66 67 67 67 67 68 68 68 68 68 69 69 69 69 69 69 70 70 71 72 72 检验是否服从正态分布。

解H0:总体服从正态分布。将67个数据输入在一列中,该列变量名为x。

选择菜单Analyze→Nonparametric Tests→1-Sample K-S,在弹出单样本K-S检验对话框中,将x送入Test Variable(检验变量)框中,选择Normal(正态分布)为检验分布,单击OK。

输出结果中,Kolmogorov-Smirnov Z统计量=0.828,双侧P=0.500>0.05,不能拒绝H0。不能认为熟地的特征物个数不服从正态分布。

9.5 两相关样本的非参数检验

对于配对计量资料,如果每对数据的差值服从正态分布,则可以用t检验;若不服从正态分布,则可以采用配对设计的Wilcoxon符号秩和检验,用于推断配对样本差值的中位数与0是否有差别。

例9-5对12份血清分别用原方法和新方法测谷-丙转氨酶(nmol·S-1/L),图9-9是测定结果的SPSS数据文件。问两法所得结果有无差别?

图9-9 例9-5数据文件图9-10 两相关样本检验对话框

解这是配对计量资料。H0:差值总体中位数M d=0,H1:M d≠0。

打开图9-9所示的数据文件,选择菜单Analyze→Nonparametric Tests→2 Related Samples,弹出两相关样本检验对话框,如图9-10所示,选中原法和新法,将其送入Test Pair(s) List(配对变量)框中,选择默认的Wilcoxon检验方法,单击OK。

输出结果见图9-11、12。图9-11中列出了两种方法测的谷-丙转氨酶的秩频数、平均秩次及秩和,并显示有一个结。由图9-12得,检验统计量Z=-2.802,近似概率(Asymp.Sig.)值P=0.005<0.05,按 =0.05水准拒绝H0,差值总体中位数与0的差异有统计学意义,可以认为两法测谷-丙转氨酶的结果有差异。

图9-11 两相关样本检验结果1 图9-12 两相关样本检验结果2 图9-10所示两相关样本检验对话框中其他选项的说明:

单击Exact按钮,再选中Exact选项,可以计算出精确概率(Exact Sig.)。当近似概率接近显著水平时,精确概率就显得更为重要。

单击Options按纽,可以设置统计量及缺失值。

检验方法(Test Type)中,Wilcoxon:符号秩检验,为系统默认;Sign:符号检验;McNemar:就是常用的配对χ2检验,因此只适用于二分类变量;Marginsl Homogeneity:是McNemar方法由二分类到多个有序分类的扩展方法,适用于两组相关等级资料的比较。

9.6 两个独立样本的非参数检验

计量成组资料的原始数据或经转换的数据不满足t检验的条件(如正态分布和方差齐性),可以作Wilcoxon秩和检验,用于推断计量资料的两个独立样本所来自的两个总体分布是否有差别。该法还可以用于两组等级资料的比较。

9.6.1 两组计量资料的非参数检验

例9-6某中医学院用葛根不同剂量,测得大鼠用药后一分钟心肌收缩的抑制率,数据如表9-4所示,判断两种剂量的效果是否不同。

表9-4 葛根两种剂量对大鼠心肌收缩的抑制率

3 g/100 ml组94.45 54.69 -1.2

4 81.80 85.19 86.92 91.32

5 g/100 ml组90.71 98.25 79.92 90.68 68.64 91.90

解这是计量成组资料。H0:两总体分布相同,H1:两总体分布不同。以group表示组别(标签值:1=“3 g/100 ml”、2=“5 g/100 ml”),以x表示抑制率,建立2列13行的数据文件,如图9-13。

选择菜单Analyze→Nonparametric Tests→2 Independent Samples,弹出两独立样本的检验对话框,如图9-14所示;将抑制率x送入Test V ariables框中;将组别group送入Grouping Variable 框中,单击Define Groups按钮,在弹出的对话框的Group 1框中键入1,在Group2框中键入2,单击Continue;选则默认的Mann-Whitney U检验方法;单击OK。

运行结果如图9-15、16所示。图9-15中列出了两组的秩频数、平均秩次及秩和。由图9-16知,Mann-Whitney U统计量15、Wilcoxon W统计量43,两法的Z检验统计量完全相同,均为-0.857,双侧P=0.391>0.05,按α =0.05水准接受H0。两总体分布相同,不能认为葛根不同剂量的效果不同。

图9-13 例9-6数据文件图9-14 两独立样本的检验对话框

图9-15 两独立样本的检验结果1 图9-16 两独立样本的检验结果2

图9-14所示两独立样本检验对话框中其他选项的说明:

检验方法(Test Type)中,Mann-Whitney U:为系统默认,它与Wilcoxon秩和检验和两组比较的Kruskal-Wallis检验完全等价;Kolmogorov -Smirnov Z:用于检验两总体的位置和形状是否相同,而不仅仅考察总体的中心位置是否相同;Moses extreme reactions:最大和最小各剔除5%后比较两组的极距是否相同;Wald- Wolfowitz runs:是游程检验。

单击Exact按钮,再选中Exact选项,可以计算出精确概率。

9.6.2 两组等级资料的非参数检验

例9-7进行火针治疗痤疮的多中心临床观察,数据见表9-5。试判断不同痤疮皮损的火针疗效是否不同。

表9-5 不同痤疮皮损的火针疗效比较

皮损痊愈显效好转无效总有效率丘疹黑头脓疱484 226 134 88 90.56%

结节囊肿119 41 37 19 91.20% 解这是单向有序2×4列联表,列变量c为有序分类的检验变量,行变量r为无序分类的分组变量。H0:两个总体分布相同,H1:两个总体分布不同。建立3列4行的数据文件,如图9-17,其中行变量r表示组别,列变量c表示疗效,freq表示频数。

1.指定频数变量同例9-1。

2.进行Wilcoxon秩和检验同例9-6,指定疗效c为检验变量、组别r为分组变量并定义组。

图9-17 例9-7数据文件图9-18 两组等级资料检验输出结果运行结果见图9-18。Z=-0.438,双侧P= 0.662>0.05,不能以α=0.05水准拒绝H0,二总体分布相同,不能认为不同痤疮皮损的火针疗效不同。说明火针不仅对损伤表浅的丘疹黑头脓疱型痤疮有效,而且对损伤较深的结节囊肿型痤疮也有效。

9.7 多个独立样本的非参数检验

完全随机分组计量资料,若原始数据或经转换的数据不满足方差分析的条件(如正态分布和方差齐性),可以作Kruskal-Wallis H检验,用于推断计量资料的多个独立样本所来自的多个总体分布是否有差别。该法还可以用于多组等级资料的比较。

9.7.1 多组计量资料的非参数检验

例9-8配制每100 ml含葛根1 g、1.5 g、3 g、5 g的药液,测定A、B、C、D四组大鼠离体心脏在药液中7~8 min的冠脉血流量,见表9-6。判断四组的冠脉血流量是否不同。

表9-6 葛根四种剂量的大鼠冠脉血流量

A组 6.2 6.0 6.8 1.0 6.0 6.4 12.0

B组 6.4 5.4 0.8 0.8 1.1 0.3 1.0

C组 2.0 1.2 1.7 3.2 0.5 1.1 0.5

D组0.2 0.2 0.5 0.5 0.4 0.3

解完全随机计量资料。H0:四总体分布相同,H1:四总体分布不全相同。如图9-19,建立数据文件。

选择菜单Analyze→Nonparametric Tests→K Independent Samples,弹出多个独立样本的非参数检验对话框,如图9-20所示;将x送入Test V ariables框中;将group送入Grouping Variable 框中;单击Define Range按钮,在弹出的对话框的Minimum框中输入4组代码的最小值1,在Maxmum框中输入4组代码的最大值4,单击Continue;选则默认的Kruskal-Wallis H检验方法,单击OK。

运行结果如图9-21、22所示。由图9-22知,Kruskal-Wallis检验χ2=16.474,P=0.001<0.01,以α=0.01水准拒绝H0,四个总体分布不全相同,可以认为葛根四种剂量的效果不全相同。根据图9-21中的平均秩次,四组的冠脉血流量是由高到低,依次是1、3、2、4组。

上述多个样本的非参数检验中,如果多组有差异,分布不全相同,接下来就应当是多重

比较,来判断到底哪些组之间有差异,但由于这方面还有一定的争议,所以SAS、SPSS等权威统计分析软件均未提供该功能。读者可以参看介绍这方面计算方法的相关的统计学书籍。

图9-19 例9-8数据文件图9-20 多组独立样本检验对话框

图9-21 多组独立样本检验结果1 图9-22 多组独立样本检验结果2 图9-20所示多组独立样本检验对话框中其他选项的说明:

检验方法(Test Type)中,Kruskal- Wallis H:多组秩和检验,可以认为是两样本Wilcoxon 方法在多样本时的推广,为系统默认;Median:多个中位数检验,用于检验各个样本是否来自具有相同中位数的总体,三种方法中它的检验效能最低;Jonckheere-Terpstra:用于检验多个样本是否来自同一个总体,对连续资料和有序分类资料都适用,且当分组变量为有序分类资料时,该法较Kruskal-Wallis法检验效能高。

单击Exact按钮,再选中Exact选项,可以计算出精确概率。

9.7.2 多组等级资料的非参数检验

例9-9测得四种病人痰液中的嗜酸性白细胞数据如表9-7所示,判断四种病人痰液中嗜酸性白细胞数有无差别。

表9-7 四种病人痰液中的嗜酸性白细胞数据

检验结果-++++++

支气管扩张0 2 9 6

肺水肿 3 5 5 2

肺癌 5 7 3 2

病毒性呼吸道感染 3 5 3 0

解H0:四个总体分布相同,H1:四个总体分布不全相同。这是多组完全随机的分类资

料,是单向有序4×4列联表,列变量c表示白细胞为有序分类的检验变量,行变量r表示疾病为无序分类的分组变量。建立3列16行的数据文件,如图9-27。

指定频数变量,同例9-1。进行Kruskal-Wallis H检验,同例9-8,指定白细胞c为检验变量、疾病r为分组变量并定义组。

图9-23 多组等级资料数据图9-24 多组等级资料检验输出结果运行结果见图9-24,χ2=15.506,P =0.001< 0.01,按α =0.01水准拒绝H0,接受H1,四个总体分布不同,可以认为四种病人痰液中嗜酸性白细胞数不全相同。

9.8 多个相关样本的非参数检验

随机配伍计量资料,在不满足方差分析的条件时,可以用Friedman秩和检验(M检验),用于推断多个相关样本所来自的多个总体分布是否有差异。

例9-10按年龄、性别、年级、社会经济地位、学习动机、智力水平、学习情况相近,将32名学生分为8个配伍组。每个配伍组的学生,随机分到4个不同的教学实验组。经过一段时间测得学习的综合成绩,结果见表9-8。试比较4种教学方式对学生成绩的影响有无不同。

表9-8 四种教学方式八个配伍组的学生综合成绩

配伍组 1 2 3 4 5 6 7 8

教学方式A 8.4 11.6 9.4 9.8 8.3 8.6 8.9 8.3

教学方式B 9.6 12.7 9.1 8.7 8 9.8 9 8.2

教学方式C 9.8 11.8 10.4 9.9 8.6 9.6 10.6 8.5

教学方式D 11.7 12 9.8 12 8.6 10.6 11.4 10.8 解随机配伍计量资料。H0:四个总体分布相同,H1:四个总体分布不全相同。如图9-25,建立数据文件。

选择菜单Analyze→Nonparametric Tests→K Related Samples,弹出多个相关样本的非参数检验对话框,指定检验变量为a、b、c、d,选择默认的Friedman检验方法,如图9-26所示;单击OK。

图9-25 例9-10数据文件图9-26 多个相关样本检验对话框

运行结果见图9-27、28。由图9-28知,χ2=14.544,概率P=0.002<0.01,以 =0.01水准拒绝H0。可以认为四种教学方式的教学效果有差异。根据图9-27中的平均秩次知,教学方式A、B的成绩低于教学方式C、D。

图9-27 多个相关样本检验结果1 图9-28 多个相关样本检验结果2 图9-26所示多组相关样本检验对话框中其他选项的说明:

检验方法(Test Type)中,Friedman:秩和检验;Kendall’s W:是协同系数检验,协同系数取值在0和1之间,系数越接近1,一致性程度越高;Cochran’s Q:是Friedman检验在所有反应变量均为二分类变量结果时的一个特例,它是两个配对样本McNemar检验在多个样本情况下的推广。

单击Exact按钮,再选中Exact选项,可以计算出精确概率。单击Statistics按钮,可以设置统计量及缺失值。

本章小结

参数检验是有使用条件的(如正态分布等),如果这些使用条件不满足,应使用非参数检验。本章介绍了调用SPSS菜单Analyze→Nonparametric Tests进行非参数检验的方法。

如果计量资料满足或近似满足t检验或F检验的条件,应该选用t检验或F检验,因为这时若选秩转换的非参数检验,会降低检验效能。

在多数情况下,如果非参数检验结论为有统计学意义,相应正确的参数检验结论大多与之相同。如果出现结论矛盾的情况,必须仔细考查是否满足参数检验的条件。

习题9

习题9-1某毒理试验对60只怀孕的小白鼠进行显性致死试验,结果见表9-9。有研究

报道胚胎死亡数服从负二项分布,表中给出的期望频数就是根据负二项分布求得的。试据此数据验证以往研究报道的正确性。

表9-9 不同胚胎死亡数的雌鼠分布

胚胎死亡数0 1 2 3-

观察雌鼠数30 14 8 8

期望频数29.69 14.86 7.55 7.90

习题9-2已知输卵管结扎的育龄妇女实施壶腹部-壶腹部吻合术后的受孕率为0.55。今对10名输卵管结扎了的育龄妇女实施峡部-峡部吻合术,结果有9人受孕。问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术的受孕率?

习题9-3某院按挂号顺序对30名患者进行肝病检查,有肝病者标以“+”,无肝病者标“-”,顺序如下,判断肝病在患者中的分布是否随机。

--++-+++--++-+-+++-+-++--++++习题9-4某校1996年流感率如表9-10,判断流感率的变化是否随机。

表9-10 某校1996年流感率

月份 1 2 3 4 5 6 7 8 9 10 11 12 流感率20.1 19.3 18.7 9.0 4.6 2.1 3.3 1.9 6.5 4.8 12.6 15.7 习题9-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,数据如下:

112 105 172 157 165 140 137 178 116 151 171 163

129 130 125 135 128 100 126 128 90 113 128 129

88 126 96 175 160 116 90 103 162 129 110 127

问从事铅作业男性工人的血红蛋白是否服从正态分布?

习题9-6取每只鼠一侧的整个腺体与另一侧的半个腺体作比较,测试10只小鼠肾上腺中抗坏血酸含量(μg/100mg)见表9-11,判断整个腺体与半个腺体的抗坏血酸测定量有无差异。

表9-11 小鼠整个腺体与半个腺体的抗坏血酸测定量

小鼠编号 1 2 3 4 5 6 7 8 9 10

整个腺体436 556 381 546 595 569 627 516 595 485

半个腺体383 598 376 563 543 487 620 480 512 494 习题9-7铅作业与非铅作业的血铅值(μg / 100 g)见表9-12,判断两组的血铅值是否不同。

表9-12 铅作业与非铅作业的血铅值

分组血铅值

非铅作业 5 6 5 9 7 12 15 13 21 18

铅作业组17 18 44 34 25 20 43

习题9-8湖北中医杂志2006年第28卷第2期,数据见表9-13,判断两组疗效是否不同。

表9-13 活血化淤法治疗顽固性失眠的临床观察

疗效痊愈显效有效无效

治疗组39 13 8 2

对照组17 9 11 11

习题9-9测得三组人的血浆总皮质醇(μg / L)见表9-14,判断三组血浆总皮质醇是否不同。

表9-14 三组人的血浆总皮质醇数据

分组血浆总皮质醇

正常人组0.4 7 4.6 1.9 2.2 2.5 2.8 3.1 3.7 3.9

单纯肥胖0.6 13.6 7.4 1.2 2 2.4 3.1 4.1 5 1.2

皮质醇多9.8 15.6 24 10.2 10.6 13 14 14.8 15.6 21.6 习题9-10四川中医杂志2006年第24卷第3期,数据见表9-15,判断不同证型的疗效是否不同。

表9-15 火针对不同证型痤疮的疗效比较

证型例数痊愈显效好转无效总有效率

肺热型464 225 126 72 41 91.16%

热毒型252 148 52 28 24 90.48%

冲任不调型243 126 54 37 26 89.30%

血瘀痰凝型189 104 45 24 16 91.53% 习题9-118名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表9-16。问4种频率声音刺激的反应率是否有差别?

表9-16 8名受试对象对4种不同频率声音刺激的反应率(%)

受试号频率A 频率B 频率C 频率D

1 8.4 9.6 9.8 11.7

2 11.6 12.7 11.8 12

3 9.

4 9.1 10.4 9.8

4 9.8 8.7 9.9 12

5 8.3 8 8.

6 8.6

6 8.6 9.8 9.6 10.6

7 8.9 9 10.6 11.4

8 7.8 8.2 8.5 10.8

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

第二讲-非参数统计检验教学内容

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=??第个个体中新方法优于对照方法第个个体中新方法劣于对照方法1,2,,i N =L 统计量1N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24N N N N E S Var S ==。拒绝域为:{}N N S S c > (2)由中心极限定理可知,当2 ,1N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α??????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n ==?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00{}{}s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2}{}{2100α =≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

非参数检验的SPSS操作

第八节非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS 操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample Tests)中去,把gender选到分组变量(Grouping Variable)中,并单击Define Groups…,在随后打开的对话框中分别键入1与2,单击Continue回到主对话框如图9-1所示。在Test Type中有四个可选项,其中最常用的是第一种方法Mann-Whitney U(又称秩和检验法)。

非参数假设检验法及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

两独立样本t检验和非参数检验的实证分析

龙源期刊网 https://www.360docs.net/doc/eb13611259.html, 两独立样本t检验和非参数检验的实证分析作者:张家骥 来源:《经营者》2013年第11期 摘要:教学质量是靠具体课程完成,课程的建设是教学质量提升的重要环节和基本保证。本文简述了概率论与数理统计重点课程建设的必要性,重点在于对课程建设前后分层随机抽样得来的样本进行实证分析。实证分析主要从基本统计分析、参数检验、非参数检验三个大的方面进行,尤其是非参数检验方面,又具体利用了三种不同的检验法进行分析推断。 关键词:t检验;非参数检验;显著性水平;频数分析 概率论与数理统计是我国高等院校理工类、经济类、管理类各专业的一门重要公共基础课程,同时也是一门应用广泛,适用性强的工具课。此门课程的教学为学生的其他专业课及其将来毕业后的工作、继续深造等方面奠定必要的数学基础,而且对培养学生的逻辑思维能力、分析判断问题能力、统计观点、应用能力和创新能力均有着特殊而又重要的作用,是培养高素质综合型人才的重要保证。 笔者本身是东华理工大学理学院的一线教师,这两年来,同时在江西财经大学统计学院读研究生。在此期间,笔者主持的“概率论与数理统计”重点课程建设项目小组一直在努力的探索和研究,收获了一些成果。本文的主要目的是针对进行重点课程建设这几年来,对搜集到的学生该门课程的考试成绩从统计学的角度进行实证分析。尤其是从参数检验和非参数统计两个重要角度进行探究,论证这几年来进行课程建设是否让学生成绩取得了明显的提高。 本文数据来源于东华理工大学所有开设了概率论与数理统计课程的学院,分别收集了2010学年第二学期(即下半年)概率成绩和2012学年第二学期概率成绩。总共十个学院,进行分层随机抽样,对每个学院随机抽取10名学生,最终获到两组样本,每组各100个样本点。下面开始进行实证分析: 一、基本统计分析 对数据的分析首先从基本统计分析入手。通过基本统计分析,掌握数据的基本统计特征,同时迅速把握数据的总体分布形态。而基本统计分析往往先从频数分析开始,由于成绩数据均为定距型数据,直接采用频数分析不利于对其分布形态的把握,因此先对数据分组后再进行频数分析。SPSS频数分析的操作如下:选择菜单【Analyze】→【Descriptive】→【Frequencies】,结果如下: 从上面的统计表中可以看出,进行重点课程建设后,平均分有了明显的提高,而且从频数分布表可以看出,第3组第4组即中高分数段百分数有了明显提升。从数据的角度初步说明课程建设有效果,学生成绩明显改善。

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

非参数检验

第十一章非参数检验 本章讲述某些用于定序尺度的双样本检验。与上一章所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验。 非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布”不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。 很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率” E n = n n 非参数检验中的 参数检验中的 0第一节符号检验 “符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验中,对于样本中每个个体的前测与后测,如果我们并不关心(X1―X0)的具体数值,而只关心是增大了还是减小了。 符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之中位数为零的零假设检验。 符号检验是二项检验的一种实际应用,即先假设p=0.5,按二项分布计算正号“+”出现次数之抽样分布,然后以样本中正号“+”出现的次数x作为检验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设,即认为两总体存在平均水平上的差别。 像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检验)。这类检验方法的特点,不仅在于其计算方法具有简捷性,而且在于其应用范围十分广泛。其缺点是检验效力低,因为在统计决策中它仅利用了数据中的部分信息。同有关的最佳参数或非参数检验相比,简便检验的统计决策是保守的,即它接受零假设已远远超过了必要程度,它拒绝零假设则需要有更大的样本容量。

SPSS的参数检验和非参数检验

S P S S的参数检验和非 参数检验 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:

请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至 周六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。 实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。

非参数检验卡方检验实验报告

大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验) 专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=,P(Sig)=<,表明灭螨剂A组的杀螨率极显着高于灭螨剂B组。 例 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 123 合计 治疗方法11916540 21612836 31513735合计504120111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df渐进 Sig. (双侧) Pearson 卡方 1.428a4.839

似然比4.830线性和线性组合.5141.474 有效案例中的 N111 a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为。 分析:表4是卡方检验的结果。自由度df=4,表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即 X2=,P=>,差异不显着,可以认为不同的治疗方法与治疗效果无关,即三种治疗方法对治疗效果的影响差异不显着。 例 表5 灌溉方式* 稻叶情况交叉制表 计数 稻叶情况 123 合计 灌溉方式114677160 2183913205 31521416182合计4813036547 分析:表5是灌溉方式* 稻叶情况资料分析的列联表。

方差分析与非参数检验

北京建筑大学 理学院信息与计算科学专业实验报告 课程名称《数据分析》实验名称方差分析与非参数检验实验地点基C-423 日期2017.3.30 (1)熟悉数据的基本统计与非参数检验分析方法; (2)熟悉撰写数据分析报告的方法; (3)熟悉常用的数据分析软件SPSS。 【实验要求】 根据各个题目的具体要求,完成实验报告。 【实验内容】 1、附件给出某年房屋价格的相关数据,请选用恰当的分析方法,对影响房屋价格的因素进行分析。(注意数据要调整成标准的格式,变量值、组别(字符变量转换成数值变量))(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可) 2、附件给出管理才能评分的相关数据,请选用恰当的分析方法,分析该评分数据是否服从正态分布。 3、附件给出了某体育比赛的两位裁判打分数据,请选用恰当的分析方法,检验该两组评分分布是否有显著差异。(注意数据要调整成标准的格式,变量值、组别) 4、附件给出了减肥茶数据,请选用恰当方法分析,检验该减肥茶是否对减肥有显著效果。(注意数据要调整成标准的格式,变量值、组别) 【分析报告】 1、对影响房屋价格的因素进行分析。(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可)。 表1-1(a) 装修状况对均价影响的单因素方差分析结果 均价 平方和df 均方 F 显著性 组间79.180 1 79.180 62.408 .000 组内230.914 182 1.269 总数310.094 183 表1-1(b) 所在区县对均价影响单因素方差分析结果 均价 平方和df 均方 F 显著性 组间91.919 3 30.640 25.279 .000 组内218.174 180 1.212 总数310.094 183 表1-1(a)是装修状况对均价影响的单因素方差分析结果。可以看到:观测变量均价的离差平方总和为310.094;如果仅考虑装修状况单个因素的影响,则均价总变差中,不同装修状况可解释的变差为79.180,抽样误差引起的变差为230.914,它们的方差分别为79.180和1.269,相除所得的F统计量的观测值为62.408,对应的概率P-值近似为0.如果显著性水平α为0.05,由于概率P-值小于显著性水平α,应拒绝原假设,认为不同装修状况对均价的平均值产生了显著影响,不同装修状况对均价的影响效应不全为0。 表1-1(b)是所在区县对均价影响单因素方差分析结果。可以看到:如果仅考虑所在区县单个因素的影响,则均价总变差310.094中不同所在区县可解释的变差为91.919,抽样误差引起的变差为218.174,

两个独立样本的非参数检验方法有哪四种

两个独立样本的非参数检验方法有哪四种 两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 一、Mann-Whitney U检验 主要通过对平均秩的研究来实现推断。 将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… Xm)(Y1 Y2 …… Yn)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和Wx ,Wy 。 N=m+n Wx+Wy= N(N+1)/2 如果H0成立,即两组分布位置相同,Wx应接近理论秩和 m(N+1)/2; Wy 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。

最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。 样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,然后对标志值序列求游程。 如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。 SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。 四、极端反应检验 从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。

两个独立样本的非参数检验方法有4种

两个独立样本的非参数检验方法有4种 曼-惠特尼U检验(Mann—whitney U) 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果两总体的分布存在较大的差距,那么游程数会相对比较少,如果游程数比较大,则应是两组样本充分混合的结果,那么总体的分布不会存在显著差异。 再次,根据游程数据计算Z统计量,该统计量近似服从正态分布。 极端反应检验 极端反应检验从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。 第1 页共1 页

完整word版,非参数统计分析方法总结,推荐文档

非参数统计分析方法 一单样本问题 1,二项式检验:检验样本参数是否与整体参数有什么关系。 样本量为n,给定一个实数M0(代表题目给出的分位点数),和分位点∏(0.25,0.5,0.75)。用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为∏。 H0:M=M0 H1:M≠MO或者M>M0或者M

长度长) Spss步骤:分析—非参数检验—游程 得出统计量R和p值 当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的 二,两个样本位置问题 1,Brown—Mood中位数检验 给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,一个为M2 H0:M1=M2. H1:M1≠M2或者M1>M2或者M1

非参数检验 SPSS操作

非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample

两个独立样本的非参数检验方法

两个独立样本的非参数检验方法 两个独立样本的费参数检验正是对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异的方法。 一、曼-惠特尼U检验 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果

非参数检验

非参数检验Nonparametric Tests菜单 概述 非参数统计是统计分析的重要组成部分,其优点是适用范围广(通用的统计方法),可用于等级资料和开口资料,缺点是检验效能低。目前,非参数统计的一般性统计分析的理论发展远远不及参数检验完善,比较完善的可供使用的方法也不多。比如多个样本间两两比较的非参数检验,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些权威的统计软件没有提供两两比较的非参数方法,但是,国产的统计软件大都提供了两两比较的方法。因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。 在SPSS中,提供了8种非参数检验方法,放入了Nonparametric Tests菜单中,分为两大类: (一)分布类型的检验过程: 亦称拟合优度检验方法,即检验样本所来自的总体是否服从某种理论分布。 1、Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,随便举例)。请注意该检验和我们一般所用的卡方检验不太一样,我们一般作的卡方检验要用crosstable菜单来完成,见上一章,而不是这里讨论。 2、Binomial T est:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以是连续性变量,然后按你给出的分界点一分为二。 3、Runs T est:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 4、One-Sample Kolmogorov-Smirnov T est(1-Sample K-S..):采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 (二)分布位置的检验过程: 用于检验样本所在的总体分布位置或形状是否相同。我们平时所说的,所用的非参数检验方法实际上指的就是这一类方法。具体包含以下几种方法: 1、T wo-Independent-Samples T ests:即成组设计的两样本均数比较的非参数检验。 2、T ests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。 3、T wo-Related-Samples T ests:配对设计两样本均数的非参数检验。 4、T ests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。 本次实习只要求掌握分布位置的检验过程

SPSS的参数检验和非参数检验

实验报告SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 鼠体内钙的留存量有显著不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天 并说明分析结论。 实验报告附页

三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。 方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。 (二) 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze->Nonparametric->k Independent sample 3、选择待检验的若干变量入包装1,包装2,包装3到Test Variable(s)框中; 4、选择推广的平均秩检验(Friedman检验),单击OK。 四、实验结果分析与评价 (一): 方式1: 由上表知:两配对变量饲料1和饲料2对应的概率p值为0.108>0.05通过了检验,可以认为两配对变量饲料1和饲料2无相关关系。 由上表知:吃饲料1和饲料2的幼鼠分别有9人,其中喂以饲料1的9只幼鼠体内平均钙留存量为32.578;而喂以饲料2的9只幼鼠体内平均钙留存量为34.267。

两个独立样本的4种非参数检验方法

两个独立样本的4种非参数检验方法 1、两独立样本的Mann-Whitney U检验 定义:两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 Mann-Whitney U检验(Wilcoxon秩和检验)主要通过对平均秩的研究来实现推断。 秩:将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… X m)(Y1 Y2…… Y n)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和W x,W y 。 N=m+n Wx+Wy=N(N+1)/2 如果H0成立,即两组分布位置相同,W x应接近理论秩和m(N+1)/2;W y 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 2、两独立样本的K-S检验 两独立样本的K-S检验与单样本K-S检验类似。 其零假设H0:样本来自的两独立总体分布没有显著差异。 检验统计量 D 为两个样本秩的累积分布频率的最大绝对差值。当D较小时,两样本差异较小,两样本更有可能取自相同分布的总体;反之,当D较大时,两样本差异变大,两样本更有可能取自不同分布。 3、两独立样本的游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。

参数检验和非参数检验

一.单因素方差分析(one-way ANOVA),用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。 完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。 二. T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与Z检验、卡方检验并列。 t检验 t检验分为单总体检验和双总体检验。 单总体t检验时检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。 单总体t检验统计量为: 双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t 检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。 独立样本t检验统计量为:

S1 和S2 为两样本方差;n1 和n2 为两样本容量。(上面的公式是1/n1 + 1/n2 不是减!) 配对样本t检验统计量为: t检验的适用条件 (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准差; (3) 样本来自正态或近似正态总体。 t检验步骤 以单总体t检验为例说明: 问题:难产儿出生体重n=35,X拔=3.42,S =0.40,一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否? 解:1.建立假设、确定检验水准α H0:μ = μ0 (无效假设,null hypothesis) H1:μ≠μ0(备择假设,alternative hypothesis,) 双侧检验,检验水准:α=0.05 2.计算检验统计量

SPSS的参数检验和非参数检验

实验二 SPSS的参数检验和非参数检验 (验证性实验 4学时) 1、目的要求:熟练掌握t检验及其结果分析。熟练掌握单样本、两独立 样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给 出准确分析。 2、实验内容:使用指定的数据按实验教材完成相关的操作。 3、主要仪器设备:计算机。 练习: 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 鼠体内钙的留存量有显著不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天 并说明分析结论。 1 参数检验概述 假设检验的基本思想 .事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立; .采用逻辑上的反证法,依据统计上的小概率原理。

2 单样本的T检验 2.1检验目的: ?检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。 ?要求样本来自的总体服从或近似服从正态分布。 2.2 单样本T检验的实现思路 ?提出原假设: ?计算检验统计量和概率P值 ●给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在 一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。 2.3 单样本t检验的基本操作步骤 1、选择选项Analyze-Compare means-One-Samples T test,出现窗口: 2、在Test Value框中输入检验值。 3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Exclude cases analysis by analysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Exclude cases listwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。 至此,SPSS将自动计算t统计量和对应的概率p值。 3 两独立样本的T检验 3.1 两独立样本T检验的目的 ?利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异; ?两独立样本的样本容量可以相等,也可以不相等; ?样本来自的总体服从或近似服从正态分布。 方差齐性检验(Levene F方法): ?计算两组样本的均值 ●计算各个样本与本组均值的平均离差绝对值; ●利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。 ●在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t 值的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。如果推断两总体方差相等则看方差相等的T检验值和P值,如果推断两总体方差不相等则看方差不相等的T检验值和P值。 3.2 两独立样本T检验的实现思路 ?提出原假设:两总体均值不存在显著差异: ●计算统计量和P值:首先利用F检验确定两个总体的方差是否相等;然后 再选择合适的T统计量计算观测值和概率P值; ●根据显著性水平和概率P值进行统计决策。 3.3 两独立样本t检验的基本操作步骤 进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS 要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个

相关文档
最新文档