威尔科克森配对符号秩检验例

威尔科克森配对符号秩检验例
威尔科克森配对符号秩检验例

威尔科克森配对符号秩检验例

随机地抽取10名学生的记分册中某门课程期中和期末考试分数如表16.17第(2)和第(3)栏数据。试在0.05显著性水平下作威尔科克森符号秩检验。

表16.17 威尔科克森配对等级计算表*

解: 计算步骤如下:

第1步:列出1x 和2x 的观察值; 第2步:计算12x x d -=; 第3步:把等级恢复原正负符号。

计算过程见表16.17。

由表16.17,秩和分别按正差和负差计算,用Σ秩(+)和Σ秩(-)表示,以此为基础,形成零假设:0H Σ秩(+)=Σ秩(-),即总体分布相同。更具体地说,该假设表明该总体中的正差和负差是在均值0的两端对称分布的。两个秩和中较小者,我们称为威尔科克森T-统计量。该检验统计量:T=Σ秩(-)=10.5。查威尔科克森T 值的临界值表(附表I),当n=10-1=9, 05.0=α时,双尾检验的临界值5=αT 。由于T T <α,因此不能否定0H ,即两次成绩没有显著差别。

在大样本情形下,T 是近似正态分布的,其均值和方差分别为:

()4

1+=

n n T μ (16.7)

*

表16.17的说明:

① 在威氏检验中,i d 要用绝对值,把它们放在一起,按从1至n 的顺序排列秩次,差别最小者,其秩次为1。 ② 以原i d 值的符号(+或-)给这些秩加上相应符号。 ③ 若排秩时出现秩次相同,采用平均秩次。 ④ 若i d 值为0,就去掉该项。

()()24

1212

++=n n n T σ (16.8)

因此,我们可以计算: T

T

T T z σμ-= (16.9)

wilcoxon符号秩检验 吴喜之例子()

吴喜之《非参数统计》第35页例子 现在用一个例子来说明如何应用Wilcoxon符号秩检验,并表明它和符号检验在解决同样的位置参数检验问题时的不同。 下面是亚洲十个国家1966年的每1000新生儿中的(按从小到大次序排列)死亡数(按世界银行:“世界发展指标”,1998) 这里想作两个检验作为比较。一个是H 0:M≥34H 1 :M<34, 另一个是H 0:M≤16H 1 :M>16。 之所以作这两个检验是因为34和16在这一列数中的位置是对称的,如果用符号检验,结果也应该是对称的。现在来看Wilcoxon符号秩检验和符号检验有什么不同,先把上面的步骤列成表: 上面的Wilcoxon符号秩检验在零假设下的P-值可由n和W查表得到,该P-值也可以由计算机统计软件把数据和检验目标输入后直接得到。从上面的检验结果可以看出,在符号检验中,两个检验的p-值都是一样的(等于0.3770)不能拒绝任何一个零假设。而 利用Wilcoxon符号秩检验,不能拒绝H 0:M≥34,但可以拒绝H :M≤16。理由很明显。

34和16虽然都是与其最近端点间隔4个数(这也是符号检验结果相同的原因),但34到它这边的4个数的距离(秩)之和(为W=29)远远大于16到它那边的4个数的距离之和(为W=10)。所以说Wilcoxon 符号秩检验不但利用了符号,还利用了数值本身大小所包含的信息。当然,Wilcoxon 符号秩检验需要关于总体分布的对称性和连续性的假定。 详细计算过程 Wilcoxon 符号秩检验 亚洲十国,每千人婴儿中的死亡数为:4、6、9、15、33、31、36、65、77、88 假设检验:16:0=D M H ;16:<-D M H 手算 由D 的符号和D 绝对值的秩可以算得: 根据n=10,45=+T 查表得到+T 的右尾概率为P=0.042,由于P<0.05,因此拒绝0H 。 SPSS

SAS讲义_第二十七课符号检验和Wilcoxon符号秩检验

第二十七课 符号检验和Wilcoxon 符号秩 检验 在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定的概率分布,这个分布带有一组自由的参数。参数检验被认为是依赖于分布假定的。通常情况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实,因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似,这是由于大样本理论所保证的。但有些资料不一定满足上述要求,或不能测量具体数值,其观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的方法,而只能用非参数统计方法(non-parametric statistical analysis )来处理。这种方法对数据来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。 一、 单样本的符号检验 符号检验(sign test )是一种最简单的非参数检验方法。它是根据正、负号的个数来假设检验。首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表示,如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体数字,也可用符号检验,例如用正号表示颜色从深变浅,用负号表示颜色从浅变深。 用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则,然后计数正号的个数+ S 及负号的个数- S ,由于在具体比较配对资料时,可能存在配对资料的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样本大小n 也随之减少,故修正样本大小- + +=S S n 。当样本n 较小时,应使用二项分布确切概率计算法,当样本n 较大时,常利用二项分布的正态近似。 1. 小样本时的二项分布概率计算 当20≤n 时,+S 或- S 的检验p 值由精确计算尺度二项分布的卷积获得。在比较配对资 料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正号,反之为负号,那么对于原假设:试验前后无变化来说,正号的个数+ S 和负号的个数- S 可 能性应当相等,即正号出现的概率p =0.5,于是+S 与- S 均服从二项分布)5.0,(n B ,对于太 大的+S 相应太小的-S ,或者太大的-S 相应太小的+ S ,都将拒绝接受原假设;对于原假设:试验后比试验前有增加来说,正号的个数+ S 大于负号的个数- S 的可能性应该大,即正号出现的概率5.0>p ,对于太小的+ S 相应太大的- S ,将拒绝接受原假设;对于原假设:试验后比试验前减小来说,正号的个数+ S 小于等于负号的个数- S 的可能性应该大,即正号出现

SAS系统和数据分析Wilcoxon秩和检验

第二十八课 Wilcoxon 秩和检验 一、 两样本的Wilcoxon 秩和检验 两样本的Wilcoxon 秩和检验是由Mann ,Whitney 和Wilcoxon 三人共同设计的一种检验,有时也称为Wilcoxon 秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t 检验比较均值。但当这两个条件都不能确定时,我们常替换t 检验法为Wilcoxon 秩和检验。 Wilcoxon 秩和检验是基于样本数据秩和。先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约被均匀分在两个样本中。如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。 设两个独立样本为:第一个x 的样本容量为1n ,第二个y 样本容量为2n ,在容量为21n n n +=的混合样本(第一个和第二个)中,x 样本的秩和为x W ,y 样本的秩和为y W ,且有: 2)1(21+= +++=+n n n W W y x (28.1) 我们定义: 2 )1(111+-=n n W W x (28.2) 2)1(222+-=n n W W y (28.3) 以x 样本为例,若它们在混合样本中享有最小的1n 个秩,于是2)1(11+=n n W x ,也是x W 可能取的最小值;同样y W 可能取的最小值为2 )1(22+n n 。那么,x W 的最大取值等于混合样本的总秩和减去y W 的最小值,即2 )1(2)1(22+-+n n n n ;同样,y W 的最大取值等于2 )1(2)1(11+-+n n n n 。所以,式(28.2)和式(28.3)中的1W 和2W 均为取值在0与

Wilcoxon符号秩检验

第二节Wilcoxon符号秩检验

Wilcoxon符号秩检验 符号检验只用了差的符号,但没有利用差值的 大小。 1 2 3Wilcoxon符号秩检验(Wilcoxon signed-rank test) 把差的绝对值的秩分别按照不同的符号相加作为其检验统计量。 显然,相比较于符号检验,Wilcoxon符号秩检验利用了更多的信息。

Wilcoxon符号秩检验:条件 u Wilcoxon符号秩检验需要一点总体分布的性质;它要求假 定样本点来自连续对称总体分布;而符号检验不需要知道 任何总体分布的性质。 u在对称分布中,总体中位数和总体均值是相等的;因此, 对于总体中位数的检验,等价于对于总体均值的检验。 u Wilcoxon符号秩检验实际是对对称分布的总体中位数(或 均值)的检验。

Wilcoxon符号秩检验:基本原理 u计算差值绝对值的秩。 u分别计算出差值序列里正数的秩和(W+)以及负数的秩和(W-)。 u如果原假设成立,W+与W-应该比较接近。如果W+和W-过大或过 小,则说明原假设不成立。 u将正数的秩和或者负数的秩作为检验统计量,根据其统计分布计 算p值,从而可以得出检验的结论。

具体步骤 设定原假设和备择假设。 分别计算出差值序列中正数的秩和W+以及负数的秩和W-。 根据W+和W-建立检验统计量,计算p值并得出检验的结论。 在双侧检验中检验统计量可以取为W=min(W+,W-)。显然,如果原假设成立,W+与W-应该比较接近。如果二者过大或过小,则说明原假设不成立。

秩的计算注意问题 计算差值绝对值的秩时,注意差值等于0值不参与排序。 下面一行R i就是上面一行数据Z i的秩。 Z i159183178513719 R i75918426310 数据中相同的数值称为“结”。结中数字的秩为它们所占位置的平均值 Z i159173178513719 R i758.518.5426310

表A.10 WILCOXON符号秩和检验的T临界值

. 精品 n 单尾检验的显著水平 .05 .025 .01 .005 双尾检验的显著水平 .10 .05 .02 .01 28 130 116 101 91 29 140 126 110 100 30 151 137 120 109 31 163 147 130 118 32 175 159 140 128 33 187 170 151 138 34 200 182 162 148 35 213 195 173 159 36 227 208 185 171 37 241 221 198 182 38 256 235 211 194 39 271 249 224 207 40 286 264 238 220 41 302 279 252 233 42 319 294 266 247 43 336 310 281 261 44 353 327 296 276 45 371 343 312 291 46 389 361 328 307 47 407 378 345 322 48 426 396 362 339 49 446 415 379 355 50 466 434 397 373 表B.10 WILCOXON 符号秩和检验的T 临界值* *如果要使结果显著,所得到的T 值必须等于或小于临界值,列中的横线(—)表示在列出的和的情况下,我们不能做出任何结论。 Adapted from F. Wilcoxon, S. K. Katti, and R. A. Wilcox, Critical Values and Probability Levels of the Wilcoxon Rank-Sum Test and the Wilcoxon Signed-Ranks Test. Wayne, N.J.: American Cyanamid Company, 1963. Adapted and reprinted with permission of the American Cyanamid Company 如有侵权请联系告知删除,感谢你们的配合! n 单尾检验的显著水平 .05 .025 .01 .005 双尾检验的显著水平 .10 .05 .02 .01 5 0 — — — 6 2 0 — — 7 3 2 0 — 8 5 3 1 0 9 8 5 3 1 10 10 8 5 3 11 13 10 7 5 12 17 13 9 7 13 21 17 12 9 14 25 21 15 12 15 30 25 19 15 16 35 29 23 19 17 41 34 27 23 18 47 40 32 27 19 53 46 37 32 20 60 52 43 37 21 67 58 49 42 22 75 65 55 48 23 83 73 62 54 24 91 81 69 61 25 100 89 76 68 26 110 98 84 75 27 119 107 92 83

Wilcoxon符号秩检验

Wilcoxon符号秩检验 Wilcoxon符号秩检验,手算、SPSS、R、SAS。 数据来源:《统计学(第三版)》贾俊平中国人民大学出版社 316页13.3题为分析股票的每股收益状况,在某证券市场上随机抽取10只股票,得到2006和2007年的每股收益数据如下表,分析2007年与2006年相比,每股收益是否有显著差异(α=0.05), 股票代码 2006年每股收益(元) 2007年每股收益(元) 1 0.1 2 0.26 2 0.95 0.87 3 0.20 0.24 4 0.02 0.12 5 0.05 0.13 6 0.56 0.51 7 0.31 0.35 8 0.25 0.42 9 0.16 0.37 10 0.06 0.05 手算: H:M,00D H:M,01D 2006年每股收益记为x,2007年每股收益记为y,差值d=x-y。 x y D=x-y |D| 股票代码 |D|的秩 D的符号 1 0.1 2 0.26 -0.14 0.14 8 - 2 0.95 0.87 0.08 0.08 5.5 +

3 0.20 0.2 4 -0.04 0.04 2. 5 - 4 0.02 0.12 -0.1 0.1 7 - 5 0.05 0.13 -0.08 0.08 5.5 - 6 0.56 0.51 0.05 0.05 4 + 7 0.31 0.35 -0.04 0.04 2.5 - 8 0.25 0.42 -0.17 0.17 9 - 9 0.16 0.37 -0.21 0.21 10 - 10 0.06 0.05 0.01 0.01 1 + T,5.5,4,1,10.5, T,8,2.5,7,5.5, 2.5,9,10,44.5, 通过查表得,T-的右尾概率P在0.042和0.053之间,即双尾概率P在0.084和0.106之间,大于显著性水平α=0.05,不能拒绝原假设,即认为2007年与2006年相比,每股收益没有显著差异。 SPSS计算: 步骤: 1、Analyze-Nonparametric Tests-2-Related Samples Test 2、将比较值和D两个变量移到检验配对变量框,勾选Wilcoxon符号秩检验,选择Exact,选择精确计算。 3、单击确定,进行计算。 输出结果: 秩 N 秩均值秩和 a比较 - D 负秩 3 3.50 10.50 b正秩 7 6.36 44.50 c 结 0

Wilcoxon符号秩检验

Wilcoxon 符号秩检验,手算、SPSS 、R 、SAS 。 数据来源:《非参数统计(第二版)》 吴喜之 中国统计出版社 49页例3.3 下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列: 4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。 手算: 通过数据可以看出,中位数为11.160,明显大于8,因此可以建立如下假设: 8 M :H 8M :H 10>= 9 1354610987642=++==++++++=-+T T 查表可知P-0.032<α=0.05,因此拒绝原假设,认为欧洲各国人均年消费酒量的中位数多于8升。 SPSS 计算: 步骤: 1、Analyze-Nonparametric Tests-2-Related Samples Tests 2、将中位数和纯酒精数移入检验对变量框中,在检验类型中选择Wilcoxon ,单击精确,选择精确。 3、单击确定输出结果。 输出结果:

由输出结果可知,精确单侧显著性值P=0.032<α=0.05,与手算结果相同,因此拒绝原假设,认为欧洲各国人均年消费酒量的中位数多于8升。 R计算: > x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45) > wilcox.test(x-8,alt="greater") Wilcoxon signed rank test data: x - 8 V = 46, p-value = 0.03223 alternative hypothesis: true location is greater than 0 由输出结果可以看出单侧检验P值为0.03223<α=0.05,与以上计算方法计算结果相同,因此拒绝原假设,认为欧洲各国人均年消费酒量的中位数多于8升。 SAS计算:

WILCOXON符号秩和检验的T临界值

实用文档 . n 单尾检验的显著水平 .05.025.01.005 双尾检验的显著水平 .10.05.02.01 2813011610191 29140126110100 30151137120109 31 163147130118 32 175159140128 33 187170151138 34 200182162148 35 213195173159 36 227208185171 37 241221198182 38 256235211194 39 271249224207 40 286264238220 41 302279252233 42 319294266247 43 336310281261 44 353327296276 45 371343312291 46 389361328307 47 407378345322 48 426396362339 49 446415379355 50 466434397373 表B.10WILCOXON符号秩和检验的T临界值* *如果要使结果显著,所得到的T值必须等于或小于临界值,列中的横线(—)表示在列出的和的情况下,我们不能做出任何结论。 Adapted from F.Wilcoxon,S.K.Katti,and R.A.Wilcox,Critical Values and Probability Levels of the Wilcoxon Rank-Sum Test and the Wilcoxon Signed-Ranks Test.Wayne,N.J.:American Cyanamid Company,1963.Adapted and reprinted with permission of the American Cyanamid Company n 单尾检验的显著水平 .05.025.01.005 双尾检验的显著水平 .10.05.02.01 50——— 620—— 7320— 85310 98531 1010853 11131075 12171397 132117129 1425211512 1530251915 1635292319 1741342723 1847403227 1953463732 2060524337 2167584942 2275655548 2383736254 2491816961 25100897668 26110988475 271191079283

R语言wilcoxon秩和检验及wilcoxon符号秩检验

R语言wilcoxon秩和检验及wilcoxon符号秩检验 wilcoxon秩和及wilcoxon符号秩检验是对原假设的非参数检验,在不需要假设两个样本空间都为正态分布的情况下,测试它们的分布是否完全相同。 操作 #利用mtcars数据 library(stats) data("mtcars") boxplot(mtcars$mpg~mtcars$am,ylab='mpg',names = c('automatic','manual)) 自动档手动档mpg值 #执行wilcoxon秩和检验验证自动档手动档数据分布是否一致 wilcox.test(mpg~am,data = mtcars) #wilcox.test(mtcars$mpg[mtcars$am==0],mtcars$mpg[mtcars$am==1])(与上面等价)Wilcoxon rank sum test with continuity correction data: mpg by am W = 42, p-value = 0.001871

alternative hypothesis: true location shift is not equal to 0 Warning message: In wilcox.test.default(x = c(21.4, 18.7, 18.1, 14.3, 24.4, 22.8, : 无法精確計算带连结的p值 总结 执行wilcoxon秩和检验(也称Mann-Whitney U检验)这样一种非参数检验。t检验假设两个样本的数据集之间的差别符合正态分布(当两个样本集都符合正态分布时,t检验效果最佳),但当服从正态分布的假设并不确定时,我们执行wilcoxon秩和检验来验证数据集中mtcars中自动档与手动档汽车的mpg值的分布是否一致,p值<0.05,原假设不成立。意味两者分布不同。警告“无法精確計算带连结的p值“这是因为数据中存在重复的值,一旦去掉重复值,警告就不会出现。

相关文档
最新文档