SPSS 箱图中异常值的计算和判别方法
SPSS箱图中异常值的计算和判别方法
异常值包括离群值和极端值。
离群值(箱图/探索二级子菜单)值与框的上下边界的距离在1.5倍框的长度
到3倍框的长度之间的个案(不包括1.5倍,包括3倍)。框的长度是
内距(四分位距)。离群值在SPSS输出的箱图中默认用圆圈标识。
极端值(箱图/探索二级子菜单)值与框的上下边界的距离超过3倍框的长度的
个案(不包括3倍)。框的长度是内距(四分位距)。极端值在SPSS输
出的箱图中默认用星号标识。
数据文件(截图)中,10号位的身高为180厘米。身高的四分位距(差)为8厘米。第75分位数的值为167厘米,则第10号位人的身高到第75分位数(长方形上边)的距离为180-167=13。因13/8=1.625,大于1.5小于3,所以判为离群值(图中的圆圈)。
数据文件(截图)中,207号位的身高为193厘米。身高的四分位距(差)为8厘米。第75分位数的值为167厘米,则第207号位人的身高到第75分位数(长方形上边)的距离为193-167=26。因26/8=3.25,大于3,所以判为极端值(图中的星号)。
华东师范大学社会调查中心邝春伟2017.01.01
相关主题