多元统计分析对应分析

多元统计分析对应分析
多元统计分析对应分析

多元统计分析对应分析Last revision on 21 December 2020

学生实验报告

学院:统计学院

课程名称:多元统计分析

专业班级:统计123班

姓名:叶常青

学号: 0124253

学生实验报告

一、实验目的及要求:

目的熟悉和掌握对应分析的原理和上机操作方法

内容及要求本次操作就父母与孩子的受教育程度的关系进行对应分析,分别对父亲与孩子和母亲与孩子的受教育程度做对应分析,最后再对输出结果进行详细的分析。

二、仪器用具:

三、实验方法与步骤:

打开GSS93 subset .sav数据,对变量Degree与变量padeg和madeg进行对应分析,依次选择分析→降维…进入对应分析对话框,进行进行如下设置,便可输出想要的数据的:

四、实验结果与数据处理:

按照上述方法和步骤得出以下输出结果.

对父亲受教育程度与孩子受教育程度的关系进行分析如下:

表1

对应表

Father's Highest Degree

R's Highest Degree

Less

than HS

High

school

Junior

college

Bach

elor

Grad

uate

有效

边际

LT High School156308294525563 High School27248347937425 Junior College11128325 Bachelor64374718121 Graduate3223271671有效边际19363275206991205

表2

表3

第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为,卡方值为,有关系式=*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。

表4

行简要表

Father's Highest Degree

R's Highest Degree

Less

than HS

High

school

Junior

college

Bach

elor

Grad

uate

有效

边际

LT High School.277.547.052.080.044 High School.064.584.080.186.087 Junior College.040.440.080.320.120 Bachelor.050.355.058.388.149 Graduate.042.310.042.380.225质量.160.524.062.171.082

表5

LT High School .808 .487 .387 .218 .253 .467

High School .140 .392 .453 .383 .374 .353 Junior College .005 .017 .027 .039 .030 .021 Bachelor .031 .068 .093 .228 .182 .100 Graduate .016 .035 .040 .131 .162 .059

有效边际

第三部分的结果是在对应分析中点击Statistics 按钮,进入Statistics 对话框,选中Row profiles 和Column profiles 交友程序运行所得到的。

表6

概述行点a

Father

's Highest Degree

质量 维中的得分 惯

贡献 1

2

点对维惯量 维对点惯量 1

2 1 2

LT High School

.46

7

.18

8

.07

2

.43

2

.10

.96

3

.03

7

High School .35

3

.26

9

.02

5

.06

4

.55

9

.40

6

.59

3

.99

9

Junior College .02

1

.78

6 .00

7

.00

5

.03

2

.00

.96

5

.00

.965

Bachel or .100

.47

6 .04

6

.26

1

.13

9

.90

1

.08

.98

1

Gradua te .059

.74

9 .04

.21

1

.20

2

.83

8 .13

4 .97

1 有效总计

.189

a. 对称标准化 表7

Junior college .06

2

.12

7

.00

3

.00

3

.10

.12

7

.84

5

.97

2

Bachel or

.17

1

.97

6

.32

1

.06

9

.40

6

.10

8

.94

8

.04

2

.99

Gradua te

.08

2

.87

4

.39

5

.02

9

.15

7

.07

8

.87

5

.07

3

.94

9

有效总计

.18 9

a. 对称标准化

第四部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括. 其中质量是行与列的边缘概率,也就是PI与PJ。惯量是每一行(列)与其重心的加权距离平方,可以看到II=IJ=。由概述行点表可知变量degree的状态Less than HS和Bachelor在第一维度中贡献较大分别为和。状态Less than HS对第二维度贡献最大为。概述列表可知变量padeg的状态LT High School在第一维度贡献最大为。状态High School对第二维度贡献最大为。

第五部分是degree各状态和paged各状态同时在一张二维表上的投影. 由图可以看到父亲初中的教育程度、高中的教育程度与孩子的教育程度有较强的关联性。

表1

第一部分是对应表,对应表是由原始数据按degree与padeg分类的列连表,可以看到总有效观测值为1350,而不是原始数据1500。说明有效的观测数据有1350个,这是因为原始数据中有150个数据缺失。

表2

第二部分是摘要表。第二部分摘要给出了惯量,卡方值以及每一维度所解释的总惯量的百分比信息。总惯量为,卡方值为,有关系式=*1205,由此可以清楚的看到总惯量和卡方的关系。Sig.是假设卡方值为0成立的概率,它的值几乎为0说明列联表之间有较强的相关性。表注表明的自由度为(5-1)*(5-1)=16。惯量部分是四个公共因子分别解释总惯量的百分比。

第三部分是概述行点和概述列点,是对列联表行与列各状态有关信息的概括.由贡献部分可以看出 LT High School这一状态对第一维度的贡献最大.在表的最后维度部分对各状态特征值的贡献部分,看到除了Graduate外,其余各最高学历的特征值的分布大部分集中在第一维度上,说明第一维度反映了最高学历各状态大部分的差异.

把母亲受教育程度和子女受教育程度的各状态投影到同一张二维图上,如上图所示。由图可以看到母亲受高中的教育程度和子女受初中,高中的教育程度有较强的关联性。

五、讨论与结论

通过对应分析可以大致了解父母亲受教育程度与孩子受教育程度的关系,并且实现了对应分析理论知识与实际操作的结合,此次试验的难点在于对输出数据的具体分析思维。由以上所有分析我们可以大胆推断子女受教育程度与父母双方受教育程度有着密切的联系,父母受教育程度很大的限制着子女的受教育水平。

相关主题
相关文档
最新文档