SAS第九课因子分析：Factor过程

SAS的Factor过程

因子分析

Factor 过程（李东风教程P251—256，P255正交旋转，斜交旋转）

DATA SOCECON;

TITLE 'FIVE SOCIO-ECONOMIC VARIABLES';

TITLE2 'SEE PAGE 14 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED';

INPUT POP 1-9 SCHOOL 10-19 EMPLOY 20-29 SERVICES 30-39

HOUSE 40-49;

LABEL POP='TOTAL POPULATION' SCHOOL='MEDIAN SCHOOL YEARS' EMPLOY='TOTAL EMPLOYMENT' SERVICES='MISC. PROFESSIONAL SERVICES'

HOUSE='MEDIAN VALUE HOUSE';

CARDS;

5700 12.8 2500 270 25000

1000 10.9 600 10 10000

3400 8.8 1000 10 9000

3800 13.6 1700 140 25000

4000 12.8 1600 140 25000

8200 8.3 2600 60 12000

1200 11.4 400 10 16000

9100 11.5 3300 60 14000

9900 12.5 3400 180 18000

9600 13.7 3600 390 25000

9600 9.6 3300 80 12000

9400 11.4 4000 100 13000

;

RUN;

PROC PRINT;

RUN;

PROC FACTOR OUTSTAT=FACT1 METHOD=PRINCIPAL NFACT=2

ROTATE=VARIMAX PREPLOT PLOT SCORE;

TITLE2 'SEE PAGES 137 & 310 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED'; RUN;

PROC PRINT; BY _TYPE_ NOTSORTED;

TITLE2 'OUTPUT DATA SET FROM PROC FACTOR';

RUN;

PROC SCORE SCORE=FACT1 DATA=SOCECON OUT=SCORES;

TITLE2 'FACTOR SCORES';

PROC PRINT;

RUN;

PROC FACTOR DATA=FACT1 METHOD=PRIN NFACT=2;

PRIORS SMC;

TITLE2 'SEE PAGE 162 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED'; RUN;

PROC FACTOR DATA=FACT1 METHOD=ML NFACT=2 HEYWOOD;

TITLE2 'SEE PAGE 229 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED'; RUN;

一、factor过程

格式：proc factor 选项；

var 变量；

priors 公因子方差；

run;

注：1）、选项：data=输入数据集outstat=输出数据集

method=因子选择方法（包括principal , ML , alpha , prinit 等）rotate=因子转轴方式（包括none , varimax , promax , orthomax 等）Priors=计算公因子方差的方法（包括One Smc 等）

2）priors语句为var语句中的变量设定公因子方差的预估值（介于0与1之间）。

例：美国洛杉机市12个社区的社会经济状况分析：5个变量为：pop （人口）、school（教育程度）、employ（就业）、services（服务）、

house（房价），程序如下：

DATA economy;

INPUT POP SCHOOL EMPLOY SERVICES HOUSE;

CARDS;

……………………..

PROC FACTOR DATA=economy SIMPLE CORR;

TITLE 'Principal Component Analysis' ;

RUN;

PROC FACTOR DATA=economy PRIORS=SMC

ROTATE=PROMAX OUTSTAT=factall REORDER ;

PROC PRINT;

TITLE2'FACTOR OUTPUT DATA SET' ;

RUN;

参照上例自己编的程：

libname abc "D:/sas1";

proc data abc.fitness;（想一想这里为什么用fitness而不用class）

input NUM AGE WEIGHT RUNTIME RSTPULSE RUNPULSE MAXPULSE OXYGEN GROUP;

proc factor data=abc.fitness PRIORS=SMC ROTALE=PROMAX OUTSTAT=factall REORDER;

proc print;

RUN;\

改进：

把promax 改为varimax,去掉reorder

Promax 和varimax是两种不同的旋转方法，一般用varimax.

Smc是计算公因子方差的方法

习题八第3题因子分析

data chemical;

input SO TO FO CO KO@@;

cards;

75.20 0.14 1.86 0.91 5.21

75.15 0.16 2.11 0.74 4.93

72.19 0.13 1.52 0.69 4.65

72.35 0.13 1.37 0.83 4.87

72.74 0.10 1.41 0.72 4.99

73.29 0.033 1.07 0.17 3.15

73.72 0.033 0.77 0.28 2.78

;

proc factor data=chemical SIMPLE CORR;

title 'chemical component';

run;

proc factor data=chemical PRIORS=SMC ROTATE=PROMAX OUTSTAT=factall REORDER;

PROC PRINT;

title2'factor output data set'; run;

SAS软件运用实验指导书

数据分析实验指导书理学院实验中心数学专业实验室编写

实验一SAS系统的使用【实验类型】（验证性）【实验学时】2学时【实验目的】使学生了解SAS系统，熟练掌握SAS数据集的建立及一些必要的SAS语句。【实验内容】 1. 启动SAS系统，熟悉各个菜单的内容；在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1）通过编辑程序将表1读入数据集sasuser.score; 2）将下面记事本中的数据读入SAS数据集，变量名为code name scale share price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75

3)将下面Excel表格中的数据导入SAS数据集work.gnp； name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53 新疆123.24 38 13.72 4.64 17.77 5.75 4)使用VIEWTABLE格式新建数据集earn,输入如表所示数据Year earn 1981 125000 1982 136000 1983 122350 1984 65200 1985 844600 1986 255000 1987 265000 1988 280000 1989 136000

完整word版数据分析实验报告分析解析

实验课程：数据分析信息与计算科学业：专级：班号：学姓名：中北大学理学院．

实验一 SAS系统的使用【实验目的】了解SAS系统，熟练掌握SAS数据集的建立及一些必要的SAS语句。【实验内容】 1. 将SCORE数据集的内容复制到一个临时数据集test。 SCORE数据集 English Math Sex Chinese Name 91 90 f 85 Alice 95 Tom m 87 84 93 90 Jenny f 83 80 85 80 Mike m 84 85 89 m Fred 97 83 f 82 Kate 92 Alex 90 m 91 75 Cook m 78 76 82 f Bennie 79 84 85 Hellen f 74 84 90 82 Wincelet f 87 77 Butt m 81 79 86 85 Geoge m 82 89 Tod m 84 84 89 Chris f 84 87 86 65 f 87 Janet math的高低拆分到3个不同的数据集：SCORE2．将数据集中的记录按照math大于等于90的到good数据集，math在80到89之间的到normal数据集，math 在80以下的到bad数据集。 3．将3题中得到的good，normal，bad数据集合并。【实验所使用的仪器设备与软件平台】SAS 【实验方法与步骤】 1： DATA SCORE; INPUT NAME $ Sex $ Math Chinese English; CARDS; 2

91 85 Alice f 90 84 Tom m 95 87 83 f 93 90 Jenny 80 80 85 Mike m 89 85 m Fred 84 82 83 Kate f 97 91 Alex m 92 90 76 Cook m 78 75 84 82 79 f Bennie 84 74 Hellen f 85 87 82 Wincelet f 90 79 Butt m 77 81 82 m 86 85 Geoge 84 89 84 Tod m 87 84 f Chris 89 87 Janet f 86 65 ; ; Run PROC PRINT DATA=SCORE; DATA test; SET SCORE; ：2 good normal bad; DATA SCORE; SET; SELECT) output good; 90when(math>=) output normal; 80when(math>=&math<90) output bad; when(math<80; end; Run=good; DATA PRINT PROC=normal; DATA PRINT PROC=bad; DATA PRINT PROC ：3 All; DATA good normal bad; SET=All; DATA PROC PRINT;Run 3 【实验结果】结果一：

时间序列分析,sas各种模型,作业神器

实验一分析太阳黑子数序列一、实验目的：了解时间序列分析的基本步骤，熟悉SAS/ETS软件使用方法。二、实验内容：分析太阳黑子数序列。三、实验要求：了解时间序列分析的基本步骤，注意各种语句的输出结果。四、实验时间：2小时。五、实验软件：SAS系统。六、实验步骤 1、开机进入SAS系统。 2、创建名为exp1的SAS数据集，即在窗中输入下列语句： 3、保存此步骤中的程序，供以后分析使用（只需按工具条上的保存按钮然后填写完提问后就可以把这段程序保存下来即可）。 4、绘数据与时间的关系图，初步识别序列，输入下列程序： ods html; ods listing close; 5、run;提交程序，在graph窗口中观察序列，可以看出此序列是均值平稳序列。

6、识别模型，输入如下程序。 7、提交程序，观察输出结果。初步识别序列为AR(2)模型。 8、估计和诊断。输入如下程序： 9、提交程序，观察输出结果。假设通过了白噪声检验，且模型合理，则进行预测。 10、进行预测，输入如下程序： 11、提交程序，观察输出结果。

12、退出SAS系统，关闭计算机。总程序： data exp1; infile "D:\"; input a1 @@;

year=intnx('year','1jan1742'd,_n_-1); format year year4.; ; proc print;run; ods html; ods listing close; proc gplot data=exp1 ; symbol i=spline v=dot h=1 cv=red ci=green w=1; plot a1*year/autovref lvref=2 cframe=yellow cvref=black ; title "太阳黑子数序列"; run; proc arima data=exp1; identify var=a1 nlag=24 minic p=(0:5) q=(0:5); estimate p=3; forecast lead=6 interval=year id=year out=out; run; proc print data=out; run; 选取拟合模型的规则: 1.模型显著有效(残差检验为白噪声)

数据分析SAS报告

90-08年人民消费能力分析一、问题提出改革开放以来中国经济飞速发展，GDP连续超过德国、日本，现以成为世界上第二大经济体，人民生活水平不断提高，但受金融危机的影响，近几年来物价持续上涨，本月CPI创历史新高，人民的消费能力是否随着GDP的增加而增加呢？本文以中国经济年鉴中的“人民消费支出构成”的数据为依据利用统计软件SAS 进行了相关分析。数据如下食品衣着居住家庭设备用品及服务交通通讯文教娱乐用品及服务医疗保健其他商品及服务 1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900 二、问题分析 1、通过对消费种类进行主成分分析判断人民的消费情况。 2、对主成分标准化后在分析各年的消费能力排名。三、解决问题 3.1 SAS程序： data examp4_4; input id x1-x8; cards; 1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900 ; run; proc corr cov nosimple data=examp4_4; var x1-x8; run; proc princomp data=examp4_4 out=bb; var x1-x8; run; data score1; /*以下程序是对各年按第一主成分得分进行排名并打印结果*/ set bb; keep id prin1;

抑郁(SDS)焦虑自评量表(SAS)_实验报告

抑郁自评量表（SDS）实验报告一、实验目的通过实验了解受试抑郁的主观感受、轻重程度及其在治疗中的变化，掌握个别施测的使用方法。掌握抑郁自评量表的原理、实施、记分与结果解释方法。二、实验材料大学生心理测验系统三、实验步骤 3.1 进入大学生心理测验系统后再点击进入人格特点测评项目。 3.2 点击测试项目名称即抑郁自评量表（SDS），进入抑郁自评量表界面。 3.3 输入被试信息，确定后桌面弹出测验指导与窗口，认真阅读指导语： ①在这个问卷测试当中有20个问题,请你依次回答这些问题，答案选项包括“没有或很少时间”、“少部分时间”、“相当多时间”和“绝大部分或全部时间”四个选项，每一测题只能选择一个答案； ②该问卷测试评定的是最近一周的实际感觉； ③本测验不计时间，但应凭自己的直觉反应进行作答，不要迟疑不决，拖延时间； ④有些题目你可能从未思考过，或者感到不太容易回答。对于这样的题目，同样要求你做出一种倾向性的选择。确定阅读完毕后开始测试。 3.4 按照出现题目的先后顺序作答，直至答题完毕。四、实验结果 4.1 受试信息姓名：XXX性别：女年龄： 2 0 文化程度：本科测验耗时：00:00:43 4.2 受试结果总粗分65 标准总分81.25 参考诊断：有（重度）抑郁症状重点提示：抑郁精神性，因子得分：6 抑郁躯体障碍，因子得分：27 抑郁精神运动性障碍，因子得分：6 抑郁心理障碍，因子得分：26 五、实验结果分析该测试结果提示受试有重度抑郁的倾向，主要表现为：情绪非常低落，感觉毫无生气，没有愉快的感觉，经常产生无助感或者绝望感，自怨自责。经常有活着太累，想解脱、出现消极的念头，还常哭泣或者整日愁眉苦脸，话语明显少，活动也少，兴趣缺乏，睡眠障碍明显，入睡困难或者早醒，性欲功能基本没有。六、讨论或思考

实验报告七-SAS典型相关分析

实验报告实验项目名称典型相关分析所属课程名称统计分析及SAS实现实验类型验证性实验实验日期2016-12-11 班级数学与应用数学学号姓名成绩

【实验方案设计】一．理解典型相关分析的概念及步骤；二．掌握典型相关分析的方法；三．用INSIGHT、“分析家”计算统计量和编程实现实际问题中的典型相关分析；【实验过程】（实验步骤、记录、数据、分析）【练习7-1】对某高中一年级男生38人进行体力测试及运动能力测试，如表所示，试对两组指标作典型相关分析。

34 47 55 113 40 71.4 19 64 7.6 410 29 7 331 35 49 74 120 53 54.5 22 59 6.9 500 33 21 342 36 44 52 110 37 54.9 14 57 7.5 400 29 2 421 37 52 66 130 47 45.9 14 45 6.8 505 28 11 355 38 48 68 100 45 53.6 23 70 7.2 522 28 9 352 其中，体力测试指标为：X 1-------反复横向跳（次），X 2 -------纵跳（cm）， X 3------背力（kg），X4------捏力（kg），X 5 -----台阶测试（指数），X 6 ------ 定向体前屈（cm），X 7 -------俯卧上提后仰（cm）。运动能力测试的指标为y 1-50m跑（s），y 2 -跳远（cm），y 3 -投球（m），y 4 引体向上（次），y 5 -耐力跑（s）。【解答】利用INSIGHT模块进行典型相关分析：结果：表7.1 Univariate Statistics Variable N Mean Std Dev Minimum Maximum y1 38 7.1316 0.3354 6.6000 8.0000 y2 38 441.8421 43.2138 362.0000 522.0000 y3 38 27.8158 2.7495 21.0000 33.0000 y4 38 7.5263 3.8326 2.0000 21.0000

sas数据挖掘与应用实验报告

SAS 数据挖掘与应用实验报告陕西省各地市经济发展水平评价研究

实验要求： 1. 选择经济领域中的一个问题，确定相关的分析变量，描述通过数据挖掘来探究（或解释、或解决）问题的逻辑思路，说明预期的结果（结论）等。 2. 查询和搜集相关原始数据 3. 整理、准备数据，建立数据集 4. 采用二种或二种以上的挖掘方法，或进行对比分析，或先后进行多个阶段的分析。 5. 对挖掘结果进行分析和说明。 6. 总结研究结论或结果。实验目的： 1.熟悉SAS软件操作 2.练习SAS编程 3.学习并练习描述性统计分析、因子分析等方法与实际操作 4.研究实际问题问题描述：陕西省各市的经济发展一直受到陕西人民的关注，而对于2014年如何分析各市的发展情况，一直是一个仁者见仁的问题，指标体系的建立以及研究方法的选择多种多样，本文以各市2014年各市的重要经济发展指标出发，对11个地市的经济发展进行评价

解决思路：为了研究上述问题，我们应当以2014年的各地市相关经济发展指标为数据源，通过描述性统计分析对整体数据进行初步了解；并利用主成分分析对2014年各地市的经济发展进行一个综合评价和排序。 1.描述性分析 2.主成分分析实验过程： 1.搜集数据通过陕西省统计局网站搜寻到2014年各地市经济发展的指标并汇总，选择其中的五个指标（生产总值、财政收入、固定资产投资、外贸进出口总额、人均可支配收入），得到如下数据： 2.数据准备和预处理首先建立数据集，我将数据存在D:\saswork.sas中

为便于进行分析，将生产总值、财政收入、固定资产投资、外贸进出口、人均可支配收入均用X1-X5代替。 3.描述性统计分析 ①单变量分析：首先要对数据的基本情况有一个初步的了解，因此先进行单变量分析。再次我们利用means过程计算一些描述性统计量，编写程序如下： proc means data=saswork.sas maxdec=2 mean std max min range cv skewness; var x1-x5; run; 运行结果如下：分析：陕西省各市生产总值平均水平约为1613亿元，从标准差看来，无论是哪个指标都有着较大的差异，而且变异系数除了X5（人均收入）外其他都有着较高的值，这也说明了各地市的经济发展水平不同，而且在最大值的选择中，西安市的值正好与最大值相对应，说明西安市的经济发展处于绝对优势地位，但仅仅如此并不能反映出更多的信息，因此进行接下来的进一步统计指标计算和分析。 ②相关系数分析和P值检验代码如下： proc corr data=saswork.sas; var x1-x5; run; 运行后得到相关系数矩阵：

数据分析5.5实验报告

5.5 考察鸢尾属植物中三个不同品种的话的如下四个形状指标： 1X :萼片长度；2X 萼片宽度；3X ：花瓣长度；4X ：花瓣宽度。重这三个品种（记为1,2,3）各选取50株，测得上述指标的取值如表5.10所示。假如三个品种的着、这4个指标均服从4维正态分布，且先验概率相等，按下列要求进行Bayes 判别分析：

(1)只考虑指标2X 和4X ，并假定各总体协方差矩阵不全相等，给出误判率的回代估计和交叉确认估计； (2)只考虑指标2X 和4X ，并假定各总体协方差矩阵相等，写出线性判别函数，给出误判率的回代估计和交叉确认估计并于(1)中结果作比较； (3)假定有新样品T T o x x x )18,35(),(42==，在(1),(2)之下，该样品非别被判归哪个总体？ (4)利用全部4个指标重复(1)和(2)的分析，结果如何？是否所用指标越多，分类效果越好？在尝试其他几个指标组合，情况有如何？解：（1）误判率的回代估计：误判率的交叉确认估计：由以上结果可以看出，当只考虑指标2X 和4X ，并假定各总体协方差矩阵不全相等的情况下，无论用回代法还是用交叉分析法，均存在误判，且误判情况相同，共有7个误判：将第52号的样品由品种2误判为品种3；第53号的样品由品种2误判为品种3；第55号的样品由品种2误判为品种3；第100号的样品由品种2误判为品种3；第103号的样品由品种3误判为品种2；第124号的样品由品种3误判为品种2；第130号的样品由品种3误判为品种2。误判的回代估计∧ *r p 和交叉确认估计∧*c p 为： 0467.01507 ??**≈==c r p p （2）当各总体协方差矩阵相等，即∑∑∑∑===123，只需把程序中pool =no 改为pool =yes ，运行结果整理如下：线性判别函数为： 421 06379.238648.363828.56?x x W -+-= 422 76415.179074.141765.37?x x W ++-=

数据分析实验报告(主成分分析)

实验八主成分分析一、实验目的和要求能利用原始数据与相关矩阵、协主差矩阵作主成分分析,并能理解标准化变量主成分与原始数据主成分的联系与区别；能根据SAS输出结果选出满足要求的几个主成分．实验要求:编写程序，结果分析．实验内容：书上4.5 4.6 4.5 data examp4_5; input id x1-x8; cards; 1 8.35 23.53 7.51 8.6 2 17.42 10.00 1.04 11.21 2 9.25 23.75 6.61 9.19 17.77 10.48 1.72 10.51 3 8.19 30.50 4.72 9.78 16.28 7.60 2.52 10.32 4 7.73 29.20 5.42 9.43 19.29 8.49 2.52 10.00 5 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 6 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35

7 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81 8 9.09 28.12 7.40 9.62 17.26 11.12 2.49 12.65 9 9.41 28.20 5.77 10.80 16.36 11.56 1.53 12.17 10 8.70 28.12 7.21 10.53 19.45 13.30 1.66 11.96 11 6.93 29.85 4.54 9.49 16.62 10.65 1.88 13.61 12 8.67 36.05 7.31 7.75 16.67 11.68 2.38 12.88 13 9.98 37.69 7.01 8.94 16.15 11.08 0.83 11.67 14 6.77 38.69 6.01 8.82 14.79 11.44 1.74 13.23 15 8.14 37.75 9.61 8.49 13.15 9.76 1.28 11.28 16 7.67 35.71 8.04 8.31 15.13 7.76 1.41 13.25 17 7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29

数据分析实验报告

广东石油化工学院数据分析（抽样调查）实验报告题目：多元统计分析在股票投资中的作用

摘要：随着我国股票市场的迅速发展和逐步完善，股票的投资特点和前景越来越受到投资者的追捧。理性的投资者，将会更加重视上市公司的经营业绩和股票的内在价值。但如何对股票的价值进行评价在实践中是个难点，对此进行探讨十分必要。本文首先运用图形分析法和移动平均法分析股票风险，再运用聚类分析对影响上市公司股票业绩的变量进行分类，运用因子分析模型得出决定股票业绩的公因子，并进行了比较。关键词：图形分析法；移动平均法；聚类分析；因子分析；SAS；股票投资分析一、研究目的及意义随着我国股票市场的不断发展，股票投资已经成为我国投资者的主要投资途径，而且也将成为我国投资者的重要投资渠道。因此，他们必须重视上市公司的经营业绩，重视股票自身的品质，即重视投资对象的选择。面对众多股票及各个公司的财务数据，怎样才能客观、全面、准确的分析并选出绩优股和潜力股呢？本文选择30家上市公司作为研究对象，进行业绩评价。目的是对上市公司财务分析的基础上，探索各上市公司的投资价值，为投资者提供一定的决策指导和理论参考。二、研究方法多元统计分析方法中的图表分析法、移动平均法、聚类分析和因子分析在股票的综合评价中有着广泛的应用。本文采用的分析方法是图表分析法、移动平均法、因子分析和聚类分析。在对上市公司进行综合评价时，先用图表分析法和移动平均法分析其风险，接着用聚类分析进行分类，然后再利用因子分析法对多维变量进行降维，降维后的变量是原变量的线性组合，并能反映原变量绝大部分信息，使信息的损失最小，对原变量的综合解释能力强。该方法通过因子的方差贡献率来表示变量的作用，可避免在系统分析中对权重的主观判断，使权重的分配更合理，尽可能地减少重叠信息的不良影响，克服

SAS实验报告

实验目的：探讨农产量、农村人口、播种面积、受灾面积、农村机械总动力的关联性。数据来源：国家统计数据库 http://219.235.129.58/reportYearBrowse.do 导入数据：农产量（万吨）农村人口（万人）播种面积（千公顷）受灾面积（千公顷）农业机械总动力(万千瓦) 北京市124.77 263 226.29 14.6 271.54 天津市156.29 270 306.64 58.533333 595 河北省2910.17 4009 6216.5 2627.5 9861.12 山西省942 1851 3146.67 1786.5 2655.0425 内蒙古自治区1981.7 1129 5424 4770.363333 2891.64 辽宁省1591 1712 3124.1 2171.786667 2142.93 吉林省2460 1279 4427.7 2670.63 2001.13 黑龙江省4353.01 1703 11391.03 7393.7 3401.27 上海市121.68 219 193.27 16.3 99.2258 江苏省3230.1 3430 5272.04 1202.6 3810.57 浙江省789.15 2181 1290.09 463.313333 2384.03 安徽省3069.872484 3550 6605.568384 2101.32 5108.85 福建省666.861112 1763 1231.012133 265.693333 1175.0092 江西省2002.56 2518 3604.6 1351.676667 3358.93 山东省4316.3 4894 7030.09 2341.87 11080.66 河南省5389 5910 9683.61 2987.353333 9817.843 湖北省2309.1 3089 4012.53 1827.1 3057.24 湖南省2902.7 3639 4799.1 1824.87 4352.39 广东省1314.5 3528 2538.5 643.3 2190.177 广西壮族自治区1463.2 2952 3067.5 1109.61 2550.9337 海南省187.604049 440 430.433876 119.9 396.07 重庆市1137.2 1384 2229.49 495.1 967.41 四川省3194.6 5017 6419.4 1598.763333 2952.66 贵州省1168.27 2663 2984.73 779.866667 1606.4196 云南省1576.92 3017 4200.13 1667.523333 2159.402 西藏自治区90.53 221 169.43 53.04 358.44 陕西省1131.4 2131 3133.973333 1220.666667 1832.9785 甘肃省906.2 1775 2740.03 1880.796667 1822.65 青海省102.69 324 275.72 159.58 388.68 宁夏回族自治区340.7 337 826.88 365.533333 702.55 新疆维吾尔自治区1152 1299 1984.7 1244.3 1503.31

SAS实验报告模板

2009年广东省各市经济统计分析 ——《数据分析与统计软件》实验报告伍思敏（进修）1102020 1、问题背景与数据描述自广东省委省政府提出建设“幸福广东”之后，如何加快全省经济的升级转型，如何促进全省各市的城乡区域协调发展，以及如何统筹全省经济社会协调发展成为全社会关注的热点。首先，我们必须了解全省21个地级市的基本经济情况，找出现行经济的不足，才能做出科学的决策。我们通过分析各市的社会经济的8项统计指标，来研究各市的经济运行情况。根据《广东年鉴2010》的资料，给出有关的数据，见表1。表1 2009年广东省各市社会经济统计数据

2、统计分析方法与SAS实现为了研究各市的经济情况，我们利用基本的描述性统计、因子分析、聚类分析等方法来进行多角度的分析，并用SAS完成统计分析任务。 2.1 数据准备和处理为便于分析和说明，在下面的中文和程序中，我们将使用以下变量来表示各经济指标，如表2所示：表2 变量符号 input region $ x1-x8; cards; guangzhou 9138.21 89082 295.62 11376.76 2659.85 374.05 3615.77 49519 shengzhen 8201.32 92772 15.48 15416.24 1709.15 1619.79 2567.94 46723 zhuhai 1038.66 69889 51.62 2405.04 410.51 177.83 404.46 31764 shantou 1035.87 20385 104.71 1531.10 291.90 40.16 661.96 25389 foshan 4820.90 80686 195.03 11711.28 1470.56 245.78 1408.78 34106 shaoguan 578.75 19549 133.42 599.23 356.50 5.79 278.36 28276 heyuan 405.50 13928 86.86 604.68 198.15 14.13 139.50 23803 meizhou 519.29 12558 179.38 351.11 162.98 6.71 267.98 24097 huizhou 1414.70 35819 147.91 3005.14 758.97 171.49 491.10 25786 shanwei 390.04 13363 111.22 319.60 289.43 9.48 282.06 23238 dongguan 3763.91 56601 25.31 6071.11 1094.08 551.67 959.07 42585 zhongshan 1566.41 62304 77.77 4057.97 545.61 177.36 549.76 36165 jiangmen 1340.88 32139 193.09 2933.26 492.07 79.49 562.07 24304 yangjiang 527.27 22132 200.16 504.56 239.49 12.30 305.38 21439 zhanjiang 1156.67 16647 397.68 1028.79 393.23 13.65 559.94 23944 maoming 1231.25 19979 385.38 1098.13 180.01 5.32 591.05 24255 zhaoqing 862.00 22415 256.81 1179.01 462.77 20.30 275.78 26174 qingyuan 861.59 22796 158.71 2024.06 841.24 14.15 303.56 28379 chaozhou 480.18 18681 61.35 581.07 162.98 18.70 207.89 21293 jieyang 816.09 14159 149.61 1153.29 393.50 25.25 341.46 19881 yunfu 344.51 14276 144.91 324.32 240.19 6.16 117.91 21913 ; run; 2.2 描述性统计分析为了对数据的基本情况有一个初步的了解，我们首先进行单变量分析。利用MEANS过程计算各

SAS统计学软件教学实验报告

实验报告课程名称：院系：数学科学系专业班级：统计1401B 学号：学生姓名：指导教师：开课时间：2015至2016 学年第二学期

一、学生撰写要求按照实验课程培养方案的要求，每门实验课程中的每一个实验项目完成后，每位参加实验的学生均须在实验教师规定的时间内独立完成一份实验报告，不得抄袭，不得缺交。学生撰写实验报告时应严格按照本实验报告规定的内容和要求填写。字迹工整，文字简练，数据齐全，图表规范，计算正确，分析充分、具体、定量。二、教师评阅与装订要求 1.实验报告批改要深入细致，批改过程中要发现和纠正学生实验报告中的问题，给出评语和实验报告成绩，签名并注明批改日期。实验报告批改完成后，应采用适当的形式将学生实验报告中存在的问题及时反馈给学生。 2.实验报告成绩用百分制评定，并给出成绩评定的依据或评分标准（附于实验报告成绩登记表后）。对迟交实验报告的学生要酌情扣分，对缺交和抄袭实验报告的学生应及时批评教育，并对该次实验报告的分数以零分处理。对单独设课的实验课程，如学生抄袭或缺交实验报告达该课程全学期实验报告总次数三分之一以上，不得同意其参加本课程的考核。 3.各实验项目的实验报告成绩登记在实验报告成绩登记表中。本学期实验项目全部完成后，给定实验报告综合成绩。 4.实验报告综合成绩应按课程教学大纲规定比例（一般为10-15%）计入实验课总评成绩；实验总评成绩原则上应包括考勤、实验报告、考核（操作、理论）等多方面成绩； 5.实验教师每学期负责对拟存档的学生实验报告按课程、学生收齐并装订，按如下顺序装订成册：实验报告封面、实验报告成绩登记表、实验报告成绩评定依据、实验报告（按教学进度表规定的实验项目顺序排序）。装订时统一靠左侧按“两钉三等分”原则装订。

数据分析实验报告

数据分析课程实验报告学院：理学院专业：信息与计算科学班级：姓名：学号：一、实验题目

所做实验属于哪一部分的内容。例如：一元线形回归及其在SPSS中的实现。二、实验目的 1、加深对聚类分析原理的理解； 2、理解聚类分析中变量聚类的原理； 3、运用SPASS软件解决关于聚类分析方面具体的问题；三、实验原理聚类分析也称群分析、点群分析，他是研究分类的一种多元统计方法。例如，我们可以根据学校的师资、设备、学生的情况，将大学分成一流大学，二流大学等；国家之间根据其发展水平可以划分为发达国家、发展中国家；自然界生物可以分为动物和植物等等。这些就是一些分类。那么分类根据什么分呢？聚类分析的基本思想是在样品之间定义距离，在样品之间定义相似系数，距离或相似系数代表样品或者变量之间的相似程度。按相似程度的大小，将样品（或变量）逐一归类，关系密切的类聚集到一个小的分类单位，然后逐步扩大，使得关系疏远的聚合到一个大的分类单位，直到所有的样品（或变量）都聚集完毕，形成一个表示亲疏关系的谱系图，依次按照某些要求对样品（或变量）进行分类。根据分类对象不同分为样品聚类和变量聚类，样品聚类在统计学中又称为Q型聚类，它是根据被观测的对象的各种特征即反映被观测对象的特征的各变量值进行分类；变量聚类在统计学中有称为R 型聚类，它反映事物特点的变量有很多，我们往往根据所研究的问题选择部分变量对事物的某一方面进行研究。依据聚类方式的不同我们可以有很多种聚类如：快速聚类法，谱系聚类法等等。 R型聚类分析的主要作用是： 1、不但可以了解个别变量之间的关系的亲疏程度，而且可以了解各个变量组合之间的亲疏程度。 2、根据变量的分类结果以及它们之间的关系，可以选择主要变量进行回

SAS数据分析

SAS数据分析通过一学期的学习，我基本掌握了SAS的基本编程，学会了用SAS对一些相关数据的分析，并写出实验报告，还能简单的读取一些SAS数据和文件了解一些背景问题。 SAS是一个综合的统计分析系统，它由多个功能模块组合而成。本学期我们主要学习了7章内容，分别介绍了对SAS数据集的操作，包括如何建立和管理SAS数据集，以及如何在数据集中更改变量的属性，还有数据集的拆分、合并、转置、筛选等操作。数据整理时今次那个统计分析的必要前提，也是熟练使用SAS系统的一项基本技能。本学期还介绍了各种常用的统计方法，包括探索性分析、假设检验、方差分析、非参数检验、回归分析、聚类分析、判别分析、因子分析、时间序列分析等多个专题。每个专题集邮相关理论的简单讲解，也配有使用的案例操作，理论与实践结合能够使学生快速获得使用SAS解决实际问题的能力；每章最后都给出了几个习题，以便学生进行练习而提高应用水平。最后还有一些基本的SAS 中的命令，经过老师的悉心指导以及上机实验，我们已经基本能够较为熟练的操作该软件了，接下来我将就一个实例，用我所学的聚类分析来展示下我学习的成果。个省、市、自治区经济发展的基本情况

地区X1 X2 X3 X4 X5 X6 X7 X8 北京1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43 天津920.11 2720 345.46 6501 342.8 115.2 110.6 582.51 河北 2849.52 1258 704.87 4839 2033.3 115.2 115.8 1234.85 山西1092.48 1250 290.9 4721 717.3 116.9 115.6 697.25 内蒙 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39 辽宁2793.37 2397 387.99 4911 1371.1 116.1 114 840.55 吉林1129.2 1872 320.45 4430 497.4 115.2 114.2 762.47 黑龙江2014.53 2334 435.73 4145 824.8 116.1 114.3 1240.37 上海2462.57 5354 996.48 9279 207.1 118.7 113 1642.95 江苏 5155.25 1926 1434.95 5943 1025.5 115.8 114.3 2026.64 浙江3524.79 2249 1006.39 6619 754.4 116.6 113.5 916.59 安徽 2003.58 1254 474 4609 908.3 114.8 112.7 824.14 福建 2160.52 2320 553.97 5857 609.3 115.2 114.4 433.67 江西 1205.11 1182 282.84 4211 411.7 116.9 115.9 571.84 山东 5002.34 1527 1229.55 5145 1196.6 117.6 114.2 2207.69 河南 3002.74 1034 670.35 4344 1574.4 116.5 114.9 1367.92 湖北 2391.42 1527 571.86 4685 849 120 116.6 1200.72 湖南 2195.7 1408 422.61 4797 1011.8 119 115.5 843.83 广东 5381.72 2699 1639.83 8250 656.5 114 111.6 1396.35 广西 1606.15 1314 382.59 5105 556 118.4 116.4 554.97 海南 364.17 1814 198.35 5340 232.1 113.5 111.3 64.33 四川 3534 1261 822.54 4645 902.3 118.5 117 1431.81 贵州 630.07 942 150.84 4475 301.1 121.4 117.2 324.72 云南 1206.68 1261 334 5149 310.4 121.3 118.1 716.65 西藏 55.98 1110 17.87 7382 4.2 117.3 114.9 5.57 陕西 1000.03 1208 300.27 4396 500.9 119 117 600.98 甘肃 553.35 1007 114.81 5493 507 119.8 116.5 468.79 青海 165.31 1445 47.76 5753 61.6 118 116.3 105.8 宁夏 169.75 1355 61.98 5079 121.8 117.1 115.3 114.4 新疆834.57 1469 376.95 5348 339 119.7 116.7 428.76 衡量一个地区经济发展的基本情况，可以采用如下所列的8项经济指标。表中X1为GDP；X5为货物周转量；X2为居民消费水平；X6为居民消费价格指数；X3为固定资产投资；X7为上品零售价格指数；X4为职工平均工资；X8为工业总产值。 SAS编程如下： data text1; input X1-X8; cards; X1 X2 X3 X4 X5 X6 X7 X8 1394.89 2505 519.01 8144 373.9 117.3 112.6 843.43 920.11 2720 345.46 6501 342.8 115.2 110.6 582.51 2849.52 1258 704.87 4839 2033.3 115.2 115.8 1234.85 1092.48 1250 290.9 4721 717.3 116.9 115 .6 697.25 832.88 1387 250.23 4134 781.7 117.5 116.8 419.39 2793.37 2397 387.99 4911 1371.1 1