实验三 SAS基本内容 (1)

实验三 SAS基本内容 (1)
实验三 SAS基本内容 (1)

课时授课计划

课次序号:05 一、课题:实验三SAS基本内容

二、课型:讲授与上机实验

三、目的要求:

1.掌握SAS软件的基本功能与基本操作方法;

2. 了解SAS软件的基本内容:数据的输入与输出,建立SAS数据集, SAS

系统数学运算符号及常用的SAS函数,逻辑语句与循环语句.

四、教学重点:SAS软件的基本功能与基本操作方法.

教学难点:SAS软件的基本操作方法.

五、教学方法及手段:传统教学与上机实验相结合.

六、参考资料:

《应用多元统计分析》,高惠璇编,北京大学出版社,2005;

《使用统计方法与SAS系统》,高惠璇编,北京大学出版社,2001;

《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;

《应用回归分析》(二版),何晓群编,中国人民大学出版社,2007;

《统计建模与R软件》,薛毅编著,清华大学出版社,2007.

七、作业:补充练习

八、授课记录:

九、授课效果分析:

实验三 SAS基本内容(3学时)

一、实验目的和要求

了解SAS软件的基本内容:数据的输入与输出,建立SAS数据集, SAS系统数学运算符号及常用的SAS函数,逻辑语句与循环语句.会建立SAS数据集,运行程序,分析结果.

二、实验内容

1.直接输入数据建立SAS数据集

在SAS程序窗口下,直接输入建立SAS数据集,基本语句:

DATA name ; /* 要建立的数据集名称*/

I NPUT variables;/* 指明数据集变量名称,为不超过8字符的字符串*/

CARDS;/* 此句后面将读入数据*/

Data lines; /* 数据行,两个数据间用至少一个空格隔开;用格式化输入,则数据要按指定格式输入*/

; /* 表数据输入结束*/

RUN;/* 程序运行*/

⑴自由输入建立SAS数据集

INPUT 变量名 <$> ?;

在INPUT后面依次列出变量名称,变量间至少一个空格,<>为可选项,变量名后输入$——代表字符型变量,如果数据中每行有多余一组观测值,可在INPUT variables后加@@,表示指针不换行读入各组观测值.

例如: INPUT ID NAME $ VAR1 VAR2 VAR3 VAR4; /*输入6个变量,序号变量ID、字符型变量NAME及数值变量VAR1、VAR2、VAR3、VAR4 */

INPUT ID NAME $ VAR1 - VAR4; /* 6个变量名,NAME字符型*/

⑵格式化输入建立数据集

方式一列输入:I

NPUT 变量名 <$> 开始列<- 结束列>?;

通过指定变量取值所占列数输入相应值.

在每个变量名后,空一格指出变量值占据的列数.

例如: INPUT ID 1-2 NAME $ 4-20 VAR1 22-24 VAR2 26-30; /* 4个变量名,将1、2列的数值赋予变量ID,第4到20列字符赋予字符型变量NAME,22到24列数值赋予VAR1*/

方式二格式化输入W.d格式:

INPUT 变量名 <修饰符> 输入格式W.d ;

W——变量取值所占总列数,d——表示从右到左小数部分列数.这种方式尤其适合于各变量间取值无空格、和无小数点的数据集.

例如INPUT ID 2.NAME $ 10.VAR1 5.2; /* 前2列赋予ID,第3列开始10列内容赋予非数值变量NAME,接下来5列赋予V AR1,最后两位为小数部分.*/

如果变量ID与NAME的值之间有三个空格,在读完ID的值后,指针从第3列跳到第6列开始读入NAME的值,应在ID2.后空一格写上@6(移到第6列)或+3(跳过3行),另外,数据间的空格也可并到变量值的位数中.

如果有连续几个变量的W.d格式相同,可用下列简写形式:

INPUT (variables) (W.d);

如INPUT (X Y Z)(2.1);INPUT (X1-X10)(2.)等.

例1 设有数据集如下:LIMING 23 56 170

LIUHUA 25 60 174

ZHANGWEI 30 65 165

相应变量分别为NAME,AGE,WEIGHT和HEIGHT,输入数据以建立一个名为examp8_1_1的SAS数据集.

方法一:自由格式输入数据以建立数据集,完整的SAS程序:

data examp1; /* 建立数据集 examp1 */

input name $ age weight height;/* 输入变量 */

cards; /* 以下为数据行*/

LIMING 23 56 17 /* 数据和变量名对应,数据间用空格表示*/ LIUHUA 25 60 174

ZHANGWEI 30 65 165

; /* 数据行结束*/

run; /* 运行程序*/

proc print data=examp1; /*打印输出数据集*/

run; /* 运行程序*/

方法二:格式化输入:若上述程序中数据行的形式保持不变,数据之间空一格,只要INPUT 语句修改即可

data examp1;

input name $ 1-8 age 10-11 weight 13-14 height 16-18;

/*或 input name $ 8.+1 age 2.+1 weight 2.+1 height 3.; */

/*或 input name $ 8. @10 age 2. @13 weight 2. @16 height 3.;*/ /*或 input name $ 9. age 3. weight 3. height 3.; */

cards;

LIMING 23 56 170

LIUHUA 25 60 174

ZHANGWEI 30 65 165

;

run;

proc print data=examp1;

run;

方法三:格式化输入:如将NAME取值中的姓和名用一空格分开,且HEIGHT的值表成具有两位小数的形式,如下

data examp1;

input name $ 9. +1 age 2. +1 weight 2. +1 height 3.2;

/* 或input name $ 9. @ 11 age 2. @ 14 weight 2. @ 17 height 3.2;*/ cards; /* name $ 9.说明NAME占9位,正好姓名之间有空格*/ LI MING 23 56 170

LIU HUA 25 60 174

ZHANG WEI 30 65 165

;

run;

proc print data=examp1;

run;

方法四:格式化输入:如程序中数据集的变量之间无空格,且使height的变量值有2位小数的形式,可按如下

data examp1;

input name $ 9. age 2. weight 2. height 3.2;

/*或 input name $ 1-9 age 10-11 weight 12-13 height 3.2;*/

cards;

LI MING 2356170

LIU HUA 2560174

ZHANG WEI3065165

;

run;

proc print data=examp1;

run;

注意:必须按照名字占够9位(位数不够输入空格),年龄占10-11列,weight占12-13列,height占14-16列来输入程序,变量之间无空格.

结果为 1 LI MING 23 56 1.70

2 LIU HUA 25 60 1.74

3 ZHANG WEI 30 65 1.65

注意:例1建立的SAS数据集只能保存在SAS程序中.调用被保存的SAS程序,加上进行分析的程序(如描述性分析程序),形成完整的程序,再在进行统计分析计算.(3)建立永久数据集

用Libname语句建立SAS永久数据集(name.sas7bdat),基本语句:

Libname SAS数据库名“路径”; /*建立数据库引用名*/

Data 数据集名; /*新建数据集名:数据库.数据集*/

Input 变量名<$>?;

Cards;

??;

RUN;

例2 将上例建立永久数据集保存在E:\sjfx目录下,集名examp1.sas7bdat.方式1:程序窗口输入:

LIBNAME sas'E:\sjfx';/* 新建立逻辑库引用名lxy,地址E:\sjfx,此地址用逻辑库名sas代替,在SAS关闭自动消失*/

DATA sas.Examp1; /*建立数据集examp1,存此文件夹下,库引用名为lxy */ input name $ age weight height;

cards;

LIMING 23 56 17

LIUHUA 25 60 174

ZHANGWEI 30 65 165

;

run;

proc print data=sas.examp1;

run;

则在E:\ sjfx,生成数据集文件examp1.sas7bdat.重新调入数据库文件examp.sas7bdat:再重新打开的程序窗口输入

LIBNAME sas'E:\sjfx';

PROC PRINT DATA=sas.examp1;

RUN;

即可,同时输出窗口显示刚才的结果.

方式2:先建立SAS逻辑库,再输入数据集

也可以先建好逻辑库(如sas),再建立数据集(逻辑库名.数据集名)存放于该库中,用Set命令课直接调用.

创建逻辑库步骤:

1)在“资源管理器”(Explorer)(左边视窗)窗口中,点“逻辑库(Library)”文件夹 (或点击:查看View-资源管理器) ;

2)选择“文件”(Files)“新建(NEW)”,或在SAS环境窗口右击逻辑库,选择“新建”;

3)在“新建逻辑库(NEW Library)”窗口名称域(Names)中输入逻辑库名,如sas.库名不超过8个字符;

4)选择引擎(Engine)类型,一般选默认即可;

5)如果希望以后SAS在启动时自动启用该逻辑库,选中“启动时启用(Enable at startuo)”复选框;

6)“逻辑库信息”各区域中输入相应信息,路径(Path)中给出SAS文件所在路径如E:\sjfx

(或点Browse找文件所在路径,找到文件夹双击);

7)单击“确定”按钮,新逻辑库出现在SAS资源管理器窗口的逻辑库中.双击逻辑库及文件名,可以显示数据集.

8)建立数据集

DATA sas.Examp1;

Input……;

练习 1 利用例1 的数据集以建立一个名为ex1的SAS永久数据student.sas7bdat放在文件夹E:\数据分析下.相应变量不变,增加序号ID(3位)、性别SEX,输入数据采用格式化输入height保留2位小数,姓和名之间加空格,并重新调用打印输出.

2. 利用外部数据文件建立SAS数据集

(1)从外部文本文件读入数据

从外部文本数据文件中读入数据,建立一个数据集.要求的外部数据文件必须是可以在Windows操作系统下用显示其全部内容的ASCII文件.该文件的第一行就是数据,不可以是字段名,各变量值依次存放.

可用INFILE语句将其读入并建立SAS数据集,DATA程序步的三个主要步骤:

●启动一个数据步,命名将要创建的数据集(使用DATA语句).

●确定要读入的外部文件(使用INFILE语句).

●描述如何读入每一条记录(使用INPUT语句).

如果需要在程序中直接嵌入数据,第二步用CARDS语句代替INFILE语句.

一般程序结构:

DATA name ; /* 命名所要创建的数据集名*/

INFILE ‘drive location :\file name’;

/* 读取外部文件,drive locationz指驱动器名及子目录名,file name是数据文件名(包含后缀)*/ INPUT variables;

/* INPUT变量1读入模式变量2 读入模式,变量模式要根据数据集中格式确定相应的变量输入格式,不

能有汉字*/

RUN;

例3 从文本文件导入数据集

有一文本文件a.txt存于E:\sjfx,内容如下:

Beijing 338 93519 274803 66556 76347 18672 Tianjin 230 72335 198537 52635 55223 13105

Hebei 814 464146 1293887 318714 344686 67536 Shanxi 560 228292 647261 163273 186674 36985 InnerMongolia 372 179126 473568 117525 121274 24593 Liaoning 464 258609 685199 169848 180225 35586 Jilin 296 169907 451637 101107 123022 22302 Heilongjiang 479 203315 546793 139441 185184 32648 Shanghai 344 106474 313811 91017 76222 17832 Jiangsu 844 494692 1373465 353177 330488 82855 Zhejiang 610 299904 860613 215649 191700 53303 Anhui 758 402700 1050188 248451 222229 45646 Fujian 614 255749 659758 159242 163985 40132 Jiangxi 642 294093 800049 198869 180557 43653

1)导入建立临时数据集

将此文件调入建立数据集,并打印输出.

DATA b;

INFILE 'E:\sjfx\a.txt';

INPUT name $ A B C D E F;

PROC PRINT;

RUN;

2)导入建立永久数据集

调入后建立永久数据集,保存到如保存到E:\sjfx下,程序:LIBNAME sas'E:\sjfx';/*如果已建立逻辑库sas,此句可省略*/ DATA sas.b;

INFILE 'E:\sjfx\a.txt';

INPUT name $ A B C D E F; /*读取数据*/

PROC PRINT;

RUN;

则在E:\sjfx下新增文件b.sas7bdat,同时sas库中也有此文件,点击打开即可出现数据集.

练习2文本文件E:\个人文件夹\a.txt,将其调入建同名数据集,存放此文件夹中.(2)从已建立的SAS数据集中读入数据

利用SET语句,可以从一个已存在的SAS数据集依次读入每一个观测.对数据做某种处理后,写入新数据集.

例如,刚才在E:\sjfx目录下,已经建立了数据集名examp1.sas7bdat,将此数据

集读入建立新数据集.

DATA d1;

SET sas. examp1;/*调用数据文件*/

RUN;

PROC PRINT data=d1;/*data=d1省略,表示打印当前数据集*/

Title “AAa”;/*标题为AAa*/

RUN;

(3)从其它数据库文件中导入数据

常用的数据管理软件将需要处理的数据录入到相应的数据库文件中,用SAS处理时,

需将该数据格式的文件转换为SAS数据集.可以使用数据导入(Import)功能,实现Access、Excel、dbf等常见数据格式与SAS数据集的无缝转换.

方式一:编程实现Excel数据的导入导出

例4E:\sjfx 中文件examp2_3.xls中有4个变量Y,X1,X2,X3,编程将此文件将其转换为同

名SAS数据集.

* examp2_3;

LIBNAME sas 'E:\sjfx'; /* 引用逻辑库名sas,地址E:\sjfx */

PROC IMPORT OUT=sas.examp2_3 /*IMPORT过程实现转换,输出的永久数据集名

lxy.examp2_3 */

DATAFILE= "E:\sjfx\examp2_3.xls" /* 要导入的数据文件地址及文件名*/

DBMS=EXCEL REPLACE; /*指定要导入的数据库管理系统为Excel*/ SHEET= "Sheet1$"; /*指定电子表格中的表单为Sheet1*/

GETNAMES=YES; /* 指出第一行是否有字段名,此处写是*/

RUN;

PROC PRINT;

RUN;

方式二:使用向导实现数据的导入和导出:

1)单击“文件(File)”,选“导入数据(Import Data)”,启动“向导(Import Wizard)”;

2)从下拉列表选择数据源类型,Microsoft Excel97 or 2000 work book,单击“下一步(NEXT)”

按钮;

3)选择数据源文件,比如“E:\sjfx\example2_3.xls”,单击“浏览(Browse)”,选中

文件,单击“OK”;

4)选择数据表的表名(数据表有三个,选取需要的,如”Sheet1$”);

5) 选择建立何种数据集.确定数据集存储位置数据库(library)如work临时库或永久

库sas和数据集名(member)如examp2_3,单击下一步;

6)单击“完成(Finish)”;

7)如果需要将相应的操作写为程序文件,单击“Next”按钮,单击“浏览”按钮,选择要建立的SAS程序位置(如E:\sjfx)及文件名如c,产生一个程序文件c.sas,单击完成.在E:\sjfx可看到数据集examp2_3.sas7bdat 和程序文件c.sas.

再打开c.sas,就会出现如下程序:

PROC IMPORT OUT= sjfx.EXAMP2_3

DATAFILE= "E:\sjfx\examp2_3.xls"

DBMS=EXCEL2000 REPLACE;

SHEET="Sheet1$";

GETNAMES=YES;

RUN;

3.利用已有的SAS数据集建立新的数据集

(1)数据集的合并

数据集的连接是把两个或两个以上的数据集的观测连接成一个新的数据集.连接的方式有二种:串(拼)接和合并.

在SAS数据步中用SET语句可拼接数据集,用MERGE语句合并数据集.例如数据集A 和B,要拼接和合并成数据集C,二种不同方法程序和结果见示意图:

例5 两数据集的拼接

* examp5;

Data A ;

Input common x ;

9801 1

9802 2

9803 3

Data B ;

Input common x ;

Cards ;

9801 4

9802 5

9803 6

Data C ;

Set A B ;

Proc print data=C ;

Run;

结果输出:

Obs common x

1 9801 1

2 9802 2

3 9803 3

4 9801 4

5 9802 5

6 9803 6

注意:10两数据集必须变量名称相同;

20 如果在“E:\sjfx”下,已经新x建立了数据集,A.sas7dbat和B.sas7dbat,逻辑库如sas已经调用(或设为永久库),则直接将A、B合并即可:

Data sas.C ;

Set sas.A sas.B ;

Proc print data=sas.C ;

Run;

在“E:\sjfx”下,新建了数据集,C.sas7dbat.

结果如上.

例6 两数据集的合并

* examp6;

Data A ;

Input common x ;

Cards ;

9801 1

9802 2

9803 3

Data B ;

Input common Y ;

Cards ;

9801 4

9802 5

Data C ;

MERGE A B ;

Proc print data=C ;

Run;

Obs common x Y

1 9801 1 4

2 9802 2 5

3 9803 3 6

(2)变量值的排序

有时需要将某个名为“name”的SAS数据集中的各观测变量按某个变量的取值由小到大(数值变量)或按字母顺序(非数值变量)排序,SAS语句形式为:

PROC SORT DATA=name;/* 调用排序过程SORT*/

BY variable;/* 按variable 排序*/

RUN;

例5 中,按变量值common排序,程序:

……

Proc Sort Data=C;

By common;

Run;

Proc print data=C ;

Run;

结果输出:

Obs common x Y

1 9801 1 .

2 9801 . 4

3 9802 2 .

4 9802 . 5

5 9803 3 .

6 9803 . 6

(3)删除数据集中的某些数据行(观测向量)

DATA new name;

SET A;

IF conditions THEN DELETE;

RUN;

例如,练习1在E:\sjfx建立的数据集examp1.Sas7bdat,删除第4行,程序:Libname ss 'E:\sjfx'; /*数据集所在文件夹逻辑库*/

data aa;

set ss.examp1;

If _N_=2Then DELETE;

RUN ;

Proc PRINT data=aa;

RUN;

Obs name age weight height

1 LIMING 23 56 17

2 ZHANGWEI 30 65 165Obs

(4)保留数据集中某些变量及相应观测值

DATA new name;

SET A;

DROP X1 Y1;(或KEEP X2 Y2 Y3;)

RUN;

(5)产生新变量及其观测值

对一个SAS数据集,有时需要产生一个新变量和计算相应观测值.例如,SAS系统只需对变量做相应运算,即可一次性产生新变量的各个观测值.

例如,SAS数据集“OLD”中,包含变量Y1,X1和X2,有n行数据,这时要产生一个名为“NEW”的新数据集,除包含原变量及其数据外,还要包含新变量Y和X,其中Y=lnY1, X=X1*X2,且要求打印出新数据集.

SAS程序:

DATA NEW;

SET OLD;

Y=LOG(YI);

X=X1*X2;

RUN;

PROC PRINT DATA=NEW;

RUN;

例7在'E:\sjfx'下,有数据文件examp2_3.SAS7bdat,含有变量X1-X3,Y,要在此文件夹下建立新数据集NEW,并计算z=X1+X2.

程序:

LIBNAME SS'E:\sjfx';

DATA SS.NEW; /* 建立新数据集*/

SET SS.examp2_3;

Z= X1+X2;

W=X1*X2;

PROC PRINT DATA=SS.NEW;

RUN;

在SS逻辑库里有New数据集,在E:\sjfx下出现New数据文件.

练习调用数据集并进行某些计算,打印输出.

4. 逻辑语句与循环语句

(1)逻辑语句

SAS语言中逻辑语句的一般形式为

IF conditions THEN command;/*如果conditions满足,执行command ,其中conditions指数据集中某些变量的取值或数据行的序号(如用_N_=1表示第一行)*/

ELSE command; /* 否则执行command*/

另外,“ELSE?”也可用另一个语句“IF?THEN”代替.但当条件表达式较复杂时,使用“ELSE?”可以简化程序.如在“THEN”后面要执行多于一个SAS指令,将这些指令写在“DO”和“AND”之间

基本形式:

IF conditions THEN DO;

Command;

Command;

END;

(2)循环语句

SAS循环语句以“DO”开始,“END”结束,使用DO语句的主要形式有四种,如下:

DO语句的程序格式之一:

DO 变量=开始值TO 终值BY 步长值;

一些SAS语句;

END ;

如DO I = 1 TO 10;

DO I=1 TO k;

DO T=0 TO 10 BY 0.5;

又如,产生100个服从N(2,16)的随机数并输出结果到指定数据集,用下循环语句实现:

DATA RANDOM;

DO N=1TO100;

X=2+4*RANNOR(1234);

OUTPUT;

END;

PROC PRINT;

RUN;

结果输出:

Obs N X

1 1 7.6861

2 2 6.5242

3 3 7.6012

94 94 4.59539

95 95 -1.56298

96 96 -1.87059

97 97 7.47935

98 98 -6.73925

99 99 8.87999

100 100 1.62646

DO语句的程序格式之二:

DO UNTIL (条件表达式);

一些SAS语句;

N=0;

DO UNTIL (N=100); /*直到N=100为止*/

X=2+4*RANNOR(1234);

N=N+1;

OUTPUT;

END;

PROC PRINT;

RUN;

结果输出同上.

DO语句的程序格式之三:

DO WHILE (条件表达式);

一些SAS语句;

N=0;

DO WHILE (N<100); /* 当 N<100 不满足为止*/

X=2+4*RANNOR(1234);

N=N+1

OUTPUT;

END;

PROC PRINT;

RUN;

DO语句的程序格式之四:

IF条件表达式THEN DO ;

一些SAS语句;

END(与do对应);

DO WHILE 和DO UNTIL语句中的表达式是用括号括起来的.两种循环程序格式的区别是,对条件表达式的判断位置.DO WHILE是在循环体的开头,而DO UNTIL是在循环体的结束,也就是说DO UNTIL至少执行循环体中一些SAS语句一次.

例8 在统计研究中,经常需要用计算机进行Monte Carlo模拟.下面编写一个SAS程序,模拟“抛掷硬币1000次,记录并输出正面(Head)数和反面(Tail)数”的随机试验.

由于硬币均匀,即每次抛掷中出现正反面概率均为0.5,可用产生(0,1)内均匀分布随机数的方法实现.用HESADS,NTAILS和N分别表示正面数、反面数和总数

SAS程序:

DATA EXAMP8;

NHEADS=0; NTAILS=0; N=0;

DO UNTIL (N=1000); /* 可用“DO N=1 TO 1000;”或“DOWHILE(N<1000)”

*/

TOSS =RANUNI(-1); /* 产生(0,1)分布随机数函数中,Seed取-1,表示初值与

计算机内时钟有关,表示不同时刻执行此程序结果不同*/

IF TOSS >0.5THEN NHEADS=NHEADS+1;

ELSE NTAILS=NTAILS+1; /* 本行可用“IF TOSS<=0.5 THEN NTAILS=

NTALILS+1;代替”*/

N=N+1;

END;

FILE PRINT;

PUT'Number of Heads=' NHEADS; /* NHEADS 输出为Number of Heads*/ PUT'Number of Tails=' NTAILS;

RUN;

结果输出:

Number of Heads=525

Number of Tails=475

注:也可用中文输出,结果如下:

PUT'正面次数=' NHEADS;

PUT'反面次数=' NTAILS;

正面次数=492

反面次数=508

课堂总结:

建立SAS数据集

1.程序窗口建立;

2.利用外部文件建立;

3.调用已有SAS数据库文件建立数据集.

要求:掌握建立SAS数据集的方法

作业:1.建立一个数据库文件,要求:

(1)成员变量包括:ID(学号数值型2位)、NAME(姓名字符型,姓名之间有空格)、SEX(性别字符型)、ENGLISH(英语成绩整数)、MATH(数学成绩整数)(容量5);

(2)将文件打印输出,建永久数据集.

(3)删除数据第二行,产生新变量A VE(平均成绩)及观测值,打印输出新数据集.

2. 文本文件如E:\个人文件夹\a.txt,调用建同名数据集,存放此文件夹

SAS软件运用实验指导书

数据分析 实验指导书 理学院实验中心数学专业实验室编写

实验一SAS系统的使用 【实验类型】(验证性) 【实验学时】2学时 【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集 表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1)通过编辑程序将表1读入数据集sasuser.score; 2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75

3)将下面Excel表格中的数据导入SAS数据集work.gnp; name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53 新疆123.24 38 13.72 4.64 17.77 5.75 4)使用VIEWTABLE格式新建数据集earn,输入如表所示数据Year earn 1981 125000 1982 136000 1983 122350 1984 65200 1985 844600 1986 255000 1987 265000 1988 280000 1989 136000

SAS区间估计与假设检验实验报告

2014——2015学年第 1 学期 合肥学院数理系 实验报告 课程名称:统计软件选讲 实验项目:区间估计与假设检验 实验类别:综合性□设计性□验证性□√ 专业班级: 12级信息与计算科学 姓名:马坤鹏学号: 1207011017 实验地点:数理系数学模型实验室 实验时间: 2014.9.24 指导教师:段宝彬成绩:

一、实验目的 掌握使用SAS对总体参数进行区间估计与假设检验方法。 二、实验内容 1、用INSIGHT对总体参数进行区间估计与假设检验 2、用“分析家”对总体参数进行区间估计与假设检验 3、编程对总体参数进行区间估计与假设检验 三、实验步骤或源程序 1、生成来自标准正态总体的10000个随机数: (1) 求总体的平均值和方差的置信水平为90%的置信区间; (2) 改变随机数的个数,观察并总结样本均值、样本方差的变化以及总体均值和方差的置信区间的变化规律。 2、从某大学总数为500名学生的“数学”课程的考试成绩中,随机地抽取60名学生的考试成绩如表5-6(lx5-2.xls)所示: 表5-6 学生成绩 (1) 分别求500名学生平均成绩的置信水平为98%、90%和85%的置信区间,并观察置信水平与置信区间的关系。 (2) 分别求500名学生成绩的标准差的置信水平为98%和85%的置信区间。 3、装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录下各自的装配时间如表5-7(lx5-3.xls)所示: 表5-7 装配时间(单位:分钟) 设两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同(α = 0.05)?data my.five1; input m n$@@; cards; 31 m 34 m 29 m 32 m 35 m 38 m 34 m 30 m 29 m 32 m 31 m 26 m 26 n 24 n 28 n 29 n 30 n 29 n 32 n 26 n 31 n 29 n 32 n 28 n ; proc ttest h0 = 0alpha = 0.05data= my.five1; var m; class n; run;

应用多元统计分析SAS作业审批稿

应用多元统计分析S A S 作业 YKK standardization office【 YKK5AB- YKK08- YKK2C- YKK18】

5-9 设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据如表1。 表1 岩石化学成分的含量数据 (1)假定两类样本服从正态分布,使用广义平方距离判别法进行判别归类(先验概率取为相等,并假定两类样本的协方差阵相等); (2)今得一块标本,并测得其Cu,Ag,Bi的含量分别为2.95,2.15和1.54,试判断该标本是含矿还是不含矿? 问题求解 1 使用广义平方距离判别法对样本进行判别归类 用SAS软件中的DISCRIM过程进行判别归类。 SAS程序及结果如下。 data d59; input group x1-x3@@; cards; 1 2.58 0.9 0.95 1 2.9 1.23 1 1 3.55 1.15 1 1 2.35 1.15 0.79 1 3.54 1.85 0.79 1 2.7 2.23 1.3 1 2.7 1.7 0.48 2 2.25 1.98 1.06 2 2.16 1.8 1.06 2 2.3 3 1.7 4 1.1 2 1.96 1.48 1.04

2 1.94 1.4 1 2 3 1.3 1 2 2.78 1.7 1.48 ; proc print data =d59; run ; proc discrim data =d59 pool =yes distance list ; class group; var x1-x3; run ; 由输出结果可知,两总体间的广义平方距离为D 2=3.19774。还可知两个三元总体均值相等的检验结果:D =3.19774,F =3.10891,p =0.0756<0.10,故在显着性水平=0.10α时量总体的均值向量有显着差异,即认为讨论这两个三元总体的判别问题是有意义的。 线性判别函数为: 判别结果为含矿的6号样本错判为不含矿;不含矿的13号样本错判为含矿。 2 对给定样本判别归类 将Cu ,Ag ,Bi 的含量数值2.95、2.15、1.54分别代入线性判别函数得: 1244.674246.978882Y Y ==,。 贝叶斯判别的解{}***1, ,k D D D = 为 {}*|()(),,1, ,(1, ,)t t j D X Y X Y X j t j k t k =>≠==, 由于1244.6742246.97888Y Y =<=,因此待判的样品判为不含矿。 5-10 已知某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别为7,4,6;类外还有3个待判样品(所有观测数据见表2)。假定样本均来自正态总体。 表2 判别分类的数据

完整word版数据分析实验报告分析解析

实验课程:数据分析 信息与计算科学 业: 专 级: 班 号:学 姓名: 中北大学理学院.

实验一 SAS系统的使用 【实验目的】 了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 将SCORE数据集的内容复制到一个临时数据集test。 SCORE数据集 English Math Sex Chinese Name 91 90 f 85 Alice 95 Tom m 87 84 93 90 Jenny f 83 80 85 80 Mike m 84 85 89 m Fred 97 83 f 82 Kate 92 Alex 90 m 91 75 Cook m 78 76 82 f Bennie 79 84 85 Hellen f 74 84 90 82 Wincelet f 87 77 Butt m 81 79 86 85 Geoge m 82 89 Tod m 84 84 89 Chris f 84 87 86 65 f 87 Janet math的高低拆分到3个不同的数据集:SCORE2.将数据集中的记录按照math大于等于90的到good数据集,math在80到89之间的到normal数据集,math 在80以下的到bad数据集。 3.将3题中得到的good,normal,bad数据集合并。 【实验所使用的仪器设备与软件平台】SAS 【实验方法与步骤】 1: DATA SCORE; INPUT NAME $ Sex $ Math Chinese English; CARDS; 2

91 85 Alice f 90 84 Tom m 95 87 83 f 93 90 Jenny 80 80 85 Mike m 89 85 m Fred 84 82 83 Kate f 97 91 Alex m 92 90 76 Cook m 78 75 84 82 79 f Bennie 84 74 Hellen f 85 87 82 Wincelet f 90 79 Butt m 77 81 82 m 86 85 Geoge 84 89 84 Tod m 87 84 f Chris 89 87 Janet f 86 65 ; ; Run PROC PRINT DATA=SCORE; DATA test; SET SCORE; :2 good normal bad; DATA SCORE; SET; SELECT) output good; 90when(math>=) output normal; 80when(math>=&math<90) output bad; when(math<80; end; Run=good; DATA PRINT PROC=normal; DATA PRINT PROC=bad; DATA PRINT PROC :3 All; DATA good normal bad; SET=All; DATA PROC PRINT;Run 3 【实验结果】 结果一:

SAS编程基础

实验2 SAS编程基础 SAS语言和其它计算机语言一样,也有其专有的词汇(即关键字)和语法。关键字、名字、特殊字符和运算符等按照语法规则排列组成SAS语句,一个SAS程序由若干数据步、过程步组合而成,而每一个程序步通常由若干语句构成。SAS程序是在Editor窗口中进行编辑,提交运行后可以在Log窗口中显示有关信息和提示,在Output窗口显示运行的结果。 2.1 实验目的 通过实验了解SAS编程的基本概念,掌握SAS编程的基本方法,掌握SAS数据步对数据集的管理和对数据的预处理。 2.2 实验内容 一、建立逻辑库与数据集,包括逻辑库的建立、直接输入数据建立数据集与读取外部数据文件建立数据集。 二、数据文件的编辑与整理,包括数据集的横向合并与纵向合并、数据集内容的复制、变量的增加与筛选、数据集的拆分和数据的排序。 2.3 实验指导 一、建立逻辑库与数据集 1.建立逻辑库 【实验2-1】编程建立逻辑库。 (1) 首先在D盘创建一个文件夹,如D:\SAS_SHYAN\SAS数据集。 (2) 建立逻辑库mylib,编辑并运行下面程序语句即可。 libname mylib "D:\sas_shiyan\sas数据集"; 2.直接输入数据建立数据集 【实验2-2】将表2-1(sy2_2.xls)中的数据直接输入建立数据集sy2_2,并将其存入逻辑库mylib中。 表2-1 职工工资 编号 姓名 性别工作日期 职称 部门基本工资工龄工资奖金扣款 实发工资 1420 0 3003 王以平男1992-8-1 助工生产620300500

3004 林红女1993-8-1 助工供销620280500 200 12003005 吕兴良男1982-1-30 工程师技术1100500500 100 20003006 司马宇男1971-2-17 工人生产520720500 0 17403007 张学武男1967-10-9 工人保卫520800500 200 16203008 冯玉霞女1987-8-1 工程师生产1100400500 250 17503009 赵大强男1968-5-10 工人财务520780500 0 18003010 王萍 女 1987-8-1 工程师 技术 1100 400 500 100 1900 代码如下: data mylib.sy2_2; length gzrq $ 10; input bh $ xm $ xb $ gzrq $ zc $ bm $ jbgz glgz jj kk sfgz; label bh='编号' xm='姓名' xb='性别' gzrq='工作日期' zc='职称' bm='部门' jbgz='基本工资' glgz='工龄工资' jj='奖金' kk='扣款' sfgz='实发工资'; cards; 3003 王以平 男 1992-8-1 助工 生产620 300 500 0 1420 3004 林红 女 1993-8-1 助工 供销620 280 500 200 1200 3005 吕兴良 男 1982-1-30 工程师 技术 1100 500 500 100 2000 3006 司马宇 男 1971-2-17 工人 生产520 720 500 0 1740 3007 张学武 男 1967-10-9 工人 保卫520 800 500 200 1620 3008 冯玉霞 女 1987-8-1 工程师 生产1100 400 500 250 1750 3009 赵大强 男 1968-5-10 工人 财务520 780 500 0 1800 3010 王萍 女 1987-8-1 工程师 技术 1100 400 500 100 1900 ; RUN; 运行完成后,在逻辑库mylib 中双击数据集名sy2_2,可以查看结果如图2-1所示: 图2-1 数据集mylib.sy2_2 说明: (1) SAS 变量的基本类型有两种:数值型和字符型。数值型变量在数据集中的存贮一般使用8个字节。SAS 的字符型变量缺省的长度是8个英文字符,可以使用LENGTH 语句指定变量长度,LENGTH 语句一般应出现在定义变量的Input 语句之前,格式为: LENGTH 字符型变量名 $ 长度; 如: LENGTH gzrq $ 10; (2) 语句:

SAS作业(1)详解

SAS作业(1)详解 By 乔兴龙P57 13.下表分别给出两个文学家马克吐温(Mark Twain)的8篇小品文以及斯诺特格拉斯(Snodgrass)的10篇小品文中由3个字母组成的词的比例: 马克 0.225 0.262 0.217 0.240 0.230 0.229 0.235 0.217 吐温 斯诺 0.209 0.205 0.196 0.210 0.202 0.207 0.224 0.223 0.220 0.201 特格 拉斯 设两组数据分别来自正态总体,且两个总体方差相等,两个样本相互独立。问两个作家所写的小品文中包含由3个字母组成的词的比例是否有显著的差异(取α=)? 0.05 分析:检验是否有差异,即检验u1-u2=0,方差相等且未知,因此要用t检验法,置信区间a=0.05 操作: 在program editor 中输入 Data P59Q13; input x y @@; card; 0.225 0.209 0.262 0.205 0.217 0.196 0.240 0.210 0.230 0.202 0.229 0.207 0.235 0.224 0.217 0.223 . 0.220 . 0.201 proc print; run; 点击运行一次。 Solutions—analysis—analyst File—open by sas name—work—p59q13—OK Statistics—hypothesis tests—two sample t test for means 选中two variables,x—group 1,y—group 2,mean1-mean2=0,alternative选择第一个,test—confidence intervals选择interval,95.0% OK—OK 所得结果: Two Sample t-test for the Means of x and y 8 09:29 Wednesday, October 7, 2011 Sample Statistics

时间序列分析,sas各种模型,作业神器

实验一分析太阳黑子数序列 一、实验目的:了解时间序列分析的基本步骤,熟悉SAS/ETS软件使用方法。 二、实验内容:分析太阳黑子数序列。 三、实验要求:了解时间序列分析的基本步骤,注意各种语句的输出结果。 四、实验时间:2小时。 五、实验软件:SAS系统。 六、实验步骤 1、开机进入SAS系统。 2、创建名为exp1的SAS数据集,即在窗中输入下列语句: 3、保存此步骤中的程序,供以后分析使用(只需按工具条上的保存按钮然后填写完提问 后就可以把这段程序保存下来即可)。 4、绘数据与时间的关系图,初步识别序列,输入下列程序: ods html; ods listing close; 5、run;提交程序,在graph窗口中观察序列,可以看出此序列是均值平稳序列。

6、识别模型,输入如下程序。 7、提交程序,观察输出结果。初步识别序列为AR(2)模型。 8、估计和诊断。输入如下程序: 9、提交程序,观察输出结果。假设通过了白噪声检验,且模型合理,则进行预测。 10、进行预测,输入如下程序: 11、提交程序,观察输出结果。

12、退出SAS系统,关闭计算机。总程序: data exp1; infile "D:\"; input a1 @@;

year=intnx('year','1jan1742'd,_n_-1); format year year4.; ; proc print;run; ods html; ods listing close; proc gplot data=exp1 ; symbol i=spline v=dot h=1 cv=red ci=green w=1; plot a1*year/autovref lvref=2 cframe=yellow cvref=black ; title "太阳黑子数序列"; run; proc arima data=exp1; identify var=a1 nlag=24 minic p=(0:5) q=(0:5); estimate p=3; forecast lead=6 interval=year id=year out=out; run; proc print data=out; run; 选取拟合模型的规则: 1.模型显著有效(残差检验为白噪声)

抑郁(SDS)焦虑自评量表(SAS)_实验报告

一、实验目的 通过实验了解受试抑郁的主观感受、轻重程度及其在治疗中的变化,掌握个别施测的使用方法。掌握抑郁自评量表的原理、实施、记分与结果解释方法。 二、实验材料 大学生心理测验系统 三、实验步骤 3.1 进入大学生心理测验系统后再点击进入人格特点测评项目。 3.2 点击测试项目名称即抑郁自评量表(SDS),进入抑郁自评量表界面。 3.3输入被试信息,确定后桌面弹出测验指导与窗口,认真阅读指导语: ①在这个问卷测试当中有20个问题,请你依次回答这些问题,答案选项包括“没有或很少时间”、“少部分时间”、“相当多时间”和“绝大部分或全部时间”四个选项,每一测题只能选择一个答案; ②该问卷测试评定的是最近一周的实际感觉; ③本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间; ④有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择。 确定阅读完毕后开始测试。 3.4按照出现题目的先后顺序作答,直至答题完毕。 四、实验结果 4.1 受试信息 姓名:XXX 性别:女年龄:20 文化程度:本科测验耗时:00:00:43 4.2 受试结果 总粗分65 标准总分81.25 参考诊断:有(重度)抑郁症状 重点提示: 抑郁精神性,因子得分:6 抑郁躯体障碍,因子得分:27 抑郁精神运动性障碍,因子得分:6 抑郁心理障碍,因子得分:26 五、实验结果分析 该测试结果提示受试有重度抑郁的倾向,主要表现为: 情绪非常低落,感觉毫无生气,没有愉快的感觉,经常产生无助感或者绝望感,自怨自责。经常有活着太累,想解脱、出现消极的念头,还常哭泣或者整日愁眉苦脸,话语明显少,活动也少,兴趣缺乏,睡眠障碍明显,入睡困难或者早醒,性欲功能 基本没有。 六、讨论或思考 SDS为短程量表,操作方便,容易掌握,能有效地反映抑郁状态的有关症状及其严重程度和变化。SDS的评分不受年龄、性别、经济状况等因素影响,目前在国外已被广泛应用。

应用多元统计分析SAS作业

应用多元统计分析S A S作 业 Prepared on 22 November 2020

5-9 设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据如表1。 表1 岩石化学成分的含量数据 (1)假定两类样本服从正态分布,使用广义平方距离判别法进行判别归类(先验概率取为相等,并假定两类样本的协方差阵相等); (2)今得一块标本,并测得其Cu,Ag,Bi的含量分别为,和,试判断该标本是含矿还是不含矿 问题求解 1 使用广义平方距离判别法对样本进行判别归类 用SAS软件中的DISCRIM过程进行判别归类。 SAS程序及结果如下。 data d59; input group x1-x3@@; cards; 1 1 1 1 1 1 1 1 1 2 2

2 2 2 1 2 3 1 2 ; proc print data =d59; run ; proc discrim data =d59 pool =yes distance list ; class group; var x1-x3; run ; 由输出结果可知,两总体间的广义平方距离为D 2=。还可知两个三元总体均值相等的检验结果:D =,F =,p =<,故在显着性水平=0.10α时量总体的均值向量有显着差异,即认为讨论这两个三元总体的判别问题是有意义的。 线性判别函数为: 判别结果为含矿的6号样本错判为不含矿;不含矿的13号样本错判为含矿。 2 对给定样本判别归类 将Cu ,Ag ,Bi 的含量数值、、分别代入线性判别函数得: 1244.674246.978882Y Y ==,。 贝叶斯判别的解{}***1, ,k D D D = 为 {}*|()(),,1, ,(1, ,)t t j D X Y X Y X j t j k t k =>≠==, 由于1244.6742246.97888Y Y =<=,因此待判的样品判为不含矿。 5-10 已知某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别为7,4,6;类外还有3个待判样品(所有观测数据见表2)。假定样本均来自正态总体。 表2 判别分类的数据

数据分析SAS报告

90-08年人民消费能力分析 一、问题提出 改革开放以来中国经济飞速发展,GDP连续超过德国、日本,现以成为世界上第二大经济体,人民生活水平不断提高,但受金融危机的影响,近几年来物价持续上涨,本月CPI创历史新高,人民的消费能力是否随着GDP的增加而增加呢?本文以中国经济年鉴中的“人民消费支出构成”的数据为依据利用统计软件SAS 进行了相关分析。数据如下 食品衣着居住家庭设备用品及服务交通通讯文教娱乐用品及服务医疗保健其他商品及服务 1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900 二、问题分析 1、通过对消费种类进行主成分分析判断人民的消费情况。 2、对主成分标准化后在分析各年的消费能力排名。 三、解决问题 3.1 SAS程序: data examp4_4; input id x1-x8; cards; 1990 58.8000 7.7700 17.3400 5.2900 1.4400 5.3700 3.2500 0.7400 1995 58.6200 6.8500 13.9100 5.2300 2.5800 7.8100 3.2400 1.7600 2000 49.1300 5.7500 15.4700 4.5200 5.5800 11.1800 5.2400 3.1400 2005 45.4800 5.8100 14.4900 4.3600 9.5900 11.5600 6.5800 2.1300 2007 43.0800 6.0000 17.8000 4.6300 10.1900 9.4800 6.5200 2.3000 2008 43.6700 5.7900 18.5400 4.7500 9.8400 8.5900 6.7200 2.0900 ; run; proc corr cov nosimple data=examp4_4; var x1-x8; run; proc princomp data=examp4_4 out=bb; var x1-x8; run; data score1; /*以下程序是对各年按第一主成分得分进行排名并打印结果*/ set bb; keep id prin1;

SAS作业

1. Homework1数据集是我国农产品进口排名前10的国家,请对进口额进行描述性统计分析(要求计算均值,标准差,最大,最小,中位数)。 程序及运行结果: /*读入数据文件*/ procimport datafile='C:\Users\Administer\Desktop\SAS\第一次作业 \Homework1.csv'out=homework1; run; procprint data=homework1; run; 上述读取数据的运行结果如下: /*描述性统计*/ procmeans data=homework1 meanstdmaxminmedian ; var VAR3; outputout=result; run; means过程指定输出平均值,标准差,最大值,最小值和中位数的描述性统计结果如下图。

2. Homework2 数据集是对成人每天摄入蛋白质含量的调查数据,利用univariate 过程对调查数据进行描述分析,进一步按照性别分组分析。 (1)读入数据 procimport datafile='C:\Users\Administer\Desktop\SAS\第一次作业 \Homework2.txt'out=homework2; run; procprint data=homework2; run; 打印数据: (2)利用univariate过程对调查数据进行描述分析 procunivariate data=homework2; var VAR3 VAR4 ; run; VAR3变量运行结果(VAR4同理,结果不再列出)如下。其中位置检验表明t检验,符号检验和符号秩和检验都显著,即拒绝原假设。

多元统计分析实验报告,计算协方差矩阵,相关矩阵,SAS

院系:数学与统计学学院 专业:__统计学 年级:2009 级 课程名称:统计分析 ____ 学号:____________ 姓名:_________________ 指导教师:____________ 2012年4月28日 (一)实验名称 1. 编程计算样本协方差矩阵和相关系数矩阵;

2. 多元方差分析MANOVA。 (二)实验目的 1. 学习编制sas程序计算样本协方差矩阵和相关系数矩阵; 2. 对数据进行多元方差分析。 (三)实验数据 第一题: 第二题:

(四)实验内容 1. 打开SAS软件并导入数据; 2. 编制程序计算样本协方差矩阵和相关系数矩阵; 3. 编制sas程序对数据进行多元方差分析; 4. 根据实验结果解决问题,并撰写实验报告; (五)实验体会(结论、评价与建议等) 第一题: 程序如下: proc corr data=sasuser.sha n cov; proc corr data=sasuser.sha n no simple cov; with x3 x4; partial x1 x2; run; 结果如下: (1)协方差矩阵 $AS亲坯 曲;15 Friday, Apr: I SB,沙DO COUR过程 x4 目由度=30 Xi x2x3x4x5X? -10.I9B4944-0.45E2GJ5I.3347097-G.1193E48-£0.e75?GS

-ID. 188494669,36&Q3?9-7.22IO&OS1J5692043I5.49ee^91S.Oa97SM -8.45S2645■7,221050829.S78&S46-6.372E47I-15.3084183-21.7352376-11.5674785 1.3841097 1.G5S2M7t.3726171IJ24?17B 4.e093011 4.4C12473 2.B747CM -G. I1S3S49 1.GS92043-is.soul aa 4.B09B01I68.7978495劣』S670971S.57ai1B3 -IH.05l6l?a15.43S6569-J1.73S2376孔耶124TB27.0387097105.103225&S7.3505S7E: -2D K5752??319-11337204-1L55M7S52r9747?3i19,573118337.3S0&87E33.3SQ6452 (2) 相关系数矩阵 Pearson相关系数” N =引 当HO: Rho=0 时.Prob > |r| Xi Xi xl 1.QQ000 x2 -C.23954 0.2061 x3 -0,30459 0.0957 x4 0.18975 Q.3092 x5 '0.14157 0.4475 x6 -0.83787 0.0630 -0.49292 0.0150 x2-0.23354 1.00000-0.162750.143510.022700.181520.24438 x20.20C10.31:1?0.441?0.90350.32640.1761 x3-0.30459-0.16275 1.00000-0.06219-0.34641-0.^797-0.23674 x30.095?0.381?<.00010.0563o.oses0 JS97 x40.1S8760.14351-0.86219L000000.400540,313650.22610 x40.30920.4412<.0001 D.02EG Q.085S0.2213 x5-0J 41570.02270-0.946410.40054 1.000000.317370.26750 x50.4J750.90350.0G68Q.025&0.08130 + 1620 x6-0.33?e?0.1S162-0.397970.813650.31787LOOOOO0.82976 x60.0S300.32840.02660.08580.0813C0001辺-0.432920.24938-0.288740.22810 D.267600.92976 1.00000 x70,01500J7610.19970.22130JG20<.0001 第二题: 程序如下: proc anova data=sasuser.hua ng; class kind; model x1-x4=k ind; manova h=k ind; run; 结果如下: (1)分组水平信息 The ANNA Procedure Cla^s Level Informat ion Class Level?Values kind 3 123 Number of observatIons CO (2) x1、x2、x3、x4的方差分析

SAS实训报告心得

通过这次的课程设计,让我对SAS有了进一步的的了解,在设计过程中,虽然有的例题已经做过了,但还是会遇到些问题,一个不显眼的小字符错了,程序就会一遍遍的报错,而且错误容易被忽视,修改时不容易发现。所以我们平常思考问题做事情都要认真严谨,思考全面。 实训不仅可以巩固我们以前所学过的知识,而且学到了很多在书本上所没有学到过的知识。这周不仅对数据集的创建,时间序列的平稳性分析和纯随机性检验有了更深刻的认识,而且更能在小细节中多上心。实践出真知,平常所学的理论只有通过实践,自己动手才能真正感觉到知识的乐趣。实训不仅能培养我们独立思考的能力,动手操作能力,在其他方面的我们的能力也能有所提高。 学习最怕的就是缺少兴趣,有了兴趣和好奇心,做什么事都不会感到累。“知之者不如好之者,好之者不如乐之者。”这句话为我们揭示了一个怎样才能取得好的学习效果的秘诀,那就是对学习的热爱。不同的人在同样的学习环境下学习效果不一样,自身的素质固然是一个方面,更加重要的还在于学习者对学习内容的态度或感觉。正所谓“兴趣是最好的老师”,当你对一门科目产生了兴趣之后,自然会学得比别人好。所以,无论以后学习什么,都要带着愉悦的心情去学习。 实际操作过程中我找出自身存在的不足,对今后的会计学习有了一个更为明确的方向和目标。虽说一周的时间很短,但其中的每一天都使我收获很大、受益匪浅,它不但极大地加深了我对一些知识的理解,从而真正做到了理论联系实际;更让我学到了很多之前在课堂上所根本没法学到的东西,这对于我的学业,乃至我以后人生的影响无疑都是极其深远的。 我希望以后能够有更多的这种实训的机会,这一周感觉过的很充实,我也真正的融入到了学习当中去,别无他思,一切都还不错,感觉非常好。我达到了我自己的预期目标和要求,受益匪浅。

抑郁(SDS)焦虑自评量表(SAS)_实验报告

抑郁自评量表(SDS)实验报告 一、实验目的 通过实验了解受试抑郁的主观感受、轻重程度及其在治疗中的变化,掌握个别施测的使用方法。掌握抑郁自评量表的原理、实施、记分与结果解释方法。 二、实验材料 大学生心理测验系统 三、实验步骤 3.1 进入大学生心理测验系统后再点击进入人格特点测评项目。 3.2 点击测试项目名称即抑郁自评量表(SDS),进入抑郁自评量表界面。 3.3 输入被试信息,确定后桌面弹出测验指导与窗口,认真阅读指导语: ①在这个问卷测试当中有20个问题,请你依次回答这些问题,答案选项包括“没有或很少时间”、“少部分时间”、“相当多时间”和“绝大部分或全部时间”四个选项,每一测题只能选择一个答案; ②该问卷测试评定的是最近一周的实际感觉; ③本测验不计时间,但应凭自己的直觉反应进行作答,不要迟疑不决,拖延时间; ④有些题目你可能从未思考过,或者感到不太容易回答。对于这样的题目,同样要求你做出一种倾向性的选择。 确定阅读完毕后开始测试。 3.4 按照出现题目的先后顺序作答,直至答题完毕。 四、实验结果 4.1 受试信息 姓名:XXX性别:女年龄: 2 0 文化程度:本科测验耗时:00:00:43 4.2 受试结果 总粗分65 标准总分81.25 参考诊断:有(重度)抑郁症状 重点提示: 抑郁精神性,因子得分:6 抑郁躯体障碍,因子得分:27 抑郁精神运动性障碍,因子得分:6 抑郁心理障碍,因子得分:26 五、实验结果分析 该测试结果提示受试有重度抑郁的倾向,主要表现为: 情绪非常低落,感觉毫无生气,没有愉快的感觉,经常产生无助感或者绝望感,自怨自责。经常有活着太累,想解脱、出现消极的念头,还常哭泣或者整日愁眉苦脸,话语明显少,活动也少,兴趣缺乏,睡眠障碍明显,入睡困难或者早醒,性欲功能基本没有。 六、讨论或思考

sas第一次作业

SAS 第二次作业 光科1201 梁修业 7-4-2一种合金在某种添加剂的不同浓度之下,各做三次实验,得数据如下表: 浓度x 10.0 15.0 20.0 25.0 30.0 抗压强度y 25.2 27.3 28.7 29.8 31.1 27.8 31.2 32.6 29.7 31.7 30.1 32.3 29.4 30.8 32.8 (1)作散点图; (2)以模型y=b 0+b1x+b2x+ ε ,2~0N εσ(,),拟合数据,其中b0,b1,b2,2σ与x 无 关,求回归方程2012????y b b x b x =++。 解:(1) (2)将x 看成x1,x^2 看成x2,在表格中增加变量x2,此题即转化为多元线性回归 所以2?19.0333 1.00860.0204y x x =+-。

7-4-3对§7.4例3的钢包容积y和使用次数x的数据,假定 b x y ae-=。 (1)画散点图; (2)试分别作变量替换,化非线性回归模型为线性回归模型并讨论回归方程的显著性。 解: (1) (2)利用Insight模块求解。增加两个变量,u=lny,v=-1/x, 说明:方程为 1 ? ln 4.71410.0903() y x =+-,方差分析表中p-值小于0.0001,说明 了回归方程高度显著。

7-4-4槲寄生是一种寄生在大树上部树枝上的寄生植物,它喜欢寄生在年轻的大树上,下表给出在一定条件下完成的实验中采集的数据。 x 3 4 9 15 40 y 28 33 22 10 36 24 15 22 10 6 14 9 1 1 (1)作出(x i ,y i )的散点图, (2)令z i =lny i ,作出(x i ,z i )的散点图 (3)以模型2 ,ln~(0,) bx y ae N εεσ =拟合数据,其中a,b,2σ与x无关,试求曲线回归方程?bx ? ?y=ae。 解:(1) (2)Insight模块。增加变量z=lny

SAS作业

使用SAS软件完成下列任务: 1.对数据集sashelp.class中的身高和体重进行描述性统计分析,计算基本统计量,并给出分析结论。 身高: 结论:身高数据共19个,最大值为72,最小值为51.3,相差20.7。55-65之间的数据最多。中位数为62.8,平均数为62.3。数据的标准差为5.1271,方差为26.2869

体重: 结论:体重数据共19个,最大值为150,最小值为50,相差99.5。中位数为99.5,平均数为100.026。数据的标准差为22.7739,方差为518.652 2.对数据集中的男生和女生分别进行问题1中的基本统计量的计算,并写出结论 身高:

结论:男生身高数据共10个,平均数为63.91。数据的标准差为4.9379,方差为24.3832,对男生身高95%的可能集中于60.3776到67.4424之间。 女生身高数据共9个,平均数为60.5889。数据的标准差为5.0183,方差为25.1836,对女生身高预测95%的可能集中于56.7315到64.4463之间。 男生的身高相较于女生而言更集中。男生身高也普遍比女生高一些。 体重: 结论:男生体重数据共10个,平均数为108.95。数据的标准差为22.7272,方差为516.525,对男生身高95%的可能集中于92.692到125.208之间。 女生体重数据共9个,平均数为90.1111。数据的标准差为19.3839,方差为375.7361,对女生身高预测95%的可能集中于75.2113到105.0109之间。 女生的体重相较于男生而言更集中。女生体重也普遍比男生轻一些。

应用多元统计分析SAS作业第三章

3-8假定人体尺寸有这样的一般规律,身高(X 1),胸围(X 2)和上半臂围(X 3)的平均尺寸比例是6:4:1,假设()()1,,X n αα=L 为来自总体()123=,,X X X X '的随机样本,并设()~,X N μ∑。试利用表3.4中男婴这一数据来检验其身高、胸围和上半臂围这三个尺寸变量是否符合这一规律(写出假设H 0,并导出检验统计量)。 解:设32,~(,),~(,)Y CX X N Y N C C C μμ'=∑∑。 121231233106,,,,,014C X X X μμμμμμμ??-?? ? == ? ?-?? ? ??其中,分别为 的样本均值。则检验三个变量是否符合规律的假设为 0212:,:H C O H C O μμ=≠。 检验统计量为 2 1(1)1~(1,1) (3,6)(1)(1) n p F T F p n p p n n p ---+= --+==--, 由样本值计算得:=(82,60.2,14.5)X ',及 15840.2 2.5=40.215.86 6.552.5 6.559.5A ?? ? ? ??? , 2-1(1)()()()=47.1434T n n CX CAC CX ''=-,

221(1)12 =18.8574(1)(1)5 n p F T T n p ---+= ?=--, 对给定显著性水平=0.05α,利用软件SAS9.3进行检验时,首先计算p 值: p =P {F ≥18.8574}=0.0091948。 因为p 值=0.0091948<0.05,故否定0H ,即认为这组男婴数据与人类的一般规律不一致。在这种情况下,可能犯第一类错误·且犯第一类错误的概率为0.05。 SAS 程序及结果如下: prociml ; n=6;p=3; x={7860.616.5, 7658.112.5, 9263.214.5, 815914, 8160.815.5, 8459.514 }; m0={00,00}; c={10 -6,01 -4}; ln={[6]1}; x0=(ln*x)`/n; print x0; mm=i(6)-j(6,6,1)/n; a=x`*mm*x; a1=inv(c*a*c`); a2=c*x0; dd=a2`*a1*a2; d2=dd*(n-1); t2=n*d2; f=(n+1-p)*t2/((n-1)*(p-1)); print x0 a d2 t2 f; p0=1-probf(f,p-1,n-p+1); fa=finv(0.95,2,4); print p0; run ;

相关文档
最新文档