SPSS复习知识点及题目

SPSS复习知识点及题目
SPSS复习知识点及题目

教育统计与测量(SPSS)复习

第一章:概述

1.什么是信息?

简单地讲,通过信息,可以告诉我们某件事情,可以使我们增加一定的知识。英语中的信息是“information”,表示信息可以让受者产生某种形式的变化,这种变化可以让受者从认识上的不完全、不理解、不确定变为完全、理解和确定。

信息论的奠基者香农将信息定义为熵的减少,即信息可以消除人们对事物认识的不确定性,并将消除不确定程度的多少作为信息量的量度。

信息的价值因人而异。所谓有用的信息,因人而异。是否是信息,不是由传者,而是由受者所决定。2.教育信息数量化的特点

表示教育信息的数量与各种物理测量的数量有着明显的不同,在教育信息的统计处理中,应根据教育信息数量化的方法、特点不同,决定对这种信息进行统计处理的具体方法。这是进行教育信息处理的重要关键。3.教育信息数量化的尺度

(1)名义尺度(nominal scale) :名义尺度的数值仅具符号的意义。名义尺度的数字多用于表示不同的数别,它为教育信息的表示,存贮带来了很大的方便。

(2)序数尺度(ordinal scale) :序数尺度的数字多用于表示某些现象的排列顺序,可比较其大小,但不能进行四则运算,所以对这类数字的数值群的处理较多。

(3)距离尺度(interval scale,equal unit scale):距离尺度又称间隔尺度,是指数值间的距离(间隔),具有加法性。距离尺度要求具有等价的单位,但不要求确定的零点位置。对距离尺度的数字可以计算算术平均值、计算标准差,求相关系数等各种统计处理。

(4)比例尺度(ratio scale) :比例尺度是一种具有绝对零度的距离尺度值。表示身长、体重的数值是比例尺度值。对比例尺度的数字可进行各种统计处理。

4.数据的类型

(1)定类数据(也称名义级数据),是数据的最低级。(性别、编号)

(2)定序数据(也称序次级数据),是数据的中间级。(名次、优秀良好及格、有顺序的)

(3)定距数据(也称间距级数据),是具有一定单位的实际测量值。(可以比较距离,可以进行平均值、标准差等运算,但不能进行加减乘除)

(4)定比数据(也称比率数据),是数据的最高等级。(测验成绩、身高、体重等,可以进行各种处理)5.描述统计

对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。其目的在于将大量零散的、杂乱无序的数字资料进行整理、归纳、减缩、概括,使事物的全貌及其分布特征清晰、明确地显现出来。

例如描述学业考试中全校或班级的考试状况(平均成绩)、描述学生的升学率、及格率或优秀率等。6.推断统计

根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。其目的在于根据已知的情况,在一定概率意义上估计、推断未知的情况。

例如随机抽取某校若干名学生的考试成绩,推断该校学生成绩与全市该类学生考试成绩的差异性。

7.教育统计中几个基本概念

(1)随机现象与随机变量

随机现象是一种不确定性现象。如考试、心理测验等。存在随机误差。我们把具有变化规律的表示随机现象各种结果的变量称为随机变量。如学生的身高、体重、性别、智商、成绩等等。随机变量具有离散性、变异性与规律性等特点。

(2)总体和个体

总体:所研究对象的全体称为总体(或母体)。

个体:组成总体的元素称为个体。在一个总体中,若个体的数目是有限的,则该总体称为有限总体;若个体的数目是无限的,则该总体称为无限总体。

(3)样本:样本是从总体中抽取的作为观察对象的一部分个体。

样本中包含的个体数目称为样本的容量,一般用n表示。样本中个体数目大于30一般称为大样本,等于或小于30称为小样本。

(4)样本上的数字特征是统计量。也就是说,根据实得的数据所计算出的能够描述这组数据各种特征的数量是统计量。

(5)总体上的各种数字特征是参数。也即反映总体上各种特征的数量参数。在进行统计推断时,就是根据样本统计量来推断总体相应的参数。

8.常用统计量

(1)集中量数:代表一组数据典型水平或集中趋势的量。常用的集中量有算术平均数、中位数(首先将数据依其取值大小排列成序,然后找出位于中间的那个数,就是中位数。有两种情况:1.数据个数是奇数的情况。则取序列为第(N+1)/2的那个数为中位数。2.数据个数是偶数的情况。则取序列为第N/2与第(N/2)+1个这两个数据的均数为中位数)、众数(出现频数最多的数)等。

(2)差异量数:代表一组数据离散程度、变异程度的量。常用的差异量指标有全距(一组数中最大值与最小值之差)、四分位距、百分位距、平均差、方差、标准差(标准差的值越大,表明这组数据的离散程度越大,即数据越参差不齐,分布范围越广)、差异系数等。

区别:集中量数是指量尺上的一个点,差异量数是量尺上的一段距离(离中趋势)

9.相关系数

相关系数:用于描述两个或多个变量间关联程度的量。两变量之间相关密切程度的数字指标[-1,1]。

方向:正相关(正的话);负相关(负的话);零相关0

相关程度:完全正相关1;完全负相关-1;零相关

10.教育统计的常见问题类型及统计方法

(1)对采集数据的一般性统计,如频数、频率、均值、方差等;(基本统计分析描述统计中的)

(2)两个总体之间某类特征数据的差异显著性;(定性数据:卡方检验;定量数据:正态分布的用T检验,非正态分布的用非参数检验。)

(3)多个总体之间某类特征数据的差异显著性;(定性数据:卡方检验;定量数据:正态分布的用方差分析,非正态分布的用非参数检验。)

(4)一个或多个因素对结果影响的显著性;(正态分布:方差分析;非正态分布:非参数检验)

(5)两个特征变量数据的相关性大小;(定性数据:卡方检验;定量数据:相关分析)

(6)某变量是否服从特定分布;(非参数检验)

(7)如何将多个研究对象进行分类;(聚类分析)

(8)如何将多个指标描述的对象简化成少量指标描述;(因子分析与主成分分析)

(9)如何将多个不同量纲指标描述的研究对象进行综合排序。(因子分析和主成分分析)

11.T检验与方差分析有哪些相同于不同的地方?

相同:都是对组间的差异性进行检验。前提都是:正态性,方差齐次性,独立性

不同:T检验用于比较两组数据之间的差异,T检验属于均值分析,它是用来检验两类母体均值是否相等。

均值分析是来考察不同样本之间是否存在差异,而方差分析用于比较多组数据之间的差异,评估不同样本之间的差异是否由某个因素起主要作用。T检验假设:H0: μ0=μ1 H1: μ0≠μ1;方差分析假设:假设:H0: μ0=μ1=……H1: μ0,μ1,……不全相等。

12.SPSS主界面有两个:一个是数据编辑窗口(数据视图和变量视图),另一个是SPSS输出窗口。

13.变量:变量名是变量的名称,由用户自己来命名,对每一个数据项确立一个变量名;变量类型有数值型、日期型、字符串型等8种类型;变量长度是指设置变量的长度,但当变量为日期型时无效;变量标签是对变量名的进一步描述,变量名不能超过8个字符,但变量标签可以长达120个字符,且可以显示大小写,需要时可以用变量标签对变量名的含义加以解释;变量值标签是对变量的每一个可能取值的进一步描述,当变量是定类或定序变量时非常有用,比如对于文化程度为高中、专科、本科可以用1、2、3来分别代表这3个层次;缺失值用于缺失值的定义,缺失值有系统缺失值和用户缺失值两类;显示宽度表示输入变量的显示宽度,默认为8;对齐方式包括左对齐、中间对齐和右对齐;变量的测试尺度按测量精度可分为定类变量、定序变量和定距变量。

第二章:相关分析

1.积差相关分析

当两个变量都是正态连续变量,而且两者之间呈线性关系时,表示这两个变量间的相关称为积差相关,积差相关又称积矩相关,也称皮尔逊相关。如都呈正态分布的且以百分制表示的语文与数学成绩之间的相关关系可用积差相关来表示它们的变化关系。

2.等级相关分析

等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。

?斯皮尔曼等级相关

当两个变量值以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关,称为等级相关。

根据某种标准对某项成绩所评定的等级,或按某种指标的优劣程度所排列的名次等,均属于等级次序性分数。

?肯德尔和谐系数

当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度(即相关)的量,称为肯德尔和谐系数。它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。

3.二列相关分析

质与量的相关是指一个变量为质,另一个变量为量,这两个变量之间的相关。如智商、学科分数、身高、体重是表现为量的变量,男与女、优与劣、及格与不及格等是表现为质的变量。质与量的相关主要包括二列相关、点二列相关、多系列相关。

?二列相关

当两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量。如及格与不及格、好与差、通过与没通过等。样本n>80。

第三章:参数估计与假设检验(单样本T检验、独立样本T检验、配对样本T检验、单因素方差分析)P109—116

显著性水平,是指估计总体参数落在某一区间时,可能犯错误的概率。

一般取0.05或0.01。0.95的置信区间是指总体参数落在该区间之内,估计正确的概率为95%,而出现错误的概率为5%。在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。%时出现说明连这么小的概率都出现,这个问题是存在的。

第四章:方差分析

1.方差分析的三条假设

?总体分布的正态性。方差分析与Z检验和T检验一样,也要求样本必须来自正态分布的总体。

?各个实验组的方差齐性。方差分析要求各总体的方差或标准差相同。因此,方差分析前需对各样本的方

差做一致性检验,称方差齐性检验,只有满足了方差齐性的条件才可做方差分析。

?变异具有加可性。方差分析是将事物的总变异分解为各个不同变异来源,分解后的各部分变异是相互独

立,相加后又构成总变异。

2.如何方差分析的表

第五章:项目分析

1.项目分析的目的:求出问卷个别题项的临界比率值—CR值,了解题目的分辨度,将未达显著水准的题项删除。

2.项目分析的基本步骤:

(1)量表题项的反向计分(量表中如无反向题,此步骤可以省略,但是只要有反向题就要进行反向计分)。(2)求出量表的总分。

(3)量表总分高低排列。

(4)找出高低分组上下27%处的分数。

(5)依临界分数将观察值在量表中之得分分成高低二组。

(6)以独立样本T检验二组在每个题项的差异。(高分组与低分组)

(7)将T检验结果未达显著性的题项删除。(差异大的,说明题目有意义,差异小的,说明题目意义不大)第六章:因素分析

1.因素分析的目的

?通过寻找或确定几个较少的“假想”因子来反映多个观测变量中蕴含的大部分信息,从而浓缩或化简观测数

据。

浓缩后的因子代表了数据间的基本结构,通过得到的因子估计值使研究者更方便地掌握数据的本质特质以及因子和观测变量之间的关系。

2.用什么方法进行因素分析

1.计算变量间相关矩阵或共变量矩阵。

2.估计因素负荷量。(用主成分分析法)

3.决定转轴方法。(用最大变异法)

4.决定因素与命名。

1.分析/降维/因子分析…

2.将项目分析中鉴别度达显著性的题项选人右边“变量”下的空框中。

3.单击描述,因子分析:描述统计”窗口中勾选“原始分析结果(I)”和“KMO和Bartlett的球形度检验(K)”

4.单击抽取,在“因子分析:抽取”窗口中设置

5单击旋转,在“因子分析:旋转口中设置

6.单击得分,在“因子分析:因子得分”窗口中设置

7.单击选项,在“因子分析:选项”窗口中选择取消小系数等。

第八章:卡方检验

1.数据要加权个案

2.结果分析

spss复习整理讲课教案

一、单项选择题:(本大题小题,1 分/每小题,共分) 1.SPSS 的数据文件后缀名是: (A) .sav 2. 对数据的各种统计处理,SPSS是在下面哪一个选项中进行: (A) 数据编辑窗口; 3. 在SPSS中,下面哪一个不是SPSS的运行方式 (A) 输入运行方式; 4. 下面哪一个选项不属于SPSS的数据分析步骤: (D)数据扩展; 5. 在SPSS中,下面哪一个选项不属于对变量(列)的描述: (B) 变量名称大小; 6. 在SPSS的定义中,下面哪一个变量名的定义是错误的: (D)A_BFG_ ;首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。 7. 在SPSS的定义中,下面哪一个变量名的定义是错误的: (A)AND ;SPSS有默认的变量名,以字母"VAR开头,后面补足5位数字,如VAR00001 VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY、AND、NOT、OR等。 8. 在SPSS数据文件中,下面那一项不属于数据的结构: (D)数据值; 9. 在SPSS数据文件中,下面那一项属于数据的内容: (D)数据值; 10. 通常来说,发放了900份问卷,可直接得到的有效问卷有800份,贝U SPSS所建立的相关数据文件中的行数为 (D)800; 11. 下面那一项不属于SPSS的基本变量类型: (D)整数型; 12. 当在SPSS数据文件中输入变量为“职工姓名”,则应选择的变量类型是: (B) 字符串型; 13. 当在SPSS数据文件中输入变量为“职工工资数”,则应选择的变量类型是: (A) 数值型; 13. 当在SPSS数据文件中输入变量为“公司成立日期”,则应选择的变量类型是: (C) 日期型; 14. 在SPSS的数据结构中,下面那一项不是“缺失数据”的定义: (D) 数据不是科学计数法; 15. 统计学依据变量的计量尺度将变量分为三类,以下哪一类不属于这三类: (D)科学计数类型; 16. 在统计学中,变量“身高”属于计量尺度中的: (A) 数值型变量;身高(定距)、优良中差(定序)、性别(定类) 17. 在统计学中,将变量“年龄”分为“老年”、“中年”、“青年”三个取值,分别用1、2、3 表示,则变量“年龄”属于计量尺度中的: (B) 定序型变量; 18. 在统计学中,将变量“性别”分为“男”、“女”、两个取值,分别用1、2表示,则变量 “性别”属于计量尺度中的: (C) 定类型变量; 19. 下面哪一个选项不能被SPSS系统正常打开: (C) 文本文件格式; 20. 下面哪一个选项不能被SPSS系统正常打开: (D) .exe ; 21. 在SPSS数据编辑窗口中,需要定义变量的数据结构,以下哪一项不属于变量的数据结构: (D) 变量值;

spss练习题及简 答

SPSS练习题 1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。先排序data---sort cases再合并data---merge files 2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。转换Data---transpose,输题目 3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。选取数据data---select cases 4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重排序。排序data---sort cases一个一个选,加 5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。计算transform---count按个输,把所有课程选取,define设区间,再排序 6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。描述性统计,先转换Data---transpose学号放下面,全部课程(poli到his)放上面,ok,analyze---descriptive statistics---descriptives,全选,options。先拆分data---split file 按性别拆分,analyze---descriptive statistics---descriptives全选所有课程options---mean 7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。数据分组Transform---recode---下面一个,输名字,change,old,range,new value---add 挨个输,从小加到大,等距 8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。(计算transform---count或)选取data---select cases 9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。Analyze--- descriptive statistics---frequencies 10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。An DS d Analyze---Descriptive Statistics---Descriptives,选择存款金额到Variable(s)中。按Option,然后选择Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variable

spss练习题

spss练习题 1、设有13例健康人,11例克山病人的血磷测定值(mg%)如下表所示,问克山 病人的血磷是否高于健康者, 健康者 1.67 1.98 1.98 2.33 2.34 2.50 3.60 3.73 4.14 4.17 4.57 4.82 5.78 患者 2.60 3.24 3.73 3.73 4.32 4.73 5.18 5.58 5.78 6.40 6.53 1、计算二组的均数、中位数、标准差、方差、P5 P95的值 2、请判断二组数据的分布 2、请进行统计学检验 2. 频数表资料,或等级资料,的两样本比较 20名正常人和32名铅作业工人尿棕色素定性检查结果见下表。问铅作业工人 尿棕色素是否高于正常人, 人数秩和秩次结果平均秩次正常人铅作业工人合计范围正常人铅作 业工人 ,1, ,6, ,5, (2) (3) (4) (7)=(2)(6) (8)=(3)(6) - 18 8 26 1-26 13.5 243 108 , 2 10 12 27-38 32.5 65 325 ++ 0 7 7 39-45 42.0 0 294 +++ 0 3 3 46-48 47.0 0 141 ++++ 0 4 4 49-52 50.5 0 202 合计n=20 n=32 52 - - T=308 T=1070 1212 3 .肺结核及结核性胸膜炎各5例的血沉(一小时)值如下表,问两者的差别显 著否, 肺结核 12 20 30 8 15 结核性胸膜炎 80 50 30 30 70

(请注意,两组病人的个体差异差别大否即方差齐否,试用一般的t检验与将各原始数据化成常用对数(定值部可取三位小数)后作t检验。将结果比较一下,是否一致,此资料应采取哪一种方法处理为妥, 4(为了研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例, 2分别测定其抗凝血酶活力(mm),结果如下: 新药组:126 125 136 128 123 138 142 116 110 108 115 140 对照组:162 172 177 170 175 152 157 159 160 162 5、某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围神经麻痹的疗效,资料见表4-7,问三种疗法的有效率有无差别, 表4-7 三种疗法的有效率比较 疗法有效无效合计有效率% 物理疗法组 20 1 21 95.24 药物治疗组 16 2 18 88.89 外用膏药组 12 3 15 80.00 合计 48 6 54 88.89 6( 某单位研究三种不同穴位的镇痛效果,资料如表4-16。试检验针刺不同穴位的镇痛效果有无差别, 表4-16 针刺不同穴位的镇痛效果 各穴位的观察频数镇痛效果合谷足三里扶突 + 38 53 47 ++ 44 29 23 +++ 12 28 19 ++++ 24 16 33

实验一 SPSS简介及统计整理教学内容

实验一S P S S简介及 统计整理

实验一SPSS简介及统计整理 一、实验目的和要求 1掌握SPSS安装、启动、主界面和退出; 2掌握SPSS的变量定义信息; 3掌握SPSS的数据录入与保存方法; 4掌握在SPSS中的实现各种统计描述参数的计算。引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。 5理解并掌握SPSS软件包有关数据文件创建和整理的基本操作 6学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件 7掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序8 实验类型:验证型;实验时间:2学时 二、实验主要仪器和设备 计算机一台,Windows XP操作系统,SPSS环境。 三、实验原理 SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。 SPSS变量的属性

SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度(Measure)。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。 四、实验内容与步骤 实验1.1数据文件管理 1.创建一个数据文件 数据文件的创建分成三个步骤: (1)选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“PASW Statistics数据编辑器”。 (2)单击左下角【变量视窗】标签进入变量视图界面,根据实验的设计定义每个变量类型。 (3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。 2.读取外部数据

研究生SPSS练习题

SPSS上机练习题 一、10名15岁中学生身高体重数据如下: 编号 1 2 3 4 5 6 7 8 9 10 性别男男男男男女女女女女 身高(cm)166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0 体重(kg)57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.5 体重指数(BMI)=体重(kg) / 身高(m)2,即体重(kg)除以身高(m)的平方。回答下列问题: (1)男生体重指数的均数为(kg/m2);标准差为:(kg/m2)(2)女生体重指数的均数为(kg/m2);标准差为:(kg/m2) 二、将126例十二指肠球部溃疡病人随机分为两组。甲药组治疗62人,54人有效;乙药组治疗64人,44人有效。问两种药物的治疗效果有无差别? 三、为研究口服二号避孕药对血液凝固的影响,随机抽取服药组10例,对照组10例,分别测定其抗凝血酶活力(u)如下。问服用二号避孕药对抗凝血酶活力是否有影响?(3.sav) 口服二号避孕药对血液凝固的影响 四、为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-5第(1)~(3)栏。问两法测定结果是否不同? 表3-5 两种方法对乳酸饮料中脂肪含量的测定结果(%) 编号(1) 哥特里-罗 紫法 (2) 脂肪酸水解 法 (3) 1 0.840 0.580 2 0.591 0.509 3 0.67 4 0.500

4 0.632 0.316 5 0.687 0.337 6 0.978 0.517 7 0.750 0.454 8 0.730 0.512 9 1.200 0.997 10 0.870 0.506 五、某单位欲研究3种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一配伍组的3只小白鼠分别用3种药物抑癌,共5个配伍组。实验结果得瘤重(克)如下。试比较3种药物的抑癌作用有无差别? 三种药物的抑癌作用(瘤重:克) 六、某医院用A、B两种配方治疗慢性阑尾炎,治疗结果如下。试分析两种配方治疗慢性阑尾炎的疗效有无差别? 两种配方治疗慢性阑尾炎疗效 七、10名不同年龄妇女(岁)的收缩压测定值(kPa)如下,试进行回归分析。 妇女号 1 2 3 4 5 6 7 7 9 10 年龄X i56427236634755493842 收缩压Y i19.616.721.315.719.817.120.019.315.318.7

SPSS期末重点整理

t检验:一般是用于检验两组观测值的均值之间差异是否显著的统计分析方法。 单样本t检验:用于检验样本均值与总体均值或某个已知值之间的差异的显著性。如果总体均值已知,那么样本均值与总体均值之间的差异显著性检验就属于单样本的t检验。 独立样本t检验:独立样本指的是样本之间彼此独立,没有任何关联。两个独立样本的t检验用于检验两个不相关样本在相同变量上的观测值均值之间差异的显著性。要求①正态性,各个样本均来自于正态分布的总体;②方差齐性,各个样本所在的总体的方差相等;③独立性,两组数据之间是相互独立的,不能够相互影响。 配对样本t检验:配对样本(或相关样本)指两个样本的数据之间彼此有关联。配对样本t 检验用于检验两个相关样本的均值或一个样本,两次测量结果的均值之间差异的显著性。 方差分析:是一种通过分析样本数据的各项变异来源,以检验三个或三个以上样本平均 数是否具有显著性差异的一种统计方法。 单因素方差分析:用于检验一个因素变量的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化。 多重比较:进行了全方差分析之后,当自变量有3个或3个以上水平时,还有要对每两个组之间均值的差异进行比较,这称作事后组间均值的“多重比较”。 多因素方差分析:是检验两个或两个以上因素变量(自变量)的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化的分析方法。 主效应和“交互作用”效应:主效应考察的是在忽略其他因素的情况下一个自变量对观察变量的影响,即这一个因素变量的不同水平分组下的观测值的均值之间的差异是否显著。当一个自变量的单独效应随另一个自变量的水平的不同而不同时,则这两个自变量对因变量的影响存在交互作用。 协变量方差分析:是在进行方差分析时将那些除了要考察的自变量之外的、很难控制的、且对因变量产生显著影响的无关变量作为“协变量”,在分析自变量对因变量的影响时,消除协变量对因变量的影响,从而使分析的结果更准确。。 多元方差分析:有两个或两个以上的因变量的方差分析(可以是单因素的,也可以是多因素的)称为多元方差分析。 重复测量的方差分析:用于某个测量指标对每个被试在不同的时间内进行多次(3次或3次以上)重复测量的情况。 组间因素:是被试分组的因素,组间因素有几个水平就把被试划分成几个组。 组内因素:又称重复测量因素,就是测试的不同水平或不同次数,是在每个被试内的因素。组内因素的不同水平决定了重复测量的次数。 方差成分分析:是对混合效应模型的分析,如对单变量重复测量和随机区组设计的分析,用于分析混合效应模型中各随机效应对因变量变异贡献的大小。通过对方差的成分进行分析,可以确定如何减小方差。 相关分析:是分析两个变量观测值变化的一致性程度或密切程度的统计方法。 简单相关分析:用于只对两个变量的数据做相关分析,其中包括两个连续变量之间的相关和两个等级变量之间的秩相关。 偏相关分析:是控制第三变量(或其他多个变量)的影响后,两变量间相关程度的统计方法。皮尔逊相关:是对两列变量为连续等间隔(等距、等比)数据,而且数据呈正态分布的相关

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

SPSS 上机考试复习题

工管机考复习: 1、基础题:收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组 织该份材料? 2、现有两个SPSS数据文件,分别名为“学生成绩单一.sav”和“学生成绩单二.sav”,存放 了关于学生学号、性别和若干门课程成绩的数据。 2-1请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件“学生成绩单”。以下操作均以此数据库为准。 2-2对每个学生计算得优课程和得良课程数,并按得估课程数的降序排序。 2-3请计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。 2-4如果将本数据库中的数据看做为来自总体的样本数据,试分析男生和女生的课程平均分是否存在显著差异。 2-5如果将本数据库中的数据看做为来自总体的样本数据,试分析哪些课程的平均分差异不显著。 2-6请任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS的绘制散点图功能进行一元线性回归分析。 (1)请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二条和第三条分别针对男生和女生样 本。 (2)对各回归线的拟合效果进行评价。 3、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.EXL”。 该数据的第一行是变量名,格式如下表所示,请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分)。以下操作均使用此数据库。 3-1利用居民储蓄调查数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据为存储常住地在“沿海或中心繁华城市”且本次存储金额在1000~5000元之间的调查数据;第二份数据文件是按照简单随机抽样选取的70%的样本数据。 3-2利用居民储蓄调查数据,将其按常住地(升序),收入水平(升序),存款金额(降序)进行多重排序。 3-3大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行分组。 3-4如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的

2010级SPSS试题资料

一.单项选择题 1.多因素方差分析中观测变量总的离差平方和不包括() A.多个控制变量单独作用引起的离差平方和 B.多个控制变量交互作用引起的离差平方和 C.其它随机因素引起的离差平方和 D.观测变量的非自然因素引起的离差平方和 2. SPSS默认的字符型变量的对齐方式是() A. 右对齐 B. 中间对齐 C. 左对齐 D. 以上说法都不对 3.下列函数分布中,单样本的K-S检验不能将一个变量的实际频数分布与 之比较的是() A.泊松分布 B.均匀分布 C. 正态分布 D. 二项分布 4. SPSS中创建数据文件时不能用来作为变量名的是() A. all B. abc1 C. name D. allby 5. 线性回归分析对回归方程的检验不包括() A. 拟合优度检验 B. 回归方程的显著性检验 C. 回归系数的显著性检验 D. 回归系数的相关性检验 6. SPSS曲线估计中没有提供的曲线方程有() A. 指数函数 B. 三次多项式 C. 幂函数 D. 三角函数 7. 一个生产罐头食品的公司,某批500瓶罐头的中位数为498g,其含义是 (变形) A. 500 瓶罐头的平均含量为每瓶498g B. 500 瓶罐头中,含量为498g的瓶数最多 C. 500 瓶罐头中含量最多的一瓶为498g D. 250 瓶罐头的含量小于等于498g 8. 下列统计量中不属于描述样本数据离散程度的是() A. 方差 B. 标准差 C. 众数 D. 极差 9. SPSS是一个模块化的软件,其扩充模块不包括() A. SPSS Statistics Base模块 B. Categories模块 C. Advanced Statistics模块 D. Conjoint模块 10. 在交叉列联表分析中,SPSS提供的相关系数的检验方法不包括() A. 卡方统计检验 B. 列联系数 C. V系数 D. S系数 11. 在系统聚类分析中,衡量样本数据与小类、小类与小类之间亲疏程度

spss复习资料整理

第一章 1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。 2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有: (1)完全窗口菜单运行方式 (2)程序运行管理方式 (3)混合运行管理方式 3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。 第二章 1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。 2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(V ariable)。 3.SPSS变量名的命名规则: 1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”); 2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等; 3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符; 4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。 4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、电话等)。 5.列和宽度的区别: 变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度; 列:设定该变量数据视图中列的宽度。 7.默认的缺失值类型:数值型类型(.)、字符串类型(空格)。 8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。 9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。 10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则,合并文件程序将失败。 11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。 课后练习题: 6.下列可以作为SPSS变量名的是 A).PRENTS12 B).1Name C).NOT TRUE D).@result 7.SPSS中可以设置工作目录,具体设置可以按照以下菜单: A).【选项】→【设置】 B).【编辑】→【选项】→【设置】 C).【编辑】→【选项】→【文件位置】

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data

SPSS机试考题答案

第一部分 数据整理考试题 1建立以下数据的数据文件: 对所建立的数据文件进行以下处理: ⑴计算每个学生的总成绩、平均成绩,并按照总成绩的大小进行排序(转换-计算变量,数据-排序个案) ⑵设Z Y X 、、分别表示语文、数学、化学,对称其进行以下处理: ①X X =' ②5+='Y Y (x1=sqrt(x)) ③对化学成绩,若是男生,5+='Z Z (转换-计算变量) 若是女生:10+= 'Z Z ④把数学成绩分成优、良、中三个等级,规则为优(X ≥85),良(75≤X ≤ 84),中(X ≤74),并进行汇总统计。(转换-重新编码为不同变量,频数分析) 2 在一次智力测验中,共有10个选择题,每题有A,B,C,D 四个答案,8个被测对象的答卷如下表。已知第1、6、10题的正确答案为A ,第4、5、7、8题的正确答案为B, 第2、9题的正确答案为C, 第3题的正确答案为D,请建立合适的数据文件,统计每个被测对象的总成绩(满分100)。(转换-对个案内的值计数,选择题号,再定义值 A or B C D 然后添加,转换-计算变量,Q+W+E+R 再乘以10就是总成绩) 3某个汽车收费站在每10分钟内统计到达车辆的数量,共取得20次观察数据,分别是:27、30、3l 、33、16、20、34、24、19、27、21、28、32、22、15、33、26、26、38、24,现要求以5为组距,对上述资料进行分组整理。(再重新转换-重新编码为不同变量) 4 练习加权处理功能: ⑴练习课本案例3-8(p84).(加权销售量,再分析-描述统计-描述,只添加单价,均值即是当天平均价格)

spss精选整理笔记

1、spss的三种输出结果: 表格格式格式文本格式标准图与交互图 2、变量名的定义与保留字不同,同时变量名不能一数字开头。变量名不能与spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。 3、字符型:字符型数据的默认显示宽度为8个字符位,系统不区分变量名中的大小写字母,并且不能进行数学运算。注意:在输入数据时不应输入引号,否则双引号将会作为字符型数据的一部分。 4、(1)定类尺度(Nominal Measurement):定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。离散型 特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的变量只能计算频数和频率。 在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥原则。 (2)定序尺度(Ordinal Measurement):定序尺度是对事物之间的等级或顺序差别的一种测度,可比较优劣或排序。离散型

特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能排序,不能进行运算。 (3)定矩尺度(Interval Measurement):定矩尺度是对事物类别或次序之间间距的测度。 特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差距是多少;定矩变量通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减运算。 (4)定比尺度(Scale Measurement):定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样表现为数值。 特点:定比变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个测度之间比值的特点,因此它可以进行加、减、乘、除运算,而定矩变量值可进行加减运算。 定类、定序、定距、定比变量的比较 适用的运算形式=、??、?+、- X、∕ 变 量

回归分析SPSS习题复习资料

回归分析习题 1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据,利用该数据完成下列工作 (1)研究变量间的相关程度。(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度); (2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程; (3)采用逐步回归方法建立“单位面积年营业额”的预测公式。 表20个商业中心有关指标的数据 2.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。 1.解:(1)变量间的相关性分析 利用SPSS软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1 从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量(万人) ”和x3“居民年消费额(万元) ”线性关系较密切。

x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切 从表1得)3,(x y ρ=0.795**,)2,(x y ρ=0.790**,)6,(x y ρ=.0 .697**, 说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”,x2“日人流量 (万人) ”,x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平(双侧)上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。 图1散点图矩阵 单位面积 年营业额 (万元/m2) 每小时机 动车流量 (万辆) 日人流量 (万人) 居民年 消费额 (万元) 对商场 环境 满意度 对商场 设施 满意度 对商场商 品丰富程 度满意度 单位面积 年营业额 (万元/m2) Pearson 相关性 1 .413 .790** .795** .341 .450* .697** 显著性(双侧) .071 .000 .000 .141 .046 .001 N 20 20 20 20 20 20 20 每小时机动车 流量(万辆) Pearson 相关性 .413 1 .751** -.129 .664** .424 .774** 显著性(双侧) .071 .000 .588 .001 .062 .000 N 20 20 20 20 20 20 20 日人流量 (万人) Pearson 相关性 .790** .751** 1 .273 .594** .279 .983**

spss整理

Spss知识点 1.SPSS:①Statistical Package for the Social Sciences,即“社会科学统计软件包” ②Statistical Product and Service Solutions,意为“统计产品与服务解决方案” 2.SPSS两个常用窗口:数据编辑窗口(功能:定义SPSS数据的结构、录入编辑和管理待分析的数据 .sav) 结果输出窗口(功能:显示管理SPSS统计分析结果、报表及图形 .spv) 3.利用SPSS做数据分析的一般步骤:12 ①建立SPSS 数据文件(定义数据文件结构、录入修改和编辑待分析的数据) ②分析数据(统计分析之前的数据预处理、统计分析和建模) ③结果的说明和解释④数据和分析结果的保存 4.SPSS数据文件的特点: ①SPSS数据文件的扩展名是:.sav ②SPSS数据文件属于结构性数据文件(数据结构:变量名、数据类型、变量名标签、变量值标签、缺失值的定义、度量尺度以及数据的显示属性;在数据编辑窗口的变量视图Variable View中完成。 数据内容:待分析的具体数据;在数据编辑窗口的数据视图Date View中完成。) 5.SPSS数据的基本组织方式:①原始数据的组织方式(数据编辑窗口中一行称为一个个案,所有个案组成完整的SPSS数据。一列称为一个变量,每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标识。)②计数数据的组织方式(数据编辑窗口中一行为变量的一个分组。所有行囊括了该变量的所有分组情况。一列仍为一个变量,代表某个问题或某个特征方面以及相应的计数结果。) 6.变量名:是变量访问和分析的唯一标志。 7.变量命名原则: ①首字符必须是字母或汉字,后面可以是任意字母、数字或除了“!”、“?”、“*”之外的任意字母或数字②长度应少于64个字符(32个汉字) ③不能用下划线“_”、句号和圆点作为变量名的最后一个字符 ④SPSS的变量名不能与SPSS的保留字相同,如ALL、AND、WITH、OR等 ⑤同一文件中变量名必须惟一,不区分大小写。 8.数据类型是指每个变量取值的类型。有数值型、字符型和日期型。 9.若字符型数据定义为数值型时,需要定义一个变量值标签。 10.变量值标签是对变量取值含义的解释说明信息,对于定类型和定序性数据尤为重要。如定类(民族、性别)定序(收入的高中低) 11.计量尺度又叫变量层次。定距>定序>定类 12.定类变量(定类尺度 Nominal Variable): ①是最低层次的变量,变量取值只有类别属性之分,而无大小、程度之别。 ②根据变量值,只能知道研究对象是相同或是不同。从数学运算特征来看,只具有等于或不等于(=、≠)的性质。例如:性别。 13.定序变量:①变量层次高于定类变量。 ②变量取值除了有类别属性之外,还有等级、次序的差别,其数学特性除了(=、≠)之外,还有大于或小于(><)之分。例如:文化程度、职称、态度等 14.定距变量(定距尺度 Interval Variable):①变量层次高于定序变量。 ②变量取值除了有类别、次序属性之外,取值之间的距离还可以用标准化的距离去量度。其数学特性除了(=、≠;><)之外,还可以进行加或减(+,-)。 例如:智商、成绩、收入等。 15.高层次的变量包含低层次变量的数学特征。 16.一个变量的层次并不是唯一的。高层次的变量可以作为低层次变量来使用,但是会使资料的信息使用不完全,尽量按其最高层次来统计分析。如:收入 17.Spss支持的数据格式有SPSS文件格式、Excel文件格式、dbf文件格式、文本文件格式。

SPSS实际操作练习题汇总

实习一SPSS基本操作 第1题:请把下面的频数表资料录入到SPSS数据库中,并划出直方图,同时计算均数和标准差。 身高组段频数 110~ 1 112~ 3 114~ 9 116~ 9 118~ 15 120~ 18 122~ 21 124~ 14 126~ 10 128~ 4 130~ 3 132~ 2 134~136 1 解答:1、输入中位数(小数位0):111,113,115,117,....135;和频数1,3,. (1) 2、对频数进行加权:DATA━Weigh Cases━Weigh Cases by━频数━OK 3、Analyze━Descriptive Statistics━Frequences━将组中值加 入Variable框━点击Statistics按钮━选中Mean和 Std.devision━Continue━点击Charts按钮━选中HIstograms ━Continue━OK 第2题某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表,并计算这81名男性血清胆 固醇含量的样本均数。 219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 解答:1、输入数据:单列,81行。

相关文档
最新文档