spss统计分析方法应用期末作业

spss统计分析方法应用期末作业
spss统计分析方法应用期末作业

1.作业1(基本统计+参数检验+方差分析1)

利用城际出行行为数据,从中随机选取90%的样本,实现以下分析目标:

(1)分析出行时间的分布,需做直方图。

(2)分析不同性别的出行方式是否一致。

(3)检验老年人(≥60)与其他人的出行时间是否有显著差异。

(4)检验是否老年人和出行目的两因素对其它时间的影响(考虑交互作用)。

1.1 分析出行时间的分布,需做直方图

1.1.1 解题思路

首先,根据题目要求在城际出行行为数据中随机选择90%的样本;由于出行时间分布数据是定距变量,且出行时间数据数量较多,不宜使用频数进行分析。因此在分析之前先对出行时间进行分组,再进行频数分布。根据公式(1-

(1-1)中n为数据个数,对结果四舍五入取整后为理论分组数目。

原样本数为235,随机选择之后剩余样本是n为213个,根据公式(1-1)计算得到分组数目为9。选中的数据中出行时间的最大值为150,出行时间的最

1.1.2操作步骤

数据选择:【数据→选择个案】,选择【随机个案样本】→【样本】→在【大约】中填入“90%”→选择【删除未选定的个案】,点击确认。剩下的即为随机选择之后的数据。

数据分组:【转换】→【重新编码为不同变量】→将“出行时间”加入到有边框中,输出变量名称改为“城市出行时间分组”,点击【更改】,在点击【旧值和新值】,按照60-70、70-80、80-90、90-100、100-110、110-120、120-130、

130-140、140-150,分别对应1,2,3,4,5,6,7,8,9。点击【完成】。

频数分析:【分析】→【描述统计】→【频率】,将“城市出行时间分组”加入到【变量】中。点击【图表】→【直方图】→选中【在直方图上显示正态曲线】→【确定】。

1.1.3输出结果与分析

总计213 100.0 100.0

图1-1城市出行时间分布直方图

从表1-1中可以看出,出行时间分布中,出行时间在60-70分钟的比较少,占比为4.7%,出行时间在120-130分钟、130-140分钟和140-150分钟的都比较少,三组总和占比仅为6.1%。出行时间在70-120分钟之间的人数最多,

总体占比为89.2%。这其中90-100分钟的出行人数比较少。整体来看大部分的出行时间为与70-120分钟之内,也就是位于中间位置。

从图1-1可以看出,用户的出行分布时间基本符合正态分布,主要集中在70-120分钟之间,两边的用户出行时间分布较少。这也与表1-1结果所对应。

1.2 分析不同性别的出行方式是否一致

1.2.1 解题思路

分析多个变量不同取值下的分布,进而分析变量之间的相互影响和关系。对于这种涉及两个或两个以上变量分布情况的研究通常要利用交叉分组下的频数分析来完成。具体来说,在1.1.1随机抽选的90%数据的基础上,借助通用的非参数检验方法—卡方检验,编制交叉列联表,即两个或两个以上变量交叉分组后形成的频数分布表。

原假设:不同性别的出行方式不一致。

1.2.2 操作步骤

交叉列联表:【分析→描述统计→交叉表】,将“出行方式”加入【行(O)】中,将“性别”加入【列(C)】中,点击【统计】,选择【卡方】,点击【单元格】,选择【计数→实测值、期望值,百分比→行、列、总计,非整数权重→单元格计数四舍五入】→选择【选择簇状条形图】点击【确定】。

1.2.3 输出结果与分析

得到结果,交叉列联表如表1-2所示。在213份调查样本中,选择小汽车

的人数为134人,选择轨道交通的人数为79人,分别占样本总数的62.9%和37.1%。在男、女期望值分别为119、94,分别占样本总数的55.9%和44.1%。

对不同性别进行分析:在119位男性中,66.4%选择小汽车出行,33.6%选择轨道交通出行,小汽车选择比例略高于总比例(62.9%),轨道交通略低于总比例(37.1%);在94位女性中,58.5%选择小汽车出行,41.5%选择轨道交通出行,小汽车选择比例略低于总比例(62.9%),轨道交通略高于总比例

(37.1%)。由此可知男性和女性都更愿意乘坐小汽车出行。

对不同出行方式分别分析:选择小汽车的134人中,男性、女性的人数分别是79和55人,各占小汽车出行总数的59%和41%,其中,男性的比例略高于总比例(55.9%),女性略低于总比例(44.1%);选择轨道交通的79人中,男性、女性的人数分别是40和39人,各占本行总数的50.6%和49.4%,其中,男性的比例略低于总比例(55.9%),女性略高于总比例(44.1%)。由此可

知,男性比女性更愿意乘坐小汽车出行。

表1-3卡方检验结果表

从表1-3可以看出,概率P值为0.237,大于显著性水平 (0.05),因此接受原假设,认为行列变量不具有相关性。得出结论:性别与出行方式相互独立,不具有相关性。

图1-2出行方式条形图

1.3 检验老年人(≥60)与其他人的出行时间是否有显著差异

1.3.1 解题思路

该问题中,由于考虑老年人和其他人的出行时间是否存在差异,可以将老年人(≥60)与其他人分为两个样本,两种类型的人可以看成两个总体,并且两个样本是来自两个总体的独立样本。且出行时间可以近似认为服从正态分布,因此,可以采用两独立样本t检验的方法进行分析。两独立样本t检验的目的是:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异,比较符合本题的要求。

原假设为来老年人与其他人对出行时间无显著性差异。

1.3.2 操作步骤

两独立样本t检验:选择菜单【分析→比较平均值→独立样本T检验】,将“出行时间”加入【检测变量T】框,将“年龄”加入到【分组变量G】框,并点击【定义组】,选择【割点】,输入“4”,点击【确定】。

1.3.3 输出结果与分析

表1-5t检验结果表

通过表1-4可以看出,老年人的平均出行时间为105分钟,其他人为96.10分钟,可以看出老年人和其他人的出行时间二者存在一定差距。通过检验应推断这种差异是是抽样误差造成的还是存在系统误差。

表1-5是老年人和其他人出行时间均值差的检验结果。分析结论分两步完成。第一步,两总体方差是否相等的F检验。该检验的F统计量观测值为

0.125,概率P为0.724,大于显著性水平0.05,可认为两总体方差不存在显著性差异;第二步,两总体均值差的检验。在第一步中,由于两总体方差无显著差异,因此应看第一行(假定等方差)t检验的结果。其中,t统计量的观测值为1.724,对应的双尾概率P值为0.086.如果显著性水平 为0.05,由于概率P 值大于0.05,不能拒绝零假设,因此得出结论:老年人(≥60)与其他人的出行时间无显著差异。

1.4 检验是否老年人和出行目的两因素对其它时间的影响(考虑交互作用)。

1.4.1 解题思路

检验是否老年人和出行目的两因素对其它时间的影响并且考虑交互作用,因而选择多因素方差分析解决问题。多因素方差分析可用来研究两个及两个以上控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响。在本题目中,首先,将是否老年人进行数据分组,定义新的变量,再进行多因素方差分析。

1.4.2 操作步骤

数据分组:数据分组:【转换】→【重新编码为不同变量】→将“年龄”加入到右边框中,输出变量名称改为“老年人分组”,点击【更改】,在点击【旧值和新值】,按照最小值到3、4到最大值分别对应0和1。点击【确定】。

多因素方差分析:【分析】→【一般线性模型】→【单变量】,选择“其它时间”到【因变量(D )】,选择“老年人分组”和“出行目的”到【固定因子(F )】,【选项】→勾选【描述统计】,点击【确定】。

1.4.3 输出结果及分析

表 1-6 主体因子情况表

首先,这里以是否为老年人和出行目的为控制变量,其它时间为观测变量,建立固定效应的饱和模型。其中零假设为是否为老年人对其它时间没有产生显著影响(即是否为老年人对其它时间的效应同时为0);不同出行目的对其它时间没有显著差异(即不同的出行目的对其它时间的效应同时为0);是否为老年人和出行目的的不同对其它时间没有产生显著的交互影响(即交互效应对其它时间的效应同时为0)。

由表1-8克制各F 检验统计量的观测值在一定自由度下的概率P 值。

F 老年人分组、4X F 、4*X F 老年人分组的概率P 值分别为0.001、0.006和0.520。如果显

著水平 为0.05,由于F 老年人分组、4X F 的概率P 值小于显著性水平,则应拒绝零假设,可以认为是否为老年人、出行目的不同对其它时间总体均值存在显著差异,对其它时间的效应不同时为不同时为0,各自不同的水平给其它时间带来了显著影响。

同时,由于4*X F 老年人分组的概率P 大于显著性水平,因此不应拒绝零假设,可以认为是否为老年人和出行目的没有对其它时间产生显著的交互作用,是否为老年人以及出行目的的不同对其它时间都将不产生显著影响。

2.作业10(回归分析5)

在城际出行行为数据中以“出行方式”为因变量,分析出行时间、其他时间、出行目的、和性别四个变量对城际出行方式的影响。(用强制进入策略,需给出最终模型的数学表达式,并对显著影响因素进行分析)。

2.1 解题思路

”出行方式“为二分类变量,当回归分析中的被解释变量为二分类型变量时,通常采用二项Logistic 回归分析方法。“出行方式”是被解释变量,其余的变量时解释变量。由于解释变量中“出行目的”、“性别”为分类变量,分类变量通常不能像数值型变量那样直接作为解释变量进入回归方程,需要转化为虚拟变量才能进行分析。

2.2 操作步骤

【分析】→【回归】→【二元Logistic 】,然后将把被解释变量“出行方式”选到【因变量】框,解释变量“出行时间、其他时间、出行目的、和性别”选择到【协变量】框中。单击【分类】按钮,将“性别和出行目的“导入

【分类协变量】中,选择【指示符】。点击【选项→分类图、霍斯默-莱梅肖拟合优度、Exp(B)的置信区间→95】,点击【保存→概率、组成员、包括协方差矩阵】

2.3 输出结果与分析

表2-1给出了虚拟解释变量的取值编码和分布情况。对由分类型变量派生出的虚拟解释变量,SPSS自动命名为原变量名。例如出行目的派生出的两个虚拟变量分别命名为收入(1)和收入(2),依次表示“是否为办公”和“是否为购物或娱乐”,两变量均为0表示“其他”;性别派生出一个虚拟变量为性别(1),表示“是否男性”,取值为0表示女性。

表2-2显示了二项Logistic分析初始步,也即零模型(第0步,方程中只有常数项,其他回归系数均为0)的混淆矩阵。可以看到,134人实际乘坐小汽车且模型预测正确,正确率为100%;79人实际实际选择了轨道交通但模型均预测错误,正确率为0%,模型总的预测正确率为62.9%。

表 2-3显示了方程中只有常数项时回归系数方面的指标,各数据项的含义依次是:回归系数、回归系数标准误、Wald 检验统计量的观测值、自由度、Wald 检验统计量的概率P 值、优势比。

表2-4显示了待进入方程中的各个解释变量的情况,各数据项的含义依次为:比分检验统计量的观测值、自由度和概率P 值。可以看到,如果下一步出行时间进入方程,则比分检验统计量的观测值为6.343,概率P 值为0.012.如果显著水平α为0.05,由于出行时间的概率P 值小于显著性水平,所以可以进入方程。由此可以看出,除了性别以外,所有变量均能进入方程。

表2-5显示了采用进入策略时回归方程显著性检验的总体情况,各数据项的含义依次是:似然比卡方的观测值、自由度和概率P 值。可以看到本步所选变量均进入方程,与前一部(第0步)相比,似然比卡方的观测值是221.932,概率值为0。如果显著性水平α为0.05。由于该P 值小于显著性水平α,应拒绝原假设,认为所有回归系数不同时为0,解释变量的全体与Logit P 之间的线性关系显著,采用该模型是合理的。

表2-7显示了当前模型的混淆矩阵。注脚中的切割值为.500表示,如果概率预测值大于0.5,则判定被解释变量的类别预测值为1;如果小于0.5,则判定被解释变量的预测值为0。在实际乘坐小汽车出行的134人中,模型正确识别了127人,错误识别了7人,正确率为94.8%;在实际选择轨道交通的79人中,模型正确识别了72人,错误识别了7人,正确率为91.1%。与前一步骤相比,小汽车的预测准确率下降了,轨道交通的预测准确率上升了,但是模型的总体预测精度上升。

根据表2-8可以写出以下回归方程。

式(2-1)反映了出行方式在其他时间和出行目的上的差异。其他时间增长一个单位会使得Logit P平均增长0.387个单位。其他时间相同的人群里面,出行目的为办公的相较于出行目的为其他的人使Logit P平均增长2.011个单位。结合发生比可知,出行目的为办公的发生比是其他的7.469倍,且有95%的把握在0.923和60.435之间。出行目的为购物和娱乐相较于出行目的为其他的人使Logit P减少0.730个单位,出行目的为娱乐或办公的发生比是其他的0.482倍,且有95%的把握在0.069和3.349之间。

3.作业13:因子分析

根据各省货物周转量及经济数数据(X1-X8)判断是否适合作因子分析,如果可以做,提取几个因子比较合适?并对结果进行分析。

3.1 解题思路

由于涉及的变量较多,直接进行地区间的比较分析较为繁琐,因此首先考虑采用因子分析方法减少变量个数,之后再进行比较和综合评价。因子分析是解决此类问题的一种非常有效的方法,能够以最少的信息丢失,将原始众多变量总合成较少的几个因子,并给出实际解释,能够起到有效根据题目要求,选择因子分析方法,判断各省货物周转量及经济数数据(X1-X8)之间的关系。

3.2 操作步骤

因子分析:选择菜单【分析】→降维→因子,将“各省经济数数据(X1-X8)”选到【变量】框中。单击【描述】→初始解、系数、反映象、KMO 和巴特利特球形度检验,点击【提取】→主成分、未旋转的因子解、碎石图、相关性矩阵,点击【旋转】→最大方差法、旋转后的解,点击【得分】→保存为变量、回归、显示因子得分系数矩阵,点击【选项】→替换为平均值、按大小排序,点击【确定】。

3.3 输出结果与分析

3.3.1 考察原有变量是否适合进行因子分析

图3-1 因子分析窗口图3-2 因子分析的描述窗口首先考察原有变量之间是否存在一定得线性关系,是否适合采用因子分析

方法提取因子。这里,借助变量的相关系数矩阵、巴特利特球度检验和KMO 检验方法进行分析,具体操作如图3-1和图3-2所示,分析结果如表3-1。

表3-1原有变量的相关系数矩阵

表3-1是原有变量的相关系数矩阵。可以看出,大部分相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。

表3-2巴特利特球度检验和KMO检验

由表3-2可知,巴特利特球度检验统计量的观测值是231.285,概率P值接近于0.如果显著水平 为0.05,由于概率P值小于显著水平,应拒绝原假设,认为相关系数矩阵与单位矩阵有显著差异。同时KMO值为0.620,根据Kaiser 给出的KMO度量标准可知,原有变量适合进行因子分析。

3.3.2 提取因子

表3-3是因子分析的初始解,显示了所有变量的共同度。第一列是因子分析初始解下的变量共同度,它表明对原有8个变量采用主要成分分析方法提取8个因子,那么原有变量的所有方差都可能被解释,变量的共同度均为1。第二列是在按指定提取条件提取因子时的变量共同度。可以看出所有因子的绝大部分信息(大于79.9%)可被因子解释,这些变量的信息丢失较少。因此本次因子提取的效果较为理想。

表3-3因子分析的初始解

表3-4因子解释原有变量总方差的情况

表3-4中,第一列是因子编号,以后三列组成一组,每组中数据项的含义一次是特征值、方差贡献率和累计方差贡献率。第一组数据项描述了初始因子解的情况,第二组数据项描述了因子解的情况,第三组数据项描述了最终因子解的情况。总共提取出3个因子,累计方差贡献值89.551%,说明3个因子共解释了原有变量总方差的89.551%,总体上原有变量的信息丢失较少,因子分析效果较为理想。

在图3-3中,横坐标为因子编号,纵坐标为特征值。可以看到:第一个因子的特征值(方差贡献)很高,对解释原有变量的贡献最大;第4个以后的因子特征值都比较小,对解释原有变量的贡献值很小。因此提取三个因子最合适。

表3-5 因子载荷矩阵图3-3因子的碎石图

表3-5显示了因子载荷矩阵,是因子分析的核心计算结果。可知,前5个变量在第1个因子上的载荷很高。变量6和7在第2个因子上的载荷较高,变量8在第3个因子上的载荷较高。

3.3.3 因子的命名解释

表3-6旋转后的因子载荷矩阵

表3-7因子旋转中的正交矩阵表3-8因子协方差矩阵

第一个因子上有较高的载荷,第1个因子主要解释这几个变量;第2个因子主要解释职工平均工资、居民消费水平;第3个因子主要解释居民消费价格指数、商品价格指数。表3-8显示了三个因子的协方差矩阵。三个因子之间都没有线性相关性,实现了因子分析的设计目标。

3.3.4 计算因子得分

表3-9因子得分系数矩阵

根据表3-9可写出一下因子得分函数:

F1=0.306GDP+0.025居民消费水平+0.270固定资产投资-0.025职工平均工资+0.248货物周转量+0.070居民消费价格指数+0.077商品价格指数+0.317工业总产值;

F2=0.011GDP+0.387居民消费水平+0.129固定资产投资+0.0451职工平均工资-0.319货物周转量+0.180居民消费价格指数-0.098商品价格指数+0.026工业总产值;

F3=0.047GDP+0.040居民消费水平+0.075固定资产投资+0.096职工平均工资-0.139货物周转量+0.653居民消费价格指数+0.462商品价格指数+0.123工业总产值;

可见,计算因子1得分时,GDP和工业总产值权重较高;计算因子2得分时,居民消费水平、职工平均工资权重较高;计算因子3得分时,居民消费价格指数、商品价格指数权重较高。另外,正值表示高于平均水平,负值表示低于平均水平。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

【免费下载】统计分析与SPSS的应用

广东海洋大学 统计分析与spss 的应用实习报告 姓名: 班级: 学号: 学院(系)职业技术学院专业名称会计电算化使用班级102实习地点软件七室起止时间2012.12.3—2012.12.14路敷设各类管资料腐跨接线槽口不盒处,调试全部高料试卷验;工作;设备与验方设备于调试试卷技在最大障高行自动绝动作资料试于差

统计分析与s p s s的应用实习报告 学院(系)职业技术学院专业会计电算化班级102 学生姓名学号实习地点软件七室201 实习要求: 1、掌握spss软件的使用基础和数据文件的建立和管理操作; 2、掌握spss数据的排序、变量计算、数据选取、计数、分类汇总、数据分组等预处理功能操作; 3、掌握spss的频数分析、计算基本描述统计量、多选项分析、比率分析等基本统计分析操作及解读; 4、掌握spss的参数检验操作及解读; 5、掌握spss的方差分析操作及解读; 6、了解spss的非参数检验操作及解读; 7、掌握spss的相关分析操作及解读; 8、掌握spss的一元线性回归分析操作及解读,了解其它回归分析。 实习目的: 本实习是《统计学原理》课程的实习环节。统计学是社会科学与管理学各专业的基础课程,重点介绍定量研究社会经济现象的基本方法。本课程是为具备一定统计学基础知识的高年级本科生和专科生开设的。通过实习掌握spss软件的统计分析功能和操作技能,把统计分析的基本原理和方法通过spss软件来实现,并能对结果进行解读,主要包括如下内容:SPSS 软件使用基础、用SPSS 进行描述统计、频数分析、交叉列联表分析、多选项分析、参数检验、方差分析、非参数检验、相关回归分析等。 实习时间: 2012.12.3—2012.12.14 实习地点:软件七室 实习内容: 本次实习中老师主要对以下六个方面的内容进行较为详细地讲解和我们进行了相应内容的操作。 1、数据文件的建立和管理 建立SPSS数据文件首先应了解SPSS数据文件的特点、数据的组织形式的基本方式和相关概念,这样才能建立一个完整且全面的数据环境,服务于以后的数据分析工作。数据

应用统计spss分析报告

学生姓名:肖浩鑫学号:31407371 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035

(1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性() (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 航空公司编号航班正点率(%)投诉次数(次) 1 81.8 21 2 76.6 58 3 76.6 85 4 75.7 68 5 73.8 74 6 72.2 93 7 71.2 72 8 70.8 122 9 91.4 18 10 68.5 125 (1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。(2)检验回归系数的显著性()。 (3)如果航班正点率为80%,估计顾客的投诉次数。 4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表 变差来源df SS MS F Significance F 回归 2.17E-09 残差40158.07 —— 总计11 1642866.67 ——— 参数估计表 Coefficients 标准误差t Stat P-value Intercept 363.6891 62.45529 5.823191 0.000168 X Variable 1 1.420211 0.071091 19.97749 2.17E-09 (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

应用统计spss分析报告

应用统计spss分析报告

学生姓名:肖浩鑫学号:31407371 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: 企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。

2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035 (1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。(4)检验回归方程线性关系的显著性()(5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:

spss作业15-17

CHAPTER 15 西北研究院蔡嘉驰131246 15.4 (i) What we choose is part of u t. Then gMIN t and u t are correlated, which causes OLS to be biased and inconsistent. (ii) I think it is uncorrelate because gGDP t controls for the overall performance of the U.S. economy. (iii) The change of U.S. minimum may someway change the state minimum and vice versa. If the state minimum is always the U.S. minimum, then gMIN t is exogenous in this equation and we would just use OLS. 15.7 (i) Because students that would do better anyway are also more likely to attend a choice school. (ii) Since u1 does not contain income, random assignment of grants within income class means that grant designation is not correlated with unobservables such as student ability, motivation, and family support. (iii) The reduced form is choice= π0 + π1faminc + π2grant + v2, and we need π2≠ 0. (iv) The reduced form for score is just a linear function of the exogenous variables: score= α0 + α1faminc + α2grant + v1. This equation allows us to directly estimate the effect of increasing the grant amount on the test score, holding family income fixed.So it is useful. C15.1 (i) The regression of log(wage) on sibs gives

统计分析与SPSS的应用考试

《统计分析软件》试(题)卷 班级姓名学号 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.”

(2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。 男生数学的均值为82.25高于女生的均值78.5。女生的的标准差7.09930高于男生的标准差3.77492。 2.

3.

优共有4人,良具有12人中有4人。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:<1> (1) (2)

spss的数据分析报告

Gender Educational Level (years)N Valid 474474Missing 00关于某公司474名职工综合状况的统计分析报告 1、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工 资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。2、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析 能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女 性别分布进行频数分析,结果如下: Gender FrequencyPercent Valid Percent Cumulative Percent Valid Female 21645.645.645.6 Male 258 54.4 54.4 100.0 Total 474100.0100.0 上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表 : Educational Level (years) Valid Cumulative

spss统计分析实习心得3篇

spss统计分析实习心得3篇五天的SPSS软件实训终于结束了,虽然实训过程充满了酸甜苦辣,但实训结果却是甜的。看着小组的课题报告,心里有种说不出来的感触。高老师在对统计理论及 SPSS 软件功能模块的讲解的同时更侧重于统计分析在各项工作中的实际应用,使我们不仅掌握 SPSS 软件及技术原理而且学会运用统计方法解决工作和学习中的实际问题这个实训。我真真正正学到了不少知识,另外,也提高了自己分析问题解决问题的能力。 小组中每个人完成不同的任务,我的任务是用独立样本T检验的方法分析市、县及县以下的分类对社会消费品零售总额的影响,分析方差,均值,P值,显著性如何并进行T 检验,得出结论报告。结果中比较有用的值为差值变量的均值Mean和Sig显著性在初级统计中,通常都要求所分析的数据呈现正态分布。通过对spss软件对数据的实践处理,我感觉显著性检验问题还是比较简单的,但对具体数据分析的目的性,实用性以及自己在做研究时如何使用,还有待进一步实践和提高。 SPSS 有具体的使用者要求的分析深度,同时是一个可视化的工具,使我们非常容易使用,这样我们可以自己对结果进行检查。电算化老师曾经说过,学习软件其实只是学习软件的操作流程,而要真正掌握整个软件,就得自己摸索探

究,真真正正弄懂它,还要下一定的功夫的。我也深刻体会到了这点。前几次实训都是关于会计实验的,虽然时间安排比此次实训紧,任务量大,但实训结束后,基本的试训内容都完全掌握。而这次实训,虽然时间安排较为轻松,内容也不多,操作起来也有一定的难度,另外受外界因素的影响,根本就听不见看不见老师讲的,即便后来老师一讲就去前面,由于没有条件跟着操作,导致一部分内容总是不熟练,请教同学他们也不会,不过,问题也总会用解决的办法。经过我坚持不懈的努力,在本次实训结束之前,我终于弥补了自己不熟练的那部分内容。 学习SPSS软件,对于我们这些将来要时刻与数据打交道的人是有很大的帮助的,它主要的是运用SPSS软件结合所学统计知识对数据进行需要的处理,相对于EXCEL处理,SPSS软件处理不仅效率高,而且操作简单。我个人觉得,SPSS 软件是一门专业性较强的课程,对于我们财务管理专业的学生是一门必备的课程,也是一门必须熟练掌握的课程,很庆幸,我是抱着将来要学习运用SPSS软件进行此次实训的。这次实训,使我对统计工作的过程和 SPSS应用的流程取得一定的感性认识,拓展了视野,巩固所学理论知识,提高了分析问题、解决问题的能力,也增强了我的职业意识、劳动观点以及适应社会的能力,最重要的是它使我获得了思想和课题分析处理上的双丰收。

《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第9章SPSS的线性回归分析 1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。 选择fore和phy两门成绩体系散点图 步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。 接下来在SPSS输出查看器中,双击上图,打开图表编辑

→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。但回归直线的拟合效果都不是很好。 2、请说明线性回归分析与相关分析的关系是怎样的? 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。 线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。 3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验? 检验其可信程度并找出哪些变量的影响显著、哪些不显著。 主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

spss统计分析报告

计算机与信息技术学院专业实习报告 学校:商丘师范学院 专业:信息管理与信息系统年级:2012 姓名:亚慧 学号:121112015 时间:2015.09

《统计分析与SPSS的应用》 实习报告 专业实习题目:数据处理与分析 一.实习目的 1.初步了解探索数据分析的基本方法和思路 2.掌握问题的研究思路及方法 3.掌握统计分析软件实现这些方法的步骤和原理 4.熟悉SPSS操作系统,掌握数据管理界面的简单的操作; 5.熟悉SPSS结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。 6.掌握常用统计图(线图、条形图、饼图、散点、直方图等)的绘制方法;熟悉描述性统计图的绘制方法; 7.熟悉描述性统计图的一般编辑方法。掌握相关分析的操作,对显著性水平的基本简单判断。二.实习要求 1.遵守学校实习纪律和学校的各项规章制度 2.服从领导和指导老师的实习安排、虚心接受指导老师的安排 3.不得冒名顶替,否则严肃处理 4.按时上下课,不得缺席 5.掌握SPSS软件的基本操作、数据分析的基本功能和基本步骤 6.掌握对SPSS所分析的各项数据的理解、数据分析的基本方法和思路 7.掌握工作中如何进行数据的收集、整理以及统计分析报告的撰写的方法。 8.掌握相关关系的含义,并准确应用,熟练掌握绘制散点图的具体操作 9.掌握线性回归分析的主要目标、及具体操作。 三.实习任务 (一)下列表为数据处理所有表格和数据 信管12-1成绩表 学号性别计算机 网络 管理信 息系统 统计 学 市场营 销学 现代管 理学 运筹学 信息资 源管理 英语上 学期 英语 下学 期 大三 综合 成绩 121112001 女82.00 90.00 79.00 82.00 84.00 85.30 81.00 74 75 89.5

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1) 作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。然而,当代大学生对华夏文明究竟知道多少呢 某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。请利用这些资料,分析以下问题。 问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。 问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。 要求: 直接导出查看器文件为.doc后打印(导出后不得修改) 对分析结果进行说明,另附(手写、打印均可)。 于作业布置后,1周内上交 本次作业计入期末成绩

答案 问题一 操作过程 1.打开数据文件作业。同时单击数据浏览窗口的【变量视图】按钮,检查各个 变量的数据结构定义是否合理,是否需要修改调整。 2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对 话框。在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。 3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字 “5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。再单击【继续】按钮,返回【频率】对话框。

应用统计spss分析报告

应用统计s p s s分析报 告 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-

学生姓名:肖浩鑫学号: 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显着性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 企业编号产量(台)生产费用(万 元)企业编号产量(台)生产费用(万 元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显着性进行检验(),并说明二者之间的关系强度。 2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显着性() (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查, 航空公司编号航班正点率(%)投诉次数(次) 1 21 2 58 3 85 4 68 5 74 6 93 7 72 8 122 9 18 10 125 系数的意义。 (2)检验回归系数的显着性()。 (3)如果航班正点率为80%,估计顾客的投诉次数。 4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 变差来源df SS MS F Significance F 回归 残差—— 总计11——— Coefficients标准误差t Stat P-value Intercept X Variable 1 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显着性(a=)。 5. 随机抽取7家超市,得到其广告费支出和销售额数据如下

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基 本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下 性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0

性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较 好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常 好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析,结果如下表:

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

spss统计分析报告

目录 一、研究背景及其意义 (3) 二、研究方案 (3) 研究目标 (3) 研究内容 (4) 研究方法 (4) 三、科学技术与经济发展的关系分析 (4) 科技投入 (4) 科技产出 (5) 经济发展 (7) 小结 (7) 四、科学技术与经济发展的模型分析 (8) 模型假设 (8) 符号说明 (8) 信度与相关性分析 (8) 因子分析 (9)

回归分析 (10) 五、结论 (13) 附录: (14) 科学技术与经济发展的关系 一、研究背景及其意义 十九大报告指出:创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。要瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究、引领性原创成果重大突破。加强应用基础研究,拓展实施国家重大科技项目,突出关键共性技术、前沿引领技术、现代工程技术、颠覆性技术创新,为建设科技强国、质量强国、航天强国、网络强国、交通强国、数字中国、智慧社会提供有力支撑。加强国家创新体系建设,强化战略科技力量。深化科技体制改革,建立以企业为主体、市场为导向、产学研深度融合的技术创新体系,加强对中小企业创新的支持,促进科技成果转化。倡导创新文化,强化知识产权创造、保护、运用。培养造就一大批具有国际水平的战略科技人才、科技领军人才、青年科技人才和高水平创新团队。 而科技作为创新的重要引领者和实践者,对于建设创新型国家起着重要作用。科技进步是经济发展与社会发展的强大推动力。邓小平同志曾指出;"科学技术是第一生产力";江泽民同志也曾指出:"科学技术是第一生产力,而且是先进生产力的集中体现和主要标志。科学技术的突飞猛进,给世界生产力和人类经济发展带来了极大的推动,未来的科学发展还将产生新的重大飞跃"。在当今这个信息化和全球化加速的时代,科技进步对经济社会发展的促进作用越来越显着,科技进步成为生产力水平的首要决定因素,是国家或区域竞争力的重要源泉。近年来,随着我国经济增长方式的转变,科技支撑和引领经济社会发展的作用越来越强,无论是国家还是区域都需要通过依靠科技进步来促进经济社会发展。科技进步考核有效地促进了科教兴国、可持续发展和人才强国战略的落实,使科技促进经济杜会发展的能力逐步提升。

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

SPSS统计分析报告分析报告案例

SPSS统计分析案例 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医

疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动需,促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费质量和消费结构都发生了明显的变化。城镇居民在食品、衣着、家庭设备用品三项支出在消费支出中的比重呈现明显的下降趋势,其中食品类支出比重降幅最大;衣着类有所下降;家庭设备用品类下降幅度不是很大。与此同时,医疗保健、交通通讯、文化娱乐教育服务、居住及杂项商品支出在消费支出中的比例均有上升,富裕阶段的消费特征开始显现。 四、我国城镇居民消费结构及趋势的统计分析

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

相关文档
最新文档