应用统计学调查报告

应用统计学调查报告
应用统计学调查报告

应用统计学调查报告Newly compiled on November 23, 2020

应用统计学报告

题目:关于大学生图书阅读量问卷调查分析报告

人员组成:张喜瑞

马腾

高伟

2016年6月6日

调查报告

第一部分调查方案设计

一、调查方案

(一)调查目的:通过了解大学生的图书借阅数目的主要状况,了解大学生的阅读量情况。

(二)调查对象:2014信管班

(三)调查单位:抽取的样本学生

(四)调查程序:

1.设计调查问卷,明确调查方向和内容;

2.分发调查问卷。将调查问卷分发至全班学生;

3.根据回收有效问卷进行分析,具体内容如下:

(1)根据样本的借阅量数目、分布状况的均值、方差等分布的数字特征,推断大学生总体分布的相应参数;

(2)根据性别进行男女两个总体生活费均值之差的比较以及方差比的区间估计

(3)绘制统计图形使样本数据直观化并对统计量进行分析(五)调查时间:2016年5月19日—2016年6月6日

关于大学本科生学期图书阅读量调查

本调查是关于大学生图书阅读量的调查,本次调查为无记名式,请大家如实填写,谢谢参与!

1.您是本科大_学生

A.一 B 二 C三 D.四

2.您的性别:

A.男

B.女

3.每个学期借阅图书数目大概是______

A.小于4本 B 4—6本 C 6—8本本以上

4. 您阅读的图书以___为主

A.文学 B.娱乐消遣 C.专业用书 D 其它类

5. 你经常去图书馆读书吗 ___

A .经常去 B. 偶尔去 C.不经常去 D不去

6. 你每天花多长时间去读课本以外的书籍

小时以上–2小时小时以下

7.您每学期买新书的费用是多少____

A 30元以下

B 30—60元—90元 D 90—120元 E 120元以上

谢谢您的参与!

第二部分数据分析

我们设样本一为抽样总体,样本二为男生的抽样总体,样本三为女生的抽样总体。

一、图书阅读量的分析

1. 对样本一的分析

由整理后输入计算机的数据,我们绘制出样本一学期图书阅读量的频数分布表和直方图,结果如下:

样本一学期阅读量的频数分布表

频率百分比有效百分

累积百分

有效4本以

16

4-6本14

6-8本13

8本以

9

合计52

由上图可以看出:样本一(即本科生抽样全体)学期图书阅读量4本以下所占频数最高。

样本一(总体)平均学期图书阅读量置信区间的构造表

~本之间。

样本一男生学期图书阅读量的频数分布表

统计量

学期图书阅读量

缺失

学期图书阅读量

频率 百分比 有效百分

累积百分比

有效 4本以

下 9 4-6本 8

6-8本 4 8本以上

1

合计

22

由上图可以看出:样本二学期图书阅读量4

本以下所占频数最高,是学期图书阅读量的众数。分析众数后,我们进一步分析学期图书图书阅读量的平均水平,得出结果如下:

在本之间。

3.对样本三的分析

由整理后输入计算机的数据,绘制出样本三女生学期图书阅读量的频数分布表和直方图,结果如下:

样本三女生学期图书阅读量的频数分布表

统计量

学期图书阅读量

缺失

学期图书阅读量

频率 百分比 有效百分比 累积百分

有效 4本以

下 7 4-6本 6

6-8本 9 8本以上

8

合计

30

由上图可以看出:样本三(即女生抽样全体)学期图书阅读量3-6本以下所占频数最高。

我们进一步分析学期图书阅读量的平均水平,得出结果如下(表6

):

样本三(女生)平均学期图书阅读量置信区间的构造表

~

本之间。

5.学生学期图书阅读量均值单因素方差分析

1. 建立假设

对于因素A : H 0:1=2 性别对学期图书阅读量均值无影响

H 1:1≠2,性别对学期图书阅读量均值有影响

ANOVA

学期图书阅读量

平方和df 均方 F 显着性

组间 1

组内50

总数51

由表可知,对于因素A,因为:由P值小于显着性水平,故不接受原假设,说明性别对学期图书阅读量具有显着影响;

6、信管学生购买新书花费费用与学期图书阅读量回归模型

(1)绘制散点图

从图上可直观地看出购买新书与学期图书阅读量之间成线性相关关系(2)简单相关

相关性

学期图书阅

读量购买新书费

学期图书阅读量Pearson 相关

1

显着性(双

侧)

N 52 52

购买新书费用Pearson 相关

1

显着性(双

侧)

N 52 52

**. 在 .01 水平(双侧)上显着相关。

从表中可得到两变量之间的皮尔逊相关系数为,双尾检验概率p值尾<,故变量之间显着相关。根据购买新书花费费用与学期图书阅读量的散点图与相关分析显示,购买新书花费费用与学期图书阅读量之间存在显着的正相关关系。在此前提下进一步进行回归分析,建立一元线性回归方程。

(3) 线性回归分析

从结果看,回归的可决系数和调整的可决系数分别为和,即学期图书阅读量的90%以

从表中可以看到无论是常数项还是解释变量x,其t统计量对应的p值都小于显着性水

回归模型的常数项(Constant)、购买新书费用和学期图书阅读量的偏相关系数,它们分别等于、和。于是得到回归方程如下:

学期图书阅读量=+×购买新书费用

二、对每天图书阅读时间的分析

有效 1小时以下

35

1-2小时 10 2小时以上 7 合计 52

可以看出主每天图书阅读时间1小时以下所占频率最高。 进一步分析单样本t 统计得

三、对购买图书花费费用的统计分析

统计量

购买新书费用 N 有效

52 缺失

购买新书费用

频率 百分比 有效百分比 累积百分

有效 15

15 45

14

75 15 105 7 135 1 合计 52

七、总结

通过以上的统计分析,我们基本得出以下结论:

第一、对于学期图书阅读量的分析结果:

1.通过对信管班全体学生生活费均值的区间估计,发现总体的学期图书阅读量平均水平在~本之间。

2从得出的数据可以看出女生相对比男生的图书阅读量要高。

3方差分析的结果表明,性别对学期图书阅读量均值有显着影响,即女生大于男生的学期图书阅读量。

第二、对于每天图书阅读时间的分析结果:

根据问卷所统计出的数据,信管班学生每天图书阅读量在小时之间。应看出信管班全班学生在图书阅读花费时间比较低。

三、对购买图书花费费用的统计分析

根据问卷所统计出的数据,信管班学生购买新书费用总水平在元之间。应看出信管班学生在购买图书方面花费比较低。

应用统计学习题:方差分析

第五章方差分析 序号:5-004 题型:名词解释题 章节:方差分析 题目:方差分析的任务 答案:①求参数μ、μj 、α 1、α 2 ……αm的估计值(参数估计) ②分析观测值的偏差 ③检验各水平效应α 1、α 2 ……αm(等价μ 1 、μ 2 ……μm)有无显著差异 难度:高 评分标准:每题2分,少一条扣去1分。 序号:5-002 题型: 判断题 章节:方差分析 题目:方差分析是一种比较总体方差差异的统计方法。() 答案:错误 难度:中 评分标准:1分 序号:5-003 题型:综合题 章节:方差分析 题目:设有三个车间以不同的工艺生产同一种产品,为考察不同工艺对产品产量的影响,现对每个车间各纪录5天的日产量,如表所示,问三个车间的日产量是否有显著差异? (取α=0.05)。 将最终的计算结果填入下表:

F >)12,2(05.0F 存在显著差异。 解:(1)计算各水平均值和总平均值,465 46 484745441=++++= X , 同理46,5232==X X ,483 46 5246=++=X (2’分) (2)计算总离差平方和S T ,组内平方和S E ,组间平方和S A 。 S T =(44-48)2+(46-48)2+……(45-48)2=172 (1’分) S A =Σ120)4846(5)4852(5)4846(5)(2222j =-+-?+-=-X X (1’分) S E =S T -S A =172-120=52(1’分) (3)计算方差 MS A = 601 3120 =- MS E = 33.43 1552 =-(1’分) (4)作F 检验 85.1333 .460 === E A MS MS F (1’分) 89.3)21,2(),1(05.02==--F m n m F (1’分) 难度:中 评分标准: 每题8分 序号:5-004 题型:综合题 章节:方差分析 题目: 有重复双因素方差分析,A 因素有3个水平,B 因素有3个水平,在A i 、B j 所有可能组合条件下,重复观测2次。试用观测值X ijk 、均值??i X 、??j X ……, i =1、2……n , j =1、2……m , k =1、2…… l 制表。并指定Excel 单元格对应。 有重复双因素方差分析数据表

卫生统计学生存分析

一、选择题 1.生存分析中的生存时间是指_____________。 A 手术至死亡的时间 B 观察开始到观察结束的时间 C 起始事件到终点事件间隔的时间 D 发病到痊愈的时间 E 出生到死亡的时间 2.食管癌患者术后随访资料进行生存分析,其中的删失值可以是_____________。 A 患者失访 B 患者死于车祸 C 患者死于其它肿瘤 D 观察期结束仍存活 E 以上都是 3.生存分析中的结果变量是_____________。 A 生存时间 B 是否删失 C 生存率D生存时间与随访结局 E 生存时间与生存率 4.关于生存概率与生存率,叙述正确的是_____________。 A 生存率不会随时间增加B生存概率随时间增加而加大 C生存概率一定大于生存率D生存概率一定小于生存率 E 生存概率一定等于生存率 5.关于生存曲线正确的描述是_____________。 A 纵坐标为生存概率 B 此曲线是严格下降的 C 曲线平缓,表示预后较好 D 横坐标中点为中位生存期 E 寿命表法生存曲线呈阶梯型 6.Cox模型要求数据满足的假设条件为_____________。 A 自变量服从正态分布 B 应变量为二项分类数据 C 各自变量满足方差齐性D变量满足比例风险假定 E 协变量为数值变量 二、简答题 1.Cox回归与logistic回归都可作临床研究中的预后分析,二者的主要区别何在?2.请简述Cox回归中回归系数与RR值的关系。

三、计算分析题 1.将符合手术治疗适应征的21例乳腺癌患者随机分为两组,一组10例接受手术治疗,另一组11例在术后同时接受化疗,其生存时间如表23-13。(1)试估计两种疗法的生存率及生存曲线。(2)比较两种疗法的生存率有无差别。 表21例乳腺癌患者两种疗法的生存时间(月) 手术组 6 9 13 15 18 19 19 20 22 24 手术+化疗组10 14 15 16+19 19 20 20+24 26 28 2.以下是女性心绞痛患者诊断后的生存数据,试用寿命表法估计其生存率并估计中位生存期。

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

统计学教案习题05方差分析

统计学教案习题05方 差分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组间)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=21)(x x n k i i i -∑= , 组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ????-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案

第五章 方差分析 课后习题参考答案 5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α) 解:(1)手工计算解答过程 提出原假设:() 3,2,10:0==i H i μ 记 167.20812 11112 =???? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.7011 2 11211=???? ??-???? ??=∑∑∑ ∑====r i n j ij r i n j ij i A i i X n X n S 7 .137=-=A T e S S S 当 H 成立时, ()() ()r n r F r n S r S F e A ----= ,1~/1/ 本题中r=3 经过计算,得方差分析表如下:

查表得 ()()35 .327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原 假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程 组建效应检验 Depend ent Variable: 存活日数a 70.429235.215 6.903 .004 137.73727 5.101 208.167 29 方差来源菌型误差总和 平方和自由度 均值F 值P 值R Squared = .338 (Adjusted R Squared = .289) a. 从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 工厂 寿命(小时) 甲 40 48 38 42 45 乙 26 34 30 28 32 丙 39 40 43 50 50 试在显著水平 0.05α=下,检验电池的平均寿命有无显著性差异?并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3) i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A

生存分析概念

“ 一、生存分析的概念: 将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。 研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计分析研究。 对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计 分析方法。 在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工 程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经 济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发 生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计 规律的分析与推断方法的学科。 二、生存时间”(Survival Time)的概念 生存时间也叫寿命、存活时间、失效时间等等。 医学:疾病发生时间、治疗后疾病复发时间 可靠性工程系:元件或系统失效时间 犯罪学:重罪犯人的假释时间 社会学:首次婚姻持续时间 人口学:母乳喂养新生儿断奶时间 经济学:经济危机爆发时间、发行债券的违约时间 保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费 汽车工业:汽车车轮转数 市场学中:报纸和杂志的篇幅和订阅费 三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可 靠性工程学等 六、生存分析研究的目的 1、描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统 计方法包括 Kaplan-Meier (K-M )法、寿命表法。 2、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗

统计学考题(按章节) 第6题【05分】__随访资料的生存分析

五、其它30分(3~5道题目,每题6~10分) 随访资料的生存分析: 【06真题】 九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。记录的资料如下:(5分) 1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么? 2、判断上述随访时间哪些属截尾值?写出观察对象编号。 【05真题、04真题、03真题】 四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。资料如下表:(8分) 16例某种癌症病人随访资料 病人号治疗组分组日期终止日期是否该病死亡截尾值 1 A 68.05.1 2 68.05.30 Y 2 B 70.10.18 71.04.16 Y 3 B 69.02.12 70.11.06 Y 4 A 72.01.30 74.05.31 仍存活 5 A 73.11.11 74.01.02 Y 6 B 68.03.12 73.03.30 车祸死亡 7 A 69.01.06 69.01.04 Y 8 A 69.02.08 70.02.08 迁出 9 B 71.05.02 71.11.13 Y 10 B 68.03.08 68.05.23 Y 11 B 73.12.12 74.02.20 Y 12 A 74.05.01 74.05.09 Y 13 B 72.07.02 72.07.15 Y 14 B 68.12.18 74.04.31 失访 15 A 69.01.01 74.05.31 仍存活 16 B 73.09.02 73.09.20 Y 1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么? 2.判断上述随访时间哪些属截尾值,写出观察对象编号。 3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法? 4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示? 【答案】jszb 0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。 1、本资料并未按时间分组,实际上是A、B两个治疗组的未分组资料。 一般情况下较细的时间单位准确性较高,当随访时间可以作较细的量化时,则应考虑用较细的时间单位。 但研究目的不同,时间单位不同,使用恰当的时间单位。 本资料的目的是比较A、B疗法对该种癌症病人的疗效,癌症病人的生存时间测度单位如果以(日)太小, 因此,本资料随访时间单位以月较合适? 2、产生截尾数据的原因:包括中途失访、研究结束时仍然存活、死于与研究疾病无关的原因。 因此,编号4、6、8、14、15观察对象属截尾值。

相关文档
最新文档