数理统计课程设计

数理统计课程设计
数理统计课程设计

合肥工业大学

数理统计课程设计设计题目:某级某专业课考试成绩描述性统计分析学生学号:20096307

学生姓名:刘明超

专业班级:数学与应用数学09-02班

指导教师:谭常春李彤

摘要

本文利用数学学院2008级与2009级同学数理统计这门课程的考试成绩,

并且运用MATLAB 进行统计描述与相关假设检验。在本文中,我们选取了2009级信息专业同学的数理统计成绩作为样本并对其统计特征进行具体描述,并将其与2008级信息专业同学的数理统计成绩进行比较。并在此基础上,还作出了曲线拟合检验其是否服从正态(卡方)分布。

一、 题目重述

某级某专业课期末考试成绩描述性统计分析:均值、方差、分组画图形、曲线拟合是否服从正态(卡方检验);描述性分析的其它量:标准差、偏态系数、峰度系数、中位数、众数、极差、经验分布函数、四分位数等、;比较两个班的相应描述性统计量的差异, 画图形表示等,另外做相关的假设检验,要求每个人的区间划分不相同,组数和区间长度对检验结果的影响。

二、描述性统计分析

1.均值

均值被定义为

=1

1=n

i i X x n

相应的matlab 命令mean(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。

根据09级信息专业选课的63名同学的数理统计成绩,可计算出数理统计成绩均值=X 71.0794。

2.中位数

即样本数据的中间值,相应的matlab 命令为median(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的中位数是73。

3.众数

即出现频率最高的数,相应的matlab 命令为mode(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的众数是63。

4.方差

样本方差为2

21

1=()-1n i i X X n σ=-∑,相应的matlab 命令为var(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的方差是277.4936。

5.标准差

样本标准差即为方差的算术平方根,由上述计算的方差值,我们可得标准差为22.4068。

6.极差

定义为样本最大观测值与最小观测值之差,相应的matlab 命令为range(A),其中A 是储存有09级信息专业同学数理统计成绩的数组。根据09级信息专业选课的63名同学的数理统计成绩,我们得出样本的极差是75。

7.四分位数

[x>]=[x<]=αξα

αξα

上分位数为P 下分位数为P

我们计算得:该样本的上下四分位数分别为84和61。

8.峰度系数

峰度是用来反映频数分布曲线顶部尖峭或扁平程度的指标,而峰度系数则被定义为

σ

4

1

4

)

1(--

=

∑??? ??-=N i a N i X X

本样本其峰度系数为2.7737,由于该系数大于2,所以拒绝其正态性。

9.偏态系数

描述频率分布不对称性的统计参数,通常采用三阶中心矩与标准差立方之比表示。

偏态系数以平均值与中位数之差对标准差之比率来衡量偏斜的程度,用SK 表示偏斜系数:偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负偏。偏态系数大于0,因为均值在众数之右,是一种右偏的分布,又称为正偏。 计算公式如下

3

1

3

()=

n

i i X

X SK σ

=-∑

该样本偏态系数为-0.3973,表示峰值较正态分布左偏。

三、经验分布函数

09级信息专业数理统计的经验分布函数如下图所示:

20

30

40

50

6070

80

90

100

00.10.20.30.40.50.6

0.70.80.9

1x

F (x )

Empirical CDF

图1. 09信息专业成绩经验分布函数

四、成绩分组频数图

对成绩分布画出其频数图,共分为十个区间:

20

30405060708090100

02

4

6

8

10

12

14

图2. 09信息专业数理统计成绩各区间频数图

五、08和09信息专业数理统计成绩的比较:

(1)、 将09级信息专业与08级信息专业的数理统计成绩进行比较,他们的统

计特征如下表所示:

表1. 两个专业统计特征

统计特征 08信息

09信息

均值

67.6184 71.0794 方差 163.679

1

277.493

6

标准差 12.7937 16.6581

中位数

69

73

众数 78 63 极差 71 75

下四分位数 58

61

上四分位数 77

84

峰度系数 4.3185

2.7737

偏态系数

-0.8007

-0.3973

由表中数据可以看出,09信息专业的平均成绩高于08信息专业,同时09信

息专业的成绩方差较大,说明08信息专业的数理统计成绩的分布较09信息专业更为集中。

(2)、 08信息专业的成绩经验分布函数图如下:

20

30

40

50

6070

80

90

100

0.10.20.30.40.50.6

0.70.80.9

1x

F (x )

Empirical CDF

图3. 08信息专业成绩经验分布函数

由上图同图1相比较,09信息专业的低分数段分布较08信息专业更少一些,

分布跨度也较小一些。

(3)、 08信息专业成绩分布的频数图如下所示:

20

30405060708090100

246810121416

18

图4. 08信息专业成绩分布频数图

由此图和图2比较,我们知道09信息专业高分人数更多,但08信息的及格

以上人数比率高一些。

六、成绩分布的正态性检验

由Jarque —Bera 检验其正态性,MATLAB 中相应的命令为[H s]=jbtest(A,

),s 为接受假设的概率值,s 越接近于0,则可以拒绝是正态分布的原假设。

则09信息成绩正态性检验有:

H=0 p=0.2867 不拒绝其正态性假设

画出其样本正态概率图,如下图所示:

30

40

50

6070

80

90

0.01

0.020.050.100.250.500.75

0.900.950.98

0.99Data

P r o b a b i l i t y

Normal Probability Plot

图5 . 09信息专业数理统计成绩正态性检验

七、对此次课程设计的总结:

经过此次数理统计的课程设计,增加了对统计知识的认识,也加强了用MATLAB 作图的能力。这短短的十天里,我们小组团结合作,经过不懈努力,最终完成了它。感谢同伴们,也感谢老师们,给我们提供的参考和环境。

八、参考文献

【1】、 《数理统计讲义》 郑明 陈子毅 汪嘉冈 编著 复旦大学出版社 【2】、 《概率论与数理统计教程》 魏宗舒等 编著 高等教育出版社 【3】、 《概率论基础》 李贤平 编著 复旦大学出版社(第2版) 【4】、 《MATLAB 编程指导》 卓金武 编著 北京航空航天大学出版社

《概率论与数理统计》期末考试试题及解答

一、填空题(每小题3分,共15分) 1. 设事件B A ,仅发生一个的概率为0.3,且5.0)()(=+B P A P ,则B A ,至少有一个不发 生的概率为__________. 答案:0.3 解: 3.0)(=+B A B A P 即 )(25.0)()()()()()(3.0AB P AB P B P AB P A P B A P B A P -=-+-=+= 所以 1.0)(=AB P 9.0)(1)()(=-==AB P AB P B A P . 2. 设随机变量X 服从泊松分布,且)2(4)1(==≤X P X P ,则==)3(X P ______. 答案: 161-e 解答: λλ λ λλ---= =+==+==≤e X P e e X P X P X P 2 )2(, )1()0()1(2 由 )2(4)1(==≤X P X P 知 λλλ λλ---=+e e e 22 即 0122 =--λλ 解得 1=λ,故 16 1)3(-= =e X P 3. 设随机变量X 在区间)2,0(上服从均匀分布,则随机变量2 X Y =在区间)4,0(内的概率 密度为=)(y f Y _________. 答案: 04,()()0,. Y Y X y f y F y f <<'===? 其它 解答:设Y 的分布函数为(),Y F y X 的分布函数为()X F x ,密度为()X f x 则 2 ()()())))Y X X F y P Y y P X y y y y y =≤=≤ =≤- - 因为~(0,2)X U ,所以(0X F = ,即()Y X F y F = 故

数理统计结课论文

数理统计中回归分析的探究与应用

回归分析问题探究 摘要 本文主要针对数理统计中的回归分析问题,通过对一元线性回归、多元线性回归以及非线性回归原理的探究,分别运用了SPSS和MATLAB软件进行实例分析以及进一步的学习。 首先,通过变量之间关系的概念诠释引出回归函数;其次,针 对回归函数,分别对一元线性回归原理上的学习,了解并会运用这三种线性回归模型、参数估计和回归系数的显著性检验来处理和解决实际的一元线性回归问题;接着,对多元线性回归和非线性回归进行学习,掌握它们与一元线性回归在理论和实践的联系与区别;然后,通过实际问题运用SPSS进行简单的分析,熟悉SPSS软件的使用步骤和分析方法,能够运用SPSS进行简单的数理分析;最后,用MATLAB编程来处理线性回归问题,通过多种方法进行比较,进行线性回归拟合计算并输出Logistic模型拟合曲线。 关键词:回归分析;一元线性回归;多元线性回归;非线性回归;SPSS;MATLAB

一、回归概念 一般来说,变量之间的关系大致可以分为两类:一类是确定性的,即变量之间的关系可以用函数的关系来表达;另一类是非确定性的,这种不确定的关系成为相关关系。相关关系是多种多样的,回归分析就是研究相关关系的数理统计方法。它从统计数据出发,提供建立变量之间相关关系的近似数学表达式——经验公式的方法,给出相关行的检验规则,并运用经验公式达到预测与控制的目的。 如随机变量Y与变量x(可能是多维变量)之间的关系,当自变量x确定后,因变量Y 的值并不跟着确定,而是按照一定的停机规律(随机变量Y的分布)取值。这是我们将它们之间的关系表示为 其中是一个确定的函数,称之为回归函数,为随机项,且。回归分析 的任务之一就是确定回归函数。当是一元线性函数形时,称之为一元线性回归;当 是多元线性函数形时,称之为多元线性回归;当是非线性函数形时,称之为非线性回归。 二、回归分析 2.1 一元线性回归分析 2.1.1 一元线性回归模型 设随机变量Y与x之间存在着某种相关关系,这里x是可以控制或可以精确测量的普通变量。对于取定的一组不完全相同的值做独立实验得到n对观察值 一般地,假定x与Y之间存在的相关关系可以表示为 , 其中为随机误差且,未知,a和b都是未知参数。这个数学模型成为医院 线性回归模型,称为回归方程,它所代表的直线称为回归直线,称b为回归系数。 对于一元线性回归模型,显然有。

概率论与数理统计-课程设计

概率论与数理统计课程设计

概率论的起源、发展和应用 作者: 摘要:论文简要介绍了概率论与数理统计学科的起源和发展,以及概率论与理统计在生活中的应用。 关键词:概率论与数理统计,起源,发展,应用 1、引言 《概率论与数理统计》是研究随机现象统计规律的一门数学学科,也是一门应用性很强又颇具特色的数学学科。它在包括控制、通信、生物、物理、力学、金融、社会科学等工程技术领域以及科学研究、经济管理、企业管理、经济预测等众多领域都有广泛的应用;它与其他数学分支有着紧密的联系(如微积分、高等代数、测度论等),是近代数学的重要组成部分;它的方法和理论向各个基础学科、工程学科的渗透,是近代科学技术发展的特征之一;它与基础学科相结合产生出了许多边缘学科,如生物统计、统计物理、数学地质等;它又是许多新兴的重要学科的基础,如信息论、控制论、可靠性理论、人工智能、信息编码理论和数据挖掘等。 《概率论与数理统计》是工科大学的一门应用性很强的必修基础课。学习和掌握概率论与数理统计的基本理论和基本方法并将其灵活应用于科学研究和工程实际中,是社会发展对高素质人才培养提出的必然要求。 2、概率论与数理统计的起源 概率论的萌芽源于十七世纪保险业的发展,但是真正引发数学家们思考的源泉,却是赌博者的请求。 十七世纪中叶,法国贵族德·美黑在骰子赌博中,有事急于抽身,须中途停止赌博,需要根据对胜负的预测把赌资进行合理的分配,但不知用什么样的比例分配才算合理,于是就写信向当时法国的最高数学家帕斯卡请教。正是这封信使概率论在历史的舞台迈出了第一步。

帕斯卡和当时第一流的数学家费尔玛一起,研究了德·美黑提出的关于骰子赌博的问题。于是,一个新的数学分支--概率论登上了历史舞台。三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯企图自己解决这一问题,结果写成了《论机会游戏的计算》一书,这就是最早的概率论著作。 为概率论确定严密的理论基础的是数学家柯尔莫哥洛夫。1933年,他发表了著名的《概率论的基本概念》,用公理化结构,这个结构明确定义了概率论发展史上的一个里程碑,为以后的概率论的迅速发展奠定了基础。 3、概率论与数理统计的发展 数理统计的发展大致可分为古典时期、近代时期和现代时期三个阶段。 古典时期(19世纪以前)——这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期。在这一时期里,瑞土数学家贝努里(1654-1795年)较早地系统论证了大数定律。1763年,英国数学家贝叶斯提出了一种归纳推理的理论,后被发展为一种统计推断方法――贝叶斯方法,开创了数理统计的先河。法国数学家棣莫佛(1667-1754)于1733年首次发现了正态分布的密度函数,并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础。1809年,德国数学家高斯(1777-1855)和法国数学家勒让德(1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析。在数理统计的理论与应用方面都作出了重要贡献,他不仅将数理统计应用到生物学,而且还应用到教育学和心理学的研究。并且详细地论证了数理统计应用的广泛性,他曾预言:“统计方法,可应用于各种学科的各个部门。” 近代时期(19世纪末至1845年)——数理统计的主要分支建立,是数理统计的形成时期。上一世纪初,由于概率论的发展从理论上接近完备,加之工农业生产迫切需要,推动着这门学科的蓬勃发展。1889年,英国数学家皮尔逊(1857-1936)提出了矩估计法,次年又提出了频率曲线的理论,并于1900年在德国数学家赫尔梅特在发现c2分布的基础上提出了c2检验,这是数理统计发展史上出现的第一个小样本分布。1908年,英国的统计学家戈塞特(1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t检验法),这为数理统计的另一分支――多元分析奠定理论基础。1912年,英国统计学家费

数理统计期末考试试卷

四川理工学院试卷(2014至2015学年第1学期) 课程名称:数理统计(A 卷) 命题教师: 适用班级:统计系2013级1、2班 注意事项: 1、满分100分。要求卷面整洁、字迹工整、无错别字。 2、考生必须将姓名、班级、学号完整、准确、清楚地填写在试卷规定的地方,否则视为废卷。 3、考生必须在签到单上签到,若出现遗漏,后果自负。 4、如有答题纸,答案请全部写在答题纸上,否则不给分;考完请将试卷和答题卷分别一同交回,否则不给分。 试 题 一、填空题(每空3分,共 24 分) 1. 设1621,,,X X X 是来自总体X ),4(~2σN 的简单随机样本, 2σ已知,令∑==16 1161i i X X ,统计量σ -164X 服从分布为 (写出分布的参数)。 2. 设),(~2σμN X ,而1.70,1.75,1.70,1.65,1.75是从总体X 中抽取的样本,则μ的矩估计值为 __________ 。 3. 设12,, ,n X X X 是来自总体X ~(1,1)U -的样本, 则()E X =___________, ()Var X =__________________。 4.已知~(,)F F m n ,则 1 ~F

5. ?θ和?β 都是参数a 的无偏估计,如果有_________________成立 ,则称?θ是比 ?β 有效的估计。 6.设()2,0.3X N μ~,容量9n =,均值5X =,则未知参数μ的置信度为0.95 的置信区间是___________________ (查表0.975 1.96U =) 7. 设123456,,,,,X X X X X X 是来自正态总体2(0,2)N 的样本,令 22123456()()Y X X X X X X =+++-- 则当C = 时CY ~2(2)χ。 二、选择题(每小题3分,共 24分 ) 1. 已知n X X X ,,,21 是来自总体2(,)N μσ的样本,μ已知,2σ未知,则下列是统计量的是( ) (A )2 1()n i i X X =-∑ (B ) 22 1 1 ()n i i X X σ =-∑ (C) 2 211 ()n i i X μσ=-∑ (D) 2 21 ()11n i i X n μσ=--∑ 2.设),,,(21n X X X 为总体),(2σμN 的一个样本,X 为样本均值,则在总体方差2σ的下列估计量中,为无偏估计量的是( ). (A )221 11?()n i i X X n σ==-∑ (B )2221 1?()1n i i X X n σ==--∑ (C)223 11?()n i i X n σμ==-∑ (D)2 241 1?()1n i i X n σμ==--∑ 3. 设81,,X X 和101,,Y Y 是分别来自相互独立的正态总体)2,1(2-N 和)5,2(N 的 样本, 21S 和2 2S 分别是其样本方差,则下列服从)9,7(F 的统计量是( ) )(A 222152S S )(B 22 2 145S S )(C 2 22154S S )(D 222125S S

数理统计结课论文

数理统计在环境监测方面的应用 班级:14研3班姓名:漆麟学号:201420001101 直线回归在分光光度法分析中起着非常重要的作用,它反应出被测物质浓度与吸光度之间的变量关系。例如在测定亚硝酸盐氮标准曲线时,由于亚硝酸盐氮不稳定在空气中可被氧化成硝酸盐氮也易被还原成氨,因此,要求测定过程快速准确。而正确绘制标准曲线是获得准确结果的必要手段。如何做到正确绘制标准,可采用数理统计中最小二乘法对每组实验数据进行线性回归,根据回归方程式 y=a+bx,求解a、b后代入回归方程即可绘出最接近真实的标准曲线。因为在理论上每组实验数据经过最小二乘法处理后都能得到一条最佳直线,这样就可避免主观选择估计的因素,使测定结果接近真值。 采用《环境监测分析方法》中N-1萘-乙二胺比色法。在pH2.0~2.5时,水中亚硝酸盐与对氨基苯磺酰胺生成重氮盐,再与N-1萘-乙二胺偶联生成红色染料,在543nm波长处有最大吸收。其色度深浅与亚硝酸盐含量成正比,可比色测定。 向标准比色管分别加入每毫升含0.5μg的亚硝酸钠标准使用液1mL、3mL、 5mL、7mL、10mL,用水稀释至50mL。然后再分别加入1.0mL对氨基苯磺酰胺盐酸盐溶液摇匀,放置2-8min,加入1.0mLN-1A萘-乙二胺盐酸盐溶液,10min后比色测定。测定结果见表1。 表1 亚硝酸盐氮标准曲线测定结果 亚硝酸(μg)x钠使用液0.5 1.5 2.5 3.5 5.0 吸光度y 0.036 0.111 0.185 0.259 0.367 线性回归设标准物浓度为x1,x2,……,x n,相应的吸光度为y1,y2,……,y n,根据回归方程y=a+bx求解方程的b和a。经计算的测定结果列于表2。 表2 用最小二乘法绘制亚硝酸盐氮标准曲线 n x x2 y y2 xy 1 0.5 0.25 0.036 0.001296 0.018 2 1.5 2.25 0.111 0.01231 0.1665 3 2.5 6.25 0.185 0.034225 0.4625

概率论与数理统计课程设计

概率论与数理统计课堂设计——概率论与数理统计在博彩中的应用 院系:班级: 姓名: 学号:

概率论与数理统计在博彩中的应用 作者: 摘要:赌博自古以来就一直是我们生活中的一个重要部分,各种形式的赌博存在于我们的生活中,但是我们也听过十赌九骗、十赌九输,那么赌博究竟有没有什么机制与规律呢?本文通过概率论的一些知识来揭示赌博中的规律,通过揭示其运行机制,让我们感受数学的美。关键字:赌博;概率论 1.发展历程 概率论是一门研究随机现象的规律的数学分支。其起源于16世纪,意大利学者吉诺拉莫·卡尔达诺(1501-1576)开始研究骰子等赌博中的一些问题,但真正刺激概率论发展的是来自17世纪的赌博者问题。数学家费马向法国数学家帕斯卡提出下列问题:现有两个赌徒相约赌若干局,谁先赢s局就算赢了,当赌徒A先赢a局(a

概率论课程小论文

《概率论与数理统计》小论文概率与理性的发展 哈尔滨工业大学 2014年12月

《概率论与数理统计》课程小论文 概率与理性的发展 摘要概率论是一门研究事件发生的数学规律的学科。他起源于生活中的实际问题的思考,较传统的几何学等起步较晚,在伯努利、泊松等数学家的努力下,形成了现如今较为完备的理论体系。他与数理统计一起,在工程设计、自然科学、社会科学、军事等领域起着重要作用。而概率论提出后有很多人感感兴趣对其进行研究的原因之一是很多事件的主观上对概率的判 断与实际的理论概率有着很大的差异,于是有关概率的悖论有很多,也有很多与直觉相悖的概率问题,这也是概率的魅力之一。本文将从概率的发展、概率与感性的差异等方面出发对概率与感性和理性进行探讨。 关键词概率悖论直觉理性 一、概率的发展 概率论的初步发展起源于十七世纪中叶的法国。在那里出现了对赌博问题的研究,也正是对赌博问题的研究,推动了概率论的发展。最初的问题是从分赌金开始的。[1] 最初的问题大致是这样的:甲乙双方是竞技力量相当的对手,每人各拿出32枚金币,以争胜负。在竞争中,取胜一次,得一分。最先获得3分的人取得全部赎金64枚金币。可是,因某种缘故,竞争3次,赌博被迫终止。而此时,甲得2分,乙得1分,问赌金如何分配?很多问题的开端都是利益的纠纷,这也是一个例子,双方都会为自己的利益考虑而提出对这笔赌金的分法,而从直觉上看,很多理由似乎也是很有道理的。但是真相只有一个,到底理论上最公平的分法是怎样的?这个问题的当事人爱好赌博的德梅雷 向其好友著名的数学家帕斯卡请教,这个问题也受到了帕斯卡的关注。帕斯卡与其好友费尔马进行了三个月的书信往来讨论这个问题,最终得到了满意的答案:假设两赌徒中甲赢了两局,乙一局未赢,那么接下来可能出现的情况是:若甲再赢一局,得3分,将获全部赌金;若乙赢一局,出现2:1的局

北航数理统计期末考试题

材料学院研究生会 学术部 2011年12月 2007-2008学年第一学期期末试卷 一、(6分,A 班不做)设x 1,x 2,…,x n 是来自正态总体2(,)N μσ的样本,令 )x x T -= , 试证明T 服从t -分布t (2) 二、(6分,B 班不做)统计量F-F(n,m)分布,证明 111(,)F F n m αααα-的(0<<1)的分位点x 是。 三、(8分)设总体X 的密度函数为 其中1α>-,是位置参数。x 1,x 2,…,x n 是来自总体X 的简单样本,试求参数α的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp x (;) 0 , p x μμσσσ??-? -≥??? =????? ,其它, 其中,0,μμσσ-∞<<+∞>已知,是未知参数。x 1,x 2,…,x n 是来自总体X 的简单样本。 (1)试求参数σ的一致最小方差无偏估计σ∧ ; (2)σ∧ 是否为σ的有效估计?证明你的结论。

五、(6分,A 班不做)设x 1,x 2,…,x n 是来自正态总体211(,)N μσ的简单样本,y 1,y 2,…,y n 是来自正态总体222(,)N μσ的简单样本,且两样本相互独立,其中221122,,,μσμσ是未知参数,2212σσ≠。为检验假设012112:, :,H H μμμμ=≠可令12, 1,2,..., , ,i i i z x y i n μμμ=-==-则上述假设检验问题等价于0111:0, :0,H H μμ=≠这样双样本检验问题就变为单检验问题。基于变换后样本z 1,z 2,…,z n ,在显著性水平α下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6分,B 班不做)设x 1,x 2,…,x n 是来自正态总体20(,)N μσ的简单样本,0μ已知,2σ未知,试求假设检验问题 22220010:, :H H σσσσ≥<的水平为α 的UMPT 。 七、(6分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6分)设方差分析模型为 总离差平方和 试求A E(S ),并根据直观分析给出检验假设012:...0P H ααα====的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A 、B 、C 、D 外,还需考察A B ?,B C ?。今选用表78(2)L ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

数理统计论文

研究生课程考核试卷 科目:数理统计教师:黄光辉 姓名:张振学号:20142002036 专业:环境科学与工程类别:学术 上课时间:2014 年9 月至2014 年11 月 考生成绩: 卷面成绩平时成绩课程综合成绩 阅卷评语: 阅卷教师(签名)

某商业银行不良贷款形成原因分析 摘要 根据某商业银行多家分行业务数据,建立线性回归模型,运用SPSS数理统计软件对此商业银行不良贷款情况进行运算与分析,以不良贷款为因变量(y),运用逐步回归法对变量数据进行筛选,最后以各项贷款余额(χ1)与本年固定资产投资额(χ4)为自变量,分别建立y与χ1的一元线性回归方程和y与χ1、χ4的二元线性回归方程,并对回归线性模型进行F检验、t检验和回归系数检验。最后结合实践经验,对模型进行检验,并运用Pearson相关系数测量因变量(y)与自变量(χ1、χ4)的线性相关关系,以及两个变量之间的相关性。 一、问题提出与分析 重庆一家某商业银行其业务主要是进行基础设施建设、重点项目建设、固定资产投资等项目的贷款。最近一段时间,在贷款额平稳增长的基础上,该银行的不良贷款记录也有大比例提高。为了弄清楚不良贷款形成的原因,该银行希望利用一些数据做些定量分析。 二、数据描述 表1是项目参考的变量名称;表2给出了该银行所属20家分行在2012年的相关业务数据。 表1 项目参考变量名 y:不良贷款(亿元)χ3:贷款项目个数(个) χ1:各项贷款余额(亿元)χ4:本年固定资产投资额(亿元) χ2:本年累计应收贷款(亿元) 表2 相关业务数据 分行编号不良贷款 各项贷款余 额 本年累计应 收贷款 贷款项目个数 本年固定资产投 资额 1 0.9 2 67.5 6.78 5 51.9 2 1.1 112.5 19.8 16 91.1 3 4.81 174.2 7.9 17 74.2 4 3.18 82.1 7.3 10 14.5 5 7.8 199.7 16.4 19 63.21 6 2. 7 16.3 2.2 1 2.2 7 1.6 106.2 10.7 17 20.2

吉林建筑大学建筑给排水课程设计计算说明书-

吉林建筑大学 课程设计(论文)说明书 课题名称长春市正大光明城2#楼 室内给水、排水设计、消防设计 院(系)市政与环境工程学院 专业给水排水工程101班 姓名宋天芳 学号21 起讫日期7月1 日- 7月 12日 指导教师 2013年 7 月12日

前言 建筑给水排水是给水排水工程中比较重要的一部分,本次设计说明书就是针对室内给水排水的设计及其计算,从而了解并掌握建筑室内给水排水设计的方法和要求。 水是我们生活中必不可少的一部分,每个人每天必须摄入一定的水量来满足机体的生活需要,因此建筑给水排水也成为我们现在建筑中必不可少的一部分,做好室内给水排水才能让我们的生活更美好。 室内给水排水的设计要合理的安排好给水管道、排水管道和消防管道的布局,计量避免交叉和错乱。 此次设计说明书也就是针对这个问题而做的一次设计。 此次设计主要依据建筑条件图和设计规范、设计手册、技术措施、标准图集设计。其余参考书详见参考书目。

目录 一、设计指导书 二、设计过程说明 三、室内给水系统计算 四、室内排水系统的计算 五、建筑内部消防系统的计算 六、小结

一、《建筑给排水工程课程设计》指导书 一、收集资料:气象、土建、水质资料、参考资料 二、设计计算: 根据建筑性质、卫生器具及用水点位置,布置给水、排水管线,根据相应公式计算给水排水流量。并分别确定其管径、管道坡度、阻力损失等。 三、绘施工图: 1、图纸内容 各系统设计一般由设计说明、平面图、系统图组成(必要时宜带有局部详图)。 A.设计说明 设计图纸上用图线表达不清楚的问题,需要用文字加以说明。主要内容有:给水所需总压力;给排水管道采用的管材及接口方式;对管道敷设的技术要求;对施工质量及验收的要求;各系统主要材料、设备的统计等。 B.平面图 平面图是设计图纸的主要部分。本图应表明给水、排水系统管道(立管,横管、支管)的水平位置及管径、立管编号,管道坡度。 C.系统图 系统图也叫轴侧图,该图表明系统各管道的空间关系,图内除注明管径及立管编号外,还应标明管道标高及坡度。 D.详图 当某些设备的构造或管道的连接情况在以上图中表示不清楚,用文字也说明不清,可将这些部分绘成详图。 E.设备及材料明细表 为方便施工备料,应将工程涉及的管材、阀门、仪表、容器设备等列出并制成明细表。一般表中项目包括:编号、名称、型号规格、单位、数量及备注等项目,其中备注栏内主要写明对材料设备有明确要求的生产厂家等。 2.设计图例 为使工程设计图纸,满足设计、报批、施工、存档、交流等方面的使用要求,图面中的线条粗细及符号的表示应尽量做到标准化、统一化。 A.图线、图例 各种管线、管材、阀门、仪表等所用图例均参见《建筑制图统一标准》、吉林省标《暖卫工程设计综合图例》。 B.文字 图纸上标注的文字均应以规范的仿宋字写出,在设计说明中列出的内容应全面、简明、扼要。 3.参考资料 A.《建筑给水排水工程》,王增长主编第五版中国建筑工业出版社。 B.《建筑给排水设计手册》刘文镔主编中国建筑工业出版社。 C.《建筑给排水设计规范》GBJ15-88。

概率论与数理统计期末考试题及答案

模拟试题 填空题(每空3分,共45 分) 1、已知P(A) = 0.92, P(B) = 0.93, P(B| A) = 0.85,则P(A| B)= P( A U B)= 1 2、设事件A与B独立,A与B都不发生的概率为—,A发生且B不发生的概率与 B 9 发生且A不发生的概率相等,则A发生的概率为:_______________________ ; 3、一间宿舍内住有6个同学,求他们之中恰好有4个人的生日在同一个月份的概率: ;没有任何人的生日在同一个月份的概率 I Ae x, X c 0 4、已知随机变量X的密度函数为:W(x) = {1/ 4, 0 < X V 2,则常数A= 0, x>2

分布函数F(x)= ,概率P{—0.51} =5/ 9,贝U p = 若X与丫独立,则Z=max(X,Y)的分布律: 6、设X ~ B(200,0.01), Y - P(4),且X 与丫相互独立,则D(2X-3Y)= COV(2X-3Y , X)= 7、设X1,X2,III,X5是总体X ~ N(0,1)的简单随机样本,则当k = 时, 丫"⑶; 8、设总体X~U(0,巧日:>0为未知参数,X i,X2,lil,X n为其样本, -1n X =—S X i为 n i 二 样本均值,则日的矩估计量为: 9、设样本X i,X2,川,X9来自正态总体N(a,1.44),计算得样本观察值X = 10,求参 数a的置信度为95%的置信区间: 计算题(35分) 1、(12分)设连续型随机变量X的密度函数为:

数理统计论文

研究生课程考核试卷 (适用于课程论文、提交报告) 科目:概率论与数理统计上课时间:2017.2-2017.5 姓名:刘振学号: 20160702031专业:机械工程教师:刘朝林 工作单位或所在行业:重庆大学 考生成绩: 卷面成绩平时成绩课程综合成绩阅卷评语: 阅卷教师 (签名)

回归分析在数理统计中的应用 摘要:回归分析是数理统计中重要的一种数据统计分析的思想, 是处理变量间的相关关系的一种有效工具。其目的在于根据已知自变量的变化来估计或预测因变量的变化情况,或者根据因变量来对自变量做一定的控制. 它可以提供变量间相关关系的数学表达式, 且利用概率统计知识,对经验公式及有关问题进行分析、判断以确定经验公式的有效性,从众多的解释变量中,判断哪些变量对因变量的影响是显著的,哪些是不显著的. 还可以利用所得经验公式,由一个或几个变量的值去预测或控制个变量的值时的值,去预测或控制另一个变量的取值,同时还可知道这种预测和控制可以达到什么样的精度。 本文就是针对实际问题运用回归分析中一元线性回归分析的统计方法,来确定自变量与 另一个变量的相关关系,并确立出较为合理的回归方程,再对其的可信度进行统计检验. 关键词:回归分析;回归方程;F检验法

1.问题的提出 调查一下重庆大学学生的生活费与家庭收入的关系,看看是否家庭收入越高,学生的每月支出也越多,从而根据学生每月消费支出,进而估计学生的家庭收入情况,对学生的生活补助等问题有重要的参考意义 2.数据描述 根据调研的重庆大学学生家庭月收入与每月生活费的数据,确定两者关系。数据来源100多份问卷调查的抽样,取其中10份,绘制表1如下图所示序号家庭月收入每月生活费14800 500 25200 600 35420 650 45600 700 56000 750 66400 800 76800 900 87000 1000 97200 1200 108000 1500 表1-1 重庆大学学生家庭月收入与每月生活费的数据利用matlab软件画出家庭月收入与每月生活费的散点图,如图一所示

数理统计课程设计一元线性回归

二氧化碳吸附量与活性炭孔隙结构的线性回归分析 摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。选取分布大致呈直线的一组数据为拟合的样本数据.对样本数据利用最小二乘法进行回归分析,参数确定,并对分析结果进行显著性检验。同时利用ma tl ab 的r egress 函数进行直线拟合。结果表明:孔径在3。 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。 关键字:活性炭 孔容 CO2吸附量 m atla b 一、问题分析 1。1.数据的收集和处理 本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴张双全,罗雪岭等人的研究成果[1]。以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的C O2吸附量和孔容的关系.数据如下表所示: 表1:孔分布与CO2吸附值 编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。因为处理方式不同得到不同结果是互不影响的,可以看出C O2的吸附量的值是互相独立 编号 孔容/(11 10L g μ--?) CO 2吸附 量 1/()mL g -? 0。5~0。8nm 0.8~1.2nm 1。2~1。8nm 1.8~2。2nm 2.2~2。2n m 2。5~3。0nm 3.0~3。5 nm 1 7.18 16.2 24.4 75.2 70 96 115 64 2 6.59 14.4 18.4 53.7 50 85。6 91 55.1 3 4.5 4 11 18.9 71 6 5 78.3 91 53.7 4 5.13 13.4 29。9 10。3 90 7 6 122 53。 7 5 4.16 10.5 18。9 83.8 78 80。5 113 61。7 6 4。92 12。1 23.4 81.6 72 56 99 53.6 7 5.0 8 12.6 23.8 93.5 86 77.8 122 65。5 8 5.29 13 25。1 88.4 69 66.4 107 57。7 9 7.47 16.9 26.9 46。4 78 93.2 107 58.2 10 5.44 13 21.4 44.1 91 98.6 137 76。6 11 1。81 64。6 18.3 53.1 114 110 142 75 12 1.24 27.7 39。5 126 114 98。6 183 98.7

应用数理统计课程小论文数据,结果,分析过程

1 聚类分析 我们利用Matlab6.5中的cluster 命令实现,具体程序如下 x={ {n,m}=size(x); Stdr=std(x); xx=x./stdr(ones(n,1),;); % 标准化变换 y=pdist(xx); %计算各样本间距离(这里为欧氏距离) z=linkage(y); %进行聚类(这里为最短距离法) h=dendrogram(z); %画聚类谱系图 t=cluster(z,3) % 将全部样本分为3类 find(t==2); %找出属于第2类的样品编号 执行后得到所要结果 聚类谱系图见图1 t={3,1,3,1,1,2,2} 即全部样本分为3类。结果见表1 从图 1可以看出:七条河流中, 二干河、横套河、四干河属于一类, 污染 较重, 主要是CODmn 、BOD5超标多; 华妙河、盐铁塘属于一类, 污染一般, 主要是氨氮、石油类超标; 张家港河、东横河属于一类,污染较轻, 总的来说,各河流都存在不同程度的污染,因此全市应对各河流严格监督管理, 着力实施水污染防治工作, 太湖流域水污染源应限期治理达标排放, 巩固水污染防治工作成果,加大投入,新建或改、 扩建废水治理工程, 确保达标排放。 3.14 5.47 3.1 5.67 6.81 6.21 4.87 8.41 9.57 4.31 9.54 9.05 7.08 8.97 23.78 26.48 21.2 10.23 16.18 21.05 26.54 25.79 23.79 22.48 20.87 24.56 31.56 34.56 4.17 6.42 5.34 4.2 5.2 6.15 5.58 6.47 5.58 6.54 6.8 5.45 8.21 8.07 }

2012级数理统计课程设计题目(最终)

课设要求: 1. 用R语言编写程序. 2. 理论方法先写出来,并附上程序. 程序中用注释详细的写出每一步的产生思路. 其中题目5供4人选择、其余题目分别供3人选择。注意同一个题目的三到四个人之间可以讨论, 但是不允许抄袭. 不能完全一致, 按自己想法独立完成. 3. 利用第二周第三周搜集资料, 完成课设. 第四周课设答辩, 具体时间另行通知. 答辩时每组选出一名代表汇报即可. 4. 答辩之后需要上交学生的课设实验报告, 程序源代码, 还有答辩

2012级数理统计课程设计题目 1. 已知两样本 A:79.98 80.04 80.02 80.04 80.03 80.03 80.04 79.97 80.05 80.03 80.02 80.00 80.02 B:80.02 79.94 79.98 79.97 79.97 80.03 79.95 79.97 计算两样本的T 统计量。 2. 建立一个R 文件,在文件中输入变量)3,2,1('=x ,)6,5,4('=y ,并作以下运算 (1) 计算e y x z ++=2,其中)1,1,1('=e ; (2) 计算x 与y 的内积; (3) 计算x 与y 的外积. 3. 已知有5名学生的数据,如表1所示,用数据框的形式输入数据. 4. 编写一个R 程序(函数),输入一个整数n ,如果n<=0,则终止运算,并输出一句话:“要 求输入一个正整数”;否则,如果n 是偶数,则将n 除2,并赋给n ;否则,将3n+1赋给n 。不断循环,直到n=1,才停止计算,并输出一句话:“运算成功”。 5. 某单位对100名女生测定血清总蛋白含量(g/L ),数据如下: 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0 70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7 67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7 75.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.3 73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4 计算均值、方差、标准差、极差、标准误差、变异系数、偏度、峰度。 6. 绘出5题数据的直方图、密度估计曲线图、经验分布图和QQ 图,并将密度估计曲线与 正态密度曲线相比较,将经验分布曲线于正态分布曲线相比较(其中正态曲线的均值和

概率论与数理统计期末考试试题及答案

《概率论与数理统计》期末考试试题(A) 专业、班级: 姓名: 学号: 十二总成绩 、单项选择题(每题3分共18分) 1. D 2 . A 3 . B 4 . A 5 . (1) (2)设随机变量X其概率分布为X -1 0 1 2 P 则 P{X 1.5}() (A) (B) 1 (C) 0 (D) 设事件A与A同时发生必导致事件A发生,则下列结论正确的是( (A) P (A) P(A I A2) (B) P(A) P(A i) P(A2) (C) P(A) P(A1 A2) (D) P(A) P(A i) P(A2) 设随机变量X~N( 3, 1), Y ?N(2, 1),且X 与Y相互独 7,贝y z~(). (A) N(0, 5); (B) N(0, 3); (C) N(0, 46); (D) N(0, 54).

(5)设 X1X2, 未知,贝U( n (A) X i2 i 1 ,X n为正态总体N(, )是一个统计量。 (B) (C) X (D) (6)设样本X i,X2, 为H o: (A)U (C) 2)的一个简单随机样本,其中2, ,X n来自总体X ~ N( 0( 0已知) (n 1)S2 2 二、填空题(每空3分 xe x 1. P(B) 2. f(x) 0 (1) 如果P(A) 0, P(B) H1 : (B) (D) 共15分) 0, P(A B) 设随机变量X的分布函数为 F(x) 则X的密度函数f(x) 3e P(A) n (X i ) i 1 2), 2未知。统计假设 则所用统计量为( 3 . 1 4. 则P(BA) 0, 1 (1 x)e x, x 0, 0. n (X i 1 P(X 设总体X和丫相互独立,且都服从N(0,1) , X1,X2, 样本,丫1,丫2, Y9是来自总体丫的样本,则统计量 服从分布(要求给出自由度)。t(9 ) 2) )2 X9是来自总体X的 X1 U肩

数理统计小论文

研究生“数理统计”课程课外作业 姓名:罗冲学号:20131002006 学院:动力工程学院专业:动力工程 类别:学术型上课时间:2013.9—2013.12 成绩:

城市供水管道长度与用水人口回归分析 摘要 为了分析城市居民供水问题,通过在国家统计局搜集数据,找到城市供水管道的长度和城市用水人口的相关数据,进行回归分析,运用参数估计、假设检验、回归分析的方法对其进行分析。讨论供水管道Y和用水人口X之间的线性关系,并讨论其在显著水平为α=0.05下,检验x和y是否具有显著线性关系。所以通过上述分析可以得到,供水管道的长度和用水人口成线性相关性。运用统计学知识,可以解决生活的问题。说明了随着人口的增长会,增加城市的供水管道的长度。 正文 一、问题提出,问题分析。 统计了有关供水的数据,通过对数据的分析,讨论供水管道Y和用水人口X 之间的线性关系,并讨论其在显著水平为α=0.05下,检验x和y是否具有显著线性关系;应用参数估计、假设检验、回归分析来解决问题。 二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据) 问题中所给出的数据来源于国家统计局网站上面的相关信息,城市供水的信息。其中包括了生活、生产用水和用水人口、供水重量、管道长度等信息,选取的数据是2011年到2006年(如下表),进行相关分析。

三、模型建立: (1)提出假设条件,明确概念,引进参数; 讨论供水管道Y 和用水人口X 之间的线性关系,采用一元线性回归模型。 Y=β0+β1x+ ε ε~ N(0,2σ) 回归函数:y=β0+β1x 采用最小二乘法,求出相应的估计值: X =6 116=∑i i x =36036.4 Y =6 1 16=∑i i Y =496943.59 通过计算可以得到: l xx =6 21 ()i i x x - =-∑=34337890.49 l yy =21 ()n i i y y - =-∑=1.510297x1010 l xy =6 1 ()i i i x x y - =-∑=701606286 ^ y = ^β0+ ^ β1x (2)模型构建; 一元线性回归模型,进行求解,并会对其进行相关的验证。根据教材的相关公式进行求解。

概率概率论与数理统计课程设计

成绩评定表

课程设计任务书

摘要 21世纪信息技术迅猛发展,给人类的生产生活带来了深远的影响,无疑我们已经身处在一个信息化时代,信息的发展快慢在一定程度上决定了我国的发展,因此我国需要大量的信息人才,信息人才的培养至关重要,对此我们调查了某学校信息学院的学生汇编成绩,利用概率论与数理统计的知识对其进行系统的分析,为学校培养高素质的信息人才提供依据,概率论与数理统计作为数学中一个重要部分,在生活中的应用越来越广,同样也在发挥着越来越广泛的作用,现实生活中国存在着许多偶然现象,但这些偶然并不是没有规律的,概率论与数理统计将这蕴含在其中的规律找出,方便了人们的生产生活。而假设检验和方差分析本在这门学科中有着不可小视的重要性。 本文就是利用了假设检验和方差分析来对学生成绩进行分析,首先对学生汇编成绩的分布进行假设,其次利用皮尔逊2 对所得的分步进行检验,结合Matlab 数据处理软件与Excel数据处理软件求出想要得到的结果,最后用单因素的方差分析判断学生汇编课设等级对学生汇编成绩的影响,从而得到学生实际操作能力跟理论结合的情况。 关键词:假设检验;单因素方差分析;Matlab;Excel;

目录 1 设计目的 (1) 2 设计问题 (1) 3 设计原理 (2) 4 设计程序 (5) 4.1 问题一的解决 (5) 4.1.1 做出直方图 (5) 4.1.2 做假设检验 (6) 4.1.3 检验原假设 (8) 4.2 问题二的解决 (10) 4.2.1 计算平方和 (10) 4.2.2 比较F值和临界值 (11) 5 结果分析 (12) 6 设计总结 (12) 致谢 (13) 参考文献 (14)

相关文档
最新文档