回归分析方法总结全面

回归分析方法总结全面
回归分析方法总结全面

一、什么是回归分析

回归分析(Regression Analysis)是研究变量之间作用关系的一种统计分析方法,其基本组成是一个(或一组)自变量与一个(或一组)因变量。回归分析研究的目的是通过收集到的样本数据用一定的统计方法探讨自变量对因变量的影响关系,即原因对结果的影响程度。

回归分析是指对具有高度相关关系的现象,根据其相关的形态,建立一个适当的数学模型(函数式),来近似地反映变量之间关系的统计分析方法。利用这种方法建立的数学模型称为回归方程,它实际上是相关现象之间不确定、不规则的数量关系的一般化。

二、回归分析的种类

1.按涉及自变量的多少,可分为一元回归分析和多元回归分析一元回归分析是对一个因变量和一个自变量建立回归方程。多元回归分析是对一个因变量和两个或两个以上的自变量建立回归方程。

2.按回归方程的表现形式不同,可分为线性回归分析和非线性回归分析

若变量之间是线性相关关系,可通过建立直线方程来反映,这种分析叫线性回归分析。

若变量之间是非线性相关关系,可通过建立非线性回归方程来反映,这种分析叫非线性回归分析。

三、回归分析的主要内容

1.建立相关关系的数学表达式。依据现象之间的相关形态,建立适当的数学模型,通过数学模型来反映现象之间的相关关系,从数量上近似地反映变量之间变动的一般规律。

2.依据回归方程进行回归预测。由于回归方程反映了变量之间的一般性关系,因此当自变量发生变化时,可依据回归方程估计出因变量可能发生相应变化的数值。因变量的回归估计值,虽然不是一个必然的对应值(他可能和系统真值存在比较大的差距),但至少可以从一般性角度或平均意义角度反映因变量可能发生的数量变化。

3.计算估计标准误差。通过估计标准误差这一指标,可以分析回归估计值与实际值之间的差异程度以及估计值的准确性和代表性,还可利用估计标准误差对因变量估计值进行在一定把握程度条件下的区间估计。

四、一元线性回归分析

1.一元线性回归分析的特点

1)两个变量不是对等关系,必须明确自变量和因变量。

2)如果x和y两个变量无明显因果关系,则存在着两个回归方程:一个是以x为自变量,y 为因变量建立的回归方程;另一个是以y为自变量,x为因变量建立的回归方程。若绘出图形,则是两条斜率不同的回归直线。

3)直线回归方程中,回归系数b可以是正值,也可以是负值。若0 b > ,表示直线上升,说明两个变量同方向变动;若0 b < ,表示直线下降,说明两个变量是反方向变动。

2.建立一元线性回归方程的条件

任何一种数学模型的运用都是有前提条件的,配合一元线性回归方程应具备以下两个条件:1)两个变量之间必须存在高度相关的关系。

两个变量之间只有存在着高度相关的关系,回归方程才有实际意义。

2)两个变量之间确实呈现直线相关关系。

两个变量之间只有存在直线相关关系,才能配合直线回归方程。

3.建立一元线性回归方程的方法

一元线性回归方程是用于分析两个变量(一个因变量和一个自变量)线性关系的数学表达式,一般形式为:y c=a+bx

式中:x代表自变量;

y c代表因变量y的估计值(又称理论值);

ab为回归方程参数。其中,a是直线在y轴上的截距,它表示当自变量x等于0 时,因变量所达到的数值;b是直线的斜率,在回归方程中亦称为回归系数,它表示当自变量x每变动一个单位时,因变量y平均变动的数值。

一元线性回归方程应根据最小二乘法原理建立,因为只有用最小二乘法原理建立的回归方程才可以同时满足两个条件:

1)因变量的实际值与回归估计值的离差之和为零;

2)因变量的实际值与回归估计值的离差平方和为最小值。

只有满足这两个条件,建立的直线方程的误差才能最小,其代表性才能最强。

现在令要建立的一元线性回归方程的标准形式为y c=a+bx,依据最小二乘法原理,因变量实际值y与估计值y c的离差平方和为最小值,即Q=∑(y-y c)2取得最小值。为使Q=∑(y-y c)2=最小值根据微积分中求极值的原理,需分别对a,b求偏导数,并令其为0,经过整理,可得到如下方程组:

∑y=an+b∑x

∑xy=a∑x+b∑x2

解此方程组,可求得a,b两个参数

4. 计算估计标准误差

回归方程只反映变量x和y之间大致的、平均的变化关系。因此,对每一个给定的x值,回归方程的估计值y c与因变量的实际观察值y之间总会有一定的离差,即估计标准误差。

估计标准误差是因变量实际观察值y与估计值y c离差平方和的平均数的平方根,它反映因变量实际值y与回归直线上各相应理论值y c之间离散程度的统计分析指标。

估计标准误差:

式中:s y——估计标准误差;y——因变量实际观察值;y c——因变量估计值;n-2——自由度如何描述两个变量之间线性相关关系的强弱?

利用相关系数r来衡量

当r>0时,表示x与y为正相关; 当r<0时,表示x与y为负相关。

5.残差分析与残差图:残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差

在研究两个变量间的关系时,

a) 要根据散点图来粗略判断它们是否线性相关;

b) 判断是否可以用回归模型来拟合数据;

c) 可以通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作就称为残差分析。

6.残差图的制作及作用。

坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布

在以横轴为心的带状区域,带状区域的宽度越窄精度越高。对于远离横轴的点,要特别注意。

7.几点注解:

第一个样本点和第6 个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就应该予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。

另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。还可以用判定系数r2来刻画回归的效果,该指标测度了回归直线对观测数据的拟合程度,其计算公式是:

其中:SSR -回归平方和;

SSE -残差平方和;

Sst=ssr+sse总离差平方和。

由公式知,R(相关指数)的值越大,说明残差平方和越小,也就是说模型拟合效果越好。在含有一个解释变量的线性模型中r2恰好等于相关系数r的平方,即R2=r2

在线性回归模型中,R2表示解释变量对预报变量变化的贡献率。R2越接近1,表示回归的效果越好(因为R2越接近1,表示解释变量和预报变量的线性相关性越强)。

如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。

总的来说:相关指数R2是度量模型拟合效果的一种指标。在线性模型中,它代表自变量刻画预报变量的能力。

五、多元线性回归分析

在一元线性回归分析中,因变量y只受某一个因素的影响,即只由一个自变量x来估计。但对于复杂的自然界中的问题,影响因素往往很多,在这种情况下,因变量y要用多个自变量同时进行估计。例如,某种产品的总成本不仅受原材料价格的影响,而且也与产品产量、管理水平等因素有关;农作物产量的髙低受品种、气候、施肥量等多个因素的影响。描述因变量与两个或两个以上自变量之间的数量关系的回归分析方法称为多元线性回归分析。它是一元线性回归分析的推广,其分析过程相对复杂一些,但基本原理与一元线性回归分析类似。多元线性回归方程的一般表达式为:

为便于分析,当自变量较多时可选用两个主要的自变量x1和x2。其线性回归方程标准式为:

其中:y c为二元回归估计值;a为常数项;b1和b2分别为y对x1和x2的回归系数,b1表示当自变量x2为一定时,由于自变量x1变化一个单位而使y平均变动的数值,b2表示当自变量x1为一定时,由于自变量x2变化一个单位而使y平均变动的数值,因此,b1和b2称为偏回归系数。

要建立二元回归方程,关键问题是求出参数a,b1和b2的值,求解方法仍用最小二乘法,即分别对a,b1和b2求偏导数,并令函数的一阶导数等于零,可得如下方程组:

(二)

在回归分析中,通常称自变量为回归因子,一般用表示,而称因变量为指标,

一般用表示。预测公式:,称之为回归方程。回归

模型,按照各种原则可以分为各种模型:

1. 当n =1 时,称为一元(单因子)回归;当n ≥2时,称为多元(多因子)回归。

2. 当f 为线性函数时,称为线性回归;当f 为非线性函数时,称为非线性(曲线)回归。最小二乘准则:

假设待定的拟合函数为,另据m个数据点,相当于求解以下规划问题:

即使得总离差平方和最小。具体在线性拟合的过程中,假设拟合函数为y=a+bx,a与b为待

定系数,已知有m个数据点,分别为,应用最小二乘法,就是要使:

达到最小值。

把S 看成自变量为a和b的连续函数,则根据连续函数达到及致电的必要条

件,于是得到:

因此,当S 取得最小值时,有:

可得方程组为:

称这个方程组为正规方程组,解这个二元一次方程组,得到:

如果把已有数据描绘成散点图,而且从散点图中可以看出,各个数据点大致分布在一条直线附近,不妨设他们满足线性方程:其中,x为自变量,y为因变量,a与b为

待定系数;ε成为误差项或者扰动项。

这里要对数据点做线性回归分析,从而a和b就是待定的回归系数,ε为随机误差。

不妨设得到的线性拟合曲线为:

这就是要分析的线性回归方程。一般情况下,得到这个方程以后,主要是描绘出

回归曲线,并且观测拟合效果和计算一些误差分析指标,例如最大点误差、总方差和标准差等。

这里最缺乏的就是一个统一的评价系统,以下说明从概率角度确立的关于线性回归的一套评价系统。

在实际的线性回归分析中,除了估计出线性回归系数a和b,还要计算y和x的相关程度,即相关性检验。相关性检验主要通过计算相关系数来分析,相关系数的计算公式为:

其中n为数据点的个数,为原始数据点,r的值能够很好地反映出线性相关程度的

高低,一般来说,存在以下一些标准:

1. 当r →1 或者r →?1时,表示y与x高度线性相关,于是由原始数据描绘出的散点图中所有数据点都分布在一条直线的附近,分别称为正相关和负相关;

2. 当r →0 时,表示y与x不相关,由原始数据描绘出的散点图的数据点一般呈无规律的特点四散分布;

3. 当?1

4. 如果r →1,则y与x线性相关程度越高;反之,如果r →0 ,则y与x线性相关程度越低。

实际计算r值的过程中,长列表计算,即:

在实际问题中,一般要保证回归方程有最低程度的线性相关。因为许多实际问题中,两个变量之间并非线性的相关关系,或者说线性相关程度不高,此时硬给他建立线性回归方程,显然没有太大意义,也没有什么实用价值。

一般来说,把这个最低限度的值记为临界值,称之为相关性检验标准。因此,如果计算

出r的值,并且满足,则符合相关性要求,线性回归方程作用显著。反之,如果

,则线性回归方程作用不显著,就尽量不要采用线性回归方程。临界值的数值表如下:

其中,自由度可以由原始数据点的个数减去相应的回归方程的变量个数,例如线性回归方程中有两个变量,而数据点的个数为n个,则自由度为n ? 2.自由度一般记为 f ,但不要与一般的函数发生混淆。显著性水平一般取为0.01,0.02,0.05等,利用它可以计算y与x之间相关关系的可信程度或者称为置信水平,计算公式为:

(这里取显著性水平为α =0.05 )

现在介绍置信区间的问题,由于实际误差的存在,由线性拟合得到的计算值跟实际值之间必然存在一定的差距,其差值就是计算误差。假设原始数据点为,计算得到的数据点为,再给定附近的一个区间:则实际值y i可能落在这个区间内,

也可能落在这个区间外。如果所有的这些区间

(以为中心,长度为)包含实际值的个数占总数的比例达到95%或者以上,则称这些区

间的置信水平不少于95%

根据以上的分析,可以知道置信区间的概念,如果确定了置信水平为95%,从而可以找到相应的最小的Δt值,使得95%以上的实际值落在区间内,则

称为预测值满足置信水平95%的置信区间。一般情况下,如果不做特别说明,置信区间的相应置信水平默认为95%,置信区间反映了回归方程的适用范围和精确度,特别的,当所有离散数据分布在回归曲线的附件,大致呈现为正态分布时,置信区间为:其中S 为该回归模型的标准差,计算公式为:

或者为:

那么,如果回归方程为y=a+bx,则有两条控制直线分别为和

,他们代表了置信区间的上限和下限,如下图所示:

那么,可以预料实际的数据点几乎全部(至少95%)落在上图两条虚线所夹的区域内。

这里对回归方程的应用做一个总结:

1. 估计、预测指标值。对于因子x的一个给定值x0,代入回归预测方程即可求出相应的指标值,称为指标y0的点估计,相应预测误差为但是,真实指标

y0 的值一般无法确知,预测精度只能根据回归误差来做估计。在回归预测中,预测的精度可以用均方差和标准差的比值来估计;

2. 估计指标值范围。估计指标值的范围,就是求给定x0 ,相应于某个给定的置信水平的置信区间。具体的求法,要应用到t分布;

3. 控制因子取值。在某些实际问题中,特别当因子值可以人为的控制、调解时,也可以根据所要达到的指标值,反过来推出因子的取值,这就是因子值的控制。

材料分析方法课后答案(更新至第十章)

材料分析方法课后练习题参考答案 2015-1-4 BY:二专业の学渣 材料科学与工程学院

3.讨论下列各组概念的关系 答案之一 (1)同一物质的吸收谱和发射谱; 答:λk吸收〈λkβ发射〈λkα发射 (2)X射线管靶材的发射谱与其配用的滤波片的吸收谱。 答:λkβ发射(靶)〈λk吸收(滤波片)〈λkα发射(靶)。任何材料对X射线的吸收都有一个Kα线和Kβ线。如Ni 的吸收限为0.14869 nm。也就是说它对0.14869nm波长及稍短波长的X射线有强烈的吸收。而对比0.14869稍长的X射线吸收很小。Cu靶X射线:Kα=0.15418nm Kβ=0.13922nm。 (3)X射线管靶材的发射谱与被照射试样的吸收谱。 答:Z靶≤Z样品+1 或Z靶>>Z样品 X射线管靶材的发射谱稍大于被照射试样的吸收谱,或X射线管靶材的发射谱大大小于被照射试样的吸收谱。在进行衍射分析时,总希望试样对X射线应尽可能少被吸收,获得高的衍射强度和低的背底。 答案之二 1)同一物质的吸收谱和发射谱; 答:当构成物质的分子或原子受到激发而发光,产生的光谱称为发射光谱,发射光谱的谱线与组成物质的元素及其外围电子的结构有关。吸收光谱是指光通过物质被吸收后的光谱,吸收光谱则决定于物质的化学结构,与分子中的双键有关。 2)X射线管靶材的发射谱与其配用的滤波片的吸收谱。 答:可以选择λK刚好位于辐射源的Kα和Kβ之间的金属薄片作为滤光片,放在X射线源和试样之间。这时滤光片对Kβ射线强烈吸收,而对Kα吸收却少。 6、欲用Mo 靶X 射线管激发Cu 的荧光X 射线辐射,所需施加的最低管电压是多少?激发出的荧光辐射的波长是多少? 答:eVk=hc/λ Vk=6.626×10-34×2.998×108/(1.602×10-19×0.71×10-10)=17.46(kv) λ0=1.24/v(nm)=1.24/17.46(nm)=0.071(nm) 其中h为普郎克常数,其值等于6.626×10-34 e为电子电荷,等于1.602×10-19c 故需加的最低管电压应≥17.46(kv),所发射的荧光辐射波长是0.071纳米。 7、名词解释:相干散射、非相干散射、荧光辐射、吸收限、俄歇效应 答:⑴当χ射线通过物质时,物质原子的电子在电磁场的作用下将产生受迫振动,受迫振动产生交变电磁场,其频率与入射线的频率相同,这种由于散射线与入射线的波长和频率一致,位相固定,在相同方向上各散射波符合相干条件,故称为相干散射。 ⑵当χ射线经束缚力不大的电子或自由电子散射后,可以得到波长比入射χ射线长的χ射线,且波长随散射方向不同而改变,这种散射现象称为非相干散射。

回归分析方法及其应用中的例子

3.1.2 虚拟变量的应用 例3.1.2.1:为研究美国住房面积的需求,选用3120户家庭为建模样本,回归模型为: 123log log P Y βββ++logQ= 其中:Q ——3120个样本家庭的年住房面积(平方英尺) 横截面数据 P ——家庭所在地的住房单位价格 Y ——家庭收入 经计算:0.247log 0.96log P Y -+logy=4.17 2 0.371R = ()() () 上式中2β=0.247-的价格弹性系数,3β=0.96的收入弹性系数,均符合经济学的常识,即价格上升,住房需求下降,收入上升,住房需求也上升。 但白人家庭与黑人家庭对住房的需求量是不一样的,引进虚拟变量D : 01i D ?=?? 黑人家庭 白人家庭或其他家庭 模型为:112233log log log log D P D P Y D Y βαβαβα+++++logQ= 例3.1.2.2:某省农业生产资料购买力和农民货币收入数据如下:(单位:十亿元) ①根据上述数据建立一元线性回归方程:

? 1.01610.09357y x =+ 20.8821R = 0.2531y S = 67.3266F = ②带虚拟变量的回归模型,因1979年中国农村政策发生重大变化,引入虚拟变量来反映农村政策的变化。 01i D ?=?? 19791979i i <≥年 年 建立回归方程为: ?0.98550.06920.4945y x D =++ ()() () 20.9498R = 0.1751y S = 75.6895F = 虽然上述两个模型都可通过显着性水平检验,但可明显看出带虚拟变量的回归模型其方差解释系数更高,回归的估计误差(y S )更小,说明模型的拟合程度更高,代表性更好。 3.5.4 岭回归的举例说明 企业为用户提供的服务多种多样,那么在这些服务中哪些因素更为重要,各因素之间的重要性差异到底有多大,这些都是满意度研究需要首先解决的问题。国际上比较流行并被实践所验证,比较科学的方法就是利用回归分析确定客户对不同服务因素的需求程度,具体方法如下: 假设某电信运营商的服务界面包括了A1……Am 共M 个界面,那么各界面对总体服务满意度A 的影响可以通过以A 为因变量,以A1……Am 为自变量的回归分析,得出不同界面服务对总体A 的影响系数,从而确定各服务界面对A 的影响大小。 同样,A1服务界面可能会有A11……A1n 共N 个因素的影响,那么利用上述方法也可以计算出A11……A1n 对A1的不同影响系数,由此确定A1界面中的重要因素。 通过两个层次的分析,我们不仅得出各大服务界面对客户总体满意度影响的大小以及不同服务界面上各因素的影响程度,同时也可综合得出某一界面某一因素对总体满意度的影响大小,由此再结合用户满意度评价、与竞争对手的比较等因素来确定每个界面细分因素在以后工作改进中的轻重缓急、重要性差异等,从而起到事半功倍的作用。 例 3.5.4:对某地移动通信公司的服务满意度研究中,利用回归方法分析各服务界面对总体满意度的影响。 a. 直接进入法 显然,这种方法计算的结果中,C 界面不能通过显着性检验,直接利用分析结果是错误

相关分析与回归分析的异同

问:请详细说明相关分析与回归分析的相同与不同之处 相关分析与回归分析都是研究变量相互关系的分析方法,相关分析是回归分析的基础,而回归分析则是认识变量之间相关程度的具体形式。 下面分为三个部分详细描述两种分析方法的异同: 第一部分:相关分析 一、相关的含义与种类 (一)相关的含义 相关是指自然与社会现象等客观现象数量关系的一种表现。 相关关系是指现象之间确实存在的一定的联系,但数量关系表现为不严格相互依存关系。即对一个变量或几个变量定一定值时,另一变量值表现为在一定范围内随机波动,具有非确定性。如:产品销售收入与广告费用之间的关系。 (二)相关的种类 1. 根据自变量的多少划分,可分为单相关和复相关 2. 根据相关关系的方向划分,可分为正相关和负相关 3. 根据变量间相互关系的表现形式划分,线性相关和非线性相关 4.根据相关关系的程度划分,可分为不相关、完全相关和不完全相关 二、相关分析的意义与内容 (一)相关分析的意义 相关分析是研究变量之间关系的紧密程度,并用相关系数或指数来表示。其目的是揭示现象之间是否存在相关关系,确定相关关系的表现形式以及确定现象变量间相关关系的密切程度和方向。 (二)相关分析的内容 1. 明确客观事物之间是否存在相关关系 2. 确定相关关系的性质、方向与密切程度 三、直线相关的测定 (一)相关表与相关图 1. 相关表 在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称为相关表。 2. 相关图

把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为相关图。利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。 (二)相关系数 1. 相关系数的含义与计算 相关系数是直线相关条件下说明两个变量之间相关关系密切程度的统计分析指标。相关系数的理论公式为: y x xy r δδδ2= (1)xy 2δ 协方差 x δ x 的标准差 y δ y 的标准差 (2)xy 2δ 协方差对相关系数r 的影响,决定:???<>数值的大小正、负)或r r r (00 简化式 ()()2222∑∑∑∑∑∑∑-?--= y y n x x n y x xy n r 变形:分子分母同时除以2 n 得 r =???????????? ??-???????????? ??-?-∑∑∑∑∑∑∑2222n y n y n x n x n y n x n xy =()[]()[]2222y y x x y x xy -*-?-=y x y x xy δδ-?- n x x x ∑-=2)(δ=()[]n x x x x ∑+?-222=()222x n x x n x +??-∑∑ = () 22x x - 2. 相关系数的性质

材料测试分析方法(究极版)

绪论 3分析测试技术的发展的三个阶段? 阶段一:分析化学学科的建立;主要以化学分析为主的阶段。 阶段二:分析仪器开始快速发展的阶段 阶段三:分析测试技术在快速、高灵敏、实时、连续、智能、信息化等方面迅速发展的阶段4现代材料分析的内容及四大类材料分析方法? 表面和内部组织形貌。包括材料的外观形貌(如纳米线、断口、裂纹等)、晶粒大小与形态、各种相的尺寸与形态、含量与分布、界面(表面、相界、晶界)、位向关系(新相与母相、孪生相)、晶体缺陷(点缺陷、位错、层错)、夹杂物、内应力。 晶体的相结构。各种相的结构,即晶体结构类型和晶体常数,和相组成。 化学成分和价键(电子)结构。包括宏观和微区化学成份(不同相的成份、基体与析出相的成份)、同种元素的不同价键类型和化学环境。 有机物的分子结构和官能团。 形貌分析、物相分析、成分与价键分析与分子结构分析四大类方法 四大分析:1图像分析:光学显微分析(透射光反射光),电子(扫描,透射),隧道扫描,原子力2物象:x射线衍射,电子衍射,中子衍射3化学4分子结构:红外,拉曼,荧光,核磁 获取物质的组成含量结构形态形貌及变化过程的技术 材料结构与性能的表征包括材料性能,微观性能,成分的测试与表征 6.现代材料测试技术的共同之处在哪里? 除了个别的测试手段(扫描探针显微镜)外,各种测试技术都是利用入射的电磁波或物质波(如X射线、高能电子束、可见光、红外线)与材料试样相互作用后产生的各种各样的物理信号(射线、高能电子束、可见光、红外线),探测这些出射的信号并进行分析处理,就课获得材料的显微结构、外观形貌、相组成、成分等信息。 9.试总结衍射花样的背底来源,并提出一些防止和减少背底的措施 衍射花样要素:衍射线的峰位、线形、强度 答:(I)花材的选用影晌背底; (2)滤波片的作用影响到背底;(3)样品的制备对背底的影响 措施:(1)选靶靶材产生的特征x射线(常用Kα射线)尽可能小的激发样品的荧光辐射,以降低衍射花样背底,使图像清晰。(2)滤波,k系特征辐射包括Ka和kβ射线,因两者波长不同,将使样品的产生两套方位不同得衍射花样;选择浪滋片材料,使λkβ靶<λk滤<λkα,Ka射线因因激发滤波片的荧光辐射而被吸收。(3)样品,样品晶粒为50μm左右,长时间研究,制样时尽量轻压,可减少背底。 11.X射线的性质; x射线是一种电磁波,波长范围:0.01~1000à X射线的波长与晶体中的原子问距同数量级,所以晶体可以用作衍射光栅。用来研究晶体结构,常用波长为0.5~2.5à 不同波长的x射线具有不同的用途。硬x射线:波长较短的硬x封线能量较高,穿透性较强,适用于金属部件的无损探伤及金属物相分析。软x射线:波长较长的软x射线的能量较低,穿透性弱,可用干分析非金属的分析。用于金属探伤的x射线波长为0.05~0.1à当x射线与物质(原子、电子作用时,显示其粒子性,具有能量E=h 。产生光电效应和康普顿效应等 当x射线与x射线相互作用时,主要表现出波动性。 x射线的探测:荧光屏(ZnS),照相底片,探测器

回归分析方法

第八章 回归分析方法 当人们对研究对象的内在特性和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型。如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,那么通常的办法是搜集大量数据,基于对数据的统计分析去建立模型。本章讨论其中用途非常广泛的一类模型——统计回归模型。回归模型常用来解决预测、控制、生产工艺优化等问题。 变量之间的关系可以分为两类:一类叫确定性关系,也叫函数关系,其特征是:一个变量随着其它变量的确定而确定。另一类关系叫相关关系,变量之间的关系很难用一种精确的方法表示出来。例如,通常人的年龄越大血压越高,但人的年龄和血压之间没有确定的数量关系,人的年龄和血压之间的关系就是相关关系。回归分析就是处理变量之间的相关关系的一种数学方法。其解决问题的大致方法、步骤如下: (1)收集一组包含因变量和自变量的数据; (2)选定因变量和自变量之间的模型,即一个数学式子,利用数据按照最小二乘准则计算模型中的系数; (3)利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型; (4)判断得到的模型是否适合于这组数据; (5)利用模型对因变量作出预测或解释。 应用统计分析特别是多元统计分析方法一般都要处理大量数据,工作量非常大,所以在计算机普及以前,这些方法大都是停留在理论研究上。运用一般计算语言编程也要占用大量时间,而对于经济管理及社会学等对高级编程语言了解不深的人来说要应用这些统计方法更是不可能。MATLAB 等软件的开发和普及大大减少了对计算机编程的要求,使数据分析方法的广泛应用成为可能。MATLAB 统计工具箱几乎包括了数理统计方面主要的概念、理论、方法和算法。运用MATLAB 统计工具箱,我们可以十分方便地在计算机上进行计算,从而进一步加深理解,同时,其强大的图形功能使得概念、过程和结果可以直观地展现在我们面前。本章内容通常先介绍有关回归分析的数学原理,主要说明建模过程中要做的工作及理由,如模型的假设检验、参数估计等,为了把主要精力集中在应用上,我们略去详细而繁杂的理论。在此基础上再介绍在建模过程中如何有效地使用MATLAB 软件。没有学过这部分数学知识的读者可以不深究其数学原理,只要知道回归分析的目的,按照相应方法通过软件显示的图形或计算所得结果表示什么意思,那么,仍然可以学到用回归模型解决实际问题的基本方法。包括:一元线性回归、多元线性回归、非线性回归、逐步回归等方法以及如何利用MATLAB 软件建立初步的数学模型,如何透过输出结果对模型进行分析和改进,回归模型的应用等。 8.1 一元线性回归分析 回归模型可分为线性回归模型和非线性回归模型。非线性回归模型是回归函数关于未知参数具有非线性结构的回归模型。某些非线性回归模型可以化为线性回归模型处理;如果知道函数形式只是要确定其中的参数则是拟合问题,可以使用MATLAB 软件的curvefit 命令或nlinfit 命令拟合得到参数的估计并进行统计分析。本节主要考察线性回归模型。 8.1.1 一元线性回归模型的建立及其MATLAB 实现 其中01ββ,是待定系数,对于不同的,x y 是相互独立的随机变量。 假设对于x 的n 个值i x ,得到 y 的n 个相应的值i y ,确定01ββ,的方法是根据最小二乘准则,要使 取最小值。利用极值必要条件令 01 0,0Q Q ββ??==??,求01ββ,的估计值01??ββ,,从而得到回归直线01 ??y x ββ=+。只不过这个过程可以由软件通过直线拟合完成,而无须进行繁杂的运算。

回归分析方法应用实例

4、回归分析方法应用实例 在制定运动员选材标准时,理论上要求先对不同年龄的运动员,各测试一个较大的样本,然后,计算出各年龄的平均数、标准差,再来制定标准。 但是,在实际工作中,有时某些年龄组不能测到较大的样本。这时能不能使用统计的方法,进行处理呢? 我们遇到一个实例。测得45名11至18岁男田径运动员的立定三级跳远数据。其各年龄组人数分布如表一。由于受到许多客观因素的限制,一时无法再扩大样本,因此决定使用统计方法进行处理。 第一步,首先用原始数据做散点图,并通过添加趋势线,看数据的变化趋势是否符合随年龄增长而变化的趋势,决定能否使用回归方程制定标准。如果趋势线不符合随年龄增长而变化的趋势,或者相关程度很差就不能用了。 本例作出的散点图如图1,图上用一元回归方法添加趋势线,并计算出年龄和立定三级跳远的: 一元回归方程:Y=2.5836+0.3392 X 相关系数 r=0.7945(P<0.01) 由于从趋势线可以看出,立定三级跳远的成绩是随年龄增加而逐渐增加,符合青少年的发育特点。而且, 相关系数r=0.7945,呈高度相关。因此,可以认为计算出的一元回归方程,反映了11至18岁男运动员年龄和立定三级跳远成绩的线性关系。决定用一元回归方程来制定各年龄组的标准。 第二步,用一元回归方程:Y=2.5836+0.3392 X 推算出各年龄的立定三级跳远回归值,作为各年龄组的第2等标准。 第三步,用45人的立定三级跳远数据计算出标准差为:0.8271。由于在正态分布下,如把平均数作为标准约有50%的人可达到标准,用平均数-0.25标准差制定标准则约有60%的人可达到,用平均数+0.25、+0.52、+0.84标准差制定标准约有40%、30%、20%的人可达到标准。本例用各年龄组回归值-0.25标准差、+0.25标准差、+0.52标准差、+0.84标准差计算出1至5等标准如表2、图2。

你应该要掌握的7种回归分析方法

你应该要掌握的7种回归分析方法 标签:机器学习回归分析 2015-08-24 11:29 4749人阅读评论(0) 收藏举报 分类: 机器学习(5) 目录(?)[+]转载:原文链接:7 Types of Regression Techniques you should know!(译者/刘帝伟审校/刘翔宇、朱正贵责编/周建丁) 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部分详细解释这一点。 我们为什么使用回归分析? 如上所述,回归分析估计了两个或多个变量之间的关系。下面,让我们举一个简单的例子来理解它: 比如说,在当前的经济条件下,你要估计一家公司的销售额增长情况。现在,你有公司最新的数据,这些数据显示出销售额增长大约是经济增长的2.5倍。那么使用回归分析,我们就可以根据当前和过去的信息来预测未来公司的销售情况。 使用回归分析的好处良多。具体如下: 1.它表明自变量和因变量之间的显著关系;

2.它表明多个自变量对一个因变量的影响强度。 回归分析也允许我们去比较那些衡量不同尺度的变量之间的相互影响,如价格变动与促销活动数量之间联系。这些有利于帮助市场研究人员,数据分析人员以及数据科学家排除并估计出一组最佳的变量,用来构建预测模型。 我们有多少种回归技术? 有各种各样的回归技术用于预测。这些技术主要有三个度量(自变量的个数,因变量的类型以及回归线的形状)。我们将在下面的部分详细讨论它们。 对于那些有创意的人,如果你觉得有必要使用上面这些参数的一个组合,你甚至可以创造出一个没有被使用过的回归模型。但在你开始之前,先了解如下最常用的回归方法: 1. Linear Regression线性回归 它是最为人熟知的建模技术之一。线性回归通常是人们在学习预测模型时首选的技术之一。在这种技术中,因变量是连续的,自变量可以是连续的也可以是离散的,回归线的性质是线性的。 线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)之间建立一种关系。 用一个方程式来表示它,即Y=a+b*X + e,其中a表示截距,b表示直线的斜率,e是误差项。这个方程可以根据给定的预测变量(s)来预测目标变量的值。

(完整版)材料分析方法期末考试总结

材料分析方法 1.x射线是一种波长很短的电磁波,具有波粒二相性,粒子性往往表现突出,故x射线也可视为一束具有一定能量的光量子流。X射线有可见光无可比拟的穿透能力,可使荧光物质发光,可使气体或其它物质电离等。 2.相干散射:亦称经典散射,物质中的电子在X射线电场的作用下,产生强迫振动。这样每个电子在各方向产生与入射X射线同频率的电磁波。新的散射波之间发生的干涉现象称为相干散射。 3.不相干散射:亦称量子散射,X射线光子与束缚力不大的外层电子,或自由电子碰撞时电子获得一部分动能成为反冲电子,X射线光子离开原来方向,能量减小,波长增加。 4.吸收限:物质原子序数越大,对X射线的吸收能力越强;对一定的吸收体,X射线的波长越短,穿透能力越强,表现为吸收系数的下降,但随着波长的的降低,质量吸收系数并非呈连续的变化,而是在某些波长位置上突然升高,出现了吸收限。 5.荧光辐射:由入射X射线所激发出来的特征X射线称为荧光辐射(荧光X 射线,二次X射线)。 6.俄歇效应:由于光电效应而处于激发态的原子还有一种释放能量的方式,及俄歇效应。原子中一个K层电子被入射光量子击出后,L层一个电子跃入K层填补空位,此时多余的能量不以辐射X光量子放出,而是以另一个L层电子活的能量跃出吸收体,这样的一个K层空位被两个L层空位代替的过程称为俄歇效应,跃出的L层电子称为俄歇电子。 7.光电子:当入射光量子的能量等于或大于吸收体原子某壳体层电子的结合能时,此光量子就很容易被电子吸收,获得能量的电子从内层溢出,成为自由电子,称为光电子。原子则处于激发态,这种原子被入射辐射电离的现象即光电效应。8.滤波片的作用:滤波片是利用吸收限两侧吸收系数差很大的现象制成的,用以吸收不需要的辐射而得到基本单色的光源。 9.布拉格方程只是获得衍射的必要条件而非充分条件。 10.晶面(hkl)的n级反射面(nh nk nl),用符号(HKL)表示,称为反射面或干涉面。 11.掠射角是入射角(或反射角)与晶面的夹角,可表征衍射的方向。 12.衍射极限条件:在晶体中,干涉面的划取是无极限的,但并非所有的干涉面均能参与衍射,因存在关系dsinθ=λ/2,或d>=λ/2,说明只有间距大于或等于X 射线半波长的那些干涉面才能参与反射。 13.劳埃法:采用连续X射线照射不动的单晶体,因为X射线的波长连续可变,故可从中挑选出其波长满足布拉格关系的X射线使产生衍射。 14.周转晶体法:采用单色X射线照射转动的单晶体,并用一张以旋转轴为轴的圆筒形底片来记录。 15.粉末法:采用单色X射线照射多晶体,试样是由数量众多、取向混乱的微晶体组成。 16.吸收因数:由于试样本身对X射线的吸收,使衍射强度的实测值与计算值不符,为了修正这一影响,则在强度公式中乘以吸收因数。 17.温度因数:原子热振动使晶体点阵原子排列的周期性受到破坏,使得原来严格满足布拉格条件的相干散射产生附加的相差,从而使衍射强度减弱。为修正实验温度给衍射强度带来的影响,需要在积分强度公式中乘以温度因数。

材料分析方法部分课后习题答案(供参考)

第一章X 射线物理学基础 2、若X 射线管的额定功率为1.5KW,在管电压为35KV 时,容许的最大电流是多少? 答:1.5KW/35KV=0.043A。 4、为使Cu 靶的Kβ线透射系数是Kα线透射系数的1/6,求滤波片的厚度。 答:因X 光管是Cu 靶,故选择Ni 为滤片材料。查表得:μ m α=49.03cm2/g,μ mβ=290cm2/g,有公式,,,故:,解得:t=8.35um t 6、欲用Mo 靶X 射线管激发Cu 的荧光X 射线辐射,所需施加的最低管电压是多少?激发出的荧光辐射的波长是多少? 答:eVk=hc/λ Vk=6.626×10-34×2.998×108/(1.602×10-19×0.71×10-10)=17.46(kv) λ 0=1.24/v(nm)=1.24/17.46(nm)=0.071(nm) 其中h为普郎克常数,其值等于6.626×10-34 e为电子电荷,等于1.602×10-19c 故需加的最低管电压应≥17.46(kv),所发射的荧光辐射波长是0.071纳米。 7、名词解释:相干散射、不相干散射、荧光辐射、吸收限、俄歇效应 答:⑴当χ射线通过物质时,物质原子的电子在电磁场的作用下将产生受迫振动,受迫振动产生交变电磁场,其频率与入射线的频率相同,这种由于散射线与入射线的波长和频率一致,位相固定,在相同方向上各散射波符合相干条件,故称为相干散射。 ⑵当χ射线经束缚力不大的电子或自由电子散射后,可以得到波长比入射χ射线长的χ射线,且波长随散射方向不同而改变,这种散射现象称为非相干散射。 ⑶一个具有足够能量的χ射线光子从原子内部打出一个K 电子,当外层电子来填充K 空位时,将向外辐射K 系χ射线,这种由χ射线光子激发原子所发生的辐射过程,称荧光辐射。或二次荧光。 ⑷指χ射线通过物质时光子的能量大于或等于使物质原子激发的能量,如入射光子的能量必须等于或大于将K 电子从无穷远移至K 层时所作的功W,称此时的光子波长λ称为K 系的吸收限。 ⑸原子钟一个K层电子被光量子击出后,L层中一个电子跃入K层填补空位,此时多余的能量使L层中另一个电子获得能量越出吸收体,这样一个K层空位被两个L层空位代替的过程称为俄歇效应。 第二章X 射线衍射方向 2、下面是某立方晶第物质的几个晶面,试将它们的面间距从大到小按次序重新排列:(123),(100),(200),(311),(121),(111),(210),(220),(130),(030),(221),(110)。 答:立方晶系中三个边长度相等设为a,则晶面间距为d=a/ 则它们的面间距从大小到按次序是:(100)、(110)、(111)、(200)、(210)、(121)、(220)、(221)、(030)、(130)、

第六章相关与回归分析方法

第六章 相关与回归分析方法 第一部分 习题 一、单项选择题 1.单位产品成本与其产量的相关;单位产品成本与单位产品原材料消耗量的相关 ( )。 A.前者是正相关,后者是负相关 B.前者是负相关,后者是正相关 C.两者都是正相关 D.两者都是负相关 2.样本相关系数r 的取值范围( )。 A.-∞<r <+∞ B.-1≤r ≤1 C. -l <r <1 D. 0≤r ≤1 3.当所有观测值都落在回归直线 01y x ββ=+上,则x 与y 之间的相关系数( )。 A.r =0 B.r =1 C.r =-1 D.|r|=1 4.相关分析与回归分析,在是否需要确定自变量和因变量的问题上( )。 A.前者无需确定,后者需要确定 B.前者需要确定,后者无需确定 C.两者均需确定 D.两者都无需确定 5.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是( )。 A.完全相关 B.微弱相关 C.无线性相关 D.高度相关 6.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x ,这意味着年劳动生产率每提高1千元时,工人工资平均( )。 A.增加70元 B.减少70元 C.增加80元 D.减少80元 7.下面的几个式子中,错误的是( )。 A. y= -40-1.6x r=0.89 B. y= -5-3.8x r =-0.94 C. y=36-2.4x r =-0.96 D. y= -36+3.8x r =0.98 8.下列关系中,属于正相关关系的有( )。 A.合理限度内,施肥量和平均单产量之间的关系 B.产品产量与单位产品成本之间的关系 C.商品的流通费用与销售利润之间的关系 D.流通费用率与商品销售量之间的关系 9.直线相关分析与直线回归分析的联系表现为( )。 A.相关分析是回归分析的基础 B.回归分析是相关分析的基础 C.相关分析是回归分析的深入 D.相关分析与回归分析互为条件 10.进行相关分析,要求相关的两个变量( )。 A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 11.相关关系的主要特征是( )。 A.某一现象的标志与另外的标志之间存在着确定的依存关系 B.某一现象的标志与另外的标志之间存在着一定的关系,但它们不是确定的关系 C.某一现象的标志与另外的标志之间存在着严重的依存关系 D.某一现象的标志与另外的标志之间存在着函数关系 12.相关分析是研究( )。 A.变量之间的数量关系 B.变量之间的变动关系 C.变量之间相互关系的密切程度 D.变量之间的因果关系 13.现象之间相互依存关系的程度越低,则相关系数( )。 A.越接近于0 B.越接近于-1 C.越接近于1 D.越接近于0.5 14.在回归直线01y x ββ=+中,若10 β<,则x 与y 之间的相关系数( )。 A. r=0 B. r=1 C. 0<r <1 D. —l <r <0 15.当相关系数r=0时,表明( )。 A.现象之间完全无关 B.相关程度较小

《材料分析测试方法A》作业

材料物理专业2013级《材料分析测试方法A 》作业 第一章 电磁辐射与材料结构 一、教材习题 1-1 计算下列电磁辐射的有关参数: (1)波数为3030cm -1的芳烃红外吸收峰的波长(μm ); (2)5m 波长射频辐射的频率(MHz ); (3)588.995nm 钠线相应的光子能量(eV )。 1-3 某原子的一个光谱项为45F J ,试用能级示意图表示其光谱支项与塞曼能级。 1-5 下列原子核中,哪些核没有自旋角动量? 12C 6、19F 9、31P 15、16O 8、1H 1、14N 7。 1-8 分别在简单立方晶胞和面心立方晶胞中标明(001)、(002)和(003)面,并据此回答: 干涉指数表示的晶面上是否一定有原子分布?为什么? 1-9 已知某点阵∣a ∣=3?,∣b ∣=2?,γ = 60?,c ∥a ×b ,试用图解法求r *110与r *210。 1-10 下列哪些晶面属于]111[晶带? )331(),011(),101(),211(),231(),132(),111(。 二、补充习题 1、试求加速电压为1、10、100kV 时,电子的波长各是多少?考虑相对论修正后又各是多 少? 第二章 电磁辐射与材料的相互作用 一、教材习题 2-2 下列各光子能量(eV )各在何种电磁波谱域内?各与何种跃迁所需能量相适应? 1.2×106~1.2×102、6.2~1.7、0.5~0.02、2×10-2~4×10-7。 2-3 下列哪种跃迁不能产生? 31S 0—31P 1、31S 0—31D 2、33P 2—33D 3、43S 1—43P 1。 2-5 分子能级跃迁有哪些类型?紫外、可见光谱与红外光谱相比,各有何特点? 2-6 以Mg K α(λ=9.89?)辐射为激发源,由谱仪(功函数4eV )测得某元素(固体样品) X 射线光电子动能为981.5eV ,求此元素的电子结合能。 2-7 用能级示意图比较X 射线光电子、特征X 射线与俄歇电子的概念。 二、补充习题 1、俄歇电子能谱图与光电子能谱图的表示方法有何不同?为什么? 2、简述X 射线与固体相互作用产生的主要信息及据此建立的主要分析方法。 第三章 粒子(束)与材料的相互作用 一、教材习题 3-1 电子与固体作用产生多种粒子信号(教材图3-3),哪些对应入射电子?哪些是由电子 激发产生的?

回归研究分析方法总结全面

回归分析方法总结全面

————————————————————————————————作者:————————————————————————————————日期:

一、什么是回归分析 回归分析(Regression Analysis)是研究变量之间作用关系的一种统计分析方法,其基本组成是一个(或一组)自变量与一个(或一组)因变量。回归分析研究的目的是通过收集到的样本数据用一定的统计方法探讨自变量对因变量的影响关系,即原因对结果的影响程度。 回归分析是指对具有高度相关关系的现象,根据其相关的形态,建立一个适当的数学模型(函数式),来近似地反映变量之间关系的统计分析方法。利用这种方法建立的数学模型称为回归方程,它实际上是相关现象之间不确定、不规则的数量关系的一般化。 二、回归分析的种类 1.按涉及自变量的多少,可分为一元回归分析和多元回归分析一元回归分析是对一个因变量和一个自变量建立回归方程。多元回归分析是对一个因变量和两个或两个以上的自变量建立回归方程。 2.按回归方程的表现形式不同,可分为线性回归分析和非线性回归分析 若变量之间是线性相关关系,可通过建立直线方程来反映,这种分析叫线性回归分析。 若变量之间是非线性相关关系,可通过建立非线性回归方程来反映,这种分析叫非线性回归分析。 三、回归分析的主要内容 1.建立相关关系的数学表达式。依据现象之间的相关形态,建立适当的数学模型,通过数学模型来反映现象之间的相关关系,从数量上近似地反映变量之间变动的一般规律。 2.依据回归方程进行回归预测。由于回归方程反映了变量之间的一般性关系,因此当自变量发生变化时,可依据回归方程估计出因变量可能发生相应变化的数值。因变量的回归估计值,虽然不是一个必然的对应值(他可能和系统真值存在比较大的差距),但至少可以从一般性角度或平均意义角度反映因变量可能发生的数量变化。 3.计算估计标准误差。通过估计标准误差这一指标,可以分析回归估计值与实际值之间的差异程度以及估计值的准确性和代表性,还可利用估计标准误差对因变量估计值进行在一定把握程度条件下的区间估计。 四、一元线性回归分析 1.一元线性回归分析的特点 1)两个变量不是对等关系,必须明确自变量和因变量。 2)如果x和y两个变量无明显因果关系,则存在着两个回归方程:一个是以x为自变量,y 为因变量建立的回归方程;另一个是以y为自变量,x为因变量建立的回归方程。若绘出图

回归分析与相关分析联系 区别

回归分析与相关分析联系、区别?? 简单线性回归分析是对两个具有线性关系的变量,研究其相关性,配合线性回归方程,并根据自变量的变动来推算和预测因变量平均发展趋势的方法。 回归分析(Regression analysis)通过一个变量或一些变量的变化解释另一变量的变化。 主要内容和步骤:首先依据经济学理论并且通过对问题的分析判断,将变量分为自变量和因变量,一般情况下,自变量表示原因,因变量表示结果;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;接着要估计模型的参数,得出样本回归方程;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验,计量经济学检验、预测检验;当所有检验通过后,就可以应用回归模型了。 回归的种类 回归按照自变量的个数划分为一元回归和多元回归。只有一个自变量的回归叫一元回归,有两个或两个以上自变量的回归叫多元回归。 按照回归曲线的形态划分,有线性(直线)回归和非线性(曲线)回归。 相关分析与回归分析的关系 (一)相关分析与回归分析的联系 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。 (二)相关分析与回归分析的区别 1.相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分。因此,在回归分析中,变量之间的关系是不对等的。 2.在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是确定的,因变量才是随机的,即将自变量的给定值代入回归方程后,所得到的因变量的估计值不是唯一确定的,而会表现出一定的随机波动性。 3.相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,由于变量之间是对等的,因此相关系数是唯一确定的。而在回归分析中,对于互为因果的两个变量(如人的身高与体重,商品的价格与需求量),则有可能存在多个回归方程。 需要指出的是,变量之间是否存在“真实相关”,是由变量之间的内在联系所决定的。相关分析和回归分析只是定量分析的手段,通过相关分析和回归分析,虽然可以从数量上反映变量之间的联系形式及其密切程度,但是无法准确判断变量之间内在联系的存在与否,也无法判断变量之间的因果关系。因此,在具体应用过程中,一定要注意把定性分析和定量分析结合起来,在定性分析的基础上展开定量分析。

材料分析方法 考前复习总结(一)

一X射线基础 1 X射线:是一种波长很短的电磁波(0.05-0.25nm,可见光390-760nm)。X射线能使气体电离,使照相底片感光,能穿过不透明的物体,还能使荧光物质发出荧光。呈直线传播,在电场和磁场中不发生偏转;当穿过物体时仅部分被散射。 产生条件:产生自由电子;使电子做定向高速运动;在电子运动的路径上设置使其突然减速的障碍物。 产生方式:利用类似热阴极二极管装置,用一定材料制作的板状阳极(靶)和阴极(灯丝)密封在一个玻璃-金属管壳内,阴极通电加热,在两极间加直流高压U,则阴极产生的热电子将在高压电场作用下飞向阳极,在碰撞的瞬间产生X射线。 连续X射线:强度随波长连续变化的谱线,波长从一最小值(短波限)向长波伸展,并在一波长处有强度最大值。受管电压U、管电流I和阳极靶材原子序数Z的作用。U提高,强度提高,短波限和强度最大值对应的波长减小;I提高,强度提高;Z越高,强度越大。根据量子力学,在管电压作用下电子动能为eU,若电子碰撞时把全部能量给予一个光子,则使其获得最大能量,,此光量子的波长即为短波限。。绝大多数到达阳极靶面的电子经多次碰撞消耗能量,每次碰撞产生一个光量子,并以均大于短波限的波长辐射,产生连续谱。 特征X射线:管电压增高到一定值时,在连续谱的某些特定的波长位置会出现一系列强度很高、波长范围很窄的线状光谱,其波长只取决于阳极靶材元素的原子序数,可作为阳极靶材的标志或特征。莫塞莱定律:(Z越大,特征谱波长越短)。经典原子模型,电子分布在一系列量子化壳层上,内层电子被激出后原子将处于激发状态,必然自发向稳态过渡,此时外层电子将填充内层空位,相应伴随着原子能量的降低。原子从高能态变成低能态时,多出的能量以X射线形式辐射出来。物质一定,原子结构一定,两特定能级间的能量差一定,故辐射出的特征X射波长一定。特征谱强度随U和I的提高而增大。 2 X-ray与物质的相互作用 1)散射:相干散射:当X射线与原子中束缚较紧的内层电子相撞时,光子方向改变但能量无损失,产生波长不变的散射线,可发生干涉,是x射线衍射的基础。(汤姆逊散射) 非相干散射:当X射线光子与束缚不大的外层电子或价电子或金属晶体中的自由电子相撞,电子被撞离原子带走一部分光子的能量成为反冲电子,损失了能量的光子被撞偏一个角度。散布于各方向的散射波波长不等,不能发生干涉。(康-吴效应) 2)真吸收(光电效应、俄歇效应和热效应消耗):入射x射线能量足够大时,可将内层电子击出,产生光电效应。被击出的电子为光电子;外层电子向内层跃迁,辐射出波长严格一定的特征x射线,因属于光致发光的荧光现象,成为荧光X射线。 原子外层电子跃迁填补内层空位后释放能量并产生新的空位,这些能量被包括空位层在内的临近原子或较外层电子吸收,受激发逸出原子的电子叫做俄歇电子。(荧光效应用于表层重元素>20的成分分析;俄歇效应用于表层轻元素的成分分析) 3)衰减X射线吸收规律:强度为I的特征X射线在均匀物质内部通过时,强度的衰减与在物质内通过的距离x成比例,即-dI/I=μdx 。 线吸收系数:即为上式中的μ,指在X射线传播方向上,单位长度上的X射线强弱衰减程度。 质量吸收系数:X射线通过单位面积上单位质量物质后强度的相对衰减量,拜托密度影响。 吸收限:当吸收物质一定时,波长越长越容易被吸收,但吸收系数并不随波长减小单调下降,会有几个跳跃台阶(对应荧光辐射吸收)。 ①根据样品化学成分选择靶材:要求尽可能少激发荧光辐射,入射线波长略长于样品的吸收线或短很多。Z靶≤Z样+1或Z靶>>Z样 ②滤片选择:滤去K系谱线中的Kβ线,使其吸收线位于K系谱线直接,尽可能靠近Kα线。Z靶<40,Z滤=Z靶-1;Z靶>40,Z滤=Z靶-2 1分析下列荧光辐射产生的可能性,为什么? 答:根据经典原子模型,原子内的电子分布在一系列量子化的壳层上,在稳定状态下,每个壳层有一定数量的电子,他们有一定的能量。最内层能量最低,向外能量依次增加。根据能量关系,M、K层之间的能量差大于L、K成之间的能量差,K、L层之间的能量差大于M、L层能量差。由于释放的特征谱线的能量等于壳层间的能量差,所以K?的能量大于Ka的能量,Ka能量大于La的能量。因此在不考虑能量损失的情况下:CuKa能激发CuKa荧光辐射;(能量相同)CuK?能激发CuKa荧光辐射;(K?>Ka)CuKa能激发CuLa荧光辐射;(Ka>la)2为什么出现吸收限?K吸收限只有一个而L吸收限有三个?当激发K系荧光Ⅹ射线时,能否伴生L系?当L系激发时能否伴生K系? 一束X射线通过物体后,其强度将被衰减,它是被散射和吸收的结果。并且吸收是造成强度衰减的主要原因。物质对X射线的吸收,是指X射线通过物质对光子的能量变成了其他形成的能量。原子系统中的电子遵从泡利不相容原理不连续地分布在K,L,M,N等不同能级的壳层上,当外来的高速粒子(电子或光子)的动能足够大时,可以将壳层中某个电子击出原子系统之外,从而使原子处于激发态。这时所需的能量即为吸收限,它只与壳层能量有关。即吸收限只与靶的原子序数有关,与管电压无关。 因为L层有三个亚层,每个亚层的能量不同,所以有三个吸收限,而K只是一层,所以只有一个吸收限。 激发K系光电效应时,入射光子的能量要等于或大于将K电子从K层移到无穷远时所做的功Wk。从X射线被物质吸收的角度称入K 为吸收限。当激发K系荧光X射线时,能伴生L系,因为L系跃迁到K系自身产生空位,可使外层电子迁入,而L系激发时不能伴生K系。3计算当管电压为50 kv时,电子在与靶碰撞时的速度与动能以及所发射的连续谱的短波限和光子的最大动能。 电子静止质量:m0=9.1×10-31kg 光速:c=2.998×108m/s电子电量:e=1.602×10-19C 普朗克常数:h=6.626×10-34J.s 电子从阴极飞出到达靶的过程中所获得的总动能为 E=eU=1.602×10-19C×50kv=8.01×10-18kJ 由于E=1/2m0v02 所以电子与靶碰撞时的速度为v0=(2E/m0)1/2=4.2×106m/s 所发射连续谱的短波限λ0的大小仅取决于加速电压λ0(?)=12400/v(伏) =0.248? 辐射出来的光子的最大动能为 E0=h?0=hc/λ0=1.99×10-15J

相关系数与回归分析

第八章相关与回归分析 114、什么叫相关分析? 研究两个或两个以上变量之间相关程度大小以及用一定涵数来表达现象相互关系的方法。 115、什么叫相关关系? 相关关系是一种不完全确定的依存关系,即因素标志的每一个数值都可能有若干结果标志的数值与之对应。 116、判定现象之间有无相关关系的方法有哪些? 判断现象之间有无相关关系,首先要对其作定性分析,否则很可能把虚假相关现象拿来作相关分析。相关表和相关图都是判定现象之间有无相关关系的重要方法。而相关系数主要是用来测定现象之间相关的密切程度的指标,估计标准误差是判定回归方程式代表性大小的指标。所以判断方法有客观现象作定性分析、编制相关表、绘制相关图。 117、什么叫相关系数? 测定变量之间相关密切程度和相关方向的指标。 118、相关系数有何特点? 参与相关分析的两个变量是对等的,不分自变量与因变量,因此相关系数只有一个。相关系数有正负号反映相关关系的方向中,正负瓜果正相关,负号反映负相关。计算相关系数的两个变量都是随机变量。 119、某产品产量与单位成本的相关系数是-0.8;(乙)产品单位成本与利润率的相关系数是-0.95;(乙)比(甲)的相关程度高吗? 相关系数是说明相关程度大小的指标,相关系数的取值范围在±1之间,相关系数越接近±1,说明两变量相关程度越高,越接近于0,说明相关程度越低。因此,(乙)比(甲)的相关程度高。 120、什么叫回归分析? 对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,已从一个已知量推算另一个未知量,为估计预测提供一个重要方法。 121、与相关分析相比,回归分析有什么特点? 两个变量是不对等的,必须区自变量与因变量;因变量是随机的,自变量是可以控制的;对于一个没有因果关系的两个变量,可以求得两个回归方程,一个是Y倚X的回归方程,另一个是X倚Y的回归方程。 122、回归方程中回归系数的涵义是什么? 回归系数表示:当自变量X每增减一个单位时,因变量Y的平均增减值。 123、当所有的观测值都落在直线y c=a+bx上时,则x与y之间的相关系数为多少?

相关文档
最新文档