两个变量的线性相关

2.3.2 两个变量的线性相关

一、教学目标

重点: 了解最小二乘法和回归分析的思想,根据给出的线性回归方程的系数公式建立回归方程.

难点:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想.

知识点:根据给出的线性回归方程的系数公式建立回归方程.

能力点:探究体会数形结合的方法及最小二乘法的数学思想.

教育点:学生通过合作学习、自主学习和探究式学习的方式完成一个完整的数学学习过程.

自主探究点:自学例2.

考试点:根据给出的线性回归方程的系数公式建立回归方程.

易错易混点:如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高.

拓展点:事件、样本数据、回归直线方程三者关系.

二、复习引入

【设计意图】为本节课学生能够更好的建构新的知识做好充分的准备,对旧的知识进行简要的提问复习,为能够顺利的完成本节课的内容提供必要的基础.

【设计说明】学生动手操作得出散点图回答.

【设计意图】通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛.

【设计说明】设计该问题,引导学生自己发现问题,鼓励学生大胆表达自己的看法,充分暴露思维过程.发现:图1很乱,两个变量没有相关关系;图2呈上升趋势,图中点的分布呈条状,所有点都落在某一直线的附近,这样由图2自然地引出线性相关、回归直线的概念,同时引入课题.

引入:为此我们引入今天的课题-回归直线及其方程.

【设计意图】循序渐进,符合学生的认知规律.

三、探究新知

(一)探索回归直线的概念

1.回归直线的定义:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.

【设计意图】培养自学能力和数学阅读能力.

【设计说明】让学生阅读教材,通过阅读教材学习线性相关,回归直线,回归方程的概念,并分析概念中应注意的问题.

注意:概念的前提是点的分布在一条直线附近.

(二)探索回归直线的找法

结合引例—年龄与体内脂肪含量相关性的散点图观察,思考以下问题.

问题1.对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?

【设计意图】让学生通过观察、分析,自己发现回归直线的条数只有一条,从而培养学生观察、分析问题的能力.

问题2.回归直线与散点图中各点的位置应具有怎样的关系?

【设计意图】让学生分析两者的关系,教师引导学生发现两者整体上最接近,以进一步培养学生观察、分析问题的能力.

问题3.那么在样本数据的散点图中,能否用直尺准确画出回归直线?

【设计意图】让学生动手操作画回归直线,建立回归思想,以分解难点、突破难点,培养学生的动手操作能力.

问题4.如果能够求出回归方程,那么我们就可以比较清楚的了解年龄与体内脂肪含量的相关性.那么我们应当如何具体求出这个回归方程呢?对于求回归直线方程,你有哪些想法?

【设计意图】充分暴露学生的思维过程, 通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛,培养学生动脑思考问题的能力.

【设计说明】结合教材,学生会出现以下方案.

方案一:采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测出此时的斜率和截距,就是回归方程了.如图

方案二:在图中选两点作直线,使直线两侧的点的个数基本相同. 如图

脂肪含量

脂肪含量

脂肪含量

方案三:如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和

截距,得回归方程.如图

问题5.以上这些方法是不是真的可行?为什么?

【设计意图】结合以上三个方案让学生画图,然后教师引导学生讨论、交流方案的可行性,体会回归直线

的特征.

【设计说明】教师先展示学生画图情况,学生说明理由;然后教师总结回归直线的特征:整体上看散点图

中的点到此直线的距离最小.

问题6.如何用数学的方法来刻画“从整体上看,各点到此直线的距离小”?

【设计意图】这样设疑符合学生的认知规律,增强了学生的求知欲.

【设计说明】教师引导学生进行下面的分析:

引导学生以等效性和简化计算为目标,将点到直线的距离转化为自变量x 取值一定时,纵坐标的偏差.这样自然引出下面求回归方程的方法. 问题7.结合以上分析,我们认为以“偏差”最小的直线作为回归直线比较恰当,那你能用代数式来刻画“从整体上看,各点与此直线的偏差最小”吗?

【设计意图】几何问题代数化,为下一步探究作好准备,经历“几何直观”转化为“代数表达”过程,为引出“最小二乘法”作准备.

【设计说明】假设我们已经得到两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y ,,

(,)n n x y .

当自变量x 取i x ),,2,1(n i =时,可以得到?i y bx a =+),,2,1(n i =,它与实际收集到的i y 之间的偏差(如图)是?()i i i i y y

y bx a -=-+),,2,1(n i =.

问题8.教师启发学生比较下列三个模型,哪个模型比较可行? 模型一:1?()n

i

i i y

y =-∑最小 模型二:1?||n i

i i y y =-∑最小 模型三:21

?()n

i

i i y

y

=-∑最小

【设计意图】先向学生说明

1

n

i =∑

的意义,体会如何选取恰当的计算方法建立回归方程的过程,提高学生分

析问题的能力;培养学生的动手操作能力.

【设计说明】教师指出:

模型一中?()i i y y

-可能有正有负,互相抵消怎么办?学生一般会想到加绝对值. 模型二中?||i i y y -去绝对值非常困难(可以提问,让学生思考),是否有其它的方法,同时可以类比方差

的处理方法,引导学生思考.

师生一起分析后,得出用模型三来制定标准评价一条直线是否为“最好”的直线较为方便. (三) 利用最小二乘法推导回归系数公式

问题9.通过对上述问题的分析,我们知道可以用Q =

2

21

1

?()()n

n

i

i i i i i y

y

y bx a ==-=--∑∑最小来表示偏差最小,那么在这个式子中,当样本点的坐标(,)i i x y 确定时,a ,b 等于多少,Q 能取到最小值呢?

【设计意图】体会最小二乘法思想,不经历公式化简无法真正理解其意义,而直接从n 个点的公式化简,

教学要求、教学时间、学生能力都没达到这个高度.因而由具体到抽象,由特殊到一般,将是学生顺利完成这一认知过程的一般性原则.通过这个问题,让学生了解这个式子的结构,为后续的学习打下基础,同时渗透最小值的思想.

n 个点与相应直线在整体上的接近程度:记Q =

21

()n

i

i i y

bx a =--∑.通过化简,得到的其实是关于a 、b 的

二元二次函数求最值的问题,一定存在这样的a 、b ,使Q 取到最小值. 教师指出:

(1)在此基础上,视Q 为b 的二次函数时,根据有关数学原理分析,可求出使Q 为最小值时的b 的值的线性回归方程系数公式:

1

12

2

2

1

1

()()

,

().

n

n

i

i i i

i i n

n

i

i

i i x

x y y x y

nx y b x

x x

nx

a y bx ====?--- ==

-- =-?

∑∑∑∑

这样,回归方程的斜率为b ,截距为a ,即回归方程为

y b x a =+.

(2)),(y x 称为样本点的中心,可以证明回归直线一定过样本点的中心,所以可得a y bx =-.

最小二乘法:这种通过上式的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

四、理解新知

例1.进一步探究引例—年龄与体内脂肪含量

【设计意图】公式形式化程度高、表达复杂,通过分解计算,可加深对公式结构的理解.同时,通过例题,反映数据处理的繁杂性,体现计算器处理的优越性.

【设计说明】可让学生观察公式,充分讨论,通过计算:i i x y 、n 、x 、y 、

1

n i i

i x y =∑、2

1

n

i

i x

=∑六个数据

带入回归方程公式得到线性回归方程,体会求线性回归方程的原理与方法.而后教师可偕同学生,对计算器操作方式提供示范,师生共同完成,得出回归直线方程为:0.6541 4.5659y x =-.

(2)利用计算器,根据表二,请同学们独立解决求出表中两变量的回归方程.

【设计意图】让学生独立体验运用计算器求回归直线方程,在重复求解回归直线的过程中,使学生掌握利用计算器求回归直线的操作方法.得出回归直线方程为:0.57650.4478y x =-.

【设计说明】学生独立运用计算器求回归直线方程,对于不会操作的学生,教师给予必要的指导.继续思考下列问题:

问题1.请同学们从表格中选取年龄x 的一个值代入上述回归直线的方程,看看得出的数据与真实数值之间的关系.如:x =50时,得出估计值为28.3772,而实际值为28.2,有偏差为什么?

【设计意图】使学生理解线性回归方程的真正意义与作用,明确y 只是y 的一个估计值,将x 值带入后肯定有误差.

问题2.试预测某人37岁时,他体内的脂肪含量,并说明结果的含义. 【设计意图】进一步理解线性回归方程的真正意义与作用.

20.883%?学生思考回答:不能,只能说他体内的脂肪含量在20.90%附近的可能性比较大.

问题3.同样问题背景,为什么回归直线不止一条?回归方程求出后,变量间的相关关系是否就转变成确定关系?

【设计意图】明确样本的选择影响回归直线方程,体现统计的随机思想.同时,明确其揭示的是相关关系而非函数的确定关系,而且最小二乘法只是某一标准下的一种数据处理方法,使学生更全面的理解回归直线这一核心概念.

【设计说明】教师说明回归直线方程由数据唯一决定,提供的数据不同,回归直线方程当然不同,同时回归直线方程又能反映数据的本质. 理解回归系数公式

思考1.线性回归方程y bx a =+为何不记为y bx a =+?你能说明对于确定的x ,根据y bx a =+计算出的y 的意义吗?

【设计意图】使学生理解线性回归方程的真正意义与作用,明确y 只是y 的一个估计值. 【设计说明】学生思考,教师帮助学生理解线性回归方程的意义与作用.

思考2.这个公式不要求记忆,但要会运用这个公式进行运算,那么,要求,b a 的值,你会按怎样的顺序求呢?

【设计意图】公式不要求推导,又不要求记忆,学生对这个公式缺少感性的认识,通过这个问题,使学生从感性的层次上对公式有所了解.

【设计说明】由于这个公式比较复杂,因此在运用这个公式求,b a 时,必须要有条理,先求什么,再求什么.比如,我们可以按照i i x y 、n 、x 、y 、

1

n

i i

i x y =∑、2

1

n

i

i x

=∑顺序来求,再代入公式.

五、运用新知

例2.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 1、画出散点图;

2、从散点图中发现气温与热饮销售杯数之间关系的一般规律;

3、求回归方程;

4、如果某天的气温是2摄氏度,预测这天卖出的热饮杯数。

(2)2、从图3-1看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。

(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式1求出回归方程的系数。 Y= -2.352x+147.767

(4)当x=2时,Y=143.063 因此,某天的气温为2摄氏度时,这天大约可以卖出143杯热饮。 【设计意图】通过此题,让学生完整经历求回归直线过程.其中第4问,让学生体会到即使是相比下“最优”的所获得的回归直线,也存在着一定的误差,从中体会无论方法的优劣,统计学中随机性无法避免.而在预测值的计算中,体现了回归直线的应用价值,加深学生对回归方程的理解,体验数学在实际生活中的应用.

【设计说明】①本题不能用计算器运算,以考查学生的运算能力;

②本题让学生自学,爬黑板板书过程,教师进一步规范学生的解题步骤; ③结合这两个例题让学生总结求回归直线方程的步骤. 拓展:

通过对以上两个案例的分析,思考:事件、样本数据、回归直线方程三者关系.

1.数据采样本身就具有随机性,同样23岁的人,脂肪含量可能9.5%,也有可能30%,这种误差我们称之为随机误差,随机误差是不可避免的.

2.回归分析是寻找相关关系中非确定关系中的某种确定性,虽然一个数据具有随机误差,但总体还是具有某种确定的关系.

3.在数据采样都符合统计要求的情况下,取三个回归直线方程中的任意一个都是合理的,不存在哪条最合适的问题,但一般情况下,选择数据多一些的比较合理. 因此,事件、样本数据、回归直线方程三者具有如下的关系:

六、课堂小结

教师提问:本节课我们学习了哪些知识,涉及到哪些数学思想方法?学生作答: 预测

抽样 统计意义上的反映 决定

选取代表 事件

样本数据 回归直线方程

(1)散点图

(2)求回归直线方程的步骤: ①先判断变量是否线性相关;

②若线性相关,可按下面的步骤求回归直线方程; 第一步,计算平均数x 、y ; 第二步,求和

1

n

i i

i x y =∑、2

1

n

i

i x

=∑;

第三步,计算1

12

2

2

1

1

()()

()n

n

i

i i i

i i n

n

i

i

i i x

x y y x y

nx y

b x

x x

nx

====---=

=

--∑∑∑∑;

第四步,写出回归直线方程为y bx a =+.

③利用回归方程对生活实际问题进行分析与预测. (3)回归直线方程的作用及意义.

2.思想:数形结合、归纳、类比、最小二乘法和回归分析的思想. 教师总结:提醒学生:在学习新知时,也要经常复习前面学过的内容,“温故而知新”.在应用中增强对知识的理解,及时查缺补漏,从而更好地运用知识,解题要有目的性,加强对数学知识、思想方法的认识与自觉运用.

【设计意图】培养学生自主梳理知识能力,加强对学生学习方法的指导.

七、布置作业

1.书面作业

1.有5

(1) (2)关于两个变量之间的关系,你能得出什么结论?

2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准(1)(2)根据上表提供的数据,用最小二乘法求出回归方程;

(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?

【设计意图】通过作业的解决,让学生巩固熟悉回归方程求解的过程,并体会运用回归方程进行预测. 2.课外思考

利用最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测. 思考:是不是所有的相关关系都可以求出回归直线的方程?请大家观察这两幅图:

变量之间的关系.显然求回归直线的方程是没有意义的.有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢?带着这个问题让学生课后阅读第92页的内容.

【设计意图】设计书面作业必做题,是引导学生先复习,再作业,培养学生良好的学习习惯.书面作业的布置,是为了让学生进一步掌握求回归直线方程的步骤;课外思考的安排,是让学生在应用知识的同时开阔了学生视野,将课堂内涵延伸到课外.

八、教后反思

1.本教案的亮点是整个教学设计过程采用研究性学习方法,由学生自己去探究,去解决问题.不是生硬的抛出,而是水到渠成.例题也是变讲为练,都是学生在独立或小组讨论中解决的,很好的调动学生的积极性与主动性,提高了学生的解题能力.

2.由于各校的情况不同,建议教师在使用本教案时灵活掌握,但必须在求回归直线方程的步骤上下足功夫.

3.本节课的弱项是课容量大,时间所限,在课堂上没有充分暴露学生的思维过程,感觉一节课下来比较紧,学生理解不透彻,尤其是学生对回归直线的找法还存在一定的困难.

bx a +,回归方程的斜率为b ,截距为其中回归方程系数公式:1.i n b bx ==∑

1

i n

b ==

∑bx a +.

③利用回归方程对生活实际问题进行分析与预测.

相关文档
最新文档