高二统计案例

高二统计案例
高二统计案例

个性化教学辅导教案

学科:

数学

年级:

十一年级

任课教师:

授课时间:

2018 年

教学课题导函数求参数范围问题

教学目标1、熟练运用统计案例中的公式进行计算2、学会分析统计数据教学重难点

重点:统计案例公式的运用难点:数据的分析

教学过程

§1.1 回归分析的基本思想及其初步应用

【知识要点】

线性回归方程

①变量之间的两类关系:函数关系与相关关系;②制作散点图,判断线性相关关系;③线性回归方程:

a bx y (最小二乘法)

12

21

n

i i

i n

i

i x y nx y b

x

nx

a y bx

注意:线性回归直线经过定点

),(y x .

相关系数(判定两个变量线性相关性):

n

i n

i i

i

n

i i

i

y y x x y y x x r

1

1

2

21)

()

())((注:⑴

r >0时,变量y x,正相关;r <0时,变量y x,负相关;

⑵①||r 越接近于1,两个变量的线性相关性越强;

②||r 接近于0时,两个变量之间几乎不存在线性相关关系.

回归分析中回归效果的判定:

⑴总偏差平方和:

n

i i

y y 1

2

)(;

⑵残差:i i i y y e ;

⑶残差平方和:

2

1

)

(n

i yi yi ;

⑷回归平方和:

n

i i

y y 1

2

)(-

2

1

)(n

i yi yi

;⑸相关指数n

i i i

n

i i i

y y y y R

12

12

2

)

()(1

注:①2

R 的值越大,说明残差平方和越小,则模型拟合效果越好;②2

R 越接近于1,则回归效果越好。

【例题精讲】

【例 1】有下列关系:

(1)人的年龄与他(她)拥有的财富之间的关系;

(2)曲线上的点与该点的坐标之间的关系;

(3)苹果的产量与气候之间的关系;

(4)森林中的同一种树木,其断面直径与高度之间的关系;

(5)学生与他(她)的学号之间的关系,其中有相关关系的是.

【例 2】某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x 1 2 3 5 10 20 30 50 100 200

y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15

检验每册书成本费y与印刷册数倒数1

x

之间是否具有线性相关关系,如有,求y对x的回归方程.

【例 3】营养学家为研究食物中蛋白质含量对婴幼儿生长的影响,调查了一批年龄在两个月到三岁的婴幼

儿,将他们按食物中蛋白质含量的高低分为高蛋白食物组和低蛋白食物组两组,并测量身高,得到下面的

数据:高蛋白食物组

年龄0.2 0.5 0.8 1 1 1.4 1.8 2 2 2.5 2.5 3 2.7

身高54 54.3 63 66 69 73 82 83 80.3 91 93.2 94 94

低蛋白食物组

年龄0.4 0.7 1 1 1.5 2 2 2.4 2.8 3 1.3 1.8 0.2 3

身高52 55 61 63.4 66 68.5 67.9 72 76 74 65 69 51 77 身高与年龄近似有线性关系,检验:不同食物的婴幼儿的身高有无差异;若存在,这种差异有何特点?

【基础达标】

1.在画两个变量的散点图时,下面哪个叙述是正确的()

A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上

C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模

型预测这个孩子10岁时的身高,则正确的叙述是()

A.身高一定是145.83cm B.身高在145.83cm以上

C.身高在145.83cm以下D.身高在145.83cm左右

3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最

好的模型是()

A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80

C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25

4.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为y=60+90x,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元

C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元

5.在回归分析中,残差图中纵坐标为()

A.残差B.样本编号 C.x D.e n

6.通过e1,e2,,,e n来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为()A.回归分析B.独立性检验分析 C.残差分析 D.散点图分析

【能力提高】

7.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,

每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:

转速x(转/秒)16 14 12 8

每小时生产有缺点的零件数y(件)11 9 8 5

(1)变量y对x进行相关性检验;(2)如果y对x有线性相关关系,求回归直线方程;

(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么

范围内?

8.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,

y x,斜率的估计等于0.8说明;成年人受过9年建立的回归直线方程如下0.8 4.6

或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)

课后练习

一、选择题.

1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()

A.总偏差平方和B.残差平方和 C.回归平方和 D.相关指数R2

2.已知回归直线的斜率的估计值是 1.23,样本点的中心为(4,5),则回归直线的方程是()A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23

3.相关系数r可用来衡量两个变量之间线性相关关系的强弱,其计算公式为:,

则以下正确的命题是()

A.r只能取正值C.r只有大于0.75 时才认为两个变量有很强的线性相关关系

B.r可以取任意实数D.r大于0.75 时才认为两个变量有很强的线性相关关系

4.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两

个变量有关系的可能性就()

A.越大B.越小 C.无法判断 D.以上都不对

5.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度.如果k >5.024,那么就有把握认为“X和Y有关系”的百分比为()

0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

2

P K k

k 0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83 A.25%B.75%C.2.5%D.97.5%

6.如图所示,有5组(x,y)数据,去掉其中一组后,剩下的4组数据的线性

相关系数最大,则应去掉的一组数据所对应的点是()

A.(3,10) B.(4,5)

C.(10,12) D.(1,2)

7.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:

x 2 3 4 5 6

y 2.2 3.8 5.5 6.5 7.0

若由资料可知y对x呈线性相关关系,则线性回归方程为()

A.y=0.08x-1.23 B.y=0.08x+1.23 C.y=1.23x- 0.08 D.y=1.23x+0.08 二、填空题.

8.若有一组数据的总偏差平方和为100,相关指数为0.5,则其残差平方和为_________.

9.在求两个变量x和y的线性回归方程过程中,计算得,则该回归方程是.

新人教版选修12《统计案例》、《推理与证明》单元测试题

选修1-2《统计案例》、《推理与证明》单元测试 可能用到的公式:回归直线的方程是:a bx y +=?,其中1 2 2 1 ,n i i i n i i x y nxy b a y bx x nx ==-==--∑∑; 相关指数2 1 122 )()?(1∑∑==--- =n i i n i i i y y y y R ,总偏差平方和: 2 1 () n i i y y =-∑,残差平方和: 2 1 ?()n i i i y y =-∑. 随机变量() ()()()() 2 2 n ad bc K a b c d a c b d -=++++ 一、选择题 (每小题 5分,共 10小题,共 50分) 1. 工人月工资 (元) 依劳动生产率 (千元) 变化的回归直线方程为6090y x =+, 下列判断正确的是 ( ). A. 劳动生产率为 1000元时,工资为 50 元 B. 劳动生产率提高 1000 元时,工资提高 150元 C. 劳动生产率提高 1000 元时,工资提高 90 元 D. 劳动生产率为 1000元时,工资为 90 元 2. 在画两个变量的散点图时,下面哪个叙述是正确的( ). A. 预报变量在x 轴上,解释变量在 y 轴上 B. 解释变量在x 轴上,预报变量在 y 轴上 C. 可以选择两个变量中任意一个变量在x 轴上 D. 可以选择两个变量中任意一个变量在 y 轴上 3. 已知回归直线的斜率的估计值是 1.23,样本点的中心为(4,5),则回归直线的方程是 ( ). A. 1.234y x =+ B. 1.235y x =+ C. 1.230.08y x =+ D. 0.08 1.23y x =+ 4. 在两个变量 y 与 x 的回归模型中,分别选择了 4 个不同的模型,它们的相关指数2 R 如下,其中拟合效果最好的模型是( ) A. 模型 1 的相关指数 2 R 为 0.95 B. 模型 2的相关指数2 R 为 0.80 C. 模型 3 的相关指数2 R 为 0.50 D. 模型 4的相关指数2 R 为 0.25 5. 已知x 与y 则y 与x 的线性回归方程为y bx a =+必过点( ). A. (2,2) B. (1.5,3) C. (1,2) D. (1.5,4) 6.下面使用类比推理正确的是 ( ).

(完整word版)高二数学典型统计案例习题及答案

典型案例作业 1.某商场经理根据以往经验知道,有40%的客户在结账时会使用信用卡,则连续三位顾客都使用信用卡的概率为( ) 2.三个同学同时作一电学实验,成功的概率分别为1P ,2P ,3P ,则此实验在三人中三人都不成功的概率是( ) 3.甲、乙两人同时应聘一个工作岗位,若甲、乙被应聘的概率分别为0.5、0.6 两人被聘用是相互独立的,则甲乙两人中没有一人被聘用的概率( ) 4.甲射击运动员分别对一目标射击三次,甲射中的概率为0.4,则至少有一次射中的概率是________ 5.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示: 比较这两种手术对病人又发作心脏病的影响有没有差别.________. 6. 回答能否有99.9% 的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”

7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表: 推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y与工作年限x之间的相关系数; (2)求年推销金额y关于工作年限x的线性回归方程; (3)若第6名推销员的工作年限为11年,试估计他的年推销金额. (参考数据: 1.04≈1.02;由检验水平0.01及n-2=3,查表得=0.959)

8.某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2010年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下表: 该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验. (1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12 ^=bx+a; 月4日的数据,求出y关于x的线性回归方程y (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

统计案例

统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 ①通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 ②通过对典型案例(如“质量控制”、“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。 ③通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。 ④通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆

和机械套用公式。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 参考案例 例1 某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1—0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。

高中数学北师大版选修12第一章统计案例第3课时条件概率与独立事件精品学案

第3课时条件概率与独立事件 1.理解相互独立事件的定义,掌握相互独立事件同时发生的概率的计算方法. 2.理解条件概率的概念,会应用条件概率的计算公式求概率. 3.培养学生分析问题和解决问题的能力. 重点:条件概率与独立事件的概念、特征以及求其概率的方法. 难点:条件概率的求法. 某人有两个孩子,那么他的两个孩子都是女孩的概率是.如果在已知他的一个孩子是女孩的情况下,他的两个孩子都是女孩的概率还是吗? 问题1:在创设情境中,已知他的一个孩子是女孩,求他的两个孩子都是女孩的概率是一个条件概率问题. 一般地,设A,B为两个事件,且P(A)>0,称P(B|A)=为在事件A发生的条件下,事件B 发生的条件概率.P(B|A)读作A发生的条件下B发生的概率. 问题2:相互独立事件 事件的相互独立性:事件A(或B)是否发生,对事件B(或A)发生的概率没有影响,即P(B|A)=P(B),这样两个事件叫作相互独立事件. 问题3:如果A、B相互独立,那么A、B、、中相互独立的有哪些? 如果A,B相互独立,可以得如下3对:A与,与B,与也相互独立. 问题4:相互独立事件的性质以及事件独立性的推广 (1)两个相互独立事件同时发生的概率等于每个事件发生的概率之积,即P(AB)=P(A)·P(B). (2)如果事件A1,A2,A3,…,A n是相互独立的,那么这n个事件同时发生的概率等于每个事件发生的概率之积,即P(A1A2A3…A n)=P(A1)P(A2)P(A3)…P(A n). 互斥事件与相互独立事件的区别 两事件互斥是指同一次试验中两事件不能同时发生;两事件相互独立是指不同试验下,二者互不影响.两个相互独立事件不一定互斥,即可能同时发生,而互斥事件不可能同时发生. 1.已知P(B|A)=,P(A)=,则P(AB)等于(). A.B.C.D. 【解析】P(AB)=P(A)·P(B|A)=×=. 【答案】D 2.将两枚质地均匀的骰子各掷一次,设事件A={两个点数互不相同},B={出现一个5点},则P(B|A)等于(). A. B. C. D. 【解析】出现点数互不相同的共有6×5=30种,出现一个5点共有5×2=10种, ∴P(B|A)==. 【答案】A 3.设P(A|B)=P(B|A),P(A)=,则P(B)的值为. 【解析】∵P(A|B)=,P(B|A)=,∴P(B)=P(A)=. 【答案】 4.某班有学生40人,其中共青团员15人,全班分成四个小组,第一小组有学生10人,其中共青团员4人.现在要在班内任选一名共青团员当团员代表,求这个代表恰好在第一小组的概率. 【解析】设在班内任选一名学生,该学生是共青团员为事件A,在班内任选一名学生,该学生恰好在第一小组为事件B,则所求概率为P(B|A).又P(B|A)===. 所以所求概率为.

[高考专项训练]统计与统计案例

[高考专项训练]统计与统计案例

小题押题16—14??统计与统计案例 卷别年 份 考题位 置 考查内 容 命题规律分析 全 国卷Ⅱ201 5 选择题 第3题 条形图、 两变量 间的相 关性 统计与统计案 例部分,抽样方法考 查较少,且考查时题 目较简单;回归分析 与独立性检验在客 观题中单独考查时 较少;随机抽样、用 样本估计总体以及 全国卷Ⅲ201 7 选择题 第3题 折线图 的应用201 6 选择题 第4题 统计图 表的应

用 变量的相关性是命 题热点,难度较低. 江苏 201 8 第3题 平均数、茎叶图 考查点一 抽样方法 1.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 类别 人 数

老年 教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A.90B.100 C.180 D.300 解析:选C设该样本中的老年教师人数为 x,由题意及分层抽样的特点得 x 900= 320 1 600,解 得x=180. 2.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是

() A.抽签法B.系统抽样法 C.分层抽样法D.随机数法 解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为(). A.89 B.91 C.90 D.900 解析:选C考察平均数的计算与茎叶图的转换关系 考查点二用样本估计总体 4.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定

选修1-2统计案例

第一章检测试题 (时间:90分钟满分:120分) 一、选择题(本大题共10小题,每小题5分,共50分) 1.(2014回中期中)在画两个变量的散点图时,下列叙述正确的是( ) (A)预报变量在x轴上,解释变量在y轴上 (B)解释变量在x轴上,预报变量在y轴上 (C)可以选择两个变量中任意一个变量在x轴上 (D)可以选择两个变量中任意一个变量在y轴上 2.回归分析中,相关指数R2的值越大,说明残差平方和( ) (A)越小(B)越大 (C)可能大也可能小 (D)以上都不对 3.预报变量的值与下列哪些因素有关( ) (A)受解释变量的影响,与随机误差无关 (B)受随机误差的影响,与解释变量无关 (C)与总偏差平方和有关,与残差无关 (D)与解释变量和随机误差的总效应有关 4.若两个变量的残差平方和是325,(y i-)2=923,则随机误差对预报变量的贡献率约为( ) (A)64.8% (B)60% (C)35.2% (D)40%

5.为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知x i=52,y i=228, =478,x i y i=1849,则y对x的回归方程是( ) (A)=11.47+2.62x (B)=-11.47+2.62x (C)=2.62+11.47x (D)=11.47-2.62x 6.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说确的个数是( ) ①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人; ④在100个吸烟者中可能一个患肺癌的人也没有. (A)4 (B)3 (C)2 (D)1 7.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么(y i-)2的值为( ) (A)241.06 (B)2410.6 (C)253.08 (D)2530.8 8.两个分类变量X和Y可能的取值分别为{x1,x2}和{y1,y2},其样本频数满足a=10,b=21,c+d=35,若X与Y有关系的可信程度为90%,则c的值可能等于( ) (A)4 (B)5 (C)6 (D)7

高中数学选修2-3第三章《统计案例》测试题

高中数学选修2-3第三章《统计案例》测试题 姓名___________学号______(满分100分,时间90分钟) 一、选择题:(每题5分,共50分,请将准确答案填在答题卡内) 1.已知一个线性回归方程为?y =1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.5 2.对有线性相关关系的两个变量建立的回归直线方程 ???y a bx =+中,回归系数? b ( ) A .能等于0 B .小于0 C .可以小于0 D .只能等于0 3.能表示n 个点与相应直线在整体上的接近程度的是( ) A.1 ()n i i y i =-∑ B 1 ()n i i i y =-∑ C. 2 1 () n i i y i =-∑ D. 21 ()n i i y y =-∑ 4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2 = ()()()()() n ad bc a b c d a c b d -++++算得K 2 =2 110(40302030)7.860506050 ??-?≈???附表: P (K 2≥k ) 0.10 0.05 0.025 0.01 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.828 参照附表,得到的正确结论是( ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 5.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^ =-3+bx ,若∑i =1 10x i =17,∑i =1 10 y i =4,则b 的值为( ) A .2 B .1 C .-2 D .-1 6.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( ) A. y ^ =x +1 B. y ^=x +2 C. y ^=2x +1 D . y ^ =x -1 7.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:

高二数学《统计案例》教案

选修1-2第一章、统计案例 1、1回归分析的基本思想及其初步应用。(第1课时) 教学目标:通过典型案例,掌握回归分析的基本步骤。 教学重点:熟练掌握回归分析的步骤。 教学难点:求回归系数 a , b 教学方法:讲练。 教学过程: 一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 二、新课: 1、回归分析的基本步骤:(1) 画出两个变量的散点图。(2) 求回归直线方程。 (3) 用回归直线方程进行预报。 2、举例:例1、题(略) 用小黑板给出。 解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。体重为因变量 y ,作散点图(如图) (2)列表求 ,?0.849?85.712x y b a ≈≈- 回归直线方程 y=0.849x-85.712 对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。316kg 问题:身高为172cm 的女大学生的体重一定是60。316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业) 研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下: 水深xm 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速ym/s 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1)求y 对x 的回归直线方程; (2)预测水深为1。95m 时水的流速是多少? 解:(略) 三、小结 四、作业: 例2、 预习。

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学第三章统计案例2独立性检验教学案北师大版选修2_3

§2独立性检验 [对应学生用书P40] 1.2×2列联表 设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A - 1;变量B :B 1,B 2 =B - 1,用下表表示抽样数据 并将此表称为2.χ2 的计算公式 χ2 = n ad -bc 2a +b c + d a +c b +d . 3.独立性判断的方法 (1)当χ2 ≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. (1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断. (2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性. [对应学生用书P41]

[例1] 在调查的6名患有色盲,试作出性别与色盲的列联表. [思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可. [精解详析] 根据题目所给的数据作出如下的列联表: [一点通] 1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A.32,40 B C .74,82 D .64,72 解析:a =53-21=32,b =a +8=40. 答案:A 2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表. 解:列联表如下:

高中数学统计案例综合检测试题及答案-word文档

高中数学统计案例综合检测试题及答案 选修2-3第三章统计案例综合检测 时间120分钟,满分150分。 一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y 4.5 4 3 2.5 由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15 C.5.2 D.5.25 [答案] D [解析] x=2.5,y=3.5, ∵回归直线方程过定点(x,y), 3.5=-0.72.5+a,a=5.25.故选D. 2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有() A.b与r的符号相同 B.a与r的符号相同

C.b与r的符号相反 D.a与r的符号相反 [答案] A [解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0. 3.有下列说法: ①随机误差是引起预报值与真实值之间的误差的原因之一; ②残差平方和越小,预报精度越高; ③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系. 其中真命题的个数是() A.0 B.1 C.2 D.3 [答案] D 4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲 X 110 120 125 130 135 P 0.1 0.2 0.4 0.1 0.2 乙 X 100 115 125 130 145 P 0.1 0.2 0.4 0.1 0.2

统计案例

统计案例 《实习作业》教学设计 一、教学内容分析 《普通高中课程标准实验教科书数学(选修1-2)》(人教A版)第19页。统计是高中重要的知识模块,在解决概率、统计的问题中经常涉及到,也是近几年高考 的一个热点,本节内容主要包含了两部分,一是回归分析,另一部分是独立检验。特别是回归分析从近几年的 高考题来看屡屡出现。本章安排这节实习作业有两个.1、我们学校学生的体重与身高之间的关系可以用什么模型 来刻画?2、中学生喜欢文科还是理科与性别有关吗?是否喜欢看足球比赛与性别有关吗?是否喜欢音乐与性别 有关吗?我们的目的就是让学生进一步巩固所学的知识,提高学生分析问题解决问题的能力,动手操作的能力以 及用数学语言表达实习过程和实习结果的能力。学生在 通过自己设计统计方案,亲自抽取样本数据,整理数据 完成实习报告的这些过程中,不仅增强了应用数学的意 识和数学实践能力,更重要的感受到新课程下新的学习 方式带来的学习数学的乐趣。 二、学生学习情况分析 学生在学习完本单元中的两个案例后,对统计问题

中如何进行数据分析已经有了一定的认识,但在本节实习设计中,由于样本数据的差异,抽样方案设置等条件的限制,学生在自己所抽取到的数据怎么处理的具体流程尚不清楚,教师应在这些方面多注意,并加强指导。学生对实习作业这种学习形式积极性高,有热情和新鲜感,但缺乏经验,所以需要教师精心设计,做好辅导工作。特别在分组时注意学生的合理搭配,让所有的学生在合作过程中树立自信培养学习数学的兴趣。 三、设计思想及理论依据 《普通高中数学课程标准(实验)》强调高中数学课程有助于学生认识数学的应用价值,增强应用意识,形成解决简单实际问题的能力。高中数学课程要求把数学探究、数学建模的思想以不同的形式渗透在各模块和专题内容之中,并在高中阶段至少安排较为完整的一次数学探究、一次数学建模活动。本节创设的数学情境联系生活,体现数学的社会意义,也是对学生产生积极的影响的诱因。心理学研究表明:“需要是产生兴趣的基础,学生的学习兴趣既可以由学生的知识本身的需要而产生,也可以由知识的社会意义诱发去产生。”通过数学联系于生活,学生对知识的社会意义的理解形成了需要,在明确了学习的社会意义的基础上,就会把当前的学习与将来的理想联想起来,从而产生学习需要,形成

(新)高中数学复习课(一)统计案例教学案新人教A版选修1-2

复习课(一) 统计案例 回归分析 (1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现. (2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题. [考点精要] 1.一个重要方程 对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y ^=b ^x +a ^. 其中b ^= ∑i =1 n x i -x y i -y ∑i =1 n x i -x 2 ,a ^=y -b ^ x . 2.重要参数 相关指数R 2 是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好. 3.两种重要图形 (1)散点图: 散点图是进行线性回归分析的主要手段,其作用如下: 一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系; 二是判断样本中是否存在异常. (2)残差图: 残差图可以用来判断模型的拟合效果,其作用如下: 一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高. 二是确认样本点在采集中是否有人为的错误. [典例] (全国卷Ⅲ)如图是我国2008年到2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:∑i =1 7 y i =9.32,∑i =1 7 t i y i =40.17, ∑i =1 7 y i -y 2 =0.55,7≈2.646. 参考公式:相关系数r = ∑i =1 n t i -t y i -y ∑i =1 n t i -t 2 ∑i =1 n y i -y 2 , 回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^ = ∑i =1 n t i -t y i -y ∑i =1 n t i -t 2 ,a ^=y -b ^ t . [解] (1)由折线图中数据和附注中参考数据得 t =4,∑i =1 7 (t i -t )2 =28, ∑i =1 7 y i -y 2 =0.55, ∑i =1 7 (t i -t )(y i -y )=∑i =1 7 t i y i -t ∑i =1 7 y i =40.17-4×9.32=2.89, r ≈ 2.89 2×2.646×0.55 ≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系. (2)由y =9.32 7 ≈1.331及(1)得

高中数学复习课(一)统计案例教案(含解析)北师大版选修12

回归分析 高中数学复习课(一)统计案例教案(含解析)北师大版选修 12 (1)变量间的相关关系是高考解答题命题的一个,主要考查变量间相关关系的判断,求解回归方程并进行预报估计,题型多为解答题,有时也有小题出现. (2)掌握回归分析的步骤的是解答此类问题的关键,另外要掌握将两种非线性回归模型转化为线性回归分析求解问题. [考点精要] 1.一个重要方程 对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归直线方程为y =bx +a . 其中b = ∑i =1 n x i -x y i -y ∑i =1 n x i -x 2 ,a =y -b x . 2.重要参数 相关系数r 是用来刻画回归模型的回归效果的,其绝对值越大,模型的拟合效果越好. 3.两种重要图形 [典例] (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得x =116∑i =1 16 x i =9.97,s = 116∑i =1 16 x i -x 2 = 116? ?? ???∑i =1 16 x 2 i -16x 2≈0.212, ∑i =1 16 i -8.5 2 ≈18.439,∑i =1 16 (x i -x )(i -8.5)=-2.78,其中x i 为抽取 的第i 个零件的尺寸,i =1,2, (16) (1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21

解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关

统计学专业经典案例分析

案例2 美国国家健康照顾协会 美国国家健康照顾协会的主要任务是了解健康照顾人力资源的短缺情况,并为未来制定发展规划。为了掌握护理人员对所从事工作的满意程度,该协会发起了一场全国性的有关医院护理人员的调查研究。调查项目包括:工作满意度、收入、晋升机会等,填答方式采用打分制,从0~100分,分值高表示满意度高。下面是其中的一部分调查结果: 另外,按医院招募护理人员的方式,对上述资料的分组结果如下:

要求:运用描述统计方法对资料进行处理,采用的表示方法要让人能够方便地获取相应的信息,对你发现出的问题给予讨论。尤其要讨论下列内容: (1)根据给定的数据资料,指出哪些方面护理人员感到最为满意,哪些方面最不满意。有可能的话,请提出改进的措施并进行讨论。 由题目,做出如下统计分析: 列1 列2 列3

有上述分析,可知护理人员感到最为满意的是工作,收入方面最不满意。 改进措施: (2)根据变异分析的结果,为什么医护人员对工作满意度的意见差异那么大? 答:a.从列1的分析结果可知,平均数=79.8<中位数=82<众数=84,可知数据呈左偏分布,即:数据中存在极小值使得算数平均数偏向较小的一方,又因为中位数小于众数,可知数据中的较小值所占得数目较多。综上所述,列1,即工作所取得得数据中,有很多人打得分数较低,也就是说,很多人对工作都相当不满意,因此,数据的差异性较大,方差较大,医护人员对工作满意度的意见差异也很大。 b.计算各列的变异系数可得:列1变异系数=1.172125228/79.8=0.01469;列2变异系数=2.086723826/54.44=0.03833;列3变异系数=2.288884/58.36=0.03922;可知列1变异系数=0.01469>列3变异系数=0.03922>列2变异系数=0.03833;所以工作的离散系数最大,可知工作中平均数的代表性最小,说明很多分对工作并不满意,即:数据的差异性较大,方差较大,医护人员对工作满意度的意见差异也很大。 (3)从分类资料中,你能得出什么样的结论?各类医院之间,医护人员对工作满意度的差别如何,哪一类医院的情况最好? 私立医院 退伍军人

高二文科数学统计案例专项练习

高二文科数学统计案例专项练习 1.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分 层抽样抽取容量为30的样本,则抽高级职称的人数为 A .2 B .3 C .5 D .10 2.为了判断高一学生是否选修文科与性别的关系,现随机抽取 50名学生,得到右侧2×2列联表:则认为选修文科与性别有 关系出错的可能性不超过 A .0.005 B .0.05 C .0.95 D .0.095 3.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相 关关系,得到回归直线方程?0.5 1.5y x =+.若该地区的人均消费水平为3.5千元,估计该地区的人均消费额占人均工资收入的百分比约为 A .80% B .82.5% C .87.5% D .92.3% 4.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系.现取 8对观测值,计算得8 1 40i i x ==∑,8 1 240i i y ==∑,8 1 1800i i i x y ==∑,8 21 400i i x ==∑,则其线性回归方 程为 . 5.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm )与年龄x (岁)的回归模型为 ?8.2560.13y x =+. ①该地区一个10岁儿童的身高为142.63 cm ;②该地区2~9岁的儿童每年身高约增加8.25 cm ; ③该地区9岁儿童的平均身高是134.38 cm ;④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高. 上述叙述正确的有. 6.某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关 系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x (°C )与该奶茶店 ( (2)请根据所给五组数据,求出y 关于x 的线性回归方程???y bx a =+. (参考公式:()() () 1 2 1 ???n i i i n i i x x y y b a y bx x x ==--==--∑∑,.)

高中数学统计、统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

相关文档
最新文档