2017届高三数学-统计及统计案例-专题练习

2017届高三数学-统计及统计案例-专题练习
2017届高三数学-统计及统计案例-专题练习

.(湖南卷,文)在一次马拉松比赛中,名运动员的成绩(单位:分钟)的茎叶图如图所示.

a

=+,其中0.76

bx a

-.据此估计,该社区一户年收入为

b=,bx

m n

bt +中斜率和截距的最小二乘估计公式分别为()(

1

1

i

i n

i t

y b ==--=

∑∑bt -.

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

统计案例试题及答案

10-4统计案例 基 础 巩 固 一、选择题 1.对于事件A 和事件B ,通过计算得到χ2的观测值χ2≈4.514,下列说法正确的是( ) A .有99%的把握说事件A 和事件 B 有关 B .有95%的把握说事件A 和事件B 有关 C .有99%的把握说事件A 和事件B 无关 D .有95%的把握说事件A 和事件B 无关 [答案] B [解析] 由独立性检验知有95%的把握说事件A 与B 有关. 2.r 是相关系数,则下列叙述中正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强; ②r ∈[0.75,1]时,两变量正相关很强; ③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r =0.1时,两变量相关性很弱. A .1 B .2 C .3 D .4 [答案] D 3.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得∑i =1 8 x i =52,∑i =1 8 y i =228,∑ i =18 x 2 i =478,∑ i =1 n x i y i =1849,则 y 与x 的回归方程是( ) A.y ^ =11.47+2.62x B.y ^ =-11.47+2.62x

C.y ^ =2.62+11.47x D.y ^ =11.47-2.62x [答案] A 4.(2011·湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=(a +b )(c +d )(a +c )(b +d ) 算得,K 2= 110×(40×30-20×20)2 60×50×60×50≈7.8. 附表: A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C .有99%以上的把握认为“爱好该项运动与性别有关” D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C [解析] 本小题考查内容为独立性检验.

统计学 统计学-——典型案例、问题和思想

经济管理类“十二五”规划教材统计学 -基于典型案例、问题和思想 主讲林海明

第一章绪论 【引言】我们从如下9个重要事例,说明统计学有什么用。 事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了

这些危险区域,使英军取得了空战的胜利。 事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。

事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。这说明了统计学中调查的重要性。 事例4:在居民收入贫富差距的测度方

面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。 事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,

日本因此成为当时的第二经济强国。该学科现已发展到了6σ质量管理原则。 事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。 事例7:在产品质量检验方面,英国统

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

统计案例专项练习

统计案例测试题 A 卷 学校___________班级___________姓名___________学号___________成绩___________ 本试卷满分:100分;考试时间:90分钟. 一、选择题(本大题共10小题,每小题4分,共40分.在每小题给出的四个选项中,只有一项是符合要求的) 1.设有一个回归方程为x y 32?+=,变量x 增加一个单位时,则( ). A.y 平均增加2个单位 B.y 平均减少3个单位 C.y 平均减少2个单位 D.y 平均增加3个单位 答案:D 2.线性回归方程a x b y ???+=必经过的点是( ). A.(0,a ?) B.)?,(b x C.),(y x D.)?,?(b a 答案:C 3.温州市正在全面普及数字电视,某住宅小区有2万住户,从中随机抽取200户,调查是否安装数字电视,调查结果如右表,则该住宅小区已经安装数字电视的用户数为( ). 答案:A 如果y 与x 之间具有线性相关关系,那么当消光系数的读数为480时,汞含量( ). A.约为13.27 mg /L B.高于13.27 mg /L. C.低于13.27 mg /L D.一定是13.27 mg /L 答案:A C.K 2<2.706 D.K 2≈4.722 答案:D 6.在画两个变量的散点图时,下面叙述正确的是( ). A.两个变量中的任意一个变量在x 轴上 B.解释变量在x 轴上,预报变量在.y 轴上 C.预报变量在x 轴上,解释变量在y 轴上 D.两个变量中的任意一个变量在y 轴上

答案:B 7.收集一只棉铃虫的产卵数y 与温度X 的几组数据后发现两个变量有相关关系,并按不同的 A.7.4638.19?-=x y B.84 .327.0e ?-=x y C.202367.0?2-=x y D.1)78.0(?2--=x y 答案:B 8.如果根据性别与是否爱好物理的列表,得到K ≈3.843>3.841,所以判断性别与物理有关,那么这种判断出错的可能性为( ). A.5% B.15% C.20% D.25% 答案:A 9.下列各组变量的关系中是相关关系的是( ). A.电压U 与电流I B.圆面积S 与半径R C.粮食产量与施肥量 D.天上出现的彗星流与自然蚧的灾害 答案:C 10.在硝酸钠(NaNO 3)的溶解试验中,测得在不同温度t (℃)下,溶解于100mg 水中硝酸钠 A.t y 4863.0818.67?+= B.t y 6870.0508.67?+= C.t y 3914.0803.66?+= D.t y 3782.0812.68?+= 答案:B 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 11.在镁合金X 射线探伤中,透视电压u 与透视厚度l 有非常显著的线性关系,一组数据如 答案: 12.在H 0成立时,若P (K 2≥k )=0.40,则k =__________. 答案:0.708 13.随机抽样340人,性别与喜欢韩剧列联表如下表,则性别与喜欢韩剧有关的频率约为__________.

[高考专项训练]统计与统计案例

[高考专项训练]统计与统计案例

小题押题16—14??统计与统计案例 卷别年 份 考题位 置 考查内 容 命题规律分析 全 国卷Ⅱ201 5 选择题 第3题 条形图、 两变量 间的相 关性 统计与统计案 例部分,抽样方法考 查较少,且考查时题 目较简单;回归分析 与独立性检验在客 观题中单独考查时 较少;随机抽样、用 样本估计总体以及 全国卷Ⅲ201 7 选择题 第3题 折线图 的应用201 6 选择题 第4题 统计图 表的应

用 变量的相关性是命 题热点,难度较低. 江苏 201 8 第3题 平均数、茎叶图 考查点一 抽样方法 1.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 类别 人 数

老年 教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A.90B.100 C.180 D.300 解析:选C设该样本中的老年教师人数为 x,由题意及分层抽样的特点得 x 900= 320 1 600,解 得x=180. 2.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是

() A.抽签法B.系统抽样法 C.分层抽样法D.随机数法 解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为(). A.89 B.91 C.90 D.900 解析:选C考察平均数的计算与茎叶图的转换关系 考查点二用样本估计总体 4.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定

统计学实例

统计学基本概念 13.1统计学实例 统计学(Statistics):收集与分析数据的科学与艺术。 统计学与概率论的宗旨都是把不确定现象量化。 概率论是数学,其基本特征是从法则到结果(from rules to results), 统计学是一门科学,其基本特征是从结果到法则(from results to rules)。 ********************************************************** 统计学能够发挥作用的领域不胜枚举,举例如下: ●科学:实证的科学研究离不开搜集和分析数据; ●技术:技术的创新和改进离不开作试验和对试验数据的分析; ●工农业生产:改进质量或提高产量离不开作试验和对试验数据的分析; ●经济金融:对经济金融形势的分析与展望需要建立模型,离不开对大量数据 的分析;投资、保险、股票等; ●政府或公司的管理和决策——进行量化的管理和决策; 天气、医药、人口、社会卫生、收入保障体系的制定等等。 ********************************************************** 实例一统计学帮助政府解决难题 印度独立不久,首都发生暴乱,大量难民聚集到被称为红色堡垒的被保护区域。政府有责任给难民提供食品等必需品,将这个任务委托给了承包商。 政府担心承包商夸大商品的需求量,从中牟取暴利,但无从入手解决 有人建议让统计学家完成这个任务。但问题显得很困难。 全体避难者一天所需的米、豆和盐的总量为R,P,S。 普通人的消费调查,每人每天平均所需米、豆、盐的量分别为r,p,s

R/r,P/p,S/s ********************************************************** 实例二小儿麻痹症疫苗的有效性 问题:小儿麻痹疫苗问世后,1954年进行了一项研究以评价它在预防幼儿麻痹及死亡方面的有效性。两组幼儿参加了这项研究。试验组按规定接受三次疫苗,对照组则不接受疫苗。对照组作为证实疫苗有效性,进行对比是必须的。比较的最重要的判据是两组中发生麻痹以及死亡的幼儿数。由于小儿麻痹症发病率极低,两组都需要大量的幼儿以保证有足够的病例发生,从而为比较提供可靠的基础。Meier的文章称该项研究是“有史以来最大规模的公共卫生试验”。两组人数都略多于200000名小孩。 ********************************************************** 实例二小儿麻痹症疫苗的有效性 随机决定每个小孩是否接受疫苗。 表13.1试验组和对照组小儿麻痹发病率 组别幼儿人数发病人数发病率(每十万人)试验组2007453316 对照组20122911557测试中存在随机因素,如何在概率意义下量化差异?两组幼儿的发病率是否有本质的差异? 回答这些问题是统计推断的重要内容。 ********************************************************** 统计学有自己独特的思维方式与方法 ●统计的目的是回答实际领域中提出的各种问题,对科学结论提供定量分析(而不是单纯的定性分析)的依据;为发现新的理论模型提供线索;预测未来,为决策提供支持等。因此统计学以问题为导向,而不以理论为导向。统计学本质上是一门应用性、方法性的学科。

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

人员测评案例分析专项练习

四、案例分析 1某大型保健品公司(以下简称“R公司”)是一家集现代生物和医药制品研制、生产、 营销于一体的高科技股份制企业,在国内保健品行业具有很高的知名度,是国内保健品行业 首家上市公司。随着业务的发展,R公司希望在未来的时间里抓住机遇,加快实现超常规发 展,在产品系列化、产业多元化、经营规模化、市场国际化的基础上,使R公司的品牌真正 成为国内、国际知名的一流品牌。 一流的品牌必须要有一流的人才来支持。为了创建一流的品牌经营团队,R公司决定对其所有的30余名品牌经理、市场经理和大区销售经理进行全面的考核与评价,以此全面了解这三类人员的岗位胜任能力和潜在素质。为了保证评价的科学性和公正性,R公司希望通过专业的测评机构对这些营销骨干人员进行科学、公正的评估,并提供中立的、客观的专业 评估意见,为科学、合理地配置这三类人才提供决策依据。 假设你是专业测评机构项目工作组的带头人,请你为R公司的三类人进行评估写出你的 评估步骤,并给出你的评估意见。 第一步:前期沟通与访谈 为了科学地把握三类岗位的具体评价要求,项目工作组在R公司进行了三次访谈: 首先,向R公司了解和收集了有关三类岗位的工作职责和任职资格要求等方面的基本信息,然后对起进行统计整合;其二,与R公司的总裁、营销副总、人力资源部经理等高管人员就公司的企业文化、发展战略、三类人员胜任能力和工作业绩的现状、高层对三类人员的期望与要求等方面进行了沟通与访谈; 第三,采取两极抽样”的方式,对三类岗位上绩效良好和绩效较差的经理人员就相关岗位的工作职责、工作内容、工作流程、工作障碍和面临的挑战等方面进行了关键行为事件访谈,同时与他们的上司、助理、业务相关部门的同事进行了360。访谈。 通过对访谈所获得的各种信息的分析,结合中智人才测评中心的项目经验,项目工作组从知识、能力、心理素质和职业素养四个方面分别初步确定了三类岗位的胜任能力模型。 第二步:建立胜任能力模型 为了确保岗位胜任能力模型的科学性和准确性,中智人才测评中心组织了品牌经理、市场经理和大区销售经理岗位胜任能力模型的专家研讨会。邀请具有相关资深管理经验的人员作为外部专家,与中心的测评咨询顾问和R公司的人力资源管理人员一起对岗位胜任能力模型进行研讨,参会人员达16人。研讨会上, 专家们运用德尔菲法对三类人员的岗位胜任能力提岀了各自的看法,通过与会人员的交流与辩论,最终达成了品牌经理、市场经理与大区销售经理的岗位胜任能力模型专家意见。 在整合专家意见的基础上,项目工作组按建立胜任能力模型的要求,对能力维度的名称、定义、权重和标准等进行了分析和整理,形成了R公司三个岗位的胜任能力模型草案。随后,项目工作组就此模型草案向R公司高层领导征询了意见和建议,经修订后,最终达成了各方认可的胜任能力模型。 建立的三类岗位胜任能力模型主要包括四方面内容:职业素养、核心能力(核心业务能力与核心管理能力) 心理素质和知识素质。其中,品牌经理的岗位胜任能力模型具体内容为: 1)职业素养:包括诚信度、成就动机、激情等; 2)核心能力:包括市场分析能力、系统思考能力、创新能力等; 3)心理素质:包括情商、工作风格、个性特征等; 4)知识素质:包括市场营销、法律、财务等。 第三步:确定评估方案 结合胜任能力模型的内容与特点,项目组拟定运用专业化的评价中心技术对每个人进行全方位的评估与考察。所使用的评价中心技术主要包括: 1)心理测验一一主要从个性特征、情商、工作风格等方面进行评价,以此评估个性和行为风格,预测职业生涯发展的方向;

统计和统计案例(教师版)

高三 年级 数学 科辅导讲义(第 讲) 学生姓名: 授课教师: 授课时间: 第一部分 基础知识梳理 1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].

标准差: s = 1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是 则K 2 (χ2 )=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量). 第二部分 考点解析 热点一 抽样方法 例1 (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 (2)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)B (2)200 解析 (1)由840 42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以 1603 200=160-150 x ,所以x =200. 思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例. (1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人 做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( ) A .15 B .16 C .17 D .18 (2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )

统计学案例集

统计学教学案例集统计学精品课建设小组 2004年11月

【案例一】全国电视观众抽样调查抽样方案 一、调查目的、范围和对象 1.1 调查目的 准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。 1.2 调查范围 全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。 1.3 调查对象 全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。 二、抽样方案设计的原则与特点 2.1 设计原则 抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。 2.2 需要考虑的具体问题、特殊要求及相应的处理方法 2.2.1 城乡区分 城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,

以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。 在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。2.2.2 抽样方案的类型与抽样单元的确定 全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。 本抽样方案采用分层五阶抽样。各阶抽样单元确定为: 第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等); 第二阶抽样:街道、乡、镇; 第三阶抽样:居委会、村委会; 第四阶抽样:家庭户; 第五阶抽样:个人。 为提高抽样效率,减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。 2.2.3 自我代表层的设立 根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有8个,包括以下城市与地区:

高二文科数学统计案例专项练习

高二文科数学统计案例专项练习 1.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分 层抽样抽取容量为30的样本,则抽高级职称的人数为 A .2 B .3 C .5 D .10 2.为了判断高一学生是否选修文科与性别的关系,现随机抽取 50名学生,得到右侧2×2列联表:则认为选修文科与性别有 关系出错的可能性不超过 A .0.005 B .0.05 C .0.95 D .0.095 3.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相 关关系,得到回归直线方程?0.5 1.5y x =+.若该地区的人均消费水平为3.5千元,估计该地区的人均消费额占人均工资收入的百分比约为 A .80% B .82.5% C .87.5% D .92.3% 4.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系.现取 8对观测值,计算得8 1 40i i x ==∑,8 1 240i i y ==∑,8 1 1800i i i x y ==∑,8 21 400i i x ==∑,则其线性回归方 程为 . 5.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm )与年龄x (岁)的回归模型为 ?8.2560.13y x =+. ①该地区一个10岁儿童的身高为142.63 cm ;②该地区2~9岁的儿童每年身高约增加8.25 cm ; ③该地区9岁儿童的平均身高是134.38 cm ;④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高. 上述叙述正确的有. 6.某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关 系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x (°C )与该奶茶店 ( (2)请根据所给五组数据,求出y 关于x 的线性回归方程???y bx a =+. (参考公式:()() () 1 2 1 ???n i i i n i i x x y y b a y bx x x ==--==--∑∑,.)

统计与统计案例(文科)教程文件

统计与统计案例(文科)

统计与统计案例 第一节随机抽样 1.下面的抽样方法是简单随机抽样的是( ) A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖 B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见 D.用抽签方法从10件产品中选取3件进行质量检验 答案:D 2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 答案:D 3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 答案: C 4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 答案:B 5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案:4 6.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,

在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) A.90 B.100 C.180 D.300 答案:C 7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案:5 8.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=() A.54 B.90 C.45 D.126 答案:B 9.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人). 个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________. 答案:30 10.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案:1800 11.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人. 答案:40

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

高中数学统计统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。

(2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。

相关文档
最新文档