统计学案例分析

统计学案例分析
统计学案例分析

[案例13-1] 我国人身保险业的发展情况

保险可分为财产保险和人身保险两大类。人身意外伤害险是人身保险的一部分。随

着我国国民经济的快速发展,我国保险业也呈现出良好的发展态势,由人身意外伤害险的保费收入的变化可见一斑。

表8—14是我国2000—2006年各月的人身意外伤害险保费收入,数据来源于中国保险监督管理委员会网站的统计信息(网址:www.circ.go~cn),由编者根据各年各月的《保险业经营情况表》中的数据整理而成。根据这些数据可以分析研究我国人身意外伤害保

险的水平、速度和构成因素等各种数量特征,为研究保费收入变化的数量规律、分析保

费收入变化的影响因素、制定发展计划以及指导保险机构发展相关业务等提供重要的参

考信息。

案例思考与分析要求:

1.利用Excel绘制出该动态序列的折线图。

2.按本章第四节中所讲的动态数列构成因素的分类和特征,观察折线图并说明我国人身意外伤害险保费收入的变化中受哪几种构成因素的影响?

3.对上述月度数据计算同比增长速度和环比增长速度各有什么意义?

4.汇总出各年度保费收入总额,并根据年度数据计算2000---2006年间的:

(1)年平均发展水平。

(2)各年的逐期增长量、累计增长量和年平均增长量,验证逐期增长量与累计增长量之间的关系。

(3)各年的增长速度(环比、定基)、平均发展速度和平均增长速度,并指出增长速度超过一般水平的是哪几年?

(4)年度保费收入总额呈现出哪种形态的长期趋势?用恰当的数学模型将这种长期趋势表达出来(利用Excel拟合出具体的方程式),说明拟合效果的好坏,并预测2007年和2008年的发展水平。

5.如果要根据月度数据来测定保费收入序列的长期趋势,适合采用移动平均法还是数学模型拟合法?为什么?若采用移动平均法,平均的项数应为几项?试用Excel的移动平均工具进行计算并输出图表。

[案例11-1] 表8—12中是16只公益股票某年的每股账面价值和当年红利:

根据表8—12中的资料:

(1)画出这些数据的散点图;

(2)根据散点图,表明二变量之间存在什么关系?

(3)求出当年红利是如何依赖每股账面价值的估计的回归方程;

(4)对估计的回归方程中的估计回归系数(斜率)的经济意义作出解释;

(5)若序号为6的公司的股票每股账面价值增加1元,估计当年红利可能为多少?

[案例11-2]股票分析

案例背景

随着中国经济的发展和经济体制改革的深入,建立一个繁荣有效的金融市场势在必行,证券市场作为它的重要组成部分,正在发挥越来越重要的作用。在这一进程中,股票投资成为了一个越来越被普遍接受的投资选择。广大投资者不断寻求对个股和大盘分析及预测的有效途径以便对投资选择提供保障和支持。个股组成大盘,大盘反作用于个股,这似乎是毋庸置疑的事实。那么,能否通过探求它们之间的关系从而对预测和决策提供支持就成了我们所关心的课题。

本案例中采用的典型个股“深发展”是由深圳特区金融行业中6家城市信用社通过股份制改造组建而成的深圳发展银行。该银行于1987年5月向社会公开发行股票,同年12月28日正式开业,其股票于1991年4月3日在深圳证券交易所上市。另一典型个股“四川长!ttZ"即四川长虹电器股份有限公司。该公司属于电子行业,成立于1988年7月8日,1994年3月11日“四川长虹(A股)”在上海证券交易所上市交易。两者在发展历程中,业绩均连年增长较快,发展的潜力都很大。两只股票都是有一定影响力的,各自在其大盘中占有较大的权重,扮演着领头羊的角色。两只股票在其发展中呈现出较强的相关波动,纵观二者各指标历史数据的变化,这种同步现象频繁出现,使我们对二者的关系产生很大的兴趣。

“深发展”和“四川长虹”在中国股市上像一对孪生姐妹,它们的发展表现出同升、同降的现象。它们是否具有一定的内在联系?如果存在内在的联系,那么根据任一股票的变化能否判断另一股票的变动趋势?由于两者都是龙头股,根据它们的变动进而能否对大盘的变动做出推测?这正是将要讨论的问题。

数据来源及说明

本案例中采用的数据来源http://gaofei.myrice.com/bar_on_top.html,以

1998年

12月29日至2002年3月13日“深证指数”的每日收盘指数、“_kit指数”的每日收盘指数、“深发展”的日收盘价和“四川长虹”的日收盘价为变量,录入时,起始日期1998年12月29日(在序列中的标号定为1),终止日期2002年3月13日(序列标号定为780),由于非交易日不在数据序列当中,所以1998年12月29日到2002年3月13日共计780个交易日。

具体数据见(Excel数据文件“股票分析数据)。

其中变量名:Xl 深发展”日收盘价,X2 “四川长虹”日收盘价,X3 "深证指数”日收盘价,X4---“上证指数”日收盘价。

分析要求

(1)探求个股与个股、个股与大盘间是否有典型的相关关系?

(2)如果有,它们是否服从某种模型?

(3)更进一步,如果服从某种模型,能否根据这种模型做一些预测用于支持投资决策?以此为研究思路展开分析。

提示:相关分析、回归分析、时间序列分析。

[案例6—1] 对大学毕业生工薪的抽样估计

很多测评机构在比较各个高校的实力或比较不同高校培养的大学生受社会欢迎的程度时,不仅使用到就业率等指标,还经常用大学毕业生的工薪高低来衡量。要反映一个学校所培养学生的工薪水平显然不宜用该校全部学生工薪的最高水平或最低水平,否则容易受个别极端值(统计上也称为异常值)的影响,通常应采用该校全部学生工薪的平均水千、工薪达到一定水平的毕业生比重等统计指标来衡量。但要对毕业生进行全面调查既不太可能也不必要,为此可进行抽样推断,即随机抽取一定数量的大学毕业生构成样本,

从我国某高校2005年毕业且在某地区就业的学生中随机抽取36名进行调查,所得的样本数据如表6-6所示。表中的工薪是指大学毕业生工作第一个月的工薪。

案例思考与分析要求:

1.以1 500、2000、2 500和3 000为组限,将样本数据进行分组,并编制出变量数列,绘制出直方图,观察样本数据的分布特征。建议利用Excel的“直方图”分析工具来完成这一任务。

2.利用Excel的“描述统计”工具对样本数据进行描述性分析,并对该校当年在调查地就业的全体毕业生的平均工薪水平进行区间估计,置信度为95%(要求指出抽样平均误差、抽样极限误差和置信区间)。

3.若要求分别以90%和99.7%的置信度再进行上述估计,试计算出相应的抽样平均误差、抽样极限误差和估计区间范围,并且观察它们都发生什么样的变化。

4.样本中工薪在2 500元以上的毕业生占多大比重?试以90%的置信度估计相应的抽样平均误差、抽样极限误差和总体比重的区间。

5.样本中工薪在3 000元以上的毕业生占多大比重?试以90%的置信度估计相应的抽样平均误差、抽样极限误差和总体比重的区间。通过对样本调查所获取的数据来估计或推断总体的平均水平或某一比重等数量特征。

[案例6-2] 应该抽取多少劳动力进行调查

要进行抽样推断,就要先获取样本数据。为此首先就必须在调查方案中攻计好样本容量的大小,即必须明确应从总体中抽取多少个体(总体单位)进行调查。抽样推断的理论告诉我们,如果样本容量太小,抽样误差太大,就不能满足推断精度的要求;如果样本容量过大,虽然足以满足推断精度要求,但调查的代价(包括人力、财力、物力和时间的花费)很大,造成不必要的浪费,甚至使调查变得无法实施或得不偿失。所以,科学地确定合适的样本容量是抽样调查中很重要的一个环节。

某市劳动就业局为了了解该市劳动力的就业和收入状况,准备进行一次抽样调查,调查内容包括性别、年龄、学历、是否在业、在何种类型的单位就业、本月工作天数、本月王资收入、家庭其他成员是否在业等。在待估计的多项总体指标中,最关注的是全市劳动力的就业率(或失业率)以及月平均收入。因此规定了这两个指标的估计精度:要求在95%的置信度下,就业率或失业率的允许误差不超过1个百分点,月平均收入的允许误差不超过3%。

由其他渠道初步估计:全市劳动力的就业率大致为94%,失业率大致为6%,平均每个劳动力的月收入大约为1 650元,标准差为584元。

根据上述推断要求和已知的相关信息,应该抽取多少劳动力构成所要调查的样本呢?

案例思考与分析要求:

1.根据就业率的允许误差要求计算出样本量(提示:就业率的允许误差就是其抽样极限误差,即?=1%)。

2.根据失业率的允许误差要求计算出样本量(提示:失业率的允许误差就是其抽样极限误差,同样?=1%),并注意计算结果与第一个问题的答案有何关系?

3.根据月平均收入的允许误差要求计算出样本量(提示:要求月平均收入的允许误差不超过3%,这里的3%是误差率或称为相对允许误差,再根据劳动力的月平均收入,就可以将其换算为允许误差的绝对值?)。

4.为了满足就业率和月平均收入的允许误差要求,应该共用一个调查样本还是分别抽取各自的调查样本?如果可以共用一个调查样本,那么该样本的样本容量应该取得多大?为什么?

5.如果要求推断的置信度下降到90%,样本容量的计算结果应各是多少?如果要求推断的置信度提高到99.7%,样本容量的计算结果又是多少?观察计算结果的变化,并说明推断的置信度与样本容量之间存在什么关系。

2016-2018年高级统计师高级统计实务与案例分析试卷考试真题

2016年高级统计师高级统计实务与案例分析试卷考试真题 1.本试卷有两部分,共8道题,满分150分。其中第一部分为必答题,共6道题,满分130分;第二部分为选答题,要求选答1道题,若多答,评卷时只对前1道答题打分,满分20分。 2.在你拿到试卷的同时将得到一份专用答题卡,所有试题务必在专用答题卡上作答,在试卷或草稿纸上作答不得分。 3.用铅笔填涂答题卡首页的准考证号;答题以及需要填写姓名、准考证号码的地方用黑色签字笔书写。 4.答题时请认真阅读试题,对准题号作答。 第一部分必答题 第一题(25分) 简述当前开展“三新”(新产业、新业态、新商业模式)统计的意义。 第二题(20分) 简述国民经济核算中的基本总量指标及其平衡关系。 第三题(25分) 某地有三家工业企业A、B、C,共属于同一家集团公司,A企业为该集团公司的核心企业。2016年2月,政府统计机构没有在规定时间收到三家企业的统计报表,向三家企业分别发出要求其补报有关统计资料的催报单。A企业汇总三家企业的生产经营情况后,在催报期限内,以A企业的名义将三家企业的生产经营情况一并予以上报;B企业在催报期限内补报了本企业的统计报表,但经核查,统计报表中有多项统计指标没有填写;C企业认为A企业已经将本企业情况一并打捆上报,因此没有补报本企业的统计报表。请回答:(1)该案例中三家企业是否都存在违法行为?分别是哪些统计违法行为? (2)应当如何处罚? 第四题(20分) 阐述抽样调查中可能产生的误差,并结合实际提出控制误差的建议。 第五题(20分) 解释人口老龄化的概念,并结合表中数据分析该地区人口老龄化的状况及可能产生的影响。 第六题(20分) 根据下图简要分析我国近年经济发展的基本特征。

商务统计学试卷C答案

命题方式:统一命题 佛山科学技术学院2014—2015学年第二学期 《商务统计学》课程期末考试试题C答案 专业班级:13级经济管理1~10班任课老师:辛焕平、贲雪峰、靳娜 一、判断题(1分×15=15分) 二、单项选择题(1分×15=15分) 三、多项选择题(2分×10=20分) 四、简答题(6分×2=12分) 1、答:根据研究的目的与要求,结合研究对象的特点,把统计总体按照某一标志划分为若干性质不同而有联系的几个部分,这种分类就叫统计分组。 要求:(1)根据研究的目的选择分组标志;(2)要选择反映研究对象本质或主要特征的标志;(3)严格遵守分组的穷举性和互斥性原则;(4)要结合研究对象所处的具体历史条件或经济条件来选择分组标志。 2、答:(1)时期指标数值可以相加,而时点指标数值直接相加没有实际的经济意义;(2)时期指标数值的大小与时期长短同方向变化,而时点指标数值的大小与时间间隔长短

没有直接联系;(3)时期指标一般通过连续登记加总求得,而时点指标通过间断的登记方法取得。 五、综合业务计算题(1小题6分,2、3小题各10分,4小题12分,共38分) 1、 解:季平均劳动生产率2 254321 b b b b b a ++++= ∑ = 24180 413540954110241001960 200019501000+++++++ = 16480 6910 =0.4193(万元/人) 年劳动生产率 = 季平均劳动生产率×4 = 0.4193×4= 1.6772(万元/人) (1)∑∑= f xf x = 97000/100=970(小时) 抽样的100只灯管的平均耐用时间是970小时 (2)用样本方差代替总体方差 (小时))(13600100 1360000 2 2== -= ∑∑f f x x x δ 抽样平均误差) ()(1000 1 11001360012 -=-= N n n x τδμ=11.66 抽样极限误差98.3466.113=?==?τμt x 区间范围98.34970±=?±=τx X =935.02~1004.98(小时) 在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围为935.02小时~ 1004.98小时。

应用统计学案例统计调查方案设计

应用统计学案例统计调查方案设计

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位 调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容 调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表 如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其它内容

包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。 (3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面能够灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法 逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情理。

应用统计学案例——市场调查分析

市场调查分析案例 市场调查分析是市场调查的重要组成部分。通过市场调查收集到的原始资料,是处于一种零散、模糊、浅显的状态,只有经过进一步的处理和分析,才能使零散变为系统、模糊走向清晰、浅显发展为深刻,分析研究其规律性,达到正确认识社会现象目的,为准确的市场预测提供参考依据,最终为调查者正确决策提供有力的依据。 市场调查分析的原则:从全部事实出发,坚持事实求实的观点;全面分析问题,坚持一分为二的观点;必须从事物的相互联系,相互制约中分析问题; 市场调查分析方法:单变量统计量分析、单变量频数分析、多变量统计量分析、多变量频数分析、相关分析、聚类分析、判别分析、因子分析等。 案例:某市家用汽车消费情况调查分析案例 随着居民生活水平的提高,私车消费人群的职业层次正在从中高层管理人员和私营企业主向中层管理人员和一般职员转移,汽车正从少数人拥有的奢侈品转变为能够被更多普通家庭所接受的交通工具。了解该市家用汽车消费者的构成、消费者购买时对汽车的关注因素、消费者对汽车市场的满意程度等对汽车产业的发展具有重要意义。 本次调研活动中共发放问卷400份,回收有效问卷368份,根据整理资料分析如下。 一、消费者构成分析 1 、有车用户家庭月收入分析

5000元以上8.69 100.00 目前该市有车用户家庭月收入在2000?3000元间的最多;有车用户平均月收入为2914.55元,与该市民平均月收入相比,有车用户普遍属于收入较高人群。61.96%的有车用户月收入在3000元以下,属于高收入人群中的中低收入档次。因此,目前该市用户的需求一般是每辆10?15万元的经济车型。 2、有车用户家庭结构分析 表2: 有车用户家庭结构 Di nk家庭(double in come no kid ),即夫妻二人无小孩的家庭,占有车家 庭的比重大,为36.96%。其家庭收入较高,负担较轻、支付能力较强,文化层次高、观念前卫,因此Dink家庭成为有车族中最为重要的家庭结构模式。核心家庭,即夫妻二人加上小孩的家庭,比重为34.78%。核心家庭是当前社会中最普遍的家庭结构模式,因此比重较高不足为奇。联合家庭,即与父母同住的家庭, 仅有8.70%。单身族占17.39%,这部分人个人收入高,且时尚前卫,在有车用户中占据一定比重。另外已婚用户比重达到了81.5%,而未婚用户仅为18.5%。 3、有车用户职业分析 调查显示有29%勺消费者在企业工作,20%勺消费者是公务员,另外还有自由职业者、机关工作人员和教师等。目前企业单位的从业人员,包括私营业主、高级主管、白领阶层仍是最主要的汽车使用者。而自由职业者由于收入较高及其工作性质,也在有车族中占据了较 高比重。详见图1。

商务统计学Assignment 2 (附答案)

Assignment 2 1. The amount of bleach a machine pours into bottles has a mean of 36 oz. with a standard deviation of 0.15 oz. Suppose we take a random sample of 36 bottles filled by this machine. What is the probability that the mean of the sample is greater than 35.94 oz? 4.236 15 .03694.35-=-=-=x x X Z σμ )4.2()4.2(Φ=->Φx The area corresponding to Z=2.4 in Table E.2 is 0.9918 Because the probability that the mean of the sample is greater than 35.94 oz,so the value is 0.9918. 2. Page 186-- Answer questions in 7.47 (b),(c) (b)60.150002 .098.098.099.0)1(60.150002 .098.098.097.0)1(2211=?-=--=-=?-=--= n p Z n p Z ππππππ 9452.0)60.1(=Φ 1-2(1-0.9452)=0.8904 Using Table E.2,the area between 97% and 99% with Internet access is 0.8904,only 89.04% of the samples of n=500 would be expected to have sample between 97% and 99% with Internet access. (c))60.1()60.1(60.1500 02.098.098.097.0)1(11>Φ=-<Φ-=?-=--= x x n p Z πππ 9452.0)60.1(=Φ 1-0.9452=0.0548 Using Table E.2,the area less than 97% with Internet access is 0.0548,only 5.48% of the samples of n=500 would be expected to have sample less than 97% with Internet access.

多元统计分析案例分析.docx

精品资料 一、对我国30个省市自治区农村居民生活水平作聚类分析 1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中

2、将数据进行标准化变换:

3、用K-均值聚类法对样本进行分类如下:

分四类的情况下,最终分类结果如下: 第一类:北京、上海、浙江。 第二类:天津、、辽宁、、福建、甘肃、江苏、广东。 第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。 第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。 二、判别分析 针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:

**. 错误分类的案例 从上可知,只有一个地区判别组和原组不同,回代率为96%。 下面对新疆进行判别: 已知判别函数系数和组质心处函数如下: 判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188 计算Y值与不同类别均值之间的距离分别为:D1=138.5182756 D2=12.11433124 D3=7.027544292 D4=2.869979346 经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。 三,因子分析: 分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:

统计学 统计学-——典型案例、问题和思想

经济管理类“十二五”规划教材统计学 -基于典型案例、问题和思想 主讲林海明

第一章绪论 【引言】我们从如下9个重要事例,说明统计学有什么用。 事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了

这些危险区域,使英军取得了空战的胜利。 事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。

事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。这说明了统计学中调查的重要性。 事例4:在居民收入贫富差距的测度方

面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。 事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,

日本因此成为当时的第二经济强国。该学科现已发展到了6σ质量管理原则。 事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。 事例7:在产品质量检验方面,英国统

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

商务统计学笔试复习题

一、The manager of the customer service division of a major consumer electronics company is interested in determining whether the customers who have purchased a videocassette recorder made by the company over the past 12 months are satisfied with their products. 1., the population of interest is a)all the customers who have bought a videocassette recorder made by the company over the past 12 months. b)all the customers who have bought a videocassette recorder made by the company and brought it in for repair over the past 12 months. c)all the customers who have used a videocassette recorder over the past 12 months. d)all the customers who have ever bought a videocassette recorder made by the company. ANSWER: a 2., which of the following will be a good frame for drawing a sample? a)Telephone directory. b)Voting registry. c)The list of customers who returned the registration card. d) A list of potential customers purchased from a database marketing company. ANSWER: c 3.the possible responses to the question "How many videocassette recorders made by other manufacturers have you used?" are values from a a)discrete random variable. b)continuous random variable. c)categorical random variable. d)parameter. ANSWER: a 4.the possible responses to the question "Are you happy, indifferent, or unhappy with the performance per dollar spent on the videocassette recorder?" are values from a a)discrete numerical random variable. b)continuous numerical random variable. c)categorical random variable. d)parameter. ANSWER: c

统计学案例集

统计学教学案例集统计学精品课建设小组 2004年11月

【案例一】全国电视观众抽样调查抽样方案 一、调查目的、范围和对象 1.1 调查目的 准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。 1.2 调查范围 全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。 1.3 调查对象 全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。 二、抽样方案设计的原则与特点 2.1 设计原则 抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。 2.2 需要考虑的具体问题、特殊要求及相应的处理方法 2.2.1 城乡区分 城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,

以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。 在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。2.2.2 抽样方案的类型与抽样单元的确定 全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。 本抽样方案采用分层五阶抽样。各阶抽样单元确定为: 第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等); 第二阶抽样:街道、乡、镇; 第三阶抽样:居委会、村委会; 第四阶抽样:家庭户; 第五阶抽样:个人。 为提高抽样效率,减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。 2.2.3 自我代表层的设立 根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有8个,包括以下城市与地区:

商务统计学笔试复习题

一、 The manager of the customer service division of a major consumer electronics company is interested in determining whether the customers who have purchased a videocassette recorder made by the company over the past 12 months are satisfied with their products. 1., the population of interest is a)all the customers who have bought a videocassette recorder made by the company over the past 12 months. b)all the customers who have bought a videocassette recorder made by the company and brought it in for repair over the past 12 months. c)all the customers who have used a videocassette recorder over the past 12 months. d)all the customers who have ever bought a videocassette recorder made by the company. ANSWER: a 2., which of the following will be a good frame for drawing a sample a)Telephone directory. b)Voting registry. c)The list of customers who returned the registration card. d) A list of potential customers purchased from a database marketing company. ANSWER: c 3.the possible responses to the question "How many videocassette recorders made by other manufacturers have you used" are values from a

完整word版经济统计分析案例

案例2-1 Gulf Real Estate Properties公司 Gulf Real Estate Properties有限责任公司是佛罗里达西南部的一家房地产公司。企业在广告中称自己是“真正的地产专家”。公司通过搜集有关地点、定价、售价和每套售出花费天数,对房屋的销售进行监督。如果房屋位于墨西哥湾,则称之为“看得见海湾的房屋”;如果房屋位于墨西哥湾附件的其他海湾或者高尔夫球场,则称之为“看不见海湾的房屋”。来自佛罗里达州那不勒斯的多元列表服务的样本数据,给出了最近售出的40套看得见海湾的房屋和18套看不见海湾的房屋的数据。数据见GulfProp.xls,价格以千美元计。 管理报告 1.对看得见海湾的房屋,求售价的总体均值以及售出中花费天数的总体均值的95%置信区间,并解释你的结论。 2.对看不见海湾的房屋,求售价的总体均值以及售出中花费天数的总体均值的95%置信区间,并解释你的结论。 3.假定分公司的经理要求在40000美元的边际误差下对看得见海湾的房屋售价的均值进行估计,在15000美元的边际误差下对看不见海湾的房屋售价的均值进行估计。取置信度为95%,则应选取多大的样本容量。 解答:利用Excel软件求得一些数据如图1、图2: 图1:看得见海湾

图2:看不见海湾 ?未知的情况,售价首先对看得见海湾的房间,根据题意,易知这是属于1. ?X 106454.2?X , ,出售天数的总体均值的总体均值21 :则售价的95%置信区间为SS 192.5192.5?????? 1nn ?1?392.65,515.79????454.2?2.0232.023?X ?t ?,X ?t ,454.2?????11 ??nn 4040???? 22 售出中花费天数的均值的95%置信区间为: SS 52.252.2?????? 1n 1?n ?89.30,122.70?106?2.023?t ?,X ?t ??,106?2.023?X ?????22 ??nn 4040???? 22 ?2. 未知的情况,售价的总体均值对于看不见海湾的房间,依旧是 X ?135.0203.2X ? ,售出天数的总体均值21所以售价的总体均值的95%置信区间 为: SS 43.8943.89??????

《统计分析与SPSS的应用(第五版)》课后练习答案(第8章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第8章SPSS的相关分析 1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果如下表。 编号客户满意度得分综合竞争力得分编号客户满意度得分综合竞争力得分 1 90 70 9 10 60 2 100 80 10 20 30 3 150 150 11 80 100 4 130 140 12 70 110 5 120 90 13 30 10 6 110 120 14 50 40 7 40 20 15 60 50 8 140 130 请问,这些数据能否说明企业的客户满意度与其综合竞争力存在较强的正相关,为什么? 能。步骤:(1)图形旧对话框散点/点状简单分布进行相应设置确定;(2)再双击图形元素总计拟合线拟合线线性确定

(3)分析相关双变量进行相关项设置确定 相关性 客户满意度得分综合竞争力得分 ** 客户满意度得分Pearson 相关性 1 .864 显著性(双尾).000 N 16 15 综合竞争力得分Pearson 相关性.864 ** 1 显著性(双尾).000 N 15 15 **. 在置信度(双测)为0.01 时,相关性是显著的。 两者的简单相关系数为0.864,说明存在正的强相关性。

2、为研究香烟消耗量与肺癌死亡率的关系,收集下表数据。(说明:1930年左右几乎极少的妇女吸烟;采用1950年的肺癌死亡率是考虑到吸烟的效果需要一段时间才可显现)。 国家1930 年人均香烟消耗量1950 年每百万男子中死于肺癌的人数 澳大利亚480 180 加拿大500 150 丹麦380 170 芬兰1100 350 英国1100 460 荷兰490 240 冰岛230 60 挪威250 90 瑞典300 110 瑞士510 250 美国1300 200 绘制上述数据的散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显 著的相关关系。 香烟消耗量与肺癌死亡率的散点图(操作方法与第 1 题相同) 相关性 人均香烟消耗死于肺癌人数 ** 人均香烟消耗Pearson 相关性 1 .737 显著性(双尾).010 N 11 11 死于肺癌人数Pearson 相关性.737 ** 1

统计学案例分析

统计学案例实习教学大纲(课程编号:00700397) 适用年级: 是否双语:是 否

课程类别:E:集中性实践 学时学分:课程总学时2周其中实验(上机)学时学分 2 先修课程:《统计学》《统计学案例》《市场调查与分析》 开课单位:管理学院统计系 适用专业统计学 开课学期 4 二、实践环节简介 统计学案例实习课程是统计学专业的一门技术基础课,是专业选修课程,也是统计学专业的重要实践环节课。它是在学习了统计学、市场调查与分析相关理论和方法的基础上,如何将相关理论和方法运用于实际问题的解决。拉近理论与现实的距离,使统计学专业的学生更好地掌握统计综合指标的计算和应用,抽样调查的基本理论和方法,统计预测的理论、方法及应用,并提高实践动手能力和综合分析能力。 三、实践环节教学目的与基本要求 教学目的: 1.通过课程实习,应使学生掌握统计学的基本理论,统计研究的基本方法,掌握统计综合指标的计算和应用,统计指数的编制和分析,抽样调查的基本理论和方法,掌握统计预测的理论、方法及应用。 2.通过课程实习,培养学生具备对经济运行的实际内容进行具体的计算分析,培养学生用统计方法解决实际问题的能力。 3.通过具体而全面的统计案例实习来启发学生的悟性,挖掘学生的潜能,培养学生用统计理论和统计方法解决实际问题的动手能力和创新能力,提高学生的统计素质。 基本要求: 在已学习了统计学、市场调查与分析和统计学案例等课程的前提下,要求学生既能够独立完成各项实习,又能够养成团队协作的精神,共同撰写实习报告。 四、实践环节注意事项 实习方式:学生自己动手实习。 1、以小组为单位进行实习。 2、实行开放式实习教学,增加学生选择实验项目和实验时间的自主性。 注意事项:1、实习前由教师向学生讲明课程内容、进度安排、书写实验报告要求等。 2、实习4-6人为一组, 分工、协作共同完成。 3、实习报告是本实习教学的一个重要环节, 需要学生掌握的内容可以通过实习报告反映学生对其掌握程度, 让教师了解尚存在的问题。 五、实践环节主要内容与时间安排 (一) 实习项目一大学生生活费收支状况调查 知识点:调查方案设计的基本内容,设计方法 重点:各种抽样统计调查方法的特点和应用条件 难点:大学生生活费收支状况分析 实习项目二关于逃课问题的调查 知识点:调查方案设计 重点:问卷设计 难点:对逃课问题分析。 实习项目三福州大学本科生自习情况调查 知识点:调查方案设计 重点:问卷设计

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

商务统计学复习题

复习题 一、单项选择题 1.下列数据属于名义尺度(nominal scale)的是() A.性别B) 年龄C)体重D)年级 2.下列数据属于名义尺度(nominal scale)数据的是()。 A.性别 B. 年龄 C. 体重 D. 年级 3.下列数据属于区间尺度(order scale)数据的是()。 A.气温 B. 产量 C. 体重 D.年级 4.针对z-分数(z-score),下列说法不正确的是()。 A. 若z-分数小于0,则变量值小于平均数 B. 若z-分数大于0,则变量值大于平均数 C. 若z-分数等于0,则变量值等于平均数 D. 若z-分数等于0,则变量值等于0 5.下列选项中,不属于变异指标(measure of variability)的是() A) 平均数B) 极差C) 标准差D) 变异系数 6.下列几种分布中,属于离散型随机变量(discrete random variable)的分布的是()。 A. 二项分布 B. 泊松分布 C. D. 超几何分布 7.下列几种常见的分布中,属于连续型随机变量(continuous random variable)的分布的是()。 A. 二项分布 B. 泊松分布 C. 指数分布 D. 超几何分布 8.一个特定研究中感兴趣的对象的全体称为() A) 样本(sample) B) 参数(a parameter) C) 统计量(statistic)D) 总体(population) 9. 下列不属于描述统计(descriptive statistics)常用形式的是() A) 绘制图形B) 绘制表格C) 计算平均数D) 区间估计 10. 下列属于统计推断(statistical inference)内容的是() A) 绘制图形B) 绘制表格C) 计算平均数D) 区间估计 11. 下列图形中,不能用于分类数据(categorical data)的是() A)条形图B) 茎叶图C) 柱状图D) 饼状图 12. 商务数据的相对频数( relative frequency)之和为() A)1 B) 2 C) 0 D)不确定 13. 若偏度=-0.85,则该组数据的分布形态为() A)适度左偏B) 适度右偏C) 对称D) 无法确定 14. 若偏度=0.85,则该组数据的分布形态为()

统计学-案例分析(英文)

Executive summary With the development of globalization and information technology, outsourcing has gained great popularity all over the world. On the other hand, virtual works have more chances to find freelance works with the development of outsourcing. The reasons for outsourcing includes low operational and labor costs, tax breaks, to gain more global and local market share, to reduce risks, to move to higher segments of the value added chain, to serve for innovation as well as to focus to accelerate business transformation. Now the Brammer is encountered with a problem of management that the purchasing and management of spares for the daily operations, maintenance and repair of production and manufacturing equipment is often a complex, time and resource consuming issue for most organizations. The Brammer is considering whether they will outsource the management of spares. This research will focus on identifying a management problem of the Brammer and designing an appropriate business research strategy for success in business. What is more, the essay will choose a qualitative research methodology to investigate the organizational management problem of the Brammer.

相关文档
最新文档