统计学答案

统计学答案
统计学答案

统计学答案

Document number【980KGB-6898YT-769T8CB-246UT-18GG08】

第一章导论

(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数

(5)推断统计方法。

第二章数据的搜集

1.什么是二手资料使用二手资料需要注意些什么

与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位

样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法

实验式、观察式等。

4. 自填式、面方式、电话式调查个有什么利弊

自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。

面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。

电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。

5.请举出(或设计)几个实验数据的例子。

不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。

6.你认为应当如何控制调查中的回答误差

对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。

7.怎样减少无回答请通过一个例子,说明你所考虑到的减少无回答的具体措施。

对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回答出现后,分析武回答产生的原因,采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。

第三章数据的图表搜集

一、思考题

数据的预处理包括哪些内容

答:审核、筛选、排序等。

分类数据和顺序数据的整理和显示方法各有哪些

答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,如果是两个或两个以上变量可以制作交叉表。对于分类数据可以绘制条形图、帕累托图、饼图、环形图等。根据不同的资料或者目的选择不同的图。

对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。可根据需要绘制条形图、饼图、环形图等。

数值型数据的分组方法有哪些简述组距分组的步骤。

答:单变量值分组和组距分组。其中组距分组:第一步,确定组数,组数多少由数据的多少和特点等决定,一般5~15组;第二步,确定各组组距,宜取5或10的倍数;第三步,根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。

直方图和条形图有何区别

答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;2直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。

绘制线图应注意问题

答:时间在横轴,观测值绘在纵轴。一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。

饼图和环形图的不同

答:饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。

茎叶图比直方图的优势,他们各自的应用场合

答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。

鉴别图标优劣的准则

答:P65明确有答案,我就不写了。

制作统计表应注意的问题

答:1,合理安排统计表结构;2表头一般包括表号,总标题和表中数据的单位等内容;3表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空白格;4在使用统计表时,必要时可在下方加注释,注明数据来源。

第4章 数据的概括性度量 (1)众数:100=M 。

中位数:5.52

1102

1=+=+=n 中位数位置,102

10

10=+=

e M 。 平均数:6.910

96

101514421

==++++=

=

∑= n

x

x n

i i

(2)5.24

10

4===

n Q L 位置 ,5.5274=+=L

Q 。 5.74

10

343=?==n Q U 位置,1221212=+=U Q 。 (3)

2.49

4

.1561

10)6.915()6.914()6.94()6.92(1)(2

2221

2

==

--+-++-+-=

--=∑= n x x

s n

i i

(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

(1)从表中数据可以看出,年龄出现频数最多的是19和23,所以有两个众数,即

19

0=M 和

23

0=M 。

将原始数据排序后,计算的中位数的位置为:132

1252

1=+=+=n 中位数位置,第13个位置上的数值为23,所以中位数23=e M 。 (2)25.64

254===

n Q L 位置,19)1919(25.019=-?+=L Q 。 75.184

25

3=?=

位置U Q ,56.252-7257.052=?

+=)(U Q 。

(3)平均数2425

600

25231715191

==++++=

=

∑= n

x

x n

i i

65.61

251062

1

25)2423()2417()2415()2419(1)(2

2221

2

=-=

--+-++-+-=

--=∑= n x x s n

i i (4)偏态系数:()

08.165

.6)225)(125(24253

3

=?---=

∑i x SK 。

峰态系数:[]

77.065

.6)325)(225)(125()

125()24(3)24()125(254

2

24=?-------+=

∑∑i i x x K 。

(5)分析:从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多

数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 (1)茎叶图如下: 茎 叶 数据个数 5 5 1 6 6 7 8 3 7 1 3 4 8 8 5

(2)79

63

98.78.76.65.5==++++= x 。

714.0808

.419)78.7()78.7()76.6()75.5(2222==--+-++-+-= s 。

(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式:274.02.797.11==v ;102.07

714

.02==v 。由于21v v >,表明第

一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

(1)1.27430

8223

1

==

=

∑=n

x

x n

i i

。 5.152

130=+=

中位数位置,5.2722273272=+=

e M 。 (2)5.74

30

==

位置L Q ,5.2592261258=+=

L Q 。

5.224

30

3=?=

位置U Q ,5.2872291284=+=

U Q 。 (3)17.211

307

.130021

)(1

2

=-=

--=

∑=n x x

s n

i i

(1)41.19340

6600

30

1500203000152100150030002100==++++==

总产量总成本甲企业的平均成本。

92.18342

55

6230

1500200051152553150000515523==++++==总产量总成本乙企业的平均成本.

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 (1)平均数计算过程见下表:

按利润额分组

组中值 i M 企业数

i f

i i f M 200~300

250 19 4750 300~400 350 30 10500 400~500 450 42 18900 500~600 550 18 9900 600以上 650 11 7150 合计 — 120 51200

67.426120

51200

1

==

=

∑=n

f M

x k

i i

i

48.1161

1207

.16146661

)(1

2=-=

--=

∑=n f x M

s k

i i

i

偏态系数:203.048

.1161204

.38534964)(3

313=?=

-=

∑=ns f x M

SK k

i i

i

。 峰态系数:688.0348.1161204

.851087441643)(4

4

1

4-=-?=

--=

∑=ns f x M

K k

i i

i

(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。

(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。

(1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系

数为1.0505

==女v ,男生体重的离散系数为08.060

5==男v ,所以女生的体重差

异大。

(2)男生:1322.260=?=x (磅),112.25=?=s (磅); 女生:1102.250=?=x (磅),112.25=?=s (磅);

(3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg 到65kg 之间。 (4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,女生中大约有95%的人体重在40kg 到60kg 之间。 通过计算标准分数来判断:

115100115=-=-=

A A A A s x x z ;5.050

400

425=-=-=B B B B s x x z 。 该测试者在A 项测试中比平均分数高出1个标准差,而在B 项测试中只高出平

均分数个标准差,由于A 项测试的标准分数高于B 项测试,所以A 项测试比较理想。

通过标准分数来判断,各天的标准分数如下表:

日期 周一 周二 周三 周四 周五 周六 周日

标准分数Z 3 0

周一和周六两天失去了控制。

(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。

(2)成年组身高的离散系数:024.01

.1722

.4==

s v ;

幼儿组身高的离散系数:035.03

.715

.2==

s v ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

4,11(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。

(2

高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:

013.06.16513.2==A v ,014.073.12875.1==B v ,022.053.12577.2==C v 。方法A 的离

散程度最小。因此应选择方法A 。 (1)用方差或标准差来评价投资的风险。

(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。

(3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。 第六章 统计量与抽样分布

()()是一个统计量。

,,,数数,则称函,不依赖于任何未知参,,,样本构造一个函数的一个样本,如果由此中抽取的容量为是从总体,,,、设n 21n 21n 21X X X T X X X T n X X X X 1 由样本构建具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量。

构造统计量的主要目的就是对总体的未知参数进行推断,如果统计量中含有总体的未知参数就没办法再对参数进行统计推断。

2、21T T 和是统计量,43T T 和在未知的情况下和σμ不是统计量。

()()()()()()()()()称为次序统计量。,,,的观测值,而为次序统计量就作个值中第时,其由小到大的排序值每当样本得到一组观测满足如下条件的函数:,,,它是样本个次序统计量,称为第中抽取的一个样本,是从总体,,,、设((n 21i)i n i 2121n 21i)n 21X X X X x i x x x x ,,,x X X X i X X X X X 3 ≤≤≤≤≤n x x 4、假若一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,这样的统计量称充分统计量。

5、统计学上的自由度指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的资料的个数。

6、分布和正态分布关系:2χ分布。分布的极限分布是正态时,2n χ+∞→ ()数。

标准正态分布的密度函的密度函数越来越接近分布的增加,。随着自由度标准正态分布的方差大尾部粗一些,方差也比的两侧的尾部都要比标准正态分布的密度函数在两侧曲线非常相似,但数标准正态分布的密度函分布的密度函数曲线与:分布和正态分布的关系t n n t t t ()()()。

,则分布的一个随机变量,看成近似服从标准正态布,若把来越接近于标准正态分也越的增加,。并且随着自由度,,则若分布和正态分布关系:。

n 1F ~X X X n n 1F ~X n t ~X F 22

7、在重复选取容量为n 的样本时,由样本统计量的所有取值形成的相对频数分布为统计量的抽样分布。

的推断提供了理论基础分布问题,为总体参数数的抽样态的情况下,样本平均理解决了在总体为非正正态分布。中心极限定的,方差为值为的抽样分布近似服从均充分大时,样本均值的样本,当样本量为的任意一个总体中抽取,方差为均值为、中心极限定理:设从n

X n n 82

2σμσμ

二、练习

1、易知由这台机器灌装的9个瓶子形成的样本,其平均灌装量服从正态分布,均值为,μ标准差为3

1

=

=

n

x σ

σ,故 ()

()6319.09.09.0313.0=≤=?

??

?

??≤-=≤-z P X P X P μμ 2、若()

95.03.0=≤-μX P ,则95.03.0=???

? ??≤-n n X P

σσμ,即96.13

.0=n σ

,又知1=σ,,68.423.096.12

=??

?

??=n 故43=n 。

3、易知∑=6

1

2i i Z 服从自由度为6的卡方分布,得59.12)6(2

95.0==χb (左侧分

位数)

4、因为

()2

21σ

S n -服从)1(2-n χ分布,我们已知1,10==σn ,故29S 服从

(2χ9)分布,()()9.0999221221=≤≤=≤≤b S b P b S b P ,我们若取

()()

05.099,05.0991222=≥=≥b S P b S P ,则可以得到92.16)9(92

95.02==χb ,33.3)9(9205.01==χb ,故88.1,37.021==b b 。(题中均为左侧分位数)

第7章 抽样与参数估计

(1)已知:5=σ,40=n ,25=x ,05.0=α,96.1205.0=z 。 样本均值的抽样标准差79.040

5==

=

n

x σ

σ。

(2)估计误差55.140

596.12=?==n

z E σα。

(1)已知:15=σ,49=n ,120=x ,05.0=α,96.1205.0=z 。 样本均值的抽样标准差14.249

15==

=

n

x σ

σ。

(2)估计误差20.449

1596.12=?==n

z E σα。

(3)由于总体标准差已知,所以总体均值μ的95%的置信区间为:

20.412049

1596.11202

±=?

±=±n

z x σ

α,即(,)。

已知:100=n ,85414=σ,104560=x ,05.0=α,96.105.0=z 。 由于总体标准差已知,所以总体均值μ的95%的置信区间为:

144.16741104560100

8541496.11045602

±=?

±=±n

z x σ

α,即(,)。

(1)已知:100=n ,81=x ,12=s ,1.0=α,645.121.0=z 。

由于100=n 为大样本,所以总体均值μ的90%的置信区间为:

974.181100

12645.1812

±=?

±=±n

s z x α,即(,)。

(2)已知:05.0=α,96.1205.0=z 。

由于100=n 为大样本,所以总体均值μ的95%的置信区间为:

352.281100

1296.1812

±=?

±=±n

s z x α,即(,)。

(3)已知:01.0=α,58.2201.0=z 。

由于100=n 为大样本,所以总体均值μ的99%的置信区间为:

096.381100

1258.2812

±=?

±=±n

s z x α,即(,)。

(1)已知:25=x ,5.3=σ,60=n ,05.0=α,96.1205.0=z 。 由于总体标准差已知,所以总体均值μ的95%的置信区间为:

89.02560

5.39

6.1252

±=?

±=±n

z x σ

α,即(,)。

(2)已知:6.119=x ,89.23=s ,75=n ,02.0=α,33.2202.0=z 。 由于75=n 为大样本,所以总体均值μ的98%的置信区间为:

43.66.11975

89.2333.26.1192

±=?

±=±n

s z x α,即(,)。

(3)已知:419.3=x ,974.0=s ,32=n ,1.0=α,645.121.0=z 。 由于32=n 为大样本,所以总体均值μ的90%的置信区间为:

283.0419.332

974.0645.1419.32

±=?

±=±n

s z x α,即(,)。

(1)已知:总体服从正态分布,500=σ,15=n ,8900=x ,05.0=α,

96.105.0=z 。

由于总体服从正态分布,所以总体均值μ的95%的置信区间为:

03.253890015

50096.189002

±=?

±=±n

z x σ

α,即(,)。

(2)已知:总体不服从正态分布, 500=σ,35=n ,8900=x ,05.0=α,

96.105.0=z 。

虽然总体不服从正态分布,但由于35=n 为大样本,所以总体均值μ的95%的置信区间为:

65.165890035

50096.189002

±=?

±=±n

z x σ

α,即(,)。

(3)已知:总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,

1.0=α,645.121.0=z 。

虽然总体不服从正态分布,但由于35=n 为大样本,所以总体均值μ的90%的置信区间为:

03.139890035

500645.189002

±=?

±=±n

s z x α,即(,)。

(4)已知:总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,

01.0=α,58.2201.0=z 。

虽然总体不服从正态分布,但由于35=n 为大样本,所以总体均值μ的99%的置信区间为:

05.218890035

50058.289002

±=?

±=±n

s z x α,即(,)。

已知:36=n ,当α为、、时,相应的645.11.0=z 、96.1205.0=z 、

58.2201.0=z 。

根据样本数据计算得:32.3=x ,61.1=s 。

由于36=n 为大样本,所以平均上网时间的90%的置信区间为:

44.032.336

61.1645.132.32

±=?

±=±n

s z x α,即(,)。

平均上网时间的95%的置信区间为:

53.032.336

61.196.132.32

±=?

±=±n

s z x α,即(,)。

平均上网时间的99%的置信区间为:

69.032.336

61.158.232.32

±=?

±=±n

s z x α,即(,)。

已知:总体服从正态分布,但σ未知,8=n 为小样本,05.0=α,

365.2)18(205.0=-t 。

根据样本数据计算得:10=x ,46.3=s 。 总体均值μ的95%的置信区间为:

89.2108

46.3365.210±=?

±=±n

s t x α,即(,)。

已知:总体服从正态分布,但σ未知,16=n 为小样本,05.0=α,

131.2)116(205.0=-t 。

根据样本数据计算得:375.9=x ,113.4=s 。 从家里到单位平均距离的95%的置信区间为:

191.2375.916

113.4131.2375.92

±=?

±=±n

s t x α,即(,)。

(1)已知: 36=n ,5.149=x ,05.0=α,96.1205.0=z 。 由于36=n 为大样本,所以零件平均长度的95%的置信区间为:

63.05.14936

93.196.15.1492

±=?

±=±n

s z x α,即(,)。

(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为

μ、方差为2σ的总体中,抽取容量为n 的随机样本,当n 充分大时(通常要求

30≥n ),样本均值x 的抽样分布近似服从均值为μ、方差为n 2σ的正态分布。

(1)已知:总体服从正态分布,但σ未知,50=n 为大样本,05.0=α,

96.105.0=z 。

根据样本数据计算得:32.101=x ,63.1=s 。 该种食品平均重量的95%的置信区间为:

45.032.10150

63.196.132.1012

±=?

±=±n

s z x α,即(,)。

(2)根据样本数据可知,样本合格率为9.050

45

==p 。该种食品合格率的95%的置信区间为:

08.09.050

)

9.01(9.096.19.0)1(±=-±=-±n p p z p α,即(,)。 已知:总体服从正态分布,但σ未知,25=n 为小样本,01.0=α,

797.2)125(01.0=-t 。

根据样本数据计算得:128.16=x ,871.0=s 。 总体均值μ的99%的置信区间为:

487.0128.1625

871.0797.2128.16±=?

±=±n

s t x α,即(,)。

已知:总体服从正态分布,但σ未知,18=n 为小样本,1.0=α,

740.1)118(21.0=-t 。

根据样本数据计算得:56.13=x ,80.7=s 。

网络公司员工平均每周加班时间的90%的置信区间为:

20.356.1318

80.7740.156.13±=?

±=±n

s t x α,即(,)。

(1)已知:44=n ,51.0=p ,01.0=α,58.201.0=z 。 总体总比例π的99%的置信区间为:

19.051.044

)

51.01(51.058.251.0)1(±=-±=-±n p p z p α,即(,); (2)已知:300=n ,82.0=p ,05.0=α,96.105.0=z 。 总体总比例π的95%的置信区间为:

04.082.0300

)

82.01(82.096.182.0)1(±=-±=-±n p p z p α,即(,); (3)已知:1150=n ,48.0=p ,1.0=α,645.121.0=z 。 总体总比例π的90%的置信区间为:

02.048.01150

)

48.01(48.0645.148.0)1(2

±=-±=-±n p p z p α,即(,)。 7,15已知:200=n ,23.0=p ,α为和时,相应的645.121.0=z ,

96.105.0=z 。

总体总比例π的90%的置信区间为:

05.023.0200

)

23.01(23.0645.123.0)1(±=-±=-±n p p z p α,即(,)。 总体总比例π的95%的置信区间为:

06.023.0200

)

23.01(23.096.123.0)1(2

±=-±=-±n p p z p α,即(,)。 已知:1000=σ,估计误差200=E ,01.0=α,58.2201.0=z 。 应抽取的样本量为:167200100058.2)(2

2

22

2

22=?==

E z n σα。

(1)已知:02.0=E ,40.0=π,04.0=α, 2.0504.0=z 。 应抽取的样本量为:252202

.0)40.01(40.005.2)

1()(2

22

22=-?=-?=

E z n ππα。 (2)已知:04.0=E ,π未知,05.0=α, 1.9605.0=z 。 由于π未知,可用使用。 应抽取的样本量为:60104

.0)50.01(50.096.1)

1()(2

22

22=-?=-?=

E z n ππα。 (3)已知:05.0=E ,55.0=π,1.0=α, 1.64521.0=z 。 应抽取的样本量为:26805.0)55.01(55.0645.1)

1()(2

22

22=-?=-?=

E z n ππα。

(1)已知:50=n ,64.050

32

==

p ,05.0=α, 1.96205.0=z 。 总体中赞成该项改革的户数比例的95%的置信区间为: 13.064.050

)

64.01(64.096.164.0)1(2

±=-±=-±n p p z p α,即(,)。 (2)已知:80.0=π,05.0=α, 1.9605.0=z 。 应抽取的样本量为:621.0)

80.01(80.096.1)

1()(2

22

22=-?=-?=

E z n ππα。

第8章 假设检验

二、练习题

(说明:为了便于查找书后正态分布表,本答案中,正态分布的分位点均采用了下侧分位点。其他分位点也可。为了便于查找书后t 分布表方便,本答案中,正态分布的分位点均采用了上侧分位点。) 解:根据题意,这是双侧检验问题。

55

.4:55.4:10≠=μμH H

已知:总体方差22105.0=σ 05.0,

9,

484.4,55.40====αμ显著水平n x

8333.19

/108.055.4484.4/0

-=-=

-=

n

x z σμ

当05.0=α,查表得96.12/1=-αz 。 拒绝域W={2/1α-z z }

因为2/1α-z z ,所以不能拒绝H 0,认为现在生产的铁水平均含碳量为。

(注:2/1α-z 为正态分布的1-α/2下侧分位点 )

解:根据题意,这是左单侧检验问题。

700

:700:10 μμH H ≥

已知:总体方差2260=σ 05.0,

36,

680,7000====αμ显著水平n x

236

/60700680/0

-=-=

-=

n

x z σμ

当05.0=α,查表得645.11=-αz 。 拒绝域W={α--1z z }

因为α---=12z z ,所以拒绝H 0,认为该元件的使用寿命低于700小时。

(注:α-1z 为正态分布的1-α下侧分位点 )

解:根据题意,这是右单侧检验问题。

250

:250:10 μμH H ≤

已知:总体方差2230=σ 05.0,

25,

270,2500====αμ显著水平n x

3333.325

/30250270/0

=-=

-=

n

x z σμ

当05.0=α,查表得645.11=-αz 。

拒绝域W={α-1z z }

因为α-=13333.3z z ,所以拒绝H 0,认为这种化肥能使小麦明显增产。

(注:α-1z 为正态分布的1-α下侧分位点 )

解:根据题意,这是双侧检验问题。

100

:100:10≠=μμH H

方差2σ未知。 已知:总体 05.0,

55.40==αμ显著水平

根据样本计算得:9,2122.1,9778.99===n s x

0549.09

/2122.11009778.99/0-=-=

-=

n

s x t μ

当05.0=α,查表得3060.2)8(2/=αt 。 拒绝域W={)8(2/αt t }

因为)8(0549.02/αt t =,所以不能拒绝H 0,认为该日打包机工作正常。

(注:)8(2/αt 为t 分布的α/2上侧分位点 )

统计学第1-2章作业参考答案

第1-2章作业参考答案 一、单项选择 1、政治算术学派的代表人物是(B)A.凯特勒B.威廉·配第C.康令D.阿亨瓦尔 2、统计学研究对象的重要特点是(A)A.数量性B.总体性C.社会性D.具体性 3、就总体单位而言(C)A.只能有一个标志B.只能有一个指标 C.可以有多个标志D.可以有多个指标 4、要了解某班50名学生的学习情况,则总体是(A)A.50名学生B.每一个学生 C.50名学生的学习成绩D.每一个学生的学习成绩 5、对某地区所有工业企业的职工情况进行研究,总体单位是(A)A.每个职工B.每个企业C.每个个数的职工D.全部工业企业 6、某生产班组四名工人月工资收入分别是3200元、3250元、3320元和3560元,这四个数字是(B)A.变量B.变量值C.数量标志D.数量指标 7、某工业企业工人的技术等级分为一级、二级、三级、四级和五级,这里的“技术等级”是(B)A.数量标志B.品质标志C.数量指标D.质量指标 8、职工人数是一个(A)变量。 A.离散型B.连续型C.有时是离散型有时是连续型D.无法判断 9、一项调查是否属于全面调查,关键看其是否(B)A.对调查对象的各方面都进行调查B.对组成调查总体的所有单位逐一进行调查C.制定统计调查方案D.采用多种调查方法 10、制定统计调查方案,首先要明确(D)A.统计调查对象B.统计调查单位C.统计调查项目D.统计调查目的11、经常调查与一时调查是按(B)来划分的。 A.调查组织形式B.登记事物连续性C.调查方法D.调查对象包括范围12、下列属于经常调查的是(D)A.对2011年大学毕业生就业状况的调查 B.对近几年来居民消费价格变动情况进行一次摸底调查 C.对全国人口每隔10年进行一次普查D.按月上报的钢铁产量 13、对某地区饮食业从业人员的身体状况进行调查,调查对象是该地区饮食业的(C)A.全部营业网点B.每个营业网点C.所有从业人员D.每个从业人员14、某市工商企业2011年生产经营成果的年报呈报时间规定在2012年1月31日,则调查期限为(B)A.一日B.一个月C.一年D.一年零一个月 15、调查时间的含义是(A)A.调查资料所属的时间B.进行调查的时间 C.调查工作期限D.调查资料报送的时间

(完整word版)《管理统计学》复习资料(计算部分).doc

《管理统计学》复习资料(计算部分) 一、 算术平均数和调和平均数的计算 加权算术平均数公式 x xf xx f (常用) f f ( x 代表各组标志值, f 代表各组单位数, f 代表各组的比重) f 加权调和平均数公式 x m m 代表各组标志总量) ( x 代表各组标志值, m x 1. 某企业 2003 年某月份生产资料如下: 按工人劳动生产率分组(件 / 人) 生产班组 实际产量(件) 50-60 3 8250 60-70 5 6500 70-80 8 5250 80-90 2 2550 90- 100 2 4750 计算该企业的工人平均劳动生产率。 分析: 工人平均劳动生产率 x 总产量 m (结合题目) 总工人人数 m x 组中值 x 按工人劳动生产率分组 (件 / 人) x 生产班组 实际产量(件) m 工人数 m x 55 50- 60 3 8250 65 60- 70 5 6500 75 70- 80 8 5250 85 80- 90 2 2550 95 90-100 2 4750 从公式可以看出,“生产班组”这列资料不参与计算,是多余条件,将其删去。其余两列资料,根据 问题“求平均××”可知“劳动生产率”为标志值 x ,而剩余一列资料“实际产量”在公式中做分子,因 此用调和平均数公式计算,并将该资料记作 m 。 每一组工人数 每一组实际产量 劳动生产率 ,即 m 。 x 同上例,资料是组距式分组,应以各组的组中值来代替各组的标志值。 m 8250 6500 5250 2550 4750 27300 (件 /人) 解: x 8250 6500 5250 2550 4750 68.25 m 400 x 55 65 75 85 95

统计学答案整理

统计学答案整理 一,单项选择题 1、质量指标( D )。 A. 不能用数值来反映 B. 反映事物的本质联系 C. 必需用数值来反映 D. 有时能够用数量指标来反映 2、从认识的顺序上来讲,一项完整的统计工作可分为四个阶段,即( B )。 A.统计调查、统计整理、统计设计和统计分析 B.统计设计、统计调查、统计整理和统计分析 C.统计调查、统计设计、统计整理和统计分析 D.统计设计、统计整理、统计调查和统计分析 3、指出错误的命题( B )。 A.凡统计指标都可以表示为具体的量 B.凡统计标志都可以表示为具体的量 C.质量指标反映的是现象之间的数量关系 D.数量指标反映的是总体现象量的规模 4、统计认识对象是( A )。 A. 社会经济现象的数量方面 B. 社会经济现象的质量方面 C. 社会经济现象的数量方面和质量方面 D. 社会经济现象的所有方面 5、统计所研究的是( A )。 A. 社会经济的总体现象 B. 社会经济的个体现象 C. 社会经济的总体现象或个体现象 D. 非社会经济的总体现象 6、统计学的研究方法有很多,其特有的方法是( C )。 A. 统计推断法 B. 统计分组法 C. 大量观察法 D. 综合指标法 7、社会经济统计中最常用、最重要的分布是( C )。 A. 连续型变量分布 B. 离散型变量分布 C. 正态分布 D. 其他类型分布 8、按变量的性质和数据的多少划分,变量数列可以分为( B )。 A. 等距数列与异距数列 B. 单项数列和组距数列 C. 开口组数列和闭口组数列 D. 等差数列和等比数列 9、将总量指标按其反映总体总量的内容不同分为( A )。 A.总体标志总量指标和总体单位总量指标 B.时期指标和时点指标 C.实物总量指标和价值总量指标 D.动态指标和静态指标 10、若以我国工业企业为研究对象,则单位总量指标为( A )。 A. 工业企业总数 B. 工业职工总人数 C. 工业设备台数 D. 工业增加值 11、加权算术平均数的计算过程中,权数的加权作用表现在( B )。 A. 权数绝对数大小 B. 权数相对水平大小 C. 权数平均值大小 D. 权数总和大小 12、平均数指标反映了同质总体的(A)。 A. 集中趋势 B. 离中趋势 C. 变动趋势 D. 分布特征 13、由相对数指标计算平均数时,应采用( D )。 A. 算术平均法 B. 调和平均法 C. 几何平均法 D. 根据所掌握资料而定

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

统计学答案

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

管理统计学1(选择)

管理统计学(选择+判断) A 1.按调查的范围不同。统计调查可以分为:B 全面调查和非全面调查 2.按数量标志将总体单位分组形成的分布数列是:A 变量数列;B 品质数列;C 变量分布数列;D 品质分布 数列;E 次数分布数列正确答案:ACE B 3.比较相对指标是用于:A 不同国家、地区和单位之间的比较;B 不同时间状态下的比较;C 先进地区水平 和后进地区水平的比较;D 不同空间条件下的比较正确答案:ACD 4.编制数量指标综合指数所采用的同度量因素是:A 质量指标 5.变量的具体表现称为变量值,只能用数值来表示。正确答案: 错 6.变量之间的关系按相关程度可分为:A 正相关;B 不相关; C 完全相关;D 不完全相关正确答案:BCD 7.标志变异指标的主要作用是:A 衡量平均数代表性的大小;B 反映统计数据的节奏性和均衡性;C 反映总 体单位的均匀性和稳定性;D 分析总体的变动趋势正确答案:ABC 8.不同总体之间的标准差不能直接对比是因为:A 平均数不一致; B 计量单位不一致 C 标准差不一致; D 总体单位数不一致正确答案:AB C 9.长期趋势是影响时间序列的根本性,决定性的因素。正确答案: 对 10.常见的离散型分布有:A 二点分布;B 二项分布; C 均匀分布; D 泊松分布正确答案:ABD 11.抽样调查和重点调查的主要区别有:A 抽选调查单位的多少不同;B 抽选调查单位的方式方法的不同;C 取 得资料的方法不同;D 原始资料的来源不同;E 在对调查资料使用时,所发挥的作用不同正确答案:BDE 12.抽样调查中的抽样误差是:A 随机误差;B 系统性误差;C 代表性误差;D 登记性误差正确答案:A 13.抽样平均误差反映了样本指标与总体指标之间的: D 平均误差程度 14.抽样实际误差是指某一次具体抽样中,样本指标值与总体真实值之间的偏差。答案: 对 15.抽样误差是由于破坏了随机原则而产生的系统性误差,也称偏差。正确答案: 错 16.抽样允许误差越大,抽样估计的精确度就:A 越高;B 越低;C 无法确定;D 两者之间没有关系正确答 案:B D 17.单位产品成本报告期比基期下降5%,产量增加6%,则生产费用:A 增加 18.单位成本与产品产量的相关关系,以及单位成本与单位产品原材料消耗量的相关关系,表述正确的是:B 前 者是负相关,后者是正相关 19.当我们冒5%的风险拒绝了本来为真的原假设时,则称5%为显著性水平。正确答案: 对 20.当需要对不同总体或样本数据的离散程度进行比较时,则应使用:D 离散系数 21.当总体单位不多,差异较小时,适宜采用简单随机抽样方式。正确答案: 对 22.点估计法一般不考虑抽样误差和可靠程度,计算简便、直观,是最常用的估计方法。正确答案: 错 23.调查时间是进行调查所需要的时间。正确答案: 错 24.定基发展速度与环比发展速度之间的关系表现为定基发展速度等于相应各环比发展速度:A 的连乘积 25.定序尺度可以:A 对事物分类;B 对事物排序;C 计算事物之间差距大小;D 计算事物数值之间的比值 正确答案:AB 26.对50名职工的工资收入情况进行调查,则总体单位是:C 每一名职工 27.对连续型变量值分为五组:第一组为40一50,第二组为50-60,第三组为60-70,第四组为70-80,第五

[整理]东财《统计学》复习题及参考答案.

一、单项选择题 (只有一个正确答案) 【1】下列属于位置平均数的是()。 A: 算术平均数 B: 调和平均数 C: 几何平均数 D: 中位数 答案: D 【2】产业部门分类是按照主产品( )的原则对产业活动单位进行的部门分类。 A: 生产性 B: 多样性 C: 同质性 D: 先进性 答案: C 【3】国民经济核算可以提供对一个( )的全面观察。 A: 企业 B: 家庭 C: 单位 D: 经济体 答案: D 【4】根据同一资料计算的数值平均数通常是各不相同的,三者之间的关系是()。 A: 算术平均数≥几何平均数≥调和平均数 B: 几何平均数≥调和平均数≥算术平均数 C: 调和平均数≥算术平均数≥几何平均数 D: 没有确定的关系 A 答案: 【5】下列属于双边备择假设的有()。 A: B: C: D: 以上都不对 答案: C 【6】在假设检验中,我们都提出原假设,与原假设对立的假设称为()。 A: 备择假设 B: 单边检验 C: 双边检验 D: 以上都不对 答案: A 【7】可以用来显示定性数据的统计图是()。

B: 直方图 C: 条形图 D: 散点图 答案: C 【8】对水库中鱼的存量,往往采用()获得数据。 A: 重点调查 B: 抽样调查 C: 典型调查 D: 全面调查 答案: B 【9】当一个变量增加时,相应的另一个变量随之减少,我们称这两个变量之间为()。 A: 单相关 B: 复相关 C: 正相关 D: 负相关 答案: D 【10】平均增长量等于()。 A: 逐期增长量之和/逐期增长量的个数 B: 增长量/报告期水平 C: 各期水平与上一期水平之比 D: 以上都不对 答案: A 【11】两个相邻定基发展速度之比,等于相应时期的()。 A: 增长速度 B: 环比发展速度 C: 平均发展速度 D: 累计增长量 答案: B 【12】若销售量增长5%,零售价格增长2%,则商品销售额增长()。 A: 7% B: 10% C: 7.1% D: 15% 答案: C 【13】期初存量与本期流量之和,形成( )。 A: 期末存量 B: 期初流量 C: 期末流量 D: 本期存量 答案: A 【14】不变价国内生产总值核算的目的是剔除按现期市场价格衡量的国内生产总值中的( )变动因素,以反映一定时期内生产活动最终成果的实际变动。 A: 价格

统计学作业答案归纳

统计学作业答案归纳 1、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准差 是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样本容量 应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254.006.396.12 2 22205.02=?=?=E s z n 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信 的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客 户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在 95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比率进 行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%3030 9?==p 。

总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t

应用统计学试题及答案1

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 一. 单选题(每题2分,共20分) 1.对工业企业的生产设备进行普查时,调查对象是( C ) A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为( B ) A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为―500以上‖。又知其邻组的组中值为480,则末组的组中值为( A) A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为( C ) A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D.1%109%107%1053-(平均定增长速度) 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为( B) A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数

b= -1.75表示( B ) A.时间每增加一个单位,产品成本平均增加1.75个单位 B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为( A ) A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件哪个车间日加工零件的离散程度较大:( B ) A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是( C ) A 用各年的环比增长速度连乘然后开方(定基年增长速度) B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减―1‖ D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间( C ) A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题(每题2分,共14分)

管理统计学试题及答案

管理统计学试题及答案https://www.360docs.net/doc/1b640017.html,work Information Technology Company.2020YEAR

一、单项选择题(每小题2分,共40分) 1.要了解某市工业企业生产设备情况,则统计总体是 (A) A.该市工业企业的全部生产设备 B. 该市每一个工业企业 C. 该市工业企业的某一台设备 D. 该市全部工业企业 2.若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则 (B) A. 甲单位的平均数代表性比较大 B. 甲单位的平均数代表性比较小 C. 两单位的平均数一样大 D. 无法判断 3.一个统计总体(C) A. 只能有一个标志 B. 只能有一个指标 C. 可以有多个标志 D. 可以有多个指标 4.品质标志的表现形式是(D) A. 绝对数 B. 相对数 C. 平均数 D. 文字 5.统计工作的各项任务归纳起来就是两条(A) A. 统计调查和统计分析 B. 统计设计和统计研究 C. 统计预测和统计 D. 统计服务和统计监督 6.对上海港等十多个沿海大港口进行调查,以了解全国的港口吞吐量情况,则这种调查方式是(B) A. 普查 B. 重点调查 C. 典型调查 D. 抽样调查 7.某连续变量分为五组:第一组为40~50;第二组为50~60;第三组为60~70;第四组为70~80;第五组为80以上。依习惯上规定(C) A. 50在第一组,70在第四组 B. 60在第二组,80在第五组 C. 70在第四组,80在第五组 D. 80在第四组,50在第二组 8.某城市为了解决轻工业生产情况,要进行一次典型调查,在选送调查单位时,应选择生产情况()的企业。(D) A. 较好 B. 中等 C. 较差 D. 好、中、差 9.某厂的职工工人人数构成如下表所示 该组的分组标志是(A)

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

1统计学原理作业1答案

统计学原理作业1 第一章-第三章 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(×) 2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。( × ) 3、全面调查包括普查和统计报表。( √ ) 4、统计分组的关键是确定组限和组距(×) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次,因此它是一种连续性调查方法。(×) 7、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(√) 8、对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。(√) 10、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。(√) 二、单项选择题 1、设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是(C ) A、每个工业企业; B、670家工业企业; C、每一件产品; D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查期限为(B )。 A、一日 B、一个月 C、一年 D、一年零一个月 3、在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是( D )。 A、二者均为离散变量 B、二者均为连续变量

C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是( D ) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是( D )。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是( A )。 A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品销售额 D、每季统计进出口贸易额 8、全面调查与非全面调查的划分是以( C ) A、时间是否连续来划分的; B、最后取得的资料是否全面来划分的; C、调查对象所包括的单位是否完全来划分的; D、调查组织规模的大小来划分的 9、下列分组中哪个是按品质标志分组( B ) A、企业按年生产能力分组 B、产品按品种分组 C、家庭按年收入水平分组 D、人口按年龄分组 三、多项选择题 1、总体单位是总体的基本组成单位,是标志的直接承担者。因此( ABD ) A、在国营企业这个总体下,每个国营企业就是总体单位; B、在工业总产值这个总体下,单位总产值就是总体单位; C、在全国总人口这个总体下,一个省的总人口就是总体单位; D、在全部工业产品这个总体下,每一个工业产品就是总体单位; E、在全部固定资产这一总体下,每个固定资产的价值就是总体单位。 2、在对工业企业生产设备的调查中( BCE ) A、全部工业企业是调查对象; B、工业企业的全部生产设备是调查对象; C、每台生产设备是调查单位; D、每台生产设备是填报单位; E、每个工业企业是填报单位 3、对连续变量与离散变量,组限的划分在技术上有不同要求,如果对企业按工人人数分组,正确的方法应是( ACE ) A、300人以下,300-500人 B、300人以下,300-500人(不含300)

管理统计学课程教学大纲

《管理统计学》课程教学大纲 课程名称:管理统计学 课程类别:专业拓展课 适用专业(方向):信息管理与信息系统专业 总学时数:32(其中:理论20,实验12) 学分:2 编制部门:信息与软件工程系 修订日期:2015-03-01 一、课程的性质与任务 本课程属于专业拓展课程。管理统计学是管理科学与工程学科的核心课程,其内容包括统计数据的搜集与整理、统计数据的描述、抽样与参数估计、假设检验、分类资料的假设检验、方差分析、相关分析与回归分析等,本课程将管理统计学基本原理、实际管理问题和软件应用结合起来。本课程不仅为学生的后续学习奠定坚实的理论基础,同时还要为学生能够灵活运用该课程所提供的基本理论与方法解决实际问题提供必要的理论上、方法上、思路上和工具上的帮助和指导。 二、课程教学基本要求 通过本课程的学习,学生应该达到以下基本要求: 1.了解管理统计学的基本概念及基本方法。 2.学会用统计学观点和思想考虑、分析和解决信息系统中一些与统计相关的问题。 3.学会用统计学软件解决常见的与统计相关的问题。 三、课程教学内容、要求与学时分配 理论: 一、绪论(2学时):理解管理统计学的重要性及其作用;掌握管理统计学的概念、特点、及描述性统计与推断性统计意义;了解管理统计学的主要内容;了解管理统计学的产生与发展过程。 二、统计数据收集与整理(3学时):掌握总体与样本的概念;掌握数据的计量尺度与类型;了解常用的统计数据收集的方法及收集数据的质量要求;了解调查方案的设计基本思想;理解抽样调查的有关基本概念。 三、统计数据的分布特征的描述(3学时):掌握数据的总体指标和相对指标;掌握描述数据分布的集中程度与离散程度的概念与方法;理解数据集合的峰度与偏度的概

统计学课后作业答案

统计学课后作业答案

4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求;(1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄 从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图:

为分组情况下的概率密度曲线:分组: 1、确定组数: () lg25 lg() 1.398 111 5.64 lg(2)lg20.30103 n K=+=+=+=,取k=6 2、确定组距:组距=( 最大值- 最小值)÷组数=(41-15)÷6=4.3,取5 3、分组频数表 网络用户的年龄(Binned) 分组后的均值与方差:

Kurtosis 1.302 分组后的直方图: 组中值 50.00 45.00 40.00 35.00 30.00 25.00 20.00 15.00 10.00 F r e q u e n c y 10 8 6 4 2 Mean =23.30 Std. Dev. =7.024 N =25 4.11 对10名成年人和10名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组 68 69 68 70 7l 73 72 73 74 75 要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大? 成年组 幼儿组 平均 172.1 平均 71.3 标准差 4.201851 标准差 2.496664 离散系数 0.024415 离散系数 0.035016 幼儿组的身高差异大。 7.6利用下面的信息,构建总体均值μ的置信区间: 1) 总体服从正态分布,且已知σ = 500,n = 15, =8900,置信水平为95%。 解: N=15,为小样本正态分布,但σ已知。则1-α=95%, 。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2) 2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。 解:为大样本总体非正态分布,但σ已知。则1-α=95%, 。其置信区间公式为 2 α() 28.109,44.10192.336.10525 10 96.136.1052=±=?±=±n z x σ αx x 2 α() 28.109,44.10192.336.10525 1096.136.1052=±=?±=±n z x σ α

统计学1答案

统计学原理模拟试题一 答案 一、判断题(每题1分,共10分) 1、统计的研究对象是社会经济现象的各个方面。 ( X ) 2、数量指标用数字表示,质量指标用文字表示。 ( X ) 3、全面调查与非全面调查是根据调查结果所得的资料是否全面来划分的。 ( X ) 4、调查单位与报告单位在任何情况下都不可能一致。 ( X ) 5、统计分组的关键问题是确定组距和组数。 ( X ) 6、全距不能全面反映总体各单位标志值的差异程度。 ( V ) 7、在时间数列中,绝对数时间是基本数列,相对数和平均数时间数列都是派生数列。 ( V ) 8、组指数从本质上说属于个体指数。 ( X ) 9、定基增长速度等于以前各期(含本期)的环比增长速度的连乘积。 ( X ) 10、所有的总量指标都是有计量单位的有名数。 ( V ) 二、填空题(每题2分,共20分) 1、“统计”一词的含义包括:_统计资料___、__统计工作___、___统计学___。 2、统计学的基本研究方法有: _大量观察法_、统计分组法__、_统计指标法__、_统计推断法___。 3、完整的统计工作包括__统计设计__、_统计调查__、_统计整理__、_统计分析__四个环节。 4、在统计调查中,搜集资料的方法有:_观察法__、_采访法_、_自填法_。 5、调查时间的含义包括两方面:__调查对象所属时间_、__调查工作开展时间___。 6、统计分组按选择分组标志多少不同可分为:__简单分组_、_复合分组__。 7、统计表从形式上看包括:_总标题__、_横行标题_、_纵栏标题_、_指标数字_四部分。 8、总量指标按反映内容不同可分为:__总体单位总量__、__总体标志总量___。 9、时间数列的影响因素可以分解为:_长期趋势_、_季节波动__、_循环变动__、_不规则变动__四种。 10、指数按反映的指标性质不同可分为:__数量指标指数__和_质量指标指数___。 三、单项选择题(每题2分,共20分) 1、财专08班的张明在这次统计考试中得了85分,85这个数字属于( C ) A 、标志 B 、指标 C 、标志值 D 、指标值 2、我国2008年的人口出生率为12.14‰,“人口出生率”这个指标是( B ) A 、动态相对指标 B 、结构相对指标 C 、强度相对指标 D 、比较相对指标 3、某企业2008年单位产品成本计划降低率5%,实际降低率为10%,则该企业2008年单位产品成本计划完成百分比为( A ) A 、94.74 % B 、200% C 、105% D 、105.56% 4、在“工业设备普查”统计调查中,调查单位是( B ) A 、国家统计局 B 、每台工业设备 C 、每个工业企业 D 、企业统计员 5、据报导,我国2000年国内生产总值(GDP )为89404亿元,2007年GDP 为246619亿元,则我国2000-2007年GDP 年平均增长速度为( A ) A 、1894042466197 - B 、7189404246619- C 、789404246619 D 、189404 246619 8 - 6、某企业2007年1—4月初职工人数资料如下:1月初1632;2月初1548;3月初1722;4月初1710; 则该企业一季度平均职工人数为( B ) A 、1634 B 、1647 C 、1653 D 、1660 7、我国2007年11月商品零售额比上年增长了18.8%,同期商品价格指数为106.9%,则我国2007年11月商品销售量的增长幅度为( D )

管理统计学试题及答案

一、单项选择题(每小题2分,共40分) 1.要了解某市工业企业生产设备情况,则统计总体是 ( A ) A.该市工业企业的全部生产设备 B. 该市每一个工业企业 C. 该市工业企业的某一台设备 D. 该市全部工业企业 2.若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则 ( B ) A. 甲单位的平均数代表性比较大 B. 甲单位的平均数代表性比较小 C. 两单位的平均数一样大 D. 无法判断 3.一个统计总体 ( C ) A. 只能有一个标志 B. 只能有一个指标 C. 可以有多个标志 D. 可以有多个指标4.品质标志的表现形式是 ( D ) A. 绝对数 B. 相对数 C. 平均数 D. 文字 5.统计工作的各项任务归纳起来就是两条 ( A ) A. 统计调查和统计分析 B. 统计设计和统计研究 C. 统计预测和统计 D. 统计服务和统计监督 6.对上海港等十多个沿海大港口进行调查,以了解全国的港口吞吐量情况,则这种调查方式是 ( B ) A. 普查 B. 重点调查 C. 典型调查 D. 抽样调查 7.某连续变量分为五组:第一组为40~50;第二组为50~60;第三组为60~70;第四组为70~80;第五组为80以上。依习惯上规定 ( C ) A. 50在第一组,70在第四组 B. 60在第二组,80在第五组 C. 70在第四组,80在第五组 D. 80在第四组,50在第二组8.某城市为了解决轻工业生产情况,要进行一次典型调查,在选送调查单位时,应选择生产情况()的企业。 ( D ) A. 较好 B. 中等 C. 较差 D. 好、中、差 9.某厂的职工工人人数构成如下表所示 性别职工人数文化程度 大专以上中学小学文盲半文盲 男 女 合计 该组的分组标志是 ( A ) A. 性别 B. 男、女 C. 文化程度 D. 性别和文化程度 10.变量数列中各组频率的总和应该 ( B ) A. 小于1 B. 等于1 C. 大于1 D. 不等于1 11.已知变量X与Y之间的关系如下图所示,则其相关系数可能为 ( C ) A. 0.1 B. 0.9

统计学作业答案...doc

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

相关文档
最新文档