统计学课后习题答案(全章节)剖析

统计学课后习题答案(全章节)剖析
统计学课后习题答案(全章节)剖析

第二章、练习题及解答

2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:

(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。

灯泡的使用寿命频数分布表

3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。

(2)制作茎叶图,并与直方图进行比较。

解:(1)频数分布表

(2)茎叶图

第三章、练习题及解答1. 已知下表资料:

试根据频数和频率资料,分别计算工人平均日产量。解:

根据频数计算工人平均日产量:6870

34.35200

xf x f

=

=

=∑∑(件) 根据频率计算工人平均日产量:34.35f

x x f

=

=∑∑g

(件)

结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。

2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:

试计算这9个企业的平均单位成本。解:

这9个企业的平均单位成本=f x x f

=

∑∑

g

=13.74(元)

3.某专业统计学考试成绩资料如下:

试计算众数、中位数。 解:众数的计算:

根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,

()()

1

11m m o m m m m f f M L d f f f f --+-=+

?-+-

()()

2014

801083.532014209-=+

?=-+-(分)

中位数的计算: 根据

60

302

2

f

=

=∑和向上累积频数信息知,中位数在80~90这一组。 12

m e me

f

S M L d f --=+

?∑3026

80108220

-=+

?=(分) 4.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)

解: 计算表

()2

25465.5

27.3275200

x x f

f

σ-=

=

=∑∑ 5.23σ===

5.23

100%100%15.23%34.35

v x

σσ

=

?=

?= 5.一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,平均分数是80分,标准差是15分;在B 项测试中,平均分数是200分,标准差是50分。一位应试者在A 项测试中得了95分,在B 项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想?

解:计算各自的标准分数:9580115A z -=

=,225200

0.550

B Z -== 因为A 测试的标准分数高于B 测试的标准分,所以该测试者A 想测试更理想。

第四章、练习题及解答

1. 随机变量Z 服从标准正态分布,求以下概率:

(1))2.10(≤≤Z P ;(2))048.0(≤≤-Z P ;(3))33.1(>Z P 。

2. 由30辆汽车构成的一个随机样本,测得每百公里的耗油量(单位:升)数据如下:

绘制频数分布直方图,判断汽车的耗油量是否近似服从正态分布。

3. 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估

计总体均值。

(1)x 的期望值是多少?(2)x 的标准差是多少?(3)x 的概率分布是什么? 4. 从π=0.4的总体中,抽取一个容量为500的简单随机样本,样本比例为p 。

(1)p 的期望值是多少?(2)p 的标准差是多少?(3)p 的概率分布是什么? 5. 假设一个总体共有6个数值:54,55,59,63,64,68。从该总体中按重置抽样方式抽

取2=n 的简单随机样本。 (1)计算总体的均值和方差。 (2)一共有多少个可能的样本?

(3)抽出所有可能的样本,并计算出每个样本的均值。

(4)画出样本均值的频数分布直方图,判断样本均值是否服从正态分布。

(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?

第四章习题答案

1.解:由于Z 服从标准正态分布,查表得 0.50=)(NORMSDIST ,0.88491.2=)(NORMSDIST , 0.68440.48=)(NORMSDIST ,0.88491.2=)(NORMSDIST , 0.90821.33=)(NORMSDIST

(1)0.38490.5-0.884901.2)2.10(==-=≤≤)()(NORMSDIST NORMSDIST

Z P (2)

0.1844

0.481-0 0.48-0048.0=+=-=≤≤-)()()()()(NORMSDIST NORMSDIST NORMSDIST NORMSDIST Z P

(3)0918.0)33.1(1)33.1(133

.1=-=≤-=>NORMSDIST Z P Z P )(

2.解:对数据进行整理,30个样本数据极差为1.99。将数据分为7组,组距为0.3,如下表所示:

对应频数直方图为:

观察上图,数据基本上拟合正态分布曲线,可以认为汽车耗油量基本服从正态分布。 3.解:已知:100n , 200==μ,2500502

2

==σ,同时由于样本量很大,可以看作重置抽样来处理。

根据公式4.5可以得到: (1)200)(E ===μx x

(2)25100

25002

2==

=

n

x

σσ,52

==x x σσ (3)根据中心极限定理,x 近似服从均值为200,标准差为5的正态分布。 4.解:已知:005n , 4.0==π,同时由于样本量很大,可以看作重置抽样来处理。 根据公式4.7可以得到: (1)4.0)(E ==πp (2)00048.0)

1(2

=-=

n

p ππσ,0219.02

==p

p σσ; (3)根据中心极限定理,p 近似服从均值为0.4,标准差为0.0219的正态分布。

5.解:

(1)5.606

68

64635955546

1

=+++++=

=

∑=N

x

x i i

9167.24)

(6

1

2

2=-=

∑=N

x x i i

σ;9917.42==σσ

(2

)由于从总体中重置抽取的样本,考虑抽取顺序情况下共有3662

=种可能样本。 (3

(4)样本均值频数表:

样本均值频数直方图:

由上图可以发现,样本均值近似服从正态分布;

(5)由样本方差均值公式可以得到:

5.60362178

36

36

1

==

=

∑=i i

x

x 12.4583336472.2536

)(36

1

2

2

==

-=

∑=i i

x x x

σ;n

x x σσσ===529636.32

可以看出,样本均值与总体均值很接近,样本标准差则比总体方差小。

第五章、练习题及解答

1. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期三周的时间里选取49名顾客

组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差; (2)在95%的置信水平下,求估计误差;

(3)如果样本均值为120元,求快餐店所有顾客午餐平均花费金额的95%的置信区间。 2. 利用下面的信息,构建总体均值μ的置信区间。

(1)总体服从正态分布,且已知15,500,8900===n x σ,置信水平为95%。 (2)总体不服从正态分布,且已知35,500,8900===n x σ,置信水平为95%。 (3)总体不服从正态分布,σ未知,35,500,8900===n s x ,置信水平为90%。 (4)总体不服从正态分布,σ未知,35,500,8900===n s x ,置信水平为99%。 3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网

的时间,得到下面的数据(单位:小时);

求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。 4. 某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。重置随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成新措施的户数比例的置信区间,置信水平为95%。

(2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%。应抽取多少户进行调查?

5. 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与很多因素有关,比

如,银行的业务员办理业务的速度、顾客等待排队的方式,等等。为此,某银行准备采

取两种排队方式进行试验。第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:

(1)构建第一种排队方式等待时间标准差的95%的置信区间。 (2)构建第二种排队方式等待时间标准差的95%的置信区间。 (3)根据(1)和(2)的结果,你认为哪种排队方式更好?

6. 两个正态总体的方差2

1σ和2

2σ未知但相等。从两个总体中分别抽取两个独立的随机样

本,它们的均值和标准差如下:

求)-(21μμ的置信区间,显著性水平分别为95%和99%。

7. 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得

到的自信心测试分数如下:

构建两种方法平均自信心得分之差21-μμμ=d 的95%的置信区间。

8. 从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比例为

%401=p ,来自总体2的样本比例为%302=p 。

构造)-(21ππ的置信区间,置信水平分别为90%和95%。

9. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以减

小方差。下表是两部机器生产的袋茶重量(单位:克)的数据:

构造两个总体方差比2

22

1/σσ的95%的置信区间。

10. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120

元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?

11. 假定两个总体的标准差分别为:121=σ,152=σ,若要求估计误差不超过5,相应的

置信水平为95%,假定21n n =,估计两个总体均值之差)-(21μμ时所需的样本量为多大?

12. 假定21n n =,估计误差为0.05,相应的置信水平为95%,估计两个总体比例之差)

-(21ππ时所需的样本量为多大?

第五章课后习题参考答案

1.解:(1)已知49n 15==,σ,故:1429.27

15

==

=

n

x σ

σ; (2)由题目可知:05.0=α,故查表可知:96.1025.02

==Z Z α 估计误差 4.22.142996.12

=?=x Z σα;

(3)由题目可知:120=x ,由置信区间公式可得: )2.124,8.115(2.41202

=±=±x Z x σα

即快餐店所有顾客午餐平均花费金额的95%的置信区间为(115.8,124.2)元。 2.解:

(1)总体服从正态分布,96.1025.02

==Z Z α,则μ的95%置信区间为:

)9153.0348,8646.9652(129.099496.189002

=?±=±x Z x σα

(2)总体不服从正态分布,且样本属于大样本,96.1025.02

==Z Z α,则μ的95%置信区间

为:

)6502.0659,3498.7348(5154.4896.189002

=?±=±x Z x σα

(3)总体不服从正态分布,σ未知,因此使用样本方差代替总体方差,645.105.02

==Z Z α,

则μ的90%置信区间为:

)0278.0399,9722.7608(5154.48645.189002

=?±=±n

s

Z x α

(4)总体不服从正态分布,σ未知,因此使用样本方差代替总体方差, 96.1025.02

==Z Z α,

则μ的95%置信区间为:

)6502.0659,3498.7348(5154.4896.189002

=?±=±n

s

Z x α

3.解:整理数据可以得到36=n ,3167.3==

∑n

x x ,6093.11

)

(2

=--=∑n x x s ,由于

36=n 属于大样本,所以使用正态分布来构建置信区间。

当645.105.02

==Z Z α,该校大学生平均上网时间的90%置信区间为:

)7579.3,8755.2(2682.0645.13167.32

=?±=±n

s

Z x α

小时 当96.1025.02

==Z Z α,该校大学生平均上网时间的95%置信区间为:

)8424.3,7910.2(2682.096.13167.32

=?±=±n

s

Z x α

小时 当58.2025.02

==Z Z α,该校大学生平均上网时间的95%置信区间为:

)0089.4,6244.2(2682.058.23167.32

=?±=±n

s

Z x α

小时 4.解:

(1)由题目可知:50=n ,64.05032

==

p ,0679.0)

1(=-=n

p p p σ,由于抽取的样本属于大样本,所以96.1025.02

==Z Z α,总体中赞成新措施的户数比例的95%置信区间为:

,(0.77310.50690.067996.164.0)

1(2

=?±=-±n

p p Z p α

(2)由题目可知:估计误差1.0%10)

1(2

=≤-=n p p Z d α

,8.0=p ,96.1025.02

==Z Z α,得到:

1.0)

1(2

≤-n

p p Z α

0.10.8-10.896.1≤?

n

n ≤5385.61

即样本个数至少为62户。

或直接将1.0=d 带入n 确定的公式,即,

6254.611.0)8.01(8.096.1)1()(2

2222/≈=-??=-=d z n ππα

5.解:

(1)整理数据可以得到:10=n ,15.71=x ,2272.02

1=s ,由于抽取的样本属于小样本,所以由CHIINV 函数得:0228.19)9(2

025.02

2==χχα,7004.2)9(2

975.022

1==-

χχ

α

,由

此可以得到第一种排队方式等待时间标准差的95%的置信区间为:

22

12

1

2

2

2

1

)1()1(α

αχσχ--≤

≤-s n s n

87.033.0≤≤σ

(2)整理数据可以得到:10=n ,15.72=x ,8183.32

2=s ,第二种排队方式等待时间标准差的95%的置信区间为:

22

12

2

22

2

2

)1()1(αα

χ

σχ-

-≤

≤-s n s n

33.325.1≤≤σ

(3)比较两种方法的标准差置信区间,第一种方法的置信区间更小,说明第一种方法等待时间的离散程度更小,比第二种方式好。

6.解:由题目可以得到:9218.92

)1()1(212

2

2211=-+-+-=

n n s n s n s w 当093.2)19()2(975.0212

1==-+-

t n n t

α ,)-(21μμ的95%置信区间为:

)4129.19,1871.0(7

11419218.9093.28.911)19()(21975.021=+??±=+±-n n s t x x w

当8609.2)19()2(995.0212

1==-+-

t n n t

α,)-(21μμ的95%置信区间为:

)

9398.22,3398.3(711419218.98609.2)4.432.53(11)19()(21995.021-=+??±-=+±-n n s t x x w

7.解:由样本数据计算得到:

1110

110

==

d ,53.6110384

1

)(1

2

=-=

--=∑=d n

i i

d n d d

s ,262.2)110(2

=-αt

则自信心得分之差21-μμμ=d 的95%的置信区间为:

)67.15,33.6(67.41110

53

.6262.211)

9(025.0=±=?±=±n s t d d 8.解:由题目可以得到:25021==n n ,4.01=p ,3.02=p , 当645.195.02

==Z Z α,)-(21ππ的90%置信区间为:

%)98.16%,021.3()

1()1(2

2211195

.021=-+-±-n p p n p p Z p p 当96.1975.02

==Z Z α,)-(21ππ的95%置信区间为:

%)32.18%,684.1()

1()1(2

22111975

.021=-+-±-n p p n p p Z p p 9.解:由题目可以得到:2121==n n ,058375.02

1=s ,005265.02

2=s ,

4645.2)20,20()1,1(025.0212

==--F n n F α,4058.0)20,20()1,1(975.0212

1==---

F n n F

α

两个总体方差比2

22

1/σσ的95%的置信区间为:

)1,1(1

)1,1(12

12

12

22

12221212

2221--≤≤---

n n F

s s n n F s s αασσ

3223.274123.1722

2

1≤≤σσ

10.解:由题目可以得到:使用过去经验数据,则可以认为σ 已知,即120=σ,在95%置信度下96.1025.02

==Z Z α,估计误差202

≤n

Z σ

α

,因此:

20975

.0≤n

Z σ

20120

96.1≤?

n

n ≤2976.138

即样本个数至少为139个。

11.解:由题目可以得到:总体σ 已知,即121=σ,152=σ,n n n ==21,在95%置信度下96.1025.02

==Z Z α,估计误差5222

1

2

12

≤+

n n Z σσα

,因此:

52

22

1

2

1025

.0≤+

n n Z σσ

5151296.12

2≤+?n

n ≤7020.56

即两个总体的样本各至少为57个。

第六章、练习题及解答

1. 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标

准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.70小时。取显著性水平01.0=α,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?

2. 为监测空气质量,某城市环保部门每隔几周即对空气烟尘质量进行一次随机测试。已知

该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值(单位:微克)如下:

根据最近的测量数据,当显著性水平01.0=α时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?

3. 安装在一种联合收割机上的金属板的平均重量为25公斤。对某企业生产的20块金属板

进行测量,得到的重量(单位:公斤)数据如下: 假设金属板的重量服从正态分布,在05.0=α显著性水平下,检验该企业生产的金属

板是否符合要求。

4. 对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城

市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商从该城市随机抽取550人,调查知其中115人早餐饮用牛奶。在05.0=α显著性水平下,检验该生产商的说法是否属实。

5. 某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样

本产生如下结果:

在05.0=α的显著性水平下检验平均装配时间之差是否等于5分钟。

6. 某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人

都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对05.0=α的显著性水平,用下列数据检验该假设,并对该广告给予评价。

7. 某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采

用方法2对12名员工进行培训。培训后的测试分数如下:

两种方法培训得分的总体方差未知且不相等。在05.0=α的显著性水平下,检验两种方法的培训效果是否有显著差异。

8. 为研究小企业经理是否认为他们获得了成功,在随机抽取的100个小企业的女性经理中,

认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为

39人。在05.0=α的显著性水平下,检验男女经理认为自己成功的人数比例是否有显著差异。

9. 为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者选择了面积相等、

土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:

取显著性水平05.0=α,检验:

(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为: ①两种肥料产量的方差未知但相等,即2

22

1σσ=。 ②两种肥料产量的方差未知且不相等,即2

22

1σσ≠。 (2)两种肥料产量的方差是否有显著差异?

10. 生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减

小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量(单位:克)的数据如下,检验这两部机器生产的袋茶重量的方差是否存在显著差异。(05.0=α)

第六章课后习题参考答案

1.解:由题目可以得到:200=n ,5.2=σ;

提出原假设与备择假设:7.6:0≤μH ,7.6:1>μH ;

该检验属于右侧单边检验,因此得到拒绝域为:}3263.2{99.01==≥=-z z z W α; 在大样本条件下检验统计量为:32563.21113.30

>=-=

n

x z σ

μ,落入拒绝域中,因

此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。

(或利用Excel 的“1-NORMSDIST(3.1113)”函数得到检验P=0.0009<0.01,则拒绝原假设)

2.解:由题目可以得到:32=n ,根据样本数据计算得到:1979.9=s ,10625.78=x ; 提出原假设与备择假设:82:0≥μH ,82:1<μH ;

该检验属于左侧单边检验,因此得到拒绝域为:}3264.2{01.0-==≤=z z z W α;

在大样本且总体方差未知条件下检验统计量为:325.23949.20

<-=-=

n

s x z μ,落入拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。 (或利用Excel 的“NORMSDIST(-2.3949)”函数得到检验P=0.0083<0.01,则拒绝原假设)

3.解:由题目可以得到:20=n ,计算样本数据得到1933.2=s ,51.25=x ; 提出原假设与备择假设:25:0=μH ,25:1≠μH ;

该检验属于双边检验,因此得到拒绝域为:}96.1{025.02

==≥=z z z W α;

在服从正态分布的小样本且总体方差未知条件下检验统计量为: 96.10399.1<=-=

n

s x z μ

,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产的金属板不符合要求。

(或利用“TDIST(1.04,19,2)”函数得到检验P=0.3114>0.05,则不能拒绝原假设) 4.解:由题目可以得到:550=n ,计算样本数据得到%91.20550

1150===

n n p ; 提出原假设与备择假设:%17:0≤πH ,%17:1>πH ;

该检验属于右侧单边检验,因此得到拒绝域为:}96.1{025.02

==≥=z z z W α;

在大样本条件下检验统计量为:96.14412.2)

1(000

>=--=

n

p z πππ,落入拒绝域中,

因此拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.0073<0.05,则拒绝原假设) 5.解:提出原假设与备择假设:5:210=-μμH ,5:211≠-μμH ;

在大样本条件下检验统计量为:1450.5)

()(2

22

121

2121-=+---=

n s n s x x z μμ

利用“2*(1-NORMSDIST(5.1450))”函数,得到双尾P 值为7

10

6752.2-?,由于

05.0=<αP ,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。

6.解:设:“看后”平均得分为1μ ,“看前”平均得分2μ,“看后”平均得分与“看前”平均得分之差为d ;

提出原假设与备择假设:0:210≥-μμH ,0:211<-μμH ;

根据样本数据计算得到:625.01

==

∑=n

d

d n

i i

,3025.11

)(1

2

=--=

∑=n d d

s n

i i

d ;

在配对的小样本条件下检验统计量为:3572.18

3025.1625

.0==

t

利用Excel “=TDIST(1.3572, 7, 1)”得到的单尾概率P 值为0.10842,由于

05.0=>αP ,不能拒绝原假设,没有证据表明广告提高了平均潜在购买力得分。

7.解:设:方法一培训测试平均得分为1μ,方法二培训测试平均得分为2μ; 提出原假设与备择假设:0:210=-μμH ,0:211≠-μμH ;

根据样本数据计算得到:

151=n ,122=n ,7333.471=x ,5.562=x ,4952.1921=s ,2727.182

2

=s 由于小样本情况下总体方差未知且不相等,t 分布自由度为:

241

-)(1-)()(222

2

21212122

2

2121≈++=n n

s n n s n s n s υ 在小样本条件下检验统计量为:2183.5)

-(-)-(2

22

121

2121-=+=

n s n s x x t μμ

利用Excel 的“=TDIST(5.2183, 24, 2)”函数,得到的双尾概率P 值为0.00002,由于05.0=<αP ,拒绝原假设,认为两种培训方法的效果存在显著差异。

8.解: 设:男性经理认为自己成功的人数比例为1π , 女性经理认为自己成功的人数比例为2π,两个样本合并后得到的合并比例为p ;

提出原假设与备择假设:0:210=-ππH ,0:211≠-ππH ;

根据样本数据计算得到:两个样本的比例分别为:=1p 41%,=2p 24%

两个样本合并后得到的合并比例%31.322

12

211=++=

n n p n p n p ;

检验统计量为:5373.21

112

12

1=+=

)

n n -p)(p(-p p z

利用Excel 的“=2*(1-NORMSDIST(2.5373))”函数,得到检验概率P 值为0.0112,由于05.0=<αP ,所以拒绝原假设,认为男女经理认为自己成功的人数比例具有显著差异。 9.解:设:新肥料获得的平均产量为1μ,旧肥料获得的平均产量为2μ; (1)两种肥料产量的方差未知但相等,即2

221σσ=时:

提出原假设和备择假设:0:0:211210>-≤-μμμμH H ; ; 根据样本数据计算得:

201=n ,202=n ,9.1091=x ,7.1002=x , 3579.3321=s ,1158.242

2

=s ; 总体方差的合并估计量为:

73685.282

-)1-()1-(212

2

22112=++=n n s n s n s p

检验统计量为: 4271.511)

-(-)-(2

12121=+

=

n n s x x t p μμ

利用Excel 的“=TDIST(5.4271, 38, 1)”函数,得到单尾概率P 值为0.000002,由于

05.0=<αP ,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。

(以上也可由Excel 中的[t-检验:双样本等方差假设]给出) 两种肥料产量的方差未知且不相等,即2

221σσ≠时:

提出原假设与备择假设:0:0:211210>-≤-μμμμH H ;;

根据样本数据计算得到:

201=n ,202=n ,9.1091=x ,7.1002=x , 3579.3321=s ,1158.242

2

=s 由于小样本情况下总体方差未知且不相等,t 分布自由度为:

371

-)(1-)()(222

2

21212122

2

2121≈++=n n

s n n s n s n s υ 在小样本条件下检验统计量为:4271.5)

-(-)-(2

22

121

2121=+=

n s n s x x t μμ

利用Excel 的“=TDIST(5.4271, 37, 1)”函数,得到单尾概率P 值为0.000002,由于

05.0=<αP ,拒绝原假设,认为新肥料获得的平均产量显著地高于旧肥料。

(以上也可由Excel 中的[t-检验:双样本异方差假设]给出) (2)设:使用新肥料的田地为样本1,使用旧肥料的田地为样本1

提出原假设与备择假设:1:22210=σσH ;1:22

2

11≠σσH

利用Excel 中的“F -检验:双样本方差”(025.0=α)得到的检验结果如下表所示:

由于05.04861

.02=>=α

P ,不能拒绝原假设,没有证据表明两种肥料产量的方差

有显著差异。

10.解:设:机器一为样本1,机器二为样本1

提出原假设与备择假设:1:22210=σσH ;1:22

2

11≠σσH

利用Excel 的“F -检验:双样本方差”(025.0=α)得到的检验结果如下表所示:

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

统计学第一章习题答案

1、指出下面的变量中哪一个属于分类变量(D) A、年龄 B、工资 C、汽车产量 D、购买商品时的支付方式(现金、信用卡、支票) 2、指出下列的变量中哪一个属于顺序变量(C) A、企业的销售收入 B、员工的工资 C、员工对企业某项改革措施的态度(赞成、中立、反对) D、汽车产量 3、指出下面的变量中哪一个属于数值型变量(A) A、生活费指出 B、产品的等级 C、企业类型 D、员工对企业某项改革措施的态度 4、某研究部门准备在全市200万个家庭中抽取2000个家庭,以推断该城市所有职工家庭的 年人均收入。这项研究总体是(B) A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200万个家庭的人均收入 5、某研究部门准备在全市200万个家庭中抽取2000个家庭,以推断该城市所有职工家庭的 年人均收入。这项研究的样本是(A) A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200万个家庭的人均收入 6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。这里的总体是(A)A、IT业的全部从业者B、IT业的500个从业者 C、IT从业者的总收入 D、IT从业者的消费支付方式 7、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。这里的“消费支付方 式”是(A) A、分类变量 B、顺序变量 C、数值型变量 D、连续变量 8、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。这里的“月收入”是 (C) A、分类变量 B、顺序变量 C、数值型变量 D、离散变量 9、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的总体是(D) A、1000个消费者 B、所有在网上购物的消费者 C、所有在网上购物的消费者的总花费 D、1000个消费者的平均花费 10、下列不属于描述统计问题的是(A) A、根据样本信息对总体进行的推断 B、了解数据分布的特征

统计学(第三版课后习题答案

Hah 和网速是无形的 1:各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数 (个) 频率 (%) 向上累积向下累积 企业数频率企业数频率 100以下100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————(2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%) 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

统计学各章节课后习题答案

统计学各章练习题答案第1章绪论(略) 第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。

2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学第一章绪论习题

第一章绪论 练习题 一、填空题 1.政治算术派产生于世纪资本主义的英国,代表人物是,代表作是。 2.国势学派产生于世纪的德国,创始人是。 3.数理统计学派的创始人是比利时学者。 4.按照统计方法的类型,可将统计学分为和。 5.总体是由许多具有的个别事物组成的整体;总体单位是的组成单位。 6.统计总体具有四个基本特征,即,,和。 7.标志是说明总体单位特征的名称,按表现形式不同分为和两种。 8.统计指标按其所说明的总体现象内容的不同,可分为和。 9.指标与标志的主要区别在于:(1)指标是说明特征的,而标志则是说明特征的;(2)标志有不能用表示的与能用表示的,而指标都是能用的。 10.一个完整的统计工作过程可以划分为、、、四个阶段。 11.样本是从中抽出来,作为代表的部分单位组成的集合体。 12.推断统计学研究的是如何根据去推断的方法。 13.统计学自身的发展,沿着两个不同的方向,形成和。 14.数学研究的是数量规律,而统计学则是研究、数量规律。 15.统计指标是说明客观现象总体数量特征的和的统一体。 16.理论统计学是以为中心建立统计方法体系,而应用统计学是以为中心应用统计方法分析和解决实际问题。 二、单项选择题 1.统计总体的同质性是指( ) A总体各单位具有某一共同的品质标志或数量标志 B总体各单位具有某一共同的品质标志属性或数量标志值 C总体各单位具有若干互不相同的品质标志或数量标志 D总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体单位是( ) A该全部工业企业 B 这800家工业企业 C每一件产品 D 800家工业企业的全部工业产品生产情况 3.要了解全国的人口情况,总体单位是( ) A每个省的人 B每一户 C全国总人口 D全国的每一个人 4.有200家公司每位员工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为( ) A 这200家公司的全部员工 B 这200家公司 C 这200家公司职工的全部工资 D 这200家公司每个职工的工资 5.要了解某班50个学生的学习情况,则总体单位是( ) A该班全体学生 B 该班全体学生的学习成绩 C该班的每一个学生 D该班每一个学生的学习成绩 6.设某地区有60家生产皮鞋的企业,要研究它们的产品生产情况,不能成为指标是( ) A所有企业 B企业数

统计学课后习题和答案

第一章 1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出 如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A. 9252157g B. 9282157g C.528292g D. 655292g E. 9252 82 g 1*. Answer :B Analysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为: 92829282 (,)()()157157157157 P Earned Employed Total P Earned P Employed Total == = g g g g g g 2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组 的试验结果。 如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱 绿色的人数的期望值? A. (99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35) 314 2*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为: 1089999108 (3050,)(3050)()314314314314 P green Total P P green Total -=-= = g g g g g g 第二章 1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第一章练习题19785

第一题:单项选择题 1.同质性、大量性、差异性() A只有有限总体具有 B只有无限总体具有 C有限总体和无限总体都具有 D有限总体和无限总体都不具有 2.”统计”的基本含义是() A统计调查、统计整理、统计分析 B统计分析、统计推断、统计描述 C统计工作、统计资料、统计学 D统计分组、统计指标、统计分析 3.研究生招生目录中,201为英语、202为俄语、203为日语。这里语种属于() A定类数据 B定序数据 C定距数据 D定比数据 4.电视观众对收费频道是否应该插入广告的态度为不应该、应该、无所谓。这里“不应该、应该、无所谓”是() A定类数据 B定序数据 C定距数据 D定比数据 5.学生的智商等级是() A定类数据 B定序数据 C定距数据 D定比数据 6.下列表述正确的是() A定序数据包含定类数据和定距数据的全部数据 B定类数据包含定序数据的全部信息 C定序数据与定类数据是平行的 D定比数据包含了定类数据、定序数据和定距数据的全部信息 7.用部分数据去估计总体数据的理论和方法,属于() A理论统计学 B应用统计学 C描述统计学 D推断统计学 8.了解学生的学习情况,要调查足够多的学生,这个方法称为() A大量观察法 B统计分组法 C综合指标法 D相关分析法 9.了解居民的消费支出情况,则() A所有居民的消费支出额是总体单位 B所有居民是总体 C某个居民的消费支出额是总体

D所有居民是总体单位 10.统计学的数量性特点表现在它是() A一种纯数量的研究 B利用大量的数字资料建立数学模型 C在质与量的联系中来研究现象总体的数量特征 D以数学公式为基础的定量研究 11.统计学的总体性特点是指() A研究现象各个个体的数量特征 B研究由大量个别事物构成的现象整体的数量特征 C从认识总体入手开始研究现象的数量特征 D从现象量的研究开始来认识现象的性质和规律 12.统计研究中的大量观察法是指() A一种具体的调查研究方法 B对总体中的所有个体进行观察和研究的方法 C收集大量总体资料的方法 D要认识总体的数量特征就必须对全部或足够多个体进行观察和研究13.对全市工业企业职工的生活状况进行调查,调查对象是() A该市全部工业企业 B该市全部工业企业的职工 C该市每一个工业企业 D该市工业企业的每一个职业 14.某年全国汽车总产量是() A随机变量 B连续变量 C离散变量 D任意变量 15.要反映我国工业企业的整体业绩水平,总体单位是() A我国每一家工业企业 B我国所有工业企业 C我国工业企业总数 D我国工业企业的利润总额16.统计总体的特点是() A同质性、大量性、可比性 B同质性、大量性、差异性 C数量性、总体性、差异性 D数量性、综合性、同质性 第二题:多项选择题

统计学课后第一章习题答案.doc

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是() A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是() A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是() A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是()的结果 A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告来源于() A、试验 B、实际观察 C、随机抽样 D、已发表的资料

6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是() A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是() A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生 9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的变量是()A、该大学一年级新生的教科书费用 B、该大学的学生数 C、该大学新生的年龄 D、大学生的生活成本 10、在下列叙述中,关于推断统计的描述是() A、一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌; B、.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

《管理统计学》习题及标准答案

《管理统计学》作业集习题集及答案 第一章导论 *1-1 对50名职工的工资收入情况进行调查,则总体单位是(单选)( 3 )(1)50名职工(2)50名职工的工资总额 (3)每一名职工(4)每一名职工的工资 *1-2 一个统计总体(单选)( 4 ) (1)只能有一个标志(2)只能有一个指标 (3)可以有多个标志(4)可以有多个指标 *1-3 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是(单选)( 4 ) (1)指标(2)标志(3)变量(4)标志值 第二章统计数据的调查与收集 *2-1 非全面调查包括(多项选择题)(12 4 ) (1)重点调查(2)抽样调查(3)快速普查 (4)典型调查(5)统计年报 *2-2 统计调查按搜集资料的方法不同,可以分为(多项选择题)( 12 3 ) (1)采访法(2)抽样调查法(3)直接观察法 (4)典型调查法(5)报告法 *2-3 某市进行工业企业生产设备状况普查,要求在7月1日至7月5日全部调查完毕。则规定的这一时间是(单项选择题)(2) (1) 调查时间(2) 调查期限(3) 标准时间(4) 登记期限 *2-4 某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是(单项选择题)(4) (1) 普查(2) 典型调查(3) 抽样调查(4) 重点调查 *2-5 下列判断中,不正确的有(多项选择题)(23 4 ) (1)重点调查是一种非全面调查,既可用于经常性调查,也可用于一次性调查; (2)抽样调查是非全面调查中最科学的方法,因此它适用于完成任何调查任务; (3)在非全面调查中,抽样调查最重要,重点调查次之,典型调查最不重要; (4)如果典型调查的目的是为了近似地估计总体的数值,则可以选择若干中等的典型单位进行调查; (5)普查是取得全面统计资料的主要调查方法。 *2-6 下列属于品质标志的是(单项选择题)( 2 ) (1)工人年龄(2)工人性别(3)工人体重(4)工人工资 *2-7 下列标志中,属于数量标志的有(多项选择题)(3) (1)性别(2)工种(3)工资(4)民族(5)年龄 *2-8 下列指标中属于质量指标的有(多项选择题)(13 4 ) (1)劳动生产率(2)废品量(3)单位产品成本 (1)资金利润率(5)上缴税利额 第三章统计数据的整理 *3-1 区分下列几组基本概念: (1)频数和频率;

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学贾俊平第五版课后习题答案完整版

亲爱的,一章一章来,肯定能弄完的,你是最棒的! 统计学(第五版)贾俊平课后习题答案(完整版) 第一章思考题 i.i什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得岀结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。 2.2 比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

相关文档
最新文档