统计学课后习题和答案

统计学课后习题和答案
统计学课后习题和答案

第一章

1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出

如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A.

9252157g B. 9282157g C.528292g D. 655292g E. 9252

82

g 1*. Answer :B

Analysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为:

92829282

(,)()()157157157157

P Earned Employed Total P Earned P Employed Total ==

=

g g g g g g

2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组

的试验结果。

如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱

绿色的人数的期望值? A.

(99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35)

314

2*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为:

1089999108

(3050,)(3050)()314314314314

P green Total P P green Total -=-=

=

g g g g g g 第二章

1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

A. B.

C. D.

E.

2*.

.

这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张

A.较低的20个分数的差异大于较高的20个分数的差异

B.中位数小于50

C.60%的学生的分数高于80分

D.如果设定及格线是70,那么大多数人没通过这次考试

E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高

F.1*. Answer:D

G.Analysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。

1*. Answer:D

Analysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。

这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张图中得出?

A.较低的20个分数的差异大于较高的20个分数的差异

B.中位数小于50

C.60%的学生的分数高于80分

D.如果设定及格线是70,那么大多数人没通过这次考试

E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高

2*. Answer:A

Analysis:本题考查累计频数分布图,较低的20个分数累积的比较快,较高的20个分数累积的比较慢,所以,较低的20个分数的变异性较大。

3*.

Set I

Set II

20 30 45 50 60

这张箱线图表明了两个统计数据组,根据这张箱线图,下列哪一个选项不能推断出来?

A.1组的范围和2组的范围一样

B.1组的四分位差和2组的四分位差一样

C.1组的中位数比2组的中位数小

D.1组的数据同2组的数据有相同的数据量

E.2组大约75%的数据大于或等于1组中大约50%的数据

Analysis:本题考查平行箱线图的数值特征。I和II的极差相同;IQR就是箱子的宽度,I和II 相同;中间的竖线是中位数,I小于II;从图中看不出I和II的数据量是否相同;I的中位数和II的下四分位数相同,所以II中至少有75%的数据比I中50%的数据大。

4*.

植物学家正在研究两种不同种类的百合花的花瓣长度(以毫米计)。上面的箱线图是选取两个不同物种的相同大小的样本的花瓣长度收集的数据。根据这个箱线图,哪一个选项是这次研究出的正确结果?

A.两组的四分位差相同

B.B种花的长度范围大于A种花

C.A种花的长度同B种花的长度相比有更多长于70mm的花瓣

D.B种花的长度同A种花的长度相比有更多长于40mm的花瓣

E.B种花的长度同A种花的长度相比有更多少于30mm的花瓣

4*. Answer:E

Analysis:本题考查平行箱线图的数值特征。A的IQR比B的小;A和B的极差相同;大于70的数据A比B的少;大于40的数据A比B多;大于30的数据A比B多。

5*.詹妮尔收集了一个大样本中每一个顾客在当地一个商店中停留的时间。这些数据被分为男士组和女士组。下图是这些数据的箱线图。

下面哪一个说法是正确的?

A.男士组在商店停留的时间的极差是40分钟

B.男士组平均在商店停留的时间大约为20分钟

C.男士组的3/4位数大约是45分钟

D.样本中女士组的四分位差是15分钟

E.样本中大约一半的男士在商店停留的时间至少同女士一样多

Analysis:本题考查平行箱线图的数值特征。解题思路同第3、4题,不再赘述。

6*.在1830年,土地测量员开始调查路易斯安那州的土地购买。他们的部分任务是调查该区

下列哪一个选项表示了累积相对频率表中树木直径在12到16英寸的组

A. 0.615 - 0.325

B. 0.615 - 0.473

C. 0.726 - 0.325

D. 0.726 - 0.473

E. 0.731 - 0.325 6*. Answer :C

Analysis :本题考查通过累积频率计算相应的区间。注意,题目问的是直径在12到16英尺之间,包括12和16。所以应该是11对应的相对频率0.325到16对应的相对频率0.726。

B. 问答题

1*.美国每个州每年公立学校招收学生与雇佣老师的数量的数据由美国每个州记录。从这些记录中,每个州学生和老师的数量比值(p-t 比)可以被计算出来。下面的柱状图显示了每个州在2001 - 2002学年的p-t 比。左边的柱状图显示了密西西比河以西的24个周的比率,右边的柱状图显示了密西西比河以东的26和州的比率

(a ) 描述你如何估计这两组数据的中位数的方法。然后用你所描述的方法估计西部地区

的中位数和东部地区的中位数。

(b ) 简单用几句话比较2001-2002学年这两组数据p-t 值。

(c ) 用你从(a )和(b )中的答案,来比较2001-2002学年这两组p-t 值的均值大小 1*. Analysis :本题考查直方图的相关知识。 (a) 找出中位数,根据中位数的定义M e 的位置是

1

2

n ,n 1 = 24,n 2 = 26。所以两个中位数所在的组都是15~16。

(b) shape :west 右偏,east 接近对称;center :中位数相同;spread :the range of west = 22 – 12 = 10,the range of east = 19 – 12 = 7。

(c) west 右偏,有mean > median ;east 接近对称,有mean = median 。两者中位数相同,所以,mean west > mean east 。

第三章

1*.下面的茎叶图显示了16年来两家不同的公司股票每股收益的比较

下列哪一个选项是正确的?

A.A公司的收益的中位数小于B公司收益的中位数

B.A公司收益的范围小于B公司的收益范围

C.A公司的3/4位数小于B公司的3/4位数

D.A公司收益的均值比B公司收益的均值大

E.A公司的四分位差是B公司的四分位差的两倍

1*. Answer:D

Analysis:本题考查背靠背茎叶图的数值特征。A的中位数为1.955,B的中位数为1.32;A 的极差为3.32,B的极差为1.71;A的上四分位数为2.49,B的上四分位数为1.65;A的均值为2.1475,B的均值为1.38625;A的IQR为1.06,B的IQR为0.67。

2*. 一个公司想要确定员工的医疗费用。对一个25个雇员的样本进行采访,确定他们上一年的医疗花费。后来该公司发现,最高的医疗费用在样本被错误地记录为10倍的实际金额。但是,在纠正错误之后,正确的数字依然大于或等于样本中任何其他的医疗花费数字。下列哪个样本统计量必须在更正后保持不变?

A. Mean 均值

B. Median 中位数

C. Mode 众数

D. Range 范围

E. Variance 方差

2*. Answer:B

Analysi:本题考查变量取值的变化对变量数字特征的影响。题中把数据错误变为原来的10倍。改正后数据还是偏大,那么和正确的相比,只有中位数不会变化。

3*. 从总人口中随机选取一个10人大小的随机样本。这个样本的方差是0。下列哪一个选项是正确的?

1:总人口的方差也是0。

2:样本的均值和样本的中位数一样。

3:这10个样本数据数学上相等

A. I only 只有1

B. II only 只有2

C. III only 只有3

D. I and II 1和2

E. II and III 2和3

3*. Answer:E

Analysis:本题考查样本均值与中位数的关系受方差变化的影响。样本方差为0,说明样本数据没有波动,即样本中每个数据都是相同的,但这并不意味着总体也是如此。所以样本均值和中位数相等。

4*.一个教授教两个统计学班。早上的课有25个学生,他们的第一次测试平均分是82。晚上的课有15个学生,他们的第一次测试成绩是74。考虑他两个班的情况,教授所教全部学生

的平均测试成绩是多少? A. 76 B. 78 C. 79 D. 80

E. The average cannot be calculated since individual scores of each student are not available. 由于不是每个学生成绩都知道所以不可计算 4*. Answer :C

Analysis :本题考查平均数的计算。两个班级的平均成绩为:

25821574

792515

?+?=+

5*. 从芒廷维尤学区抽取一个25个家庭的随机样本进行调查。在这次调查中,收集的数据是每一个家庭中生活的最小的小孩。下面的直方图展示了这次调查中得到的数据。

下面哪一个组包含了这次调查中的均值

A. 0 years old to less than 2 years old 0岁到小于2岁

B. 4 years old to less than 6 years old 4岁到小于6岁

C. 6 years old to less than 8 years old 6岁到小于8岁

D. 8 years old to less than 10 years old 8岁到小于10岁

E. 10 years old to less than 12 years old 10岁到小于12岁 5*. Answer :D

Analysis :本题考查中位数的计算。n = 25,所以median 是第13个数,它落在8—10之间。

6*.下面的数据选取自随机抽取的一个200小孩的样本,提供了一个汇总的统计分布的身高。 均值:46英尺

中位数:45英尺7*. 标准差:3英尺 /4位数:43英尺 3/4位数:48英尺

大概样本中的100个小孩的身高范围是 A.小于43英尺 B.小于48英尺

C.在43到48英尺间

D.在40到52英尺间

E.多于46英尺

6*. Answer:C

Analysis:本题考查两个四分位数之间的数据比例为50%。所以约有100个children的身高在43—48 inches之间。

7.上表展示了测量的两个样本的大小,均值,中位数。哪一个数值表示了这47个样本的总

n Mean Median

Sample I 21 42.6 45.0

Sample II 26 49.2 48.5

A.

2B.

48.5

2

C.

2142.62649.2

2

?+?

D.

2145.02648.5

2

?+?

E. It can not be determined from the given information.

E.由给定数据不能计算出

7*. Answer:E

Analysis:本题考查中位数计算。必须知道两个样本各自的直方图或者具体的数据,才能计算两个样本合在一起的median。

8*. 下面哪个分布的均值大于中位数

8*. Answer:A

Analysis:本题考查中位数和均值的比较。一般来说,均值大于中位数就是右偏。

9*. 一个当地的房地产杂志在报道被古弗兰高中录取的学生的平均SAT成绩时,用中位数替代均值。一个图形显示被古弗兰高中录取的学生SAT成绩强烈向右倾斜。下列哪个选项解释了在这种情况下为什么中位数是一个比均值更准确的测量学生SAT平均水平的标准。

A. 均值被右偏影响,而中位数不会

B. 均值总是更接近原始数据

C. 当数据强烈右偏时均值会少于中位数

D. 只有数据左偏时才应该使用均值

E. 中位数等于古弗兰高中SAT 成绩最大和最小的和的一半 9*. Answer :A

Analysis :本题考查使用mean 还是median 来代表center 。由于考试分数是右偏的,所以magazine 使用median 来表示centre 。

10*.成年雄性灰鲸的体重大约按照均值为18000kg ,标准差为4000kg 的正态分布。成年雄性座头鲸的体重大约按照均值为30000kg ,标准差为6000kg 。一只成年雄性灰鲸重24000kg 。这只鲸应该和以下哪一头成年雄性座头鲸体重有相同的标准化分数? A. 21,000 B. 24,000 C. 30,000 D. 36,000 E. 39,000 10*. Answer :E

Analysis :本题考查Z 分数的应用(转换)。gray whales~N(18,000, 4,000),humpback whales~N(30,000, 6,000)。某个gray whale 是24,000千克,它和humpback whales 的Z 分数相同。那么Z gray whale = Z humpback whale =

24000180004000-=1.5 =

30000

6000

x -,所以x = 39000。

11*. 在一所大学,学生们的化学期末考试成绩大约服从均值为75,标准差为12正态分布.微积分期末考试成绩大约服从均值为80,标准差为8的正态分布。一个学生期末化学考了81,微积分考了84,相对于这些学生在各自班级中,下面那个课程这个学生学得更好? A.这个学生化学学得更好 B.这个学生微积分学得更好 C.这个学生两门课一样好 D.信息不足不能判断 11*. Answer :C

Analysis :本题考查Z 分数的应用,不同数据的比较。计算各自的Z 分数,

81750.512chemistry Z -=

=,8480

0.58

calculus Z -==,所以,两门考试成绩一样好。

12*. 劳伦参加了一个非常大的大学微积分班。在第一次考试中,班级平均分是75,标准偏差是10。在第二次考试中,班级平均分是70,标准偏差是15。劳伦在两个考试中都得了85分。假设每个考试分数约为正态分布,劳伦在哪一次考试中表现更好? A.她第一次考得好 B.她第二次考得好 C.两次一样好

D.由于班级人数未知所以不能判断

E.由于两个考试间相关性未给出所以不能判断 12*. Answer :C

Analysis :本题考查Z 分数的应用,不同数据的比较。计算各自的Z 分数,8575

110

first Z -==,sec 8570

15

ond Z -=

=,所以,两场考试成绩一样好。

13*.下图记录了一种遥控汽车每一次充满电所能运行的时间。这种类型的汽车运行时间的分

布,在电池第一次使用后的初始时期,大约服从均值为80分钟,标准差为2.5分钟的正态分布。阴影面积表示了下列选项中哪一个的概率?

A.任意选定汽车初次充电后使用时间范围在75到82.5分钟的概率

B.任意选定汽车初次充电后使用时间范围在75到85分钟的概率

C.任意选定汽车初次充电后使用时间范围在77.5到82.5分钟的概率

D.任意选定汽车初次充电后使用时间范围在77.5到85分钟的概率

E.任意选定汽车初次充电后使用时间范围在77.5到87.5分钟的概率 13*. Answer :A

Analysis :本题考查用Z 分数计算x 的值。均值减去两个标准差等于75,均值加上一个标准差等于82.5。

14*.下列哪一个选项是下图所示分布的标准差的最佳估计

A. 5

B. 10

C. 30

D. 50

E. 60 14*. Answer :B

Analysis :本题考查经验法则的应用。均值为50,均值加减两个标准差的范围内包含95%的数据,从图形上看,30~70的范围包含近似95%的数据,所以,47030σ≈-,10σ≈。

15*.有一次测试的成绩不是对称分布的下列哪一个数是第三四分位数的z 值的最佳估计A. 0.67 B. 0.75

D. 1.41

E. This z-score cannot be estimated from the information given.

E.这个z值不能从给定的信息得出

15*. Answer:E

Analysis:本题考查经验法则的应用。由于分布不是对称的,不能使用经验法则。

16*. Suppose that the distribution of a set of scores has a mean of 47 and a standard deviation of 14. 一组数据符合均值为47标准差为14的正态分布。如果每一组数据加4,哪一组数据将成为新的分布的均值和标准差?

Mean Standard Deviation

A. 51 14

B. 51 18

C. 47 14

D. 47 16

E. 47 18

16*. Answer:A

Analysis:本题考查变量取值变化对均值和标准差的影响。

17*.将一组测试数据按照下面的式子进行转换

转化后的数据=3.5(原始数据)+6.2

下列哪一个选项是错误的?

A.转换后的均值=3.5(原始数据)+6.2

B.转换后的中位数=3.5(原始数据)+6.2

C.转换后的极差=3.5(原始数据)+6.2

D.转换后的标准差=3.5(原始数据)

E.转换后的四分位距=3.5(原始数据)

17*. Answer:C

Analysis:本题考查变量取值变化对均值和标准差的影响。

18.

上图展示了一组数据的描述性变量。一次测试中,一个学生的标准化分数z= -1.2。这个学生在测试中得了多少分?

A. 266.28

B. 779.42

C. 1008.02

D.1083.38

E. 1311.98

18. Answer:B

Analysis:本题考查Z分数和x的关系。z = –1.2=

1045.7

221.9

x

,x = 779.42。

1*.一个专业的运动队用两个标准评价运动员的潜力,速度和力量。

(a)速度的比较是通过40码赛跑进行,用时更少则有更令人满意的速度。所有同位置运动员的用时均值为4.6秒,标准差为0.15秒,最小值为4.40秒,如下图所示

根据均值,标准差,最小值的时间,我们有理由相信40码赛跑的成绩大约按正态分布吗?请解释。

(b)力量是用举重所举起的重量衡量,举起重量更大则成绩更令人满意。所有同位置运

计算并说明一个举重成绩为370磅的运动员的z分数为多少。

(c)力量和速度在选拔运动员时被认为具有同样的重要性。根据下表所示的A运动员和B

1*. Analysis:本题主要考查Z分数的相关应用。

(a) 不能认为是正态分布。可以计算最小值的Z分数,,如果是正态分布,那么P(z < -1.33) = 0.092,不是0,所以不是正态的。

(b) 本题只需要计算Z分数并解释。,说明370比均值大2.4个标准差。

(c) 要比较孰优孰劣,就需先标准化。跑步:Player A:,Player B:;举重:Player A:,Player B:。所以两者在跑步上差距较大,所以选择A。

2*.宾州周立大学的调查员发现奖励可以提高智商,尤其是对于较低基线智商。他们发现一

(a)分析离群值

(b)说明每一组的集中趋势度量

(c)两个样本的智商的3/4位数是多少?

2. Analysis:本题考查数据的数值性度量。

(a) outlier 定义为大于Q3 + 1.5IQR,或小于Q1 - 1.5IQR,计算后发现不存在。

(b) 由于没有outlier,也没有明显的偏斜,mean和median都可以表示central。No Incentive: mean = 97.9, median = 95.0; Incentive: mean = 105.0, median = 98.0。

(c) 上四分位数就是处于75%位置的数。No Incentive: 109.75, Incentive: 131.39。

第四章

1*. 在下列情形中,哪一项活动是最难以运用普查的?

A.确定大学校园里持有拍照的自行车中有灯的车子所占的比例

B.确定某所高中支持穿校服的学生所占的比例

C.确定某所大学里注册就读的学生中,每周工作二十小时以上的学生所占的比例

D.确定某个小镇上一个家庭住宅里拥有两个车库的房子所占的比例

E.确定密歇根湖里的鱼中,鲈鱼所占的比例

1*. Answer:E

Analysis:本题考查普查的使用。普查需要调查到总体的每一个个体,选项E需要抽到该湖里每一条鱼,所以难度很大。

2*.一个小学里有十五间教室,每间教室有24个学生。一个样本容量为30的样本按照如下程序来抽取学生。

这15个教师每人从他的班上抽取两名学生进入样本。每个班的学生按照从1到24的顺序排序,然后用随机数表在01到24之间来选择两个不同的随机数字,被选中的两个数字所对应的两个学生进入样本。

这是程序是不是从这个小学中抽取了一个样本容量为30的简单随机样本?

A.不是,因为老师不是随机选择的

B.不是,因为所有的学生被选中的可能性不是相等的

C.不是,因为不是所有的学生都有被选中的可能

D.是的,因为每个学生被选中的可能性是相等的

E.是的,因为数字是随机分配给这些学生的

2*. Answer:B

Analysis:本题考查SRS抽样的概念。按照题目的描述,该方法不是SRS。

3*. 某所高中的学生管理中心想要进行一项关于学生意愿的问卷调查,他们想要获取一个样本容量为60的简单随机样本,下列哪项调查方法可以获得一个简单随机样本?

A.调查早晨前六十位到学校的学生

B.调查每十个学生中第十个进入图书馆的学生,直到调查60人为止

C.用随机数表从一年级、二年级、三年级、四年级学生中各抽15人

D.给咖啡厅的座位排序,用随机数表选择座位并调查这个学生直到调查60位学生

E.在官方名册中给学生排序,用随机数表从这份名册中选择60位学生调查

3*. Answer:E

Analysis:本题考查SRS的概念。先编号,然后使用随机数表来选择60个学生。

4*. 一家电视台的新闻编辑想知道当地的注册选民会怎样来回答这样一个问题:“在接下来的特别的选举中你赞成?”一个调查在晚间新闻的间歇进行,两个电话号码在屏幕上并排列出来。一个供支持者拨打,另外一个供反对者拨打。由于很多原因,这种调查方法会给调查结果带来偏差。下列哪一个是最明显的原因?

A.他们用了分层抽样而不是简单随机抽样

B.对这个问题比较敏感的人更可能做出回应

C.在调查之前,应当把这个问题告诉观看者

D.一些打来电话的选民可能不会再选举中投票

E.问题的表达存在偏差

4*. Answer:B

Analysis:本题考查自愿回答偏差(voluntary response bias)的问题。去回答这个问题的,一般是和这个television news editor的观点相同的人。

5*. 杰森想要确定在他的家乡年龄和性别与党派偏好之间是什么关系。选民名单按照年龄和

性别分层。杰森从20到29岁组抽取了一个样本容量为50的男性样本,并记录他们的年龄,性别以及注册党派(民主党,共和党或者都不是)。同时他也从40到49岁组抽取了一个独立的样本容量为60的女性样本,并记录相同的信息。下列选项中,关于杰森的计划哪一项是最重要的观点?

A.计划地很周密,应该服务于预期的目的

B.样本容量太小

C.他应该采用同样大小的样本容量

D.他应该随即的选择两个年龄段的人群,而不是非随机的选择

E.他将无法辨别不同的年龄段或者不同的性别是否与党派的差异有关

5*. Answer:E

Analysis:本题考查如何抽样。age和gender对political party preference都有影响,两组的age和gender都不同,所以不能区分出是age影响了political party preference还是gender影响了political party preference。

6*. 根据密歇根州现有的27,000个涉及儿童的车祸记录,研究发现,当时系了安全带的儿童(系安全带组)中大约有百分之十受伤,没系安全带的儿童(没系安全带组)中大约有百分之十五受伤。下列哪个陈述不应该作为这项研究的结论?

A.司机的驾驶行为可能是一个潜在的混淆变量

B.儿童在车里的位置可能是一个潜在的混淆变量

C.这项研究不是实验,不能得出关于因果关系的推论

D.这项研究清楚的表明安全带使儿童免于受伤

E.得出安全带使儿童免于受伤的结论是不妥的,至少要等到研究独立的复制

6*. Answer:D

Analysis:本题考查因果关系。观测研究不能找出因果关系

7*. 一个涉及22,000名男性医生的医学实验想要知道是否阿司匹林能够预防心脏病。在这项研究中,11,000名隔日吃一片阿司匹林的医生被分为一组,而控制组吃安慰剂。几年之后,可以确定,吃阿司匹林的处理组得心脏病的机会显著地低于控制组。下列哪项陈述解释了为什么不能说每个人都应该隔日吃一片阿司匹林?

I.该研究只包括医生,其他职业个人中可能出现不同的结果。

II.该研究只包括男性,女性的结果可能会不同

III.虽然服用阿司匹林可能在预防心脏病方面有帮助,但是他可能在其他的方面对健康有害

A.只有I

B.只有II

C.只有III

D.只有II和III

E.I,II,III

7*. Answer:E

Analysis:本题考查实验的控制组处理组。这个实验的对象只是males physicians,所以对其他和其他性别人不一定有相同的结论。并且吃药会有其他的影响。

8*. 一群学生有一个大的容器,装有60个家蝇,为了做一个实验需要往标记为A,B和C 的三组中各分配20只。它们可以在家蝇进入有诱饵的侧腔室中的容器中时,一次捕获一只苍蝇时。下列方法中的哪一个将是最有可能产生三个具有可比性而且每组有20只家蝇的

组?

A.抓到的前二十只标记为A组,中间20只标记为B组,后20只标记为C组

B.在每个单独的纸条上写下字母A,B和C。随机挑一个纸条,并分配捕捉到的前20只苍

蝇进入该组。拿起另一个纸条,接下来的20苍蝇分配给该组。剩余的苍蝇分配给剩下的组。

C.每抓到一个苍蝇,掷骰子。如果骰子显示一个偶数,苍蝇记为A组,如果骰子示出了奇

数,苍蝇记为B组。当20只苍蝇已被标记为A组和20只已被标记为B组,然后将剩余的苍蝇标记为C组

D.将每个苍蝇放在自己的编号的容器中(编号从1到60)。把数字1到60写在纸条上,把

纸条放到一个盒子里,拌匀。从盒子中拿出20个号码。把与这些数字对应的容器中的苍蝇放入A组。再从盒子中拿出20个数字,并分配与这些数字对应容器中的苍蝇进入B组,分配剩余的20只苍蝇入C组

E.每抓到一个苍蝇,掷骰子。如果骰子点数为1或2,则标记苍蝇为A组;如果骰子点数

为3或4,则标记苍蝇为B组;如果骰子点数为5或6,则标记苍蝇为C组。重复此过程直到取满60只苍蝇。

8*. Answer:D

Analysis:本题考查实验分组。分组要符合随机化(randomization),如何实现随机化。

9*. 检验低温对两个品牌的橡皮的弹性的影响。一个盒子装A品牌的橡皮筋,一个盒子装B 品牌的橡皮筋。10根取自A品牌盒子的橡皮筋在更冷的环境下放置两小时,同时10根取自B品牌盒子的橡皮筋存放在室温环境中。拉伸每根橡皮筋,测量断裂前的长度。用冷橡皮筋的长度均值与其他的橡皮筋的长度均值相比。这是一个好的实验设计吗?

A.不是,因为均值不是一个合适的、用来比较的统计量。

B.不是,因为应该加入更多的品牌,而不是两个。

C.不是,因为应该采用更多的温度。

D.不是,因为温度与品牌相混淆了。

E.是的

9*. Answer:D

Analysis:本题考查何为好的实验。这里测试温度对橡胶弹性的影响,但是使用两个品牌的橡胶作对比,所以temperature 和brand会confound。

10*. 一个研究人员想要测验一种新开发的治疗高血压的药。一组由40位高血压的男性和60位高血压女性组成的样本参与实验。实验者随机分配20名男性和30名女性进入安慰剂组,剩下的进入处理组。按照不同性别来设计实验的主要原因是:

A.这是一个样本容量为100的大样本实验

B.新药可能对男性和女性的作用不同

C.新药可能对高血压患者和飞高血压患者的作用不同

D.这个设计使用了配对样本来测试新药的作用

E.安慰剂组和处理组的样本容量必须一样

10*. Answer:B

Analysis:本题考查实验区集。新药的效果根据性别的不同而不同。

11*. 一家狗粮公司想要测试一种新的高蛋白的狗粮配方,以确定它是否比现有的配方更好地促进小狗的体重增长。参加实验的小狗将在断奶的时候测量体重(开始吃狗粮的时候),

并且将在一年当中每个月末称重一次。在这个实验的设计中,调查中想要见笑自然差异导致的小狗的生长率方面的差异。为了达到这个目的,下面方法当中那个是最合适的?

A.按照小狗的品种区集,在每个品种下随机分配小狗至现有的配方组和新的配方组。

B.按照地理位置区集,在每个地理位置下随机分配小狗至现有的配方组和新的配方组。

C.按照小狗的品种分层,并从每个品种的小狗中随机抽样。然后随机分配小狗至现有的配方组和新的配方组。

D.按照小狗所在的地理位置分层,并从每个地理区域中随机抽样。然后随机分配小狗至现有的配方组和新的配方组。

E.按照性别分层,并从每个性别的小狗中随机抽样。然后随机分配小狗至现有的配方组和新的配方组。

11*. Answer:A

Analysis:本题考查实验区集。小狗的成长率会因狗的品种的不同而不同。

12*. 汽车是刹车片分为金属的和非金属的。一个实验为了确定不同种类的刹车片的汽车的制动距离是否是一样的。在之前的研究中,已经发现汽车的制动距离与汽车的大小(小型,中型,大型)有关,但是与汽车的种类(轿车,旅行车,轿跑)无关。这个实验最好能够这样进行:

A.按照车的大小区集

B.按照车的种类区集

C.按照车的制动距离区集

D.按照刹车片的种类区集

E.不区集

12*. Answer:A

Analysis:本题考查实验区集。Car size会影响stoppiing distance,所以,要根据car size来block。

13*. 在设计一个实验的时候,运用区集主要是为了减少:

A.实验的敏感行

B.变异

C.随机性的需要

D.偏差

E.混淆

3*. Answer:B

Analysis:本题考查为何使用block。使用block就是为了减少变异。

14*. 一家新开的餐厅很有兴趣确定焙烧羊肉的最佳时间和温度组合。在350℉和425的℉的环境下,分别焙烤45分钟、60分钟、90分钟各一次,并且期待最佳组合为90分钟——425℉。该组合最终被淘汰,因为这样会过分焙烤羊肉剩下了五种组合。从10片相同的羊肉中,随机选择两个,在相同的炉子中,用每种时间——温度组合焙烤。并且对每一个焙烤后的成品进行评估。下面哪项是正确的?

A.解释变量是成品羊肉的质量

B.相应变量是焙烤羊肉的时间

C.如果重复的做实验,可以预料结果是相同的。

D.应该设置一个控制组(比如一个没有接受处理的组)

E.两片羊肉逐次在每个时间——温度组合下焙烤就是一个复制的例子

14*. Answer:C

Analysis:本题考查实验复制。如何根据题目里的方法再做一遍实验的话,我们期望结果是相似的。

15*. 下列哪项是实验和观测研究的主要区别?

A.实验的主体比观测研究多

B.道德的约束阻碍了大规模的观测研究

C.实验比观测研究的成本低

D.实验可以反映直接的因果关系,但是观测研究不能

E.观测研究得来的数据不能进行显著性检验

15*. Answer:D

Analysis:本题考查观察研究和实验的关键区别——因果关系。实验能为变量之间的因果关系提供良好的证据,而观测研究不可以。

16. 下列哪种情况下用分层抽样比简单随机抽样更好?

A.总体可以被分成很多层,每一层所包含的个体都比较少

B.总体可以被分成很少层,每一层所包含的个体都比较多

C.总体可以被分层,每一层当中的个体要尽可能的相像

D.总体可以被分层,每一层当中的个体要尽可能的不同

E.总体可以被分成同等大小的层,所以总体中的个体依然有相等的可能被抽中

16. Answer:C

Analysis:本题考查分层抽样和SRS的比较。SRS抽出的样本可能对总体没有好的代表性。

17. 一个样本容量为2000 人的简单随机样本中,每个人都会接受一项调查。其中317人回应了调查。不回应会给结果造成怎样的偏差?

A.不回应导致样本减少,小样本比大样本的偏差大

B.不回应违反了独立性的假设

C.难以区分不回应的人和没有收到调查问卷的人

D.没有回应的人代表了一个层,这把简单随机抽样变成了分层抽样

E.回应的人可能在很多重要的方面与不回应的人不同

17. Answer:E

Analysis:本题考查无回答误差。有可能无回答的被调查者很重要。

18.乔治和米歇尔都声称自己有更好的配方来制作巧克力饼干。他们决定进行一项研究来确定到底谁的饼干更好。他们每个人都用自己的烤箱焙烤了一批饼干。乔治用简单随机抽样的方式邀请他的朋友来品尝他的饼干,并且来完成一份调查问卷。米歇尔也用简单随机抽样的方式邀请她的朋友来品尝她的饼干,并且来完成一份相同的调查问卷。然后他们对比得到的结果。关于这项研究,下列哪项说法的错误的?

A.因为乔治和米歇尔各自的朋友的总体是不同的,所以她们的抽样方法导致了难以比较他

们的配方

B.因为乔治和米歇尔都按照他们各自的配方,他们的手艺会与配方的质量相混淆

C.因为乔治和米歇尔都在自己家中用各自的烤箱,配方的质量会与烤箱的特性相混淆

D.因为乔治和米歇尔都用相同的调查问卷,调查结果可以推广到他们的朋友的总体

E.因为乔治和米歇尔都只焙烤了一批,饼干的配方没有复制

18. Answer:D

Analysis:本题考查自发性回答。这里调查没有可比性,因为问的是各自的朋友,有自发性取向。

B. 问答题

1*. 一座公寓楼有九层,每层都有四间公寓。在更换整座楼所有的地毯之前,公寓楼的所有者想要在其中的8间公寓铺上新地毯先看看效果。

下图显示了每层楼的公寓及其编号,标有一个星号(*)的房间表示家中有小孩。

(a)为了方便起见,公寓楼的所有者想要采取整群抽样的方法,楼层表示群,要从中抽取8间公寓。请描述用这种方法随机选择8间公寓的过程。

(b)另外一种抽样方法是用分层抽样随机选择8间公寓,有小孩和没有小孩的公寓分别表示2种不同的层。这种方法抽取的样本包括两间有小孩的公寓和6间没有小孩的公寓。请说出用这种抽样方法选择8间公寓而不是整群抽样以楼层表示群的方法,在统计方面的优势。

1*. Analysis:本题考查分层抽样和整群抽样的区别

(a) 整群抽样。从1~9个数字中随机抽取两个数字,如1,2,那么第1层和第2层所有8个房间都入选样本。

(b)整群抽样和分层抽样的区别。本题考查铺地毯对儿童的影响,整群抽样有可能抽到的房间中没有儿童。例如抽到3,4两层。而分层抽样不会有这样的问题,按照有无儿童分为两层,有儿童的随机抽2个房间,没儿童的随机抽6个房间。

2*. 患有恐高症的人有时候通过参加治疗课程来帮助克服这种恐惧心理。通常情况下,经过七八个疗程才会有所改善。现进行一项研究,为了确定使用D-环丝氨酸是否在帮助克服恐高症的同时可以缩短治疗过程。

在参与研究27人中每人都可以在两个疗程之前得到一颗药丸。27人中随机分配17人拿到D-环丝氨酸的药丸,剩下的10人拿到安慰剂。两个疗程之后,27人中没有人得到额外的药丸或者治疗。三个月之后,27个人都要接受评估,以确定他(或她)的情况有没有改善。(a)这项研究是实验还是观测研究?请就你的回答给出解释。

(b)在分析数据的时候,D-环丝氨酸组与安慰几组相比有了显著的改善。在这个结果的基础上,研究者有理由认为D-环丝氨酸药丸配上两个疗程比8个疗程没有药丸更有效吗?解释你的答案。

(c)一篇报纸载文称:这项实验的结果不能解释他们是如何确定哪些是接受D-环丝氨酸的人和哪些是接受安慰剂的人。假设研究者允许治疗专家来选择谁来接受D-环丝氨酸,谁来接受安慰剂,那就没有了随机性。解释为什么这种方法可能导致得出不正

确的结论。

2*. Analysis:本题考查实验相关知识。

(a) 很明显,这是一个实验。receive a D-cycloserine pill就是treatment group。

(b) 不能。本实验只能看出服用药物与否会不会有用,不能知道服药多或少的区别。

(c) 如果允许选择安慰剂还是药物,结果就会有不同。

3. 一个社区大学认为学生的出勤率和GPA之间是有关系的。他们选择了6个修初级概率论与数理统计的班级,每个班有50名学生。

(a)应该用什么方法来确定出勤率与GPA之间的关系?

(b)这是一项什么类型的研究?能够找出因果关系吗?

(c)假设这个大学认为老师通过小组作业的方式可以提高出勤率,进而导致更高的GPA。

应该怎样检验这个假设?

(d)加入结果显示进行分组作业的班级与传统教学的班级之间在GPA方面没有显著的差异,那么能够用什么来解释这个结果?

3. Analysis:本题考查实验中的因果关系、混淆变量等。

(a) 要观察GPA的数值和attendance的数量。

(b) 这是一个观察研究(observational study),不能找出cause and effect。

(c) 可以让一半的教师group work in the class,作为treatment group;一半的教师traditional instruction,作为control group。

(d) Attendance 会和其他变量混淆,如income, illness, family responsibility, risky behavior。

第五章

1*. Lynn计划从纽约飞往洛杉矶,并且将会乘坐Airtight航空公司早晨8点起飞的航班。她预定机票的网站说航班准点抵达洛杉矶的概率是0.7。下列选项中,就如何估计出的这个概率,哪项解释是最合理的?

A.通过用天气预报的方式,她所乘坐的航班起飞的那天有30%的概率是恶劣的天气

B.通过假设飞机是如何工作的,以及所有影响飞机工作的因素所组成的等式来估算出这个

概率

C.通过以往的事实,所有的飞往加利福尼亚的航班中,70%的准时抵达的

D.通过以往的事实,美国的所有航班中,70%是准时的

E.通过以往的事实,之前所有的这个航班路线,70%的是准时的

1*. Answer:E

Analysis:本题考查概率的含义。概率实际上是一个relative frequency。

2*. 交通数据显示,在沿州际公路部分路段运行的汽车中35%的汽车超过法定限速。通过高速公路摄像机和车牌登记,还确定52%的跑车也在该公路同样的路段超速。在该路段随机选择一辆汽车是超速行驶的跑车的概率是多少?

A. 0.870

B. 0.673

C. 0.182

D. 0.170

E.给出的信息无法确定

2*. Answer:E

Analysis:本题考查计算概率的条件。这里没有交代所有的car中有多少是sports car。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学试卷及答案

统计学试卷及答案 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

统计学原理试卷1(专科) 05工商管理 一、单项选择题(每题1分,共20分) 1.下面属于品质标志的是() A、工人年龄 B、工人性别 C、工人月工资 D、工人体重 2.某工厂有100名职工,把他们的工资加总除以100,这是对100个()求平均数 A、变量 B、标志 C、变量值 D、指标 3.统计设计的核心问题是() A、搜集统计资料方法的设计 B、统计分类和分组的设计 C、统计指标和指标体系的设计 D、统计工作各个环节的具体设计 4.统计调查按组织方式的不同可以分为() A、全面调查与专门调查 B、定期调查与连续性调查 C、连续性调查与一次性调查 D、统计报表与专门调查 5.为了了解城市职工家庭的基本情况,以作为研究城市职工收入水平及生活负担的依据,需要进行一次专门调查,最为适合的调查组织形式是() A、重点调查 B、典型调查 C、抽样调查 D、普查 6.非全面调查中最完善、最有科学根据的方式方法是() A、重点调查 B、典型调查 C、抽样调查 D、非全面报表 7.某工业企业产品年生产量为10万件,期末库存量为万件,它们()。 A、是时期指标 B、是时点指标 C、前者是时期指标,后者是时点指标 D、前者是时点指标,后者是时期指标 8.加权算术平均数的大小()。 A、受各组次数的影响最大 B、受各组标志值的影响最大 C、受各组标志值和次数的共同影响 D、不受各组次数的影响 9.时间数列中所排列的指标数值()。 A、只能是绝对数 B、只能是相对数 C、只能是平均数 D、可以是绝对数,也可以是相对数或平均数 10.发展速度与增长速度的关系是()。 A、环比增长速度等于定基发展速度-1 B、环比增长速度等于环比发展速度-1 C、定基增长速度的连乘积等于定基发展速度 D、环比增长速度的连乘积等于环比发展速度 11.抽样调查的目的在于()。 A、了解总体的基本情况 B、用样本指标推断总体指标 C、对样本进行全面调查 D、了解样本的基本情况 12.当一个现象的数量由小变大,而另一个现象的数量相反地由大变小时,这种相关关系称为 ()。 A、线性相关 B、非线性相关 C、正相关 D、负相关

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案(卷二) 一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类,其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于( )。 7.统计调查从调查范围上分,可分为( )和( )。 8.统计调查按调查登记时间是否连续,可分为( )和( )。 9.统计调查从调查目的上,可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料,属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式,下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件,重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中,选择其中的重点单位进行调查。 5.应用( )方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案 一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。() 2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 1)表明同类统计事项指标的对比关系; (2)揭示总体内部的结构; (3)反映统计事项的发展动态; (4)分析统计事项之间的依存关系; (5)说明总体单位的分配; (6)检查计划的执行情况; (7)观察统计事项在地域上的分布。 3.简述相关的含义及种类。 答:相关就是指事物或现象之间的相互关系。

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

相关文档
最新文档