社会统计学习题相关与回归分析

第十二章相关与回归分析

第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关

双变量交互分类（列联表）·削减误差比例（PRE ）·λ系数与τ系数第三节定序变量的相关分析

同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数（τa 系数、τb

与τc 系数）·萨默斯系数（d 系数）·斯皮尔曼等级相关（ρ相关）·肯德尔和谐系数

第四节定距变量的相关分析

相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析

线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归

可线性化的非线性函数·实例分析（二次曲线指数曲线）

一、填空

1．对于表现为因果关系的相关关系来说，自变量一般都是确定性变量，依变量则一般是（随机性）变量。

2．变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的全部误差E 1，减去知道Y 与X 有关系时预测Y 的联系误差E 2，再将其化为比例来度量，这就是（削减误差比例）。

3．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y 围绕每个估计值c Y 是服从（）；（2）分布中围绕每个可能的c Y 值的（）是相同的。

4．在数量上表现为现象依存关系的两个变量，通常称为自变量和因变量。自变量是作为（变化根据）的变量，因变量是随（自变量）的变化而发生相应变化的变量。

5．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）。

6．积差系数r 是（协方差）与X 和Y 的标准差的乘积之比。

二、单项选择

1．当x 按一定数额增加时，y 也近似地按一定数额随之增加，那么可以说x 与y 之间存在（ A ）关系。

A 直线正相关

B 直线负相关

C 曲线正相关

D 曲线负相关 2．评价直线相关关系的密切程度，当r 在0.5～0.8之间时，表示（ C ）。

A 无相关

B 低度相关

C 中等相关

D 高度相关

3．相关分析和回归分析相辅相成，又各有特点，下面正确的描述有（ D ）。

A在相关分析中，相关的两变量都不是随机的；

B在回归分析中，自变量是随机的，因变量不是随机的；

C在回归分析中，因变量和自变量都是随机的；

D在相关分析中，相关的两变量都是随机的。

4．关于相关系数，下面不正确的描述是（ B ）。

≤r1时，表示两变量不完全相关；

A当0≤

B当r=0时，表示两变量间无相关；

C两变量之间的相关关系是单相关；

D如果自变量增长引起因变量的相应增长，就形成正相关关系。

5．欲以图形显示两变量X和Y的关系，最好创建（ D ）。

A 直方图

B 圆形图

C 柱形图

D 散点图

6．两变量X和Y的相关系数为0.8，则其回归直线的判定系数为（ C ）。

A 0.50

B 0.80

C 0.64

D 0.90

7．在完成了构造与评价一个回归模型后，我们可以（ D ）。

A 估计未来所需样本的容量

B 计算相关系数和判定系数

C 以给定的因变量的值估计自变量的值

D 以给定的自变量的值估计因变量的值

8．两变量的线性相关系数为0，表明两变量之间（ D ）。

A 完全相关

B 无关系

C 不完全相关

D 不存在线性相关

9．身高和体重之间的关系是（ C ）。

A 函数关系

B 无关系

C 共变关系

D 严格的依存关系

10．在相关分析中，对两个变量的要求是（ A ）。

A 都是随机变量

B 都不是随机变量

C 其中一个是随机变量，一个是常数

D 都是常数

11．在回归分析中，两个变量（ D ）。

A 都是随机变量

B 都不是随机变量

C 自变量是随机变量

D 因变量是随机变量

12．一元线性回归模型和多元线性回归模型的区别在于只有一个（ B ）。

A 因变量

B 自变量

C 相关系数

D 判定系数

13．以下指标恒为正的是（ D ）。

A 相关系数r

B 截距a

C 斜率b

D 复相关系数

14．下列关系中，属于正相关关系得是（ A ）。

A 身高与体重

B 产品与单位成本

C 正常商品的价格和需求量

D 商品的零售额和流通费率

三、多项选择

1．关于积差系数，下面正确的说法是（ABCD ）。

A 积差系数是线性相关系数

B 积差系数具有PRE性质

C 在积差系数的计算公式中，变量X和Y是对等关系

D 在积差系数的计算公式中，变量X和Y都是随机的2．关于皮尔逊相关系数，下面正确的说法是（）。

A 皮尔逊相关系数是线性相关系数

B 积差系数能够解释两变量间的因果关系

C r公式中的两个变量都是随机的

D r的取值在1和0之间

E 皮尔逊相关系数具有PRE性质，但这要通过r2加以反映3．简单线性回归分析的特点是（ABE ）。

A 两个变量之间不是对等关系

B 回归系数有正负号

C 两个变量都是随机的

D 利用一个回归方程，两个变量可以互相推算

E 有可能求出两个回归方程

4．反映某一线性回归方程y=a+bx好坏的指标有（ABD ）。

A 相关系数

B 判定系数

C b的大小

D 估计标准误

E a的大小5．模拟回归方程进行分析适用于（ACDE ）。

A 变量之间存在一定程度的相关系数

B 不存在任何关系的几个变量之间

C 变量之间存在线性相关

D 变量之间存在曲线相关

E 时间序列变量和时间之间

6．判定系数r2=80%和含义如下（ABC ）。

A 自变量和因变量之间的相关关系的密切程度

B 因变量y的总变化中有80%可以由回归直线来解释和说明

C 总偏差中有80%可以由回归偏差来解释

D 相关系数一定为0.64

E 判定系数和相关系数无关

7．回归分析和相关分析的关系是（ABE ）。

A 回归分析可用于估计和预测

B 相关分析是研究变量之间的相互依存关系的密切程度

C 回归分析中自变量和因变量可以互相推导并进行预测

D 相关分析需区分自变量和因变量

E 相关分析是回归分析的基础

8．以下指标恒为正的是（BC ）。

A 相关系数

B 判定系数

C 复相关系数

D 偏相关系数

E 回归方程的斜率

9．一元线性回归分析中的回归系数b可以表示为（BC）

A 两个变量之间相关关系的密切程度

B 两个变量之间相关关系的方向

C 当自变量增减一个单位时，因变量平均增减的量

D 当因变量增减一个单位时，自变量平均增减的量

E 回归模型的拟合优度

10．关于回归系数b ，下面正确的说法是（）。 A b 也可以反映X 和Y 之间的关系强度。； B 回归系数不解释两变量间的因果关系； C b 公式中的两个变量都是随机的；

D b 的取值在1和-1之间；

E b 也有正负之分。

四、名词解释

1．消减误差比例

变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的误差0E ，减去知道Y 与X 有关系时预测Y 的误差1E ，再将其化为比例来度量。将削减误差比例记为PRE 。 2．确定性关系

当一个变量值确定后，另一个变量值夜完全确定了。确定性关系往往表现成函数形式。 3．非确定性关系

在非确定性关系中，给定了一个变量值，另一个变量值还可以在一定范围内变化。 4．因果关系

变量之间的关系满足三个条件，才能断定是因果关系。1）连个变量有共变关系，即一个变量的变化会伴随着另一个变量的变化；2）两个变量之间的关系不是由其他因素形成的，即因变量的变化是由自变量的变化引起的；3）两个变量的产生和变化有明确的时间顺序，即一个在前，另一个在后，前者称为自变量，后者称为因变量。 5．单相关和复相关

单相关只涉及到两个变量，所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关，又称多元相关。 6．正相关与负相关

正相关与负相关：正相关是指一个变量的值增加时，另一变量的值也增加；负相关是指一个变量的值增加时，另一变量的值却减少。 7．散点图

散点图：将相关表所示的各个有对应关系的数据在直角坐标系上画出来，以直观地观察X 与Y 的相互关系，即得相关图，又称散点图。 8．皮尔逊相关系数r

皮尔逊相关系数是协方差与两个随机变量X 、Y 的标准差乘积的比率。 9．同序对

在观察X 序列时，如果看到i j X X <，在Y 中看到的是i j Y Y <，则称这一配对是同序对。

10．异序对

在观察X 序列时，如果看到i j X X <，在Y 中看到的是i j Y >Y ，则称这一配对是异序对。

11．同分对

如果在X 序列中，我们观察到i j X =X （此时Y 序列中无i j Y =Y ），则这个配对仅是X 方向而非Y 方向的同分对；如果在Y 序列中，我们观察到i j

Y =Y （此时X 序列中无i j X =X ），则这个配对仅是Y 方向而非X 方向的同分对；我们观察到i j X =X ，也观察到i j Y =Y ，则称这个配对为X 与Y 同分对。

五、判断题

1．由于削减误差比例的概念不涉及变量的测量层次，因此它的优点很明显，用它来定义相关程度可适用于变量的各测量层次。（√）

2．不管相关关系表现形式如何，当r＝1时，变量X和变量Y都是完全相关。（√）3．不管相关关系表现形式如何，当r＝0时，变量X和变量Y都是完全不相关。（×）

4．通过列联表研究定类变量之间的关联性，这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话，必然存在着Y的相对频数条件分布相同，且和它的相对频数边际分布相同。（×）5．如果众数频数集中在条件频数分布列联表的同一行中，系数便会等于0，从而无法显示两变量之间的相关性。（√）6．从分析层次上讲，相关分析更深刻一些。因为相关分析具有推理的性质，而回归分析从本质上讲只是对客观事物的一种描述，知其然而不知其所以然。（×）

六、计算题

1．对某市市民按老中青进行喜欢民族音乐情况的调查，样本容量为200人，调查结果示于下表，试把该频数列联表：①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表；③指出对于民族音乐的态度与被调查者的年岁有无关系，并说明理由。

2．已知十名学生身高和体重资料如下表，（1）根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数；（2）根据下述资料求出两变量之间的回归方程（设身高为自

【皮尔逊相关系数：0.889，斯皮尔曼相关系数：0.94，回归方程：Y=-54.48+0.66X】

3．假定有不同文化程度的35～45岁育龄妇女100人的生育情况如下表，求文化程度与平均生育数的相关系数r。

4．某市有12所大专院校，现组织一个评审委员会对各校校园及学生体质进行评价，结果如下，试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。

【斯皮尔曼相关系数：0.94，肯德尔等级相关系数：0.83】

5．以下是婚姻美满与文化程度的抽样调查的结果，请计算婚姻美满与文化程度之Gamma 【τc =0.18】

6．以下为两位评判员对

10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。

【斯皮尔曼相关系数：0.95】

要求：（1）求回归方程；（2）这是正相关还是负相关；（3）求估计标准误差；

（4）用积差法求相关系数。【Y=-11.48+0.27X 】【正相关】【相关系数r=0.95】

（1）求回归方程；（2）求相关系数。【Y=-0.957X+14.867】【r=0.98】

9．试就下表所示资料，计算关于身高和体重的皮尔逊相关系数。

【r=0.77】

10．青年歌手大奖赛评委会对10名决赛选手的演唱水平（X ）和综合素质（Y ）进行打分，评价结果如下表（表中已先将选手按演唱水平作了次序排列）所示，试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。【肯德尔系数：0.56，斯皮尔曼系数：0.76】

11．青年歌手大奖赛，假设五位评委对10名决赛选手的演唱水平进行排序，他们的有关评价结果列于下表，试通过计算肯德尔和谐系数，检验专家意见的一致性和相关程度。

【0.76】

12．某地区失业率与通货膨胀率之间的资料如下表所示，试求：（1）拟合指数回归方程

c Y ＝x ab ；（2）失业率与通货膨胀率之间的相关系数。

【()

e y 1803.0717.1-=】【相关系数0.76】

13．试就下表所示资料，求算员工工作满足感高与归属感之Gamma 系数，并解释Gamma 系数具有削减误差比例PRE 性质。

工作满足感与归属感

【G=0.092】

14．已知相关系数r ＝0.6，估计标准误差X

Y S ＝8，样本容量为62。求：

1）剩余变差值；

2）剩余变差占总变差的百分比； 3）求总变差值。

15．在相关和回归分析中，已知下列资料：2

X S ＝16，2

Y S ＝25，2

XY S ＝－19，a ＝30。要求：1）计算相关系数r ，说明相关程度；2）求出直线回归方程。

16．在相关和回归分析中，已知下列有关资料：X S ＝5，Y S ＝10，n ＝20，r ＝0.9，

)(∑-Y Y ＝2000。试计算：

1）回归系数b ；

2）回归变差和剩余变差； 3）估计标准误差X

Y S 。

17．根据下述假设资料求回归方程。 X 1 2 3 4 5 6 7 Y 23.0

23.4

24.1

25.2

26.1

26.9

27.3

要求：1）写出最小平方法计算的回归直线方程；

2）在95.46％把握下，当X＝45时，写出Y的预测区间。

19．根据下述假设资料，试用积差法求相关系数。

输出X（亿元）12 10 6 16 8 9 10

输出Y（亿元）12 8 6 11 10 8 11

20．对40个企业的横截面样本数据进行一元回归分析，因变量与其平均数的离差平方和为6000，而回归直线拟合的剩余变差为2000，求：

1）变量间的相关指数R；

2）该方程的估计标准误差。

七、问答题

1．简述积差系数的特性。

2．简述回归分析和相关分析之间的密切联系。

部分计算参考：（见计算题六）

2. 已知十名学生身高和体重资料如下表，（1）根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数；（2）根据下述资料求出两变量之间的回归方程（设身高为自变量，体重为因变量）。

皮尔逊相关系数与回归方程编号身高（cm ）x 体重（kg ）y

1 171 53 29241

2809 9063

2 167 56 27889 3136 9352

3 177 6

4 31329 4096 11328 4 154 49 23716 2401 7546

5 169 55 28561 3025 9295

6 175 66 30625 4356 11550

7 163 52 26569 2704 8476

8 152 47 23104 220

9 7144 9 172 58 29584 3364 9976 10 162 50 26244 2500 8100 合计 1662 550 276862 30600 91830

n xy x y r 0.89-=

n xy x y b 0.659

n x (x)y x a=b 54.479n n

y=a+bx=-54.479+0.659x

=--=-∑∑∑∑∑∑∑

斯皮尔曼相关系数编号身高（cm ）

次序

体重（kg ）次序 d

1 171 4 53 6 -

2 4 2 167 6 56 4 2 4

3 177 1 6

4 2 -1 1 4 154 9 49 9 0 0

5 169 5 55 5 0 0

6 175 2 66 1 1 1

7 163 7 52 7 0 0

8 152 10 47 10 0 0

9 172 3 58 3 0 0 10 162

8 0

0 合计

2s 2

6d r 1-0.94n(n -1)

==∑

4. 某市有12所大专院校，现组织一个评审委员会对各校校园及学生体质进行评价，结果如下，试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。

斯皮尔曼等级相关系数

环境名次体质名

次

3 5 -2

4 9 9 0 0 7 6 1 1

5 7 -2 4 12 12 0 0 8 8 0 0 10 11 -1 1 2 1 1 1 11 10 1 1 4 3 1 1 1 2 -1 1

6 4

合计

2s 26d r 1-

0.94n(n -1)

==∑

肯德尔等级相关系数

1） A ：同序对 AC AB AD AE AF AG AH AI AK 9 异序对 AJ AL 2 2） B ：同序对 BC BD BG BH BI BJ BK BL BE BF 10

3） C ：同序对 CE CF CG CH CI CJ CK CL 8 异序对CD 1 4 D ：同序对 DE DF DG DH DI DJ DK 7 异序对 DL 1 5） E ：同序对 EG EH EI EJ EK EL EF 7 6） F ：同序对 FG FH FI FJ FK FL 6

7） G ：同序对 GH GJ GK GL 4 异序对GI 1 8） H ：同序对 HI HJ HK HL 4 9） I ：

同序对 IJ IK IL 3 10）J ：同序对 JK JL 2 11）K ：同序对 KL 1

合计：同序对s n 61= 异序对d n 5=

s d

a n n 0.831

n(n 1)2

τ-=

5. 以下是婚姻美满与文化程度的抽样调查的结果，请计算婚姻美满与文化程度 Gamma 系数和肯德尔相关系数τc 。

s n =9×（30+18+4+7）+16×（18+7）+8×(4+7)+30×7=1229

d n =5×(30+8+3+4)+18×(3+4)+16×(8+3)+30×3=617

[]s d

c 2

n n 1n (m 1)/m 2

τ-=

=-0.18

6．以下试两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述

参赛人评审员1 评审员2

d A 1 1 0 0 B 2 2 0 0 C 4 3 1 1 D 3 4 -1 1 E 5 5 0 0 F 8 6 2 4 G 6 7 -1 1 H 7 8 -1 1 I 9 9 0 0 J 10 10

0 合计

2s 2

6d r 1-

0.95n(n -1)

==∑

要求：（1

）求回归方程；

（2）这是正相关还是负相关；【正相关】（3）求估计标准误差；（4）用积差法求相关系数。

X Y

xy 65

5 4225 25 325 73 7 5329 49 511 91 13 8281 169 1183 88 13.5 7744 182.25

1188 76 7 5776 49 532 53 4.5 2809 20.25 238.5 96 15 9216 225 1440 67 6.7 4489 44.89 448.9 82 10 6724 100 820 85

7225

121

935

776 92.7 61818 985.39 7621.4

n xy x y r 0.95

n xy x y b 0.267

n x (x)y x a=

b 11.477

n n

y=a+bx=-11.477+0.267x

-==-==--=-∑∑∑∑∑∑∑

17．根据下述假设资料求回归方程。 X 1 2 3 4 5 6

Y 23.0 23.4

24.1

25.2

26.1

26.9 27.3

编号 x

1 1 23.0 1 529 23

2 2 23.4 4 547.56 46.8

3 3 24.1 9 580.81 72.3

4 4 25.2 16 635.04 100.8

5 5 26.1 25 681.21 130.5

6 6 26.9 36 723.61 161.4

7 7 27.3 49 745.29 191.1 合计

176.0

140

4442.52

725.9

0.992832

22.0143

0.782143

n xy x y b 0.782n x (x)

y x a=

b 22.014

n n

y=a+bx=22.014+0.782x

-==--=∑∑∑∑∑∑∑

要求：1）写出最小平方法计算的回归直线方程；

2）在95.46％把握下，当X ＝45时，写出Y 的预测区间。

收入（X ）支出（Y ）

xy 20 7 400 49 140 30 9 900 81 270 33 8 1089 64 264 40 11 1600 121 440 15 5 225 25 75 13 4 169 16 52 26 8 676 64 208 38 10 1444 100 380 24 9 576 81 216 43 10 1849 100 430

282

8928

701

2475

n xy x y b 0.196

n x (x)

y x a=

b 2.585

n n

y=a+bx=2.585+0.196x

-==--=∑∑∑∑∑∑∑

19．根据下述假设资料，试用积差法求相关系数。

输出X （亿元）

10 6 16 8 9

输出Y （亿元） 12

8 11 输出 x （亿元）输出 y （亿元

xy 12 12 144

144 144 10 8 100 64 80 6 6 36 36 36 16 11 256 121 176 8 10 64 100 80 9 8 81 64 72 10

100

121

110

n xy x y r 0.70-=

26、回归分析测试题及答案

中级经济师基础知识第 1题：单选题(本题1分) 某公司产品当产量为1000单位时，其总成本为4000元；当产量为2000单位时，其总成本为5000，则设产量为x，总成本为y，正确的一元回归方程表达式应该是（）。 A、y = 3000 + x B、y = 4000 + 4x C、y = 4000 + x D、y = 3000 + 4x 【正确答案】：A 【答案解析】：本题可列方程组：设该方程为y = a + bx，则由题意可得：4000 = a + 1000b5000 = a + 2000b 解该方程，得b=1，a=3000，所以方程为y = 3000 + x 第 2题：单选题(本题1分) 在回归分析中，估计回归系数的最小二乘法的原理是（）。 A、使得因变量观测值与均值之间的离差平方和最小 B、使得因变量估计值与均值之间的离差平方和最小 C、使得观测值与估计值之间的乘积和最小 D、使得因变量观测值与估计值之间的离差平方和最小【正确答案】：D 【答案解析】：较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法第 3题：多选题(本题2分) 关于相关分析和回归分析的说法，正确的的有（） A、相关分析可以从一个变量的变化来推测另一个变量的变化 B、相关分析研究变量间相关的方向和相关的程度 C、相关分析中需要明确自变量和因变量 D、回归分析研究变量间相互关系的具体形式 E、相关分析和回归分析在研究方法和研究目的有明显区别【正确答案】：BDE 【答案解析】：相关分析与回归分析在研究目的和方法上具有明显的区别。（1）、相关分析研究变量之间相关的方向和相关的程度，无法从一个变量的变化来推测另一变量的变化情况。（2）、回归分析是研究变量之间相关关系的具体形式

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷（A卷）一、单项选择题（请将正确选项的序号填在答题纸相应的位置。） 1．社会统计中的变量一般分四个层次，其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2．标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3．计算中位值时，对于未分组资料，先把原始资料按大小顺序排列成数列，然后用公式 D 确定中位值所在位置。 A、n/2 B、（n-1）/2 C、（n+2）/2 D、（n+1）/2 4．下列统计指标中，对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5．如果原假设是总体参数不小于某一数值，即大于和等于某一数值，应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6．在一个右偏的分布中，大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7．下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8．假定男性总是与比自己年轻3岁的女性结婚，那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9．“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10．某校期末考试，全校语文平均成绩为80分，标准差为4.5分，数学平均成绩为87分，标准差为9.5分。某学生语文得了83分，数学得了92分，从相对名次的角度看，该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断三、判断题(请在答题纸相应位置打√或?。） 1．无论分布曲线是正偏还是负偏，中位值都居于均值和众值之间。 2．一组数据的均值代表了该组数据中大多数的数据。 3．对于连续型随机变量，讨论某一点取值的概率是没有意义的。 4．异众比率越大，各变量值相对于众值越离散，众值的代表性越好。 5．只要样本量足够大，则不论总体分布如何，样本均值的抽样分布都服从正态分布。 6．检验均值差异时，独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7．在显著性水平既定的情况下，一端检验比两端检验更容易拒绝H0。 8．不管相关关系表现形式如何，当r＝1时，变量X和变量Y都是完全相关；当r＝0时，变量X 和变量Y都是完全不相关。 9．方差分析就其内容来说，是分析或检验总体间的均值是否存在差异。 10．纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学作业一.

社会统计学作业一特别提示：1、作业提交截至时间：2005年10月11日中午12点； 2、不接收电子版，答案要求手填。一、某城市有人口211732人，去年发生了47次银行抢劫案，13次谋杀案，23次汽车偷窃案，分别计算每10万人口中这三类案件的犯罪率。二、

上面是社会学系某年级学生的总评学分绩点，按照这个原始数据，作出四个完整的分布统计表：（1）不分组的频次统计表；（2）利用计算法确定组距画出分组的频次统计表；（3）利用经验法分组的频次统计表，包括标示组限、频次、相对频次，频率，cf↑，cf↓，c％↑，c％↓；（4）利用经验法分组的频次统计表，包括每组的标示上下组限，真实上下组限，组距，组中值和频次。三、下面的统计表有哪些问题，指出来。并画一个完整的频次和频率统计表，在表中把真实组限、组距和组中值都列上。某厂工人的月收入分布四、下面的图是一个直方图，表示了在药物研究项目中所有14148位妇女的血压分布。使用直方图回答下列问题：

a) 血压在130mm 以上的妇女的百分数大约是25％，50％，还是75％？ b) 血压在90mm 与160mm 之间的妇女的百分数大约是1％，50％，还是99％？ c) 在哪个区间有较多妇女：135-140mm 还是140-150mm ？ d) 哪个区间更拥挤一些：是135—140mm 还是140—150mm ？ e) 在区间125—130mm 内，直方图的高大约为每mm2.1％。多少百分数的妇女具有这个小组区间里的血压？ f) 哪个区间有较多妇女：是97－98mm ，还是102—103mm ？ g) 所有的毫米中，哪里最拥挤？五、三个人使用密度尺度对一项研究中的实验对象的体重绘制了直方图。只有一个人是正确的。是哪一个，为什么？ (1) 100 150 200 (2) (3) 100 150 200 100 150 200 六、下面给出非全日雇员月工资的直方图。没有人一个月挣1000美元以上。200 至500美元的小组区间上的块形不见了，它必定有多高？每 mm 的百分数 0 1 2 3 4 90 100 110 120 130 140 150 160 血压（mm ）

概率与数理统计典型例题

《概率与数理统计》第一章随机事件与概率典型例题一、利用概率的性质、事件间的关系和运算律进行求解 1.设,,A B C 为三个事件，且()0.9,()0.97P A B P A B C ==U U U ，则()________.P AB C -= 2.设,A B 为两个任意事件，证明：1|()()()|.4 P AB P A P B -≤ 二、古典概型与几何概型的概率计算 1.袋中有a 个红球，b 个白球，现从袋中每次任取一球，取后不放回，试求第k 次取到红球的概率.（a a b +） 2.从数字1,2,,9L 中可重复地任取n 次，试求所取的n 个数的乘积能被10整除的概率.（58419n n n n +--） 3.50只铆钉随机地取来用在10个部件上，其中有3个铆钉强度太弱，每个部件用3只铆钉，若将3只强度太弱的铆钉都装在一个部件上，则这个部件强度就太弱，从而成为不合格品，试求10个部件都是合格品的概率.（19591960 ） 4.掷n 颗骰子，求出现最大的点数为5的概率. 5.（配对问题）某人写了n 封信给不同的n 个人，并在n 个信封上写好了各人的地址，现在每个信封里随意地塞进一封信，试求至少有一封信放对了信封的概率. （01(1)! n k k k =-∑）

6.在线段AD上任取两点,B C，在,B C处折断而得三条线段，求“这三条线段能构成三角形”的概率.（0.25） 7.从(0,1)中任取两个数，试求这两个数之和小于1，且其积小于 3 16 的概率. （13 ln3 416 +）三、事件独立性 1.设事件A与B独立，且两个事件仅发生一个的概率都是 3 16 ，试求() P A. 2.甲、乙两人轮流投篮，甲先投，且甲每轮只投一次，而乙每轮可投两次，先投中者为胜.已知甲、乙每次投篮的命中率分别为p和1 3 .（1）求甲取胜的概率；（2）p求何值时，甲、乙两人的胜负概率相同？（ 95 ; 5414 p p p = + ）四、条件概率与积事件概率的计算 1.已知10件产品中有2件次品，现从中取产品两次，每次取一件，去后不放回，求下列事件的概率：（1）两次均取到正品；（2）在第一次取到正品的条件下第二次取到正品；（3）第二次取到正品；（4）两次中恰有一次取到正品；（5）两次中至少有一次取到正品.（28741644 ;;;; 45954545 ） 2.某人忘记了电话号码的最后一个数字，因而他随意地拨号，假设拨过了的数字不再重复，试求下列事件的概率：（1）拨号不超过3次而接通电话；（2）第3次拨号才接通电话.（0.3；0.1）五、全概率公式和贝叶斯公式概型 1.假设有两箱同种零件：第一箱内装50件，其中10件为一等品；第二箱内装30件，其中18件为一等品，现从两箱中随意挑选出一箱，然后从该箱中先后随机取出两个零件（取出的零件均不放回），试求：（1）先取出的零件是一等品的概率；（2）在先取出的零件是一等品的条件下，第二次取出的零件仍然是一等品的概率.（2690 ; 51421 ） 2.有100个零件，其中90个一等品，10个二等品，随机地取2个,安装在一台设备上，若2个零件中有i个（0,1,2 i=）二等品，则该设备的使用寿命服从参

应用回归分析,第8章课后习题参考答案

第8章非线性回归思考与练习参考答案 8.1 在非线性回归线性化时，对因变量作变换应注意什么问题？答：在对非线性回归模型线性化时，对因变量作变换时不仅要注意回归函数的形式，还要注意误差项的形式。如： (1) 乘性误差项，模型形式为 e y AK L αβε =， (2) 加性误差项，模型形式为y AK L αβ ε = + 对乘法误差项模型（1）可通过两边取对数转化成线性模型，（2）不能线性化。一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式，为了方便通常省去误差项，仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系，记录了如表8.15所示的数据，请画出散点图，根据散点图的趋势拟合适当的回归模型。表8.15 生产率x （单位/周） 1000 2000 3000 3500 4000 4500 5000 废品率y （%） 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解：先画出散点图如下图： 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线，由此采用二次方程式和指数函数进行曲线回归。（1）二次曲线 SPSS 输出结果如下： Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为：72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05，得到x 的系数未通过显著性检验。由x 2的系数检验P 值小于0.05，得到x 2的系数通过了显著性检验。（2）指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型：一、填空题（10×1分＝10分）二、判断题（10×1分＝10分）三、单项选择题（20×1分＝20分）四、简答题（2×6分＝12分）五、计算题（4题共48分） ·各章复习要点第一章总论 P.2 统计的含义：统计工作·统计资料·统计学。其中：统计工作和统计资料是活动过程和成果的关系；统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义，并且具有密切的联系。其中：统计工作和统计资料之间是工作与成果的关系；统计学和统计工作之间是理论和实践的关系。（y ） P.11—P.13 定类尺度；定序尺度；定距尺度；定比尺度（结合课件相关内容）量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度？两者有何区别？1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低，大小，好坏，强弱，优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。何谓定距尺度和定比尺度？两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度缺乏绝对零点---有，0 2. 0只表示一个值，即0值---0是绝对零点，表示没有 3.只能加减，不能乘除---加减乘除，高层次的各种统计分析。 P.13—P.14 总体和总体单位一、总体和总体单位（一）总体 1、概念总体（也称为统计总体）是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体（同质个体的集团）。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外，还必须具备1、差异性（或变异性）性，否则

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案（卷二）一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理，可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程，凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求，在对所研究对象进行初步全面分析的基础上，从中选择有代表性的单位，做周密细致的调查。 4.( )误差，是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差，是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类，其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查，这种调查方式属于( )。 7.统计调查从调查范围上分，可分为( )和( )。 8.统计调查按调查登记时间是否连续，可分为( )和( )。 9.统计调查从调查目的上，可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下，用样本指标代表总体指标不可避免存在的误差，它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组，然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料，属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式，下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件，重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中，选择其中的重点单位进行调查。 5.应用( )方式抽取样本时，必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

数理统计复习题第五章

第五章大数定律与中心极限定理一、典型题解例1设随机变量X 的数学期望()(){}2,3E X u D X X u σσ==-≥方差，求P 的大小区间。解令3εσ=，则有切比雪夫不等式有： ()() ()22 221 ,339D X P X E X P X E X σεσεσ????-≥≤ -≥≤=????有例2在n 次独立试验中，设事件A 在第i 次试验中发生的概率为()1,2,....i p i n = 试证明：A 发生的频率稳定于概率的平均值。证设X 表示n 次试验中A 发生的次数，引入新的随机变量0i A X A ?=??1,发生? ，不发生 ()12,...i n =，，则X 服从()01-分布，故 ()()(),1i i i i i i i E X p D X p p p q ==-=，又因为 () ()2 2 4140i i i i i i i i p q p q p q p q -=+-=-≥，所以 ()()1 1,2, (4) i i i D X p q i n =≤ = 由切比雪夫大数定理，对,o ε?>有()11lim 1n i i n i p X E X n ε→∞ =?? -<=???????? ∑ 即 11lim 1n i n i X p p n n ε→∞ =?? -<=???? ∑ 例 3 对于一个学生而言，来参加家长会的家长人数是一个随机变量，设一个学生无家长，1名家长、2名家长来参加会议的概率分别为。若学校共有400名学生，设各学生参加会议的家长数相互独立，且服从同一分布。（1）求参加会议的家长数X 超过450的概率；（2）求有1名家长来参加会议的学生数不多于340的概率。解（1）以()400,,2,1 =k X k 记第k 个学生来参加会议的家长数，则k X 的分布律为 k X 0 1 2 k P 0.05 0.8 0.15

回归分析练习试题和参考答案解析

1 下面是7个地区2000年的人均国内生产总值（GDP）和人均消费水平的统计数据：求：(1)人均GDP作自变量，人均消费水平作因变量，绘制散点图，并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数，说明两个变量之间的关系强度。 (3)求出估计的回归方程，并解释回归系数的实际意义。 (4)计算判定系数，并解释其意义。 α=)。 (5)检验回归方程线性关系的显著性(0.05 (6)如果某地区的人均GDP为5000元，预测其人均消费水平。 (7)求人均GDP为5000元时，人均消费水平95％的置信区间和预测区间。解：（1）

可能存在线性关系。（2）相关系数：系数a 模型非标准化系数标准系数 t Sig. 相关性 B标准误差试用版零阶偏部分 1(常量).003 人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平有很强的线性关系。（3）回归方程：734.6930.309 y x =+ 系数a 模型非标准化系数标准系数t Sig.相关性

回归系数的含义：人均GDP没增加1元，人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意：图标不要原封不动的完全复制软件中的图标，要按规范排版。系数(a) 模型非标准化系数标准化系数 t显著性B标准误Beta 1（常量）人均GDP（元） %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%（4）模型汇总模型R R 方调整 R 方标准估计的误差 1.998a.996.996 a. 预测变量: (常量), 人均GDP。人均GDP对人均消费的影响达到%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意：图标不要原封不动的完全复制软件中的图标，要按规范排版。模型摘要模型R R 方调整的 R 方估计的标准差

2014年秋社会统计学期末复习训练题

2014年秋社会统计学期末复习训练题一、单项选择题 1．某地区政府想了解全市332.1万户家庭年均收入水平，从中抽取3000户家庭进行调查，以推断所有家庭的年均收入水平。这项研究的总体是（） A．332.1万户家庭B．3000户家庭 C．332.1户家庭的年均收入D．3000户家庭的年均收入 2．在频数分布表中，将各个有序类别或组的百分比逐级累加起来称为（）A．频率B．累积频数C．累积频率D．比率 3．离散系数的主要目的是（） A．反映一组数据的平均水平B．比较多组数据的平均水平 C．反映一组数据的离散程度D．比较多组数据的离散程度 4．经验法则表明，当一组数据正态分布时，在平均数加减2个标准差的范围之内大约有( ) A．50%的数据B．68%的数据C．95%的数据D．99%的数据 5．在某市随机抽取10家企业，7月份利润额（单位：万元）分别为72.0、63.1、20.0、23.0、54.7、 54.3、23.9、25.0、26.9、29.0，那么这10家企业7月份利润额均值为（） A．39.19B．28.90C．19.54D．27.95 6．用样本统计量的值直接作为总体参数的估计值，这种方法称为（） A．点估计B．区间估计C．有效估计D．无偏估计 7．在频数分布表中，比率是指（） A．各组频数与上一组频数之比B．各组频数与下一组频数之比 C．各组频数与总频数之比D．不同小组的频数之比 8．下面哪一项不是方差分析中的假定（） A．每个总体都服从正态分布B．观察值是相互独立的 C．各总体的方差相等D．各总体的方差等于0 9．判断下列哪一个不可能是相关系数（） A．-0.9B．0C．0.5D．1.2 10．用于说明回归方程中拟合优度的统计量主要是（） A．相关系数B．离散系数C．回归系数D．判定系数 11．在假设检验中，不拒绝虚无假设意味着（） A．虚无假设是肯定正确的B．虚无假设肯定是错误的 C．没有证据证明虚无假设是正确的D．没有证据证明虚无假设是错误的

数理统计复习题第八章

第七章假设检验三、典型题解例1：某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.498 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 解: 根据样本值判断5.05.0≠=μμ还是.提出两个对立假设 0100:5.0:μμμμ≠==H H 和选择统计量：)1,0(~/0 N n X Z σμ-= 取定0.05a =，则/20.025 1.96,z z a ==又已知 9, 0.015, n s ==由样本计算得0.511x =， 2.2 1.96=>，于是拒绝假设 0H , 认为包装机工作不正常. 例2：某工厂生产的固体燃料推进器的燃烧率服从正态分布),(2 σμN ， s cm s cm /2,/40==σμ，现用新方法生产了一批推进器，从中随机取25n =只，测得燃烧率的样本均值为s cm x /25.41=.设在新方法下总体均方差仍为s cm /2，问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高？（取显著性水平05.0=α）解：根据题意需要检验假设 00 :40H m m ?（即假设新方法没有提高了燃烧率）, 10 :H m m >（即假设新方法提高了燃烧率）, 这是右边检验问题，拒绝域为 0.05 1.645x z z = ?，由 3.125 1.645 x z = =>可得z 值落到拒绝域中故在显著性水平0.05 a =下拒绝0 H . 即认为这批推进器的燃烧率较以往有显著提高. 例3：某切割机在正常工作时, 切割每段金属棒的平均长度为10.5cm, 标准差是0.15cm, 今

多元线性回归模型习题及答案

多元线性回归模型一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中，计算得多重决定系数为，则调整后的多重决定系数为（ D ） A. B. C. 下列样本模型中，哪一个模型通常是无效的（B ） A. i C （消费）=500+i I （收入） B. d i Q （商品需求）=10+i I （收入）+i P （价格） C. s i Q （商品供给）=20+i P （价格） D. i Y （产出量）=0.6i L （劳动）0.4i K （资本） 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后，在的显著性水平上对 1b 的显著性作t 检验，则1b 显著地不等于零的条件是其统计量t 大于等于（ C ） A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中，1b 的实际含义是（ B ） A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中，若某个解释变量对其余解释变量的判定系数接近于１，则表明模型中存在（ C ） A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中，检验0:0(0,1,2,...) t H b i k ==时，所用的统计量服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数与多重判定系数之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8．关于经济计量模型进行预测出现误差的原因，正确的说法是（ C ）。 A.只有随机因素 B.只有系统因素 C.既有随机因素，又有系统因素、B 、C 都不对 9．在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数)：（ C ） A n ≥k+1 B n

统计学期末考试试题(含答案)

西安交大统计学考试试卷一、单项选择题（每小题2分，共20分） 1.在企业统计中，下列统计标志中属于数量标志的是（C） A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有（B ） A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元，则这句话中有（B）个变量？ A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是（A ） A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中，属于时点指标的有（A ） A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是（B ）确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到（A ）： A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为（A ） A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p（D ） A、大于1 B、大于－1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于（A ） A、零 B、1 C、－1 D、2 二、多项选择题（每小题2分，共10分。每题全部答对才给分，否则不计分） 1.数据的计量尺度包括（ABCD ）： A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有（BE ）： A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有（ABE ） A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中（BDE ） A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中，容易受数列中极端值影响的平均数有（ABC ） A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数三、判断题（在正确答案后写“对”，在错误答案后写“错”。每小题1分，共10分） 1、“性别”是品质标志。（对） 2、方差是离差平方和与相应的自由度之比。（错） 3、标准差系数是标准差与均值之比。（对） 4、算术平均数的离差平方和是一个最大值。（错）

《社会统计学》作业(共享含部份答案)

社会统计学作业一、单项选择题 1.为了解IT行业从业者收入水平，某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查，其中44%回答他们的月收入在6000元以上，30%回答他们每月用于娱乐消费在1000元以上。此处800人是（ A ） A．样本 B. 总体 C. 统计量 D. 变量 2．在频数分布表中，将各个有序类别或组的百分比逐级累加起来称为（ C ）A．频率 B. 累积频数 C. 累积频率 D. 比率 3．离散系数的主要目的是（ D ） A．反映一组数据的平均水平 B．比较多组数据的平均水平 C．反映一组数据的离散程度 D．比较多组数据的离散程度 4．经验法则表明，当一组数据正态分布时，在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5．在某市随机抽取10家企业，7月份利润额（单位：万元）分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0，那么这10家企业7月份利润额均值为（ A ） A. 39.19

B. 28.90 C ．19.54 D ．27.95 6．用样本统计量的值直接作为总体参数的估计值，这种方法称为（ A ） A ．点估计 B ．区间估计 C ．有效估计 D ．无偏估计 7．某单位对该厂第一加工车间残品率的估计高达10%，而该车间主任认为该比例（π）偏高。如果要检验该说法是否正确，则假设形式应该为（ B ） A ．0H ：π≥0.1；1H ：π<0.1 B ．0H ：π≤0.1；1H ：π>0.1 C ．0H ：π=0.1；1H ：π≠0.1 D ．0H ：π>0.1；1H ：π≤0.1 8．下面哪一项不是方差分析中的假定（ D ） A ．每个总体都服从正态分布 B ．观察值是相互独立的 C ．各总体的方差相等 D ．各总体的方差等于0 9．判断下列哪一个不可能是相关系数（ D ） A ．-0.9 B ．0 C ．0.5 D ．1.2 10．用于说明回归方程中拟合优度的统计量主要是（ D ） A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+，已知：数据x 的平均值为2，数据 y 的平均值为3，则 ( ) A ．回归直线必过点（2，3） B ．回归直线一定不过点（2，3） C ．点（2，3）在回归直线上方 D ．点（2，3）在回归直线下方 2. 在一次试验中，测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5)，则Y 与X 之间的回归直线方程为（）A ． y x 1=+ B ． y x 2=+ C ． y 2x 1=+ Ｄ． y x 1=-3. 在对两个变量x ，y 进行线性回归分析时，有下列步骤： ①对所求出的回归直线方程作出解释； ②收集数据(i x 、i y ），1,2i =，…，n ； ③求线性回归方程； ④求未知参数； ⑤根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量,x y 具有线性相关结论，则在下列操作中正确的是（） A ．①②⑤③④ B ．③②④⑤① C ．②④③①⑤ D ．②⑤④③① 4. 下列说法中正确的是（） A ．任何两个变量都具有相关关系 B ．人的知识与其年龄具有相关关系 C ．散点图中的各点是分散的没有规律 D ．根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论：（1）在回归分析中，可用指数系数2 R 的值判断模型的拟合效果，2 R 越大，模型的拟合效果越好；（2）在回归分析中，可用残差平方和判断模型的拟合效果，残差平方和越大，模型的拟合效果越好；（3）在回归分析中，可用相关系数r 的值判断模型的拟合效果，r 越小，模型的拟合效果越好；（4）在回归分析中，可用残差图判断模型的拟合效果，残差点比较均匀地落在水平的带状区域中，说明这样的模型比较合适．带状区域的宽度越窄，说明模型的拟合精度越高．以上结论中，正确的有（）个． A ．1 B ．2 C ．3 D ．4 6. 已知直线回归方程为2 1.5y x =-，则变量x 增加一个单位时（） A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中，散点图与相关系数r 不符合的是（）

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数）１、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零 ;各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度＝平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5％,实际增长了1０％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。１0、从内容上看，统计表由主词和宾词两个部分组成;从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）; 四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数ｒ=0，则表明两个变量之间不存在线性相关关系。二、判断题

社会统计学习题卢淑华

1、P58习题十五人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 （1）试作频率统计表，直方图和折线图（2）试求均值和标准差 2、P59习题十六设以下是七十二名离婚者的婚龄的统计（见下表）。（1）试作频率统计表、直方图和折线图（2）试求众值、中位值和均值，并做简单讨论。（3）试求四分互差和标准差。婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七设以下是1209名抽烟者年龄的统计（见下表）年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 （1）试作频率统计表、直方图和折线图（2）试求四分互差。 4、P72例10 某年级共有学生一百名，其中来自广东省的有二十五名，来自广西省的有十名，问任抽一名，来自两广的概率是多少？

5、P73例12 根据某市职业代际流动的统计，服务性行业代际向下流动的概率为0.07，静止不流动的概率为0.85，求服务性行业代际向上流动的概率是多少？ 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响，某大学统计出学生中父亲具有大学文化程度的占30%，母亲具有大学文化程度的占20%，而父母双方都具有大学文化程度的占10%，问学生中任抽一名，父代至少有一名具有大学文化程度的概率是多少？ 7、P75例14 某地对外国旅游者旅游动机进行了调查，发现旅游者处于游览名胜的概率为0.219；处于异族文化的吸引占0.509；而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少？ 8、P76例16 根据统计结果，在自然生育情况下，男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇，问两名孕妇都生男婴的概率是多少？两名孕妇都生女婴的概率是多少？其中一名孕妇生男婴、一名孕妇生女婴的概率是多少？ 9、P77例17 某居民楼共十二户，其中直系家庭为两户，问访问两户都是直系家庭的概率是多少？ 10、P78例18 某居民楼共二十户，其中直系家庭为两户，问访问第二户才是直系家庭的概率是多少？11、P78例20 设居民楼共有住户一千户，其中核心家庭占60%，问访谈中散户都是核心家庭的概率是多少？ 12、P83例22 10人抓阄，其中共有2张球票，问第2个人抓到球票的概率？ 13、P85例23 设出口商标为Made in China的产品，其中有50%为上海厂的产品；30%为北京厂得产品；20%为天津厂的产品。设上海厂得正品率为90%；北京厂的正品率为95%，天津厂的正品率为97%。问（1）任抽一件为正品的概率是多少？（2）在抽得产品是正品的情况下，是上海厂的概率是多少？ 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P（ξ=Xi）0.05 0.15 0.60 0.15 0.05 求σ2=？ 15、P106习题三某班对全班订报纸情况进行了统计，中订《人民日报》的有45%；订《北京晚报》的有80%；两种报纸都订的有30%，试求以下事件的概率。（1）只定人民日报的（2）至少订以上一种报纸的（3）只订以上一种报纸的（4）以上两种报纸都不订的 16、P107习题6 根据统计，由出生活到60岁的概率为0.8，活到70岁的概率为0.4，问现年60岁的人活到70岁的概率为多少？

2018年春社会统计学期末复习训练题(4)报告.doc

2018年春社会统计学期末复习题一、单项选择题 1．以下关于因变量与自变量的表述不正确的是（） A．自变量是引起其他变量变化的变量 B．因变量是由于其他变量的变化而导致自身发生变化的变量 C．自变量的变化是以因变量的变化为前提 D．因变量的变化是以自变量的变化为前提 2．在频数分布表中，将各个有序类别或组的百分比逐级累加起来称为（） A．频率 B．累积频数 C．累积频率 D．比率 3．离散系数的主要目的是（） A．反映一组数据的平均水平 B．比较多组数据的平均水平 C．反映一组数据的离散程度 D．比较多组数据的离散程度 4．经验法则表明，当一组数据正态分布时，在平均数加减2个标准差的范围之内大约有() A．50%的数据 B．68%的数据 C．95%的数据

D．99%的数据 5．在某市随机抽取10家企业，7月份利润额（单位：万元）分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25．0、26.9、29.0，那么这10家企业7月份利润额均值为（） A．39.19 B．28.90 C．19.54 D．27.95 6．用样本统计量的值直接作为总体参数的估计值，这种方法称为（） A．点估计 B．区间估计 C．有效估计 D．无偏估计 7．在频数分布表中，比率是指（） A．各组频数与上一组频数之比 B．各组频数与下一组频数之比 C．各组频数与总频数之比 D．不同小组的频数之比 8．下面哪一项不是方差分析中的假定（） A．每个总体都服从正态分布 B．观察值是相互独立的 C．各总体的方差相等 D．各总体的方差等于0

9．判断下列哪一个不可能是相关系数（） A．-0.9 B．0 C．0.5 D．1.2 10．用于说明回归方程中拟合优度的统计量主要是（） A．相关系数 B．离散系数 C．回归系数 D．判定系数 11．在假设检验中，不拒绝虚无假设意味着（） A．虚无假设是肯定正确的 B．虚无假设肯定是错误的 C．没有证据证明虚无假设是正确的 D．没有证据证明虚无假设是错误的 12．下列变量属于数值型变量的是（） A．工资收入 B．产品等级 C．学生对考试改革的态度 D．企业的类型 13．如果用一个图形描述比较两个或多个样本或总体的结构性问题时，适合选用哪种图形（）