统计学第四版第七章答案

统计学第四版第七章答案
统计学第四版第七章答案

第四章 抽样分布与参数估计

某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成

了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x σ=

=

= (2)在95%的置信水平下,求边际误差。

x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?x z ασ=?0.025x z σ=?=×=

(3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为:

(),x x x x -?+?=()120 4.2,120 4.2-+=(,)

从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:

大样本,样本均值服从正态分布:2,x N n σμ?? ???:或2,s x N n μ??

???

:

置信区间为:

22x z x z αα?-+ ? (1)构建μ的90%的置信区间。

2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(,)

(2)构建μ的95%的置信区间。

2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(,)

(3)构建μ的99%的置信区间。

2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(,)

某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取

36人,调查他们每天上网的时间,得到下面的数据(单位:小时):

解:

(1)样本均值x =,样本标准差s=; (2)抽样平均误差: 重复抽样:

x σ≈

不重复抽样:

x σ≈

=×=

(3)置信水平下的概率度: 1α-=,t=z α=0.05z = 1α-=,t=z α=0.025z = 1α-=,t=z α=0.005z = (4)边际误差(极限误差): 2x x x t z ασσ?=?=?

1α-=,x x x t z ασσ?=?=?=0.05x z σ?

重复抽样:2x x z ασ?=?=0.05x z σ?=×= 不重复抽样:2x x z ασ?=?=0.05x z σ?=×=

1α-=,x x x t z ασσ?=?=?=0.025x z σ?

重复抽样:2x x z ασ?=?=0.025x z σ?=×= 不重复抽样:2x x z ασ?=?=0.025x z σ?=×=

1α-=,x x x t z ασσ?=?=?=0.005x z σ?

重复抽样:2x x z ασ?=?=0.005x z σ?=×= 不重复抽样:2x x z ασ?=?=0.005x z σ?=×=

(5)置信区间:

(),x x x x -?+?

1α-=,

重复抽样:(),x x x x -?+?=()3.320.441,3.320.441-+=(,)

不重复抽样:(),x x x x -?+?=()3.320.439,3.320.439-+=(,)

1α-=,

重复抽样:(),x x x x -?+?=()3.320.525,3.320.525-+=(,) 不重复抽样:(),x x x x -?+?=()3.320.441,3.320.441-+=(,)

1α-=,

重复抽样:(),x x x x -?+?=()3.320.69,3.320.69-+=(,) 不重复抽样:(),x x x x -?+?=()3.320.688,3.320.688-+=(,)

某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,

他们到单位的距离(单位:km)分别是:

10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2

假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。 解:小样本,总体方差未知,用t 统计量

x t =

()1t n -: 均值=,样本标准差s= 置信区间:

(

)(

)211x t n x t n αα?

--+- ?

1α-=,n=16,()21t n α-=()0.02515t =

(

)(

)211x t n x t n αα?

--+- ?

=9.375 2.13 2.13?-+ ?=(,

7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。现从某天生产

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量的95%的置信区间。 解:大样本,总体方差未知,用z 统计量

x z =

()0,1N : 样本均值=,样本标准差s= 置信区间:

22x z x z αα?

-+ ?

1α-=,2z α=0.025z =

22x z x z αα?

-+ ?

=101.4 1.96 1.96?-+ ?=(,

) (2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。

解:总体比率的估计

大样本,总体方差未知,用z 统计量

z =

()0,1N :

样本比率=(50-5)/50= 置信区间:

22p z p z αα? -+ ? 1α-=,2z α=0.025z =

22p z p z αα? -+ ?

=

0.9 1.96 1.96? -+ ?=(,)

7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了

假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%的置信区间。

解:小样本,总体方差未知,用t 统计量

x t =

()1t n -: 均值=,样本标准差s= 置信区间:

(

)(

)211x t n x t n αα?

--+- ?

1α-=,n=18,()21t n α-=()0.0517t =

(

)(

)211x t n x t n αα?

--+- ?

=13.56 1.7369 1.7369?-+ ?=(,

7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的

电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:总体比率的估计

大样本,总体方差未知,用z 统计量

z =

()0,1N :

样本比率= 置信区间:

22p z p z αα? -+ ? 1α-=,2z α=0.025z =

22p z p z αα? -+ ?

=

0.23 1.645 1.645? -+ ? =(,)

1α-=,2z α=0.025z =

22p z p z αα? -+ ? =

0.23 1.96 1.96? -+ ?=(,)

7.20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,

比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间

)如下:

要求:

(1)构建第一种排队方式等待时间标准差的95%的置信区间。 解:估计统计量

()()222

1~1

n S n χσ

-- 经计算得样本标准差2

2s = 置信区间:

()()

()()222222121111n S n S n n αασχχ---≤≤--

1α-=,n=10,()221n αχ-=()20.0259χ=,()2121n αχ--=()20.9759χ=

()()()()222221211,11n S n S n n ααχχ-??-- ? ?--??=90.227290.2272,19.02

2.7???? ???=(,) 因此,标准差的置信区间为(,)

(2)构建第二种排队方式等待时间标准差的95%的置信区间。 解:估计统计量

()()222

1~1

n S n χσ

-- 经计算得样本标准差2

1s = 置信区间:

()()

()()222222121111n S n S n n αασχχ---≤≤--

1α-=,n=10,()221n αχ-=()20.0259χ=,()2121n αχ--=()2

0.9759χ=

()()()()222221211,11n S n S n n ααχχ-??-- ? ?--??=9 3.3189 3.318,19.02

2.7???? ???=(,) 因此,标准差的置信区间为(,)

(3)根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种方式好,标准差小!

(1)计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。 d =,d s

=

(2)设12μμ和

分别为总体A 和总体B 的均值,构造12d μμμ=-的95%的置信区间。 解:小样本,配对样本,总体方差未知,用t 统计量

d d t =

()1t n -:

均值=,样本标准差s= 置信区间:

(

)()2

11d t n d t n αα?

--+- ?

1α-=,n=4,

()21t n

α-=()0.0253t = ()()211d t n d t n αα?

--+- ?

=1.75 3.182 3.182?-+ ?=(,

7.25 从两个总体中各抽取一个12n n ==250的独立随机样本,来自总体1的样本比例为1

p =40%,来自总体2的样本比例为2p =30%。要求:

(1)构造12ππ-的90%的置信区间。 (2)构造12ππ-的95%的置信区间。 解:总体比率差的估计

大样本,总体方差未知,用z 统计量

p p z ππ---=

()0,1N :

样本比率p1=,p2=

置信区间:

122122p p z p p z αα? ---+ ?

1α-=,2z α=0.025z

=

122122p p z p p z αα? ---+

?

=

0.1 1.645 1.645? -+ ? =(%,%)

1α-=,2z α=0.025z

=

122122p p z p p z αα? ---+

?

=

0.1 1.96 1.96? -+ ? =(%,%)

生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方

差。下面是两部机器生产的袋茶重量(单位:g)的数据:

要求:构造两个总体方差比21σ/2

2σ的95%的置信区间。

解:统计量:

2

1212

2

2

2s s σσ()121,1F n n --:

置信区间:

()()22

112222

2121212,1,11,1s s s s F n n F n n αα-?? ? ?---- ? ???

21s =,22s =

n1=n2=21

1α-=,()2121,1F n n α--=()0.02520,20F =,

()12121,1F n n α---

=

()

2211

1,1F n n α--

()12121,1F n n α---=()0.97520,20F =

()

0.0251

20,20F =

22

112222

2121212,1,11,1s s s s F n n F n n αα-?? ? ?---- ? ???

=(,

) 7.27 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求边际误差不超过4%,应抽取多大的样本? 解:2

z α

?=

()

2221p

z p p n α??-=

?

1α-=,2z α=0.025z =

()222

1p

z p p n α??-=?=221.960.020.98

0.04??=,取n=48或者50。

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约

为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本? 解:2222

x

z n ασ

?=

?

,1α-=,z α=0.025z =,

222

2x

z n ασ?=?22

2

1.9612020?=

=,取n=139或者140,或者150。

7.29 假定两个总体的标准差分别为:112σ=,215σ=,若要求误差范围不超过5,相应

的置信水平为95%,假定12n n =,估计两个总体均值之差12μμ-时所需的样本量为多大? 解:n1=n2=()

12

2222122

x x z n ασσ-?+=

?

,1α-=,2z α=0.025z =,

n1=n2=()

12

2222122x x z n ασσ-?+=?=

()

2222

1.9612155

?+=,取n=58,或者60。

7.30 假定12n n =,边际误差E =0.05,相应的置信水平为95%,估计两个总体比例之差

12ππ-时所需的样本量为多大?

解:n1=n2=()()12

221122211p p z p p p p n α-?-+-????

=

?,1α-=,2z α=0.025z =,取p1=p2=,

n1=n2=()()12

2211222

11p p z p p p p n α-?-+-????

=

?

=

()

2222

1.960.50.50.05

?+=,取n=769,或者

780或800。

8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。 解:H 0:μ≥700;H 1:μ<700

已知:x =680 σ=60

由于n=36>30,大样本,因此检验统计量:

x

==-2

z

当α=,查表得zα=。因为z<-zα,故拒绝原假设,接受备择假设,说明这批产品不合格。

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示) (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) 分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P =( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

统计学课后答案

4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics 汽车销售数量 N Valid10 Missing0 Mean Median Mode10 Std. Deviation Percentiles25 50 75 4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 1915292524 2321382218 3020191916 2327223424 4120311723 要求;(1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄

从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。 Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+×2=。 (3)计算平均数和标准差; Mean=;Std. Deviation= (4)计算偏态系数和峰态系数: Skewness=;Kurtosis= (5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图: 为分组情况下的概率密度曲线: 分组: 1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103 n K =+ =+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=,取5 3、分组频数表 网络用户的年龄 (Binned)

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

《统计学》-第7章-习题答案

第七章思考与练习参考答案 1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。 2.答:相关和回归都是研究现象及变量之间相互关系的方法。相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。 3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数 ,样本相关系数 。复相关系数是多元线性回归分 析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。 4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。根据样本数据拟合的方程,就是样本回归函数,以一元线 性回归模型的样本回归函数为例可表示为:t t X Y 10???ββ+=。总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。第二,总体回归函数中 的0β和1β是未知的参数,表现为常数;而样本回归直线中的0 ?β和1?β是随机变量,其具体数值随所抽取的样本观测值不同而变动。 5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏 差的尺度,找到使得残差平方和最小的回归系数0 ?β和1?β的取值的估计方法。根据微积分中

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

2020年自考《社会统计学》模拟试题及答案

2020年自考《社会统计学》模拟试题及答案 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2) ;(3) 。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题

1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细 4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( )

统计学课后答案

第一部分 课程指导 第一章绪论 一、本章重点 1.统计的基本涵义。统计工作、统计资料和统计学,统计资料是统计工作的成果;统计学是统计工作的经验总结和理论概括,统计学与统计工作是理论与实践的关系。 2.统计学的历史大体可分为古典统计学时期、近代统计学时期、现代统计学时期。曾经产生过记述学派、政治算术学派、数理统计学派和社会经济统计学派等流派。赫尔曼·康令、特弗里德·阿亨瓦尔、威廉·配第、约翰·格朗特、阿道夫·凯特勒、克尼斯等是各个不同时期、不同流派的代表人物。《政治算术》、《社会物理学》是统计学说史上的典型著作。 3.统计的研究对象是大量社会经济现象的数量方面,社会经济现象的数量表现,现象变化的数量关系和数量界限,通过这个对象的研究以认识和利用社会经济发展变化的规律。 4.统计具有数量性、总体性、具体性、社会性等特点。大量观察法、统计分组法、综合指标法和归纳推理法是统计研究的基本方法。 5.统计的基本任务是对国民经济与社会发展情况进行统计调查、统计分析、提供统计资料和统计咨询意见,实行统计监督。统计具有信息的职能、咨询的职能、监督的职能。一个完整的统计工作过程包括:统计设计、统计调查、统计整理和统计分析四个阶段。 6.总体与总体单位、标志与指标、变异与变量是统计中常用的基本概念。同质性、大量性、差异性是统计总体的基本特征。统计指标具有数量性、综合性、具体性三个特点。指标的构成必须完整、指标的名称必须具有正确的涵义和理论依据、要明确指标的计算口径和范围、要有科学的计算方法等是对一个统计指标的基本要求。掌握统计指标体系的概念和基本分类。 二、难点释疑 1.对于社会经济统计的性质及研究对象,要从马克思主义认识论的基本原理,客观事物质与量的辩证统一关系出发,从统计总体本身具有大量性、同质性、差异性特点出发,联系社会经济统计的实践,从统计要发现规律、描述规律、认识规律、利用规律等递进关系上来深刻正确的理解。 2.熟记、掌握以下基本概念:统计总体与总体单位,标志与指标、统计指标体系。要掌握这些重要概念的联系与区别、特点、表现形式及其基本分类等。 三、练习题: (一)填空题 1.“统计”一词有三种涵义,即统计工作、()和()。

免费《统计学》课后答案

统计学 费宇石磊(主编) 第2章练习题参考答案 2.1解:(1)首先将顾客态度分别用代码1、2、3表示,然后在数据文件的Varible View窗口Values栏定义变量值标签:1代表“喜欢并愿意购买”;2代表“不喜欢”,3代表“喜欢并愿意购买”。操作步骤: 依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示: (2)根据表2.1频数分布表资料建立的数据文件为 绘制条形图操作步骤:依次点击File→点击open→点击Data→打开数据文件,选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable(纵轴),将“态度分类”选入Category Axis (横轴)→点击OK。输出结果如图2.1所示:

图2.1 30名顾客满意程度分布条形图 绘制饼图操作步骤:依次点击File→点击open→点击Data→打开数据文件 of individual cases→点击Define→将“人数”选入Slices Represent栏,将“态度分类”选入Variable栏→点击OK。输出结果如图2.2所示: 2.2解:首先列计算表如表2.2所示: 表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表

(1)均值151 872072.67120 i i i i i x f x f === = =∑∑(分) 表2.2中,分布次数最多的组是“40~50”组,这就是众数所在组;2 N =60,中位数大约在第60位,可确定中位数也在“40~50”组。 众数10124230 701073.333018M L i ?-=+ ?=+?=?+?-+-(分) (42)(42) 中位数11204922701072.6242 m e m N S M L i f ---=+?=+?=(分) (2)首先计算标准差:11.65s = =(分) 3 1 1 3 3 () /38389.64/120 0.202311.65k k i i i i x x f f SK s ==-= = =∑∑ 由计算结果可看出,偏态系数为正值,但与零的差距不大,说明120名大学生英语成绩为轻微右偏分布,成绩较低的同学占有一定的比例,但偏斜程度不大。 4 1 1 4 4 () /5108282.61/120 330.689111.65k k i i i i x x f f K s ==-= -= -=-∑∑ 由计算结果可看出,峰度系数为负值,说明120名大学生英语成绩为平峰分布,成绩较低的同学占一定比例,但低成绩区域的集中程度并不很高。 2.3解(1)整理的组距数列如表 表2.3.1 连续60天计算机销售量频数分布表

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

统计学课后答案

第一章总论(16页) 一、判断题 1、统计学是数学的一个分支 答:错。统计学和数学都是研究数量规律的,虽然两者关系非常密切,但有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;统计学的数据则总是与客观的对象联系在一起,特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计学的方法本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或试验区取得数据,研究时不仅要运用统计学的方法,而且要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性;统计学则更加注意方法的适用性和操作性。 2、统计学是一门独立的社会科学。 答、错。统计学是横跨社会科学领域和自然科学领域的多学科性的科学。 3、统计学是一门实质性科学。 答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。 4、统计学是一门方法论科学。 答:对统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。 5、描述统计是用文字和图标对客观世界进行描述 答:错。描述统计是对彩机的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图标的形式表示经过归纳分析而得到的各种有用信息,描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。 6、对于有限总体不必应用推断统计方法。 答:错。一些有限总体,由于各种原因,并不一定能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命,不可能对每一台都进行观察和试验,只能采用抽样调查方法得到样本,并结合推断统计方法估计显像管的寿命。 7、社会经济统计问题都属于有限总体的问题。 答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。 8、理论统计学与应用统计学是两类性质不同的统计学。 答:对。理论统计学具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有着非常密切的联系,具有边缘交叉和复合型学科的性质。 二、选择题 1、社会经济统计学的研究对象是(A) A. 社会经济现象的数量方面, B. 统计工作, C. 社会经济的内在规律, D. 统计方法 2、考察全国的工业企业的情况时,以下标志中属于不变标志的有(A) A. 产业分类, B. 职工人数, C. 劳动生产率, D. 所有制 3、要考察全国居民的人均住房面积,其统计总体是(A) A. 全国说有居民, B. 全国的住宅, C. 各省市自治区, D. 某一居民户 4、最早使用统计学这一学术用语的是(B) A. 政治算数学派, B. 国势学派, C. 社会统计学派, D. 树立统计学派

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 7.1 (1)已知σ=5,n=40,x =25,α=0.05, z 05.0=1.96 样本均值的抽样标准差 σ x =n σ= 79.040 5 = (2)估计误差(也称为边际误差)E= z 2 α n σ =1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05, z 05.0=1.96 (2)样本均值的抽样标准差 σ x =n σ= =4915 2.14 估计误差E= z 2 α n σ=1.96* =4915 4.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =120±1.96*2.14=120±4.2,即(115.8,124.2) 7.3(1)已知σ=85414,n=100,x =104560,α=0.05, z 05.0=1.96 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =104560±1.96* =100 85414104560±16741.144即(87818.856,121301.144) 7.4(1)已知n=100,x =81,s=12, α=0.1, z 2 1.0=1.645 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=81±1.645* =100 1281±1.974,即(79.026,82.974) (2)已知α=0.05, z 2 05.0=1.96 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=81±1.96* =100 1281±2.352,即(78.648,83.352) (3)已知α=0.01, z 2 01.0=2.58 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

社会经济统计学原理试题及答案

社会经济统计学原理试题及答案 统计学原理试题( A ) 一、填空题 ( 每小题 1 分,共 10 分 ) 1. 标志按其特征的不同,可以分为品质标志与 ________ 。 2. 统计指标由指标名称和 ________ 。 3. 统计分组的关键在于选择分组标志和划分 ________ 。 4. 总量指标按其反映的内容不同,可进一步细分为标志总量和 ________ 。 5. 平均指标反映了总体分布的 ________ 。 6. 测定循环变动的常用方法称为 ________ 。 7. 如果用的是各年份季度资料,应采取 ________ 移动平均。 8. 三个或三个以上在经济上有联系,数量上保持一定对等关系的指数形成的一个整体,称为 ________ 。 9. 就方法来说,参数估计的基础是概率论中的大数法则和 ________ 。 10. 估计标准误差愈小,根据回归直线方程式计算的估计值就 ________ 。 二、单项选择题 ( 每小题 1 分,共 15 分 )在每小题列出的四个选项中只有一个选项是符合题目要求的,请将正确选项前的字母填在题后的括号内。 11. 社会经济统计学属于社会科学的 ( )

A. 实验论和理论性的学科 B. 方法论和应用性的学科 C. 系统论和全面性的学科 D. 信息论和社会性的学科 12. 下列属于数量标志的是 ( ) A. 职工的工龄 B. 职工的性别 C. 职工的政治面貌 D. 职工的籍贯 13. 某人的民族是汉族,则汉族是 ( ) A. 数量标志 B. 品质标志 C. 统计总体 D. 总体单位 14. 统计设计的中心内容是 ( ) A. 确定统计指标和指标体系 B确定统计分析的方法 C.确定统计分析的内容 D明确统计研究的目的 15. 调查项目的承担者是 ( ) A. 调查对象 B. 调查项目 C. 调查单位 D. 填报单位 16. 对连续型组距数列,凡是某单位的标志值刚好等于相邻两组上下限数值时,一般是 ( ) A将此值归入上限所在组 B将此值归入下限所在组 C将此值归入上限所在组或下限所在组 D. 另立一组 17. 某校 2001 年在校学生人数 6000 人,毕业生人数 1400 人,上述两个指标是 ( ) A. 均为时期指标 B. 均为时点指标 C. 前者为时期指标,后者为时点指标 D. 前者为时点指标,后者为时期指标 18. 第一组工人的平均工龄为 6 年,第二组为 8 年,第三组为 10 年,第一组工人数占总数的 30% ,第二组占 50% ,则三组工人的平均工龄为 ( ) A.8 年 B.7.55 年 C.32.5 年 D.7.8 年 19. 某企业有三个流水连续作业车间,某月份间产品合格率分别为 95% , 90% , 85 ,全厂平均合格

相关文档
最新文档