社会统计学

社会统计学
社会统计学

社会统计学

——2013年考前辅导

目录

一、学习统计学的意义与自学的好方法

二、考核策略与期末考试说明

三、期末考试重点辅导

四、平时作业答疑

五、重点章节学习难点辅导

一、学习统计学的意义与自学的好方法

(一)学习社会统计学的意义:

如果不能量化某些事情,那么就不能理解它.

如果不能理解它,那么就不能控制它

如果不能控制它,那么就不能改进它。

(二)生活中要有统计的思维

这个研究的变量是如何定义的

数据是如何收集的

用了什么样的统计方法

结果是否通过了显著性检验

结果有哪些不足

统计学是由一组收集数据分析数据由数据得出结论而组成的概念、原则和方法。

统计公式就像一门外语,如果理解了这种语言,那么公式会大大增进对统计学的理解,否则,这些公式就像密码一样难以破译,不要把公式当成一种障碍,不用公式,照样有可能获得对统计思想的深刻理解。

(三)自学的好方法

1、认真看书,不落下一段一章。

2、跟做课后习题。有问题随时查阅本章知识点。

3、善于做笔记,做到每一章都有知识点的整理,都有学习小结。

4、善于前后联系,将各章知识点进行贯通。

5、善于预习与复习。

6、善于利用学习平台,与老师交流与其他同学分享学习经验。

二、考核策略与期末考试说明

平时成绩占30%;其中,两次平时作业各占10% ,学习小组占10%。

期末考试成绩占70%;

综合成绩=期末考试*70%+(平时两次作业+小组讨论)的成绩*30%。

期末闭卷考试说明

考试方式:

闭卷考试,总分100分,占综合成绩的70%

考试题型:

名词解释:4题,每题5分,共计20分;

填空题:共10个空,每空1分,共计10分;

简答题:3题,每题10分,共计30分;

计算题:2题,20分。

对错判断:20题,20分

三、期末闭卷考试重点

第一部分基础统计学(注:本部分以概念为主,简单计算题都出在这一部分)

出题量最大,占60%以上

第一章统计学的性质/2

第二章描述性统计学/11

第三章概率分布/49

第四章抽样/75

第二部分常用统计分析方法(注:本部分重点理解原理,掌握每种方法的思路)

出题量较大,占20%左右

第五章置信区间/98

第六章假设检验/121

第七章回归分析/145

第八章方差分析/174

第九章相关分析/193

第十章卡方检验和交互分析/227

第三部分抽样调查原理(注:本章以概念为主)

出题量较小,不高于10%,基本为最基础的概念

第十三章概论/276

第十四章简单随机抽样/279

第十五章抽样调查的组织形式/293

第四部分问卷的设计及信度和效度分析(注:本章以概念为主)

考核个别概念,不高于10%

第十六章问卷的设计及信度和效度分析/324

注意:

每一章的课后小结是我们考试重点中的重点,需要大家实记。可出多种题型。

接下来我将以考试题型的形式带领同学们对本门课程的重要知识点进行梳理。

(一)需要掌握的名词概念(25个)

1、统计量:统计量是一个不包含任何未知参数的样本函数。

2、极差:极差也叫全距,就是最大值与最小值之间的距离。

3、四分位数间距(IQR):四分位数间距也叫四分位数偏差或四分位差。通常将数据从小到大顺序排列后,用三个四分位数点Q1Q2Q3将其分成四部分。四分位数间距是Q1和Q3之间的距离:

IQR= Q3- Q1

4、零假设H0 :在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。

5、第一类错误:零假设H0实际上是正确的,却被否定了。

6、第二类错误:零假设H0实际上是错误的,却没有被否定

7、显著性水平:能允许犯第一类错误(零假设H0实际上是正确的,却被否定了)的概率叫做检验的显著性水平,它决定了否定域的大小。

8、皮尔逊相关系数r:皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。

9、检验统计量:检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。

10、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。

11、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

12、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。

13、消减误差比例:变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E1,减去知道Y与X有关系时预测Y的误差E2,再将其化为比例来度量。将削减误差比例记为PRE。

14、正态近似定理:在容量为n的非常简单随机样本(VSRS)中,样本均值以标准误差(为总体标准差)围绕着总体均值波动。随着n的增大,的分布也就围绕其目标μ波动得越来越小,它也就越来越接近正态(铃状)P86

15、拟和优度检验:是有关检定总体是否具有正态或其他分布形式的非参数统计检验。

16、列联表:是按品质标志把两个变量的频数进行交互分类的统计表格。

17、理论频数:是按照理论分布计算出的样本各组频数。

18、方差分析:研究多个总体均值是否存在差异的统计检验方法。

19、简单随机样本:是当我们每抽取一个观察值时,总体中所有个体被抽取的可能性都是相同的。

20、蒙特卡罗法:重复抽样的方法叫蒙特卡罗法。P95

21、同序对:在观察X序列时,如果看到Xi

22、异序对:在观察X序列时,如果看到XiYj ,则称这一配对是异序对。

23、同分对:如果在X序列中,我们观察到Xi=Xj (此时Y序列中无Yi=Yj ),则这个配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们观察到Yi=Yj (此时X序列中无Xi=Xj ),则这个配对仅是Y方向而非X方向的同分对;我们观察到Xi=Xj ,也观察到Yi=Yj ,则称这个配对为X与Y同分对。

24、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

25、散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。

二、需要掌握的填空题目(22个)

1.统计学是关于通过取自总体的样本来(描述)和(推断)该总体的方法。为了避免偏差,样本必须是(随机)抽取的。于是可以构造一个(置信区间),它包含了一个表示抽样不确定性的误差范围。

2.测量可以划分为四个等级:名称级、顺序级、间隔级和(比例级)。

3.定义分布的中心主要有三种方式:众数、(中位数)和平均数。

4、斜度和(峰值)用于描述数据和分布于正态分布之间的离异程度。正态分布可以用一条呈铃状的对称曲线来表示。其中,斜度表示分布与正态分布的(不对称程度)和方向。峰值表示分布于正态曲线相比的冒尖程度或扁平程度。

5、原始数据可以用(频数分析表)的形式来整理概括,并用(直方图)表示。原始数据的分布还可以用(茎叶图)和(饼形图)来表示

6、分布中心的最常用的统计量是(均值)。

7、描述分布形状的最常用的统计量是(标准差)。

8、X的均值也叫平均数或(期望值)。

9、在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。

10、根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这种分析方法,通常又称为(回归分析)。

11、对于表现为因果关系的相关关系来说,自变量一般都是(确定性)变量,依变量则一般是(随机性)变量。

12、变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X 有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。

13、当试验可以分阶段进行时,(概率树)是求概率分布的一种很有用的方法。

14、为了区分X的标准差和X平均数的标准差,通常称X平均数的标准差为的标准误差,或简称为(SE)

15、参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括(点估计)和(区间估计)。

16、方差分析可以对多个总体(均值)是否相等进行检验。

17、列联表是按(品质)标志把两个变量的频数进行交互分类的。

18、在使用检验法进行列联表检验所使用的自由度为( df= (c-1)(r-1) )。

19、方差分析中把已解释的变差对总变差的比值称为(相关比率)。

20、方差分析是(均值差)检验的推广,一般用于处理自变量是一个或多个定类变量和因变量是一个定距变量之间的关系。

21、在实际运用中,方差分析的结果常用一种称为(方差分析表)的标准形式的表格表示出来。

22、通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为(样本)。样本中所

含的单位数,在统计学上称为样本大小,也叫做(样本量)。

注意:名词解释和填空两类题目可能会相互变换形式,大家可以将这两种题型作为知识点进行强化记忆。

三、需要掌握的判断题目(45个)

1、在确定一个处理是否有效的实验中,为了避免偏差,采用随机方法来决定让谁去接受处理以及让谁留下作为对照者。而且,对于任何有可能对结果产生偏见的人,都应该避免使他了解谁接受了处理而谁没有。(√)

2、名称级用于测量定类变量的值。(√)

3、顺序级用于测量定序变量的值。(√)

4、间隔级用于测量定距变量的值。(√)

5、比例级用于测量定比率变量的值。(√)

6、众数就是出现次数最多的变量值。(√)

7、中位数的定义依赖于数据的大小顺序,因此它不适合于定类变量。对于定序和定距变量,特别是对于分布不很规则的情况,中位数是比较理想的统计量之一。(√)

8、由于平均数计算设计到每个观测值的大小,因此它一般只适用于定距和定比率变量。(√)

9、不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于正态分布。(√)

10、一个离散型随机变量的分布告诉我们该变量有哪些可能的取值,以及每个可能取值出现的概率。(√)

11、相对概率之和等于1,即?P(X)=1。(√)

12、二项分布有一个重要的假定:N次试验是彼此相互独立的(或称为统计上相互独立的)。(√)

13、样本均值的分布有一个显著的特征:尽管总体的分布很偏斜,担的抽样分布几乎是一条对称的正态分布曲线。也就是说,不管总体自身是否服从正态分布,其样本的的分布式渐近正态的。(√)

14、最普遍的连续型分布式钟型的正态(高斯)分布,其右侧尾部概率面积可从附录三的表IV 查得。(√)

15、概率是随着样本量N越来越大时相对频率的(统计意义下)极限。(√)

16、统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显著性水平),它决定了否定域的大小。(√)

17、在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。(√)

18、统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。(√)

19、检验的显著性水平被定义为能允许犯第一类错误的概率,它决定了否定域的大小。

20、为了表示响应Y是怎样和因子X相联系的,可以用一条回归直线?=a+bx去拟合,斜率b 和截距a 可以用最小二乘的简单公式来计算。(√)

21、实际的观测值必须假定是取自某一潜在的总体样本。对于这个总体,我们用希腊字母β表示真实回归直线的斜率,它就是用样本斜率b来估计的那个目标。(√)

22、双类型因子可以用一个哑变量来处理。(√)

23、非线性关系,例如抛物线关系,既可以利用简单的变换化为标准的多元回归来拟合,也可以利用现有的统计软件来寻求一条比较合理的拟合曲线。(√)

24、积距相关系数r度量了两个变量线性联系的紧密程度,它的值位于-1与+1之间。(√)

25、积距相关系数r的显著性检验可以采用图解法,也可以用t检验法(或F检验法)。(√)

26、决定系数的值位于0与1之间,它等于Y变量中可以用X变量回归来解释的变差占Y 变量总变差中的比例。回归与相关有密切的联系,例如,回归斜率b很容易用r来表示。对b 的t检验等于方差分析中的F检验。(√)

27、检验是一种假设检验,它建立在比较观测值与期望值(在原假设下的期望值)的差的基础上。在最简单的情况下,可以应用的分类数据上,这些数据按照某个因子如电视节目,可以分成几个小组。(√)

28、检验也可以应用到按照两个因子分类的数据上,用于检验连个因子相互之间的独立性。虽然检验很容易计算,也比较直观,但它也有不少的局限性。因此,有时需要采取补救的办法,例如求C、计算修正的值等,或者用更生动精细的方法,如置信区间、方差分析或回归等方法来代替。(√)

29、非参数检验常常又快又方便且不要求总体是正态。对于两个配对样本,最简单的是符号检验(或是对一个单一样本)。(√)

30、继续遵循符号检验的逻辑,则可以为总体的中位数构造一个非参数的置信区间。我们只要从顺序排列的数据的两端,分别去掉相同数目的几个观测值,就可以得到这样的置信区间。(√)

31、虽然贝叶斯估计常常很有吸引力,但是应该注意,必须在满足某些假定的前提下才能应用叶斯估计。(√)

32、分层抽样的精度一般都高于简单随机抽样。(√)

33、大规模的各类调查都采用多级抽样。它可以看成是分层抽样和整群抽样的综合。在精度上介于两者之间。(√)

34、标准正态分布,也叫Z分布。他是均值μ=0,标准差=1的正态分布。(√)

35、在多级混合型抽样中,精心计算最后一级的抽样中个体被抽中的概率,使得所抽取的样本可以近似地看成是简单随机样本,这将有利于最后的计算统计分析。(√)

36、问卷的设计要根据调查研究的目的、主题以及研究假设来进行。(√)

37、常用的问卷是结构型的封闭式问卷。(√)

38、信度表示测量的可靠度。(√)

39、效度表示测量的准确度。(√)

40、不同信度分析方法测量的是信度的不同方面,适用于不同的情况。(√)

41、不同效度分析方法测量的是效度的不同方面,适用于不同的情况。(√)

42、初设计的量表必须经过一次或多次效度分析,删除低效度的项目,才有可能得到高效度的量表。(√)

43、当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在直线负相关关系。(×)

44、评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示无相关。(×)

45、每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合适。(×)

四、需要掌握的简答题目(15个)

1、作频数分布表的一般步骤

答:

第一步,先找出数据的大致范围。

第二步,决定分组数和组距。

第三步,决定组限。

第四步,统计观测数据落入各组的频数。

2、请比较众数、中位数和平均数三种统计量的优缺点。

答:

稳定性方面:平均数是最稳定的,中位数稍差一点,众数最不稳定。

分组变化时:平均数影响不大,中位数有些影响,众数影响较大。

受极端值影响方面:平均数受极端值影响,中位数对极端值不敏感,众数有时候对极端值的变动也很敏感。

3、算术平均数的性质是什么?

答:

(1)各变量值与算术平均数的离差之和等于0。

(2)各变量值对算术平均数的离差的平方和,小于它们对任何其他数(X’)偏差的平方和。也就是说,各变量值与算术平均数的离差的平方和为最小值。

(3)算术平均数受抽样变动影响微小,通常它是反映总体分布集中趋势的最佳指标。

(4)算术平均数受极端值的影响颇大,遇到这种情况时,就不宜用它来代表集中趋势了。

(5)分组资料如通有开放组距时,不经特殊处理,算术平均数将无法得到。

4、中位数的性质是什么?

答:

(1)各变量值对中位数之差的绝对值总和,小于它们对任何其他数(X’)之差的绝对值总和。

(2)中位数不受极端值的影响。

(3)分组资料有不确定组距时,仍可求得中位数。

(4)中位数受抽样变动的影响较算术平均数略大,因此中位数作为表示总体资料集中趋势的指标,使用也很广泛。

5、众数的性质是什么?

答:

(1)在分组资料中,众数仅受上下相邻两组频数大小的影响。而不受极端值的影响,因而对分组资料,仍可计算众数。

(2)受抽样变动影响大。

(3)对于给定资料,其反映集中趋势的指标,只有众数不唯一确定。有的资料只有一个众数,有的资料没有众数,有的资料则存在好几个众数。

(4)在频数分布中,众数标示为其“峰”值所对应的变量值,它的优点是帮助我们很容易区分出偏态以及单峰分布和多峰分布。

6、何谓抽样调查?抽样调查的优点是什么?

答:

抽样调查是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,然后用所得到的调查结果来推断总体。

抽样调查的最大优点是省时、省力和节省经费。此外,由于抽样调查的范围较小,调查工作可能做得更加深入细致。错误发生的机会减少,资料的可信程度提高,这也是抽样调查的一个优点。

7、什么是分层抽样?什么是整群抽样?请从它们各自的适用性来谈谈它们的区别。

答:

(1)分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。

(2)整群抽样是从总体中成群地抽取调查单位。也就是说,要先将总体单位分为若干群,再在其中随机地抽取部分群,整群抽样并不以抽样框的获得为前提。

(3)一是:抽取方法方面的差别:整群抽样,抽中群的全部个体都是样本单位,未抽中群的样本单位都不在调查之列。分层抽样则要在所有层中均抽取一个小样本,它们合起来构成总体样本。也就是说,对于分层抽样,调查对象来自所有层,调查结果的代表性自然比较高。

二是:在适用上的基本差别是:分层抽样时,层间差异尽可能大,层内差异尽可能小;整群抽样时,群间差异尽可能小,群内差异尽可能大。

8、Z分数的性质有哪些?

答:

①Z分数之和等于0

②Z分数的算术平均数等于0

③Z分数的标准差等于1,Z分数的方差也等于1

9、简述平均差的性质。

答:

平均差是变异指标,但就其计算的数学方法来看,仍属于算术平均数。所以,平均差在受抽样变动影响、受极端值影响和处理不确定组距这三方面,它的性质均同于算术平均数。

平均差由于计算时采用了取绝对值来消除正负号的影响的方法,它不便于代数运算,而且平均差的意义在理论上也不容易作出阐述。

所以,平均差作为变异指标,其运用比标准差要少得多。

10、概率树的要领

答:

(1)每次试验有几个可能的结果,概率数就有几个分支。

(2)共进行了N次试验,概率树就有N个段。

(3)每个单独的结果的概率等于各段上概率之积。

(4)随机变量X取某个值的概率等于对应单个结果的概率之和。

11、变量之间的关系满足三个条件,才能断定是因果关系。

答:

1)两个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;

2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

12、正态分布的常用性质

答:

(1)只要给出了平均值和标准差,对应的正态分布就完全确定了

(2)平均值决定了分布的中心,它就位于正态曲线的对称中心。

(3)标准差决定了分布的形状,其大小就等于从正态曲线的中心到其右侧(或左侧)曲线的拐点处距离。

(4)在任何正态分布中,68-95-99.7规则都近似成立。

13、非常简单随机样本的特点

答:

(1)抽样分布的中心就是原总体的中心μ,在数学上可以证明的期望值=μ

(2)抽样分布的标注误差比原总体的标准差小,而且样本量N越大,标准误差就越小。

在数学上可以证明的标准误差=

(3)正态总体产生的的正态抽样分布,不过对于非正态总体,即使总体是高度偏斜的,随着样本量的增加,的抽样分布也会近似地变成对称的和正态的。

14、利用置信区间进行假设检验的步骤如下:

答:

(1)陈述原假设

(2)计算单侧的或双侧的置信度为1- 的置信区间

(3)如果H0落在此区间之外,则拒绝H0;如果H0落在此区间之内,则接受H0

(4)得出结论:在的错误水平下,差异是统计上可以(或不可以)分辨的,或者,在的显著性水平下,差异是统计上显著的(或:不显著的)。其中括号内的结果对应于“接受H0”;括号外的结果对应于“拒绝H0”的情形。

15、对于拟合优度检验,解释统计推断的结果时,应注意些什么?

答:首先,当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设。但是,数据少如果否定了零假设,这一否定的可靠性是很大的。

其次,当试验规模极大而得到否定零假设的结果时,需要进一步(使用区间估计等方法)考虑与零假设的偏离有多大,而不能只是宣布一下统计检验的结果就了事。反之,若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持。

五、计算题目(3个)

2-2、在中国台湾的一项《夫妻对电视传播媒介观念差距的研究》中,访问了30对夫妻,其中丈夫所受教育X(以年为单位)的数据如下:

18 20 16 6 16 17 12 14 16 18

14 14 16 9 20 18 12 15 13 16

16 2l 2l 9 16 20 14 14 16 16

(1)将数据分组,使组中值分别为6,9,12,15,18,21,作出X的频数分布表;

(2)作出频数分布的直方图;

(3)问10.5年的教育在第几百分位数上?

答题思路:

(1)由组中值可知,组距为3,共分为6组;每组组限为组中值±1.5;规定上限不计入本组;这样将数据分组如下表:

(2)丈夫所受教育年限X数据直方图(单位:年;n=30)

注意:因为是连续型变量所以选择条形图

(3)10.5年的教育,累积频率为10.00%,前面有10.00%个样本,所以在第10个百分位数上;2-6、在2000年北京申办奥运会有关调查中,某单位20名员工的一个样本表明,他们亲身参加过的与北京申奥有关的活动的件数为

3,3,0,1,3,3,5,2,4,0,0,3,6,1,0,7,3,2,1,2

(1)作频数分布图;

(2)求平均数、中位数和众数;

(3)如果另一单位的20名员工参加活动的件数的均值为2.25,中位数为2,众数为2,那么这个样本参加活动的总数是多少?

1) 频数分布表

频数分布图

注意:因为是离散型变量所以选择条形图

答:2)平均数2.45,中位数2.5,众数3

答题提示:将原始数据排队后,最中间两个数据的平均值即为中位数

3-17、设X为一般的正态变量,计算

1) Pr (X<7.1),如果=5,=2;

2) Pr (X<860),如果=500,=300;

答题思路:

使用公式将正态分布标准化:

Z=

(1)Z = 1.05;

P r ( X <7.1 ) = P r ( Z <1.05 ) =1- P r ( Z > 1.05 )= 1-0.1469=0.8531

(2)Z = 1.2;

P r ( X < 860 ) = 1 - P r ( X > 860 ) = 1 - P r ( Z > 1.2 ) = 1 – 0.1151 = 0.8849

谢谢大家!

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) 分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P =( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学作业一.

社会统计学作业一 特别提示:1、作业提交截至时间:2005年10月11日中午12点; 2、不接收电子版,答案要求手填。 一、某城市有人口211732人,去年发生了47次银行抢劫案,13次谋杀案,23次汽车偷窃案,分别计算每10万人口中这三类案件的犯罪率。 二、

上面是社会学系某年级学生的总评学分绩点,按照这个原始数据,作出四个完整的分布统计表: (1)不分组的频次统计表; (2)利用计算法确定组距画出分组的频次统计表; (3)利用经验法分组的频次统计表,包括标示组限、频次、相对频次,频率,cf↑,cf↓,c%↑,c%↓; (4)利用经验法分组的频次统计表,包括每组的标示上下组限,真实上下组限,组距,组中值和频次。 三、下面的统计表有哪些问题,指出来。并画一个完整的频次和频率统计表,在 表中把真实组限、组距和组中值都列上。 某厂工人的月收入分布 四、下面的图是一个直方图,表示了在药物研究项目中所有14148位妇女的血压 分布。使用直方图回答下列问题:

a) 血压在130mm 以上的妇女的百分数大约是25%,50%,还是75%? b) 血压在90mm 与160mm 之间的妇女的百分数大约是1%,50%,还是99%? c) 在哪个区间有较多妇女:135-140mm 还是140-150mm ? d) 哪个区间更拥挤一些:是135—140mm 还是140—150mm ? e) 在区间125—130mm 内,直方图的高大约为每mm2.1%。多少百分数的妇女 具有这个小组区间里的血压? f) 哪个区间有较多妇女:是97-98mm ,还是102—103mm ? g) 所有的毫米中,哪里最拥挤? 五、三个人使用密度尺度对一项研究中的实验对象的体重绘制了直方图。只有一 个人是正确的。是哪一个,为什么? (1) 100 150 200 (2) (3) 100 150 200 100 150 200 六、下面给出非全日雇员月工资的直方图。没有人一个月挣1000美元以上。200 至500美元的小组区间上的块形不见了,它必定有多高? 每 mm 的百 分数 0 1 2 3 4 90 100 110 120 130 140 150 160 血压(mm )

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案(卷二) 一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类,其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于( )。 7.统计调查从调查范围上分,可分为( )和( )。 8.统计调查按调查登记时间是否连续,可分为( )和( )。 9.统计调查从调查目的上,可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料,属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式,下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件,重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中,选择其中的重点单位进行调查。 5.应用( )方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

2014年秋社会统计学期末复习训练题

2014年秋社会统计学期末复习训练题 一、单项选择题 1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是() A.332.1万户家庭B.3000户家庭 C.332.1户家庭的年均收入D.3000户家庭的年均收入 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为()A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有( ) A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、 54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19B.28.90C.19.54D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比B.各组频数与下一组频数之比 C.各组频数与总频数之比D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9B.0C.0.5D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数B.离散系数C.回归系数D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

2020年自考《社会统计学》模拟试题及答案

2020年自考《社会统计学》模拟试题及答案 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2) ;(3) 。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题

1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细 4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( )

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

社会统计学重点

1.社会调查研究的步骤:1.确定课题。 2.了解情况。 3.建立假设。 4.确定概念和测量方法。 5.涉及问卷。 6.试填问卷。 7.调查实施。 8.校核与登录。 9.统计分析与命题的检验。资料的整理归纳分析以及如何收集资料正是统计分析所要谈论的内容。 2.社会调查资料的特点:随机性和统计规律性。 3.怎样选用统计分析方法:1.全面调查和非全面调查。2.单变量和多变量。3.变量层次. 4.分布概念:指一个概念或变量,它的各个情况出现的次数或频次,又称频次分布。表现形式:数对的集合. 5.变量取值的要求—⑴变量取值必须完备;⑵变量取值必须互斥。 6.统计表:是用表格形式来标识前面所说变量的分布。它不需要文字叙述,就能反应出资料的特性以及资料之间的关系,在编印,传递方面有很大优点,比统计表更精确,但不及统计图直观。 7.统计表必须具备的内容:1.表号。2.表头。3.标识行。4.主体行。5.表尾。 8.根据变量的层次,可以选择以下不同的统计图形:定类变量:圆瓣图、条形图。定序变量:条形图。定距变量:直方图、折线图。 9.圆瓣图:是将资料展示在一个圆的平面上,通常用圆形代表现象的总体,用圆瓣代表现象中一种情况,其大小代表变量取值在总体中所占的百分数。 10.条形图:是用长条的高度来表示资料类别的次数或百分数。定类:离散。定序:离散或紧挨着的。 11.直方图:直方图从图形来看,也是紧挨着的长条形所组成,它与条形图不同,宽度有意义,一般来说,直方图是以长条的面积来表示频次或相对频次,而条形的长度。即纵轴高度表示是频次密度或相对频次密度。频次密度=频次/组距。 12.折线图:如果用直线连接直方图中条形顶端的中点,就是折线图。折线图可使资料的频次分布趋势更一目了然。 13.累计图和累计表:表示的是大于某个变量值的频次是多少或小于某个变量值的频次是多少。 14.众值:就是用具有频数最多的变量值来表示变量的集中值。 15.中位值:是数据序列之中央位置之变量值。未分组:N为奇数时:中位值等于n+1/2. N 为偶数时:中位值等于中间两变量和/2. 根据频次分布求中位值:中位值等于频次的和+1/2.中位值等于求出所对应值所在的区域。分组:1.计算出累计频次,得到累计百分比。2.确定最高频次所在组。 均值:总体各单位数值之和除以总体单位数目所得之商。 统计分析中习惯以X 来表示。 离散趋势测量法:

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

2018年春社会统计学期末复习训练题(4)报告.doc

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

《统计学》作业

《统计学》作业 本课程作业由两部分组成。第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。第二部分为“主观题部分”,由简答题和论述题组成,共15分。作业总分30分,将作为平时成绩记入课程总成绩。 客观题部分: 一、选择题(每题1分,共15题) 1、对于非专业人员而言,统计学原理可以分为()。 A.调查与实验设计 B.描述统计 C.推断统计 D.多元统计分析2、()是统计总体的特征。 A.差异性 B.大量性 C.同质性 D.不可知性 3、说明总体单位名称的是()。 A.指标 B.标志 C.计量单位 D.标识 4、统计学上一般用()来衡量标志。 A.列名尺度 B.顺序尺度 C.间隔尺度 D.比率尺度 5、统计调查按范围可分为()。 A.典型调查 B.重点调查 C.问卷调查 D.抽样调查 6、下列抽样调查方法中属于概率抽样的有()。 A.配额抽样 B.判断抽样 C.简单随机抽样 D.等距抽样7、缺失值处理的方法有()。 A.就近插值 B.删除对应记录 C.随机插值 D.分类插值8、反映社会经济现象总体规模或水平的指标是()。 A.绝对数 B.相对数 C.相对指标 D.总量指标

9、常用的平均指标有()。 A.调和平均数 B.算术平均数 C.众数 D.中位数 10、数据最大值与最小值之差称为()。 A.内距 B.极差 C.方差 D.绝对差 11、探索性数据分析的主题有()。A.耐抗性B.残差C.重新表达D.图示 12、影响时间数列的因素有()。 A.不规则变动 B.循环变动 C.长期趋势 D.季节变动13、测定趋势变动的方法中,修匀方法主要有( )。 A.时距扩大法 B.移动平均法 C.最小二乘法 D.分段平均法 14、影响抽样误差的因素有()。 A.抽样的组织形式 B.抽样方式 C.目标总体的变异程度 D. 15、相关系数( )。 A.可以为负 B.大于等于零小于等于一 C.可以为任意实数 D.绝对值不大于一 主观题部分: 一、简答题(每题2.5分,共2题) 1、什么是统计指标,统计指标有哪些要素? 2、什么是概率抽样,概率抽样有哪些主要形式? 二、论述题(每题5分,共2题) 1、平均指标有哪些类型? 2、什么是探索性数据分析,试阐述探索性数据分析的四大主题。样本容量

相关文档
最新文档