统计学简答题

统计学简答题
统计学简答题

1.5.1如何理解统计学的性质?

答:为了更好地理解统计学的性质,我们应明确以下三个方面的问题。其一,统计学研究的对象是客观现象的数量方面;其二,统计学研究的是群体现象的数量特征与规律性;其三,统计学是一门方法论的科学。

1.5.2统计数据有哪些基本分类?

答:统计数据有三种基本分类。一是按其采用的计量尺度不同,统计数据可以分为分类数据、顺序数据、数值型数据;二是按其收集方法不同,统计数据可以分为观测数据和实验数据;三是按被描述的对象和时间的关系不同,统计数据可以分为截面数据、时间序列数据和混合数据。

1.5.3什么是描述统计学和推断统计学?

答:描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。

推断统计学(Inferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。

1.5.4什么是统计总体?它具有何特点?

答:统计总体就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体,简称为总体。总体具有以下三个特点:

其一,同质性,是指构成总体的个别事物在某个方面(或某一点上)必须具有相同的性质,这是构成总体的必要条件。其二,变异性,是指构成总体的个别事物除了至少在某一个方面具有相同的性质以外,其他方面应该存在差异,这是进行统计研究的前提。其三,大量性,是指构成总体的个别事物要求足够的多,这是探究客观事物规律性的基础。

1.5.5什么是样本?它具有何特点?

答:从全及总体中抽取出来,作为代表这一总体的部分单位组成的集合体称为样本。

样本有以下显著的特点:其一,构成样本的单位必须取自全及总体内部,不允许总体外部的单位参加抽样过程;其二,从一个全及总体中可以抽取许多个样本;其三,样本具有代表性;其四,样本具有客观性。从全部总体中抽取样本,必须排除主观因素的影响。

1.5.6 什么是统计指标与指标体系?

答:统计指标是反映统计总体数量特征的概念和数值。

统计指标体系是由一系列相互联系的统计指标所组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。

2.5.1 在选择次级数据时应该注意什么?

答:(1)应根据研究目的选择次级数据;(2)注意次级数据变量名称的含义是否发生变化;(3)注意次级数据的计算口径和计算方法是否一致;(4)注意尊重次级数据所有者的权益。

2.5.2什么是普查?组织普查时,应该注意什么问题?

答:普查是国家为了详细地了解某项重要的国情国力而专门组织的一次性全面调查,主要用来调查属于一定时点上现象的总体特征。组织普查时,应该注意(1)要规定统一的标准时点;(2)严格设定必需的调查项目;(3)尽可能地缩短普查登记期限;(4)按一定的周期进行同类普查。

2.5.3抽样调查具有什么特点?

答:(1)从总体中随机抽取样本单位;(2)抽样调查的目的是根据样本的数量特征推断总体的数量特征;(3)抽样误差可以事先计算并且加以控制。

2.5.4统计数据的具体收集方法有哪些?

答:有访问调查法、问卷调查法、德尔菲法、电话调查法、电脑辅助调查法、小组座谈法、观察法、实验法、网络调查法等。

2.5.5 什么是访问调查法?访问调查法的特点是什么?

答:访问调查法是调查者通过与被调查者的当面交谈而得到所需资料的调查方法。在访问调查中,调查人员可以直接了解被调查者对调查问题的态度、观点、举止和调查现场的环境等,为判断调查资料的准确程度提供一定的依据。与其他调查法相比,访问调查法的特点有:回答率较高、数据比较准确、可使用较复杂的问卷、调查成本高等。

2.5.6什么是德尔菲法?德尔菲法的特点是什么?

答:德尔菲法是指按照规定的程序,采用邮寄或电子邮件的方式,反复多次地收集各地专家的看法,使不同意见趋于一致的调查方法。德尔菲法有匿名性、定量化和轮回反馈式等特点。

2.5.7一份完整的调查方案,应该包括哪些内容?

答:(1)调查目的;(2)调查对象、调查单位和报告单位;(3)调查项目与调查表;

(4)调查时间、调查方式与方法;(5)调查的组织工作。

2.5.8为了保证原始统计资料的准确性,在确定调查项目时应该注意什么问题?

答:(1)调查项目的含义必须明确,不能模棱两可;(2)考虑取得资料的可行性,有些调查项目虽然需要,但在现有条件下难以取得资料的则不应列入;(3)调查项目的答案应满足完备性和互斥性。如果要求选择回答,则必须列出所有可能的答案,以免出现重复或遗漏;(4)确定不同时期同类调查的调查项目时,前后时期的调查项目应互相衔接,以便进行动态比较分析。

2.5.9设计问卷的提问项目时一般应注意遵循哪些规则?

答:(1)问题的顺序安排应注意逻辑性;(2)问题的顺序安排应注意兴趣;

(3)问题的顺序安排应注意先易后难;(4)开放性问题一般放在最后。

2.5.10什么是问卷中的封闭性问题?封闭性问题答案的设计有哪些类型可供选择?

答:封闭性问题是指调查者已经设计好若干个答案,被调查者只需从中选择一个或一个以上答案的问题。其答案的设计有两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法等可供选择。

2.5.11分类数据和顺序数据的图示方法各有哪些?

答:分类数据的图示方法包括条形图、Pareto图、对比条形图和饼图;顺序数据的图示方法包括累计频数分布图和环形图。

2.5.12数据分组应注意什么?

答:(1)保持组内单位的同质性和组间单位的差异性;(2)统计分组要符合穷举性原则;(3)统计分组要符合互斥性原则。

2.5.13数值型数据的图示方法有哪些?

答:数值型数据的图示方法包括直方图、茎叶图、箱线图、线图、二维或三维散点图、气泡图、雷达图等。

2.5.14统计表由哪几个部分组成?

答:统计表有多种具体形式,但不论哪种形式的统计表,从外形看都由表头、行标题、列标题和数字资料四个部分组成。

2.5.15简述统计表的设计规则。

答:(1)合理安排统计表的结构;(2)统计表的总标题、行标题、列标题都要能简明扼要地说明有关内容;(3)统计表的左右两端一律不封口;表的上下两端一般用粗线,其他的中间线都用细线隔开;(4)表中数据一般采用右对齐形式,有小数点时以小数点对齐,同栏数据要具有同一精确度;不要求填写或不可能有答案的表格单元,一般用“—”表示,在数字资料区不能出现“同上”、“同左”等文字;(5)若使用的是次级资料,应在表的下方注明资料来源,既显示对原作者的尊重,又便于读者查对。有时还需要在表的下方附上简明的指标解释。

3.5.1什么是集中趋势?测度集中趋势的主要指标有哪些?

答:集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具有一般水平的量,这个量不是某一个具体变量值,但又要反映这些数据的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形式。

3.5.2什么是调和平均数?调和平均数与算术平均数有何关系?

答:调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数。

从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。

3.5.3什么是几何平均数?其应用场合是什么?

答:几何平均数也称几何均值,它是n个变量值乘积的n次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零,则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。

3.5.4什么是离散趋势?测度离散趋势的主要指标有哪些?

答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。

描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。 3.5.5 什么是偏度和峰度?如何根据偏态系数和峰度系数判断数据分布的形态? 答:偏度是描述数据分布对称性的特征值。

峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。 根据皮尔逊测度法测算的偏态系数

p

SK ,经验证明,在适度偏态的情况下,

33

p SK -≤≤。当

,0

o p x M SK ==时,数据分布呈对称分布;当

,0

o p x M SK >>时,数据分布呈右(正)偏分布;当

,0

o p x M SK <<时,数据分布呈左(负)偏分布。

根据中心矩法计算的偏态系数α,当0α=时,数据分布呈对称分布形态;0α<,数据分布呈负(左)偏态;0α>,数据分布呈正(右)偏态;α值越接近于0,数据分布越趋于对称,α的绝对值越大,数据分布越偏斜。

根据峰度系数β

,当0

β=时,分布曲线为正态曲线;当0>β时,分布曲线为高峰曲线,表明变量值的差异程度小,平均数代表性好;当0

<β时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。 4.5.1说明随机变量X 的方差()

D X 的意义。

答:指X 分布在其均值()

E X 附近的分散程度,

()

D X 越小,分布越集中在

()

E X 的附近,反之,则越分散。

5.5.1未知参数

q 的点估计与区间估计主要有哪些不同之处?

答:⑴定义不同。点估计就是用一个统计量

()

1,,n T X X 作为未知参数

q 的估计;而区间估计是指用两个统计量

()()11,,,,,n n X X X X q q 构造一个随机区间()

,q q ,该区间以1a

-的概率包含未知参数q

⑵估计可靠性的刻画不同。点估计没有给出估计的可靠性,而区间估计在给出随机区间的同时,也给出这一区间包含未知参数的概率。

5.5.2若总体X 的分布未知,而方差

2

s

已知,可否选用统计量

x Z =

m 进行区间估计?

答:当样本量n 很大时

()30n 3是可以的,因由中心极限定理,知样本均值X 渐近正态分布,即

2~,X N n s m 骣÷

?÷?÷÷

?桫,从而

()0,1X Z N =

故可用Z 对进行区间估计。

5.5.3 有人认为:假设检验中,给定检验水平

a ,对于检验假设0H ,犯弃真错误的概率为a ,则犯采伪错误的概率为1a

-,你说对吗?

答:如果犯弃真错误的概率为a ,犯采伪错误的概率为b

,一般情况下,1b a

?,因为“采伪”与“弃真”并不一定是对立事件。在假设检验

中,我们无论作出接受还是拒绝原假设的判断,都是依据小概率事件在一次试验中几乎不可能发生的原理,既然是几乎,当然就有例外,如果例外,就犯错误。

5.5.4正态分布的主要特征有哪些?

答:(1)图形呈钟型、中间高、两头低、左右对称;(2)最高处对应于

x 轴的值就是均数(位置参数);(3)标准差决定曲线的形状(形状参数);

(4)曲线下面积为1;(5)是一个正态分布簇,经Z 变换可转换为标准正态分布;(6)其他分布(如t 分布、F 分布、2c 分布、二项分布、

Poisson 分布等)的基础。

5.5.5简述评价估计量好坏的标准。

答:一般将同时满足以下三条标准的估计量称为优良估计量。

⑴无偏性,即

()

?E q

q =,称

?q 为q 的无偏估计量。⑵有效性,即()1?E q q =,()2?E q q =,且()()12

??D D q q <,则相对2

?q 来说,1?q 是q 的有效估计量。

⑶一致性,即当任意给定0e >时,有{}?lim 1n P q q e

-<=即当n 时, ?q 依概率收敛于q ,则称?q 为q 的一致估计量。

5.5.6怎样确定假设检验问题的零假设和备择假设?

答:通常零假设表示结果的差异是随机因素引起,而不是系统性或结构性因素引起;备择假设是研究者要证明的假设,要认为其正确必须有显著证据才能被人接受;零假设是受到保护的假设。 5.5.7临界值检验法有那些步骤?

答:(1)确定零假设和备择假设,(2)确定检验统计量及其分布,(3)根据样本观测数据计算检验统计量的观测值,(4)根据检验统计量的分布和显著性水平确定检验的临界值,进而确定拒绝域,(5)判断检验统计量的观测值是否落于拒绝域,是,则拒绝零假设,否则,不能拒绝。 5.5.8怎样理解假设检验问题的P 值?它与显著性水平什么关系?

答:P 值是零假设为真时,检验统计量得到至小象观测值那么极端情形的概率,通常称为观测的显著性水平,是零假设能被拒绝的最小显著性水平。 6.5.1比较非参数统计方法与参数统计方法的区别。 答:(1)对总体依赖不同;(2)对参数的假定不同;(3)适用的数据类型不同;(4)适用的范围不同。 6.5.2简述非参数检验的局限性。 答:(1)可能会浪费一些信息;特别当数据可以使用参数模型的时候。Example: Converting Data From Ratio to Ordinal Scale ;(2)大样本手算相当麻烦;(3)一些表不易得到。

7.5.1方差分析包括哪些类型?它们有什么区别?

答:方差分析包括单因素方差分析和双因素方差分析,双因素方差分析又分为有交互作用的双因素方差分析和无交互作用的双因素方差分析,单因素方差分析只能判断一个因素对试验数据是否有显著影响,双因素方差分析可以判断二个因素是否对试验数据有显著影响。 7.5.2简述方差分析的基本思想。

答:一方面,同一总体内部的各数据是不同的,其差异可以看成是由于随机因素造成的;另一方面,不同总体的各数据也是不同的,这既可能是由于总体数据的平均水平不同造成的,也有可能是由于随机因素造成的。要判断随机因素和总体均值差别哪个是造成各数据不同的主要原因,在假设遇到的都是正态总体、各总体的方差无显著差异和各数据相互独立的条件下,可进行正态总体均值是否相等的检验,即用F 检验解决系统因素是否是造成数据差异的主要原因的问题。 7.5.3方差分析中有哪些基本假定? 答:(1)遇到的都是正态总体;(2)各总体的方差无显著差异;(3)各数据相互独立。 7.5.4简述方差分析的步骤。 答:方差分析的步骤为:(1)建立假设;(2)计算有关均值及平方和;(3)列方差分析 表;(4)统计决策。

7.5.5简述单因素方差分析表的内容。

7.5.6如何进行方差分析中的多重比较?

答:多重比较法是通过对总体均值之间的配对比较来进一步检验到底是哪些均值之间存在差 异的统计方法。其基本步骤为: (1)提出原假设:

0:i j

H μμ=;(2)计算各检验统计量

i j

x x -的值;(3)计算LSD ;

(4)根据显著性水平α

进行决策:如果i j x x LSD

- 的值,则拒绝0H ;否则,则接受0H 。

7.5.7有交互作用双因素方差分析的检验统计量是什么? 答:

/(1)

(1,(1))/((1))A A E S r F F r rs t S rs t -=--- ,/(1)(1,(1))/((1))B

B E S s F F s rs t S rs t -=---

/((1)(1))

((1)(1),(1))

/((1))

A B A B E S r s F F r s rs t S rs t ??--=

----

7.5.8简述双因素方差分析表的内容。

7.5.9简述试验设计原则的内容。

答:(1) 重复性原则:重复性是指对一项试验要在相同的条件下重复进行若干次。只有进行 多次的试验,才会对其有深刻的认识,并进一步掌握其规律性。

(2) 随机化原则:随机化是指试验材料和试验地点都要随机地确定。这样进行试验得出 的结论才具有客观性和普遍性,且每次进行的试验都可认为是相互独立的。

(3) 区组化原则:一组试验,试验者总希望在相同或近似相同的条件下进行,以便在相 互比较中得出正确的结论。

8.5. 1什么是相关关系?相关关系与函数关系有何区别?

答:相关关系是指变量之间客观存在的非严格确定的依存关系;函数关系是指变量之间存在的严格确定的依存关系。

函数关系中当一个或几个相互联系的自变量取一定的值时,因变量必定有一个且只有一个确定的值与之对应,而相关关系中,当一个或几个相互联系的自变量取一定的数值时,与之对应的因变量往往会出现几个不同的值,但这些数值会按某种规律在一定范围内变化。 8.5.2什么是单相关、复相关和偏相关?请各举一例说明。

答:单相关是指两个现象之间的相关,即一个变量对另一个变量的相关关系。如居民家庭可支配收入与消费支出之间的关系。

复相关是指一个变量与两个或两个以上其他变量之间的相关关系。例如,某种商品的销售量与其价格水平以及人们收入水平之间的相关关系便是一种复相关。

偏相关是指在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系。例如,在假定人们的收入水平不变的条件下,某种商品的销售量与其价格水平的关系就是一种偏相关。 8.5.3什么是线性相关和非线性相关?请各举一例说明。

答:线性相关是指两种相关现象之间在直角坐标系中近似地表现为一条直线时的相关关系。例如人均消费水平与人均收入水平通常呈线性关系。 非线性相关是指两种相关现象之间在图上并不表现为直线形式而是表现为某种曲线形式时的相关关系。例如产品的平均成本与产品总产量之间的相关关系就是一种非线性相关。

8.5.4什么是相关分析和回归分析?它们之间有何联系和区别?

答:相关分析是指研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法。

回归分析是指根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法。

两者之间的联系:相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

两者之间的区别:(1)相关分析中,变量x 与变量y 处于平等地位,不需要区分自变量和因变量;回归分析中必须区分自变量和因变量;(2)相关分析中所涉及的变量y 与x 全是随机变量,而回归分析中,因变量y 是随机变量,自变量x 可以是随机变量,也可以是非随机的确定变量; (3)相关分析的研究主要是刻画两类变量间线性相关的密切程度,而回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制。

8.5.5回归分析有哪些基本假设?

答:有关误差项的基本假设有:(1)误差项的期望值为0,即对所有的i 有:

()0i E ε=;

(2)误差项的方差为常数,即对所有的

i 有

22var()()i i E εεσ==;

(3)误差项之间不存在自相关关系,其协方差为0,即当j i ≠时,有cov(,)0i j εε=;(4)自变量是给

定的变量,与随机误差项线性无关;(5)随机误差项服从正态分布。

8.5.6什么是P 值?说明其在假设检验中的应用。 答:所谓的

P 值是一个条件概率值,是在原假设0H 为真的假设下,由样本观察值计算得到的对原假设0H 可信程度的一个度量。

对于给定的α

值,当P 值<α时,拒绝原假设0H ;当P 值≥α

时,接受原假设

0H 。

8.5.7说明样本决定系数的含义及其作用。 答:样本决定系数

2r 是指总离差平方和中回归平方和所占的比重,用以反映回归直线与样本观测值拟合优度的统计分析指标。2r 反映了因变量

的变化中能用自变量解释的比例。2

r 的值总是在0和1之间,也可以用百分数表示。

样本决定系数2r 的取值在[0,1]区间内,2r 越接近1,表明回归拟合的效果越好;2r 越接近0,表明回归拟合的效果越差。与F 检验相比,2

r

可以更清楚直观地反映回归拟合的效果,但是并不能作为严格的显著性检验。 8.5.8非线性回归分析应解决哪些主要问题?

答:非线性回归分析必须解决两个主要问题:一是如何确定非线性回归函数的具体形式;二是如何估计函数中的参数。对于前一个问题,要注意非线性回归函数不同于线性回归函数,它有不同的表现形式,需要根据所要研究的问题的性质并结合实际样本观测值做出恰当的选择。对于后一个问题,要注意虽然非线性回归分析中最常用的参数估计方法仍然是最小二乘估计法,但需要根据函数的不同类型进行适当变换,先将非线性函数转换为线性函数,再利用最小二乘法估计参数。 10.5.1什么是统计指数,它有何作用?

答:统计指数的概念有广义和狭义之分。广义的指数指一切反映社会经济现象数量变动的相对数。狭义的指数指反映复杂总体多种要素在数量上综合变动情况的相对数。

统计指数的作用主要有如下三个方面:

(1) 指数可以综合反映社会经济现象总变动方向及变动幅度;

(2) 指数可以分析现象总变动中各因素变动的影响方向及影响程度; (3) 指数可以反映社会经济现象的变动趋势。 10.5.2简述统计指数的分类。

答:统计指数从不同角度可以作如下分类:

按研究范围不同,统计指数可分为个体指数和总指数;按编制指数的方法论原理不同,指数可分为简单指数和加权指数;按指数性质不同,指数可分为数量指数和质量指数;按反映的时态状况不同,指数分为动态指数和静态指数;按编制指数数列时指数所选用的基期不同,指数可分为环比指数与定基指数。按编制指数数列时指数选用的权数不同,指数可分为可变权数指数和不变权数指数。 10.5.3什么是同度量因素?同度量因素在统计指数中有何作用?

答:指数理论中,通常将引入的使复杂现象同度量化的媒介因素(在指数计算公式中分子、分母处于相同水平的因素)称为同度量因素。它在编制指数中不仅起到同度量的作用,还起到权数的作用,所以又称为权数。

10.5.4简述基期加权综合法与加权算术平均法在计算数量指数时的区别与联系。

答:用基期加权综合法编制数量总指数时,将同度量因素固定在基期的水平上来计算指数,这种方法编制的综合指数又称为拉氏指数;用加权算术平均法计算数量指数时,是以个体指数为变量值,以一定时期的总值数据为权数,对个体指数加权算术平均计算总指数。

区别与联系:实质上,加权算术平均法计算指数的公式是基期加权综合法计算综合指数公式的变形形式。在实际应用中,加权平均法既可以使用全面资料,也可以使用非全面资料。如果用加权算术平均法计算数量指数时使用的是全面资料,个体指数与基期总值数据之间存在严格的应关系,其计算结果的实际意义与基期加权综合法的完全相同。若依据的是非全面资料计算总指数,其计算结果的实际意义与基期加权综合法的有一定差别。 10.5.5简述报告期加权综合法与交叉加权综合法在计算价格指数时的异同。

答:用报告期加权综合法编制价格总指数时,将同度量因素固定在报告期的水平上计算指数,这种方法编制的价格指数又称为派氏价格指数;用交叉加权综合法计算价格指数时,引入的同度量因素就是相应指标的基期水平与报告期水平的平均值,这种方法编制的价格指数又称为马歇尔—埃奇沃斯价格指数。

异同:依据同一资料,用两种方法计算的价格指数在一定程度上能够综合反映价格的变动方向及变动幅度。但是,因两种方法采用的同度量因素不同,计算的结果有时差异很大。经济学家们认为,因为选用的权数的原因,用报告期加权综合法计算的物价指数比实际的指数偏低,用交叉加权综合法计算价格指数是一种折衷的办法。另外,在编制物价地区性指数时,在销售量构成差别较大的情况下,采用交叉加权综合法来编制物价地区性指数比较合理。

10.5.6简述指数体系的概念及作用。

答:在统计分析中,将多个相互联系、相互影响,在数量上存在严格的推算关系的统计指数所构成的整体称为指数体系。 指数体系是进行因素分析的基础。构建指数体系的目的,就是要分析多种因素的变动对经济总体变动的影响情况。 10.6.7指数体系和指数数列有何区别?

答:在统计分析中,将多个相互联系、相互影响,在数量上存在严格的推算关系的统计指数所构成的整体称为指数体系。指数数列,指反映同一现象在不同时期综合变动情况的一系列指数,按时间顺序排列所组成的序列。

两者的特点及编制的目的各不相同。指数体系中各指数之间存在严格的数量依存关系,彼此可以相互推算。指数数列一般不具备这一功能。构建指数体系的目的是为进行因素分析服务的,而编制指数数列目的是要反映现象在一段时期内连续发展变动的趋势。 10.5.8简述指数数列的概念及种类。

答:指数数列,指反映同一现象在不同时期综合变动情况的一系列指数,按时间顺序排列所组成的序列。

指数数列,按各指数对比的方式不同可分为定基指数数列和环比指数数列;按各指数权数选择不同,指数数列可分为不变权数指数数列和可变权数指数数列。

11.5.1什么是综合评价?综合评价的类型有哪些?

答:对评价客体的不同侧面的数量特征给出系统的量化描述,并以此为基础,运用一系列数学、统计学和其他定量方法进行适当综合,得出反映各评价客体较为真实的综合数量水平的数量分析方法。

综合评价的主要类型有:1.按目的划分,综合评价可分为分类问题、排序问题和整体水平评价问题;2.按时间状况分,综合评价可分为纵向评价问题、横向评价问题;3.按使用方法分综合评价可分为使用传统方法的综合评价问题、使用现代方法的综合评价问题;4.按定量化程度分综合评价可分为定性评价、定量评价和半定性评价问题;5.按赋权方法分,综合评价方法分为主观赋权法、客观赋权法、主客观结合赋权法。 11.5.2简述进行综合评价的基本步骤。 答:综合评价的基本步骤有:(1)确定评价的目的;(2)确定评价对象和属性集;(3)对属性集中的指标数据进行搜集和处理;(4)确定权重系数和价值函数;(5)给出评价结果;(6)对评价结果进行检验;(7)分析和运用评价结果。 11.5.3简述指标体系建构的原则。 答:指标体系建构的原则有:(1)目的性原则;(2)层次性原则;(3)整体性原则;(4)操作性原则;(5)导向性原则;(6)简要性原则(不重复);(7)实际需要性原则。

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

厦门大学统计学原理期末试题与答案完整版

厦门大学网络教育 2013-2014学年第一学期 《统计学原理》复习题 、单选题 1、统计调查方法体系中,作为“主体”的是( A ) A .经常性抽样调查 B.必要的统计报表 2、考虑全国的工业企业的情况时,以下标志中属于不变标志的有( A .产业分类 B.职工人数 C.劳动生产率 3、某地区抽取3个大型钢铁企业对钢铁行业的经营状况进行调查,这种调查是 4、下列这组数列15,17,17,18,22,24,50,62的中位数是(C )。 现象之间的相关程度越低,贝刑关系数越( 接近+1 B 接近-1 接近0 8、假定其他变量不改变,研究一个变量和另一个变量间的相关关系的是( 9、已知两个同类型企业职工平均工资的标准差分别为 8元,12元,则两个企业职 工平均工资的代表性是(A ) 10、( C 。是标志的承担者。 C.重点调查及估计推算 D.周期性普查 D.所有制 A .普查 B .典型调查 C.重点调查 D .抽样调查 A.17 B.18 C.20 5、标志变异指标中最容易受极端值影响的是( A.极差 B.平均差 &简单分组与复合分组的区别在于( 总体的复杂程度不同 选择分组标志的性质不同 A. C. D.22 C. B. D. 标准差 D.标准差系数 ) 组数多少不同 选择的分组标志的数量不同 7、 A.偏相关 B.正相关 C.完全相关 D.复相关 A.甲大于乙 B.乙大于甲 C. 一样的 D.无法判断

11、 下列各项中属于数量标志的是(A ) A.年龄 B.学历 C.民族 D.性别 12、 某商品价格上涨了 5%,销售额增加了 10%,则销售量增加了( C ) A. 15% B. 5.2 % C. 4.8 % D. 2 % 13、某变量数列末组为开口组,下限是 500;又知其邻组的组中值是 480,则该组 的组 中值应为(D )0 B.时间和指标数值 C.时间和次数 20、现象总体中最普遍出现的标志值是( A ) A.变量 B.总体 C.总体单位 D.指标 A. 490 B. 500 C. 510 D. 520 14、根据最小二乘法原理所配合的一元线性回归方程,是使( B )0 无 (Y -Y?)2 为最小 送(Y -Y?) = 0 A S (Y -Y ) = 0 C 送(Y -Y )为最小 15、 以下不是统计量特点的是( A.不确定 B.已知 16、 不属于专门调查的有(A A.统计年报 B.抽样调查 C.未知 C 普查 17、 今有N 辆汽车在同一距离的公路上行驶的速度资料, Z xf B. ----- Z f C 旦 C 7 x D.不唯一 D.典型调查 m 表示路程,x 表示速度, ) D. 18、 抽样推断的特点有(B )0 A.事先人为确定好样本 C.缺乏一定的科学性和可靠性 19、 时间数列的构成要素是( B.按随机原则抽取样本 D.事先无法计算和控制抽样误差 A.变量和次数 D.主词和宾词 A.众数 B.中位数 C.平均数 D.频数 21、定基发展速度等于相应的各环比发展速度(C A.之和 B.之差 C.之积 D.之商 22、平均指标不包括(A ) 0 A.标准差 B.调和平均数

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

统计学简答题完整

三、简答题(每题10分,共30分) 16.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是 连续变量。 (1)网络供应商的姓名:定性变量。分) (2)每月的网络服务费:定量变量,连续变量。分〉 (3)每月上网时间:定量变量,连续变量。分〉 (4)上网的主要目的:定性变量。分) (5)上周收到的电子邮件数量:定量变量,离散变量(1分) (6)每月用于网上购物的金额:定量变量,连续变量(1分) (7)上月网上购物的次数:定量变量,离散变量。分) (8)使用的电脑的品牌:定性变量(1分) (9)上网是否玩游戏:定性变量。分) (10)电脑是否带有光盘刻录机:定性变量。分) 17.调查方法主要包括哪几种?简要说明各种方法的优缺点。 (1)问卷法 问卷法:是调查者根据一定的目的和要求,采用事先设计好的问卷,向被调查者了解情况,征询意见的一种方法。问卷法广泛应用于社会学、人口学、教育学、管理学、心理学等领域中。(1分) 问卷调查的主要优点是:获得的资料便于进行定量分析;节约时间、人力和经费;应用范围广;结果具有较高的信度。不足之处:(1)变量间的因果关系方面相对较弱;对事物的理解和解释的深入性及效度相对较差;所得资料比较表面化、简单化。(1分) (2)访谈法 访谈法:是指由调查员直接对被调查员进行访问和交谈,并记录调查结果的方法。访谈法是以口头语言为中介、调查者与被调查者面对面的交谈和互动的过程。(1分) 访谈法的主要:优点是:调查的回答率较高;调查资料的质量较高;调查对象的适用范围较高。缺点主要有:访 谈员的语言、表情等可能会影响被调查者的回答;对访谈员的要求比较高;匿名性较差;调查的时间比较长、费用比较高。(1分) (3)观察法 观察法是指研究者深入到所要研究对象的生活背景中,在实际参与研究对象的日常生活 的过程中直接记录研究对象的有关资料的方法。(1分) 观察法的主要优点是:能获得更真实的结果;调查结果不受研究对象的意愿和回答能力的影响;可以更快更准确的收集到想要的数据。观察法的缺点主要有:观察到的只是行为,而对于心理、态度、观点等没法公开的只能是通过观察到的行为推测,而不能直接得到;观察所得到的资料往往无法重复;对观察者的要求较高,观察者必须具备较强的敏感性、领悟能力。(2分) (4)典型组讨论 典型组讨论是由8-12个具有某些共同特征或经历的人,在一个经过专门培训的主持人 的引导下、围绕着某一专门话题进行互动小组讨论的一种定性调查方式。(1分) 典型组讨论的主要优点是:能够从一组人口中比较快得获得丰富的信息;所得的信息更加 丰富和深入,分析和报告更加生动;鼓励参与者互相回应和交流,为了解差异和不同视角、确认答案提供了渠道;典型组讨论的方式弹性比较大、灵活性比较强,适用面广o缺点主要有:参与者具有一定的偏差性;实施比较复杂,参与者的募集比较麻烦;参与者之间的互动可能会产生不利的影响;讨论内容和答案偏重于发现,元暇确认信息;得到的信息在汇总、分析、

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

统计学简答题

统计学简答题 1、统计的含义与本质是什么? (1)“统计”一词可以有三种含义:统计活动、统计数据、统计学 统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段; 统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据; 统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。 (2)统计的本质是关于为何统计,统计什么,和如何统计的思想。 2、统计学的学科性质: 1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。 2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。 3、统计学就其研究方式而言,具有描述性和推断性的特点。 3、总体、样本、个体三者关系如何?试举例说明。 总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体; 样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。 (1)总体与个体的关系(可变性) 总体容量随着个体数的增减可变大或变小; 随着研究目的的不同,总体中的个体可发生变化; 随着研究范围的变化,总体与个体的角色可以转换 (2)样本与总体的关系 样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。 样本是用来推断总体的。 总体和样体的角色是可以改变的。 4、理解标志、指标、变量三者的含义?标志与指标的联系与区别? 标志是用以描述或体现个性特征的名称; 统计指标简称指标,是反映现象总体数量特征的概念及其数值; 从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。 (1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。 (2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。 5、什么是统计指标体系?有哪些表现形式? 同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式: 数学等式关系:若干统计指标之间可以构成一个等式关系 相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征 相关关系:各个指标之间的存在着一定的相关关系 原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果

统计学简答题完整版

一、统计的含义和本质是什么P2 含义:“统计”一词可以有三种含义:统计活动、统计数据和统计学。统计活动是对各种统计数据进行搜集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理和统计分析三个阶段;统计数据是通过统计活动获得的、用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何搜集、整理和分析统计数据的科学。 本质:统计的本质就是关于为何统计,统计什么和如何统计的思想。 二、统计数据有哪些分类不同类型数据有什么不同特点P7 1.统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据。定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据两种。定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。 2.统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数。绝对数是用以反映现象或事物绝对数量特征的数据,有明确的计量单位。相对数是用以反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现联系关系。平均数是用以反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 3.统计数据按照其来源不同,可以分为观测数据与实验数据两类。观测数据是通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。实验数据是在人为控制的条件下,通过实验的方式而获得的关于实验对象的数据。 4.统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。原始数据是指直接向调查对象搜集的、尚待加工整理、只反映个体特征的数据。次级数据也称为加工数据或二手数据,是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 5.统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据。时序数据是对同一现象在不同时间上搜集到的数据(即空间状态相同,时间状态不同)。截面数据是对一些同类现象在相同或近似相同的时间上搜集到的数据(即空间状态不同,时间状态相同)。 三、总体和样本概念以及它们之间的关系如何P14 概念:总体,就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体。样本,就是从总体中抽取的一部分个体所组成的集合。 关系:1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。对样本进行观测的目的是要对总体数量特征做出估计或判断,即通常所说的以样本推断总体。 3.总体和样本的角色是可以改变。随着考察角度的改变,一定的研究总体也可成为另一意义上总体的一个样本,这说明总体与样本的角色是可以改变的。 四、标志和指标之间的关系如何P17 区别:1.指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征。 2.指标和标志的表现形式不同,指标是用数值来表现的,而标志则既有只能用文字来表现的品质标志,又有用数值来表现的数量标志。 联系:1.标志是计算统计指标的依据,即统计指标数值是根据个体的标志表现综合而来的。 2.由于总体与个体的确定是相对的、可以换位的,因而指标与标志的确定也是相对的、可以换位的。 五、统计数据收集方案包括哪些内容P25 数据收集目的(why)、数据及其类型(what type)、数据收集对象与观测单位(whom)、观测标

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

统计学简答题

1、描述统计与推断统计有何区别和联 系? 描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的方法。 联系:描述统计学和推断统计学是现代统计学的两个组成部分呢,相辅相成、缺一不可,描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。 2、统计数据的类型有哪些?(P5-6) 按照计量尺度不同,可分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法可以分为观测数据和实验数据;按照被描述的现象与时间的关系可分为截面数据和时间序列数据。 3、简述数据误差来源?(P33-38) 统计数据的误差来源分为抽样误差和非抽样误差。抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。非抽样误差是相对抽样误差而言的,是指除抽样误差之外的由于其他原因引起的样本观察结果与总体真值之间的差异。 4、衡量数据离散程度的指标有哪些 (P96-104) 衡量数据离散程度的指标有:1.异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;2.四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;3.方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 5、为什么说正态分布是客观现象中最主 要的分布?(P142) 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 6、有人说,标准化与中心化的两个变量的 协方差就是它们的相关系数,你认为正 确吗?请说明理由? 7、请你说明小概率原理的含义?(P213, 最后一段) 一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 8、评价估计量的标准有哪些?并解释它 们的含义(P179-180) 一般地说,一个好的估计量应具备三个标准:无偏性、有效性和一致性。 无偏性是指估计量分布的数学期望等于被估计的总体参数。有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。一致性是指随着样本量的增大,点估计量的值越来越接近于被估总体的参数。 9、假设检验的理论基础和推理方法是什 么?(P210-213) 进行假设检验的基本原理就是小概率原理。小概率原理是说概率很小的事件(称为“小概率事件”)在一次试验中几乎是不可能发生的。 根据小概率原理进行假设检验的方法就是概率意义下的反证法,其思想是:为了检验原假设 H是否正确,我们首先假定“0H 正确”,然后来看在 H是正确的假定下能导出什么结果。如果导出一个与小概率原理相矛盾的结果,则说明“ H正确”的假定是错误的,即原假设 H不正确,于是我们应作出否定原假设 H的决策;如果没有导出与小概率原理相矛盾的结果,则说明“ H正确”的假定没有错误,即不能认为原假设 H是不正确的,于是我们应作出不否定原假设 H的决策。 10.假设检验的一般步骤?(P212-213) 假设检验的一般步骤:1.根据所研究问

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

统计学简答题(完全)

简答题 1.一个完整的统计调查方案包括哪些主要内容 (1)确定调查目的。 (2)确定调查对象和调查单位。 (3)确定调查项目,拟定调查表。 (4)确定调查时间和时限。 (5)确定调查的组织和实施计划。 2.简述品质标志与数量标志的区别。 品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表示。 品质标志本身不能直接汇总为统计指标,只能对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量。 数量标志表明总体单位数量方面的特征,其标志表现可用数值表示,即标志值。 数量标志值可直接汇总综合出数量指标。 3.时期指标有什么特点 (1)时期指标的数值是连续计数的,表示现象在一段时期内发生的总量; (2)时期指标具有累加性; (3)时期指标数值的大小与时间长短直接相关,时期越长,时期指标数值就越大。 4.影响抽样平均误差的因素有哪些 (1)总体各单位标志的变动程度(总体内部差异程度); (2)抽样单位数的多少; (3)抽样组织方式; (4)取样方法(重复抽样或不重复抽样)。 5.品质标志与质量指标有何区别和联系 区别:品质标志说明总体单位的属性特征,只有名称,没有数值;而质量指标是统计指标中的一种,是说明统计总体特征的综合性数值,由指标名称和指标数值两个部分组成。 联系:品质标志与质量指标之间本身没有直接的关系只是在进行统计分析时,可以利用按某一品质标志分组的资料,计算各组某种质量指标,研究这种质量指标在各组之间的变动规律,这时两者之间便产生了一定的联系。 6、时期指标与时点指标有何区别 (1)时期指标反映现象在一段时期内发展过程的总数量 时点指标表示现象处在某一时刻上的状态 (2)时期指标可以累计相加; 时点指标则不能 (3)时期指标数值的大小与计算时期长短有直接关系; 时点指标数值的大小与时间间隔长短没有直接关系

相关文档
最新文档