统计学基础复习题

统计学基础复习题
统计学基础复习题

10级电商《应用统计学》期末复习

一、单选题

1.统计学的研究对象是( A )

A.客观事物的总体数量特征和数量关系

B.统计工作过程

C.总体与样本的关系

D.抽象数量的联系和空间形式 2.按某一标志分组的结果,表现出( A )

A.组内同质性和组间差异性

B.组内差异性和组间差异性

C.组内同质性和组间同质性

D.组内差异性和组间同质性 3.指出下面的数据哪一个属于顺序数据( D )

个人的年龄分别是25,22,34,41,33 B.性别:男,女 C.上市公司所属行业:金融,房地产,医药,机械制造 D.员工对企业某项改革措施的态度:赞成,中立,反对 4.下列不属于描述统计问题的是( A )

A.根据样本信息对总体进行的推断

B.了解数据分布的特征

C.分析感兴趣的总体特征

D.利用图、表或其他数据汇总工具分析数据

5.我国六次人口普查规定的标准时间是2010年11月1日0时(截止时间),下列情况应计入人口数的是( D )

年11月2日出生的婴儿 年10月29日21时出生,10月31日23时死亡的婴儿 年10月29日23时死亡的人 年11月1日3时死亡的人

6.某商场2010年空调销售量为10000台,库存年末比年初减少100台,这两个总量指标是( A ) A.时期指标 B.时点指标

C.前者是时期指标,后者是时点指标

D.前者是时点指标,后者是时期指标

7.某企业某年上半年月产量分别为410、420、380、410、420、420万件,则该企业上半年的平均月产量、中位数和众数分别为( A )

、415、420 、420、420 、420、420 、420、410 8.下列数列中属于时间序列数据的是( B ) 年我国的国内生产总值 年我国的国内生产总值 年底我国的人口数 年10月我国的进口额 9.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强

B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系

C.只是两个变量之间线性关系的一个度量,并不意味两个变量之间存在因果关系

D.绝对值不会大于1

10.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D )

% % 同时研究居民的消费支出与居民货币收入和消费品价格的数量关系,属于( B )

A.单相关

B.复相关

C.直线回归

D.曲线回归

12.在回归直线$μμ0

1

y x β

β=+中,μ1

β表示( C )

A.当x 增加一个单位时,y 增加μ0β的数量

B.当y 增加一个单位时,x 增加μ1β的数量

C.当x 增加一个单位时,y 的平均增加量

D.当y 增加一个单位时,x 的平均增加量 13.下列现象的相关密切程度最高的是( B ) A.某商店的职工人数与商品销售额之间的相关系数为 B.流通费用水平与利润率之间的相关系数为 C.商品销售额与利润率之间的相关系数为 D.商品销售额与流通费用水平的相关系数为

14.编制数量指标指数一般是采用( A )作同度量因素

A.基期质量指标

B.报告期质量指标

C.基期数量指标

D.报告期数量指标 15.问卷设计的主体部分是( C )

A.被调查基本情况

B.引言和注释

C.问题和答案

D.结语 16.一组数据的偏态系数为,表明该组数据的分布是( D ) A.正态分布 B.平峰分布 C.左偏分布 D.右偏分布 17.如果一个样本因人故意操纵而出现偏差,这种误差属于( B ) A.抽样误差 B.非抽样误差 C.设计误差 D.试验误差

18.为了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这种数据的收集方法称为( A )

A.访问调查

B.邮寄调查

C.座谈会

D.个别深度访问 19.下面的陈述中不是评价图形优劣的准则的是( D )

A.精心设计,有助于洞察问题的实质

B.使复杂的观点得到简明、确切、高效的阐述

C.能在最短的时间内以最少的笔墨给读者提供最大量的信息

D.漂亮和美观 20.下面的陈述中不是一张好的图形应包括的基本特征的是( D )

A.让读者把注意力集中在图形的内容上,而不是制作图形的程序上

B.避免歪曲

C.强调数据之间的比较

D.美观和漂亮 21.与直方图相比,茎叶图( B )

A.没有保留原始数据的信息

B.适合于描述小批量数据的分布

C.不能用于描述大数据的分布

D.适合描述分类数据的分布 22.直方图与条形图的区别之一是( A )

A.直方图的各矩形通常是连续排列的,而条形图则是分开排列的

B.条形图的各矩形通常是连续排列的,而直方图则是分开排列的

C.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据

D.直方图主要用于描述各类别数据的多少,条形图则主要用于描述数据的分布

23.对一批进口商品的质量进行假设检验,在显着性水平为时,原假设被拒绝,如果使用的显着性水平,则原假设( A )

A.一定会被拒绝

B.可能会被拒绝

C.一定会被接受

D.重新检验

24.以A 表示事件“吴明喜欢吃烤肉,王兰不喜欢吃烤肉”,其对立事件为( D ) A.“吴明不喜欢吃烤肉,王兰喜欢吃烤肉” B.“吴明和王兰都喜欢吃烤肉”

C.“吴明和王兰都不喜欢吃烤肉”

D.“吴明不喜欢吃烤肉或王兰喜欢吃烤肉” 25.某超市某种商品的销售量与销售价格之间的相关系数是( A ) 二、判断题

1.某音乐会门票标明“1.2米以下半票”,一个小朋友米,应买全票。(√ ){上限不在内}

2.能够对统计总体进行分组,是由统计总体中各个单位所具有的差异性特点决定的。( √ )

3.抽样的样本指标是随机的,则总体也是不能确定的。(× ){后半部分错误}

4.离散型变量可以做单项式分组或组距式分组,而连续型变量只能做组距式分组。(√ )

5.为把握开发区土地利用情况而进行的全国开发区规模和土地利用效益调查属于专门调查。(√ )

6.某厂劳动生产率计划在去年的基础上提高10%,实际仅提高5%,则该厂劳动生产率计划仅完成一半。( × ){实际/计划=5%/100%;劳动:105%/110%=}

7.十分位数就是将全部单位按标志值分成两个部分,即两端的标志值个数相等。(×){10个部分} 8.正相关指的就是两个变量之间的变动方向都是上升的。( × ){相同方向改变,上升与下降} 9.当要检验样本平均数和总体平均数,或样本成数与总体成数是否存在显着差异时,要采用右单侧检验。( × ){没标明差异方向}

10.时间序列也叫时间数列、动态数列,是将不同时间上的同类指标按大小顺序排列而成的数列。( × ){应该按时间顺序}

11.组中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( × ) 12.样本容量是指一个总体一共可以组成多少不同的样本,而样本个数是指一样本中的单位数。( × ){容量-单位数;个数-总体一共可以组成多少不同的样本}

13.点估计和区间估计的主要区别在于,前者不能反映估计的误差和可靠性,后者可以。( √ ) 14.函数关系和相关关系都是指变量之间存在严格的数量依存关系。( × ){“严格”太绝对} 15.正态分布表现为其取值具有对称性,极大部分取值集中在区间外,只有少量取值落在以对称点为中心的小区间内。( × ){区间内-极大部分;区间外-少量}

三、计算题

1. 某银行为吸收存款,逐年提高存款利率,五年各年分别为3%、%、4%、%、5%,若本金为10000元。问:

1)按算术平均数计算平均利率,则第五年年末的实际存款额是多少 2)按几何平均数计算平均利率,则第五年年末的实际存款额又是多少

解:

1)用算术平均数计算的平均利率为:

第五年年末的实际存款额为=10000(1+4%*5)=12000元 2)用几何平均数计算的平均利率为:

2. 某汽车电瓶商声称其生产的电瓶具有均值为60个月、标准差为6个月的寿命分布,现假设质监部门决定检验该厂的说法是否正确,为此随机抽取50个该厂生产的电瓶进行寿命试验。则:(1)假定厂商声称是正确的,试描述50个电瓶的平均寿命的抽样分布;(2)假定厂商声称是正确的,则50个样品组成的样本的平均寿命不超过57个月的概率是多少( F= )

解:

(1)

则根据中心极限定理可以推出50个电瓶的平均寿命的分布服从正态分布,即: (2)如果厂方声称是正确的,则观察得到的50个电池的平均寿命不超过57个月的概率为: 0.030.0350.040.0450.054%

5

x

x n ++++===

∑514%=12166.53G ===第五年末的实际存款额10000(1+4%)

x

600.85μσ=====由于,2~(60,0.85)x N 6057605760

(57)(

)()

0.85

0.85

0.85

x p x p p Z ---≤=≤

=≤

结论:即如果厂方的说法正确,则50个电瓶的平均寿命不超过57个月的概率为,这是一个不可能事件。根据小概率事件原理,观察到50个电瓶的平均寿命小于或等于57个月的事件是不可能的;反之,如果真的观察得到50个电瓶的平均寿命低于57个月,则有理由怀疑厂方说法的正确性,即可认为厂方的说法是不正确的。

3. 学者认为早期教育对儿童智力发展有影响,现在从受过良好教育的儿童中随机抽取70人进行韦氏智力测验,结果平均数为分。若总体平均分为100分,总体标准差为15分,在显着性水平为时能否认为受过良好教育的儿童智力高于一般水平 解:

4. 已知某地区基期农副产品收购总额为360亿元,报告期比基期增长10%,农副产品收购价格指数为108%,报告期与基期相比:

1)农民因销售农副产品共增加多少收入

2)由于农副产品收购价格提高8%,农民增加了多少收入 3)农副产品收购量增加了百分之几农民因此增加了多少收入 4)验证以上三方面的分析结论能否协调一致。

解:设农副产品收购量为q ,农副产品收购价格为p 1)

2)

1110

01

=108%:396108%366.67q p q p p q ==÷=∑∑

∑收购价格指数所以亿元

3)

01:00.05:100:100103.3100 1.8415

1.64

H H x z z z z z z αα

μμμσ≤>--=====>∴Q 落在拒绝域内,所以拒绝原假设。即受过良好教育的儿童智力高于一般水平。1100

11=110%:360*110%396q p q p p q ===∑∑∑收购总额指数所以亿元110039636036p q p q -=-=∑∑农民增加的收入为:亿元11

01

396366.6729.33p q p q

-=-=∑∑农民增加的收入:

亿元

1

00

366.67

=

=101.85%360

q p q p

=

∑∑收购量指数

4)

5.设随机变量k 在[1,6]上服从均匀分布,则方程210x kx ++=有实根的概率是多少

解:

6. 100台车床彼此独立地工作着,每台车床的实际工作时间占全部工作时间的80%,试求:(1)任一时刻有70~86台车床在工作的概率;(2)任一时刻有80台以上车床在工作的概率。( F= , F= , F(0)= ) 解:

将在任一时刻观察每台车床是否工作看成是一次试验,依题意本题可以看做100重贝努里概型,每次试验成功(车床工作)的概率为:p=80/100=

设X 表示100台车床中工作着的车床台数,可见X~B(100,,现利用正态分布近似计算,np=*100=80,npq=16,则:

7.

解:

01

00

366.67-360=6.67p q p q

-=∑∑农民增加的收入:

亿元

2244(2)(2)0

22b ac k k k k ?=-=-=-+≥≥≤-即或k 62(22)(2)(2)1

0.8

5

p k k p k p k dx ≥≤-=≥+≤-==?

或7080808680

(1)(7086)()444

80

( 2.5 1.5)4

(1.5)( 2.5)(1.5)(2.5)10.93320.993810.9270

X p X p X p F F F F ---≤≤=≤≤-=-≤

≤=--=+-=+-=80

(2)(80)(

0)1(0)0.54

X p X p F -≥=≥=-=

总产值指数=

即:该厂总产值报告期比基期上升了%,增加额为21700元。

产量指数=

即:该厂产量报告期比基期上升了%,使总产值增加8800元。

出厂价格指数=

即:该厂出厂价格报告期比基期上升了%,使总产值增加12900元。

8. 公交公司想了解公共汽车的使用时间和年维修费用之间是否存在某种关系,由10辆公共汽车组成一个样本,经计算得到相关数据如下所示:50x =∑,61500y =∑,308200xy =∑,2258x =∑,其中x 代表使用时间(年),y 代表维修费用(元)。根据以上资料,要求:(1)建立以使用时间为因变量的直线回归方程,并解释回归系数的含义;(2)若已知某公车已使用5年,则该公车的维修费用为多少 解:

(1)设维修费用y 与使用年限x 之间的关系式为:y=b1+b2x

则回归方程为:

此回归方程表示公车使用年限每增加1年,维修费用平均增加元。维修费用与使用年限成正比例变动关系,使用年限越长,维修费用越高。

(2)当使用年限为5时,代入回归方程可得维修费用为:

9. 某单位按简单随机重复抽样的方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下: 11

00

263700108.97%242000p q p q ==∑∑11

00

26370024200021700p q p q -=-=∑∑元01

00

250800

103.64%

242000

p q p q

=

=∑∑01002508002420008800p q p q -=-=∑∑

元1101263700105.14%250800p q p q ==∑∑110126370025080012900p q p q -=-=∑

元()

222

2

103082005061500

87.51025850n xy x y b n x x

-=-?-?==?-∑

∑∑∑∑12615005087.55712.51010b y b x =-=-?=12?5712.587.5y b b x x =+=+()

?5712.587.556150y =+?=元元

2)若其他条件不变,将允许误差范围缩小一半,应抽取多少名职工 解:

1)

则抽样平均误差为:

概率保证程度为95%,则=,则抽样极限误差为:

2) 即允许误差缩小一半时,应抽取160名职工。

10. 假设某地区大学四年级男学生的身高(以厘米计)服从正态分布2(175,5.2)N ,今在这个地区

内任选5名大学四年级男学生,问其中至少有两名男学生身高超过180厘米的概率是多少(F=)

解:设X 表示{四年级男生身高},A 表示{男生身高超过180厘米},则:

又设Y={5名大学生中身高超过180厘米的人数},则Y~B(5,,故所求的概率为:

11. 某产品组装生产线中一部件的设计组装时间为15分钟,现根据随机抽选的7名工人的工作时间进行观察,观察结果为(分钟):,,,,,,. 计算工人的组装时间的95%的置信区间。 ( 0.05(6) 2.447t =,0.025(6) 2.969t =,0.05(7) 2.365t =

,0.025(7) 2.841t

=,0.025 1.96Z

=)

解:

12. 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从每天生产的一批产品中按重复抽样随机抽取50包进行检查,测得其平均重量为克,样本标准差为克。(1)确定该种食品平均重量

90%的置信区间;(2)采用假设检验方法检验该批食品的重量是否符合标准要求。(显着性水平为,已知0.0250.05

0.01Z 1.96Z 1.64Z 1.28===,,)

22

30807740()4440113.851401

xf x f x x f f ===-==--∑∑∑∑

样本均值分

样本方差S = 1.69x σ===分0.025 1.96*1.69 3.31x x E Z σ=?==分()(77 3.31)(73.69,80.31)

x x E ±=±=22

`2

4160(0.5)

Z s n n E ===名180175()(180)()5.21(0.96)10.83150.1685X p P A P X P F μσ--==>=>=-=-=5

552(2)(1)1(0)(1)

0.1998

k k k k p Y C p p p Y p Y -=≥=-=-=-==∑15.515.713.615.315.114.513.97103.614.87i x x n

=++++++===∑分钟

0.8145S ==分钟/2

(((14.8 2.969(14.80.914)(13.89,15.71)x t n α±-=±=±=

解:(1)根据题意知食品平均重量90%的置信区间为:

(2)

13. 某农场研究某种农作物耕种深度(x ,厘米)与平均亩产量(y ,千克)的关系,其数据资料如下所示:48x =∑,1800y =∑,15860xy =∑,2454x =∑,n=6。根据以上资料,要求:(1)建立以产量为因变量的直线回归方程,并解释回归系数的含义;(2)估计耕种深度为厘米时的平均某产量是多少 (1)

此回归系数的含义是:当耕种深度增加1厘米时,平均亩产量增加千克。 (2)

当耕种深度为厘米时,平均亩产量为:

/2(101.32 1.64101.320.38x Z α±=±=±即

(100.94,101.70)010.10/2:100:100 5.72z 5.72 1.64

H H x z z z μμ=≠====>=由于落在拒绝域内,所以拒绝原假设;即该批食品的重量不符合标准要求。()

12

2261586048180020.86

645448n xy x y b n x x

-=-?-?==?-∑∑∑∑∑0118004820.86133.1266b y b x =-=-?=01?133.1220.86y

b b x x =+=+()?133.1220.8611.5373.01y

=+?=千克千克

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学期末试卷与答案

2014统计学试卷与答案 一、填空题(每空1分,计10分) 1、统计指标包括 、计算方法、空间限制、时间限制、具体数值和计量单位6个要素。 2、无论采用何种调查方法进行调查,首先都要制定 。 3、质量指标是反映 的指标。 4、8名队员的身高(单位:CM )由低到高排序为: 181,182,182,183,184,185,186,186,身高的中位数是 CM 。 5、假定中国和美国的国民年龄方差相同,现在各自重复随机抽样获取1%的公民来分别估计两个国家国民的平均年龄,其他条件相同的情况下,哪个国家国民平均年龄的估计误差会较小一些 。 6、变量之间完全相关,则其相关系数为 。 7、若逐期增长量每年相等且为正数,则各年的环比发展速度是年年 。(上升,不变,下降)。 8、回归分析中OLS (普通最小二乘法)的原理是 。 9、编制综合指数的特点是 。 10、拉氏指数是把同度量因素的时间固定在 的一种综合指数形式。 二、判断题(每题1分,计10分,请填入“√”或“?”) (× )1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来; ( ×)2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确; ( × )3、凡是离散型变量都适合编制单项式数列; ( × )4、任何变量数列都存在众数; ( √)5、如果o e m m x <<,则变量分布为左偏; ( ×)6、判定系数越大,估计标准误就越大; ( ×)7、正相关是指两个变量的数量变动方向都是上升的; ( √ )8、统计的本质就是关于为何统计,统计什么和如何统计的思想; ( × )9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列; ( √ )10、同度量因素在起到同度量的同时,还具有一定的权数作用。 三、单项选择题(每题1分,计10分)

统计学基础试卷四.doc

2005——2006学年第一学期期末试题(A卷) 一、填空题(每空2分,共20分) 1、统计一词包括三层含义,即()、统计资料和()。 2、品质标志是表明总体单位属性 的特征,只能用()来回答;数量标志是表明总体单位数量的特征,只能用()来回答。 3、在比较两组数据的差异程度时,若它们的平均数相同,用标准差来肓接比较即可; 但若它们的平均数不同,贝炖用()來进行比较才行。 4、统计调查,按其调查对象包括的调查单位多少,可分为全而调查和()。 5、组距式分组时,某一组的组中 值应等于()。 6、一般來说,时间 数列的变动中包含四种影响因索:()、季节变动、 循环变动和()。 7、在进行参数估 计时,根据其形式不同可分为点估计和()两种。 二、单项选择题(每题2分,共10分) ()1、以下指标中属于离散型的有: %1设备台数②总产值 ③利润④人口增长率 ()2、在以下相对数小,属于名数的有: %1今年利润是去年的2倍; %1某地的人口密度为180人/平方公里; %1某企业职工的男女性别比例为3: 1; %1某地的人口出牛率为12%0 ()3、某种材料上月末库存罐和木月末库存量两个指标: ①都是时期指标;②都是时点指标 ③一个时期指标一个时点指标④都是相对指标 ()4、某厂计划规定第一季度的单位产品成本应比去年同期降10%,实际降低8%,则 完成计划为:①8% / 10% ②(1+8% ) / (1 + 10%)

③(1-8% ) / (1-10%)④ 10% / 8% ()5、两个相邻吋期的定基发展水平之比,是这两个吋期的: ①定基发展速度②环比发展速度 ③定基增长速度④环比增长速度

统计学考试试卷A及答案

2012—2013学年第二学期闽江学院考试试卷 考试课程:统计学 试卷类别:A卷□√B卷□考试形式:闭卷□√开卷□ 适用专业年级:2011级金融学、国际贸易学、保险学专业 注明:试卷答案请做在答题纸上。 一、单选题(每题1分,共30分,30%) 1. 下列不属于描述统计问题的是() A根据样本信息对总体进行的推断B了解数据分布的特征 C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据 2. 根据样本计算的用于推断总体特征的概括性度量值称作() A.参数 B. 总体C.样本 D. 统计量 3. 通过调查或观测而收集到的数据称为() A.观测数据 B. 实验数据 C.时间序列数据 D. 截面数据 4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。 A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。 A 系统抽样 B 整群抽样 C 滚雪球抽样 D 判断抽样 6. 下面的哪一个图形最适合于描述结构性问题() A.条形图 B.饼图 C.雷达图 D. 直方图 7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图 8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( ) A.5000 B.7500 C.5500 D.6500 9. 下列关于众数的叙述,不正确的是() A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为() A.平均数 B.规范差 C.极差 D.四分位差 11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是() A.至少有75%的数据落在平均数加减3个规范差的范围之内 B. 至少有89%的数据落在平均数加减3个规范差的范围之内

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

统计学基础试卷(一)

统计学基础模拟试卷(一) 一、单项选择题(只有1个选项是正确答案,每题2分,共20分) 1.统计学的基本方法包括有( ) A.调查方法、整理方法、分析方法、预测方法 B.调查方法、汇总方法、预测方法、实验设计 C.相对数法、平均数法、指数法、汇总法 D.实验设计、大量观察、统计描述、统计推断 2.有意识地选择三个农村点调查农民收入情况,这种调查方式属于() A.典型调查 B.重点调查 C.抽样调查 D.普查 3.直接反映总体规模大小的指标是()。 A.平均指标 B.相对指标 C.总量指标 D.变异指标 4、计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A.小于100% B.大于100% C.等于100% D.小于或大于100% 5.计算平均指标最常用的方法和最基本的形式是()。 A.中位数 B.众数 C.算术平均数 D.调和平均数 6.标准差指标数值越小,则反映变量值() A.越分散,平均数代表性越低 B.越集中,平均数代表性越高 C.越分散,平均数代表性越高 D.越集中,平均数代表性越低 7.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程是()。 A. x y24 6000 ? + = B. x y24 .0 6 ? + = C. x y6 24000 ? + = D. x y6000 24 ? + = 8.某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。第一组和第四组的组中值分别为() A.750和2500 B.800和2250 C.800和2500 D.750和2250

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学试卷五及答案

统计学原理试卷 一、单选题 1.调查某大学2000名学生学习情况,则总体单位是() A 、2000名学生B、2000名学生的学习成绩C、每一名学生D、每一名学生的学习成绩 2.标志是说明( ) A、总体单位的特征的名 B、总体单位量的特征的名称 C、总体质的特征的名称 D、总体量的特征的名称 3.某些不能够或不宜用定期统计表搜集的全面统计资料,一般应采取的方法是() A、普查 B、重点调查 C、典型调查 D、抽样调查 4.下面属于品质标志的是()。 A、工人年龄 B、工人性别 C、工人月工资 D、工人体重 5.下列指标中属于时点指标的是() A、国内生产总值 B、流通费用率 C、人均利税额 D、商店总数 6.某产品单位成本计划1997年比1996年降低10%,实际降低15%,则计划完成程度为() A、150% B、94.4% C、104.5% D、66.7% 7.指标数值随研究范围的大小而增减的综合指标是()。 A、相对指标 B、质量指标 C、平均指标 D、总量指标 8.下列指标属于比例相对指标的是() A、工人出勤率 B、农轻重的比例关系 C、每百元产值利税额 D、净产值占总产值的比重9.下列指标属于总量指标的是() A、人均粮食产量 B、资金利税率 C、产品合格率 D、学生人数 10.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为() A、 600元 B、 533.33元 C 、466.67元 D、 500元 11.标志变异指标是反映同质总体的()。 A、集中程度 B、离中程度 C、一般水平 D、变动程度 12.假定10亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1‰人口,则抽样误差() A、两者相等 B、前者大于后者 C、前者小于后者 D、不能确定 13.当可靠度大于0.6827时,抽样极限误差() A、大于抽样平均误差 B、小于平均误差 C、等于抽样平均误差 D、与抽样平均误差的大小关系依样本容量而定 14.下列等式中,不正确的是() A、发展速度=增长速度+1 B、定基发展速度=相应各环比发展速度的连乘积 C、定基增长速度=相应各环比增长速度的连乘积 D、平均增长速度=平均发展速度-1 15.编制动态数列的基本原则是要使动态数列中各项指标数值具有() A、可加性 B、可比性 C、一致性 D、同质性 16.在物价上涨后,同样多的人民币少购买商品3%,则物价指数为( ) A、97% B、103.09% C、3% D、109.13% 17.若销售量增加,销售额持平,则物价指数( ) A、降低 B、增长 C、不变 D、趋势无法确定

统计学基础模拟试题A卷答案

D.等距抽样 E.类群抽样和整群抽样 4.某商业企业今年同比去年相比,各种商品的价格总指数为115%,这一结果说明( AD )。 A.商品价格平均上涨了15% B.商品零售量平均上涨了15% C.商品零售额平均上涨了15% D.由于价格提高使零售额上涨了15% E.由于价格提高使零售量下降了15% 三、判断题 1.当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。(√) 2.抽样调查和典型调查的主要区别是调查目的不同。(×) 3.按数量标志分组的目的,就是要区分各组在数量上的差别。(×) 4.标志变异指标的数值越大,平均数的代表性就越低。(√) 5.在计算综合指数时,要求同度量因素所属时期不变。(√) 四、填空题 1.统计指标按所反映的数量特点不同,可以分为数量指标和质量指标。 2.在对变量进行分组时,如果将一个变量值作为一组称为单项式分组;如果把某一区间的变量值作为一组则称为组距式分组。 3.相对指标数值的表现形式有有名数和无名数两种。 r 1 ;若变量x与y之间为完全4.若变量x与y之间为完全正相关,则相关系数= r -1 。 负相关,则相关系数= 5.增长量由于采用的基期不同有逐期增长量和累积增长量之分。 五、简答题 1.什么是统计分布?它包括哪两个要素? 答:统计分布就是在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布。其实质是把总体的全部单位按某标志所分的组进行分配所形成的数列,所以又称为分配数列或分布数列。 统计分布由两个构成要素所组成: (1)总体按某标志所分的组 (2)各组所占的单位数——次数。 2.强度相对指标和其他相对指标的主要区别是什么? 主要区别: (1)其他各种相对指标都属于同意总体内的数量进行对比,而轻度相对指标除此之外,也可以是两种性质不同的但又有联系的属于不同总体的总量指标之间的对比。(2)计算结果表现形式不同。其他相对指标用无名数表示,而强度相对指标主要是用有名数表示。 (3)当计算强度相对指标的分子、分母的位置互换后,会产生正指标和逆指标,而其他指标不存在正、逆指标之分。

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

2018统计学基础试卷A

2018统计学基础试卷A

2017—2018学年第二学期17 级《统计基础》试卷(试 卷编号 A ) 考试形式:闭卷(开卷/闭卷) 一、填空题:(每空1分,共10分) 1、调查项目通常是以或的 方式来体现。 2、综合指数中,数量指标指数是研究的变动,所以要假定其同度量因素固定在基期不变。 3、由于采用的基期不同,增长量分为和。 4、现象间的普遍联系、相互制约往往表现为相互依存的关系,这种关系通常有两种类型,即 和。 5、分配数列包括两个基本要素,一是,二是。 二、名词解释:(每小题2分,共10 分)

1.抽样推断 2.综合指数 3.移动平均法 4.发展水平 5.总量指标 三、判断正误,并简述理由(正确的在 括号内划“√”,错误的划“×”。每小

题1分,共10分) ()1、相对指标是认识社会经济现象总体的起点。 ()2、通常将样本单位数不少于40个的样本称为大样本。 ()3、通过编制时间数列可以描述社会经济现象的发展过程。 ()4、平均增长速度不能根据各个环比增长速度直接求得。 ()5、统计分组的关键是选择分组标志和划分各组界限。 ()6、若商品销售量增长10%,商品零售价格也增长了10%,则商品销售额增长20%。 ()7、抽样调查是非全面调查中最有科学根据的方式方法,因此,它适用于完成任何调查任务。()8、回归标准误差小,说明模型的拟合精度高,从而进行统计分析结论的可靠性就大,反之,回归标准误差大,说明模型拟合的精度低,则统计分析结论的可靠性就低。 ()9、职工人数是时点指标,人均工资是时期指标。 ()10、简单算术平均数是加权算术平均数的特例。 四、单项选择题(将正确的字母序号填 入括号。每小题1分,共10分) 1、要了解40名学生的学习情况,则总体单位是()。 A、40名学生 B、每一名学生

统计学考试试题及答案

统计学考试试题及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学原理》期末考试题 一、单选题{每小题2分,共12分} 1.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 2.反映不同总体中同类指标对比的相对指标是( B)。 A.结构相对指标 B.比较相对指标 C.强度相对指标 D.计划完成程度相对指标 3.在组距分组时,对于连续型变量,相邻两组的组限(A ) A.必须是重叠的 B.必须是间断的 C.可以是重叠的,也可以是间断的 D.必须取整数 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 5.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A ) A.缩小为原来的% B.缩小为原来的50% C.缩小为原来的25% D.扩大为原来的四倍 6.下列哪两个变量之间的相关程度高(C )。 A.商品销售额和商品销售量的相关系数是0. 9 B.商品销售额与商业利润率的相关系数是0. 84 C.平均流通费用率与商业利润率的相关系数是一 D.商品销售价格与销售量的相关系数是一

二、多选题(每小题2分,共8分) 1.要了解某地区的就业情况( ABE) A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.反映每个人特征的职业是数量指标 E.某人职业是教师是标志表现 2.影响加权算术平均数的因素有(AB ) A.各组频率或频数 B.各组标志值的大小 C.各组组距的大小 D.各组组数的多少 E.各组组限的大小 3.简单随机抽样(ACDE ) A.适用于总体各单位呈均匀分布的总体 B.适用于总体各单位标志变异较大的总体 C.在抽样之前要求对总体各单位加以编号 D.最符合随机原则 E.是各种抽样组织形式中最基本最简单的一种形式 4.下面哪几项是时期数列(BC ) A.我国近几年来的耕地总面积 B.我国历年新增人口数 C.我国历年图书出版量 D.我国历年黄金储备 E.某地区国有企业历年资金利税率 三、填空题(每小题2分.共10分) 1.变量按其取值的连续性可分为(离散变量)和(连续变量)两种。 2.统计调查根据(被研究总体范围)可分为全面调查和非全面调查,根据(调查登记时间是否连续)可分为连续调查和不连续调查。 3.总体是非标志(0,1)分布的平均数为P ,方差为P(1-P)。

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

统计学基础试题以及答案

一、单项选择题(每题1分,共15分) 1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104% 105 C 、%96% 95 D 、%4%5 13、某企业报告期产量比基期产量增长了10%,生产费用增长了8%,则其产品单位成本降低了( )。 A 、1.8% B 、2% C 、20% D 、18% 14、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( )。 A 、增加% B 、增加约3/5 C 、减少约3/5 D 、没有什么变化 15、若某总体次数分布呈左偏分布,则成立的有( )。 A 、x > e M >o M B 、x o M >e M D 、以上都不对 1、ACD 2、ACDE 3、BC 4、ABCDE 5、ADE 6、ABD 7、CD 8、AC 9、ABC10、ACE 二、多项选择题(每题2分,共20分) 1、下列各项中属于品质标志的有( )。 A 、性别 B 、年龄 C 、职务 D 、民族 E 、工资 2、从表式上看,统计表由哪些部分构成( )。 A 、总标题 B 、主词 C 、纵栏标题 D 、横行标题 E 、指标数值 3、在相对数中,子项和母项可以互换位置的有( )。

相关文档
最新文档