统计学复习1-5

统计学复习1-5
统计学复习1-5

第一章

统计学:收集、处理、分析、解释数据并从数据中得出结论的科学

描述统计:研究数据收集、整理和描述的统计学方法

推断统计:研究如何利用样本数据来推断总体特征的统计学方法

变量、变量的分类:数值变量、分类变量和顺序变量

第二章

抽样方法:简单随机抽样,分层抽样,系统抽样,整群抽样。 搜索数据的基本方法:

第三章

定性数据的图表表示:频数分布表,条形图,帕累托图,饼图,环形图。

定量数据的图表表示:频数分布表,直方图,茎叶图,箱线图,散点图,雷达图

第四章

水平的度量:平均数、中位数、分位数(上四分位Q U 下四分位Q L )、众数

差异的度量:极差、四分位差、方差(样本方差,总体方差)、标准差、离散系数 样本平均数

总体平均数

样本加权平均数 总体加权平均数 实验的数据 自填式 面访式

电话式 调查的数据 搜索数据的基本方法 n x n x x x x n

i i n ∑==+++=121 N x N x x x N

i i N ∑==+++=121 μn

f M f f f f M f M f M x k i i i k k k ∑==

++++++=1212211 N f M f f f f M f M f M k i i i k k k ∑==++++++=1212211 μ

几何平均数

异众比率

四分位差 Q d = Q U - Q L

未分组数据平均差 分组数据平均差

未分组数据 分组数据 总体方差 总体方差

未分组数据 分组数据 样本方差 样本方差

未分组数据 分组数据 总体标准差 总体标准差

未分组数据 分组数据 样本标准差 样本标准差

标准分数

偏态:偏态系数=0为对称分布

偏态系数> 0为右偏分布 1)(122--=∑=n f x M s k i i i N f M K i i i ∑=-=12)(μσN x N i i ∑=-=12)(μσ1)(12--=∑=n x x s n i i 1)(12--=∑=n f x M s k i i i s

x x z i i -=N x N i i ∑=-=122)(μσ1)(122--=∑=n x x s n i i n n i i n n m x x x x G ∏==???=121 ∑∑∑-=-=i

m i m i r f f f f f v 1n x x M n

i i ∑=-=1d n f x M M k i i i ∑=-=1

d N f M K i i i ∑=-=122)(μσ

偏态系数< 0为左偏分布

偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低

偏态系数: 根据未分组数据

根据分组数据

峰态:峰态系数=0扁平峰度适中

峰态系数<0为扁平分布

峰态系数>0为尖峰分布

峰态数据 根据未分组数据

根据分组数据 第五章

概率:对事件发生的可能性大小的度量

离散型概率分布:

二项分布:一次试验只有两个可能结果,即“成功”和“失败”一次试验“成功”的概率为p ,失败的概率为q =1- p ,且概率p 对每次试验都是相同的 ,试验是相互独立的,并可以重复进行n 次 。重复进行 n 次试验,出现“成功”的次数的概率分布称为二项分布,记为X~B(n ,p)。

泊松分布:

连续型概率分布:正态分布

∑??? ??---=3)2)(1(s x x n n n SK 31

3)(ns f x M SK k

i i i ∑=-=[]4224)3)(2)(1()1()(3)()1(s n n n n x x x x n n K i i -------+=∑∑3)(414--=∑

=ns f x M K k i i i ())!(!!)

,,2,1,0(x n x n x n C n x q p C x X P x n x x n -====-式中: ()+∞<<∞-=--x x f x ,e π21)(22212μσσ())0,,2,1,0(!e >===-λλλ x x x X P x

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学基础练习题一

统计学基础(练习题一) 一、单项选择题 1.调查某大学5000名学生学习成绩,则总体单位是() A、5000名学生 B、5000名学生的学习成绩 C、每一名学生 D、每一名学生的学习成绩2.下列属于品质标志的是() A、工人年龄 B、工人性别 C、工人体重 D、工人工资等级 3.要了解我国农村经济的具体状况,最适合的调查方式是() A、普查 B、典型调查 C、重点调查 D、抽样调查 4.按连续型变量分组,其末组为开口组,下限为2000,已知相邻组的组中值为1750,则末组的组中值为() A、2500 B、2250 C、 2100 D、2200 5.某商场2007年空调销售量为6500台,库存年末比年初减少100台,这两个总量指标是() A、时期指标 B、时点指标 C、前者是时期指标,后者是时点指标 D、前者是时点指标,后者是时期指标 6.下列标志中属于品质标志的是() A、年龄 B、工龄 C、职业 D、工资 7.在编制组距数列时,影响组数多少的主要因素是() A、组距 B、全距 C、组中值 D、组距和全距 8.下述各项调查属于全面调查的是() A、对某种连续生产的产品质量进行抽样检验 B、对全国钢铁生产中的重点单位进行调查 C、对某地区工业企业设备进行普查 D、抽选部分地块进行农产量调查 9.下列分组中属于按品质标志分组的是() A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 10.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为() A、230 B、260 C、185 D、215 11.某城市进行工业企业未安装设备普查,个体是() A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 12.几位学生的某门课成绩分别是67分、78分、88分、96分,则“成绩”是() A、品质标志 B、数量标志 C、标志值 D、数量指标

应用统计学期末复习

应用统计学期末复习重点(按题型整理) 一、填空题(10分) 1.统计学的三种含义:统计工作;统计数据或统计信息;统计学 2.统计学的研究对象是群体现象 3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学。 4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法 5.标志是说明总体单位特征的,而指标是说明总体特征的, 6.标志按其性质不同分为数量标志和品质标志两种。按其变异情况可以分为不变标志和可变标志,可变标志称为变量。 7.统计总体具有三个基本特征,即同质性、大量性和变异性。 8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标。 9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。 10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量 11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明

各变量值分布的离中趋势 12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。 13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数。 14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。 15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样。 16.统计分组的关键在于正确选择分组标志和合理划分各组界限 17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。 18.离散变量可作单项式分组或组距式分组,连续变量只能做组距式分组。 19.从统计表的内容看:统计表由主词和宾词两部分构成,从统计表的形式看:统计表包括总标题、横行和纵栏标题、数字资料 20.平均指标可分为两类:计算均值和位置均值。 21.根据算术平均数、众数和中位数的关系,次数分布可以分为对称分布,左偏分布,右偏分布。

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

第三版统计学基础练习题部分答案

第一章 1统计数据可分为哪几种类型不同类型的数据各有什么特点 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 2变量分为那几类:分类变量、顺序变量和数值型变量。 3举例说明离散型变量和连续型变量: 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.

练习书上有答案:需注意:用数值表示的属于数值变量。分类选择的属于分类变量。投票选举的属于顺序变量。 第二章: 简述普查和抽样调查的特点: 抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。 特点:第一普查通常是一次性的或周期性的。第二普查一般需要规定统一的调查时间。第三普查的数据一般笔记哦啊准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本的依据。第四普查使用范围比较狭窄,只能调查一些最基本的、特定的现象。 调查方案包括哪几方面的内容:调查目的、调查对象和调查单位、调查项目和调查表。 什么是调查问卷:它由哪几部分组成 调查问卷是用来收集调查数据的一种工具,是调查者根据调查目的和要求所涉及的,有一系列问题、备选答案、说明以及码表组成的一种调查形式。结构:开头部分、甄别部分、主体部分和背景部分组成。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

27871统计学基础复习资料整理

27871统计学基础复习资料整理

统计学基础 项目1 基础知识 第1讲统计的基本问题 统计理论的产生和发展 1.国势学派:又称记述学派,产生于17世纪的德国,首先使用了“统计学” 这个名词。(有统计学之名,无统计学之实) 2.政治算术学派:起源于17世纪英国,主要代表人物是威廉.配第,著的《政 治算术》,可以说是统计学的创始人。(无统计学之名,有统计学之实) 3.数理统计学派:产生于19世纪比利时,主要代表人物凯特勒,他完成了统 计学和概率论的结合,形成了数理统计学。 统计的含义 有统计工作、统计资料和统计学三种含义 1.统计工作:即统计实践,是对社会经济现象以及自然现象的总体数量进行搜集、整理和分析的活动过程。 2.统计资料:即统计数据,是统计工作的成果,是统计工作过程中所取和的反映社会经济实际情况和变化过程的数字资料,是社会绿洲信息的主体,也是国家制定政策、计划和实行科学管理的数字资料。 3.统计学:是研究统计工作的理论与方法的一门方法论科学,是长期统计工作实践经验和相关理论的科学概括和总结。 4.统计的三种含义之间有着密切的联系。统计资料是统计工作实践的成果,统计学来源于统计工作,是统计工作经验的理论概括,又用理论和方法指导统计工作,推动统计工作不断提高。随着统计工作的进一步发展,统计学不断地充实和提高,二者是理论和实践和关系。由于统计工作、统计统计学联系紧密,所以习惯上把这三者通称为统计。 统计学的性质 统计学历经三百多年的发展,现在已经成为一门横跨社会科学,自然科学等领域的综合性学科。 第2讲统计学的研究对象和研究方法 1.统计学的研究对象是统计研究所要认识的客体。研究对象为大量现象的数量 方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 2.就性质来说,统计学是一门适用于自然现象和社会现象的方法论学科。 3.统计学研究对象的特点:数量性、总体性、变异性和具体性。 4.统计的工作过程:统计设计、统计调查、统计整理和统计分析。 5.统计学的研究方法:大量观察法、统计分组法、综合指标法、动态数列分析 法、指数分析法、抽样推断法、相关分析等。(其中大量观察法、统计分组法和综合指标法贯穿统计研究的全过程,是统计研究的基本方法。 6.大量观察法:是对所研究的经济现象总体中的全部单位或足够量的单位进行

应用统计学期末试卷

南京邮电大学 2010 /2011 学年第 一 学期 《应用统计》期末 试卷(A ) 院(系) 班级 学号 姓名 一、单项选择题(每题2分,共10题,合计20分) (1)一个旅游景点的管理员根据以往的经验,有80%游客照相留念,则接下来的两名游客都照相留念的概率是( )。 A.0.65 B.0.36 C.0.5 D.0.4 (2)从一个装有3个红球2个白球的盒子摸球(不放回),则连续两次摸到红球的概率为( )。 A.0.6 B.0.3 C.0.5 D.0.4 (3)下面属于时期指标的是( )。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 (4)平均发展速度是( )。 A. 定基发展速度的算术平均数 B. 环比发展速度的算术平均数 C. 环比发展速度的几何平均数 D. 增长速度加上100% (5)在回归直线Y =a +bx 中,回归系数b 的意义为( )。 A .x =0时,Y 的期望值 B .X 每变动一个单位引起的Y 的平均变动量 C .Y 每变动一个单位引起的X 的平均变动量 D .X 每变动一个单位时Y 的变动总量 (6)设随机变量2~(3,)X N σ,且(36)0.4P X <<=,则( )0P X <=( )。 A .0.1 B .0.4 C .0.6 D .1 (7)某企业生产某种产品,其产量每年增加5万吨,则该产品的产量环比增长速度( )。 A . 年年下降 B . 年年增长 C . 年年保持不变 D . 无法做结论 (8)设()~X P λ,已知()()12P X P X ===,则()3P X =的数值为( )。 装 订 线 内 不 要 答 题 自 觉 遵 守 考 试 规 则,诚 信 考 试,绝 不 作 弊

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

统计学基础复习题

10级电商《应用统计学》期末复习 一、单选题 1.统计学的研究对象是( A ) A.客观事物的总体数量特征和数量关系 B.统计工作过程 C.总体与样本的关系 D.抽象数量的联系和空间形式 2.按某一标志分组的结果,表现出( A ) A.组内同质性和组间差异性 B.组内差异性和组间差异性 C.组内同质性和组间同质性 D.组内差异性和组间同质性 3.指出下面的数据哪一个属于顺序数据( D ) 个人的年龄分别是25,22,34,41,33 B.性别:男,女 C.上市公司所属行业:金融,房地产,医药,机械制造 D.员工对企业某项改革措施的态度:赞成,中立,反对 4.下列不属于描述统计问题的是( A ) A.根据样本信息对总体进行的推断 B.了解数据分布的特征 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 5.我国六次人口普查规定的标准时间是2010年11月1日0时(截止时间),下列情况应计入人口数的是( D ) 年11月2日出生的婴儿 年10月29日21时出生,10月31日23时死亡的婴儿 年10月29日23时死亡的人 年11月1日3时死亡的人 6.某商场2010年空调销售量为10000台,库存年末比年初减少100台,这两个总量指标是( A ) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 7.某企业某年上半年月产量分别为410、420、380、410、420、420万件,则该企业上半年的平均月产量、中位数和众数分别为( A ) 、415、420 、420、420 、420、420 、420、410 8.下列数列中属于时间序列数据的是( B ) 年我国的国内生产总值 年我国的国内生产总值 年底我国的人口数 年10月我国的进口额 9.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,并不意味两个变量之间存在因果关系 D.绝对值不会大于1 10.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) % % 同时研究居民的消费支出与居民货币收入和消费品价格的数量关系,属于( B ) A.单相关 B.复相关 C.直线回归 D.曲线回归 12.在回归直线$μμ0 1 y x β β=+中,μ1 β表示( C )

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

统计学期末复习资料

《统计学》期末考试 题型壹:名词解释 ①统计学:统计学是关于统计的原理、原则和方法的科学。主要研究和阐明收集、整理与分析客观现象统计资料的原理和方法,同时也揭示统计对象的本质特征和发展规律。(书P2) ②描述统计学:描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理与显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。(书P4) ③统计学研究方法:统计学研究方法是在统计学的研究过程中,根据各不同阶段数量信息资料的处理需要,使用的各种专门方法。概括来说主要有实验设计法、大量观察法、统计描述法和统计推断法。(书P9) ④统计图:统计图是利用几何图形和具体事物的形象来表现统计数据的一种形式。常见的统计图主要有直方图、条形图、折线图、曲线图、圆形图等。(书P48) ⑤统计数据整理:统计数据整理就是对收集到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。(书P31) ⑥统计指数:从狭义上说,统计指数是反映不能直接加总计算的多种事物或现象数量综合变动情况的相对数。(书P156) ⑦因素分析:因素分析就是利用指数体系分析现象总变动中各因素变动的影响方向和影响程度的一种统计分析方法。(书P165) ⑧统计预测:统计预测就是以统计资料为基础,运用统计方法,揭示现象的变化特征、数量关系和发展规律,进而对其未来发展状态做出估计和推断。(书P192) ⑨统计分组:统计分组是根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干组,使组内的差异尽可能小,组间的差距尽可能明显,从而使大量无序的混沌的数据变为有序的、反映总体特征的资料。(书P32) ⑩时间数列:时间数列是指将某一统计指标在不同时间上的数值按照时间先后顺序排列所形成的数列。(书P134) 题型贰:填空题 ①统计学的研究方法概括来说主要有实验设计法、大量观察法、统计描述法和统计推断法。 ②从统计活动的程序来看,统计工作过程主要包括统计设计、统计采集、统计整理和统计分析四个阶段。 ③从研究的层次和方法来看,统计学可以分为描述统计学和推断统计学。 ④根据总体各单位某一数量标志值的变动特征,可供选择的分组方式有单项式分组和组距式分组。 ⑤反映标志集中程度的指标主要有算数平均数、调和平均数、几何平均数、众数和中位数。 ⑥反映标志变异程度的指标主要有全距、平均差、标准差、变异系数等。 ⑦构成时间数列的各种因素,按它们的性质和作用不同,可大致分解为长期趋势、季节变动、循环变动和不规则变动。 ⑧按时间数列指标表现形式的不同,可以把时间数列分为绝对数时间数列、相对数时间数列和平均数时间数列。 ⑨按照编制方法的不同,可以将统计指数分为综合指数和平均数指数。 ⑩按照指数化指标的性质不同,可以将综合指数分为数量指标综合指数和质量指标综合指数。 题型叁:单项选择题

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

统计学基础知识期末复习资料

统计学基础知识期末复习资料 一、名词解释 1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。

8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位 时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。 13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体 成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

统计学基础概念复习

统计学基础概念复习

一、名词解释 1、统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。 2、统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。 3、总体是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体。有无限总体与有限总体之分。 4、总体单位是指构成总体的个别事物。 5、总量指标是反映统计对象总体规模或水平的综合指标,其表现形式为绝对数 6、相对指标也称相对数,它是用两个有联系的指标进行对比的比值来反映现象数量特征和数量关系的综合指标。 7、国内生产总值是指一定时期内(通常为一年)国民经济各部门创造的增加值之和,是反映一个国家或地区所有常住单位生产活动最终成果的指标。 8、统计决策有广义和狭义之分,凡是利用统计方法进行的决策都可称之为广义的统计决策;狭义的统计决策是指在不确定情况下的决策。

9、指标是说明总体数量特征的范畴,一个完整的指标应包括指标名称和指标数值两部分。 10、指标体系是指一系列相互联系的统计指标所构成的整体。 二、填空题 1、中位数是将总体各单位的标志值按大小顺序排列,处于中间位置的那个标志值,通常用M表示。 2、众数是指总体中出现次数最多的标志值,它能够鲜明地反映数据分布的集中趋势。 3、总体的特征有同质性、大量性、差异性 4、直接计算法就是根据全面调查的资料对各个体的数量进行汇总。间接计算法是利用指标之间的数量对等关系或非全面调查资料来推算总量指标的方法。 5、指标体系的种类按其内容可分为:经济指标体系、社会指标体系、科技指标体系。 6、中位数和众数是与算术平均数配合使用的两个位置平均数。算术平均数一般适合于具有集中分布趋势 7、如果数列的数据项数n是奇数,则位于中间的数是第(N+1)/2 项,如果数据项数n是偶数,则取中间两个数值的算术平均数作中位数。

应用统计学期末考试试题A卷

一 、单项选择题(每题2分,共30分) △1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的 ( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C )。 A. 5 B. 45 C. D. 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤,据此计算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为,平均数为70,乙数列的标准差为,平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本 存折抽出一本登记其余额。这样的抽样组织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关

相关文档
最新文档