第三章社会统计资料的整理

第三章社会统计资料的整理
第三章社会统计资料的整理

第三章社会统计资料的整理

原始资料杂乱无章,需加整理,才能为人所用。统计资料的整理,其基础是统计分组。所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。

第一节统计分组的原则与标准

统计分组的标志分为数量标志和品质标志两大类。按国际惯例,无论采用何种标志进行统计分组,都应遵循以下一般原则:(1)分组应使各类别构成之和等于总体;(2)分组设计应能反映统计总体的分布规律性。

在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定顺序归类整理,即可得到能够表明总体单位总数在各组分配情况的频数(或次数)分布数列,简称数列。频数分布数列是统计分组工作的产物。显然,按品质标志进行分组,我们可以得到品质数列;按数量标志进行分组,我们可以得到变量数列。

统计分组的关键在于选择分组标志和划分各组界限。一般来讲,按品质标志来分组,其差别比较明确,区分也较容易。按数量标志来分组则不同,对于划分各组界限,变量数列有较大的任意性。如果划分不当,不仅容易混淆各组的差别,也可能无法反映变量的分布特征。在统计整理和统计分析中,广泛应用变量数列,借以观察某一数量标志的变动及其分布状况。因此,如何编制变量数列是我们重点需要掌握的。

第二节统计表

统计调查搜集来的资料往往是没有次序的原始资料,使原始资料有序化,列表和作图是两种基本方法,得到的分别就是统计表和统计图。变量数列是统计表的一种常用形式。

1.统计表的格式、内容与种类

统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。统计表的主要功用是汇总和积累统计资料,以简捷和有条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。

统计表通常有一定格式:总标题、横行标题(表侧)、纵栏标题(表头)、统计数值(表身)。统计表从内容上看,是由主词和宾词两部分构成的。主词是统计表所要说明的对象,它可以是总体各单位的名称、总体的各个组或总体单位的全部。宾词是用来说明主词的标志和标志值(或指标名称和指标数值)。主词通常列于表的左瑞,宾词通常列于表的上端。但有时为了编排合理和阅读方便,也可以互换位置,将主词置于表的上端,将宾词置于表的左瑞。

统计表的种类是按主词和宾词交叉划分的。统计表按主词是否分组以及分组的程度,可分为简单表、简单分组表和复合分组表。统计表按宾词如何表达和配置,可分为简单设计两种。

2.统计表的制作规则

第三节 变量数列的编制

在社会统计学中,总体中各单位的分布特征首先是用统计表来表示的。能够表示变量分布及其特征的统计表,即变量数列。它的编制,在社会统计资料的整理中有特殊的意义。 变量数列有两个构成要素;①变量值——用来分组并按大小顺序排列的数量标志的具体数值,用符号i X 表示;②频数——总体单位在各组中出现的次数,用符号i f 表示。将各组频数除以总体单位总数N (也称总体容量),就得到相对频数,简称频率.用符号i P 表示。用频率也可以将变量分布的状况清晰地表示出来。

变量数列的编制比较复杂,这不仅因为划分各组界限有较大弹性,而且因为因变量有离散变量和连续变量之别,需分别加以讨论。

1.对于离散变量

离散变量所描述的对象的数量特征,可以按一定次序列出它的整数值,相邻两变量值不会出现小数.因而能编制出单项式和组距式两种变量数列。所谓单项数列,是指数列中每一个变量值一组,有几个变量值就有几组;所谓组距数列,是指数列中每一组由两个变量值的一个差值范围来表示。

首先,离散变量的整数值如果变动幅度较小,可以将每一个变量值列为一组,编制单项数列。其次,离散变量的整数值如果变动幅度较大,而且总体单位数N 又很大,则要编制组距数列。组距数列又有等距和异距两种。组距数列的首组和末组还有开口组和闭口组之别。

对离散变量编制组距数列的具体做法是:在变量值变动的最大范围内,将全部变量值依次划分为几个区间,一个区间内的所有变量归为一组。

变量值变动的最大范围称为全距(R );区间距离(i h )称为组距;组距两端的数值称为组限;上限与下限之差就是组距;上限和下限之间的中点数值(i m )称为组中值。

2.对于连续变量

连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只能编制组距数列。与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重合。至于恰等于某一组限的数据归于哪一组,应该按照“上限不包括在内”的原则处理。有了这一规定,就不会在编制连续变量的数列时,发生违背“穷举”与“互斥”这两个基本原则的情况了。

3.组距和组数的确定

显然,组距和组数两者成反比关系。因为等距分组和闭口组有编制方便、便于计算和便于绘制统计图等优点,因而统计分组应尽量采用等距分组以及闭口组。但是如果碰到有极端值的情况,就要采取首组“向下开口”或末组“向上开口”的方式来处理。异距分组主要在变量变动很不均匀而有急剧上升或突然下降之类情况发生时考虑。有时,为了适应某项专门工作的需要,也采用异距分组。

4.累计频数

累计频数一般用大写字母F来表示。累计又分向上累计和向下累计。所谓向上累计,是以变量数列首组的频数为始点,逐个累计各组的频数,每组累计频数展示了小于该组上限的频数合计有多少。所谓向下累计,则是以变量数列末组的频数为始点,逐个累计各组的频数,每组累计频数展示了大于该组下限的频数合计有多少。当然,累计也可以根据相对频数分布来进行,得到的便是相对频数累计(或百分数累计)了。

第四节统计图

频数分布不但可以用统计表的形式表现,也可以用统计图的形式表现。用统计图表示频数分布,较之用统计表,要直观便捷得多。但缺点是不及统计表精确。统计图的种类很多,本书使用的统计图有频数(频率)分布图、时间数列的历史曲线、相关关系的散点图等等。

根据编制好的频数分布数列,可以绘制出相应的统计图,最常用的有频数分布直方图、折线图、曲线图以及累计频数分布曲线。具体方法是:先画直角坐标,横轴代表分组或各组组限,纵轴代表各组频数或频率,然后再根据相应的分配数列作图。

洛仑兹(Lorenz)曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。洛仑兹曲线的特点是在纵轴和横袖两个方向上都进行累计。

20世纪初意大利经济学家基尼(Gini)根据洛仑兹曲线提出了一种判断社会收入分配平

均程度的指标,用G表示。设实际收入分配曲线和收入分配绝对平均线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以A+B的商表示不平均程度。这个数值被称为基尼系数。

第六章-《数据与统计图表》各节知识点及典型例题

第六章《数据与统计图表》各节知识点及典型例题 第一节、数据的收集与整理第二节、条形统计图和折线统计图第三节、扇形统计图第四节、频数与频率 第五节、频数直方图 章节知识框图 【课本相关知识点】 1、数据收集可以通过直接观察、测量、实验和调查等手段得到,也可以通过查阅文献资料、使用互联网查询等间接途径得到 2、将数据分类、排序是整理数据的常用方法;当然分组、编码也是整理数据的常用方法。 3、人们根据研究自然现象或社会现象的需要,对所有的考察对象作调查,这种调查叫做全面调查。 4、抽样调查:人们在研究自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象进行调查,而是从所有对象中抽取一部分作调查分析,这就是抽样调查。特别注意:①抽样调查要具有广泛性(要具有相当的样本容量)和代表性(各个阶层或类型对象都要具有),即样本容量要恰当,因此对象不宜太少;②调查对象应随意抽取,即每个个体被选中的机会都相等。 5、在统计中,我们把所要考察的对象的全体叫做总体,把组成总体的每一个考察对象叫做个体。从总体中取出的一部分个体叫做这个总体的一个样本,样本中个体的数目叫做样本的容量。样本的容量是不带单位的。 6、对数据收集和整理后,就可以制作统计表。一个完整的统计表不能缺少标题(统计表的名称)、标目、数据(有单位要注明单位)以及制表日期 【典型例题】 【题型一】数据的收集方法 例1、如果就下列情况进行统计,你准备采用哪种方式来收集数据?填在后面的横线上 (1)学校足球队队员的身高

(2)每年到杭州西湖观光旅游的人数 (3)A、B、C三种品牌电池的使用寿命 (4)明天7时~8时进入易初莲花超市的人数 【题型二】根据实际情况对数据进行整理 例2、某乡镇企业生产部门有技术工人10人,生产部为了合理制定每月的生产定额,统计了这10人某月的加工零件个数如下:40,80,50,75,50,70,50,40,35,50 (1)为了使这组数据更为直观,你将怎样处理这组数据? (2)若生产定额能够使大多数人都能完成即为合理的生产定额,假如你是生产部负责人,你认为每月的生产定额应定为多少比较合理? 练习、(2011?南昌)以下是某省2010年教育发展情况有关数据:全省共有各级各类学校25000所,其中小学12500所,初中2000所,髙中450所,其它学校10050所;全省共有在校学生995万人,其中小学440万人,初中200万人,高中75万人,其它280万人;全省共有在职教师48万人,其中小学20万人,初中12万人,高中5万人,其它11万人. 请将上述资料中的数据按下列步骤进行统计分析. (1)整理数据:请设计一个统计表,将以上数据填入表格中. (2)分析整理后的相关数据,小学、初中、高中三个学段的师生比,最小的是哪个学段?(师生比=在职教师:在校学生数) 【题型三】利用数据的收集与整理知识解决实际问题 例3、(2003?安徽)某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基 (1 (2)另一方面,游客认为调整收费后风景区的平均日总收入相对于调价前,实际上增加了约9.4%.问游客是怎样计算的? (3)你认为风景区和游客哪一个的说法较能反映整体实际?

数据与统计图表知识点

数据与统计图表知识点-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

数据与统计图表知识点 一、抽样: 人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样。 在统计中,我们把所要考察的对象的全体叫做总体,把组成总体的每一个考察的对象叫做个体,从总体中取出的一部分个体的集体叫做这个总体的一个样本,样本中的个体的数目叫做样本的容量。 二、常见的统计图: 常见的统计图有条形统计图、折线统计图、扇形统计图三种,在解决实际问题时,具体选择用哪种统计图,要依据统计图的特点和问题的要求而定。 1.条形统计图: (1)条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。条形统计图又分为条形统计图和复式条形统计图。 (2)特点:能够显示每组中的具体数据;易于比较数据间的差别;如果要表示的数据各自独立,一般要选用条形统计图。 (3)绘制方法: ①为了使图形大小适当,先要确定横轴和纵轴的长度,画出横轴和纵轴; ②确定单位长度,根据要表示的数据的大小和数据的种类,分别确定两个轴 的单位长度,在横纵、纵轴上从零开始等距离分段; ③用长短(或高低)不同的直条来表示具体的数量,直条的宽度要适当,每 个直条的宽度要相等,直条之间的距离也要相等; ④要注明各直条所表示的统计对象、单位和数量,写上统计图的名称、制图 日期,复式条形图还要有图例。 2.折线统计图: (1)折线统计图用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来,以折线的上升或下降来表示统计数量增减变化。 (2)特点:折线统计图能够清晰地显示数据增减变化。如果表示的数据是想了解随时间变化而变化的情况,那么就采用折线统计图。 (3)绘制方法: ①根据统计资料整理数据; ②用一定单位表示一定的数量,画出纵、横轴; ③根据数量的多少,在纵、横轴的恰当位置描出各点; ④把各点用线段按顺序依次连接起来; ⑤统计图中的数据是不是统计资料整理的数据。 3.扇形统计图:

第三章 统计资料整理

第三章统计资料整理 通过统计调查所取得的资料只能反映总体各单位的具体情况,是分散的、零碎的、个别的,要说明事物的总体情况,揭示总体的一般情况,还需对这些资料进行加工整理,才能对总体做出概括性的说明。 1、统计资料整理的一般问题 (1) 统计整理的概念、作用、重要性 统计整理是根据统计研究的目的和要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已经初步加工的资料进行再加工,使之成为系统化、条理化的综合分析,以反映现象总体特征的工作过程。 统计整理是整个统计工作的中间环节,统计整理是统计调查的继续,又是统计分析的基础,具有承前启后的作用。统计调查所搜集到的资料只有经过科学的审核、分类、汇总等整理工作,才能实现由个体到总体、由现象到本质、由感性到理性的转变。 (2) 统计整理的程序 1、制定整理方案 2、数据审核 就是对搜集到的资料进行全面审核,主要检查数据的完整性(是否遗漏)和准确性(是否可靠),如果发现问题,及时纠正,以保证搜集的资料准确无误,这是统计工作十分重要的环节,必须认真对待。 3、划类分组 根据研究目的和统计分析的需要,对原始资料进行分组分类。 例如:研究性别构成可以按性别分组;研究不同职业的工资水平可以按照职业分组,又可以按照某一组距进一步细分。 4、综合汇总 即在分组的基础上,将各项资料进行汇总,得出反映各组和总体的总量指标。 例如:女性总人口数、男性总人口数、总人口数;金融业人均工资、会计类人均工资、教师类人均工资、公务员人均工资、农民工人均工资等。(注意:前者总量指标,后者为平均指标) 5、制表制图 将整理出来的统计结果用统计表或统计图的形式反映出来,表述统计资料的内容 6、积累保管

社会统计学 复习资料

1、参数:是一个变量。我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。 ?2、列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。 ?3、备择假设:又称研究假设,是我们在社会学研究中事先安排的假设。通过抽样调查有充分根据否定原假设,是与原假设相反的假设,用H1表示,是当原假设被推翻时需要接受的假设。备择假设有三种形式,以H0为=Z0为例,当H0被否定,可能被采用的H1为>Z0,?

统计基础知识第三章统计整理习题及答案

第三章统计整理 一、单项选择题 1.统计分组对总体而言是(B )(2012年1月) A.将总体区分为性质相同的若干部分 B.将总体区分为性质不同的若干部分 C.将总体单位区分为性质相同的若干部分 D.将总体单位区分为性质不相同的若干部分 2.统计表中的主词是指( A )(2011年10月) A.所要说明的对象 B.说明总体的统计指标 C.横行标题 D.纵列标题 3.某课题需要搜集资料,课题组成员从《统计年鉴》摘取有关资料,这种资料是( D ) (2011年1月) A.原始资料 B.第一手资料 C.初级资料 D.次级资料 4.按照分组标志性质的不同,统计分组可分为按品质标志分组和( A ) (2011年1月) A.按数量标志分组 B.平行分组 C.交叉分组 D.复杂分组 5.对于不等距数列,在制作直方图时,应计算出( B ) (2010年10) A.次数分布 B.次数密度 C.各组次数 D.各组组距 6.U型分布的特征是( B )(2010年1) A.两头小,中间大 B.中间小,两头大 C.左边大,右边小 D.左边小,右边大 7.在次数分布中,频率是指( D )(2010年1) A.各组的次数之比 B.各组的次数之差 C.各组的次数之和 D.各组次数与总次数之比 8.对企业职工按技术等级分组,这样的分组属于( C ) (2009年10) A.简单分组 B.复合分组 C.按品质标志分组 D.并列分组 9.按某一标志分组的结果表现为( C )(2009年1月) A.组内差异性,组间同质性 B.组内同质性,组间差异性 C.组内同质性,组间同质性 D.组内差异性,组间差异性 10.某连续变量数列,其第一组为开口组,上限为500,已知第二组的组中值为540,则第一组的组中值为( D )(2008年10月) A.480 B.420 C.450 D.460 11.反J型分布的特征是( D ) (2011年1月) A.两头小,中间大 B.中间大,两头小

第二章统计数据的搜集与整理

第二章统计数据的搜集与整理 一、教学目的与要求 通过本章的学习,了解统计数据的计量尺度和数据的类型,了解绝对数和相对数的意义及比例和比率的计算方法;了解各种统计调查方式的特点和适用场合;掌握统计调查方案设计的内容,了解数据预处理的意义;掌握统计数据的分组方法,能够对原始数据进行适当的分组并编制频数分布表,绘制频数分布的直方图和茎叶图。 二、教学重点 1、统计调查方案设计 2、统计数据的分组 3、变量数列的编制 三、教学难点 1、抽样调查、重点调查与典型调查的比较 2、调查方案的设计 3、次数分布的概念 4、变量数列的基本术语及编制 四、教学基本内容 第一节数据的计量与类型 一、数据的计量尺度 (一)定类尺度 按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例:按照性别将人口分为男、女两类。 (二)定序尺度 又称顺序尺度,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:考试成绩可分为优、良、中、及格、不及格。 (三)定距尺度 又称间隔尺度,是对事物类别或次序之间距离的测度。该尺度通常使用自然或物理单位作为计量尺度。例:考试成绩80分与90分之间相差10分。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”表示水平,不表示没有)。 (四)定比尺度 又称比率尺度,由于定比尺度有绝对零点(定比尺度中的“0”表示没有,不存在)。因此,不仅可以加减运算,还可以乘除运算。例如,甲工资为600元,乙工资为1200元,则乙的工资为甲的2倍。二、数据的类型 统计数据大体上分为两种类型:定性的数据和定量的数据。 定性数据也称品质数据,它说明的是事物的品质特征,是不能用数值表示的,这类数据由定类尺度和定序尺度计量形成。 定量数据也称数量数据,它说明的是事物的数量特征,是能够用数值表示的,这类数据由定距尺度和定比尺度计量形成。 说明现象某种特征的概念称为变量,变量的具体表现称为变量值。变量可分为连续型变量和离散型变量。离散变量只能取有限个数,而且其取值都以整位数断开,如企业个数、职工人数等;连续变量可以取无穷个数值,其取值是连续不断的,不能一一列举,如零件尺寸、年龄、温度等。 三、统计数据的表现形式 数量型统计数据通常有两种基本的表现形式,即绝对数与相对数。 (一)总量指标(绝对数) 1、概念:反映客观现象总规模、总水平的指标。 2、种类 按反映现象总体内容的不同,可分为: 总体单位总量:反映总体所有单位总数的指标。 总体标志总量:反映总体中各单位标志值总和的指标。 按指标反映的时间状况不同 时期指标:反映现象在一段时期发展变化的总量指标。 时点指标:反映现象在某个时点所达总量的指标。 (二)相对指标 1、概念:两个相互联系的指标数值对比的比值(相对水平) 2、作用:用一个抽象化了的数值来反映两个有联系的事物之间的数量关系 3、种类 计划完成程度相对数、结构相对数、比例相对数、比较相对数、强度相对数、动态相对数 第二节统计数据的搜集

数据资料的统计处理

数据资料的统计处理 ● 对数据的统计分析方法 一、s x -分析法 二、综合达标度 三、次数分布表和次数分布图 四、应答信息分析法 ● 相关关系分析 ● 数量标志的统计检验 ● 品质标志的统计检验 一、s x -分析法 1、平均值x : 描述样本的总体分值集中趋势的量,反映总体分值的一般水平。 n x x i ∑= n :样本的个数 2、标准差S : 描述样本的总体分值中各分值离散程度的量,反映总体中各分值的总体平均值离差(x ;-x ) 的平均水平。 s= n x x i ∑-2 )( 将x 和S 结合起来共同描述样本的整体水平比较科学。 一、分析方法:将x 和S 结合起来,分析整体学习水平 例1:某学科30名学生考试成绩如下表1,试分析30名学生整体学习水平。 表1 n=30 i

1.计算x =83 2. S= n x x i ∑-2 )(=7.73≈7.8 3 图1 x -s 分析图 二、综合达标度 采用综合加权的方法,对达标的程度进行分析 计算方法: 例2、抽取30份物理试卷,分析概念“力”的综合达标度 规定权重b : 知识=1、理解=2、应用=3、分析=4、综合=5、评价=6 总体目标系数K= 6321=++=∑i b 综合加权得分H= ∑i b ·i G =1×0.97+2×0.87+3×0.77=5.02 综合达标度84.06 02.5=== K H T

综合达标分析: 三、数据资料的次数分布表和次数分布图分析法 (一)数据资料的分类 1、计数资料: 指计数事物个数的数值,这个数值称次数 如:在某个分数段所对应得分的学生数 在向卷量表上,同意某种意见的人数。 2、测量资料: 指测量事物时产生的度量值,这个度量值叫量数,如:考试的分数。 (二)特点: 以最简单最直观的形式,最大限度的容纳数据信息。 如,数据的分布情况,集中趋势和离散程度等。 (三)次数分布表的制作方法 次数分布表是用表格的形式,表示数据在某些规定的组别中次数的分布情况,是整理,分析数据的第一步 下面以50名学生物理考试成绩为例,阐述编制次数分布表的方法和步骤。 1、求全距R R=最大数-最小数 =98-51 =47 2、定组数: 一般以10—20组为宜。太多了计算麻烦,太少了可能把很多不同事实归于一类,掩盖了分布特征。 本例分10组 表3 50名学生物理考试成绩次数分布表

第三章 统计资料的整理

第三章统计资料的整理 内容提要:通过本章的学习,要求明确统计资料整理的概念,了解统计整理的步骤;能够对不同的社会经济现象进行适当的统计分组;运用分配数列对原始数据进行系统整理;掌握统计表的具体编配方法。 第一节统计整理的意义和内容 一、统计整理的意义 统计调查之后,就是统计整理。我们在统计调查阶段搜集得到大量的原始资料,这些资料是分散、零乱、不系统、不规范的,只能反映统计总体每个具体单位的特征,不能反映总体的综合数量特征。统计认识客观现象的目的不在于认识个体的状况,而在于通过个体来认识总体。因此,我们需要将调查资料进一步整理成系统化、条理化、规范化、科学化,得出能反映客观现象总体特征的综合资料。 1、什么是统计整理? 所谓统计整理,简单说是对调查资料进行加工处理的过程。完整说就是根据统计研究的目的和任务,将统计调查阶段所收集到的分散的、零乱的、不系统、不规范的大量原始资料,用科学的方法进行加工处理,把它们转化为总体资料,使之系统化、条理化、科学化、规范化,成为能够反映事物总体特征的综合资料的过程。 它一般包括狭义的统计整理和广义的统计整理。狭义的统计整理也称为初级整理,仅指对统计调查所取得的原始统计资料的整理;而广义的统计整理也称为次级整理除了对原始调查资料的整理外,还包括对某些已经加工过的综合(或历史)资料的整理。 2、统计整理的作用 统计整理是统计工作的第三个阶段,是从统计调查到统计分析的中间环节,是统计调查工作的继续和统计分析的前提。统计调查所取得的原始资料,只有通过统计整理之后,才可能得出对总体数量特征的认识。统计活动既是一种从个体的实际表现到总体的综合表现的认识过程。同时也是从对现象的感性认识到对现象的规律性认识的过程。统计调查虽然已经收集到大量的原始资料,但从这些反映个体的零散的资料只能得出不全面的感性认识,只有通过统计整理,才能提供全面系统的资料,使我们对现象的感性认识深化到理性认识。所以,统计整理是统计认识过程中的一个重要阶段,是统计分析的基础。 二、统计整理的步骤 统计整理是一项细致而周密的工作,必须有组织、有计划的进行。统计整理由于手工整理、电子计算机整理的技术条件不同,具体步骤有差异,但其基本步骤是一致的,主要有: 1、设计统计整理方案 统计整理方案包括两个方面的内容: (1)按照统计设计确定的统计指标和统计指标体系以及我们将要介绍的统计分组体系具体地设计到统计整理表(过录表)和统计综合表(提供表)中,并详细规定整理、综合的方法。 (2)根据统计调查所取得的原始资料的多少和统计整理表、综合表的要求,

社会统计资料的整理

第三章社会统计资料的整理 原始资料杂乱无章,需加整理,才能为人所用。统计资料的整理,其基础是统计分组。所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。 第一节统计分组的原则与标准 统计分组的标志分为数量标志和品质标志两大类。按国际惯例,无论采用何种标志进行统计分组,都应遵循以下一般原则:(1)分组应使各类别构成之和等于总体;(2)分组设计应能反映统计总体的分布规律性。 在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定顺序归类整理,即可得到能够表明总体单位总数在各组分配情况的频数(或次数)分布数列,简称数列。频数分布数列是统计分组工作的产物。显然,按品质标志进行分组,我们可以得到品质数列;按数量标志进行分组,我们可以得到变量数列。 统计分组的关键在于选择分组标志和划分各组界限。一般来讲,按品质标志来分组,其差别比较明确,区分也较容易。按数量标志来分组则不同,对于划分各组界限,变量数列有较大的任意性。如果划分不当,不仅容易混淆各组的差别,也可能无法反映变量的分布特征。在统计整理和统计分析中,广泛应用变量数列,借以观察某一数量标志的变动及其分布状况。因此,如何编制变量数列是我们重点需要掌握的。 第二节统计表 统计调查搜集来的资料往往是没有次序的原始资料,使原始资料有序化,列表和作图是两种基本方法,得到的分别就是统计表和统计图。变量数列是统计表的一种常用形式。 1.统计表的格式、内容与种类 统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。统计表的主要功用是汇总和积累统计资料,以简捷和有条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。 统计表通常有一定格式:总标题、横行标题(表侧)、纵栏标题(表头)、统计数值(表身)。统计表从内容上看,是由主词和宾词两部分构成的。主词是统计表所要说明的对象,它可以是总体各单位的名称、总体的各个组或总体单位的全部。宾词是用来说明主词的标志和标志值(或指标名称和指标数值)。主词通常列于表的左瑞,宾词通常列于表的上端。但有时为了编排合理和阅读方便,也可以互换位置,将主词置于表的上端,将宾词置于表的左瑞。

第三章 统计整理

第三章统计整理 一、填空题 1.统计表的结构从内容上看包括【】和【】两部分。 2.统计整理的关键在于【】。 3.分配数列按分组标志特征的不同,可分为【】数列和【】数列两种形式。 4.在组距数列中,各组上限与下限之间的中点数值称为【】。 5.某连续变量数列其末组为开口组,下限为500,又知其相邻组组中值为480, 则末组组中值为【】,如果该数列为等距数列(5个组),则首组组中值为【】。 二、单项选择题 1.按照国民收入水平分组是() A、品质标志分组 B、复合标志分组 C、数量标志分组 D、混合标志分组 2.按某一标志分组的结果表现为() A、组内同质性,组间差异性 B、组内同质性,组间同质性 C、组内差异性,组间同质性 D、组内差异性,组间差异性 3.某连续变量数列,其首组为开口组,上限为100,若其相邻组的组中值为130.,则首组的组中值为( ) A、60 B、70 C、80 D、90 4.在组距分组时,对于连续型变量,相邻两组的组限() A、必须是重叠的 B、必须是间断的 C、必须取小数 D、必须取整数 5.企业按资产总额分组() A、只能使用单项式分组 B、只能使用组距式分组 C、只能进行复合分组 D、无法进行分组 三、多项选择题: 1.选择分组标志应遵循的原则是() A 、根据研究的目的和任务来选择 B 、选择具有现实意义的标志 C 、能反映现象的本质特征 D 、最好选择数量标志 2.从统计分组的含义来看,它意味着() A、对总体而言是“合” B、对总体而言是“分” C、对个体而言是“合” D、对个体而言是“分” 3.等距分组中() A、各组组距是相等的 B、各组组距绝大部分是等距的 C、标志值的变动在各组之间都是相等的 D、标志值的变动在各组之间不一定相等 4.在组距数列中,组中值是() A、上限和下限之间的中点数值 B、用来代表各组标志值的平均水平 C、在开口式分组中,可以参照相邻组的组距来确定 D、组距的一半 5.统计表从表式上看,包括() A、总标题 B、横行标题 C、纵栏标题 D、数字资料 E、主词 F、宾词

社会统计资料的整理练习题

第三章社会统计资料的整理 一、填空 1.统计表从内容上看,是由()和宾词两部分构成的。 2.主词是统计表要说明的();宾词是用来说明主词的()。 3.统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。 4.统计分组的关键在于()和划分各组界限,统计分组法是统计资料________阶段的基本方法。 5.统计表按主词的分组情况,可分为简单表、简单分组表和()。 6、变量数列中各组标志值出现的次数称________,各组单位数占单位总数的比重称________。 7. 各组频数与组距之比称为__________,频数分配数列按照数量标志分组可以得到__________ 。 8.将全部变量值依次划分为若干个区间,并将每一区间的变量值作为一组,这样的分组方法称为________分组。 9. 变量数列有两个构成要素()和()。对于连续变量,恰是某一组限的数据应按照____的原则归入相应的组别。 10.若采用异距分组,_______反映单位组距内分布的频数。 2.在频数分布图中,()标示为曲线的最高点所对应的变量值。 11.绘制直方图时,对于___变量和定序变量的分组,矩形的宽度是没有意义的。6.u型曲线的特征是_______。12.实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。 13.基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。 二、单项选择题 1.统计整理所涉及的资料是( C )。 A.原始资料 B.次级资料 C.原始资料和次级资料 D.统计分析后的资料 2. 单项数列分组通常只适用于( ) 的情况。 A.离散变量且变量值较多B.连续变量,但范围较大C.离散变量且变量值较少D.连续变量,但范围较小4.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。 A. 品质标志 B. 数量标志 C. 质量指标 D. 数量指标 7. (B )的数列属于连续型变量数列。 A.企业职工按性别分组 B. 企业职工按工资分组 C. 企业职工按学历分组 D. 企业职工按日产量(件)数分组 5.按某一标志分组的结果就表现为( ) A.组内差异性,组间同质性 B.组内同质性,组间同质性 C.组内同质性,组间差异性 D.组内差异性,组间差异性 20.统计分组必须遵循的两个重要原则是()A.实用与科学B.科学与合理C.互补与无穷D.穷举与互斥 6.在统计分组时,首先应考虑( B )。A.分成多少组B.选择什么标志分组C.各组差异大小D.分组后计算方便7指出下列哪种分组是按品质标志分组的?( ) A.企业按职工人数多少分组 B.企业按资金拥有量分组 C.企业按经济类型分组 D.企业按设备拥有量分组 8、下列分组中属于按品质标志分组的是(B)。 A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组 9. 单项式变量数列与组距式变量数列都不可缺少的基本要素是( )。 A. 组数和组距B.组限和组中值 C. 变量和次数D.变量和组限 10.统计表的数字部分中符号“……”代表的含义是()。 A.某项数字不存在B.缺少某项数字C.某项数字较大D.提醒注意核计 11.上限与下限之差是() A.组限 B.组距 C.组中值 D.等距 39.对统计总体进行分组时,采用等距分组还是异距分组,决定于( ) A.变量值的多少 B.次数的大小 C.现象的特点 D.数据分布是否均匀 E.组数的多少 12.若间距h= 8-16,fi=3,则m值为() A.12 B.4 C.6 D.8

高级社会统计学 复习资料

高统期末考试资料整理 1、参数:是一个变量。我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。 2、列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。 3、备择假设:又称研究假设,是我们在社会学研究中事先安排的假设。通过抽样调查有充分根据否定原假设,是与原假设相反的假设,用H1表示,是当原假设被推翻时需要接受的假设。备择假设有三种形式,以H0为=Z0为例,当H0被否定,可能被采用的H1为>Z0,

6、选择相关系数的标准 看两个变量的变量层次 看两个变量是否对称 7、假设检验与区间估计的逻辑有哪些不同 不同①假设检验从总体到样本,即事先对总体参数值或分布形式作出某种假设,然后利用样本来判断这个原假设是否成立 ②区间估计从样本到总体,即根据样本计算出一个范围来对未知参数 进行估计 相同:区间估计与假设检验的统计处理时相通的,实际上假设检验的接受域也正是区间估计的置信区间 8、相关关系的特点: ①现象之间确实存在着数量上的依存关系。就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。 ②现象间的数量依存关系值是不确定的。就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值。 9、相关系数:指线性相关系数,对两个变量之间线性相关程度的度量。相关程度有强弱之分,一般是在-1到1之间,相关系数越趋于0,关系越弱,相关系数与趋于绝对值1时,关系越强。 10、参数估计:即根据抽样结果合理地、科学地猜测总体参数的具体值或其范围。参数估计包括参数的点估计和区间估计两种 11、统计值:关于调查样本中某一变量的综合描述,是样本特征值,如样本均值,成数及方差

社会统计资料的搜集

第二章社会统计资料的搜集 第一节调查的方法及种类 原始资料与次级资料·静态资料与动态资料·全面调查与非全面调查·经常性调查与一次性调查·问询法与观察法·报告法与实验法·文献法第二节统计调查的组织形式 普查·重点调查与典型调查·抽样调查·随机抽样与非随机抽样 第三节概念的操作化与测量 抽象定义和操作化定义·信度和效度·测量层次(定类测量、定序测量、定距测量、定比测量)社会学研究的科学性 第四节统计误差 登记性误差与代表性误差·抽样误差·无反应偏差 一、填空 1.()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为();凡某时期内变动累计的资料称为()。 3.()调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5.统计误差有()和()两类,其中()在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于()。 7.统计调查从调查范围上分,可分为()和()。 8.统计调查按调查登记时间是否连续,可分为()和()。 9.统计调查从调查目的上,可分为()和专项调查。 10.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。 二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫()。

统计学-第三章-统计整理

第三章统计整理 (一)填空题 1、统计整理是统计工作的第三阶段。在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。 2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。 3、统计分组实质上是在统计总体内部进行的一种定性分类。 4、对原始资料审核的重点是真实性。 5、区分现象质的差别是统计分组的根本作用。 6、标志是统计分组的依据,是划分组别的标准。 7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。 8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。 9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。 10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。 11、按品质标志分组的结果,形成品质分布数列。 12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。 13、组距变量数列的组距大小与组数的多少成反比。与全距的大小成正比。 14、组距变量数列的分布可以用次数分布曲线图表示。 15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。 16、统计资料的整理方法主要有统计分组和统计汇总两种。 17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。 18、统计分组体系有品质标志分组和数量标志分组两种。 19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。 20、统计表从内容结构上看,是由主词和宾词两部分构成。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、统计分组的结果表现为( A ) A. 组内同质性,组间差异性 B. 组内差异性,组间同质性 C. 组内同质性,组间同质性 D. 组内差异性,组间差异性 2、统计分组的依据是( A ) A、标志 B、指标 C、标志值 D、变量值 3、下面属于按品质标志分组的有( C ) A. 企业按职工人数分组 B. 企业按工业总产值分组 C. 企业按经济类型分组 D. 企业按资金占用额分组 4、统计分组的关键在于( A ) A、正确选择分组标志 B、正确划分各组界限 C、正确确定组数和组限 D、正确选择分布数列种类 5、下面属于按数量标志分组的有( B ) A. 工人按政治面貌分组 B. 工人按年龄分组 C. 工人按工种分组 D. 工人按民族分组 6、在全距一定的情况下,组距的大小与组数的多少成(B) A、正比 B、反比 C、无比例关系 D、有时成正比有时成反比

2015最新版第六章 《数据与统计图表》各节知识点及典型例题 专题讲义

2015最新版第六章《数据与统计图表》各节知识点及典型例题专题讲义第一节、数据的收集与整理第二节、条形统计图和折线统计图第三节、扇形统计图第四节、频数与频率 第五节、频数直方图 章节知识框图 【课本相关知识点】 1、数据收集可以通过直接观察、测量、实验和调查等手段得到,也可以通过查阅文献资料、使用互联网查询等间接途径得到 2、将数据分类、排序是整理数据的常用方法;当然分组、编码也是整理数据的常用方法。 3、人们根据研究自然现象或社会现象的需要,对所有的考察对象作调查,这种调查叫做全面调查。 4、抽样调查:人们在研究自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象进行调查,而是从所有对象中抽取一部分作调查分析,这就是抽样调查。特别注意:①抽样调查要具有广泛性(要具有相当的样本容量)和代表性(各个阶层或类型对象都要具有),即样本容量要恰当,因此对象不宜太少;②调查对象应随意抽取,即每个个体被选中的机会都相等。 5、在统计中,我们把所要考察的对象的全体叫做总体,把组成总体的每一个考察对象叫做个体。从总体中取出的一部分个体叫做这个总体的一个样本,样本中个体的数目叫做样本的容量。样本的容量是不带单位的。 6、对数据收集和整理后,就可以制作统计表。一个完整的统计表不能缺少标题(统计表的名称)、标目、数据(有单位要注明单位)以及制表日期 【典型例题】 【题型一】数据的收集方法 例1、如果就下列情况进行统计,你准备采用哪种方式来收集数据?填在后面的横线上

(1)学校足球队队员的身高 (2)每年到杭州西湖观光旅游的人数 (3)A、B、C三种品牌电池的使用寿命 (4)明天7时~8时进入易初莲花超市的人数 【题型二】根据实际情况对数据进行整理 例2、某乡镇企业生产部门有技术工人10人,生产部为了合理制定每月的生产定额,统计了这10人某月的加工零件个数如下:40,80,50,75,50,70,50,40,35,50 (1)为了使这组数据更为直观,你将怎样处理这组数据? (2)若生产定额能够使大多数人都能完成即为合理的生产定额,假如你是生产部负责人,你认为每月的生产定额应定为多少比较合理? 练习、(2011?南昌)以下是某省2010年教育发展情况有关数据:全省共有各级各类学校25000所,其中小学12500所,初中2000所,髙中450所,其它学校10050所;全省共有在校学生995万人,其中小学440万人,初中200万人,高中75万人,其它280万人;全省共有在职教师48万人,其中小学20万人,初中12万人,高中5万人,其它11万人. 请将上述资料中的数据按下列步骤进行统计分析. (1)整理数据:请设计一个统计表,将以上数据填入表格中. (2)分析整理后的相关数据,小学、初中、高中三个学段的师生比,最小的是哪个学段?(师生比=在职教师:在校学生数) 【题型三】利用数据的收集与整理知识解决实际问题 例3、(2003?安徽)某风景区对5个旅游景点的门票价格进行了调整,据统计,调价前后各景点的游客人数基本不变.有关数据如下表所示: (1)该风景区称调整前后这5个景点门票的平均收费不变,平均日总收入持平.问风景区是怎样计算的?(2)另一方面,游客认为调整收费后风景区的平均日总收入相对于调价前,实际上增加了约9.4%.问游客是怎样计算的? (3)你认为风景区和游客哪一个的说法较能反映整体实际?

第三章统计数据的整理

第三章统计数据的整理 一、填空题 1、综合平均 2、简单分组复合分组 3、统计分组的关键在于分组标志的选择 4、人口按性别民族职业分组属于按品质标志分组人口按年龄,工资分组属于按数量标志分组 5、统计复合分组表:是指主词按两个或两个以上标志进行层叠分组的统计表 6、可量性综合性 7、简单分组复合分组 8、百分数或倍数复名数 9、调查单位报告单位 10 、总体单位总量总体标志总量 二、简答题 1、统计资料整理的一般程序:编制整理纲要、统计资料的审核、统计资料的分类汇总、编制统计表。 2、统计分组有何作用:区分事物的性质,反映总体的内部结构,描述统计变量的分布状况研究现象之间的依存关系。 3、统计分组:根据统计研究的目的和被研究现象的本质特征,将统计总体按照一定的标志划分为若干性质不同的部分或组。 4、数量指标是用绝对数形式表现的,用来反映总体规模大小、数量多少的统计指标,其数值大小一般随总体范围的大小而增减。质量指标是说明总体内部数量关系和总体单位水平的统计指标,其数值大小不随总体范围的大小而增减。 5、比例相对指标有反映总体结构的作用,与结构相对指标有密切联系。所不同的是二者对比方法的不同,说明问题的点不同,比例相对指标反映的比例关系是一种结构性比例,一般侧重有一个经验数据。(2)强度相对指标也反映一种比例关系,相对比例相对指标而言,它所反映的是一种依存性比例而非结构性比例,不存在经验数据。

6、编制数量指标指数和质量指标指数应遵循的一般原则是:数量指标指数要使用基期的质量指标作为同度量因素,而质量指标指数要使用报告期的数量指标作为同度量因素,称之为“数基质报”原则。 三、计算题 1、 某公司日商品销售额分组 绘制直方图如下: 2、(1)线图如下:

数据资料的统计处理.

数据资料的统计处理 在现代教育技术科学研究中,必须应用数学的语言对研究过程和结果进行阐述,马克思指出:“一种科学只有成功的运用数学时,才算达到了真正完善的地步”。 无论是对教学模式、教学方法、还是对教学媒体的研究都需要收集相关的资料,如测验的成绩、观察的记录、问卷的统计等,这些资料只有运用数学的方法进行加工处理后,才能对研究对象进行说明和评价。所以,资料的统计处理是研究工作的重要环节,也是科研人员应掌握的重要知识和技能之一。 下面介绍常用的几种方法 ● 对数据的统计分析方法 一、s x -分析法 二、综合达标度 三、次数分布表和次数分布图 四、应答信息分析法 ● 相关关系分析 ● 数量标志的统计检验 ● 品质标志的统计检验 一、s x -分析法 1、平均值x : 描述样本的总体分值集中趋势的量,反映总体分值的一般水平。 n x x i ∑= n :样本的个数 2、标准差S : 描述样本的总体分值中各分值离散程度的量,反映总体中各分值的总体平均值离差(x ;-x )的平均水平。

s= n x x i ∑-2 )( 将x 和S 结合起来共同描述样本的整体水平比较科学。 一、分析方法:将x 和S 结合起来,分析整体学习水平 例1:某学科30名学生考试成绩如下表1,试分析30名学生整体学习水平。 表1 n=30 2490=∑i x 83=x s=7.8 1.计算x =83 2. S= =7.73≈7.8 图1 x -s 分析图 二、综合达标度 采用综合加权的方法,对达标的程度进行分析 计算方法:

例2、抽取30份物理试卷,分析概念“力”的综合达标度 规定权重b : 知识=1、理解=2、应用=3、分析=4、综合=5、评价=6 总体目标系数K=6321=++=∑i b 综合加权得分H= ∑i b ·i G =1×0.97+2×0.87+3×0.77=5.02 综合达标度84.06 02.5=== K H T 综合达标分析: 三、数据资料的次数分布表和次数分布图分析法 (一)数据资料的分类 1、计数资料: 指计数事物个数的数值,这个数值称次数 如:在某个分数段所对应得分的学生数 在向卷量表上,同意某种意见的人数。 2、测量资料: 指测量事物时产生的度量值,这个度量值叫量数,如:考试的分数。 (二)特点: 以最简单最直观的形式,最大限度的容纳数据信息。 如,数据的分布情况,集中趋势和离散程度等。

相关文档
最新文档