显著性检验卡方检验等

显著性检验卡方检验等
显著性检验卡方检验等

第十章 研究资料的整理与分析

本章学习目标:

1.理解量化资料整理与分析中的几个基本概念。

2.掌握几种常用的量化分析方法。

3.掌握质性资料的整理分析方法。

无论采用什么研究方法进行研究,都会搜集到大量的、杂乱的、复杂的研究资料。因此,对大量的、复杂的研究资料进行科学、合理的整理和分析,就成为教育科学研究活动的必不可少的一个环节。这一环节体现着研究者的洞见,是研究者对研究资料进行理性思维加工的过程。通过这一过程,产出研究结果。

根据研究资料的性质,研究资料可以分为质性研究资料和量化研究资料。对研究资料的整理和分析就相应的分为:质性研究资料的整理与分析和量化资料的整理与分析。

第一节 定量资料的整理与分析

一、定量资料分析中的几个基本概念 1.随机变量

在相同条件下进行试验或观察,其可能结果不止一个,而且事先无法确定,这类现象称为随机现象。表示随机现象中各种可能结果(事件)的变量就称为随机变量。教育研究中的变量,大多数都是随机变量。如身高、智商、学业测验分数等。

2.总体和样本

总体是具有某种或某些共同特征的研究对象的总和。样本是总体中抽出的部分个体,是直接观测和研究的对象。例如,要研究西安市5岁儿童的智力发展问题,西安市的5岁儿童就是研究的总体,从中抽取500名儿童,这500名儿童就成为研究的样本。

3.统计量和参数

统计量:反映样本数据分布特征的量称为统计量。例如:样本平均数、样本标准差、样本相关系数等,都属于统计量,它们分别用

表示。统计

量一般是根据样本数据直接计算而得出的。

参数:反映总体数据分布特征的量称为参数。例如:总体平均数、总体标准差、总体相关系数等。它们分别用ρσμ,,等符号来表示。总体参数常常需要根据样本统计量进行估计和推断。

4.描述统计与推断统计

描述统计是指对获得的杂乱的数据进行分类、整理和概括,以揭示一组数据

分布特征的统计方法。包括:编制统计表;绘制统计图;计算各种统计量:集中量、差异量、相关系数量等。

根据样本所提供的信息,运用概率理论进行论证,在一定可靠程度上对总体分布特征进行估计、推测,这类统计方法叫做推断统计。推断统计的特征有三点:

推断总是根据样本信息对总体进行推断; 推断总是依据一定的概率理论进行推断; 推断总是在一定置信度上的推断。

推断统计又可分为参数估计和假设检验。最常用的推断统计方法是假设检验。

5.集中量与差异量

集中量:是表示一组数据典型水平或集中趋势的量。集中量是一组数据整体水平的代表值。不同群体间学生成绩比较时,需要用集中量指标。常用的集中量指标有算术平均数、中位数、众数。

差异量:表示一组数据的离中趋势或变异程度的量称为差异量。常用的差异量指标有方差、标准差和差异系数。从下列两组数据可以看出,描述一组数据分布特征仅用集中量指标是不够的,还需用差异量指标。

A :60 65 70 75 80

B :50 60 70 80 90

两个组的集中量指标算术平均数都是70,但A 组数据的变异明显大于B 组的变异,A 组的全距是20(最大值减去最小值),而B 组的全距是40。所以要全面描述一组数据的分布特征,既要用集中量指标,也要用差异量指标。

二、方差和标准差的概念及其计算

描述一组数据的分布特征,需要用到集中量指标和差异量指标。集中量最常用的指标是算术平均数,这在小学里都已经学过,这里不再赘述。最常用的差异量指标是方差和标准差。这里简单介绍方差和标准差的概念及其计算方法。

1.方差:是一组数据离差平方的算术平均数(用表示)。

定义公式为:

N

X X S 2

2)

(∑-=

为数据个数

:;

:为离差平方和为离差N X X X X 2

)(∑--

2.方差的方根即标准差

N

X X S 2

2)

(∑-=

例如:利用定义公式求:5、6、8、6、4的方差和标准差。

解:

33.1)3(77

.158.548.568.588.568.55)2(8

.54

6865)

1(2

222

222

2

])()()()()[()(5

===÷-+-+++=-=

=++++=

=

---∑∑S S N

X X S

N X X ::

:标准差方差求平均数

三、假设检验的逻辑原理 常用的推断统计是假设检验。现以平均数的显著性检验为例来说明假设检验的逻辑原理。

以平均数为例,看假设检验的基本原理。从已知总体中抽出的容量为n 的一切可能样本的平均数形成的分布如右图,这就是平均数的抽样分布。当总体为正态分布时,平均数的抽样分布也符合正态分布。现有一个随机样本,其平均数为

X a ,这个样本是来自0μ这一已知总体

吗?或者说这个样本所代表的总体平均数和已知总体平均数0μ相等吗?这就是假设检验所要解决的问题。其逻辑原理是,视X a 在以0μ为中心的平均数抽样分

布上出现的概率大小而定。若样本平均数X a 在以0μ为中心的抽样分布中出现的概率较大,则认为样本所属总体和已知总体为同一总体;若样本在抽样分布中出现的概率较小,则认为样本X 所属总体与已知总体0μ有显著性差异。 四、总体平均数的显著性检验

总体平均数的显著性检验,也就是根据一个样本信息,来检验这个样本所代表的总体平均数,和一个已知的总体平均数是否有显著性差异。

例如:某校初一年级英语测验的平均成绩为78分,标准差为7分。实验班40名学生的平均成绩为79.5分,问实验班成绩与全年级的成绩有无显著性差异?

检验:

其值

选择检验统计量并计算)()提出假设:(::278

78110≠=μμH H

假定总体为正态分布,总体σ已知,所以采用z 检验

36

.140

778

5.79=-=

-=

n

X Z σ

μ

(3)确定检验形式

没有资料说明实验班的成绩过去是高于还是低于全年级的成绩,所以采用双侧检验。

(4)统计决断

05

.096.136.12

/05.0||>∴=<=P Z Z

因此,在0.05水平上保留零假设,拒绝备择假设,结论为实验班的成绩与全年级的成绩差异不显著。

(1.96和2.58是Z 检验时的两个临界值,当计算出的Z 值小于1.96时,概率P 就大于0.05,这时差异不显著;当Z 值大于1.96或者大于2.58时,P 值就小于0.05或小于0.01,这时差异就显著或极其显著。)

当总体标准未知时,应当使用t 检验。

五、平均数差异的显著性检验(独立大样本) 平均数差异的显著性检验,也就是根据两个样本信息,对两个样本所代表的两个总体平均数之间是否有差异,所进行的检验。

例如:在一次教学方法的实验研究中,实验后的测试结果为:实验班50名学生的平均分是83、标准差是6;对照班48名学生的平均分是80,标准差为5。试问,实验班的成绩与对照班的成绩有无显著性差异?

检验:

算其值、选择检验统计量并计、假设::212

1121μμμμ≠=H H o

假定总体为正态分布,σ未知,独立大样本,故采用Z 检验

42

.248

550680832

2

2

22

121

21=+-=

+-=

n S n S X X Z

3、确定检验形式 采用双侧检验。

4、统计决断 ∵|Z |=

>1.96=Z 0.05

∴P <0.05

因此,在0.05水平上拒绝零假设,接受备择假设。结论为实验班的成绩与对照班的成绩差异极其显著。

六、卡方检验

对总体平均数之间是否有差异所进行的检验,被称为参数检验。常常适

用于教学实验研究。而对调查资料,常常需要运用非参数检验的方法进行检验。最常用的非参数检验就是卡方检验。

2χ检验的统计量

t

t f f f 2

02

)(-∑

为理论频数为实际频数,

t 0f f 。 例如:对100人进行某一态度问题的调查,60人否定,40人肯定。现在问肯定人数与否定人数差异是否显著?

检验:

1.假设 0H :肯定与否定人数差异不显著; 1H :肯定与否定人数差异显著。

2.计算卡方值

根据肯定与否定人数无显著性差异的零假设,肯定与否定人数的理论频数均为100/2=50。

所以 4

50)5040(50)5060()(2

2202

=-+-=-∑=t t f f f χ

3、统计决断 因为

205

.0)1(284.34χχ== 所以P <0.05 因此在0.05水平上拒绝零

假设,接受备择假设。结论为,肯定与否定人数差异显著。

七、 相关分析

相关的概念 1、相关关系

相关关系:两个变量之间不精确、不稳定的变化关系就是相关关系。这一概念包括以下几层意思:

(1)两个变量间存在着变化关系,即一个变量变化时,另一个变量也会发生变化;

(2)两个变量的变化关系不精确、不稳定、不能用函数式表示; (3)两个变量间互为因果关系。 2、相关关系的类型

从两个变量的变化方向上分:

(1)正相关:两个变量变化方向一致;

(2)负相关:两个变量变化方向相反; (3)零相关,两个变量变化方向无规律。 3、从密切程度上分 (1)高度相关; (2)中度相关; (3)弱相关。 相关系数

相关系数是表示两个变量之间的变化方向及密切程度的统计指标。 样本相关系数用r 表示,总体相关系数用ρ表示。 相关系数的取值范围:11≤≤-r

正负号表示变化方向,绝对值表示密切程度。

含义不同。与如:3.070.0-==r r

积差相关

积差相关的概念与使用条件

1、积差相关的概念

积差相关:是指具有线性关系的两个正态连线变量的相关 2、积差相关的作用条件

(1)两个变量都是由测量而获得的连续型数据; (2)两个变量的总体都是正态分布或接近正态分布; (3)数据必须是成对的,且各对之间相互独立; (4)两个变量间呈线性关系 (5)要排除共变因素; (6)。或样本容量

)50(30≥≥n n

3、积差相关系数的定义公式

y

x n Y Y X X r σσ))((--∑=

例:

表 10个学生初一(X )与初二(Y )数学分数积差相关系数计算表

相关系数的显著性检验 (一)相关系数的抽样分布

一切可能的r 值的频数分布是r 的抽样分布。r 抽样分布的形态: 1、r 的抽样分布形态随ρ和n 变化; 2、0=ρ时,分布对称或为正态分布; 3、0≠ρ且较小,50>n 时,近似正态分布; 4、ρ较大时r 抽样分布为偏态。

(二)相关系数检验的基本原理

只有r 在以0=ρ为中心的抽样分布上出现的概率很小时,才能认为X 与Y 有相关关系。

(三)相关系数检验的方法

1、0:0=ρH 时相关系数的显著性检验

(1)当50≥n 时,r 的离差统计量近似正态分布:

2

11

r n r Z --?=

【例题】:随机抽取100名学生的数学与物理成绩,求得65.0=r ,问从总体上讲数学与物理成绩是否存在相关?

检验:

(1)假设0:0=ρH 0:1≠ρH (2)选择并计算统计量

检验用且Z n ∴>==50100,0ρ 2.1165.011

10065.0112

2=--?=--=

r n r Z (3)统计决断

01.058.2**2.11Z Z =>= 01.0<∴P

因此,在职0. 01 水平上拒绝零假设,接受备择假设。结论为学生的物理成绩与数学成绩存在正相关。

(2)当50

当050=<ρ、n 时,r 的离差统计量为t 分布。

2

12r

n r t --?=

2-=n df

【例题】:25名学生的身高与体重的相关系数为45.0=r ,问学生身高与体重是否存在正相关?

检验:

(1)假设0:0=ρH 0:1≠ρH (2)选择并计算统计量

,0=ρ 且5025<=n .检验采用t ∴

42.245

.0122545.022

2

1=--?=

--?=

r

n r t

(3)统计决断

根据232252=-=-=n df 查表知069.205.0)23(=t

05

.0069.242.205.0)23(<∴=>=P t t

结论为学生的身高与体重存在正相关。

注:一般可通过查积差相关系数临界值表(附表9)进行简便推断:

)(505.0396

.001.0)23(05.0)23(双侧==r r

05

.0396.045.005

.0)23(<∴=>=P r r

结论同前

等级相关

表示等级次序变量之间的相关即为等级相关。常用的等级相关有两种:斯皮尔曼的二列等级相关和肯德尔和谐系数。 斯皮尔曼等级相关

1、斯皮尔曼等级相关的概念

表示两个等级次序变量之间的相关,即为等级相关。 2、使用条件:

不要求总体为正态分布,也不要求n>30或n>50,只要求两个变量为等级秩次分数。

但若原始数据符合积差相关系数的使用条件时,应用积差相关系数计算,而不能改用等级相关。

3、等级相关系数的计算

)

1(612

2

-∑-=n n D r R 例:五名学生的数学成绩和思品成绩如下表,求二者的相关系数。

学生的数学成绩和思品成绩等级相关系数计算表五名

12=∑D 解:1、赋予等级(编秩次)R X 、R Y

(1)、两个变量的等级方向应一致;

(2)、在原始数据中,若有相同数据时,用它们所占的等级为次的平均数作为各自的秩次分数。 2、求等级差D 及2D ∑ 12=∑D 3、计算r R 值

95.0)15(51

61)1(612

22=-??-=-∑-=n n D r R 检验方法与积差相关系数检验方法相同。

质与量的相关

一个变量为连续测量数据,另一变量为按性质划分的类别,表示这两个变量的相关,就是质与量的相关。

质与量的相关包括:二列相关、点二列相关。 一、二列相关

(一)二列相关的概念及使用条件

当两个变量都是正态连续变量,其中一个变量被认为地划分为二分变量,表

示这两个变量的相关,就是二列相关。

使用条件:

两个变量都是正态连续变量; 两个变量之间是线性关系;

二分变量是人为划分的,分界点要尽量靠近中值; 样本容量n 应大于80。 (二)二列相关系数的计算

Y

pq X X r t q

p b ?-=

σ Y

p X X r t

t

p b ?

-=

σ 二、点二列相关 (一)概念与适用范围

一个变量为正态连续变量,另一个为真正的二分名义变量(非人为划分),表示这两个变量之间的相关,就是点二列相关。

双峰分布也可用点二列计算 n 也应大于80

(二)点二列相关系数的计算

pq X X r t

q

p pb σ-=

q

p

X X r t

t

p b σ-=

以上介绍的是几种简单常用的统计分析方法。如果要进行更为复杂的统计分析,可参考有关教育统计学书籍。对定量数据资料的统计分析看起来有些复杂麻烦,但利用统计分析软件SPSS 进行分析检验就会十分简便的。

第二节定性资料的整理与分析

对于定性研究而言,资料的整理与分析是指系统化地搜集和排列访谈记录、观察笔记和其他积累的资料,以便得出研究发现的过程。分析包括处理资料、组织资料、将资料打散为可以管理的单元、编码、综合和探索规律。

在定性研究中,处理分析资料的手段是多种多样的。分析方法可以分为两种:一种是在资料收集的同时即进行资料的分析和阐释,到资料收集完的时候分析和阐释的工作也差不多完成了。另外一种是资料收集完之后再分析和阐释。这里主要介绍后一种方法。

你刚刚把最后一次访谈笔记或观察记录输入电脑,然后把它们归档。现在,你面对着在整个研究过程中辛勤搜集来的、大量的、杂乱的所有资料,脑袋里一片空白,问道:“现在我该怎么办?”

的确,对定性资料进行分析和阐释是一件困难和复杂的事情。但是,对定性资料分析的方法说起来确是比较简单的事情,即是对资料进行编码分类。①设想你在一个很大的体育馆里,地板上杂乱地堆着数千个玩具。你的任务是建立一套归类方案把这些玩具分成若干堆。你绕着体育馆来回走,盯着这些玩具,捡起它们,仔细观察。有很多分类方法可以选择,你可以按照大小、颜色、原产国、生产日期、制造商、原材料、可玩的游戏类型、适合的年龄段等方式来分类。

这与定性研究者通过编码分类来组织研究资料是很类似的。当然定性研究者的任务更加艰难、条件更加复杂,要组织归类的资料不是那么容易被切分成单元资料,分类系统也不是那么不言而喻、清晰明了的。

研究者在通读研究资料的过程中,会发现某些词、词组、行为模式、研究对象的思维方式或者事件会重复出现或者显得很突出。建立一个编码项目包括以下几步:搜寻自己的资料,寻找规律、模式和话题,然后用某个词或词组来代表这些话题和模式。这些词和词组就是编码分类了。要记住,任何一个单元资料(一个自然段、一个句子,等等)都可以用多个编码族的多个编码分类表示。换句话说,一个单元资料可以有一个或多个编码。下面是美国学者罗伯特·C·波格丹和萨利·诺普·比克伦提出的一些比较常用的编码族:

一、场景/情景码

场景/情景码指的是那些可以将关于场景、主题和研究对象的最一般信息进行归类的编码。这种编码可以将你的研究置于一个更大的情景中。在这些编码下,大部分关于环境、研究对象和主题的描述性资料,也包括地方报纸的文章和其它媒体资料,都可以进行合理安排。

另外,人们描述研究对象、环境及其在社区中的地位的一般性陈述也可以在这里被编码。描述统计信息和其他描述环境的量化数据也可以被编码。这一族中一些特殊的编码可以是“小学描述”,“市中心高中”。编码标签由你的研究对象决定。

下面这个例子就是一个可以进行这一类编码的数据单元。它是一个校长的陈述,是他向研究者描述他的学校。

杰森高中有850名学生,90%左右的学生进入四年制大学读书。我们服务的①【美】罗伯特等著,钟同等译.教育研究方法:定性研究的视角,中国人民大学出版社,2008年,140页。

社区主要是上层中产阶级的职业人士。他们受过良好的教育,当然也希望自己的孩子能接受良好的教育。稳操胜券的学生平均经费开支比本地区任何其他高中都要高。我们的荣誉学者也比任何学校都多。说到足球,就是另外一回事了。我们为组织一支足球队颇费了一番周折。我给你一个我们的大学布局图吧。我也会给你一些描述我们的理念、目标和项目的小册子。

给研究者读的材料同样应该编码在场景/情境码下。

二、被研究者对事情的定义码

在这类编码下,你的目标是安置那些显示了研究对象如何定义环境和特定主题的数据单元。他们渴望实现什么?他们如何定义自己做的事情?什么对他们是重要的?是否有特定的倾向影响他们对各种活动参与(宗教、政治、社会等级、女权主义、生命权利)的定义?你可能在观察不同类型的参与者:中学生、小学生、行政人员、家长。你可能对每一类参与者都有一个编码,也可能在参与者之间有其他的区分可以作为编码的依据。在一个女性对自己小学经历的看法的研究中,情境定义码包括:“女权主义的自觉”,“当前自我形象”,“阐释过去的影响”

适合于这一组的数据,我们以如下一名教师的陈述为例,它被编码到“教师对自己工作的看法”中:

对我来说,教书就是我的生活。我并不把二者区分开。当我冲凉时,会想:“如果我这样呈现材料,而不是像去年暑假那样,会如何呢?”有时会不知不觉地冲了20分钟。我丈夫觉得我很疯狂但其实他也是那样。我们对聚会和度假并不热中;工作就是我们生活的主要内容。

三、被研究者看问题的角度

这一组包含了那些导向全部或部分研究对象所具有的思维方式的编码,它们不是对整个情形的宏观定义,而是对环境中某一特定方面的理解倾向。这包括共享的规则、规范,也包括一些普遍的观点。通常观点或视角是从研究对象使用的词组中捕捉到的。在对教学医院中加护病房的研究中,两个词组经常被使用,它们反映了共同的理解,成为整理数据的编码。“难以预料”(指的是很难预测病人将会发生什么)、“坦诚但不残酷”(指的是理解你应该告诉父母孩子的病情,但不要用那种让他们不安的字眼)。

以下数据是从被编码为“难以预料”的单元中摘录的。

我和一个实习医生卡罗尔在一起。她正在为那个“霍普金斯婴儿”准备静脉

注射。琼,一个护士,进来后跟我说:“如果你想知道怎么回事,跟我出来吧。”在她旁边是一个妇女,我猜是女孩的妈妈。她穿着漂亮的印花裙子。小女孩穿着紧身裤和配套的上衣。琼用低沉的嗓音对我说:“她现在挺好。来做检查。她第一次来时不比那个霍普金斯婴儿大。我们根本没想到她能活下来。看看她——知道了吧?对这些孩子的未来你真的很难预料。”

四、被研究者看待人和事的方式

这一组编码代表着研究对象对彼此的、对局外人的,以及对构成他们的世界的那些事物的理解。比如说,教师对他们所教学生的特点就会有定义。在老师眼中有各种不同的学生。在对一个幼儿园的研究中,研究者发现教师认为学生要么是“不成熟的”要么是“愿意上学的”。另外,有时老师也会根据学生的穿着或家庭环境将他们分类。“教师对学生的看法”就是这个研究中的编码分类。在对教学医院中儿童加护病房的研究中,研究者发现医生根据一个详细的方案对婴儿分类,有的类别和婴儿在病房中度过的特定阶段相关。有的类别是这样的:“哺育者和成长者”、“不能生存者”、“重病婴儿”、“健康婴儿”、“慢性病患者”、“吃奶者”、“休养者”。在同样的环境中,家长被视为“好家长”、“不够好的家长”和“制造麻烦的家长”。“医生眼中的病人”和“医生眼中的家长”也是那个研究中的编码分类。不仅人可以作为分类的对象,在一个对学校看门人的研究中,不同类型的垃圾也被做了笔记并进行了了分类。

以下材料是从对一所乡村高中的研究中摘录的,属于“被研究者对人和事的看法”这一类属;在这个具体的例子中就是“教师对彼此的定义”。

乔迪开始谈论学校里的其他老师,她说:“你知道这学校里的老师都不错。我想不出来一个我不愿意提起的。当然人和人是会有不同的,也会有那种整天抱怨个不停的人——孩子们好好的时候他们也觉得这些孩子快要毁了。孩子们不应该受歧视。他们通常从来不会做任何事去帮一个不够机灵的孩子——这里确实有这样的一群人。他们整天混在一起,都是男人,非常保守。然后还有些苦干家,他们不会气馁,愿意多付出一些。

五、过程码

过程码,是那些方便对事件序列、随时间的变化以及从一种状态向另一种状态的转变进行归类的词和短语。为了使用一个过程码,研究者必有将一个人、群体、组织或活动看作随时间变化的,并且能认识到一个至少分为两部分的序列中的变化。典型的过程码包括时间段、阶段、状态、转变、步骤、生涯和编著年

表。另外,过程码族中也包括序列中的关键点(如转折点、基准点、过渡点)。

过程编码在组织生活史材料中很常用.这个编码分类就是被研究者生命中明显可以分开的几个时期.强调教育状况的个人生活史可以包括这样的编码分类(1)早期生活,(2)迁居新泽西,(3)入学第一天,(4)纳尔逊夫人,(5)纳尔逊夫人后的小学时代.(6)中学的前几周,(7)成为一个青少年,(8)高中后。注意这里的编码暗示了被研究者如何排列她的生活。这里的编码并不反映统一的时间跨度或者其他研究者强加的时间段。在建立生活史编码系统时,被研究者自己的分类方案通常就作为编码了.

过程编码方案也是案例研究中常用的数据组织方式。在这里,组织随时间的发展变化是关注的焦点。同样,对有计划的社会干预的研究可以用一个编年编码方案来编码,编年编码是历史研究的基础。

在有的研究中,过程编码分类是占统治地位的,但在其他研究中可能只是作为被用到的多种方法之一。比如,在一个对教室的研究中,下列标题揭示了作为其他编码族的补充的编码分类:“教师生涯的阶段”、“学年”、“学校的一周”、“被青少年群体接受的步骤”,还有“退学的过程”。

被编码为“教师生涯的阶段”的数据单元的例子如下:

我在这五年了,虽然我不觉得自己像马奇和苏那样老资格了,但我也不再天真了。当我看到新老师进来时,我会对自己说:“你们有的受了,我就是这样过来的”。

六、活动码

活动码用来指代常规性发生的行为。这些行为可以是相对非正式的,并且可以衍出类似“学生抽烟”、“开玩笑”或“放电影”这样的类属,或者是作为环境的正式组成部分的其他经常发生的行为,像“学校中的早操”、“午餐”、“出勤”、“学生访问校长办公室”、“班级出游”和“特教案例会”。可以用这样的标题来编码的数据单元是显而易见的。下面是从一个小学的特殊教育项目的研究中摘出的例子。这个会议是关于有情绪困扰的儿童应该被如何安置在班里的。

尽管会议应该11点开始,但我11:05到时屋子里一个人还没有.(O.C.:这是我参加的第三次会议了,其他人十分钟后才会陆续赶来而且只有一半人出席.)第一个

到的人是布朗博士。

七、事件码

这类编码指向那些记录你所研究的环境或采访的研究对象生活中发生的特定活动的数据单元.事件码指向那些频繁发生或者只发生一次的事件。比如,在一个研究中,有采访女性的小学经历的环节,第一次月经是所有女人都提到的事件。这个事件就成为一个编码分类。在参与式观察的研究过程中,能够成为编码分类的事件是研究对象足够注意并大加讨论的事件。在你的研究之前发生的事件可能是被频繁讨论的话题。在一些参与式观察研究中以下事件成为编码分类:“教师

被抄鱿鱼”、“教师罢工”、“骚乱”和“学校庆典”。

以下引文是被编码为这种编码分类的数据的例子,“骚乱”一词是从与一位教师的谈话中摘出的。

出事那天来了很多警车,大部分孩子不知道发生了什么事。布朗警官没有浪费时间。事情太严重了,学校仍然没有渡过难关。

八、策略码

策略指的是人们用以完成各种事情的战术、方法、技术、伎俩、手段和其他有意识的方式。比如,教师采用一定的策略来控制学生行为、教授阅读、使学生顺利通过一个学年、逃避在大厅里的义务、得到他们想教的班级。学生利用策略来通过考试、会见朋友、对冲突的需求进行协调。校长利用策略来摆脱老师、开设新的职位或减少旷课。以下引文可以被编码为类别码“控制班级的策略”:

德雷夫人走进教室,没人老老实实在座位上坐着。大家都在站着说话,有的声音很大。詹米开着他的收音机。德雷夫人用一种演讲的语调说“我们开始上课”,但明显听得出不耐烦,她等了一秒,学生们照旧说笑。他侧身向詹森说了些话,我听不到。然后詹森用一副很大的唱歌的腔调说“注意了!注意了!我要说个通知!”大家都不说话了,看着詹森。他说:“开始上课了,安静点。”大家都坐下了。里昂大声说:“詹森老大,你应该拿薪水的!”德雷克夫人带着笑容对里昂说“你没听到吗?”

九、人际关系和社会结构码

对于人们之间不是被组织结构图定义的那种常规行为模式我们称之为人际关系。人际关系码所包含的数据单元有派系、友谊、爱情、联盟、角色设定和职位,它们代表了这类编码分类的一部分。对一个环境中人际关系的总体描述称为“社会结构”。对这个领域的涉及引向一个社会结构描述系统的建立。

下面是跟人际关系相关的一个数据单元,可以被编码为人际关系/社会结构码,比如“学生友谊”:

学生们走进本班的教室,一群男孩——提姆、哈里、彼得和布莱恩——站在门边,半坐在课桌上,聊天。他们昨天也是这么干的。玛丽和苏一起进来,两人坐在一起,贝丝和艾利森也是如此。(O.C.:男生似乎是成群结伙地玩。相反,女孩总是一对一对地玩。我将会检查这个结论是否成立。有的孩子跟其他人并无

联系,有的则经常在一起……)

十、叙事码

叙事码描述了谈话本身的结构。当数据提供者告诉你他们的故事时,他们实际上提供了一个有特定框架的生活记述。如果是以叙事形式来呈现的,那么叙事的结构是什么?故事从哪里开始?讲了什么?如何结束的?数据提供者组织他们的故事时,有些什么冲突?通常,数据提供者会想同时表达两个观点,或者前后矛盾,或者被牵扯到多个方向,或者他们无法用言语清楚地表达某种情形。

以下两则数据显示了这些问题。两个访谈记录都是关于一个女大学生对性别的看法的研究项目的,研究的访谈部分探索了来自九个专业的低年级高年级学生的观点,以下两段数据的提供者来自生化专业。访谈记录诠释了一种叙事形式和一个冲突。

关于基沙如何讲述自己的故事,她叙述故事的方式有很多地方值得分析.对

这些故事提出的问题包括以下几点:

1.基沙如何构造她的生活故事?我们对这个故事似曾相识是因为之前听到过类似的,出乎意料的是,到目前为止,基沙实现了一个美国梦,借助一些老师的帮助,几乎是自力更生地提升自我,进入一个有利的职业领域。尽管基沙对社会中的种族问题有清醒认识,但是她相信个人努力。

2.你在基沙谈话的哪里发现了冲突?冲突通常是一个多产的分析领域,因为它们暗示着挣扎。在基沙谈论自己作为某些科学课班级里唯一非裔美国人的经历里,她既描述了突出的感受,又坚持自己不以为这是个问题。基沙在此面对的究竟是什么?

研究者事先设定的编码系统

有时研究者会被他人雇用去探索某一环境或研究对象的特定问题或方面。在这种情况下,编码分类会或多或少地提前被设定。在开展的一个对残疾儿童的研究中,研究者建立了一个主题列表给那些参与研究的人,指导他们收集数(参见表10.1)。这稍后成为研究者的编码分类。许多评估研究的编码方案会受研究资助方和开展研究的人之间达成协议的影响,有时甚至是对协定的一种直接反映。此时编码可以从协议中推导出来。

表10.1 全纳案例研究的观察指导

以下是你应该搜集数据的一些大体的领域,可以利用大的领域下列出的细节话题来指导你。只有当该领域信息和“回归主流”及残疾儿童相关时我们才会感兴趣。比如,如果学校整体上创新性很强,我们感兴趣是因为它可能意味着员工勇于接受改变的气质。

对学校的描述(提供几页的情境描述)

?硬件

?历史

?学生数

?邻里

?教师

?特色

?声誉

?著名的毕业生或与学校有关的名人

?地理位置

班级或项目

?在学校里的地位

?它的历史——对残疾儿童教育的项目何时开始,如何进行(如安置过程、孩子如何被分配、教师的参与、家长的选择)

?对于班级空间利用的物理描述(如学习中心、分开的小房间等、班级空间的改装、为残疾儿童提供的设备、墙上的东西、座次安排/教师桌的位置、条件)?组织——包括权威(决策制定),享有资源的人的离散程度

?年级

?使用中的项目和机会

教师和/或其他人员

?风格

?物理描述

?当教师的历史

?对他/她所做的事情的看法,尤其他/她试图将残疾儿童融入班级时

?他/她是怎样变得像现在这样看待事物的

?典型的一天

?与普通儿童和残疾儿童的关系

?教室中的其他人员(助教、小老师)

?与教室相关的资源人员(他们的角色、观点)

?对“特殊”教师的利用——美术、音乐、体操——他们如何与全纳项目相关,他们的观点及其重要性

?与其他普通教师同事的关系(如何被看待、合作、支持)

?教师认为谁是支持的力量

被定义为残疾儿童

?、他们的所作所为与一般孩子有何异同点

?伙伴关系——他们是什么(社会测量),教师如何影响

?典型的一天

?身体描述

?病情描述(残疾程度、独立性)

?受教育历史和家庭历史

?物理位置——坐在哪儿(同教师和其他孩子相比)

?其他人描述他们所用的词汇

?教师如何定义他们的进步(与其他人相比是否相同),社交目标和学业目标的平衡

?个别化教育方案(参见课程部分)、

?与教师联系的量和特点(与典型学生相比)

典型的学生

?身体描述

?学业描述

?衣着

?背景

?他们如何与彼此及老师相处

课程

?内容(使用的材料、任何采用的设备、个性化?)

?过程(整组,小组,个别化,一对一,一体化还是残疾人单独分开?)?花在残疾儿童和典型儿童身上的时间量的对比

?个别化教育方案(是否有,谁写的,是否实现了,是否合适)

家长

?教师与家长联系的量和特点

?家长会问到孩子在回归主流项目中的安排么?

?家长对残疾儿童的个别化教育方案的参与

?家长对全纳教育和项目丰功的看法

校长和其他支持人员和行政人员

第八章卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

卡方检验 (Chi-square)

卡方检验(Chi-square) ?参数与非参数检验 ?卡方匹配度检验 ?卡方独立性检验 ?卡方检验的前提和限制 ?卡方检验的应用 参数与非参数检验 ?参数检验 ◆用于等比/等距型数据 ◆对参数的前提:正态分布和方差同质 ?非参数检验 ◆不用对参数进行假设 ◆对分布较少有要求,也叫d i s t r i b u t i o n-f r e e t e s t s ◆用于类目/顺序型数据 ◆没有参数检验敏感,效力低 ◆因此在二者都可用时,总是用参数检验 卡方匹配度检验 ?用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度?是对次数分布的检验 ?研究情境 ◆在医生职业中,男的多还是女的多? ◆在三种咖啡中,哪种被国人最喜欢? ◆在北京大学中,各国留学生的比例有代表性吗? 卡方匹配度检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=p n ?d f=C-1 ◆F0:观察次数 ◆f e:期望次数 ◆C:类目的个数 ◆Χ2:统计量 卡方独立性检验 ?检验行和列的两个本来变量彼此有无关联 卡方独立性检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=(r o w t o t a l)(c o l u m n t o t a l)/n, ?d f=(R-1)(C-1)

◆F0:观察次数 ◆f e:期望次数 ◆R:行类目的个数C:列类目的个数◆Χ2:统计量 例:х2检验 1.计算期望次数fe=(fc*fr)/n 2.计算每个单位格的х2值 22 df=(R-1)(C-1)= (3-1)(2-1)=2,х2的临界值为5.99 拒绝Ho,对手表显示的偏好程度与被试的年龄段有关

卡方独立性检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

无差检验、独立性检验 SPSS

作业6: 1.无差检验 随机从某市抽取90名教师,其中高级职称有30名,中级职称有42名,初级职称有18名。若假设规定高、中、初级职称比为2:6:2,试问这一调查结果是否与规定相一致? 注:上表中“1”表示高级职称、“2”表示中级职称、“3”表示初级职称。 (2)研究假设 零假设:这一调查结果与规定一致。 备择假设:这一调查结果与规定不一致。 (3)操作说明 1.输入数据。保存为“数据1”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案” 对话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使 之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数 据编辑框。 3.卡方检验。单击“分析”菜单下的“非参数检验”,选项中得“卡方检验”命令。 在弹出的“卡方检验”对话框中,因为要对高级职称、中级职称、初级职称的人数 进行分析,所以在对话框左侧的列表中选择“职称”变量,单击“添加”按钮使之 添加到“检测变量列表”框中。在“期望值”框中得“数值”处输入理论上高级职 称、中级职称、初级职称的比例2:6:2,然后单击“确定”按钮,SPSS开始进行卡 方检验。 (4)生成图表及结果解释 从第一个表格中可以看出高、中、初级职称的实际观测值、理论值和两者之间的差异个数;从第二个表格中可以看出自由度df=2,X2=10.667>9.210= X20.01 (2), P<0.01,所以拒绝零假设,支持备择假设,即这一调查结果与规定不一致。

2.独立性检验 在研究初中厌学学生意志力时,某研究得到下表样本资料,试问厌学学生的意志力水平是否与年级有关? (1)原始数据 (2)研究假设 零假设:厌学学生的意志力水平与年级无关。 备择假设:厌学学生的意志力水平与年级有关。 (3)操作说明 1. 输入数据。保存为“数据2”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案”对 话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数据编辑框。 3.独立性检验。单击“分析”菜单下的“描述统计”中得“交叉表”选项,在弹出的“交叉表”对话框中,将左边列表中得“年级”添加到“行”变量框中,将左边列表框中得“意志力水平”添加到“列”变量中。点击“统计量”按钮,在弹出的对话框中,选择“卡方检验”单选项。点击“继续”按钮,返回到“交叉表”对话框中,点击“确定”。SPSS开始进行独立性检验。 (4)生成图表及结果解释。

《独立性检验》

《独立性检验的基本思想及其初步应用》教学设计 东北师范大学附属实验学校李宇 一、教学内容与内容解析 1.内容: 独立性检验的基本思想及实施步骤 2.内容解析: 本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。 教学重点:理解独立性检验的基本思想及实施步骤. 二、教学目标与目标解析 1.目标: ①知识与技能目标 通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步

骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。 ②过程与方法目标 通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。这一直觉来自于观测数据,即样本。问题是这种来自于样本的印象能够在多大程度上代表总体。这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。 ③情感态度价值观目标 通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 2.目标解析: 独立性检验是考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.因此,在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力. 新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。从心理学的角度看,青少年有一种好奇的心态、探究的心理。因此,紧紧地抓住学生的这一特征,利用学生身边的问题“玩电脑游戏与注意力集中是否有关系”,设计教学情境,使学生在观察、讨论等活动中,逐步提高数据分析能力。 三、教学问题诊断分析 1.本节课的内容独立性检验对学生来说是全新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。 2.独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个

知识讲解 独立性检验的基本思想及其初步应用(文、理)

独立性检验的基本思想及其初步应用 编稿:赵雷审稿:李霞 【学习目标】 1. 了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用 2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用. 【要点梳理】 要点一、分类变量 有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。 要点诠释: (1)对分类变量的理解。 这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。 (2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。 要点二、2×2列联表 1. 列联表 用表格列出的分类变量的频数表,叫做列联表。 2. 2×2列联表 对于两个事件A ,B ,列出两个事件在两种状态下的数据,如下表所示: 这样的表格称为2×2列联表。 要点三:卡方统计量公式 为了研究分类变量X 与Y 的关系,经调查得到一张2×2列联表,如下表所示 统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 22 ()()()()() n ad bc K a b c d a c b d -=++++(n a b c d =+++为样本容量)。 要点四、独立性检验

1. 独立性检验 通过2×2列联表,再通过卡方统计量公式计算2K 的值,利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 2. 变量独立性的判断 通过对2K 统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断: ①如果2K ≤3.841时,认为事件A 与B 是无关的。 ②如果2K >3.841时,有95%的把握说事件A 与事件B 有关; ③如果2 K >6.635时,有99%的把握说事件A 与事件B 有关; 要点诠释: (1)独立性检验一般是指通过计算2K 统计量的大小对两个事件是否有关进行判断; (2)独立性检验的基本思想类似于反证法。即在H 0:事件A 与B 无关的统计假设下,利用2K 统计量的大小来决定在多大程度上拒绝原来的统计假设H 0,即拒绝“事件A 与B 无关”,从而认为事件A 与B 有关。独立性检验为假设检验的特例。 (3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。 3.独立性检验的基本步骤及简单应用 独立性检验的步骤: 要推断“A 与B 是否有关”,可按下面步骤进行: (1)提出统计假设H 0:事件A 与B 无关(相互独立); (2)抽取样本(样本容量不要太小,每个数据都要大于5); (3)列出2×2列联表; (4)根据2×2列联表,利用公式:22 ()()()()() n ad bc K a c b d a b c d -=++++,计算出2 K 的值; (5)统计推断:当2 K >3.841时,有95%的把握说事件A 与B 有关; 当2 K >6.635时,有99%的把握说事件A 与B 有关; 当2K >10.828时,有99.9%的把握说事件A 与B 有关; 当2K ≤3.841时,认为事件A 与B 是无关的. 要点诠释: ① 使用2 K 统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5.

非参数检验(卡方检验)实验报告

大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验)专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

一、实验目的 对分类资料进行卡方检验。 二、实验环境 1、硬件配置:处理器:Intel(R)Core(TM) i5-4210U CPU @1.7GHz 1.7GHz 安装内存 (RAM):4.00GB 系统类型:64位操作系统 2、软件环境:IBM SPSS Statistics 19.0软件 三、实验内容 (包括本实验要完成的实验问题及需要的相关知识简单概述) (1)课本第六章的例6.1-6.5运行一遍,注意理解结果; (2)然后将实验指导书的例1-4运行一遍,注意理解结果。 四、实验结果与分析 (包括实验原理、数据的准备、运行过程分析、源程序(代码)、图形图象界面等) 例6.1 表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表 效果 杀灭未杀灭 合计组别灭螨A 32 12 44 灭螨B 14 22 36 合计46 34 80 分析:表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表,即交叉列联表。 表2 卡方检验 X2值df 渐进Sig. (双侧) 精确Sig.(双侧) 精确Sig.(单侧) Pearson 卡方9.277a 1 .002 连续校正b7.944 1 .005 似然比9.419 1 .002 Fisher 的精确检验.003 .002

有效案例中的N 80 a. 0 单元格(.0%) 的期望计数少于5。最小期望计数为15.30。 b. 仅对2x2 表计算 分析:表2是卡方检验的结果。因为两组各自的结果互不影响,即相互独立。对于这种频数表 格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。 Pearson 卡方:皮尔逊卡方检验计算的卡方值(用于样本数n≥40且所有理论数E≥5); 连续校正b:连续性校正卡方值(df=1,只用于2*2列联表); 似然比:对数似然比法计算的卡方值(类似皮尔逊卡方检验); Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例6.1为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=7.944,P(Sig)=0.005<0.01,表明灭螨剂A组的杀螨率极显著高于灭螨剂B组。 例6.2 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 1 2 3 合计治疗方法 1 19 16 5 40 2 16 12 8 36 3 15 13 7 35 合计50 41 20 111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df 渐进Sig. (双侧) Pearson 卡方 1.428a 4 .839 似然比 1.484 4 .830 线性和线性组合.514 1 .474

(新)高中数学第一章统计案例1_1独立性检验卡方检验素材新人教B版选修1-21

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

第三节-两个样本平均数差异显著性检验

第三节两个样本平均数的差异显著性检验 在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计不同,一般可分为两种情况:一是非配对设计或成组设计两样本平均数的差异显著性检;二是配对设计两样本平均数的差异显著性检。 一、非配对设计两样本平均数的差异显著性检验 非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。非配对设计资料的一般形式见表5-2。 表5-2非配对设计资料的一般形式 处理观测值xij 样本含 量ni 平均数总体平均 数 1 x11x12…n1 =Σx1j/n1 2 x21x22…n2 =Σx2j/n2 非配对设计两样本平均数差异显著性检验的基本步骤如下:(一)提出无效假设与备择假设:=,:≠(二)计算值计算公式为: (5-3) 其中:(5-4)

= = 当时, ==(5-5) 为均数差异标准误,、,、,、分别为两样本含量、平均数、均方。 (三)根据df=(n1-1)+(n2-1),查临界值:、,将计算所得t值的绝对值与其比较,作出统计推断 【例】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异 表5-3长白与蓝塘后备种猪背膘厚度 品种头 数 背膘厚度(cm ) 长白1 2 、、、、、、、、、、、 蓝塘1 1 、、、、、、、、、、 1、提出无效假设与备择假设:=,:≠

8.1 独立样本四格表资料的卡方检验

第八章c 2 检验 一、独立样本四格表资料的c 2 检验

问题的提出: 通过前面两章的学习,我们知道可以采用t检验比较两个样本均数的差别是否有统计学意义,可以采用F检验多个样本均数之间的差别是否有统计学意义。在医学研究中,还 常需对比两组或多组定性变量资料之间的差别,例如比较两 种或多种治疗方法的治愈率是否不同。该怎么办?

表 8-1 两种药物治疗消化道溃疡 4周后疗效 处理 愈合 未愈合 合计 愈合率(%) 洛赛克64 21 85 75.29 雷尼替丁51 33 84 60.71 合计115 54 169 68.05 (57.84)(57.16) (26.84)(27.16) ( )2 2 2222 (6457.84)(2127.16)(5157.16)(3326.84) 4.13 57.8427.1657.1626.84 A T T c - = ---- =+++= ? 1.1 c 2 检验的基本思想

1.2 2×2列联表c 2 检验的基本步骤 1.建立检验假设,确定检验水准 H 0: 2 1 p p = ,即两种药物治疗消化道溃疡的愈合率相同 H 1: 12 p p 1 ,即两种药物治疗消化道溃疡的愈合率不同 a = 0.05 2.计算统计量 ( ) 2 2 2222 (6457.84)(2127.16)(5157.16)(3326.84) 4.13 57.8427.1657.1626.84 A T T c - = ---- =+++= ?

3.确定P值,做出推断 n自由度为ν=(行数―1)×(列数―1) n按自由度等于1 , 检验水准等于0.05, 查附表8,得c 2 0.05, 1 = 3.84。 本例c 2 = 4.13,可知P<0.05。在α=0.05水平上拒绝H 0 ,两样本频率的差异具有统计学意义。 n因为洛赛克的样本愈合率为75.29%,雷尼替丁的愈合率为 60.71%,可以认为洛赛克的愈合率比雷尼替丁的愈合率高。

SPSS非参数检验之一卡方检验

SPSS中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为x2佥验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总 体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时,就近似服从X的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q O i E i E i 其中,Oi表示观察频数;Ei表示期望频数或理论频数。可见Q值越大,表示观察频数和理论频数越不接近;Q值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q统计量,由于Q统计量服从K-1个自由度的X平方分布,因此SPSS 将根据X 平方分布表给出Q统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样 本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大 于显著性水平,则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧 郁数是否满足1:1:221:1:1。

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

使用SPSS进行两组独立样本的t检验、F检验、显著性差异、计算p值

使用SPSS 进行两组独立样本的t检验、F检验、显著性差异、计算p值 SPSS版本为SPSS 20. 如有以下两组独立的数据,名称分别为“111”,“222”。 111组:4、5、6、6、4 222组:1、2、3、7、7 首先打开SPSS,输入数据,命名分组,体重和组名要对应,111组的就不要输入到222组了。数据视图如下: 变量视图如下,名称可以改成“分组嗷嗷嗷”“体重喵喵喵”等

点击“分析”-“比较均值”-“独立样本T检验” 来到这里,分组变量为“分组嗷嗷嗷”,检验变量为“体重喵喵喵”。

【关键的一步】点击分组嗷嗷嗷,进行“定义组”

【关键的一步】输入对应的两组数据的组名:“111”和“222” 点击确定,可见数据与组名对应上了。

点击“确定”,生成T检验的报告,即将大功告成!

第一个表都知道什么回事就不缩了,excel都能实现的。 第二个表才是重点,不然用SPSS干嘛。 F检验:在两样本t检验中要用到F检验,F检验又叫方差齐性检验,用于判断两总体方差是否相等,即方差齐性。 如图:F旁边的Sig的值为.007 即0.007,<0.01, 即两组数据的方差显著性差异! 看到“假设方差相等”和“假设方差不相等”了么? 此时由于F检验得出Sig <0.01,即认为假设方差不相等!因此只关注红框中的数据即可。 如图,红框内,Sig(双侧),为.490即0.490,也就是你们要求的P值啦, Sig ( 也就是P值) >0.05,所以两组数据无显著性差异。 PS:同理,如果F检验的Sig >.05(即>0.05),则认为两个样本的假设方差相等。 所以相应的t检验的结果就看上面那行。 by 20150120 深大医学院FG

5习题-卡方检验知识讲解

计数资料统计分析————习题 1.220.05,n x x ≥ 则( ) A.P ≥0.05 B.P ≤0.05 C.P <0.05 D.P =0.05 E.P >0.05 2.2x 检验中,自由度v 的计算为( ) A.行×列(R ×C ) B.样本含量n C.n-1 D.(R -1)(C -1) E.n 2.四格表卡方检验中,2x <20.05(1)x ,可认为 A.两样本率不同 B.两样本率相同 C.两总体率不同 D.两总体率相同 E.样本率与总体率不同 3.分析计数资料时,最常用的显著性检验方法是( ) A.t 检验法 B.正态检验法 C.秩和检验法 D.2 x 检验法 E.方差分析 4.在卡方界值(2x )表中,当自由度一定时,2x 值愈大,P 值( ) A.不变 B.愈大 C.愈小 D.与2x 值相等 E.与2x 值无关 5.从甲乙两篇论文中,查到同类的两个率比较的四格表资料以及2x 检验结果,甲论文 2x >20.01(1)x 2x >2 0.05(1)x 。若甲乙两论文的样本量相同,则可认为( ) A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信 D.甲论文结果不可信 E.甲论文说明两总体的差别大 6.计算R ×C 表的专用公式是( ) A. 22 ()()()()()ad bc n x a b a c b d c d -=++++ B. B. 2 2 ()b c x b c -=+ C . 2 2 1R C A x n n n ??=- ???∑ D. ()220.5b c x b c --=+ E. 2 2 ()A T x T -=∑

T检验、F检验和统计学意义,想了解显著性差异的也可以来看

一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。 F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。 2,统计学意义(P值或sig值) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 3,T检验和F检验

8.2 多个独立样本R×C列联表资料的卡方检验

第八章c 2 检验 二、多个独立样本R×C列联表资料的c 2 检验

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? 2.1 频率的比较

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效 组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 2.1 多个独立样本频率的比较 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? c 2 (A, B ) =4.419,P =0.036,P ’=0.108

2.2 独立样本频率的比较 表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布 分组A 型 B 型 O 型 AB 型合计 儿童30 38 32 12 112 成人19 30 19 9 77 合计49 68 51 21 189 c 2 0.75,3 =1.21,P >0.75 2 2 11 (1)0.695 R C i j i j i j A n n m c == =- = ??

《独立性检验》教案3

《独立性检验》教案3 教学内容: 人教版数学高中选修2—2《独立性检验》 教学目标: 1、分类变量的概念 2. 列联表及利用2x2列联表以及统计量卡方对两个变量进行独立性检验 3、理解独立性检验的思想并掌握独立性检验的实际应用 教学重点: 列联表及利用2x2列联表以及统计量卡方对两个变量进行独立性检验 教学难点: 对临界值的理解。 知识链接: 1、复习独立性检验的步骤。 2、可信程度。 教学过程: 1. 分类变量概念 方法与规律: 看是否是分类变量只需看变量的不同值是否表示个体的不同类别 例下列不是分类变量的是: A. 人的性别 B. 国籍 C. 商品的等级 D. 身高 反思: 2. 列联表与独立性检验 方法与规律:推断X与Y有关系可按下列步骤进行: (1)找相关数据,做列联表并画出等高条形图,初略判断两变量是否相关 (2)独立性检验方法判定两边量是否有关 H: X与Y没有关系 ①假设 ②根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a, k 然后查表1-11确定临界值 o K的观测值k ③利用公式(1),计算随机变量2 ④如果,就判断“X与Y有关系”,这种判断犯错误的概率不超过a,否则,就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或则在样本数据中没有发现足

够证据支持结论“X与Y有关系”, 例1 某县对在职的71名高中数学教师就支持旧的数学教材作了调查,结果如下表所示: 分析:根据独立性检验思想,由公式计算出的观测值,然后与临界值比较得出结论。独立性检验能帮租我们对日常生活中的实际问题做出合理的推断与预测。因此要在学习中通过案例分析,理解和掌握独立性检验的方法,体会其基本思想在在解决实际问题中的应用,以提高我们分析和处理问题的能力。

显著性检验卡方检验等剖析

第十章 研究资料的整理与分析 本章学习目标: 1.理解量化资料整理与分析中的几个基本概念。 2.掌握几种常用的量化分析方法。 3.掌握质性资料的整理分析方法。 无论采用什么研究方法进行研究,都会搜集到大量的、杂乱的、复杂的研究资料。因此,对大量的、复杂的研究资料进行科学、合理的整理和分析,就成为教育科学研究活动的必不可少的一个环节。这一环节体现着研究者的洞见,是研究者对研究资料进行理性思维加工的过程。通过这一过程,产出研究结果。 根据研究资料的性质,研究资料可以分为质性研究资料和量化研究资料。对研究资料的整理和分析就相应的分为:质性研究资料的整理与分析和量化资料的整理与分析。 第一节 定量资料的整理与分析 一、定量资料分析中的几个基本概念 1.随机变量 在相同条件下进行试验或观察,其可能结果不止一个,而且事先无法确定,这类现象称为随机现象。表示随机现象中各种可能结果(事件)的变量就称为随机变量。教育研究中的变量,大多数都是随机变量。如身高、智商、学业测验分数等。 2.总体和样本 总体是具有某种或某些共同特征的研究对象的总和。样本是总体中抽出的部分个体,是直接观测和研究的对象。例如,要研究西安市5岁儿童的智力发展问题,西安市的5岁儿童就是研究的总体,从中抽取500名儿童,这500名儿童就成为研究的样本。 3.统计量和参数 统计量:反映样本数据分布特征的量称为统计量。例如:样本平均数、样本标准差、样本相关系数等,都属于统计量,它们分别用 表示。统计 量一般是根据样本数据直接计算而得出的。 参数:反映总体数据分布特征的量称为参数。例如:总体平均数、总体标准差、总体相关系数等。它们分别用ρσμ,,等符号来表示。总体参数常常需要根据样本统计量进行估计和推断。 4.描述统计与推断统计 描述统计是指对获得的杂乱的数据进行分类、整理和概括,以揭示一组数据

相关文档
最新文档