统计学复习(均值比较-卡方检验)

统计学复习(均值比较-卡方检验)
统计学复习(均值比较-卡方检验)

实验报告格式

重庆工商大学 《统计学》实验报告 实验课程:统计学 _ 指导教师:陈正伟 _ 专业班级: 08 经济学 学生姓名:程剑波 学生学号: 2008011133 __

实验项目 实验日期实验地点80608 实验目的掌握统计学的基本计算方法和分析方法。 实验内容一、统计图绘制;二、动差、偏度系数、峰度系数的计算;三、趋势性的绘制; 四、相关分析与回归分析;五、时间数列的动态指标分析;六、循环变动的测 算分析。 通过统计学(2009.9.10-2009.12.15)实验报告如下: 一、统计图绘制; (一)过程: (二)结果: (三)分析: 二、动差、偏度系数、峰度系数的计算; (一)过程: (二)结果: (三)分析: 三、趋势性的绘制; (一)过程: (二)结果: (三)分析: 四、相关分析与回归分析; (一)过程: (二)结果: (三)分析:

五、时间数列的动态指标分析 (一)过程: (二)结果: (三)分析: 六、循环变动的测算分析。 (一)过程: (二)结果: (三)分析: 体会: 参考实验报告: 重庆工商大学数学与统计学院 综合评价方法及应用 实验报告

实验课程:非参数统计 _ 指导教师:陈正伟 _ 专业班级: 06市调2班 学生姓名:何春 学生学号: 2006004151 _

实验报告一 实验项目变异系数法相关系数法熵值发坎蒂雷法 实验日期2009-4-30 实验地点80608 实验目的 通过本实验本要求掌握综合评价指标体系中各个指标重要性权数的重要意义;掌握权数确定的定性和定量技术和技能;解决实际综合评价中重要性权数确定的处理技能。 实验内容 根据资料使用变异系数法、相关系数法、熵值法和坎蒂雷方法分别确定各个指标的权数。并进行权数比较分析。 检验方法的选择及实验步骤及结果: 1用变异系数求各个指标的权数: 基本步骤:(1)先求各个指标的均值Xi 和标准差 Si (2)接着求各个指标的变异系数Vi=Si/Xi (3)对Vi作作归一化处理,及得各个指标的权数 结果如下: 从这个表中可以看到最后一列的权数最大,即人均创造总收入这个指标在这项评价上的分辨信息丰富,这个指标的数值能明确区分开各个评价被评价对象差异。同理,第四列的权数最小,也就是说各个被评价对象在某项指标上的数值差异较小,那么这项指标区分开各评价对象的能力较弱。 2 用相关系数法求各个指标的权数: 基本步骤:(1)计算各个指标之间的相关系数矩阵 (2)构造分块矩阵 R1(去掉相关系数矩阵的第一行和第一列)R2 R3 R4 R5 R6 同理可得

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

统计学教案习题08卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格 表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算 表8-1 2 检验的用途、假设的设立及基本计算公式 01四格表 ①独立资料两 样本率的比较 ②配对资料两 样本率的比较 0H :两总体率相等 1H :两总体率不等 ①专用公式 ))()()(()(22 d b c a d c b a n bc ad ++++-=χ ②当n ≥40但1≤T<5时,校正公式 1

卫生统计学-卡方检验

卫生统计学之卡方检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假 设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不 应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间

卫生统计学第七章卡方检验 十

卫生统计学第七章卡方检验十 一、题型:A1 题号:1 本题分数:2 四格表资料两样本率比较的χ2检验,正确的一项为 A.χ2值为两样本率比较中u值 B.P<α前提下,χ2值越大,越有理由拒绝H0 C.χ2值大小与样本含量无关 D.每个格子的理论频数与实际频数的差值相等 E.χ2检验只能进行单侧检验 正确答案:B 答案解析:根据专业知识确定四格表资料两样本率比较的χ2检验采用单侧检验或是双侧检验,(也可使用四格表专用公式),可以证明四格表计算得出的χ2值与正态近似法两率比较中u值的平方相等,其大小与样本含量有关,且每个格子的理论频数与实际频数的差的绝对值相等,P<α前提下,自由度一定时,χ2值越大,P值越小,越有理由拒绝H0,故答案为B。 做答人数:0

做对人数:0 所占比例: 0 题号:2 本题分数:2 下列能用χ2检验的是 A.成组设计的两样本均数的比较 B.配对设计差值的比较 C.多个样本频率的比较 D.单个样本均数的比较 E.多个样本均数的比较 正确答案:C 答案解析:χ2检验可用于率或构成比比较的假设检验中,不适宜于均数的比较。 做答人数:0 做对人数:0 所占比例: 0 题号:3 本题分数:2 行×列表的自由度是 A.行数-1 B.列数-1

C.行数×列数 D.(行数-1)×(列数-1) E.样本含量-1 正确答案:D 答案解析:行×列表中,行的自由度=行数-1,列的自由度=列数-1,行×列二维表资料的χ2统计量所对应的自由度=(行数-1)×(列数-1)。做答人数:0 做对人数:0 所占比例: 0 题号:4 本题分数:2 四个百分率做比较,有一个理论数小于5,其他都大于5,则 A.只能做校正χ2检验 B.不能做χ2检验 C.直接采用行×列表χ2检验 D.必须先做合理的合并 E.只能做秩和检验 正确答案:C 答案解析:四个百分率做比较,资料可整理为4×2的行×列表,多个率比较的行×列表资料不适宜采用秩和检验,当满足行×列表资料

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

《卫生统计学》 案例版丁元林课后思考题答案

第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无 第十五章:无 第十六章:无 第十七章:DBABC BDE 第十八章:无 第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

卫生统计学试题(含答案)

医学统计方法选择题一: 医学统计方法概述 l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小 D某事件发生的可能性很大 E以上均不对 3.抽签的方法属于 D A分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫:B A计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数 8 23 6 3 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料 6.样本是总体的 C A有价值的部分 B有意义的部分 C有代表性的部分 D任意一部分 E典型部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计 B收集资料 C整理资料 D分析资料 E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对

10.以下何者不是实验设计应遵循的原则 D A对照的原则 B随机原则 C重复原则 D交叉的原则 E以上都不对 第八章数值变量资料的统计描述 11.表示血清学滴度资料平均水平最常计算 B A算术均数 B几何均数 C中位数 D全距 E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B A均数不变,标准差改变 B均数改变,标准差不变 C两者均不变 D两者均改变 E以上均不对 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时? C A 5 B 5.5 C 6 D lO E 12 15.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差 16.下列哪个公式可用于估计医学95%正常值范围 A A X±1.96S B X±1.96SX C μ±1.96SX D μ±t0.05,υSX E X±2.58S 17.标准差越大的意义,下列认识中错误的是 B A观察个体之间变异越大 B观察个体之间变异越小 C样本的抽样误差可能越大 D样本对总体的代表性可能越差 E以上均不对 18.正态分布是以 E A t值为中心的频数分布 B 参数为中心的频数分布 C 变量为中心的频数分布 D 观察例数为中心的频数分布 E均数为中心的频数分布 19.确定正常人的某项指标的正常范围时,调查对象是 B A从未患过病的人 B排除影响研究指标的疾病和因素的人 C只患过轻微疾病,但不影响被研究指标的人 D排除了患过某病或接触过某因素的人 E以上都不是 20.均数与标准差之间的关系是 E A标准差越大,均数代表性越大 B标准差越小,均数代表性越小 C均数越大,标准差越小 D均数越大,标准差越大 E标准差越小,均数代表性越大 第九章数值变量资料的统计推断 21.从一个总体中抽取样本,产生抽样误差的原因是 A

卫生统计学--卡方检验

第八章卫生统计学--卡方检 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2 χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ -= ,π为总体率,或 (8-1) n p p S p )1(-= , p 为样本率; (8-2) 2.总体率的可信区间

第八章记数据统计法—卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是( C )。 A)标准差B)方差 C)均数标准误D)变异系数 2.抽样研究中,s为定值,若逐渐增大样本含量,则样本( B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3.均数标准误越大,则表示此次抽样得到的样本均数( C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为,标准差为mmHg,后者反映的是( A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5.配对计数资料差别的卡方检验,其备择假设是( D )。 A)p1=p2 B)p1≠p2 C)B=C D)B≠C 6.下列关于总体均数可信区间的论述是正确的,除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内 D)95%是指此范围包含总体均数在内的可能性是95%,即估计错误的概率是5% 试题来源:【2016公卫执业医师考试宝典免 费下载】 小编教你如何快速通过公卫执业医师考试 查看其他试题,请扫描二维码,立即获得本 题库手机版详情咨询 7.总体率可信区间的估计符合下列( C )情况时,可以借用正态近似法处理。 A)样本例数n足够大时B)样本率p不太大时 C)np和n(1-p)大于5时D)p接近1或0时 8.正太近似法估计总体率95%可信区间用( D )。 A)p±B)p±σ

C)p±σ D)p± 9.统计推断的内容( C )。 A)用样本指标估计相应总体指标B)假设检验 C)A和B答案均是D)估计参考值范围 10.关于假设检验,下列哪个是正确的( A )。 A)检验假设是对总体作的某种假设 B)检验假设是对样本作的某种假设 C)检验假设包括无效假设和零假设 D)检验假设只有双侧的假设 11.两样本均数假设检验的目的是判断( C )。 A)两样本均数是否相等B)两总体均数的差别有多大 C)两总体的均数是否相等D)两样本均数的差别有多大 12.比较两种药物疗效时,对于下列哪项可作单侧检验( C )。 A)已知A药与B药均有效B)不知A药好还是B药好 C)已知A药不会优于B药D)不知A药与B药是否均有效 13.当总体方差已知时,检验样本均数与已知总体均数差别的假设检验是( B )。 A)只能用t检验B)只能用u检验 C)t检验或u检验 D)方差分析 14.完全随机设计的两样本均数t检验时,不仅要求数据来自正态分布总体,而且要求( B )。 A)两组数据均数相近,方差齐B)两组数据方差齐 C)两组数据均数相近D)两组数据的σ已知 15.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验( C )。 A)t值符号相反,结论相反B)t值符号相同,结论相同 C)t值符号相反,但结论相同D)t值符号相同,但大小不同,结论相反 16.以下正确的一项是( D )。 A)配对设计的t检验中t值的分子是两样本均数之和 B)配对设计的t检验中t值的分子是差值的和 C)配对设计的t检验中t值的分母是差值的标准差 D)配对设计的t检验中t值的分母是差值均数的标准误 17.在比较完全随机设计两个小样本的均数时,需要(校正)t检验的情况是( A )。 A)两总体方差不等B)两样本方差不等 C)两样本均数不等D)两总体均数不等

统计学例题-方差分析、相关分析、卡方检验和交互分析

第一章方差分析 完成的学历年数 收入平均值 ~弭) 2?x —刃2 初中(8年)X1 7.8 1835 高中(12年)X2 9.7 2442 大学(16年)X3 14.0 4707 例1、1977年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了 50位全日制工作的妇女 样本,她们的年收入(单位:千美元)数据整理后归纳如下: 解::顼=瓯x 爲 :三组收入均值有显著差异 SSb/dfb F = ,即组间均方/组内均方 S 片F / df 懈 其中,组间自由度 ^=3-1=2,组内自由度 .裁;百=(50-1) X 3=147 由于样本均值沪(7.8+9.7+14.0)/3=10.5 宙円『=50*(於也牒+ )=1009 组内偏差平方和 藝?=£》*為-昂尸=1835+2442+4707=8984 1009/2 所以,F = ^8.2548419 > (2,147)=3.07 B 964/147 0,n5 拒绝原假设;认为不同学历的妇女收入存在差异。 所以组间偏差平方和疑:=50 例2、月收入数据: 男:2500, 2550, 2050, 2300, 1900 女:2200, 2300, 1900, 2000, 1800 如果用Y 表示收入,哑变量X 表示性别(X=1为女性),计算Y 对X 的回归方程,并在5%的水平下 检验收入是否与性别无关(先求回归系数的置信区间) 。 根据最小二乘法,可知 h VAR(i^) VAR() = 1) 脸:收入与性别无关 (1) ⑵ ⑶ 收入与性别不完全无关

=2150 =0.5 根据公式1,得恰=-220 ;為才?徹,即Y=^^-220X+ll』j 根据公式2、3,得VAR(\|:)飞癒顾胡56.3549577 n=10., n-2=8 ;当df=8 时,i;叮旷2.306 的0.05置信区间求解方法如下: 亠 bg-B2 -2.036<= <=2.306,得既施用觀匡际忒140.57769. se(b2] 亠 由于原假设飓=0落入了这个置信区间,所以接受原假设,认为加系数不显著,收入与性别无关。 第二章相关分析 2)求总体相关系数T的95%置信区间; - - 13 由于弟=22,=23; = 祀.3426 1 V1440 ⑵由于se( ,)= ------ , n=10,df=8:j 靠足=2.306,所以詐匕亦弐卜 se( )=0.332 043426-p -2.036<= <=2.306 0332 得廉驾 —

卫生统计学(案例版)复习资料.doc

卫生统计学复习整理 一、统计工作基本步骤 1、设计 2、收集资料 3、整理资料 4、分析资料 二、调查研究的特点 1、不能人为施加干预措施 2、不能随机分组 3、很难控制干扰因素 4、一般不能下因果结论 三、常用的基本抽样方法 1、单纯随机抽样 先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签等方法之一随机抽取〃(样本大小)个编号,由这〃个编号所对应的〃个观察单位构成研究样本。 2、系统抽样 又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分隔成〃(样本大小)个部分, 每一部分内含/〃个观察单位;然后从第一部分开始,从中随机抽出第了号观察单位,依此用相等间隔/〃机械地在第二部分、第三部分直至第〃部分内各抽出一个观察单位组成研究样木。 3、分层抽样 先按对观察指标影响较大的某项或某儿项特征,将总体分成若干层(strata),该特征的测定值在层内变异较小、层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 将总体划分为群(初级观察单位),各群由次级观察单位组成。随机抽取一部分群,调查抽中群的全部次级观察单位。 5、多阶段抽样 抽样误差比较:分层抽样〈系统抽样〈单纯随机抽样〈整群抽样 四、实验设计的特点 1、研究者可人为设置处理因素 2、受试对象接受何种处理因素或处理因素的何种水平是随机的五、实验设计的三个基本要素 1、处理因素(或研究因素) 2、受试对象 3、实验效应 六、实验设计的基本原则 ?对照原则 ?随机原则 ?重复原则 ?均衡原则 七、常用的实验设计方案 ?完全随机设计 ?配对设计 ?随机区组设计八、定量资料集中趋势的描述指标:描述数据分布中心位置(平均水平)的指标。

统计学教案习题08卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H : 21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的 检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格 表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算 表8-1 2检验的用途、假设的设立及基本计算公式 01四格表 ①独立资料两 样本率的比较 ②配对资料两 样本率的比较 0H :两总体率相等 1H :两总体率不等 ①专用公式 )(22 n bc ad -= χ

相关文档
最新文档