[医学统计学课件]第十二章生存时间资料的非参数分析方法

第十二章生存时间资料的

非参数分析方法目录第一节生存时间资料的特点第二节小样本生存率的kaplan-Meier估计第三节大样本生存率的寿命表法估计第四节生存曲线比较的假设检验第一节生存时间资料的特点一、数据结构二、统计描述指标三、资料要求一、数据结构

在临床医学中, 对病人疗效考查：治疗结局？生存时间？生存时间的三个要点一、起始事件二、终点事件三、生存时间医学例子：起始事件随访时间终点事件

疾病确诊死亡随访（follow-up）资料的记录生存资料一般通过随访收集，记录的项目：（起始与终止）随访事件生存时间（开始观察日期与终止观察日期）（年、月、天、小时、分、秒等）分组变量（处理方法）和其它协变量（性别、年龄、职业、文化程度等）生存时间资料的特点 2个效应变量（1）生存时间(天数)，（2）结局(死亡与否、是否阳性等) 截尾数据：如表12-1中的1号和 3号病人未观察到底，不知他们究竟能活多长时间。产生结尾原因： (1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出(4)预定终止结果迟迟不发生分布类型复杂：生存时间分布常呈正偏态分布 2个效应变量（1）生存时间(天数)，（2）结局(死亡与否、

是否阳性等) 错误1：忽略生存时间，采用Logistic回归分析死亡

率错误2：忽略结局，采用t检验、线性回归分析生存时间 What is Censoring?（截尾问题）得不到确切的生存时间，但它们提

供的生存时间长于观察期的时间，这种数据为不完全数据。或截尾数

据、删失数据或终检值。（如有确切的生存时间，则这种数

据称为完全数据。）两种错误的做法：错误1：丢弃截尾数据，只

考虑确切数据。（损失了信息）错误2：将截尾数据当作确切数据处

理。（低估了生存时间的平均水平）。两种错误的做法：错

误1：采用平均生存时间而不是采用中位生存时间来表示生存时间的

平均水平。错误2：采用常规t检验或方差分析进行组间比较。（应

采用log-rank检验比较几组生存时间）二、生存分析的统计描述

指标 [例1] 手术治疗60例肺癌病人，术后每年死亡10例，无删失。

试求基本生存分析指标。N=60 注意：死亡率与死亡概率

的分子相同，但分母不同；生存概率与生存率的分子

相同，但分母不同 1 . 死亡率、死亡概率、生存概率 (1) 死亡率(mortality rate，death rate) 表示某单位时间内

的死亡强度。年平均人口数=(年初人口数+年末

人口数) (2) 死亡概率 ( mortality probability ) 指死于

某时段内的可能性大小。＝

d/n0 年内有删失，分母用校正人口数：校正人口数= 年初

人口数―删失例数 / 2 ＝n0－c/2 (3) 生存概率 ( survival probability ) 指某单位时

段开始时存活的个体到该时段结束时仍存活的可能性的大小。

＝ (n0-d)/n0 分子为年末尚存人数，若年内有删失，分

母用校正人口数。生存率 (survival rate) ( 累积生存概率

cumulative probability of survival ) 指病人经历t个单位

时间后仍存活的概率。生存概率指单个时段的概率，生存

率指从0~t多个时段的积累概率。公式1 用于完全数据

＝(n0-d)/N 公式2用于删失数据以及完全数据

S ( t ) = P (T ≥tk ) = p1 p2 …pk 例如手术治疗50例肺癌病人，术后1，2，3年的死亡

数分别为10，10，10例，无截尾数据。试求各年的生存

概率和3年生存率。解：各年生存概率 p1 = ( 50

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将 27 例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表 1-4。经检验，得连续性校正 2 =3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12（9.33） 6（8.67）无效 2（4.67） 7（4.33）合计 14 13 27 有效率（％） 85.7 46.2 66.7 18 9 【问题 1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组，属于完全随机设计方案。 (3) 患者总例数 n=27＜40，该医师用 2 检验是不正确的。当 n＜40 或 T＜1时，不宜计算 2 值，需采用四格表确切概率法（exact probabilities in 22 table）直接计算概率案例分析－卡方检验（一）【例 1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取 140 例胃炎患者分成中药组和西药组，结果中药组治疗 80 例，有效 64 例，西药组治疗 60例，有效 35 例。 1 / 5

医学统计学试题与答案

医学统计学试题及答案习题《医学统计学》第二版（五年制临床医学等本科生用）（一）单项选择题 1．观察单位为研究中的( d )。 A．样本 B. 全部对象 C．影响因素 D. 个体 2．总体是由（ c ）。 A．个体组成 B. 研究对象组成 C．同质个体组成 D. 研究指标组成 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。

医学统计学分析基本思路指南

医学统计学分析基本思路指南医学统计学的学习一定要以理解为主。对于初学者，不必强记一大堆的公式，也不要死钻牛角尖，非要弄明白为什么这种方法叫“t检验”、“F检验”，为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题，感兴趣的读者可以查阅统计学史。对于只想应用的人来讲，你只要了解在什么情况下应该用什么方法，什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验，然后选定统计量，然后怎么怎么。但实际中我们拿到一堆数据的时候，不会坐在桌上先列出零假设和备择假设，也不会满座子地计算统计量。更实际的分析思路是: （1）先确定研究目的，根据研究目的选择方法。不同研究目的采用的统计方法不同，常见的研究目的主要有三类：一是差异性研究，即比较组间均数、率等的差异，可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析，即分析两个或多个变量之间的关系，可用的方法有相关分析。三是影响性分析，即分析某一结局发生的影响因素，可用的方法有线性回归、logistic回归、Cox回归等。（2）明确数据您身边的论文好秘书：您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表，扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型，根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。（3）选定统计方法后，需要利用统计软件具体实现统计分析过程。SAS中，不同的统计方法对应不同的命令，只要方法选定，便可通过对应的命令辅之以相应的选项实现统计结果的输出。（4）统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果，需要从中选择自己需要的部分，并做出统计学结论。但统计学结论不同于专业结论，最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择，可供读者参考。

医学统计学论文

医学统计学论文【摘要】大学生是当今社会中的新鲜血液，是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平，同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以，提高当代大学生道德素质是当今社会刻不容缓的问题，同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据，对学校内的大学生道德现状进行客观分析，并得出相应数据。一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展，以总结现大学生存在的问题。 3分析原因，找到相关的原因。二、调查设计 1调查对象：郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法：采用问卷调查（问卷共30题） 4问卷：发放出书面问卷200份，回收问卷179份三、数据分析数据经整理后，采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。四、影响因素的分析为了能更好的来参照男女性别以及年级的不同，从而对调查问卷涉及的问题所给出的不同回答，我们做了诸多的关于性别差异，年纪差异的数据分析。其中也包括了T检验，交叉表等形式，当然，对于道德素质的选材，我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面，这给我们的调查统计造成了难以精准的障碍，另一方面，在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在，我们小组还是尽量在数据统计分析出的结果中找到相关性。 1，年级差异对道德水平的影响针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三，我们采用了不同的交叉表等形式来进行分析。

非参数统计分析NonparametricTests菜单详解

非参数统计分析――Nonparametric Tests菜单详解非参数统计分析――Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法，它们都是在已知总体分布的条件下，对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布，然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数，而是总体分布情况，即研究目标总体的分布是否与已知理论分布相同，或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数，因而称为非参数统计方法。 SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法，它们可以被分为两大类： 1、分布类型检验方法：亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括： Chi-square test：用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test：用于检测所给的变量是否符合二项分布，变量可以是两分类的，也可以使连续性变量，然后按你给出的分界点一分为二。 Runs Test：用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动，该数值可以是均数、中位数、众数或人为制定。一般来说，如果该检验P值有统计学意义，则提示有其他变量对该变量的取值有影响，或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test：采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符

合某种分布，可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 2、分布位置检验方法：用于检验样本所在总体的分布位置/形状是否相同。具体包括： Two-Independent-Samples Tests：即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples：成组设计的多个独立样本的秩和检验，此处不提供两两比较方法。 Two-Related-Samples Tests：配对设计的两样本秩和检验。 Tests for Several Related Samples：配伍设计的多样本秩和检验，此处同样不提供两两比较。一、分布位置检验方法 1、Two Independent Samples Test与 K Independent Samples Test 用于检验两独立样本/多独立样本所在总体是否相同。 Two-lndependent-Samples Test对话框: (1) Test Variable框，指定检验变量。 (2) Grouping Variable框，指定分组变量。Define Groups对话框，Groupl和Groupl后的栏中，可指定分组变量的值。 (3) TestType框，确定用来进行检验的方法。Mann-Whitney U：默认值，相当于两样本秩和检验。Kolmogorov-Smimov Z：K-S检验的一种。Moses extreme reactions：如果施加的处理使得某些个体出现正向效应，而另一些个体出现负向效应，就应当采用该检验方法。

医学统计学案例分析(1)

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验，得连续性校正χ2=3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（％）中药12（9.33）2（4.67）1485.7 西药 6（8.67）7（4.33）1346.2 合计1892766.7【问题1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 (3) 患者总例数n=27＜40，该医师用χ2检验是不正确的。当n＜40或T＜1时，不宜计算χ2值，需采用四格表确切概率法（exact probabilities in 2×2 table）直接计算概率案例分析－卡方检验（一）【例1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验（有效=1，无效=0）进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义检验（有效=1，无效=0）进行进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义，故认为中西药治疗胃炎的疗效有差别，中药疗效高于西药。

【问题1-1】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？（4）该资料应该用何种统计方法？【分析】(1) 该资料是按中西药疗效（有效、无效）分类的二分类资料，即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别，应用四格表资料的 X2检验（chi-square test）。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率的比较药物有效无效合计有效率（％）中药西药14（11.2） 2 （4.8） 14（16.8） 10 （7.2） 28 12 50.0 16.7 步骤如下： 1．建立检验假设，确定检验水准 H 0：两药的有效率相等，即π 1 ＝π 2 H 1：两药的有效率不等，即π 1 ≠π 2 2．计算检验统计量值 (1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。 (2) 计算χ2值具体计算略。

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。**绝不能对其中的两

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计简答 1 给了一张表，计算患病率，发病率，病死率，以及患者哪个年龄段最多，是多少，发病率哪个年龄段最多，是多少等等 2 一个单向有序资料（分组变量无序，指标变量有序），用了卡方检验，问你对不对为什么如果是你，用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料（列出了几个方程的校正决定系数，决定系数，剩余标准差等的数值），判断哪个方程回归效果最好，为什么 5 给了甲流的例子，用某药治疗，用了自身对照（用药前后抗体浓度变化为指标），得出了药物有效。问你合不合理，为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差计算 1 给了健康人的白天和晚上血压的相关数值（x和y各自的平均数，和，平方和，以及两者差值的均数等）注：计算时直接带入公式的相关数值（1）比较白天晚上血压有无差别(配对t检验计算) （2）白天和晚上血压有无相关(相关分析) （3）如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同（方差分析）（也有人说：一个大题，3问，第一问是配对t检验计算，第二问相关分析，第三问，回归分析，都是计算题15分）

3 样本率与总体率的比较 (u检验)（也有人说：配伍组方差分析） 2008 1. 列出样本标准误的估计值的公式，至少五个（包括两样本差值的标准误，两样本率差值的标准误等） 2. 医学统计中，将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验，你有什么建议若不符合卡方检验的应用条件，你又有什么建议他再比较三个样本率是否来自同一总体，也用了卡方检验，你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料：小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值（1）对体重增加量资料进行统计描述（2）求饮食量和体重增加量的关系（3）由体重增加量的样本估计其代表总体均数的可信区间（4）求小鼠体重增加量为X5（就是从体重增加量的那十个値里取了一个）的95%的置信区间（5）（3）和（4）中的可信区间有什么差别

医学统计学案例分析

案例分析—四格表确切概率法【例１-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将2７例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验,得连续性校正χ２＝3.134，P＞0．05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。表1－4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（%)中药1２（9.3３)2(4.67）1485.7 西药６（８．6７）7(4．3３）13４6．2 合计1892７6６．７【问题1-5】 (1）这是什么资料？（2）该资料属于何种设计方案？ (3) 该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果(有效、无效）分类的计数资料。 (2) ２7例患者随机分配到中药组和西药组，属于完全随机设计方案。(３) 患者总例数n=27<40,该医师用χ２检验是不正确的。当n＜40或Ｔ＜１时，不宜计算χ2值，需采用四格表确切概率法(exａct pｒoｂaｂｉｌiｔies in 2×2 taｂlｅ)直接计算概率案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取1４0例胃炎患者分成中药组和西药组，结果中药组治疗8０例,有效64例,西药组治疗60例，有效3５例。该医师采用成组t检验(有效=１，无效=0）进行假设检验，结果t=2．8４8,P=0.0０5,差异有统计学意义检验(有效=１，无效=０)进行进行假设检验，结果t＝２.8４８,P＝０.005，差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1）这是什么资料？(2）该资料属于何种设计方案？ (３)该医师统计方法是否正确？为什么？(4）该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料，即计数资料。（2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。（３) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。（4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(ｃｈｉ-sｑuare test）。【例1-２】 20０３年某医院用中药和西药治疗非典病人４0人，结果见表1-1。表1－1 中药和西药治疗非典病人有效率的比较药物有效无效合计有效率（%）中药西药14(11.2） 2 (4.８) １４(1６.8） 1０(7.2） 28 １2 ５0．0 １６.7 步骤如下: 1.建立检验假设,确定检验水准 H 0：两药的有效率相等，即π 1 ＝π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2．计算检验统计量值（1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。 (2) 计算χ2值

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下：表1 BCG治疗组生存情况 *死亡=1；删失=0

*死亡=1；删失=0 按上述二表将数据输入SPSS软件，其中数据编号为i，列（1）即时间为t，列（3）即生存结局为status，表1为group1，表2为group2。选择Analyze中的Survival里的Kaplan-Meier分析，将Time，Status，Factor依次选定，option 和Compare Factor依次设定完成后，得到输出结果，结果分析如下： Survival Table中： 1为BCG治疗组患者生存率（Estimate）及其标准误（Std. Error）的计算结果。2为药物与BCG结合治疗组患者生存率（Estimate）及其标准误（Std. Error）的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0：两种疗法患者生存率相同 H 1：两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验，得到上面Overall Comparisons 表，其中第一行为LogRank 检验结果。即X 2=0.057，P=0.811。按α=0.05水准，不拒绝H 0，还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。生存曲线如上图所示，其中生存时间为横轴，生存率为纵轴。

医学统计学案例分析报告.doc

医学统计学案例分析评述医学期刊论著：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论著未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确

非参数统计分析方法总结

非参数统计分析方法一单样本问题 1，二项式检验：检验样本参数是否与整体参数有什么关系。样本量为n给定一个实数MO（代表题目给出的分位点数），和分位点口（0.25,0.5,0.75）。用S-记做样本中比M0小的数的个数，S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为n。 H0：M=M0 HI: M k MO或者M>M（或者M

H1 ：不是随机的（混合倾向，游程多，长度短）（成群倾向，游程少，长度长) Spss步骤：分析一非参数检验一游程得出统计量R 和p 值当p值小于0.05时拒绝原假设，没有充足理由证明该数据出现是随机的二，两个样本位置问题 1，Brown —Mood 中位数检验给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系，设一个中值为M1，—个为M2 H0：M1=M2. HI: M1H M2或者M1>M或者M1

医学统计学案例分析

医学统计学案例分析案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞de疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检2验，得连续性校正χP,0.05，差异无统计学意义，故认为中西药治=3.134，疗急性心肌梗塞de疗效基本相同。表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12(9.33) 2(4.67) 14 85.7 西药 6(8.67) 7(4.33) 13 46.2 合计 18 9 27 66.7 【问题1-5】 (1) 这是什么资料, (2) 该资料属于何种设计方案, (3) 该医师统计方法是否正确,为什么, 【分析】 (1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 2(3) 患者总例数n=27,40，该医师用χ检验是不正确de。当n,40或T,1时， 2不宜计算χ值，需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验(有效=1，无效=0)进行假设检验，结检验(有效=1，无效=0)进行进行果t,2.848，P,0.005，差异有统计学意义假设检验，结果t,2.848，P,0.005，差异有统计学意义，故认为中西药治疗胃炎de疗效有差别，中药疗效高于西药。【问题1-1】 (1)这是什么资料,(2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料，即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布de计量资料，不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别，应用四格表资料de 检验(chi-square test)。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率de比较药物有效无效合计有效率(,) 中药 (11.2) (16.8) 28 50.0 1414 西药 2 (4.8) 10 (7.2) 12 16.7 合计 16 24 40 40.0 某医师认为这是完全随机设计de2组二分类资料，可用四格表de检验。其步骤如下: 1(建立检验假设，确定检验水准

医学统计学案例分析

医学统计学案例分析集团文件发布号：（9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学案例分析评述医学期刊论着：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。

②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论着未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确采用了那种统计方法，即是卡方检验还是秩和检验等。

医学统计方法小结

统计方法小结首次分享者：yanyan已被分享22次评论(0)复制链接分享转载删除一、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性，则作成组t检验 (2)若方差不齐，则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料，则用成组的Wilcoxon秩和检验 2.多组资料： 1)若大样本资料或服从正态分布，并且方差齐性，则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD检验，Bonferroni检验等）进行两两比较。 2)如果小样本的偏态分布资料或方差不齐，则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：用成组的Wilcoxon秩和检验，但用Bonferroni方法校正P值等）进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料： (1)小样本时：用二项分布进行确切概率法检验； (2)大样本时：用U检验。 2)多分类资料：用Pearson c2检验（又称拟合优度检验）。 2. 四格表资料 1)n>40并且所以理论数大于5，则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5，则用校正c2或用Fisher’s 确切概率法检验 3)n￡40或存在理论数<1，则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类，列变量为有序多分类变量，则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2 (2)n￡40或理论数小于5的格子数>行列表中格子总数的25%，则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标，并且为无序多分类变量，行变量为有序多分类变量，作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量，可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量，

医学统计学各种资料比较_选择方法小结

医学统计学各种资料比较选择方法小结一、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性，则作成组t检验 (2)若方差不齐，则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料，则用成组的Wilcoxon秩和检验 2.多组资料： 1)若大样本资料或服从正态分布，并且方差齐性，则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD检验，Bonferroni检验等）进行两两比较。 2)如果小样本的偏态分布资料或方差不齐，则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：用成组的Wilcoxon秩和检验，但用Bonferroni方法校正P值等）进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料： (1)小样本时：用二项分布进行确切概率法检验； (2)大样本时：用U检验。

2)多分类资料：用Pearson c2检验（又称拟合优度检验）。 2. 四格表资料 1)n>40并且所以理论数大于5，则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5，则用校正c2或用Fisher’s 确切概率法检验 3)n￡40或存在理论数<1，则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类，列变量为有序多分类变量，则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2 (2)n￡40或理论数小于5的格子数>行列表中格子总数的25%，则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标，并且为无序多分类变量，行变量为有序多分类变量，作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量，可以作Spearman相关分析

医学统计工作基本步骤(详细)

*医学统计工作的基本步骤 1设计主要指统计设计，是影响研究能否成功的最关键环节，是提高观察或实验质量的重要保证。内容包括对资料搜集，整顿和分析全过程的设想与安排。实验设计的三大原则：随机化，重复，对照。 2搜集资料：目的指应采取措施使能取得准确可靠的原始数据。来源：统计报表，工作记录，专题调查或实验研究，统计年鉴和统计数据专辑。要求：随机性和样本含量足够大 3整顿资料：将原始数据净化，系统化和条理化，为下一步计算和分析打好基础过程。 4分析资料：在表达数据特征的基础上，阐明事物的内在联系和规律性，包括两方面：统计描叙和统计推断 17均数的可信区间与参考值范围的区别？均数的可信区间与参考值范围的区别主要体现在含义，计算公式和用途三个方面的不同。（1）意义：均数的可信区间是按预先给定的概率，确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数，要么不包含。但可以说：该区间可多大（如当a=0.05时为95%）的可能包含了总体均数。而参考值范围是指‘正常人’的解剖，生理生化某项指标的波动范围。均数的可信区间计算公式（1）σ未知：X±指均数可信区间的用途：估计总体均数，参考值范围是指判断观察对象的某项指标是否正常。 7.假设检验与区间估计的关系：置信区间具有假设检验的主要功能；置信区间在回答差别有无统计学意义的同时，还可以提示差别是否具有实际意义；假设检验可以报告确切的P值，还可以对检验的功效做出估计。 1.标准差与标准误的区别：标准差是衡量观察值的离散趋势，描述正态分布资料的频数。标准误是样本均数的变异程度，表示抽样误差的大小，用于总体均数区间估计。两者联系：两者都是变异指标。在样本含量一定时，S越大标准误也越大，即在抽取相同例数的前提下，标准差越大，抽到的样本均数的抽样误差也越大。 2.P值和α：P值时从样本求得H0条件下随机抽样得到目前的统计量以及更极端统计量的概率，反映样本信息是否支持H0，也反映做出拒绝或不拒绝H0决定的理由充分程度。α时人为确定的小概率，容许犯第二类错误的概率，用作门槛，称检验水平。在假设检验中，通常时将P与α对比来得到结论，。 3.标准正态分布与t分布有何不同：t分布为抽样分布，标准正态分布为理论分布。t分布比标准正态分布的峰值低，且尾部瞧得更高。随着自由度的增大，t分布逐渐趋于标准正态分布。当自由度趋于无穷大时，t分布趋近于标准正态分布。 4.假设检验中，当P<0.05时，拒绝H0的理论依据。P值是指从H0规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。当P<0.05时，说明在H0成立的条件下，得到现有检验结果的概率小于通常确定的小怪绿时间标准的0.05。因小概率事件在一次试验中几乎不可能发生，现的确发生了，说明现在样本信息不支持H0，所以怀疑原假设H0不成立，拒绝H0。 5.t检验应用的条件：对单样本t检验要求资料服从正态分布；配对t检验要求差值服从正态分布；对两样本t检验则要求数据均服从正太分布，且两样本对应的两总体方差相等。 6.I型错误和Ⅱ型错误得区别与联系：I型错误是指拒绝了实际成立的H0所犯的弃真的错误，其概率大小用α表示，Ⅱ型错误是指接受了实际上不成立的H0所犯的取伪错误，其概率用β表示。当样本含量N确定时，α越小β越大，反之，α越大β越小。了解这两类错误的实际意义在于，若在应用中要重点减少α，则取α=0.05；若要在应用中要重点减少β，则取α=0.10或-。20甚至更高。 7.假设检验和区间估计有何联系：假设检验用于推断质的不同即判断两个或多个总体参数是否不等，而可信区间用于说明量的大小即推断总体参数的范围。两者有联系也有区别，假设检验与区间估计的联系在于可信区间也可以回答假设检验的问题，若算得的可信区间若包含了H0，则按α水准，不拒绝H0，若不包含H0，则按照α水准，拒绝H0，接受H1。也就是说在判断两个总体参数不等时，假设检验和可信区间时完全等价的。 1.方差分析的基本思想和应用条件是什么。方差分析的基本思想时根据试验设计的类型，将全部测量值总的离均差平方和及其自由度分解为两个或多个部分，除随机误差作用外，每个部分的编译可由某个因素的作用加以解释。通过比较不同变异来源的均方，借助F分布做出统计推断，从而推论各种研究因素对试验结果有无影响。应用条件：各样本是互相独立的随机样本，均服从正态分布；相互比较的各样本的具有方差齐性。

医学统计学案例分析

医学统计学案例分析评述医学期刊论著:《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010年1 月-－２0１2 年5 月口岸接受预防接种的出入境人员68７0 位，其基本资料如下:男36７8 人，女３０２１人；年龄在3－7９岁之间,平均年龄4５.６岁。经免疫前检查和询问，研究对象均无严重的疾病,且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处２010 年１月-２０11年4 月,2011 年5月-2012 年5月两个时间段6８７0位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查,未明确抽样的方法,是如何应用随机抽样的方法选择这６８7０位研究对象的? 【统计方法】（1）本论著未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐，选择χ2检验,否则应选

用秩和检验。一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。（2）文献尽管在“1．４统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确采用了那种统计方法，即是卡方检验还是秩和检验等。（3）在没有提及统计方法的前提下，全文也没有表示统计结果，即具体的计算值和相对应的P值，只有Ｐ<0.05，表述不完整。正确的统计分析方法、具体的统计量值和Ｐ值是最终准确推断结论的重要依据，三者缺一不可。所以,具体的P值和统计量应在论文表格或文字描述中说明。 (4）统计符号书写不规范: 检验水准表述有误，原文“检验水平取P=0.0５”,应改为“检验水准ɑ＝0.05”。【结果表达】（1）在“２.1 不同时间段接种人数比较”中： ①原文:研究将研究对象按照２０1０年１月－201１年4月，2011 年5月－2012 年 5 月分为两个时间段进行研究，第一个时间段接种人数为４60６人,第二时间段接种人数为22６4 人。第二时间段较第一时间段接种人数明显减少，且具有显著差异性(P＜0．05)。 ②错误:结果表述有误:“第二时间段较第一时间段接种人数明显减少，且具有显著差异性”。2个时间段研究对象数量不同,通过统计分析不能得出 “人数明显较少”的结论，应表述为：按ɑ=0.05水准,差别有统计学意