840-统计学

统计学基础（科学学位）考试大纲（840）

《统计学基础》（科学学位）考试大纲（840）

本考试大纲由数学科学与计算技术学院学院教授委员会于2013年7月7日通过。

本考试大纲由数学院学院教授委员会于2013年7月7日通过。

I.考试性质

统计学基础考试是为统计学招收学术型硕士研究生而设置的具有选拔性质的入学考试科目，其目的是科学、公平、有效地测试学生掌握大学本科阶段概率论与数理统计的基本知识、基本理论，以及用统计思想分析和解决问题的能力，评价的标准是高等学校（理学或经济学）统计本科毕业生能达到的及格或及格以上水平，以保证被录取者具有坚实的统计学基础理论知识和较好的分析实际统计问题的能力，有利于招生学校在专业上录取。

II.考试目标

统计学基础考试的目标在于考查考生对统计学基础的基本概念、基本理论和方法的掌握以及分析和求解概率论与统计的能力。考生应能：1．正确理解概率论中的基本概念和基本理论。

2．掌握求解概率论中的实际问题的方法。

3．掌握统计中的基本原理和方法及计算公式，并能正确地解释计算结果。

4．正确应用统计的基本理论知识分析和解决实际问题。

Ⅲ.考试形式和试卷结构

答卷方式：闭卷，笔试；

答题时间：180分钟；

试卷分数：满分为150分；

试卷结构及考查比例：试卷主要分两部分，概率论基础（占90分），统计学（占60分），其中统计学分A和B两类，数理统计和统计学，考试选做其中一类。

IV. 考试内容

第一部分概率论基础

.随机事件及其概率

随机事件的概念，事件间的关系及运算。概率的定义及性质，古典概型，几何概型。条件概率，乘法公式，全概率公式，贝叶斯公式。事件的相互独立性，独立重复试验。

.随机变量及其分布

随机变量及其分布的概念，离散型随机变量及其分布律的定义和性质，连续型随机变量及其概率密度的定义和性质，分布函数的定义和性质，

常用的随机变量的分布及其在工程与管理中的应用，随机变量的函数及其分布律。

.多维随机变量及其分布

二维随机变量，边缘分布，条件分布，相互独立的随机变量，两个随机变量函数的分布。

.随机变量的数字特征

随机变量的期望与方差的定义和性质，随机变量及其函数的期望与方差的计算，几种常用分布的期望与方差。

.大数定理和中心极限定理

依概率收敛，以概率1收敛，依分布收敛，伯努利大数定律，利莫弗-拉普拉斯中心极限定理，辛钦大数定律，独立同分布的中心极限定理及其应用

第二部分统计学（考生选A类和B类中的一类）

A 类数理统计

1 样本及抽样分布

总体与样本，样本的数字特征，常用统计量及其分布.

2 参数估计

参数点估计的求法，点估计的评价标准。最小方差无偏估计，贝叶斯估计，区间估计

3.假设检验

假设检验的基本概念，两类错误，显著性水平的选择，原假设与备择假设的选择，双侧检验与单侧检验，假设检验的一般步骤。正态总体均值和方差的假设检验；分布拟合检验

4. 方差分析与回归分析

单因素方差分析方法，了解双因素方差分析方法。简单线性回归模型，回归系数，相关系数，回归效果显著性检验，回归系数的置信区间与假设检验，应用拟合模型进行估计和预测。

B类统计学

1统计数据的描述

1）用分布特征来概括地描述数据分布的特征和规律。

）集中趋势的测度：众数、中位数和分位数、均值、调和平均数、几何平均数。

）离散程度的测度：异众比率、四分位差、方差和标准差、极差、平均差和离散系数。

2. 时间数列分析

1）时间数列的定义和数据的表现形式，时期序列，时点序列观察值。）时间数列的水平分析：发展水平与平均发展水平，相对数和绝对数；增长量与平均增长量。

）时间数列的速度分析：定基与环比发展速度，定基与环比增长速度；平均发展速度与平均增长速度；年度化增长率。

）长期趋势分析，四种基本因素是最重要的基本概念。长期趋势、季节变动、循环波动和不规则波动。时间数列的乘法模型。

3. 指数

1）指数的性质：相对性、综合性和平均性。

）指数的分类：数量指数和质量指数、个体指数和综合指数、简单指数和加权指数、时间性指数（定基和环比）和区域性指数。

）加权指数，注意确定权数的方法。拉氏指数和帕氏指数，学习这两种指数可以加深对质量指数和数量指数的理解。加权平均指数的两种形式，基期总量加权和报告期总量加权。

）利用指数体系进行分析，分析现象发展变化的绝对数量及各因素的影响数额。分析变量影响指数和结构影响指数对总体平均数变动的影响。

生物统计学考试复习题库

生物统计学各章题目一填空 1．变量按其性质可以分为（连续）变量和（非连续）变量。 2．样本统计数是总体（参数）的估计值。 3．生物统计学是研究生命过程中以样本来推断（总体）的一门学科。 4．生物统计学的基本内容包括（试验设计）和（统计分析）两大部分。 5．生物统计学的发展过程经历了（古典记录统计学）、（近代描述统计学）和（现代推断统计学）3个阶段。 6．生物学研究中，一般将样本容量（n ≥30）称为大样本。 7．试验误差可以分为（随机误差）和（系统误差）两类。判断 1．对于有限总体不必用统计推断方法。（×） 2．资料的精确性高，其准确性也一定高。（×） 3．在试验设计中，随机误差只能减小，而不能完全消除。（∨） 4．统计学上的试验误差，通常指随机误差。（∨）二填空 1．资料按生物的性状特征可分为（数量性状资料）变量和（质量性状资料）变量。 2. 直方图适合于表示（连续变量）资料的次数分布。 3．变量的分布具有两个明显基本特征，即（集中性）和（离散性）。 4．反映变量集中性的特征数是（平均数），反映变量离散性的特征数是（变异数）。 5．样本标准差的计算公式s=（）。判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。（×） 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。（×） 3. 离均差平方和为最小。（∨） 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。（∨） 5. 变异系数是样本变量的绝对变异量。（×）单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ，其标准差（ D ）。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度，应采用的指标是（ C ）。 A. 标准差 B.方差 C.变异系数 D.平均数三填空 1．如果事件A 和事件B 为独立事件，则事件A 与事件B 同时发生的概率P （AB ）= P （A ）?P （B ）。 2．二项分布的形状是由（ n ）和（ p ）两个参数决定的。 3．正态分布曲线上，（ μ ）确定曲线在x 轴上的中心位置，（ σ ）确定曲线的展开程度。 4．样本平均数的标准误 =（）。 5．t 分布曲线与正态分布曲线相比，顶部偏（低），尾部偏（高）。 n /σx σ

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期生物统计学试题（A ）试题使用对象： 2011 级专业(本科) 命题人：考试用时 120 分钟答题方式采用：闭卷说明：1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题，在此卷上答题作废. 一：判断题；（每小题1分，共10分） 1、正确无效假设的错误为统计假设测验的第一类错误。（） 2、标准差为5，B 群体的标准差为12，B 群体的变异一定大于A 群体。（） 3、一差异”是指仅允许处理不同，其它非处理因素都应保持不变。（） 4、30位学生中有男生16位、女生14位，可推断该班男女生比例符合1∶1 （已知84.321,05.0=χ）。（） 5、固定模型中所得的结论仅在于推断关于特定的处理，而随机模型中试验结论则将用于推断处理的总体。（） 6、率百分数资料进行方差分析前，应该对资料数据作反正弦转换。（） 7、比较前，应该先作F 测验。（） 8、验中，测验统计假设H 00:μμ≥ ，对H A :μμ<0 时，显著水平为5%，则测验的αu 值为1.96（） 9、行回归系数假设测验后，若接受H o :β=0，则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y （厘米），果穗长的平均数和标准差为s y ±1030±=（厘米），可认为该玉米的株高性状比果穗性状变异大。（）二：选择题；（每小题2分，共10分） 1分别从总体方差为4和12的总体中抽取容量为4的样本，样本平均数分别为3和2，在95%置信度下总体平均数差数的置信区间为（）。 A 、[-9.32，11.32] B 、[-4.16，6.16]

生物统计学重要知识点

生物统计学重要知识点（说明：下列知识点为考试内容，没涉及的不需要复习。注意加粗的部分为重中之重，一定要弄懂。大家要进行有条理性的复习，望大家考出好成绩！）第一章概论（容易出填空题和名词解释） 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差（随机误差和系统误差）与错误以及产生的原因 5、会区分准确度和精确度第二章试验资料的整理与特征数的计算（容易出填空和名词解释） 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图，会计算全距、组数、组距、组限和组中值 3、会求平均数（算数、加权和几何）、中位数、众数，算术平均数的重要特性 4、会求极差、方差、标准差和变异系数，理解标准差的性质第三章概率与概率分布（选择、填空和计算） 1、理解事件、频率及概率，事件的相互关系，加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征，会计算概率值 4、理解分位数的概念，弄清什么时候用单尾，什么时候用双尾 5、样本平均数差数的分布第四章统计推断（计算） 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误，会根据小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验（例4.5）成组数据平均数比较的t检验（例4.6和4.7） 4、一个样本频率的假设检验（例4.11），知道连续性矫正 5、参数的区间估计（置信区间）和点估计

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班摘要：本文首先将介绍2χ分布，t 分布，F 分布和正态分布的定义及基本性质，然后用理论说明2χ分布，t 分布，F 分布与正态分布的关系，并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现，它是由正态分布派生出来的，主要用于列联表检验。定义：若随机变量12n ,,X X …X 相互独立，且都来自正态总体01N （，），则称统计量2222 12n =+X X χ++…X 为服从自由度为n 的2χ分布，记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ，2χ分布的密度函数图形是一个只取非负值的偏态分布，如下图.

卡方分布具有如下基本性质：性质1：22(()),(())2E n n D n n χχ==；性质2：若221122(),()X n X n χχ==，12,X X 相互独立，则21212~()X X n n χ++；性质3：2 n χ→∞→时，（ n ）正态分布；性质4：设)(~2 2n αχχ，对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布，是由英国统计学家戈赛特在1908年“student”的笔名首次发表的，这个分布在数理统计中也占有重要的位置. 定义：设2 ~0~X N χ（，1），Y （n ），,X Y 相互独立，，则称统计量 T = 服从自由度为n 的t 分布，记为~()T t n . t 分布的密度函数为

地统计分析

实验五加利佛尼亚州的大气臭氧浓度的地统计分析（综合实验）实验目的：通过对数据的具体分析，掌握ArcGIS下地统计分析模块的功能，了解完整的地统计分析过程，并能使用其解决科研问题中的实际问题。实验内容：美国环保局负责对加利佛尼亚州的大气臭氧浓度进行监测。利用地统计分析模块提供的许多工具，通过检测所有采样点之间的关系，对生成一个关于臭氧浓度值、预测标差（不确定性）的连续表面，从而使对其他点的浓度值进行最佳预测成为可能。 1、数据检查 2、模型拟合 3、模型精度比较 4、臭氧浓度制图实验数据：数据集描述 Ca_outline 加州轮廓图 Ca_ozone_pts 臭氧采样点数据（单位：ppm） Ca_cities 加州主要城市位置图实验步骤：一、数据加载 1、生成子集将特定位置上的预测值同这些区域内的实测值相对比，是评价一个输出表面质量的最严格的方法。其方法是将原始数据集划分成两个部分：一个部分用于建立模型，也就是用来生成输出表面；另外一个部分用于测试，即验证输出表面。（1）在Geostatistical Analyst 工具栏中单击Create Subsets命令；（2）Input Layer：选择要划分子集的图层；（3）拖动滑块到合适位置，来选择训练和测试数据的相对百分比；（4）单击完成，训练和测试数据集会在Personal Geodatabase中。 2、应用子数据集进行验证（1）validation：input 选择测试数据集（2）attribute：选择与生成表面时相同的属性（3）打开验证图层二、数据检查你可以用三种方式对数据进行检验：（1）检测数据分布

生物统计学期末考试题

生物统计学期末考试题一名词解释(每题2分,共10分) 1．生物统计学期末考试题 2．样本：从总体中抽出的若干个体所构成的集合称为样本 3．方差：用样本容量n来除离均差平方和,得到的平方和,称为方差 4．标准差：方差的平方根就是标准差 5．标准误：即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6．变异系数：将样本标准差除以样本平均数,得出的百分比就是变异系数 7．抽样：通常按相等的时间间隔对信号抽取样值的过程。 8．总体参数：所谓总体参数是指总体中对某变量的概括性描述。 9．样本统计量：样本统计量的概念很宽泛（譬如样本均值、样本中位数、样本方差等等）,到现在为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间的关系已经被证明了。 10．正态分布：若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名高斯分布 11．假设测验：又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。 12．方差分析：又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13．小概率原理：一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15．决定系数：决定系数定义为相关系数r的平方 16．随机误差：在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17．系统误差：它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号（正值或负值）保持不变；或者在条件变化时,按一定规律变化的误差二. 判断题（每题2分,共10分） 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体（） 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生（） 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验（） 6.系统误差是不可避免的,并且可以用来计算试验精度。（） 7.精确度就是指观察值与真值之间的差异。（） 8. 实验设计的三个基本原则是重复、随机、局部控制。（） 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。（） 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。（）三. 简答题（每题5分共20分） 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末考试试题A

漳州师范学院生物系_____________专业_____级本科_______班《生物统计学》课程期末考试卷（A）（2011—2012学年度第一学期）学号___________姓名________考试时间：2011-12-29 一、名词解释（6×2） 1统计数： 2小概率原理： 3无偏估计： 4准确性： 5纳伪错误： 6方差：二、判断题：请在下列正确的题目后面打“√”，错误的打“×”。（12×1） 1 t分布曲线的平均数与中位数相等（√） 2众数是总体中出现最多个体的次数。（×） 3 正态分布曲线形状与样本容量n无关（√） 4 假设检验显著水平越高，检验效果越好（×） 5 样本频率假设检验如果需要连续性矫正时，矫正系数＝0. 5（×） 6 样本标准差是总体标准差的无偏估计（×） 7计算相关系数的两个变量都是随机变量（√） 8 试验因素的任一水平就是一个处理（×） 9 在同一显著水平下，双尾检验的临界正态离差大于单位检验（√） 10 LSD检验方法实质上就是t检验（×） 11对多个样本平均数仍可采用t测验进行两两独立比较。（×）

12假设测验结果或犯α错误或犯β错误。（ × ）三、选择题（18×2） 1、某学生某门课成绩为75分，则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中，若b ＜0，则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0＜r ＜1 D. -1＜r ＜0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方法抽取本国人口的1%计算平均年龄，则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中，如果一个变数10的离均差是2，那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时，()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验，抽样1000粒，得发芽种子870粒，若规定发芽率达90%为合格，测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本，平均完成工作需时13分钟。已知总体标准差为3分钟。若想对完成工作所需时间总体构造一个90%置信区间，则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题

统计选择题 1，由于（1，研究对象本身的性质）造成我们所遇到的各种统计数据的不齐性。 2，研究某一品种小麦株高，因为该品种小麦是个极大的群体，其数量甚至于是个天文数字，该体属于（4，无限总体） 3，从总体中（2，随机抽出）一部分个体称为样本。 4，用随机抽样方法从总体中获得一个样本的过程称为（3，抽样） 5，身高，体重，年龄这一类数据属于（3，连续型数据；1，度量数据） 6，每10个中男性人数，每亩麦田中杂草株数，喷洒农药后每100只害虫中死虫数等，这一类数据属于（1，离散型数据；2，计数数据） 7，把频数按其组值的顺序排列起来，称为（3，频数分布） 8，以组值作为一个边，相应的频数为另一个边，做成的连续矩形图称为（2，直方图）9，绘制（4，多边形图）的方法是在坐标平面内点上各点（中值，频数），以线段连接各点，最高和最低非零频数点与相邻零频数点相连。 10，累积频数图是根据（3，累积频数表）直接绘出的。 11，样本数据总和除以样本含量，称为（算数平均数 12，已知样本平方和为360，样本含量为10，以下4种结果中（2，6.0）是正确的标准差。 13，概率的古典定义是（2，基本事件数与事件总数之比） 14，下面第（2，概率是事物所固有的特性） 15，对于事件A和B，P（A∪B）等于（2，P（AB）） 16，对于事件A和事件B，P（A|B）等于（P（AB）/P（B）） 17，对于任意事件A和B，P（AB）等于（P（B）P（B|A）） 18，下述（3随机试验中所输入的变量）项称为随机变量 19，关于连续型随机变量，有以下4种提法，其中（1，可取某一区间内的任何数值）20，总体平均数可以用以下4种符号中的一种表示，它是（2，μ） 21，样本标准差可以用以下4种符号中的一种表示，它是（1，s） 22，在养鱼场中，A鱼塘的面积占10%，A鱼塘中鱼的发病率为1%，问从养鱼场中任意捕捞一条鱼，它既是A鱼塘，又是生病的鱼的概率是（4,0.003） 23，以下4点是描述连续型随机变量特征的，其中（2，f（x）=lim △x→0P（x

三大抽样分布

三大抽样分布众所周知，在概率论中有二项分布、正态分布、泊松分布着三大分布，而统计学中也有三大抽样分布，分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期，对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程，而t分布的发现来源于Gosset小样本理论的创立过程，F分布则是来源于Fisher创立方差分析理论的过程。三大抽样分布的研究意义 c．R．Rao曾经说过“在终极的分析中，一切知识都是历史，在抽象的意义下，一切科学都是数学，在理性的基础上，所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位，由此可见，研究三大抽样分布对于科学研究有着重要意义。在实际工作中，统计工作者对于三大抽样分布的研究必不可少，通过研究三大抽样分布的产生、发展和完善，能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布，对于三大分布理论的研究，能够在充分吸收前人研究成果的基础上不断进行理论创新，从而推动科学技术的进步。纵观所有的科技进步，无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布，对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初，在统计学的发展过程中，每一次新的分析统计数据概率模型的发现，统计学理论都会发生一次重大飞跃。为此，要想研究三大抽样分布，就应该对其发展过程进行研究。统计量是样本的函数，是随机变量，有其概率分布，统计量的分布称为抽样分布。 X2分布 x2的早期发展由于受到中心极限定理和正态误差理论的影响，正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中，正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展，一些学者开始对正态性提出了质疑，随后，在多位科学家的试验验证下，正态分布与实际数据拟合不好的情况日渐凸显出来，科学家纷纷开始研究比正态分布范围更广的分布类型，波那个人产生了偏态分布，其中，x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel，他在研究气体分子运动的过程中引入了X2分布。1891年，X2分布首次被作为统计量的分布导出。Pizzetti在求线性模型最小二乘估计残差平方和的分布时，通过富氏分析法得出了X2的分布。随着时代的发展，正态分布理论的局限更加明显，更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人，成为了一代统计学巨人。按照他的观点，统计学应该把在模型基础上对观测数据进行有效预测作为基本任务，所以他开创了一族曲线对观测数据进行拟合，使得分布拟台数据的应用范围进一步扩大。 X2模型

2019统计学考研院校排名及全国排名前10所院校深度解读

2019统计学考研院校排名及全国排名前10所院校深度解读1.2019统计学考研院校排名第一档：天津财经大学、西南财经大学第二档：上海财经大学、厦门大学、中国人民大学、中南财经政法大学、浙江工商大学、暨南大学、西安交通大学、辽宁大学、中央财经大学第三档：湖南大学、安徽财经大学、江西财经大学、北京大学、山西财经大学、东北财经大学、西安财经学院、南京财经大学、河北经贸大学、天津大学、兰州商学院、云南财经大学、首都经济贸易大学、福建农林大学、重庆工商大学、山东经济学院第四档：西北工业大学、江苏大学、河北大学、西北师范大学、贵州财经学院、长沙理工大学、广东商学院、石河子大学、杭州电子科技大学、新疆财经学院、内蒙古财经学院、长春税务学院、河南财经学院、福州大学、山东财政学院、中南大学、深圳大学。统计学国家级重点学科单位统计学一级国家重点学科：天津财经大学、西南财经大学统计学二级国家重点学科：清华大学、吉林大学、华侨大学、国防大学、军事经济学院统计学院校报考指南历年统计学院校排名具体名次有所不同，但总体排名前列的院校名录变化不大，广大考生可以综合参考院校实力以及统计学发展情况判断其专业实力选择报考，如西南财经大学统计学院的前身统计系，是1952年和1953年两次全国院系调整成立四川财经学院时首批组建的五个系之一，也是全国财经院校中最早招收统计学专业本科生的院系之一。中国人民大学统计学科始建于1950年，两年后成立统计学系，是新中国经济学科中最早设立的统计学系，2003年7月，成立中国人民大学统计学院。考生可以通过院校网站及新闻报道了解更多统计学专业发展情况。2.统计学全国排名靠前院校深度解读（1）中国人民大学

生物统计学考试试卷及答案

考试轮次：2017－2018学年第一学期期末考试试卷编号考试课程：[120770] 生物统计与实验设计命题负责人曾汉元适用对象：生物与食品工程学院生物科学专业2015级审查人签字考核方式：上机考试试卷类型：A卷时量:150分钟总分：100分注意：答案中要求保留必要的计算和推理过程，全部答案保存为一个Word文档，文件名为学号最后两位数+姓名。考试结束后不要关机。提交答卷后，请到主机看一下是否提交成功。第1题12分，第3题5分，第10题13分，其余的题各10分。 1、下表为某大学96位男生的体重测定结果（单位：kg），请根据资料分别计算以下指标：（1）算术平均数；（2）几何平均数；(3)中位数；（4）众数；（5）极差；（6）方差；（7）标准差；（8）变异系数；（9）标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N（97，3 2），求：（1）株高在94cm以上的概率？（2）株高在90~99cm之间的概率？（3）株高在多少cm之间的中间概率占全体的99%？ 3．已知某批30个小麦样品的平均蛋白质含量为14.5%，σ=2.50%，试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合，F2代的芒性状表型有钩芒、长芒和短芒三种，观察计得其株数依次分别为348、11 5、157，试检验其比率是否符合9：3：4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者，现将血红蛋白含量（g/L）变化的数据列在下面，假定资料满足各种假设测验所要求的前提条件，问：治疗前后之间的差别有无显著性意义？患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学期末复习题库及答案

第一章填空 1．变量按其性质可以分为（连续）变量和（非连续）变量。 2．样本统计数是总体（参数）的估计值。 3．生物统计学是研究生命过程中以样本来推断（总体）的一门学科。 4．生物统计学的基本内容包括（试验设计）和（统计分析）两大部分。 5．生物统计学的发展过程经历了（古典记录统计学）、（近代描述统计学）和（现代推断统计学）3个阶段。 6．生物学研究中，一般将样本容量（n ≥30）称为大样本。 7．试验误差可以分为（随机误差）和（系统误差）两类。判断 1．对于有限总体不必用统计推断方法。（×） 2．资料的精确性高，其准确性也一定高。（×） 3．在试验设计中，随机误差只能减小，而不能完全消除。（∨） 4．统计学上的试验误差，通常指随机误差。（∨）第二章填空 1．资料按生物的性状特征可分为（数量性状资料）变量和（质量性状资料）变量。 2. 直方图适合于表示（连续变量）资料的次数分布。 3．变量的分布具有两个明显基本特征，即（集中性）和（离散性）。 4．反映变量集中性的特征数是（平均数），反映变量离散性的特征数是（变异数）。 5．样本标准差的计算公式s=（）。判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。（×） 2. 条形图和多边形图均适合于表示计数资料的次数分布。（×） 3. 离均差平方和为最小。（∨） 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。（∨） 5. 变异系数是样本变量的绝对变异量。（×）单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ，其标准差（ D ）。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度，应采用的指标是（ C ）。 A. 标准差 B.方差 C.变异系数 D.平均数第三章 12 2--∑∑n n x x )(

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班摘要：本文首先将介绍 2分布，t 分布，F 分布和正态分布的定义及基本性质，然后用理论说明2分布，t 分布，F 分布与正态分布的关系，并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2（n ）分布是一种连续型随机变量的概率分布。这个分布是由别奈梅（Benayme ）赫尔默特（Helmert ）、皮尔逊分别于1858年、1876年、1900年所发现，它是由正态分布派生出来的，主要用于列联表检验。定义：若随机变量X 1,X 2,…X n 相互独立，且都来自正态总体 N （0,，）,则称统计量 2 =x ； X ；…+X ；为服从自由度为n 的2分布，记为 2 2 ~ （n ）. 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数（X ） e t t x 1dt,x 0， 2 分布的密度函数图形是一个只取非负值的偏态分布，如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立，则X! X2~ 2g n2); 性质3: n 时，2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件： P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位数的值已经编制成表供查分布，是由英国统计学家戈赛特在1908年“student的'笔名布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立，，则称统计量T —X VY/ n 分布，记为T~t( n). 为性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

《生物统计学-2019》复习题

《生物统计学》复习题 1．变量之间的相关关系主要有两大类：（因果关系），（平行关系） 2．在统计学中，常见平均数主要有（算术平均数）、（几何平均数） 3．样本标准差的计算公式（ 1 ) (2 --= ∑n X X S ） 4．小概率事件原理是指（某事件发生的概率很小，人为的认为不会发生） 5．在分析变量之间的关系时，一个变量X 确定，Y 是随着X 变化而变化，两变量呈因果关系，则X 称为（自变量），Y 称为（因变量） ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是： A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中，如果一个变数10的离均差是2，那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于，数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时，如果t = t 0、01 ，此差异是： A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中，是以为前提。 A 、肯定假设 B 、备择假设 C 、无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本，其样本标准差是0.96，该组数据的标本标准误（差）是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中，计算的统计量与事件发生的概率之间存在的关系是。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中，已知总自由度是15，组间自由度是3，组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据，并呈线性回归关系，它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

统计学分析报告

. . . 统计学调查报告（08级）上海商学院学生消费状况调查报告（奉浦校区）徐伟杰，景宝龙，苏淳，张玮，贾金诚小组成员指导教师姓名崔峰物流管理系系名称论文提交日期2010.12.23

目录一，调查目的： (3) 二，调查对象： (3) 三，调查项目： (3) 四，调查时间和时限 (3) 五，调查的组织工作 (4) 六，调查结果： (4) 七，调查问卷 (4) 上海市大学生消费状况调查问卷 (4) 八，调查分析： (6) （一）基本信息 (6) （二）消费结构状况分析： (7) （三）具体消费情况： (8) 九，预测分析 (14) 十，调查分析 (16) 十一，附录：调查统计汇总表 (17)

一，调查目的：随着社会的发展，大学生的消费方式及消费状况引起了社会各界的极大关注，社会消费观念的转变和周围环境影响他们的消费观念和行为。大学生有着较为前卫的消费观念，消费来源主要有家庭父母供给，构成了一个比较特殊的消费群体，随着大学生数量的不断攀升，他们的消费行为在一定程度上形象着整个社会的消费观念和消费行为。而上海有拥有30所本科院校，大学生的数量比较庞大，并且有着更加前卫的消费观念。就此我们针对上海商学院学生的消费情况展开调查，了解我校学生的消费特征，进而探求更为科学的消费方式和行为，提高大学生的消费效益。二，调查对象：统计调查对象：上海上海商学院奉浦校区在读学生统计调查单位：每一位在上海商学院奉浦校区就读的学生统计填报单位：物流管理082班景宝龙、徐伟杰三，调查项目：统计标志：户籍所在地、就读年级、家庭月收入、个人月生活费、生活费来源、各方面的消费金额分配、是否满意目前的消费金额、期望月消费金额、消费计划、期望消费项目、超前消费的情况四，调查时间和时限调查时间：2010年10月调查时限：两个月五，调查分工：问卷设计：徐伟杰问卷校验：苏淳，张玮，景宝龙问卷调查：景宝龙，张玮，苏淳，徐伟杰，贾金诚

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷一单项选择（每题3分，共21分） 1.设总体服从),(2 σμN ，其中μ未知，当检验0H :220σσ=,A H :220σσ≠时，应选择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2．设123,,X X X 是总体2 ( , )N μσ的样本，μ已知，2 σ未知，则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ，X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4．假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布，则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5．在假设检验中，显著性水平α的意义是_______。 A. 原假设0H 成立，经检验不能拒绝的概率 B. 原假设0H 不成立，经检验不能拒绝的概率 C. 原假设0H 成立，经检验被拒绝的概率 D. 原假设0H 不成立，经检验被拒绝的概率 6．单侧检验比双侧检验的效率高的原因是________。 A ．单侧检验只检验一侧 B ．单侧检验利用了另一侧是不可能的这一已知条件 C ．单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7．比较身高和体重两组数据变异程度的大小应采用_____。 A ．样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班摘要：本文首先将介绍2χ分布，t 分布，F 分布和正态分布的定义及基本性质，然后用理论说明2χ分布，t 分布，F 分布与正态分布的关系，并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现，它是由正态分布派生出来的，主要用于列联表检验。定义：若随机变量12n ,,X X …X 相互独立，且都来自正态总体01N （，），则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布，记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ，2χ分布的密度函数图形是一个只取非负值的偏态分布，如下图.

卡方分布具有如下基本性质：性质1：22(()),(())2E n n D n n χχ==；性质2：若221122(),()X n X n χχ==，12,X X 相互独立，则21212~()X X n n χ++；性质3：2 n χ→∞→时，（ n ）正态分布；性质4：设)(~2 2n α χχ，对给定的实数),10(<<αα称满足条件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布，是由英国统计学家戈赛特在1908年“student ”的笔名首次发表的，这个分布在数理统计中也占有重要的位置. 定义：设2 ~0~X N χ（，1），Y （n ），,X Y 相互独立，，则称统计量/T Y n = 服从自由度为n 的t 分布，记为~()T t n .

生物统计学期末复习资料(推荐文档)

第一章概论 1.1什么事生物统计学？生物统计学的主要内容和作用是什么？答：生物统计学（biostatistics）是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料，是研究生命过程中以样本来推断总体的一门学科。生物统计学主要包括实验设计和统计分析两答部分的内容。其基本作用表现在以下四个方面：a.提供整理和描述数据资料的科学方法；确定某些性状和特性的数量特征；b.判断实验结果的可靠性；c.提供由样本推断总体的方法；d.提供实验设计的一些重要原则。 1.2解释以下概念：总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、实验误差。答：总体(populatian)是具有相同性质的个体所组成的集合，是研究对象的全体。个体(individual)是组成总体的基本单元。样本(sample)是从总体中抽出的若干个个体所构成的集合。样本容量(sample size)是指样本个体的数目。变量（variable）是相同性质的事物间表现差异性的某种特征。参数(parameter)是描述总体特征的数量。统计数(statistic是由样本计算所得的数值，)是描述样本特征的数量。效应（effection）试验因素相对独立的作用称为该因素的主效应，简称效应。互作（interaction）是指两个或两个以上处理因素间的相互作用产生的效应。实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异，可以分为随机误差和系统误差。 1.3随机误差和系统误差有何区别? 答：随机误差(random)也称抽样误差或偶然误差，他是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异，是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差，但不能完全消除随机误差。系统误差（systematic）也称为片面误差，是由于实验处理以外的其他条件明显不一致所差生的倾向性的或定向性的偏差。系统误差主要有一些相对固定的因素引起，在某种程度上是可控制的,只要试验工作做得精细，在试验过程中是可以避免的。 1.4准确性与精确性有何区别？答：准确性（accuracy）也称为准确度，指在调查或实验中某一实验指标或性状的观测值与其真值接近的程度。精确性（precision）也称精确度，指调查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。准确性是说明测定值堆真值符合程度的大小，用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度，用样本间的各个变量间变异程度的大小来衡量。第二章试验资料整理与特征数的计算 2.3平均数与标准差在统计分析中有什么作用？它们各有哪些特性？答：平均数(mean)的用处：①平均数指出了一组数据资料内变量的中心位置，标志着资料所

2021中南大学心理学考研真题经验参考书

大家好，我现在是中南大学的一名心理学研究生了，自己有一些复习的经验，虽不敢说很优秀的经验，但自己感觉还是很有用的，所以和学弟学妹们分享一下。我是和大多数人一样，是从大三下学期开始决定考研的。到底是工作还是深造？为什么要考研？自己是不是要考研？我相信大家一开始和我一样，都是很迷茫的。但是当你下定决心之后，我想说的是，既然你选择了这条路，便只顾风雨兼程。初试前很重要的是院校的选择和注意要报考院校的招生信息。我一直就比较注意中南大学的心理学，所以就很关注中南大学心里学信息。如果你想报考中南大学的心理学，就要考三门科目，分别是101政治、201英语一和312心理学专业基础综合，这三门都是统考。心理学有七本官方的教材： 1）普心：彭聃龄《普通心理学》 2）统计：张厚粲《现代心理与教育统计学》 3）实验：郭秀艳《实验心理学》 4）测量：戴海琦《心理与教育测量》 5）发展：林崇德《发展心理学》 6）教心：刘儒德《教育心理学》 7）社会：侯玉波《社会心理学》下面给大家分享一下我的专业课学习经验。我一直秉承的理念是，是文科就好好的背，是理科就好好的刷题，所以在我买到了官方的指定教材后就开始看，像一只无头苍蝇一样乱飞。后来经过学长学姐的经验后，才制定了学习的计划。学习的计划非常重要，在复习之初，一个好的学习计划可以帮助你快速地进入学习状态。后来我也渐渐地通过计划进入了紧张的复习时光，当然计划并不是一成不变的，它是根据你自己的复习状况而变的。比如你规定过一本书要5天，而这本书很晦涩难懂，你就可以把5天改为一周等等。 6月和7月，首先粗略的过了一遍书籍，知道书中讲的是什么内容，大概也就是3天到5天过完一本书，第一次看书只求脑海里有个印象，知道每个子标题主要是讲的什么内容，一个月甚至不到一个月就能完成这一轮复习。这时候看完了脑海里什么都没有是很正常的。因为我们就只求脑海里留个印象：原来这就是心理学呀，这样就可以了。自己总不能无时无刻都处在运转状态，所以在前期一