如何用数理统计方法去解决一个实际问题

如何用数理统计方法去解决一个实际问题

如何用数理统计方法去解决一个实际问题

用数理统计方法去解决一个实际问题时,一般有如下几个步骤:建立数学模型,收集整理数据,进行统计推断、预测和决策。

①模型的选择和建立。在数理统计学中,模型是指关于所研究总体的某种假定,一般是给总体分布规定一定的类型。建立模型要依据概率的知识、所研究问题的专业知识、以往的经验以及从总体中抽取的样本(数据)。

②数据的收集。有全面观测、抽样观测和安排特定的实验3种方式。全面观测又称普查,即对总体中每个个体都加以观测,测定所需要的指标。抽样观测又称抽查,是指从总体中抽取一部分,测定其有关的指标值。这方面的研究内容构成数理统计的一个分支学科。叫抽样调查。

③安排特定实验以收集数据,这些特定的实验要有代表性,并使所得数据便于进行分析。这里面所包含的数学问题,构成数理统计学的又一分支学科,即实验设计的内容。

④数据整理。目的是把包含在数据中的有用信息提取出来。一种形式是制定适当的图表,如散点图,以反映隐含在数据中的粗略的规律性或一般趋势。另一种形式是计算若干数字特征,以刻画样本某些方面的性质,如样本均值、样本方差等简单描述性统计量。

⑤统计推断。指根据总体模型以及由总体中抽出的样本,作出有关总体分布的某种论断。数据的收集和整理是进行统计推断的必要准备,统计推断是数理统计学的主要任务。

⑥统计预测。统计预测的对象,是随机变量在未来某个时刻所取的值,或设想在某种条件下对该变量进行观测时将取的值。⑦统计决策。依据所做的统计推断或预测,并考虑到行动的后果(以经济损失的形式表示)而制定的一种行动方案。目的是使损失尽可能小,或反过来说,使收益尽可能大。

《质量控制常用数理统计方法》

1 质量控制概述 1.1 质量控制分类 质量控制方法分为两大类,包括: 1.以数理统计方法为基础的质量控制方法。 2.建立在全面质量管理思想之上的组织性的质量管理方法两大类。 1.2 质量控制方法 1.统计质量控制方法:以1924年美国的休哈特提出的控制图为起点,经过了半个多世纪的发展,形成初级、中级和高级统计管理方法。 2.初级统计管理方法又称为系统管理方法,运用这此方法可以从经常变化的生产过程中,系统地收集要到与产品质量有关的各种上数据,并对数据进行整理、加工和分析,进而画出各种图表,计算某些数据指标,找出质量变化的规律,实现对质量的控制。“企业95%的质量管理问题可通过企业全体人员灵活应用这七种工具而得到解决”(石川馨)。初级统计方法包括以下七种工具: a)括统计分析表; b)数据分层法; c)排列图; d)因果图; e)相关图; f)直方图; h)控制图。 3.中、高级统计管理方法是有关专业人员用于复杂的工程分析和质量分析,如实验计划法、多变量解析法等。 2 质量管理常用七种工具 2.1 分层法 分层法是质量管理中常用的数理统计方法,它把收集到的原始质量数据按照一定的目的加以分类整理,再据此进行质量分析。分层的目的就是把性质相同的数据归纳在一起。分层法的关键是尽量使同一层内的数据波动小一些,各层间的数据波动大一些。常用分层标志有:操作者、设备、原材料、缺陷项目等。某钢厂的废品分层如表1所示。 表1 某轧钢厂废品分层表 废品项目 废品数量 甲车间乙车间丙车间合计 尺寸超差30 15 10 55 轧废10 28 10 48 耳子 5 10 25 40 压痕8 4 8 20 其他 3 1 2 6 小计56 58 55 169 2.2 调查表法 调查表是为了分层收集数据而设计的一类统计图表。调查表法就是利用这在统计图表进行数据收集、整理分析的一种方法。常用的调查表陷调查表、不良项止调查表、不良原因调查表、过程分布调查表等。 2.3 散布图 散布图又叫相关图,两个可能相关的变量数据用点画在坐档图上,通过观察分析来判断两个变量之间的相关关系,

医药数理统计习题和答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1(D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C)

医药应用数理统计第三章测试题(卷)(卷)

第三章测试卷一、单选题 1. (2分)设随机变量X的分布列如下表,则常数c = (). ? A. 0 ? B. 1 ? C. ? D. C 2. (2分) ? A. 0.9 ? B. 0.5 ? C. 0.75 ? D. 以上都不对 C 3. (2分)

? A. ? B. ? C. ? D. A 4. (2分) 设随机变量X的概率密度函数为f(x),分布函数为F(x),对于任意实数x,下列正确的是(). ? A. ? B. ? C. ? D. B 5. (2分) ? A. 0 ? B. 1 ? C.

? D. C 6. (2分) ? A. 0.625 ? B. 0.25 ? C. 0.5 ? D. 0.0625 D 7. (2分) ? A. ? B. ? C. ? D. C 8. (2分)

? A. 1 ? B. 2 ? C. 3 ? D. 4 B 9. (2分)某车床一天生产的零件中所含次品数ξ的概率分布如下表所示,则平均每天生产的次品数为()件. ? A. 0.3 ? B. 0.5 ? C. 0.2 ? D. 0.9 D 10. (2分) ? A. 0.5

? C. 1.5 ? D. 0 C 11. (2分) ? A. 9 ? B. 6 ? C. 30 ? D. 36 B 12. (2分) 设连续型随机变量的分布函数和密度函数分别为F(x)、f(x),则下列选项中正确的是(). ? A. ? B. ? C. ? D. A 13. (2分)

? B. 0.2 ? C. 0.7 ? D. 条件不足,无法计算B 14. (2分) ? A. 1 ? B. 2 ? C. 3 ? D. π/2 C 15. (2分) ? A. 1 ? B. 0 ? C.

数理统计课后答案.doc

数理统计 一、填空题 1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。不含任何未知参数 2、设母体 ),,(~2 N X 已知,则在求均值 的区间估计时,使用的随机变量为 n X 3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。 025.010 1 5u 4、假设检验的统计思想是 。 小概率事件在一次试验中不会发生 5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。 0H :05.0 p 6、某地区的年降雨量),(~2 N X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2 的矩估计值为 。 1430.8 7、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2 N 与 )1,2(N , 2 *2 2*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS ,已知)4(~),20(~22 2221 ,则__________, b a 。 用 )1(~)1(22 2 * n S n ,1,5 b a 8、假设随机变量)(~n t X ,则 2 1 X 服从分布 。)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2 X P ,则____ 。 用),1(~2 n F X 得),1(95.0n F

(完整word版)医药数理统计大纲_试题及答案(1)

模拟训练题及参考答案 模拟训练题: 一、选择题: 1.下列事件中属于随机事件范畴的是( ) A. {人的的寿命可达500岁} B. {物体会热胀冷缩} C. {从一批针剂中抽取一支检验} D. {X2+1=0 有实数解} 2.依次对三个人体检算一次试验,令A={第一人体检合格},B={第二人体检合格},C={第三人体检合格},则{只有一人体检合格}可以表示为( ) A. A+B+C B. ABC C. C B A D. C B A C B A C B A ++ 3.一批针剂共100支,其中有10支次品,则这批针剂的次品率是( ) A. 0.1 B. 0.01 C. 0.2 D. 0.4 4.所谓概率是指随机事件发生的( )大小的数值表示。 A. 频率 B. 可能性 C. 次数 D. 波动性 5.若X~N (μ,σ2),则EX 的值为( ) A. μ B. μ2 C. σ2 D. σ 6.若X~B (K ;n ,p ),则DX 的值为( ) A. np B. μ C. σ2 D. np(1-p) 7.求一组数据(5,-3,2,0,8,6)的总体均数μ的无偏估计( ) A.2.4 B.3.1 C.3 D.4 8.作参数的区间估计时,给定的α越大,置信度1-α越小,置信区间处于( )变化。 A 变窄 B.变宽 C.没有 D.不确定 9.对于一组服从正态分布的试验数据,描述试验数据波动程度的特征统计量是( ). A. 样本算术平均数 B.中位数 C. 样本标准差 D.样本频数 10.伯努利概率模型具有的两个特点:( ) A.每次试验的结果具有对立性;重复试验时,每次试验具有独立性

应用数理统计作业题及参考答案(第二章)(2)

第二章 参数估计(续) P68 2.13 设总体X 服从几何分布:{}()1 1k P X k p p -==-,12k = ,,,01p <<,证明 样本均值1 1 n i i X X n == ∑是()E X 的相合、无偏和有效估计量。 证明: 总体X 服从几何分布, ∴()1= E X p ,()2 1-= p D X p . 1 () ()1 11 11 11==????===??== ? ????? ∑ ∑ n n i i i i E X E X E X n E X n n n p p . ∴样本均值11n i i X X n == ∑ 是()E X 的无偏估计量。 2 () 2222 1 11 1111==--???? ===??= ? ?????∑ ∑n n i i i i p p D X D X D X n n n n p np . ()()()()11 11 ln ln 1ln 1ln 1-??=-=+--??;X f X p p p p X p . () 111ln 111111f X p X X p p p p p ?--= - =+?--;. () () 2 11 2 2 2 ln 11 1f X p X p p p ?-=- + ?-;. ()()()()21112 2 2 22ln 11 1111f X p X X I p E E E p p p p p ???? ?? ?--=-=--+=+???????--?????? ? ?? ? ; () ()() ()12 2 2 2 2 211 11 111111111??-= + -= + ?-=+? ?---?? p E X p p p p p p p p ()()() () 2 2 2 111 1 111-+= + = = ---p p p p p p p p p .

数理统计试题及答案

数理统计考试试卷 一、填空题(本题15分,每题3分) 1、总体得容量分别为10,15得两独立样本均值差________; 2、设为取自总体得一个样本,若已知,则=________; 3、设总体,若与均未知,为样本容量,总体均值得置信水平为得置信区间为,则得值为________; 4、设为取自总体得一个样本,对于给定得显著性水平,已知关于检验得拒绝域为2≤,则相应得 备择假设为________; 5、设总体,已知,在显著性水平0、05下,检验假设,,拒绝域就是________。 1、; 2、0、01; 3、; 4、; 5、。 二、选择题(本题15分,每题3分) 1、设就是取自总体得一个样本,就是未知参数,以下函数就是统计量得为( )。 (A) (B) (C) (D) 2、设为取自总体得样本,为样本均值,,则服从自由度为得分布得统计量为( )。 (A) (B) (C) (D) 3、设就是来自总体得样本,存在, , 则( )。 (A)就是得矩估计(B)就是得极大似然估计 (C)就是得无偏估计与相合估计(D)作为得估计其优良性与分布有关 4、设总体相互独立,样本容量分别为,样本方差分别为,在显著性水平下,检验得拒绝域为( )。 (A) (B) (C) (D) 5、设总体,已知,未知,就是来自总体得样本观察值,已知得置信水平为0、95得置信区间为(4、71,5、69),则取显著性水平时,检验假设得结果就是( )。 (A)不能确定(B)接受(C)拒绝(D)条件不足无法检验 1、B; 2、D; 3、C; 4、A; 5、B、 三、(本题14分) 设随机变量X得概率密度为:,其中未知 参数,就是来自得样本,求(1)得矩估计;(2)得极大似然估计。 解:(1) , 令,得为参数得矩估计量。 (2)似然函数为:, 而就是得单调减少函数,所以得极大似然估计量为。 四、(本题14分)设总体,且就是样本观察值,样本方差,

医药数理统计习题及答案汇编

学习好资料 第一套试卷及参考答案 一、选择题 ( 40 分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制 ( B ) A 条图B 百分 条图或圆图C 线图D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式E负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检 验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A. 个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6、男性吸烟率是女性的10 倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D )率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t 检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n i和住,在进行成组设计资料的t 检 验时,自由度是( D ) (A) n i+ n2 (B) n i+ n2 - C) n1+ n2 +1 D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小E垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料, 既作直线回归分析, 又作直线相关分析。 令对相关系数检验的t值为t r,对回归系数检验的t值为t b, 二者之间具有什么关系?( C) A t r >t b B t r

数理统计试题及答案

一、填空题(本题15分,每题3分) 1、总体得容量分别为10,15得两独立样本均值差________; 2、设为取自总体得一个样本,若已知,则=________; 3、设总体,若与均未知,为样本容量,总体均值得置信水平为得置信区间为,则得值为________; 4、设为取自总体得一个样本,对于给定得显著性水平,已知关于检验得拒绝域为2≤,则相应得备择假设为________; 5、设总体,已知,在显著性水平0、05下,检验假设,,拒绝域就是________。 1、; 2、0、01; 3、; 4、; 5、。 二、选择题(本题15分,每题3分) 1、设就是取自总体得一个样本,就是未知参数,以下函数就是统计量得为( )。 (A ) (B ) (C ) (D ) 2、设为取自总体得样本,为样本均值,,则服从自由度为得分布得统计量为( )。 (A ) (B ) (C ) (D ) 3、设就是来自总体得样本,存在, , 则( )。 (A )就是得矩估计 (B )就是得极大似然估计 (C )就是得无偏估计与相合估计 (D )作为得估计其优良性与分布有关 4、设总体相互独立,样本容量分别为,样本方差分别为,在显著性水平下,检验得拒绝域为( )。 (A ) (B ) (C ) (D ) 5、设总体,已知,未知,就是来自总体得样本观察值,已知得置信水平为0、95得置信区间为(4、71,5、69),则取显著性水平时,检验假设得结果就是( )。 (A )不能确定 (B )接受 (C )拒绝 (D )条件不足无法检验 1、B ; 2、D ; 3、C ; 4、A ; 5、B 、 三、(本题14分) 设随机变量X 得概率密度为:,其中未知 参数,就是来自得样本,求(1)得矩估计;(2)得极大似然估计。 解:(1) θθθ322)()(022 ===??∞+∞-x d x x d x f x X E , 令,得为参数得矩估计量。 (2)似然函数为:),,2,1(,022),(1212n i x x x x L i n i i n n n i i i Λ=<<==∏∏==θθθθ, , 而就是得单调减少函数,所以得极大似然估计量为。

医药数理统计第六章习题集(检验假设和t检验)

第四章抽样误差与假设检验 练习题 一、单项选择题 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~ 9.1×109/L,其含义是 A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95%

答案:E D C D E 二、计算与分析 1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案] 样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 101.4 X=, 1.5 S=,450 n=,0.07 X S=== 95%可信区间为 下限: /2.101.4 1.960.07101.26 X X u S α=-?= -(g/L) 上限: /2.101.4 1.960.07101.54 X X u S α +=+?=(g/L) 即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。 2.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题: ①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间; ③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案] ①均数的标准误可以用来衡量样本均数的抽样误差大小,即 30 S=mg/dl,100 n= 3.0 X S=== ②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 207.5 X=,30 S=,100 n=,3 X S=,则95%可信区间为 下限: /2.207.5 1.963201.62 X X u S α=-?= -(mg/dl)

医药应用数理统计第一章测试卷

第一章测试卷 一、单选题 1。 (2分)数值型数据的离散趋势测度中,受极端值影响最大的是() ? A. 标准差 ?B。方差 ?C。极差 ?D。样本标准误 A 2。 (2分)对于对称分布的数据,众数、中位数、平均数的大小关系是(). ?A。众数>中位数>平均数 ?B。众数=中位数=平均数 ? C. 众数<中位数<平均数 ? D. 中位数>众数>平均数 D 3. (2分)关于样本标准差,以下选项错误的是()。 ?A。反应样本观察值的离散程度,

?B。度量了数据偏离样本均值的大小 ? C. 反应了均值代表性的好坏 ?D。不会小于样本均值 D 4. (2分)可以计算平均数的数据类型是( ) ? A. 定类数据 ? B. 定序数据 ?C。数值型数据 ?D。所有数据 C 5. (2分) ?A。2。2, 3。7 ?B。2。75, 3。7 ?C。2。2, 2。96 ?D。 2.75, 2.96 A

6。 (2分)比较腰围和体重两组数据变异程度大小宜采用(). ?A。变异系数(CV) ? B. 方差(s2) ? C. 极差(R) ?D。方差(s) A 7。 (2分)各样本观察值均加同一个常数c后( ) ?A。样本均值不变,样本标准差改变 ?B。样本均值改变,样本标准差不变 ? C. 两者均不变 ?D。两者均改变 B 8. (2分)若样本观察值为2,1,3,0,5,则中位数是() ?A。 3 ?B。 2 ? C. 1

?D。 5 C 9。 (2分)数值型数据的集中趋势测度中,受极端值影响最大的是() ?A。平均值 ?B。中位数 ? C. 众数 ? D. 以上都不对 A

概率论与数理统计习题集及答案

《概率论与数理统计》作业集及答案 第1章 概率论的基本概念 §1 .1 随机试验及随机事件 1. (1) 一枚硬币连丢3次,观察正面H ﹑反面T 出现的情形. 样本空间是:S= ; (2) 一枚硬币连丢3次,观察出现正面的次数. 样本空间是:S= ; 2.(1) 丢一颗骰子. A :出现奇数点,则A= ;B :数点大于2,则B= . (2) 一枚硬币连丢2次, A :第一次出现正面,则A= ; B :两次出现同一面,则= ; C :至少有一次出现正面,则C= . §1 .2 随机事件的运算 1. 设A 、B 、C 为三事件,用A 、B 、C 的运算关系表示下列各事件: (1)A 、B 、C 都不发生表示为: .(2)A 与B 都发生,而C 不发生表示为: . (3)A 与B 都不发生,而C 发生表示为: .(4)A 、B 、C 中最多二个发生表示为: . (5)A 、B 、C 中至少二个发生表示为: .(6)A 、B 、C 中不多于一个发生表示为: . 2. 设}42:{},31:{},50:{≤<=≤<=≤≤=x B x x A x x S :则 (1)=?B A ,(2)=AB ,(3)=B A , (4)B A ?= ,(5)B A = 。 §1 .3 概率的定义和性质 1. 已知6.0)(,5.0)(,8.0)(===?B P A P B A P ,则 (1) =)(AB P , (2)()(B A P )= , (3))(B A P ?= . 2. 已知,3.0)(,7.0)(==AB P A P 则)(B A P = . §1 .4 古典概型 1. 某班有30个同学,其中8个女同学, 随机地选10个,求:(1)正好有2个女同学的概率, (2)最多有2个女同学的概率,(3) 至少有2个女同学的概率. 2. 将3个不同的球随机地投入到4个盒子中,求有三个盒子各一球的概率. §1 .5 条件概率与乘法公式 1.丢甲、乙两颗均匀的骰子,已知点数之和为7, 则其中一颗为1的概率是 。 2. 已知,2/1)|(,3/1)|(,4/1)(===B A P A B P A P 则=?)(B A P 。 §1 .6 全概率公式 1. 有10个签,其中2个“中”,第一人随机地抽一个签,不放回,第二人再随机地抽一个 签,说明两人抽“中‘的概率相同。 2. 第一盒中有4个红球6个白球,第二盒中有5个红球5个白球,随机地取一盒,从中 随机地取一个球,求取到红球的概率。

医药数理统计方法试题(二)

医药数理统计方法 第五章t检验 一、单项选择题 1. 两样本均数比较,检验结果05 P说明 .0 A. 两总体均数的差别较小 B. 两总体均数的差别较大 C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论 E. 可以确认两总体无差别 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 A. 两样本均数的差别具有实际意义 B. 两总体均数的差别具有实际意义 C. 两样本和两总体均数的差别都具有实际意义 D. 有理由认为两样本均数有差别 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P值越小说明 A. 两样本均数差别越大 B. 两总体均数差别越大 C. 越有理由认为两样本均数不同 D. 越有理由认为两总体均数不同 E. 越有理由认为两样本均数相同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 A. 减少Ⅰ类错误 B. 减少测量的系统误差 C. 减少测量的随机误差 D. 提高检验界值 E. 增加样本含量 5.两样本均数比较的t检验和u检验的主要差别是 A. t检验只能用于小样本资料 B. u检验要求方差已知或大样本资料 C. t检验要求数据方差相同 D. t检验的检验效能更高 E. u检验能用于两大样本均数比较 答案:D E D E B

二、计算与分析 1. 已知正常成年男子血红蛋白均值为140g/L ,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L ,标准差15g/L 。问该厂成年男子血红蛋白均值与一般成年男子是否不同? [参考答案] 因样本含量n >50(n =60),故采用样本均数与总体均数比较的u 检验。 (1)建立检验假设, 确定检验水平 00:μμ=H ,该厂成年男子血红蛋白均值与一般成年男子相同 11μμ≠:H ,该厂成年男子血红蛋白均值与一般成年男子不同 α=0.05 (2) 计算检验统计量 X X X u μ σ-= = =60 15125 140-=7.75 (3) 确定P 值,做出推断结论 7.75>1.96,故P <0.05,按α=0.05水准,拒绝0H ,接受1H ,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。 2. 某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。 表 成人耳垂血和手指血白细胞数(10g/L) 编号 耳垂血 手指血 1 9.7 6.7 2 6.2 5.4 3 7.0 5.7 4 5.3 5.0 5 8.1 7.5 6 9.9 8.3 7 4.7 4.6 8 5.8 4.2 9 7.8 7.5

数理统计课后答案

) 数理统计 一、填空题 1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。不含任何未知参数 2、设母体σσμ),,(~2 N X 已知,则在求均值μ的区间估计时,使用的随机变量为 n X σ μ - 3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。 025.010 1 5u ?± ; 4、假设检验的统计思想是 。 小概率事件在一次试验中不会发生 5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。 0H :05.0≤p 6、某地区的年降雨量),(~2 σμN X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2 σ的矩估计值为 。 ~ 7、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2 N 与 )1,2(N , 2 *2 2*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS +==χχ,已知)4(~),20(~22 2221χχχχ,则__________,==b a 。 用 )1(~)1(22 2 *--n S n χσ,1,5-==b a 8、假设随机变量)(~n t X ,则 21 X 服从分布 。)1,(n F

9、假设随机变量),10(~t X 已知05.0)(2 =≤λX P ,则____=λ 。 用),1(~2 n F X 得),1(95.0n F =λ 10、设子样1621,,,X X X 来自标准正态分布母体)1,0(N , X 为子样均值,而 01.0)(=>λX P , 则____=λ 01.04)1,0(~1z N n X =?λ 11、假设子样1621,,,X X X 来自正态母体),(2 σμN ,令∑∑==-=16 11 10 1 43i i i i X X Y ,则Y 的 分布 )170,10(2 σμN % 12、设子样1021,,,X X X 来自标准正态分布母体)1,0(N ,X 与2 S 分别是子样均值和子 样方差,令2*2 10S X Y =,若已知01.0)(=≥λY P ,则____=λ 。)9,1(01.0F =λ 13、如果,?1θ2?θ都是母体未知参数θ的估计量,称1?θ比2?θ有效,则满足 。 )?()?(2 1θθD D < 14、假设子样n X X X ,,,21 来自正态母体),(2σμN ,∑-=+-=1 1 2 12 )(?n i i i X X C σ 是2σ的一个无偏估计量,则_______=C 。 ) 1(21 -n 15、假设子样921,,,X X X 来自正态母体)81.0,(μN ,测得子样均值5=x ,则μ的置信度是95.0的置信区间为 。025.03 9 .05u ?± 16、假设子样10021,,,X X X 来自正态母体),(2 σμN ,μ与2 σ未知,测得子样均值 5=x ,子样方差12=s ,则μ的置信度是95.0的置信区间为 。 025.0025.0025.0)99(),99(10 1 5z t t ≈?± 17、假设子样n X X X ,,,21 来自正态母体),(2 σμN , μ与2σ未知,计算得

数理统计在实际问题中的应用方法

数理统计在实际问题中的 应用方法 Prepared on 22 November 2020

数理统计在实际问题中的应用方法 哈尔滨工业大学,材料科学与工程一班,哈尔滨 150001 摘要:数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛和深刻的应用,其研究的内容也随着科学技术和经济社会的不断发展而逐步扩大。随机现象无处不在,渗透于日常生活的各个方面和科学技术的各个领域。概率统计就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。学好概率尤其是能够将学习的概率统计应用于实践中将受益匪浅。 关键词:概率统计;实际问题;应用方法 数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策 和行动提供依据或建议。数理统计以概率论为基础,研究社会和自然界中大量随机现象数 量变化基本规律的一种方法。其主要内容有参数估计、假设检验、相关分析、试验设计、 非参数分析和过程统计等。数理统计学是统计学的数学基础,从数学的角度去研究统计 学,为各种应用统计学提供理论支持。它研究怎样有效地收集、整理和分析带有随机性的 数据,以对所考察的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议 的数学分支。 1 数理统计的发展 数理统计起源于人口统计、社会调查等各种描述性统计活动。公元前2250年,大禹治水,根据山川土质,人力和物力的多寡,分全国为九州;殷周时代 实行井田制,按人口分地,进行了土地与户口的统计;春秋时代常以兵车多寡 论诸侯实力,可见已进行了军事调查和比较;汉代全国户口与年龄的统计数字 有据可查;明初编制了黄册与鱼鳞册,黄册乃全国户口名册,鱼鳞册系全国土 地图籍,绘有地形,完全具有现代统计图表的性质。我国缺少系统研究,未形 成专门的着作。 在西方各国,统计工作开始于公元前3050年,埃及建造金字塔,为征收建筑费用,对全国人口进行普查和统计。到了亚里土多德时代,统计工作开始往 理性演变。这时,统计在卫生、保险、国内外贸易、军事和行政管理方面的应 用,都有详细的记载。统计一词,就是从意大利一词逐步演变而成。 2 数理分析用途 2-1提供表示事物特征的数据

数理统计作业答案

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21Λ为其样本,2≥n ,则下列说法中正确的是( D )。 (A ) ∑=-n i i X n 12 2 )(μσ是统计量 (B ) ∑=n i i X n 1 2 2 σ是统计量 (C ) ∑=--n i i X n 1 2 2 )(1 μσ是统计量 (D ) ∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,)9(~2 χY ,则 Y X 3服从( C )。 3、设两独立随机变量)1,0(~N X ,2 ~(16)Y χ 服从( C )。 4、设n X X ,,1Λ是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( A ). 5、设4321,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是( B ). (A )3/X σ; (B ) 4 1 4i i X =∑; (C )σ-1X ; (D ) 4 2 21 /i i X σ=∑ 6、设总体),(~2 σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( C ). 7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ???是来自总体的简单随机样本, 则下列随机变量不是统计量为( C ) ( A ) . 12X X + ( B ) {}max ,15i X i ≤≤ ( C ) 52X p + ( D ) ()2 51X X - 8、设1,,n X X ???为来自正态总体2 (,)N μσ的一个样本,μ,2σ未知。则2 σ的最大似然估计量为 ( B )。 (A )∑=-n i i X n 12)(1μ (B )()2 1 1∑=-n i i X X n (C )∑=--n i i X n 12 )(11μ(D )()∑=--n i i X X n 1211 9、设总体),(~2 σμN X ,1,,n X X ???为样本,S X , 服从 ( D )分布. 10、设1,,n X X ???为来自正态总体2 (,)N μσ的一个样本,μ,2σ未知。则2 σ的置信度为1α-的区 间估计的枢轴量为( C )。 (A) () 2 1 2 n i i X μσ =-∑ (B) () 2 1 2 n i i X μσ =-∑ (C) ()∑=-n i i X X 1 2 2 1 σ (D) () 2 1 2 0n i i X X σ=-∑ 11、在假设检验中,下列说法正确的是( A )。

数理统计课后题答案完整版

第一章3. 解:因为 i i x a y c -= 所以 i i x a cy =+ 1 1n i i x x n ==∑ ()1 111n i i n i i a cy n na cy n ===+??=+ ??? ∑∑ 1n i i c a y n a c y ==+=+∑ 所以 x a c y =+ 成立 因为 ()2 2 1 1n x i i s x x n ==-∑ () ( ) () 2 2 12 21 11n i i i n i i n i i a cy a c y n cy c y n c y y n ====+--=-=-∑∑∑ 又因为 ()2 2 1 1n y i i s y y n ==-∑ 所以 2 22 x y s c s = 成立 6. 解:变换 ()1027i i y x =- 1 1l i i i y m y n ==∑ ()1 3529312434101.5 =-?-?+?+=- 2710 y x = += () 2 21 1l y i i i s m y y n ==-∑ ()()()()2222 1235 1.539 1.5412 1.534 1.510440.25 ?= ?-++?-++?+++???= 22 1 4.4025100 x y s s = = 7解: *1 1l i i i x m x n ==∑ ()1 156101601416426172121682817681802100166= ?+?+?+?+?+?+?= ()2 2 *1 1l i i i s m x x n ==-∑ ()()()()()()()2222 222 110156166141601662616416628168166100 121721668176166218016633.44 = ?-+?-+?-+?-??? +?-+?-+?-? = 8解:将子样值重新排列(由小到大) -4,,,,,0,0,,,,,, ()()()()()17218120 3.2147.211.2 e n n e n M X X R X X M X X +?? ??? ??+ ??? ====-=--==== 9解:

常用数理统计方法的正确使用问答

常用数理统计方法的正确使用问答 作者:张利田,卜庆杰,杨桂华,刘秀兰 在科学研究中,经常会涉及到对随机变量大小、离散及分布特征描述以及对2个或多个随机变量之间关系比较的问题。而对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计。能否正确使用各种数理统计方法关系到能否得出客观和可信的结论。 1 统计软件的选择 在进行统计分析时,尽管作者可以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。因此,出于对工作效率以及对算法的可靠性、通用性和可比性的考虑,多数科技期刊都要求作者采用专门的数理统计软件进行统计分析。我们在处理稿件时经常发现的问题是,作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行统计分析。由于电子表格软件提供的统计分析功能十分有限,很难满足实际需要,除非比较简单的分析,我们不主张作者采用这样的软件。目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for Social Sciences)、SAS(Statistical Analysis System)、BMDP和STATISTICA等。其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。目前,国际学术界有一条不成文的约定:凡是用SPSS和SAS软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。由此可见,SPSS和SAS 软件已被各领域研究者普遍认可。我们建议《环境科学学报》的作者们在进行统计分析时尽量使用这2个专门的统计软件。目前,有关这2个软件的使用教程在书店中可很容易地买到。 2 均值的计算 在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。此时,多数作者会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的。在数理统计学中,作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等。何时用算术平均值?何时用几何平均值?以及何时用中位数?这不能由研究者根据主观意愿随意确定,而要根据随机变量的分布特征确定。反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其总体的数学期望就是其算术平均值。此时,可用样本的算术平均值描述随机变量的大小特征。如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则可用几何平均值描述该随机变量总体的大小。此时,就可以计算变量的几何平均值。如果随机变量既不服从正态分布也不服从对数正态分布,则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。退而求其次,此时可用中位数来描述变量的大小特征。

《医药数理统计方法》中药专业

7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95 (1)计算其样本均值、方差、标准差、标准误和变异系数。 (2)求出该组数据对应的标准化值; (3)计算其偏度。 解 75.6795.55.61.710 1 =+++=∑= i i x ,n =10 =+++=∑=222101295.55.61.7 i i x 462.35 样本均值 775.61075.6711===∑=n i i x n x 方差 )(111 2 22∑ =--=n i i x n x n S 371.0)775.61035.462(9 1 2=?-= 标准差2 S S ==371.0≈0.609 标准误193.040609.0===n S S x 变异系数CV =%100||?x S = %100775.6609.0?=8.99%; (2)对应的标准化值公式为 609 .0775 .6-=-=i i i x S x x u 对应的标准化值为 0.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355; (3)3 3 )2)(1()(S n n x x n S i k ---=∑=0.204 2.用事件A 、B 、C 表示下列各事件: (1)A 出现,但B 、C 不出现; (2)A 、B 出现,但C 不出现; (3)三个都出现; (4)三个中至少有一个出现; (5)三个中至少有两个出现; (6)三个都不出现; (7)只有一个出现; (8)不多于一个出现; (9)不多于两个出现。 解:(1)ABC (2)ABC (3)ABC (4)ABC BC A C B A C AB C B A C B A C B A ++++++ 或A +B +C 或C B A -Ω (5)ABC BC A C B A C AB +++ (6)ABC 或Ω-(A +B +C )或C B A ++ (7)ABC ABC ABC ++ (8)ABC ABC ABC ABC +++ (9)BC A C B A C AB C B A C B A C B A C B A ++++++ 或Ω-ABC 或ABC

相关文档
最新文档