贾俊平统计学第7版 第八章例题课后习题

第8章假设检验

例题

8.1

由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异?

★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。

上述问题的关键点是,20克的差异说明了什么?这个差异能不能用抽样的随机性来解释?为了回答这个问题,我们可以采取假设的方法。假设1989年和1990年新生儿的体重没有显著差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年新生儿的体重有了明显增加。在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。

例8.2

某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?

★解:这是一个单侧检验问题。显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。因此,如果样本均值超过1000小时,他会购进这批灯泡。问题在于样本均值为960小时他是否应当购进。因为即便总体均值为1000小时,由于抽样的随机性,样本均值略小于1000小时的情况也会经常出现。在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于什么水平时拒绝。于是检验的形式为:

H0:μ≥1000

H1:μ<1000

例8.3

某种大量生产的袋装食品按规定重量不得少于250克。今从一批该食品中随机抽取50袋,发现有6袋重量低于250克,若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂?

★解:显然,不符合标准的比例越小越好。在这个产品质量检验的问题中,我们比较关心次品率的上限,即不合标准的比例达到多少就要拒绝。由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格范围,但由F抽样的随机性,样本中不合标准的比例略大于5%的情况也会经常发生。如果采用右单侧检验,确定拒绝的上限临界点,那么检验的形式可以写为:

H0:μ≥1000

H1:μ≤1000

右单侧检验如图8- 6所示(a=0. 05).也可以把右单侧检验称为上限检验。

例8.4

某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0. 076mm,样本标准差为0.025mm,问新机床加工零件的椭圆度总体均值与以前有无显著差别?

★解:在这个例题中,我们所关心的是新机床加工零件的椭圆度总体均值与老机床加工零件的椭圆度均值0. 081mm是否有所不同,于是可以假设

H0:μ=0.081mm 没有显著差别

H0:μ≠0.081mm有显著差别

这是一个双侧检验问题,所以只要μ>μ0或μ<μ0二者之间有一个成立,就可以拒绝原假设。由题意可知,μ0=0.081mm,s=0.025mm,x̅=0.076mm。因为n>30,故选用z统计量。

z=0

s/√n =

0.025/√200

=−2.83

通常把α称为显著性水平。显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这既是前面假设检验中犯弃真错误的概率,它是人们根据检验的要求确定的。通常取α=0.05或α=0.01,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。此时不妨取α=0.05,查表可以得到临界值:

zα/2=±1.96

Z的下标α/2表示双侧检验。

因为因为|z|>|zα/2|,根据决策准则,拒绝H0可以认为新老机床加工零件椭圆度的均值有显著差别。

例8.5

★解:根据前面的分析,采用左单侧检验。

在该例中已知μ0=1000,x̅=9600,σ=200,n=100,,并假定显著性水平α= 0.05由图8- 5可知拒绝域在左侧,所以临界值为负,即zα=−1.645,z的下标a表示单侧检验。

进行检验的过程为:

H0:μ≥1000

H1:μ≤1000

z=x̅−μ

σ/√n

=

960−1000

200/√100

=−2

由于|z|>|Zα|,即z的值位于拒绝域,所以拒绝H0,即这批灯泡的使用寿命低于1 000小时,批发商不应购买。

如果使用P值检验,按照前述方法,找到NORMSDIST.在z值框内录人样本统计量z 的绝对值2,与之相对的承数值为0.97725,由于这是单侧检验,故P值为:

P=1-0.977 250=0.022 75

在单侧检验中,用P值直接与a比较,由于P(O. 022 75)

但如果在此例的假设检验中,取显著性水平a=0.02, 则有P>a,这时就不能拒绝

这进一步说明,检验的结论是建立在概率的基础上的。不能拒绝H并不一定保证H为真,只是在规定的显著性水平上不能拒绝原假设。上面的例子说明能在0.95的置信水平上拒绝原假设,却不能在0.98的置信水平上拒绝原假设。

例8.6

其电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。某厂宣称它采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取20件作为样本,测得平均使用寿命为1245小时。能否说该厂的元件质量显著高于规定标准?

★解:首先需要规定检验的方向。在本例中某厂称其产品质量大大超过规定标准1200小时,要检验这个宣称是否可信,因而是单侧检验。从逻辑上看,如果样本均值低于1 200 小时,则元件厂的宣称会被拒绝,即使略高于1 200小时,也会被拒绝。只有当样本均值大大超过1 200小时,以至于用抽样的随机性也难以解释时,才能认为该厂产品质量确实超过规定标准。所以用右单侧检验更为适宜。

由题意可知,μ0=1200,x̅=1245,σ=150,n=20,并规定α=0.05,虽然n<30,但由于σ已知,可以使用z统计量。进行检验的过程为:

H0:μ≥1200

H1:μ≤1200

z=x̅−μ

σ/√n

=

1245−1200

150/√20

=1.34

因为这是右单侧检验,由图8-6可知拒绝域在右侧,查表得到临界值zα=1.645。

由于Z=1.34在非拒绝域,所以不能拒绝H0,即还不能说该厂产品质量显著高于规定标准。若用P值检验,方法与前面相同,在Z值框内输入1.34,得到函数值为0.9099,由于是单侧检验,故P值为:

P=1−0.9099=0.0901

由于P>α,故不能拒绝H0,新产品与老产品质量未表现出显著差别。

某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂作为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。

★解:如果机器性能良好,生产出的肥皂厚度将在5cm上下波动,过薄或过厚都不符合产品质量标准,所以,根据题意这是双侧检验问题。

由于总体σ未知,且样本量n较小,所以应采用t统计量。

已知条件为:μ0=5,x̅=5.3,s=0.3,n=10,α=0.05。

H0:μ=5

H1:μ≠5

t=0

s/√n =

0.3/√10

=3.16

当σ=0.05,自由度n-1=9时,查表得tα/2(9)=2.2622。因为t>tα/2,样本统计量落入拒绝域,故拒绝H0,接受H1,说明该机器的性能不好。

8.8

一项统计结果声称,某市老年人口(年龄在65岁以上)所占的比例为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比例为14. 7%的看法(a=0. 05)?

★解:

H0:π=14.7%

H0:π≠14.7%

ρ=57

400

=0.1425=14.25%

z=

ρ−π

√π0(1−π0)

n

0.1425−0.147

√0.147×(1−0.147)

400

=−0.254

这是一个双侧检验,当α=0.05时,有

zα/2=±1.96

由于|z|<|zα/2|,不能拒绝H0,可以认为调查结果支持了该市老年人口所占比例为14. 7%的看法。

思考与联系

思考题

8.1假设检验和参数估计有什么相同点和不同点?

答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

8.2什么是假设检验中的显著性水平?统计显著是什么意思?

答:显著性水平是一一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。统计显著等价拒绝HO,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。

8.3什么是假设检验中的两类错误?

答:假设检验的结果可能是错误的,所犯的错误有两种类型,-.类错误是原假设HO为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误。

8.4两类错误之间存在什么样的数量关系?

答:在假设检验中,a与β是此消彼长的关系。如果减小a错误,就会增大犯β错误的机会,若减小β错误,也会增大犯a错误的机会。

8.5解释假设检验中的P值

答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。(它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。)

8.6显著性水平与P值有何区别

答:显著性水平是原假设为真时,拒绝原假设的概率,是一个概率值,被称为抽样分布的拒绝域,大小由研究者事先确定,一般为0.05。而P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性水平

8.7假设检验依据的基本原理是什么?

假设检验的理论依据是概率论中的小概率原理,该原理认为小概率事件在一次观察中是不可能出现的。换言之,如果在一次调查(即观察)中发现了小概率事件,

就应当作出这样的判断:这种事件本身就不是一个小概率事件,而是一个大概率事件。

8.8在单侧检验中原假设和备择假设的方向应该如何确定?

解:假设问题有两种情况,一种是所考察的数值越大越好(左单侧

检验或下限检验),临界值和拒绝域均在左侧;另-种是数值越小越

好(右单侧检验或上限检验),临界值和拒绝域均在右侧。

练习题

8.1 已知某炼铁厂的铁水含碳量服从正态分布N(4.55, 0.1082), 现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,能否认为现在生产的铁水平均含碳量为4.55 (a=0. 05)?

8.2 有一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。

8.3 某地区小麦的一般生产水平为亩产250千克,其标准差为30千克。现用一种化肥进行试验,从25个地块抽样,平均产量为270千克。这种化肥是否使小麦明显增产(a=0.05)?

8.4糖厂用自动打包机打包,每包的标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:

99.3 98. 7 100.5 101.2 98.3 99.7 99.5 102.1 100. 5

已知每包的重量服从正态分布,试检验该日打包机工作是否正常(a=0. 05)。

8.5某种大量生产的袋装食品按规定不得少于250克。今从一批该食品中任意拍取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能

否出厂(a=0. 05)?

8.6 某厂家在广告中声称,该厂生产的汽车轮胎在正常条件下行驶距离超过目前的平均水平25 000公里。对一个由15个轮胎组成的随机样本做了试验,得到样本均值和标准差分别为27 000公里和5000公里。假定轮胎寿命服从正态分布,问该厂家的广告所声称的内容是否真实(a=0. 05)?

8.7某种电子元件的寿命工服从正态分布。现测得16只无件的寿命(单位:小时)如下:

159 280 101 212 224 379 179 264

222 362 168 250 149 260 485 170

是否有理由认为元件的平均寿命显著地大于255小时(a=0.05)?

8.8随机抽取9个单位,测得结果分别为:

85 59 66 81 35 57 55 63 66

以a=0.05的显著性水平对下述假设进行检验:H0:σ2≤100,H1:σ2>100。

8.9 A,B两厂生产同样的材料。已知其抗压强度服从正态分布,且σA2=632,σB2=572。从A厂生产的材料中随机抽取81个样品,测得x A̅̅̅=1070kg/cm2;从B厂生产的材料中随

̅̅̅=1070kg/cm2。根据以上调查结果,能否认为A,B两厂生产机抽取64个样品,测得x B

的材料的平均抗压强度相同(α=0.05)?

8.10装配个部件可以采用不同的方法,所关心的问题是哪一个方法的效率更高劳动效率可以用平均装配时同来反映,现从不同的装配方法中各抽取12件产品,记承子自的装配时间(单位:分钟)如下:

甲方法:31 34 29 32 35 38 34 30 29 32 31 26

乙方法:26 24 28 29 30 29 32 26 31 29 32 28

两总体为正态总体,且方差相同,间这两种方法的装配时间有无显著差别(o=0.05)?

8.11 调查了339名50岁以上的人,在205 名吸烟者中有43个患慢性气管炎,在134名不吸烟着中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管类”这种观点(a=0. 05)?

8.12为了控制贷款规模,某商业银行有个内部要求,平均每项贷款的效额不能超过60万元。险着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样的项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得5=68.1万元,s=45。在a=0.01的显著性水平下采用P值进行检验。

8.13有一种理论认为服用河司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本1),另一组人员在相同的时间服用安慰剂(样本2)。持续3年之后进行检测,祥本1中有104人患心脏病,样本2中有189人惠心脏病。以a=0.05的显薯性水平检验服用阿司匹林是否可以降低心脏病发生率。

8.14某工厂制造螺栓,规定课栓口径为7.0cn.方差为0.03cm。今从一批螺栓中拍取80个测量其口径,得平均值为6.97cm.方差为0.037 5cm,假定螺检口径服从正态分布,问这批螺栓是否达到规定的要求(a=0. 05)?

8.15 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一所学校中随机挡取25名男生和16名女生,对他们进行相同题目的测试。测试结果表明,男生的平均成绩为82分,方差为58分,女生的平均成绩为78分,方差为49分。假设显著性水平a=0.02, 从上述数据中能得到什么结论?

贾俊平统计学第7版第八章例题课后习题

第8章假设检验 例题 由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显着差异 ★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。 上述问题的关键点是,20克的差异说明了什么这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。假设1989年和1990年新生儿的体重没有显着差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。如果成立,说明这两年新生儿的体重没有显着差异;如果不成立,说明1990年新生儿的体重有了明显增加。在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。 例 某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡 ★解:这是一个单侧检验问题。显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。因此,如果样本均值超过1000小时,他会购进这批灯泡。问题在于样本均值为960小时他是否应当购进。因为即便总体均值为1000小时,由于抽样的随机性,样本均值略小于1000小时的情况也会经常出现。在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于什么水平时拒绝。于是检验的形式为:

《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版

《统计学》(贾俊平第 七版)课后题及答案-统计学课后答案第七版 -CAL-FENGHAI.-(YICAI)-Company One1

第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型不同类型的数据各有什么特点 4. 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。 5.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。 6.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 7.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 8.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料使用二手资料需要注意些什么 2. 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。 3.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,

贾俊平统计学第7版_第八章例题课后习题

第8章假设检验 例题 8.1 由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异? ★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。 上述问题的关键点是,20克的差异说明了什么?这个差异能不能用抽样的随机性来解释?为了回答这个问题,我们可以采取假设的方法。假设1989年和1990年新生儿的体重没有显著差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年新生儿的体重有了明显增加。在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。 例8.2 某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡? ★解:这是一个单侧检验问题。显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。因此,如果样本均值超过1000小时,他会购进这批灯泡。问题在于样本均值为960小时他是否应当购进。因为即便总体均值为1000小时,由于抽样的随机性,样本均值略小于1000小时的情况也会经常出现。在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于什么水平时拒绝。于是检验的形式为:

《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版

第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。 4.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。 5.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。 2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本

2023统计学第七版贾俊平课后习题答案

2023统计学第七版贾俊平课后习题答案 第一章 1.1 习题答案 1.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市,而纽约市占比是 5%,所以答案应为 $60 \\times 0.05 = 3$ 2.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市并且是女性,而纽约市总体中女性的占比是 53%,所以答案应为 $60 \\times 0.05 \\times 0.53 = 1.59$ 1.2 习题答案 1.答案:根据题意,我们需要求得这家电视公司进入市场的概率。已知电视公司市场占有率为 10%,而市场占有率的补集为失败率,所以电视公司进入市场的概率为1−0.10=0.90 2.答案:根据题意,我们需要求得这两家公司都进入市场的概率。已知电视公司进入市场的概率为 0.90,而两

家公司都进入市场的概率为两者概率相乘,所以两家公司都进入市场的概率为 $0.90 \\times 0.90 = 0.81$ 第二章 2.1 习题答案 1.答案:根据题意,我们需要求得两次抛掷硬币都为正面向上的概率。已知硬币正面朝上的概率为 0.5,而两次抛掷硬币都为正面向上的概率为两者概率相乘,所以两次抛掷硬币都为正面向上的概率为 $0.5 \\times 0.5 = 0.25$ 2.答案:根据题意,我们需要求得至少一次抛掷硬币为正面向上的概率。已知硬币正面朝上的概率为 0.5,而至少一次抛掷硬币为正面向上的概率为 1 减去两次都为背面向上的概率,所以至少一次抛掷硬币为正面向上的概率为 $1 - (0.5 \\times 0.5) = 0.75$ 2.2 习题答案 1.答案:根据题意,我们需要求得至少一辆汽车需要检测两次才能检查到故障的概率。已知单次检测不到故障的概率为 0.1,而至少一辆汽车需要检测两次才能检查到故障的概率为 1 减去两次都未检测到故障的概率,所以至

贾俊平统计学思考题答案

贾俊平统计学思考题答案(总9页) --本页仅作为文档封面,使用时请直接删除即可-- --内页可以根据需求调整合适字体及大小--

第一章: 1、什么是统计学 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差 别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差) 7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。

贾俊平统计学第七版课后思考题

贾俊平统计学第七版课后思考题 第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。 4.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。 5.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或

多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。 2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本 低。而且对于抽样中的统计学专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。 3.调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集 数据的方法? 试验式和观察式。 4.自填式、面访式、电话式调查各有什么利弊? 自填式优点:调查组织者管理容易;成本低,可进行大规模调查;减少被调查者回答敏感问题的压力。缺点:返回率低;调查内容有限;调查周期长;在数据搜集过程中遇见问题不能及时调整。 面访式优点:回答率高;数据质量高;在调查过程中遇见问题可以及时调整。缺点:成本比较高;搜集数据的方式对调查过程的质量

统计学贾俊平课后习题答案

附录:教材各章习题答案 第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工 家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。 1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4) 统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 服务质量等级评价的频数分布 (3)条形图(略) (4)帕累托图(略)。 2.2(1)频数分布表如下 ( 2.3频数分布表如下 某百货公司日商品销售额分组表

直方图(略)。 箱线图(略)。 2.5(1)排序略。 (2)频数分布表如下 (3)直方图(略)。 (4)茎叶图如下 2.6

(2)直方图(略)。 (3)食品重量的分布基本上是对称的。 2.7 (2)直方图(略)。 2.8(1)属于数值型数据。 (2)分组结果如下 (3)直方图(略)。 2.9(1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.10(1)茎叶图如下

(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。 (2)5.5=L Q ;12=U Q 。 (3)2.4=s 。 (4)左偏分布。 3.2 (1) 19 0=M ; 23 =e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =274.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企 业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标 准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数 0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。

统计学贾俊平课后习题答案

第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”; (2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者 的月平均花费;(4)统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 (4)帕累托图(略)。 2.2(1)频数分布表如下

2.3 2.5(1)排序略。 (2)频数分布表如下

2.6 (2)直方图(略)。 (3)食品重量的分布基本上是对称的。 2.7 2.8(1)属于数值型数据。

2.9 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 (2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分 布比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。 (2)5.5=L Q ;12=U Q 。

(3)2.4=s 。 (4)左偏分布。 3.2 (1)190=M ;23=e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =27 4.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产 量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相 同,因为均值和标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本 越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生 体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。 3.9 通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中 该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测 试的标准化值高于B 项测试,所以A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。 3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。

贾俊平《统计学》第7版复习笔记和课后习题答案+习题及详解

目录 第1 章导论 (5) 1.1 复习笔记 (5) 1.2 课后习题详解 (6) 1.3 典型习题详解 (9) 第2 章数据的搜集 (15) 2.1 复习笔记 (15) 2.2 课后习题详解 (21) 2.3 典型习题详解 (22) 第3 章数据的图表展示 (31) 3.1 复习笔记 (31) 3.2 课后习题详解 (36) 3.3 典型习题详解 (45) 第4 章数据的概括性度量 (58) 4.1 复习笔记 (58) 4.2 课后习题详解 (64) 4.3 典型习题详解 (71) 第5 章概率与概率分布 (87) 5.1 复习笔记 (87) 5.2 课后习题详解 (92) 5.3 典型习题详解 (94) 第6 章统计量及其抽样分布 (106) 6.1 复习笔记 (106) 6.2 课后习题详解 (109) 6.3 典型习题详解 (110) 第7 章参数估计 (118) 7.1 复习笔记 (118) 7.2 课后习题详解 (123) 7.3 典型习题详解 (135) 第8 章假设检验 (149) 8.1 复习笔记 (149) 8.2 课后习题详解 (153) 8.3 典型习题详解 (161) 第9 章分类数据分析 (174) 9.1 复习笔记 (174) 9.2 课后习题详解 (176) 9.3 典型习题详解 (183) 第10 章方差分析 (191) 10.1 复习笔记 (191) 10.2 课后习题详解 (198) 10.3 典型习题详解 (206) 第11 章一元线性回归 (217) 11.1 复习笔记 (217) 11.2 课后习题详解 (226) 11.3 典型习题详解 (235) 第12 章多元线性回归 (250) 12.1 复习笔记 (250) 12.2 课后习题详解 (254) 12.3 典型习题详解 (262)

相关主题
相关文档
最新文档