统计学练习题参考答案(湘潭大学出版社)

统计学练习题参考答案(湘潭大学出版社)
统计学练习题参考答案(湘潭大学出版社)

第一章

(四)综合题

⑴总体:证券从业者;样本:随机抽取的1000名证券从业者

⑵月收入是数值型变量

⑶消费支付方式是标志

⑷统计量

第二章

(一)填空题

1 调查数据实验数据

2 一次性全面

3 随机

4 询问调查法观察法实验法

5 抽样误差非抽样误差

6 一览表

7 普查抽样调查统计报表重点调查

8 精确度及时性有效性

(二)单选题

(三)多选题

(四)判断题

第三章

(一)填空题

⑴统计分组,统计汇总,分布数列(频数分布)

⑵各组数据呈现均匀分布或对称分布

⑶统计表和统计图

⑷各组变量值和频数

⑸数字资料

(四)多选题

(五)计算题

1. ⑴顺序数据

(4)基本上呈对称分布。评价等级为“一般”的最多,评价为“较好”和“较差”的较少,评价为“好”和“差”的更少。

比较:与直方图比较起来更直观,但是茎叶图保留了每一个原始数据

折线图(略)

3.⑴排序略

⑵频率分布表如下

直方图(略)

4.(略)

第四章

(一)填空题

⑴集中趋势 离散程度 偏斜和峰度 ⑵1080 1050

⑶离差之和 离差平方和 ⑷加权算术平均均值 ⑸速度和比率 ⑹右偏 左偏 ⑺方差 离散程度 ⑻平均数 标准差

⑼对称性 偏斜度 尖峰和平峰

(三)单选题

(五)计算题 1.

①(1)x =274.1(万元);Me =272.5 ;q L =260.25;q U =291.25。

(2)17.21=s (万元)。

2.①5.64=x ; m o 为65; m e =65

②m e ≈x ≈m o接近对称分布,日产零部件集中于60-70个

3. 该公司产量计划完成百分比=97%;该公司实际的优质品率=%8.96

4.甲企业平均成本=19.41(元),乙企业平均成本=18.29(元); 原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

5.(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%;

(4)95%。

6.(1) 离散系数,因为它消除了不同组数据水平高地的影响。

(2)成年组身高的离散系数:024.01.1722

.4==

s v ; 幼儿组身高的离散系数:032

.03.713.2==s v ;

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度

相对较大。

第五章

(一)填空题 1.时间 统计指标

2.绝对数 相对数 平均数;相对数时间序列 平均数时间序列 绝对数时间序列

3.逐期 累计 逐期增长量之和等于相应时期的累计增长量

4.各期发展水平 序时平均数

5.增长1%绝对值

6.最末水平 最初水平 中间各期发展水平

7.长期趋势 不规则变动

8.奇数项 偶数项 奇数项

9.400%

10.同期平均法 趋势剔除移动平均法

(二)判断题

(三)单选题

(四)多项选择题

(五)计算题

1.(1)525人;(2)1767(万元);(3)3.366(万元/人);(4)10.097(万元/人)

(5)824.6万元,52万元

(6)106.96% 6.96%

=2003)

3.y? =232.146+6.785t(t

1

?y=232.146+6.785t10=232.146+6.7857*10≈300(万吨)

2012

4.115.16%

5.略

第六章

(二)填空题

1.综合指数;

2.基期;

3.个体指数加权算术平均指数加权调和平均指数;

4.平均指标数值可变构成指数组平均数指数结构影响指数

5.对等关系乘积代数和;

6.加权算术平均指数

(五)计算题

1.

(1)Lq=1.07667 ,Lp=1.61000;

(2)Pq=1.07971; Pp=1.61455

(3)略

2.

(1) 111.52%,12500元; (2)62.05%,-74000元 (3)179.72%,86500元 3.

(1)%27.93125550

117100 , %83.921018009450010111011==∑∑='==∑∑=p q p

q P z q z q P q q 。

(2)略。

4.

(1)拉氏加权产量指数=100.45% (2)帕氏单位成本总指数111.03%

5. ⑴43.2亿元;

⑵106.67%,24亿元; ⑶19.2亿元

⑷2.432.190.24 , %112%105%67.106=+=?。

6. 95.78%,-40万元

7.

(1)1.207369=1.051414*1.148329 968元=240元+ 728元 (2)1.13227=0.986015*1.148329

0.315018元/公斤=-0.03331元/公斤+0.348325元/公斤

第七章

(一)填空题

1.样本统计量;

2.大数定律 中心极限定理;

3.样本均值;

4.随机抽样 最大的抽样效果;

5. 1

(二)判断题

(五)计算题 1. 0)9585()},1

601660(1636,

78{~=≤≤--x P N x

2. %575.3%)95%90(},)

1(,{~=≤≤-p P n

N p πππ

第八章

(一)填空题

1.点估计 区间估计;

2.无偏;

3.样本统计量 允许误差

4.样本统计量 总体参数

5.1000 40 ;

6.少;

7. 4.742~5.258

(五)计算题

1.(1)14.2=x σ;(2)E =4.2;(3)(115.8,124.2)。

2.(500±8.113) (500±8.113)×3000

3. (1)(2000±2.352) (2)p=80%,(80%±8%)

4. 11 (不重复抽样)

5. 265(不重复抽样)

6. (1)(51.37%,76.63%);(2)175。

第九章

(一)填空题

1.备择假设 原假设;

2.双侧检验 左侧检验 右侧检验;

3.弃真错误;

4.检验统计量 显著性水平;

5.总体方差已知 正态 t ;

6.假设检验

(四) 多选题 1.AD 2.AB

(五)计算题

1.mm H 55:0=μ ;mm H 55:1≠μ

51.54=x 72.1/-=-=

n

x Z o

σμ

不拒绝原假设。

2.g H 800:0=μ ;g H 800:1≠μ

33.116

/60800820/=-=

-=

n

s x t o μ

不拒绝原假设。

3. 小时8.5:0=μH ;小时8.5:1 μH

5.4/=-=

n

s x t o μ

拒绝原假设。

4. %40:%;40:10 ππH H =

P=

%38200

76

= 58.0)

1(-=--=n

o o o

p Z πππ

不拒绝原假设。

5. %20:%;20:10 ππH H ≤

23.0)1(=--=

n

p p o p t π

不拒绝原假设。 6.(略)

第十章

1.正相关 负相关;2. 相关图 相关系数;3. -1~+1; 4. +1 -1; 5. 线性相关 非线性相关 6. t ; 7. 回归平方和与总离差平方和;8.对因变量进行估计与预测; 9. 区间估计; 10.可决系数(判定系数) 估计标准误差

(二)判断题

(五)计算题

1.

(1)r=0.985

(2) x y

0955.091.17?+-= (3)回归系数表示教育经费每增加1万元,在校学生平均增加0.0955万元。 2.(1)r=0.85

(2) x y 12.374.89?-+= 斜率即回归系数表示商品价格每增加1元,需求量将减少3.12吨。

(3)(吨)06

.4?=y s 3.(1)r=0.99;

(2)x y

074.0273.7?+-=,回归系数销售额每增加1万元,利润额增加0.074万元; (3)销售额为1200万元时利润额的估计值:(万元)76.811200074.0273.7?=?+-=y

4.

(1) r=0.83 ,高度显著正相关;

(2)x y 55.140.29?+=,回归系数表示广告费用每增加1万元,超市销售额增加1.55万元;

(3)0:;0:1110≠=ββH H ; 34.346

.055

.1??

1==

=

ββs t 根据α=0.05, n=7,查得:57.2)27(025.0=-t

57.2)27(025.0=-t t ,∴拒绝原假设。

(4)若广告费x=15万元,则销售额(万元)65.521555.140.29?=?+=y

5.

(1)数据散点图如下:

(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。

(3)设投诉率为y ,航班正点率为x

建立回归方程 x y

07.00178.6?-= 回归系数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。

(4)拒绝投诉率与航班正点率不存在显著线性相关的假设。

(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为:

4187.08007.00178.6?=?-=i Y (次/10万)

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

统计学经典习题集参考答案

1.要了解某班50名学生的性别构成情况,则总体是()。 A.每一个学生 B.每一个学生的性别 C.全体学生 D.全体学生的性别 2.要了解全国的人口情况,总体单位是()。 A.每一个人 B.每一户 C.每个省的人口 D.全国总人口 3.某班四名学生金融考试成绩分别为70分、80分、86分和90分,这四个数字是()。 A.变量值 B.标志 C.指标值 D.指标 4.工业企业的职工人数、职工工资是()。 A.离散变量 B.前者是离散变量,后者是连续变量 C.连续变量 D.前者是连续变量,后者是离散变量 5.统计学与统计工作的关系是()。 A.理论与应用的关系 B.工作与结果的关系 C.理论与实践的关系 D.工作与经验的关系 6.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的90%的五个大型水泥厂的生产情况进行调查,这种调查方式是()。 A.典型调查 B.重点调查 C.抽样调查 D.普查 7.某地进行国有商业企业经营情况调查,则调查对象是()。 A.该地所有商业企业 B.该地所有国有商业企业 C.该地每一家商业企业 D.该地每一家国有商业企业 8.对企业先按经济类型分组,再按企业规模分组,属于()。 A.简单分组 B.平行分组 C.复合分组 D.再分组 9.某变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为550,则末组的组中值是()。 A.100 B.500 C.650 D.700 10.统计表的宾词是用来说明总体特征的()。 A.统计指标 B.总体单位 C.标志 D.统计对象 11.下面属于时期指标的是()。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 12.用水平法检查长期计划完成程度,应规定()。 A.计划期初应达到的水平 B.计划期末应达到的水平 C.计划期中应达到的水平 D.整个计划期应达到的水平 13.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。该数字资料为()。 A.绝对数 B.结构相对数 C.比较相对数 D.强度相对数 14.某商场计划11月份销售利润比10月份提高2%,实际提高了3%,则销售利润计划完成程度为()。 A.100.98% B.95.10% C.99.00% D.105.10% 15.平均数反映了()。 A.总体分布的集中趋势 B.总体分布的离中趋势 C.总体中各单位分布的集中趋势 D.总体变动的趋势 16.中位数和众数是一种()。 A.常见值 B.代表值 C.实际值 D.典型值 17.计算发展速度的分母是()。 A.计划期水平 B.固定期水平 C.报告期水平 D.基期水平 18.由一个10项的时间序列可以计算的环比发展速度有()。 A.8个 B.9个 C.10个 D.11个

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课程习题参考答案

《统计学》课程部分习题参考答案(龚凤乾) 1.试针对统计学的三种任务各举一例。答:见授课题板。 2.举例说明统计分组可以完成的任务。答:见授课题板。 3.举一个单向复合分组表的例子,再举一个双向复合分组表的例子。 答:单向复合分组表的例如下 4.某市拟对该市专业技术人员进行调查,想要通过调查来研究下列问题: (1)通过描述专业技术人员队伍的学历结构来反映队伍的整体质量; (2)研究专业技术人员总体的职称结构比例是否合理; (3)描述专业技术人员总体的年龄分布状况; (4)研究专业技术人员完成的科研成果数是否与其最后学历有关。 请回答: (1)该项调查研究的调查对象是该市全部专业技术人员; (2)该项调查研究的调查单位是该市每一位专业技术人员; (3)该项调查研究的报告单位是该市每一位专业技术人员; (4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目学历、职称、年龄、科研成果数。 5 根据上表指出: (1)上表变量数列属于哪一种变量数列;(2)上表中的变量、变量值、上限、下限、

次数(频数);(3)计算各组组距、组中值、频率。 答:(1)连续型组距式分组;(2)连续型组距式分组的组距=本组上限—本组下限;组中值=(上限+下限)/2;频率= i i f f / 6.某地区人口统计数据如下表,请在此表的空白处添加以下数字:组距、组中值、频率、上限以下累计频数。 注:年龄以“岁”为单位计算,小数部分按舍尾法处理。 7.对下列指标进行分类。(只写出字母标号即可) A 手机拥有量 B 商品库存额 C 市场占有率 D 人口数 E 出生人口数 F 单位产品成本 G 人口出生率 H 利税额 (1)时期性总量指标有: EH ;(2)时点性总量指标有: ABD ; (3)质量指标有: CFG ;(4)数量指标有: ABDEH ; (5)离散型变量有: ADE ;(6)连续型变量有: BCFGH 。 8.现在把某地区1999年末全部个体经营工业单位作为研究对象。对这个统计总体,设计了“1999年末全部个体经营工业单位总数”和上述这个个体经营工业单位总体的“1999

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学原理练习题及答案

统计学原理练习题及答案 2007-12-7 9:32:24 阅读数:6162 《统计学原理》综合练习题 一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。) 1、社会经济统计的研究对象是社会经济现象总体的各个方面。() 2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。() 3、总体单位是标志的承担者,标志是依附于单位的。() 4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。() 5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。 6、调查单位和填报单位在任何情况下都不可能一致。() 7、在统计调查中,调查标志的承担者是调查单位。() 8、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。() 9、统计分组的关键问题是确定组距和组数( ) 10、按数量标志分组的目的,就是要区分各组在数量上的差别( ) 11、总体单位总量和总体标志总量是固定不变的,不能互相变换。() 12、相对指标都是用无名数形式表现出来的。() 13、众数是总体中出现最多的次数。() 14、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。() 15、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。() 16、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。() 17、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 18、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。() 19、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。() 20、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。() 21、抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。() 22、施肥量与收获率是正相关关系。() 23、计算相关系数的两个变量都是随机变量() 24、利用一个回归方程,两个变量可以互相推算()

统计学习题参考答案

第一章导论 1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。

第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学练习题参考答案

统计学参考答案(2013.12) 一、名词解释 1.统计学:是收集、分析、表述和解释数据的科学。 2.众数:一组数据中出现次数最多的变量值。 3.简单随机抽样:从含有N元素的总体中,抽取n个元组作为样本,使得每一个容量为n的样本都有相同的机会被抽中,这样的抽样方式称为简单随机抽样。4.标准分数:变量值与其平均数的离差除以标准差后的值,也称标准化值和z 分数。 二、单项选择 1.下列变量中属于连续变量的是( C ) A 中等学校个数 B 企业个数 C 学生年龄 D 学生个数 2.平均指标反映了总体分布的(A) A 集中趋势 B 离中趋势 C 长期趋势 D 基本趋势 3.标准差指标数值越小,则反映变量值( B ) A 越分散,平均数代表性越低 B 越集中,平均数代表性越高 C 越分散,平均数代表性越高 D 越集中,平均数代表性越低 4.对连续大量生产的某种小件产品进行产品质量检验,最恰当的调查方式方法是( B ) A 全面调查 B 抽样调查 C 重点调查 D 典型调查 5.下列资料中,属于时点指标的是( C ) A 2001年旅游入境人数; B 2001年全国出生人数; C 2001年全国人口数; D 2001年大学生毕业人数 6.某连续变量分组数列,其末组为开口组,下限为500;又知其邻组的组中值为480,则末组的组中值为( A ) A 520 B 510 C 500 D 490 7.计算平均发展速度最合适的平均数是( C ) A 简单算术平均数 B 加权算术平均数

C 几何平均数 D 调和平均数 8.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350元,标准差 分别为230和680元,则职工平均收入的代表性( B )。 A 甲类较大 B 乙类较大 C 两类相同 D 在两类之间缺乏可比性 9.要反映我国上市公司业绩的整体水平,总体是( A )。 A 我国所有上市公司 B 我国每一家上市公司 C 我国上市公司总数 D 我国上市公司的利润总额 10.直线回归方程中,若回归系数为负,则( B )。 A 表明现象正相关 B 表明现象负相关 C 表明相关程度很弱 D 不能说明相关的方向和程度 11.调查50个房地产公司,房屋销售面积与广告费用之间的相关系数为0.76, 这说明( A ) A 二者之间有较强的正相关关系 B 平均看来,销售面积的76%归因于其广告费用 C 如要多销售1万平方米的房屋,则要增加广告费用7600元 D 如果广告费用增加1万元,可以多销售7600平方米的房屋 12.下列各直线回归方程中,哪一个是不正确的( B ) A x y 715?+=,r =0.92 B x y 520?-=,r =0.85 C x y 210?+-=,r =0.78 D x y 35?-=,r =-0.69 13.下面现象间的关系属于相关关系的是( C ) A 圆的周长和它的半径之间的关系 B 价格不变条件下,商品销售额与销售量之间的关系 C 家庭收入愈多,其消费支出也有增长的趋势 D 正方形面积和它的边长之间的关系 14.下列数列中哪一个属于时间数列( D ) A 学生按学习成绩分组形成的数列 B 工业企业按地区分组形成的数列 C 职工按工资水平高低排列形成的数列 D 出口额按时间先后顺序排列形成的 数列 15.对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算 各自的( A )来比较。 A 标准差系数 B 平均差 C 全距 D 均方差

统计学(第五版)贾俊平 课后思考题和练习题答案(最终完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 整理by__kiss-ahuang 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学参考答案

综合指标 1、某企业2006年产值超计划完成8%,比上年增长12%,试问产值计划规定比上期增长多少? 又该企业甲产品单位成本计划在上年230元的水平上降低15元,实际上比上年降低了8%,试计算甲产品单位成本的计划完成程度。 %108% 1% 121=++x %7.31% 108% 121%=-+= x 2 要求计算表中空格数字,并直接填入表中。 3要求:1.计算该工业局的平均劳动生产率; 2.计算该工业局平均每个企业的产值。 该工业局的平均劳动生产率=10600000÷1400=7571.4(元/人)

该工业局平均每个企业的产值=1060÷20=53(万元/人) 5 试分别计算男、女职业人员的总录用率,并比较两组说明各组和总录用率高低不同的原因。 男的总录用率=123÷600=20.5% 女的总录用率=89÷500=17.8% 6、某厂三个分厂同时生产甲产品,第一季度生产情况如下: 一分厂实际产量为500件,刚好完成计划;二分厂实际产量为900件,仅完成计划的90%;三分厂实际产量为1160件,超额完成计划16%。另外,一分厂单位成本为18元/件,二分厂单位成本为16元/件,三分厂单位成本为17元/件。所以全厂超额2%完成甲产品产量计划,即(0+16%-10%)/3=2%;全厂甲产品平均单位成本为17元/件,即(18+16+17)/3=17元/件。 以上平均指标的计算是否正确?为什么?应该如何计算? 全厂计划完成率=%4.1022500 2560 %116/1160%90/9005001160900500==++++ 全厂平均单位成本= 8.162560 43120 1160 9005001711601690018500==++?+?+?(元) 7、2006年某月份A 农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个市场农产品的平均价格较高?并说明原因。 甲市场平均价格=5.5÷4=1.375(元/斤) 乙市场平均价格=5.3÷4=1.325(元/斤)

统计学第章练习题及答案

第4章 练习题 一、单项选择题 1.平均指标反映了( ) ①总体次数分布的集中趋势 ②总体分布的特征 ③总体单位的集中趋势 ④总体次数分布的离中趋势 2.某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,计算结果均值为128=X 元,标准差为( ) ①σ=33 ②σ=34 ③σ= ④σ=35 3.众数是总体中下列哪项的标志值( ) ①位置居中 ②数值最大 ③出现次数较多 ④出现次数最多 4.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为( ) ①600元 ②元 ③元 ④500元 5.标志变异指标说明变量的( ) ①变动趋势 ②集中趋势 ③离中趋势 ④一般趋势 6.标准差指标数值越小,则反映变量值( ) ①越分散,平均数代表性越低 ②越集中,平均数代表性越高 ③越分散,平均数代表性越高 ④越集中,平均数代表性越低 7.在抽样推断中应用比较广泛的指标是( ) ①全距 ②平均差 ③标准差 ④标准差系数 二、多项选择题 1.根据标志值在总体中所处的特殊位置确定的平均指标有( ) ①算术平均数 ②调和平均数 ③几何平均数 ④众数 ⑤中位数 2.影响加权算术平均数的因素有( ) ①总体标志总量 ②分配数列中各组标志值 ③各组标志值出现的次数 ④各组单位数占总体单位数比重 ⑤权数 3.标志变异指标有( ) ①全距 ②平均差 ③标准差 ④标准差系数 ⑤相关系数 4.在组距数列的条件下,计算中位数的公式为( ) ①i f S f L M m m e ?-+ =+∑12 ②i f S f U M m m e ?-=∑12 -- ③i f S f L M m m e ?-+ =∑12 - ④i f S f U M m m e ?-=+∑12 - ⑤i f S f U M m m e ?-=∑12 -+

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学练习题及答案

百度文库-让每个人平等地提升自我 《统计学》习题集 PART 1 导论 《第一套》 一、填空 1、统计的研究对象是社会经济现象(总体)的( 2、统计工作程序是统计资料的搜集、(整理)、( 3、统计学的研究方法有(大量观察法)、(实验设计法数量方面)。 分析)。 )(统计分组法)、(综合指标法)和(统计模型法)及 统计推断法。 4、我国统计工作的基本职能包括:(信息)、(咨询)、(监督)及辅助决策等职能。 二、单选题 1、社会经济统计学是一门(C) A自然科学B、新兴科学 C方法论科学D、实质性科学 2、社会经济统计的研究范围是(D) A社会现象的数量方面B、人人类生活现象的数量方面C自然科学研究的数量方面D、社会经济现象的数量方面3、社会经济统计现象形成统计总体的必要条件是( B ): A差异性B、同质性 C 、 社会性D、综合性 4、社会经济统计对社会经济现象总体数量的认识是( A ): A、从个体到总体 B、从总体到个体 C 、 从定性到定量D、从定量到定性 5、一个统计总体(D ) A只能有一个指志B、只冃匕有个标志 C可以有多个标志D、可以有多个指标 6、变量包括标志和(D ) A品质标志B、数量标志 C 、数量指标D、指标 7、在研究某城市商业企业状况中. 某商业企业的营业员人数是( A ) A、数量标志 B、数量指标 C 、变量值D、标志变量 8以产品等级来衡量某产品质量优劣,则该产品等级是( B ): A数量标志B 品质标志 C数量指标D质量指标 9、就统计指标而言,变异是指( D ): A数量指标的具体表现各不相同 B 、质量指标的具体表现各不相冋C统计指标的具体表现各不相同 D 、以上都是正确的 10、商业企业的职工人数、商品销售总额是(A连续变量B C前者是连续变量、后者也是连续变量。 ):

统计学概论练习题及参考答案

统计学概论练习题及参考答案 20XX年《统计学概论》练习题 一、单项选择题 1.统计学的两大基本) A.统计资料的收集和分析B.理论统计和运用统计C.统计预测和决策D.描述统计和推断统计2.下面的变量中哪一个属于分类变量() A.年龄B.工资C.汽车产量D.付款方式(现金、信用卡、支票)3.下面哪一个图形最适合描述结构性问题() A.条形图B.饼图C.直方图D.折线图4.统计分组后,应使()A.组B.组D.组) A.众数B.中位数C.四分位数D.平均数 6.根据经验,当算术平均数小于中位数且小于众数时,次数分布为() A.对称分布B.右偏分布C.左偏分布D.右偏或左偏分布 7.对两个总体分布进行变异性比较,当它们的平均数不等,计量单位不同时,需要计算()比较。 A.标准差系数B.标准差C.平均差D.方差8.当原假设正确,按检验规则却拒绝了原假设,则犯了() A.取伪错误B.检验错误C.第Ⅰ类错误D.第Ⅱ类错误 9.每一吨铸铁成本yc(万元)和铸件废品率x(%)变动的回归方程为:,这意味着() A.废品率每增加1%,成本每吨增加64万元B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8万元D.废品率每增加1%,则每吨成本为56万元10.将总体全部单位按照某个标志分组,再从各类型组中随机抽取一定单位组成样本,这种抽样是() A.随机抽样B.等距抽样C.分层抽样D.整群抽样11.根据经验,当算术平均数大于中位数且大于众数时,钟形分布为() A.对称分布B.右偏分布C.左偏分布D.负偏分布12.正态总体,总体方差σ2未知,小样本(n<30)的情况下,总体均值μ的置信度为1-α的置信区间为() A. 2 2 ) B. 2 2 Sn )

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关文档
最新文档