.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法

怎样表达一组数据

描述计量资料的常用指标—

A 、描述平均水平（中心位置）:

均数X 、中位数和百分位数、几何均数G 、众数（mode ） B 、描述数据的分散程度:

标准差、四分位数间距、变异系数、方差、全距

(一)均数mean 和标准差standard deviation

1. (算术)均数X

均数是描述一组计量资料平均水平或集中趋势的指标。

*直接计算公式：

12n

X X X X n

+++==

∑L

应用条件：适用于对称分布，特别是正态分布资料。

2. 中位数（median ）M 和百分位数（percentile ）

A.中位数M

是将一组观察值从小到大排序后，居于中间位置的那个值或两个中间值的平均值。应用条件：

用于任何分布类型，包括偏态资料、两端数据无界限的资料。计算：

n 为奇数时--

(

n M X

n 为偶数时--

()(1)2212n n M X X +?

?=+ ?

9人数据：12，13，14， 14， 15， 15， 15， 17, 19天

B.百分位数

是将N 个观察值从小到大依次排列，再分成100等份，对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。

四分位数间距（quartile range ）

= 第25百分位数(P25)～第75百分位数(P75)。

四分位数间距用于描述偏态资料的分散程度（代替标准差S ），包含了全部观察值的一半。

)

(天1552

19===+X X M 88451

22221415214.5()

M X X X X ??

==== ???＋如果只调查了前八位中学生，则：

＋（＋）（＋）天

百分位数计算(频数表法)：

(%)

X X

L X

i P L nX f f =+-∑

X L ：第X 百分位数所在组段下限 L Σf ：小于X L 各组段的累计频数

X i ：第X 百分位数所在组段组距

n ：总例数 f x :所在组段频数

注：有的教材X= r ;

L f ∑=C

例：求频数表的第25、第75百分位数(四分位数间距)

组段频数f 累积频数∑f

56～ 2 2 59～ 5 7

62～ 12 19 ∑f 25 L 25 65～

15 34 P 25在此

68～ 25 59 71～ 26 85 ∑f 75

L 75 74～

19 104 P 75在此

77～ 15 119 80～ 10 129 83～85

1 130

合计

130

① 确定Px 所在组段：

P 25所在的组段：n X %=130×25%=,

65～组最终的累积频数=34，落在65～组段内；

P 75所在的组段：n X %=130×75%=, 此值落在74～组段 ② 确定Px 所在组段的X L 、X i 、f x 、L Σf ③ P 25＝65+3x[(130x25%－19)/15]＝

P 75＝74+3x[(130x75%－85)/19]＝

四分位数间距=～ (次/分)

3.几何均数G （geometric mean ）

应用：

适用于成等比数列的资料，特别是服从对数正态分布资料。原始数据分布不对称，经对数转换后呈对称分布的资料。可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。例如抗体滴度。

计算：N 个数值的乘积开N 次方, 即为这N 个数的几何均数。

有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。使用分母计算！

平均抗体效价为： 1：57 加权法：

众数

是一组观察值中出现频率最高的那个观察值；若为分组资料，

众数则是出现频率最高的那个

121

lg 1lg (lg lg lg )lg lg n G X G X X X n n X

G n

-==+++=

=∑∑L 为正值

，为底的反对数表示以为底的对数；表示以

010lg 10lg 1>-X 57.566403201608040201058=???????=G 1

lg [(lg5lg10lg20lg640)/8]56.57

G -=++++=L

组段的组中值。适用于大样本但较粗糙。

例：有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62，试求众数。

正态分布时：均数＝中位数＝众数

正（右）偏态分布时：均数 > 中位数 >众数负（左）偏态分布时：均数 < 中位数 <众数

3. 标准差S

S 描述数据的分散程度.描述一组数据在其平均数周围的分布情况，若每个数据集中在其平均数周围，此平均数对这组数据的代表照就大；反之，代表性较差。

标准差S

甲组 75 80 85 90 95 100 105 n 1=7 X 1=90 s 1= 乙组

105 120 135 n 2=7

X 2=90

s 2=

()数据越分散 1

-∑-=

n X X S ，分子越大。或者

S =

标准差的5应用：

描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围

S 用于正态分布资料

怎样使用均数和标准差

论文中常用X±S描述对称、正态或近似正态分布数据的特征。

描述偏态资料的分散程度需用四分位数间距P25～P75(代替标准差S）。

方差:

方差=S2

全距R :

R= 最大值–最小值。简单，但仅利用了两端点值，稳定性差。变异系数(coefficient of variation，CV):

计算：CV=（S/X）100%，无单位

应用：1.单位不同的多组数据比较；

2.均数相差悬殊的多组资料

什么是正态分布

(二)正态分布(Normal distribution)

正态分布是描述连续型变量值分布的曲线. 当例数比较多时，医学上许多资料近似服从正态分布。正态分布在统计推断上有重要的作用。

正态分布曲线理论上的特征

（1）以X= μ均数为中心, X值呈钟型分布，中央高、两端对称性减少、与X轴永不相交。

（2 ）在X= μ处，f（x）取最大值（例数最多）。

（3 ）正态分布由均数μ、标准差σ决定曲线的左右位置和高低形状：

正态分布有两个参数，即位置参数--均数μ和形态参数--标准差σ。

若固定标准差σ，改变均数μ值，曲线沿着X轴平行移动，其形状不变。

若固定μ，σ越小，曲线形状越陡峭；反之，σ越大，曲线越平坦。

正态分布均数（位置参数）、标准差（变异度）变化示意图

正态曲线面积分布规律：

①X轴与正态曲线所夹面积恒等于1或100%；

②区间μσ

±的面积为%；

③区间 1.96

μσ

±的面积为%；

④区间 2.58

μσ

±的面积为%。

正态分布u值表(标准正态分布概率单位值)

变量值

分布范围(%)尾部面积

单侧u值双侧u值

尾部面积为α的u值，记为uα，称为u界值：

尾部面积各为%时（黑色处），其对应的u值为u=±；u=（，）区间的面积为（空白处）

正态分布的应用：

1.估计正态分布X 值在特定值范围内的分布比例(概率）。

2.制定某临床指标的参考值范围

3.利用估计变量值的范围或对极端值做取舍。

4.许多统计方法的统计推断建立在正态分布基础上。

怎样确定资料是否属正态分布

1.做正态性检验；

2.粗略估计：正态一般X S 3

<； X S >者必为偏态！

正态分布可用于求参考值范围！

(三)医学参考值范围的制定

概念医学参考值是指包括绝大多数“正常人”的各种生理及生化指标常数，也称正常值(背景值)。

正常值是指在一定范围内波动的值，医学上常用95%的范围作为判定正常或异常的参考标准。

制定参考值的基本原则

1. 选定正常人：

即排除了影响研究指标的有关因素的同质人群。有足够的样本例数（一般不低于100例）

2. 确定参考值范围的百分界限（常用95%）

3. 考虑制定单侧或双侧诊断界值：

新药肯定比旧药好（旧药肯定比新药差）——单侧新药可能好，也可能差------------------------------双侧双侧标准较高，结论较可靠（常用）

4. 依分布(正态或偏态) 确定计算方法：

（1）正态分布法

X±μ?S，其中

双侧95%参考值范围公式：X±

单侧95%参考值范围公式：X+

例：已知111人的血铅X= μg/100ml, S= μg/100ml

因为血铅可以低而不可以高，故用单侧95%参考值范围

X+=+×=(μg/100ml);

血铅95%参考值范围≤μg/100ml

注意：如果资料非正态分布而使用正态分布法，会得出错误结论！！

（2）百分位数法

适用于偏态分布资料

计算公式：

双侧界值：～

单侧用上界：P95

单侧用下界：P5

描述统计学思考题

1、调查问卷的结构？ 2、多项选择题的编码？（多重响应） 3、多项选择排序题的编码？ 4、缺失值有哪些处理方法？ 5、离群值如何判断和筛选出来？ 6、什么是问卷的信度和效度？怎样检验问卷的信度和效度？ 7、问卷调查中的信度分析，有几种信度系数？写出三种信度的测量方法。 8、问卷调查中的效度分析，有几种关于效度的测定方法？ 9、信度与效度之间有什么关系？ 10、条形图、直方图、茎叶图的区别。 11、箱线图中的离群点是哪些点？离群程度？ 12、数据特征从哪几个方面进行描述？描述统计量分别是？ 13、众数、中位数、均值的异同？ 14、根据下表数据， (1)用描述统计的方法概括表中数据，并讨论你的结论。 (2)对变量数据的最大值、最小值、平均数以及适当的分位数进行评价和解释；通过这些描述统计量，你对亚太地区的商学院有何看法或发现？ (3)对本国学生学费和外国学生学费进行比较。 (4)对要求或不要求工作经验的学校学生的起薪进行比较。 (5)对要求或不要求英语测试的学校学生的起薪进行比较。

(6)分析报告中如果有必要的图表，将更便于反映你希望反映的问题。（见下页）

表亚太地区25所知名商学院商学院名称录取名额每系人数本国学生学费（$）外国学生学费（$）年龄国外学生比例（%）是否要求 GMAT 是否要求英语测试是否要求工作经验起薪（$）麦夸里商学院（悉尼） 12 5 24420 29600 28 47 是否是71400 阿德莱德大学20 4 19993 32582 29 28 是否是65200 梅西大学（新西兰，北帕默斯顿） 30 5 4300 4300 22 0 否否否7100 墨尔本皇家工商学院 30 5 11140 11140 29 10 是否否31000 马来西亚 Sains大学（槟城） 30 4 33060 33060 28 60 是是否87000 澳大利亚国立大学（堪培拉） 42 5 7562 9000 25 50 是否是22800 De La Salle大学（马尼拉） 44 5 3935 16000 23 1 是否否7500 南洋理工大学（新加坡） 50 6 6146 7170 29 51 是是是43300 香港理工大学60 8 2880 16000 23 0 否否否7400 拉合尔管理科学院 70 2 20300 20300 30 80 是是是46600 香港大学90 5 8500 8500 32 20 是否是49300 柯廷理工学院（珀思） 98 17 16000 22800 32 26 否否是49600 日本国际大学126 2 11513 11513 26 37 是否是34000 昆士兰大学（布里斯本） 138 8 17172 19778 34 27 否否是60100 新加坡国立大学 147 7 17355 17355 25 6 是否是17600 墨尔本商学院200 13 16200 22500 30 30 是是是52500 Chulalongkorn 大学（曼谷） 200 10 18200 18200 29 90 否是是25000 新南威尔士大学（悉尼） 228 19 16426 23100 30 10 否否是66000 Jamnalal Bajaj 管理学院（孟买） 240 15 13106 21625 37 35 否是是41400 亚洲管理学院300 7 13880 17765 32 30 否是是48900

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告一、数据介绍：本次分析的数据为某地区361个人旅游情况状况统计表，其中共包含七变量，分别是：年龄，为三类变量；性别，为二类变量（0代表女，1代表男）；收入，为一类变量；旅游花费，为一类变量；通道，为二类变量（0代表没走通道，1代表走通道）；旅游的积极性，为三类变量（0代表积极性差，1代表积极性一般，2代表积极性比较好，3代表积极性好 4代表积极性非常好）；额外收入,一类变量。通过运用spss统计软件，对变量进行频数分析、描述性统计、方差分析、相关分析，以了解该地区上述方面的综合状况，并分析个变量的分布特点及相互间的关系。二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状况的统计数据表，在性别、旅游的积极性不同的状况下的频数分析，从而了解该地区的男女职工数量、不同积极性情况的基本分布。统计量积极性性别 N 有效359 359 缺失0 0 首先，对该地区的男女性别分布进行频数分析，结果如下

性别频率百分比有效百分比累积百分比有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明，在该地区被调查的359个人中，有198名女性，161名男性，男女比例分别为44.8%和55.2%，该公司职工男女数量差距不大，女性略多于男性。其次对原有数据中的旅游的积极性进行频数分析，结果如下表：积极性频率百分比有效百分比累积百分比有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析，结果如下表：其次对原有数据中的是否进通道进行频数分析，结果如下表：

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定：60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。要求： (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表； (2)指出分组标志及类型及采用的分组方法； (3)分析本单位职工业务考核情况。解：(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组，组限表示方法是重叠组限； (3)本单位的职工考核成绩的分布呈两头小，中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高？并说明原因解：先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 （元 /斤） m/x 4 乙市场平均价格 X xf 5.3 1.325 （元 / 斤） f 4 说明：两个市场销售单价是相同的，销售总量也是相同的，影响到两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组，甲组平均每个工人的日产量为 36件, 标准差为9.6件；乙组工人日产量资料如下：

年度医院医疗统计分析报告

2013年度医疗统计分析报告综合全年医疗统计数字，对比去年同期，对期内统计数据做以分析，为医院综合工作提供参考，进一步提高医疗服务质量和工作效率。工作效率分析，即运用统计指标来分析和评定医院工作效率，可以了解医院科室人员、设施、设备、技术、物资的利用情况。反映医院管理方面的成效和问题，对改进医院管理有重要意义。按照国家对二级甲等医院临床医疗质量与工作效率的指标，实际床位使用率应≥85%，从此数据反映平均每天使用床位与实有床位的比例情况;平均住院日≤12天，超过则说明病床负担过重；术前平均住院日＜3天，反映了术前诊断质量、术前准备质量、手术室管理水平。我们通过分析认为，我院2013全年床位使用率还是低于范围值，平均住院日及术前住院日都在允许范围内。积极深入查找原因，及时反馈有关部门，在保证医疗质量的前提下，提高床位使用率，不仅能节省床位投资，使现有的卫生资源得到充分有效的利用，也使我们医院的技术优势能够得到充分的发挥。一、床位使用率、平均住院日、术前平均住院日分析 1、资料与方法资料来源于我院病案统计2013年与2012年统计数据汇总。 2、结果表一： 3、分析由表一可以看出：我院2013年总体床位使用率为57.40％，虽比2012年同期上升12.7％，但是离国家卫生主管部门规定≥85%的标准差距太大，依然处于低效率运行状态。我院2013年出院病人平均住院日10.14天，同比2012年同期下降0.27天，低于规定≤12天标准，处于正常效率运行状态。

我院2013年术前平均住院日2.04天，低于规定＜3天标准，处于正常效率运行状态。从表上数据看我院2013年床位使用率低效率运行科室是妇产科和五官科。妇产科孕产妇就诊率极低，与市里专业性极强的妇、产医院竞争，实力明显薄弱。五官科亦面临同样的问题。结果分析反映出：我院2013年床位未得到充分利用，出院病人平均住院日处于正常效率运行状态，而床位使用率处于低效率运行，说明住院病人率低。建议：加大人才培养力度，广招贤能充实医院卫生专业技术人员队伍，选派技术骨干进修学习，提高医疗技术水平、强化优质服务和管理力度，合理用药合理医治，降低患者治疗成本，吸引患者，提高床位运行效率。我院2013年同比2012年同期的术前平均住院日，均处于正常效率运行状态，它反映术前诊断质量、术前准备质量、手术安排合理性、手术室管理均达到标准水平。二、门诊诊疗工作状态分析 1、来源：门诊工作数据来源主要通过门诊电脑就诊挂号系统提取，并每月定期收集门诊专家工作日志，深入查看门诊患者的入住率。 2、结果：2013及2012年门诊工作量对比表二 3、结果分析： 2013年我院门诊工作量同比2012年同期增长21.80%。门诊量增长幅度不是太大，因素：2013年上半年诊疗工作在老院，下半年10月搬迁入新住院楼，千头万绪，新环境、新设备，医务人员缺口大，业务工作于2013年年底才基本进入有序轨道运行。建议：2014年国家还会加大医疗保险的投入，社会保险人群大幅度增加，尤其是新农合报销比例也在不断增加，大形势越好竞争也就越激烈，我们还得在宣传力度和医疗技术与服务上投大力气、下大功夫吸引患者，加上我院几年来一直深入农村、村屯、各农牧场开展免费诊疗，随队人员都是主任医师、副主任医师，我们一定能克服客观困难，争取提高工作量。三、临床诊断质量分析 1、来源：医疗统计系统提取报表数据 2、对照

统计学原理(第五版)》习题计算题答案详解

《统计学原理(第五版)》习题计算题答案详解第二章统计调查与整理 1．见教材P402 2．见教材P402-403 3．见教材P403-404 第三章综合指标 1．见教材P432 2． %86.12270 25 232018=+++= 产量计划完成相对数 3．所以劳动生产率计划超额%完成。 4． %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标一季度产品单位成本，未完成计划，还差%完成计划。 5． %85.011100%8% 110% 1=?++==计划完成数实际完成数计划完成程度指标计划完成数；所以计划完成数实际完成数标因为，计划完成程度指%105%103= = 1.94%%94.101% 103% 105，比去年增长解得：计划完成数==()得出答案）将数值带入公式即可以计算公式，上的方程，给大家一个很多同学都不理解也可以得出答案，鉴于（根据第三章天）。个月零天（也即是个月零（月）也就是大约）（上年同季（月）产量达标季（月）产量超出计划完成产量达标期完成月数计划期月数超计划提前完成时间达标期提前完成时间完成计划的时间万吨。根据公式：提前多出万吨，比计划数万吨产量之和为：季度至第五年第二季度方法二：从第四年第三PPT PPT 6868825.8316-32070 -7354-60--3707320181718=+=+=+==+++()天完成任务。个月零年第四季度为止提前（天），所以截止第五）（根据题意可设方程：万吨完成任务。天达到五年第二季度提前万吨。根据题意，设第万吨达到原计划，还差万吨产量之和为：季度至第五年第一季度方法一：从第四年第二6866891 -91*20)181718(1916707016918171816=++++=+++x x x

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组（千元）人数（人）向上累计频数向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— （1）计算并填写表格中各行对应的向上累计频数；（2）计算并填写表格中各行对应的向下累计频数；（3）确定该公司月销售额的中位数。按上限公式计算：Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下：p41 工人按年龄分组（岁）工人数（人） 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合计 550 要求：采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表：某旅游胜地旅游人数时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日旅游人数（人） 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示，试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日在册学生人数（人） 3408 3528 3250 3590 3575

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试，甲班平均成绩为81分，标准差为9.5分，乙班的成绩分组资料如下：按成绩分组学生人数（人） 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩，并比较甲乙两班，哪个班的平均成绩更有代表性？ 2、某车间有甲乙两个生产组，甲组平均每个人的日产量为36件，标准差为9.6件，乙组工人产量资料如下：日产量（件）工人数（人） 15 15 25 38 35 34 45 13 要求：（1）计算乙组平均每个工人的日产量和标准差（2）比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元，试计算上半年，下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长（%） 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 （2）计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下：（万元）商品单位销售额1996比1995年销售价格提高（%） 1995 1996 甲米120 130 10 乙件40 36 12 要求：（1）计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值（2）计算销售量总指数，计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下：要求：（1）计算相关系数，说明两个变量相关的密切程度（2）配合回归方程，指出产量每增加1000件时，单位成本平均变动多少？月份产量（千克）单位成本（元） 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

《统计学》计算题型与参考答案

《统计学》计算题型（第二章）1．某车间40名工人完成生产计划百分数（％）资料如下：9065 100 102 100 104 112 120 124 98 110110 120 120 114 100 109 119 123 107 110 99 132 135 107 107 109 102 102 101 110 109 107 103 103 102 102 102 104 104 要求：（1）编制分配数列；（4分）（2）指出分组标志及其类型；（4分）（3）对该车间工人的生产情况进行分析。（2分）解答：（1）

（2）分组标志：生产计划完成程度类型：数量标志（3）从分配数列可以看出，该计划未能完成计划的有4人，占10%，超额完成计划在10％以内的有22人，占55％，超额20％完成的有7人，占17.5％。反映该车间，该计划完成较好。（第三章）2．2005年9份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下：试问哪一个农贸市场农产品的平均价格较高？(8分)并分析说明原因。（2分）解答： (1)x 甲＝∑∑m x m 1＝24 8.41 6.36.314.24.21246.34.2?+?+?++＝30/7=4.29(元) x 乙＝ ∑∑f xf ＝ 1 241 8.426.344.2++?+?+?＝21.6/7=3.09(元) (2)原因分析：甲市场在价格最高的C 品种成交量最高，而乙市场是在最低的价格A 品种成交量最高，根据权数越大其对应的变量值对平均数的作用越大的原理，可知甲市场平均价格趋近于C ，而乙市场平均价格却趋近于A ，所以甲市场平均价格高于乙市场平均价格。

统计学计算题和标准答案

企业型号价格（元/台）甲专卖店销售额（万元）乙专卖店销售量（台） A 2500 50.0 340 B 3400 115.6 260 C 4100 106.6 200 合计—272.2 — 要求：分别计算两个专卖店空调的平均销售价格，并分析平均价格差异的原因。答案： 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件，标准差为11件；乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差，并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性？日加工零件数（件）60以下60—70 70—80 80—90 90—100 工人数（人） 5 9 12 14 10 答案：三、某地区2009—2014年GDP资料如下表，要求： 1、计算2009—2014年GDP的年平均增长量； 2、计算2009—2014年GDP的年平均发展水平； 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案： x-== 年平均增长速度：100%100%22.9% 试用最小平方法配合销售额的直线趋势方程，并预测2016年的销售额将达到什么水平？答案：2010年—2014年的数据有5项，是奇数，所以取中间为0，以1递增。设定x为-2、-1、0、1、2、年份/销售额（y）x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计1728 0 144 10 b=∑xy/∑x2=144/10=14.4 a=∑y/n=1728/5=345.6 y=345.6+14.4x 预测2016年，按照设定的方法，到2016年应该是5 y=345.6+14.4*5=417.6元五、某企业生产三种产品，2013年三种产品的总生产成本分别为20万元，45万元，35万元，2014年同2013年相比，三种产品的总生产成本分别增长8%，10%，6%，产量分别增长12%，6%，4%。试计算： 1、三种产品的总生产成本增长的百分比及增加的绝对额； 2、三种产品的总产量增长的百分比，及由于产量增长而增加的总生产成本； 3、利用指数体系推算单位产品成本增长的百分比。试计算: 1、三种商品的销售额总指数； 2、三种商品的价格总指数和销售量总指数；

2019年统计学数据分析报告

统计学数据分析报告一、调查研究方案的设计与组织实施（一）调查目的 (1)描述和反映本校商学院14级金融系学生对于毕业去向的意向，分析并研究各意向的分布情况； (2)在专业，性别，家庭因素，个人因素等方面对毕业意向的分布进行研究，探究这些因素对于毕业意向分布的影响。(3)分析和解释形成毕业意向分布差异的因素和原因； (二)调查对象和调查单位本次调查的基本调查对象是本校商学院金融类的部分同学。调查单位为此范围内的每一个同学。在此基础上，在每个专业内随机抽取样本进行抽样调查，进而对整体进行推断。（三）调查的组织和实施方法获取资料的方法：问卷法、文献法本小组采用的基本方法为问卷法，发放问卷60份，收回问卷54份。辅助方法为文献法，通过图书馆和网络获取相关背景资料，对研究素材进行丰富和补充。调查方法：抽样调查抽样方法：分层抽样将调查对象按专业分为金融工程、金融学和信用管理三个类别，然后从各个类别中随机抽取组成样本，用于对整体进行推断。数据资料整理结果如下：

在全部被调查对象中，男生23人，占43%，女生31人，占57%，金融学18人，占总体1/3,信用管理18人，占总体1/3,金融工程18人，占总体1/3。选择考研的有14人，占总体的26%。选择出国深造的有1人，占总体的2%。选择自主创业的有3人，占总体6%。选择直接就业的有29人，占总体54%。选择考公务员的有7人，占总体12%。（四）调查时间和调查期限调查时间：20XX年5月9日调查期限：20XX年5月9日―20XX年5月14日（五）调查项目和调查表调查项目：性别年级专业毕业意向家庭收入情况性格特点就业优势调查表如下：二、统计数据的整理和分析（一）总体分布情况与相关分析根据问卷统计的数据得到的频数分布表和毕业意向分布饼图如下：由上表可以得到以下结论：选择直接就业的人数占总体的比例最大，占总体的54%其次是选择考研和考公务员，分别占总体的26%和12%。选择出国深造和自主创业的人数最少，只占总体的2%和6%。可以看出大部分同学的毕业意向集中在直接就业和考研两个方面，而出国深造和自主创业对本校商学院来说仍旧是比较冷僻的意向。

统计学练习题及答案

2014统计学练习题及答案一判断题 1、某企业全部职工的劳动生产率计划在去年的基础上提高8%，计划执行结果仅提高4%，则劳动生产率的任务仅实现一半。（错） 2、在统计调查中，调查标志的承担者是调查单位。( 错) 3、制定调查方案的首要问题是确定调查对象。( 错) 4、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( 错) 5、现象之间的函数关系可以用一个数学表达式反映出来。（对） 6.上升或下降趋势的时间序列，季节比率大于1，表明在不考虑其他因素影响时，由于季.的影响使实际值高于趋势值，（对） 7.特点是“先对比，后综合。”（错 8.隔相等的时点数列计算平均发展水平时，应用首尾折半的方法。( 错) 9.均数指数的计算特点是：先计算所研究对象各个项目的个体指数；然后将个体指数进行加权平均求得总指数。( 错) 10.和样本指标均为随机变量。( 错) 11.距数列中，组数等于数量标志所包含的变量值的个数。（对） 12.中值是各组上限和下限之中点数值，故在任何情况下它都能代表各组的一般水平。( 错) 13.标志和数量标志都可以用数值表示，所以两者反映的内容是相同的。（错） 14.变异度指标越大，均衡性也越好。( 对) 15.于资料的限制，使综合指数的计算产生困难，就需要采用综合指数的变形公式平均数指数。( 错) 16.计量是随机变量。（对） 17.数虽然未知，但却具有唯一性。（错） 18.标和数量标志都可以用数值表示,所以两者反映的内容是相同的（错） 19.以经常进行，所以它属于经常性调查(错) 20.样本均值来估计总体均值，最主要的原因是样本均值是可知的。（）答案未 21.工业普查中，全国工业企业数是统计总体，每个工业企业是个体。（错） 22.标志的承担者，标志是依附于个体的。（对） 23.志表明个体属性方面的特征，其标志表现只能用文字来表现，所以品质标志不能转化为统计指标。（错） 24.标和数量标志都可以用数值表示，所以两者反映的内容是相同的。（错） 25.计指标都是用数值表示的，所以数量标志就是统计指标。（错） 26.标及其数值可以作为总体。（错） 27.润这一标志可以用定比尺度来测定。（错） 28.统计学考试成绩分别为55分，78分，82分，96分，这4个数字是数量指标。（错） 29.术学派注重对事物性质的解释，而国势学派注重数量分析。（错） 30.是统计研究现象总体数量的前提。（对） 31.析中，平均发展速度的计算方法分水平法和方程两种。（错） 32.数值越大，说明相关程度越高：同理，相关系数的数值越小，说明相关程度越低（对 33.志是总体同质性特征的条件，而不变标志是总体差异性特征的条件。（错） 34.度具有另外三种尺度的功能。（对） 35.民旅游意向的问卷中，“你最主要的休闲方式是什么？”，这一问题应归属于事实性问题

统计学计算例题及答案

计算题例题及答案： 1、某校社会学专业同学统计课成绩如下表所示。社会学专业同学统计课成绩表学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求：（1）对考试成绩按由低到高进行排序，求出众数、中位数和平均数。

（2）对考试成绩进行适当分组，编制频数分布表，并计算累计频数和累计频率。答案：（1）考试成绩由低到高排序： 62，66，68，70，70，75，76，76，76，76，76，77，78，79， 80，80，80，81，82，82，83，83，85，86，86，87，87，88， 88，90，90，90，91，91，92，93，93，94，95，95，96，97，众数：76 中位数：83 平均数： =（62+66+……+96+97）÷42 =3490÷42 =83.095 （2）按成绩分组频数频率(%) 向上累积向下累积频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

描述性统计分析报告--Descriptive Statistics菜单详解

第六章：描述性统计分析－－ Descriptive Statistics菜单详解描述性统计分析是统计分析的第一步，做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析，但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中，最常用的是列在最前面的四个过程：Frequencies过程的特色是产生频数表；Descriptives过程则进行一般性的统计描述；Explore过程用于对数据概况不清时的探索性分析；Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验，我们常用的X2检验也在其中完成。本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一，Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表，还可以按要求给出某百分位点的数值，以及常用的条图，圆图等统计图。和国内常用的频数表不同，几乎所有统计软件给出的均是详细频数表，即并不按某种要求确定组段数和组距，而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表，请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示：

该界面在SPSS中实在太普通了，无须多言，重点介绍一下各部分的功能如下：【Display frequency tables复选框】确定是否在结果中输出频数表。【Statistics钮】单击后弹出Statistics对话框如下，用于定义需要计算的其他描述统计量。现将各部分解释如下：

统计学数据分析报告记录

————————————————————————————————作者：————————————————————————————————日期：

统计学数据分析报告一、调查研究方案的设计与组织实施（一）调查目的 (1)描述和反映本校商学院14级金融系学生对于毕业去向的意向，分析并研究各意向的分布情况； (2)在专业，性别，家庭因素，个人因素等方面对毕业意向的分布进行研究，探究这些因素对于毕业意向分布的影响。 (3)分析和解释形成毕业意向分布差异的因素和原因； (二) 调查对象和调查单位本次调查的基本调查对象是本校商学院金融类的部分同学。调查单位为此范围内的每一个同学。在此基础上，在每个专业内随机抽取样本进行抽样调查，进而对整体进行推断。（三）调查的组织和实施方法获取资料的方法：问卷法、文献法本小组采用的基本方法为问卷法，发放问卷60份，收回问卷54份。辅助方法为文献法，通过图书馆和网络获取相关背景资料，对研究素材进行丰富和补充。调查方法：抽样调查抽样方法：分层抽样将调查对象按专业分为金融工程、金融学和信用管理三个类别，然后从各个类别中随机抽取组成样本，用于对整体进行推断。数据资料整理结果如下：

在全部被调查对象中，男生23人，占43%，女生31人，占57%，金融学18人，占总体1/3,信用管理18人，占总体1/3,金融工程18人，占总体 1/3。选择考研的有14人，占总体的26%。选择出国深造的有1人，占总体的2%。选择自主创业的有3人，占总体6%。选择直接就业的有29人，占总体54%。选择考公务员的有7人，占总体12% 。（四）调查时间和调查期限调查时间：2016年5月9日调查期限：2016年5月9日―2016年5月14日（五）调查项目和调查表调查项目：性别年级专业毕业意向家庭收入情况性格特点就业优势调查表如下：毕业意向专业性别考研出国深造自主创业直接就业考公务员金融工程男7 0 0 0 6 1 女11 2 0 0 8 1 金融学男8 2 1 0 4 1 女10 6 0 1 2 1 信用管理男8 1 0 1 5 1 女10 3 0 1 4 2 合计54 14 1 3 29 7 二、统计数据的整理和分析

(完整版)统计学复习题答案

一、主要术语描述统计．．．．：研究数据收集、处理和描述的统计学分支。推断统计．．．．：研究如何利用样本数据来推断总体特征的统计学分支。观测数据．．．．：在没有对事物进行人为控制的条件下，通过调查或观测而收集到的数据。实验数据．．．．：在实验中控制实验对象而收集到的数据。异众比率．．．．：非众数组的频数占总频数的比率。四分位差．．．．：也称为内距或四分间距，上四分位数与下四分位数之差. 。显著性水平．．．．．：假设检验中发生第Ⅰ类错误的概率，记为 P-．值．：也称观察到的显著性水平或实测显著性水平，是根据样本观测值计算出来的概率。拟合优度检验．．．．．．：根据样本观测结果与原假设为真条件下期望结果的吻合程度，来检验总体是否服从某种分布。一般地，可以用于任何假设的概率分布。独立性检验．．．．．：检验两个分类变量之间是否存在相关关系。多个总体比例差异检验．．．．．．．．．．：检验多个总体比例是否都相等。消费者物价指数．．．．．．．：又称居民消费价格指数，反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动程度的一种相对数。生产者价格指数．．．．．．．：反映企业产品出厂价格变动趋势和变动程度的一种相对数。股票价格指数．．．．．．：是反映某一股票市场上多种股票价格变动趋势的一种相对二．简答和计算P41—P42： 2．2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样，什么情况下适合采用非概率抽样。概率抽样的特点：简单随机抽样、系统抽样（等距抽样）、分层抽样（类型抽样）和整群抽样。非概率抽样的特点：方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。 2．6你认为应当如何控制调查中的回答误差？回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种，主要有理解误差、记忆误差及意识误差。调查一方在调查时可协助被调查者一方共同完成调查，被调查方不了解的调查方可帮助解释、阐明，这样可减少误差。 2．7怎样减少无回答？请通过一个例子，说明你所考虑到的减少无回答的具体措施。可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防，采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制，采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。 2．8如何设计调查方案？第一步：确定调查目的第二步：确定调查对象和调查单位第三步：确定调查项目和调查表第四步：调查表格和问卷的设计第五步：确定调查时间和调查方法等

统计学原理计算题及参考答案

}

| 1、某生产车间30名工人日加工零件数（件）如下： 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求：（1）根据以上资料分成如下几组：25—30，30—35，35—40，40—45，45—50，计算各组的频数和频率，编制次数分布表；（2）根据整理表计算工人平均日产零件数。（20分）解：（1）根据以上资料编制次数分布表如下：

则工人平均劳动生产率为： 17.3830 1145 == = ∑∑f xf x # 要求：（1）建立以产量为自变量的直线回归方程，指出产量每增加1000件时单位成本的平均变动是多少、（2）当产量为10000件时，预测单位成本为多少元（15分） x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为，5.2-=b ，所以产量每增加1000件时，即x 增加1单位时，单位成本的平均变动是：平均减少元（2）当产量为10000件时，即10=x 时，单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性解：乙班学生的平均成绩∑∑=f xf x ，所需的计算数据见下表：

统计学的发展历程

统计学概述 [编辑本段] 统计学是应用数学的一个分支，主要通过利用概率论建立数学模型，收集所观察系统的数据，进行量化的分析、总结，并进而进行推断和预测，为相关决策提供依据和参考。它被广泛的应用在各门学科之上，从物理和社会科学到人文科学，甚至被用来工商业及政府的情报决策之上。统计学主要又分为描述统计学和推断统计学。给定一组数据，统计学可以摘要并且描述这份数据，这个用法称作为描述统计学。另外，观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型，以之来推论研究中的步骤及母体，这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。统计学的发展历程 [编辑本段] 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik，最早是由Gottfried Achenwall(1749)所使用，代表对国家的资料进行分析的学问，也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义，并且由John Sinclair引进到英语世界。统计学是一门很古老的科学，一般认为其学理研究始于古希腊的亚里斯多德时代，迄今已有两千三百多年的历史。它起源于研究社会经济问题，在两千多年的发展过程中，统计学至少经历了“城邦政情”，“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科，确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础，但是它不属于统计学的范畴，而属于数学的范畴。统计学的发展过程的三个阶段第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要，其内容包括各城邦的历史，行政，科学，艺术，人口，资源和财富等社会和经济情况的比较，分析，具有社会科学特点。“城邦政情”式的统计研究延续了一两千年，直至十七世纪中叶才逐渐被“政治算数”这个名词所替代，并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。第二阶段称之为“政治算数”(Politcal arthmetic)阶段与“城邦政情”阶段没有很明显的分界点，本质的差别也不大。

统计学调查报告

统计学课程设计大学生熬夜调查报告班级：xxxx 学号：xxxx 姓名：xxxx

目录一、引言 (3) 二、调查方案 (4) 三、问卷设计 (5) 四、问卷发放 (6) 五、数据分析 (7) 六、结论 (11)

一、引言俗话说，“早睡早起身体好”，这是有一定科学道理的。人在睡眠的时候，意识相对不清楚，肌肉的随意运动停止，从而帮助大家恢复体能、巩固记忆力，其重要性仅次于呼吸和心跳，是维持健康不可缺少的。有了良好的睡眠，可以使第二天保持清醒和活力。鉴于此，我们对身边的大一大二大三学生，进行了一次抽样问卷调查活动。本着了解如今大学生的作息基本情况，还有宣传熬夜的危害和早睡早起的良好作息习惯的目的，举行了这此调查。虽然调查持续了一个月，但颇有收益。研究目的:对于有些人，熬夜已经成为生活方式的一部分。但是,从健康的角度讲，熬夜还是害处多多的。熬夜会导致人疲劳，免疫力下降;头痛;皮肤干燥、长黑斑、青春痘等;长期熬夜还会慢慢地出现失眠、健忘、易怒、焦虑不安等神经、精神症状。通过这次探究，发现大学生熬夜状况及深层原因。这次调查包括熬夜的比例、原因等，希望以此为基础，探究大学生的熬夜现象，并且提出切实可行的解决措施，为大家的作息时间提出一点建议，减少大学生熬夜现象，同时也希望通过这份调查报告给大家带来提醒，希望大家能制定一个科学的休息时间，为生活和学习打好基础。

二、调查方案（一）调查目的我们想更加深入的了解与大学生的熬夜相关的一系列问题,并根据调查情况，并根据调查情况，做出调查报告。（二）调查对象身边的在校大学生（三）调查单位在校大学生共42名（四）调查程序： 1．确定调查内容 2．设计调查问卷 3．确定调查对象及单位（采用分层抽样的方式，男生21份，女生21份），发放问卷（采用留置调查法）并回收问卷 4．问卷整理并进行数据统计、数据分析、数据总结 5．对问卷总结分析得出结论（五）调研期限调研期限： 2019年12月1日—2019年12月30日（五）调查方式过问卷星在网上发布调查报告，对不同大学不同专业不同年级的大学生进行调查，并用统计学的方法处理数据，从而得到结果。关键词：大学生熬夜健康在大学，对于许多大学生来说，熬夜早已成为一种生活常态。每天的深夜和凌晨都会看到这样的情景：宿舍的灯熄了，但是电脑的屏幕还是亮着的；校园的街道是安静的，而宿舍的楼道依然是吵闹着的。这样的情景使大部分同学的生活变得很不规律。或者是习惯于晚睡晚起。熬夜已成了一种习惯，不熬夜反倒少见。因此作为一名大学生，在自己处于这种情况下，对大学生熬夜情况很感兴趣。研究大学生熬夜情况有助于帮助大学生正确安排自己的作息时间,并关注自己的健康。

统计学计算题答案(课后)

9. (1)工人日产量平均数: 45 60 55 140 65 260 75 150 85 50 660 =64.85(件 / 人) (2)通过观察得知，日产量的工人数最多为 260人，对应的分组为 60~70,则众数在60~70这一组中，则众数的取值范围在 60~70 之间。利用下限公式计算众数: n x f i i i 1 n f i i 1 众数M ° (f m f m 1 )

=65.22 (件) (3)首先进行向上累计，计算出各组的累计频数: 10.(1)全距只=最大的标志值一最小的标志值 =95—55=40 x f ⑵平均日装配部件数x ―」 55 4 65 12 75 24 85 6 95 4 50 =73.8 (个) n _ X i x f i i 1 n 260 140 (260 140 (260 15C) (70 60) 660 1 2 330.5 比较各组的累计频数和 330.5，确定中位数在60~70这一组利用下限公式计算中位数: ~~2- S m 1 M e L 壬 60 660 200 2 (70 60) 65(件) 260 ⑷分析：由于x M e M o ，所以该数列的分布状态为左偏。平均差 A.D

f i i 1 |55 73.8 4 |65 73.8| 12 |75 73.8| 24 |85 73.8 6 |95 73.8 4 4 12 24 6 4 =7.232 (件)

⑷标准差系数V -100% x 9.93 73.8 13.46% X i f i 30 4 50 25 70 84 90 126 110 28 267 =81.16 (件) 乙企业的平均日产量X 乙 xf j 30 2 50 8 70 30 90 42 110 18 2 (X i X) f i i 1 n f i i 1 2 2 2 2 2 (55 73.8) 4 (65 73.8) 12 (75 73.8) 24 (85 73.8) 6 (95 73.8) 4 ⑶方差 4 12 24 6 4 =98.56 (个) 标准差 n (x x)2 f i i 1 n 、、98.56 9.93(件) 13. 甲企业的平均日产量x 甲