初步数量分析方法

初步数量分析方法
初步数量分析方法

数量分析方法

概论

一、概论

对事物进行研究,离不开数量分析。数量分析是深入认识事物的基本途径之一。在质与量的密切联系中,一定事物的质总是表现为一定的数量。事物的质总是以一定的量的积累为基础,因此,对事物的认识从量入手,可以更好地把握事物固有的本质特征和基本的规律性。尽管研究事物量的目的仍然是为了更好地认识事物的质,而且定量分析与定性分析在认识事物的过程中都是十分重要的,但是定性分析的目的是通过逻辑分析、相互比较和基本推理来认识事物固有的本质特征,一般通过访谈、观察和综合来实现;而定量分析是通过对数据的研究来表征事物的特征,一般除需要根据事物本身特征,通过观察、综合外,还常常需要选择分析工具,进行定量分析。因而,在某种程度上讲,认识事物的本质特征,定量分析比定性分析更具有客观性和易操作性。为了进行更科学的定量分析,作为定量分析的方法体系,数量分析方法近年来越来越受到人们的重视。

数量分析方法的含义有广义和狭义之分。广义上讲,研究事物的数量特征、数量关系和数量界限需要一系列特有的和通用的方法,所有这些方法统称为数量分析方法。从狭义上讲,数量分析方法是在一定的理论指导下,遵照数学和统计学的有关原理,通过处理有关数据,建立数量模型,从而对经济现象的数量特征、数量关系和数量界限进行研究、分析和决策的一系列方法的总称。

数量分析方法作为定量分析的方法体系,其产生和发展总是有其自身发展规律的。事实上,数量分析方法的有关具体方法均来自其相应的学科。特别是统计学、经济学、系统工程、控制论,以及运筹学和决策理论等。随着这些学科的产生和发展,数量分析方法的方法体系就越来越丰富。同时,数量分析方法也随着这些学科的发展而发展。

数量分析方法的产生,最早可追溯至16~17世纪早期。随着统计学的产生和发展,数量分析方法也在各个领域被广泛应用。1662年,英国学者格朗特发表《关于死亡表的自然和政治观察》的论文开创了统计学研究的纪元,也开创了数量分析方法研究的新局面。随后,配第发表的《政治算术》也运用数量分析的方法对当时欧洲各国政治经济状况进行了分析。由于受英国学者格朗特和配第的影响,许多人在人口、医疗、保险和经济等领域均采用了数量分析方法。概率论的研究以及引入统计学,并通过贝努里、高斯、拉普拉斯、凯特

勒、高斯特和费雪等人努力,使得统计学更加完善和科学化,为数量分析方法的发展提供了重要理论基础。

在现代经济学领域,经济学家古诺、戈森等人首先将数量分析方法应用于经济学领域。随后,杰文斯和瓦尔拉斯等人用数量分析方法又进一步阐明了经济学的有关重要原理,并创立了经济学的数理学派。以后,经济学家费雪等人又在经济学领域进一步发展数量分析方法,直到20世纪90年代,在现代经济学领域,数量分析方法已成为经济学研究的最重要方法之一。在30多位诺贝尔经济学奖得主中,有近20位是由于他们成功地在经济学领域大量动用了数量分析方法。

随着系统工程、运筹学、现代管理学、投入产出理论、模糊数学和灰色理论等一系列新兴学科在20世纪30年代的兴起,特别是计算机技术迅速成熟,数量分析方法也得到了蓬勃发展,其应用范围已渗透到社会生活的各个领域。从经济学和其他社会科学到自然科学领域、从经济基础到上层建筑、从城市规划到生态环境、从生物科

学到军事科学都须用到数量分析方法。在当今,数量分析方法已成为各领域必然的重要分析方法。今后,数量分析方法也势必会随着现实需要的变化而不断发展。

二、指标

在进行经济管理类对象分析过程中,往往离不开指标的选取,指标的选取是否合适,直接影响到分析的结论,指标是不是选取得越多越全面呢?太多了,事实上是重复性的指标,会有干扰;太少了,可能所选的指标缺乏足够的代表性,会产生片面性.每一项指标都是从一个方面反映了分析对象的某些信息,如何正确地、科学地使用这种信息,就是分析过程中要处理的问题.

很明显,指标的选取与具体问题所涉及的专业知识有关,也与我们能考察获取的手

段有关.例如评价参加高考的学生,是否能录取,考试科目太多了,学生受不了.口试可以了解到学生的反映能力快慢,但实际上是无法进行的.尽管如此,仍然有一些原则,一些数学方法可以帮助我们.

(一)所选评价指标的一些原则

选取指标要遵循的原则,通常有以下几条,这些供我们在解决实际问题时参考.

1.目的明确

所选用的指标目的很明确.从分析对象和内容看,该指标确实能反映有关的内容,反映多与少是另一类问题.决不能将与分析对象和内容无关的指标也选择近来.比如

要评价一个企业的活力如何,就要选择与企业自身发展能力有关的指标,例如劳动

生产率,市场占有率,产品的优势,等等.所以选取指标目的明确是非常重要的.

2.比较全面

选取的指标要尽可能覆盖分析的内容,如果有所遗漏,分析就会出偏差.当然,要做

到全面是不容易的,但要努力、尽量去做.比如评价科技实力时,既要考虑科技人才、科技知识结构等重要因素,还要考虑科技投入、科技人员流动情况等有关的因素,这样才能比较全面.

比较全面的另一种说法就是有代表性,所选的指标确能反映要分析的内容,虽然不

是全部,但代表了某一侧面.

3.切实可行

用通俗一些说法,就是可操作性.某些指标虽然很合适,但无法得到,就不切实可行,缺乏可操作性.例如一个学生的才能,没有办法可以直接测量,只能通过做题、面试、科研等几个方面考察.

以上几条原则还需在实际中灵活考虑和运用.下面我们通过例子来了解指标选取的思路.

例1.1我国各地区普通高等教育发展水平的综合评价

近年来,我国普通高等教育得到了迅速发展,为国家培养了大批人才。但由于各地区经济发展水平不均衡,加之高等院校原有布局使各地区高教发展的起点不一致,因

而各地区高教发展水平就存在一定的差异。对我国各地区普通高等教育发展水平进行综合评价,有利于管理和决策部门从宏观上把握各地区普通高教发展现状,更好

地指导和规划高教事业的健康发展。

我们从高等教育的五个方面选取10项相对指标(见图1-1).

x

平均每所高校在校生数

高等院校规模

高等院校数量

x8

每百万人口学校数

每十万人口毕业生数

x1

高教发展

水平

每十万人口招生数

平均教育经费

国家财政预算内普通高教经费占国民生产总值比重高级职称占专职教师的比例

每十万人口专职教师数

教职工情况

每十万人口教职工数

高等院校学生数量

每十万人口在校生数

x2

x3

x4

x5

x6

x7

经费投入

x8

图1-1 高教发展水平评价指标体系

需要说明一点,高等教育的质量是高等教育发展水平的一个重要标志,它表现在严

格而高效的教学管理和高质量的教学水平,最终体现为高素质的毕业生.鉴于高等

教育质量难以量化,从可操作性考虑,这里改用教职工情况予以近似地反映.另外,

这10个评价指标中的某些指标之间(比如反映高等院校学生数量的三个指标之间)

可能存在较强的相关性(需要予以筛选).

(二)定量指标筛选方法

在按一些原则确定指标体系后,这些变量都是可以观察测量的.在这个基础上,就可

以用统计分析中的一些方法来选出一部分,使得它们有很好的代表性,进行分析时,

工作就更容易些.

面对一大堆指标,可能有重复反映某些内容的,都考虑会过于偏重某一侧面.但若删

去的过多或不当,就会不全面,丢失重要信息.所以这是一个矛盾,又要尽可能全面、

又希望指标数量不要过多.解决这个矛盾我们常用下面几种统计方法.

1.条件广义方差极小

从统计分析的眼光来看,给定p个指标x1,…,xp的n组观察数据,就称为给了n个样本,

相应的全部数据用矩阵X表示,即

个样本第第二个样本第一个样本nxxxxxxxxxXnpnnpp (212222111211)

每一行代表一个样本的观察值,X是的矩阵,利用X的数据,可以算出变量xi的均值/

方差与xi,xj之间的协方差,相应的表达式是: pn

均值pixnxnaaii........,2.1,11

naiaiiipixxns1,......,2,1),(1

方差

najajiaiijjixxxxxns1__),)((1

协方差

i,j=1,2,…,p

由sii,sij形成的矩阵

(1-1) )(ijppss

称为x1,x2,…,xp这些指标的方差/协方差矩阵(样本的),或简称为样本的协方差阵.用S的行列式值|S|反映这p个指标变化的状况,称为广义方差,因为p=1时

|S|=|s11|=变量x1的方差,所以它可以看成是方差的推广.可以证明,当x1,…,xp相互独立时,广义方差|S|达到最大值;当x1,…,xp线性相关时,广义方差|S|的值是0.因此,当x1,…,xp既不独立,又不线性相关时,广义方差的大小反映了它们内部的相关性.

现在来考虑条件广义方差,将(1-1)式分块表示,也就是将x1,…,xp这p个指标分成

两部分,( x1,…,xp1)和(xp+1,…,xp),分别记为x(1)和x(2),即

pppppxxxxxxp

2121)2()1(21,11...

212221121121ppSsssspp

这样表示后,s11,s22分别表示x(1)和x(2)的协方差.给定x(1)之后,x(2)对x(1)的

条件协差阵,从数学上可以推导得到(在正态分布的前提下)

S(x(2)|x(1))=s22-s21s11-1s12 (1-2)

(1-2)表示已知x(1)时,x(2)的变化状况.可以想到,若已知x(1)后,x(2)的变化很小,那么x(2)这部分指标就可以删去,表示x(2)所能反映的信息,在x(1)中几乎都可得到,因此就产生条件广义方差最小的删去方法.方法如下:

将x1,…,xp分成两部分,(x1,…,xp-1)看成x(1),xp看成x(2),用(1-2)就可算出

S(x(2)|x(1)),此时是一个数值,它是识别xp是否应删去的量,记为tp.类似地,对xi,可以将xi看成x(2),余下的p-1个看成x(1),用(1-2)算出一个数,记为ti.于是得到

t1,t2,…,tp这p个值,比较它们的大小,最小的一个是可以考虑删去的,这与所选的临界值有关,这个临界值C就是自己选的,认为小于这个C就可删去,大于这C不宜删去。给定C之后,逐个检查

ti

是否成立,有就删,删去后对留下的变量,可以完全重复上面的过程,因此,这样可以进行到没有可删的为止,这就选得了既有代表性又不重复的指标集.

从(1-2)式可以看到,如有经验,不必逐个考虑,完全可以将指标分组,按组来考虑,

方法/步骤与上面所说的相同.

2.极大不相关

容易想到,如果x1与其他的x2,…,xp是独立的,那就表明x1是无法由其他指标来代

替的,因此保留的指标应该是相关性越小越好,在这个想法指引下,就导出极大不相关方法.首先利用(1-1)式,求出(样本的)相关阵R

(1-3) )(ijrR

pjisssrjjiiijij....,2,1,

rij称为xi与xj的相关系数,它反映了xi与xj的线性相关程度.现在要考虑的是一个变量xi与余下的p-1个变量之间的线性相关程度,称为复相关系数.通常记为piiixxxxxx,....,,....,,|1121

这个符号太复杂,现在简化为,但要注意它的意义.可以由下面的公式来计算.先将R 分块,例如要计算,就将R写成i p

)(111的相关阵表示除去pppTpppxRrrRR

(注意R中的主对角元素rij=1,I=1,2,…,p),于是

(1-4) ppTpprRr12

类似地要计算时,见R中的第i行/第i列经过置换,放在矩阵最后一行,最后一列,此

时2i

1TiiirrRR置换后

于是的计算公式为2i

pirRriiTii,....,2,1,12

算得后,其中值最大的一个,表示它与其余变量相关性最大,指定临界值D之后,当时,

就可以删去xi. 221,....,p Di 2

例1.2(续1.1) 我国各地区高教发展水平的十项指标值如表2-5所示,其中

x1,x2,…,x10的含义见图1-1.试用极大不相关法进行筛选.

由表1-1中数据可求得十个指标中的每一个与其余九个指标的相关系数如下(记xi

与其余九个指标的复相关系数为): )1(i

80920.0,92324.094687.0,93591.099952.0,99926.099946.0,99923.099692.0,9 9786.0)1(10)1(9)1(8)1(7)1(6)1(5)1(4)1(3)1(2)1(1

可见,指标x6与其余指标间的复相关系数最大,因而它最能被其余指标代替,故先将

x6剔除掉.再计算余下的九个指标中的每一个与其余八个指标的复相关系数,记

为: )2(i

表1-1

76681.090513.0,94490.092327.0,99497.099945.0,99923.099647.0,99671.0)2 (10)2(9)2(8)2(7)2(5)2(4)3(3)2(2)2(1 序号地区X1 X2 X3 X4 X5 X7 X8 X6 X9 X10

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30 北京

上海

天津

陕西

辽宁

吉林

黑龙江

湖北

江苏

广东

四川

山东

甘肃

湖南

浙江

新疆

福建

山西

河北

安徽

云南

江西

海南

内蒙古

西藏

河南

广西

宁夏

贵州

青海

5.96

3.39

2.35

1.35

1.50

1.67

1.17

1.05

0.95

0.69

0.56

0.57

0.71

0.74

0.86

1.29

1.04

0.85

0.81

0.59

0.66

0.77

0.70

0.84

1.69

0.55

0.60

1.39

0.64

1.48

310

234

157

81

88

86

63

67

64

39

40

58

42

42

42

47

53

53

43

35

36

43

33

43

26

32

28

48

23

38

461

308

229

111

128

120

93

92

94

71

57

64

62

61

71

73

71

65

66

47

40

63

51

48

45

46

43

62

32

46

1557

1035

713

364

421

370

296

297

287

205

177

181

190

194

204

265

218

218

188

146

130

194

165

171

137

130

129

208

93

151

931

498

295

150

144

153

117

115

102

61

61

57

66

61

66

114

63

76

61

46

44

67

47

65

75

44

39

77

37

63

319

161

109

58

58

58

44

43

39

24

23

22

26

24

26

46

26

30

23

20

19

23

18

29

33

17

17

34

16

30

44.36

35.02

38.40

30.45

34.30

33.53

35.22

32.89

31.54

34.50

32.62

32.95

28.13

33.06

29.94

25.93

29.01

25.63

29.82

32.83

28.55

28.81

27.34

27.65

12.10

28.41

31.93

22.70

28.12

17.87

2615

3052

3031

2699

2808

2215

2528

2835

3008

2988

3149

3202

2657

2618

2363

2060

2099

2555

2313

2488

1974

2515

2344

2032

810

2341

2146

1500

1469

1024

2.20

0.90

0.86

1.22

0.54

0.76

0.58

0.66

0.39

0.37

0.55

0.28

0.73

0.47

0.25

0.37

0.29

0.43

0.31

0.33

0.48

0.34

0.28

0.32

1.00

0.30

0.24

0.42

0.34

0.38

13631

12665

9385

7881

7733

7480

8570

7265

7786

11355

7693

6805

7282

6477

7704

5719

7106

5580

5704

5628

9106

4085

7928

5581

14199

5714

5139

5377

5415

7368

由此看出,我们应剔除指标x4,同理再计算余下八个指标的复相关系数,结果如下:

75579.0,90321.094102.0,92182.099292.0,99839.099582.0,99657.0)3(10)3(9)

3(8)3(7)3(5)3(3)3(2)3(1

指标x3应剔除,在余下七指标中,如果再计算下去,应剔除的将是x1,但考虑到指标

x1(每百万人口学校数)反映着高教发展水平的五个方面之一高等学校数量,如果剔

除的话,这个侧面将不能被反映,所以剔除到此为止,我们将余下的七个指标作为评

价指标。从图1-1看出,剔除的x4,x3与留下的x2反映同一个侧面,x6与x5,x7反映同

一个侧面,因而x4,x3,x6在一定程度上可以被其他指标代替,这与定性分析的结果

也是吻合的.

3.选取典型指标

如果开始考虑的指标过多,则可以将这些指标先进行聚类,而后在每一类中选取若

干个典型指标.关于聚类分析我们将在后面介绍.在每一类中选取典型指标可以用

上述方法1或2.这两种方法的计算量都相当大,下边介绍一种用单相关系数选取典

型指标的方法,该方法较为粗略,但其计算简单,在实际中可依据具体情况选用.

假设反映事物同一侧面的或聚为同一类的指标有n个,分别为a1,a2,….an.第一步

计算n个指标之间的相关系数矩阵R

212222111211

nnnnnnrrrrrrrrrR

第二步计算每一指标与其他n-1个指标的决定系数(相关系数的平方)的平均值—2ir

(1-5) nirnrnjiji,,2,1,11122_

则粗略地反映了ai与其他n-1个指标的相关程度。第三步比较的大小,若有2_ir

2_12_maxinikrr

则可选取ak作为a1,a2,…,an的典型指标,需要的话,还可以在余下的n-1个指标中

继续选取。这里之所以要用复相关系数的平方是为了防止相关系数可能为负,因而

无法直接相加求平均。如果相关系数均为正,则可直接用相关系数。比如,例1.1中

的指标x5,x6,x7,反映了高教发展水平的同一侧面,其相关阵为

33155001.055988.055001.0199859.055988.099859.01 R

直接用相关系数由(1-5)式可求得

77924.0)155988.099859.01(1315_

r

同理可得

55495.0,7743.07_6_ rr

最大,故应选x5为x5,x6,x7的典型指标.如果再选一个,应在x6和x7之间选取,而x6

和x7之间相关性为0.55001,无法再用上边的方法,但我们从相关阵可以看出x6和x5

的相关性(0.99859)要大于x7与x5的相关性(0.55988),已经选取了x5,它已将x6基

本代替,因而应选x7.即如果从x5,x6,x7中选两个指标,应选x5和x7. 5_r

三、量纲

在分析过程中如选取了人口、面积、某消费量和产值等指标.这些指标显然是异量

纲的,而且数值差异也可能会较大,直接将它们加权平均是不合适的,也没有实际意义.这就需要把指标值转化为无量纲的相对数,同时数值大小规范在[0,1]内.这种

去掉指标量纲的过程,我们称为数据的无量纲化(也称为数据的规格化),它是指标

综合分析的前提。如果我们把指标无量纲化以后的数值称为指标评价值,那么无量

纲化过程就是指标实际值转化为指标评价值的过程,无量纲化方法也就是指如何实现这种转化.从数学角度讲就是要确定指标评价值依赖于指标实际值的一种函数关

系式.我们把无量纲化方法从几何的角度归为三类:直线型无量纲化方法、折线型无量纲化方法、曲线型无量纲化方法.

(一)直线型无量纲化方法

常用的直线型无量纲化方法有以下几种:

1.阈值法

阈值法也称临界值法,是衡量事物发展变化的一些特殊指标值,比如极大值、极小值、满意值、不允许值等.阈值法是用指标实际值与阈值相比以得到指标评价值的无量

纲化方法,主要公式及特点等如表1-2所示,其中n为参评单位的个数。在多数情况下, 指标值均大于0,故以上按所有xi>0处理,事实上若有部分,公式仍然适用.最后两个

公式实质是一样的,只不过评价值的范围有所变化.我们可以用同样的方法将前几

个公式的评价值范围变到我们希望的范围内.公式2和公式3适合于处理指标体系中

的逆指标,比如经济效益评价中的成本类指标,社会效益评价中的资源耗费类指标等。当然我们也可以事先将其转化为正指标,然后再与其他指标一起无量纲化.在

弄清这些公式的特点之后,我们就可以灵活选用或构造新的公式。需要提及的是,如果我们所选取的评价指标都是正指标(或都是逆指标),则在一次综合评价中对所

有指标应采取同一种无量纲化公式。如果在评价中既有正指标,又有逆指标,且不作逆指标转化处理的话,则应对正/逆指标分别采用两种相互对应的无量纲化公式。所谓相互对应的公式是指两种公式得到的评价范围应是一致的,这样才可以进行综合.表1-2中式1和式2, 式3和式4都是相互对应的.将式3稍作变形可得式5对应的公式.

0 ix

表1-2 几种阈值法参照表

序号公式指标因素指标范围几

特点

1 iniiixxy 1max , ix

inix 1max

1,maxminiixx

评价值随

指标值增

大,若指

标值均为

正,则评

价值不可

能为零,

指标最大

值的评价

值为1.

2 iiiiixxxxymaxminmax

iiiixxxxminmax,0

评价值随

指标值大

而小,适

于逆指标

进行无纲

处理,即

无量纲化

和指标转

化同时进

行.

3 iiiiixxxxyminmaxmax

iiixxxminmax

[0,1]

同上

4 iiiiixxxxyminmaxmin

同上

[0,1]

评价值随

指标值增

大而增

大,指标

最小值的

评价值为

零,指标

最大值的

评价值为

1.

5 qkxxxxyiiiii

minmaxmin

qkxxxiii,minmax

[q ,k+q]

随指标值

大而大.

指标最小

值的评价

值为q,指

标最大值

的评价值

k+q.

另外实际中也有将指标实际值除以该指标的第一个样本值或均值,分别称为初值化和均值化,实质也是一种阈值法.

2.标准化方法

统计学理论告诉我们,要对多组不同量纲的数据进行比较,可以先将它们分别标准化,转化成无量纲的标准化数据.如综合评价分析就是要将多组不同的数据进行综合,因而可以借助于标准化方法来消除数据量纲的影响.标准化公式为

(1-6) sxxyii_

上式中

(1-7) niixnx1_1

2_11xxnsi

(1-8)

指标实际值与评价值的关系如图1-2所示.

Y 评价值

0 x 实际值_x

图1-2

可以看出,无论实际值如何,指标的评价值总是分布在零的两侧.指标实际值比平均值大的,其平均值为正,反之为负,实际值距平均值越远则其评价值距零越远.这种方法与阈值法最大的不同在于:第一,它利用了原始数据的所有信息;第二,它要求样本数据较多;第三,它的评价值结果超出[0,1]区间,有正有负.为了更符合习惯,我们可以将其转化为百分数形式,比如用公式(见图1-3):

y 6 0 x

图1-3

(1-9) 10601001060__

sxxsxxyiii 均值转化为60,超过均值的转化为60以上,反之在60以下.这种”百分数”还不同于一般的百分数,因为个别极端数值的转化值可能超出[0,100]区间.另外,也有的将均值转化为50.

在用多元统计方法中,大多是用标准方法进行数据无量纲的.

例1.3某次考试中有关的统计结果及甲/乙两考生的成绩如表1-3所示. 科目 原始分数 全体考生 无量纲化结果

甲 乙

均值 标准差s 甲

数学 物理 化学 78 45 72 82 41 74 80 42 74 8 4 6 57.5 67.5 56.7 62.5 57.5 60

这里就涉及一个对甲/乙两考生理科学习水平的综合评价问题,评价指标为三科目的考试成绩.我们可以利用公式(1-9)对甲/乙两名考生的成绩进行无量纲化,以甲生数学成绩为例

100810807860 甲数y =57.5

计算结果见表1-3最右边一栏.还有两个问题说明一下,第一个问题是:有必要对考试分数进行无量纲化吗?通常的看法是考试成绩是一种分数,本身没有单位,而且都是百分制,因此不必要无量纲化,直接相加求总分即可。事实上,这种看法是有误解的.由于不同科目试题的难易程度/分量不一定相同,其分数的”含金量”并不相同,因而不能直接相加.本例中物理较难,因而分数普遍偏低,数学则相反,因耳物理中的1分就比数学中的1分具有更高的“含金量”.无量纲以后,个科分数都是以60分为中心而分布,具有了可比性,因而可以相加.例中甲/乙两考生的原始总分分别195

197,乙比甲高两分.无量纲以后甲/乙两考生的分数分别为188.3和180.甲比乙高.

很显然,后一个结果才是客观合理的.虽然乙在数学和化学上共比甲高出6分,而甲

在物理上仅比乙高出4分,但这4分的”含金量”要比那6分的”含金量”高.近年来,我国

的高考实行用标准分录取就是源于这个思想.后面我们将对高考标准分再进行讨论。第二个问题是,本例实际上是应该对所有考生进行综合评价,因而均值和标准差是

由全体考生计算出来。我们这里为了计算方便,便于说明想法,仅对其中的两名考生进行了计算.

3.比重法

比重法是将指标实际值转化为它在指标值总和中所占的比重,重要

公式有:

(1-10)或(1-11) niiiixxy1 niiiixxy12

公式(1-10)适合指标值均为正数的情况,且评价值之和满足

(1-12) niiy11

公式(1-11)适合于指标值有负值的情况,一般情况下,指标评价值不满足(1-12)式.而是满足.考尔在综合国力评价中就是利用比重法消除量纲影响的.

niiy121

以上介绍了三种常用的直线型无量纲化方法,这些方法的最大特点是简单/直观.直

线型无量纲化方法实质是假定指标评价值与实际值成线性关系,评价值随实际值等

比例变化,也就是说指标值在不同区间内变化对被评事物的综合水平影响是一样的(如图1-4所示),即在事物发展的前期和后期指标值相同的变化量引起评价值的变

化量是

y

△y

△y

0 △x △x x

图1-4

不同的.而这一点与事物发展变化的实际情况往往并不符合,这也是直线型无量纲

化方法的最大缺陷.比如我们要评价一个学生,学习成绩是一个指标,如果我们将学习成绩用直线型无量纲化方法转化为评价值,再与其他指标综合,这就意味着学习

成绩从40分增加到50分和90分增加到100分对评价起的作用是相同的(二者导致评

价值的增加量是相同的),这显然与实际情况不符.实际中后者要比前者难得多,需

要比前者付出更多的努力,因此,从这个角度讲,应该给后者以较多的评价值增加量.为了解决这个问题很自然我们就会想到用折线或曲线来代替直线,这就是我们下面要介绍的折线型和曲线型无量纲化方法.

(二)折线型无量纲化方法

折线型无量纲化方法适合于事物发展呈现阶段性,指标在不同阶段变化对事物总体水平影响是不相同的.构造折线型无量纲化方法与直线型不同之处在于必须找出事物发展的转折点的指标值并确定其评价值.常用的有下面三种类型.

(三)曲线型无量纲化方法

有些事物发展阶段性的分界点不很明显,而前中后各期发展情况又截然不同,也就

是说指标值变化对事物总体水平的影响是逐渐变化的,而非突变的.在这种情况下,曲线型无量纲化公式更为合适.常用的曲线型无量纲话公式如表1-4所示.

例1.4 无量纲化在高考录取工作中的应用

高考就是对考生进行综合评价,各科目成绩即为评价指标,综合评价的结果就是录取的依据.以往的作法就是直接将各科目原始成绩相加,总分就是综合评价值,然后依据各考生的总分从高到低录取.从例1.3中我们已经可以看出这样的作法是不合

理的.这里的核心问题是:各科目的分数不是同质的,不具有可比性,因而不能直接相加.必须首先对不同科目的分数进行无量纲化,即转化为标准分数,然后才能相加.

化为标准分数有几种不同的方式,比如线性标准分数/正态化标准分数/中位数标准分数等.由公式(1-9)得到的标准分数就是线性标准分数,用公式(1-9)进行无量纲

化的前提是不同科目的分数要呈现正态分布,否则,不同科目分数经公式(1-9)转化后还不具有可比性.例如,如果一个科目分数呈现正态分布,另一科目分数呈偏态分布,那么相同的线性标准分数可能对应不同的百分等级1),难以做到准确的比较.通常,各科目考试成绩在考生人数较多时,从理论上讲应该呈

现正态分布,但是实际考试中,由于题目难度不同及评分误差等随机因素影响,很难使考试分数的实际分布与正态分布完全一致.因此,实践中并不采用公式(1-9)进行无量纲化,而是将各科目原始分数分别进行正态化变换,以使得源于不同分布的分

数可以比较,然后再相加.

正态化变换是一种非线性变换,不论原始分数的分布呈何种形态,通过这种变换,可以使变换后的分数呈现标准正态分布,因而变换后的分数称为正态化标

准分数。利用这种分数可以明确知道,原分数在整批分数中所处的位置.对原始分数进行正态化变换得到正态化标准分数的步骤是:

1)百分等级:在一批分数中,小于某分数的分数个数占整批分数个数的百分比,称为该分数在这批分数中的百分等级.比如,某班共50人,某人成绩为80分,80分以下有30人,则该考生的百分等级为60(30/50=60%).

(1)对原始分数排序,求出每个原始分数x对应的百分比

(1-13) 考生人数分以下的考生人数xpx

(2)查标准正态分布表,得到每个分数的正态化标准分数Zx如图1-5所示,阴影部分面积为Px,即

xxxZPdex 2221

y

0 Zr x

图1-5 N(0,1)分布

比如,某考生某科原始分数所对应的百分数值为0.5,则查表可知其正态化标准分为0,另一考生某科原始分数所对应的百分位数值为0.8413,则查表可知其正态化标准分为1.反过来由正态化标准分数也

表1-4 曲线型无量纲化公式一览表

图形解析式特点

г

y

x 0100)(

kaxeaxyaxk

指标评价值随实际值变化,到后

期逐渐缓慢直至几乎不变,适合

于指标值在后期变化对事物发展

总体水平影响较小的情况

.

升半正态型

y

0 x

01002)( kaxeaxyaxk

指标评价值随实际值中期变化较快,而前后期相对较慢.适合于指

标中期变化对事物发展总体水平影响较大的情况. 升半柯西型

y 0 x

0,)(1)(002 kaxaxkaxkaxy

同上 升半凹凸型

y

0 x 0111,)(00

kaaxaaxaaxaaxykkk

指标评价值随指标实际值的变化逐渐加快或逐渐减慢.

升半岭型 y o x

01),2(sin212100 kbxbxabaxabaxy 指标评价值随指标实际值中期变化快,前后期较慢,

且呈对称情况.

可查得原始分数所对应的百分比.

与原始分数相比,正态化标准分数服从标准正态分布,故而形式简单、整齐,它准确保留原始数据的相对位置信息,合理调整分数间距使不同科目间具有可比性.由于正态化标准分数绝对值较小,有正还有负,且多为小数,实践中在不同科目相加前再作一次线性变换,得到标准T 分数

(1-14) ZT100500

这样可以将分数的档次拉开,便于比较.各科目的分数都经过正态化变换和(1-14)式的变换得到标准T 分数后,就可以进一步形成综合分.实际中具体的操作方法可参阅文献.

无量纲化方法在使用时,要尽量选择适合于讨论对象性质的方法,不要不加思考,随便选用一种,当然也可以选用几种,然后分析不同的无量纲化方法对结论会产生多大的影响.实际工作表明,不是越复杂的方法越合适,关键在于是否切合实际的要求,在这个前提下,应该说越简便、越方便施用,越会受欢迎.

常用分析方法

绍的主要方法有六种,分别为:1、对比分析法:将A公司和B公司进行对比、2、外部因素评价模型(EFE)分析、3、内部因素评价模型(IFE)分析、4、swot 分析方法、5、三种竞争力分析方法、6、五种力量模型分析。对比分析法是最常用,简单的方法,将一个管理混乱、运营机制有问题的公司和一个管理有序、运营良好的公司进行对比,观察他们在组织结构上、资源配臵上有什么不同,就可以看出明显的差别。在将这些差别和既定的管理理论相对照,便能发掘出这些差异背后所蕴含的管理学实质。企业管理中经常进行案例分析,将A和B公司进行对比,发现一些不同。各种现象的对比是千差万别的,最重要的是透过现象分析背后的管理学实质。所以说,只有表面现象的对比是远远不够的,更需要有理论分析。外部因素评价模型(EFE)和内部因素评价模型(IFE)分析来源于战略管理中的环境分析。因为任何事物的发展都要受到周边环境的影响,这里的环境是广义的环境,不仅指外部环境,还指企业内部的环境。通常我们将企业的内部环境称作企业的禀赋,可以看作是企业资源的初始值。公司战略管理的基本控制模式由两大因素决定:外部不可控因素和内部可控因素。其中公司的外部不可控因素主要包括:政府、合作伙伴(如银行、投资商、供应商)、顾客(客户)、公众压力集团(如新闻媒体、消费者协会、宗教团体)、竞争者,除此之外,社会文化、政治、法律、经济、技术和自然等因素都将制约着公司的生存和发展。由此分析,外部不可控因素对公司来说是机会与威胁并存。公司如何趋利避险,在外部因素中发现机会、把握机会、利用机会,洞悉威胁、规避风险,对于公司来说是生死攸关的大事。在瞬息万变的动态市场中,公司是否有快速反应(应变)的能力,是否有迅速适应市场变化的能力,是否有创新变革的能力,决定着公司是否有可持续发展的潜力。公司的内部可控因素主要包括:技术、资金、人力资源和拥有的信息,除此之外,公司文化和公司精神又是公司战略制定和战略发展中不可或缺的重要部分。一个公司制定公司战略必须与公司文化背景相联。内部

数量分析方法模拟试题三 (1)

商务统计方法模拟试题三 一、判断题 1、定义数据结构是在数据视窗中进行的。() 2、在进行二项分布检验时,要求检验变量必须是二值变量。() 3、Kendall相关系数适用于度量定类变量间的线性相关关系。() 4、非参数检验要求样本来自的总体服从或近似服从正态分布。() 5、配对样本中个案个数一定是相同的。() 6、在SPSS数据文件中,一行代表一个个案(case)。() 7、单样本t检验也可用于对总体比率进行检验。() 8、在进行方差分析时,若总方差主要是由组内方差引起的,则会拒绝原假设。() 9、二值变量序列中,游程数最小为1.() 10、变量值越大,对应的秩就会越小。() 二、单项选择题 1、SPSS数据文件默认的扩展名() A、.sps B、.spo C、.sav D、.rtf 2、在SPSS的运行方式中,最常见,对初学者最适用的方式是() A、程序运行方式 B、完全窗口菜单方式 C、混合运行方式 D、联机帮助方式 3、面对100份调查问卷,在进行SPSS数据输入时,应采用() A、原始数据的组织方式 B、计数数据的组织形式 4、下列关于变量名的取名规则的说法,不正确的是() A、变量名的字符数不能超过8个 B、变量名不区分大小写字母 C、“3G”是一个合法的变量名 D、变量名可以以汉字开头 5、在定义数据结构时,Label是指定义() A、变量名 B、变量名标签 C、变量值标签 D、变量类型 6、“年龄”这个变量属于() A、定类型变量 B、定序型变量 C、定距型变量 7、欲插入一个个案,应选择的一级菜单是() A、File B、Edit C、View D、Data 8、在横向合并时,[Excluded V ariables]框中的变量是() A、两个待合并的数据文件中的所有变量 B、合并后新的数据文件中包括的变量 C、合并后新的数据文件中不包括的变量 D、第二个待合并的数据文件中的变量 9、如果只想对收入大于5000或者职称不小于4级的职工进行计算,应输入的条件表达式是() A、收入>5000or 职称>4 B、收入>5000and 职称>4 C、收入>5000 or not(职称>4) D、收入>5000 or not(职称<4) 10、希望从全部231个个案中随机选出32个个案,应采用的选取方式是() A、指定条件选取 B、近似选取 C、精确选取 D、过滤变量选取 11、分类汇总中,默认计算的是各分类组的()

4几种常见的质量分析方法

几种常用的质量分析方法 1、层别法 2、柏拉图法 3、特性要因图法 4、检查表 具体说明: 1、层别法 层别法是将所要进行的项目利用统计表进行区别,这是运用统计方法作为管理的最基础工具。一般的工厂所做的层别通常为: 操作者:不同班组别机器:不同机器别 原料、零件:不同供给厂家作业条件:不同的温度、压力、湿度、作业场所……. 产品:不同产品别不同批别:不同时间生产的产品 员 一二三人 组组组 器 机 料 材 法 方

2、柏拉图法 柏拉图是美国品管大师朱兰博士(Joseph Juran)运用意大利经济学家柏拉图(Pareto)的统计图加以延伸所创造出来的。柏拉图分析步骤: (1)要处置的事,以状况(现象)或原因加以层别。 (2)纵轴虽可以表示件数,但最好以金额表示。 (3)决定搜集资料的时间,自何时至何时,作为柏拉图资料的依据,期间尽可能定期。 (4)各项目依照合计的大小顺序自左向右排列在横轴上。 (5)绘上柱状图 (6)连接累积曲线 示例: 某部门将上个月生产的产品作出统计,总不良数414个,其中不良项目依次为: 层别统计表

N=414 100 400 80 300 47.1%60 200 40 21.7% 100 15.8%20 10.9% 4.5% 破损变形刮痕尺寸超差其他 不良项目 由上图可以看出,该部门上个月产品不良最大的来自破损,占了47.1%,前三项加起来超过80%以上,进行处理应以前三项为重点。

3、特性要因图 特性要因图,就是将造成某项结果的众多原因,以系统的方式加以图解,用图来表达结果(特性)与原因(要因)之间的关系,因其形状像鱼骨,又称鱼骨图。 特性要因图,可使用在一般管理及工作改善的各种阶段,特别是树立意识的初期,易于使问题的要因明朗化,从而设计步骤解决问题。

16种常用数据分析方法

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。 适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。 A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析 检査测量的可信度,例如调查问卷的真实性。 分类: 、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度1. 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。 四、列联表分析 用于分析离散变量或定型变量之间是否存在相关。 对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。 列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。 五、相关分析 研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 1、单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量; 2、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关; 3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。

管理数量方法与分析简答题

《管理数量方法与分析》简答题 第一章数量分析基础 1,对数据进行分析的前提是什么? 数据分析的前提是数据的搜集与加工整理。 2,什么是变量数列? 变量数列是,在对变量的取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列。 3*,变量数列的两个组成要素及其作用。 变量数列由两个要素组成:一个是由不同变量值划分的组,称为组别;另一个是各组变量值出现的次数,称为频数;各组频数与总次数之比,称为频率。 组别表示变量的变动幅度;频数、频率表示对应的变量值对其平均水平的作用程度。频数、频率越大的组所对应的变量值对其平均水平的作用也越大。 4,什么是洛伦茨曲线?它的主要用途是? 洛伦茨曲线就是累计频数(或频率)分布曲线,主要用途是研究社会财富、土地和工资收入的分配是否公平。 5*,简述分布中心的概念和意义。 分布中心,是指距离一个变量的所有取值最近的位置。变量的分布中心有重要的意义,①可以反映变量取值的一般水平。②可以揭示其取值的次数分布在直角坐标系中的集中位置,可以用来反映变量分布密度曲线的中心位置。 6,应用算数平均数应该注意哪些问题?怎么避免?略。 7,算数平均数有哪些性质?略。 8*,在数据分析中引入离散程度测度有什么意义? 变量各取值之间的离散程度是变量次数分布的一个重要特征,测定它对实际研究有重要意义: ①可以反映各变量取值之间的差异大小,也就是反映分布中心指标对各个变量值代表性的高低。差异越大,代表性越低。 ②可以大致反映变量次数分布密度曲线的形状。 9*,测度离散程度的指标有哪些?分别的特点是什么? ①极差。(也称全距,指最大值与最小值的差值。) 特点:计算简单,意义明了,是离散程度测度指标中最粗略、最简单的一种。 ②四分位全距。 特点:不像极差那么容易受极端变量值的影响,但是依然存在没有充分利用所有数据信息的缺点。 ③平均差。(变量各取值与平均数偏差的绝对值的算数平均数)

大数据的统计分析方法

统计分析方法有哪几种?下面天互数据将详细阐述,并介绍一些常用的统计分析软件。 一、指标对比分析法指标对比分析法 统计分析的八种方法一、指标对比分析法指标对比分析法,又称比较分析法,是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法,有比较才能鉴别。 指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。 二、分组分析法指标对比分析法 分组分析法指标对比分析法对比,但组成统计总体的各单位具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求,把所研究的总体按照一个或者几个标志划分为若干个部分,加以整理,进行观察、分析,以揭示其内在的联系和规律性。 统计分组法的关键问题在于正确选择分组标值和划分各组界限。 三、时间数列及动态分析法 时间数列。是将同一指标在时间上变化和发展的一系列数值,按时间先后顺序排列,就形成时间数列,又称动态数列。它能反映社会经济现象的发展变动情况,通过时间数列的编制和分析,可以找出动态变化规律,为预测未来的发展趋势提供依据。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。 时间数列速度指标。根据绝对数时间数列可以计算的速度指标:有发展速度、增长速度、平均发展速度、平均增长速度。

动态分析法。在统计分析中,如果只有孤立的一个时期指标值,是很难作出判断的。如果编制了时间数列,就可以进行动态分析,反映其发展水平和速度的变化规律。 四、指数分析法 指数是指反映社会经济现象变动情况的相对数。有广义和狭义之分。根据指数所研究的范围不同可以有个体指数、类指数与总指数之分。 指数的作用:一是可以综合反映复杂的社会经济现象的总体数量变动的方向和程度;二是可以分析某种社会经济现象的总变动受各因素变动影响的程度,这是一种因素分析法。操作方法是:通过指数体系中的数量关系,假定其他因素不变,来观察某一因素的变动对总变动的影响。 用指数进行因素分析。因素分析就是将研究对象分解为各个因素,把研究对象的总体看成是各因素变动共同的结果,通过对各个因素的分析,对研究对象总变动中各项因素的影响程度进行测定。因素分析按其所研究的对象的统计指标不同可分为对总量指标的变动的因素分析,对平均指标变动的因素分析。 五、平衡分析法 平衡分析是研究社会经济现象数量变化对等关系的一种方法。它把对立统一的双方按其构成要素一一排列起来,给人以整体的概念,以便于全局来观察它们之间的平衡关系。平衡关系广泛存在于经济生活中,大至全国宏观经济运行,小至个人经济收支。平衡分析的作用:一是从数量对等关系上反映社会经济现象的平衡状况,分析各种比例关系相适应状况;二是揭示不平衡的因素和发展潜力;三是利用平衡关系可以从各项已知指标中推算未知的个别指标。 六、综合评价分析 社会经济分析现象往往是错综复杂的,社会经济运行状况是多种因素综合作用的结果,而且各个因素的变动方向和变动程度是不同的。如对宏观经济运行的评价,涉及生活、分配、流通、消费各个方面;对企业经济效益的评价,涉及人、财、物合理利用和市场销售状况。如果只用单一指标,就难以作出恰当的评价。 进行综合评价包括四个步骤:

管理数量方法与分析

管理数量方法与分析 第一章数据分析的基础计算题20分必考 数据分组:就是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征及变动规律。变量:离散变量和连续变量分组:单项分组和组距分组。 变量数列的概念:在对变量取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成的数列,成为变量数列 两因素组成:一个是由不同变量值所划分的组,称为组别。各组变量出现的次数,称为频数。各组次数与总次数之比,成为频率。 编制组距:1.确定组数2.确定组距3.确定组限4.计算各组的次数(频数)5.编制变量数列向上累计频数具体做法是:由变量值低的组向变量值高的组依次累计频数。向下:相反 分布中心的测度 分布中心:是指距离一个变量的所有取值最近的位置。揭示变量的分布中心有着十分重要的意义。首先,变量的分布中心是变量取值的一个代表,可以用来反映其取值的一般水平。一个变量往往有许多个不同的取值,假若要用一个数值作为他们的代表,反映其一般水平,分布中心值无疑是一个最合适的数值。其次,变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来反映变量分布密度曲线的中心位置,即对称中心或尖峰位置。 分布中心指标:1算数平均数,2中位数,3众数 算数平均数需注意问题:1.算数平均数容易受到极端变量值的影响 2.权数对平均数大小起着权衡轻重的作用3.根据组距数列求加权算术平均时,需用组中值作为各组变量值的代表

算数平均中位数众数概念:1.算数平均又称均值,它是一组变量值的总和与其变量值的个数总和的比值。 2.是指将某一变量的变量值按照从小到大的顺序排成一列。位于这列数中心位置上的那个变量值。3.是指某一变量的全部取值中出现次数最多的那个变量值。 离散程度的测定 离散程度:还需要进一步考察其各个取值的离散程度即差异程度的大小。首先,通过对变量取值之间离散程度的测定可以反映各个变量值之间的差异大小。其次,通过对变量取值之间离散程度的测定可以反映变量次数分布密度曲线的形状。 离散程度测定指标:1极差,2四分位全距,3平均差,4标准差,5极差,6变异系数 概念:1.极差又称全距,是指一组变量值中最大变量值与最小变量值之差。2.是指将一组由小到大排列的变量数列分成四等分,QI-Q3所得差的绝对值。3.是变量各个取值偏差绝对值的算数平均数。4是变量的各个取值偏差平方的平均数的平方根。5标准差的平方。6.变异系数主要用于不同变量的各自取值之间差异程度的比较。 相关系数:是两变量的协方差与他们标准差之积的比率。它是专门用来测定两个变量线性相关方向和程度的一个指标。1.取值-1和1之间 2.<0 x与y负相关 3.>0正相关 4.=0 不存在线性相关关系 5.-1 完全负相关 6.1完全正相关 7.≈0 相关关系越弱 8.≈-1或1 相关关系越强 协方差:是两个变量的所有取值与其算数平均数离差乘积的算数平均数,可以用来测定两变量之间相关关系的方向和密切程度

计算流体力学常用数值方法简介[1]

计算流体力学常用数值方法简介 李志印 熊小辉 吴家鸣 (华南理工大学交通学院) 关键词 计算流体力学 数值计算 一 前 言 任何流体运动的动力学特征都是由质量守恒、动量守恒和能量守恒定律所确定的,这些基本定律可以由流体流动的控制方程组来描述。利用数值方法通过计算机求解描述流体运动的控制方程,揭示流体运动的物理规律,研究流体运动的时一空物理特征,这样的学科称为计算流体力学。 计算流体力学是一门由多领域交叉而形成的一门应用基础学科,它涉及流体力学理论、计算机技术、偏微分方程的数学理论、数值方法等学科。一般认为计算流体力学是从20世纪60年代中后期逐步发展起来的,大致经历了四个发展阶段:无粘性线性、无粘性非线性、雷诺平均的N-S方程以及完全的N-S方程。随着计算机技术、网络技术、计算方法和后处理技术的迅速发展,利用计算流体力学解决流动问题的能力越来越高,现在许多复杂的流动问题可以通过数值计算手段进行分析并给出相应的结果。 经过40年来的发展,计算流体力学己经成为一种有力的数值实验与设计手段,在许多工业领域如航天航空、汽车、船舶等部门解决了大量的工程设计实际问题,其中在航天航空领域所取得的成绩尤为显著。现在人们已经可以利用计算流体力学方法来设计飞机的外形,确定其气动载荷,从而有效地提高了设计效率,减少了风洞试验次数,大大地降低了设计成本。此外,计算流体力学也己经大量应用于大气、生态环境、车辆工程、船舶工程、传热以及工业中的化学反应等各个领域,显示了计算流体力学强大的生命力。 随着计算机技术的发展和所需要解决的工程问题的复杂性的增加,计算流体力学也己经发展成为以数值手段求解流体力学物理模型、分析其流动机理为主线,包括计算机技术、计算方法、网格技术和可视化后处理技术等多种技术的综合体。目前计算流体力学主要向二个方向发展:一方面是研究流动非定常稳定性以及湍流流动机理,开展高精度、高分辩率的计算方法和并行算法等的流动机理与算法研究;另一方面是将计算流体力学直接应用于模拟各种实际流动,解决工业生产中的各种问题。 二 计算流体力学常用数值方法 流体力学数值方法有很多种,其数学原理各不相同,但有二点是所有方法都具备的,即离散化和代数化。总的来说其基本思想是:将原来连续的求解区域划分成网格或单元子区

数量分析方法模拟试题一

商务统计方法模拟试题一 一、判断题 1.一般的统计分析人员和SPSS初学者适合采用程序运行方式。() 2.在定义数据结构时,每个变量都要定义变量值标签。() 3.在定义SPSS变量名时,变量名可以以数字开头。() 4.利用SPSS进行数据分析的首要任务是明确数据分析目标。() 5.在SPSS中,只有取值是数字的才是变量。() 6、峰度系数等于3,说明数据分布与标准正态分布相同。() 7、比率分析只适用于定距型变量。() 8、进行单样本参数检验时,要求样本来自的总体服从或近似服从正态分布。() 9、若两变量间的相关系数为0,则说明这两个变量不存在相关关系。() 10、多对变量两两之间的相关关系可以用重叠散点图展现。() 二、单项选择题 1. SPSS数据文件默认的扩展名() A、.sps B、.spo C、.sav D、.rtf 2. 面对100份调查问卷,在进行SPSS数据输入时,应采用() A、原始数据的组织方式 B、计数数据的组织形式 3. 下列内容中,不属于SPSS数据结构的是() A、变量名 B、对齐方式 C、字体大小 D、缺失值 4. 在定义数据结构时,默认的数据类型是() A、标准数值型 B、用户自定义型 C、字符型 D、日期型 5. “民族”这个变量属于() A、定类型变量 B、定序型变量 C、定距型变量 6. 欲将“性别”变量的变量值规定为“1为男,2为女”,应在哪进行设置() A、Name B、Label C、Values D、Missing 7. 欲插入一个个案,应选择的一级菜单是() A、File B、Edit C、View D、Data 8. 在横向合并时,[Excluded Variables]框中的变量是() A、两个待合并的数据文件中的所有变量 B、合并后新的数据文件中包括的变量 C、合并后新的数据文件中不包括的变量 D、第二个待合并的数据文件中的变量 9. 进行数据排序,应选择的菜单是() A、[Data]-[Go to case] B、[ Edit ]-[Go to case] C、[Data]-[ Sort Cases ] D、[ Edit ]-[Sort Cases ] 10. Sd(高数,英语,哲学)的功能是() A、计算三门课程成绩的平均分 B、计算三门课程成绩的标准差 C、计算三门课程成绩的方差 D、计算三门课程成绩的总分 11. 希望从全部231个个案中随机选出32个个案,应采用的选取方式是() A、指定条件选取 B、近似选取 C、精确选取 D、过滤变量选取

数值分析常用的插值方法

数值分析 报告 班级: 专业: 流水号: 学号: 姓名:

常用的插值方法 序言 在离散数据的基础上补插连续函数,使得这条连续曲线通过全部给定的离散数据点。插值是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值。 早在6世纪,中国的刘焯已将等距二次插值用于天文计算。17世纪之后,牛顿、拉格朗日分别讨论了等距和非等距的一般插值公式。在近代,插值法仍然是数据处理和编制函数表的常用工具,又是数值积分、数值微分、非线性方程求根和微分方程数值解法的重要基础,许多求解计算公式都是以插值为基础导出的。 插值问题的提法是:假定区间[a,b〕上的实值函数f(x)在该区间上 n+1 个互不相同点x 0,x 1 (x) n 处的值是f(x ),……f(x n ),要求估算f(x)在[a,b〕 中某点的值。其做法是:在事先选定的一个由简单函数构成的有n+1个参数C , C 1,……C n 的函数类Φ(C ,C 1 ,……C n )中求出满足条件P(x i )=f(x i )(i=0,1,…… n)的函数P(x),并以P(x)作为f(x)的估值。此处f(x)称为被插值函数,x 0,x 1 ,……xn 称为插值结(节)点,Φ(C 0,C 1 ,……C n )称为插值函数类,上面等式称为插值条件, Φ(C 0,……C n )中满足上式的函数称为插值函数,R(x)= f(x)-P(x)称为 插值余项。

求解这类问题,它有很多种插值法,其中以拉格朗日(Lagrange)插值和牛顿(Newton)插值为代表的多项式插值最有特点,常用的插值还有Hermit 插值,分段插值和样条插值。 一.拉格朗日插值 1.问题提出: 已知函数()y f x =在n+1个点01,, ,n x x x 上的函数值01,, ,n y y y ,求任意一点 x '的函数值()f x '。 说明:函数()y f x =可能是未知的;也可能是已知的,但它比较复杂,很难计算其函数值()f x '。 2.解决方法: 构造一个n 次代数多项式函数()n P x 来替代未知(或复杂)函数()y f x =,则 用()n P x '作为函数值()f x '的近似值。 设()2012n n n P x a a x a x a x =+++ +,构造()n P x 即是确定n+1个多项式的系数 012,,,,n a a a a 。 3.构造()n P x 的依据: 当多项式函数()n P x 也同时过已知的n+1个点时,我们可以认为多项式函数 ()n P x 逼近于原来的函数()f x 。根据这个条件,可以写出非齐次线性方程组: 20102000 201121112012n n n n n n n n n n a a x a x a x y a a x a x a x y a a x a x a x y ?+++ +=?++++=??? ?+++ +=? 其系数矩阵的行列式D 为范德萌行列式: () 200021110 2 111n n i j n i j n n n n x x x x x x D x x x x x ≥>≥= = -∏

CFA一级笔记-第二部分 数量分析方法

CFA一级考试知识点 第二部分数量分析方法 名义利率等于实际利率加上预期通货膨胀率,而不是当期的实际通货膨胀率。 Holding period return,HPR持有期收益率 Bank discount yield,BDY银行贴现利率,本金为F,价格为P,公式:* Money market yield,MMY货币市场收益率* Effective yield,EAY有效年利率(1+HPY)^365/t-1 Money-weighted rate of return,MWR货币加权收益率(内部收益率) Time-weighted rate of return,TWR时间加权收益率(几个收益期间的几何平均) Bond equivalent yield,BEY债券等价收益率(irr的年化) 货币加权受现金流入流出影响,因此时间加权更加广泛 四种度量衡:名义尺度nominal scale(分类不排序)、排序尺度ordinal scale(排序进行比较,不能够加减,有优先次级,不成比例)、区间尺度interval scale(温度、评分,零不具备数学意义)、比例尺度ratio scale(常用最高级、身高、收入、资产收益率) 算术平均arithmetic mean:相加后除以数据 几何平均geometric mean:可以排除算术平均的极端值,相乘后开次方。计

算多期平均价收益率 调和平均harmonic mean:用于计算定投平均成本N/,3期1元定投价格X1、X2、X3,总共3元买入了 份股票,调和平均成本即为3/ 调和平均≤几何平均≤算术平均,等号成立只有X1=X2=X3时 加权平均weighted mean:加入资产比重计算 分位数L =(N+1)Y/100,N是样本数、Y是分位数位置数:四分位、五分位。 总体方差variance:开根号后即为总体标准差standard deviation。 样本方差:开根号后即为样本标准差。 以上公式用于衡量收入偏离均值的平均距离值。 变异系数coefficient of variation:CV=S/X平均值,样本标准差除以样本均值。用于对比不同资产(农业银行股份、茅台股份),一单位均值收益率承受的风险,系数越低越好。 对比两家公司的例题出现标准差、平均值时使用。 夏普比例,资产收益率-无风险收益率,除以总体标准差,用于衡量资产P在单位风险下的差额收益,比例越大越好。

16种统计分析方法-统计分析方法有多少种

16种常用的数据分析方法汇总 2015-11-10分类:数据分析评论(0) 经常会有朋友问到一个朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用的数据分析方法,供大家参考学习。 一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:易9除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前 需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W 检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A单样本t检验:推断该样本来自的总体均数卩与已知的某一总体均数卩0常为理论值或标准值)有无差别; B配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。

适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的 A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10 以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。 四、列联表分析 用于分析离散变量或定型变量之间是否存在相关。对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel 分层分析。 列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。 五、相关分析 研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 1、单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量; 2、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关; 3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。 六、方差分析 使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。 分类1、单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时, 只分析一个因素与响应变量的关系2、多因素有交互方差分析:一顼实验有多个影响

议论文中常用的分析方法

议论文中常用的分析方法 一、知识讲解 议论文是作者对某个问题或某件事进行分析、评论,表明自己立场、态度、看法和主张的文体,议论文讲求的是摆事实、讲道理的“证明过程”,作者的观点能否得到读者的信服,很大程度上取决于作者是否善于分析。下面,我们就给大家介绍议论文中常用的几种分析方法。 1.归纳分析 归纳分析,是指由个别到一般的分析。它通过分析个别的实例,从而归纳出它们所共有的特性,得出一般性的结论。有这么个传说:有位师傅,想考一下自己的两个徒弟。他给了两个徒弟每人一箩花生,让他们剥开花生,看看花生仁是不是都有粉衣包着。大徒弟不加思索,急忙走到箩筐前,抓起花生,一个一个地剥了起来。小徒弟则不然,他想了一会儿,找到了解决这个问题的一个好办法。他先挑选了几个饱满的和不饱满的花生,又挑选了几个单仁的、双仁的和仨仁的花生,再挑选几个大的和小的花生,合在一起也就是十几个花生。不一会儿,他就把这些花生剥完了。他发现这几种不同类型的花生都有粉衣包着,于是,他认为这一箩花生的仁都有粉衣包着。大徒弟忙了一天,才把一箩花生剥完,结果发现这一箩花生的仁都有粉衣包着。尽管徒弟二人都得出了相同的结论,可是,从两人解决问题的方法上,师傅不难看出到底哪一位徒弟更聪明。 在这个传说中,徒弟二人都用了一种叫做归纳的逻辑方法。大徒弟之

所以不如师弟解决问题快,只不过大徒弟采用的是完全归纳法,而小徒弟采用的是不完全归纳法。作文中使用归纳分析法,应采用不完全归纳,一般只需列举三四个实例。至于用来归纳的事实,叙述时可灵活掌握。既可先举事例,再归纳结论;也可先提出结论,再做举例分析。 2、演绎分析 演绎分析,是指由一般到个别的分析。它由一般性原理出发,作出个别性的论断。在分析中,普遍性原理是依据,而个别性论断是论点。演绎分析反映了论据与论点之间由一般到个别的逻辑关系。比如,我们可以根据“凡生命力顽强的事物,都可以在逆境中得到种群的进化”(优胜劣汰),得出“人类不能太追求安逸享受,而使人类素质降低”的观点,这里运用的就是演绎分析法。演绎分析用到作文中,往往能使论述的逻辑性大大增强。比如,在以书信体(比如写给同学),写作“诚信”话题作文时,就可以先提出自己的观点“健全的人格,离不开诚信”(亦可举出若干实例),继而做出“你应该勇于承认撒谎的过错,以使自己的人格不滑坡”的结论。此为演绎分析。 3、归谬分析 上面讲到的归纳分析和演绎分析多用于立论文章中。对于驳论文章,“归谬法”往往更容易出奇制胜。归谬分析,不是直接分析对方观点如何错误,而是顺水推舟,按照对方的逻辑和思路推导出一个明显荒谬的结论,使其论点不攻自破。在分析中巧妙地运用这一方法,不但能一矢中的,增强论辩的说服力,而且能形成强烈的讽刺,使话语风

常用相关分析方法及其计算.doc

二、常用相关分析方法及其计算 在教育与心理研究实践中,常用的相关分析方法有积差相关法、等级相关法、质量相关法,分述如下。 (一)积差相关系数 1. 积差相关系数又称积矩相关系数,是英国统计学家皮尔逊(Pearson)提 出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。 积差相关系数记作r,其计算公式为 XY n ( x X i )( y Y i ) r XY n i ( 1 x i n 2 X ) ( y i Y 2 ) (2-20) i 1 i 1 式中x i 、y i 、X 、Y 、n 的意义均同前所述。 若记x x i X , y y i Y ,则(2-20)式成为 xy r (2-21) XY nS S X Y 式中 xy n 称为协方差, xy n 的绝对值大小直观地反映了两列变量的一致性程 度。然而,由于X 变量与Y 变量具有不同测量单位,不能直接用它们的协方差xy 来表示两列变量的一致性,所以将各变量的离均差分别用各自的标准差n 除,使之成为没有实际单位的标准分数,然后再求其协方差。即: xy 1 x y r ( ) ( XY S nS S n S X Y X Y ) 1 n Z X Z (2-22) Y 这样,两列具有不同测两单位的变量的一致性就可以测量计算。 计算积差相关系数要求变量符合以下条件:(1)两列变量都是等距的或等比的测量数据;(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布;(3)两列变量必须具备一一对应关系。 2. 积差相关系数的计算

利用公式(2-20)计算相关系数,应先求两列变量各自的平均数与标准差,再 1

数量分析方法模拟试题三答案

基础课程教学资料 祝福您及家人身体健康、万事如意、阖家欢乐!祝福同学们快乐成长,能够取得好成 绩,为祖国奉献力量 数量分析方法模拟试题三 答案 一、判断题 1、定义数据结构是在数据视窗中进行的。 ( X ) 2、在进行二项分布检验时,要求检验变量必须是二值变量。 ( X ) 3、 Kendall 相关系数适用于度量定类变量间的线性相关关系。 ( X ) 4、非参数检验要求样本来自的总体服从或近似服从正态分布。 ( X ) 5、配对样本中个案个数一定是相同的。 ( V ) 6、在 SPSS 数据文件中,一行代表一个个案( case )。 ( X ) 7、单样本 t 检验也可用于对总体比率进行检验。 ( V ) 8、在进行方差分析时,若总方差主要是由组内方差引起的,则会拒绝原假设。 ( X ) 9、二值变量序列中, 游程数最小为 1. ( X ) 10、变量值越大, 对应的秩就会越小。 ( X ) 二、单项选择题 1. SPSS 的主程序窗口是( A ) A 、数据编辑窗口 B 、结果输出窗口 C 、语句窗口 D 、命令窗口 2. SPSS 输出结果默认的文件扩展名是( B ) A 、 .sps B 、 .spv C 、 .sav D 、 .rtf 3. 在SPSS 的运行方式中,最常见,对初学者最适用的方式是( B ) A 、程序运行方式 B 、完全窗口菜单方式 C 、混合运行方式 D 、联机帮助方式 4. 下列内容中,不属于 SPSS 数据结构的是( C ) A 、变量名 B 、对齐方式 C 、字体大小 D 、缺失值 5. 在定义数据结构时,默认的数据类型是( A ) A 、标准数值型 B 、用户自定义型 C 、字符型 D 、日期型 6. 欲将“性别”变量的变量值规定为“ 1 为男, 2为女”,应在哪进行设置( C ) A 、 Name B 、 Label C 、 Values D 、 Missing 7. 欲插入一个个案,应选择的一级菜单是( B ) A 、 File B 、 Edit C 、 View D 、 Data 8. “合并”应选择的二级菜单是( C ) C 、 Merge Files D 、 Aggregate ) 12. 分类汇总中,默认计算的是各分类组的( A ) A 、 Insert Cases B 、 Insert Variable 9. 进行数据排序,应选择的菜单是( C A 、 [Data] -[Go to case] C 、 [Data] - [ Sort Cases ] 10. S d (高数,英语,哲学)的功能是( A 、计算三门课程成绩的平均分 C 、计算三门课程成绩的方差 11. 希望从全部 231 个个案中随机选出 A 、指定条件选取 B 、近似选取 B 、 [ Edit ] -[Go to case] D 、 [ Edit ] -[Sort Cases ] B ) B 、计算三门课程成绩的标准差 D 、计算三门课程成绩的总分 32 个个案,应采用的选取方式是( C ) C 、精确选取 D 、过滤变量选取

结构动力学中的常用数值方法

第五章 结构动力学中的常用数值方法 5.1.结构动力响应的数值算法 ... . 0()(0)(0)M x c x kx F t x a x v ? ++=??=??=?? 当c 为比例阻尼、线性问题→模态叠加最常用。但当C 无法解耦,有非线性存在,有 冲击作用(激起高阶模态,此时模态叠加法中的高阶模态不可以忽略)。此时就要借助数值积分方法,在结构动力学问题中,有一类方法称为直接积分方法最为常用。所识直接是为模态叠加法相对照来说,模态叠加法在求解之前,需要对原方程进行解耦处理,而本节的方法不用作解耦的处理,直接求解。(由以力学,工程中的力学问题为主要研究对象的学者发展出来的) 中心差分法的解题步骤 1. 初始值计算 (1) 形成刚度矩阵K ,质量矩阵M 和阻尼矩阵C 。 (2) 定初始值0x ,. 0x ,.. 0x 。 (3) 选择时间步长t ?,使它满足cr t t ?

常用的分析方法

市场营销分析法-SWOT,PEST,Five Forces 介绍 市场营销环境 什么是市场营销环境 市场营销环境包围公司并影响公司。关于市场营销环境存在三个关键的观点:宏观环境(macro-environment)、微观环境(micro-environment)、内部环境(internal environment)。 微观环境 微观环境对公司产生直接影响。它包括产生直接或间接交易的供应商,消费者与顾客,以及其他少数股东。微观意为少数,但是少数并不表示不重要。本文中微观的意思是公司之间的关系以及控制这种关系的动力。这是一种局部关系,公司可以行使一定程度的影响力。 宏观环境 宏观环境指的是能够间接影响公司的所有因素。一般来说,一家公司并不能对法律产生任何影响(虽然通常意义上公司可以对立法机关进行游说,也可以成立相关的贸易组织)。市场在不断的变化,公司也需要随之而改变,同时也必须注意激烈的市场竞争。全球化意味着替代产品与新兴公司的不断涌现从而产生威胁。更广义的环境也在不停地发生变化,从事市场营销的人员必须适应文化、政治、经济与科技带来的各种变化。

内部环境 所有从内部影响公司的因素都称之为“内部环境”。内部环境可以归纳为“五个M”:员工、资金、设备、原料、市场。对于应对市场变化而言,内部环境和外部环境同样重要。作为市场营销人员,我们把应对市场变化的过程称为“内部市场营销”。 基本上我们通过使用市场营销的方法来促进沟通与改善管理。 外部环境通过是一能够其他方法来监测,例如SWOT Analysis, Michael Porter…s Five Forces Analysis或者PEST Analysis。 SWOT 分析法 优势(S trengths)、劣势(Weaknesses)、机会(Qpportunities)、 威胁(Threats) SWOT分析法是一种用于检测公司运营与公司环境的工具。这是编制计划的首要步骤,它 能够帮助市场营销人员将精力集中在关键问题上。SWOT的每个字母分别表示优势、劣势、机会与威胁。优势和劣势是内在要素,机会与威胁则是外在要素。 在页面的底部你可以免费查看关于SWOT的案例。 在SWOT分析法中,优势和劣势指的是内部要素,具体如下: 优势: ?市场营销的资深阅历。 ?一种创新的产品或服务。 ?营业场所。 ?质量工序与品质程序。 ?其他能对产品与服务产生增值效应的方面。 劣势: ?缺乏市场营销经验。 ?产品或服务同质化。 ?营业场所。 ?劣质产品或服务。

相关文档
最新文档