实证研究-5. 基本统计、相关分析、回归分析

管理学研究方法论

第五讲:基本统计、相关分析、因果关系、回归分析

严鸣

所有材料禁止上传到网络或与课堂外人员分享!

Mean 平均

()

E x 我很满意我的工作 1 2 3 4 5

期望值

Expected value

x

?

Minimum error

Mean 平均

_

1

()

n

i

i x

x E x n

==

=∑x x 1

x 2

x 3我很满意我的工作 1 2 3 4 5

平均数

期望值Expected value

x

n ??o ?

m Minimum error

Variance 方差(变异)

()

2

2

22

1

()[()]

n

i

i i i x x E x E x n

σ=?=

=?∑方差是数据一般与「平均数」的距离的平方;Variance is the “average squared deviation from the mean.”(平均「差」的平方)

()1

x x ?()2

x

x

?x x 1

x 2

平均数

(正数)

(负数)

Standard Deviation 标准差(均方差)

σ=衡量基金波动程度的工具就是标准差。标准差是指基金可能的变动程度。标准差越大,基金未来净值可能变动的程度就越大,稳定度就越小,风险就越高。

A基金二年期的收益率为36%,标准差为18%;B基金二年期收益率为24%,标准差为8%,从数据上看,A基金的收益高于B基金,但同时风险也大于B基金。

A基金的"每单位风险收益率"为

2(0.36/0.18),而B基金为3(0.24/0.08)。因此,原先仅仅以收益评价是A基金较优,但是经过标准差即风险因素调整后,B基金反而更为优异。

Standardization 标准化

_

i i x x z σ

?=

我很满意我的工作 1 2 3 4 5

我很满意我的工作 1 2 3 4 567

我很满意我的工作 1 2 3 4 56789

and Standardization by SPSS

and Standardization by SPSS

Covariance 协方差(共变)

()

2

2

1

n

i

i x x n

σ=?=

∑()()

1

n

i

i

i xy x x y y n

σ=??=

∑如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。

如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。如果两个变量是完全统计独立的,那么二者之间的协方差就是0

The problem of covariance

()()

1

n

i

i

i xy x x y y n

σ=??=

∑()()

1

n

i

i

xy i x y

x x y y σσσ=??=

∑我很满意我的工作 1 2 3 4 5我很满意我的工作 1 2 3 4 5 6 7

Standardization 标准化

_

i i x x z σ

?=

我很满意我的工作 1 2 3 4 5

我很满意我的工作 1 2 3 4 567

我很满意我的工作 1 2 3 4 56789

The correlation coefficient

y

_y i

y

x xy σσσ

Correlation

?A relationship between two variables such

that

?changes in one are associated with changes

in the other

?particular attributes of one variable are

associated with particular attributes of the

other.

?Correlation in and of itself does not constitute

a causal relationship between the two

variables, but it is one criterion of causality.

大量的相关性是被创造与灌输出来的

?广告的力量

?怕上火喝王老吉

?今年过节不收礼,收礼只收脑白金

?这十年买房,你去打听打听谁没赚钱

?……

?书本的力量

?货币战争

?把吃出来的病吃回去

?……

14

xy

X

Y

r xy = 0 only when

(1)X cannot predict Y at all; or (2)For each unit change in X, the change in Y can be anything

xy

X

Y

In both cases, R xy = 1.0 because (1)X can predict Y perfectly; or (2)For each unit change in X, the

change in Y is constant

Which one has a higher correlation, blue or green ?

The First Table in Your Paper

相关主题
相关文档
最新文档