管理学研究方法论第五讲:基本统计、相关分析、因果关系、回归分析严鸣所有材料禁止上传到网络或与课堂外人员分享!Mean 平均()E x 我很满意我的工作 1 2 3 4 5期望值Expected valuex?Minimum errorMean 平均_1()nii xx E x n===∑x x 1x 2x 3我很满意我的工作 1 2 3 4 5平均数期望值Expected valuexn ‚ƒo •m Minimum errorVariance 方差(变异)()22221()[()]nii i i x x E x E x nσ=−==−∑方差是数据一般与「平均数」的距离的平方;Variance is the “average squared deviation from the mean.”(平均「差」的平方)()1x x −()2xx−x x 1x 2平均数(正数)(负数)Standard Deviation 标准差(均方差)σ=衡量基金波动程度的工具就是标准差。
标准差是指基金可能的变动程度。
标准差越大,基金未来净值可能变动的程度就越大,稳定度就越小,风险就越高。
A基金二年期的收益率为36%,标准差为18%;B基金二年期收益率为24%,标准差为8%,从数据上看,A基金的收益高于B基金,但同时风险也大于B基金。
A基金的"每单位风险收益率"为2(0.36/0.18),而B基金为3(0.24/0.08)。
因此,原先仅仅以收益评价是A基金较优,但是经过标准差即风险因素调整后,B基金反而更为优异。
Standardization 标准化_i i x x z σ−=我很满意我的工作 1 2 3 4 5我很满意我的工作 1 2 3 4 567我很满意我的工作 1 2 3 4 56789and Standardization by SPSSand Standardization by SPSSCovariance 协方差(共变)()221nii x x nσ=−=∑()()1niii xy x x y y nσ=−−=∑如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。
如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果两个变量是完全统计独立的,那么二者之间的协方差就是0The problem of covariance()()1niii xy x x y y nσ=−−=∑()()1niixy i x yx x y y σσσ=−−=∑我很满意我的工作 1 2 3 4 5我很满意我的工作 1 2 3 4 5 6 7Standardization 标准化_i i x x z σ−=我很满意我的工作 1 2 3 4 5我很满意我的工作 1 2 3 4 567我很满意我的工作 1 2 3 4 56789The correlation coefficienty_y iyx xy σσσCorrelation•A relationship between two variables suchthat•changes in one are associated with changesin the other•particular attributes of one variable areassociated with particular attributes of theother.•Correlation in and of itself does not constitutea causal relationship between the twovariables, but it is one criterion of causality.大量的相关性是被创造与灌输出来的•广告的力量•怕上火喝王老吉•今年过节不收礼,收礼只收脑白金•这十年买房,你去打听打听谁没赚钱•……•书本的力量•货币战争•把吃出来的病吃回去•……14xyXYr xy = 0 only when(1)X cannot predict Y at all; or (2)For each unit change in X, the change in Y can be anythingxyXYIn both cases, R xy = 1.0 because (1)X can predict Y perfectly; or (2)For each unit change in X, thechange in Y is constantWhich one has a higher correlation, blue or green ?The First Table in Your Paper•“选举日的前夕若是满月,则能够促进自由派的投票”•命题的构成•自变量、因变量•是有理性的判断么?•有无证据将两个事件联系起来•两者之间有无逻辑上的关联21•在两个没有因果关系的事件之间,基于一些其他未见的因素,推断出因果关系。
这会引致“两个事件是有所联系”的假象,但这种联系并不能通过客观的试验。
•冰激凌销售量和溺水死亡人数正相关•季节•一个地区内的骡子数和博士数量负相关•乡村与城市•火灾现场的消防车数量与火灾所导致的损失量正相关•火势大小Example of a Spurious Causal Relationship•原因和结果是揭示客观世界中普遍联系着的事物具有先后相继、彼此制约的一对范畴。
原因是指引起一定现象的现象,结果是指由于原因的作用,缘之串联而引起的现象。
•在时间上,先有因,后有果•两者之间有真实的相关性•该相关性不因为第三者的变化而产生变化24•必要原因,是指现象Y的发生(变化)一定以现象X的发生(变化)为前提。
换言之,如果X不存在,那么Y必定不会存在。
•一旦不存在氧, 也就不存在燃烧•充分原因,是指现象X的发生(变化)一定会导致现象Y的发生(变化)。
换言之,对于一个现象Y, 很可能有不同的充分原因(X1 、X2 、X3 ..)的存在导致这一现象的发生。
•心肌梗死、遭受致命车祸、中毒, 等等, 均可看作是导致一个人死亡的充分原因25•组合式非唯一充分原因。
对一组可以用来解释结果的解释原因而言, 所有这些因素可以划归为若干子原因组, 其中每一个子原因都可以构成导致结果的充分原因, 而构成这些子原因的因素本身, 对其所在的子原因而言都可以看作是构成它的必要而不是充分原因。
26工作绩效上司排挤人际技巧道德感工作绩效员工上司•直接原因是不经过其他因素而直接会导致结果发生的原因•间接原因是直接原因的原因。
•中国长城的修建导致罗马帝国的衰亡。
•长城的存在阻挡了匈奴人南下,被迫退到了漠北无水草之地,开始走下坡路。
西汉末期分裂为南北二部,不久南匈奴归附汉朝,汉朝与南匈奴联手大败北匈奴。
北匈奴受此重大打击,被迫西迁。
到了欧洲占领了日耳曼人的地盘,日耳曼人被迫南下,最终冲破了罗马帝国的防御, 导致后者衰亡。
•来自日耳曼人的进攻是罗马帝国崩溃的直接原因,而中国长城的修建则是间接原因。
27•事件的发生完全是非随机性的结果,如果方法得当, 那么世界几乎是可以完全预测的。
•但实际上, 有大量的因果关系并不是完全按照确定性的方式表现出来, 而是以一种非确定性(类似回归模型)的方式表现出来的。
28Multiple Regression Analysis Y = β0+ β1X1+ …+ βn X n+ ε^Y = b0+ b1X1+ … + b n X nThe idea of regression XY Organizationalcommitment Turnover intentionHow can werepresent therelationshipbetween X and Y?The prediction problemXY(,)x y (,')x y 'y y −yxOrganizational commitmentTurnover intention$yyThe prediction problem•Min Σ (y –y ’) •Min Σ | y -y ’|•Min Σ ( y -y ’)2XY(,)x y (,')x y 'y y −Ordinary Lease Square (OLS)Criterion: OLSxy(x,y)y=3y=4^error = i y y∧−y=5x =3y∧LinearityTurnover intentionYXGeneral Mental AbilityTurnover intentionYXGeneral Mental AbilityXYOrganizational commitmentTurnover intentionY = a X 2 + b X + cQuadratic termsTurnover intentionYY = a X2 + b X + cXOrganizationalcommitmentHierarchical regression•Blockwise regression, Not stepwise regression, which is:εββ++=∑=10i i i X Y X 1X 2X 3X 4Forward: start with X 1, then enter X 2, ……Backward: start with all variables, then remove X 1, then remove X 2, ……Table1. Y=performanceM 0M 1M 2M 3β∆R 2β∆R 2β∆R 2β∆R 2Age -.21-.02.00.01Gender .88.09.10.08Edu -.51-.06-.06-.05Tenure.08.01.08.08.08Loyalty to sup .31**.32** .28**Trust in sup -.11.07**-.11-.13Neuroticism .06.09Extraversion -.04-.06openness.03.01Agreeableness .11.12Conscientiousness .04.02.04Emotional Intelligence.19*.03*Baseline model with control variables onlyChange in R 2after adding in twopredictorsRun Regression by SPSSRun Regression by SPSSThe SPSS output。