当前位置:文档之家› 统计学-回归分析

统计学-回归分析


中国改革开放
– 中国经济体制改革 – “中国经济进入中等发达国家水平” – 中国政治体制改革 – “我深知改革的难度,主要是任何一项改革必须 有人民的觉醒、人民的支持、人民的积极性和创 造精神。” --温家宝 – 中国半数人还处于文革状态,要么是缺乏理性的 文革战士,要么是逆来顺从的奴隶状态,基本不 懂现代社会的处事原则。—茅于轼 – “权利回归于人民,人民真正当家作主” – ”没有独裁专制,才有新中国“
∑(yi- y)2 =∑(yi- y^)2 +∑ (y^ - y)2
变异分解示意图
F值的构造
• SS总 = SS残差 + SS回归 • df总 = df残差 + df回归
• MS回归=SS回归/df回归 • MS残差 =SS残差 /df残差 • F= MS回归/ MS残差 • F值越大,越不利H0假设的成立。
---------------------------------------------------------
• 3 统计推断与决策 p<α ,拒绝H0 ; 回归方程有统计学意义 p>α ,不拒绝H0。回归方程无统计学意义
Regression Analsys
回归分析
童新元 中国人民解放军总医院
名人格言
• 纵使世界给我珍宝和荣誉,我也不愿 意离开我的祖国,因为纵使我的祖国 在耻辱之中,我还是喜欢,热爱,祝福 我的祖国。
---裴多菲(匈牙利诗人,1823—1849)
问题
• 能否由脂肪的含量推出热量的多少? • 知道父代身高,可否推测子代身高? • 回归方程解决由一个量变化推断另一量变化 的问题。

方差分析表 ---------------------------------------------------------y的变异来源 SS 回归方程 残差 总变异 DF MS F值 P
---------------------------------------------------------SS回归 1 MS回归 F=MS回归/Mse SSe n- 2 Mse SST n-1
• 这个例子说明了生物学中“种”的概念的 稳定性。正是为了描述这种有趣的现象, Galton引进了“回归”这个名词来描述父 辈身高与子代身高的关系。 • 大自然界很多物种都有 “回归”现象: • 大象、蚂蚁后代体重回归到其平均水平
人类社会的“回归”.
– 少小离家,老大归。。。 社会学…叶落归根 – 和谐社会 稳定--发展 – 贫富分化严重社会不稳定
回归直线与散点图的关系

b>0
b<0
b=0

b=0
b=0
b=0
4 ) 回归方程的检验
• 回归方程的抽样误差:
• 回归方程来自样本,存在抽样误差
回归方程的假设检验步骤:
• 1 建立假设:
H0:回归方程无统计学意义 H1:回归方程有统计学意义 α =0.05
2 变异的分解: 方差分析思想
yi- y = (yi - y^) + (y^ - y)
求解线性方程组,而得到最小二 乘估计系数b和a
参数的计算公式
• β 的估计:
• α 的估计:
计算结果
• a=33.73,b=0.516
• 回归方程:y^=33.73+0.516x
• 例 12-1 测定 16 种食物中的热量(卡路 里)和脂肪含量(克). • 试建立食物热量与脂肪含量之间的回 归方程.
计算结果 • a=36.0727,b=15.2584
• 回归方程:y^=36.0727+15.2584x
回归方程的基本含义
• 回归方程在坐标轴上的含义
• a:截距 b: 斜率称为回归系数。 • 回归系数b的意义: 回归系数b反映的是x每增加1个单位时y的增加幅度; b越大,x对y的影响幅度越大。
回归分析的数据基本格式
• 变量x 变量y x1 y1 x2 y2 . . . . . . xn yn
相关问题
• 回归分析的任务: 在平面上怎么找最佳的直线? • 实现的类似问题: 某地区有若干个房子, 现要修建一条直的公 路,怎样让大家都满意?
3) 参数的估计
• 回归方程: • 采用最小二乘法原理: • 所有实测点到回归直线的纵向距离平方之 和最小.
由父高推测子女身高的设想
• 影响子女身高y的因素: 基本生长规律、父母的身高x 个体差异(随机误差) • 问题的模型化:回归分析模型 子高=基本生长+父母高作用+个体差异
2) 回归方程
• 回归分析研究目的是由自变量的信息去推 断因变量,并用直线方程来表示它们的线 性关系。 • 直线回归方程的家Galton观察了1078对夫妇 与子女,分析他们的身高关系。 • 以每对夫妇的平均身高作为x,取他们的一个 成年儿子的身高作为y,将结果在平面直角坐 标系上绘成散点图,发现趋势近乎一条直线。
• 计算出的回归直线方程为:
• Y^=33.73+0.516x • 这种趋势及回归方程表明父母平均身高x每增 加一个单位时,其成年儿子的身高y也平均增 加0.516个单位。
• 低个子父辈的儿子们虽然仍为低个子, 平均身高却比他们的父辈增加了,即父 辈偏离中心的部分在子代被拉回来一些。
说明子代的平均身高没有比他们的父辈更低。
• 正因为子代的身高有回到父辈平均身高 的趋势,才使人类的身高在一定时间内 相对稳定,没有出现父辈个子高其子女 更高,父辈个子矮其子女更矮的两极分 化现象。
• 结果表明,虽然高个子父辈确实有生 高个子儿子的趋势,但父辈身高增加 一个单位,儿子身高仅增加半个单位 左右。 • 平均说来,一群高个子父辈的儿子们 的平均高度要低于他们父辈的平均高 度,他们儿子的身高没有比他们更高, 高个子父辈偏离其父辈平均身高的一 部分被其子代拉回来了,即子代的平 均身高向中心回归。
1) “回归”概念的来源
• “香港回归”, “澳门回归”…. • “回归”这一名词起源于19世纪生物学家和 统计学家F· Galton的遗传学研究。 • 问题:现实直观经验: • “通常都认为子女比父母的身高要高”。 这是人身的客观规律还是一种假象? • 如果这个趋势是客观规律话,人身高应该 是越来越高,早就超过了现在的水平。
相关主题