当前位置：文档之家› 回归分析及进阶分析多元回归与结构方程模型

回归分析及进阶分析多元回归与结构方程模型

可以证明，在一元线性回归条件下，ESS和 RSS分别服从自由度为 1和 n-2 的卡方分布

H0：B2＝B3＝0

等同于零假设H0：R2=0
这个假设表明两个解释变量一起对应变量Y无影响，
这是对估计的总体回归直线的显著性检验。
Note：书上的写反了。
如果分子比分母大，也即Y被回归解释的部分比未被回归解释的部分大，F值越大，说明解释变量对应变量Y的变动的解释的比例逐渐增大，就越有理由拒绝零假设。
年龄是否影响智商（IQ）
◦ 定量---定量
年龄是否影响对电脑品牌的选择
◦ 定量---定性
性别是否影响对电脑品牌的选择
◦ 定性---定性
。。。。。。
考虑家庭月可支配收入如何影响消费支出。可支配收入 X（千元）消费支出 Y（千元）
假设样本为10，
为了拟合这样一条直线，需要某种准则。准则不同，
能大一些，样本量太小时，估计量的稳定性肯定不会很好。
拟合优度：
◦ 样本数据聚集在样本回归直线周围的密集程度，从而判断回归方程对样本数据的代表程度。
◦ 判定系数
回归方程的显著性检验：
◦ F检验
◦ 对因变量与所有自变量之间的线性关系是否显著的一种假设检验
回归系数的显著性检验
◦ 根据样本估计的结果对总体回归系数的有关假设进行检验 ◦ T检验
用样本回归直线与推断总体回归直线用一些指标来判断推断的是否合理（接近）
Байду номын сангаас 样本回归方程
求出参数
需要一个公式/准则：
◦ 所有观测点与直线的垂直距离
（称为残差
Residual）都尽可能地小，即让所有的观测点与直线的垂
直距离之和∑e为最小。
◦ 有些观测点在直线之下，因此有些e是正的，有些是负的。
每次回归的F值及其显著性每个自变量的系数，及其T检验的显著性判定系数判定系数的变化及其显著性
33
34
曲线检验——U形、倒U形中介与调节对曲线的调节作用曲线调节如何画调节效应图
36
因变量y
自变量x
37
曲线估计
◦ P.220
多元回归—2个以上的自变量
研究一个变量（被解释变量/因变量）对另一个或多个变量（解释变量/自变量）的依赖关系。变量之间的关系可分为线性关系和非线性关系。
因变量y
自变量x
x1
y2
y1
x2
y3
自变量x与因变量y皆为定量（定距变量、定比变量），而非定性（定类变量、定序变量）
如果要将定类、定序变量放入回归，须转化为虚拟变量（dummy variable）。如未转换，则有可能造成就对结果解释的偏误。
回归分析一元回归多元回归
回归分析是研究一个变量（被解释变量/因变量）对另一个或多个变量（解释变量/自变量）的依赖关系。变量之间的关系可分为线性关系和非线性关系。
在进行回归分析之前，要先分析变量之间是否存在线性相关关系，如果变量间不存在线性相关关系，则使用基于最小二乘法的回归分析所得的的结果是不可靠的。
相加后正负抵销，有可能总和∑e很小但是个别是的e还是
很大。为了克服这个问题，我们先将e平方使它们都变成
正的，然后再求和并使之变成最小，这就是所谓的“普通最小二乘法（OLS——Ordinary Least Squares）准则”
目标函数：min 变量：b0和b1
要想使 b0和 b1更稳定，在收集数据时，就应该考虑 X 的取值尽可能分散一些；样本容量也应尽可
期望：拒绝零假设，即，F检验要显著
当样本为小样本时，回归参数估计值的标准化变换变量并不遵循正态分布规律，而是服从自由度为
n-2 的ｔ分布
H0：B2＝0。 X对Y的影响为0 期望：拒绝零假设，要显著
如果 t 的绝对值大于临界值（或者 p<α），就拒绝原假设，接受备择假设，说明 X 对 Y具有显著的影响作用；反之，如果 t 的绝对值小于临界值的绝对值（或者 p>α），则接受原假设，说明 X 对Y 没有显著的影响
选择R square最大的函数式进行回归检验
◦ 曲线估计没能包括控制变量
38
加入自变量的二次项
◦ 中心化
跟据二次项的方向，判断是U形还是倒U形 Note:
◦ 仍要放入一次项
39
40
中介： Baron3步检验：
调节： 1. 整体模型的F检验 2. 交互项的系数的T检验 3. R Square change的显著性
自变量的中心化问题
43
加入自变量的二次项×调节变量
◦ 中心化
乘积项与二次项方向一致——加强——更陡 Note:
◦ 控制变量放入一次项与调节变量的乘积项
判定系数是对回归模型拟合程度的综合
度量，判定系数越大，模型拟合程度越
高。判定系数越小，则模型对样本的拟合程度越差。大于0，小于1
如果比例值 ESS/RSS 较大，说明 X 对 Y 的解释程
度高，可以认为总体存在线性关系，反之总体可能不存在线性关系。做利用这个值 ESS/RSS 进行推
断。由于对不同的样本，这个比值可能不同，因此对给定的样本，利用这个比值进行推断，必须在统计假设检验的基础上进行
实际观测值与理论回归值的离差
，它是不能由回归直线加以解释的残差ｅ
因变量的理论回归值与其样本均值的离差，它可以看成是能够由回归直线解释的部分，称为可解释
离差
平方，对所有的点求和，最终可得
总离差平方和（Total Sum of Squares）残差平方和(Residual Sum of Squares) 回归平方和(Explained Sum of Squares)
拟合的方法也就不同，拟合出来的直线就不一样。最常用的准则是普通最小二乘准则。
残差
可以计算
误差 •客观现象的随机性质 •测量误差
总体回归直线未知的
残差e——根据样本所拟合出来的直线上的y值与样本实际观测到的y之间的距离。这个值可以观测到。
误差E/Ksi——总体直线中，x与常数项不能解释的总体y的部分。不可观测。它来自随机性与测量误差。

e商务文档

回归分析及进阶分析多元回归与结构方程模型

相关文档推荐：