课程设计报告课程:应用回归分析学号:姓名:班级: 12金统教师:**江苏师范大学科文学院《应用回归分析》课程设计指导书一、课程设计的目的1. 加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握SPSS常用统计软件的应用。
2. 通过学习达到熟练掌握一元线性回归建模过程,熟悉一元线性回归建模步骤;掌握模型选择,参数估计,模型检验,模型优化和模型预测的方法。
3. 掌握诊断序列自相关性(或异方差性)的方法,并能给出消除自相关性(或异方差性)的方法。
4. 能够根据历史数据,对未来走势作出预测;可以处理一些简单的经济问题。
二、设计名称:检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。
三、设计要求1.数据来源要真实,必须注明数据的出处。
2.尽量使用计算机软件分析,说明算法或过程。
3.必须利用到应用回归分析的统计知识。
4.独立完成,不得有相同或相近的课程设计。
四、设计过程1.思考研究课题,准备搜集数据。
2.确立课题,利用图书馆、上网等方式方法搜集数据。
3.利用机房实验室等学校给予的便利措施开始分析处理数据。
4.根据试验结果,写出课程设计报告书。
5.对实验设计报告书进行完善,并最终定稿。
五、设计细则1.利用的统计学软件主要为SPSS,因为其方便快捷,功能也很强大,界面美观。
2.对Word文档进行编辑的时候,有些特殊的数学符号需要利用Mathtype这款小软件进行编辑。
3.数据来自较权威机构,增加分析的准确性与可靠性。
4.力求主题突出,观点鲜明,叙述简洁明了。
六、说明1.数据来源于江苏统计年鉴2013;2.所选取数据可能不会涉及到所学的各种分析方法,本课程设计最后会对此情况作出解释。
3.本课程设计中,取显著性水平为 =0.05,对于分析中需要用到的数据做加粗处理课程设计任务书设计名称:检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。
日期:2014年6月1日(1)画散点图(2)x 与y 之间是否大致呈线性关系 (3)用最小二乘估计求出回归方程(4)求回归标准误差σˆ (5)给出0ˆβ与1ˆβ的置信度为95%的区间估计 (6)计算x 与y 的决定系数 (7) 对回归方程作方差分析 (8)作回归系数0β,1β显著性分析 (9)做相关系数的显著性检验(10)用线性回归的plots 功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。
设计目的与要求:1.加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握SPSS 常用统计软件的应用。
2.通过学习达到熟练掌握一元线性回归建模过程,熟悉一元线性回归建模步骤;掌握模型选择,参数估计,模型检验,模型优化和模型预测的方法。
3. 掌握诊断序列相关性(或异方差性)的方法,并能给出消除自相关性(或异方差性)的方法。
设计环境或器材、原理与说明:设计环境器材:统计实验室、SPSS 软件、EXCEL 软件等 原理与说明:1、一元线性回归模型的一般形式设随机变量y 与一般变量x 的线性回归模型为y=01x ββε++0β称为回归常数,β称为回归系数。
ε是随机误差,我们常假定2()0var()E εεσ=⎧⎨=⎩ 2、F 检验对随机变量y 是否有明显的影响。
为此提出原假设01H 0β=:构造F 检验统计量如下/1/(2)SSR F SSE n =-在正态假设下,当原假设01H 0β=:成立时,F 服从自由度为(1,n-2)的F 分布。
3、t 检验t 检验是统计推断的一种方法,因此,检验回归系数是否显著,等价于检验假设111:0:0o H H ββ=≠如果接受原假设o H ,则x 不显著;如果拒绝原假设o H ,则x 是显著的。
在一元线性回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的。
4、拟合优度拟合优度用于检验回归方程对样本观测值的拟合程度。
样本决定系数2/r SSR SST =,样本决定系数2R 的取值在[0,1]区间内,2R 越接近1,表明回归拟合的效果越好;2R 越接近0,表明回归拟合的效果越差。
与F 检验相比,2R 可以更清楚直观地反映回归拟合的效果,但是并不能作为严格的显著性检验。
5、通过画散点图我们可以从中观察出样本变量间是否有线性关系 6、用普通最小二乘估计和最大似然估计可以对参数0β,1β进行估计7、关于残差图:一般认为,如果一个回归模型满足所给出的基本假定,所有残差是在ε=0附近随机变化,并在变化幅度不大的一条子带内。
若e 随x 的增大而减小,则为异方差。
6、消除异方差:一元加权最小二乘估计法:用自变量的幂函数的倒数形式作为权数对原模型进行加权:1m wixi设计过程(步骤)或程序代码:1.确定模型(1)散点图:图形---旧对话框---散点/点状(2)回归方程:分析---回归---线性2. 模型检验:(1)相关系数:分析---相关---双变量3. 残差检验:(1)散点图:图形---旧对话框---散点/点状4. 模型预测:(1)模型预测:分析—回归—线性—保存—预测—为标准化分析—回归—线性—统计量—保存—预测区间—均值5. 消除异方差:分析—回归—权重估计—因变量,自变量,将自变量输入权重变量,确定。
设计结果与分析:一,确定模型:一元线性回归是描述两个变量之间统计关系的最简单的回归模型。
拿到一组数据,在建立回归模型之前,通常先做出其散点图,直观地判断一下它们之间的数量关系,进而选择合适的理论回归模型。
(1)我们以农业产值为横轴,以农林牧渔业总产值为纵轴,做出散点图。
图形如下。
(2)通过散点图我们看出样本数据点(,)i i x y 大致分别落在一条直线附近。
这说明变量x 与y 之间具有明显的线性关系。
进而,我们可以选择一元线性回归模型来拟合此例。
(3)我们以农业产值为自变量i x ,以农林牧渔业总产值为因变量i y ,做线性回系数a模型 非标准化系数标准系数 t Sig. B 的 95.0% 置信区间 B 标准 误差试用版下限 上限 1(常量) -107.902 24.426-4.417 .000 -157.196 -58.607 农业1.967.023.99783.857.0001.9202.015a. 因变量: 农林牧渔业总产值x y 967.1902.107+-=(4)模型汇总b由模型汇总表可得回归标准误差:116.30261^=σ0ˆβ的95%置信区间为 [-157.196,-58.607] 1ˆβ的95%置信区间为 [1.920,2.015] (6)由模型汇总表得x 与y 的决定系数: 994.02=r 二,检验模型:当我们得到一个实际问题的经验回归方程01y xββ∧∧∧=+后,还不能马上就用它去做分析和预测,因为01y xββ∧∧∧=+是否真正描述了变量y 与x 之间的统计规律性,还需运用统计方法对回归方程进行检验。
由方差分析表可得F=7031.956,P 值=.000a所以回归方程显著由回归系数表可得:0β的t 值为-4.417, Sig ≈0,所以0β显著; 1β的t 值为83.857, Sig ≈0,所以1β显著。
由相关系数表可得 x 与y 的相关系数为0.997,呈高度相关至此,该一元线性回归模型通过了回归系数的t检验,回归方程的F检验,相关系数的t检验。
三,残差检验:一个线性回归方程通过了t检验或F检验,只是表明变量x与y之间的线性关系是显著的,或者说线性回归方程是有效的,但不能保证数据拟合的很好。
只有当与模型中的残差项有关的假定满足时,我们才能放心的运用回归模型。
因此,再利用回归方程作分析和预测之前,应该做残差检验。
(10)我们以农业产值为横轴,以残差为纵轴,做出散点图。
图形如下残差图表明y的观测值的方差并不相同,而是随着x的增加而减少后有不规则变动,即存在异方差。
(11)消除异方差。
对数似然值b幂-2.000 -323.046-1.500 -307.850-1.000 -293.960-249.363a),所以权数为211m wi xi xi ==从输出结果来看, 还原后的加权最小二乘法的估计结果为x y 700.1616.17+-=该模型通过了F 检验和T 检验,同时也消除了异方差性。
结论:1952年-2012年第一产业产出和总产出之间呈线性相关的关系。
设计体会与建议:课程设计本身是对所学知识的一次温习,通过深入思考,查阅相关书籍,可以拓宽知识面,对所学知识理解的更为透彻,而且运用统计软件处理数据相当方便。
通过对实际问题的分析,我们可以学会灵活运用专业知识,但设计过程中发现自己对软件操作还不是很熟练,所以以后要加强练习。
最后,说明一下。
我选的数据是一元线性回归模型,处理起来较为简单。
最后出现了异方差,通过一元加权最小二乘估计法最终消除了异方差并模型通过了检验。
设计成绩:教师签名:年月日。