当前位置：文档之家› 应用回归分析课程设计报告书

应用回归分析课程设计报告书

课程设计报告课程：应用回归分析学号：姓名：班级： 12金统教师：**江苏师范大学科文学院《应用回归分析》课程设计指导书一、课程设计的目的1. 加深理解本课程的研究方法、思想精髓，提高解决实际问题的能力，熟练掌握SPSS常用统计软件的应用。

2. 通过学习达到熟练掌握一元线性回归建模过程，熟悉一元线性回归建模步骤；掌握模型选择，参数估计，模型检验，模型优化和模型预测的方法。

3. 掌握诊断序列自相关性（或异方差性）的方法，并能给出消除自相关性（或异方差性）的方法。

4. 能够根据历史数据，对未来走势作出预测；可以处理一些简单的经济问题。

二、设计名称：检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。

三、设计要求1.数据来源要真实，必须注明数据的出处。

2.尽量使用计算机软件分析，说明算法或过程。

3.必须利用到应用回归分析的统计知识。

4.独立完成，不得有相同或相近的课程设计。

四、设计过程1.思考研究课题，准备搜集数据。

2.确立课题，利用图书馆、上网等方式方法搜集数据。

3.利用机房实验室等学校给予的便利措施开始分析处理数据。

4.根据试验结果，写出课程设计报告书。

5.对实验设计报告书进行完善，并最终定稿。

五、设计细则1.利用的统计学软件主要为SPSS，因为其方便快捷，功能也很强大，界面美观。

2.对Word文档进行编辑的时候，有些特殊的数学符号需要利用Mathtype这款小软件进行编辑。

3.数据来自较权威机构，增加分析的准确性与可靠性。

4.力求主题突出，观点鲜明，叙述简洁明了。

六、说明1.数据来源于江苏统计年鉴2013；2.所选取数据可能不会涉及到所学的各种分析方法，本课程设计最后会对此情况作出解释。

3.本课程设计中，取显著性水平为 =0.05，对于分析中需要用到的数据做加粗处理课程设计任务书设计名称：检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。

日期：2014年6月1日（1）画散点图（2）x 与y 之间是否大致呈线性关系（3）用最小二乘估计求出回归方程（4）求回归标准误差σˆ （5）给出0ˆβ与1ˆβ的置信度为95%的区间估计（6）计算x 与y 的决定系数（7）对回归方程作方差分析（8）作回归系数0β,1β显著性分析（9）做相关系数的显著性检验（10）用线性回归的plots 功能绘制标准残差的直方图和正态概率图，检验误差项的正态性假设。

设计目的与要求：1.加深理解本课程的研究方法、思想精髓，提高解决实际问题的能力，熟练掌握SPSS 常用统计软件的应用。

2.通过学习达到熟练掌握一元线性回归建模过程，熟悉一元线性回归建模步骤；掌握模型选择，参数估计，模型检验，模型优化和模型预测的方法。

3. 掌握诊断序列相关性（或异方差性）的方法，并能给出消除自相关性（或异方差性）的方法。

设计环境或器材、原理与说明：设计环境器材：统计实验室、SPSS 软件、EXCEL 软件等原理与说明：1、一元线性回归模型的一般形式设随机变量y 与一般变量x 的线性回归模型为y=01x ββε++0β称为回归常数，β称为回归系数。

ε是随机误差，我们常假定2()0var()E εεσ=⎧⎨=⎩ 2、F 检验对随机变量y 是否有明显的影响。

为此提出原假设01H 0β=：构造F 检验统计量如下/1/(2)SSR F SSE n =-在正态假设下，当原假设01H 0β=：成立时，F 服从自由度为（1,n-2）的F 分布。

3、t 检验t 检验是统计推断的一种方法，因此，检验回归系数是否显著，等价于检验假设111:0:0o H H ββ=≠如果接受原假设o H ，则x 不显著；如果拒绝原假设o H ，则x 是显著的。

在一元线性回归中，回归系数显著性的t 检验与回归方程显著性的F 检验是等价的。

4、拟合优度拟合优度用于检验回归方程对样本观测值的拟合程度。

样本决定系数2/r SSR SST =,样本决定系数2R 的取值在[0,1]区间内，2R 越接近1，表明回归拟合的效果越好；2R 越接近0，表明回归拟合的效果越差。

与F 检验相比，2R 可以更清楚直观地反映回归拟合的效果，但是并不能作为严格的显著性检验。

5、通过画散点图我们可以从中观察出样本变量间是否有线性关系 6、用普通最小二乘估计和最大似然估计可以对参数0β，1β进行估计7、关于残差图：一般认为，如果一个回归模型满足所给出的基本假定，所有残差是在ε=0附近随机变化，并在变化幅度不大的一条子带内。

若e 随x 的增大而减小，则为异方差。

6、消除异方差：一元加权最小二乘估计法：用自变量的幂函数的倒数形式作为权数对原模型进行加权:1m wixi设计过程（步骤）或程序代码：1.确定模型（1）散点图:图形---旧对话框---散点/点状（2）回归方程：分析---回归---线性2. 模型检验：（1）相关系数:分析---相关---双变量3. 残差检验：（1）散点图:图形---旧对话框---散点/点状4. 模型预测：（1）模型预测：分析—回归—线性—保存—预测—为标准化分析—回归—线性—统计量—保存—预测区间—均值5. 消除异方差：分析—回归—权重估计—因变量，自变量，将自变量输入权重变量，确定。

设计结果与分析：一，确定模型：一元线性回归是描述两个变量之间统计关系的最简单的回归模型。

拿到一组数据，在建立回归模型之前，通常先做出其散点图，直观地判断一下它们之间的数量关系，进而选择合适的理论回归模型。

（1）我们以农业产值为横轴，以农林牧渔业总产值为纵轴，做出散点图。

图形如下。

（2）通过散点图我们看出样本数据点(,)i i x y 大致分别落在一条直线附近。

这说明变量x 与y 之间具有明显的线性关系。

进而，我们可以选择一元线性回归模型来拟合此例。

（3）我们以农业产值为自变量i x ，以农林牧渔业总产值为因变量i y ，做线性回系数a模型非标准化系数标准系数 t Sig. B 的 95.0% 置信区间 B 标准误差试用版下限上限 1(常量) -107.902 24.426-4.417 .000 -157.196 -58.607 农业1.967.023.99783.857.0001.9202.015a. 因变量: 农林牧渔业总产值x y 967.1902.107+-=(4)模型汇总b由模型汇总表可得回归标准误差：116.30261^=σ0ˆβ的95%置信区间为 [-157.196，-58.607] 1ˆβ的95%置信区间为 [1.920，2.015] （6）由模型汇总表得x 与y 的决定系数： 994.02=r 二，检验模型:当我们得到一个实际问题的经验回归方程01y xββ∧∧∧=+后，还不能马上就用它去做分析和预测，因为01y xββ∧∧∧=+是否真正描述了变量y 与x 之间的统计规律性，还需运用统计方法对回归方程进行检验。

由方差分析表可得F=7031.956，P 值=.000a所以回归方程显著由回归系数表可得:0β的t 值为-4.417， Sig ≈0，所以0β显著； 1β的t 值为83.857， Sig ≈0，所以1β显著。

由相关系数表可得 x 与y 的相关系数为0.997，呈高度相关至此，该一元线性回归模型通过了回归系数的t检验，回归方程的F检验，相关系数的t检验。

三，残差检验：一个线性回归方程通过了t检验或F检验，只是表明变量x与y之间的线性关系是显著的，或者说线性回归方程是有效的，但不能保证数据拟合的很好。

只有当与模型中的残差项有关的假定满足时，我们才能放心的运用回归模型。

因此，再利用回归方程作分析和预测之前，应该做残差检验。

（10）我们以农业产值为横轴，以残差为纵轴，做出散点图。

图形如下残差图表明y的观测值的方差并不相同，而是随着x的增加而减少后有不规则变动，即存在异方差。

（11）消除异方差。

对数似然值b幂-2.000 -323.046-1.500 -307.850-1.000 -293.960-249.363a),所以权数为211m wi xi xi ==从输出结果来看, 还原后的加权最小二乘法的估计结果为x y 700.1616.17+-=该模型通过了F 检验和T 检验,同时也消除了异方差性。

结论：1952年-2012年第一产业产出和总产出之间呈线性相关的关系。

设计体会与建议：课程设计本身是对所学知识的一次温习，通过深入思考，查阅相关书籍，可以拓宽知识面，对所学知识理解的更为透彻，而且运用统计软件处理数据相当方便。

通过对实际问题的分析，我们可以学会灵活运用专业知识，但设计过程中发现自己对软件操作还不是很熟练，所以以后要加强练习。

最后，说明一下。

我选的数据是一元线性回归模型，处理起来较为简单。

最后出现了异方差，通过一元加权最小二乘估计法最终消除了异方差并模型通过了检验。

设计成绩：教师签名：年月日。

e商务文档

应用回归分析课程设计报告书

相关文档推荐：