当前位置:文档之家› 一元线性回归论文

一元线性回归论文

一元线性回归分析论文专业:姓名:学号:摘要回归分析是数理统计中处理变量之间一种较为成熟、实用和有效的办法。

它可以简便有效地利用调查的统计资料,对经济现象进行事先预计和推断,为此引出一元线性回归分析数学模型和解决问题的方法。

本文回顾了描述变量相关关系和回归分析方面的基本知识,系统阐述了一元线性回归模型的基本原理,并将所学的知识与实际生产生活相结合,解决实际问题。

目录第一章回归分析概述 (1)1.1相关关系基本知识: (1)1.2回归分析基本知识回顾: (2)1.2.1回归分析的定义 (2)1.2.2.回归模型的分类 (2)1.2.3.回归分析的步骤 (3)1.2.4.回归分析的任务 (3)第二章一元线性回归的基本理论 (4)2.1一元线性关系的判断 (4)2.2一元线性回归模型的建立 (4)2.3模型回归效果的显著性检验 (5)2.3.1线性假设的显著性检验(T检验) (5)2.3.2线性回归的方差分析(F检验) (6)2.4利用回归方程进行预测 (9)2.4.一元线性回归模型的使用条件和特点 (11)2.4.1一元线性回归模型的使用条件 (11)2.4.2.一元线性回归模型的特点 (12)第三章一元线性回归分析方法的实际应用 (13)3.1.典型实际问题 (13)3.2应用MATLAB与EXCEL软件对验数据进行分析 (14)3.2.1应用MATLAB分析 (14)3.2.2应用Excel软件分析 (18)第四章总结 (25)第一章回归分析概述随着科技的迅速发展,数学的应用不仅在它的传统领域——经济建设、工程技术等方面发挥着越来越重要的作用,而且不断向一些新的领域渗透,形成了许多交叉科学,如计量经济学、人口控制论、生物数学等。

数学模型成为人们认识和研究这些学科的一种重要的工具,如何利用所学知识,建立与实际生活背景更贴切的数学模型来解决我们经济生活中存在的问题是摆在人们面前的重要课题!本文回顾了描述变量相关关系和回归分析方面的基本知识,系统阐述了一元线性回归模型的基本原理,并将其应用于实际生活中。

1.1相关关系基本知识:在生产实践和科学实验中,经常会遇到一些相互关联、相互制约的变量,它们之间客观上存在着一定的关系,为了揭示其内在联系,往往需要确定这些变量的关系程度。

变量之间的关系大致可分为两类,一类是确定性的关系,变量之间按照确定的函数关系发生关联,也称函数关系,如物理学中速度与加速度之间的关系;另一类是不确定性的关系,这种关系无法用一个数学公式来精确描述。

当一个变量(称因变量或可控变量)的取值确定后,若另一个变量(称因变量或依变量)的取值虽无确定值,但以一确定的条件概率分布与之对应,这种变量间的不确定性关系称为相关关系,如人的血压与年龄,身高与体重之间的关系,存在相关关系的变量称为相关变量。

统计学中研究相关关系的理论模型有相关模型和回归模型两种;相关模型指的是变量间具有平行变化关系,相应的统计分析方法称为相关分析,研究的是多个变量在数量关系上的密切程度和性质;回归模型指的是变量间具有因果变化关系,相关的统计分析方法称为回归分析,研究的是一个随机变量与一个或多个可控变量之间的变化关系。

相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度;相关分析研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析可以推断变量之间相互关系的具体形式,能够从一个变量的变化来推测另一个变量的变化情况。

1.2回归分析基本知识回顾:1.2.1回归分析的定义在研究某一社会经济现象的发展变化规律时,所研究的现象或对象称为被解释变量,它是分析的对象;把引起这一现象变化的因素称为解释变量,它是引起这一现象变化的原因,被解释变量反映了解释变量变化的结果。

回归分析是研究某一被解释变量(因变量)与另一个或多个解释变量(自变量)间的依存关系,其目的在于根据已知的解释变量值或固定的解释变量值(重复抽样)来估计和预测被解释变量的总体平均值。

1.2.2.回归模型的分类(1)按模型中自变量的多少,分为一元回归模型和多元回归模型;(2)按模型中参数与被解释变量之间是否线性,分为线性回归模型和非线性回归模型;(3)按模型中方程数目的多少,分为单一方程模型和联立方程模型;1.2.3.回归分析的步骤(1)数据的收集与选取;(2)回归模型参数的估计、模型的确定检验与修正;(3)回归模型应用与推广。

1.2.4.回归分析的任务找出相关变量间的回归方程,并利用其进行预测和控制。

(1)依据一组实验数据,判断变量间是否存在相关关系,若有则建立相关变量间的数学关系式(回归方程),并对所获得的回归方程的可信度作统计检验;(2)判断各变标考核变量(随机变量)影响的显著性,并做出统计选择;(3)利用最终获得的回归方程对生产和试验进行预测和控制。

回归分析是一种传统意义上的应用性较强的科学方法之一,在各个领域都得到了广泛的应用,它不仅可以提取大量数据中的重要信息,掌握这些数据的特点及规律,进而得出变量间相关关系的数学表达式,对这些关系进行分析;还可以利用这些关系式,有一些变量去预测和控制另一个因变量的取值,进而知道这种预测和控制所到达的程度,并分析得出结论。

第二章 一元线性回归的基本理论2.1一元线性关系的判断一元线性回归模型的使用条件是两个变量之间存在线性关系,通过相关系数的来判定两个变量之间存在线性相关。

1nnni i i i x y x y r -=∑∑∑1r ≤,r 越大,线性相关越密切;当0.51r ≤≤为线性相关,可以用一元线性回归分析预测。

2.2一元线性回归模型的建立设随机变量y 与变量x 之间存在着直线相关关系,(,)i i x y 可用模型表示为:01(1,2,...,)i i i y x i n ββε=++=,0β与1β为未知参数,(1,2,...)i i n ε=相互独立且服从2(0,)N σ的正态分布,求得0β与1β的估计值0b 和1b ,对 于x ,()E y 的估计值01b b x +,记为y ∧,则方程01y b b x ∧=+称为y 对x 的一 元线性回归模型。

利用最小二乘法估计参数:若能使回归直线01y b b x ∧=+尽可能地靠近散点(,)i i x y ,即应使总的离回归平方和:22010111(,)()()nni i i i i i Q b b y y y b b x ∧===-=--∑∑达到最小,欲使二元函数01(,)Q b b 最小,即2011001112()02()0ni i i ni i ii Q y b b x bQ y b b x x b ==∂⎧=---=⎪∂⎪⎨∂⎪=---=⎪∂⎩∑∑ 整理得:0111201111n n i i i i n n ni i i i i i i nb b x y bx b x x y =====⎧+=⎪⎪⎨⎪+=⎪⎩∑∑∑∑∑ 其解0b ,1b 称为0β与1β的最小二乘估计。

令11n i i x x n -==∑,11ni i y y n -==∑进一步表示为:011121()()()n i i i ni i b y b x x x y y b x x ----=-=⎧=-⎪⎪⎪--⎨=⎪⎪-⎪⎩∑∑ 即求出y 对x 的一元线性回归模型01y b b x ∧=+。

2.3模型回归效果的显著性检验对于一元线性回归模型来说,我们常用的检验方法有以下几种:线性假设的显著性检验、线性回归的方差分析、相关系数的显著性检验、拟合优度……下面我们重点介绍一下线性假设的显著性检验和线性回归的方差分析。

2.3.1线性假设的显著性检验(T 检验)1、t 统计量回归系数估计量服从正态分布:222001122ˆˆ~, ~, i i i X N N n x x σββσββ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭∑∑∑, 用2σ的无偏估计量2ˆ22-=∑n e iσ来代替2σ时,可以构造t 统计量:1111ˆˆˆ()e t S βββ-==0000ˆˆˆ()e t S βββββ--==所构造的t 统计量服从自由度为n-2的t 分布。

即t ~ t (n-2) 1、回归系数估计量的t 检验步骤下面以估计量1ˆβ为例,介绍t 检验的步骤。

1> 提出假设原假设H 0:β1=0 备择假设H 1:β1≠02>给定显著性水平,查t 分布表获得临界值)2(2-n t α,对于例2-1,在显著性水平α=0.05,n-2=8时,查t 分布表,得到:306.2)2(2=-n t α。

3>根据下式利用样本数据计算检验统计量t 的值1111ˆˆˆ()e t S βββ-==4>进行比较,做出判断若2(2)t t n α>-,差异显著,拒绝原假设,接收备择假设。

若2(2)t t n α<-,差异不显著,接受原假设。

2.3.2线性回归的方差分析(F 检验)1、方差分析F 检验是根据平方和分解式,直接从回归效果检验回归方程的检验性。

平方和分解式为:()222111nnnii i i i i i y y y y y y ∧∧-==⎛⎫⎛⎫-=-+- ⎪ ⎪⎝⎭⎝⎭∑∑∑其中()21nii y y --∑称为总平方和,简记为SST 或者S 总或yy L ,SST 表示 sum ofsquare for total 。

21nii y y ∧=⎛⎫- ⎪⎝⎭∑称为回归平方和,简记为SSR 或者S 回,R 表示regression 。

21ni i i y y ∧=⎛⎫- ⎪⎝⎭∑称为残差平方和,简记为SSE 或者S 残,E 表示error 。

因而平方和分解式可以简写为:SST=SSR+SSE对总平方和(SST )的这两个分量进行研究,就称为从回归角度进行的方差分析每个平方和都具有相应的自由度,假定给n 个变量赋予数值,在计算平方和时,总有k 个变量可以自由取值,即是这k 个变量线性独立,我们说这个平方和的自由度为k 。

与每一个平方和相联系的是它们的自由度。

对于一元线性回归模型,SST 有n -1个自由度;SSE 有1个自由度;SSR 有n -2个自由度。

平方和与自由度之比即为平均平方和。

将平方和、自由度及平均平方和列成一个表,该表称为方差分析表。

一元线性回归方差分析表2、F 检验统计量定义从方差分析的角度进行的回归模型整体性检验所采用的检验统计量是F 统计量。

检验统计量F 反映平均回归平方和与平均剩余平方和的比较。

2121SSR11SSE22ni i ni i i y y F n y y n ∧=∧=⎛⎫- ⎪⎝⎭==⎛⎫-- ⎪⎝⎭-∑∑且F 服从自由度为1和n-2的F 分布。

相关主题