1
数理统计上机报告
姓名: 孙跃 班级: 信计12-2 组别: 成绩: .
合作者: 指导教师: 白如玉 实验日期: 2014.11.4 .
上机实验题目:用R 软件进行回归分析
一、上机实验目的
1.进一步理解回归分析的概念和思想,学会求回归分析的思想和求解步奏。
2.了解常用统计函数在R 中的表示方法,学会在R 中求出这些统计函数值,用R 软件进行回归分析。
二、回归分析基本理论、方法
1.确定回归模型:
由于我们研究的是一元线性回归,因此其回归模型可表示为:
01y x ββε=++;
其中,y 是因变量;x 是自变量;ε是误差项;0β和1β称为模型参数(回归系数)。
2.求出回归系数:
这里的回归系数的求解,就要用一定的方法,使得该系数应用于该方程是“合理的”。
最常用的一种方法就是最小二乘估计法。
最小二乘法是测量工作和科学实验中最常用的一种数据处理方法,其基本原理是,根据实验观测得到的自变量x 和因变量y 之间的一组对应关系,找出一个给定类型的函数
2
()y f x =,使得它所取的值12(),(),f x f x ……,()n f x 与观测值12,,y y …,n y 在某种尺
度下最接近,即在各点处的偏差的平方和达到最小,即
2
20
11
1
ˆˆˆ()()n
n
i
i
i
i i i y y
y x ββ==-=--=∑∑最小。
这种方法求的的0
ˆβ和1ˆβ将使得拟合直线01
ˆˆy x ββ=+中的y 和x 之间的关系与实际数据的误差比其他任何直线都小。
根据最小二乘法的要求,可以推导得到最小二乘法的计算公式:
111122
1101ˆˆˆn
n n i i i i i i i n n i i i i n x y x y n x x y x
βββ=====⎧⎛⎫⎛⎫
-⎪
⎪⎪⎝⎭⎝⎭⎪=⎪⎨⎛⎫- ⎪⎪
⎝⎭⎪
=-⎪⎩∑∑∑∑∑ 其中,1111,n n i i i i x x y y n n ====∑∑;
三、相关性检验:
对于若干组具体数据(,)i i x y 都可算出回归系数01
ˆˆ,ββ,从而得到回归方程。
至于y 与x 之间是否真有如回归模型所描述的关系,或者说用所得的回归模型去拟合实际数据是否有足够好的近似,并没有得到判明。
因此,必须对回归模型描述实际数据的近似程度,也即对所得的回归模型的可信程度进行检验,称为相关性检验。
相关系数是衡量一组测量数据,i i x y 线性相关程度的参量,其定义为:
)
)((2
2
2
2
y y x x y x xy r ---=
,
或者n x y x y r -=
3
四、实验实例和数据资料
研究同一地区土壤中所含植物可给态磷的情况,得到18组数据,其中:
1x ——土壤内所含无机磷浓度
2x ——土壤内溶于K2CO3溶液并受溴化物水解的有机磷浓度 3x ——土壤内溶于K2CO3溶液但不溶于溴化物的有机磷浓度
y ——载在20C 。
土壤内的玉米中可给态磷的浓度 已知y 与123,,x x x 之间有下述关系:
01122331,2,,18i i i i i y x x x i ββββε=++++= ,其中各i ε相互独立,均服从
2
五、上机实验步骤
1.根据自变量与因变量的现有数据以及关系,初步设定回归方程;
2.求出合理的回归系数;
3.进行相关性检验,确定相关系数;
4.在符合相关性要求后,即可根据已得的回归方程与具体条件相结合,来确定。
六、实例计算结果及分析
4
5
结论:回归方程y=43.65+1.78x1-0.08x2+0.16x3,故:在0.05的水平上,x1是显著的,x2,x3是不显著的。