当前位置:文档之家› SAS数据分析1

SAS数据分析1


958.3
7317.2
Tianjin
3341.1
1738.9
4489.0
Hebei
2495.3
1607.1
2194.7
Shanxi
2253.3
1188.2
1992.7
Hubei
2732.5
1934.6
1484.8
Hunan
3013.3
1342.6
2047.0
Guangdong
3886.0
1313.9X1源自1 0.44171 0.31290 1.41 0.1761
X2
1 0.72268 0.07549
下面是输出的图示:
SAS 系统
REG 过程
模型: MODEL1
因变量: Y
9.57 <.0001
回归分析是研究一个变量关于另一个(些)变量的依赖关系的计算 方法和理论。其目的在于通过后者的已知或设定值,去估计和预测前者 的(总体)均值。前一变量称为因变量或被解释变量,后一变量称为自 变量或解释变量。在这组数据中有一个因变量农村居民人均支出(用Y 表示),两个自变量从事农业经营的纯收入与他来源的纯收入(用X1与 X2表示)。其中因变量、自变量均有20个数据,REG过程采用最小二乘 法拟合线性回归模型。
表二中的F为方程的显著性检验得出的F值。Pr>F表示F检验的显著 性概率。由于模型的检验结果(0.0001<0.05)显著,表明X1、X2从整 体上对Y有影响模型的关系成立,说明建立的模型有意义。其经济意义 为:从事农业经营的纯收入与他来源的纯收入从整体上对农村居民人均 支出有显著性影响。
拟合优度检验中可决系数R方是重要的指标,R方表示回归平方和占 总理差平方和的比重,调整的可决系数去除了自由度对拟合优度的影 响,更为准确。表三中调整R方为0.8931,表示在因变量Y的总离差中, 有89.32%的信息由自变量X1与X2做出解释,模型对样本观测点的拟合度 良好。
均方根误差 489.76022 R 方 0.9044 因变量均值 3463.90500 调整 R 方 0.8931
变异系数 14.13896
参数估计值
变量
自 参数 由 估计值 度
标准 误差
t Pr > 值 |t|
Intercept 1 612.16752 711.12588 0.86 0.4013
下面是中国内地2006年20个城市的农村居民家庭人均纯收入与支出 的数据,我将通过SAS来研究居民收入与其消费支出之间是否存在关 系。
中国内地2006年各地区(20)农村居民家庭人均纯收入与消费支出 单位:元
地区
人均消费支 从事农业经营的纯 其他来源的纯收
出Y
收入X1
入X2
Beijing
5724.5
1948.2
2420.1
Henan
2229.3
1844.6
1416.4
(资料来源《中国统
计年鉴(2007)》)
SAS编程输入如下:
data example1;
input region$Y X1 X2; /*region表示地区
*/
/*Y表示人均消费支出
*/
/*X1表示从事农业经营的纯收入*/
/*X2表示其他来源的纯收入 */
Jiangxi
2676.6 1609.2 1850.3
Shandong
3143.8 1948.2 2420.1
Henan
2229.3 1844.6 1416.4
;
run;
输入如下过程,进行回归分析,使用了REG过程:
proc reg data=example1;
model Y=X1 X2/slentry=0.5;
run;
得出下面的结果:
SAS 系统
REG 过程
模型: MODEL1
因变量: Y
读取的观测数 20
使用的观测数 20
方差分析
源 自由 平方


均方 F 值 Pr > F
模型 2
38561265 19280633 80.38 <.0001
误差 17 4077706 239865
校正合 19 计
42638971
8006.0
532
8606.7
Jiangsu
4135.2
1497.9
4315.3
Zhejiang
6057.2
1403.1
5931.7
Anhui
2420.9
1472.8
1496.3
Fujian
3591.4
1691.4
3143.4
Jiangxi
2676.6
1609.2
1850.3
Shandong
3143.8
SAS数据分析实验报告
通过一学期的学习,我基本掌握了SAS的基本编程,学会了用SAS对 一些相关数据的分析,并写出实验报告,还能简单的读取一些SAS数据 和文件了解一些背景问题。
SAS是一个综合的统计分析系统,它由多个功能模块组合而成。本 学期我们主要学习了对SAS数据集的操作,包括如何建立和管理SAS数据 集,以及如何在数据集中更改变量的属性,还有数据集的拆分、合并、 转置、筛选等操作。数据整理时今次那个统计分析的必要前提,也是熟 练使用SAS系统的一项基本技能。本学期还介绍了各种常用的统计方 法,包括探索性分析、假设检验、方差分析、非参数检验、回归分析、 聚类分析、判别分析、因子分析、时间序列分析等多个专题。每个专题 集邮相关理论的简单讲解,也配有使用的案例操作,理论与实践结合能 够使学生快速获得使用SAS解决实际问题的能力;每节课的最后老师都 给出了几个练习,以便学生进行练习而提高应用水平。最后还有一些基 本的SAS中的命令,经过老师的悉心指导以及上机实验,我们已经基本 能够较为熟练的操作该软件了,接下来我将就一个实例,用我所学的回 归分析来展示下我学习的成果。
3765.9
Guangxi
2413.9
1596.9
1173.6
InnerMongolia 2772.0
2560.8
781.1
Liaoning
3066.9
2026.1
2064.3
Heilongjiang 2618.2
2622.9
929.5
Jilin
2700.7
2623.2
1017.9
Shanghai
Guangdong
3886.0 1313.9 3765.9
Guangxi
2413.9 1596.9 1173.6
InnerMongolia 2772.0 2560.8 781.1
Liaoning
3066.9 2026.1 2064.3
Heilongjiang 2618.2 2622.9 929.5
Jilin
2700.7 2623.2 1017.9
Shanghai
8006.0 532
8606.7
Jiangsu
4135.2 1497.9 4315.3
Zhejiang
6057.2 1403.1 5931.7
Anhui
2420.9 1472.8 1496.3
Fujian
3591.4 1691.4 3143.4
表四是对变量参数估计的结果。在假设参数为零的前提下,从t检 验结果中可以看出,变量X1、X2的系数都不为零。显著表明了变量X1与 X2对Y有影响。
在回归性分析中我们可以看出因变量Y与自变量X1、X2确实存在数学 关系。即农业经营的纯收入与他来源的纯收入对农村居民人均支出是有
影响的。
经过一学期的学习,我发现其实SAS软件并不难学,SAS软件简洁好 用,既有熟悉的图形用户界面也可以编程来得到想要的结果,我想它会 在将来的学习以及工作中给我带来非常大的帮助。
cards;
Beijing
5724.5 958.3 7317.2
Tianjin
3341.1 1738.9 4489.0
Hebei
2495.3 1607.1 2194.7
Shanxi
2253.3 1188.2 1992.7
Hubei
2732.5 1934.6 1484.8
Hunan
3013.3 1342.6 2047.0
相关主题