spass回归分析实验报告
其Rsq 值较大),于是就选QUA,CUB,POW来进行。重新进行上面的过程,只选以上三 种模型。 3、 实验结果:
Model Summary and Parameter Estimates Dependent Variable:远视 率 Model Summary R Equation Square Linear Logarith mic Inverse Quadrati c Cubic Compou nd Power S Growth Exponen tial Logistic F df1 1 1 1 2 3 1 1 1 1 1 1 df2 11 11 11 10 9 11 11 11 11 11 11 Sig. .001 Parameter Estimates Constan t b1 b2 b3
1、 实验原理:曲线估计 2、 实验步骤: 第一步 先用散点图的形式进行分析,看究竟是否具有线性相关性;按Graph|Scatter 顺 序打开Scatterplot 对话框,并选择Simple,点击Define; 第2 步 现在进行曲线估计。 Analyze|Regression|Curve Estimation, 将里面的模型全选上, 看哪种模型拟合效果更好从拟合优度(Rsq 即R2)来看, QUA,CUB,POW 效果较好(因为
51.859 187.328 -2.0 0 4.440
.024 -22.306 .036 .199
13.231
2.698
.504 4.905
.001
7.010
19.452
第三题:研究青春发育阶段的年龄与远视率的变化关系,测得数据如表9.28所示,请 对x与y的关系进行曲线估计。 (数据来源: 《统计学(第二版) 》 袁卫,高等教育出版 社;数据文件:data9-6.sav) 表 9.28 青春发育阶段年龄与远视率的变化关系 年龄(x) 远视率 y) 6 7 8 9 10 11 12 13 14 15 16 17 18 63.6 61.0 38.8 13.7 14. 8.0 4.4 4.2 2.0 1.0 2.5 3.1 2.9 4 6 4 5 5 7 1 7 9 2 1 2 8
实验主题 实验题目 实训时间 学生姓名 实训地点 2011 学年 官其虎 信息管理 实验室
专业统计软件应用 回归分析 2 学期 15 周 (2011 年 6 月 1 日—2 日) 班级 0360901 刘进 设备号 B25 指导教师 学号 2009211467
一 实验目的
回归分析是指通过提供变量之间的数学表达式来定量描述变量间相关关系的数学 过程,这一数学表达式通常称为经验公式。我们不仅可以利用概率统计知识,对这个 经验公式的有效性进行判定,同时还可以利用这个经验公式,根据自变量的取值预测 因变量的取值。如果是多个因素作为自变量的时候,还可以通过因素分析,找出哪些 自变量对因变量的影响是显著的,哪些是不显著的。 理解和学会使用回归分析方法解决问题。
of Squares b1 1177.718 1180.718 2.000 2.000 b2 -4.000 -4.000 b3 65.000 65.000
Derivatives are calculated numerically. a. Major iteration number is displayed to the left of the decimal, and minor iteration number is to the right of the decimal. b. Run stopped after 2 model evaluations and 1 derivative evaluations because the relative reduction between successive parameter estimates is at most PCON = 1.00E-008. Parameter Estimates Param eter b1 b2 b3 95% Confidence Interval Estimate Std. Error Lower Bound Upper Bound 2.000 -4.000 65.000 .000 .000 .000 2.000 -4.000 65.000 2.000 -4.000 65.000
.000 156.773 .000 -40.567 .000 192.085 .000 290.851 .000 308.120 .000 .000 .000 49462.7 24
-1.502 37.175 5.730 -.314 -.314 1.369
.000 308.120 .000 .003
The independent variable is 年龄.
a. Predictors: (Constant), x b. Dependent Variable: Y Coefficientsa Standardiz Unstandardized Coefficients ed Coefficients 95% Confidence Interval for B Lower Model 1 (Constan t) x B -94.575 1410.210 Std. Error 28.417 88.511 Beta t -3.328 .983 15.933 Sig. .009 .000 Bound -158.858 1209.983 Upper Bound -30.292 1610.437
.674 22.710 .793 42.251 .883 83.244 .943 82.114 .959 69.538 .794 42.445 .861 68.413 .877 78.119 .794 42.445 .794 42.445 .794 42.445
74.006 -4.768 -57.57 4 615.32 1 -26.56 7 -54.71 7 .731 -3.638 .908 3.398 -.069
a. Predictors: (Constant), x ANOVAb Sum of Model 1 Regression Residual Total Squares 1517083.637 53787.772 1570871.409 df Mean Square 1 1517083.637 9 10 5976.419 F 253.845 Sig. .000a
第二题:某公司太阳镜销售情况如表8.17,销售量与平均价格、广告费用和日照时间 之间的关系作多元线性回归分析。 (数据文件:data8-8.sav) 1、 实验原理:多元线性回归分析 2、 实验步骤: 第1 步 分析:显然是采用多重线性回归分析方法; 第2 步 建立数据文件,变量名销售量与平均价格、广告费用和日照时间第3 步 按 Analyze|Regression|linear…的顺序打开Linear Regression 主对话框,,并将销售量设为 因变量,其余变量设为自变量。我们可选择其中任一种方法进行回归分析(这里选 Stepwise,逐步 回归法),无论选哪种方法,进入方程的变量必须符合容许偏差,默认的容许偏差是 0.0001。同样一个变量若使模型中变量的容许偏差低于默认的容许偏差,则不进入方 程; 第4 步 单击Statistics 按钮,打开Linear Regression:Statistics 对话框,并选择Model fit 和 Estimates;
a. All requested variables entered. b. Dependent Variable: Y Model Summary Adjusted Model 1 R .983a R Square .966 R Square .962 Std. Error of the Estimate 77.3073
第5 步 打开Linear Regression:Option 框, 其中Stepwise Method Criteria (逐步回归方法 准测),应用于Stepwise,Backward,Forward 方法,变量根据指定的F 值或F 值的显 著性水平被引入或剔除模型。 Use probability of F, 当F 值的显著性水平小于Entry值时, 该变量将进入回归方程;若大于Removeal 值时,则被剔除。Entry 值必须小于Removal 值,且均为正 数。若想更多的变量进入模型,可增大Entry 值,若想在模型中剔除更多的变量,可 以降低Removal 值。而Use F value 是使用的F 的值。运行即可 3、 实验结果: Coefficientsa Standard ized Unstandardized Coefficie Coefficients Std. Model 1 (Const ant) 价格 广告费 用 日照时 间 a. Dependent Variable: 销量 分析:表示有两种回归方程表达式: 销售量=119.594-12.163*价格;销售量=119.594+13.231*广告费用+2.698*日照时间 B 119.594 -12.163 2.319 Er or 29.373 4.399 .920 Beta t 4.072 -.235 -2.765 .292 2.522 Sig. .004 nts 95% Confidence Interval for B Lower Bound Upper Bound
a. Dependent Variable: Y 分析:一个是方差分析表,是对回归方程进行显著性检验的情况。从结果看,相伴概 率 Sig.<0.05,说明自变量 x 与因变量 y 之间确有线性关系。 一个是是对回归系数的分析。从两系数的相伴概率来看均<0.05,说明均具有显著性意 义,说明回归系数是显著的,则回归方程为: y =-94.575+ 1410.210x。
1、实验原理:非线性回归分析 2、实验步骤: 第一步 分析:这显然是一个非线性回归的问题 第二步 数据组织 第三步 进行非线性回归分析 第四步 主要结果及分析 3、实验结果: Iteration Historyb Iteratio Residual Sum Parameter