当前位置:
文档之家› 运用多元线性回归模型分析我国教育经费投入现状
运用多元线性回归模型分析我国教育经费投入现状
表 2 方差分析表
Moel
Sum of Squares df Mean Square F
Sig
1 Regression 40659883
1 40659882.97 296.554 .000a
Residual
1371079
10 137107.898
Total
42030962 11
2 Regression 41816139
理论与实践
运用多元线性回归模型 分析我国教育经费投入现状
王亚雄 吴 敏
摘 要: 本文通过分析我国教育发展的现状和影响教育经费投入量的因素, 运用 SPSS 软件建立多元线性回归模型。同时, 运用 SPSS 软件对模型进行回归诊断, 进一步优化模型, 使模型具有较强的拟合性和实用性。最后, 阐述了模型的现实意义。
校在校学生人数( 万人) , 社会团体和公民办学( 亿元) d. Dependent Variable: 教育经费( 亿元) 表 3 回归系数表
Unstandardized Standardized
Model
Coefficients Coefficients t Sig.
B Std.Error Beta
26.20
188.42
74462.60 317.40
30.17
170.66
78345.20 340.80
48.03
141.85
82067.50 413.40
62.90
125.87
89468.10 556.10
85.85
113.96
97314.80 719.10
128.09
112.89
105172.30 903.40
28
时代金融
理论与实践
( 三) 回归方程为: 标准化后得: 这 里 x3 的 系 数 为 负 , 显 然 不 合 理 , 原 因 可 能 是 由 于 自 变 量 之间存在多重共线性。
四 、多 重 共 线 性 的 诊 断 与 处 理 ( 一) 运 用 方差 扩 大 因子 法 。如 表 6, x2、x3 的 方 差 扩大 因 子 VIF2=67.916, VIF3=71.164。远超过 10, 说明回归方程存在严 重的多重共线性。
表 4 协同因素表
Model
1 ( Constant) 国内生产总值( 亿元)
2 ( Constant) 国内生产总值( 亿元) 普通高校在校学生人数( 万人)
3 ( Constant) 国内生产总值( 亿元) 普通高校在校学生人数( 万人) 社会团体和公民办学( 亿元)
Unstandardized
二、作相关分析, 设定理论模型 用 SPSS 软件计算增广相关阵, 并通过变量间的相关性分 析可以进行多元回归分析, 建立回归方程。用逐步筛选法作多 元回归分析, 将回归系数显著性 F 检验的相伴概率值小于 0.05 的自变量引入回归方程, 大于 0.1 的自变量剔除回归方程。自变
量 进 入 回 归 方 程 的 次 序 是 : 国 内 生 产 总 值 、普 通 高 校 在 校 学 生 人 数 、社 会 团 体 和 公 民 办 学 。
用 等 级 相 关 系 数 法 检 验 。令
用 SPSS 计算 与 xi
的等级相关系数。结果如表 7, 在 0.05 显著性水平下异方差不
明显。
根据所建立的预测回归模型, 就可以对未来教育经费的投 入量进行预测。由方程可以看出国民生产总值每增加 1 亿元, 教育经费的投入量就会增加 0.039 亿元, 国民生产总值每增加
社会团体和公民办学( 亿元)
- 7.223 2.840 - 0.403 - 2.543 0.035
注: a.Dependent Variable: 教育经费( 亿元) ( 一) 复 相 关 系 数 R=0.999, 决 定 系 数 R2=0.997, 由 此 可 得 回归方程高度显著。 ( 二) 方差 分 析表 , F= 940.986, P 值= 0.000, 也 说 明 回归 方 程 高度 显 著 , x1、x2、x3 整体 上 对 y 有高 度 显 著的 线 性 影响 。
国内生产 普通高校在 社会团体和 社会捐资和
总值 校学生人数 公民办学 集资办学
( 亿元) ( 万人) ( 亿元) ( 亿元)
34634.40 253.60
3.33
70.19
46759.40 279.90
10.78
97.45
58478.10 290.60
20.37
162.84
67884.60 302.10
Collinearity Statistics
Tolerance
VIF
1.000
1.000
0.144 0.144
6.945 6.945
0.137 0.015 0.014
7.317 67.916 71.164
注: a.Dependent Variable: 教育经费( 亿元)
( 二) 剔 除 一 些解 释 变 量。x3 的 方 差 扩大 因 子 最大 , 剔 除 x3, 再用 SPSS 诊断。
三 、计 算 结 果 用 SPSS 软 件 计 算, 其 中 y 代 表 当 年 教 育 经 费 的 投 入 量 , x1 代 表 当 年 国 内 生 产 总 值 , x2 代 表 当 年 普 通 高 校 在 校 人 数 , x3 代 表 社 会团 体 和 公民 个 人 办学 投 入 经费 。输 出 结果 如 表 4 和表 5 所示:
六 、自 相 关 的 诊 断 与 处 理 按照时间绘制回归残差项 e 的图形。由图示可知: 变量间
此 时 x1、x2 的 方 差 扩 大 因 子 分 别 为 VIF1=6.945, VIF2=6. 不存在自相关性。
945。同时 , 复 相 关 系 数 R=0.997, 决 定 系 数 R2=0.997, F=875.
七 、结 论
944, 回归系数的显著性检验 P 值均小于 0.05, 故可认为方程具
由此可建立了一个二元线性回归模型:
有较 强 的 拟合 性 , x1、x2 整 体上 与 y 高 度相 关 。
回归方程为:
( 1)
回归方程为:
标准化后得:
( 2)
标准化后得: 五 、异 方 差 的 检 验 与 处 理
其中 代表所需要的教育经 费 ( 亿元) , x1 代 表 当年 国 内 生 产总值( 亿元) , x2 代表当年普通高校在校人数( 万人) 。
一 、提 出 因 变 量 与 自 变 量 y 表示 当 年 教育 经 费 的投 入 量( 亿元) , 为 因 变量 ; 四 个 自变 量 : x1 表 示当 年 国 内生 产 总 值( 亿 元) , x2 表 示当 年 普 通高 校 在 校 人数( 万人) , x3 表示社会团体和公民个人办学投入经费( 亿元) , x4 表示 社 会 捐 资 和 集 资 办 学( 亿 元) 。1993~2004 年 我 国 教 育 经 费情 况 、国 内生 产 总 值、普 通 高 校 在 校 学 生 人 数 、社 会 团 体 和 公民个人办学情况、社会捐资和集资办学情况的统计见表 1:
普通高校在校学生人数( 万人)
2.328 0.334 0.437 6.960 0.000
3( Constant)
- 1507.722 270.044
- 5.583 0.001
国内生产总值( 亿元)
0.041 0.003 0.608 11.966 0.000
普通高校在校学生人数( 万人)
4.316 0.825 0.810 5.232 0.001
12
普通高校在校学生人数 ( 万人) 0.231 0.471 12 1.000* *
12
一个标准差, 教育经费的投入量会增加 0.579 个标准差; 普通高校在校学生人数每 增加 1 万人, 教育经费的投入量就会增加 2.238 亿元, 普通高校在校学生每增加一个 标准差, 教育经费的投入量就会增加 0.437 个标准差。
Beta
0.984
0.579 0.437
0.608 0.810 - 0.403
t
- 5.542 17.221 - 4.924 9.222 6.960 - 5.583 11.966 5.232 - 2.543
Sig.
0.000 0.000 0.001 0.000 0.000 0.001 0.000 0.001 0.035
2 20908069.66 875.944 .000b
Residual
214822.6
9 23869.181
Total
42030962 11
3 Regression 41912187
3 13970728.9 940.986 .000c
Residual
118775.2
8 14846.905
Total
42030962 11
表 1 1993~2004 年我国教育经费投入情况
年份
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
教育经费
( 亿元) 1059.94 1488.78 1877.95 2262.34 2531.73 2949.06 3349.04 3849.08 4637.66 5480.03 6208.27 7242.6
注: a. Predictors:( Constant) , 国内生产总值( 亿元) b. Predictors:( Constant) , 国 内 生 产 总 值( 亿 元) , 普 通 高
校在校学生人数( 万人) c. Predictors:( Constant) , 国 内 生 产 总 值( 亿 元) , 普 通 高
1 ( Constant)