例1.3序列T和H分别表示某地区1997年1月至2000年12月的气温和绝对湿度的月平均值序列,数据见表1.2。
要求绘制序列H的经验累计分布函数图和它与序列T的QQ 图。
例2.1表2.1是1950—1987年间美国机动车汽油消费量和影响消费量的变量数值。
其中各变量表示:qmg—机动车汽油消费量(单位:千加仑);car—汽车保有量;pmg—机动汽油零售价格;pop—人口数;rgnp—按1982年美圆计算的gnp(单位:十亿美圆);pgnp—gnp指数(以1982年为100)。
以汽油量为因变量,其他变量为自变量,建立一个回归模型。
表2.1(0201) 1950—1987年间美国机动车汽油消费量数据ls qmg c car pmg pop rgnp pgnpls car c pmg pop rgnp pgnpeqcarscalar vifcar=1/(1-eqcar.@R2) (vifcar是方差扩大因子)同时工作表中产生vifcar=229.1862方差扩大因子只要有一个超过10,说明存在多重共建性检验零假设H0:car对qmg的影响不重要在主窗口输入eq01.testdrop car3.多重共建性处理方法:2.3。
差分法其中算子:ls qmg-qmg(-1) car-car(-1) pmg-pmg(-1) pop-pop(-1) rgnp-rgnp(-1) pgnp-pgnp(-1)ls qmg c qmg(-1) car pmg pmg(-1) pop pop(-1) rgnp rgnp(-1) pgnp pgnp(-1)Qmg t=qmg t-1+0543292cart-0.543292car t-1Ls qmg-eq02.@coefs(1)*qmg(-1) c car-eq02.@coefs(1)*car(-1) pmg-eq02.@coefs(1)*pmg(-1) pop-eq02.@coefs(1)*pop(-1) rgnp-eq02.@coefs(1)*rgnp(-1) pgnp-eq02.@coefs(1)*pgnp(-1)Scalar beta0=eq04.@coefs(1)/(1-eq02.@coefs(1)) 得beta0=75541509.38 回归模型为 Qmg=75541509.38+1.4390*car-…… White 检验 打开equation view-例2.2为研究采取某项保险革新措施的速度y 与保险公司的规模x1和保险公司类型的关系,选取下列数据:y —一个公司提出该项革新直至革新被采纳间隔的月数,x1—公司的资产总额(单位:百万元),x2—定性变量,表示公司类型:其中1表示股份制公司,0表示互助公司。
数据资料见表2.5。
要建立的模型:i i i i x x y εβββ+++=22110得到模型为y=33.87407-0.101742*x1+8.055469*x2差分回归方程:t t x y ∇=∇*65.0即1165.065.0---=-t t t t x x y y即1165.065.0---+=t t t t x x y y消除自相关的模型:qmg=75541509.38+1.4390*car-10354749*pmg-503.50*pop-5290.80*rgnp-565089.4*pgnp某市楼盘销售价格及相关情况的抽样调查表,其中建筑类别分别用1、2、3、4表示多层、多层别墅、小高层、高层;交通状况综合分、物业管理综合分、周边配套等级是通过对居民用户的问卷调查平均而得。
1.Y关于X1、X2、X3、X4和X5的回归方程;2.对回归方程和解释变量做显著性检验;3.当X1=4,X2=8,X3=7,X4=36%,X5=8时,对楼盘的均价进行预测。
例3.1表3.3是某企业在16个月度的产品产量和单位成本资料,研究二者关系。
表3.3 (0301)某企业某产品产量和单位成本资料月度序号obs产量(台)x单机位成本(元/台)y 14300346.2324004343.3434300327.4645016313.2755511310.7565648307.6175876314.5686651305.7296024310.82106194306.83117558305.11127381300.71136950306.84146471303.44156354298.03168000296.21为了明确产量和单机成本是何种关系,先绘制散点图。
genr lx=log(x)genr ly=log(y)ls ly c lxls log(y) c log(x)log(y)=c(1)+c(2)*log(x)双曲线模型: y=a+b/x对数曲线模型:y=a+blnx双对数曲线模型: lny=a+lnx在自变量个数K=1,样本量n=16,在显著性水平 =0.01下,d L=0.84,d u=1.00,此时有D.W=1.151568D.W=1.115981D.W=1.156127均有d u=1.0≤D.W=1.151568≤4- d u=3说明三种模型来描述x与y的关系都比较好。
例3.2 根据例3.1中数据,用非线性最小二乘法建立成本函数模型例3.3粮食产量通常由粮食生产劳动力(L)、化肥施用量(K)等因素决定。
表3.8是我国粮食生产的有关数据(由于粮食生产劳动力不易统计,假定它在农业劳动力中的比例是一定的,故用农业劳动力的数据代替),研究其间关系,建立Cobb—Douglas生产函数模型。
生产的产出量与投入要素之间并不简单地满足线性关系,通常讨论的生产函数,都是以非线性的形式出现。
Cobb—Douglas生产函数模型为Y=aL b K1-b(3.2.4)Y=c(1)*l^c(2)*k^(1-c(2))Y=c(1)*l^c(2)*k^(1-c(2))Coefficient Std. Error t-Statistic Prob.C(1)0.4742530.03618413.106620.0000C(2)0.7635520.01754143.529600.0000R-squared0.945223Mean dependent var40114.73 Adjusted R-squared0.942941S.D. dependent var7222.666S.E. of regression1725.278Akaike infocriterion17.81797Sum squared resid71438041Schwarz criterion17.91474Log likelihood-229.6336Hannan-Quinncriter.17.84584Durbin-Watson stat 1.178765例4.1我国轿车保有量资料见表4.1表4.1(0401)1971—1992年我国轿车保有量根据表绘制时间序列曲线趋势图。
例4.6我国民航客运量数据的季节调整。
有关数据见表4.6例5.4序列Pt是某国1960年至1993年GNP平减指数的季度时间序列。
例5.6表5.4是我国1990年1月至1997年12月工业总产值的月度资料(1990年不变价格),记作IP t,共有96个观测值,对序列IP t建立ARMA模型。
表5.4 1990年1月至1997年12月我国工业总产值单位:亿元例5.6 表5.4是我国1990年1月至1997年12月工业总产值2资料(1990年不变价格),记作ipt,共有96个观测值,对序列ipt建立ARMA模型。
例6.1表6.1是某水库1998年至2000年各旬的流量、降水量数据。
试对其建立多项式分布滞后模型。
LS VOL C RA RA(-1) RA(-2) RA(-3) RA(-4) RA(-5) RA(-6)LS VOL c pdl(series name lags order optionsLS VOL c pdl(ra,9,6 )Variable Coefficient Std. Error t-Statistic Prob.C-186.6747134.7779-1.3850540.1711 PDL01-1.754639 1.938446-0.9051780.3689PDL02-0.627491 2.049412-0.3061810.7605PDL030.780418 1.3668340.5709670.5701PDL040.2304630.4903450.4700020.6400PDL05-0.0147330.183776-0.0801700.9364PDL06-0.0242630.023555-1.0300540.3071PDL070.0026110.0065650.3978000.6922R-squared0.753184Mean dependent var888.0580 Adjusted R-squared0.724860S.D. dependent var1241.393 S.E. of regression651.1569Akaike info criterion15.90403 Sum squared resid25864326Schwarz criterion16.16306 Log likelihood-540.6890Hannan-Quinn criter.16.00679 F-statistic26.59247Durbin-Watson stat 1.903413 Prob(F-statistic)0.000000六介多项式的检验 T统计量的相关概率太大了,所以相关性不好LS VOL c pdl(ra,9,5 )Variable Coefficient Std. Error t-Statistic Prob.C-189.5507133.6672-1.4180790.1612 PDL01-1.333475 1.612718-0.8268500.4115PDL02-0.109091 1.570947-0.0694430.9449PDL030.3053520.6603360.4624190.6454PDL040.0817920.3152670.2594370.7962PDL050.0564470.041616 1.3563670.1799PDL06-0.0166690.013704-1.2163350.2285R-squared0.752543Mean dependent var888.0580 Adjusted R-squared0.728596S.D. dependent var1241.393 S.E. of regression646.7215Akaike info criterion15.87764 Sum squared resid25931423Schwarz criterion16.10428 Log likelihood-540.7784Hannan-Quinn criter.15.96755 F-statistic31.42482Durbin-Watson stat 1.897721 Prob(F-statistic)0.000000LagDistribution of RA i Coefficient Std. Error t-Statistic. *|030.2731 3.217099.41009 . * |18.15629 2.59687 3.14082 * |20.88833 1.720840.51622 *. |3-0.92771 1.88469-0.49223 *. |4-1.33347 1.61272-0.82685 *. |5-1.01564 1.61361-0.62942 * |60.69384 1.877880.36948 . * |7 3.81751 1.78166 2.14267 T统计量的相关概率还是太大了0.9449,所以相关性不好LS VOL c pdl(ra,9,4 )C-192.7441134.1490-1.4367910.1557 PDL01-2.201333 1.451790-1.5162890.1344PDL02 1.4651620.893758 1.6393270.1061PDL030.8923650.452415 1.9724490.0530PDL04-0.2922490.069748-4.1900610.0001PDL050.0157060.0247920.6335030.5287R-squared0.746638Mean dependent var888.0580 Adjusted R-squared0.726530S.D. dependent var1241.393 S.E. of regression649.1779Akaike info criterion15.87223 Sum squared resid26550210Schwarz criterion16.06650 Log likelihood-541.5920Hannan-Quinn criter.15.94931F-statistic37.13130Durbin-Watson stat 1.917450 Prob(F-statistic)0.000000LagDistribution of RA i Coefficient Std. Error t-Statistic. *|028.9405 3.036299.53153 T统计量的相关概率还是太大了0.9449,所以相关性不好LS VOL c pdl(ra,9,3 )Variable Coefficient Std. Error t-Statistic Prob.C-182.8158132.6058-1.3786410.1728 PDL01-2.660015 1.252455-2.1238400.0376PDL02 1.1967410.783251 1.5279150.1315PDL03 1.1586180.166665 6.9517880.0000PDL04-0.2616620.050099-5.2228850.0000R-squared0.745024Mean dependent var888.0580 Adjusted R-squared0.729088S.D. dependent var1241.393 S.E. of regression646.1344Akaike info criterion15.84960 Sum squared resid26719342Schwarz criterion16.01149 Log likelihood-541.8111Hannan-Quinn criter.15.91382 F-statistic46.75112Durbin-Watson stat 1.940066 Prob(F-statistic)0.000000这个就好多了LS VOL c pdl(ra,9,3 )能不能减小9呢?把9改为6/ 最终发现改为8最好Variable Coefficient Std. Error t-Statistic Prob.C-170.8551128.4471-1.3301590.1881 PDL01-2.535784 1.200150-2.1128890.0385PDL02 1.2612190.930553 1.3553430.1800PDL03 1.1308020.172132 6.5693970.0000PDL04-0.2683540.073921-3.6302900.0006R-squared0.741959Mean dependent var881.0714 Adjusted R-squared0.726080S.D. dependent var1233.750 S.E. of regression645.7127Akaike info criterion15.84734 Sum squared resid27101416Schwarz criterion16.00794 Log likelihood-549.6567Hannan-Quinn criter.15.91113 F-statistic46.72448Durbin-Watson stat 1.927732 Prob(F-statistic)0.000000例6.2表6.6中,序列St和Zt分别表示1992年1月至1998年12月经居民消费价格指数调整的中国城镇居民月人均可支配收入和人均生活费支出时间序列,现以人均生活费支出Zt为因变量,建立自回归分布滞后模型。