当前位置:文档之家› 时间序列分析

时间序列分析


其中, sign() 为符号函数。当 X i X j 小于、等于或大于零时, sign( X i X j ) 分别为-1、 0或1。S为正态分布,其均值为0,方差 Var ( S ) n(n 1)(2n 5) /18 。
把反映现象发展水平的统计指标数 时间序列 值,按照时间先后顺序排列起来所 形成的统计数列,又称动态数列。
构成要素:
现象所属的时间 反映现象发展水平的指标数值
要素一:时间t
年份 1986 1987 1988 1989 1900 1991 1992 1993 1994 1995 国内生产总值 (亿元) 4038.2 4517.8 4862.4 5294.7 5934.5 7171.0 8964.4 10202.2 11962.5 14928.3
时间序列分析
Time Series Analysis
常用 样本数据
时间序列 数据
截面数据
虚变量数据
面板数据
面板数据(panel data)是截面上个体在不同时点的重复观测数据,是 一组二维数据,所以也称作时间序列截面数据(pooled time series and cross section data) 。
要素二:指标数值a
年份 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 国内生产总值 (亿元) 16909.2 18547.9 21617.8 26638.1 34634.4 46759.4 58478.1 67884.6 74462.6 79395.7
4996.87 5960.42 6650.02 7162.20 7662.10 山东 数据来源:中国统计年鉴 1996-2000。 其他类似的例子还有:历次人口普查中有关不同年龄段的受教育状况;同行业不同公 司在不同时间节点上的产值等。这里,不同的年龄段和公司代表不同的截面,而不同时间 节点数据反映了数据的时间序列性。
面板数据的数据结构
表 1 华东地区各省市 GDP 历史数据 1995 1996 1997 上海 江苏 浙江 安徽 福建 江西 2462.57 5155.25 3524.79 2003.66 2191.27 1244.04 2902.20 6004.21 4146.06 2339.25 2583.83 1517.26 3360.21 6680.34 4638.24 2669.95 3000.36 1715.18 单位:亿元 1998 1999 3688.20 7199.95 4987.50 2805.45 3286.56 1851.98 4034.96 7697.82 5364.89 2908.59 3550.24 1962.98
季 节 与 趋 势
时间序列的分解模型
乘法模型: 假定时间序列是基于4种成份相乘而成的
(长期趋势用绝对数表示,季节变动、周期变动、不规则 变动用相对数(百分数)表示,四个因子相互不独立)。 假定季节变动与循环变动为长期趋势的函数。该模型为: Yi=Ti×Si×Ci×Ii
加法模型: 假定时间序列是基于4种成份相加而成的 混合模型为:
(消除季节变动的影响)
(表明现象逐期的发展变动程度)
(表明现象在较长时期内总的发展速度)
年距发展速度
平均发展速度
设各个时期的发展水平为 a0,a1,a2,…,an
设时间数列中各 期发展水平为:
增长水平
逐期增长量 累计增长量
又称增长量
增长水平=报告期水平-基期水平
二者的关系


年距增长量
本期发展水平与去年同期水平之 差,目的是消除季节变动的影响
基本上不存在趋势的序列,各观察值基本上在 某个固定的水平上波动 或虽有波动,但并不存在某种规律,而其波动 可以看成是随机的
2. 非平稳序列 (non-stationary series)


有趋势的序列
线性的,非线性的
有趋势、季节性和周期性的复合型序列
时间序列的成分
时间序列 的成分 趋势 T 线性 趋势 季节性 S 非线性 趋势 周期性 C 随机性 I
序时平均数的计算方法
⑵由时点数ห้องสมุดไป่ตู้计算
①由连续时点数列计算
对于逐日记录的 时点数列,每变动 一次才登记一次
※间隔不相等时,采用加权算术平均法
【例】某企业5月份每日实有人数资料如下:
日 期 实有人数 1~9日 10~15日 16~22日 23~31日 780 784 786 783
序时平均数的计算方法 ②由间断时点数列计算
与横截面数据和时间序列数据的区别

从横截面(cross section)上看,面板数据是 由若干个体(entity, unit, individual)在某一 时刻构成的截面观测值;
从纵剖面(longitudinal
section)上看其
则是一个时间序列。 时间序列数据或截面数据都是一维数据。 时间序列数据是变量按时间得到的数据; 截面数据是变量在截面空间上的数据。
在Mann-Kendall检验中,原假设H0为时间序列数据(x1,x2,,xn),是n个独立的、 随机变量同分布的样本;备择假设H1是双边检验。对于所有的i,j≤n,且i≠j,xi和xj的分布 是不相同的。定义检验统计量S:
S sign( X i X j )
i 2 j 1
n
i 1
时间序 列分类
按变量 性质分
按变化 形态分
平稳性序列
趋势性序列
季节性序列
总量指标序列(绝对时间序列) 时期数列 时点数列
二 者 的 区 别
由反映一段时期内社会经济现象发展的总 量或总和的绝对数所组成的时间数列。 由反映一时点上社会经济现象所处的水平 的绝对数所组成的时间数列
1、各指标数值是否具有可加性。 2、各指标数值大小是否与其时间长短 直接相关。 3、各指标的数值的取得方式。是连续 登记还是一次性登记。
一季 度初 二季 度初 三季 度初
每隔一段时间登 记一次,表现为 期初或期末值
※间隔相等 时,采用简单序时平均法
四季 度初 次年一 季度初
※间隔不相等 时,采用加权序时平均法
一季 度初
90天
二季 度初
90天
三季 度初
180天
次年一 季度初
发展速度
指报告期水平与基期水平的 比值,说明现象的变动程度
(四个因子彼此独立,互不相关)。若以Y表示时间序列, 则加法模型为: Yi=Ti+Si+Ci+Ii
时间序列的分解步骤 1、加法模型 (1)根据时间序列,计算出移动平均数Mt , 分解出 趋势循环因子: Mt=Tt +Ct (2)分离季节因子:yt - Mt=St +It (3)计算季节因子的预测值 S ˆ t (4)建立趋势方程,计算各期趋势水平估计值 T ˆ t (5)计算循环因子估计值: ˆ C ˆ ˆ S Yt T t t t (6)根据各因子的估计值进行预测: ˆ ˆ ˆ ˆ
发展水平 指时间数列中每一项指标数值
它是计算其他时间数列分析指标的基础。
设时间数列中各期发展水平为:
( n项数据)
最初水平
中间水平
最末水平
( n+1 项数据)
或:
平均发展水平
又叫序时平均数,是把时间数列中 各期指标数值加以平均而求得的平 均数
一般平均数与序时平均数的区别:
计算的依据不同:前者是根据变量数列计算的,后
时间序列的成分
1. 趋势(trend)
持续向上或持续下降的状态或规律
季节性(seasonality)
2. 也称季节变动(seasonal fluctuation) 3. 时间序列在一年内重复出现的周期性波动
周期性(cyclity)
3. 也称循环波动(cyclical fluctuation) 4. 围绕长期趋势的一种波浪形或振荡式变动
时间序列分析:是一种根据动态数据揭示系
统动态结构和规律的统计方法。其基本思想:根 据系统的有限长度的运行记录(观察数据),建 立能够比较精确地反映序列中所包含的动态依存 关系的数学模型,并借以对系统的未来进行预报
趋势变化分析 确定性变化分析 周期变化分析 循环变化分析 随机性变化分析: AR、MA、ARMA模型
时间序列分析
时间序列趋势分析
目的
有些时间序列具有非常显著的趋势,分析的目 的就是要找到序列中的这种趋势,并利用这种 趋势对序列的发展作出合理的预测
常用方法
趋势拟合法 平滑法
趋势拟合法
趋势拟合法就是把时间作为自变量,相应 的序列观察值作为因变量,建立序列值随 时间变化的回归模型的方法 分类
2、环比增长率(环比增长速度)
报告期水平-前一期水平 环比增长率 100% 前一期水平
3、定基增长速度
报告期水平-基期水平 定基增长速度 100% 基期水平
年距增长速度
时间序列的分类
时间序列
平稳序列 非平稳序列
有趋势序列
复合型序列
时间序列的分类
1. 平稳序列(stationary series)
线性拟合 非线性拟合
线性拟合
使用场合
长期趋势呈现出线形特征
模型结构
xt a bt I t E ( I t ) 0,Var( I t )
例:拟合黄州区1949——2011年年末总人口序列
Mann-Kendall的检验方法用于检测序列的变化趋势, 属于非参数方法。非参数检验方法亦称无分布检验, 其优点是不需要样本遵从一定的分布,也不受少数异 常值的干扰,更适用于类型变量和顺序变量,计算也 比较简便。
平均增长量
逐期增长量的序时平均数
增长速度
表明社会现象增长程度的相对指标,它 是报告期的增长量与基期发展水平之比, 增长速度也叫增长率。
相关主题