当前位置:文档之家› 变系数模型的变量选择及在股票数据中的应用

变系数模型的变量选择及在股票数据中的应用

2009年11月四川大学学报(自然科学版)N ov.2009第46卷第6期Jour na l of Si c huan U ni ve r si t y(N a t ur a l Sc i enc e E di t i on)V01.46N o.6doi:103969/j.i ssn.0490’6756.2009.06.003变系数模型的木鲁又里选择及在股票数据中的应用邓金兰,王彬寰,樊仕利(四J II大学数学学院,成都610064)摘要:作者研究了纵向数据分析中变系数模型的变量选择及效应估计问题,该模型允许变量的效应随时间改变.本文方法在进行变量选择的同时,也估计变系数函数,避免了传统的变量选择方法极其复杂的计算.将本文方法用于股票价格分析,能够快速地在公司的众多财务变量中挑选出对股票收益率有显著影响的变量,并估计这些变量的时变效应,很好地解释股票收益率的变化.关键词:变量选择;变系数模型;局部线性;交叉验证中图分类号:0212.7文献标识码:A文章编号:0490—6756(2009)06—1585—07V ar i abl e s el ect i on of var yi ng-coef f ci ent m ode l sand i t s appl i cat i on on s t oc k da t aD E N GJ i n—Lan。

W A N GB i n—H uar l,FA N Shi-L i(Sch ool of M a t hem at i c s,S i chua n U ni ve r s i t y,C hengdu610064,C hi na)A bs t r ac t:T hi s pap er di scus ses t he var i a bl e s el ec t i on and es t i m at i on bas ed o n var yi ng—e oe f fc i e nt m odel s f or l o ngi t u di n al dat a.T he m ode l al l ow s t he ef f ec t of var i abl es t o var y w i t h t i m e.T he m et hod i n t h i s pa—pe res t i m at es t he f un ct i o ns of var yi ng—coef fc i e nt and se l e ct s var i abl es s i m ul t aneou s l y,w hi ch avo i ds t he i nt ens i ve co m put at i o n f or t he t ra di t i onal var i abl e s el ect i on.A ppl yi ng t h i s m e t hod t o s t o ck pr i c e,t he var i—abl es ar e s el ec t ed qui ckl y w hi c h have si gni f i c ant ef f ec t on t he r e t u r n r at e of s t o ck f r om t he num e r ous com p any fi na nc i a l var i abl es,a nd t he t i m e-var yi ng ef f ec t of t ho s e s i gni fi ca nt var i abl es coul d be es t i m at ed s i m ul t aneo us l y.T he r es ul t s s h ow t hat t hi s m e t hod w or ks w el l.K ey w or ds:v ar i abl e s el ec t i on,va ryi ng—c oe ff c i e nt m odel s,l ocal l i nea r,c ross—va l i da t i on1引嗣上市公司股价与公司基本面(财务信息)的关系一直受到国内外学术界和投资界的广泛关注,是西方发达国家证券市场研究中长盛不衰的课题.从表面上看,股价取决于市场供求关系,但从本质上来说,股票价格最终要受制于股票价值,遵循“价格围绕内在价值上下波动”的价值规律.影响上市公司股票价值的主要因素是公司的经营能力和管理能力,而公司的经营和管理能力主要是通过公司每个季度的财务基本面来体现的,因而研究上市公司的财务基本面对股票价格的影响关系具有重要的意义.国外研究(见文献[1,2])表明:上市公司股价与公司基本面具有显著的相关关系.B a l l和B r ow n (1968)(见文献[1])开创了上市公司基本面与股价变动关系的实证研究;O u和Penm an(1989)在文献[2]中选用了投资者比较关心的68个财务变量,对未来股票价格变化进行预测,得出的结论是公开收稿日期:2008—11一16基金项目:国家自然科学基金(10771148)作者简介:邓金兰(1983一),女,四川德阳人,硕士,主要研究向概率论与理统计及其应用.E-m ai l:c dj t一1024@163.CO f f l1586四川大学学报(自然科学版)第46卷的财务报告中包含了关于股票价格变化的信息;A bar banel l和B us hee(1997)在文献1-33中用9个分析师最常用的财务基本信息作为预测变量,也得到与O u和Penm an类似的结论.国内证券市场发展历史比较短,但也已有这方面的研究.陈信元(2001)在文献[4]中对预期股票收益的决定因素进行了横截面分析,得出的结论是财务信息对股价的解释力显著.然而,现有的研究都假定:财务基本面对股价的影响不随时问改变.实际上,这个假定很难成立.很多时候我们可以观察到财务基本面没有很大的改变,但股价有很大变化.其原因在于财务基本面对股价的影响可能与当时的经济环境及政策因素有关,但都经济环境及政策因素很难量化.本文仅研究行业的财务基本面对股价的影响如何随时问改变.在公司股价研究中,某些财务变量对股票收益率的影响有着滞后性以及超前性,使得自变量的数目变得很大.在研究初期为了降低可能的模型偏差,会选择尽可能多的财务变量建立一个庞大的模型,但是实际上不是所有的财务变量都对股票价格有影响,并且在众多财务变量里有些财务变量是高度相关的,因此需要去除多余财务变量和选出不相关的财务变量,这样可以大大简化模型.简化模型有如下两方面的原因:一方面,简化后的模型通常有较好的解释性及预测精度,另一方面,差不多在所有的模型中高维数据都会带来维数诅咒问题.因此,选择有显著影响的自变量子集是模型建立的必经过程.对传统的线性模型(即自变量的效应固定不变),有很多变量选择技术,比如最优子集选择,逐步回归选择和贝叶斯变量选择.但这些变量选择方法的计算相当复杂并且统计性质不清楚.F a n和L i(2001)cs3提出了基于非凹判罚似然的变量选择方法.不同于传统变量选择方法,他们通过将某些回归系数估计为0,选择显著变量的同时也估计回归系数,证明了适当选取判罚函数和相关参数,估计具有or ac l e性质,即不显著的自变量的系数自动估计为零,而显著变量的系数估计就好象潜在的真实的模型已知,并通过模拟说明了SC A D判罚函数优于其他几种方法.本文将SC A D变量选择方法从固定效应模型推广到时变效应模型,使不重要的财务指标被有效并快捷地删除的同时估计出重要的财务指标的效应变化规律.鉴于可变效应及庞杂的的财务及估值指标使得股票收益率的分析很困难,本文先用SC A D-y0罚方法选出时变系数模型中有显著影响的变量,再用局部线性方法估计出有显著影响的变量的效应函数.与传统的变量选择的方法比较。

本文的方法计算简单,模拟结果证实我们的方法合理有效,而股票收益率的分析结果也显示我们的时变系数模型更好的解释了财务变量与股票收益之间的关系.本文结构如下:第2节给出基于股票数据的基本模型;第3及4节基于S C A D判罚及局部线性方法,给出时变系数模型中的变量选择及效应估计;第5节用模拟数据考察估计方法的效果;第6节将本文方法用于分析股票数据;第7节本文内容的简单总结.2模型描述设t,表示第J次观察时问,Y,,表示第i只股票在t f时刻观察到的股票收益率,X i i一(X引,X j z,…,X叫)7是在时问t,测量的d维自变量(歹一1,2,…,T,i=1,2,…,九,),包括财务指标和估值指标.财务指标是财务报表公布的上一季度数据,以及证券公司研究员通过调研等方式得到的本季度和下一季度的财务指标预测数据,估值指标是在当期财务报表公布的前3个月的数据.变系数模型是传统的线性模型的一个很有用的推广.该模型假定自变量(z)对因变量(y)的影响不是常数,而是随某个变量的变化而变化.文献[6]详细讨论了变系数模型的产生背景以及用于不同数据背景下的变系数模型.特别的,当数据是纵向数据时,变系数模型经常被用于描述在不同时问X对y的效应系数是时间£的函数.即如下的时变系数模型:Y d=xi d(t』)+eⅡ(1)这里“是均值为零的不能被自变量解释的随机过程,p(‘,)表示财务指标和估值指标在时间t,对股票收益率的影响大小.在现有的股票价格的研究中,都假定它是固定的常数.如前文所述,这个假定在很多情况下是不合理的.本文假定财务指标和估值指标对股价的影响随时间改变,即口()是关于时间t的函数,用于反映经济及政治环境对股价的影响.文献[7]给出了光滑样条方法估计系数函数口(),但当自变量的维数很大时,因维数诅咒问题,这个方法不可用.文献[8]给出了更加简洁而且有效的两步估计方法.本文用SC A D及两步估计方法,选择显著变量并估计显著变量的系函8().第6期邓金兰等:变系数模型的变量选择及在股票数据中的应用3时变系数模型的变量选择当自变量过多时,需要删除不重要的变量,但在时变系数模型中自变量的系数是一个函数,这种情况下变量的选择是比较复杂的.就我们所知,在纵向数据研究中没有相关的研究工作.设咒j表示在时间t i观察到的样本个数.对每个给定的时间t j,L为在时间t J观察到的,zJ只股票收益率所组成的咒f维随机向量,X,为对应的行,×d 设计矩阵,ei为对应的7zi维随机噪声向量.模型(1)的矩阵形式为:I Y j—X J8(t i、)+2j,.{E(旬)=o,(2)(C ov(ej)=巩j。

相关主题