当前位置:文档之家› 股票证券-毕业论文中国股票市场收益率分布曲线的实证研究 精品

股票证券-毕业论文中国股票市场收益率分布曲线的实证研究 精品

前言迄今为止,我国股票市场才经历十余年的发展历史,却走过了西方发达国家上百年的发展历程。

取得了举世瞩目的成绩。

在股票市场的规模、上市公司的数量、投资者的规模以及交易系统的完善等方面都得到了迅速的发展,目前已经进入世界股票市场的前列。

不过,由于我国股票市场发展时间比较短,是在探索中前进的,因此,在诸多方面还不成熟,最为明显的是股票市场大起大落,这种大幅波动对投资者造成很多不良后果。

经过无数次“风雨”洗礼后,投资者开始学会用在股票价格的波动中寻找规律,希望能够找到股市的制胜“法宝”。

然而,目前有关股票理论知识的书籍极多,各述其见,竟有“股票价格的波动有外部噪音引起,并服从正态分布”之说。

本论文试图把股票的理论联系实践,找到合理的规律,希望本论文能够给读者一点启发,对股票投资起一点参考价值。

本论文共分为两部分,第一部分对股票日收益率分布曲线作了实证分析,通过偏度峰度检验和2检验,得到市场收益率更多地呈现出偏离正态分布的形式,市场处在弱势非有效状态。

第二部分首先引入了灰色系统的理论和几个概念,利用关联分析,建立了模型,根据关联度大小对各股票的日收益率进行了排序,进而确定股票走势的优劣,并且对前后两个阶段的结果作了详细的比较。

由于时间仓促,论文中的不足和欠缺之处,还望得到各位老师和同学的不吝赐教。

在本论文的成长过程中,我得到了成都信息工程学院计算科学系杨老师的帮助,在此,向杨老师表示衷心的感谢。

摘要:本文首先对股票日收益率进行了偏度峰度检验和2χ检验,得到市场收益率更多地呈现出偏离正态分布的形式,市场处在弱势非有效状态。

然后,运用灰色理论的关联度对股票日收益率进行优劣排序,并对前后两个阶段的结果进行了详细比较。

关键词:收益率;正态分布;灰色理论第一章收益率分布曲线§1 收益率的分布与股票价格行为的理论股票价格总是处于不断的波动之中,这种波动是连续的,非间断性的。

股价的波动被认为由外部“噪声”因素造成,当时间间隔∆t —>0时,外部噪声将呈现正态分布,服从维纳过程。

因此随机理论采用一般化的维纳过程作为描述股价行为的模型。

数学表达式如下:),(t t u SS∆∆=∆σϕ (1) z S t u S ∆+∆=∆σ (2)其中:S ∆为短时间t ∆后股票价格s 的变化u 为单位时间内股票的预期收益率 σ为股票价格的波动率),(s m ϕ表示均值为m ,标准方差为s 的正态分布(1)式表示如果外来噪声服从正态随机过程,SS∆即收益率将服从均值为t u ∆,标准方差为t ∆σ的正态分布。

其中:t z ∆∈∆,∈表示服从标准正态分布,z ∆在维纳过程中被认为遵从马尔科夫过程,隐含市场是弱势有效的条件。

当收益率服从正态分布时,股价行为的一般化维纳过程式(2)才能成立。

当收益率的分布偏离了正态分布,这就意味着式(2)中的外部噪音项z s ∆σ就不服从正态随机过程。

也就是说,股价的行为方式不再服从正态马尔科夫过程,市场可能不处于弱势有效状态。

收益率的分布是股价行为的基础,要了解某股票市场价格行为的特征,必须了解该市场的收益率分布。

本文将对八只股票收益率的分布进行实证检验,考察是否符合正态分布或符合其t 分布形式或并无一确切表达的分布形式。

§2 实例与检验(一)、本文随机选取了八只股票的日收盘价作为实证样本,样本容量是从20XX 年1月4号到20XX 年3月31号的日收盘价个数。

为了形成对比,我们分成了两个阶段来研究。

前一阶段(20XX/1/4/~20XX/7/31的日收盘价数据见附录1.1.1):后一阶段(20XX/8/1/~20XX/3/31的日收盘价数据见附录1.1.2):本文采集日收盘价的数据来计算收益率,若以i s 表示第i 个交易日某种股票的收盘价, 假定已做过除权、除息处理,日收益率t R ,则计算公式为:11---=∆=i i i t s s s s s R (3) (二)、收益率分布的检验1、 正态分布理论:设收益率),(~2σu N X ,即X 服从参数为σ,u 的正态分布,则 概率密度为: ∞<<-∞=--x ex f u x ,21)(222)(σσπ (4)其中u 为平均收益率,)0(>σσ为收益率的标准差,)0(,>σσu 都为常数。

2、用偏度峰度法检验指数收益率的正态分布性(1)、偏度峰度检验理论随机变量X 的偏度和峰度指的是X 的标准化变量)()]([X D X E X -的三阶中心矩和四阶中心矩:数码网络日收盘价 20XX 年8月1号----20XX 年3月31号 四川湖山日收盘价 20XX 年8月1号----20XX 年3月31号 法尔胜日收盘价 20XX 年8月1号----20XX 年3月31号 天坛生物日收盘价 20XX 年8月1号----20XX 年3月31号 山东临工日收盘价 20XX 年8月1号----20XX 年3月31号 长城电工日收盘价 20XX 年8月1号----20XX 年3月31号 浙江医药日收盘价20XX 年8月1号----20XX 年3月31号2/3331))((]))([(]))()([(X D X E X E X D X E x E -=-=ν, 2442))((]))([(]))()([(X D X E X E X D X E X E -=-=ν。

当随机变量X 服从正态分布时,01=ν且32=ν。

假设n X X X ,,,21⋅⋅⋅是来自总体收益率X 的样本,则1ν,2ν的矩估计量分别是:22422/3231,B B g BB g ==.其中k B (k=2,3,4)是收益率样本的k 阶中心矩,∑=--=ni k i k X X n B 1)(1,1g 为收益率样本偏度,2g 为收益率样本峰度。

若总体x 为正态变量,则当n 充分大时,近似地有))3)(1()2(6,0(~1++-n n n N g))5)(3()1()3)(2(24,163(~22+++--+-n n n n n n n N g (2)、假设0H :股票日收益率服从正态分布 1H :股票日收益率不服从正态分布记,)3)(1()2(61++-=n n n σ)5)(3()1()3)(2(2422+++--=n n n n n n σ, 1632+-=n μ,111/σg u =,2222/)(σμ-=g u 。

当H 0为真且n 充分大时,近似地有1u ~N(0,1),2u ~N(0,1).样本偏度g 1、样本峰度g 2分别依概率收敛于总体偏度1ν和总体峰度 2ν,因此当H 0为真并且n 充分大时,一般g 1与1ν=0偏离不应太大,而 g 2与2ν=3的偏离不是很大。

故从直观来看当|1u |或|2u |过大时就拒绝H 0。

取显著性水平为α,H 0的拒绝域为|1u |≥1k 或|2u |≥2k 。

其中1k ,2k 由下面两式来确定:P 0H {|1u |>1k }=2α;P 0H {|2u |>2k }=2α即有1k =4/αz ,2k =4/αz ,于是得到拒绝域为:|1u |≥4/αz ,|2u |≥4/αz(3)、计算结果由matlab编程(程序见附录2.1)算得两个阶段的统计量和临界值如下:股票名20XX/1/4~20XX/7/31 20XX/8/1~20XX/3/31统计量临界值统计量临界值深赛格数码网络四川湖山法尔胜天坛生物山东临工长城电工浙江医药3.545636.23392.352236.675494.440293.93263.40617.94915.99155.99155.99155.99155.99155.99155.99155.9915154.4447208.618061.124312.8123312.677877.5101206.80061.13515.99155.99155.99155.99155.99155.99155.99155.9915由上面两个阶段的结果表比较知道:①、前一阶段有三只股票(深赛格,四川湖山,长城电工)的统计量小于临界值,故接受H,即表示这三只股票的日收益率符合正态分布。

浙江医药的统计量只比临界值稍大了一点,表示存在少量偏离均值的异常值。

天坛生物的统计量最大,表示存在大篇幅偏离均值的异常值而导致偏离正态分布的程度大。

②、后一阶段只有浙江医药统计量小于临界值,故在后一阶段里,只有一只股票的日收益率符合正态分布。

天坛生物的统计量比拒绝域的边界值超出了300多,可以看出这只股票含有很多偏离均值的异常值的,这种情况主要是股票的收盘价大起大落而造成日收益率出现异常值。

③、很明显,总体上后一阶段的统计量比前一阶段的大,说明后一阶段股票收盘价的波动幅度大,偏离均值的异常值多,呈现出不规则和不对称的程度大。

总之,股票收益率的分布图符合正态分布的共有四个,前一阶段有深赛格、四川湖山、长城电工三个,后一阶段只有浙江医药一个,由于限于篇幅,在这里只给出前一阶段的四川湖山和后一阶段的浙江医药两个图。

四川湖山股票收益率直方图(前):浙江医药股票收益率直方图(后):检验(程序见附录2.2),检验本文还对前后两个阶段的八只股票进行了2收益率是否服从t分布,很遗憾,所列出的八只股票全部不服从t分布.§3 总结1、我们采集了这八只股票的两个阶段的收益率,从整体上来讲,大部分都不符合正态分布,实际收益率分布说明了尚未满足正态马尔科夫过程,处于弱势非有效市场。

市场的收益率从整体来说都非常接近于零,而且正负侧都有,说明目前市场价格行处于比较平衡的状态。

2、前一阶段的五只股票和后一阶段七只股票不符合正态分布,而且是并无一确切表达的分布形式。

后一阶段的统计量比前一阶段的大,这表示后一阶段股票收盘价的波动幅度更大,呈现出不规则和不对称。

这种情况说明市场价格行为很大程度上偏离有效市场的价格行为。

总之,中国的股票收益率分布并不是完全服从正态分布,表明股票价格的波动并非完全有外来噪音造成的,还存在着一些非随机因素影响着股价,如:人为控制和操纵、快进快出等进行投机性活动,这需进一步完善、规范证券市场。

第二章各股票收益率排名§1 排名理论一、灰色系统理论客观世界的很多实际问题,其内部的结构,参数以及特征并未全部被人们了解,人们不可能像研究白箱问题那样将其内部机理研究清楚。

对于社会、经济、工业、农业等诸多领域的一些不确定性问题,通常是通过统计规律,概率分布对事物的发展进行预测,对事物的处置进行决策。

现有的系统分析的量化方法,大都是数理统计法如回归分析,方差分析,主成分分析等,回归分析是应用最广泛的一种方法。

但回归分析要求大样本,只有通过大量的数据才能得到量化的规律,这对很多无法得到或一时缺乏数据的实际问题的解决带来困难。

相关主题