公众投资者信息获取与风险态度等方面的影响模型摘要:经济改革促进我国证券市场高速发展,引起人们广泛关注,投资者希望充分把握各种证券信息,但发行方却视之为商业机密,证券发行人为了出售证券,虽然不得不向投资者公开某些信息,但信息公开程度系以满足证券销售为最高限度。
在采取信息自愿公开的时期,信息公开的范围和方式、信息公开的时间性或者时效性、信息的真实性及准确性等方面,都是站在发行人立场上作出判定的,因此,难免出现损害投资者利益的情形。
针对投资者受损害的情景,本文对博雅证券研究所所提供的一些数据资料进行量化分析。
问题一:对于个人状况,信息获取方式,媒体信任度,风险态度的提出,我们用综合评价的定量分析法中的主成分分析法对所给数据进行分析处理。
利用spss 软件分别对基本信息、投资习惯、外部因素影响、对待风险的态度的四部分调查问卷进行处理,可以得到其特征值,贡献率,累计贡献率,确定主成分元素,提出个人状况,信息获取方式,媒体信任度,风险态度。
问题二:对于个人状况,信息获取方式,媒体信任度,风险态度他们之间的相关性分析,我们利用excel软件中的统计函数的correl函数求他们确定主成分元素之间的相关性系数,通过比较他们之间相关性系数的大小确定其相关性的大小。
问题三:向公众投资者和证券监管部门提出相应意见,通过比较已经得出的公众投资者的个人状况,信息获取方式,媒体信任度,风险态度之间的相关系数向公众投资者和证券监管部门提出相应意见。
最后,我们进行对模型优缺点的客观评价,模型的改进及模型推广。
关键字:主成分分析,数据降维,相关系数,spss公众投资者信息获取与风险态度等方面的影响模型一、问题重述几十年来,经济改革的成就之一是我证券市场的高速发展,实现个人财产性收入已引起人们的广泛关注.投资想者希望能够充分地把握各种证券信息,但发行方有时却会视公司信息为其独占信息,甚至视之为发行人的商业秘密。
证券发行人为了出售证券,虽然不得不向投资者公开某些信息,但信息公开程度系以满足证券销售为最高限度。
在采取信息自愿公开的时期,信息公开的范围和方式、信息公开的时间性或者时效性、信息的真实性及准确性等方面,都是站在发行人立场上作出判定的,因此,难免出现损害投资者利益的情形。
附录中给出了博雅证券研究所所掌握的一些数据资料,请你们根据这些数据资料,利用数学建模的方法,提出以量化分析为基础的公众投资者的个人状况、信息获取方式、媒体信任程度、风险态度等,并分析他们之间的相关性,同时向证券监管部众投资者提供一些建议。
二、模型假设与符号说明2.1 模型假设1. 假设调查问卷和调查问卷统计表中的数据能够购代表投资者群体的基本情况;2. 表中数据真是可靠且不存在人为误差;2.2 符号说明表示问题1,问题2,问题3……问题47;表示主成分载荷矩阵中的数据;表示主成分中各指标所对应的系数;表示新的综合变量;表示主成分;表示相关系数;三、问题分析3.1问题一的分析由于调查问卷数据统计表中的数据很多,要提出公众投资者的个人状况、信息获取方式、媒体信任程度和风险态度是困难的,在调查问卷中各个问题之间会存在一定的相关性,通过主成分分析方法消减变量个数,将众多的原有变量综合成较少几个综合互不相关的指标(主成分),并且这几个综合指标能够反映原有变量的绝大部分信息。
通过spss软件和主成分的计算方法来分别找出公众投资者的个人状况、信息获取方式、媒体信任程度和风险态度这4部分的综合指标。
通过每个部分的综合指标来确定公众投资者的个人状况、信息获取方式、媒体信任程度和风险态度。
3.2问题二的分析由于要分析公众投资者的个人状况、信息获取方式、媒体信任程度和风险态度之间的相关性,即要求出他们之间的相关系数。
相关系数可以通过excel软件中的统计函数的correl函数来实现。
3.3问题三的分析向公众投资者和证券监管部门提出相应意见可以根据问题二已经得出的众投资者的个人状况、信息获取方式、媒体信任程度和风险态度之间的相关系数,综合比较他们之间相关系数的大小,向公众投资者和证券监管部门提出相应意见。
四、模型建立与求解4.1模型准备4.1.1 主成分分析的概念主成分分析是数学上对数据降维的一种常用方法。
其基本思想是:设法将原来众多的具有一定相关性的指标例如:x1,x2,x3……xp(比如p个指标),重新组合成一组较少个数互不相关的Fm来代替原来指标,Fm的计算要通过计算和实验才能得到。
这个过程就是主成分计算。
4.2问题一的模型建立与求解4.2.1 模型建立:(以问题一的公众投资者的个人状况为例)对于如此多的样本数,要从原来所有变量得到新的综合变量,一种较为简单又常用的方法就是利用SPSS得到主成分载荷矩阵中的数据,再利用主成分载荷矩阵中的数据得到主成分中各指标所对应的系数,进一步作线性变换,新的综合变量为原来的线性组合。
通过推导可知,q1,q2,q3,……q16的主成分就是以协方差矩阵∑的特征向量为系数的线性组合。
他们互不相关,其方差为∑的特征根。
由于∑特征根,所以有,因此新的综合变量的有效成分的选取是按特征根取值的大小顺序来进行的。
针对本课题,我们选取了特征值大于1的6个数据作为有效变量,实现了新的综合变量的表达。
表1如下表所示:投资者个人状况有616个样本,每个样本有16个变量,其中这16个变量为博雅证券研究所对公众投资者个人情况的调查问题。
每个问题分别用q1,q2,q3……q16表示。
中的数据。
实现过程如下图1,图2及图3所示:(图1)(图2)(图3)其中,图2可读取特征值、贡献率和累积贡献率,图3为主成分载荷矩阵中的数据。
用主成分载荷矩阵中的数据除以主成分相对应的特征值开平方根就得到两个主成分中每个指标对应的系数。
公式如下:对应在spss软件中实现如下图4、图5所示:(图4)(图5)图4为计算主成分中各指标所对应的系数的过程,图5为得到的结果。
利用新的综合变量表示公式,结合指标系数即可写出新的综合变量表达式。
其中,新的综合变量表达式为:由于得到的指标系数集中在0.3左右,所以我们选取指标系数绝对值大于0.4的变量作为有效指标系数。
因此,投资者的基本信息的新的综合变量表示为:进一步计算主成分Y,由即可得投资者基本信息主成分的表达式:代入即可得:考虑到问题过多,我们取系数绝对值大于0.04的问题作为可参考量,所以,主成分的表达式进一步化简为:同理可得:4.2.2 模型分析由表达式和所对应的问题分析可得:1.个人状况:主要与公众投资者的性别,年龄,教育程度,入市时间,股票投资知识来源,是否参加过培训有关。
2.信息获取方式:主要与股票持有数,是否会分析财务报表,股票脱手前持有时间,是否有投资失败经历,认为投资经验是否有帮助,自我投资水平评价有关。
3.媒体信任度:主要与是否参考朋友意见,是否会看财经报道,信息渠道,投股时是否接受专业人士和媒体意见有关。
其中,媒体信任度与是否参考朋友意见、信息渠道、是否接受专业人士和媒体意见成正相关,与是否会看财经报道成负相关。
也就是说,若投资者对媒体的信任度很高的话,就会在投股时更多地接受专业人士和媒体的意见;若投资者具备看财经报道的能力,就会较少的参考媒体的意见,与事实相符。
4.风险态度:主要与对短期和长期购买的股票下跌的应对措施、是否抓住机会贷款投资有关。
其中,风险态度与短期股票下跌的应对措施负相关与其余因素正相关。
也就是说,购买的股票时间越短,风险越低;风险度随投资买股票次数的增加而变大。
4.3问题二中相关性分析4.3.1相关系数的求解公众投资者的个人状况、信息获取方式、媒体信任程度和风险态度之间的相关性,可以通过求解其两两之间的相关系数来分析。
相关系数可以通过excel软件中的correl函数来实现,对主成分表达式中各问题的系数进行处理。
具体实现过程如下图5、图6和图7:(图5)(图6)(图7)其中,图6为相关系数求解过程,图7为求解结果。
4.3.2相关系数结果分析因为相关系数r介于-1和1之间,当r的绝对值越接近1时,说明两个变量的相关程度越大,反之越小。
r大于0时,二者正相关,r小于0时,二者负相关。
由图7可得,个人状况和信息获取方式相关程度最大,信息获取方式与风险态度相关程度最小,也就是说,个人对投资市场的了解决定了投资者获取信息的途径,而获取信息方式的不同对投资者面临的风险度几乎无关,与实际相符。
4.4问题三中向公众投资者和证券监管部门提的意见由问题一和问题二中得到的结论向公众投资者提出以下建议:1.因为个人状况与信息获取方式相关系数最大,而决定个人状况的最要因素为年龄和教育程度,因此建议投资者根据自身年龄及文化水平有选择性的适当进行风险投资,2.因为风险度会随着投资时间增长和投资次数的增加而变大,所以,建议投资者少进行长期投资,多了解股票信息,切勿盲目多次风险投资。
3.因为信息获取方式与风险度相关性最小,所以建议投资者不要把投资重心放在信息方式选择上。
由问题一和问题二中得到的结论向证券监督部门提出以下建议:因为个人状况和信息获取方式成最大负相关,所以建议证券监管部门向证券发行方出台一些政策,使得公众投资者者能够更多了解证券发行方的信息。
又个人状况和媒体信任度相关系数较大,因此建议证券监督部门加大对证券发行方公关媒体的管制规范。
五、模型评价5.1模型优缺点5.1.1模型优点(1) 问题(1)中,建立的主成分分析模型是用少数的几个变量来综合反映原始变量的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85 %以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。
并且新的变量彼此间互不相关,消除了多重共线性。
在主成分分析中,最终确定的新变量是原始变量的线性组合。
因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的作用,为我们处理数据降低了难度,简单快速。
(2)问题(1)中,最终得到的为主成分与问题间的线性关系,根据各问题的系数的大小及正负可判断出影响“投资者基本信息、投资习惯、外部影响因素、对待风险态度”的主要因素以及影响方向,很直观明了。
(3)问题(2)中,利用excel实现相关系数的计算,得到了“投资者基本信息、投资习惯、外部影响因素、对待风险态度”四个方面中两两方面的相关系数,根据相关系数的正负以及其绝对值与1的关系判断出了相关性大小,容易操作。
(4)问题(3)中,结合问题(1)和问题(2)中的数据,结合网络资源,实现了数据与现实的有效结合,向证券监督部门和投资者提出建议,比较合理。
5.1.2模型缺点(1)问题(1)中主要成分模型的建立,在表示新的综合变量时,对于主成分中各指标所对应的系数进行了保留小数点后两位的措施,可能会带来部分误差。