《应用统计软件》课程实验报告年级专业__09 保险_姓名_ 郭见鹄___学号_090142881_指导教师_ 王周伟__上海师范大学金融学院2012 年 5月成绩评定:实验项目二基于聚类分析——嘉实基金公司各产品绩效差异研究摘要嘉实基金(HARVEST FUND MANAGEMENT CO.,LTD.)拥有证券投资基金设立与管理、全国社保基金投资管理人、企业年金投资管理人、基金公司开展境外证券投资管理业务和基金管理公司特定客户资产管理业务资格。
截至2011年12月31日,资产管理规模超过2274亿元,居行业前列。
目前,嘉实旗下管理2只封闭式基金、28只开放式基金及多个社保组合和企业年金账户,共同基金产品线和资产管理业务种类齐全。
研究多个基金产品的绩效时,往往需要按一定的标准进行分类。
运用聚类分析法将各个基金按其业务发展的特点,进行分类符合实际。
本文主要采用理论分析与实证分析相结合的形式。
利用《金融界》数据库,将选出的各项指标进行量化,结合层次聚类和K-均值聚类两种方法,从不同角度对各基金进行划分,并建立指标分类过程和体系。
对嘉实基金公司旗下具有典型意义的、共14个基金产品的绩效进行分类。
同时,运用SPSS软件,将实证结果以图表的形式反映出来,为分类的依据及合理性提供佐证,分析每一类别基金的显著特征和绩效差异,从而得出结论,并对嘉实基金管理公司的发展提出建议。
关键词:嘉实基金产品;绩效差异;聚类分析AbstractHARVEST FUND has the establishment of securities investment funds , fund investment management, enterprise annuity management, the administration of overseas securities investment business and specific qualification for the customers’asset management business. As of December 31, 2011, the scale of assets under management is over 227,400,000,000 yuan, which ranks the forefront of industry.At present, HARVEST FUND manages 2 closed-end funds,28 open-end funds ,social fund portfolio and enterprise annuity accounts. The mutual fund product line and asset management business are of diversity. When studying the performance of multiple fund products, we often need a certain standard to classify. It is practical to apply clustering method to the classification of each fund according to its business characteristics.This paper combines theoretical analysis with empirical analysis .By using the JRJ database, the selected indicators are quantified and combined with two methods of hierarchical clustering and K - means clustering .From different angles, the funds are divided. Then the process and system of classification are established. A total of 14 fund products which are with typical significance are chosen for the performance classification. At the same time, in use of the SPSS software, the empirical results are reflected in the form of graphs and tables , which provide evidence on rationality and basis of the classification .Through the analysis on each category of fund characteristics and performance difference, conclusions can be got, which may help to make proposals on the development of Harvest Fund Management Company.Key words: Harvest Fund Products; Performance Differences; Cluster Analysis目录实验项目二基于聚类分析——嘉实基金公司各产品绩效差异研究 (3)摘要 (3)Abstract (4)1、绪论 (6)1.1研究背景 (6)1.2研究目的和意义 (6)1.3研究对象和范围 (6)1.4研究方法 (7)2、相关理论回顾 (8)2.1 聚类分析的思想和原理 (8)2.2 层次聚类 (9)2.3 K-均值聚类 (9)3、样本选择与数据收集 (11)3.1 样本的选择 (11)3.2 数据的处理 (11)4、实证研究结果分析 (14)5、结论 (21)参考文献 (22)附件:主要操作步骤 (23)1、绪论1.1研究背景1999年3月,嘉实基金(HARVEST FUND MANAGEMENT CO.,LTD.)经中国证监会批准成立,并于2005年6月成为合资基金管理公司,目前嘉实的股东为中诚信托有限责任公司、立信投资有限责任公司与德意志资产管理公司。
嘉实拥有证券投资基金设立与管理、全国社保基金投资管理人、企业年金投资管理人、基金公司开展境外证券投资管理业务和基金管理公司特定客户资产管理业务资格。
截至2011年12月31日,资产管理规模超过2274亿元,居行业前列。
嘉实基金管理公司在同行业中具有较大的影响力,其打造出了具有不同风格稳定投资观的品牌基金,是数百万客户的投资选择。
在业绩、产品、服务这三个方面,其综合实力也不容小觑。
在如今变幻莫测的市场环境中,有如此的卓越的业绩,其背后的原因值得我们探究。
1.2研究目的和意义目前,嘉实旗下管理2只封闭式基金、28只开放式基金及多个社保组合和企业年金账户,共同基金产品线和资产管理业务种类齐全。
研究多个基金产品的绩效时,往往需要按一定的标准进行分类。
运用聚类分析法将各个基金按其业务发展的特点,进行分类符合实际。
本文以研究嘉实基金管理公司各基金产品的绩效差异为目的,建立一定的指标分类体系,将不同绩效特征的基金加以区分。
从实证得到的研究结果,分析比较嘉实基金管理公司旗下各基金产品的差异性,对不同基金产品存在的问题,基金管理公司未来的发展提出相应的建议,也会基金投资者提供参考标准。
1.3研究对象和范围本文选取了嘉实基金公司旗下具有典型意义的14个基金产品,主要涉及12个开放式基金:嘉实增长、嘉实稳健、嘉实成长、嘉实货币、嘉实短债、嘉实300、嘉实海外、嘉实策略、嘉实主题、嘉实债券、嘉实服务、嘉实优质。
其中,既有股票型或者混合型,也有债券型基金即嘉实债券、嘉实短债,还有货币型基金和指数型基金:如嘉实货币、嘉实300。
另外,样本中还包含了2个封闭式基金:基金丰和、基金泰和。
每个样本测得多个变量,这些指标包括基金运作时间、基金资产总值、管理费用(率)、单位净收益、基金净值增长率、累积净值增长率,基金经理的累积任职时间等。
1.4研究方法本文主要采用理论分析与实证分析相结合的形式。
利用《金融界》数据库,将选出的各项指标进行量化,结合层次聚类和K-均值聚类两种方法,从不同角度对各基金进行划分,并建立指标分类过程和体系。
同时运用SPSS软件,将实证结果以图表的形式反映出来,为分类的依据及合理性提供佐证,分析每一类别基金的显著特征和绩效差异,从而得出结论,并对嘉实基金管理公司的发展提出建议。
2、相关理论回顾2.1 聚类分析的思想和原理2.1.1 聚类分析的基本原理聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。
聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy) 。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。
传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。
采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS 、SAS 等。
根据样本的观测数据测度变量之间的相似性程度可以使用夹角余弦、Pearson 相关系数等工具,也称为相似系数。
变量间的相似系数越大,说明它们越相近。
根据变量来测度样本之间的相似程度则使用“距离”。
把离得比较近的归为一类,而离得比较远的放在不同的类。
2.1.2 相似性的度量聚类分析中是用“距离”或“相似系数”来度量对象之间的相似性。
在对样本进行分类时,度量样本之间的相似性使用点间距离。
点间距离的计算方法主要有: 欧氏距离(Euclidean distance)平方欧氏距离(Squared Euclidean distance) Block 距离(Block distance)Chebychev 距离(Chebychev distance) 马氏距离(Minkovski distance) 最常用的是平方欧氏距离。
在对变量进行分类时,度量变量之间的相似性常用相似系数,测度方法有 夹角余弦 :∑=-pi i iy x12)(∑=-pi i iy x12)(∑=-p i ii y x 1ii y x -max qpi qii y x ∑=-1∑∑∑=iiii i iixy y x y x22cos θPearson 相关系数 :2.2层次聚类层次聚类又称系统聚类。