当前位置:文档之家› 北航研究生数理统计第二次大作业-聚类分析

北航研究生数理统计第二次大作业-聚类分析

2 数据采集与标准化处理
本文选取的数据来自新浪体育 2014-2015 赛季欧冠冠军杯联赛数据库。选取 2014-2015 赛季欧洲冠军杯联赛参赛球队中的 29 支球队的 7 项技术指标作为分类 的自变量,分别为场均进球数,场均失球数,场均射门数,场均角球数,场均传 球数,场均抢断数和场均控球率(单位:%)。其中,从新浪欧洲联赛数据库[1] 中可以找出这 29 支球队在 2014-2015 赛季欧洲冠军杯中的进球数、失球数、射 门数、角球数、传球数和抢断数,再除以各个球队的比赛场次即可得到所需数据。 数据整理结果如表 2.1 所示:
类问题,使不同变量的数表 2.2 经标准化后的 29 支球队的 7 项技术指标
巴塞罗那 皇家马德里
波尔图 安德莱赫特
阿森纳 沙尔克 04 尤文图斯 莫斯科中央陆军
罗马 巴黎圣日耳曼 毕尔巴鄂竞技 马德里竞技
马里博尔 顿涅茨克矿工
巴塞尔 卢多戈雷茨
1
表 2.1 29 支球队的 7 项技术指标
巴塞罗那 皇家马德里
波尔图 安德莱赫特
阿森纳 沙尔克 04 尤文图斯 莫斯科中央陆军
罗马 巴黎圣日耳曼 毕尔巴鄂竞技
马德里竞技 马里博尔 顿涅茨克矿工 巴塞尔 卢多戈雷茨 切尔西 马尔默
曼城 本菲卡 里斯本竞技 加拉塔萨雷 阿贾克斯 鲍里索夫 利物浦 摩纳哥 泽尼特 奥林匹亚科斯 希腊人竞技
Z 场均 射门数 0.81280 2.35532 0.15770 -0.31077 0.05487 0.67188 0.05106 -0.18508 -0.75638 -0.22317 0.38622 0.04344 -0.56595 -1.37339 -0.23078 -0.05939 0.95753 -0.50120 -0.18508 -.31077 1.78401 1.02228 -0.50120 -1.13725 0.19579 -1.06108 -0.94682 -0.44026 -2.78641
北京航空航天大学 数理统计第二次大作业
欧洲足球俱乐部竞技水平的聚类分析和判别分析
2015 年 12 月
欧洲足球俱乐部竞技水平的聚类分析和判别分析
摘要:近年来,人们对足球的关注越来越多。欧洲作为足球的发源地,其五大联 赛自然吸引着大批人的目光。尤其是欧洲冠军杯联赛更是代表着欧洲足球的最高 水平,吸引着各国最好的球队参加。本文从参加 2014-2015 赛季欧洲冠军杯联赛 的球队中选取 29 支球队,根据这些球队的一些技术统计资料,用 SPSS 软件对 其进行聚类分析,将这些球队按水平层次分为了 5 类。并选取 3 支球队,利用聚 类分析的结果对这 3 支球队进行判别分析。结果表明,聚类分类结果与判别分析 结果基本符合实际情况。
场均抢 断数 20.31 19.83 22.30 23.33 21.13 18.38 17.08 20.83 17.33 21.20 24.17 22.10 16.17 19.38 20.75 18.33 22.75 15.33 18.25 20.50 19.17 21.33 19.50 18.00 21.50 26.10 19.83 16.83 24.00
场均射 门数 14.62 18.67 12.90 11.67 12.63 14.25 12.62 12.00 10.50 11.90 13.50 12.60 11.00 8.88 11.88 12.33 15.00 11.17 12.00 11.67 17.17 15.17 11.17 9.50 13.00 9.70 10.00 11.33 5.17
场均失 球数 0.85 0.75 1.20 1.67 1.38 2.38 0.77 2.17 2.33 1.50 1.00 0.50 2.17 1.38 1.63 2.33 0.75 2.50 1.38 1.00 2.00 3.17 1.67 4.00 1.50 0.50 1.00 2.17 2.00
Z 场均 角球数 0.11373 2.18400 -0.22977 0.02089 0.21585 0.09516 0.32725 -0.90749 -1.22314 0.51293 -0.44330 1.62698 -1.68732 0.32725 -0.83322 1.09780 1.37632 -1.83586 0.79144 1.09780 0.16943 0.94926 -1.68732 -0.13694 -0.75895 -0.50829 -0.13694 -0.44330 -1.37168
II
1 引言
近些年,随着中国经济水平的不断繁荣进步,人民群众的生活水平也得到了 进一步的提升,随之而然的是人们生活方式以及兴趣爱好的不断变化。从以前为 了解决温饱问题而努力工作,变为现在为提高生活质量而工作。足球,作为全球 体育界最具有影响力的单项体育运动,享有“世界第一运动”的美誉,自然渐渐 进入了人们的日常生活中。
切尔西 马尔默 曼城 本菲卡 里斯本竞技 加拉塔萨雷 阿贾克斯 鲍里索夫 利物浦 摩纳哥 泽尼特 奥林匹亚科斯 希腊人竞技
Z 场均 进球数 1.38632 0.86067 1.55232 -0.06614 1.20650 0.34885 -0.09380 1.55232 -0.06614 0.03069 -0.75779 0.16902 -0.97912 0.69468 -0.52263 -0.75779 1.55232 -0.97912 -0.17680 -1.44944 0.86067 -0.97912 -0.06614 -1.44944 -0.75779 -0.93762 -0.97912 0.40418 -1.67077
由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标
准化处理。本文采用 Z 得分值法标准化的方法进行标准化,用 x 的值减去 x 的
均值再除以样本的方差。也就是把个案转换为样本均值为 0、标准差为 1 的样本。
如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较
小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此
I
目录
1 引言.......................................................................................... 1 2 数据采集与标准化处理 ......................................................... 1 3 聚类分析.................................................................................. 3
Z 场均 传球数 2.22733 1.11925 0.66563 -1.14118 0.98926 0.36825 0.48045 -0.78635 0.39833 0.89430 -0.25692 -0.92040 -0.93842 -0.54552 -0.41598 -0.37712 1.00469 -1.41908 0.63725 -0.77881 -0.50846 0.14860 0.99151 -1.58804 0.40959 -0.94856 0.05285 -0.74129 -1.56551
欧洲是现代足球的发源地,也是世界足球的中心,欧洲五大联赛也享誉世界, 每年一次的欧洲冠军联赛作为欧洲足坛最高水平的赛事,自然是人们关注的焦点。 能够打进欧洲冠军杯联赛的足球俱乐部都是欧洲各国中最顶尖的俱乐部。对于一 些老球迷来说,他们对这些球队都有着足够的了解;而对一些刚开始看球的球迷 朋友们,很多人并不了解这些世界顶级足球俱乐部之间的水平层次情况。所以, 本文利用 SPSS 软件,从参加 2014-2015 赛季欧洲冠军杯联赛的 32 支球队中,选 取 29 支球队的参赛数据,用聚类分析的方法将其按实力水平分为几类,并选则 另外 3 支球队,根据已有的类别划分情况,进行判别分析,确定其所属的水平层 次。
Z 场均 失球数 -0.90720 -1.03184 -0.47093 0.11491 -0.24657 0.99990 -1.00691 0.73814 0.93758 -0.09699 -0.72023 -1.34346 0.73814 -0.24657 0.06505 0.93758 -1.03184 1.14948 -0.24657 -0.72023 0.52624 1.98461 0.11491 3.01918 -0.09699 -1.34346 -0.72023 0.73814 0.52624
场均传 球数 667.54 569.17 528.90 368.50 557.63 502.50 512.46 400.00 505.17 549.20 447.00 388.10 386.50 421.38 432.88 436.33 559.00 343.83 526.38 400.67 424.67 483.00 557.83 328.83 506.17 385.60 474.50 404.00 330.83
场均控 球率(%)
60.92 57.11 56.33 40.92 57.18 51.28 55.09 34.90 47.30 48.65 51.17 44.26 41.75 46.28 44.74 47.17 54.15 41.52 48.49 50.42 48.57 51.50 52.75 35.55 50.05 42.95 54.78 46.62 30.45
3.1 聚类分析概述 ................................................................. 3 3.2 输出结果及分类 ............................................................. 4 4 判别分析.................................................................................. 8 4.1 判别分析概述 ................................................................. 8 4.2 输出结果 ......................................................................... 8 4.3 判别分析 ....................................................................... 12 5 结论........................................................................................ 13 参考文献.................................................................................... 13
相关主题