当前位置:文档之家› 数据分析课程设计-NBA球员技术统计分析报告

数据分析课程设计-NBA球员技术统计分析报告

《数据分析方法》课程设计成绩评定表学生姓名严震班级学号1109010114专业信息与计算课程设计题目NBA球员技科学术统计分析报告评语组长签字:成绩日期20年月日《数据分析方法》课程设计课程设计任务书学院理学院专业信息与计算科学学生姓名严震班级学号1109010114课程设计题目NBA 球员技术统计分析报告实践教学要求与任务 :设计要求(技术参数):1、熟练掌握SPSS 软件的操作方法;2、根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型;3、运用 SPSS 软件,对模型进行求解,对结果进行分析并得出结论;4、掌握利用数据分析理论知识解决实际问题的一般步骤。

设计任务:1、查阅相关资料,找到NBA 球员技术的相关指标,获得相关数据;2、利用数据分析的理论,建立线性回归模型,以及对其进行主成分分析;3、利用 SPSS软件求解 , 并给出正确的结论。

工作计划与进度安排 :第一天——第二天学习使用SPSS 软件并选题第三天——第四天查阅资料第五天——第六天建立数学模型第七天——第九天上机求解并完成论文第十天答辩指导教师:专业负责人:学院教学副院长:201年月日201年月日201年月日II摘要数据分析析的主要应用有两方面,一是寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的,相互独立的随机变量),以再现因子与原变量之间的内在联系;二是用于分类,对p个变量或 n 个样品进行分类。

聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是通过定义样品或变量间“接近程度”的度量,将“相近”的样品或变量归为一类。

本文利用利用数据分析中的因子分析和聚类分析对多个变量数据进行了分析。

就是分析和处理数据的理论与方法,数据分析中提出了广泛的多元数据分析的统计方法,包括线性回归分析、方差分析、因子分析、主成分分析、典型相关分析、判别分析、聚类分析等。

关键词: spss 软件 ; 聚类分析 ; 因子分析 ; 线性规划目录1数据分析的任务和目的 (1)1.1问题的背景 (1)1.2任务和目的 (1)2数据的搜集与整理 (3)2.1数据的来源 (3)2.2数据的处理 (3)3利用 SPSS软件对结果进行分析 (5)总结 (15)参考文献 (16)1数据分析的任务和目的1.1问题的背景一年一度的 NBA 赛季让全世界的篮球迷为之疯狂,NBA 赛事之所以如此受欢迎,最主要的原因在于NBA 球员高超的球技。

球队中灵魂人物的个人发挥能够直接影响其球队的成败。

因而对他们的技术统计与分析是一件十分重要的事情。

众所周知,科比 -布莱恩特和阿伦 -艾弗森是深受大家喜爱的两位球员,两位球员在赛季的发挥也在一定程度上影响着两队的战绩。

因此,通过两位球员在以往的赛季中的发挥及表现,可以大概的预测两人的得分及表现,为NBA 相关的商业活动和广大球迷提供数据上的参考。

1.2任务和目的1、频数分析(对两人平均每场上场时间进行频数分析)2、基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)3、单样本 t 检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均值是否为 2.7)4、两独立样本 t 检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)5、单样本非参数假设检验(检验科比 -布莱恩特平均每场进攻次数与首发的关系基本是否为 1:1:10: 10:10:10:10:10: 10:10:2)6、单样本非参数假设检验(检验科比 -布莱恩特和阿伦 -艾弗森平均每场盖帽次数总体的分布是否为正态分布)7、单样本非参数假设检验(检验科比 -布莱恩特在某段时间内平均每场得分是否持续正常 )8、单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦 -艾弗森平均每场防守次数对平均每场得分有无显著影响)9、相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系)10、偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中率与平均每场得分的偏相关关系)11、线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性回归方程)12、曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)2数据的搜集与整理2.1数据的来源《 NBA 球员科比 -布莱恩特和阿伦 -艾弗森 11 个赛季技术统计表》下载自NBA 中文官方网站 ,具有可信度。

2.2数据的处理定义视图数据视图:《数据分析方法》课程设计3 利用 SPSS 软件对结果进行分析( 1)频数分析 (对两人平均每场上场时间进行频数分析)数据文件中增加一个变量 scsj 。

NBA 球 员 * 分 组 后 上 场 时 间 CrosstabulationCount分组后上场时间12TotalNBA 阿伦-艾弗森 1 10 11 球 员 科比-布莱恩特7 4 11 Total81422输出 1Chi-Square TestsAsymp. Sig. Exact Sig. Exact Sig.Valuedf(2-sided)(2-sided)(1-sided)Pearson Chi-Square 7.071b1 .008 Continuity Correction a 4.911 1 .027 Likelihood Ratio 7.7191.005Fisher's Exact Test.024.012N of Valid Cases22a. Computed only for a 2x2 tableb. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 4.00.分析:从输出 1 中看出,阿伦 10-40 (分钟)的频数为 1,在 40-50 (分钟)的频数为 10;科比 - 布莱恩特平均每场上场时间在 10-40 (分钟)的频数为 7,在 40-50(分钟)的频数为 4;两人平均每场上场时间在 10-40(分钟)的频数为 8,在 40-50 (分钟)的频数为 14。

从输出 2 中看出,交叉分组下的频数分析卡方检验结果的相伴概率为 0.008 ,小于显著性水平 0.05 ,故拒绝原假设,认为两人的平均每场上场时间 存在显著性差异。

( 2)基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)实现按 NBA 球员拆分,输出结果放在同一张表中。

- 艾弗森平均每场上场时间在输出 2Descriptive StatisticsNBA球员科比-布莱恩特平均每场投篮命中率平均每场三分球命中率平均每场罚球命中率N Minimum Mean Std.Skewness Statistic Statistic Statistic Std. ErrorDeviationStatistic Std. ErrorStatistic11.4170.449364.005401.0179124-.580.66111.2500.324636.012164.0403442-.503.66111.7940.831909.005513.0182836-.736.661Valid N (listwise)阿伦-艾弗森平均每场投篮命中率平均每场三分球命中率平均每场罚球命中率Valid N (listwise)1111.3870.419636.006128.0203237.666.661 11.2340.300909.009339.0309724-.706.661 11.7020.778818.016848.0558799.248.661 11输出 3分析:从输出 3 中看出,科比 -布莱恩特的平均每场投篮命中率、平均每场三分球命中率和平均每场罚球命中率的均值均比阿伦-艾弗森高,但标准差有高有底,说明在投篮方面科比 -布莱恩特比阿伦 -艾弗森发挥出色,但稳定程度高低不定。

均值的统计误差均小于0.05(比较小),说明数据没有不均衡现象,说明两人的发挥都比较稳定。

( 3)单样本t检验(检验科比 -布莱恩特和阿伦 -艾弗森平均每场犯规次数的均值是否为 2.7)实现按 NBA球员拆分,输出结果放在同一张表中。

One-Sample TestTest Value = 2.795% ConfidenceInterval of theMean Difference NBA球员t df Sig. (2-tailed)Difference Lower Upper 阿伦-艾弗森平均每场犯规次数-4.79910.001-.6818-.9984-.3652科比-布莱恩特平均每场犯规次数.29710.773.0473-.3079.4025输出 4分析:从输出4 中得,阿伦-艾弗森单样本假设的相伴概率为0.001,小于显著性水平0.05,故拒绝原假设,认为阿伦-艾弗森平均每场犯规次数的均值与2.7 有显著性差异;科比 -布莱恩特单样本假设的相伴概率为 0.773,大于显著性水平 0.05,故接受原假设,认为科比 -布莱恩特平均每场犯规次数的均值与 2.7 无显著性差异。

( 4)两独立样本t检验(科比 -布莱恩特和阿伦 -艾弗森平均每场犯规次数比较)Independent Samples TestLevene's Test forEquality of Variances t-test for Equality of Means95% ConfidenceInterval of theMean Std. Error DifferenceF Sig.t df Sig. (2-tailed)DifferenceDifference Lower Upper 平均每场犯规次数 Equal variances assumed.893 3.41420.003.7291.21355.28363 1.17455.019Equal variances not3.41419.740.003.7291.21355.28326 1.17492assumed输出 5分析:从输出 5 中看出,两独立样本 F 检验结果的相伴概率为0.019 ,小于显著性水平0.05 ,故拒绝原假设,认为阿伦 -艾弗森与科比 -布莱恩特平均每场犯规次数的方差有显著性差异;两独立样本 t 检验结果的相伴概率为 0.003 ,小于显著性水平0.05 ,故拒绝原假设,认为阿伦 -艾弗森与科比 -布莱恩特平均每场犯规次数的均值有显著性差异。

(5)单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发的关系基本是否为 1:1:10:10: 10:10:10: 10:10: 10:2)赛季Observed N Expected N Residual11.1.921 1.2-.231 1.2-.241 1.2-.251 1.2-.261 1.2-.271 1.2-.281 1.2-.291 1.2-.2101 1.2-.2111.2.8Total11输出 6Test Statistics赛季Chi-Square a9.291df10Asymp. Sig..505a.11 cells (100.0%) have expected frequencies lessthan 5. The minimum expected cell frequency is .1.输出 7分析:从输出 7 中看出,非参数假设检验卡方分布的相伴概率为0.505 ,大于显著性水平 0.05 ,故接受假设,认为样本来自的总体分布与理论分布无显著差异,即科比 -布莱恩特与首发的关系基本是为1:1:10:10:10: 10:10:10:10:10:2。

相关主题