1314赛季NBA球员数据的聚类分析研究.doc

上传人:sccc 文档编号:5517699 上传时间:2023-07-16 格式:DOC 页数:25 大小:510.23KB
返回 下载 相关 举报
1314赛季NBA球员数据的聚类分析研究.doc_第1页
第1页 / 共25页
1314赛季NBA球员数据的聚类分析研究.doc_第2页
第2页 / 共25页
1314赛季NBA球员数据的聚类分析研究.doc_第3页
第3页 / 共25页
1314赛季NBA球员数据的聚类分析研究.doc_第4页
第4页 / 共25页
1314赛季NBA球员数据的聚类分析研究.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《1314赛季NBA球员数据的聚类分析研究.doc》由会员分享,可在线阅读,更多相关《1314赛季NBA球员数据的聚类分析研究.doc(25页珍藏版)》请在三一办公上搜索。

1、 “R软件”课程综合作业姓 名: 解宇涵 学 号: 20112319 年 级: 2011级 班 级: 统计(2)班 学院及专业: 数学与统计学院 任课教师: 张应应 上课时间: 2014 年 4 月至2014 年 6 月 考 生 成 绩: 阅卷评语: 阅卷教师 (签名) 13-14赛季NBA球员数据的聚类分析研究摘要勒布朗詹姆斯作为NBA历史上处于前列的球员又一次在总决赛与冠军失之交臂。再一次把James推向舆论声中,但简单地根据比赛结果评价一个球员是盲目的。本文分析的重点将定为20132014赛季的NBA球员,主要意图是对该赛季James在联盟中的地位分析。本文将运用R软件进行计算,运用直观

2、分类,聚类分析模型,主成分分类模型,假设检验得出全能的James的打球风格更接近哪一类球员,在该类球员中James的能力处于什么水平。运用直观分类及聚类分析,从官方确定的5个位置出发,比较James与每一个位置球员的得分能力,James在联盟中属于强核心球员,得分效率较高但没有显著地高于平均水平。因为同一个位置的球员,打球风格也各异。考虑对全联盟的高水平球员进行聚类分析。为克服变量过多、变量之间的相关性的影响,运用主成分分析将21个变量降维至3个主成分,再运用各球员的主成分得分进行聚类分析。最后通过分析得到James的属于“进攻型内线球员”,综合能力处于该类前列,得分效率较高但没有显著地高于平

3、均水平。关键词:体育统计 聚类分析 主成分分类 假设检验 R软件 NBA 勒布朗詹姆斯目录摘要I目录II1. 绪论11.1选题的背景和意义11.2论文综述11.3本文主要研究思路与文章结构安排11.3.1本文的研究思路11.3.2本文的文章结构安排22. NBA的统计资源32.1 NBA统计的原始数据32.1.1数据来源:32.1.2 符号说明32.2 本文的数据处理42.2.1得分效率42.2.2得分频率42.3待测球员的选取42.3.1 PF的球员筛选52.3.2 待测球员准入原则53. James在联盟中的地位分析73.1基于球队位置的聚类分析73.1.1 PF的聚类分析73.1.2其他

4、位置的聚类分析93.1.3 得分效率均值的显著性检验113.2在主成分分析下的聚类模型133.2.1 主成分分析模型133.2.2 高水平球员数据的主成分分析153.2.3 主成分得分173.2.4 基于主成分得分的聚类分析18参考资料221. 绪论1.1选题的背景和意义体育统计学在全世界得到广泛的应用和重视,各种统计软件,如R软件,不断升级和普及,使得普通球迷也能根据比赛的具体数据,进行更具体和及时的统计分析,来评价球员或球队水平、预测比赛胜负及具体结果。本文选择篮球比赛数据为研究内容,以著名球员James为研究对象,使得论文的内容和结果具有意义1.2论文综述统计技术已经在篮球比赛中得到广泛

5、应用,中外学者都试图通过比赛数据,选取适当的统计技术,揭露运动员存在的问题。由于本文篇幅所限,下面仅具体介绍几篇论文的情况。常庆用逐步回归分析方法研究篮球比赛中诸因素与胜负的关系寻找描述篮球比赛中各结束因素之间依存关系的数学表达式。向政2003-2004赛季NBA篮球联赛火箭队与湖人队实力比较分析,采用文献资料法,观察法,数理统计法。从季后赛5场比赛的投篮命中率、篮板球、失误、犯规及心理承受能力进行比较分析。陈卫02-07赛季姚明在NBA进攻情况的分析,运用统计法、文献资料法、观察法、比较分析法,分析在02-07赛季进攻情况的优劣,通过对姚明在NBA进攻的方式、方法归纳,比较姚明和其他NBA优

6、秀中锋的进攻规律和特点、优势和不足,总结出优秀中锋的发展方向和今后训练的侧重方向。李国岩2005-2006NBA常规赛姚明技术指标探析,客观评价姚明在新赛季的竞技能力,姚明的相关比赛指标与球队的胜负有一定的规律性关系。1.3本文主要研究思路与文章结构安排1.3.1本文的研究思路勒布朗詹姆斯作为NBA历史上处于前列的球员又一次在总决赛与冠军失之交臂。再一次把James推向舆论声中,但简单地根据比赛结果评价一个球员是盲目的。本文分析的重点将定为20132014赛季的NBA球员,主要意图是对该赛季James在联盟中的地位分析。本文将运用直观分类,聚类分析模型,主成分分类模型得出全能的James的打球

7、风格更接近哪一类球员,在该类球员中James的能力处于什么水平。本文首先从球员的得分能力出发,根据NBA统计专家惯用的数据处理方式,定义出“得分效率”和“投篮频率”评价球员的得分能力。为排除其他的干扰,在选取球员的过程中,通过分析,设定了“600次投篮”的准入底线。运用直观分类及聚类分析,从官方确定的5个位置出发,比较James与每一个位置球员的得分能力,初步得出James在全联盟中的得分水平。因为同一个位置的球员,打球风格也各异。考虑对全联盟的高水平球员进行聚类分析。为克服变量过多、变量之间的相关性的影响,运用主成分分析将变量降维,再运用各球员的主成分得分进行聚类分析。最后通过分析得到Jam

8、es的所处类别,及在该类别中的能力水平。1.3.2本文的文章结构安排本文分为三章,第一章, 绪论部分,主要介绍本文选题的背景及相关论文的综述、文章的研究思路以及结构安排。第二章, NBA的统计分析。主要介绍NBA的专业术语、本文选取的变量及数据描述介绍以及在球员选择上的考虑。第三章, James在联盟中的地位分析。运用聚类分析、主成分分析主要介绍按照官方位置的地位分析、主成分分类后的地位分析。2. NBA的统计资源2.1 NBA统计的原始数据2.1.1数据来源:本文的数据来自BBR:http:/www.basketball- 20132014赛季常规赛82场比赛的球员总数据。2.1.2 符号说

9、明符号含义T信号灯周期,研究路段周期长度为60s单条直行车道的设计通行能力,pcu/h;周期内绿灯时间,研究路段为30 s;绿灯亮后,第一辆车启动、通过停车线的时间,s,平均取;直行车通过停车线的车头时距,s;单条直行车道的设计通行能力周期内绿灯时间,研究路段为30 s绿灯亮后,第一辆车启动、通过停车线的时间,s,平均取直行车通过停车线的车头时距,s事故发生后,第i个周期内事故断面实际通行能力第i个周期中,通过事故断面的标准车当量数车流中集散波波速车辆进入分界面前的上游流量车流进入分界面前的密度车辆进入分界面前的下游流量车辆通过分界面后的密度第i周期内车辆排队长度变化量第i周期30秒通行信号灯

10、内车流中集散波波速第i周期内30秒禁止通行信号灯内车流中集散波波速第i周期内车辆进入分界面前的上游流量第i周期内车流进入分界面前的密度第i周期内车辆进入分界面前的下游流量第i周内车辆通过分界面后的密度2.2 本文的数据处理得分能力是衡量进攻能力的重要指标。球队能否获胜最终要由他们取得的分数多少来决定。在一场比赛里,两支对垒球队获得的投篮机会在数量上是基本相当的,因此,哪支球队能更合理的在己方队员间分配出手机会,哪队的球员能更有效地使用这些机会,他们就可以得到比对手更多的分数。反映进攻能力的指标显然不仅仅是得分能力这一项数据,另外象进攻篮板能力,协作程度等等也都是体现进攻能力的重要指标(同时它们

11、各自对得分能力的数据也有影响)。但我现在倾向于对简单化的数据进行分析。象EFF、PER那样的线型方程式的综合性数据主要功用还是拿来做排名系统,它们实际说明问题的能力反而还不如简单处理的数据。现在用最简单的方法把球员的得分能力切为两个部分来分析:l 得分效率;投篮频率(得分负荷)2.2.1得分效率所谓得分效率,这里用的是“每次出手能得到的分数”的定义。公式:得分效率 = 得分 / (投篮次数 + 0.44*罚球次数)由于大多数的罚球来自于投篮出手被犯规,转化为罚球后,原投篮在数据上就不再算一次投篮而另算两或三次的罚球机会。因此,完整地统计球员的投篮次数就需要加算罚球次数。投篮次数与罚球次数间的转

12、换系数大约是0.44。得分效率这项数据主要是用来取代命中率的,一般统计球员的命中率必须分开考量两分命中、三分命中和罚球命中三个部分。由于本次调查得分能力并不需要细分球员的得分手段,而只需要单论球员的得分效果即可,所以,应用合并了的得分效率显然比应用三项命中率来得更简便更直观。2.2.2得分频率单独观察得分效率仍不足以分析球员的得分能力。球员的高效率很可能来自于他的低出手。没有多少进攻任务的角色球员,偶尔只在获得极佳的出手机会时才投篮,效率自然比球队主攻手要高。但这些角色球员的进攻能力是肯定不如主攻手的。因此,分析球员的得分能力,还要引入“投篮频率”这项数据,由此观察球员的得分负荷状况。所谓投篮

13、频率,这里用的是“单位上场时间的投篮次数”的定义。公式:投篮频率=投篮次数/上场时间2.3待测球员的选取13-14赛季现役球员共有482名,上场时间从1分钟的DeAndre Liggins到3122分钟的Kevin Durant不等;论进攻能力,投篮数从0的Chris Smith到1688的Kevin Durant不等。因此有必要对待测球员进行筛选。以下以PF为例进行分析,其他位置类似。2.3.1 PF的球员筛选本赛季现役大前锋中共有98名,以下是全员大前锋得分能力散点图图1 全员大前锋得分能力散点图根据上图可以明显看到,有大量的球员堆叠在某个区域,其他位置的球员分布较散,差异明显。运用这种数

14、据会影响到分析的结果,一方面,有些球员因为伤病或能力较差,得分能力与高水平球员有明显差别,他们没有分析的意义;另一方面,有些球员因为出手次数很少导致的得分效率很高也作为整体数据的奇异值影响分析。表1 全员大前锋得分能力聚类分析部分结果第一类White.6.SACWhite.7.CHA第二类James.2.SASOnuaku.29.TOT第三类Plumlee.27.BRKHollins.59.LAC注:表1仅为部分数据,全部数据共将98名球员分为4类,采用均值法上图是运用全员PF得分能力的聚类分析部分结果,在需要分为4类的聚类分析中,前三类所包含的球员均是上场时间较少,投篮数较少的球员,因此必须

15、设置准入底线以保证统计分析的意义。2.3.2 待测球员准入原则本文设置“600次投篮”的准入底线,只有在本赛季达到600次以上投篮的球员才有机会进入统计。投篮太少的球员投篮频率很高是因为出场时间很短,而不是擅于进攻。投篮太少,得分效率受其他因素影响的可能性也很大,不适于进行分析。600次投篮的底线基本保证了统计分析的可靠,进入这次统计分析的大多是各球队的主力球员。3. James在联盟中的地位分析3.1基于球队位置的聚类分析James在球队中的位置是大前锋(以下简称PF),所以首先从联盟高水平的PF进行分析。因为James在联盟中数据全能,在球队中是核心球员,他具备与其他位置球员的比较得分能力

16、的条件,遂在第二部分将他与各位置球员进行比较分析。3.1.1 PF的聚类分析3.1.1.1 PF的直观分类表2 投篮数大于600的大前锋数据统计PF人数均值最大值球员29投篮频率得分效率投篮频率得分效率0.411.10Aldridge.96.PORJames.55.MIA21543下图3是筛选后的大前锋得分能力情况。图3 大前锋得分能力散点图c1理想情况下,球员的投篮频率应该围绕球员的得分效率上下波动,即投篮效率与投篮频率之间满足某种线性关系,而图形的直观表示就是散点图中在某条直线附近聚集了较多的点,如上图3中,球员的得分能力有这样的分布趋势。如图3,大致可以图3划分为以下4个区域:l 区域1

17、强核心球员 (近似: 负荷0.45, 效率1.15)l 区域2弱核心球员 (近似: 负荷0.45, 效率1.05)l 区域3弱角色球员 (近似: 负荷0.45, 效率1.15)l 区域4强角色球员 (近似: 负荷1.15)l 区域5进攻二把手 (近似: 0.35负荷1.15)注:以上和后面提及的“核心球员”与“角色球员”仅仅针对得分能力而言。【强核心球员】是球队无可争议的进攻核心,频繁投篮附加高效率。见上图3,James、Nowitzki、Love,Griffin就属于这一类型。【弱核心球员】占据大量的投篮机会,但是效率很低,远远偏离对角线,属于有争议的进攻核心型球员,他们可能是鱼腩球队的攻击

18、手,被迫承担明显超负荷的进攻任务,Randolph是典型的代表。假如球队中存在弱核心球员,说明该球队存在严重的进攻权分配问题,主攻手获得的支援火力非常有限。【弱角色球员】低出手低效率的普通进攻球员,是联盟中处于中庸水平的一群人,虽然各有所长,但是必然无法成为超级明星,或者独立地撑起一个球队的进攻。【强角色球员】低出手高效率的潜力进攻球员。他们恰好与弱核心球员形成对比,但大多是新秀,经验不足,稍待时日可能成为球队当家。显然JAMES在直观的分析中属于强核心球员中的得分效率最高者,是球队无可争议的进攻核心,频繁投篮附加高效率,下面将对PF进行聚类分析。3.1.1.2 PF的聚类分析系统聚类的主要思

19、想为:n 个样品各自为一类,并按照规定的方法计算样本之间的距离及类之间的距离。再将类间距离最短的两类合并为新类,计算新类与各类之间的距离,重复进行直至所有类合并为一类。类间距离的定义有很多种,本文选取最长距离法、类平均法、重心法及离差平方和法完成系统聚类。由于进行聚类分析的球员较多,聚类图不方便一一罗列,遂选取离差平方和法得到的系统聚类结果进行具体分析。图4 高水平PF聚类图(ward方法)如上图4,James、Nowitzki、Love,Griffin分为一类,恰好是上图3散点图中的区域1,说明这一类代表了核心强进攻球员。另外几类分类情况也大部分满足上图3散点图的直观分类,如图4的最右边一类

20、,就是弱核心球员的类别。综上所述,James在联盟中的PF中属于强核心球员。3.1.2其他位置的聚类分析由于本文的核心是分析James在全联盟的地位,遂将不过多地分析各个位置的球员得分能力分布情况。3.1.2.1 直观分类表3 四个位置的球员得分能力统计数据位置人数均值最大值球员投篮频率得分效率投篮频率得分效率SG370.3911.11Young.1.LALHarden.60.HOUPG370.3961.07Westbrook.5.OKCCurry.67.GSWSF280.3571.10Durant.65.OKCDurant.65.OKCC180.3751.11Jefferson.48.CHA

21、Lopez.38.POR注:James的得分效率在各个位置中均处于第一上表反映每个位置的球员侧重点不太一样,得分能力的平均水平有差异。具体的分布情况如下图:注:James的位置用红色标记图5 4个位置球员得分能力的分布情况散点图上图5中,后卫球员的堆积在投篮频率不高,得分效率也不高的位置,其中雷霆队的Westbrook投篮频率比后卫的平均水平高很多;小前锋的投篮频率不高但得分效率较高,其中雷霆队的Durant.投篮频率与得分效率都比小前锋平均水平高很多,并且根据统计数据,他的上场时间也是所有球员最多的,也难怪其获得本赛季常规赛MVP。由于聚类的球员众多,聚类图不宜分清,遂只展示聚类结果。下表中

22、只展示每个位置,每种聚类方法包含James的类别:表4 5个位置的球员聚类分析部分结果位置最长距离法均值法重心法Ward法PFJames.55.MIAJames.55.MIAJames.55.MIALove.43.MIN Griffin.69.LACJames.55.MIANowitzki.31.DALSGden.60.HOU Dragic.76.PHO Green.63.PHO Wade.5.MIA Ginobili.68.SASJames.55.MIAJames.55.MIAHarden.60.HOU Dragic.76.PHO Johnson.53.BRK Afflalo.107.ORL

23、 Green.63.PHOWade.5.MIA Ginobili.68.SAS James.55.MIAPGCurry.67.GSW James.55.MIACurry.67.GSW James.55.MIACurry.67.GSW James.55.MIACurry.67.GSW Lillard.48.POR Thomas.13.SAC Parker.31.SAS Paul.30.LAC Mills.38.SASJames.55.MIASFDurant.65.OKC James.55.MIADurant.65.OKC James.55.MIADurant.65.OKC James.55.MI

24、ADurant.65.OKC James.55.MIACDavis.71.NOP Bosh.77.MIA Pekovic.23.MIN James.55.MIAJames.55.MIAJames.55.MIADavis.71.NOP Pekovic.23.MIN James.55.MIA注:每种聚类个数均为4类,上表只包含有James的类别上图5中James的得分能力在每个位置都处于前列。上表的聚类结果说明,与James分为一类的球员均为该位置的当红球星,能力拔群。说明James的得分能力在全联盟球员中较强,特别是得分效率很高。但是他的得分效率能否显著地强于其他球员呢?下面进行对其进行得分效率

25、均值的显著性检验。3.1.3 得分效率均值的显著性检验3.1.3.1单个正态总体均值的假设检验理论设总体,来自总体的一个样本,均值的单边检验,即:当方差已知时,其拒绝域为, 其中 当方差未知时,其拒绝域为,其中 3.1.3.2 James的得分效率的假设检验首先检验James的得分效率均值是否显著高于所有球员的均值Step1 正态性检验因为3.1.3.1中的假设检验方法是针对正态性总体的,所以在运用均值假设检验之前,先要对数据的分布进行正态性检验。本文运用Shapiro的检验方法,若结果的,则拒绝原假设,即数据不服从正态分布,反之则接受原假设。结果中算得p-value = 0.6451大于置信

26、水平0.05,因此接受原假设,即认为该组数据服从正态分布。Step2 均值的单边假设检验需要检验所有球员的平均得分效率是否显著的小于James的1.297,设置假设:计算结果如下表:表5 James在全部球员中得分效率均值假设检验结果meanJames显著性水平T值dfP_value显著性1.0940321.2971930.05-33.015021466.6914e-70不显著注:选取所有投篮数大于600的球员进行本表的分析由于P_value=6.69e-70小于0.05,因此拒绝原假设,接受,认为James的得分效率没有显著地大于所有球员平均得分效率。运用相同步骤对James的官方位置PF的

27、数据进行检验。对高水平PF的得分效率数据进行正态性检验,p-value = 0.7145,认为该组数据服从正态分布。均值单边假设检验后得到下表结果:表6 James在PF中得分效率均值假设检验结果meanJames显著性水平T值dfP_value显著性1.101138 1.297193 0.05-15.08369282.839e-15不显著注:选取所有投篮数大于600的PF进行本表的分析由于P_value=2.839e-15小于0.05,因此拒绝原假设,接受,认为James的得分效率没有显著地大于PF平均得分效率。综上所述,James虽然得分能力拔群,得分效率较高,但是并没有显著的大于高水平球

28、员平均水平。3.2在主成分分析下的聚类模型在全联盟中,试图一类球员,他们与James的打球风格相似,并且能力比较接近,这样就可以通过分析这类球员的共性特征,间接得到James的打球风格。并且将James与这类球员的能力进行比较,结果更有意义,更有说服力。如果用所有21个变量进行聚类分析,因为变量太多,结果难以解释,遂使用主成分分析将变量降维,再用各球员的主成分得分进行聚类分析。3.2.1 主成分分析模型设是维随机变量,并假设,。考虑如下线性变换 易见 我们希望的方差达到最大,即是约束优化问题的解。因此,是最大特征值(不妨设为)的特征向量。此时,称为第一主成分。类似地,希望的方差达到最大,且要求

29、。由于是的特征向量,所以,选择的应与正交。类似于前面的推导,是第二大特征值(不妨设为)的特征向量。称为第二主成分。一般情况下对于协方差阵,存在正交阵,将它化为对角阵,即且则矩阵的第列就对应于,相应的为第主成分。前面讨论的是总体主成分,而在实际问题中,一般总体协方差阵未知,用样本相关阵来计算样本主成分,设为样本相关阵的特征值,为相应的单位特征向量,且彼此正交。令,则则存在谱分解:若选取个主成分,则主成分分析的残差阵为: (1)主成分分析的残差阵的元素平方和(简称为误差平方和)为: (2)3.2.2 高水平球员数据的主成分分析根据3.2.1的方法,对本赛季联盟内投篮数大于600的球员的数据进行主成

30、分分析。数据情况如下表:表7 主成分分析中数据基本情况表球员人数变量个数147213.2.2.1主成分分析的结果这些数据的主城分析结果如下:图6 147名球员NBA原始指标的主成分分析的碎石图表8 主成分的贡献率表Comp.1Comp.2Comp.3Standard deviation2.89576852.36309261.22261608Proportion of Variance0.39930840.26591460.07118048Cumulative Proportion0.39930840.66522300.73640344表9 前三个主成分的因子载荷表综合因子高矮因子攻防因子综合因

31、子高矮因子攻防因子MP-0.2270.163-0.356FTA-0.2820.1360.169FG-0.3060.133FT.0.256FGA-0.2630.230ORB-0.196-0.297-0.141FG.-0.178-0.255DRB-0.269-0.169-0.171X3P0.322-0.396TRB-0.258-0.227-0.170X3PA0.336-0.372AST0.301X2P-0.3220.221STL-0.1030.199-0.162X2PA-0.3090.258BLK-0.167-0.253-0.194X2P.-0.125-0.189TOV-0.2200.214FT-

32、0.2580.1950.183PF-0.154-0.481PTS-0.283 0.215 -当主成分个数达到3时,累积方差贡献率超过70%,并且观察因子载荷矩阵,前三个主成分基本都把所有变量描述了,因此选取3个主成分,剩下18个主成分舍去,达到降维目的。3.2.2.2 主成分解释第1主成分对应的系数符号都相同,其值在-0.2左右,它反映了球员的综合能力,综合能力强的球员,因为各项数据值均比较大,因此第1主成分得分就越小,因此取名为“综合因子”第2主成分对应的命中率,2分球命中率,篮板(攻、防、总),盖帽这几个变量的因子载荷符号为负,其余为正。身材高大的球员,适合内线进攻,抢篮板,以及盖帽,其进

33、攻方式多为2分进攻,并且命中率也高,所以身材高大的球员的第2主成分得分就较小(带符号);而身材矮小的球员,动作敏捷,擅长控球与抢断,因此其助攻与抢断较多,并且身材矮小的球员在内线进攻比较吃亏,因此经常选择投三分球,不过其命中率也将降低,所以身材矮小的球员的第2主成分较大。因此取名“高矮因子”第3主成分对应的上场时间,三分球投球数及总得分,抢断,盖帽,个人犯规,的符号都为负,其余变量中,部分变量因子载荷过小,最后剩下的变量因子载荷符号为正。防守队员的数据基本上以系数为负的变量为主,如巴蒂尔,因为防守队员的打法在内线进球的机会很少,所以第3主成分的得分就较低;而攻击型球员就与之相反,第3主成分因子

34、得分较高。因此取名为“攻防因子”。总的来说,各主成分得分体现的球员能力如下表10 主成分得分描述的情况表主成分负正综合因子(第1主成分)综合能力强综合能力弱高矮因子(第2主成分)身材高大身材瘦小攻防因子(第3主成分)防守型进攻性3.2.3 主成分得分选取排名前25的球员主成分得分情况如下表:表11 前25名球员的主成分得分球员综合因子高矮因子攻防因子得分和Drummond.68.DET.C-5.380-7.321-2.969-4.307Howard.50.HOU.C-5.700-4.278-0.495-3.449Griffin.69.LAC.PF-8.327-0.0200.826-3.272C

35、ousins.73.SAC.C-6.818-1.1770.489-3.001Jefferson.48.CHA.C-5.587-2.0991.061-2.713Ibaka.57.OKC.PF-3.628-4.116-1.417-2.644Davis.71.NOP.C-4.357-2.8410.272-2.476Gortat.58.WAS.C-2.864-4.200-0.604-2.304Noah.29.CHI.C-3.583-2.579-1.368-2.214Monroe.37.DET.PF-3.990-2.3340.147-2.203Randolph.24.MEM.PF-4.454-1.508

36、0.693-2.130Durant.65.OKC.SF-9.0105.4890.381-2.111Aldridge.96.POR.PF-5.096-0.7262.047-2.082Faried.73.DEN.PF-2.488-3.8270.268-1.992James.55.MIA.PF-6.8882.6501.057-1.971Lopez.38.POR.C-1.412-4.892-0.750-1.918Love.43.MIN.PF-6.0722.448-0.781-1.829Favors.72.UTA.PF-1.802-3.920-0.534-1.800Valanciunas.7.TOR.C

37、-1.391-4.224-0.582-1.720Anthony.92.NYK.PF-6.3853.368-0.709-1.704Duncan.67.SAS.C-2.504-2.8861.149-1.686Lee.45.GSW.PF-2.859-2.2571.046-1.667Thompson.15.CLE.PF-1.538-3.3210.072-1.492Johnson.52.TOR.PF-0.311-4.568-1.602-1.453注:所有数据见附录在上个部分3.2.2.2中,对主成分的属性进行的命名,球员的每个主成分的得分高低代表的情况进行说明。因此可以以每个球员的各主成分得分,来将球员

38、进行分类,主成分得分情况散点图如下图所示:图7 147名球员主成分得分情况散点图上图中,中锋用黑色点标记,前锋用红色和粉色点标记,后卫用蓝色和绿色点标记。在主成分得分散点图中,能直观地将各个位置的球员区别开。本文前面的部分中,将同一个位置的球员进行得分能力的比较,并且使用的指标都相同,并不是太科学。一方面,每个位置的球员各司其职,所展现的能力不一,单纯地以得分效率比较球员得分能力显得比较盲目;另一方面,在同一个位置的球员,也因个人技术特点、球队因素等侧重点不一样,如果将一个防守型中锋与进攻型中锋比较得分能力和投篮频率是没有意义的。因此,需要确定一个比较范围来解决上述两个方面的问题,即,不仅仅通

39、过官方的位置对球员进行分类,而是根据其原始数据体现出来的打球风格对球员进行划分。因此下面介绍基于主成分得分的聚类分析。3.2.4 基于主成分得分的聚类分析3.2.4.1聚类分析结果运用球员的主成分得分,对球员进行聚类分析。将球员分为3类,由于结果数量过多,仅展示含James的一类结果:表12 聚类分析结果中含James的一类球员(最长距离法) Bosh.77.MIA.C Duncan.67.SAS.C Gasol.61.LAL.C Hawes.54.TOT.C Kanter.45.UTA.C Gortat.58.WAS.CNoah.29.CHI.C Hibbert.52.IND.C Gasol

40、.62.MEM.CPekovic.23.MIN.C Vucevic.5.ORL.C Valanciunas.7.TOR.C Lopez.38.POR.C Anthony.92.NYK.PF Aldridge.96.POR.PF Love.43.MIN.PF James.55.MIA.PF Young.3.PHI.PF Nowitzki.31.DAL.PF Randolph.24.MEM.PF Millsap.39.ATL.PF Monroe.37.DET.PF Lee.45.GSW.PF Boozer.83.CHI.PF West.8.IND.PF Sullinger.18.BOS.PF Gi

41、bson.70.CHI.PF Morris.36.PHO.PF Faried.73.DEN.PF Thompson.15.CLE.PF Favors.72.UTA.PF Bass.88.BOS.PF Harris.65.ORL.PF Jones.49.HOU.PF Blatche.86.BRK.PF Hickson.62.DEN.PF Henson.63.MIL.PF Johnson.52.TOR.PF DeRozan.77.TOR.SG Harden.60.HOU.SG Dragic.76.PHO.SG Henderson.58.CHA.SG Stephenson.14.IND.SG Burks.91.UTA.SG Wade.5.MIA.SG Curry.67.GSW.PG Wall.10.WAS.PG Ellis.65.DAL.PG Carter-Williams.73.PHI.PG Oladipo.33.OR

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号