数据挖掘知识

免费体验
当前位置: 首页 > 知识库 > 数据挖掘知识 >

NBA 1985-2017 数据分析二

分享到:
时间:2018-02-09 19:18来源: 作者:
中国统计网(www.itongji.cn),是由大数据资深从业人员创办的大数据门户网站

单赛季分析:(16-17常规赛)


主场战绩:


主场胜率勇士最高:87.8%,最低篮网31.7%


wbt.sort_values('home',ascending=False)['home'].plot.bar(figsize=(12,3),color='#0b8b87')



客场战绩:


最高勇士75.6%,最低篮网17%


wwbt.sort_values('away',ascending=False)['away'].plot.bar(figsize=(12,3),color='#0b8b87')



主客场战绩差异:


所有球队主场战绩都优于客场


步行者差异达到39%


差异最小马刺2.4%


wbt.sort_values('diff',ascending=False)['diff'].plot.bar(figsize=(12,3),color='#0b8b87')



各队场均得分:


勇士最高115.9分


达拉斯最低97.9分



各队得分标准差,得分稳定性:


波动最大骑士14.4分


最小凯尔特人9.05分



得分期望及方差反应进攻火力及稳定性,


如将对手得分置换成主队,就能计算防守效率及稳定性


接下来的分析:


以对阵两队前5个赛季胜率和当季各队主客场胜率 为线性模型因子预测胜率并验证模型.


编码:


r2017 = df[df.赛季=='2016-2017'][:1230]
r2017.head()

赛季     日期     主队 主队得分 客队 客队得分 主队胜负 主队分差 得分总和
37647 2016-2017 2016-10-25 骑士 117 尼克斯 88 1 29 205
37648 2016-2017 2016-10-25 开拓者 113 爵士 104 1 9 217
37649 2016-2017 2016-10-25 勇士 100 马刺 129 0 -29 229
37650 2016-2017 2016-10-26 魔术 96 热火 108 0 -12 204
37651 2016-2017 2016-10-26 凯尔特 122 篮网 117 1 5 239


各队战绩一览:


合并各队主客场战绩


hs=r2017.loc[:,['主队','主队胜负']].groupby('主队').mean()
gs = r2017.loc[:,['客队','主队胜负']].groupby('客队').mean()
#客场战绩替换成主场
gs['主队胜负']=1-gs['主队胜负']
gs.columns=['away',]
hs.columns=['home',]
hs.index.name='team'
wbt=hs.join(gs)
#改用球队英文简称,方便图示
nl={'SIXER':'PHI', '公牛':'CHI', '凯尔特':'BOS', '勇士':'GS', '国王':'SAC', '太阳':'PHO', '奇才':'WAS', '小牛':'DAL', '尼克斯':'NY', '开拓者':'POR', '快船':'LAC',
      '掘金':'DEN', '森林狼':'MIN', '步行者':'IND', '活塞':'DET', '湖人':'LAL', '火箭':'HOU', '灰熊':'MEM', '热火':'MIA', '爵士':'UTAH', '猛龙':'TOR', '篮网':'BN',
      '老鹰':'ATL', '雄鹿':'MIL', '雷霆':'OKC', '马刺':'SA', '骑士':'CLE', '魔术':'ORL', '鹈鹕':'NO', '黄蜂':'CHA'}
wbt.index=(list(map(lambda x: nl.get(x),wbt.index)))
#添加例:主客场胜负差距
wbt['diff']=wbt['home']-wbt['away']


合并赛季主客队战绩


s1=r2017.loc[:,['主队','主队得分']]
s2=r2017.loc[:,['客队','客队得分']]
s1.columns=(['team','score'])
s2.columns=(['team','score'])
s2017=s1.append(s2,ignore_index=True)
s2017['team']=(list(map(lambda x: nl.get(x),s2017['team'])))
s2017.groupby('team').mean().sort_values('score',ascending=False).plot.bar(figsize=(10,3),color='#769958')
s2017.groupby('team').std().sort_values('score',ascending=False).plot.bar(figsize=(10,2),color='#769958')


End.


谷歌优化(整理:英文推广TuiGuang123.com)
分享到:
------分隔线----------------------------

联系信息

 

 地址:深圳南山保利广场B区二层51#

 手机:18123763721,400-879-3881

 微信:18123763721

 联络:费先生、雁狸

 办公:9:00~22:00

 网址:http://www.tuiguang123.com

银行账户

 

银行:招商银行深圳水榭花都支行

户名:深圳市亿推信息技术有限公司

帐号:7559 2777 4410 601

重点方案

 

国外媒体发稿

社交媒体KOL

区块链海外推

英文外链推广

跨境电商特惠

微信咨询

 

COPYRIGHT·深圳市亿推信息技术有限公司 版权所有 粤ICP备17150804号-2