- A+
我是一个NBA的球迷,一直很喜欢科比的球风和“曼巴精神”,于是想写一篇文章看一下他的整个NBA生涯的数据情况是怎样的,这应该是一件有趣的事情。
使用工具:Ipython notebook
用到的库:Pandas,Matplotlib
1.数据来源
本次用到的数据来源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以选择多种形式,我选的是CSV格式,方便后面的数据分析,看看数据长什么样呢
2.导入数据
1).数据集是一个下载好的csv文件( csv是数据分析金牌御用文件格式),我们把数据导入到pandas之后,初步分析一下
>>
(20, 30) #数据集是一个20行30列的大表格,正好是20年的数据
看一些数据的基本统计分析信息:
20年平均得分是24.2分,相当厉害,最高得分是35.4,最低7.6,那我们继续横向探索数据
2).接下来就可以继续分析了,一般来说,我们经常关注的是球员的得分,篮板,助攻,抢断和盖帽的能力,所以我们可以从这5个方面来分析,先来看一下科比的得分的基本情况
>>
常规赛总得分: 33633.3
常规赛场均得分: 24.9875928678
3).这里的总分会有偏差(实际总分是33643)
因为是根据每赛季的场均得分和场次得来的,所以数据会有出入,科比的得分巅峰是哪个赛季呢 ? 场均得分又是多少?只需两行代码就解决问题:
max_point=data.PTS.max()print(data[data.PTS==max_point])
>>
3).科比的巅峰赛季
科比的巅峰是在05-06赛季,27岁的时候,场均35.4分,要知道场均能上30分就已经很了不起了,果然是巅峰科比,进攻火力太猛了,那我们接着看一下上30分的有哪些赛季
print(data.loc[data.PTS>=30])
>>
30分以上的赛季有02-03,05-06和06-07
4).看一下这20年来各项的最强科比的数据
>>
assistants 6.3
blocks 1.0
point 35.4
rebounds 6.9
steals 2.2
dtype: float64
3.可视化数据
1).为了更好的展现数据的魅力,我们用matplotlib画个图看看吧
x轴用20年(1997-2016)的年份
y轴是每个赛季的得分情况
用数据可视化可以非常清晰的看出,96-97刚起步的时候,进步非常快,几乎是火箭般的快速上升,然后30分左右徘徊了3-4年。突然爆发了,黄金赛季在06-07人生顶峰35分,而2014开始慢慢走向低谷,哪到底发生了什么了呢
2).其他的篮板,助攻,抢断和盖帽都可以仿照得分的方式来分析,表中分别对应TRB,AST,STL,BLK,看一下大致情况就好
篮板
助攻
结合前面的数据,我们发现从2013年开始从得分王,开始慢慢的转为助攻王,助攻的得分明显上升甚至达到职业生涯的顶峰,猜想也许是因为体能或者伤痛的原因,转为助攻
有开发者发布了一个网站以对 Python 2.7 的“退休”进行倒计时。
可以看到 Python 2.7 预计将于两年后退休。
该开发者表示,由于官方尚未放出准确的日期,所以预计 Python 2.7 于 2020 年 4 月 12 日退休,这是到时 PyCon 的举办时间。
Python 2,感谢您多年以来的忠诚服务。
Python 3,现在到你登场了。
Python 2.7 是 2.x 系列的最后一个版本,它的继承者 Python 3.0 在 2008 年 12 月发布,但不兼容 2.x 系列,3.0 的许多特性和语法向后移植到了 2.6 和 2.7。2.7 的支持时间将最少为 10 年,2020 年前会一直提供 bug 修正。
如何转换到 Python 3?
如果你主要的代码仍然基于 Python 2,这是完全可以理解的。PyPI 的大部分流行软件包现在都可以在 Python 2 和 Python 3 上运行,而且每天都会增加更多。为了简化转换, 官方移植指南提供了在 Python 3 中运行 Python 2 代码的建议。
结论:
上面这个小例子非常适合小白入门数据分析,综合了很多知识,非常不错,大家若有什么问题,欢迎留言讨论.