我用Python对科比NBA生涯进行了一个数据分析

  • A+
所属分类:ptython全栈开发

我是一个NBA的球迷,一直很喜欢科比的球风和“曼巴精神”,于是想写一篇文章看一下他的整个NBA生涯的数据情况是怎样的,这应该是一件有趣的事情。

使用工具:Ipython notebook

用到的库:Pandas,Matplotlib

1.数据来源

本次用到的数据来源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以选择多种形式,我选的是CSV格式,方便后面的数据分析,看看数据长什么样呢

我用Python对科比NBA生涯进行了一个数据分析

2.导入数据

1).数据集是一个下载好的csv文件( csv是数据分析金牌御用文件格式),我们把数据导入到pandas之后,初步分析一下

我用Python对科比NBA生涯进行了一个数据分析

>>

(20, 30) #数据集是一个20行30列的大表格,正好是20年的数据

看一些数据的基本统计分析信息:

我用Python对科比NBA生涯进行了一个数据分析

20年平均得分是24.2分,相当厉害,最高得分是35.4,最低7.6,那我们继续横向探索数据

2).接下来就可以继续分析了,一般来说,我们经常关注的是球员的得分,篮板,助攻,抢断和盖帽的能力,所以我们可以从这5个方面来分析,先来看一下科比的得分的基本情况

我用Python对科比NBA生涯进行了一个数据分析

>>

常规赛总得分: 33633.3

常规赛场均得分: 24.9875928678

3).这里的总分会有偏差(实际总分是33643)

因为是根据每赛季的场均得分和场次得来的,所以数据会有出入,科比的得分巅峰是哪个赛季呢 ? 场均得分又是多少?只需两行代码就解决问题

max_point=data.PTS.max()print(data[data.PTS==max_point])

>>

我用Python对科比NBA生涯进行了一个数据分析

3).科比的巅峰赛季

科比的巅峰是在05-06赛季,27岁的时候,场均35.4分,要知道场均能上30分就已经很了不起了,果然是巅峰科比,进攻火力太猛了,那我们接着看一下上30分的有哪些赛季

print(data.loc[data.PTS>=30])

>>

我用Python对科比NBA生涯进行了一个数据分析

30分以上的赛季有02-03,05-06和06-07

4).看一下这20年来各项的最强科比的数据

我用Python对科比NBA生涯进行了一个数据分析

>>

assistants 6.3

blocks 1.0

point 35.4

rebounds 6.9

steals 2.2

dtype: float64

3.可视化数据

1).为了更好的展现数据的魅力,我们用matplotlib画个图看看吧

x轴用20年(1997-2016)的年份

y轴是每个赛季的得分情况

我用Python对科比NBA生涯进行了一个数据分析

我用Python对科比NBA生涯进行了一个数据分析

用数据可视化可以非常清晰的看出,96-97刚起步的时候,进步非常快,几乎是火箭般的快速上升,然后30分左右徘徊了3-4年。突然爆发了,黄金赛季在06-07人生顶峰35分,而2014开始慢慢走向低谷,哪到底发生了什么了呢

2).其他的篮板,助攻,抢断和盖帽都可以仿照得分的方式来分析,表中分别对应TRB,AST,STL,BLK,看一下大致情况就好

篮板

我用Python对科比NBA生涯进行了一个数据分析

助攻

我用Python对科比NBA生涯进行了一个数据分析

我用Python对科比NBA生涯进行了一个数据分析

结合前面的数据,我们发现从2013年开始从得分王,开始慢慢的转为助攻王,助攻的得分明显上升甚至达到职业生涯的顶峰,猜想也许是因为体能或者伤痛的原因,转为助攻

我用Python对科比NBA生涯进行了一个数据分析

我用Python对科比NBA生涯进行了一个数据分析

有开发者发布了一个网站以对 Python 2.7 的“退休”进行倒计时。

可以看到 Python 2.7 预计将于两年后退休。

该开发者表示,由于官方尚未放出准确的日期,所以预计 Python 2.7 于 2020 年 4 月 12 日退休,这是到时 PyCon 的举办时间。

我用Python对科比NBA生涯进行了一个数据分析

Python 2,感谢您多年以来的忠诚服务。

Python 3,现在到你登场了。

Python 2.7 是 2.x 系列的最后一个版本,它的继承者 Python 3.0 在 2008 年 12 月发布,但不兼容 2.x 系列,3.0 的许多特性和语法向后移植到了 2.6 和 2.7。2.7 的支持时间将最少为 10 年,2020 年前会一直提供 bug 修正。

如何转换到 Python 3?

如果你主要的代码仍然基于 Python 2,这是完全可以理解的。PyPI 的大部分流行软件包现在都可以在 Python 2 和 Python 3 上运行,而且每天都会增加更多。为了简化转换, 官方移植指南提供了在 Python 3 中运行 Python 2 代码的建议。

结论:

上面这个小例子非常适合小白入门数据分析,综合了很多知识,非常不错,大家若有什么问题,欢迎留言讨论.

weinxin
我的微信公众号
爱真理,得永生!          爱在灵灵久博客,网罗天下,福利大家!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: