- A+
面一篇文章写了如何爬取南京20000多套二手房的信息,算是一个铺垫,今天我们就来深入分析一下这些数据,看看南京房子到底有多贵. 有多少豪宅,多少的富人区,哪些房子,哪些区域比较火比较贵!有没有性价比高的房子可以挑选!这些数据的背后隐藏了什么故事!这次我用可视化来反映数字里的秘密!
南京地图
南京一共有11个区域:浦口区,建邺区,雨花台区,江宁区,鼓楼区,玄武区,秦淮区. 地图最上面有六合区,地图最下面还有一个溧水区,高淳,西边还有一个栖霞区。
由于高淳和溧水房源特别少,那么我们就重点看南京的主要9个区的情况
1.二手房数据总览
上一篇爬取的数据我全部存在一个csv文件中有18000多条数据,我一共抽取了8个维度.(链家上明明写20864套,核对了几遍为啥只有18000不到,我也很奇怪呢)
-
房子的装修,面积,总价,房子的小区名字,所在区域,单价,房间多少和朝向.
-
基本这8个特征值,包括了房子的绝大部信息,而且数据我已经清洗过,为我们下一步数据分析做好了准备.
纵览一下南京二手房:
1).装修情况
精装5105套,简装3011套,毛胚:981套,其他8830套
2).最大/小的面积,最贵和最便宜的二手房
最大的面积有644平米,最小的面积只有22平米,我很想知道这都是什么房子:
最小的是雨花区的一个22平米的叫"明门公寓",也是总价最低的。
最大的是大名鼎鼎的钟山高尔夫别墅,总价最高的5800万,单价近9万
整个二手房平均总价近300万,也就是低于300万很难选到好房子.
3).总价在600万以上的精装修的豪宅
600万以上的豪宅有331套,而且面积都是大户型,富人真多!
4).那个区域的二手房比较多
鼓楼2995,浦口2987,建邺2968,秦淮2863,这四大热门区域很多房子在出售,相信有少投资客在这些区域,后面我们会深入挖掘一下
5).每平米最贵和最便宜
最贵的11万一平米的,最便宜的是1万左右,均价在3万左右,南京的房子相当的贵啊!
6).出售中最多的小区
发现诚品城和江佑铂庭这两个小区出售的最多,为啥呢? 仔细查看发现这两个楼盘一个在南京最东边,一个在最西边。看来投资客很多啊,估计获利不少,准备出货吧.
2.单维度可视化分析
我们分别从总价,面积,均价,区域这些基本维度来可视化看一下南京的二手房.
1).均价
南京房子单价分布图,发现每平方小于2万的房子非常少,均价6.5万以上的房子也非常少.市面上大部分都是是在3万左右二手房.
-
去掉一些特殊的豪宅,南京的房子只有少部分是在2000万以上的,我们重点分析2000万以内的房子的情况
-
发现200-400万的房子特别多。峰值在200万左右的房子有5000套以上,从600万开始数量慢慢下降.
3).面积
-
南京二手房市场上,小面积的房子特别多,其中80-90的房源非常充足!看来是小户型的比较好卖啊,那小户型的几房几厅的比较多呢
4).房间数
看了市面上以3房的居多,其次是2房的,发现2房一厅和2房2厅的比例大概是7成,而3室1厅的仅有3室2厅的4成. 看来户型里面还是3室2厅的比较好!
3.双维度可视化分析
双维度分析,我们挑几组相关性比较大的维度分析一下:
1).面积和总价
-
房子的面积和总价的关系图,面积基本集中在50-300平米之间,价格在1000万的。但是发现50平米的房子数据也非常密集,300平以上的房子急剧减少
-
我们把房价面积和价格分别取平方根和对数,发现50-100平米的房子价格线性关系非常明显
-
而100-200平米的房子,随着面积的增长价格并没有出现线性变化. 还是小三房比较好卖啊
2).房子面积和所在区域
-
看来面积比较大的房子集中在南京江宁区,秦淮区和浦口区。而建邺区箱体长度非常大,而六合区因为数据非常少,箱体非常小.
-
而房间面积分布比较均匀的是,鼓楼区和玄武区,基本都差不多,集中在50-100之间,说明小面积的房子主要分布在鼓楼和玄武两个地方.
3).房子均价和区域
-
看来是建邺区和鼓楼区的均价最高,建邺区的均价在38000左右,鼓楼在35000左右 ,看来富人都云集在这两个区域.浦口和江宁均价相对低一些,而且箱体长度很小,说明价格分布比较均匀.
-
另外鼓楼区和玄武区的异常值非常多,尤其是鼓楼区可以看出6万到9万多的数据异常很多,说明鼓楼区的投资非常旺盛。因为学区房非常集中在鼓楼,而异常值最少的江宁区,江宁的学区看来不行。
4.多维度可视化分析
一个好的二手房地段,面积,价格和装修,这4个要素之间分布关系是怎么样的呢,我们来看一下:
-
很明显红色区域非常集中,红色区域是鼓楼区的房子大部分都是精装,面积在100左右,而总价在500万左右的数据量很大
-
而1000万左右的房子出现在绿色区也就是建邺区,面积在200-300平米
-
1500万的房子出现在栖霞区。看了真正的豪宅还是在栖霞区,而且毛胚居多.
本篇已经用了13个图片,限于篇幅大小,多维度我就不再展开了。
结论:
南京的房子真心不便宜啊,还有很多深入的数据我没有来得及写上去。以后我会再出一篇深入的地产数据分析报告给大家.如果哪个中介公司看到这份数据有兴趣可以交流。希望能有更细致和准确的数据集挖掘一下,屌丝希望能找出最佳性价比的二手房.
摘要:为什么Python能够在这么多其他人失败的地方成功?学习起来很容易,使用起来很有趣,而且很强大。
有数百种编程语言:一些被广泛流行,然后被削弱,一些开始成为小众语言,从未扩展到一个核心的爱好者群体,但其中一个,特别是,经受住了时间的考验。那么,为什么Python在1989年设计并于1991年首次发布,现在仍然重要呢?
你不可能是所有人的一切……但它有帮助
Python开发人员重视它的灵活性。Python的创建者Guido van Rossum之前曾在ABC编程语言中使用过(明显不那么受欢迎),并使用他喜欢的ABC片段构建了Python,并取消了他不喜欢的部分。Python中的一些流行的结集和添加包括列表、字典、基本语句和缩进。
Guido van Rossum也使用小写字母,而不是大写的关键字,他用一个小的核心做了Python,这个核心很容易扩展,而不是像ABC那样的整体设计。这种可扩展性帮助最初将Python从包中分离出来,如今它被称为通用通用语言。
同时具有服务器端和前端
Python在上面的语言特性中反映了灵活性,在编程领域具有广泛的吸引力。作为一种可以遵循许多不同设计模式的多范式编程语言,Python将简单的语法、文本处理和脚本能力结合起来,使它和DevOps工程师能够适应更高级的架构,从而吸引应用程序程序员。额外的扩展带来了来自其他群体的忠诚;web开发人员重视其web框架(Django,金字塔),研究人员重视Python处理科学计算libs(NumPy,SciPy)的能力。
生态系统的支持
Python是在GitHub上最流行的语言之一,在谷歌有大量的支持作为一种流行的内部语言。其他公司(如Facebook和Instagram)在内部使用Python,并且仍然有更多的创建Python SDKs,以使开发人员在Python中编写代码更容易访问他们的api。在这两家公司的所有类型的工程师中,都可以广泛地支持Python。Python是可以接近的,以至于教育者将它作为入门的编程语言,经验丰富的开发人员使用它来构建一个有趣的项目。这种广泛的支持和吸引力是对Python的持续相关性的证明。