编程语言 基于Python分析金庸小说里的主角,原来他才是真正的主角! 粉丝独白说起武侠小说,不得不提中国武侠小说三大宗师——金庸、梁羽生、古龙,从上世纪七八十年代开始,大量的武侠经典出现在荧幕之中。三位大师的文字作品几乎都读过,在学习Python和数据分析后又发现了很多... 05月24日 发表评论 阅读全文
编程语言 python 数据挖掘篇 一 结巴分词 Python 数据挖掘学习一 结巴分词github地址:https://github.com/fxsjy/jieba"结巴"中文分词:做最好的 Python 中文分词组件还记得当时想用C++,实现分词... 04月30日 发表评论 阅读全文
编程语言 python 数据挖掘篇 二 词云统计 python 数据挖掘篇 一 结巴分词第二章 词云统计这是一个非常有意思的功能,数据可视化,我这里,前两个图使用了词云统计人名、地名,最后一个图使用条状图列出词频最高的名词统计部分,使用的结巴分词,这... 04月30日 发表评论 阅读全文
python数据分析 python 数据挖掘篇 三 gensim 使用 python 数据挖掘篇 一 结巴分词python 数据挖掘篇 二 词云统计第三章 Genism3.1字符串列表到分词向量的转换将每一个文档进行分词,形成2维列表形式,列表的每一项是子列表,子列表存储... 04月30日 发表评论 阅读全文