- A+
所属分类:编程语言
安装完模块后我们正式开始进行数据爬取
先说一下requests的用法,导入这个模块后,你只需要调用一下get方法,就能获取网页的内容了
例如,爬取我的博客首页,这个单网页
前面只是提前熟悉一下爬取数据的步骤,接下来我们通过列表字典批量获取数据,然后把它保存为一个文件
首先定义一个字典,存储我们要抓取页面的网址
然后我们在定义一个列表,也是存储抓取页面的网址
然后我们先利用字典来抓取
代码如下:
在后面我们打印抓取的网页地址
然后我们利用列表来抓取数据
代码如下
原理上跟前面的字典一样,我就不做过多解释了
只是要注意这是一个嵌套的列表,遍历的时候要注意一下
运行结果如下图
文件目录变化如下
用浏览器打开如下图
特克斯博客 www.susmote.com
百度网站 www.baidu..com
到这里,简单的数据抓取就讲完了
学会了吗?
我的微信公众号
爱真理,得永生! 爱在灵灵久博客,网罗天下,福利大家!