- A+
所属分类:python网络爬虫
一般的网站都是有反爬机制的,很多常见的方法大家都知道,但是用起来知识点不到位,所以就不会破解,今天带来的方法相对来说比较简单!就是Python加上C++来绕过一些比较简单的反爬机制。
某些网站有反爬虫的机制
写个爬虫(简单的介绍一下,各位都是爬虫大佬)
我找了一个比较典型的网站来进行爬虫,(已经打码)
第一页
第二页
我们还需要获取一层链接,如果生来的话就是简单的缩略图。
写了一个这样的正则
具体找到这层链接的代码如下:
这层链接里面就是需要的高清大图,如下图:
解决问题
我想到的是哪里的东西写错了么?
我们输出一下正则匹配过后的东西。
修改如下:
0×03 效果
我的微信公众号
爱真理,得永生! 爱在灵灵久博客,网罗天下,福利大家!