python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

  • A+
所属分类:编程语言

本节目的:解析下载到本地的文件,获得图片链接

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

所有相关的网址,都下载到本地了,下面我们依次解析,获得图片链接,然后将图片链接保存起来。

由上图,可看到

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

是一组,保存着背景图片,那我们解析的时候,将这一组图片,单独的放在一个文件夹background中

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

是另一组,解析的时候,单独的放在一个文件夹中

第一步,我们遍历目录,获得所有的文件路径

为此,我写了个函数

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

调用:

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

获得目录下的所有txt文件路径,保存在txtFileList中。

第二步 解析文件,获得IMG路径

1、首先,针对不同分组,创建相应的子目录

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

是一组,保存着背景图片,那我们解析的时候,将这一组图片,单独的放在一个文件夹background中

我们将右侧的数字去掉,剩下的字符串作为这一组的类别

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

分析网页源码

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

图像链接保存在class=subcontents的div下,

<img 属性为 data-layer 下

为此我写了个函数

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

调用

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

获得文件中,所有图片的链接列表

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

这一过程的详细代码如下:

python学习 二 04 爬一个图片网站-解析文件,获得所有图片链接

weinxin
我的微信公众号
爱真理,得永生!          爱在灵灵久博客,网罗天下,福利大家!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:1   其中:访客  0   博主  1

    • avatar 爱在灵灵久 Admin