python学习三 04 图片爬虫工程-组织框架

本图片爬虫工程，组织框架

初次使用python,没什么组织，只是开发过程中的逻辑梳理下

一个主程序，用于分析网站，根据网站图片分类，创建本地类别，获得所有分页，最后下载所需图片。

Common.py 常用功能

Down.py 下载功能

MyThread.py 多线程，与下载结合，实现多线程下载

Parse.py 解析

大体逻辑上，是按这个组织的，当然一开始是写在一个文件中的，不过发现那样太乱，不利于重复利用，于是就慢慢的分离出这几个文件。

现在，脉络是这样，不过耦合度还是挺多的，先不管了，有机会再研究的话，再进行完善。

工程发布到github，有一个网站是日本的，可以尽情爬取，另一个网站网址省去了，避免多人爬取，直接把人家的网站挂掉，就像有人如果爬我的网站，差点把我的网站弄瘫痪了，我也是不愿意的：》

至此，我的爬虫项目已经完成了爬虫任务，暂时不再研究了，下一步打算做数据挖掘项目了

Github:

https://github.com/gudianxiaoshuo/myPython

对您有所启发的话，用支付宝扫下红包奥。。。

我的微信公众号

爱真理，得永生！　　　　　　　　　　爱在灵灵久博客，网罗天下，福利大家！