python爬虫：爬取男生喜欢的图片

toutiao

7年之前

python爬虫：爬取男生喜欢的图片

任务目标：

1.抓取不同类型的图片

2.编写一个GUI界面爬虫程序，打包成exe重新文件

3.遇到的难点

1.分析如何抓取不同类型的图片

首先打开网站，可以看到有如下6个类型的菜单

选择图片存储路径

抓取到的图片要保存到电脑本地，所以就想着最好能够自己挑选本地任意一个文件夹作为存储路径

后来网上冲浪一番发现tkinter是可以实现这个功能的

可以通过tkinter.filedialog模块中的askdirectory（）方法实现

下面是在网上找到的一段示例代码

具体到这个例子，

（1）定义一个文本框，用来存放（显示）选择的存储路径

（2）定一个按钮，来触发选择本地路径功能

（3）定义一个函数，来实现选取路径功能

后续保存图片时，路径可以直接使用前面定义好的的self.input中的值

选择分类

因为图片分为了6个类别，每个类别对应一个cid值，所以可以预先把cid抽象出来，视为参数传递（1）定义一个拖动框，存储图片类型

（2）根据选择性类型不同，返回不同的cid值

3.填写爬取页数

*声明：本文于网络整理，版权归原作者所有，如来源信息有误或侵犯权益，请联系我们删除或授权事宜。

写在最后

文章可能写的有点水，但是我只是想给大家一个坚持下去的理由，不能坚持的小伙伴看看上面的话吧~相信能够帮助大家！

最后！只要你转发文章+私信小编（学习）即可免费获得一套python爬虫全套资料以及2020年最新的Python学习七大阶段路线和400集python学习教程！

阶段一：Python基础知识和高级特性

1、Python语法基础

2、Python字符串解析

3、Python时间和日历

4、Python文件操作

5、Python面向对象

6、并发编程

7、函数式编程

8、正则表达式

9、设计模式

10、排序算法

11、异常

12、模块

阶段二：Linux基础

1、shell操作

2、系统管理

3、常用Linux命令

4、常见Linux系统

5、HDFS搭建

阶段三：数据库原理和sql优化

1、Linux下MySQL数据库

2、数据库设计和SQL标准

3、Python数据库操作的库

4、Linux下MongoDB非关系型数据库

5、SQL优化和数据库优化

6、ORM对象关系映射基本思想

阶段四：前端web开发

1、Html

2、CSS

3、PC端页面开发实战流程

4、Bootstrap

5、html5和css3

6、JQuery

阶段五：Python Web后端开发

1、Django 框架开发

2、Nginx配置和uWSGI部署

3、RESTful接口开发

4、Flask框架开发

5、电商平台项目

6、BBS论坛系统

阶段六：爬虫和数据分析

1、第一个Python网络爬虫

2、专业HTTP分析工具Fiddler的使用

3、实际爬虫Python编码问题

4、urllib2 的使用TesseractOCR语言模型爬取使用带验证码登录的网站

5、Beautiful Soup

6、XPath & CSS选择器

7、PhantomJS

8、SeleniumWebdriver

9、Scrapy大型框架使用代理服务器爬取

10、Scrapy分布式集群多代理爬虫Redis

11、分布式集群Redis MongoDB在爬虫里的应用

12、数据分析工具与模块

阶段七：Python人工智能

1、机器学习

3、深度学习

朝鲜百姓的日常生活 »

« 胡冰卿的机场穿搭，工装风气场十足