广告国内BGP机房32G内存299元网站收录排名问题解决【超牛】搜外友链平台站长在线扒站工具【免费】【免费】站长开发工具箱【推荐】站长自动外链工具广告位联系QQ：253000106 独立服务器100M/不限/免备 2核2G服务器新用户低至68元/年虚拟资源平台,轻松变现 10000来路IP只需8元站群系统程序-专注SEO站群黑帽SEO论坛_黑帽聚集地企业HTTP代理IP服务提供商软文推广，在线获客【定制】站群服务器99元起 SEO免费工具分享外推代发包收录【国内国际】短信推广，免费测试实力产品收量外链代发 5分一条快速排名 █一解决“收录、排名”问题一█ ●●●优质搜狗泛收录域名●●● AI数字人直播系统源码百度SEO排名7-15天上首页

python批量抓取美女图片

PHP中文网 • 2025年2月27日 20:36:39 • 编程技术 • 阅读 2

学了python以后，知道python的抓取功能其实是非常强大的，当然不能浪费，呵呵。我平时很喜欢美女图，呵呵，程序员很苦闷的，看看美女，养养眼，增加点乐趣。好，那就用python写一个美女图自动抓取程序吧~~

其中用到urllib2模块和正则表达式模块。下面直接上代码：

用python批量抓取美女图片

#!/usr/bin/env python#-*- coding: utf-8 -*-#通过urllib(2)模块下载网络内容import urllib,urllib2,gevent#引入正则表达式模块，时间模块import re,timefrom gevent import monkey   monkey.patch_all()   def geturllist(url):    url_list=[]    print url           s = urllib2.urlopen(url)    text = s.read()    #正则匹配，匹配其中的图片    html = re.search(r'', text, re.S)    urls = re.finditer(r'@@##@@
',html.group(),re.I)    for i in urls:        url=i.group(1).strip()+str("jpg")        url_list.append(url)    return url_list   def download(down_url):    name=str(time.time())[:-3]+"_"+re.sub('.+?/','',down_url)    print name    urllib.urlretrieve(down_url, "D:\TEMP\"+name)   def getpageurl():    page_list = []    #进行列表页循环    for page in range(1,700):        url="http://jandan.net/ooxx/page-"+str(page)+"#comments"        #把生成的url加入到page_list中        page_list.append(url)    print page_list    return page_listif __name__ == '__main__':    jobs = []    pageurl = getpageurl()[::-1]    #进行图片下载    for i in pageurl:        for (downurl) in geturllist(i):            jobs.append(gevent.spawn(download, downurl))    gevent.joinall(jobs)

登录后复制

程序不长才45行，不是太难，大家可以研究下，这里我只是抛砖引玉，大家可以根据原理开发出其他的抓取程序，呵呵，自己想去吧。。。我就不多说了~~

立即学习“Python免费学习笔记（深入）”；

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至253000106@qq.com举报，一经查实，本站将立刻删除。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2284134.html

Python 图片批量抓取

赞 (0)

0 0

关于作者

PHP中文网签约作者

281.8K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

python实现douban.fm简易客户端

上一篇 2025年2月27日 20:36:32

FastAPI中如何实现类似Flask g对象的全局数据容器？

下一篇 2025年2月25日 13:17:51

Python中map filter reduce的递归实现

map2=lambda f,seq: [] if seq==[] else [f(seq[0])] + map2(f, seq[1:]) filter2=lambda f, seq: [] if seq==[] else ( [seq[0…

PHP中文网
编程技术 2025年2月27日
2000
如何让python变得更快？

python和其他脚本语言通常会被摒弃，因为它们相对于一些类似于c语言的编译型的语言来说效率很低。比如下面的斐波纳契数的例子： C语言中： int fib(int n){ if (n Python中：def fib(n): if n …

PHP中文网
编程技术 2025年2月27日
2000
教你用100多行写一个数据库

本文介绍的是以为中国的it资深人士写的一个简单的数据库，没有我们使用的数据库那么强大，但是值得大家借鉴。可以用在特定环境中，更加灵活方便。数据库的名字叫WawaDB，是用python实现的。由此可见python是灰常强大啊！简介记录日…

PHP中文网
编程技术 2025年2月27日
2000
linux及windows下使用Python获取IP地址

使用python可以用很简单的方法得到本机ip地址，不过在windows和linux下的方法稍有不一样的，下面就来详细介绍下： Windows下获得IP地址的方法方法一使用socket模块使用拨号上网的话，一般都有一个本地ip和一个外…

PHP中文网
编程技术 2025年2月27日
2000
PYTHON如何在内存中生成ZIP文件

如题，代码如下： class MemoryZipFile(object): def __init__(self): #创建内存文件 self._memory_zip = StringIO.StringIO() …

PHP中文网
编程技术 2025年2月27日
2000
python的子子孙孙

python果真非常强大，它有着众多的追随者，所以很多开发者都依赖它开发出了各种不同的变种版本，下面列举几种： 1. pypy pypy 是用python实现的python解释器。pypy比cpython是更加灵活，易于使用和试验，以制定具…

PHP中文网
编程技术 2025年2月27日
2000
得到一张图片或logo的主要颜色（颜色趋向）python版

在使用google或者baidu搜图的时候会发现有一个图片颜色选项，感觉非常有意思，有人可能会想这肯定是人为的去划分的，呵呵，有这种可能，但是估计人会累死，开个玩笑，当然是通过机器识别的，海量的图片只有机器识别才能做到。那用python能不…

PHP中文网
编程技术 2025年2月27日
2000
python+ mysql存储二进制流的方式

很多时候我们为了管理方便会把依稀很小的图片存入数据库，有人可能会想这样会不会对数据库造成很大的压力，其实大家可以不用担心，因为我说过了，是存储一些很小的图片，几k的，没有问题的！再者，在这里我们是想讲一种方法，python+ mysql存…

PHP中文网
编程技术 2025年2月27日
2000
python下redis安装和使用

python下redis安装用python操作redis数据库，先下载redis-py模块下载地址https://github.com/andymccurdy/redis-py shell# wget https://github.com…

PHP中文网
编程技术 2025年2月27日
2000
sys.argv[] 的使用详解

sys.argv[]是用来获取命令行参数的，sys.argv[0]表示代码本身文件路径;比如在cmd命令行输入 “python test.py -help”，那么sys.argv[0]就代表“test.py”。 sys.startswit…

PHP中文网
编程技术 2025年2月27日
2000

发表回复

登录后才能评论