python小技巧之批量抓取美女图片

PHP中文网 • 2025年2月28日 07:39:22 • 编程技术 • 阅读 2

其中用到urllib2模块和正则表达式模块。下面直接上代码：

[/code]
#!/usr/bin/env python
#-*- coding: utf-8 -*-
#通过urllib(2)模块下载网络内容
import urllib,urllib2,gevent
#引入正则表达式模块，时间模块
import re,time
from gevent import monkey

monkey.patch_all()

def geturllist(url):
    url_list=[]
    print url
    s = urllib2.urlopen(url)
    text = s.read()
    #正则匹配，匹配其中的图片
    html = re.search(r’

‘, text, re.S)
urls = re.finditer(r’

‘,html.group(),re.I)
    for i in urls:
        url=i.group(1).strip()+str(“jpg”)
        url_list.append(url)
    return url_list

def download(down_url):
    name=str(time.time())[:-3]+”_”+re.sub(‘.+?/’,”,down_url)
    print name
    urllib.urlretrieve(down_url, “D:\TEMP\”+name)

def getpageurl():
    page_list = []
    #进行列表页循环
    for page in range(1,700):
        url=”http://jandan.net/ooxx/page-“+str(page)+”#comments”
        #把生成的url加入到page_list中
        page_list.append(url)
    print page_list
    return page_list
if __name__ == ‘__main__’:
    jobs = []
    pageurl = getpageurl()[::-1]
    #进行图片下载
    for i in pageurl:
        for (downurl) in geturllist(i):
            jobs.append(gevent.spawn(download, downurl))
    gevent.joinall(jobs)
[/code]

程序不长才45行，不是太难，大家可以研究下，这里我只是抛砖引玉，大家可以根据原理开发出其他的抓取程序，呵呵，自己想去吧。。。我就不多说了~~

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2303971.html

Python 抓取美女图片

0 0

关于作者

PHP中文网签约作者

288.4K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

Python实例之wxpython中Frame使用方法

上一篇 2025年2月28日 07:38:00

Swift中属性的声明与作用

下一篇 2025年2月27日 16:50:53

使用python调用浏览器并打开一个网址的例子

python 打开浏览器，可以做简单的刷网页的小程序。仅供学习，别用非法用途。 python的webbrowser模块支持对浏览器进行一些操作,主要有以下三个方法：代码如下: webbrowser.open(url, new=0, aut…

PHP中文网
编程技术 2025年2月28日
2000
实例讲解python函数式编程

函数式编程是使用一系列函数去解决问题，按照一般编程思维，面对问题时我们的思考方式是“怎么干”，而函数函数式编程的思考方式是我要“干什么”。至于函数式编程的特点暂不总结，我们直接拿例子来体会什么是函数式编程。 lambda表达式（匿名函数）…

PHP中文网
编程技术 2025年2月28日
2000
python操作xml文件详细介绍

关于python读取xml文章很多，但大多文章都是贴一个xml文件，然后再贴个处理文件的代码。这样并不利于初学者的学习，希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件。一、什么是xml？ xml即可扩展标记语言，它…

PHP中文网
编程技术 2025年2月28日
2000
python实现的一个p2p文件传输实例

考虑到我手上的服务器逐渐的增多，有时候需要大规模的部署同一个文件，例如因为方便使用systemtap这个工具定位问题，需要把手上几百台服务器同时安装kernel-debuginfo这个包，原有的方式采用一个源服务器，采用rsync或者scp…

PHP中文网
编程技术 2025年2月28日
2000
python实现文件分组复制到不同目录的例子

场景：某个文件夹下面包含数量巨大的文件，需求需要将这些文件按组（比如5000个一组）存放到不同的目录中去。代码如下: # Filename: CopyFiles.pyimport osimport os.path folder_capac…

PHP中文网
编程技术 2025年2月28日
2000
2款Python内存检测工具介绍和使用方法

去年自己写过一个程序时，不太确定自己的内存使用量，就想找写工具来打印程序或函数的内存使用量。这里将上次找到的2个内存检测工具的基本用法记录一下，今后分析Python程序内存使用量时也是需要的。 memory_profiler模块（与psut…

PHP中文网
编程技术 2025年2月28日
2000
python应用程序在windows下不出现cmd窗口的办法

python写的GTK程序，会有这样一个怪现象，本来在cmd下用 python xxx.py 启动，还好好的，但是用py2exe编译以后，再用subprocess调用命令行程序的时候，就发现一个黑乎乎的cmd窗口跳出来了，特别难看，要消除它…

PHP中文网
编程技术 2025年2月28日
2000
python中stdout输出不缓存的设置方法

考虑以下python程序：代码如下: #!/usr/bin/env python import sys sys.stdout.write(“stdout1 “)sys.stderr.write(“std…

PHP中文网
编程技术 2025年2月28日
2000
测试、预发布后用python检测网页是否有日常链接

在大的互联网公司干技术的基本都会碰到测试、预发布、线上这种多套环境的，来实现测试和线上正式环境的隔离，这种情况下，就难免会碰到秀逗了把测试的链接发布到线上的情况，一般这种都是通过一些测试的检查工具来检查链接来规避风险的。前两天跟了一个问题也…

PHP中文网
编程技术 2025年2月28日
2000
python中常用的各种数据库操作模块和连接实例

工作中，经常会有用python访问各种数据库的需求，比如从oracle读点配置文件或者往mysql写点结果信息之类的。这里列一下可能用到的各个模块。 sqlite3: 内置模块用sqlite，有时候确实很方便，我觉得它确实做到了宣称的“零配…

PHP中文网
编程技术 2025年2月28日
2000

发表回复

登录后才能评论

python小技巧之批量抓取美女图片

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

请登录

AD推荐黄金广告位招租... 更多推荐