Python使用正则匹配实现抓图代码分享

PHP中文网 • 2025年2月28日 02:24:59 • 编程技术 • 阅读 1

内涵：正则匹配，正则替换，页面抓取，图片保存。

实用的第一次 Python 代码参考

#!/usr/bin/env pythonimport urllibimport re x=0def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): global x reg = 'alt=".+?" src="(.+?.jpg)"' imgre = re.compile(reg) imglist = re.findall(imgre,html) for imgurl in imglist:  urllib.urlretrieve(re.sub(r',d+,d+',',800,450',imgurl),"img/%s.jpg" % x)  print ""+re.sub(r',d+,d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x  x+=1 print 'Starting...' pages = range(1,9) for p in pages: html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p) print "-------------------------page:%d-------------------------------" % p getImg(html) print "Done!"

登录后复制

以上所述就是本文给大家分享的全部代码了，本人Python菜鸟，第一个作品，希望对大家能有所帮助。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2293627.html

Python 抓图正则匹配

0 0

关于作者

PHP中文网签约作者

285.4K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

用Python中的__slots__缓存资源以节省内存开销的方法

上一篇 2025年2月28日 02:24:50

如何通过 PHP 与文本文件交互？

下一篇 2025年2月18日 03:11:47

编程技术

用Python中的__slots__缓存资源以节省内存开销的方法

我们曾经提到，oyster.com的python web服务器怎样利用一个巨大的python dicts（hash table），缓存大量的静态资源。我们最近在image类中，用仅仅一行__slots__代码，让每个6g内存占用的服务进程（…

PHP中文网
2025年2月28日
2000
介绍Python中的一些高级编程技巧

正文：本文展示一些高级的Python设计结构和它们的使用方法。在日常工作中，你可以根据需要选择合适的数据结构，例如对快速查找性的要求、对数据一致性的要求或是对索引的要求等，同时也可以将各种数据结构合适地结合在一起，从而生成具有逻辑性并易…

PHP中文网
编程技术 2025年2月28日
2000
编程技术

用Python展示动态规则法用以解决重叠子问题的示例

动态规划是一种用来解决定义了一个状态空间的问题的算法策略。这些问题可分解为新的子问题，子问题有自己的参数。为了解决它们，我们必须搜索这个状态空间并且在每一步作决策时进行求值。得益于这类问题会有大量相同的状态的这个事实，这种技术不会在解决重叠…

PHP中文网
2025年2月28日
2000
Python编写百度贴吧的简单爬虫

操作：输入带分页的地址，去掉最后面的数字，设置一下起始页数和终点页数功能：下载对应页码的所有页面并储存为HTML文件，以当前时间命名代码： # -*- coding: utf-8 -*- #———————–…

PHP中文网
编程技术 2025年2月28日
2000
使用优化器来提升Python程序的执行效率的教程

如果不首先想想这句knuth的名言，就开始进行优化工作是不明智的。可是，你很快写出来加入一些特性的代码，可能会很丑陋，你需要注意了。这篇文章就是为这时候准备的。那么接下来就是一些很有用的工具和模式来快速优化Python。它的主要目的很简单…

PHP中文网
编程技术 2025年2月28日
2000
编程技术

用Python编写分析Python程序性能的工具的教程

虽然并非你编写的每个 python 程序都要求一个严格的性能分析，但是让人放心的是，当问题发生的时候，python 生态圈有各种各样的工具可以处理这类问题。分析程序的性能可以归结为回答四个基本问题：正运行的多快速度瓶颈…

PHP中文网
2025年2月28日
2000
python连接远程ftp服务器并列出目录下文件的方法

本文实例讲述了python连接远程ftp服务器并列出目录下文件的方法。分享给大家供大家参考。具体如下：这段python代码用到了pysftp模块，使用sftp协议，对数据进行加密传输 import pysftpsrv = pysftp.C…

PHP中文网
编程技术 2025年2月28日
2000
编程技术

用实例详解Python中的Django框架中prefetch_related()函数对数据库查询的优化

实例的背景说明假定一个个人信息系统，需要记录系统中各个人的故乡、居住地、以及到过的城市。数据库设计如下： Models.py 内容如下： from django.db import models class Province(model…

PHP中文网
2025年2月28日
2000
10种检测Python程序运行时间、CPU和内存占用的方法

在运行复杂的python程序时，执行时间会很长，这时也许想提高程序的执行效率。但该怎么做呢？首先，要有个工具能够检测代码中的瓶颈，例如，找到哪一部分执行时间比较长。接着，就针对这一部分进行优化。同时，还需要控制内存和CPU的使用，这样可…

PHP中文网
2025年2月28日 • 编程技术
2000
简单的Python2.7编程初学经验总结

如果你从来没有使用过Python，我强烈建议你阅读Python introduction，因为你需要知道基本的语法和类型。包管理 Python世界最棒的地方之一，就是大量的第三方程序包。同样，管理这些包也非常容易。按照惯例，会在 requi…

PHP中文网
2025年2月28日 • 编程技术
2000

发表回复

登录后才能评论

Python使用正则匹配实现抓图代码分享

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

请登录

AD推荐黄金广告位招租... 更多推荐