广告国内BGP机房32G内存299元网站收录排名问题解决【超牛】搜外友链平台站长在线扒站工具【免费】【免费】站长开发工具箱【推荐】站长自动外链工具广告位联系QQ：253000106 独立服务器100M/不限/免备 2核2G服务器新用户低至68元/年虚拟资源平台,轻松变现 10000来路IP只需8元站群系统程序-专注SEO站群黑帽SEO论坛_黑帽聚集地企业HTTP代理IP服务提供商软文推广，在线获客【定制】站群服务器99元起 SEO免费工具分享外推代发包收录【国内国际】短信推广，免费测试实力产品收量外链代发 5分一条快速排名 █一解决“收录、排名”问题一█ ●●●优质搜狗泛收录域名●●● AI数字人直播系统源码百度SEO排名7-15天上首页

Python天气预报采集器实现代码(网页爬虫)

PHP中文网 • 2025年2月28日 08:38:03 • 编程技术 • 阅读 2

爬虫简单说来包括两个步骤：获得网页文本、过滤得到数据。
　　1、获得html文本。
　　python在获取html方面十分方便，寥寥数行代码就可以实现我们需要的功能。

代码如下:

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
page.close()
return html

这么几行代码相信不用注释都能大概知道它的意思。

　　2、根据正则表达式等获得需要的内容。

　　使用正则表达式时需要仔细观察该网页信息的结构，并写出正确的正则表达式。
　　python正则表达式的使用也很简洁。我的上一篇文章《Python的一些用法》介绍了一点正则的用法。这里需要一个新的用法：

代码如下:

def getWeather(html):
reg = ‘(.*?).*?(.*?).*?(.*?)‘
weatherList = re.compile(reg).findall(html)
return weatherList

其中reg是正则表达式，html是第一步获得的文本。findall的作用是找到html中所有符合正则匹配的字符串并存放到weatherList中。之后再枚举weatheList中的数据输出即可。
　　这里的正则表达式reg有两个地方要注意。
　　一个是“(.*?)”。只要是（）中的内容都是我们将要获得的内容，如果有多个括号，那么findall的每个结果就都包含这几个括号中的内容。上面有三个括号，分别对应城市、最低温和最高温。
　　另一个是“.*?”。python的正则匹配默认是贪婪的，即默认尽可能多地匹配字符串。如果在末尾加上问号，则表示非贪婪模式，即尽可能少地匹配字符串。在这里，由于有多个城市的信息需要匹配，所以需要使用非贪婪模式，否则匹配结果只剩下一个，且是不正确的。
　　
　　python的使用确实十分方便：）

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至253000106@qq.com举报，一经查实，本站将立刻删除。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2305573.html

Python 天气预报采集器

赞 (0)

0 0

关于作者

PHP中文网签约作者

289.0K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

Python常见文件操作的函数示例代码

上一篇 2025年2月28日 08:36:18

php如何将特殊字符转换为单引号

下一篇 2025年2月23日 11:19:57

Python常见文件操作的函数示例代码

代码如下: # -*-coding:utf8 -*- ”’ Python常见文件操作示例 os.path 模块中的路径名访问函数分隔 basename() 去掉目录路径, 返回文件名 dirname() 去掉文件名…

PHP中文网
编程技术 2025年2月28日
2000
python 不关闭控制台的实现方法

直接打开dos窗口，再执行python程序在脚本的最后一行后面添加：raw_input()语句，这样直到按下回车键，窗口才关闭。使用time模块的sleep函数，它有一个参数，传入数字，其单位是秒：代码如下: import time …

PHP中文网
编程技术 2025年2月28日
2000
Python中删除文件的程序代码

Python是一种面向对象的解释性的计算机程序设计语言，也是一种功能强大而完善的通用型语言，已经具有十多年的发展历史，成熟且稳定。Python 具有脚本语言中最丰富和强大的类库，足以支持绝大多数日常应用。它具有简单、易学、免费、开源、可移植…

PHP中文网
编程技术 2025年2月28日
2000
python类定义的讲解

一、类定义：代码如下: class : 类实例化后，可以使用其属性，实际上，创建一个类之后，可以通过类名访问其属性。如果直接使用类名修改其属性，那么将直接影响到已经实例化的对象类的私有属性：　　__private_attrs 两个下…

PHP中文网
编程技术 2025年2月28日
2000
初学python数组的处理代码

初学python,小缘缘出了几道题：有一 list a = [1, 2, 3, 4, 5, 6] 请将 a 依 0, 1 1, 2 2, 3 3, 4 4, 5 5, 6 打印输出， 2.将a list 倒序成 [6, 5, 4, 3, …

PHP中文网
编程技术 2025年2月28日
2000
python操作MongoDB基础知识

首先运行easy_install pymongo命令安装pymongo驱动。然后执行操作：创建连接代码如下: In [1]: import pymongoIn [2]: connection = pymongo.Connection(&#…

PHP中文网
编程技术 2025年2月28日
2000
让python的Cookie.py模块支持冒号做key的方法

为了做好兼容性，只能选择兼容:冒号。很简单，修改一下Cookie.Morsel 代码如下: #!/usr/bin/python # -*- coding: utf-8 -*- “””MorselHook…

PHP中文网
编程技术 2025年2月28日
2000
布同统计英文单词的个数的python代码

word中对于英文单词的统计也很好，大家不妨试试。如果没有安装word，而且你也是程序员的话，那么可以使用我的这段代码。通过测试，word的统计结果是18674，软件的统计结果是18349，相差不到2%，可以作为一个参考。　　代码如下： …

PHP中文网
编程技术 2025年2月28日
2000
用实例说明python的*args和**kwargs用法

先来看一个例子：代码如下: >>> def foo(*args, **kwargs): print ‘args =’, args print ‘kwargs = &#821…

PHP中文网
编程技术 2025年2月28日
2000
python下函数参数的传递(参数带星号的说明)

函数参数的使用又有俩个方面值得注意：1.函数参数是如何定义的 2.在调用函数的过程中参数是如何被解析先看第一个问题，在python中函数参数的定义主要有四种方式： 1.F(arg1,arg2,…) 这是最常见的定义方式，一个…

PHP中文网
编程技术 2025年2月28日
2000

发表回复

登录后才能评论