基本原理是使用一系列特殊字符和语法来匹配和操作文本数据。正则表达式通常包括模式字符串，用于描述要匹配的文本模式，以及一个或多个特殊字符和语法，用于控制匹配的方式和结果。Python中的正则表达式通常使用re模块来实现

PHP中文网 • 2025年2月26日 18:41:16 • 编程技术 • 阅读 2

正则表达式是什么？

正则表达式，又称规则表达式，(英语:regular expression，在代码中常简写为 regex、regexp 或 re)，它是计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如在 perl 中内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由 unix 中的工具软件普及开的。正则表达式是对字符串(包括普通字符(例如，a 到 z 之间的字母)和特殊字符(称为”元字符”))操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个”规则字符串”，这个”规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式，模式描述在搜索文本时要匹配的一个或多个字符串。

1.实例引入

说了一大堆废话，大家可能还是云里雾里的，我们通过实例来说明一下，我们可以用正则表达式测试工具，或者python都可以，首先，我们输入一段文本。

hello，my name is Tina，my phone number is 123456 and my web is http://tina.com.

                               [a-zA-z]+://[^s]*

登录后复制

我们就可以获取网页链接，也就是文本中的url，是不是很神奇？

这是因为它有自己的匹配规则，部分如下。

模式描述.任意字符*0个或者多个表达式+一个或者多个表达式

关于更多的匹配规则可自行查阅。

立即学习“Python免费学习笔记（深入）”；

?,*,+,d,w 都是等价字符

?等价于匹配长度{0,1}

*等价于匹配长度{0,}

+等价于匹配长度{1,}

d 等价于[0-9]

D 等价于[^0-9]

w 等价于[A-Za-z_0-9]

W 等价于[^A-Za-z_0-9]

2.match()

这里介绍一个常用的匹配方法——match（），向他传入要匹配的字符串以及正则表达式，就可以检测这个正则表达式是否匹配字符串。

匹配目标

res = re.match('hellos(d+)sword')

登录后复制

贪婪匹配

res = re.match('hello.*(d+)sword')

登录后复制

3.findall（）

我们最常用的就是这个，我们看看这个是如何使用的。

import re useData = str(input('请输入字符串数据:')) '''匹配字符串中的数字,+是匹配前面的子表达式一次或多次'''digital = re.findall('d+',useData) print(digital)

登录后复制

我们看看运行结果

findall()函数是返回所有匹配到的字符串,返回值的数据类型为列表。

常用符号

我们再来说说正则表达式的常用符号吧。

“.”字符为匹配任意单个字符。

“”字符为转义字符。

“[…]”为字符集。

“(.*?)” 是python爬虫最常用的一个字符，叫贪心算法，可以匹配任意的字符。

下面我们看一个示例代码。

import re a=‘xxixxjshdxxlovexxsfhxxpythonxx' data=re.findall(‘xx(.*?)xx') print(data)

登录后复制

我们运行一下，看下效果。

运行结果
[‘I’ ,‘love’,‘python’]

特殊字符

所谓特殊字符，就是一些有特殊含义的字符，比如讲 runoo*b 中的，简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号，则需要对 * 进行转义，即在其前加一个，runo*ob 匹配字符串 runo*ob。

许多元字符要求在试图匹配它们时特别对待。若要匹配这些特殊字符，必须首先使字符”转义”，即，将反斜杠字符放在它们前面。下表列出了正则表达式中的特殊字符：

特别字符描述$

匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 $ 也匹配 ‘’ 或 ‘’。要匹配 $ 字符本身，请使用 $。

()标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 ( 和 )。*匹配前面的子表达式零次或多次。要匹配 * 字符，请使用 *。+匹配前面的子表达式一次或多次。要匹配 + 字符，请使用 +。.匹配除换行符之外的任何单字符。要匹配 . ，请使用 . 。

概念说了一大堆，大家可能也记不住，我直接说几个案例，大家就能明白其他的道理。

这是某网的HTML，部分片段如下：

§123 §133 §156 §189

登录后复制

大家会发现只有中间的一段不一样，而不一样的数据就是我们想要的，我们怎么用正则表达式提取出来呢.

§(.*?)

登录后复制

就可以了，我们看看效果吧。

123
133
156
189

以上就是基本原理是使用一系列特殊字符和语法来匹配和操作文本数据。正则表达式通常包括模式字符串，用于描述要匹配的文本模式，以及一个或多个特殊字符和语法，用于控制匹配的方式和结果。Python中的正则表达式通常使用re模块来实现的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2236843.html

Python

0 0

关于作者

PHP中文网签约作者

263.2K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

利用Python内置函数和自己编写的DFS算法，如何实现排列组合问题

上一篇 2025年2月26日 18:41:06

php代码出现乱码怎么解决

下一篇 2025年2月23日 23:14:44

利用Python内置函数和自己编写的DFS算法，如何实现排列组合问题

排列组合是数学中的一种常见的计算方法，用于求出从给定的元素中选取若干个元素的所有可能的排列或组合。在Python中，有多种方式可以实现排列组合的计算。调用内置函数 python标准库中提供了一个模块itertools，该模块包含了许多用于…

PHP中文网
编程技术 2025年2月26日
2000
如何实现希尔排序算法在Python中

算法描述希尔排序，又叫“缩小增量排序”，是对插入排序进行优化后产生的一种排序算法。它的执行思路是：把数组内的元素按下标增量分组，对每一组元素进行插入排序后，缩小增量并重复之前的步骤，直到增量到达1。一般来说，希尔排序的时间复杂度为O(n…

PHP中文网
2025年2月26日 • 编程技术
2000
编程技术

Python怎么对图片进行resize、裁剪、旋转、翻转

对图片进行resize、裁剪、旋转、翻转首先我们的原始图片是10张网上下载尺寸不一的图片，如下：操作1：resize 将图片resize到相同尺寸(320,240) from PIL import Imageimport torchvi…

PHP中文网
2025年2月26日
2000
Python内置logging怎么使用

logging 的主要作用提供日志记录的接口和众多处理模块，供用户存储各种格式的日志，帮助调试程序或者记录程序运行过程中的输出信息。 logging 日志等级 logging 日志等级分为五个等级，优先级从高到低依次是： **CRITI…

PHP中文网
编程技术 2025年2月26日
2000
Python中怎么处理Session和Cookie

Session和Cookie 在web开发中，session和cookie是常见的两种技术，它们用于在客户端和服务器端之间传递数据。session是一种服务器端的技术，它会在服务器端保存用户的数据，而cookie是一种客户端的技术，它会在浏…

PHP中文网
编程技术 2025年2月26日
2000
Python函数、递归和闭包怎么用

重新认识函数我们已经接触过数据类型和不变性中的函数。如果你还没有读过那篇文章，我建议你现在回去看看。让我们看一个函数的简单示例，以确保我们在同一维度。 def cheer(volume=None): if volume is None:…

PHP中文网
编程技术 2025年2月26日
2000
Python的命令行输入方法怎么用

命令行输入 Python 允许命令行输入。这意味着我们能够要求用户输入。 Python 3.6 中的方法与 Python 2.7 略有不同。 Python 3.6 使用 input() 方法。立即学习“Python免费学习笔记（深入）”…

PHP中文网
编程技术 2025年2月26日
2000
编程技术

python函数运行内存时间等性能检测工具怎么用

基础测试函数首先，来编写一个基础的python函数用于在后面的各种性能测试。 def base_func(): for n in range(10000): print(‘当前n的值是：{}’.format(n)) 登…

PHP中文网
2025年2月26日
2000
python的简单四则运算语法树可视化怎么实现

简单四则运算语法树可视化如果想要动手尝试一下，需要安装一下这个 python 可视化库。解析 AST Python 的 ast 库有一个 parse 方法，可以把传入的内容，解析成一个 AST。然后我们使用 ast.dump 将其导出并…

PHP中文网
2025年2月26日 • 编程技术
2000
Python怎么实现自动录入ERP系统数据

项目总体情况软件：pycharm 环境: Python 3.7.9(考虑到客户可能会有不同操作系统，为了兼容性考虑) 技术库: requests、pandas、Pyqt5等（详见依赖文件）需求分析通过对客户需求文档分析和与沟通，大致有…

PHP中文网
2025年2月26日 • 编程技术
2000

发表回复

登录后才能评论

正则表达式是什么？

1.实例引入

2.match()

匹配目标

贪婪匹配

3.findall（）

常用符号

特殊字符

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

请登录

AD推荐黄金广告位招租... 更多推荐