python的正则表达式的操作–re模块

re模块

序言:

re模块用于对python的正则表达式的操作

'.'     默认匹配除之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行'^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","abceee",flags=re.MULTILINE)'$'     匹配字符结尾,或e.search("foo$","bfoosdfsf",flags=re.MULTILINE).group()也可以'*'     匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']'+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']'?'     匹配前一个字符1次或0次'{m}'   匹配前一个字符m次'{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']'|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC''(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c'[a-z]' 匹配a到z任意一个字符'[^()]' 匹配除()以外的任意一个字符 r' '    转义引号里的字符 针对字符  详情查看⑦'A'    只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的'Z'    匹配字符结尾,同$'d'    匹配数字0-9'D'    匹配非数字'w'    匹配[A-Za-z0-9]'W'    匹配非[A-Za-z0-9]'s'    匹配空白字符、、、 , re.search("s+","abc13").group() 结果 ''   '(?P...)' 分组匹配 re.search("(?P[0-9]{4})(?P[0-9]{2})(?P[0-9]{4})","371481199306143242").groupdict("city")结果{'province': '3714', 'city': '81', 'birthday': '1993'}re.IGNORECASE  忽略大小写 re.search('(A|s)red(s+|$)',i,re.IGNORECASE)

登录后复制

标志位即模式修正符,不改变正则表达式的情况下,通过模式修正符改变正则表达式的含义,从而实现一些匹配结果的调整等功能: 

# flagsI = IGNORECASE = sre_compile.SRE_FLAG_IGNORECASE # ignore case  匹配时忽略大小写L = LOCALE = sre_compile.SRE_FLAG_LOCALE # assume current 8-bit locale   做本地化识别匹配U = UNICODE = sre_compile.SRE_FLAG_UNICODE # assume unicode locale       根据Unicode字符及解析字符M = MULTILINE = sre_compile.SRE_FLAG_MULTILINE # make anchors look for newline   多行匹配S = DOTALL = sre_compile.SRE_FLAG_DOTALL # make dot match newline      让.匹配包括换行符,即用了该模式修正后,"."匹配就可以匹配任意的字符了X = VERBOSE = sre_compile.SRE_FLAG_VERBOSE # ignore whitespace and comments

登录后复制

 

贪婪模式、懒惰模式:

立即学习“Python免费学习笔记(深入)”;

import reresult1 =  re.search("p.*y","abcdfphp435pythony_py")   # 贪婪模式print(result1)# result2 =  re.search("p.*?y","abcdfphp435pythony_py")   # 懒惰模式print(result2)# 

登录后复制

  

match:

从起始位置开始根据模型去字符串中匹配指定内容:

#matchimport re                               obj = re.match('d+', '123uua123sf')       #从第一个字符开始匹配一个到多个数字print(obj)                                #if obj:                                   #如果有匹配到字符则执行,为空不执行    print(obj.group())                    #打印匹配到的内容#123

登录后复制

匹配ip地址:

import reip = '255.255.255.253'result=re.match(r'^([1-9]?d|1dd|2[0-4]d|25[0-5]).([1-9]?d|1dd|2[0-4]d|25[0-5]).'                r'([1-9]?d|1dd|2[0-4]d|25[0-5]).([1-9]?d|1dd|2[0-4]d|25[0-5])$',ip)print(result)# 

登录后复制

 

search:

根据模型去字符串中匹配指定内容(不一定是最开始位置),匹配最前

#searchimport  reobj = re.search('d+', 'a123uu234asf')     #从数字开始匹配一个到多个数字print(obj)#if obj:                                   #如果有匹配到字符则执行,为空不执行    print(obj.group())                    #打印匹配到的内容#123import  reobj = re.search('([^()]+)', 'sdds(a1fwewe2(3uusfdsf2)34as)f')     #匹配最里面()的内容print(obj)#if obj:                                   #如果有匹配到字符则执行,为空不执行    print(obj.group())                    #打印匹配到的内容#(3uusfdsf2)

登录后复制

 

group与groups的区别:

#group与groups的区别import  rea = "123abc456"b = re.search("([0-9]*)([a-z]*)([0-9]*)", a)print(b)#print(b.group())#123abc456print(b.group(0))#123abc456print(b.group(1))#123print(b.group(2))#abcprint(b.group(3))#456print(b.groups())#('123', 'abc', '456')

登录后复制

 

findall:

上述两中方式均用于匹配单值,即:只能匹配字符串中的一个,如果想要匹配到字符串中所有符合条件的元素,则需要使用 findall;findall没有group用法

#findallimport  reobj = re.findall('d+', 'a123uu234asf')     #匹配多个if obj:                                   #如果有匹配到字符则执行,为空不执行    print(obj)                             #生成的内容为列表#['123', '234']

登录后复制

 

sub:

用于替换匹配的字符串(pattern, repl, string, count=0, flags=0)

#subimport  recontent = "123abc456"new_content = re.sub('d+', 'ABC', content)print(new_content)#ABCabcABC

登录后复制

 

split:

根据指定匹配进行分组(pattern, string, maxsplit=0, flags=0)

#splitimport  recontent = "1 - 2 * ((60-30+1*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2) )"new_content = re.split('*', content)       #用*进行分割,分割为列表print(new_content)#['1 - 2 ', ' ((60-30+1', '(9-2', '5/3+7/3', '99/4', '2998+10', '568/14))-(-4', '3)/(16-3', '2) )']content = "'1 - 2 * ((60-30+1*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2) )'"new_content = re.split('[+-*/]+', content)# new_content = re.split('*', content, 1)print(new_content)#["'1 ", ' 2 ', ' ((60', '30', '1', '(9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14))',#  '(', '4', '3)', '(16', '3', "2) )'"]inpp = '1-2*((60-30 +(-40-5)*(9-2*5/3 + 7 /3*99/4*2998 +10 * 568/14 )) - (-4*3)/ (16-3*2))'inpp = re.sub('s*','',inpp)                #把空白字符去掉print(inpp)new_content = re.split('(([+-*/]?d+[+-*/]?d+){1})', inpp, 1)print(new_content)#['1-2*((60-30+', '-40-5', '*(9-2*5/3+7/3*99/4*2998+10*568/14))-(-4*3)/(16-3*2))']

登录后复制

 

补充r’ ‘ 转义:

python的正则表达式的操作--re模块python的正则表达式的操作--re模块

fdfdsfdsdssfdsfds& @$

登录后复制lzl.py

首先要清楚,程序读取文件里的字符时,添加到列表里面的是\

import re,sysli = []with open('lzl.txt','r',encoding="utf-8") as file:    for line in file:        li.append(line)print(li)                   # 注意:文件中的单斜杠,读出来后会变成双斜杠# ['fdfdsfds\fds', 'sfdsfds& @$']print(li[0])                # print打印的时候还是单斜杠# fdfdsfdsds

登录后复制

r字符的意义,对字符进行转义做为字符出现:

import re,sysli = []with open('lzl.txt','r',encoding="utf-8") as file:    for line in file:        print(re.findall(r's\f', line))  #第一种方式匹配        # print(re.findall('\\', line))  #第二种方式匹配        li.append(line)print(li)                   # 注意:文件中的单斜杠,读出来后会变成双斜杠# ['s\f']# []# ['fdfdsfds\fds', 'sfdsfds& @$']

登录后复制

补充:看完下面的代码你可能更懵了

import rere.findall(r'\', line)  # 正则中只能这样写 不能写成 r'' 这样print(r'\')            # 只能这样写 不能写成r'' 只能是双数# \        结果# 如果想值打印单个 写成如下print('\')             # 只能是双数#          结果

登录后复制

总结:文件中的单斜杠,读出到程序中时是双斜杠\,print打印出来是单斜杠;正则匹配文件但斜杠时,用r’\’双斜杠去匹配,或者不用r直接用’\\’四个斜杠去匹配

 

compile函数:

说明:

Python通过re模块提供对正则表达式的支持。使用re的一般步骤是先使用re.compile()函数,将正则表达式的字符串形式编译为Pattern实例,然后使用Pattern实例处理文本并获得匹配结果(一个Match实例),最后使用Match实例获得信息,进行其他的操作

登录后复制

举一个简单的例子,在寻找一个字符串中所有的英文字符:

import repattern = re.compile('[a-zA-Z]')result = pattern.findall('as3SiOPdj#@23awe')print(result)# ['a', 's', 'S', 'i', 'O', 'P', 'd', 'j', 'a', 'w', 'e']

登录后复制

匹配IP地址(255.255.255.255):  

import repattern = re.compile(r'^(([1-9]?d|1dd|2[0-4]d|25[0-5]).){3}([1-9]?d|1dd|2[0-4]d|25[0-5])$')result = pattern.match('255.255.255.255')print(result)# 

登录后复制

 

以上就是python的正则表达式的操作–re模块的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2270483.html

(0)
上一篇 2025年2月27日 11:43:08
下一篇 2025年2月18日 09:44:19

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • Python基础-包与模块详解

    Python基础-包与模块 写在前面 如非特别说明,下文均基于Python3 摘要 为重用以及更好的维护代码,Python使用了模块与包;一个Python文件就是一个模块,包是组织模块的特殊目录(包含__init__.py文件)。 模块搜索…

    2025年2月27日
    200
  • Python的主要应用领域有哪些?Python的介绍

    一、pthon介绍                                             Pyhton的创始人为吉多·范罗苏姆(Guido van Rossum)。1989年的圣诞节期间,吉多·范罗苏姆在阿姆斯特丹打发时间…

    编程技术 2025年2月27日
    200
  • os模块

    一、简介 Python的标准库中的os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。即它允许一个程序在编写后不需要任何改动,也不会发生任何问题,就可以在Linux和Windows下运行。 二、具体模…

    编程技术 2025年2月27日
    200
  • python——根据电子表格的数据自动查找文件

    最近刚接触python,找点小任务来练练手,希望自己在实践中不断的锻炼自己解决问题的能力。 经理最近又布置了一个很繁琐的任务给我:有一项很重大的项目做完了,但是要过审计(反正就是类似的审批之类的事情),要提交整个项目的过程性文件。这个项目做…

    编程技术 2025年2月27日
    200
  • python中一些基本概念的详解

    面向对象: 概念:类,实例化,对象,实例 属性:   公有属性:在类中定义   成员属性:在方法中定义  立即学习“Python免费学习笔记(深入)”;   私有属性:在方法中使用 __属性  定义 限制外部访问 方法:   普通方法   …

    编程技术 2025年2月27日
    200
  • Python爬虫:HTTP协议、Requests库

    http协议: HTTP(Hypertext Transfer Protocol):即超文本传输协议。URL是通过HTTP协议存取资源的Internet路径,一个URL对应一个数据资源。 HTTP协议对资源的操作: Requests库提供了…

    2025年2月27日 编程技术
    200
  • Python之Excel操作

    python的excel操作需要另外下载安装对应python版本的xlrd和xlwt包,用于对excel的读取和写入。 安装方法:直接解压后,在字符命令界面cd到setup.py的目录,执行命令“Python setup.py instal…

    编程技术 2025年2月27日
    200
  • 解决Linux系统中python matplotlib画图的中文显示问题

    最近想学习一些python数据分析的内容,就弄了个爬虫爬取了一些数据,并打算用anaconda一套的工具(pandas, numpy, scipy, matplotlib, jupyter)等进行一些初步的数据挖掘和分析。 在使用matpl…

    编程技术 2025年2月27日
    200
  • Python之os操作实例

    1. os.path.driname(path):返回路径的上一级路径字符串。   >>> os.path.dirname(‘D:Games’)  ’D:\’  >&g…

    编程技术 2025年2月27日
    200
  • python学习路程

    这一章中作者简要的介绍了python数据模型,主要是python的一些特殊方法。比如__len__, __getitem__. 并用一个纸牌的程序来讲解了这些方法   首先介绍下Tuple和nametuple的区别: Nametuple是类…

    2025年2月27日
    200

发表回复

登录后才能评论