这次给大家带来正则的回溯引用backreference如何使用,正则回溯引用backreference使用的注意事项有哪些,下面就是实战案例,一起来看一下。
在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。
一、问题引入
一个在HTML页面中匹配标题标签(H1—H6)的问题:
文本:
Welcome to my page
Content is pided into twosections:Introduction
Information about me.Hobby
Information about my hobby.This is invalid HTML
登录后复制登录后复制
正则表达式:.*?[hH][1-6]>
结果:
【
Welcome to my page
】Content is pided into twosections:
【
Introduction
】Information about me.
【
Hobby
】Information about my hobby.
【
This is invalid HTML】
分析:模式匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了
、
,[hH][1-6]>匹配到了
、、;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即
,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。
二、回溯引用匹配
回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:
文本:
Welcome to my page
Content is pided into twosections:Introduction
Information about me.Hobby
Information about my hobby.This is invalid HTML
登录后复制登录后复制
正则表达式:.*?[hH]>
结果:
【
Welcome to my page
】Content is pided into twosections:
【
Introduction
】Information about me.
【
Hobby
】Information about my hobby.
This is invalid HTML
分析:首先匹配开始标题标签的模式,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为[hH]>,其中表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那也匹配到1,如果匹配到2,那也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。
相信看了本文案例你已经掌握了方法,更多精彩请关注【创想鸟】其它相关文章!
推荐阅读:
正则怎样写才能匹配一组字符
正则的位置匹配使用详解
以上就是正则的回溯引用backreference如何使用的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2777748.html