使用正则表达式删除HTML标签解决办法

使用正则表达式删除html标签。 

import java.util.regex.Matcher; import java.util.regex.Pattern; public class HTMLSpirit{    public static String delHTMLTag(String htmlStr){        String regEx_script="]*?>[\s\S]*?"; //定义script的正则表达式        String regEx_style="]*?>[\s\S]*?"; //定义style的正则表达式        String regEx_html="]+>"; //定义HTML标签的正则表达式        Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);        Matcher m_script=p_script.matcher(htmlStr);        htmlStr=m_script.replaceAll(""); //过滤script标签        Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);        Matcher m_style=p_style.matcher(htmlStr);        htmlStr=m_style.replaceAll(""); //过滤style标签        Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);        Matcher m_html=p_html.matcher(htmlStr);        htmlStr=m_html.replaceAll(""); //过滤html标签        return htmlStr.trim(); //返回文本字符串    } }

登录后复制

Java中去掉网页HTML标记的方法 
Java里面去掉网页里的HTML标记的方法: 

/** * 去掉字符串里面的html代码。
 * 要求数据要规范,比如大于小于号要配套,否则会被集体误杀。 * * @param content * 内容 * @return 去掉后的内容 */ public static String stripHtml(String content) { // 

段落替换为换行 content = content.replaceAll("

", ""); // 

替换为换行 content = content.replaceAll("
", ""); // 去掉其它的之间的东西 content = content.replaceAll("\", ""); // 还原HTML // content = HTMLDecoder.decode(content); return content; }

登录后复制

以上就是使用正则表达式删除HTML标签解决办法的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2834358.html

(0)
上一篇 2025年3月9日 05:40:13
下一篇 2025年3月1日 20:33:29

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 简述HTML 交互式表单验证方法

      在 HTML 中创建表单总是有点复杂。你首先得将 HTML 标记编写正确,然后需要确保每一个表单项在提交之前都有一个可用的值,最后还需要在有问题时用提醒来告知用户。   还好 HTML5 引入了一些新的特性,让这件事情变得轻松了许多。特…

    2025年3月9日
    200
  • html中列表标签总结

    1. 定义列表,定义列表中的项目,对项目的描述 例: 效果: 2.无序列表,列表项 例: 效果: 3.有序列表,列表项 例: 效果: 以上这篇细数html中的列表标签就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚…

    2025年3月9日 编程技术
    200
  • 详解HTML嵌套规则

      先说基础,html标签有两类:   1、块级元素   p、h1~h6、address、blockquote、center、dir、dl、dt、dd、fieldset、form、hr、isindex、menu、noframes、noscr…

    2025年3月9日
    200
  • 关于过滤Html的函数介绍

    这篇文章关于过滤html的函数介绍,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 //过滤Html的函数public string checkStr(string html){    System.Text.RegularExpress…

    编程技术 2025年3月9日
    200
  • 关于HTML中的滚动条/去掉滚动条

    1.xhtml下滚动条的颜色问题 在原来的html的时候,我们可以这样定义整个页面的滚动条: body{ scrollbar-3dlight-color:#d4d0c8; /*- 最外左 -*/  scrollbar-highlight-c…

    2025年3月9日
    200
  • HTML中的几种常用特殊符号

    在用HTML(HyperText Markup Language,超文本链接标示语言)语言编写Web页面时,由于所用的Web浏览器对HTML支持的程度不同,常常会在HTML语言的运用上产生一些疑问。在此,将几点经验奉献给大家,以供参考。  …

    2025年3月9日
    200
  • html中路径问题

    1 什么都不加默认当前目录 2 ./   当前目录 3 ../    父级目录 4 /    根目录 5.对以斜杠开头的url,服务器和浏览器的解释是不同的,服务器总是相对于当前web应用对他们进行解释,浏览器总是相对于服务器的根目录对它们…

    2025年3月9日
    200
  • html的meta属性使用总结

    原文:http://www.haorooms.com/post/html_meta_ds 引子 之前的我的博客中对于meta有个介绍,例如:http://www.haorooms.com/post/liulanq_think_ie 浏览器安…

    2025年3月9日
    200
  • HTML加载外部css文件的两种方法

    html加载外部css文件的两种方法          方法1:   <!–@import url(“/css.css”); –>   方法2:rel=”stylesh…

    2025年3月9日
    200
  • 详解html中的特殊字符

    html的特殊字符我们并不常用,但是有的时候却要在页面中用到这些字符,甚至有时候还需要用这些字符来实现某种特殊的视觉效果。现在,国外的设计师neal chester整理了一份很全的特殊字符集,我觉得这很赞~~,共享出来供大家查阅吧。 使用方…

    编程技术 2025年3月9日
    200

发表回复

登录后才能评论