使用正则表达式删除html标签。
import java.util.regex.Matcher; import java.util.regex.Pattern; public class HTMLSpirit{ public static String delHTMLTag(String htmlStr){ String regEx_script="]*?>[\s\S]*?"; //定义script的正则表达式 String regEx_style="]*?>[\s\S]*?"; //定义style的正则表达式 String regEx_html="]+>"; //定义HTML标签的正则表达式 Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); Matcher m_script=p_script.matcher(htmlStr); htmlStr=m_script.replaceAll(""); //过滤script标签 Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); Matcher m_style=p_style.matcher(htmlStr); htmlStr=m_style.replaceAll(""); //过滤style标签 Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); Matcher m_html=p_html.matcher(htmlStr); htmlStr=m_html.replaceAll(""); //过滤html标签 return htmlStr.trim(); //返回文本字符串 } }
登录后复制
Java中去掉网页HTML标记的方法
Java里面去掉网页里的HTML标记的方法:
/** * 去掉字符串里面的html代码。
* 要求数据要规范,比如大于小于号要配套,否则会被集体误杀。 * * @param content * 内容 * @return 去掉后的内容 */ public static String stripHtml(String content) { //段落替换为换行 content = content.replaceAll("
", ""); //
替换为换行 content = content.replaceAll("
", ""); // 去掉其它的之间的东西 content = content.replaceAll("\", ""); // 还原HTML // content = HTMLDecoder.decode(content); return content; }
登录后复制
以上就是使用正则表达式删除HTML标签解决办法的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2834358.html