Java项目中的HTML标签怎么使用正则表达式进行删除

  介绍

这篇文章给大家介绍Java项目中的HTML标签怎么使用正则表达式进行删除,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

具体如下:

包com.xz.cxzy.utils;
  进口java.util.regex.Matcher;
  进口java.util.regex.Pattern;
  公开课HtmlUtil {
  私有静态最终字符串regEx_script=? lt;脚本(^祝辞]*和# 63;祝辞(\ \ \ \年代)*和# 63;& lt; \ \/script>“;//定义脚本的正则表达式
  私有静态最终字符串regEx_style=? lt;风格[^祝辞]*和# 63;祝辞(\ \ \ \年代)*和# 63;& lt; \ \/style>“;//定义风格的正则表达式
  私有静态最终字符串regEx_html=? lt;[^祝辞]+祝辞“;//定义HTML标签的正则表达式
  私有静态最终字符串regEx_space=癨 \ s * | \ t | | \ \ r n";//定义空格回车换行符/* *
  * @param htmlStr
  * @return
  *删除Html标签
  */delHTMLTag公共静态字符串(字符串htmlStr) {
  模式p_script=Pattern.compile (regEx_script Pattern.CASE_INSENSITIVE);
  匹配器m_script=p_script.matcher (htmlStr);
  htmlStr=m_script.replaceAll (“;”);//过滤脚本标签
  模式p_style=Pattern.compile (regEx_style Pattern.CASE_INSENSITIVE);
  匹配器m_style=p_style.matcher (htmlStr);
  htmlStr=m_style.replaceAll (“;”);//过滤风格标签
  模式p_html=Pattern.compile (regEx_html Pattern.CASE_INSENSITIVE);
  匹配器m_html=p_html.matcher (htmlStr);
  htmlStr=m_html.replaceAll (“;”);//过滤html标签
  模式p_space=Pattern.compile (regEx_space Pattern.CASE_INSENSITIVE);
  匹配器m_space=p_space.matcher (htmlStr);
  htmlStr=m_space.replaceAll (“;”);//过滤空格回车标签
  返回htmlStr.trim ();//返回文本字符串
  }
  getTextFromHtml公共静态字符串(字符串htmlStr) {
  htmlStr=delHTMLTag (htmlStr);
  htmlStr=htmlStr.replaceAll (““““);
  htmlStr=htmlStr。substring (0, htmlStr.indexOf (“!”) + 1);
  返回htmlStr;
  }
  公共静态void main (String [] args) {
  字符串str=? lt; div风格=& # 39;text-align:中心;& # 39;比;整治“四风”清弊除垢& lt; br/祝辞& lt;跨风格=& # 39;字体大小:14 px; & # 39;比;& lt;/span> & lt;跨风格=& # 39;字体大小:18 px; & # 39;在公司召开党的群众路线教育实践活动动员大会& lt;/span> & lt; br/祝辞& lt;/div>“;
  System.out.println (getTextFromHtml (str));
  }
  }

关于Java项目中的HTML标签怎么使用正则表达式进行删除就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看的到。

Java项目中的HTML标签怎么使用正则表达式进行删除