介绍
这篇文章给大家介绍Java项目中的HTML标签怎么使用正则表达式进行删除,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
具体如下:
包com.xz.cxzy.utils; 进口java.util.regex.Matcher; 进口java.util.regex.Pattern; 公开课HtmlUtil { 私有静态最终字符串regEx_script=? lt;脚本(^祝辞]*和# 63;祝辞(\ \ \ \年代)*和# 63;& lt; \ \/script>“;//定义脚本的正则表达式 私有静态最终字符串regEx_style=? lt;风格[^祝辞]*和# 63;祝辞(\ \ \ \年代)*和# 63;& lt; \ \/style>“;//定义风格的正则表达式 私有静态最终字符串regEx_html=? lt;[^祝辞]+祝辞“;//定义HTML标签的正则表达式 私有静态最终字符串regEx_space=癨 \ s * | \ t | | \ \ r n";//定义空格回车换行符/* * * @param htmlStr * @return *删除Html标签 */delHTMLTag公共静态字符串(字符串htmlStr) { 模式p_script=Pattern.compile (regEx_script Pattern.CASE_INSENSITIVE); 匹配器m_script=p_script.matcher (htmlStr); htmlStr=m_script.replaceAll (“;”);//过滤脚本标签 模式p_style=Pattern.compile (regEx_style Pattern.CASE_INSENSITIVE); 匹配器m_style=p_style.matcher (htmlStr); htmlStr=m_style.replaceAll (“;”);//过滤风格标签 模式p_html=Pattern.compile (regEx_html Pattern.CASE_INSENSITIVE); 匹配器m_html=p_html.matcher (htmlStr); htmlStr=m_html.replaceAll (“;”);//过滤html标签 模式p_space=Pattern.compile (regEx_space Pattern.CASE_INSENSITIVE); 匹配器m_space=p_space.matcher (htmlStr); htmlStr=m_space.replaceAll (“;”);//过滤空格回车标签 返回htmlStr.trim ();//返回文本字符串 } getTextFromHtml公共静态字符串(字符串htmlStr) { htmlStr=delHTMLTag (htmlStr); htmlStr=htmlStr.replaceAll (““““); htmlStr=htmlStr。substring (0, htmlStr.indexOf (“!”) + 1); 返回htmlStr; } 公共静态void main (String [] args) { 字符串str=? lt; div风格=& # 39;text-align:中心;& # 39;比;整治“四风”清弊除垢& lt; br/祝辞& lt;跨风格=& # 39;字体大小:14 px; & # 39;比;& lt;/span> & lt;跨风格=& # 39;字体大小:18 px; & # 39;在公司召开党的群众路线教育实践活动动员大会& lt;/span> & lt; br/祝辞& lt;/div>“; System.out.println (getTextFromHtml (str)); } }
关于Java项目中的HTML标签怎么使用正则表达式进行删除就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看的到。