清洗数据时,发现数据中有一些HTML未转义的字符。需要先将其转义,在看这些符号是过滤还是保留。于是就找到了这个StringEscapeUtils工具类,这边记录一下。
StringEscapeUtils
是在java.commons.lang3的2.0版本中加入的工具类,在3.6版本中被标注为@Deprecated,表明在之后的版本中则为过时状态,之后StringEscapeUtils
类被移到java.commons.text包下。
功能用途
StringEscapeUtils的主要功能就是为Java,JavaScript,HTML,XML进行转义与反转义。
- escapeJava(String input) / unescapeJava(String unionCodeString)
将输入字符串转为unicode编码 / 将unicode字符串转为Utf-8格式的字符串 - escapeHtml4(String input) / unescapeHtml4(String input)
转义/反转义html脚本 - escapeEcmaScript(String input) / unescapeEcmaScript(String input)
转义/反转义js脚本 - escapeXml(String input) / unescapeXml(String input)
转义/反转义xml脚本
我这边主要使用的是HTML的转义
标题引入依赖
<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-lang3 -->
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-lang3</artifactId>
<!--选一个用的人多的版本-->
<version>x.x</version>
</dependency>
样例:
import org.apache.commons.lang3.StringEscapeUtils;
public class HtmlTest {
public static void main(String[] args) {
String str = " "&<>";
System.out.println(StringEscapeUtils.unescapeHtml3(str));
}
}
结果:
最后
以上就是长情小懒虫最近收集整理的关于HTML字符Java转义 |"|&|<|>等的全部内容,更多相关HTML字符Java转义 |"|&|<|>等内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复