我是靠谱客的博主 深情朋友,最近开发中收集的这篇文章主要介绍pageEncoding与contentType中charset的关系及乱码详解,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

一、运行环境:Tomcat8.0

二、jsp文件中charset和pageEncoding的区别:

1.contentType的charset是指服务器发送给客户端时的内容编码
将charset为UTF-8,那么在浏览器当前网页右键-->编码,可以看到浏览器选择的编码也是UTF-8,如果charset设置为GBK,浏览器编码则会选择为GBK。
2.pageEncoding是指jsp页面的输出方式
设置pageEncoding设置为GBK,无论这个jsp文件实际是什么编码方式,都会以GBK的格式输出;pageEncoding还有一个功能就是告诉IDE这个文件是
什么编码格式,以便于IDE自动修改文件编码;这里用Eclipse测试(其他IDE未尝试):
windows环境下选中jsp文件 右键-->属性 可以看到下图:

这里写图片描述

如果Default选项为选中状态,当改变pageEncoding时,Eclipse会自动改变jsp文件的编码格式。

三、jsp页面乱码的原因及处理

1.pageEncoding设置不当造成乱码
关于pageEncoding的取值分为下面三种情况(charset的取值原则与此一致):
  1. 指定pageEncoding的值,pageEncoding即为指定的值;
  2. 只有charset的值,pageEncoding认为和charset取值一样;
  3. 既无pageEncoding也无charset,系统会取默认值“ISO-8859-1”

当jsp页面pageEncoding指定的编码和jsp页面的实际编码不一致时,如上图文件编码选择了Other的GB2312,如果此时pageEncoding指定的编码
不是GB2312就会出现乱码。
2.charset指定的编码不包含jsp页面中的所有文字
当charset的编码中不含有当前jsp页面中的某些字符时,会出现乱码情况;如:jsp页面中含有中文字符,charset为“ISO-8859-1”(可以保存,
发布),pageEncoding为GBK(其他任何Tomcat支持的含有中文字符的编码都行,UTF-8 , gb2312等;ANSI为windows下的编码格式,tomcat
不支持,无法解析)时,访问该页面会出现乱码,这是由于“ISO-8859-1”编码不含有中文字符,无法正确解析导致。

另外,如果pageEncoding指定的编码不含有jsp页面中的所有字符,Eclipse是不让保存的,如:pageEncoding=ISO-8859-1,jsp页面含有中文,
当保存时Eclipse会弹出下面的对话框:

这里写图片描述

3.乱码的处理
综上所述:为了保证jsp不会乱码,在Eclipse下我们可以这么做:
  1. jsp编码格式选择默认的选项Default,见图一;
  2. 不设置charset的编码;
  3. 必须设置 pageEncoding (其实在tomcat的识别范围内,是什么无所谓,符合公司的规范即可);

后记

contentType="text/html; charset=UTF-8"对应于该jsp界面相应java文件的这里,如下图:

这里写图片描述

最后

以上就是深情朋友为你收集整理的pageEncoding与contentType中charset的关系及乱码详解的全部内容,希望文章能够帮你解决pageEncoding与contentType中charset的关系及乱码详解所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(42)

评论列表共有 0 条评论

立即
投稿
返回
顶部