我是靠谱客的博主 炙热招牌,最近开发中收集的这篇文章主要介绍UTF-8的汉字三字节码与Unicode编码转换,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

     最近在学习jsp学到了随机验证图片的制作,需要输出汉字,下面就简单的介绍一下如何得到一个想要汉字的unicode编码。

     首先可以在浏览器中输入想要的汉字,然后回车,可以在弹出页面的地址栏中url找到一个参数,下面以IE为例,我输入的是“许” 可以看到“query=%E8%AE%B8”这样一个字段

其中“%E8%AE%B8”就是许的三字节码,如下图:

     这样我们就得到了一个汉字的三字节码,下面就具体介绍如何将其转换成Unicode编码;

 

UTF-8汉字采用三字节编码,有如下固定格式 :1110xxxx 10xxxxxx 10xxxxxx

其中用x代表的16位使用unicode相应的位来填充,可得到汉字的代码点,这个可以直接用来输出

,如下面给出的例子,分别是三字节序列,可转换成Unicode

例如 :

%E8%AE%B8(许的三字节编码) :11101000 10101110 10111000

取第一个字节4-7位(假设是从左到右0-7位):1000十六进制为8,

取第二个字节的2-5位:1011为B

取第二个字节6-7位和第三个字节2-3位 :1011为B

取第三个字节4-7位:1000为8

故可以得到“许”的Unicode码为u8bb8

最后

以上就是炙热招牌为你收集整理的UTF-8的汉字三字节码与Unicode编码转换的全部内容,希望文章能够帮你解决UTF-8的汉字三字节码与Unicode编码转换所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部