关于使用utf8编码实现全球化的几点困惑

随笔分类(9)

文章分类(19)

随笔档案(9)

文章档案(19)

Posted on 2006-04-09 10:25 publisher luo 阅读(3865) 评论(1) 编辑收藏所属分类: java技术

某日一时兴起将我们的内容管理发布系统改成uft-8格式（即将所有页面encode变为utf8，mysql字符集也变成uft-8）来支持能够建立各种语言的网站（产品现在可以免费下载，网址为：http://sourceforge.net/projects/nodepublisher）。但是在修改程序过程中发现了一个问题，那就是在客户端页面提交过来的请求的编码格式在服务器端无法获知。如果提交页面的<head>里面如果包含<meta http-equiv="Content-Type" content="text/html; charset=utf-8">，汉字部分则以utf8编码提交，如果没有的话则以gbk编码提交，而服务器端接受到的request无法判别编码格式，取到的头信息只有一些zh类似的说明,所以无法正确的将其转换成正确的编码格式。
另一需要注意的是不能将取到的参数从ISO8859转换成中文系统默认的字符集GBK,然后再转换成utf8，这样的话如果出现奇数汉字的话会导致部分汉字乱码，原因在于汉字在GBK编码中为2个byte，而在utf8编码则为3个byte，如果是偶数个汉字，从ISO8859（tomcat默认得到的request都是ISO8859编码）转换成GBK，然后再转换成ISO8859到还无妨，但是奇数个，最后一个byte不知道会怎么转换成GBK的，然后再转回到utf8时最后那个字符就会成为乱码，我想可能是跟String类里面的拆分char的方法有关，不知道谁有更加明确的分析和解释。
再一数据库方面使用mysql5，设置成utf8初始化数据脚本汉字转换成uft8，一切正常。后来无意将数据库转换成GBK编码，竟然程序运行也正常，后来经过测试将mysql设置成gbk，然后执行初始化sql脚本，汉字编码格式为GBK，程序运行依然正常。不明白其中的原由。

Feedback

# re: 关于使用utf8编码实现全球化的几点困惑 回复 更多评论

2006-04-09 13:37 by thinkbase

mysql的原因, 应该是数据库jdbc驱动会自己进行编码的转换; 至于有些页面提交的是UTF-8, 有些是GBK, 为什么不把所有页面都加上"<meta http-equiv="Content-Type" content="text/html; charset=utf-8">"?

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: 在windows下eclipse的带ssh的cvs客户端配置（使用putty tools）关于使用utf8编码实现全球化的几点困惑软件体系结构（构架）、框架、设计模式之间的关系基于J2EE轻量级容器构件框架设计（系列） j2ee框架设计原理及应用板块开张 why? EnterpriseBean extend Serializable

常用链接

java site

About.com
来自About.com的Java新闻和技术文章网站
Cnet的Builder.com网站
Cnet的Builder.com网站 - 所有的技术文章, 以Java为主.
comp.lang.java的FAQ站点
comp.lang.java的FAQ站点 - 收集了来自comp.lang.java新闻组的问题和答案的分类目录
DevX
DevX维护的一个Java技术文章网站.
Gamelan.com
由Gamelan.com 维护的Java技术文章网站.
IBM的Developerworks技术网站
IBM的Developerworks技术网站; 这是其中的Java技术主页
Java Blog
互联网上最活跃的一个Java Blog网站.
Java Developers Journal
Java Developers Journal的在线杂志网站.
javadesktop
位于Java.net的一个Java桌面技术社区网站
JavaPro在线杂志网站
JavaPro在线杂志网站.
javaranch论坛
一个论坛，得到Java问题答案的地方，初学者的好去处。
Java开发者年鉴
Java开发者年鉴一书的在线版本. 要想快速查到某种Java技巧的用法及示例代码, 这是一个不错的去处
java评论服务
提供Java评论服务. 包括各种framework和应用程序.
O'Reilly的Java网站
O'Reilly的Java网站. 每周都有新文章.
Q&A形式的Java技术资源社区
一个非常棒的采用Q&A形式的Java技术资源社区.
Sun Java社区网站.
Sun公司维护的一个Java社区网站.
SUN公司的官方Java指南
来自SUN公司的官方Java指南 - 对于了解几乎所有的java技术特性非常有帮助.
theserverside
这是一个讨论所有Java服务器端技术的网站.
官方的Java开发者网站
官方的Java开发者网站 - 每周都有新文章发表.
最早的一个Java站点
最早的一个Java站点. 每周更新Java技术文章.

java node

随笔分类(9)

文章分类(19)

随笔档案(9)

文章档案(19)

最新随笔

最新评论