Live a simple life

沉默(zhu_xing@live.cn)
随笔 - 48, 文章 - 0, 评论 - 132, 引用 - 0
数据加载中……

【原创】JDK 1.4有关编码的一个bug

        在JDK 1.4中存在一个有关编码的问题。简要描述如下:
        通过参数-Dfile.encoding="charset"设定特定的字符集,但是并不会被当作Reader或者Writer的默认字符集使用。这个问题,有时候会引起隐藏较深的乱码问题。JDK 1.5和1.6中此问题已经不存在,所以,如果遇到在同样默认字符集系统上面运行,基于JDK 1.5正常,基于JDK 1.4则出现乱码问题的时候,注意一下是否由于此问题引起。
        (原来JDK 1.4的这个bug在脑子中特别清晰,最近忘了,头两天遇到了,搞了半天~_~。发出来吧,也给大家提个醒)
       测试程序如下:
        

 1 public static void main(String[] args) {
 2     try {
 3        File file = new File("D:/text.txt");
 4        file.createNewFile();
 5        InputStreamReader reader = new InputStreamReader(new FileInputStream(file));
 6        OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(file));
 7        System.out.println(reader.getEncoding());
 8        System.out.println(writer.getEncoding());
 9     } catch (IOException e) {
10          e.printStackTrace();
11     }
12 }

        【执行环境】
        Windows XP中文,默认系统字符集是GBK
        启动参数设置:-Dfile.encoding=utf-8

        在JDK 1.4.2版本上输出如下:
        GBK
        GBK        

        在JDK 1.5.0_09版本上输出如下:
        UTF8
        UTF8

        由以上测试结果可以看出,在JDK 1.4上面,通过参数-Dfile.encoding="charset"设定特定的字符集,但是并不会被当作Reader或者Writer的默认字符集使用在JDK 1.4版本上面,此可能引起很多问题,例如read的部分是由于某开源库完成,则内部实现可能强制采用了-Dfile.encoding的配置;输出由我们自己完成,则默认的writer并不会默认采用-Dfile.encoding的设置,这样解码和编码用的字符集就不一致,可能就会引起乱码问题。
        简而言之,在JDK 1.4上开发,在利用字符流编解码需要依赖-Dfile.encoding设置的时候,要注意此问题

        附加说明:
        1、可以对InputStreamReader和OutputStreamWriter两个wrapper设定明确的编辑码字符集
        2、如果像和当前系统的-Dfile.encoding设置保持绝对一直,可以将System.getProperty("file.encoding")传入InputStreamReader和OutputStreamWriter



本博客中的所有文章、随笔除了标题中含有引用或者转载字样的,其他均为原创。转载请注明出处,谢谢!

posted on 2008-08-01 19:57 zhuxing 阅读(1701) 评论(1)  编辑  收藏 所属分类: Java

评论

# re: 【原创】JDK 1.4有关编码的一个bug  回复  更多评论   

记得我以前也是专门测试过这个问题,所以尽量是在代码中来指定读写的字符集。
2008-08-01 22:43 | 隔叶黄莺

只有注册用户登录后才能发表评论。


网站导航: