kapok

垃圾桶,嘿嘿，我藏的这么深你们还能找到啊，真牛！

语源科技BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合

:: 管理 ::

455 随笔 :: 0 文章 :: 76 评论 :: 0 Trackbacks

再谈URLEncoder

http://rabbit8.blogchina.com/blog/article_144619.859489.html
再谈URLEncoder

2005年 02月16日

有个朋友说在百度上提交的数据进行编码后不是我说的那样，我试了一下，找到原因如下

关于URLEncoder的解析问题

在http://rabbit8.blogchina.com/blog/article_144619.789425.html后，有个朋友留言，说在百度试验的结果和我文章中说的不一致，我做了个实验，证实JDK的帮助没错，原因如下：

我的试验代码如下：
public static void main(String[] args) {
        URLEncoder urle = null;

        //得到默认：%A8%B9
        System.out.println("默认：" +   urle.encode("ü"));
        try {
            //得到GBK：%A8%B9
            System.out.println("GBK：" + urle.encode("ü", "GBK"));
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        try {
            //得到UTF-8：%C3%BC
            System.out.println("UTF-8：" + urle.encode("ü", "UTF-8"));
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
    }

      如果用UltraEdit来查看"ü"的ASCII的话，得到的结果如图：

      可见，UltraEdit使用的是操作系统默认的编码方式(实际上，MS采用的也不是GBK，而是另一种编码，但效果和GBK差不多)，所以它显示的ASCII的编码为A8 B9,就是第一和第二种情况的结果。而第三种情况才是JDK帮助中所声明的情况。

      我查看了百度，提交了一下，结果和我预期的是一样的！

      如果你查看页面的源文件，会看到百度的charset为gb2312,而帮助中明确提到例子使用的是UTF-8编码，所以出现了不一致的问题，也正是因为这个原因，所以JDK中决定要废弃public static String encode(String s)方法，因为这个方法的编码的字符集依赖于程序运行的系统的默认的字符集！

                                                                     兔八哥
                                                            2005-2-15 17：41

posted on 2005-03-09 00:44 笨笨阅读(789) 评论(0) 编辑收藏所属分类: ALL 、AppFuse

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: 简化JavaMail：小巧 Jakarta Commons-Email 简单教程读"Under the Hood of J2EE Clustering" J2EE集群 Phase x509数字证书介绍 SSL※ X509 了解安全性断言标记语言架构蓝图--软件架构 "4+1" 视图模型主动对象 Profile,Stereotype,TaggedValue与OCL漫谈 Drools 为你的业务逻辑提供框架（翻译）

kapok

常用链接

留言簿(28)

随笔分类

随笔档案

Corba

EAI

Online Document

Open Source

Portal

RSS Links

Weblogic

不错的链接

工具集合

数据仓库相关

搜索

最新评论

阅读排行榜

评论排行榜