吕鹏的blog

研究技术探讨生活

常用链接

统计

随笔 - 69
文章 - 1
评论 - 24
引用 - 0

编码问题

UTF8是可变长的编码
1   UTF-8通过UNICODE转所以每次编码都会变成最小
2   但解码的时候仍然可以识别多种编码
public class TestUTF8
{
   public static void main(String [] args) throws Exception
   {
      byte[] bytes = {(byte)0xC0,(byte)0xB1};
       String str = new String(bytes,"UTF-8");（解码）
       System.out.println(str.getBytes("UTF-8").length);（通过unicode编码）
   }
}
程序运行后打印的结果如下：
1
1
原因是

十六进制：C0 B1
二进制：11000000 10110001
对比两个字节编码的表示方式：
110xxxxx 10xxxxxx
提取出对应的UNICODE编码：
00000 110001

抽象类和接口的区别

抽象类抽出象的部门   重在体现共同的部份   达到代码复用
接口扩展功能   重在表现不同的部分

posted on 2006-08-23 17:09 吕鹏阅读(142) 评论(0) 编辑收藏所属分类: java技术心得

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: 多态例外 J2EE java字符编码设计模式 java缓存动力短信开会编码问题

吕鹏的blog

导航

公告

留言簿(4)

随笔分类

文章分类

随笔档案

文章档案

相册

阅读排行榜

评论排行榜

常用链接

统计

最新评论

编码问题