posts - 297,  comments - 1618,  trackbacks - 0

一. UTF-8和US-ASCII的区别
    UTF-8 包括 US-ASCII 和多字节编码。与普通的多字节编码不同,UTF-8的字节长度不固定,对于ASCII, 字节长度为1, 对于中文,阿拉伯文等,可以是2,3或更多字节,这样能有效节省存储空间. 它还与很多传统编码标准兼容,所以很受欢迎.

二 native2ascii的使用
    将本地码转为ASCII码的转换器。
    将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。

   1) 结构: native2ascii [options] [inputfile [outputfile]]

   2) 说明

Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(\udddd 记号)字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。

若省略 outputfile,则使用标准输出设备输出。此外,如果也省略 inputfile,则使用标准输入设备输入。

    3) 选项

-reverse
执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件:
-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是下表第一栏所示的字符串.
4) 使用举例
native2ascii -encoding GBK ApplicationResources_zh_CN.properties.gbk ApplicationResources_zh_CN.properties



posted on 2007-03-29 12:16 阿蜜果 阅读(6221) 评论(1)  编辑  收藏 所属分类: Other


FeedBack:
# re: UTF-8和US-ASCII的区别,native2ascii的使用
2007-03-30 09:09 | Tortoise
不错。顶
  回复  更多评论
  

只有注册用户登录后才能发表评论。


网站导航:
 
<2007年3月>
25262728123
45678910
11121314151617
18192021222324
25262728293031
1234567

      生活将我们磨圆,是为了让我们滚得更远——“圆”来如此。
      我的作品:
      玩转Axure RP  (2015年12月出版)
      

      Power Designer系统分析与建模实战  (2015年7月出版)
      
     Struts2+Hibernate3+Spring2   (2010年5月出版)
     

留言簿(253)

随笔分类

随笔档案

文章分类

相册

关注blog

积分与排名

  • 积分 - 2101945
  • 排名 - 3

最新评论

阅读排行榜

评论排行榜