posts - 201,  comments - 927,  trackbacks - 0

一. UTF-8和US-ASCII的区别
    UTF-8 包括 US-ASCII 和多字节编码。与普通的多字节编码不同,UTF-8的字节长度不固定,对于ASCII, 字节长度为1, 对于中文,阿拉伯文等,可以是2,3或更多字节,这样能有效节省存储空间. 它还与很多传统编码标准兼容,所以很受欢迎.

二 native2ascii的使用
    将本地码转为ASCII码的转换器。
    将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。

   1) 结构: native2ascii [options] [inputfile [outputfile]]

   2) 说明

Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(\udddd 记号)字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。

若省略 outputfile,则使用标准输出设备输出。此外,如果也省略 inputfile,则使用标准输入设备输入。

    3) 选项

-reverse
执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件:
-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是下表第一栏所示的字符串.
4) 使用举例
native2ascii -encoding GBK ApplicationResources_zh_CN.properties.gbk ApplicationResources_zh_CN.properties



posted on 2007-03-29 12:16 阿蜜果 阅读(648) 评论(1)  编辑  收藏 所属分类: Other


FeedBack:
# re: UTF-8和US-ASCII的区别,native2ascii的使用
2007-03-30 09:09 | Tortoise
不错。顶
  回复  更多评论
  



标题  
姓名  
主页
验证码 *  
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2007-03-29 12:26 编辑过
 
 
相关链接:
网站导航:



<2007年3月>
25262728123
45678910
11121314151617
18192021222324
25262728293031
1234567


錢為人用無需多,人為錢忙凈白忙

留言簿(140)

随笔分类

随笔档案

文章分类

相册

关注blog

积分与排名

  • 积分 - 271485
  • 排名 - 25

最新评论

评论排行榜

60天内阅读排行