from:http://hi.baidu.com/wangzengfang/blog/item/c9f97b7b34c6caf00bd18724.html
下面的文章可供参考,但我遇到了几百兆的数量库,几次用此方法都失败,原因是编辑器不能支持这么大的文本文件的编辑,另存为UTF8格式后,再次导入都不成功。

怎么办呢?程序员还是靠程序吧。

从数据库中取出中文字符串来,用函数一看是UTF-8格式的,所有不能再转换为UTF-8格式的了,那怎么办呢?仔细想想,原来的网页显示中文是可行的,这时实际上是在GBK,GB2312编码下的。那我把字符串取出后转换成GBK的,即UTF-8=>BGK,果然可以显示了。注意这时网页中所有的编码都是UTF-8的了,应该跟一般的UTF-8的网页一样可以插入到数据库里了。但是插入记录还是乱码,于是把set names utf8再加上。竟然成功了。

但有个问题:为何字段格式是latin1,却可以gbk显示出来,但检测却是utf-8编码,却在utf-8下显示不出来,必须转换成bgk才可以显示出来?找到一篇强文!http://hi.baidu.com/wangzengfang/blog/item/8563a8f9b56bd25d252df2d7.html


相信 MySQL 的编码对很多人来说 … 一直是个相当令人头痛的问题 … 今天所要做的介绍是如何把数据库的数据, 由 latin1 转成 utf8..

一般 .. MySQL 装起来后(用 rpm 安装) ,系统的默认编码是 latin1.

而很多人在安装一些网页的系统时,如 wordpress、LifeType、phpBB … 等等,都会选择 utf8 。

这时 … 系统一样可以正常运作 … 只是当用 phpmyadmin 进入管理数据库时,就会发现 .. 怎么中文字的部分都变成了歪七扭八 ..

或者一些鬼画符的文字。如:凡事先從工作講起

此现象就是 utf8 的文字以 latin1形式储存,phpmyadmin 以 utf8 的数据读取方式读取 … 读出来的数据就是这种鬼画符…><。

若要解决 phpmyadmin 读出的鬼画符 … 有两个方法:

1. 进入 phpmyadmin 内一个名为 libraries 的子目录 .. 编辑 select_lang.lib.php. 找到 $mysql_charset_map 这一段下方 ..

‘utf-8′ => ‘utf8′,把它改成‘utf-8′ => ‘latin1′,

然后存盘 … 这时候就可以发现原先的鬼画符 … 这时候又都正常了.

2. 把数据库的编码转成 utf8 …

步骤:

a. 把数据库 dump 出来

mysqldump -u xxx -p database > database.sql –default-character-set=latin1

这时候 dump 出来的 database.sql 是 latin1 的文件格式,然而是 utf8 的文字数据,因此这时若用 vi 开档看它 …

还是会发现中文字是鬼画符 … 这时不要被眼前的假象所骗 … 以为自己做错 .. 几接着做下一步骤。

b. 把 dump 出来的 database.sql 下载回去 .. 用 emEditor或者editplus等支持保存文件时可选择文件存储格式的编辑器把 database.sql 打开,

它可以正常识别 utf8 的文字 ..用字符串替换的功能,把 “latin1” 都替换成 “utf8” ,之后直接另存新档 .. 这时把文件类型设定储存成 UTF-8。

c. 再把 database-utf8.sql 上传到 server .. 这时我们用 vi 开启它 .. 就可以看见是正常的中文字 .. 这就表示档案没问题啰。

d. 把档案汇入数据库

mysql database < database-utf8.sql -u xxx -p --default-character-set=utf8

注意你的database名称,如果你想把数据导入到另外一个数据库中时,因为你想保留原来的数据库中的数据。那你应该先自己建立一个空的数据库。这条命令并不能在数据库不存在的情况下建立数据库。

如果数据量不是很大 … 那么很快就可以完成这个步骤 .. 这时候若没有错误讯息出现 .. 那么恭喜你 ..

你已经完成了数据库转换的工作了。如果有错误讯息出现 .. 主要有两个情形 ..

1. 文件文件内的中文字,用 vi 看是乱码 ..文件档的格式不是 utf-8。

2. 汇入的时候漏掉指定采用 utf8 的数据编码汇入。

以上的作业是在 数据库系统都是处于 latin1 的环境底下,也就是没有在 my.cnf 指定 default-character-set=utf8。