很久没有倒腾过mysql的字符集了,都疏忽了,以致于为LP安装Dreamhost上主机的时候,居然没有修改mysql数据库的字符集。也是由于mysql这东西,即使字符集设置错了,也是吃啥吐啥,拿错误的字符集就往数据库里存,所以外面根本看不出来。今天给LP写了个自动备份脚本,才发现导出的sql中全是乱码,岂能容忍?遂解决之~
首先还是放松了警惕,走了个弯路,我习惯使用的dump脚本是:
mysqldump --add-drop-table --default-character-set=utf8 -h mysql.mydomain.com --user=fwolf --password=mypasswd --extended-insert=false fwolf_db > mydomain.com_db.sql
可是dump出来的sql一看中文全是乱码,于是去掉--default-character-set=utf8
再dump,数据依旧,一时没想过来,用iconv把dump出来的sql左转换右转换怎么也是不对,后来才想明白,DH上mysql字符集的默认设置是这样的:
mysql> show variables where variable_name like 'char%';
+--------------------------+--------------------------------------------+
| Variable_name | Value |
+--------------------------+--------------------------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /data/mysql/ovadilla/share/mysql/charsets/ |
+--------------------------+--------------------------------------------+
8 rows in set (0.00 sec)
数据库服务器字符集是latin1,也就是mysql默认的latin1_swedish_ci,而系统的默认字符集则是utf8,所以不带--default-character-set=utf8
参数dump的数据的时候,其实和带上这个参数是一样的!想通这个问题,又知道了mysql吃啥吐啥的特性之后,解决方法就简单了,记住如果WordPress和mysql都是默认设置的情况下,如果你能夠正常浏览中文,则说明配置就是错误的,因为WordPress默认也不是utf8字符集的。
首先,按latin1字符集导出sql:
mysqldump --add-drop-table --default-character-set=latin1 -h mysql.mydomain.com --user=fwolf --password=mypasswd --extended-insert=false fwolf_db > mydomain.com_db.sql
这样导出的sql中的中文应该都是正确的了,现在修改导出的sql文件,把其中的latin1全部替换为utf8,然后再重新导入数据库,导入的时候强制指定字符集为utf8:
mysql --default-character-set=utf8 fwolf_db -h mysql.mydomain.com -u fwolf -pmypasswd < mydomain.com_db.sql
这样,如果直接用mysql查询数据的话,如果不使用set names 'utf8'
,中文应该是乱码的,而如果你的数据库字符集仍然是默认的latin1的话,会是相反的情况:不使用set names 'utf8'
,中文正常,使用之后反而乱码。确认数据库字符集调整正确之后,再来搞定WordPress,这个就简单多了,编辑文件WP/wp-includes/wp-db.php
,大概66行,在$this->select($dbname);
前面,加上:
$this->query('set names utf8');
这样就全部搞定了,数据库和Wordpress的字符集全部调整为万国码utf8。
参考:
- [搬往 dreamhost 中文变乱码](http://joyus.org/blog/2006/07/move-to-dreamhost.html)
- [PHP 存取 MySQL 乱码问题](http://9458398.cn/tag/%E4%B9%B1%E7%A0%81+sql/)
- [MySQL 的数据库转换问题](https://dream4ever.org/archive/t-149238.html)
- [MySQL 內 latin1 編碼儲存的 utf8 編碼資料轉 utf8 編碼儲存](http://phpbb-tw.net/phpbb/viewtopic.php?t=47299)
PS1: DH主机ssh、svn、cron、php-cli、fsocketopen什么的全部支持,太爽了,怪不得那么多人喜爱,就是ssh的速度慢了些。
PS2: 一个和mysql吃啥吐啥有关的笑话,不太雅:你来到医院,向医生说:我近来很不正常,吃什么拉什么,吃黄豆拉黄豆,吃西瓜拉西瓜,你问医生怎样才能恢复正常,医生沉默了一阵说:你吃屎吧!
Update @ 2007-07-20
mt主机上的mysql是4.1版本,查服务器配置变量的sql好像略微有些不同,不用where了:
show variables like 'char%';
4 thoughts on “把DH主机上的mysql字符集倒腾为utf8”