Mysql中utf8_unicode_ci、utf8_general_ci有什么区别？【MySQL教程】,Mysql,utf8_unicode_ci,utf8_general_ci

本篇文章给人人带来的内容是关于Mysql中utf8_unicode_ci、utf8_general_ci有什么区别？有肯定的参考价值，有须要的朋侪可以参考一下，愿望对你有所协助。

Mysql中utf8_general_ci与utf8_unicode_ci有什么区别呢？在编程言语中，通经常运用unicode对中文字符做处置惩罚，防备涌现乱码，那末在MySQL里，为什么人人都运用utf8_general_ci而不是utf8_unicode_ci呢？

用了这么长时间，发明本身居然不知道utf_bin和utf_general_ci这两者到底有什么区别。。
ci是 case insensitive, 即 "大小写不敏感", a 和 A 会在字符推断中会被当作一样的;
bin 是二进制, a 和 A 会别区别对待.
比方你运转:
SELECT * FROM table WHERE txt = 'a'
那末在utf8_bin中你就找不到 txt = 'A' 的那一行, 而 utf8_general_ci 则可以.
utf8_general_ci 不辨别大小写，这个你在注册用户名和邮箱的时刻就要运用。
utf8_general_cs 辨别大小写，假如用户名和邮箱用这个就会照成不良后果
utf8_bin:字符串每一个字符串用二进制数据编译存储。辨别大小写，而且可以存二进制的内容

一、官方文档申明
下面摘录一下Mysql 5.1中文手册中关于utf8_unicode_ci与utf8_general_ci的申明：

当前，utf8_unicode_ci校正划定规矩仅部份支撑Unicode校正划定规矩算法。一些字符照样不能支撑。而且，不能完整支撑组合的暗号。这重要影响越南和俄罗斯的一些少数民族言语，如：Udmurt 、Tatar、Bashkir和Mari。

utf8_unicode_ci的最重要的特征是支撑扩大，即当把一个字母看做与别的字母组合相称时。比方，在德语和一些别的言语中‘ß'即是‘ss'。

utf8_general_ci是一个遗留的校正划定规矩，不支撑扩大。它仅可以在字符之间举行逐一比较。这意味着utf8_general_ci校正划定规矩举行的比较速率很快，然则与运用utf8_unicode_ci的校正划定规矩比拟，比较正确性较差）。

比方，运用utf8_general_ci和utf8_unicode_ci两种校正划定规矩下面的比较相称：
Ä = A
Ö = O
Ü = U

两种校正划定规矩之间的区别是，关于utf8_general_ci下面的等式建立：
ß = s

然则，关于utf8_unicode_ci下面等式建立：
ß = ss

关于一种言语仅当运用utf8_unicode_ci排序做的不好时，才实行与细致言语相干的utf8字符集校正划定规矩。比方，关于德语和法语，utf8_unicode_ci事情的很好，因而不再须要为这两种言语建立特别的utf8校正划定规矩。

utf8_general_ci也实用与德语和法语，除了‘ß'即是‘s'，而不是‘ss'以外。假如你的运用可以接收这些，那末应当运用utf8_general_ci，由于它速率快。不然，运用utf8_unicode_ci，由于它比较正确。

假如你想运用gb2312编码,那末发起你运用latin1作为数据表的默许字符集,如许就可以直接用中文在命令行东西中插进去数据,而且可以直接显示出来.而不要运用gb2312或许gbk等字符集,假如忧郁查询排序等题目,可以运用binary属性束缚,比方:

create table my_table ( name varchar(20) binary not null default '')type=myisam default charset latin1;

二、简短总结
utf8_unicode_ci和utf8_general_ci对中、英文来讲没有本质的差异。
utf8_general_ci校正速率快，但正确度稍差。
utf8_unicode_ci正确度高，但校正速率稍慢。

假如你的运用有德语、法语或许俄语，请肯定运用utf8_unicode_ci。平常用utf8_general_ci就够了，到现在也没发明题目。。。

三、细致总结

1、关于一种言语仅当运用utf8_unicode_ci排序做的不好时，才实行与细致言语相干的utf8字符集校正划定规矩。比方，关于德语和法语，utf8_unicode_ci事情的很好，因而不再须要为这两种言语建立特别的utf8校正划定规矩。
2、utf8_general_ci也实用与德语和法语，除了‘?'即是‘s'，而不是‘ss'以外。假如你的运用可以接收这些，那末应当运用 utf8_general_ci，由于它速率快。不然，运用utf8_unicode_ci，由于它比较正确。

用一句话概略上面这段话：utf8_unicode_ci比较正确，utf8_general_ci速率比较快。通常情况下 utf8_general_ci的正确性就够我们用的了，在我看过许多顺序源码后，发明它们大多数也用的是utf8_general_ci，所以新建数据库时平常选用utf8_general_ci就可以了

四、如安在MySQL5.0中运用UTF8
在 my.cnf中增添以下参数

[mysqld]
init_connect='SET NAMES utf8′
default-character-set=utf8
default-collation = utf8_general_ci

实行查询 mysql> show variables; 相干以下:

character_set_client | utf8 
character_set_connection | utf8 
character_set_database | utf8 
character_set_results | utf8 
character_set_server | utf8 
character_set_system | utf8

collation_connection | utf8_general_ci 
collation_database | utf8_general_ci 
collation_server | utf8_general_ci

个人见解，关于数据库的运用，utf8 - general 已充足的正确，而且相较与 utf8 - unicode速率上有上风，固可宁神采用之

附1：旧数据升级方法

以本来的字符集为latin1为例，升级成为utf8的字符集。本来的表: old_table (default charset=latin1)，新表：new_table(default charset=utf8)。

第一步：导出旧数据

mysqldump --default-character-set=latin1 -hlocalhost -uroot -B my_db --tables old_table > old.sql

第二步：转换编码(相似unix/linux环境下)

iconv -t utf-8 -f gb2312 -c old.sql > new.sql

或许可以去掉 -f 参数，让iconv自动推断本来的字符集

iconv -t utf-8 -c old.sql > new.sql

在这里，假定本来的数据默许是gb2312编码。

第三步：导入

修正old.sql，在插进去/更新语句最先之前，增添一条sql语句： "SET NAMES utf8;"，保留。

mysql -hlocalhost -uroot my_db < new.sql

功德圆满！！

附2：支撑检察utf8字符集的MySQL客户端有
1.) MySQL-Front，听说这个项目已被MySQL AB迫令住手了，不知为什么，假如国内另有不少破解版可以下载（不代表我引荐运用破解版 :-P）。
2.) Navicat，另一款异常不错的MySQL客户端，汉化版刚出来，还约请我试用过，总的来讲照样不错的，不过也须要付费。
3.) PhpMyAdmin，开源的php项目，异常好。
4.) Linux下的终端东西（Linux terminal），把终端的字符集设置为utf8，连接到MySQL以后，实行 SET NAMES UTF8; 也能读写utf8数据了。

本篇文章到这里就已悉数完毕了，更多其他精彩内容可以关注ki4网的MySQL视频教程栏目！

以上就是Mysql中utf8_unicode_ci、utf8_general_ci有什么区别？的细致内容，更多请关注ki4网别的相干文章！