本篇文章给人人带来的内容是关于Mysql中utf8_unicode_ci、utf8_general_ci有什么区别?有肯定的参考价值,有须要的朋侪可以参考一下,愿望对你有所协助。
Mysql中utf8_general_ci与utf8_unicode_ci有什么区别呢?在编程言语中,通经常运用unicode对中文字符做处置惩罚,防备涌现乱码,那末在MySQL里,为什么人人都运用utf8_general_ci而不是utf8_unicode_ci呢?
用了这么长时间,发明本身居然不知道utf_bin和utf_general_ci这两者到底有什么区别。。
ci是 case insensitive, 即 "大小写不敏感", a 和 A 会在字符推断中会被当作一样的;
bin 是二进制, a 和 A 会别区别对待.
比方你运转:
SELECT * FROM table WHERE txt = 'a'
那末在utf8_bin中你就找不到 txt = 'A' 的那一行, 而 utf8_general_ci 则可以.
utf8_general_ci 不辨别大小写,这个你在注册用户名和邮箱的时刻就要运用。
utf8_general_cs 辨别大小写,假如用户名和邮箱用这个 就会照成不良后果
utf8_bin:字符串每一个字符串用二进制数据编译存储。 辨别大小写,而且可以存二进制的内容
一、官方文档申明
下面摘录一下Mysql 5.1中文手册中关于utf8_unicode_ci与utf8_general_ci的申明:
当前,utf8_unicode_ci校正划定规矩仅部份支撑Unicode校正划定规矩算法。一些字符照样不能支撑。而且,不能完整支撑组合的暗号。这重要影响越南和俄罗斯的一些少数民族言语,如:Udmurt 、Tatar、Bashkir和Mari。
utf8_unicode_ci的最重要的特征是支撑扩大,即当把一个字母看做与别的字母组合相称时。比方,在德语和一些别的言语中‘ß'即是‘ss'。
utf8_general_ci是一个遗留的 校正划定规矩,不支撑扩大。它仅可以在字符之间举行逐一比较。这意味着utf8_general_ci校正划定规矩举行的比较速率很快,然则与运用utf8_unicode_ci的 校正划定规矩比拟,比较正确性较差)。
比方,运用utf8_general_ci和utf8_unicode_ci两种 校正划定规矩下面的比较相称:
Ä = A
Ö = O
Ü = U
两种校正划定规矩之间的区别是,关于utf8_general_ci下面的等式建立:
ß = s
然则,关于utf8_unicode_ci下面等式建立:
ß = ss
关于一种言语仅当运用utf8_unicode_ci排序做的不好时,才实行与细致言语相干的utf8字符集 校正划定规矩。比方,关于德语和法语,utf8_unicode_ci事情的很好,因而不再须要为这两种言语建立特别的utf8校正划定规矩。
utf8_general_ci也实用与德语和法语,除了‘ß'即是‘s',而不是‘ss'以外。假如你的运用可以接收这些,那末应当运用utf8_general_ci,由于它速率快。不然,运用utf8_unicode_ci,由于它比较正确。
假如你想运用gb2312编码,那末发起你运用latin1作为数据表的默许字符集,如许就可以直接用中文在命令行东西中插进去数据,而且可以直接显示出来.而不要运用gb2312或许gbk等字符集,假如忧郁查询排序等题目,可以运用binary属性束缚,比方:
create table my_table ( name varchar(20) binary not null default '')type=myisam default charset latin1;
二、简短总结
utf8_unicode_ci和utf8_general_ci对中、英文来讲没有本质的差异。
utf8_general_ci校正速率快,但正确度稍差。
utf8_unicode_ci正确度高,但校正速率稍慢。
假如你的运用有德语、法语或许俄语,请肯定运用utf8_unicode_ci。平常用utf8_general_ci就够了,到现在也没发明题目。。。
三、细致总结
1、关于一种言语仅当运用utf8_unicode_ci排序做的不好时,才实行与细致言语相干的utf8字符集校正划定规矩。比方,关于德语和法语,utf8_unicode_ci事情的很好,因而不再须要为这两种言语建立特别的utf8校正划定规矩。
2、utf8_general_ci也实用与德语和法语,除了‘?'即是‘s',而不是‘ss'以外。假如你的运用可以接收这些,那末应当运用 utf8_general_ci,由于它速率快。不然,运用utf8_unicode_ci,由于它比较正确。
用一句话概略上面这段话:utf8_unicode_ci比较正确,utf8_general_ci速率比较快。通常情况下 utf8_general_ci的正确性就够我们用的了,在我看过许多顺序源码后,发明它们大多数也用的是utf8_general_ci,所以新建数据 库时平常选用utf8_general_ci就可以了
四、如安在MySQL5.0中运用UTF8
在 my.cnf中增添以下参数
[mysqld] init_connect='SET NAMES utf8′ default-character-set=utf8 default-collation = utf8_general_ci
实行查询 mysql> show variables; 相干以下:
character_set_client | utf8 character_set_connection | utf8 character_set_database | utf8 character_set_results | utf8 character_set_server | utf8 character_set_system | utf8
collation_connection | utf8_general_ci collation_database | utf8_general_ci collation_server | utf8_general_ci
个人见解,关于数据库的运用,utf8 - general 已充足的正确,而且相较与 utf8 - unicode速率上有上风,固可宁神采用之
附1:旧数据升级方法
以本来的字符集为latin1为例,升级成为utf8的字符集。本来的表: old_table (default charset=latin1),新表:new_table(default charset=utf8)。
第一步:导出旧数据
mysqldump --default-character-set=latin1 -hlocalhost -uroot -B my_db --tables old_table > old.sql
第二步:转换编码(相似unix/linux环境下)
iconv -t utf-8 -f gb2312 -c old.sql > new.sql
或许可以去掉 -f 参数,让iconv自动推断本来的字符集
iconv -t utf-8 -c old.sql > new.sql
在这里,假定本来的数据默许是gb2312编码。
第三步:导入
修正old.sql,在插进去/更新语句最先之前,增添一条sql语句: "SET NAMES utf8;",保留。
mysql -hlocalhost -uroot my_db < new.sql
功德圆满!!
附2:支撑检察utf8字符集的MySQL客户端有
1.) MySQL-Front,听说这个项目已被MySQL AB迫令住手了,不知为什么,假如国内另有不少破解版可以下载(不代表我引荐运用破解版 :-P)。
2.) Navicat,另一款异常不错的MySQL客户端,汉化版刚出来,还约请我试用过,总的来讲照样不错的,不过也须要付费。
3.) PhpMyAdmin,开源的php项目,异常好。
4.) Linux下的终端东西(Linux terminal),把终端的字符集设置为utf8,连接到MySQL以后,实行 SET NAMES UTF8; 也能读写utf8数据了。
本篇文章到这里就已悉数完毕了,更多其他精彩内容可以关注ki4网的MySQL视频教程栏目!
以上就是Mysql中utf8_unicode_ci、utf8_general_ci有什么区别?的细致内容,更多请关注ki4网别的相干文章!