10.10.2 西欧字符集
西欧字符集涵盖了大多数西欧语言,例如法语,西班牙语,加泰罗尼亚语,巴斯克语,葡萄牙语,意大利语,阿尔巴尼亚语,荷兰语,德语,丹麦语,瑞典语,挪威语,芬兰语,法罗语,冰岛语,爱尔兰语,苏格兰语和英语。
-
ascii
(美国 ASCII)排序规则: -
ascii_bin
ascii_general_ci
(默认)
-
cp850
(DOS 西欧)排序规则: -
cp850_bin
cp850_general_ci
(默认)
-
dec8
(DEC 西欧)排序规则: -
dec8_bin
dec8_swedish_ci
(默认)
-
hp8
(HP 西欧)归类: -
hp8_bin
hp8_english_ci
(默认)
-
latin1
(cp1252 西欧)排序规则: -
latin1_bin
-
latin1_danish_ci
-
latin1_general_ci
-
latin1_general_cs
-
latin1_german1_ci
-
latin1_german2_ci
-
latin1_spanish_ci
-
latin1_swedish_ci
(默认)
-
latin1
是默认字符集。 MySQL 的latin1
与 Windows 的cp1252
字符集相同。这意味着它与官方ISO 8859-1
或 IANA(互联网编号分配机构)latin1
相同,只是 IANA latin1
将0x80
和0x9f
之间的代码点视为“未定义”,而cp1252
(因此是 MySQL 的latin1
)为这些位置分配了字符。例如,0x80
是欧元符号。对于cp1252
中的“未定义”条目,MySQL 将0x81
转换为 Unicode 0x0081
,0x8d
转换为0x008d
,0x8f
转换为0x008f
,0x90
转换为0x0090
以及0x9d
转换为0x009d
。
latin1_swedish_ci
归类是大多数 MySQLClient 可能使用的默认值。尽管经常说它是基于瑞典/芬兰归类规则,但是有瑞典人和芬兰人不同意这一说法。
latin1_german1_ci
和latin1_german2_ci
归类基于 DIN-1 和 DIN-2 标准,其中 DIN 代 table* Deutsches InstitutfürNormung *(相当于 ANSI 的德语)。 DIN-1 被称为“字典整理”,而 DIN-2 被称为“电话簿整理”。有关此比较或搜索时的效果的示例,请参见第 10.8.6 节“排序规则效果的示例”。
latin1_german1_ci
(词典)规则:
Ä = A
Ö = O
Ü = U
ß = s
latin1_german2_ci
(电话簿)规则:
Ä = AE
Ö = OE
Ü = UE
ß = ss
在latin1_spanish_ci
归类中,ñ
(n-tilde)是n
和o
之间的单独字母。
-
macroman
(Mac 西欧)归类: -
macroman_bin
macroman_general_ci
(默认)
-
swe7
(7 位瑞典语)排序规则: -
swe7_bin
swe7_swedish_ci
(默认)