10.10.2 西欧字符集

西欧字符集涵盖了大多数西欧语言,例如法语,西班牙语,加泰罗尼亚语,巴斯克语,葡萄牙语,意大利语,阿尔巴尼亚语,荷兰语,德语,丹麦语,瑞典语,挪威语,芬兰语,法罗语,冰岛语,爱尔兰语,苏格兰语和英语。

  • ascii(美国 ASCII)排序规则:

  • ascii_bin

    • ascii_general_ci(默认)
  • cp850(DOS 西欧)排序规则:

  • cp850_bin

    • cp850_general_ci(默认)
  • dec8(DEC 西欧)排序规则:

  • dec8_bin

    • dec8_swedish_ci(默认)
  • hp8(HP 西欧)归类:

  • hp8_bin

    • hp8_english_ci(默认)
  • latin1(cp1252 西欧)排序规则:

  • latin1_bin

    • latin1_danish_ci

    • latin1_general_ci

    • latin1_general_cs

    • latin1_german1_ci

    • latin1_german2_ci

    • latin1_spanish_ci

    • latin1_swedish_ci(默认)

latin1是默认字符集。 MySQL 的latin1与 Windows 的cp1252字符集相同。这意味着它与官方ISO 8859-1或 IANA(互联网编号分配机构)latin1相同,只是 IANA latin10x800x9f之间的代码点视为“未定义”,而cp1252(因此是 MySQL 的latin1)为这些位置分配了字符。例如,0x80是欧元符号。对于cp1252中的“未定义”条目,MySQL 将0x81转换为 Unicode 0x00810x8d转换为0x008d0x8f转换为0x008f0x90转换为0x0090以及0x9d转换为0x009d

latin1_swedish_ci归类是大多数 MySQLClient 可能使用的默认值。尽管经常说它是基于瑞典/芬兰归类规则,但是有瑞典人和芬兰人不同意这一说法。

latin1_german1_cilatin1_german2_ci归类基于 DIN-1 和 DIN-2 标准,其中 DIN 代 table* Deutsches InstitutfürNormung *(相当于 ANSI 的德语)。 DIN-1 被称为“字典整理”,而 DIN-2 被称为“电话簿整理”。有关此比较或搜索时的效果的示例,请参见第 10.8.6 节“排序规则效果的示例”

  • latin1_german1_ci(词典)规则:
Ä = A
Ö = O
Ü = U
ß = s
  • latin1_german2_ci(电话簿)规则:
Ä = AE
Ö = OE
Ü = UE
ß = ss

latin1_spanish_ci归类中,ñ(n-tilde)是no之间的单独字母。

  • macroman(Mac 西欧)归类:

  • macroman_bin

    • macroman_general_ci(默认)
  • swe7(7 位瑞典语)排序规则:

  • swe7_bin

    • swe7_swedish_ci(默认)