10.14.4 将 UCA 归类添加到 Unicode 字符集

本节介绍如何通过在 MySQL Index.xml文件的<charset>字符集描述中写入<collation>元素来为 Unicode 字符集添加 UCA 归类。此处描述的过程不需要重新编译 MySQL。它使用语言环境数据标记语言(LDML)规范的子集,该规范可在http://www.unicode.org/reports/tr35/获得。使用此方法,您无需定义整个排序规则。而是从现有的“基本”排序规则开始,并根据新排序规则与基本排序规则的不同之处来描述新排序规则。下 table 列出了可以定义 UCA 归类的 Unicode 字符集的基本归类。无法为utf16le创建用户定义的 UCA 归类;没有utf16le_unicode_ci归类可以用作此类归类的基础。

table10.4 适用于用户定义的 UCA 归类的 MySQL 字符集

Character SetBase Collation
utf8utf8_unicode_ci
ucs2ucs2_unicode_ci
utf16utf16_unicode_ci
utf32utf32_unicode_ci

以下各节说明如何添加使用 LDML 语法定义的排序规则,并提供 MySQL 支持的 LDML 规则的摘要。