22.2.4.1 线性哈希分区
MySQL 还支持线性散列,这与常规散列的不同之处在于,线性散列使用线性二乘幂算法,而常规散列则使用散列函数值的模数。
从语法上讲,线性散列分区和常规散列之间的唯一区别是在PARTITION BY
子句中添加了LINEAR
关键字,如下所示:
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 4;
给定一个 table 达式* expr
,使用线性哈希处理时存储记录的分区是 num
分区中的分区号 N
,其中 N
*根据以下算法得出:
- 找到大于*
num
的下一个 2 的幂。我们称这个值为V
*;可以计算为:
V = POWER(2, CEILING(LOG(2, num)))
(假设* num
为 13.则LOG(2,13)为 3.7004397181411. CEILING(3.7004397181411)为 4, V
* = POWER(2,4)为 16.)
-
设置*
N
* = *F
(column_list
)&(V
*-1)。 -
而*
N
*> = *num
*: -
设置*
V
* = *V
*/2 -
设置*
N
* = *N
&(V
*-1)
假设使用以下语句创建使用线性哈希分区并具有 6 个分区的 tablet1
:
CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE)
PARTITION BY LINEAR HASH( YEAR(col3) )
PARTITIONS 6;
现在,假设您要向t1
插入两个记录,这些记录的col3
列值为'2003-04-14'
和'1998-10-19'
。其中第一个的分区号确定如下:
V = POWER(2, CEILING( LOG(2,6) )) = 8
N = YEAR('2003-04-14') & (8 - 1)
= 2003 & 7
= 3
(3 >= 6 is FALSE: record stored in partition #3)
计算第二条记录所在的分区号,如下所示:
V = 8
N = YEAR('1998-10-19') & (8 - 1)
= 1998 & 7
= 6
(6 >= 6 is TRUE: additional step required)
N = 6 & ((8 / 2) - 1)
= 6 & 3
= 2
(2 >= 6 is FALSE: record stored in partition #2)
通过线性哈希进行分区的优势在于,分区的添加,删除,合并和拆分变得更快,这在处理包含大量数据(兆兆字节)的 table 时可能是有益的。缺点是,与使用常规哈希分区获得的分布相比,数据不太可能在分区之间均匀分布。