9.5. 二进制字符串函数和运算符

本节介绍了用于检查和处理bytea类型的值的函数和运算符。

SQL 定义了一些使用关键字而不是逗号分隔参数的字符串函数。详细信息在Table 9.11中。 PostgreSQL 还提供了使用常规函数调用语法的这些函数的版本(请参见Table 9.12)。

Note

此页面上显示的示例结果假定服务器参数bytea_output设置为escape(传统 PostgreSQL 格式)。

表 9.11. SQL 二进制字符串函数和运算符

FunctionReturn TypeDescriptionExampleResult
string || stringbytea字符串串联'\\Post'::bytea || '\047gres\000'::bytea\\Post'gres\000
octet_length(string)int二进制字符串中的字节数octet_length('jo\000se'::bytea)5
overlay(string placing string from int [for int])byteaReplace substringoverlay('Th\000omas'::bytea placing '\002\003'::bytea from 2 for 3)T\\002\\003mas
position(substring in string)int指定子字符串的位置position('\000om'::bytea in 'Th\000omas'::bytea)3
substring(string [from int] [for int])byteaExtract substringsubstring('Th\000omas'::bytea from 2 for 3)h\000o
trim([both] bytes from string)bytea从* string 的开头和结尾删除最长只包含 bytes *中出现的字节的字符串trim('\000\001'::bytea from '\000Tom\001'::bytea)Tom

附加的二进制字符串操作函数可用,并在Table 9.12中列出。其中一些用于内部以实现Table 9.11中列出的 SQL 标准字符串函数。

表 9.12. 其他二进制字符串函数

FunctionReturn TypeDescriptionExampleResult
btrim(string bytea, bytes bytea)bytea从* string 的开头和结尾删除最长只包含 bytes *中出现的字节的字符串btrim('\000trim\001'::bytea, '\000\001'::bytea)trim
decode(string text, format text)bytea从* string *中的文本表示解码二进制数据。 * format *的选项与encode中的选项相同。decode('123\000456', 'escape')123\000456
encode(data bytea, format text)text将二进制数据编码为文本表示形式。支持的格式为:base64hexescapeescape将零字节和高位设置字节转换为八进制序列(\ * nnn *),并将反斜杠加倍。encode('123\000456'::bytea, 'escape')123\000456
get_bit(string, offset)int从字符串中提取位get_bit('Th\000omas'::bytea, 45)1
get_byte(string, offset)int从字符串中提取字节get_byte('Th\000omas'::bytea, 4)109
length(string)int二进制字符串 的长度length('jo\000se'::bytea)5
md5(string)text计算* string *的 MD5 哈希值,以十六进制返回结果md5('Th\000omas'::bytea)8ab2d3c9689aaf18b4958c334c82d8b1
set_bit(string, offset, newvalue)bytea设置字符串位set_bit('Th\000omas'::bytea, 45, 0)Th\000omAs
set_byte(string, offset, newvalue)bytea在字符串中设置字节set_byte('Th\000omas'::bytea, 4, 64)Th\000o@as
sha224(bytea)byteaSHA-224 hashsha224('abc')\x23097d223405d8228642a477bda255b32aadbce4bda0b3f7e36c9da7
sha256(bytea)byteaSHA-256 hashsha256('abc')\xba7816bf8f01cfea414140de5dae2223b00361a396177a9cb410ff61f20015ad
sha384(bytea)byteaSHA-384 hashsha384('abc')\xcb00753f45a35e8bb5a03d699ac65007272c32ab0eded1631a8b605a43ff5bed8086072ba1e7cc2358baeca134c825a7
sha512(bytea)byteaSHA-512 hashsha512('abc')\xddaf35a193617abacc417349ae20413112e6fa4e89a97ea20a9eeee64b55d39a2192992a274fc1a836ba3c23a3feebbd454d4423643ce80e2a9ac94fa54ca49f

get_byteset_byte将二进制字符串的第一个字节编号为字节 0.get_bitset_bit在每个字节中从右数位;例如,位 0 是第一个字节的最低有效位,而位 15 是第二个字节的最高有效位。

请注意,由于历史原因,函数md5返回类型为text的十六进制编码值,而 SHA-2 函数返回的类型为bytea。使用函数encodedecode在两者之间进行转换,例如encode(sha256('abc'), 'hex')以获得十六进制编码的文本表示形式。

另请参见Section 9.20中的聚合函数string_aggSection 35.4中的大对象函数。