9.5. 二进制字符串函数和运算符
本节介绍了用于检查和处理bytea
类型的值的函数和运算符。
SQL 定义了一些使用关键字而不是逗号分隔参数的字符串函数。详细信息在Table 9.11中。 PostgreSQL 还提供了使用常规函数调用语法的这些函数的版本(请参见Table 9.12)。
表 9.11. SQL 二进制字符串函数和运算符
Function |
Return Type |
Description |
Example |
Result |
string || string |
bytea |
字符串串联 |
'\\Post'::bytea || '\047gres\000'::bytea |
\\Post'gres\000 |
octet_length(string) |
int |
二进制字符串中的字节数 |
octet_length('jo\000se'::bytea) |
5 |
overlay(string placing string from int [for int]) |
bytea |
Replace substring |
overlay('Th\000omas'::bytea placing '\002\003'::bytea from 2 for 3) |
T\\002\\003mas |
position(substring in string) |
int |
指定子字符串的位置 |
position('\000om'::bytea in 'Th\000omas'::bytea) |
3 |
substring(string [from int] [for int]) |
bytea |
Extract substring |
substring('Th\000omas'::bytea from 2 for 3) |
h\000o |
trim([both] bytes from string) |
bytea |
从* string 的开头和结尾删除最长只包含 bytes *中出现的字节的字符串 |
trim('\000\001'::bytea from '\000Tom\001'::bytea) |
Tom |
附加的二进制字符串操作函数可用,并在Table 9.12中列出。其中一些用于内部以实现Table 9.11中列出的 SQL 标准字符串函数。
表 9.12. 其他二进制字符串函数
Function |
Return Type |
Description |
Example |
Result |
btrim(string bytea, bytes bytea) |
bytea |
从* string 的开头和结尾删除最长只包含 bytes *中出现的字节的字符串 |
btrim('\000trim\001'::bytea, '\000\001'::bytea) |
trim |
decode(string text, format text) |
bytea |
从* string *中的文本表示解码二进制数据。 * format *的选项与encode 中的选项相同。 |
decode('123\000456', 'escape') |
123\000456 |
encode(data bytea, format text) |
text |
将二进制数据编码为文本表示形式。支持的格式为:base64 ,hex ,escape 。 escape 将零字节和高位设置字节转换为八进制序列(\ * nnn *),并将反斜杠加倍。 |
encode('123\000456'::bytea, 'escape') |
123\000456 |
get_bit(string, offset) |
int |
从字符串中提取位 |
get_bit('Th\000omas'::bytea, 45) |
1 |
get_byte(string, offset) |
int |
从字符串中提取字节 |
get_byte('Th\000omas'::bytea, 4) |
109 |
length(string) |
int |
二进制字符串 的长度 |
length('jo\000se'::bytea) |
5 |
md5(string) |
text |
计算* string *的 MD5 哈希值,以十六进制返回结果 |
md5('Th\000omas'::bytea) |
8ab2d3c9689aaf18b4958c334c82d8b1 |
set_bit(string, offset, newvalue) |
bytea |
设置字符串位 |
set_bit('Th\000omas'::bytea, 45, 0) |
Th\000omAs |
set_byte(string, offset, newvalue) |
bytea |
在字符串中设置字节 |
set_byte('Th\000omas'::bytea, 4, 64) |
Th\000o@as |
sha224(bytea) |
bytea |
SHA-224 hash |
sha224('abc') |
\x23097d223405d8228642a477bda255b32aadbce4bda0b3f7e36c9da7 |
sha256(bytea) |
bytea |
SHA-256 hash |
sha256('abc') |
\xba7816bf8f01cfea414140de5dae2223b00361a396177a9cb410ff61f20015ad |
sha384(bytea) |
bytea |
SHA-384 hash |
sha384('abc') |
\xcb00753f45a35e8bb5a03d699ac65007272c32ab0eded1631a8b605a43ff5bed8086072ba1e7cc2358baeca134c825a7 |
sha512(bytea) |
bytea |
SHA-512 hash |
sha512('abc') |
\xddaf35a193617abacc417349ae20413112e6fa4e89a97ea20a9eeee64b55d39a2192992a274fc1a836ba3c23a3feebbd454d4423643ce80e2a9ac94fa54ca49f |
get_byte
和set_byte
将二进制字符串的第一个字节编号为字节 0.get_bit
和set_bit
在每个字节中从右数位;例如,位 0 是第一个字节的最低有效位,而位 15 是第二个字节的最高有效位。
请注意,由于历史原因,函数md5
返回类型为text
的十六进制编码值,而 SHA-2 函数返回的类型为bytea
。使用函数encode
和decode
在两者之间进行转换,例如encode(sha256('abc'), 'hex')
以获得十六进制编码的文本表示形式。
另请参见Section 9.20中的聚合函数string_agg
和Section 35.4中的大对象函数。