apache-hive / 3.1.1 / reference / RCFileCat.html

RCFileCat

$ HIVE_HOME/bin/hive --rcfilecat 是一个 shellUtil,可用于从RC files打印数据或元数据。

Data

打印出存储在 RCFile 中的行,用制表符分隔列,用换行符分隔行。

Usage:

hive --rcfilecat [--start=start_offset] [--length=len] [--verbose] fileName

--start=start_offset           Start offset to begin reading in the file
--length=len                   Length of data to read from the file
--verbose                      Prints periodic stats about the data read,
                               how many records, how many bytes, scan rate

Metadata

0.11.0 的新功能

Usage:

hive --rcfilecat [--column-sizes | --column-sizes-pretty] fileName

设置了--column-sizes 选项,而不是打印 RC 文件中的数据,而是打印 3 列的行。
\ <uncompressed size><compressed size>
列的大小是整个文件中从 RC 文件头获取的列的合计大小。

通过--column-sizes-pretty 选项设置,可以打印与--column-sizes 选项相同的数据,但是格式更人性化。