On this page
Installing Hive
您可以通过下载并解压缩 tar 包来安装 Hive 的稳定版本,也可以下载源代码并使用 Maven(0.13 版和更高版本)或 Ant(0.12 版和更低版本)来构建 Hive。
配置单元安装具有以下要求:
Java 1.7(首选)。
注意: Hive 版本1.2以后需要 Java 1.7 或更高版本。 Hive 0.14 至 1.1 版可与 Java 1.6 一起使用,但更喜欢 1.7. 强烈建议用户开始使用 Java 1.8(请参阅HIVE-8607)。Hadoop 2.x(首选),1.x(Hive 2.0.0 及更高版本不支持)。
最高为 0.13 的 Hive 版本还支持 Hadoop 0.20.x,0.23.x。Hive 通常用于生产 Linux 和 Windows 环境。 Mac 是常用的开发环境。本文档中的说明适用于 Linux 和 Mac。在 Windows 上使用它需要略有不同的步骤。
从 Tarball 安装
首先从一个 Apache 下载镜像(请参阅Hive Releases)下载 Hive 的最新稳定版本。
接下来,您需要打开压缩包的包装。这将导致创建一个名为hive-x.y.z
(其中x.y.z
是发行版号)的子目录:
$ tar -xzvf hive-x.y.z.tar.gz
将环境变量HIVE_HOME
设置为指向安装目录:
$ cd hive-x.y.z
$ export HIVE_HOME={{pwd}}
最后,将$HIVE_HOME/bin
添加到您的PATH
:
$ export PATH=$HIVE_HOME/bin:$PATH
从源代码安装(Hive 1.2.0 和更高版本)
Version information
要使用Apache Maven构建 Hive 1.2.0 和更高版本,请参阅入门:从源代码构建 Hive。您将需要 Java 1.7 或更高版本。
从源代码安装(Hive 0.13.0 及更高版本)
Version information
要使用Apache Maven构建 Hive 0.13.0 和更高版本,请参见入门:从源代码构建 Hive。
从源代码安装(Hive 0.12.0 及更低版本)
Version information
本节介绍了使用Apache Ant来构建 Hive 的 Hive 0.12.0 和更早版本的安装。
安装 Hive 很简单,只需要在计算机上安装 Java 1.6 和 Ant(对于 Hive 0.12 和更早版本)。
Hive 可通过 SVN http://svn.apache.org/repos/asf/hive/branches获得。您可以通过运行以下命令来下载它。
$ svn co http://svn.apache.org/repos/asf/hive/branches/branch-#.# hive
其中#.#
是 Hive 版本号。对于版本 0.8.1,请使用“ branch-0.8-r2
”。
要构建 Hive,请在基本目录上执行以下命令:
$ ant package
它将使用以下内容创建子目录 build/dist:
README.txt:自述文件。
bin /:包含所有 shell 脚本的目录
lib /:包含所有必需的 jar 文件的目录
conf /:包含配置文件的目录
examples /:包含示例 Importing 和查询文件的目录
子目录 build/dist 应该包含运行 Hive 所需的所有文件。您可以从那里运行它,也可以将它复制到其他位置。
为了运行 Hive,您必须在路径中包含 Hadoop 或使用 Hadoop 安装目录定义环境变量 HADOOP_HOME。
此外,我们强烈建议用户创建 HDFS 目录/ tmp 和/ user/hive/warehouse(也称为 hive.metastore.warehouse.dir),并在 Hive 中创建表之前将其设置为 chmod g w。
Next Steps
您可以在安装 Hive 后立即开始使用它,尽管您可能需要先对其进行配置。
Hive CLI 和 Beeline CLI
要使用 Hive 命令行界面(CLI),请转到 Hive 主目录并执行以下命令:
$ bin/hive
Hive 主目录是包含 Hive 0.12 及更早版本的 build/dist 的目录;对于 Hive 0.13 和更高版本,它是包装/ target/apache-hive- *<release_string> * -bin/apache-hive- *<release_string> * -bin /。
HiveServer2(在 Hive 0.11 中引入)具有一个称为 Beeline 的新 CLI(请参见直线–新命令行 Shell)。要使用 Beeline,请在 Hive 主目录中执行以下命令:
$ bin/beeline
Hive Metastore
元数据存储在嵌入式 Derby 数据库中,该磁盘的磁盘存储位置由名为 javax.jdo.option.ConnectionURL 的 Hive 配置变量确定。默认情况下,此位置是./metastore_db(请参阅 conf/hive-default.xml)。
在嵌入式模式下使用 Derby 一次最多允许一个用户。要将 Derby 配置为以服务器模式运行,请参阅Hive 在服务器模式下使用 Derby。
要为 Hive Metastore 配置 Derby 以外的数据库,请参阅Hive MetastoreManagement。
下一步: Configuring Hive。
HCatalog 和 WebHCat
HCatalog
Version
从 Hive 版本 0.11.0 开始,HCatalog 随 Hive 一起安装。
如果从二进制 zipfile 中安装 Hive,则hcatalog/bin
目录中提供hcat
命令。但是,除“ hcat -g
”和“ hcat -p
”以外,大多数hcat
命令可以作为hive
命令发布。请注意,hcat
命令使用-p
标志来获得权限,但是hive
使用它来指定端口号。 HCatalog CLI 的文档为here,而 Hive CLI 的文档为here。
HCatalog 安装记录为here。
WebHCat (Templeton)
Version
从 Hive 版本 0.11.0 开始,WebHCat 随 Hive 一起安装。
如果从二进制压缩包安装 Hive,则 WebHCat 服务器命令webhcat_server.sh
位于hcatalog/sbin
目录中。
WebHCat 安装记录为here。