apache-hive / 3.1.1 / reference / AdminManual_Installation.html

Installing Hive

您可以通过下载并解压缩 tar 包来安装 Hive 的稳定版本,也可以下载源代码并使用 Maven(0.13 版和更高版本)或 Ant(0.12 版和更低版本)来构建 Hive。

配置单元安装具有以下要求:

  • Java 1.7(首选)。
    注意: Hive 版本1.2以后需要 Java 1.7 或更高版本。 Hive 0.14 至 1.1 版可与 Java 1.6 一起使用,但更喜欢 1.7. 强烈建议用户开始使用 Java 1.8(请参阅HIVE-8607)。

  • Hadoop 2.x(首选),1.x(Hive 2.0.0 及更高版本不支持)。
    最高为 0.13 的 Hive 版本还支持 Hadoop 0.20.x,0.23.x。

  • Hive 通常用于生产 Linux 和 Windows 环境。 Mac 是常用的开发环境。本文档中的说明适用于 Linux 和 Mac。在 Windows 上使用它需要略有不同的步骤。

从 Tarball 安装

首先从一个 Apache 下载镜像(请参阅Hive Releases)下载 Hive 的最新稳定版本。

接下来,您需要打开压缩包的包装。这将导致创建一个名为hive-x.y.z(其中x.y.z是发行版号)的子目录:

$ tar -xzvf hive-x.y.z.tar.gz

将环境变量HIVE_HOME设置为指向安装目录:

$ cd hive-x.y.z
  $ export HIVE_HOME={{pwd}}

最后,将$HIVE_HOME/bin添加到您的PATH

$ export PATH=$HIVE_HOME/bin:$PATH

从源代码安装(Hive 1.2.0 和更高版本)

Version information

要使用Apache Maven构建 Hive 1.2.0 和更高版本,请参阅入门:从源代码构建 Hive。您将需要 Java 1.7 或更高版本。

从源代码安装(Hive 0.13.0 及更高版本)

Version information

要使用Apache Maven构建 Hive 0.13.0 和更高版本,请参见入门:从源代码构建 Hive

从源代码安装(Hive 0.12.0 及更低版本)

Version information

本节介绍了使用Apache Ant来构建 Hive 的 Hive 0.12.0 和更早版本的安装。

安装 Hive 很简单,只需要在计算机上安装 Java 1.6 和 Ant(对于 Hive 0.12 和更早版本)。

Hive 可通过 SVN http://svn.apache.org/repos/asf/hive/branches获得。您可以通过运行以下命令来下载它。

$ svn co http://svn.apache.org/repos/asf/hive/branches/branch-#.# hive

其中#.#是 Hive 版本号。对于版本 0.8.1,请使用“ branch-0.8-r2”。

要构建 Hive,请在基本目录上执行以下命令:

$ ant package

它将使用以下内容创建子目录 build/dist:

  • README.txt:自述文件。

  • bin /:包含所有 shell 脚本的目录

  • lib /:包含所有必需的 jar 文件的目录

  • conf /:包含配置文件的目录

  • examples /:包含示例 Importing 和查询文件的目录

子目录 build/dist 应该包含运行 Hive 所需的所有文件。您可以从那里运行它,也可以将它复制到其他位置。

为了运行 Hive,您必须在路径中包含 Hadoop 或使用 Hadoop 安装目录定义环境变量 HADOOP_HOME。

此外,我们强烈建议用户创建 HDFS 目录/ tmp 和/ user/hive/warehouse(也称为 hive.metastore.warehouse.dir),并在 Hive 中创建表之前将其设置为 chmod g w。

Next Steps

您可以在安装 Hive 后立即开始使用它,尽管您可能需要先对其进行配置。

Hive CLI 和 Beeline CLI

要使用 Hive 命令行界面(CLI),请转到 Hive 主目录并执行以下命令:

$ bin/hive

Hive 主目录是包含 Hive 0.12 及更早版本的 build/dist 的目录;对于 Hive 0.13 和更高版本,它是包装/ target/apache-hive- *<release_string> * -bin/apache-hive- *<release_string> * -bin /。

HiveServer2(在 Hive 0.11 中引入)具有一个称为 Beeline 的新 CLI(请参见直线–新命令行 Shell)。要使用 Beeline,请在 Hive 主目录中执行以下命令:

$ bin/beeline

Hive Metastore

元数据存储在嵌入式 Derby 数据库中,该磁盘的磁盘存储位置由名为 javax.jdo.option.ConnectionURL 的 Hive 配置变量确定。默认情况下,此位置是./metastore_db(请参阅 conf/hive-default.xml)。

在嵌入式模式下使用 Derby 一次最多允许一个用户。要将 Derby 配置为以服务器模式运行,请参阅Hive 在服务器模式下使用 Derby

要为 Hive Metastore 配置 Derby 以外的数据库,请参阅Hive MetastoreManagement

下一步: Configuring Hive

HCatalog 和 WebHCat

HCatalog

Version

从 Hive 版本 0.11.0 开始,HCatalog 随 Hive 一起安装。

如果从二进制 zipfile 中安装 Hive,则hcatalog/bin目录中提供hcat命令。但是,除“ hcat -g”和“ hcat -p”以外,大多数hcat命令可以作为hive命令发布。请注意,hcat命令使用-p标志来获得权限,但是hive使用它来指定端口号。 HCatalog CLI 的文档为here,而 Hive CLI 的文档为here

HCatalog 安装记录为here

WebHCat (Templeton)

Version

从 Hive 版本 0.11.0 开始,WebHCat 随 Hive 一起安装。

如果从二进制压缩包安装 Hive,则 WebHCat 服务器命令webhcat_server.sh位于hcatalog/sbin目录中。

WebHCat 安装记录为here