Como instalar o Apache Hive com Hadoop no CentOS, Ubuntu e Linuxmint

Como instalar o Apache Hive com Hadoop no CentOS, Ubuntu e Linuxmint

O que é Apache Hive ? O software Apache Hive Data Warehouse facilita a consulta e o gerenciamento de grandes conjuntos de dados que residem em armazenamento distribuído. O Hive fornece um mecanismo para a estrutura do projeto para esses dados e consultar os dados usando uma linguagem do tipo SQL chamada HiveQL. Leia mais no site oficial

Este guia de instruções ajudará você a instalar o Apache Hive no CentOS/RHEL com o Hadoop com etapas fáceis.

Etapa 1: Instale Java e Hadoop

Apache Hive exigiu Java 6 ou versão posterior. Também precisamos instalar o Hadoop antes de instalar o Apache Hive em nosso sistema. Use os links abaixo para instalá -los

Etapas para instalar Java no CentOS e Rhel 7/6/5
Etapas para instalar o Hadoop no Linux

Etapa 2: Baixe o Arquivo de Hive

Depois de configurar o Hadoop com sucesso em seu sistema Linux. Vamos iniciar a configuração da colméia. Primeiro baixe o código fonte mais recente do Hive e o Extract Archive usando os seguintes comandos.

# cd/home/hadoop # wget http: // arquivamento.apache.org/dist/hive/hive-0.12.0/Hive-0.12.0-BIN.alcatrão.gz # tar xzf hive-0.12.0-BIN.alcatrão.gz # mv hive-0.12.0 -BIN HIVE # CHOWN -R HADOOP 

Etapa 3: Variáveis ​​de ambiente de configuração

Após extrair arquivo de arquivo de colméias, mude para o usuário do Hadoop e configure as seguintes variáveis ​​de ambiente.

# su - hadoop $ export hadoop_home =/home/hadoop/hadoop $ export hadoop_prefix =/home/hadoop/hadoop $ export hive_home =/home/hadoop/hive $ exportar caminho = $ hive_home/bin: $ caminho 

Etapa 4: Inicie a Hive

Antes de correr Hive, precisamos criar /tmp e /Usuário/Hive/Warehouse e defina -os chmod g+w em hdfs antes de criar uma tabela em hive. Use os seguintes comandos.

$ CD/HOME/HADOOP/Hive $ $ HADOOP_HOME/BIN/HADOOP FS -MKDIR/TMP $ $ HADOOP_HOME/BIN/HADOOP FS -MKDIR/User/Hive/Warehouse $ $ HADOOP_HOME/BIN/HADOOP FS -CHMOD G+W/W/ tmp $ $ hadoop_home/bin/hadoop fs -chmod g+w/usuário/hive/warehouse 

Vamos começar a usar o Hive usando o seguinte comando.

$ bin/hive logging inicializado usando a configuração em jar: arquivo:/home/hadoop/hive/lib/hive-common-0.12.0.jarra!/hive-log4j.Propriedades Hive> 

Etapa 5: Crie tabela de demonstração e teste

Nesta fase, você instalou com sucesso Hive. Vamos criar uma tabela de amostra usando o seguinte comando

Hive> Criar tabela Demo1 (id int, string de nome); Ok, tempo necessário: 6.565 segundos 

Mostre as tabelas criadas com o comando abaixo.

Hive> Mostrar mesas; Ok Demo1 Time Taken: 0.231 segundos, buscados: 1 linha (s) 

Solte a tabela usando o comando abaixo.

Hive> Drop Table Demo1; Ok, tempo necessário: 2.393 segundos 

Leia mais sobre as operações SQL no Hive no Apache Hive Official Site.