Como instalar o Apache Hive com Hadoop no CentOS, Ubuntu e Linuxmint
- 3921
- 1184
- Spencer Emard
O que é Apache Hive ? O software Apache Hive Data Warehouse facilita a consulta e o gerenciamento de grandes conjuntos de dados que residem em armazenamento distribuído. O Hive fornece um mecanismo para a estrutura do projeto para esses dados e consultar os dados usando uma linguagem do tipo SQL chamada HiveQL. Leia mais no site oficial
Este guia de instruções ajudará você a instalar o Apache Hive no CentOS/RHEL com o Hadoop com etapas fáceis.
Etapa 1: Instale Java e Hadoop
Apache Hive exigiu Java 6 ou versão posterior. Também precisamos instalar o Hadoop antes de instalar o Apache Hive em nosso sistema. Use os links abaixo para instalá -los
Etapas para instalar Java no CentOS e Rhel 7/6/5
Etapas para instalar o Hadoop no Linux
Etapa 2: Baixe o Arquivo de Hive
Depois de configurar o Hadoop com sucesso em seu sistema Linux. Vamos iniciar a configuração da colméia. Primeiro baixe o código fonte mais recente do Hive e o Extract Archive usando os seguintes comandos.
# cd/home/hadoop # wget http: // arquivamento.apache.org/dist/hive/hive-0.12.0/Hive-0.12.0-BIN.alcatrão.gz # tar xzf hive-0.12.0-BIN.alcatrão.gz # mv hive-0.12.0 -BIN HIVE # CHOWN -R HADOOP
Etapa 3: Variáveis de ambiente de configuração
Após extrair arquivo de arquivo de colméias, mude para o usuário do Hadoop e configure as seguintes variáveis de ambiente.
# su - hadoop $ export hadoop_home =/home/hadoop/hadoop $ export hadoop_prefix =/home/hadoop/hadoop $ export hive_home =/home/hadoop/hive $ exportar caminho = $ hive_home/bin: $ caminho
Etapa 4: Inicie a Hive
Antes de correr Hive, precisamos criar /tmp e /Usuário/Hive/Warehouse e defina -os chmod g+w em hdfs antes de criar uma tabela em hive. Use os seguintes comandos.
$ CD/HOME/HADOOP/Hive $ $ HADOOP_HOME/BIN/HADOOP FS -MKDIR/TMP $ $ HADOOP_HOME/BIN/HADOOP FS -MKDIR/User/Hive/Warehouse $ $ HADOOP_HOME/BIN/HADOOP FS -CHMOD G+W/W/ tmp $ $ hadoop_home/bin/hadoop fs -chmod g+w/usuário/hive/warehouse
Vamos começar a usar o Hive usando o seguinte comando.
$ bin/hive logging inicializado usando a configuração em jar: arquivo:/home/hadoop/hive/lib/hive-common-0.12.0.jarra!/hive-log4j.Propriedades Hive>
Etapa 5: Crie tabela de demonstração e teste
Nesta fase, você instalou com sucesso Hive. Vamos criar uma tabela de amostra usando o seguinte comando
Hive> Criar tabela Demo1 (id int, string de nome); Ok, tempo necessário: 6.565 segundos
Mostre as tabelas criadas com o comando abaixo.
Hive> Mostrar mesas; Ok Demo1 Time Taken: 0.231 segundos, buscados: 1 linha (s)
Solte a tabela usando o comando abaixo.
Hive> Drop Table Demo1; Ok, tempo necessário: 2.393 segundos
Leia mais sobre as operações SQL no Hive no Apache Hive Official Site.
- « Fedora 20 Lançado - O que há de novo no Fedora 20
- Instale Elgg (plataforma de redes sociais) no CentOS Rhel 6/5 »