Instalação do Spark e HBase em Cluster

Para instalar o Apache Spark e o Apache HBase em um cluster com um nó mestre e dois nós trabalhadores, siga os passos detalhados abaixo. Os nomes dos nós utilizados são master, worker1 e worker2.

1. Instalação do Scala (pré‑requisito para o Spark)

Crie o diretório de instalação e extraia o pacote:

mkdir -p /opt/scala
tar -xzf /opt/packages/scala-2.11.11.tgz -C /opt/scala/

Configure as variáveis de ambiente no arquivo /etc/profile:

export SCALA_HOME=/opt/scala/scala-2.11.11
export PATH=$SCALA_HOME/bin:$PATH

Atualize o ambeinte e verifique a instalação:

source /etc/profile
scala -version

Distribua a instalação para os nós trabalhadores:

scp -r /opt/scala root@worker1:/opt/
scp -r /opt/scala root@worker2:/opt/

2. Instalação do Spark

Crie o diretório e extraia o Spark:

mkdir -p /opt/spark
tar -xzf /opt/packages/spark-2.4.3-bin-hadoop2.7.tgz -C /opt/spark/

Adicione as variáveis do Spark ao /etc/profile:

export SPARK_HOME=/opt/spark/spark-2.4.3-bin-hadoop2.7
export PATH=$SPARK_HOME/bin:$PATH

Atualize o ambiente:

source /etc/profile

Configure o arquivo spark-env.sh:

cd $SPARK_HOME/conf
cp spark-env.sh.template spark-env.sh
vim spark-env.sh

Adicione as seguintes linhas:

export SPARK_MASTER_HOST=master
export SCALA_HOME=/opt/scala/scala-2.11.11
export SPARK_WORKER_MEMORY=8g
export JAVA_HOME=/usr/java/jdk1.8.0_221
export HADOOP_HOME=/opt/hadoop/hadoop-2.7.7
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

Defina os nós trabalhadores no arquivo workers:

cp workers.template workers
echo -e "worker1\nworker2" > workers

Copie a instalação do Spark para os trabalhadores:

scp -r /opt/spark root@worker1:/opt/
scp -r /opt/spark root@worker2:/opt/

Repita a configuração do spark-env.sh e do arquivo workers em cada nó trabalhador (lembre‑se de atualizar o ambiente).

Para iniciar o cluster Spark, execute no mestre:

$SPARK_HOME/sbin/start-all.sh

3. Instalação do HBase

Crie o diretório e extraia o HBase:

mkdir -p /opt/hbase
tar -xzf /opt/packages/hbase-1.2.4-bin.tar.gz -C /opt/hbase/

Entre no diretório de configuração e edite hbase-env.sh:

cd /opt/hbase/hbase-1.2.4/conf
vim hbase-env.sh

Adicinoe:

export HBASE_MANAGES_ZK=false
export JAVA_HOME=/usr/java/jdk1.8.0_171
export HBASE_CLASSPATH=/opt/hadoop/hadoop-2.7.3/etc/hadoop

Edite hbase-site.xml:

vim hbase-site.xml

Adicione as seguintes propriedades:

<property>
  <name>hbase.rootdir</name>
  <value>hdfs://master:9000/hbase</value>
</property>
<property>
  <name>hbase.cluster.distributed</name>
  <value>true</value>
</property>
<property>
  <name>hbase.master</name>
  <value>hdfs://master:6000</value>
</property>
<property>
  <name>hbase.zookeeper.quorum</name>
  <value>master,worker1,worker2</value>
</property>
<property>
  <name>hbase.zookeeper.property.dataDir</name>
  <value>/opt/zookeeper/zookeeper-3.4.14</value>
</property>

Configure os region servers no arquivo regionservers:

echo -e "worker1\nworker2" > regionservers

Copie os arquivos de configuração do Hadoop para o HBase:

cp /opt/hadoop/hadoop-2.7.7/etc/hadoop/hdfs-site.xml .
cp /opt/hadoop/hadoop-2.7.7/etc/hadoop/core-site.xml .

Distribua a instalação do HBase para os trabalhadores:

scp -r /opt/hbase root@worker1:/opt/
scp -r /opt/hbase root@worker2:/opt/

Repita a configuração do hbase-site.xml em cada nó (ajustando o caminho do ZooKeeper, se necessário).

Tags: spark hbase hadoop cluster Scala

Publicado em 7-4 20:00