Pplware

Apache HBase – Base de dados NoSQL do ecossistema Hadoop

O Apache HBase é um datastore de Big Data altamente escalável e distribuído no ecossistema do Apache Hadoop. Esta plataforma open source, desenvolvida em Java, foi criada para dar acesso aleatório e em tempo real a tabelas com milhares de dados.

Vamos conhecer melhor esta plataforma que pode ser usada nos mais diversos cenários.


O HBase é uma base de dados não-relacional (NoSQL) que é executado em cima do Hadoop Distributed File System (HDFS). O Apache HBase fornece acesso aleatório e em tempo real aos dados do Hadoop. Este projeto foi criado para armazenar tabelas muito grandes, tornando-se uma ótima opção para armazenar dados multi-estruturados ou esparsos.

HBase – Região

A unidade mais simples e fundamental da escalabilidade horizontal no HBase é a Região, isto é, um conjunto contíguo e ordenado de linhas que são armazenadas. A arquitetura do HBase possui um único nó mestre (Master) e vários escravos (Slaves), ou seja, RegionServers.

Cada RegionServer serve um conjunto de regiões mas uma região pode ser atendida somente por um único RegionServer. Sempre que um cliente envia uma solicitação, o Master recebe-a e encaminha-a para o Region-Server correspondente.

Modelo de Dados

O modelo de dados do HBase armazena dados semiestruturados com diferentes tipos de dados. O modelo de dados do HBase consiste em vários componentes lógicos – chave de linha, família de colunas, nome da tabela, registo de data e hora, etc.

Componentes da Arquitetura (Daemons)

HMaster – O Hmaster atribui regiões aos RegionServers com a ajuda do ZooKeeper para distribuir os pedidos de forma equilibrada, deslocando as regiões para RegionServers menos ocupados.

Este componente é responsável por alterações do esquema e outras operações de metadados, como criação de tabelas e famílias de colunas.

HRegionServer – O HRegionServer, é executado em todos os nós DataNode no cluster do hadoop. Esses são os nós de trabalho que manipulam solicitações de leitura, gravação, atualização e exclusão.

Zookeeper (HQuorumPeer) – O HBase usa o ZooKeeper como um serviço de coordenação distribuída. Alguns serviços fornecidos são:

Modos de funcionamento

STAND-ALONE MODE

PSEUDO-DISTRIBUTED MODE

FULLY-DISTRIBUTED MODE

Este foi um artigo de apresentação do Apache HBase. Num próximo artigo iremos ensinar a configurar e mostraremos alguns exemplos de utilização. Estejam atentos! Alguma dúvida ou questão deixem nos comentário.

Exit mobile version