Pplware

Sabe o que é uma DataWarehouse?

Por David Soares para o Pplware. Uma Data Warehouse é um sistema que visa responder às questões relativas à gestão de uma Base de Dados. Embora muito relacionadas as bases de dados com as data warehouses, têm um funcionamento diferente, pois enquanto numa base de dados são inseridos dados/registos, a Data Warehouse vai extrair esses dados, organizando-os, de modo a responder a questões previamente programadas. Os dados extraídos devem ser facilmente perceptíveis e credíveis, pois estes dados poderão ter influência na gestão de uma empresa.

A construção de uma Data Warehouse é constituída por 4 fases:

1) Identificar os processos de negócio/actividade;

2) Escolher a granularidade dos dados a registar.

3) Identificar dimensões;

4) Identificar os factos;

É muito importante para quem faz uma Data Warehouse saber quem vai usar este sistema e para que fins. Quando falamos do “quem vai usar este sistema”, não nos devemos referir apenas a um departamento organizacional de uma empresa, mas sim a toda a empresa, de modo a que os dados seleccionados não se venham a repetir. Daí ser muito importante identificar os processos de negócio/actividade, pois é nesta fase que serão criadas as questões que a Data Warehouse irá responder posteriormente e se faltarem questões, também vão faltar respostas.

Quando escolhemos a granularidade, estamos a ir ao máximo detalhe possível. Por exemplo, vamos supor que queremos responder apenas a duas questões: Quantos produtos foram vendidos num dia? Quantos produtos foram vendidos num mês? A nossa granularidade seria Produto x Dia, pois é o nível de detalhe que estas duas questões exigem.

As dimensões representam todas as possíveis descrições que tomam valores singulares no contexto de cada medida, ou seja, todas as possibilidades verificadas nas questões, estarão descritas nas dimensões, que por sua vez, estarão ligados à tabela de factos. Cada dimensão é criada conforme os dados existente na granularidade. Pegando no exemplo anterior, a Data Warehouse teria duas dimensões, a do Tempo e dos Produtos.

É a tabela de factos que nos vai dar os dados necessários para responder às questões solicitadas. Esta tabela é composta por dados que sejam numéricos e aditivos. Continuando com o exemplo anterior, um atributo possível para esta tabela de factos seria: quantidade vendida.

Exit mobile version