FRAMEWORK DATAWAREHOUSE

FRAMEWORK DATAWAREHOUSE

1- Data Warehouse pode ser considerado um banco de dados voltado a um conjunto de assuntos. Ele extrai informações valiosas das diversas fontes de dados e as armazena no banco de dados único de uma forma estruturada para atender as ferramentas de suporte à decisão.

Veja algumas definições de outras pessoas sobre o Data Warehouse:

Ralph Kimball define o Data warehouse como um conjunto de data marts que representa os focos de análise de forma intuitiva, facilitando a filtragem e agregação dos dados gerenciais.

Bill Inmon define o data warehouse como uma base de dados orientada por assuntos, integrada, não volátil, com histórico cumulativo indexado no tempo.

Os dados nos quais as tarefas de BI (BUSINESS INTELLIGENCE -Inteligência Empresarial) geralmente são carregados em um repositório data warehouse gerenciado por um ou mais servidores. Uma escolha popular de mecanismos para armazenamento e consulta de dados de armazenamento é o sistema de gerenciamento de banco de dados relacional (RDBMS). Nas duas últimas décadas, várias estruturas de dados, otimizações e técnicas de processamento de consultas foram desenvolvidas principalmente para executar consultas SQL complexas em grandes volumes de dados – um requisito importante para BI.

Em um framework Data WareHouse contém:

Datawarehouse (visão de todo o negócio);
Datamart (dividido por assunto ou departamentos);
Metadados (informação sobre os dados);

Exemplo de um framework data warehouse:

2-Definição Data Mart

  • É um segmento/parte do DataWarehouse;
  • Separado por assunto/departamento;
  • Protótipo rápido;
  • Restringe o acesso aos dados;
  • Possui três tipos: dependente, independente e o híbrido.

O Professor Dr. Lawrence Chung Koo define o data mart como: “Uma implementação de um DW com um escopo menor e mais restrito de dados e funções, servindo a um único departamento ou parte de uma organização”

3-Metadados 

Os metadados são informações sobre os dados;

  • A ideia principal, é abstrair a informação de forma que ela possa ser compreendida por qualquer sistema;
  • Possuem 4 tipos : sintáticos, estruturais, semânticos e negócios/técnicos.

Os Metadados podem estar encapsulados dentro do mesmo arquivo de dados ou podem estar separados em outros arquivos. Por exemplo, no início de cada arquivo de dados temos a descrição em forma de tags.

<nome>

Conteúdo com a característica da tag

</nome>

  • São baseadas nos padrões XML (Extended Markup Language –Linguagem de Marcação Extendida).

Dicionário de dados

  • Catálogo de dados
  • Diretório de dados
  • Normalmente administrado por um DA (Data Administrator), gestor de informação da empresa

Referência Bibliográficas:

https://cacm.acm.org/magazines/2011/8/114953-an-overview-of-business-intelligence-technology/fulltext

https://kosmos-cronograma-anexo.s3.amazonaws.com/7510/b876f867-e430-4ff9-ad65-60b9f381207a.pdf

Por Igor Costa – Desenvolvedor de Sistemas da Weblynx