Modelagem de Dados aplicada em ambiente de Data Warehouse – Hierarquias, Drill-Down e Roll-UP

Olá, boa noite!

Seja bem-vindo a mais um post da sessão “Contando História com Dados“.

Nesta nova sessão, você vai encontrar posts relacionados a área de dados, destacando ao longo dos anos como este elemento atualmente reconhecimento como o mais importante em nossas vidas, conseguiu evoluir, conquistar o seu espaço, tornando-se cada vez mais vital para nossa evolução.

Em adicional, estarei compartilhando sempre que possível, um documento, apresentação ou resumo do conteúdo aqui compartilhado, o qual conterá o meu ponto de vista, conhecimento e aprendizados obtidos ao longo dos estudos realizados para elaboração do referido post.

Neste quinto post, destaco de forma breve outros conceitos relacionados a Modelagem de Dados aplicada em ambientes de Data Warehouse, em especial Drill-Down e Roll-Up.

Introdução

As hierarquias descrevem a lógica dos relacionamentos entre os dados são a base
para a navegação entre os diferentes níveis de detalhe em uma estrutura multidimensional.

Por outro lado, uma característica interessante aplicada nas análises dimensionais, é a possibilidade de detalhamento e da sintetização das informações, algo que podemos chamar respectivamente de Drill-Down e Roll-Up.

Hierarquias

As hierarquias podem ser reconhecidas como estruturas que permitem estabelecer formas de identificar a relação entre dados existentes em um mesmo campo, atributo ou valor.

Neste caso podemos exemplificar uma hierarquia com base no tempo: horas, dias, semanas, meses, trimestres e anos; ou então de maneira geográfica representada por cidades, municípios, estados, regiões e países.

Desta forma, as hierarquias podem ser classificadas como: explícita e implícita:

  • Hierarquias explícitas: são caracterizadas por uma sequência de entidades interligadas, cujos relacionamentos, entre cada par de entidades na sequência, é N:1.

    A Figura 1 representa a hierarquia explícita para a dimensão Produto, essa hierarquia é constituída pelas dimensões Tipo e Categoria.

Figura 1 – Hierarquia explícita de Produto.

  • Hierarquia Implícitas: Podem também ser chamadas de múltiplas hierarquias, que representam as hierarquias embutidas nos atributos das dimensões.

    Um exemplo para múltiplas dimensões é representado na Figura 2, com a classificação de produtos de acordo com Tipo de Armazenamento e Tipo de Embalagem. Os alimentos podem ser subcategorizados, quanto ao armazenamento refrigerado ou “não refrigerado”, ou quanto ao tipo de embalagem, em “caixa” e “pacote”.

    Do mesmo modo, os materiais de limpeza podem ser classificados, quanto à sua fórmula, em tóxica ou não tóxica, ou, quanto à sua consistência, em líquida, pastosa ou em pó.

Figura 2 – Hierarquia implícita para Produto.

Drill-Down e Roll-Up

Tratados pelo profissionais da área de banco de dados e data warehouse, como uma das mais importantes características utilizadas diretamente na análise dimensional, permitindo-se criar formas diferentes de encontrar níveis de detalhamento ou sintetização dos dados.

Através do uso do Drill-Down, podemos navegar dentro dos níveis hierárquicos pré-estabelecidos nos conjuntos de dados armazenados nas respectivas dimensões, aprofundando-se nos níveis mais baixos, afim de se encontrar informações que podem ser rotuladas como novos conjuntos de dados.

A Figura 3 apresenta um exemplo de drill-down e roll-up através de uma informação de data.

Figura 3: Exemplo de drill-down, detalhando uma informação de data e roll-up, sintetizando a informação.

Inmon (1996) apresenta uma definição interessante sobre o comportamento do Drill-Down:

(…) Drill-down não significa descer em uma hierarquia predeterminada. Significa a possibilidade de obter rapidamente cabeçalhos de linha de qualquer uma das dimensões associadas a uma tabela de fatos. Significa também a possibilidade de remover cabeçalhos e pesquisar em direções diferentes.

William H. Inmon

Entretanto, o Drill-Down estabelece a possibilidade do detalhamento de um consulta, as consultas são mais restritas se existirem mais detalhes nos critérios de seleção.

O usuário pode querer começar sua análise no nível mais alto de agregação, e então aprofundar a pesquisa passando pelos diferentes níveis até o nível inferior de detalhe a fim de obter uma perspectiva diferente do que compôs os valores do nível mais alto.

Porém, diferentes níveis de uma hierarquia não representam dimensões diferentes por si mesmas, desse modo, eles não são considerados requerimentos para se fornecer capacidades multidimensionais.

Há dois tipos de processamento de drill-down relevantes:

1 – Processamento de drill-down entre-OLAP; e
2- Processamento de drill-down OLAP-para-dados estruturados organizacional.

A Figura 4 mostra o suporte OLAP ao processamento de drill-down.

Figura 4: Drill-down e drill-across de OLAP.

Em suma, o Drill-down entre-OLAP, é utilizado para mostrar o relacionamento como resumo entre as diferentes instâncias de dados dentro do ambiente OLAP, é também conhecido como drill-across.

No entanto, dados mais detalhados existem no nível estruturado organizacional do data warehouse, o que dá suporte a um nível de drill-down que vai além do projeto de cada instância de OLAP departamental.  

Por fim, o roll-up pode ser reconhecido como o processo inverso do drill-down, o qual terá o papel de permitir que o usuário possa reduzir o escopo da análise, subindo dentro dos níveis de detalhe, pré-estabelecidos com base na estrutura hierárquica, realizando a operação de agregação, ou seja subindo para os níveis anteriores.

Download

Referências

INMON, W.H. Como construir o Data Warehouse. Rio de Janeiro: Editora Campus, 1997. 388p.

INMON, W.H, WELCH, J. D., GLASSEY, K. L. Gerenciando Data Warehouse. São Paulo: Makron Books, 1999. 375p.

KIMBALL, Ralph. Data Warehouse Toolkit. São Paulo: Makron Books, 1996-b. 388 p.

KIMBALL, Ralph, REEVES, Laura, ROSS, Margy, THORNTHWAITE, Warren. TheIData Warehouse Lifecycle Toolkit – Expert Methods for Designing, Developing andIDeploying Data Warehouses. New York: John Wiley & Sons, Inc., 1998. 771 p.

KIMBALL, Ralph, ROSS, Margy. The Data Warehouse Toolkit (Segunda Edição). Rio de Janeiro: Editora Campus, 2002. 494 p.

Agradecimento

Obrigado por sua visita a mais este post do meu blog!

Espero que este post e todos os demais aqui compartilhados possam lhe ajudar ao longo das mais diversas necessidades da sua vida profissional e acadêmica.

Aproveite, para viver cada dia, observando como você pode transformá-la em uma nova história repleta de dados.

Um forte abraço.