Introdução ao Data Collection no Microsoft SQL Server 2008 – Parte I.

Pessoal, bom dia.

A partir de hoje e nos próximos posts, vou apresentar para aqueles que não conhecem ou ainda não tiveram a oportunidade de conhecer uma das novas funcionalidades introduzidas a partir do SQL Server 2008, conhecida como Data Collection (Coleção de Dados ou Coletor de Dados). Este artigo tem como objetivo responder diversos comentários recebidos a algum tempos, pelos participantes e visitantes do meu blog, sobre uma pequena dica postada a alguns meses apresentando um Data Collection.

Como de costume vou dividir este material em várias partes e sessões, desta forma, você poderá acontecer este nova série e manter-se atualizado. Então vamos lá a seguir começo a destacar e apresentar o DC, suas características, recursos, funcionalidades, formas de uso e muitos mais.

——————————————————————————————————————————————————-

Com o Data Collection (DC) adicionado ao SQL Server 2008, temos a possibilidade de trabalhar um dos recursos mais solicitados e aguardado entre os profissionais da área de Banco de Dados, os chamados Coletores de Dados.  Através destes coletores podemos utilizar contêineres de coleta de dados, capturando informações sobre o escopo e a freqüência da coleta de dados em um computador executando o SQL Server 2008.

O coletor de dados (Data Collector) é um componente responsável na coleta de diferentes conjuntos de dados, e pode ser executada constantemente ou por uma agenda previamente definida, conforme escolha do usuário. Os dados são armazenados em um banco de dados relacional, também chamado de Data Warehouse de Gerenciamento.

O coletor fornece um ponto central para coleta de dados em seus servidores de banco de dados e aplicativos, que pode obter dados de várias fontes, não se limitando apenas aos dados de desempenho.

Ele oferece suporte ao ajuste dinâmico para coleta de dados, além de permitir ajuste do escopo da coleta de forma a adequar-se aos ambientes de teste e produção, e é extensível via API. A figura 1 abaixo mostra como o coletor de dados se adapta à estratégia geral de coleta e gerenciamento de dados.

Figura 1. Adaptação do coletor e gerenciamento da coleta de dados, através do Data Collection.

INTRODUÇÃO AO COLETOR DE DADOS

O componente do coletor de dados é instalado durante a instalação do SQL Server 2008, juntamente com as funções e ferramentas de segurança necessárias para configurar e usar o coletor de dados. Antes de começar a usar o coletor de dados, é recomendável ler Terminologia de coleta de dados e Segurança do coletor de dados. Antes de usar o coletor de dados, é necessário executar várias tarefas:

Crie logons e mapeie-os para as funções do coletor de dados

O coletor de dados tem funções específicas para coleta de dados e tarefas de data warehouse de gerenciamento. Logons e funções de coleta de dados são criados no servidor que executa a coleta de dados.

Logons e funções do data warehouse de gerenciamento são criados no servidor que hospeda o data warehouse de gerenciamento. Use o assistente para Configurar Data Warehouse de Gerenciamento para criar esses logons e mapeá-los para funções específicas.

Configurar o data warehouse de gerenciamento

Use o assistente para Configurar Data Warehouse de Gerenciamento para configurar o armazenamento dos dados coletados. O assistente fornece uma maneira fácil de fazer o seguinte:

  1. Criar o data warehouse de gerenciamento. Você pode instalar esse data warehouse de gerenciamento na mesma instância do SQL Server que executa o coletor de dados. No entanto, se o desempenho ou os recursos do servidor forem um problema no servidor que está sendo monitorado, você poderá instalar o data warehouse de gerenciamento em um
    computador diferente;
  2. Instalar os conjuntos de coletas de Dados do Sistema predefinidos;
  3. Mapear logons para as funções de data warehouse de gerenciamento;
  4. Habilitar a coleta de dados; e
  5. Iniciar os conjuntos de coletas de Dados do Sistema.

Criar proxies

Proxies utilizados na coleta e carregamento de dados devem ser criados antes de iniciar a coleta. Os proxies podem ser configurados para um conjunto de coleta usando a guia Geral da página Propriedades do Conjunto de Coleta.

Utilize o SQL Server Management Studio para tarefas de coleta de dados, como habilitar o coletor de dados, iniciar um conjunto de coleta, exibir logs e exibir os relatórios personalizados que são fornecidos.

Você também pode usar stored procedures fornecidos para qualquer tarefa de coletor de dados que não necessitde do SQL Server Management Studio, como exibir relatórios personalizados.

TERMINOLOGIA

Antes de configurar, usar ou estender o coletor de dados, é necessário entender a terminologia que descreve esse recurso.

Destino: Uma instância do Mecanismo de Banco de Dados em uma edição do SQL Server que suporta Coleta de dados. Uma raiz de destino define uma subárvore na hierarquia de destino. Um conjunto de destinos é o grupo de destinos resultante da aplicação de um filtro a uma subárvore definida por uma raiz de destino. A raiz de destino pode ser uma instância do SQL Server, uma instância do computador, ou um Banco de Dados.

Tipo de destino: Tipo de destino que tem um determinado comportamento e características. Por exemplo, um destino de
instância do SQL Server tem características diferentes das de um destino de banco de dados do SQL Server.

Provedor de destinos: Fonte de dados conhecida, específica para um tipo de destino que fornece dados para um tipo de
coletor.

Tipo de coletor: Um delimitador lógico que envolve os pacotes do SSIS e fornece o mecanismo real para coletar dados e carregá-los no data warehouse de gerenciamento.

Item de coleta: Uma instância de um tipo de coletor. Um item de coleta é criado com um conjunto específico de
propriedades de entrada e uma freqüência de coleta.

Conjunto de coleta: Um grupo de itens de coleta. Um conjunto de coleta é uma unidade de coleta de dados com o qual um
usuário pode interagir através da interface do usuário.

Modo da coleta: A maneira pela qual os dados são coletados e armazenados. O modo de coleta pode ser em cache ou
não-cache. O modo cache dá suporte à coleta contínua, enquanto que o modo não-cache destina-se à coleta sob demanda ou a um instantâneo de coleta.

Data warehouse de gerenciamento: Um banco de dados relacional usado para armazenar os dados coletados. A ilustração a seguir mostra as dependências e as relações entre os componentes do coletor de dados. Com base na figura 2, você poderá observar que o provedor de dados fica fora do coletor de dados e, por definição, tem uma relação implícita com o destino.

Figura 2. Localização do provedor de dados em relação a estrutura de trabalho para coleto de dados.

Como mostrado na figura 2, o provedor de dados fica fora do coletor de dados e, por definição, tem uma relação implícita com o destino. O provedor de dados é específico para um destino específico (por exemplo, um serviço do SQL Server como o mecanismo relacional) e fornece dados como exibições do sistema no SQL Server, contadores de Desempenho do Sistema e
provedores WMI, que podem ser consumidos pelo coletor de dados.

O tipo de coletor é específico a um tipo de destino, baseado na associação lógica de um provedor de dados a um tipo de destino. O tipo de coletor define como os dados são coletados de um provedor de dados específico (usando parâmetros esquematizados)
e especifica o esquema de armazenamento de dados. para armazenar os dados coletados são necessários o esquema de armazenamento e o de provedor de dados.

O tipo de coletor também fornece o local do data warehouse de gerenciamento (que pode ser no computador que está executando a coleta ou num outro computador). Um item de coleta, mostrado na figura, é uma instância de um tipo de coletor específico, com parâmetros de entrada (esquema XML do tipo de coletor). Todos os itens de coleta devem funcionar na mesma raiz de destino ou em uma raiz de destino vazia. Isso habilita o coletor de dados a combinar tipos de coletor do sistema
operacional ou de uma raiz de destino específica, mas não de raízes de destino diferentes.

Um item de coleta possui uma freqüência de coleta definida que determina a freqüência com que as cópias de valores são feitas. Embora seja um bloco de construção para um conjunto de coleta, um item de coleta não existe isoladamente.

Os conjuntos de coleta são definidos e implantados em uma instância de servidor e podem ser executados independentemente um do outro. Cada conjunto de coleta pode ser se aplicado a um destino que corresponda aos tipos de destino de todos os tipos de coletor que fazem de um conjunto de coleta. O conjunto de coleta é executado por um trabalho ou trabalhos do SQL Server Agent, e os dados são carregados no data warehouse de gerenciamento em uma agenda predefinida.

Todos os dados coletados por instâncias diferentes dentro do conjunto de coleta são carregados no data warehouse de gerenciamento na mesma agenda, que é definida como uma agenda compartilhada do SQL Server Agent, podendo ser usada por mais de um conjunto de coleta. Os itens de coleta não podem ser ativados/desativados individualmente, diferentemente do conjunto de coleta, que é ativado/desativado como uma entidade única.

Ao criar ou atualizar um conjunto de coleta, é possível configurar o modo de coleta de duas maneiras: em cache, que executa a coleta e o carregamento de dados como trabalhos separados, e não-cache, que os executa em um único trabalho. A coleta em cache é executada segundo uma agenda que inicia quando o SQL Server Agent é iniciado e executado na freqüência especificada no item de coleta. O carregamento é executado de acordo com a agenda especificada pelo usuário.

A coleta não-cache funciona em duas etapas: A primeira etapa é a coleta, a segunda etapa é o carregamento. Nenhuma agenda é necessária para a coleta sob demanda. Depois de habilitar um conjunto de coleta, pode ser iniciada a coleta de dados, de acordo com uma agenda ou sob demanda. Ao iniciar a coleta, é gerado um processo para o coletor de dados, através do SQL Server Agent, e então os pacotes do Integration Services são carregados no conjunto de coleta. Os itens de coleta que representam tipos de coleta reúnem dados dos provedores de dados apropriados nos destinos especificados. Ao final do ciclo, o data warehouse de
gerencialmento é carregado com os dados.

Bom pessoal, vou encerrar esta primeira parte aqui, mas nos próximos dias, vou com este mesmo artigo destacando a Arquitetura de Funcionamento do Data Collection na segunda parte desta sério.

Por enquanto, agradeço mais uma vez a sua visita, espero que estas informações possam ser úteis no sua dia-a-dia.

Nos vemos em breve, até mais.

Anúncios

Sobre Junior Galvão - MVP

Profissional com vasta experiência na área de Tecnologia da Informação e soluções Microsoft. Graduado no Curso Superior em Gestão da Tecnologia de Sistemas de Informação. Pós-Graduado no Curso de Gestão e Engenharia de Processos para Desenvolvimento de Software com RUP na Faculdade FIAP - Faculdade de Informática e Administração Paulista de São Paulo. Pós-Graduado em Gestão da Tecnologia da Informação Faculdade - ESAMC Sorocaba. Formação MCDBA Microsoft, autor de artigos acadêmicos e profissionais postados em Revistas, Instituições de Ensino e WebSistes. Meu primeiro contato com tecnologia ocorreu em 1995 após meus pais comprarem nosso primeiro computador, ano em que as portas para este fantástico mundo se abriram. Neste mesmo ano, comecei o de Processamento de Dados, naquele momento a palavra TI não existia, na verdade a Tecnologia da Informação era conhecida como Computação ou Informática, foi assim que tudo começou e desde então não parei mais, continuando nesta longa estrada até hoje. Desde 2001 tenho atuado como Database Administrator - Administrador de Banco de Dados - SQL Server em tarefas de Administração, Gerenciamento, Migração de Servidores e Bancos de Dados, Estratégias de Backup/Restauração, Replicação, LogShipping, Implantação de ERPs que utilizam bancos SQL Server, Desenvolvimento de Funções, Stored Procedure, Triggers. Experiência na Coordenação de Projetos de Alta Disponibilidade de Dados, utilizando Database Mirroring, Replicação Transacional e Merge, Log Shipping. Atualmente trabalho como Administrador de Banco de Dados no FIT - Instituto de Tecnologia da Flextronics, como também, Consultor em Projetos de Tunnig e Performance para clientes, bem como, Professor Titular na Fatec São Roque. Desde 2008 exerço a função de Professor Universitário, para as disciplinas de Banco de Dados, Administração, Modelagem de Banco de Dados, Programação em Banco de Dados, Sistemas Operacionais, Análise e Projetos de Sistemas, entre outras. Possuo titulações e Reconhecimentos: Microsoft MVP, MCC, MSTC e MIE.
Esse post foi publicado em Dicas, VIRTUAL PASS BR e marcado , , , , , , , , , . Guardar link permanente.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s