Você está na página 1de 79

Governança de Dados

•The Data-Centric Revolution: Restoring Sanity to Enterprise Information Systems by Dave McComb
Publisher: Technics Publications, Release Date: September 2019.

•Non-Invasive Data Governance by Robert S. Seiner, Publisher: Technics Publications, Release Date: July
2014.

•Gestão e Governança de Dados – Promovendo dados como ativo de valor nas empresas. Rêgo, Bergson
Lopes. Editora Brasport, 2013.
Módulo 1: Contexto da Governança de Dados na
Administração Pública
Governança de Dados é o conjunto de políticas, processos, pessoas e tecnologias que visam a estruturar e
administrar os ativos de informação, com o objetivo de aprimorar a eficiência dos processos de gestão e da
qualidade dos dados, a fim de promover eficiência operacional, bem como garantir a confiabilidade das
informações que suportam a tomada de decisão.

Objetivos da Governança de Dados:


•Definir e implementar estratégias de dados, políticas, normas, padrões, arquitetura,
processos e métricas.
•Patrocinar e monitorar os projetos de relacionados à Gestão de Dados.
•Implementar e gerenciar a Gestão de Riscos relacionadas ao compartilhamento de
dados.
•Promover o valor dos dados como ativos estratégicos.
2. Cadeia de evolução dos dados e informações

Dados

São a base de todo o processo de geração da sabedoria organizacional e o primeiro estágio a ser atingido. Eles representam fatos através de um conjunto de caracteres primitivos e
isolados, geralmente representados através de textos, números, imagens, sons ou vídeos. Os dados não possuem qualquer significado relevante dentro de um contexto de negócio
(dados sem contexto).
Metadados

Representam os significados dos dados. Esses significados correspondem tanto ao conteúdo técnico do dado, obtido através das informações sobre estrutura, formato, tamanho e
restrições (metadados técnicos), como informações sobre definições, conceito, relevância e regras de negócio dos dados envolvidos (metadados de negócio).
Informações

Correspondem aos dados processados com algum significado e são geradas e obtidas nos sistemas de processamento de transações e sistemas de apoio à decisão, reduzindo a
incerteza sobre alguma coisa, estado ou evento. Quando os metadados são utilizados para leitura e interpretação dos dados, a cadeia de evolução do dado já mudou de estágio, ou
seja, já está no nível da informação.
Conhecimento

Corresponde ao processamento das informações com significados, premissas, padrões de comportamento, tendências e valores agregados através de conjunto de regras de
manipulação e características dessas informações. São o subsídio para soluções de problemas e tomadas de decisão. Atualmente, é impossível imaginar a evolução para esse
estágio da cadeia sem os sistemas de apoio à decisão e as aplicações de inteligência analítica.
Sabedoria

É a utilização do conhecimento com efetividade. Apesar das aplicações de inteligência analítica já serem uma realidade dentro do mercado, fornecendo condições para a
organização atingir o estágio anterior, muitas organizações que possuem estes subsídios desejam a sabedoria, mas não a conseguem. Parte deste fracasso está na confiabilidade
dos dados, que não foram bem geridos no decorrer da evolução da cadeia. Outra parte na falta de habilidade dos profissionais em extrair as informações e utilizá-las de forma
vantajosa.
3. A importância da Governança de Dados
Um exemplo prático de uso da Governança de Dados pode ser verificado na implementação da Plataforma de Interoperabilidade de Dados - ConectaGov.
Essa plataforma disponibiliza a infraestrutura de armazenamento e hospedagem permitindo o cruzamento de grandes volumes de dados, visando:
•1
•A utilização de ferramentas para análise e cruzamento de dados para geração de informações para a tomada de decisões.
•2
•O favorecimento da desburocratização por meio de acesso centralizado a informações de governo para simplificar a oferta de serviços públicos.
•3
•A ampliação da transparência permitindo a análise de contas públicas para combater fraudes.
•4
•A adoção de tecnologia de ponta no processamento de grande volume de dados com rápido tempo de resposta.
•5
•A viabilização da segurança e garantia de sigilo e individualização das bases de dados.
•6
•A alavancagem da economicidade pelo uso compartilhado de infraestrutura e do consumo de dados para redução de custos.
Podemos elencar os principais ganhos que são comuns à maioria das organizações ao adotarem a Governança de Dados como parte de sua estrutura organizacional:

•Mudança de cultura: dados e informações passam a ser reconhecidos como importantes ativos estratégicos nas organizações.

•Melhor alinhamento entre as áreas de Tecnologia da Informação e Comunicação (TIC) e de Negócio: este alinhamento é premissa fundamental para o bom funcionamento da
Governança de Dados. Com isso, outras áreas como a de mapeamento de processos e a de desenvolvimento de sistemas podem se beneficiar de alinhamentos já iniciados.

•A gestão das operações de captura, armazenamento, proteção, planejamento, controle e garantia da qualidade dos ativos de dados é centralizada em uma única estrutura,
permitindo a redução de custos e a otimização do uso dos recursos.

•Criação de uma cultura do uso de indicadores de processo, qualidade e desempenho de dados e informações: o objetivo é manter alinhados a Governança de Dados e o
Planejamento Estratégico da Organização.

•Conhecimento de dados e informações utilizados por meio da adoção de um vocabulário único sobre as definições dos dados: ampliação e melhoria da disseminação do
conhecimento entre as pessoas – passagem do capital intelectual para o capital estrutural.

•Entendimento das principais necessidades de dados e informações da organização, fornecendo um importante subsídio para estabelecer o planejamento para absorção, criação
e/ou transformação de novos dados e informações para a empresa: definir o que realmente é importante em relação à utilização de dados e informações e estabelecer
prioridades em relação às futuras implementações e mudanças.

•Redução da quantidade de informações redundantes.

•Estabelecimento de mecanismos formais de segurança para acesso e disponibilização de dados e informações.

•Reutilização de dados corporativos e/ou compartilhados, por meio do gerenciamento de dados mestre e dados de referência.

•Total governança dos dados manipulados pela organização.


3.1 Governança e gestão

São funções da Governança:

•definir o direcionamento estratégico;

•supervisionar a gestão;

•envolver as partes interessadas;

•gerenciar riscos estratégicos;

•gerenciar conflitos internos;

•auditar e avaliar o sistema de gestão e controle; e

•promover a accountability (prestação de contas e responsabilidade) e a transparência.


Enquanto a Gestão é inerente e integrada aos processos organizacionais, sendo responsável pelo planejamento, execução, controle, ação, enfim, pelo
manejo dos recursos e poderes colocados à disposição de órgãos e entidades para a consecução de seus objetivos, a governança provê direcionamento,
monitora, supervisiona e avalia a atuação da gestão, com vistas ao atendimento das necessidades e expectativas dos cidadãos e demais partes interessadas.

Nesse contexto, a Governança de Dados está organizada da seguinte forma:


3.2 Tipos de papéis
Nesse sentido, podemos categorizar esses papéis em três grupos distintos:
•Papéis ligados à área de negócio.
•Papéis ligados à área estratégica.
•Papéis ligados à área técnica/tecnológica.

3.3 Papéis ligados à Governança de Dados


Criar Políticas, Processos e Procedimentos é um dos principais resultados da Governança de Dados.

•As Políticas estabelecem um conjunto de metas e afirmam “o que deve ser


feito” alinhadas com outros instrumentos estratégicos da organização.
•Os Processos, indicam as atividades, pessoas, ferramentas, regras necessárias
ao cumprimento da Política.
•Os Procedimentos descrevem em detalhes como exatamente executar os
processos.
•Curador de Dados de Negócio
Também conhecido como Business Data Steward, é o Gestor de Dados ligado à área de negócio da organização. Trabalha e atua como o
principal curador dos dados, representando os interesses da área de negócios, atuando com responsabilidade e autoridade sobre o conjunto de
dados do seu escopo de negócio.
A ele compete:

•Definir dos metadados corretos (glossário de termos, nomes de entidades e atributos, regras de validação, valores válidos, regras de qualidade.
•Identificar problemas de qualidade de dados e suas causas.
•Acompanhar a resolução de problemas de qualidade.
•Acompanhar o desenvolvimento de novas soluções de tecnologia.
•Avaliar riscos e oportunidades no uso dos dados.

•Curador de Dados Corporativos


São pessoas escolhidas entre os gestores das áreas de negócio. Geralmente são ocupantes de cargos com poder de decisão.
Ao curador de dados corporativos compete:
•Entender os processos da Gestão e Governança de Dados;
•Conhecer o modelo de processos da sua área de negócio em profundidade e os outros processos de negócio;
•Conhecer as técnicas de modelagem de dados;
•Conhecer arquitetura de sistemas transacionais e Business Intelligence;
•Apoiar na criação e manutenção do glossário de termos de negócio;
•Apoiar na criação e manutenção do modelo de dados conceitual corporativo;
•Identificar o valor das informações e sua qualidade;
•Corrigir problemas de qualidade de dados.
•Encarregado de Proteção de Dados ou Data Protection Officer – DPO

O Encarregado de Proteção de Dados ou Data Protection Officer – DPO, que teve como origem a General Data Protection Regulation – GDPR[1], com
adaptações, pela Lei Geral de Proteção de Dados – LGPD (Lei nº 13.709/2018), é o responsável por disseminar a cultura de proteção de dados na empresa, além
de criar normas e procedimentos adequados à lei. Será ele que receberá notificações da Autoridade Nacional de Proteção de Dados – ANPD e dos titulares das
informações e as colocará em prática.
No art. 41, § 2º, da LGPD, temos algumas atividades do DPO, que consiste em:
I – aceitar reclamações e comunicações dos titulares, prestar esclarecimentos e adotar providências;
II – receber comunicações da autoridade nacional e adotar providências;
III – orientar os funcionários e os contratados da entidade a respeito das práticas a serem tomadas em relação à proteção de dados pessoais; e
IV – executar as demais atribuições determinadas pelo controlador ou estabelecidas em normas complementares.

•Curador de Dados Técnico e Operacional

Profissional responsável por projetar os mecanismos para integração dos dados. Ele deve dominar o uso de ferramentas de integração e de extração de dados,
como por exemplo: SOA, ETL e mecanismos de integração por meio de SGBDs. Entre suas responsabilidades destacam-se:

•Emitir pareceres técnicos indicando a melhor forma de integração de dados.


•Manter atualizado o catálogo de serviços de integração de dados.
•Apoiar na especialização de mecanismos de integração.
•Apoiar o desenvolvimento de serviços na construção de dispositivos de integração de dados.

Competências

•Conhecimentos avançados de mecanismos de integração de dados.


•Conhecimentos avançados de utilização de repositórios de ativos de informação.
3.4 Informação de qualidade

Os dados são um ativo valioso e devem ser gerenciados conforme são transferidos em uma organização. À medida que as fontes de informações estão se tornando mais numerosas e
diversificadas e as iniciativas de conformidade regulatória mais direcionadas, a necessidade de integrar e acessar informações dessas fontes diferentes de forma consistente, confiável e
reutilizável também está se tornando essencial.
A informação de qualidade deriva de dados qualificados, o que é uma característica essencial que determina a confiabilidade dos dados para a tomada de decisões.
Sendo o governo uma organização de informações, seus resultados estão ligados a suas informações, e à qualidade destas. Exemplo: Se o índice de erro no controle de estoque de
medicamentos subir muito, não apenas o governo irá gastar onde não precisa, como poderá deixar a população sem atendimento médico adequado. Qualidade da informação inclui
atualização, completude, detalhes, etc.
4. Organização da informação na Administração Pública Federal (APF)

Órgãos públicos geram muitos dados e informações. Arrecadam taxas e impostos, constroem estradas, abastecem hospitais, pagam benefícios e cancelam
permissões de motoristas. Todas essas ações são sustentadas pelo primeiro item, a cobrança de impostos. Então poderíamos dizer que a função do Estado é
cobrar impostos e executar ações com esse dinheiro. Mas, para todas as ações, desde a cobrança de impostos, o insumo básico é informação. Isso vai desde a
renda declarada, e da renda verificada, até a ocorrência de multas que justificarão o cancelamento da carteira de motorista.
O governo é uma instituição de informações. Ele consome informações (renda, salários, bens, ocorrência de doenças, estoque de remédios, idade de
pensionistas, multas de trânsito etc.) e produz informações (imposto devido, necessidade de reposição de medicamentos, valores de pensões devidas, carteiras a
serem canceladas). Seu desempenho, em todas as áreas, está ligado a essas informações.
Com isso, a Administração Pública Federal (APF), diante de elevada geração de dados registrados em diversas bases sem integração e compartilhamento;
promoveu a criação de instrumentos normativos e adoção de soluções tecnológicas que visem criar um ambiente de integração

Neste contexto, podemos destacar a publicação do Decreto nº 10.046, de 9 de outubro de 2019, que dispõe sobre a governança no compartilhamento de dados no
âmbito da administração pública federal e institui o Cadastro Base do Cidadão. Além disso, com base neste Decreto, concebeu-se a Plataforma de
Interoperabilidade do Governo Federal – CONECTAGOV, que representa umas das principais ações de governo para fomento de compartilhamento de dados
por meio de APIs (Application Programming Interface). As APIs são conectores que propiciam o compartilhamento de informações governamentais em tempo
real e a possibilidade de interoperabilidade entre sistemas de governo com garantia de requisitos de segurança necessários e suficientes para prover a
disponibilidade, a integridade, a autenticidade e a confidencialidade dos dados.
4.1 Legislação correlata
Além do que foi citado e considerando os objetivos da Governança de Dados, destacamos os principais instrumentos normativos como sendo relevantes
instrumentos que visam promover o valor do dado e da informação como ativos estratégicos:

Iniciativas de Governança de Dados na APF

Em decorrência da publicação de instrumentos normativos que tratam da Governança e da Gestão da Informação, principalmente no que tange ao
compartilhamento de dados previsto no Decreto nº 10.046, de 09 de outubro de 2019 e do Decreto nº 8.936, de 19 de dezembro de 2016, promoveu-
se o desenvolvimento das seguintes iniciativas:
Módulo 2: Princípios, Importância e Desafios do
Gerenciamento de Dados
1. A importância do gerenciamento de dados

Porém, produzir dados de alta qualidade e gerenciar maneiras que permitam que sejam utilizados com eficiência não é um processo simples.
A partir de agora, revisaremos os seguintes conceitos, que são importantes para qualquer organização que deseje aprimorar seus recursos de gerenciamento de dado
•A onipresença dos dados - o fato de que quase todo processo organizacional cria ou consome dados ou ambos.
•Valor dos dados como um ativo.
•A função de atividades e funções envolvidas no gerenciamento de dados.

1.1 Os dados estão em todo lugar

Os dados são difundidos nas organizações. Quase todos os processos de negócios - desde a criação de clientes, transações de compras, contato com clientes
para feedback e serviços - usam dados como entrada e dados produzidos como saída. Esses dados podem ser armazenados, manipulados, integrados e
agregados para diferentes utilizações; incluindo inteligência artificial e análise preditiva. Esse gerenciamento também fornece evidências de conformidade
(ou falta) com a legislação vigente e as normas internas.
1.1 Os dados estão em todo lugar
À medida que as organizações precisam gerenciar seus dados, visto que o avanço da tecnologia expandiu o escopo da necessidade de gerenciamento. Os
dados são difundidos nas organizações. Quase todos os processos de negócios - desde a criação de clientes, transações de compras, contato com clientes
para feedback e serviços - usam dados como entrada e dados produzidos como saída. Esses dados podem ser armazenados, manipulados, integrados e
agregados para diferentes utilizações; incluindo inteligência artificial e análise preditiva. Esse gerenciamento também fornece evidências de conformidade
(ou falta) com a legislação vigente e as normas internas

1.2 Dados como um ativo


Um ativo é um recurso econômico, que pode ser de propriedade ou controlado e produz valor. Os ativos são frequentemente vistos como propriedade, mas com
uma forte implicação de que podem ser convertidos em valores.
Se questionados, muitos usuários diriam que os dados de sua organização são um ativo ativo.
Os dados não são apenas necessários para as operações de negócio, mas também podem fornecer informações sobre usuários, produtos e serviços. No entanto,
pesquisas mostram que poucas organizações tratam seus dados como um ativo. Para muitos, pode até ser um passivo. Uma falha no gerenciamento de dados é
semelhante à falha no gerenciamento de capital. Isso resulta em desperdício e em oportunidades perdidas. Dados mal gerenciados representam riscos de
conformidade e de segurança.
Mesmo os usuários que reconhecem os dados como um ativo não podem ser capazes de descrever exatamente o que isso significa, pois os dados são transferidos
de outros ativos. A obtenção de valor dos dados não ocorre em caso de vácuo ou acidente. Isso requer compromisso organizacional e liderança.
1.3 Atividades de gerenciamento de dados

As atividades de gerenciamento de dados podem ser entendidas em grupos: alguns focos na governança para garantir que a organização tome decisões
consistentes e sólidas sobre o gerenciamento, manutenção e uso de dados ao longo do tempo; e outros se concentram no gerenciamento do ciclo de vida dos
dados, desde a obtenção dos dados até a sua eliminação.
As atividades de governança visam desenvolver políticas de gestão e de uso de dados, de forma a reduzir os riscos e, ao mesmo tempo, permitir que se
criem condições detalhadas para obter o uso mais eficiente dos dados estratégicos. Estas atividades estabelecem um sistema de garantias e
responsabilidades, para que se possa tomar decisões consistentes no âmbito da área de negócios.

As atividades de governança incluem esses elementos:

•Definir estratégias.
•Definir políticas.
•identificar o valor dos dados.
•Preparar uma organização para obter o máximo de eficiência no uso de seus dados por meio de:
•Ampliação da atualização de suas práticas de gerenciamento de dados.
•Evolução da mentalidade da organização em torno da gestão de dados.

As atividades do ciclo de vida incluem:


•Arquitetura de dados.
•Modelagem de dados.
•Construção e gerenciamento de data warehouses e marts .
•Integração de dados para uso de inteligência de negócios e cientistas de dados.
•Gerenciamento do ciclo de vida com compartilhamento de fatores críticos: como dados de referência e dados mestres.
1.4 Áreas de conhecimento em gerenciamento de dados
O trabalho de gerenciamento de dados é realizado por pessoas que trabalham em funções ou áreas de conhecimento vinculadas ao gerenciamento de
dados, que possuem diferentes tipos de habilidades e conhecimentos, conforme demonstrado na figura a seguir
A DAMA© International define suas áreas de conhecimento:

O framework DAMA-BOK estrutura as áreas de


conhecimento de gerenciamento de dados. Ela centraliza
a disciplina Governança de Dados das atividades de
gerenciamento de dados, já que a governança é
necessária para a consistência e o equilíbrio entre as
funções. As outras áreas de conhecimento (arquitetura de
dados, modelagem de dados, etc.) são balanceadas em
torno do centro. Todas são partes de uma função madura
de gerenciamento de dados, mas podem ser inovadoras
em momentos diferentes, dependendo dos requisitos da
organização.
2. Desafios no gerenciamento de dados

2.1 Os dados coletados de outros ativos

Os dados têm características únicas que os diferenciam de outros ativos: os ativos financeiros, por exemplo, podem ser contabilizados. Mas os dados não
são tangíveis. Os dados são dinâmicos e podem ser usados ​para diversas finalidades.
As diferenças se tornam complexas quando se trata de manter o controle e conceder um valor monetário ao dado. Essa percepção de valor é um dos fatores
para avaliar os dados importantes para o sucesso organizacional. Fatores que auxiliam na atribuição de valor aos dados:
•Implementação de um inventário.
•Definição de propriedade e responsabilidade.
•Definição de políticas de segurança de acesso e uso.
•Definição de políticas de gerenciamento de riscos.
•Definição de padrões para avaliar a qualidade de dados.

2.4 A avaliação de dados não é padronizada

Os dados de cada organização são exclusivos e, com isso, tornam-se difíceis de conseguir valor.
Atribuir valor é útil para a compreensão da importância das atividades de gerenciamento de dados. Uma abordagem para a
avaliação dos dados é definir categorias gerais de custos e benefícios. Exemplo:
•Custo de obtenção e armazenamento.
•O custo da substituição de dados se for perdido.
•Impacto para a organização se houver dados ausentes.
•Custos potenciais de riscos.
•Custo de mitigação de risco.
•Custo de melhoria de dados.
•Benefícios de dados de maior qualidade.
2.5 Gerenciamento de dados significa gerenciar o ciclo de vida dos dados
O ciclo de vida dos dados representa processos de criação, entrega, transformação e armazenamento; permitindo que sejam reservados e
compartilhados e/ou descartados. Durante o ciclo de vida os dados podem ser limpos, transformados, mesclados, aprimorados ou
agregados. Os dados geralmente se movem horizontalmente dentro da organização; na medida em que são utilizados ou aprimorados, novos
dados são criados, de modo que seu ciclo de vida possui iterações internas. Sendo que os 'mesmos' dados podem ter requisitos de ciclo de vida
diferentes em outras partes da organização.
A complexidade se dá pelo fato de que diferentes tipos de dados têm requisitos de ciclo de vida diferentes. Por exemplo, os dados transacionais
podem ser controlados em grande parte por meio de aplicações básicas. Enquanto os Dados Mestres requerem uma curaria.
Alguns princípios se aplicam ao ciclo de vida de qualquer dado:
Dados transacionais são informações capturadas de transações. Eles registram a
Em geral, os dados capturados pelas empresas hora da transação, o local onde ocorreu, os preços dos itens comprados, a forma
se enquadram em uma destas três categorias: de pagamento empregada, os descontos, se houver, e outras quantidades e
•Dados transacionais: dados transacionais são qualidades associadas à transação.
dados gerados por vários aplicativos durante a Bancos de dados transacionais são armazenamentos de linha, o que significa que
execução ou suporte a processos de negócios os dados são armazenados no disco como linhas, em vez de colunas. Os
diários. armazenamentos de linha são úteis quando você precisa saber tudo sobre um
•Dados analíticos : dados analíticos, como o cliente na tabela de usuários, já que é possível coletar apenas os dados de que
você precisa. No entanto, eles não são tão úteis quando você está tentando contar
nome sugere, surgem por meio de cálculos ou os clientes em um CEP específico, porque é preciso carregar não apenas a coluna
análises executadas nos dados transacionais. CEP, mas também as colunas de nome, endereço e user_id.
•Dados mestres: dados mestres representam
Bancos de dados transacionais não são criados especificamente para análise, mas
os objetos de negócios reais e críticos sobre os geralmente se tornam ambientes de análise reais porque já estão em vigor como
quais essas transações são realizadas, levando bancos de dados de produção. Como eles existem há décadas, são conhecidas,
também em consideração os parâmetros nos acessíveis e onipresentes.
Se a organização não tem uma pilha de análise separada, uma das maneiras mais
quais a análise de dados é realizada.
rápidas de começar a fazer a análise é criar uma réplica do seu banco de dados
transacional. Isso garante que as consultas analíticas não impeçam acidentalmente
as consultas de produção essenciais para os negócios, além de exigirem um
mínimo de configuração adicional
2.6 Não se pode gerenciar dados sem os metadados

Os metadados incluem informações que permitem a compreensão dos dados e dos sistemas jurídicos. Os metadados descrevem os dados que uma
organização possui, o que representa, como é categorizado, sua origem, como transitam dentro da organização, como evoluem através da utilização, quem
pode utilizá-los e se são de alta qualidade.

2.8 O gerenciamento de dados requer habilidades

•Habilidades de processos de negócios para entender e planejar a criação de dados confiáveis.


•bala
•Habilidades de projeto para sistemas planejados nos quais os dados serão armazenados e utilizados.
•bala
•Habilidades técnicas para gestão de soluções de hardware e de software.
•bala
•Habilidades de análise de dados.
•bala
•Habilidades para formular modelos de dados inteligíveis.
•bala
•Pensamento estratégico para identificar oportunidades de utilização de dados.
3. Princípios de gerenciamento de dados do DAMA

O Data Management Body of Knowledge (DAMA DMBOK®) é um framework de boas práticas que constitui um conjunto de princípios e
orienta as boas práticas de gerenciamento de dados.
s princípios de gerenciamento de dados da DAMA DMBOK® fornecem uma lente para entender como sua organização gerencia os seus
dados. As implicações em mensurar a atualização do gerenciamento de dados. Um modelo de maturidade define uma progressão do controle
crescente sobre um conjunto de processos. Quando uma organização obtém uma compreensão das características do processo, pode
estabelecer um plano para melhorar suas capacidades. Também pode medir a melhoria e comparar-se com concorrentes ou parceiros, guiados
pelos níveis do modelo. Os modelos de atualização do gerenciamento de dados descrevem detalhes dos processos de gerenciamento de dados
que podem ser usados ​para esse tipo de avaliação.

3.1 Os dados têm valor


3.2 Requisitos de gerenciamento de dados são requisitos de
negócios

3.3 Gerenciamento de dados é o gerenciamento do ciclo de


vida

3.4 O gerenciamento de dados depende de múltiplas


habilidades
3.5 Maturidade em gerenciamento de dados

A avaliação da maturidade é uma abordagem para a melhoria dos processos com base em uma estrutura - Modelo de Maturidade da Capacidade - que descreve
como as características de um processo evoluem de ad hoc para o ideal.
A cada novo nível, a execução do processo se torna mais consistente, previsível e confiável. Os processos melhoram à medida que assumem as características
dos níveis. A progressão acontece em uma ordem definida. Nenhum nível pode ser suprimido. Os níveis geralmente incluem:

•Nível 0 Ausência de capacidade.


•Nível 1 inicial ou ad hoc : o sucesso depende da competência dos indivíduos.
•Nível 2 repetível: a disciplina ou processo mais básico está em operação.
•Nível 3 definido: os padrões estão definidos e são utilizados.
•Nível 4 gerenciado: os processos são quantificados e controlados.
•Nível 5 otimizado: as metas de melhoria de processos são quantificadas.

O DMMA (Data Management Maturity Assessment) pode ser usado para avaliar o
gerenciamento de dados em geral, ou para se concentrar em uma única área funcional ou de
conhecimento, ou mesmo em um único processo.
3.6 Reavaliação do grau de maturidade

A reavaliação do grau de maturidade deve ser realizada em intervalos regulares, visto que faz parte do ciclo de melhoria
contínua:
•Estabelecer uma classificação de linha de base por meio da primeira avaliação.
•Definir parâmetros de reavaliação, incluindo o escopo organizacional.
•Repetir a avaliação do DMMA conforme um planejamento.
•Acompanhar tendências em relação à linha de base inicial.
•Desenvolver recomendações com base nos resultados da reavaliação.

3.7 Ferramentas de avaliação de maturidade

Estrutura de atualização do gerenciamento de dados : A principal ferramenta usada em uma avaliação de maturidade é a
própria estrutura do DMMA.

Repositórios de gerenciamento de conhecimento e de metadados : padrões de dados, políticas, métodos, agendas, atas de
reuniões ou decisões e arquitetos servem como insumos de prática que podem ser gerenciados. A falta desses repositórios é um
indicador de menor maturidade na organização. Os repositórios de metadados podem existir em várias arquiteturas. Por
exemplo, alguns aplicativos de Business Intelligence dependem completamente dos Metadados para compilar suas
visualizações e relatórios, sem se referir a ele como um repositório distinto separado.
.9 Uso da estrutura DAMA-DMBOK

4. Ética na Gestão de Dados


Módulo 3: Gestão Inteligente de
Dados
1. Governança de dados

A governança de dados (GD) é definida como o exercício de autoridade sobre o gerenciamento de dados, promovendo a redução dos riscos associados e
orientando o uso estratégico dos dados.
As organizações que estabelecem um programa formal de governança de dados exercem autoridade e controle com maior impacto e consistência. Com
isso, são mais propensas a alavancar estrategicamente o valor de seus ativos de dados.

1.1 Governança de dados como supervisão

O objetivo do controle de dados é garantir que os dados sejam gerenciados corretamente, de acordo com políticas e práticas
recomendadas. Uma analogia comum é equiparar governança de dados às atividades de auditório. Auditores e controladores definem
como regras para o gerenciamento de investimentos financeiros. Os profissionais de governança de dados definem regras para
gerenciamento estratégico de dados
A governança de dados se concentra em como as decisões são tomadas sobre os dados e como as pessoas e os processos serão impactados.
O escopo e o objetivo de um programa de governança de dados incluem:
•Supervisão: Garantir que todas as áreas funcionais de governança de dados sigam os princípios orientadores da organização.
•bullet
•Estratégia: definir, comunicar e direcionar a execução da estratégia.
•bullet
•Política: Definir e aplicar as políticas relacionadas ao gerenciamento, acesso, uso, segurança e qualidade de dados e metadados.
•bullet
•Padrões e qualidade: definir e aplicar padrões de qualidade e arquitetura de dados.
•bullet
•Gestão: Fornecer insumos de controle e acompanhamento das áreas de qualidade e gerenciamento de dados.
•bullet
•Conformidade: garantir que a organização possa atender aos requisitos de conformidade regulamentar relacionados a dados.
•bullet
Um programa de governança de dados irá estabelecer princípios, políticas e
procedimentos para se implantar uma estrutura de governança de dados, bem como as
ações de mudanças de comportamento necessárias para o gerenciamento de dados no
decorrer do ciclo de vida dos dados.

Isso implica no gerenciamento de mudanças, bem como na


necessidade de patrocínio da alta liderança, como Chief Risk
Officer e/ou Chief Data Officer. Ambos poderão atuar como
Curadores de Dados ou Data Steward - papel fundamental para
as atividades de governança. São essas atividades que
impulsionam o processo de qualidade de dados e de
informações, permitindo fazer a gestão dos dados de forma
aderente as necessidades de negócio.
1.2 Direcionadores (Drivers) de Negócios

Embora a conformidade e/ou análise de dados possam impulsionar a implementação de governança, as organizações
avaliam a governança de dados apenas do ponto de vista de um programa de gerenciamento de informações direcionado
por outras necessidades de negócios, como o Master Data Management (MDM).

A governança de dados deve estar alinhada à estratégia de negócio. Os direcionadores (drivers) para governança de dados
geralmente se concentram em:

•Reduzir riscos, como os relacionados à conformidade, a segurança e a privacidade dos dados.


•Melhorar processos, capacidade instalada de cumprir com a regulamentação, gerenciar serviços e operar com eficiência.

O Cadastro Base do Cidadão - CBC visa unificar e melhorar as informações sobre o cidadão dentro do governo. Tem como base os cadastros hoje
existentes nas bases do governo, principalmente no Cadastro de Pessoa Física mantido pela Secretaria de Receita Federal. O CBC não irá substituir nem
eliminar os cadastros existentes, mas alinhar suas informações.

Gestão do CBC
O Comitê Central de Governança de Dados é o colegiado responsável pela gestão do Cadastro Base do Cidadão, por disposição do mesmo decreto
1.3 - Características do Programa de Controle de Dados

A governança de dados fornece os princípios, políticas, processos e indicadores necessários para orientar as atividades de
gerenciamento de dados.

A governança de dados pode ser entendida em termos de uma estrutura política:


•Funções legislativas (Legislative-like functions): definição de políticas, padrões e arquitetura de dados corporativos.
•Funções judiciais (Judicial-like functions): gerenciamento e escalonamento de problemas.
•Funções executivas (Executive functions): proteger e servir, responsabilidades administrativas.

1.4 Modelos de Governança de Dados

Alguns modelos são organizados de forma centralizada, enquanto outros são distribuídos. Todos os modelos
precisam de um certo grau de flexibilidade
A governança de dados pode ser estruturada em camadas e conduzida por comitês, com certo grau de supervisão.

No nível estratégico, diversas organizações têm um Comitê Gestor de Governança


de Dados. Esse Comitê tem caráter diretivo/deliberativo e monitora a aplicação da
política de GD e atua também como Fórum para discussão para dirimir questões
sobre gestão de dados e atua na criação de subcomitês para analisar e avaliar
soluções.

vários programas e vários projetos são implementados por meio de equipes de


projeto de gerenciamento de dados.
1.5 Gerenciamento de dados

O Data Stewards tem a função de gerenciar ativos de dados em nome de terceiros, conforme interesse da organização.

Os Data Stewards representam os interesses das partes interessadas e devem adotar uma perspectiva corporativa e
responsável para garantir que os dados corporativos sejam submetidos aos processos de qualidade de dados.
possam ser utilizados com eficiência e seguindo as normas de segurança. Os Data Stewards são responsáveis pelas
atividades de governança de dados.

•Criação e gerenciamento de metadados: padronização, definição e gerenciamento de terminologia de negócios, valores de dados válidos e outros metadados
críticos.
•bullet
•Regras e padrões de documentação: definição/documentação de regras de negócios, padrões e regras de qualidade de dados. As expectativas usadas para
definir dados de alta qualidade são frequentemente formuladas em termos de regras fundamentadas nos processos de negócios que criam ou consomem dados.
•bullet
•Gerenciamento de problemas de qualidade de dados: Os organizadores geralmente estão envolvidos na identificação, priorização e resolução de problemas
relacionados a dados ou na facilitação do processo de resolução.
•bullet
•Execução de atividades operacionais de governança de dados: Responsáveis por garantir que as políticas e iniciativas de governança de dados sejam
cumpridas. Influenciam as decisões para garantir que os dados sejam gerenciados de maneira a apoiar os objetivos da organização
1.6 Iniciando o Controle de Dados

As avaliações iniciais permitiram avaliar:

•A maturidade dos processos de gerenciamento de dados: como a organização utiliza o potencial humano, processos e tecnologia para gerenciar seus dados. Essa
avaliação pode ajudar a determinar os níveis de gestão, os padrões existentes e a identificar oportunidades de melhoria.
•bullet
•A capacidade de mudança: possíveis obstáculos e ações de superação para adoção de ações para gerar comportamentos para implementação de uma governança de
dados bem-sucedida.
•bullet
•A capacidade colaborativa: capacidade da organização de colaborar entre funções para administrar e tomar decisões holísticas e consistentes sobre dados.
•bullet
•O alinhamento estratégico: avaliar se a organização possui seus objetivos de gerenciamento de dados alinhados com a estratégia de negócio.
•bullet
•A qualidade dos dados: identificar se os dados críticos e pontos problemáticos sobre riscos associados aos dados e aos processos de negócio.
•bullet
•A conformidade regulatória: a relação dos riscos com os requisitos de conformidade e como são gerenciados. Identificar controles e monitoramento que possam
melhorar a capacidade da organização de cumprir com os regulamentos.
As avaliações de maturidade, qualidade dos dados e conformidade devem identificar pontos de melhoria e orientar uma
estratégia que defina o escopo e a abordagem dos esforços de governança de dados em relação aos objetivos de negócio. A
estratégia deve ser definida por meio de:

•Um instrumento formal que estabeleça metas e princípios.


•Uma matriz de responsabilidades.
•Um plano de implementação estratégico e operacional que descreva:
•O objetivo das atividades de governança de dados e como elas serão incorporadas nos processos de TI.
•O conjunto de iniciativas para melhorar os recursos de gerenciamento e da qualidade dos dados.
•Os benefícios esperados.
•A definição dos indicadores que demonstre os resultados esperados.

Depois que a estratégia é definida, segue-se:

•A definição das políticas.


•A subscrição dos projetos de melhoria de dados.
•O gerenciamento de mudanças para impulsionar a adoção dos comportamentos
desejáveis.
•O gerenciamento de problemas e conflitos que podem surgir durante o processo
de implementação.
2. Planejamento e design no gerenciamento do ciclo de vida dos dados

As atividades de gerenciamento do ciclo de vida dos dados se concentram no planejamento e design de dados, permitindo o uso, a manutenção
para atender às metas organizacionais. Arquitetos de dados e modeladores de dados são os que planejam e projetam dados.
Este tópico descreverá:
•O papel da arquitetura corporativa no planejamento e design da organização
•A função crítica da arquitetura de dados no gerenciamento de dados
•Os objetivos e artefatos associados à modelagem de dados

2.1 Arquitetura de Negócio

Arquitetura refere-se a um arranjo organizado de elementos destinados a otimizar a função, o desempenho, a viabilidade, o
custo e a estética de uma estrutura ou sistema geral. O termo arquitetura foi adotado para descrever várias facetas do design de
sistemas de informação.
Artefatos arquitetônicos e documentação que descrevem sistemas e fluxos de dados mostram às pessoas como sistemas,
processos e dados funcionam juntos. Uma abordagem estratégica da arquitetura permite que uma organização tome melhores
decisões sobre seus sistemas e dados.
2.2 O Quadro Zachman
A estrutura de arquitetura corporativa mais conhecida, o Zachman Framework, foi desenvolvida por John A. Zachman na década de 1980. Continuou a evoluir. Zachman
reconheceu que, ao criar edifícios, aviões, empresas, cadeias de valor, projetos ou sistemas, existem muitas partes interessadas e cada uma tem uma perspectiva diferente sobre
arquitetura. Ele aplicou esse conceito aos requisitos para diferentes tipos e níveis de arquitetura em uma organização.

•executiva (contexto de negócios): Lista os elementos de negócios que definem o escopo nos modelos
de identificação.
•de gerenciamento de negócios (conceitos de negócios): Esclarecimento das relações entre os
conceitos de negócios definidos pelos líderes executivos como proprietários nos modelos de definição.
•do arquiteto (lógica de negócios): Modelos lógicos do sistema detalhando os requisitos do sistema e o
design sem restrições representados pelos arquitetos como designers nos modelos de representação.
•do engenheiro (física dos negócios): Modelos físicos otimizando o design para implementação para
uso específico sob as restrições de tecnologia, pessoas, custos e prazos específicos especificados pelos
engenheiros como construtores nos modelos de especificação.
•do técnico (montagens de componentes): Uma visão fora de contexto, específica da tecnologia, de
como os componentes são montados e operados, configurados pelos técnicos como implementadores nos
modelos de configuração.
•do usuário (classes de operações): Instâncias de funcionamento reais usadas por Trabalhadores como
Participantes. Não há modelos nessa perspectiva.
2.3 Arquitetura de Dados

A arquitetura de dados é fundamental para o gerenciamento de dados. Como a maioria das organizações possui mais dados do que as
pessoas podem compreender, é necessário representar dados organizacionais em diferentes níveis de abstração para que a alta
Administração possa analisá-los e tomar decisões sobre eles.

A disciplina especializada da arquitetura de dados pode ser entendida sob alguns pontos de vista, apresentados a seguir:
•Resultados da arquitetura de dados, tais como modelos, definições e fluxos de dados em vários níveis (geralmente referidos como artefatos da
arquitetura de dados).
•Atividades de arquitetura de dados para formar, implantar e cumprir intenções de arquitetura de dados.
•Comportamento da arquitetura de dados, assim como colaboração e habilidades entre as várias funções que afetam a arquitetura de dados da
organização.
O documento de design da arquitetura de dados mais detalhado é um modelo formal de dados corporativos, contendo nomes de dados, definições
abrangentes de dados e metadados, entidades e relacionamentos conceituais e lógicos e regras de negócios. Modelos de dados físicos estão
incluídos, mas como um produto de modelagem e design de dados ao invés de uma arquitetura de dados.
A arquitetura de dados agrega mais valor quando suporta as necessidades de gestão de dados de toda a organização. A arquitetura de dados
corporativos define termos e designs padrão para os elementos importantes para toda a organização.
O design de uma arquitetura de dados corporativos inclui a representação dos dados de negócio como tais, englobando a coleta, armazenamento,
integração, movimentação e distribuição de dados. A arquitetura de dados corporativos permite padronização e integração consistentes de dados em
toda a organização.
A arquitetura de dados servirá como uma ponte entre a estratégia de negócios e a execução da tecnologia. Vale alertar que como parte da arquitetura
corporativa os arquitetos de dados devem:
•Preparar estrategicamente as organizações para evoluir rapidamente seus produtos, serviços e dados para aproveitar as oportunidades de negócios
inerentes às tecnologias emergentes.
•Traduzir necessidades de negócios em requisitos de dados e de sistema, para que os processos tenham consistentemente os dados necessários.
•Gerenciar entrega complexa de dados e informações em toda a organização.
•Facilitar o alinhamento entre negócios e TI.
•Agir como agentes de mudança e transformação.
2.4 Artefatos de arquitetura de dados

À medida que os dados fluem dentro de uma organização, por meio de feeds ou interfaces, eles são protegidos, integrados,
armazenados, registrados, catalogados, compartilhados, relatados, analisados e entregues às partes interessadas.
Ao longo do caminho, os dados podem ser verificados, aprimorados, vinculados, certificados, agregados, anonimizados e usados para
análises até serem arquivados ou eliminados. As descrições da arquitetura de dados corporativos devem, portanto, incluir modelos de
dados corporativos (por exemplo, estruturas e especificações de dados), bem como projetos de fluxo de dados.
Os arquitetos de dados criam e mantêm o conhecimento organizacional sobre os dados e os sistemas pelos quais eles se movem. Esse
conhecimento permite que uma organização gerencie seus dados como um ativo e aumente o valor que obtém de seus dados,
identificando oportunidades para uso de dados, redução de custos e mitigação de riscos.
Os arquitetos buscam projetar de maneira a agregar valor à organização. Esse valor é obtido por meio de presença técnica ideal,
eficiências operacionais e de projetos e maior capacidade da organização de usar seus dados. Para chegar lá, são necessários: bom
design, planejamento e capacidade de garantir que os projetos e planos sejam executados de maneira eficaz.
Nesse sentido, serão apresentados, a seguir, alguns artefatos da arquitetura de dados.
Modelo de Dados Corporativos (Enterprise Data Model - EDM)

O Enterprise Data Model - EDM é um


modelo de dados conceitual ou lógico
holístico, que independente da
implementação, fornece uma visão comum e
consistente dos dados da organização.
Os EDMs podem ser criados em diferentes
níveis de detalhes, portanto, a
disponibilidade de recursos influenciará o
escopo inicial. Com o tempo, conforme as
necessidades da organização exigem, o
escopo e o nível de detalhes capturados em
um modelo de dados corporativos
geralmente se expandem. Os modelos de
dados corporativos mais bem-sucedidos são
criados de forma incremental e iterativa,
usando camadas.
Design de Fluxo de Dados

O design do fluxo de dados define os requisitos e o plano mestre para armazenamento e processamento em bancos de dados, aplicações, plataformas e redes (os componentes). Esses fluxos
de dados mapeiam a movimentação de dados para processos, locais, funções de negócios e componentes técnicos.
Os fluxos de dados são um tipo de documentação de linhagem de dados que descreve como os dados transitam pelos processos e sistemas de negócios.
Os fluxos de dados de ponta a ponta ilustram onde os dados se originaram, onde são armazenados e usados e como são transformados à medida que se movem dentro e entre diversos
processos e sistemas.
A análise de linhagem de dados pode ajudar a explicar o estado dos dados em um determinado ponto no fluxo.
Ressalta-se que os fluxos de dados mapeiam e documentam os relacionamentos entre:
•plicações em um processo de negócios.
•bullet
•Armazenamentos de dados ou bancos de dados em um ambiente.
•bullet
•Segmentos de rede (úteis para mapeamento de segurança).
•bullet
•Funções de negócio, representando quais funções são responsáveis por criar, atualizar, usar e excluir dados (CRUD – Acrônimo de Create, Read, Update e Delete, na língua inglesa).
•bullet
•Locais onde ocorrem as diferenças

Os fluxos de dados podem ser documentados em diferentes níveis de detalhe: área de assunto, entidade ou mesmo no nível do atributo. Os sistemas podem ser representados por segmentos
de rede, plataformas, conjuntos de aplicações comuns ou servidores individuais.
Os fluxos de dados podem ser representados por matrizes bidimensionais e diagrama de fluxo de dados:
•.
•Matrizes Bidimensionais
•Diagramas de Fluxo de Dados (DFD)

O Modelo de Dados Corporativos e o Design do Fluxo de


Dados precisam estar bem alinhados. Como mencionado,
ambos precisam refletir o estado atual em relação à
perspectiva da arquitetura de dados e também o estado de
transição em relação à perspectiva do projeto.
Arquitetura, Qualidade e Inovação de Gerenciamento de Dados

Os dados e a arquitetura corporativa lidam com a complexidade de dois indicadores, que pedem abordagens distintas, conforme apresentado na tabela a
seguir.
2.5 Modelagem de dados

A modelagem de dados é o processo de descoberta, análise e escopo de requisitos de dados e, em seguida, representação e comunicação desses
requisitos de dados de uma forma precisa chamada modelo de dados. A modelagem de dados é um componente crítico do gerenciamento de dados.
O processo de modelagem exige que as organizações descubram e documentem como seus dados se encaixam. Modelos de dados permitem que
uma organização entenda seus ativos de dados.
Os modelos de dados incluem e contêm metadados essenciais para os consumidores de dados. Boa parte desses metadados descobertos durante o
processo de modelagem é essencial para outras funções de gerenciamento de dados, como, por exemplo, definições para controle de dados e
linhagem para armazenamento e análise de dados.
Um modelo de dados descreve os dados de uma organização como a organização os entende ou como a organização deseja que sejam. Um modelo
de dados contém um conjunto de símbolos com rótulos de texto que tentam representar visualmente os requisitos de dados comunicados ao
modelador de dados, para um conjunto específico de dados que pode variar em tamanho, de pequeno (para um projeto) a grande (para uma
organização).
O modelo é, portanto, uma forma de documentação para requisitos e definições de dados resultantes do processo de modelagem. Os modelos de
dados são o principal meio usado para comunicar os requisitos de dados da organização para a TI e, dentro da TI, de analistas e arquitetos, para
designers e desenvolvedores de bancos de dados.
Atenção, os modelos de dados são críticos para o gerenciamento eficaz dos dados, pois:
•Fornecem um vocabulário comum sobre dados.
•bullet
•Capturam e documentam o conhecimento explícito (metadados) sobre os dados e sistemas de uma organização.
•bullet
•Servem como principal ferramenta de comunicação durante os projetos.
•bullet
•Fornecem o ponto de partida para personalização, integração ou mesmo substituição de uma aplicação.
Modelagem Conceitual
O objetivo aqui é criar um modelo de forma gráfica, sendo este chamado de Diagrama Entidade e Relacionamento (DER), que identificará todas as entidades e relacionamentos de uma forma
global.
Aqui é evitado qualquer detalhamento específico do modelo de BD.
Sua principal finalidade é capturar os requisitos de informação e regras de negócio sob o ponto de vista do negócio.
No desenvolvimento de soluções é o primeiro modelo que deve ser desenvolvido.
Na fase de levantamento de requisitos.
Feito geralmente pelo Gestor de Dados de Negócio ou outro profissional acompanhado de sua supervisão/orientação.
É independente de hardware ou software, ou seja, não depende de nenhum tipo de servidor de banco de dados [Sql Server, My Sql, Oracle, Postgresql, etc].
Por tanto, qualquer alteração no software ou hardware, não terão efeito no nível conceitual.
Modelagem lógica
A modelagem lógica é necessária para compilar os requisitos de negócio e representar os requisitos como um modelo.
Está principalmente associada à coleta de necessidades de negócios, e não ao design do banco de dados.
As informações que precisam ser coletadas são sobre unidades organizacionais, entidades de negócios e processos de negócios.
Descreve como os dados serão armazenados no banco e também seus relacionamentos.
Esse modelo adota alguma tecnologia, pode ser: relacional, orientado a objetos, orientado a colunas, entre outros.
Os modelos lógicos basicamente determinam se todos os requisitos do negócio foram reunidos.
Ele é revisado pelos desenvolvedores, pelo gerenciamento e, por fim, pelos usuários finais para ver se é necessário coletar mais informações antes do início da modelagem física.
O DER lógico também modela as informações coletadas dos requisitos de negócios.
É mais complexo do que o modelo conceitual em que os tipos de coluna são definidos.
Observe que a configuração dos tipos de coluna é opcional e, se você fizer isso, deverá fazer isso para auxiliar na análise de negócios.
Não tem nada a ver com a criação de banco de dados ainda.

Modelagem física
A modelagem física lida com o design do banco de dados real com base nos requisitos reunidos durante a modelagem lógica do banco de dados.
Todas as informações coletadas são convertidas em modelos relacionais e modelos de negócios.
Durante a modelagem física, os objetos são definidos em um nível denominado nível de esquema.
Um esquema é considerado um grupo de objetos que estão relacionados entre si em um banco de dados.
Tabelas e colunas são feitas de acordo com as informações fornecidas durante a modelagem lógica.
Chaves primárias, chaves exclusivas e chaves estrangeiras são definidas para fornecer restrições.
Índices são definidos.
A modelagem física depende do software que já está sendo usado na organização.
É específica ao software. [Sql Server, Oracle, MySql, Postgresql, etc]
1.Entre os componentes de um modelo conceitual, podemos relacionar:
•Entidades;
•Atributos;
•Relacionamentos; Comparativo de diversas formas
2.Modelagem lógica é principalmente para a coleta de informações sobre as de representar um Modelo
necessidades de negócios e não envolve projetar um banco de dados. Conceitual
Enquanto que a modelagem física é principalmente necessária para o projeto real
do banco de dados.
3.Modelagem lógica não inclui índices e constraints.
O modelo lógico para um aplicativo pode ser usado em vários banco de dados [Sql
Server, MySql, Oracle, Postgresql, etc].
Na modelagem lógica pode haver chaves primárias e estrangeiras, qnquanto que a
modelagem física é específica de software e hardware e possui índices e
constraints.
4.Modelagem lógica inclui; ERD, diagramas de processos de negócios e
documentação de feedback do usuário; considerando que a modelagem física
inclui; diagrama de modelo de servidor, documentação de design de banco de
dados e documentação de feedback do usuário.
O que se considera é que o modelo conceitual é para
mostrar O QUE fazer. Fazendo uma analogia com
programação, seria a forma declarativa.
O modelo lógico seria o COMO fazer. O problema é
que ainda se faz de forma declarativa, então não é
como na programação que seria a forma imperativa, só
muda um pouco o detalhamento.

https://www.devmedia.com.br/
modelagem-de-dados-tutorial/20398
https://pt.stackoverflow.com/questions/
294699/qual-a-diferen%C3%A7a-entre-
modelagem-conceitual-l%C3%B3gica-e-f
%C3%ADsica
Um modelo físico pode ser constituído de código SQL para criação de objetos
no banco
CREATE TABLE turma (
idturma INTEGER(4) NOT NULL AUTO_INCREMENT,
capacidade INTEGER(2) NOT NULL,
idProfessor INTEGER(4) NOT NULL,
PRIMARY KEY (idturma),
FOREIGN KEY (idProfessor) REFERENCES professor(idProfessor),
UNIQUE KEY idturma (idturma)
)
CREATE TABLE professor (
idProfessor INTEGER(4) NOT NULL AUTO_INCREMENT,
telefone INTEGER(10) NOT NULL,
nome CHAR(80) COLLATE NOT NULL DEFAULT ‘’,
PRIMARY KEY (idProfessor),
FOREIGN KEY(idTurma)
REFERENCES turma(idturma),
UNIQUE KEY idProfessor (idProfessor)

)
Objetivos de modelagem de dados
O objetivo da modelagem de dados é confirmar e documentar o entendimento de diferentes perspectivas sobre os dados. Esse entendimento leva a
aplicações e dados que se alinham mais com os requisitos de negócios atuais e futuros. Esse entendimento também cria uma base para concluir com
êxito iniciativas de escopo amplo, como Master Data Management e programas de governança de dados.
Da mesma maneira que o cartógrafo aprendeu e documentou um cenário geográfico para outros usarem na navegação, o modelador permite que
outros entendam um cenário de informações.

Blocos de construção

Existem diferentes variedades de modelos de dados, incluindo relacionais, dimensionais etc. Os profissionais de design utilizam tipos apropriados de
modelos com base nas necessidades da organização, nos dados que estão sendo modelados e no sistema para o qual o modelo está sendo
desenvolvido. Cada espécie de modelo utiliza convenções visuais diferentes para capturar informações.
Os modelos também diferem com base no nível de abstração das informações que representam (conceitual com um alto nível de abstração; lógico
com um nível médio de abstração; e físico que representa um sistema específico ou instanciação de dados). Entretanto, todos os modelos usam os
mesmos blocos de construção: entidades, relacionamentos, atributos e domínios.
Entidade
Fora da modelagem de dados, a definição de entidade é algo que existe separado de outras coisas. Na modelagem de dados, uma entidade é algo sobre o
qual uma organização coleta informações. Às vezes, as entidades são chamadas de 'substantivos de uma organização. Nos modelos de dados relacionais, as
entidades são as caixas que identificam o conceito que está sendo modelado.
Uma entidade pode ser pensada como a resposta a esses questionamentos: Quem? O que? Quando? Onde? Por quê? Como? Pode também ser definida por
uma combinação dessas perguntas.

Relação
Um relacionamento é uma associação entre entidades. Ele captura as interações de alto nível entre entidades conceituais, as interações detalhadas entre
entidades lógicas e as restrições entre entidades físicas. Os relacionamentos são mostrados como linhas no diagrama de modelagem de dados.
Em uma relação entre duas entidades, a cardinalidade captura quantas de uma entidade (instâncias de entidade) participam do relacionamento com quantas da
outra entidade. Por exemplo, uma organização pode ter um ou vários funcionários.
Cardinalidade

A cardinalidade é representada pelos símbolos que aparecem nas duas extremidades de uma linha de relacionamento. Para cardinalidade, as opções são
simples: zero, um ou muitos ("muitos" referentes a qualquer número maior que um). Cada lado de um relacionamento pode ter qualquer combinação de
zero, um ou muitos.
O diagrama abaixo apresenta diferentes relações de cardinalidade. Uma organização emprega um ou mais funcionários. Um funcionário pode suportar
zero, um ou muitos dependentes. Mas um Funcionário tem um e apenas um Trabalho durante um período de tempo.
Os relacionamentos de cardinalidade são uma maneira de capturar regras e expectativas relacionadas aos dados. Se os dados mostrarem que um
Funcionário mantém mais de um Trabalho durante um período de tempo definido, há um erro nos dados ou a organização está violando uma regra.

Atributo

Um atributo é uma propriedade que identifica, descreve ou


mede uma entidade. O correspondente físico de um atributo em
uma entidade é uma coluna, campo, tag ou nó em uma tabela,
visualização, documento, gráfico ou arquivo.
No exemplo abaixo, a entidade Organization possui os
atributos de ID fiscal da organização, Número de telefone da
organização e Nome da organização. O funcionário possui os
atributos: Número do funcionário, Nome do funcionário,
Sobrenome do funcionário e Data de nascimento do
funcionário. Os detalhes Dependente e Trabalho têm atributos
que descrevem suas características.
Domínio
Na modelagem de dados, um domínio é o conjunto completo de valores possíveis aos quais um atributo pode ser atribuído. Um domínio fornece um
meio de padronizar as características dos atributos e restringe os dados que podem ser preenchidos no campo.
Por exemplo, o domínio Data, que contém todas as datas válidas possíveis, pode ser atribuído a qualquer atributo de data em um modelo de dados
lógico ou a colunas/campos de data em um modelo de dados físico, como:
• EmployeeHireDate
• OrderEntryDate
• ClaimSubmitDate
• CourseStartDate

Os domínios são críticos para entender a qualidade dos dados. Todos os valores dentro do domínio são válidos. Aqueles fora do domínio são
chamados de valores inválidos. Um atributo não deve conter valores fora do domínio atribuído. O domínio para EmployeeHireDate pode ser
definido simplesmente como datas válidas. Sob essa regra, o domínio para EmployeeHireDate não inclui 30 de fevereiro de qualquer ano.
Modelagem e gerenciamento de dados
A Modelagem de Dados é um processo de descoberta e documentação de informações críticas para o entendimento de uma organização por meio de seus
dados. Os modelos capturam e permitem o uso do conhecimento dentro de uma organização (ou seja, são uma forma crítica e uma fonte de metadados). Eles
podem até ser usados para melhorar a qualidade dessas informações, por meio da aplicação de convenções de nomenclatura e outros padrões que tornam as
informações mais consistentes e confiáveis.
Os analistas e designers de dados atuam como intermediários entre os consumidores de informações (as pessoas com requisitos de negócios para dados) e os
produtores de dados que capturam os dados de forma utilizável. Os profissionais de dados devem equilibrar os requisitos de dados dos consumidores de
informações e os requisitos de aplicação dos produtores de dados
3. Habilitando e mantendo dados

Compete a área de arquitetura e modelagem de dados fornecer informações sobre a melhor forma de configurar as aplicações que disponibilizam
dados utilizáveis, acessíveis e atualizados para atendimento aos objetivos estratégicos da organização.

3.1 Armazenamento e operações de dados

O processo de armazenamento e operação de dados representa o gerenciamento tradicional de dados. Esse ofício é geralmente realizado pelos
administradores de banco de dados (Data Base Administrators - DBAs) e pelos Administradores de Armazenamento em Rede (Network Storage
Administrators - NSAs), responsáveis por manter o conjunto de dados acessíveis e com a integridade necessária. O trabalho de armazenamento e
operações de dados é essencial para as organizações que dependem de dados para realizar diversos tipos de transações.

A administração do banco de dados é vista como uma função monolítica onde os DBAs desempenham papéis diferentes. Podem suportar ambientes de
produção, trabalho de desenvolvimento e procedimentos específicos. O trabalho do DBA é influenciado pelo modelo de Arquitetura de Dados, bem
como pela maneira como os próprios bancos de dados são organizados (hierárquicos, relacional, etc.). Com o surgimento de novas tecnologias, os
DBAs e NSAs são responsáveis por criar e gerenciar ambientes virtuais (computação em nuvem). Como os ambientes de armazenamento de dados são
bastante complexos, os DBAs procuram maneiras de reduzir ou pelo menos gerenciar a complexidade por meio da automação, reutilização e aplicação
de padrões e boas práticas reconhecidas.
3.2 Integração e interoperabilidade de dados

Enquanto as atividades de armazenamento e operações de dados se concentram nos ambientes para armazenamento e manutenção, as atividades de
integração e interoperabilidade de dados (DII) contemplam os processos para consolidar dados dentro e entre repositórios e aplicações. A integração
trata dos aspectos físicos ou virtuais. Enquanto a Interoperabilidade consiste na capacidade de vários sistemas se comunicarem e interoperar dados de
forma eficiente e segura.
O design das soluções DII deve considerar:
• Coleta de dados modificados: como garantir que os dados sejam atualizados corretamente.
• Latência: a quantidade de tempo entre quando os dados são coletados ou criados até quando são disponibilizados para consumo.
• Replicação: como garantir o desempenho esperado nos processos de compartilhamento de dados.
• Orquestração: como diferentes processos são organizados e executados para preservar a consistência e a continuidade dos dados.

Devido à sua complexidade, o DII depende de outras áreas do gerenciamento de dados para auxiliar na redução de riscos e aumento da eficiência:
•Governança de dados: para definir e governar as regras e políticas de transformação de dados e estruturas.
•Arquitetura de dados: para projetar soluções.
•Segurança de dados: para garantir que as soluções de segurança sejam eficientes nas diversas aplicações de transações de dados entre as
organizações.
•Metadados: para manter e disponibilizar o inventário de dados (persistente, virtual e em transição), o significado estratégico dos dados, as regras
para transformá-los, seu histórico e linhagem.
•Armazenamento e operações de dados: para gerenciar as diversas instancias física das soluções.
•Modelagem e Design de Dados: para projetar estruturas de dados, incluindo persistência física em bancos de dados, estruturas de dados virtuais e
tráfego de informações entre aplicações.
A integração e a interoperabilidade de dados são essenciais para o Data Warehousing & Business Intelligence, bem como para o gerenciamento de
dados de referência ou de dados mestre, visto que esses dois processos geram transformação e integração de dados de múltiplas origens para hubs
de dados consolidados.
A integração e interoperabilidade de dados é ponto central para o gerenciamento de aplicações Big Data. O Big Data procura integrar diversos tipos
de dados, incluindo dados estruturados e dados não estruturados (documentos, arquivos de áudio, vídeo e streaming); que após integrados e tratados
podem ser utilizados para desenvolver modelos preditivos e gerar insumos para implantação de atividades de inteligência artificial.

3.3 Armazenamento de Dados


Os data warehouses (DW) – ou armazém de dados – permitem que as organizações integrem dados de diferentes aplicações em um modelo de dados
comum, a fim de suportar funções operacionais, requisitos de conformidade e atividades de Business Intelligence (BI)
No entanto, o conceito de data warehouses consiste em várias partes pelas quais os dados são transitados. A estrutura e o formato dos dados podem
ser alterados, para que possam ser reunidos em tabelas comuns, a partir das quais podem ser acessados. Pode ser usado diretamente para relatórios ou
como entrada para aplicações downstream.
A construção de um DW requer conhecimentos de gerenciamento de dados nos processos de operação, integração, de governança de dados. Além
disso, é necessário conhecimentos de gerenciamento de processos que permitam que os dados sejam compartilhados com qualidade, de forma segura
e utilizável (via metadados confiáveis).
A abordagem adotada no processo de construção de DW dependerá de seus objetivos estratégicos e da arquitetura dos dados. Os DWs compartilham
características comuns:
•Armazenam dados de outros sistemas e os tornam acessíveis e utilizáveis para análise.
•O ato de armazenamento inclui organizar os dados de maneira a agregar valor. Em muitos casos, isso significa que os armazéns efetivamente criam
novos dados que não estão disponíveis em outros lugares.
•As organizações implantam DWs em razão da necessidade de disponibilizar dados confiáveis e integrados para as partes interessadas autorizadas.
•Os dados armazenados são utilizados para propósitos distintos, principalmente para análise preditiva.
Data Marts (DM) são repositórios segmentados de dados que contém conjuntos de dados
sobre um único tema. Geralmente, são armazenados dentro de Data Warehouses (DW).
data warehouse como "uma cópia dos dados de transação
estruturados especificamente para consulta e análise". A
imagem abaixo ilustra a abordagem de Kimball, que exige um
modelo dimensional.

As organizações estão construindo DWs de


segunda e terceira geração ou adotando Data
Lakes (lagos de dados) para disponibilizar mais
dados a uma velocidade mais elevada, criando
a oportunidade de aprimorar as análises
preditivas.
3.4 Gerenciamento de Dados de referência

Diferentes tipos de dados desempenham diferentes funções dentro de uma organização e têm diferentes requisitos de gerenciamento de dados. Dados
de referência (por exemplo, tabelas de código e descrição) são dados usados apenas para caracterizar outros dados em uma organização ou apenas
para relacionar dados em um banco de dados a informações além dos limites da organização.
Os dados de referência fornecem um contexto crítico para a criação e uso de dados mestre e transacionais. Permite que outros dados sejam
compreendidos de maneira significativa. Ter várias instâncias dos mesmos Dados de Referência é ineficiente e inevitavelmente resulta em
inconsistência. A inconsistência gera ambiguidades, a qual produz riscos.
A propriedade e a responsabilidade pelos Dados de Referência são um desafio para as organizações. Alguns dados de referência se originam fora da
organização, outros podem ser gerados e mantidos internamente. Determinar a responsabilidade pela gestão dos dados de referência faz parte do
gerenciamento. Sendo que a falta dessa responsabilização gera riscos, pois as inconsistências nos Dados de referência podem causar prejuízos
irreparáveis no contexto da gestão de dados.
O gerenciamento de dados de referência requer planejamento e design. A arquitetura e os modelos de dados de referência devem considerar que os
dados de referência serão armazenados, mantidos e compartilhados. Com isso, há necessidade de estabelecer políticas de segurança mais rígidas.
3.5 Gerenciamento de Dados Mestre
Gerenciamento de Dados Mestres (Master Data Management - MDM) é uma estrutura de processos e tecnologias destinadas a criar e manter um ambiente
de dados autorizado, confiável e sustentável, preciso e seguro que representa uma versão única da verdade, um sistema de registro aceito usado tanto intra -
e entre organizações em um conjunto diversificado de sistemas e aplicações, estratégias de negócio e comunidades de usuários.

O planejamento para o gerenciamento de dados mestre inclui várias etapas:


•Identificar fontes de dados elegíveis e que atendam aos requisitos que justificam sua escolha como Dados Mestres.
•Elaborar políticas e regras específicas.
•Estabelecer regras para identificar e tratar dados redundantes.
•Estabelecer regras para compartilhamento de dados confiáveis, sustentáveis, precisos e seguros.

O MDM é um processo de gerenciamento do ciclo de vida dos dados. Não deve ser gerenciado apenas pelo sistema MDM, mas compartilhado para uso em
outras aplicações. Isso requer tecnologia que permita compartilhamento e feedback. Todo esse processo deve estar alinhado à políticas específicas para
MDM, de forma que as regras sejam internalizadas nos processos de negócio para uso de dados oriundos de um processo de qualidade de dados com a
finalidade de evitar inconsistências.
Os Dados Mestres gerenciados de forma eficiente, ampliam a eficiência organizacional e reduzem os riscos associados a inconsistências na estrutura de
dados entre sistemas e processos.
3.6 Gerenciamento de documentos e conteúdo

Documentos, registros e conteúdo (por exemplo, as informações armazenadas nos sites da Internet e da intranet) compreendem uma forma de dados
com requisitos de gerenciamento distintos. O Gerenciamento de documentos e conteúdo envolve controlar a coleta, armazenamento, o acesso e uso de
dados e informações compartilhados ou não. Dados não estruturados requer um tratamento que garanta sua confiabilidade e qualidade. Para isso é
necessária uma estrutura de governança, arquitetura confiável e metadados bem gerenciados.
O gerenciamento de documentos e de conteúdo se concentram em manter a integridade e permitir o acesso a documentos e outras informações não
estruturadas ou semiestruturadas. No entanto, também possui direcionadores estratégicos. Os principais fatores de negócios para gerenciamento de
documentos e conteúdo incluem conformidade regulamentar, capacidade de responder a solicitações de litígio e descoberta eletrônica e requisitos de
continuidade de negócios.

O gerenciamento de documentos é o termo usado para descrever armazenamento, inventário e controle de documentos eletrônicos ou em meio físico.
Abrange as técnicas e tecnologias para controlar e organizar documentos ao longo de seu ciclo de vida.

O Gerenciamento de Registros é uma forma especializada de gerenciamento de documentos que se concentra nos registros - documentos que fornecem
evidências das atividades de uma organização. Essas atividades podem ser eventos, transações, contratos, correspondência, políticas, decisões,
procedimentos, operações, arquivos de pessoal, etc. Os registros podem ser documentos físicos, arquivos e mensagens eletrônicas ou conjunto de
dados.

O Gerenciamento de conteúdo refere-se aos processos, técnicas e tecnologias para organizar, categorizar e estruturar recursos de informações para que
possam ser armazenados, publicados e reutilizados de várias maneiras. O conteúdo pode ser volátil ou estático (documentos e outros ativos digitais,
como vídeos, fotografias, etc.). Pode ser gerenciado formalmente (estritamente armazenado, gerenciado, auditado, retido ou descartado) ou
informalmente por meio de atualizações ad hoc. O gerenciamento de conteúdo é particularmente importante em sites e portais, mas as técnicas de
indexação com base em palavras-chave e organização com base em taxonomias podem ser aplicadas em plataformas tecnológicas.
O gerenciamento eficiente de documentos, registros e outras formas de conteúdo compartilhado requer:

•Planejamento, incluindo a criação de políticas para diferentes tipos de acesso e manipulação.


•Definição da arquitetura da informação e dos metadados necessários para suportar uma estratégia de conteúdo.
•Permissão do gerenciamento de terminologia, incluindo ontologias e taxonomias necessárias para organizar, armazenar e recuperar várias formas
de conteúdo.
•Adoção de tecnologias que permitem o gerenciamento do ciclo de vida do conteúdo, desde a criação ou captura de conteúdo até a versão e
garantido a segurança do conteúdo.

Atingir esses objetivos necessita de sistemas de gerenciamento de conteúdo (Content Management Systems - CMS), além de ferramentas para criar
e gerenciar os metadados que suportam o uso do conteúdo. A governança de dados deve elaborar as políticas e procedimentos que suportam o uso
de conteúdo e evitam o uso indevido; permitindo que a organização responda a qualquer forma de litígio de maneira consistente e apropriada.

3.7 Big Data

Os primeiros esforços para definir o significado de Big Data caracterizaram-no em termos dos Três V's: Volume, Velocidade, Variedade. À medida que mais
organizações começam a aproveitar o potencial do Big Data, a lista de V’s se expandiu:
•Volume: refere-se à quantidade de dados. O Big Data geralmente possui milhares de entidades ou elementos em bilhões de registros.
•Velocidade: refere-se à velocidade na qual os dados são capturados, gerados ou compartilhados. O Big Data geralmente é gerado e também pode ser distribuído e até analisado em
tempo real.
•Variedade/variabilidade: refere-se às formas em que os dados são capturados ou entregues. O Big Data vem requer armazenamento de vários formatos. A estrutura de dados
geralmente é inconsistente dentro ou entre conjuntos de dados.
•Viscosidade: refere-se à dificuldade em usar ou integrar os dados.
•Volatilidade: refere-se à frequência com que os dados são alterados e, portanto, quanto tempo os dados são úteis.
•Veracidade: refere-se à confiabilidade dos dados.

A maioria dos data warehouses - DW é baseado em modelos relacionais. O DW depende do conceito de ETL (loading and then transforming - extrair, transformar, carregar). As
soluções de Big Data, como os lagos de dados, dependem do conceito de E L T - carregar e depois transformar (loading and then transforming).
O Big Data pode ser usado para uma série de atividades, de mineração de dados, aprendizado de máquina e análise preditiva. Mas para isso é necessário criar uma estratégia para
implementação do Big Data alinhada a estratégia de negócio da organização.

•Para que a organização precisa de análise: Uma organização pode determinar que os dados devem ser usados para avaliar suas estratégias de negócio.
•bullet
•Quais fontes de dados: As fontes internas podem ser acessíveis, mas podem ter escopo limitado. Fontes externas podem ser úteis, mas estão fora do domínio da Governança de
Dados.
•bullet
•Escopo dos dados: muitos elementos podem ser fornecidos em feeds em tempo real, instantâneos em um determinado momento ou até integrados. Dados de baixa latência são ideais,
mas costumam custar recursos de aprendizado de máquina.
•bullet
•O impacto e a relação com outras estruturas de dados: pode ser necessário fazer alterações na estrutura ou no conteúdo de outras estruturas de dados para torná-los adequados para
integração com o Big Data.
4. Usando e aprimorando dados

O desenvolvimento de relatórios de Business Intelligence é outra atividade em que o uso de dados resulta na criação de novos dados que exige um
nível de gerenciamento contínuo.
O termo Business Intelligence (BI) é conceituado de duas formas:
Primeiro, refere-se a um tipo de análise de dados que visa entender as atividades e oportunidades organizacionais, por meio de insights extraídos
de análises dos dados locais e exportados, permitindo apoiar a tomada de decisão em relação ao alcance dos seus objetivos estratégicos.
Segundo, Business Intelligence refere-se a um conjunto de tecnologias que suportam processos de análise de dados, permitindo realizar
consultas, mineração de dados, análise estatística, geração de relatórios, modelagem de cenários, visualização de dados e criação de painéis de
controle e de acompanhamento.
As atividades tradicionais de BI exigem fontes de dados confiáveis, integradas e disponíveis. As ferramentas de BI devem suportar a exploração de
dados e deve se orientar por processos, de forma a:

•Manter e aprimorar os dados estratégicos utilizados nos relatórios de BI e permitindo a incorporação de novos dados.
•Manter e aprimorar o conjunto de ferramentas de BI.
•Gerenciar metadados para que otimizar relatórios elegíveis.
•Documentar a linhagem de dados para as partes interessadas.
•Fornecer um ciclo de feedback da qualidade dos dados que possibilite identificar oportunidades e aprimoramentos.
4.2 Ciência de Dados
A ciência de dados mescla mineração de dados, análise estatística e aprendizado de máquina com recursos de integração e modelagem de dados para se criar modelos preditivos
que exploram padrões de conteúdo de dados. O termo ciência de dados refere-se ao processo de desenvolvimento de modelos preditivos. O analista de dados (ou cientista de
dados) usa o método científico (observação, hipótese, experimentação, análise e conclusão) para desenvolver e avaliar um modelo analítico ou preditivo.
De certa forma, a ciência de dados pode ser entendida como uma extensão do BI. O Business Intelligence tradicional fornece relatórios do 'passado' - análise de dados
estruturados para descrever tendências passadas. Em alguns casos, os padrões de BI são utilizados para prever o comportamento futuro, mas com ausência de precisão
confiável.

4.3 Análise preditiva e prescritiva

O Predictive Analytics utiliza modelos de probabilidade com base em


variáveis (incluindo dados históricos) relacionadas a possíveis eventos.
Quando recebe outras informações, o modelo desencadeia uma reação
da organização. O fator desencadeante pode ser um evento como
um feed de notícias ou dados de sensores de utilidade ou um aumento
no volume de solicitações de serviço. O fator de disparo pode ser um
evento externo. As notícias relatadas sobre uma organização podem
servir como um preditor de uma mudança no preço das ações.
A análise prescritiva tende a ser uma análise preditiva, mas com novas
abordagens estatísticas que possibilite prever resultados, e não apenas
avaliar os resultados de eventos pretéritos. A análise prescritiva
antecipa o que irá ocorrer, quando acontecerá e implica por que isso irá
acontecer. Como a análise prescritiva pode mostrar as implicações de
várias decisões, pode sugerir como aproveitar uma oportunidade ou
evitar um risco
Até recentemente, a análise de grandes conjuntos de dados era limitada pela tecnologia. As análises basearam-se em amostragem ou por outros meios de abstração para
aproximar padrões. À medida que cresce a capacidade de coletar e analisar grandes conjuntos de dados, os cientistas de dados estão integrando métodos de matemática,
estatística, ciência da computação, processamento de sinais, modelagem de probabilidade, reconhecimento de padrões, aprendizado de máquina, modelagem de
incertezas e visualização de dados para obter insights e prever comportamentos com base em conjuntos de Big Data. Em suma, a ciência de dados encontrou novas
maneiras de analisar e extrair conhecimento dos dados. Em muitos casos, esse conhecimento pode ser traduzido em valor econômico.
Como o Big Data foi introduzido nos ambientes de data warehouse e BI, as técnicas de ciência de dados podem fornecer uma visão prospectiva da organização.
Recursos preditivos, em tempo real e baseados em modelo, usando diferentes tipos de fontes de dados, oferecem às organizações uma melhor visão para onde estão
caminhando.

4.4 Visualização de dados

4.5 Monetização de Dados


Aiken e Billings afirmam que boas práticas de gerenciamento de dados também são a base para a inovação bem-sucedida do uso de dados. As práticas precárias de
gerenciamento de dados, por outro lado, custam dinheiro e introduzem riscos em novas iniciativas e processos existentes. Os autores apresentam estudos de caso que
documentam que más práticas de gerenciamento de dados podem resultar em desperdício direto por meio de trabalho redundante e, com ele, a criação de dados redundantes,
metadados ruins ou ausentes, processos confusos e informações incorretas. Eles também fornecem exemplos dos benefícios de práticas disciplinadas de gerenciamento de
dados. Por exemplo, práticas claras e executáveis de gerenciamento de metadados aumentam o conhecimento organizacional e tornam esse conhecimento transferível.
Laney apresenta 12 (doze) drivers (direcionadores) de negócio para monetizar dados. Uma das primeiras maneiras de se obter valor é usar os dados organizacionais com mais
eficiência para reter, entrar em novos mercados e criar novos produtos. Mas Laney vai além do óbvio. Por exemplo, dados de qualidade podem melhorar a eficiência
organizacional, permitindo que uma organização reduza os custos de manutenção, negocie melhores termos e condições, detecte fraudes e desperdícios ou se prepare para
assumir os custos de gerenciamento de dados.
Os estudos de caso de Aiken e Billings e Laney e de outras pesquisas confirmam que dados de baixa qualidade são um passivo significativo. Outros, no entanto, conseguiram
avançar, com melhorias operacionais e monetização direta. Os estudos de caso mostram que o uso inovador de dados requer gerenciamento confiável de dados. Embora nem
toda organização almeje vender seus dados, todas as organizações vislumbram ter confiança nas decisões com base em seus dados. O primeiro passo nessa direção é gerenciar
bem os dados.
5. Proteção de Dados, Privacidade, Segurança e Gerenciamento de Riscos

Você também pode gostar