Você está na página 1de 56

Gerenciamento de registros

x
Forma especializada de gerenciamento de documentos que se concentra nos registros -
documentos que fornecem evidências das atividades de uma organização. Essas atividades
podem ser eventos, transações, contratos, correspondência, políticas, decisões, procedimentos,
operações, arquivos de pessoal e demonstrações financeiras. Os registros podem ser
documentos físicos, arquivos e mensagens eletrônicos ou conteúdo do banco de dados.

Gerenciamento de conteúdo
x
Refere-se aos processos, técnicas e tecnologias para organizar, categorizar e estruturar recursos
de informações para que eles possam ser armazenados, publicados e reutilizados de várias
maneiras. O conteúdo pode ser volátil ou estático (documentos e outros ativos digitais, como
vídeos, fotografias, etc.). Pode ser gerenciado formalmente (estritamente armazenado,
gerenciado, auditado, retido ou descartado) ou informalmente por meio de atualizações ad hoc.
O gerenciamento de conteúdo é particularmente importante em sites e portais, mas as técnicas
de indexação com base em palavras-chave e organização com base em taxonomias podem ser
aplicadas em plataformas tecnológicas.

O gerenciamento bem-sucedido de documentos, registros e outras formas de conteúdo


compartilhado requer:
•Planejamento, incluindo a criação de políticas para diferentes tipos de acesso e
manipulação.
•Definição da arquitetura da informação e dos metadados necessários para suportar uma
estratégia de conteúdo.
•Permissão do gerenciamento de terminologia, incluindo ontologias e taxonomias,
necessárias para organizar, armazenar e recuperar várias formas de conteúdo.
•Adoção de tecnologias que permitem o gerenciamento do ciclo de vida do conteúdo,
desde a criação ou captura de conteúdo até a versão e assegurando a segurança do
conteúdo.
Para os registros, as políticas de retenção e descarte são críticas. Os registros devem ser mantidos
pelo período de tempo necessário e devem ser destruídos assim que os requisitos de retenção
forem atendidos. Embora existam, os registros devem estar acessíveis às pessoas e processos
apropriados e, como outros conteúdos, devem ser entregues por meio dos canais apropriados.
Para atingir esses objetivos, as organizações exigem sistemas de gerenciamento de conteúdo
(Content Management Systems - CMS), além de ferramentas para criar e gerenciar os metadados
que suportam o uso do conteúdo. Eles também exigem que a governança supervisione as
políticas e procedimentos que suportam o uso de conteúdo e evitam o uso indevido; essa
governança permite que a organização responda ao litígio de maneira consistente e apropriada.

3.7. Armazenamento de Big Data


O Big data e a ciência de dados estão conectados a mudanças tecnológicas significativas que
permitiram às pessoas gerar, armazenar e analisar quantidades cada vez maiores de dados e usá-
los para prever e influenciar comportamentos, além de obter informações sobre uma série
assuntos como práticas de saúde, gestão de recursos naturais e desenvolvimento econômico.
Os primeiros esforços para definir o significado de Big Data caracterizaram-no em termos dos Três
V's: Volume, Velocidade, Variedade. À medida que mais organizações começaram a aproveitar o
potencial do Big Data, a lista de V’s se expandiu. Hoje são seis os “v”, conforme especificado
abaixo.
•Volume: refere-se à quantidade de dados. O Big Data geralmente possui milhares de
entidades ou elementos em bilhões de registros.
•Velocidade: refere-se à velocidade na qual os dados são capturados, gerados ou
compartilhados. O Big Data geralmente é gerado e também pode ser distribuído e até
analisado em tempo real.
•Variedade/variabilidade: refere-se às formas em que os dados são capturados ou
entregues. O Big Data vem requer armazenamento de vários formatos. A estrutura de
dados geralmente é inconsistente dentro ou entre conjuntos de dados.
•Viscosidade: refere-se à dificuldade em usar ou integrar os dados.
•Volatilidade: refere-se à frequência com que os dados são alterados e, portanto, quanto
tempo os dados são úteis.
•Veracidade: refere-se à confiabilidade dos dados.
Tirar proveito do Big Data requer mudanças na tecnologia e nos processos de negócios e na
maneira como os dados são gerenciados. A maioria dos data warehouses é baseada em modelos
relacionais.
O Big Data geralmente não é organizado em um modelo relacional. O data warehousing depende
do conceito de ETL (loading and then transforming - extrair, transformar, carregar).
As soluções de Big Data, como os lagos de dados, dependem do conceito de E L T - carregar e
depois transformar (loading and then transforming). Isso significa que grande parte do trabalho
inicial necessário para a integração não é feito para o Big Data, pois é para criar um data
warehouse com base em um modelo de dados. Para algumas organizações e para alguns usos de
dados, essa abordagem funciona, mas para outras, é necessário se concentrar na preparação de
dados para uso.
A velocidade e o volume dos dados apresentam desafios que exigem abordagens diferentes para
aspectos críticos do gerenciamento de dados, não apenas a integração de dados, mas também o
Gerenciamento de metadados, a avaliação da qualidade dos dados e o armazenamento de dados
(por exemplo, no local, em um data center ou a nuvem).
A promessa do Big Data - de que ele fornecerá um tipo diferente de insight - depende da
capacidade de gerenciar o Big Data. De várias maneiras, devido à grande variação de fontes e
formatos, o gerenciamento de Big Data requer mais disciplina do que o gerenciamento de dados
relacionais. Cada um dos V's apresenta a oportunidade para o caos.
Os princípios relacionados ao gerenciamento de Big Data ainda não foram totalmente formados,
mas um é muito claro: as organizações devem gerenciar cuidadosamente os metadados
relacionados às fontes de Big Data para ter um inventário preciso dos arquivos de dados, suas
origens e seu valor.
Algumas pessoas questionaram se há necessidade de gerenciar a qualidade do Big Data, mas a
pergunta em si reflete uma falta de entendimento da definição de qualidade - adequação ao
objetivo. A grandeza, por si só, não torna os dados adequados ao objetivo. O Big Data também
representa novos riscos éticos e de segurança que precisam ser contabilizados pelas organizações
de governança de dados.
O Big Data pode ser usado para uma série de atividades, de mineração de dados a aprendizado de
máquina e análise preditiva. Mas, para chegar lá, uma organização deve ter um ponto de partida e
uma estratégia.
A estratégia de Big Data de uma organização necessita estar alinhada e apoiar a estratégia geral
de negócios da instituição.
Sua atenção, para que isso ocorra, deve-se avaliar:
•Quais são os problemas a organização está tentando resolver. Uma organização pode
determinar que os dados devem ser usados para entender os negócios ou o ambiente de
negócios; provar ideias sobre o valor de novos produtos; explorar uma hipótese; ou
inventar uma nova maneira de fazer negócios. É importante estabelecer um processo de
fechamento e verificação para avaliar o valor e a viabilidade das iniciativas.
•Quais fontes de dados usar ou adquirir: As fontes internas podem ser fáceis de usar, mas
também podem ter escopo limitado. Fontes externas podem ser úteis, mas estão fora do
controle operacional (gerenciado por terceiros ou não controlado por ninguém, como no
caso das mídias sociais). Muitos fornecedores estão competindo como intermediários de
dados e geralmente existem várias fontes para os conjuntos de dados desejados. A
aquisição de dados que se integra aos itens de ingestão existentes pode reduzir os custos
gerais de investimento.
•A pontualidade e o escopo dos dados a serem provisionados: Vários elementos podem ser
fornecidos em feeds em tempo real, instantâneos em um determinado momento ou até
integrados e resumidos. Dados de baixa latência são ideais, mas costumam custar recursos
de aprendizado de máquina - há uma enorme diferença entre algoritmos computacionais
direcionados para dados em repouso versus streaming. Não minimize o nível de integração
necessário para o uso downstream.
•O impacto e a relação com outras estruturas de dados: Pode ser necessário fazer
alterações na estrutura ou no conteúdo de outras estruturas de dados para torná-los
adequados para integração com os conjuntos de Big Data.
•Influências nos dados modelados existentes: Isso inclui a ampliação do conhecimento
sobre clientes, produtos e abordagens de marketing.
A estratégia orientará o escopo e o cronograma do roteiro de recursos de Big Data da organização.
Muitas organizações estão integrando Big Data em seu ambiente geral de gerenciamento de
dados. Os dados são transferidos dos sistemas de origem para uma área intermediária, onde
podem ser limpos e enriquecidos. Em seguida, é integrado e armazenado no data warehouse
(DW) e/ou em um armazenamento de dados operacional (Operational Data Store - ODS).
A partir do DW, os usuários podem acessar dados por meio de marcadores ou cubos e utilizá-los
para vários tipos de relatórios. O Big Data passa por um processo semelhante, mas com uma
diferença significativa: enquanto a maioria dos armazéns integra dados antes de colocá-los em
tabelas, as soluções de Big Data ingerem dados antes de integrá-los. O Big Data BI pode incluir
análise preditiva e mineração de dados, além de formas mais tradicionais de geração de
relatórios.
4. Usando e aprimorando dados
Uma característica dos dados que os diferencia de outros ativos é que eles não são "consumidos"
quando usados. Pessoas e processos diferentes utilizam dados ao mesmo tempo ou utilizam os
mesmos dados várias vezes sem esgotá-los. Os dados não se esgotam como também o uso de
dados cria mais dados. Por exemplo, agregações e cálculos de conjuntos de dados existentes
criam novos conjuntos de dados, assim como modelos preditivos criados por cientistas de dados.
Em muitos casos, esses novos conjuntos de dados continuaram sendo produzidos e atualizados.
Eles exigem gerenciamento. Eles precisam ser definidos e suportados por meio de metadados.
Expectativas relacionadas à sua qualidade também devem ser definidas. Seu acesso e uso devem
ser regidos.
Este tópico examinará as atividades do ciclo de vida em que os dados são utilizados e
aprimorados, incluindo:
•Uso de dados mestre.
•Business Intelligence.
•Ciência de Dados.
•Ferramenta Google Analytics.
•Visualização de dados.
•Monetização de dados.
4.1. Uso de dados mestre
O uso de dados mestre fornece uma boa ilustração de como o uso de dados está diretamente
conectado à melhoria de dados. Os dados mestre bem gerenciados permitem que uma
organização tenha um bom entendimento das entidades (usuários, fornecedores, serviços etc.)
com as quais interage e transaciona os negócios.
No processo transacional de dados, uma organização aprende mais sobre essas entidades. O que
se aprende pode ser armazenado no nível da transação, mas as organizações coletam dados
necessários para manter seus dados mestre (por exemplo, alterações de endereço, atualizações
nas informações de contato etc.).
Os dados transacionais também permitem que eles obtenham dados adicionais (por exemplo:
quais benefícios assistenciais determinado usuário tem acesso, etc.) que podem aprimorar seus
dados mestre. Embora a interação dinâmica entre diferentes usos de dados deva ser considerada
no planejamento do gerenciamento de dados, esse é o foco particular do gerenciamento de dados
mestre.

4.2. Inteligência do Negócio


O desenvolvimento de relatórios de Business Intelligence é outra atividade em que o uso de dados
resulta na criação de novos dados que exigem um nível de gerenciamento contínuo.
Vale ressaltar que o termo Business Intelligence (BI) apresenta dois significados:
1. Tipo de análise de dados que visa entender as atividades e oportunidades organizacionais.
Quando as pessoas dizem que os dados possuem a chave da vantagem competitiva, estão
articulando a promessa inerente à atividade de Business Intelligence: que se uma
organização fizer as perguntas certas de seus próprios dados, poderá obter insights sobre
seus usuários, produtos e serviços que permitem tomar as melhores decisões sobre como
cumprir seus objetivos estratégicos.
2. Conjunto de tecnologias que suportam esse tipo de análise de dados. As ferramentas
de BI permitem consultas, mineração de dados, análise estatística, geração de relatórios,
modelagem de cenários, visualização de dados e painel de controle, desde orçamento,
relatórios operacionais e métricas de desempenho de negócios até análises avançadas.
O BI é o principal direcionador (driver) do armazenamento de dados, pois as atividades tradicionais
de BI exigem fontes de dados confiáveis e integradas para uso. As ferramentas de BI devem
suportar a exploração de dados, bem como os relatórios.
O BI pode evoluir rapidamente à medida que os analistas utilizam os dados.
Sua atenção, pois um programa de análise de dados utilizando BI deve se orientar por processos
confiáveis, tais como:
• Manter e aprimorar os dados estratégicos utilizados nos relatórios de BI e permitir a
incorporação de novos dados.
• Manter e aprimorar o conjunto de ferramentas de BI.
• Gerenciar metadados relacionados aos relatórios de BI, para que as partes interessadas
entendam os próprios relatórios.
• Documentar a linhagem de dados para as partes interessadas.
• Fornecer um ciclo de feedback da qualidade dos dados para que permaneçam confiáveis e
sejam identificadas oportunidades para aprimorá-los.
Em resumo, o gerenciamento dos dados criados por um programa de BI segue as etapas de
gerenciamento do ciclo de vida que fazem parte do gerenciamento de dados.

4.3. Ciência de dados


A ciência de dados existe há muito tempo. Costumava ser chamado de estatística aplicada. Mas a
capacidade de explorar padrões de dados evoluiu rapidamente no século XXI com o advento das
tecnologias de coleta e armazenamento de Big Data.
A ciência de dados mescla mineração de dados, análise estatística e aprendizado de máquina com
recursos de integração e modelagem de dados para se criar modelos preditivos que exploram
padrões de conteúdo de dados. O termo ciência de dados refere-se ao processo de
desenvolvimento de modelos preditivos. O analista de dados (ou cientista de dados) usa o método
científico (observação, hipótese, experimentação, análise e conclusão) para desenvolver e avaliar
um modelo analítico ou preditivo.
O cientista de dados desenvolve uma hipótese sobre o comportamento que pode ser observado
nos dados antes de uma ação específica. Por exemplo, a compra de um tipo de item geralmente é
seguida pela compra de outro tipo de item (a compra de uma casa geralmente é seguida pela
compra de móveis). Em seguida, o cientista de dados analisa grandes quantidades de dados
históricos para determinar com que frequência a hipótese foi verdadeira no passado e para
verificar estatisticamente a precisão provável do modelo.
Se uma hipótese é válida com frequência suficiente e se o comportamento previsto é útil, o
modelo pode se tornar a base de um processo de inteligência operacional para prever o
comportamento futuro, possivelmente até mesmo em tempo real.
De certa forma, a ciência de dados pode ser entendida como uma extensão do BI. De outras
formas, no entanto, leva a análise de dados e o uso a um nível muito diferente. O Business
Intelligence tradicional fornece relatórios do 'espelho retrovisor' - análise de dados estruturados
para descrever tendências passadas. Em alguns casos, os padrões de BI são utilizados para prever
o comportamento futuro, mas com ausência de precisão confiável.

4.4. Análise preditiva e prescritiva


Grande parte da ciência de dados está focada no desejo de criar modelos preditivos, embora nem
todos que criam e utilizam esses modelos sejam cientistas de dados. A forma mais simples de
modelo preditivo é a previsão.
O Predictive Analytics é o subcampo do aprendizado de máquina supervisionado, enraizado nas
estatísticas em que os usuários tentam modelar elementos de dados e prever resultados futuros
por meio da avaliação de estimativas de probabilidade.
O Predictive Analytics utiliza modelos de probabilidade com base em variáveis (incluindo dados
históricos) relacionadas a possíveis eventos. Quando recebe outras informações, o modelo
desencadeia uma reação da organização.
O fator desencadeante pode ser um evento como um feed de notícias ou dados de sensores de
utilidade ou um aumento no volume de solicitações de serviço. O fator de disparo pode ser um
evento externo. As notícias relatadas sobre uma organização podem servir como um preditor de
uma mudança no preço das ações. A previsão do movimento das ações deve incluir o
monitoramento de notícias e determinar se as notícias sobre uma organização provavelmente
serão boas ou ruins para o preço das ações.
Frequentemente, o fator desencadeante é o acúmulo de um grande volume de dados em tempo
real como um número extremamente alto de negociações ou solicitações de serviço ou
volatilidade do ambiente. O monitoramento de um fluxo de eventos de dados inclui a criação
incremental dos modelos preenchidos até que seja atingido um limite que ativa o acionador.
A quantidade de tempo que um modelo preditivo fornece entre a previsão e o evento previsto é
frequentemente muito pequena (em segundos ou menos). O investimento em soluções de
tecnologia de latência muito baixa como bancos de dados em memória, redes de alta velocidade e
até proximidade física da fonte dos dados, otimiza a capacidade da organização de reagir à
previsão.
A análise prescritiva leva a análise preditiva um passo adiante para definir ações que afetarão os
resultados, em vez de apenas prever os resultados das ações que ocorreram.
A análise prescritiva antecipa o que acontecerá, quando acontecerá e implica por que isso
acontecerá. Como a análise prescritiva pode mostrar as implicações de várias decisões, pode
sugerir como aproveitar uma oportunidade ou evitar um risco. A análise prescritiva pode captar
continuamente novos dados para re-prever e re-prescrever. Esse processo pode melhorar a
precisão da previsão e resultar em melhores prescrições. A tabela a seguir resume a relação
entre BI tradicional e ciência de dados.
A tabela abaixo, revela a Progressão analítica.

Data Werehouse / BI Ciência de Dados / Análise Ciência de Dados / Análise


Tradicional Preditiva Prescritiva
Retrospectiva Percepção Predição
Com base em modelos
Baseado na histório: Com base em cenários:
preditivos:
O que aconteceu? O que devemos fazer para que as
O que é provável que
Por que isso aconteceu? coisas aconteçam?
aconteça?
Descritivo Preditivo Prescritivo

Até recentemente, a análise aprofundada de enormes conjuntos de dados era limitada pela
tecnologia. As análises basearam-se em amostragem ou outros meios de abstração para
aproximar padrões. À medida que cresce a capacidade de coletar e analisar grandes conjuntos de
dados, os cientistas de dados estão integrando métodos de matemática, estatística, ciência da
computação, processamento de sinais, modelagem de probabilidade, reconhecimento de
padrões, aprendizado de máquina, modelagem de incertezas e visualização de dados para
obter insights e prever comportamentos com base em conjuntos de Big Data.
Em suma, a ciência de dados encontrou novas maneiras de analisar e extrair conhecimento dos
dados. Em muitos casos, esse conhecimento pode ser traduzido em valor econômico.
Como o Big Data foi introduzido nos ambientes de data warehouse e BI, as técnicas de ciência de
dados podem fornecer uma visão prospectiva ('para-brisa') da organização. Recursos preditivos,
em tempo real e baseados em modelo, usando diferentes tipos de fontes de dados, oferecem às
organizações uma melhor visão para onde estão caminhando.
Os modelos de ciência de dados se tornam fontes de dados. Eles precisam ser monitorados e
explorados para obter informações. Como outras formas de ciência, a ciência de dados cria novos
conhecimentos e também novas hipóteses. Testar hipóteses resulta em novos modelos e novos
dados. Todas essas peças requerem gerenciamento para criar valor ao longo do tempo. Os
modelos precisam ser 'treinados' e avaliados. Novas fontes de dados podem ser incorporadas aos
modelos existentes. O ciclo de vida dos dados deve compor os esforços de ciência de dados que
precisa ser contabilizado como parte do planejamento e da estratégia.
Os modelos de ciência de dados que contêm lógica (algoritmos) para processar dados e fazer
previsões a partir deles, não são a mesma coisa que os modelos de dados descritos no tópico
“Habilitando e Mantendo Dados” que documentam a estrutura dos dados e os relacionamentos
entre entidades e atributos de dados.

4.5. Visualização de dados


Visualização é o processo de interpretação de conceitos, ideias e fatos usando figuras ou
representações gráficas. A visualização de dados facilita a compreensão dos dados subjacentes,
resumindo-os em uma forma visual, como um gráfico. As visualizações de dados condensam e
encapsulam dados de características, facilitando sua visualização. Dessa forma podem revelar
oportunidades, identificar riscos ou destacar novas análises.
A visualização tem sido fundamental para a análise de dados. As ferramentas tradicionais
de BI incluem opções de visualização, como tabelas, gráficos de diversos modelos, histogramas,
dentre outras formas.
Os princípios nesses exemplos simples são estendidos significativamente em aplicações de ciência
de dados. A visualização de dados é fundamental para a ciência de dados porque, sem ela, a
interpretação dos dados é quase impossível. Padrões em um grande conjunto de dados podem
ser difíceis, se não impossíveis, de reconhecer em uma exibição de números. Um padrão pode ser
capturado rapidamente, quando milhares de pontos de dados são apresentados em uma exibição
visual.
As visualizações de dados podem ser entregues em um formato estático, como um relatório
publicado ou em um formato online mais interativo. Algumas tecnologias de visualização
permitem que os analistas se movam entre as camadas de dados, por meio de filtros ou a
capacidade de 'aprofundar' os dados. Outros permitem que a visualização seja alterada pelo
usuário sob demanda por meio de displays inovadores, como mapas de dados e paisagens em
movimento de dados ao longo do tempo.
Para atender à crescente necessidade de entender dados, o número de ferramentas de
visualização aumentou e as técnicas melhoraram.
À medida que a análise de dados amadurece, a visualização apresenta novas maneiras de exibição
oferecendo vantagens estratégicas. Ver novos padrões nos dados pode resultar em novas
oportunidades de negócios.
À medida que a visualização de dados continua a evoluir, as organizações terão que aumentar
suas equipes de Business Intelligence para competir em um mundo cada vez mais orientado a
dados. Os departamentos de análise de negócios buscarão especialistas em dados com
habilidades de visualização (incluindo cientistas de dados, artistas de dados e especialistas em
visão de dados), além de arquitetos e modeladores de informações tradicionais, especialmente
devido aos riscos associados à visualização enganosa.
Um fator crítico de sucesso na implementação de uma abordagem de ciência de dados é o
alinhamento das ferramentas de visualização apropriadas à comunidade de usuários.
Dependendo do tamanho e da natureza da organização, é provável que muitas ferramentas de
visualização diferentes sejam aplicadas em uma variedade de processos.
Certifique-se de que os usuários entendam a complexidade relativa das ferramentas de
visualização. Usuários sofisticados terão demandas cada vez mais complexas. A coordenação
entre as equipes de arquitetura corporativa, gerenciamento de portfólio e manutenção será
necessária para controlar os canais de visualização dentro e por meio do portfólio. Esteja ciente de
que a mudança de provedores de dados ou critérios de seleção provavelmente terá impactos a
jusante nos elementos disponíveis para visualização que podem afetar a eficácia das ferramentas.
É uma prática recomendada estabelecer uma comunidade que defina e publique padrões e
diretrizes de visualização e revise artefatos dentro de um método de entrega especificado; isso é
particularmente vital para o conteúdo voltado para clientes e regulamentações.
Assim como outros usos dos dados, a visualização de dados cria novos conjuntos de dados, na
forma das próprias visualizações e nos métodos pelos quais os dados são combinados para que
possam ser apresentados em um formato gráfico. Você adivinhou!!! Esses dados também devem
ser gerenciados.
A visualização de dados é um campo em evolução, mas os princípios que o guiam se baseiam
nos princípios de design. Ver Tufte (2001) e McCandless (2012). Existem vários recursos baseados
na Web com exemplos e exemplos contrários. Consulte a Tabela Periódica de Métodos de
Visualização em Visual Literacy.Org https://bit.ly/IX1bvI.

4.6. Monetização de dados


É provável que qualquer organização envolvida na Data Science ou outras formas de análise
obtenha informações valiosas sobre seus próprios clientes, produtos, serviços e processos. A
análise avançada também pode gerar informações sobre entidades externas.
É possível que essa organização desenvolva técnicas que possam ser valiosas para outras pessoas.
Se essas ideias e técnicas puderem ser empacotadas e vendidas, uma organização estaria
aproveitando seus dados não apenas como um ativo, mas como um produto. Em alguns círculos,
a monetização direta de dados é percebida como o santo graal do gerenciamento de dados.
Algumas organizações (Dun & Bradstreet, Google, Amazon) fizeram um negócio de monetizar seus
dados. Mas vender dados e informações não é a única maneira de obter valor dos ativos de
dados.
Em Monetizing Data Management, Peter Aiken e Juanita Billings apontam que poucas
organizações exploram a vantagem estratégica que podem obter com os dados, “o único ativo
estratégico não esgotável, não degradante, durável e duradouro da organização”. Eles
argumentam que melhorar as práticas de gerenciamento de dados é o primeiro meio de obter
mais valor dos dados. Uma organização que coloca um valor monetário em práticas eficazes de
gerenciamento de dados produzirá dados de maior qualidade e poderá fazer mais com eles.
Aiken e Billings afirmam que boas práticas de gerenciamento de dados também são a base para a
inovação bem-sucedida do uso de dados. As práticas precárias de gerenciamento de dados, por
outro lado, custam dinheiro e introduzem riscos em novas iniciativas e processos existentes.
Esses autores apresentam estudos de caso que documentam que más práticas de gerenciamento
de dados podem resultar em desperdício direto por meio de trabalho redundante e, com ele, a
criação de dados redundantes, metadados ruins ou ausentes, processos confusos e informações
incorretas.
Eles também fornecem exemplos dos benefícios de práticas disciplinadas de gerenciamento de
dados. Por exemplo, práticas claras e executáveis de gerenciamento de metadados aumentam o
conhecimento organizacional e tornam esse conhecimento transferível.
Infonomics, de Douglas Laney, um estudo completo sobre gerenciamento de informações como
um ativo, apresenta uma ampla variedade de estudos de caso que demonstram como as
organizações aproveitaram seus ativos de informações para criar valor. Enquanto as indústrias,
atividades e produtos diferem, o valor econômico derivado dos dados se resume a dois métodos
básicos:
•Troca de informações por bens, serviços ou dinheiro.
•Usando informações para aumentar a receita, reduzir despesas e gerenciar riscos.
Laney apresenta 12 (doze) drivers (direcionadores) de negócio para monetizar dados. Uma das
primeiras maneiras de obter valor é usar os dados organizacionais com mais eficiência para reter
clientes existentes, entrar em novos mercados e criar novos produtos. Mas Laney vai além do
óbvio. Por exemplo, dados melhores podem melhorar a eficiência organizacional, permitindo que
uma organização reduza os custos de manutenção, negocie melhores termos e condições, detecte
fraudes e desperdícios ou pague os custos de gerenciamento de dados.
Para alguns, como mostram os estudos de caso de Aiken e Billings e Laney e outras pesquisas
confirmam, dados de baixa qualidade são um passivo significativo. Outros, no entanto,
conseguiram avançar, com melhorias operacionais e monetização direta. Os estudos de caso
mostram que o uso inovador de dados requer gerenciamento confiável de dados. Embora nem
toda organização almeje vender seus dados, todas as organizações vislumbram ter confiança nas
decisões com base em seus dados. O primeiro passo nessa direção é gerenciar bem os dados.

5. Proteção de Dados, Privacidade, Segurança e Gerenciamento de Riscos


O gerenciamento de dados por meio do seu ciclo de vida depende de um conjunto de processos
fundamentais que permite o uso e aprimoramento contínuos dos dados. Isso inclui a proteção de
dados contra o uso não autorizado, o gerenciamento de metadados (o conhecimento necessário
para entender e usar dados) e o gerenciamento da qualidade dos dados. Conforme observado
anteriormente, as atividades fundamentais devem ser consideradas como parte do planejamento
e design e devem ser realizadas operacionalmente. Essas atividades também são apoiadas pelas
estruturas de governança.
Este tópico abordará a proteção e segurança dos dados. A Segurança de dados inclui o
planejamento, desenvolvimento e execução de políticas e procedimentos de segurança para
fornecer autenticação, autorização, acesso e auditoria adequados aos ativos de dados e
informações.

5.1. Objetivos de segurança de dados


As especificidades da segurança de dados (que dados precisam ser protegidos, por exemplo)
diferem entre indústrias e países. Mas o objetivo das práticas de segurança de dados é o mesmo:
proteger os ativos de informações em alinhamento com os regulamentos de privacidade e
confidencialidade, acordos contratuais e requisitos de negócios. Esses requisitos vêm de:
Partes interessadax
As organizações devem reconhecer as necessidades de privacidade e confidencialidade de suas
partes interessadas, incluindo clientes, pacientes, estudantes, cidadãos, fornecedores ou
parceiros de negócios. Todos em uma organização devem ser um administrador responsável
pelos dados sobre as partes interessadas.

Regulamentos governamentais
Existem regulamentos governamentais para proteger os interesses de algumas partes
interessadas. Os regulamentos têm objetivos diferentes. Alguns restringem o acesso às
informações, enquanto outros garantem abertura, transparência e responsabilidade. Os
regulamentos diferem entre os países, o que significa que as organizações que realizam negócios
internacionalmente precisam estar cientes e capazes de atender aos requisitos de proteção de
dados onde fazem negócios.

Preocupações comerciais proprietárias


Cada organização possui dados proprietários para proteger. Os dados de uma organização
fornecem informações sobre seus clientes e, quando alavancados com eficiência, podem fornecer
uma vantagem competitiva. Se dados confidenciais forem roubados ou violados, uma
organização poderá perder vantagem competitiva.

Necessidades de acesso legítimo


Ao proteger dados, as organizações também devem habilitar o acesso legítimo. Os processos de
negócios exigem que indivíduos em determinadas funções possam acessar, usar e manter dados.

Obrigações contratuais
Acordos contratuais e de não divulgação também influenciam os requisitos de segurança de
dados. Por exemplo, o PCI Standard, um contrato entre empresas de cartão de crédito e
empresas individuais, exige que certos tipos de dados sejam protegidos de maneiras definidas
(por exemplo, criptografia obrigatória para senhas de clientes).

Políticas e procedimentos eficazes de segurança de dados permitem que as pessoas certas usem
e atualizem os dados da maneira correta e restrinjam todo acesso e atualizações inadequados.
* O princípio Cachinhos Dourados é nomeado por analogia à história infantil Os Três Ursos, na
qual uma garotinha chamada Cachinhos Dourados prova três tigelas diferentes de mingau e
descobre que . [1] Como a história das crianças é bem conhecida em todas as culturas, o conceito
de "a quantidade certa" é facilmente compreendido e aplicado a uma ampla gama de disciplinas,
incluindo psicologia do desenvolvimento, biologia, [2] astronomia, economia [3] e Engenharia.

Compreender e cumprir os interesses e necessidades de privacidade e


confidencialidade de todas as partes interessadas é do interesse de todas as
organizações. Todos os relacionamentos com usuários dependem do uso responsável
dos dados.

Os objetivos das atividades de segurança de dados incluem:

• Habilitar o acesso apropriado e impedir o acesso inadequado aos ativos de


dados corporativos.
• Permitir conformidade com regulamentos e políticas de privacidade, proteção
e confidencialidade.=Garantir que os requisitos das partes interessadas em
privacidade e confidencialidade sejam atendidos.

5.2. Princípios de segurança de dados


Como os requisitos específicos mudam ao longo do tempo e diferem entre locais, as práticas de
segurança de dados devem seguir os princípios orientadores, incluindo:

Clique no(s) item(s) abaixo para navegar pelo infográfico

• Colaboração
A segurança de dados é um esforço colaborativo que envolve gestores de segurança de TI,
Gestores de dados / governança de dados, equipes de auditoria interna e externa e o
departamento jurídico.

Colaboração

•Abordagem corporativa
Os padrões e políticas de segurança de dados devem ser aplicados de forma consistente em toda
a organização.
Colaboração

•Gerenciamento proativo
O sucesso no gerenciamento de segurança de dados deve ser proativo e dinâmico, envolver todas
as partes interessadas, gerenciar mudanças e superar gargalos organizacionais ou culturais, como
a separação tradicional de responsabilidades entre segurança da informação, tecnologia da
informação, gestão de dados e partes interessadas nos negócios.
Colaboração

•Responsabilidade Clara
As funções e responsabilidades devem ser claramente definidas, incluindo a 'cadeia de custódia'
dos dados nas organizações e funções.
Colaboração

•Orientado por metadados


A classificação de segurança para elementos de dados é uma parte essencial da definição de
dados.
aboração

•Reduza o risco reduzindo a exposição


Minimize a proliferação de dados sensíveis/confidenciais, especialmente em ambientes que não
sejam de produção.

A redução de riscos e o crescimento dos negócios são os principais impulsionadores das


atividades de segurança de dados. Garantir a segurança dos dados de uma organização reduz os
riscos e agrega vantagens competitivas. A segurança em si é um ativo de alto valor e há também
um imperativo ético para proteger os dados.
Os objetivos de mitigar riscos e aumentar os negócios podem ser complementares e apoiarem-se
mutuamente, se integrados a uma estratégia coerente de gerenciamento e proteção de
informações.

5.3. Segurança de dados e gerenciamento de dados corporativos


Na medida em que as regulamentações de dados aumentam, geralmente em resposta a roubos e
violações de dados, também aumentam os requisitos de conformidade.
As organizações de segurança geralmente têm a tarefa de gerenciar não apenas os requisitos de
conformidade de TI, mas também políticas, práticas, classificações de dados e regras de
autorização de acesso em toda a organização.
Como em outros aspectos do gerenciamento de dados, é melhor abordar a segurança dos dados
como uma iniciativa corporativa e fazê-lo durante todo o ciclo de vida dos dados. Sem um esforço
coordenado, as unidades de negócios encontrarão soluções diferentes para as necessidades de
segurança, aumentando o custo geral e potencialmente reduzindo a segurança devido a proteção
inconsistente.
Arquitetura ou processos de segurança ineficazes podem custar às organizações devido a
violações e perda de produtividade.
A segurança de dados e de informações começa por avaliar o estado atual dos dados de uma
organização para identificar quais dados requerem proteção. O processo inclui as seguintes
etapas:
•Identificar e classificar ativos de dados confidenciais: Dependendo do setor e da
organização, pode haver poucos ou muitos ativos e uma variedade de dados confidenciais
- identificação pessoal, saúde, etc.
•Localizar dados confidenciais em toda a organização: Os requisitos de segurança podem
ser diferentes, dependendo de onde os dados são armazenados. Uma quantidade
significativa de dados confidenciais em um único local representa um alto risco devido ao
dano possível de uma única violação.
•Determinar como cada ativo precisa ser protegido: As medidas necessárias para garantir a
segurança podem variar entre ativos, dependendo do conteúdo dos dados e do tipo de
tecnologia.
•Identificar como essas informações interagem com os processos de negócios: A análise
dos processos de negócios é necessária para determinar qual acesso é permitido e sob
quais condições.
Além de classificar os dados em si, é necessário avaliar ameaças externas, como as de hackers e
criminosos, e os riscos internos apresentados por funcionários e processos. Muitos dados são
perdidos ou expostos pela ignorância de quem trabalha diretamente com os dados, que por vezes
não percebem que as informações são altamente sensíveis ou ignoram as políticas de segurança.
O impacto de violações de segurança em marcas bem estabelecidas nos últimos anos resultou em
enormes prejuízos. Não apenas as ameaças externas da comunidade de hackers criminais estão
se tornando mais sofisticadas e direcionadas, mas a quantidade de danos causados por ameaças
externas e internas, intencionais ou não, também tem aumentado constantemente ao longo dos
anos.

5.4. Metadados de Segurança de Dados


Uma abordagem para gerenciar dados confidenciais é via Metadados. Classificações de segurança
e sensibilidade regulatória podem ser capturadas ao nível do elemento e do conjunto de dados.
Existe tecnologia para marcar dados para que os metadados viajem com as informações à medida
que fluem pela organização. O desenvolvimento de um repositório mestre de características de
dados significa que todas as partes da organização podem saber exatamente qual nível de
informações confidenciais de proteção requer.
Se um padrão comum for aplicado, essa abordagem permitirá que vários departamentos,
unidades de negócios e fornecedores usem os mesmos metadados - Segurança padrão. Os
metadados podem otimizar a proteção de dados e orientar os processos de uso comercial e
suporte técnico, levando a custos reduzidos. Essa camada de segurança pode auxiliar a impedir o
acesso não autorizado e o uso indevido de ativos de dados.
Quando dados confidenciais são identificados corretamente como tal, as organizações criam
confiança com seus clientes e parceiros. Os próprios metadados relacionados à segurança se
tornam um ativo estratégico, aumentando a qualidade das transações, relatórios e análises de
negócios, reduzindo o custo da proteção e os riscos associados que as informações perdidas ou
roubadas causam.
A classificação de dados é pré-requisito para gerenciar a segurança dos dados. Sua atenção para
os dois conceitos que geram restrições de segurança:
1.Nível de confidencialidade: Confidencial significa secreto ou privado. As organizações
determinam quais tipos de dados não devem ser conhecidos fora da organização, ou
mesmo dentro de certas partes da organização. Informações confidenciais são
compartilhadas apenas com base na 'necessidade de conhecimento'. Os níveis de
confidencialidade dependem de quem precisa conhecer certos tipos de informações.
2.Categorias de regulamentação: são atribuídas com base em normas legais, como leis,
tratados, acordos alfandegários e regulamentos. As informações sob regulamentação legal
são compartilhadas com base no 'permitido saber'. As maneiras pelas quais os dados
podem ser compartilhados são regidos pelos detalhes do regulamento.
A principal diferença entre restrições confidenciais e regulamentares é onde a restrição se origina:
as restrições de confidencialidade se originam internamente, enquanto as restrições regulatórias
são definidas externamente.
Outra diferença é que qualquer conjunto de dados, como um documento ou uma exibição de
banco de dados, pode ter apenas um nível de confidencialidade. Este nível é estabelecido com
base no item mais sensível (e mais alto classificado) no conjunto de dados.
As categorizações regulatórias, no entanto, são aditivas. Um único conjunto de dados pode ter
dados restritos com base em várias categorias regulatórias. Para garantir a conformidade
regulamentar, aplique todas as ações necessárias para cada categoria, juntamente com os
requisitos de confidencialidade.
Quando aplicadas ao direito do usuário (a agregação dos elementos de dados específicos aos
quais uma autorização do usuário fornece acesso), todas as políticas de proteção devem ser
seguidas, independentemente de terem se originado interna ou externamente.
Saiba Mais sobre o compartilhamento de dados no âmbito da administração pública
Decreto presidencial dispõe sobre governança no compartilhamento de dados pelo Poder Público
O Decreto nº 10.046, de 09 de outubro de 2019, que estabelece normas e diretrizes para o
compartilhamento de dados entre os órgãos e entidades da administração pública direta,
autárquica e fundacional e os demais Poderes da União, foi recentemente sancionado pelo
Presidente da República. Referido Decreto atua em caráter complementar à Lei Geral de Proteção
de Dados Pessoais (Lei nº 13.709, de 14 de agosto de 2018 – “LGPD”), definindo alguns atributos a
serem considerados como dados pessoais compartilhados e estabelecendo os níveis de
compartilhamento de dados pessoais no âmbito da administração pública federal, a partir do grau
de confidencialidade dos dados que estão sob o controle do Poder Público. Com base nessas
definições, serão estabelecidas regras específicas de compartilhamento e medidas de segurança
para tais transferências.
O Decreto também institui o Cadastro Base do Cidadão e o Comitê Central de Governança de
Dados. O primeiro tem a finalidade de criar uma base de dados integradora única, em formato
interoperável, capaz de disponibilizar diversas informações pessoais dos cidadãos aos órgãos e
entidades do Poder Executivo Federal; e o segundo, órgão deliberativo, tem como principais
competências o estabelecimento de diretrizes e regras para as diferentes categorizações de
compartilhamento (amplo, restrito e específico); a avaliação da compatibilidade de políticas de
segurança da informação com os compartilhamentos realizados; a avaliação da qualidade dos
dados cadastrados; a resolução de controvérsias sobre a validade de informações cadastrais e as
regras de prevalência entre eventuais registros administrativos conflitantes, no caso de
cruzamento de informações entre bases de dados do Cadastro Base; dentre outras.
Segundo consta no Art. 3º:
(...)
Art. 3º O compartilhamento de dados pelos órgãos e entidades de que trata o art. 1º observará as
seguintes diretrizes:
I - a informação do Estado será compartilhada da forma mais ampla possível, observadas as
restrições legais, os requisitos de segurança da informação e comunicações e o disposto na Lei nº
13.709, de 14 de agosto de 2018 - Lei Geral de Proteção de Dados Pessoais;
II - o compartilhamento de dados sujeitos a sigilo implica a assunção, pelo recebedor de dados,
dos deveres de sigilo e auditabilidade impostos ao custodiante dos dados;
III - os mecanismos de compartilhamento, interoperabilidade e auditabilidade devem ser
desenvolvidos de forma a atender às necessidades de negócio dos órgãos e entidades de que
trata o art. 1º, para facilitar a execução de políticas públicas orientadas por dados;
IV - os órgãos e entidades de que trata o art. 1º colaborarão para a redução dos custos de acesso a
dados no âmbito da administração pública, inclusive, mediante o reaproveitamento de recursos
de infraestrutura por múltiplos órgãos e entidades;
V - nas hipóteses em que se configure tratamento de dados pessoais, serão observados o direito à
preservação da intimidade e da privacidade da pessoa natural, a proteção dos dados e as normas
e os procedimentos previstos na legislação; e
VI - a coleta, o tratamento e o compartilhamento de dados por cada órgão serão realizados nos
termos do disposto no art. 23 da Lei nº 13.709, de 2018.
(...)
Além disso, no Art. 4º é definido os níveis de compartilhamento:
(...)
DOS NÍVEIS DE COMPARTILHAMENTO DE DADOS
Art. 4º O compartilhamento de dados entre os órgãos e as entidades de que trata o art. 1º é
categorizado em três níveis, de acordo com sua confidencialidade:
I - compartilhamento amplo, quando se tratar de dados públicos que não estão sujeitos a
nenhuma restrição de acesso, cuja divulgação deve ser pública e garantida a qualquer
interessado, na forma da legislação;
II - compartilhamento restrito, quando se tratar de dados protegidos por sigilo, nos termos da
legislação, com concessão de acesso a todos os órgãos e entidades de que trata o art. 1º para a
execução de políticas públicas, cujo mecanismo de compartilhamento e regras sejam simplificados
e estabelecidos pelo Comitê Central de Governança de Dados; e
III - compartilhamento específico, quando se tratar de dados protegidos por sigilo, nos termos da
legislação, com concessão de acesso a órgãos e entidades específicos, nas hipóteses e para os fins
previstos em lei, cujo compartilhamento e regras sejam definidos pelo gestor de dados.
§ 1º A categorização do nível de compartilhamento será feita pelo gestor de dados, com base na
legislação.
§ 2º A categorização do nível de compartilhamento será detalhada de forma a tornar clara a
situação de cada item de informação.
§ 3º A categorização do nível de compartilhamento como restrito ou específico será publicada pelo
respectivo gestor de dados no prazo de noventa dias, contado da data de publicação das regras de
compartilhamento de que trata o art. 31.
§ 4º A categorização do nível de compartilhamento como restrito e específico especificará o
conjunto de bases de dados por ele administrado com restrições de acesso e as respectivas
motivações.
§ 5º A categorização do nível de compartilhamento, na hipótese de ainda não ter sido feita, será
realizada pelo gestor de dados quando responder a solicitação de permissão de acesso ao dado.
§ 6º A categorização do nível de compartilhamento será revista a cada cinco anos, contados da
data de publicação deste Decreto ou sempre que identificadas alterações nas diretrizes que
ensejaram a sua categorização.
§ 7º Os órgãos e entidades de que trata o art. 1º priorizarão a categoria de compartilhamento de
dados de maior abertura, em compatibilidade com as diretrizes de acesso a informação previstas
na legislação.
(...)
As regras gerais de compartilhamento encontram-se detalhadas a partir do Artigo 5º do Decreto
nº 10.046, 09/10/2019: http://www.planalto.gov.br/ccivil_03/_Ato2019-
2022/2019/Decreto/D10046.htm.

5.5. Arquitetura de segurança de dados


A arquitetura corporativa define os ativos e componentes de informações de uma empresa, suas
inter-relações e regras de negócios relacionadas à transformação, princípios e diretrizes.
A arquitetura Data Security é o componente da arquitetura corporativa que descreve como a
segurança dos dados é implementada dentro da organização para satisfazer as regras de negócios
e os regulamentos externos.
Atenção, a arquitetura influencia:
•Ferramentas usadas para gerenciar a segurança dos dados.
•Padrões e mecanismos de criptografia de dados.
•Diretrizes de acesso externos.
•Protocolos de transmissão de dados.
•Documentos necessários.
•Padrões de acesso remoto.
•Procedimentos de comunicação de incidentes de violação de segurança.

A arquitetura de segurança é particularmente importante para a integração de dados


entre:

• Sistemas internos e unidades de negócios.


• Uma organização e seus parceiros de negócios externos.
• Uma organização e agências reguladoras.

Por exemplo, um padrão de arquitetura referente a um mecanismo de integração orientado a


serviços entre partes internas e externas exigiria uma implementação de segurança de dados
diferente da arquitetura de integração tradicional de intercâmbio eletrônico de dados ( Electronic
Data Interchange - EDI).
Para uma organização de grande porte, a função formal de ligação entre essas disciplinas é
essencial para proteger as informações contra uso indevido, roubo, exposição e perda. Cada parte
deve estar ciente dos elementos que interessam às outras, para que possam falar uma linguagem
comum e trabalhar em direção a objetivos compartilhados.
5.6. Planejando a segurança de dados
O planejamento da segurança inclui o planejamento do processo, bem como a classificação dos
dados e o planejamento da arquitetura. Inclui segurança não apenas de sistemas, mas também de
instalações, dispositivos e credenciais.
A implementação de boas práticas começa com a identificação de requisitos. Eles se baseiam
amplamente em regulamentos para indústrias e regiões geográficas específicas. É importante
garantir que uma organização possa atender a requisitos que possam ser direcionados por aqueles
com quem interage; por exemplo, a União Europeia possui requisitos de privacidade mais rigorosos
do que os Estados Unidos. Os requisitos também serão baseados nos riscos relacionados ao cenário
do sistema da própria organização.
Os requisitos devem ser formalizados em políticas e apoiados por padrões coesos como níveis de
classificação. Políticas e padrões precisam ser mantidos e aperfeiçoados à medida em que os
regulamentos evoluem. Treinamento contínuo, acesso a dados e o uso do sistema precisarão ser
monitorados para garantir a conformidade.
A cultura corporativa influencia profundamente a maneira como mantemos os dados seguros. As
organizações geralmente acabam reagindo a crises, em vez de gerenciar proativamente a
responsabilidade e garantir a auditoria. Embora a segurança perfeita dos dados seja quase
impossível, a melhor maneira de evitar violações da segurança dos dados é conscientizar e entender
os requisitos, políticas e procedimentos de segurança.
As organizações podem aumentar a conformidade, por meio de:
Treinamento
Promoção de padrões por meio de treinamento em iniciativas de segurança em todos os níveis da
organização. Siga o treinamento com mecanismos de avaliação, como testes on-line focados em
melhorar a conscientização dos funcionários. Esse treinamento e teste devem ser obrigatórios e um
pré-requisito para a avaliação de desempenho dos funcionários.
Políticas consistentes
Definição de políticas de segurança de dados e políticas de conformidade regulamentar para grupos
de trabalho e departamentos que complementam e se alinham às políticas da organização. A adoção
de uma mentalidade "agir localmente" ajuda a envolver as pessoas de maneira mais ativa.
Avalie os benefícios da segurança
Vincule os benefícios da segurança de dados a iniciativas organizacionais. As organizações devem
incluir métricas objetivas para as atividades de segurança de dados em suas métricas de balanced
scorecard e avaliações de projetos.
Definir requisitos de segurança para fornecedores
Inclua requisitos de segurança de dados em contratos de nível de serviço e obrigações contratuais
de terceirização. Os contratos de Service Level Agreement (SLA) devem incluir todas as ações de
proteção de dados.
Crie um senso de urgênciax
Enfatize os requisitos legais, contratuais e regulamentares para criar um senso de urgência e uma
estrutura interna para o gerenciamento de segurança de dados.
Comunicações contínuas
Suporte a um programa contínuo de treinamento de segurança dos funcionários, informando-os
sobre práticas seguras de computação e ameaças atuais. Um programa em andamento comunica
que a computação segura é importante o suficiente para ser suportada pela gerência.

Lição módulo 4
1. Gerenciamento de metadados
Como princípio, os metadados são essenciais para o gerenciamento de dados.
Em outras palavras, você precisa de dados para gerenciar dados. Os metadados descrevem quais
dados você possui e, se não souber isso, não poderá gerenciá-los. O gerenciamento de metadados é
uma atividade fundamental que precisa ser realizada durante todo o ciclo de vida dos dados. O ciclo
de vida dos metadados também precisa ser gerenciado.
A definição mais comum de metadados – "dados sobre dados" – é aparentemente simples. Para
alguns, infelizmente, é uma fonte de confusão e não de esclarecimento, porque muitos tipos de
informações podem ser classificados como metadados e não existe uma linha clara entre "dados" e
"metadados". Em vez de tentar traçar essa linha, descreveremos como os metadados são usados e
por que são tão importantes.
Para entender o papel vital dos metadados no gerenciamento de dados, imagine uma grande
biblioteca, com centenas de milhares de livros e revistas, mas sem catálogo. Sem um catálogo, os
leitores podem nem saber como começar a procurar um livro específico ou mesmo um tópico
específico.
O catálogo não apenas fornece as informações necessárias (quais livros e materiais a biblioteca
possui e onde estão guardadas), mas também permite que os clientes encontrem materiais usando
diferentes pontos de partida (área de assunto, autor ou título). Sem o catálogo, encontrar um livro
específico seria difícil, se não impossível. Uma organização sem metadados é como uma biblioteca
sem um catálogo.
Como outros dados, os metadados requerem gerenciamento. À medida que a capacidade das
organizações de coletar e armazenar dados aumenta, o papel dos metadados no gerenciamento de
dados cresce em importância. O gerenciamento de metadados, no entanto, não é um fim em si; é um
meio pelo qual uma organização pode obter mais valor com seus dados. Para ser guiada por dados,
uma organização deve ser guiada por metadados.

1.1 Metadados e seus benefícios


No gerenciamento de dados, os metadados incluem informações sobre processos técnicos e de
negócio, regras e restrições de dados e estruturas de dados lógicas e físicas. Ele descreve os
próprios dados (por exemplo, bancos de dados, elementos de dados, modelos de dados), os
conceitos que os dados representam (por exemplo, processos de negócios, sistemas de
aplicativos, código de software, infraestrutura de tecnologia) e as conexões (relacionamentos)
entre os dados e os conceitos.
Os metadados auxiliam uma organização a entender seus dados, sistemas e fluxos de trabalho.
Ele permite a avaliação da qualidade dos dados e faz parte do gerenciamento de bancos de dados
e outros aplicativos. Contribui para a capacidade de processar, manter, integrar, proteger, auditar
e governar outros dados.
Os dados não podem ser gerenciados sem os metadados. Além disso, os próprios metadados
devem ser gerenciados.
Atenção, metadados confiáveis e bem gerenciados ajudam a:
•Aumentar a confiança nos dados, fornecendo contexto, permitindo a representação
consistente dos mesmos conceitos e a medição da qualidade dos dados.
•Ampliar o valor das informações estratégicas (por exemplo, dados mestre), possibilitando
vários usos.
•Identificar dados e processos redundantes e assim melhorar a eficiência operacional.
•Impedir o uso de dados desatualizados ou incorretos.
•Proteger informações confidenciais.
•Reduzir o tempo de pesquisa orientada a dados.
•Aperfeiçoar a comunicação entre consumidores de dados e profissionais de TI.
•Criar análise de impacto precisa, reduzindo assim o risco de falha do projeto.
•Melhorar o tempo de implementação, reduzindo o tempo do ciclo de vida do
desenvolvimento do sistema.
•Reduzir os custos de treinamento e diminuir o impacto da rotatividade de pessoal por
meio de documentação completa do contexto, histórico e origem dos dados.
•Dar suporte à conformidade regulamentar.
As organizações obtêm mais valor de seus ativos de dados se os dados forem de alta qualidade.
Os dados de qualidade dependem da governança. Como explicam os dados e processos que
permitem que as organizações funcionem, os metadados são críticos para a governança de dados.
Se os metadados são um guia para os dados em uma organização, eles devem ser bem
gerenciados.
Convém atenção também ao fato que Metadados mal gerenciados levam a:
•Dados redundantes e processos de gerenciamento de dados.
•Dicionários, repositórios e outros armazenamentos de metadados replicados e
redundantes.
•Definições inconsistentes de elementos de dados e riscos associados ao uso indevido de
dados.
•Origens e versões concorrentes e conflitantes dos metadados que reduzem a confiança
dos consumidores de dados.
•Dúvida sobre a confiabilidade de metadados e dados.
O gerenciamento bem executado de metadados permite um entendimento consistente dos
recursos de dados e um desenvolvimento interorganizacional mais eficiente.
1.2 Tipos de metadados
Os metadados são geralmente classificados em três tipos: estratégico, técnico ou operacional.
Os metadados de negócio se concentram amplamente no conteúdo e na condição dos dados e
também incluem detalhes relacionados à governança de dados.
Os metadados incluem nomes e definições não técnicos de conceitos, áreas de assunto, entidades
e atributos; tipos de dados de atributo e outras propriedades de atributo; descrições de faixa;
cálculos; algoritmos e regras de negócios; valores de domínio válidos e suas definições.
Seguem exemplos de metadados de negócios:
•Modelos de dados, definições e descrições de conjuntos de dados, tabelas e colunas.
•Regras de negócios, regras de qualidade de dados e regras de transformação, cálculos e
derivações.
•Origem e linhagem dos dados.
•Padrões e restrições de dados.
•Nível de segurança / privacidade dos dados.
•Problemas conhecidos com dados.
•Notas de uso de dados.
Os metadados técnicos fornecem informações sobre os detalhes técnicos dos dados, os sistemas
que armazenam dados e os processos que os movem dentro e entre sistemas.
São exemplos de metadados técnicos:
•Nomes e propriedades da tabela e da coluna do banco de dados físico.
•Direitos de acesso a dados, grupos, funções.
•Regras de CRUD de dados (Criar, Substituir, Atualizar e Excluir).
•Detalhes do trabalho ETL de dados (Extração, Transformação e Carregamento).
•Documentação da linhagem de dados, incluindo informações de impacto de alterações a
montante e a jusante.
•Agendas e dependências do ciclo de atualização de conteúdo.
Atenção, metadados operacionais descrevem detalhes do processamento e acesso aos dados,
como:
•Logs de execução de tarefas para programas em lote.
•Resultados de auditoria, balanceamento, medidas de controle e registros de erros.
•Relatórios e padrões de acesso à consulta, frequência e tempo de execução.
•Patches e plano e execução de manutenção de versão, nível de patch atual.
•Provisões de backup, retenção, data de criação, recuperação de desastres.
Essas categorias auxiliam as pessoas a entender o conjunto de informações que se enquadram
nos metadados, bem como as funções que produzem metadados. No entanto, as categorias
também podem levar a confusão. As pessoas podem ser envolvidas em perguntas sobre a qual
categoria um conjunto de metadados pertence ou quem deve usá-lo.
É melhor pensar nessas categorias em relação à origem dos metadados, e não como eles são
usados. Em relação ao uso, as distinções entre os tipos de metadados não são rigorosas.
Determinada equipe pode utilizar metadados técnicos e/ou operacionais, conforme o tipo de
demanda a ser atendida.
1.3 Metadados são dados
Embora os metadados possam ser entendidos por meio de seus usos e categorias, é importante
destacar que os metadados são dados. Como outros dados, ele tem um ciclo de vida. Devemos
gerenciá-lo em relação ao seu ciclo de vida.
Uma organização deve planejar os metadados de que precisa, projetar processos para que os
metadados de alta qualidade possam ser criados e mantidos e aumentar seus metadados à
medida que aprende com seus dados.

1.4 Metadados e gerenciamento de dados


Os metadados são essenciais para o gerenciamento de dados e o uso de dados. Todas as grandes
organizações produzem e utilizam muitos dados. Em uma organização, indivíduos diferentes terão
níveis diferentes de conhecimento de dados, mas nenhum indivíduo saberá tudo sobre os dados.
Essas informações devem ser documentadas ou a organização corre o risco de perder um
conhecimento valioso sobre si mesma. Os metadados fornecem o principal meio de capturar e
gerenciar o conhecimento organizacional sobre dados.
O gerenciamento de metadados, entretanto, não é apenas um desafio de gerenciamento de
conhecimento, é também uma necessidade de gerenciamento de riscos. Os metadados são
necessários para garantir que uma organização possa identificar dados particulares ou
confidenciais e que possa gerenciar o ciclo de vida dos dados para seu próprio benefício e para
atender aos requisitos de conformidade e minimizar a exposição ao risco.
Sem metadados confiáveis, uma organização não sabe quais dados possui, o que representa,
onde se origina, como transita pelos sistemas, quem tem acesso a eles ou o que significa, quais
dados são de alta qualidade. Sem os metadados, uma organização não pode gerenciar seus dados
como um ativo. De fato, sem os metadados, uma organização pode não ser capaz de gerenciar
seus dados.
Na imagem a seguir, conheça o ciclo de vida dos metadados:

1.5 Metadados e interoperabilidade


À medida que a tecnologia evoluiu, a velocidade na qual os dados são gerados também
aumentou.
Os metadados técnicos tornaram-se absolutamente essenciais para a maneira como os dados são
movidos e integrados. O Padrão de Registro de Metadados da ISO, ISO/IEC 11179, visa permitir a
troca de dados orientada por metadados em um ambiente heterogêneo, com base em definições
exatas de dados.
Os metadados presentes no XML e em outros formatos permitem o uso dos dados. Outros tipos
de marcação de metadados permitem que os dados sejam trocados, mantendo os significantes de
propriedade, requisitos de segurança, etc.
Saiba Mais sobre o Padrão de Registro de Metadados da ISO/IEC 11179:

1.6 Estratégia de metadados


Conforme você já percebeu, os tipos de informações que podem ser usados como metadados são
amplos. Os metadados são criados em vários setores da organização. Os desafios vêm com a
união de metadados para que pessoas e processos possam utilizá-los.
Uma estratégia de metadados descreve como uma organização pretende gerenciá-los e como ela
passará do estado atual para as práticas avançadas e inovadoras (estado futuro).
Uma estratégia de metadados deve fornecer uma estrutura para as equipes de desenvolvimento
melhorarem o gerenciamento de metadados. O desenvolvimento de requisitos de metadados
ajudará a esclarecer os direcionadores da estratégia e a identificar possíveis obstáculos à sua
implementação.
A estratégia inclui definir o conteúdo e a arquitetura de metadados da situação atual e a ser
alcançada pela organização, bem como as fases de implementação necessárias para atender aos
objetivos estratégicos.
Os passos para a estratégia de metadados incluem:

Clique no(s) item(s) abaixo para navegar pelo infográfico

Iniciar o planejamento da estratégia de metadados


O objetivo do início e do planejamento é permitir que a equipe de estratégia de metadados
defina suas metas de curto e longo prazo. O planejamento inclui a elaboração de uma carta,
escopo e objetivos alinhados aos esforços gerais de governança e o estabelecimento de um plano
de comunicação para apoiar o esforço. As principais partes interessadas devem estar envolvidas
no planejamento.

Realizar entrevistas com as principais partes interessadas


As entrevistas com as partes interessadas técnicas e de negócios fornecem uma base de
conhecimento para a estratégia de Metadados.

Avaliar fontes de metadados existentes e arquitetura da informação


A avaliação determina o grau relativo de dificuldade na solução dos problemas de metadados e
sistemas identificados nas entrevistas e na revisão da documentação. Durante esse estágio,
realize entrevistas detalhadas da equipe principal de TI e revise a documentação das arquiteturas
do sistema, modelos de dados, etc.

Desenvolver a arquitetura futura de metadados


Refine e confirme a visão futura e desenvolva a arquitetura de destino de longo prazo para o
ambiente de metadados gerenciados neste estágio. Essa fase deve levar em consideração
componentes estratégicos, como estrutura organizacional, alinhamento com administração e
administração de dados, arquitetura de metadados gerenciados, arquitetura de entrega de
metadados, arquitetura técnica e arquitetura de segurança.

Desenvolver plano de implementação em fases


Valide, integre e priorize os resultados das entrevistas e análises de dados. Documente a
estratégia de metadados e defina uma abordagem de implementação em fases para passar do
ambiente de metadados gerenciado existente para o futuro.

A estratégia evoluirá com o tempo, à medida que os requisitos de metadados, a arquitetura e o


ciclo de vida dos metadados forem mais bem compreendidos.
1.7 Entender os requisitos de metadados
Os requisitos de metadados começam com o conteúdo: quais metadados são necessários e em
que nível. Por exemplo, nomes físicos e lógicos precisam ser capturados para colunas e tabelas. O
conteúdo de metadados é amplo e os requisitos virão dos consumidores de dados estratégicos a
técnicos.
Existem ainda diversos requisitos focados na funcionalidade associados a uma solução
abrangente de metadados. São eles:
•Frequência com a qual os atributos e conjuntos de metadados serão atualizados.
•Tempo das atualizações em relação às alterações de origem.
•Se as versões históricas dos metadados precisam ser mantidas.
•Quem pode acessar os metadados.
•Como os usuários acessam (funcionalidade específica da interface do usuário para
acessar).
•Como os metadados serão modelados para armazenamento.
•O grau de integração de metadados de diferentes fontes; regras para integração.
•Processos e regras para atualização de metadados (registro e referência para aprovação).
•Funções e responsabilidades para gerenciar metadados.
•Requisitos de qualidade de metadados.
•Segurança para metadados - alguns metadados não podem ser expostos porque revelam
a existência de dados altamente protegidos).

1.8 Arquitetura de Metadados


Como outras formas de dados, os metadados têm um ciclo de vida.
Embora existam maneiras diferentes de arquitetar uma solução de metadados, conceitualmente
todas as soluções de gerenciamento de metadados incluem camadas de arquiteturas que
correspondem a pontos no ciclo de vida dos metadados. São elas:
•Criação e fornecimento de metadados.
•Armazenamento de metadados em um ou mais repositórios.
•Integração de metadados.
•Entrega de metadados.
•Acesso e uso de metadados.
•Controle e gerenciamento de metadados.
Um sistema de gerenciamento de metadados deve ser capaz de reunir metadados de várias
fontes diferentes. Os sistemas diferem dependendo do grau de integração e do papel do sistema
de integração na manutenção dos metadados.
Um ambiente de metadados gerenciados deve isolar o usuário final das várias e diferentes fontes
de metadados. A arquitetura deve fornecer um único ponto de acesso para os metadados
necessários. O design da arquitetura depende dos requisitos específicos da organização.
Conheça a seguir, as três abordagens arquiteturais técnicas para a construção de um repositório
comum de metadados refletem as abordagens para projetar data warehouses:

• Centralizada
Uma arquitetura centralizada consiste em um único repositório de metadados que contém cópias
dos metadados das várias fontes. As organizações com recursos limitados de TI, ou aquelas que
procuram automatizar o máximo possível, podem optar por evitar essa opção de arquitetura. As
organizações que buscam um alto grau de consistência no repositório comum de metadados
podem se beneficiar de uma arquitetura centralizada.

Centralizada

•Distribuída
Uma arquitetura completamente distribuída mantém um único ponto de acesso. O mecanismo de
recuperação de metadados responde às solicitações do usuário, recuperando dados dos sistemas
de origem em tempo real; não há repositório persistente.
Nessa arquitetura, o ambiente de gerenciamento de metadados mantém os catálogos do sistema
de origem e as informações de pesquisa necessárias para processar efetivamente as consultas e
pesquisas do usuário.
Um broker de solicitação de objeto comum ou protocolo de middleware semelhante acessa esses
sistemas de origem.

•Híbrida
Uma arquitetura híbrida combina características de arquiteturas centralizadas e distribuídas. Os
metadados ainda transitam diretamente dos sistemas de origem para um repositório
centralizado. No entanto, o design do repositório considera apenas os metadados adicionados
pelo usuário, os itens padronizados críticos e as adições de fontes manuais.

Implementar um ambiente de metadados gerenciados de forma incremental visa minimizar riscos


e facilitar a aceitação.
O conteúdo do repositório deve ser genérico no design. Não deve meramente refletir os projetos
de banco de dados do sistema de origem.
Os especialistas da área empresarial devem ajudar a criar um modelo abrangente de metadados
para o conteúdo. O planejamento deve considerar a integração de metadados para que os
consumidores de dados possam ver em diferentes fontes de dados. A capacidade de fazer isso
será um dos principais recursos estratégicos do repositório. Ele deve abrigar versões atuais,
planejadas e históricas dos metadados.
Frequentemente, a primeira implementação é um piloto para provar conceitos e aprender sobre o
gerenciamento do ambiente de metadados.
1.9 Qualidade de metadados
Ao gerenciar a qualidade dos metadados é importante reconhecer que diversos metadados se
originam por meio dos processos existentes. Por exemplo, o processo de modelagem de dados
produz definições de tabela e coluna e outros metadados essenciais para a criação de modelos de
dados. Para obter metadados de alta qualidade, os metadados devem ser vistos como um
produto desses processos e não como um subproduto deles.
Novamente, os metadados seguem o ciclo de vida dos dados. Os metadados confiáveis começam
com um plano e aumentam o valor à medida que são usados, mantidos e aprimorados. As fontes
de metadados, como o modelo de dados, a documentação de mapeamento de origem para o
destino, os logs de ETL e similares devem ser tratadas como fontes de dados. Eles devem
implementar processos e controles para garantir que produzam um produto de dados confiável e
utilizável.
Todos os processos, sistemas e dados precisam de algum nível de meta-informação; isto é, uma
descrição de suas partes componentes e como elas funcionam. Além disso, à medida que o
processo, sistema ou dados são usados, as meta-informações crescem e mudam. Com isso, o
sistema precisa ser mantido e aprimorado.
O uso de metadados geralmente resulta no reconhecimento de requisitos para metadados
adicionais. Por exemplo, os consumidores que utilizam dados de usuários de dois sistemas
diferentes podem precisar saber de onde os dados foram originados para entender melhor o
perfil dos usuários.
Alguns princípios gerais do gerenciamento de metadados descrevem os meios para gerenciar sua
qualidade, são eles:
•Responsabilidade: Reconhecer que os metadados geralmente são produzidos por meio de
processos existentes (modelagem de dados, SDLC (systems development life cycle),
definição de processos de negócios) e responsabilizar os proprietários dos processos pela
qualidade dos metadados (tanto na criação inicial quanto na manutenção).
•Padrões: Definir, impor e auditar os padrões dos metadados para simplificar a integração
e permitir o uso.
•Melhorar: Criar um mecanismo de feedback para que os consumidores possam informar a
equipe de Gerenciamento de Metadados de que estão incorretos ou desatualizados.
Como outros dados, os metadados podem ser perfilados e inspecionados quanto à qualidade. Sua
manutenção deve ser agendada ou concluída como uma parte auditável do trabalho do projeto.

1.10 Governança de Metadados


Mudar de um ambiente de metadados não gerenciado para um gerenciado exige trabalho e
disciplina. Não é fácil, mesmo que a maioria das pessoas reconheça o valor de metadados
confiáveis. A prontidão organizacional é uma grande preocupação, assim como os métodos de
governança e controle. Uma abordagem abrangente de metadados exige que a equipe de
negócios e a de tecnologia possam trabalhar em conjunto de maneira multifuncional.
O gerenciamento de metadados é de baixa prioridade em muitas organizações.
Um conjunto essencial de metadados precisa de coordenação e compromisso. Do ponto de vista
do gerenciamento de dados, os metadados essenciais dos negócios incluem definições, modelos e
arquitetura de dados. Os metadados técnicos essenciais incluem descrições técnicas de arquivos e
conjuntos de dados, nomes de tarefas, agendas de processamento etc.
As organizações devem determinar seus requisitos específicos para o gerenciamento do ciclo de
vida de metadados críticos e estabelecer processos de governança para permitir esses requisitos.
Recomenda-se atribuir funções e responsabilidades formais a recursos dedicados, especialmente
em áreas grandes ou críticas aos negócios. A governança de metadados requer metadados e
controles, para que a equipe encarregada de gerenciar os metadados possa testar os princípios
nos metadados criados e utilizados.

2. Gerenciamento de qualidade de dados


O gerenciamento eficaz de dados envolve um conjunto de processos inter-relacionados que
permitem a organização utilizar seus dados para atingir objetivos estratégicos. O gerenciamento
de dados inclui a capacidade de projetar dados para desenvolver aplicações, armazená-los e
acessá-los com segurança, compartilhá-los adequadamente e aprender com eles para atender aos
objetivos estratégicos e operacionais.
Atenção, as organizações que almejam obter valor com seus dados precisam saber se eles são
confiáveis. Em outras palavras, se os dados são de alta qualidade. Entretanto, vários fatores
podem prejudicar a qualidade dos dados, tais como:
•Falta de entendimento sobre os efeitos de dados de baixa qualidade no sucesso
organizacional.
•Planejamento ruim ou insuficiente.
•Projeto isolado de processos e sistemas (silos).
•Processos de desenvolvimento técnico inconsistentes.
•Documentação incompleta e metadados.
•Falta de padrões e governança.
Uma parcela das organizações não prioriza definir o que torna os dados adequados ao objetivo
estratégico e, consequentemente, não têm compromisso com a qualidade dos dados.
Todas as disciplinas de gerenciamento de dados contribuem para a qualidade dos dados. Como as
decisões ou ações desinformadas de qualquer pessoa que interaja com dados podem resultar em
dados de baixa qualidade, a produção de dados de alta qualidade requer comprometimento e
coordenação multifuncionais.
As organizações e as equipes devem estar cientes disso e planejar dados de alta qualidade,
executando processos e projetos de maneira a responder pelos riscos relacionados a condições
inesperadas ou inaceitáveis nos dados.
Como nenhuma organização possui processos técnicos perfeitos ou práticas perfeitas de
gerenciamento de dados, todas as organizações enfrentam problemas relacionados à qualidade
de seus dados. Esses problemas podem gerar prejuízos elevados. As organizações que gerenciam
formalmente a qualidade dos dados têm menos problemas em relação aquelas que não priorizam
a qualidade dos dados.
A qualidade dos dados está se tornando uma necessidade estratégica. A capacidade de
demonstrar que os dados são de alta qualidade, como a capacidade de demonstrar que os dados
foram protegidos adequadamente, é exigida por alguns regulamentos. Os parceiros de negócios e
os usuários (consumidores de dados) esperam que os dados sejam confiáveis. Uma organização
que pode mostrar que gerencia bem seus dados obtém uma vantagem competitiva.
O objetivo deste tópico é definir os principais conceitos relacionados à qualidade dos dados e
discutir o gerenciamento da qualidade em relação a governança de dados.

2.2 Dimensões da qualidade dos dados


Uma dimensão da qualidade de dados é um recurso ou característica mensurável dos dados.
O termo dimensão é usado para fazer a conexão com as dimensões na medição de objetos físicos
(por exemplo, comprimento, largura, altura). As dimensões da qualidade dos dados fornecem um
vocabulário para definir os requisitos de qualidade dos dados. A partir daí, eles podem ser
utilizados para definir os resultados da avaliação inicial da qualidade dos dados, bem como das
medições em andamento.
Para medir a qualidade dos dados, uma organização precisa estabelecer características que não
são apenas importantes para os processos de negócios, mas também mensuráveis e factíveis.
As dimensões fornecem uma base para regras mensuráveis, as quais devem estar diretamente
vinculadas aos riscos potenciais em processos críticos. Atenção ao exemplo a seguir:
•Risco: Se os dados no campo de endereço de e-mail do usuário estiverem incompletos,
haverá prejuízo no processo de comunicação.
•Um meio de mitigar o risco: Deve ser medida a porcentagem de usuários para os quais se
tem endereços de e-mail utilizáveis para aprimorar os processos até se obter um endereço
de e-mail utilizável para pelo menos 98% de usuários.
Diversos pensadores importantes escreveram sobre as dimensões da qualidade dos dados.
Embora não haja um único conjunto de dimensões de qualidade de dados acordadas, todos os
conjuntos contêm ideias comuns.
As dimensões incluem algumas características que podem ser medidas objetivamente
(integridade, validade, conformidade do formato) e outras que dependem muito do contexto ou
da interpretação subjetiva (usabilidade, confiabilidade, reputação). Quaisquer que sejam os
nomes usados, as dimensões focam se há dados suficientes (integridade), se estão corretos
(precisão, validade), quão bem eles se encaixam (consistência, integridade, exclusividade), se estão
atualizados (pontualidade), acessível, utilizável e seguro.
Em 2013, o DAMA (The Data Management Association) do Reino Unido produziu um documento
técnico propondo seis dimensões principais da qualidade dos dados. O conjunto inclui:
•Completude: a proporção de dados armazenados contra o potencial de 100%.
•Exclusividade: nenhuma instância de entidade será registrada mais de uma vez após
identificada.
•Oportunidade: o grau em que os dados representam a realidade a partir do momento
requerido.
•Validade: os dados são válidos se estiverem em conformidade com a sintaxe (formato,
tipo, intervalo) de sua definição.
•Precisão: o grau em que os dados descrevem corretamente o objeto ou evento do 'mundo
real' sendo descrito.
•Consistência: A ausência de diferença ao comparar duas ou mais representações de uma
instancia com uma definição.
Além dessas dimensões, o documento oficial da DAMA UK descreve outras características que têm
impacto na qualidade.
•Usabilidade: os dados são compreensíveis, relevantes, acessíveis, mantidos e no nível
certo de precisão?
•Problemas de tempo (além da própria tempestividade): é estável, mas responde a
solicitações de mudança legítimas?
•Flexibilidade: os dados são comparáveis e compatíveis com outros dados? Possui
agrupamentos e classificações úteis? Pode ser reaproveitado? É fácil de manipular?
•Confiança: a governança, a proteção e a segurança dos dados estão vigentes? Qual é a
credibilidade dos dados? É verificável?
•Valor: existe um levantamento de custo/benefício para os dados? É ou serão utilizados da
melhor maneira possível? Põe em risco a segurança ou a privacidade das pessoas ou as
responsabilidades legais da organização? Apoia ou contradiz a imagem corporativa ou a
visão estratégica corporativa?
Qualquer organização que almeja melhorar a qualidade de seus dados deve adotar ou
desenvolver um conjunto de dimensões por meio das quais possa mensurar a qualidade e
alcançar um consenso sobre as dimensões que podem fornecer um ponto de partida para a
construção de um vocabulário comum sobre o tema.
2.3 Gerenciamento da qualidade dos dados
Conforme observado anteriormente, às vezes o termo qualidade dos dados é usado para se
referir aos processos usados para medir ou melhorar a qualidade dos dados. Esses processos
constituem o gerenciamento da qualidade dos dados. Embora todas as funções de gerenciamento
de dados tenham potencial para afetar a qualidade.
Atenção, o gerenciamento formal da qualidade dos dados concentra-se em ajudar a organização
a:
•Definir dados de alta qualidade: por meio de padrões, regras e requisitos de qualidade de
dados.
•Avaliar os dados: em relação a esses padrões e comunicar resultados às partes
interessadas.
•Monitorar e relatar: a qualidade dos dados em aplicações e armazenamentos de dados.
•Identificar problemas: e avaliar e defender oportunidades de melhoria.
O gerenciamento formal da qualidade dos dados é semelhante ao gerenciamento contínuo da
qualidade de outros serviços. Ele inclui o gerenciamento de dados durante o seu ciclo de vida,
definindo padrões, incorporando qualidade aos processos que criam, transformam e armazenam
dados e medindo dados em relação aos padrões. Gerenciar dados para esse nível geralmente
requer uma equipe de programa de qualidade de dados.
A equipe do programa de qualidade de dados é responsável por envolver os profissionais de
gerenciamento de dados técnicos e de negócios e conduzir o trabalho de aplicação de técnicas de
gerenciamento de qualidade aos dados, para garantir que os dados sejam adequados ao
consumo para uma variedade de propósitos.
A equipe provavelmente estará envolvida em uma série de projetos por meio dos quais eles
podem estabelecer processos e práticas recomendadas enquanto abordam problemas de dados
de alta prioridade. Como o gerenciamento da qualidade dos dados envolve o gerenciamento do
ciclo de vida dos dados, um programa de qualidade dos dados também terá responsabilidades
operacionais relacionadas ao uso dos dados. Por exemplo, relatórios sobre os níveis de qualidade
dos dados e participação na análise, quantificação e priorização de problemas de dados.
A equipe ainda é responsável por trabalhar com aqueles que precisam de dados para realizar suas
tarefas, para garantir que os dados atendam às suas necessidades e por trabalhar com aqueles
que criam, atualizam ou excluem dados no decorrer de suas tarefas para garantir que eles
estejam manipulando os dados corretamente. A qualidade dos dados depende de todos que
interagem com os dados, não apenas dos profissionais de gerenciamento de dados.
Como é o caso da governança de dados e do gerenciamento de dados como um todo, o
gerenciamento da qualidade dos dados é um programa, não um projeto. Incluirá o trabalho de
projeto e manutenção, juntamente com o compromisso com as comunicações e o treinamento.
Mais importante, o sucesso a longo prazo do programa de melhoria da qualidade dos dados
depende de uma organização mudar sua cultura e adotar uma mentalidade de qualidade.
Conforme declarado no Manifesto de dados do líder: mudanças fundamentais e duradouras
exigem liderança e envolvimento comprometidos de pessoas em todos os níveis de uma
organização.
As pessoas que utilizam dados para realizar seu trabalho – o que significa um percentual elevado -
precisam promover mudanças. E uma das mudanças mais críticas a serem focadas é como as
organizações gerenciam e melhoram a qualidade de seus dados.

Os princípios de gerenciamento de dados da DAMA afirmam que o gerenciamento de dados é o


gerenciamento do ciclo de vida dos dados e que gerenciar dados significa gerenciar a qualidade
dos dados.
Durante o ciclo de vida dos dados, as atividades de gerenciamento da qualidade dos dados
ajudam uma organização a definir e medir as expectativas relacionadas aos seus dados. Essas
expectativas podem mudar ao longo do tempo à medida que os usos organizacionais dos dados
evoluem.

2.4 Qualidade dos dados e outras funções de gerenciamento de dados


Conforme citado anteriormente, todas as áreas do gerenciamento de dados têm o potencial de
afetar a qualidade dos dados.
Governança e administração de dados, modelagem de dados e gerenciamento de metadados têm
efeitos diretos na definição dados de alta qualidade. Se estes não forem bem executados, é muito
difícil ter dados confiáveis. Os três estão relacionados na medida em que estabelecem padrões,
definições e regras relacionadas aos dados. A qualidade de dados visa atender às expectativas de
forma coletiva descrevendo um conjunto de expectativas comuns.
A qualidade dos dados é baseada na premissa de que atende aos requisitos dos consumidores de
dados. Ter um processo robusto pelo qual os dados são definidos suporta a capacidade de uma
organização formalizar e documentar os padrões e requisitos pelos quais a qualidade dos dados
pode ser medida.
Os metadados definem o que os dados representam. A administração de dados e os processos de
modelagem de dados são fontes de metadados críticos. Metadados bem gerenciados também
podem apoiar o esforço para melhorar a qualidade dos dados.
Um repositório de metadados pode abrigar resultados de medições de qualidade de dados que
podem ser compartilhados por toda a organização, de forma que a equipe de qualidade de dados
possa ter insumos para produzir consenso sobre as prioridades e fatores de melhoria do
Programa de Qualidade de Dados.
Um programa de qualidade de dados é mais eficaz quando faz parte de um programa de
governança de dados, uma vez que isto que esse alinhamento visa identificar problemas de
qualidade de dados e propor soluções a serem discutidas e avaliadas para como a política de
governança de dados na organização.
A incorporação dos esforços de qualidade dos dados no escopo da governança de dados permite
que a equipe do programa de qualidade dos dados trabalhe com uma variedade de partes
interessadas e facilitadores, tais como:
•Equipe de risco e segurança que pode ajudar a identificar vulnerabilidades organizacionais
relacionadas a dados.
•Equipe de engenharia e treinamento de processos de negócios que pode ajudar as
equipes a implementar melhorias de processos que aumentam a eficiência e resultam em
dados mais adequados para usos posteriores.
•Gestores de dados de negócio, operacionais e proprietários de dados que podem
identificar dados críticos, definir padrões e expectativas de qualidade e priorizar a correção
de problemas de dados.
Atenção, uma organização de governança pode acelerar o trabalho de um programa de qualidade
de dados, por meio das seguintes ações:
•Definindo as prioridades.
•Desenvolvendo e agindo na manutenção de padrões e políticas para a qualidade dos
dados.
•Estabelecendo mecanismos de comunicação e compartilhamento de conhecimento.
•Monitoramento e geração de relatórios sobre desempenho e medições de qualidade de
dados.
•Compartilhando resultados da inspeção da qualidade dos dados para conscientizar e
identificar oportunidades de melhoria.
Os programas de governança também costumam ser responsáveis pelo gerenciamento de dados
mestre e gerenciamento de dados de referência. Vale ressaltar que o gerenciamento de dados
mestre e o gerenciamento de dados de referência são exemplos de processos focados na
curadoria de tipos específicos de dados com o objetivo de garantir sua qualidade. Simplesmente
rotular um conjunto de dados de "Dados Mestre" implica certas expectativas sobre seu conteúdo
e confiabilidade.
2.5 Qualidade e regulação de dados
A qualidade como a segurança dos dados proporciona uma vantagem estratégica.
Usuários e parceiros de negócios esperam e estão começando a exigir dados completos e
precisos. A qualidade dos dados também é um requisito regulatório em alguns casos. As práticas
de gerenciamento de dados podem ser auditadas.
Os regulamentos diretamente conectados às práticas de qualidade dos dados consideram os
seguintes exemplos:
•Sarbanes-Oxley (EUA), que se concentra na precisão e validade das transações financeiras.
•Solvência II (UE), que se concentra na linhagem de dados e na qualidade dos dados
subjacentes aos modelos de risco.
•O Regulamento Geral de Proteção de Dados (GDPR, União Européia) afirma que os dados
pessoais devem ser precisos e, quando necessário, mantidos atualizados. Devem ser
tomadas medidas razoáveis para apagar ou corrigir dados pessoais imprecisos.
•A Lei de Proteção de Informações Pessoais e Documentos Eletrônicos (PIPEDA, Canadá)
afirma que os dados pessoais devem ser tão precisos, completos e atualizados para seus
fins.
Vale ressaltar que, mesmo quando os requisitos de qualidade dos dados não são especificamente
mencionados, a capacidade de proteger dados pessoais depende, em parte, da alta qualidade
desses dados.

2.6 Ciclo de melhoria da qualidade dos dados


A maioria das abordagens para melhoria da qualidade dos dados baseia-se nas técnicas de
melhoria da qualidade na fabricação de produtos físicos. Nesse paradigma, os dados são
entendidos como o produto de um conjunto de processos.
Em sua forma mais simples, um processo é definido como uma série de etapas que transforma
entradas em saídas.
Um processo que cria dados pode consistir em uma etapa (coleta de dados) ou várias etapas:
coleta de dados, integração em um data warehouse, agregação em um data mart, etc. Em
qualquer etapa, os dados podem ser afetados negativamente, por ter sido coletado
incorretamente, eliminado ou duplicado entre sistemas, alinhado ou agregado incorretamente,
etc.
Melhorar a qualidade dos dados requer a capacidade de avaliar o relacionamento entre entradas
e saídas para garantir que as entradas atendam aos requisitos do processo e as saídas estejam
em conformidade com as expectativas. Como as saídas de um processo se tornam entradas para
outros processos, os requisitos devem ser definidos ao longo de toda a cadeia de dados.
Uma abordagem geral para a melhoria da qualidade dos dados é uma versão do
ciclo Shewhart/Deming.
Com base em método científico, o ciclo de Shewhart/Deming é um modelo de solução de
problemas conhecido como 'planejar-fazer-verificar-agir'. A melhoria ocorre por meio de um
conjunto definido de etapas.
A condição dos dados deve ser medida em relação aos padrões e, se não atender aos padrões,
a(s) causa(s) raiz(es) da discrepância em relação aos padrões deve(m) ser identificada(s) e
remediada(s).
As causas-raízes podem ser encontradas em qualquer uma das etapas do processo, técnicas ou
não técnicas.
Uma vez remediados, os dados devem ser monitorados para garantir que continuem a atender
aos requisitos.
Conheça a seguir o ciclo de Shewhart/Deming
Para um determinado conjunto de dados, um ciclo de melhoria da qualidade começa
identificando os dados que não atendem aos requisitos dos consumidores, que são problemas e
geram obstáculos à consecução dos objetivos de negócios.
Os dados precisam ser avaliados em relação às principais dimensões da qualidade e aos
requisitos de negócio conhecidos. As causas principais dos problemas precisarão ser identificadas
para que as partes interessadas possam entender os custos da correção e os riscos de não
remediá-los.
Esse trabalho geralmente é realizado em conjunto com o Data Stewards e outras partes
interessadas.
Acesse as abas a seguir para conhecer mais sobre as etapas do ciclo.

•Planejar
No estágio Planejar (Plan), a equipe de qualidade dos dados (QD) avalia o escopo, o impacto e a
prioridade dos problemas conhecidos e avalia alternativas para resolvê-los. Esse plano deve ser
baseado em uma base sólida de análise das causas dos problemas. A partir do conhecimento das
causas e do impacto dos problemas, é possível entender o custo / benefício, determinar a
prioridade e formular um plano básico para resolvê-los.

•Fazer
No estágio Fazer (Do), a equipe de qualidade de dados lidera os esforços para abordar as causas
principais dos problemas e planejar o monitoramento contínuo dos dados. Para causas raízes
baseadas em processos não técnicos, a equipe de QD pode trabalhar com os responsáveis pelos
processos para implementar mudanças. Para causas raiz que exigem alterações técnicas, a equipe
de QD deve trabalhar com equipes técnicas e garantir que os requisitos sejam implementados
corretamente e que nenhum erro não intencional seja introduzido por alterações técnicas.
•Verificar
O estágio de Verificar (Check) envolve o monitoramento ativo da qualidade dos dados, conforme
medido em relação aos requisitos. Desde que os dados atendam aos limites definidos para a
qualidade, ações adicionais não são necessárias. Os processos serão considerados sob controle e
atendendo aos requisitos de negócios. No entanto, se os dados estiverem abaixo dos limites de
qualidade aceitáveis, ações adicionais deverão ser tomadas para elevá-lo a níveis aceitáveis.

•Agir
O estágio Agir (Act) é para atividades que abordam e resolvem problemas emergentes de
qualidade de dados. O ciclo é reiniciado, à medida que as causas dos problemas são avaliadas e as
soluções propostas. A melhoria contínua é alcançada iniciando um novo ciclo.
Novos ciclos começam como:
As medidas existentes caem abaixo dos limites.
Novos conjuntos de dados estão sob investigação.
Novos requisitos de qualidade de dados emergem para conjuntos de dados existentes.
Regras, padrões ou expectativas de negócios mudam.
Estabelecer critérios para a qualidade dos dados no início de um processo ou construção do
sistema é um sinal de uma organização com maturidade no gerenciamento de dados. Fazer isso
exige governança e disciplina, além de colaboração multifuncional.
Integrar a qualidade nos processos de gerenciamento de dados desde o início custa menos do
que modernizá-la. Manter dados de alta qualidade em todo o ciclo de vida dos dados é menos
arriscado do que tentar melhorar a qualidade em um processo existente. Isso também cria um
impacto muito menor na organização.
É melhor fazer as coisas corretamente da primeira vez, embora poucas organizações tenham o
cuidado de fazê-lo. Mesmo se o fizerem, gerenciar a qualidade é um processo contínuo. As
demandas em mudança e o crescimento orgânico ao longo do tempo podem causar problemas
de qualidade dos dados que podem ser onerosos se desmarcados, mas podem ser cortados pela
raiz se uma organização estiver atenta aos riscos potenciais.

2.7 Qualidade dos dados e comprometimento da liderança


Os problemas de qualidade dos dados podem surgir em qualquer ponto do ciclo de vida dos
dados, desde a criação até o descarte.
Ao investigar as causas principais, os analistas devem procurar possíveis culpados, como
problemas com entrada de dados, processamento de dados, design de sistema e intervenção
manual em processos automatizados.
Muitos problemas terão múltiplas causas e fatores contribuintes (especialmente se as pessoas
tiverem criado maneiras de contorná-los). Essas causas de problemas também implicam que
problemas de qualidade de dados podem ser evitados por meio de:
•Melhoria no design de interface.
•Teste de regras de qualidade de dados como parte do processamento.
•Foco na qualidade dos dados no design do sistema.
•Controles rigorosos da intervenção manual em processos automatizados.
Obviamente, táticas preventivas devem ser usadas. No entanto, o senso comum diz e pesquisas
indicam que muitos problemas de qualidade dos dados são causados pela falta de
comprometimento organizacional, que por sua vez resultam da falta de liderança de governança e
de gerenciamento.
Toda organização possui ativos de informação e dados que são estratégicos para suas operações.
De fato, as operações dependem da capacidade de compartilhar informações. Apesar disso,
poucas organizações gerenciam esses ativos com rigor.
Vários programas de controle e ativos de informações são orientados apenas pela conformidade e
não pelo valor potencial dos dados como um ativo. A falta de reconhecimento por parte da
liderança significa falta de compromisso dentro de uma organização para gerenciar dados como
um ativo, incluindo o gerenciamento de sua qualidade.
Sua atenção, às barreiras para o gerenciamento eficaz da qualidade dos dados englobam:
•Falta de conscientização por parte da liderança e da equipe.
•Falta de governança de negócios.
•Falta de liderança e gestão.
•Dificuldade em justificar melhorias.
•Instrumentos inadequados ou ineficazes para medir o valor.
Essas barreiras têm efeitos negativos na experiência do cliente, produtividade, moral, eficácia
organizacional, receita e vantagem competitiva. Eles aumentam os custos de administração da
organização e também introduzem riscos.
Assim como no entendimento da causa raiz de qualquer problema, o reconhecimento dessas
barreiras - as causas principais dos dados de baixa qualidade - fornece à organização uma visão
de como melhorar sua qualidade.
Se a organização perceber que não possui governança, propriedade e responsabilidade
corporativa fortes, poderá resolver o problema estabelecendo governança, propriedade e
responsabilidade empresarial.
Se a liderança perceber que a organização não sabe como colocar as informações em
funcionamento, a liderança poderá implementar processos para que a organização possa
aprender a fazê-lo.
O reconhecimento de um problema é o primeiro passo para resolvê-lo!
Realmente, resolver problemas exige trabalho. A maioria das barreiras ao gerenciamento de
informações como um ativo é cultural. Para resolvê-los, é necessário um processo formal de
gerenciamento de mudanças organizacionais.
A imagem a seguir apresenta as barreiras ao gerenciamento de dados como um ativo estratégico,
apresentadas na DMBOK2.

2.8 Organização e mudança cultural


A qualidade dos dados não será aprimorada por meio de uma coleção de ferramentas e conceitos,
mas por mentalidade que ajuda os consumidores e as partes interessadas a priorizarem a
qualidade dos dados necessários para atender sua organização e seus usuários.
Conseguir que a organização seja consciente da qualidade dos dados geralmente requer mudança
cultural significativa. Essa mudança requer visão e liderança!
O primeiro passo é promover a conscientização sobre o papel e a importância dos dados para a
organização e definir as características dos dados de alta qualidade. Todos os consumidores de
dados devem agir com responsabilidade e levantar problemas de qualidade dos dados; solicitar
dados de boa qualidade como consumidores e fornecer informações de qualidade a terceiros.
Toda pessoa que toca nos dados pode afetar a qualidade desses dados. A qualidade dos dados
não é apenas responsabilidade de uma equipe de QD, de uma equipe de governança de dados ou
de um grupo de TI.
Os consumidores de dados precisam pensar e agir de maneira diferente para produzir e gerenciar
dados de melhor qualidade. Isso requer não apenas treinamento, mas também
comprometimento da liderança.

3 Maturidade em Gerenciamento de dados


Dados confiáveis não são produzidos por acidente. Tentamos mostrar que dados bem
gerenciados dependem do planejamento, governança e comprometimento com a qualidade e
segurança, bem como da execução disciplinada dos processos contínuos de gerenciamento de
dados.
Este tópico abordará as etapas críticas para iniciar melhorias na maturidade organizacional em
torno do gerenciamento de dados. Esses incluem:
•Avaliar o estado atual
•Compreender as opções de melhoria para desenvolver um roteiro para gerenciamento de
dados
•Iniciar um programa de Gerenciamento de Mudanças na Organização para apoiar a
execução do modelo

3.1 Avaliar o estado atual


Antes de definir qualquer nova organização ou tentar melhorar uma já existente, é importante
avaliar o estado atual da gestão dos dados, especialmente porque elas se relacionam à cultura, ao
modelo operacional existente e às pessoas. Embora as especificidades da mudança cultural sejam
diferentes de organização para organização.
A avaliação do estado atual foca na melhoria do gerenciamento de dados e precisará considerar:
•O papel dos dados na organização: Quais processos principais são orientados por dados?
Como os requisitos de dados são definidos e entendidos? Quão bem reconhecido é o papel
que os dados desempenham na estratégia organizacional? De que maneira a organização
está ciente dos custos de dados de baixa qualidade?
•Normas culturais sobre dados: Existem possíveis obstáculos culturais para implementar
ou melhorar as estruturas de gerenciamento e governança de dados? Os proprietários de
processos de negócios upstream estão cientes dos usos downstream de seus dados?
•Práticas de gerenciamento e governança de dados: Quem e como é executado as
atividades relacionadas à gestão de dados? Como e quem toma as decisões sobre o
gerenciamento de dados?
•Como o trabalho é organizado e executado: A execução das atividades é baseada em
projetos? Quais estruturas de comitê existem para apoiar o esforço de gerenciamento de
dados? Qual é o modelo operacional para interações de TI/Negócios? Como os projetos são
patrocinados?
•Relacionamentos de relatórios: A organização é centralizada ou descentralizada,
hierárquica ou plana? Quão colaborativas são as equipes?
•Níveis de habilidade: Qual é o nível de conhecimento de dados e de gerenciamento de
dados das partes interessadas? Existem especialistas no assunto?
A avaliação do estado atual também deve incluir o nível de satisfação, isso fornecerá informações
sobre as necessidades e prioridades de gerenciamento de dados da organização. Atenção aos
exemplos:
•Tomada de decisão: A organização possui as informações necessárias para tomar decisões
estratégicas, oportunas e sólidas?
•Relatórios: A organização confia em seus relatórios?
•Principais indicadores de desempenho (Key Performance Indicator - KPI): Com que eficácia
a organização rastreia seus KPIs?
•Conformidade: A organização está em conformidade com todas as normas legais
relacionadas à governança de dados?
O meio mais eficaz para conduzir essa avaliação é usar um modelo confiável de maturidade em
gerenciamento de dados que forneça informações sobre como a organização se compara a outras
organizações e orientações sobre os próximos passos.
Os modelos de maturidade definem cinco ou seis níveis de maturidade, cada um com suas
próprias características, que variam de inexistentes (nível 0), ad hoc (nível 1) a otimizados ou de
alto desempenho (nível 5).
Uma avaliação detalhada incluiria critérios para categorias amplas, como pessoas, processos e
tecnologia; e para subcategorias como estratégia, política, padrões, definição de função,
tecnologia/automação etc. dentro de cada função de gerenciamento de dados ou área de
conhecimento.
Acesse as abas para obter um resumo dos níveis macro da maturidade do gerenciamento de
dados.
Nível 0 - Ausência de Capacidade
x
Não existem práticas organizadas ou processos corporativos formais para gerenciamento de
dados. Há uma parcela considerável de organizações no nível 0. Esse nível é reconhecido apenas
para fins de conceito.

Nível 1 - Inicial/Ad Hoc


x
Gerenciamento de dados utilizando um conjunto de ferramentas limitado, com pouca ou
nenhuma governança.
O tratamento de dados é altamente dependente de alguns especialistas.
Papéis e responsabilidades são definidos em silos.
Cada gestor de dados recebe, gera e envia dados de forma autônoma.
Os controles, se existirem, são aplicados de forma inconsistente.
As soluções para gerenciamento de dados são limitadas.
Os problemas de qualidade dos dados são difundidos e não são abordados.
Os suportes de infraestrutura estão no nível da unidade de negócios.
Os critérios de avaliação podem incluir a presença de qualquer controle de processo, como
registro de problemas de qualidade de dados.

Nível 2 - Repetível
x
Surgimento de ferramentas consistentes e definição de função para apoiar a execução do
processo.
No nível 2, a organização começa a usar ferramentas centralizadas e a fornecer mais supervisão
para o gerenciamento de dados.
As funções são definidas e os processos não dependem apenas de um especialista.
Existe conscientização organizacional sobre questões e conceitos de qualidade de dados.
Os conceitos de gerenciamento de dados mestre e de referência começam a ser reconhecidos.
Os critérios de avaliação podem incluir a definição formal de função em artefatos, como
descrições de tarefas, a existência de documentação do processo e a capacidade de alavancar
conjuntos de ferramentas.

Nível 3 - Definido
x
Capacidade emergente de gerenciamento de dados.
O Nível 3 vê a introdução e a institucionalização de processos escaláveis e uma visão do
gerenciamento de dados como um facilitador organizacional.
As características incluem a replicação de dados em uma organização com alguns controles em
vigor e um aumento na qualidade dos dados, juntamente com definição e gerenciamento
coordenados de políticas.
Uma definição de processo mais formal leva a uma redução significativa na intervenção manual.
Isso, junto com um processo de design centralizado, significa que os resultados do processo são
mais previsíveis.
Os critérios de avaliação podem incluir a existência de políticas de gerenciamento de dados, o uso
de processos escalonáveis e a consistência de modelos de dados e controles do sistema.

Nível 4 - Gerenciado
x
O conhecimento institucional adquirido com o crescimento nos níveis 1 a 3 permite que a
organização preveja resultados ao abordar novos projetos e tarefas e comece a gerenciar os
riscos relacionados aos dados.
O gerenciamento de dados inclui métricas de desempenho.
As características do nível 4 incluem ferramentas padronizadas para gerenciamento de dados,
das estações de trabalho à infraestrutura, juntamente com uma função centralizada de
planejamento e governança.
As expressões desse nível são um aumento mensurável na qualidade dos dados e nos recursos
de toda a organização, como auditorias de dados de ponta a ponta.
Os critérios de avaliação podem incluir métricas relacionadas ao sucesso do projeto, métricas
operacionais para sistemas e métricas de qualidade dos dados.

Nível 5 - Otimizado
x
Quando as práticas de gerenciamento de dados são otimizadas, elas são altamente previsíveis,
devido à automação de processos e gerenciamento de mudanças tecnológicas.
As organizações nesse nível de maturidade se concentram na melhoria contínua.
No nível 5, as ferramentas permitem uma visualização dos dados entre os processos.
A proliferação de dados é controlada para evitar duplicação desnecessária.
Métricas bem entendidas são usadas para gerenciar e medir a qualidade e os processos dos
dados. Os critérios de avaliação podem incluir artefatos e métricas de gerenciamento de
mudanças na melhoria do processo.

Na sequência, conheça o Modelo de Níveis de Maturidade em Gerenciamento de Dados.

O gráfico espiral a seguir apresenta um exemplo de demonstração de resultado das descobertas


após a aplicação da metodologia de Avaliação de Maturidade de Gerenciamento de Dados (Data
Management Maturity Assessment - DMMA).

3.2 Uso dos resultados para planejar melhorias


Uma avaliação do estado atual ajuda a determinar o que está funcionando bem, o que não está
funcionando e onde uma organização apresenta lacunas.
As conclusões fornecem a base para os objetivos do programa de mapeamento de trilhas que
auxiliam a determinar por onde começar e com qual velocidade avançar.
Atenção, os objetivos devem se concentrar em:
•Oportunidades de melhoria de alto valor relacionadas a processos, métodos, recursos e
automação.
•Recursos alinhados à estratégia de negócios.
•Processos de governança para avaliação periódica do progresso organizacional com base
nas características do modelo.
As especificidades dos planos de ação dependerão dos resultados da avaliação.
A tabela abaixo apresenta um modelo simplificadíssimo que considera apenas a adoção de uma
metodologia padrão e o grau de automação do processo.

Nível de Maturidade Qualidade de Dados (QD) – Características Grau de Automação


de Medição
Os relatórios de QD são amplamente
Nível 5 – Otimizado: compartilhados entre os acionistas da gerência.
Relatórios e Painéis
As metas de Os resultados da medição da qualidade dos
otimizados e
melhoria e de dados são usados para identificar
automatizados, incluindo
processo são oportunidades de melhorias no sistema e nos
alertas.
quantificadas processos de negócios e o impacto dessas
melhorias é relatado.
Nível 4 – Os gestores de sistemas e de negócios são
Gerenciado: obrigados a medir a qualidade de seus dados e
O processo de medição é
Processos são a reportar resultados, para que os consumidores
totalmente automatizado.
quantificados e tenham um conhecimento consistente da
controlados qualidade dos dados.
Nível 3 – Definido: Os padrões são definidos para estabelecimento Uma abordagem padrão
Os padrões são das métricas de qualidade dos dados e se estão foi adotada para iniciar o
definidos e usados sendo aplicados nas equipes. processo de automação.
Nível 2 – Repetível: As partes envolvidas aprenderam práticas para Os processos ainda são
Existe uma prática medir a qualidade dos dados e estão amplamente manuais, mas
mínima repetível no desenvolvendo habilidades para replicar essas algumas equipes testaram
processo práticas. a automação.
Nível 1 - Inicial (Ad
Há um esforço dos indivíduos em medir a Nenhum. Os processos de
Hoc): O sucesso
qualidade dos dados, mas isso não faz parte acompanhamento dos
depende da
diretamente da rotina de atividades e não existe indicadores são realizados
competência dos
uma metodologia definida. de forma manual.
indivíduos
Nível 0 - Ausência de Não existe definição de métricas e
Não aplicável.
capacidade acompanhamento da qualidade dos dados.
Níveis de maturidade para medição da qualidade dos dados

Digamos que uma organização reconheça a necessidade de melhorar a qualidade de seus dados.
No entanto, sua avaliação atual do estado mostra que encontra-se no Nível 1. Ainda não
estabeleceu práticas repetíveis em torno da medição da qualidade dos dados, mas há indivíduos
que testaram as águas e descobriram algumas coisas. Com base em sua estratégia geral,
estabelece uma meta de passar do Nível 1 para o Nível 3 dentro de 18 meses.
Atingir esse objetivo requer um plano de ação que explique vários fluxos de trabalho:
•Pesquisa de abordagens para medir a qualidade dos dados e adoção de uma abordagem
alinhada com os pontos problemáticos da organização, as metas de medição e o setor.
•Treinamento de equipe sobre a metodologia.
•Identificação e adoção de ferramentas para apoiar a execução da metodologia.
Além de executar planos para atingir essas metas, os líderes também devem levar em
consideração o desenvolvimento futuro (ou seja, ao passar para o Nível 3, a organização também
deverá se preparar para passar para o Nível 4).
Esse exemplo simples mostra o processo de pensamento em torno do planejamento para a
melhoria de um componente do gerenciamento de dados. As avaliações de maturidade do
gerenciamento de dados podem ter diferentes áreas de foco.
Se sua organização avaliar de forma abrangente suas práticas de gerenciamento de dados, a saída
identificará diversas oportunidades de melhoria. Eles precisarão ser priorizados para apoiar a
estratégia de negócios.
Um modelo de maturidade de gerenciamento de dados inclui orientações internas, descrevendo
como é o progresso dentro e entre as áreas funcionais de gerenciamento de dados. O caminho
para a melhoria baseado em etapas pode ser adaptado às necessidades e prioridades de uma
organização.
Para cada um dos recursos (Governança, Arquitetura, etc.), o anel externo da tela mostra o nível
de capacidade que a organização determinou que precisa para competir com sucesso. O anel
interno exibe o nível de capacidade conforme determinado pela avaliação. As áreas em que a
distância entre os dois anéis é maior representam os maiores riscos para a organização. Esse
relatório pode ajudar a definir prioridades, como também, ser utilizado para medir o progresso ao
longo do tempo.
O objetivo de uma avaliação do estado atual é compreender o ponto de partida da organização
para planejar a melhoria. Uma avaliação precisa é mais importante que uma pontuação alta. Uma
avaliação formal da maturidade do gerenciamento de dados coloca a organização na escala de
maturidade, esclarecendo os pontos fortes e fracos de atividades críticas de gerenciamento de
dados. Ajuda a organização a identificar, priorizar e implementar oportunidades de melhoria.
Ao atingir seu objetivo principal, um DMMA pode ter um impacto positivo na cultura. Isso auxilia a:
•Conscientizar as partes interessadas sobre os conceitos, princípios e práticas de
gerenciamento de dados.
•Esclarecer as funções e responsabilidades das partes interessadas em relação aos dados
organizacionais.
•Destacar a necessidade de gerenciar dados como um ativo crítico.
•Ampliar o reconhecimento das atividades de gerenciamento de dados em toda a
organização.
•Contribuir para melhorar a efetividade da governança de dados.
Com base nos resultados da avaliação, uma organização pode aprimorar seu programa de
gerenciamento de dados, de forma a apoiar as atividades estratégicas da organização.
Normalmente, os programas de gerenciamento de dados são desenvolvidos em silos
organizacionais. Raramente começam com uma visão corporativa dos dados.
Um estudo de DMMA pode prover à organização meios para desenvolver uma visão coesa e
estratégica; além de permitir uma avaliação clara e criteriosa de suas prioridades, redefinição de
objetivos e desenvolvimento de um plano integrado de melhoria.

3.3 Gerenciamento de mudanças organizacionais


A maioria das organizações que busca melhorar suas práticas de gerenciamento ou governança
de dados está no meio da escala de maturidade de capacidade (ou seja, não são 0 ou 5). O que
significa que quase todas precisam melhorar suas práticas.
Para a maior parte das organizações, melhorar as práticas de gerenciamento de dados requer
alterar a maneira como as pessoas trabalham juntas e como elas entendem o papel dos dados em
suas organizações, bem como a maneira como utilizam os dados e implementam a tecnologia
para dar suporte aos processos organizacionais.
Atenção às práticas bem-sucedidas de gerenciamento de dados, pois elas exigem, entre outros
fatores:
• Aprender a gerenciar horizontalmente, alinhando responsabilidades ao longo da cadeia de
valor das informações.
• Mudar o foco da responsabilidade vertical (silo) para a gestão compartilhada de
informações.
• Evoluir a qualidade da informação de uma expectativa do negócio de nicho ou trabalho do
departamento de TI para um valor central da organização.
• Mudar o pensamento sobre a qualidade das informações de 'limpeza de dados
e scorecards' para uma capacidade organizacional mais fundamentada em transformar a
qualidade em processos.
• Implementar processos para mensurar o custo do gerenciamento de dados informal e o
valor do gerenciamento de dados formalizado.
Esse nível de mudança não é alcançado por meio da tecnologia (mesmo que o uso apropriado de
ferramentas de software possa dar suporte à entrega). Em vez disso, é realizado por meio de uma
abordagem cuidadosa e estruturada para o gerenciamento de mudanças na organização. A
mudança será necessária em todos os níveis. É fundamental que seja gerenciado e coordenado a
fim de evitar iniciativas sem saída, perda de confiança e danos à credibilidade da função de
gerenciamento de informações e de sua liderança.
A mudança na cultura da organização requer planejamento, treinamento e persistência.
Consciência e responsabilidade são essenciais para motivar e envolver as pessoas em iniciativas,
políticas e processos de gerenciamento de dados.
Os fatores críticos de sucesso para o gerenciamento de mudanças organizacionais são bem
conhecidos.
Demonstrou-se consistentemente que dez fatores desempenham um papel fundamental no
sucesso de organizações eficazes de gerenciamento de dados, independentemente de sua
estrutura. São eles:
Patrocínio da alta administração
A alta administração deve internalizar e acreditar na iniciativa. Deve ser capaz de se envolver
efetivamente e mobilizar outros líderes no apoio às mudanças.

Visão clara
Os líderes devem garantir que todas as partes interessadas afetadas pelo gerenciamento de
dados - tanto internas quanto externas - entendam e internalizem o que é gerenciamento de
dados, por que é importante e como o trabalho deles afetará e será afetado por eles.

Gerenciamento proativo de mudanças


A aplicação do gerenciamento organizacional de mudanças para o estabelecimento de uma
prática de gerenciamento de dados aborda os desafios das pessoas e aumenta a probabilidade
de práticas e estruturas organizacionais serem sustentáveis ao longo do tempo.

Alinhamento da liderança
O alinhamento da liderança garante que haja acordo - e suporte unificado para - a necessidade
de um programa de gerenciamento de dados e que haja acordo sobre como o sucesso será
definido. O alinhamento da liderança inclui o alinhamento entre as metas dos líderes e os
resultados do gerenciamento de dados, além de valor e alinhamento de propósito entre os
líderes.

Comunicação
A organização deve garantir que as partes interessadas tenham um entendimento claro do que é
o gerenciamento de dados e a sua importância. O que sofrerá transformações e quais mudanças
no comportamento são necessárias.

Engajamento das partes interessadas


Indivíduos e grupos afetados por uma iniciativa de gerenciamento de dados reagirão de maneiras
diferentes ao novo programa e sua função. O modo como a organização envolve essas partes
interessadas - como elas se comunicam, respondem e envolvem - terá um impacto significativo
no sucesso da iniciativa.

Orientação e treinamento
A capacitação é essencial para que o gerenciamento de dados aconteça. Diferentes grupos de
pessoas (líderes, gestores de dados, equipes técnicas) exigirão diferentes tipos e níveis de
educação para que possam desempenhar suas funções de maneira eficiente. Diversas pessoas
precisarão de treinamento em novas políticas, processos, técnicas, procedimentos e até
ferramentas.

Avaliação da adoção
Crie métricas em torno do progresso e da adoção das diretrizes de gerenciamento de dados
visando manter a continuidade da execução do programa de gerenciamento de dados. O aspecto
facilitador do gerenciamento de dados pode se concentrar na melhoria dos processos centrados
em dados, como identificação de risco e eficiência da execução do projeto. O aspecto de inovação
do gerenciamento de dados pode se concentrar na melhoria na tomada de decisão e na análise
por meio de dados aprimorados e confiáveis.

Adesão aos princípios orientadores


Princípios de gerenciamento de dados do DAMA servem como pontos de referência a partir dos
quais todas as decisões serão tomadas. Estabelecê-los é um primeiro passo para a criação de um
programa de gerenciamento de dados que efetivamente conduz mudanças no comportamento.

Evolução, não revolução


Em todos os aspectos do gerenciamento de dados, a filosofia de 'evolução não revolução' ajuda a
minimizar grandes mudanças ou projetos de alto risco e em larga escala. O estabelecimento de
uma organização que evolua e amadureça ao longo do tempo, melhorando de forma incremental
a maneira como os dados são gerenciados e priorizados pelos objetivos de negócios, garantirá
que novas políticas e processos sejam adotados e que as mudanças comportamentais sejam
sustentadas.

3.4. Governança da Gestão da Maturidade


Um DMMA faz parte de um conjunto de atividades de governança de dados. O ciclo de vida de um
DMMA consiste no planejamento e na avaliação inicial, seguido de recomendações, um plano de
ação e reavaliação periódica.
Supervisão do Processo DMMA
A supervisão do processo DMMA é exercido pela equipe de Governança de Dados. Se a
Governança de Dados formal não possuir know-how, os padrões de supervisão serão adotados
pelo Comitê Diretor ou pela camada de gerenciamento que iniciou o DMMA. O processo deve ter
um patrocinador da alta Administração para garantir que as melhorias nas atividades de
gerenciamento de dados sejam mapeadas conforme os objetivos de negócios.
A amplitude e profundidade da supervisão dependem do escopo da DMMA. Cada função
envolvida no processo tem sua responsabilidade na execução, método, resultados e roteiros
provenientes da avaliação. Cada área de gerenciamento de dados estará envolvida de forma
interdependente, mas também utilizaram uma linguagem comum por meio da estrutura do
DMMA.
Métricas
Além de ser um componente central de qualquer estratégia de melhoria, as métricas são uma
ferramenta de comunicação essencial. As métricas iniciais do DMMA são as classificações que
representam o estado atual do gerenciamento de dados. As métricas podem ser reavaliadas
periodicamente para demonstrar tendências de melhoria.
Cada organização deve desenvolver métricas adaptadas à sua situação. Métricas podem incluir:
Classificações DMMA
As classificações DMMA apresentam, por meio de níveis, a capacidade da organização. As
classificações podem ser acompanhadas de uma descrição, talvez uma ponderação personalizada
para a classificação em uma avaliação ou área temática específica e um resultado esperado.

Taxas de utilização de recursos


Utilizar exemplos de métricas que ajudam a expressar o custo do gerenciamento de dados com
base em cálculos percentuais como: "Todo recurso da organização gasta 10% do tempo
agregando dados manualmente".

A exposição ao risco: Exposição ao risco


Exposição ao risco ou a capacidade de responder a cenários de risco expressa os recursos de
uma organização em relação às classificações de DMMA. Por exemplo, se uma organização
quisesse iniciar um novo negócio que exigisse um alto nível de automação, mas seu modelo
operacional atual se baseia no gerenciamento manual de dados (Nível 1), incorreria no risco de
não entregar.

O gerenciamento de gastos
Expressa como o custo do gerenciamento de dados é alocado em uma organização e identifica os
impactos desse custo na sustentabilidade e no valor. Essas métricas se sobrepõem às métricas de
governança de dados.

• Sustentabilidade no gerenciamento de dados


• Realização das metas e objetivos
• Eficácia da comunicação
• Eficácia da capacitação de pessoal
• Velocidade de adoção das mudanças
• Valor agregado com práticas de gerenciamento de dados
• Contribuições para os objetivos de negócios
• Reduções de riscos

As entradas para o DMMA


São importantes para gerenciar, pois falam sobre a abrangência da cobertura, nível de
investigação e detalhes do escopo relevante para a interpretação dos resultados da pontuação.
As entradas principais podem incluir o seguinte: contagem, cobertura, disponibilidade, número de
sistemas, volumes de dados, equipes envolvidas etc.

Taxa de mudança
A taxa na qual uma organização está melhorando sua capacidade. Uma linha de base é
estabelecida por meio do DMMA. A reavaliação periódica é usada para melhorar a tendência.

3.5. Elementos do modelo de maturidade


Temos acesso a mais dados do que nunca, mas isso se tornou confuso e contraditório, a ponto de
a qualidade dos dados ser considerada uma disciplina por si só.
Em que ponto paramos de confiar nos dados? Não é apenas o volume de dados que os torna
confusos, é como os usamos.
Podemos usar os dados para obter muitos resultados diferentes, dependendo do que fazemos
com eles. Se não pararmos para verificar se estamos de acordo em que manipulamos ou
extrapolamos, estamos caminhando em direções muito diferentes e concorrentes.
O primeiro passo será proceder uma avaliação da maturidade dos dados para ajudá-lo a entender
com qual cenário está inserido - forneça uma imagem de como organização encontra-se em seu
ponto de partida no mapa.
A avaliação da maturidade dos dados é uma ferramenta útil não só para compreender a situação
atual da organização, antes de iniciar (ou a partir de quando o processo será iniciado), mas
também para demonstrar o progresso das iniciativas de melhoria. Visto que essas informações
serão utilizadas como insumos da linha de base.
Diversas mudanças falham porque não houve tempo para compreender a real posição da
organização. Uma lagarta pode ser uma lagarta perfeitamente boa, mas para atingir seu
verdadeiro potencial, ela precisa se transformar em uma borboleta. Embora não estamos
sugerindo que é possível saber tudo com antecedência, é possível em pouco tempo compreender
a posição da sua organização sobre os fatores importantes em relação à forma como trata os
dados.
A linha de base pode demonstrar o que a organização tem realizado e onde fez a diferença. Com
isso é possível determinar se existe retorno relevante para a organização e com isso decidir se
mantém ou não esse processo. Uma das coisas que é difícil quando se algum tipo de mudança é
demonstrar os benefícios - sem isso é realmente fácil para qualquer organização se preocupar
que não está no caminho certo. As partes interessadas e os usuários podem consumir uma
grande quantidade de energia para gerenciar e também podem inviabilizar completamente os
programas, se houver medidas preventivas. Uma maneira simples de ajudá-los a entender se
estão na direção certa é demonstrar o progresso em relação à sua linha de base - que é a primeira
avaliação de maturidade.
Conheça alguns pontos relevantes ao se conduzir um modelo de maturidade:
• Toda interação é importante. O trabalho de preparação foi realizado para que haja
alinhamento das motivações e expectativas.
• Nem todo mundo será um defensor ou até um pouco positivo sobre o que propõe a fazer.
É necessário avaliar e decidir se o esforço para mudar a posição de alguns é factível.
• Se forem positivos, não presumam que permanecerão assim, continue se engajado para
garantir um bom nível de aceitação.
• Aproveite todas as oportunidades para mudar a atitude das pessoas em relação aos dados!
Atenção aos principais elementos do modelo de maturidade são:
Estratégia
Organizações com níveis de maturidade altas comunicam a visão. Ou seja, o caminho da
liderança a seguir com uma estratégia de negócios e fornecer os princípios para estratégias
detalhadas relacionadas às principais áreas de negócios, das quais a estratégia de dados deve se
alinhar.

Governança corporativa
Os elementos principais da boa governança corporativa estão vigentes e estão bem implantados?
Operam isoladamente um do outro ou garantem uma abordagem sincronizada? As atividades
relevantes e adaptáveis são realizadas regularmente e de forma eficiente? A governança deve
alinhar-se conformidade.
Liderança e patrocínio
Existem pessoas chaves nos níveis estratégicos da organização que compreendem a importância
e o valor do que está sendo feito? Apoiarão para garantir que se obtenha o tempo necessário
para demonstrar o verdadeiro valor advindo desse processo.

Estrutura, processo e ferramentas


Sua organização possui estrutura coerente para fazer com que os demais setores se mantenham
alinhados? Como as políticas são atualizadas? As ferramentas disponíveis ajudam ou atrapalham?
Quantos sistemas relacionados a dados estão em operação no momento? As pessoas utilizam
esses sistemas de dados de forma correta? Compreende o ciclo de vida das informações na sua
organização?

Políticas
Existem políticas, padrões, procedimentos para garantir que as pessoas da organização tenham
um instrumento de alinhamento estratégico? Essas políticas, procedimentos e padrões são claras,
consistentes e fáceis de utilizar? Existe uma estrutura para demonstrar a inter-relação entre essas
políticas?

Risco de informação
O risco das informações está bem definido e em que nível, tendo em vista a importância do
negócio? As ferramentas vigentes para auxiliar o gerenciamento de dados e adequada para
mitigar os riscos adequadamente?

Arquitetura
Como as informações de toda a organização são estruturadas e como transitam entre os silos? As
arquiteturas estão mapeadas? Quais são os responsáveis?

Organização, funções e responsabilidadx


As funções são claras e acordadas em toda a organização? Existe uma equipe dedicada pela
gestão dos dados da organização? Foram definidas funções para abordar elementos de
gerenciamento e garantia de informações em seus diferentes domínios? Existe um conselho
diretor com poderes para tomar decisões relacionadas a dados e informações?

Habilidades
Quais habilidades são necessárias para alcançar os objetivos de gerenciamento de dados
definidos pela organização? A organização dispõe de programas de treinamento para os
profissionais de dados e de informações?

Métricas
As funções de gerenciamento de dados são mensuradas do ponto de vista de desempenho e
demonstrada por meio de relatórios que apontam os benefícios alcançados? O resultado do
processo de mensuração é direcionado para as mudanças comportamentais pretendidos pela
cultura de valorização de dados?

Comportamento da tutela da informação


Valoriza-se os dados e o que pode ser realizado pelo seu uso? Os investimentos no
gerenciamento de dados foram positivos resultado em resultados mensuráveis?

Tecnologia
A tecnologia disponível é facilmente escalável e adequada para atender os processos de
gerenciamento de dados?

Você também pode gostar