Escolar Documentos
Profissional Documentos
Cultura Documentos
ANÁLISE DA PESQUISA:
O perfil das empresas brasileiras em
gestão e governança de dados
Carlos Barbieri
Belo Horizonte
Janeiro de 2013
Versão 02
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 3
FICHA TÉCNICA
Autor
Carlos Barbieri
Colaboração
Fernanda Farinelli (PRODEMGE)
Equipe técnica
Isabella Fonseca (FUMSOFT)
Claudio Filardi (FUMSOFT)
Evilene Santos (FUMSOFT)
Editoração
Pedro Ivo Brandão (FUMSOFT)
Renata Ferreira (FUMSOFT)
Projeto gráfico
Gracielle Santos (FUMSOFT)
FUMSOFT
Presidência
Thiago Turchetti Maia
Vice-presidência
Leonardo Fares Menhem
Barbieri, Carlos.
As informações contidas neste trabalho podem ser reproduzidas desde que citada a fonte.
Outras informações podem ser obtidas pelo e-mail qualidade@fumsoft.org.br
Fumsoft
Av. Afonso Pena, 4.000, 3º andar - bairro Cruzeiro
CEP: 30.130-009 - Belo Horizonte/MG
Tel.: (31) 3281-1148
www.fumsoft.org.br
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 4
SUMÁRIO
1. INTRODUÇÃO ..................................................................................................................... 5
2. GESTÃO DE DADOS ............................................................................................................ 6
3. ANÁLISE DOS RESULTADOS ............................................................................................... 8
3.1. Características das empresas respondentes .................................................................. 8
3.1.1. Perfil das empresas ...................................................................................................... 8
3.1.2. Número de empregados .............................................................................................. 9
3.1.3. Natureza das empresas................................................................................................ 9
3.1.4. Localização Geográfica............................................................................................... 10
3.1.5. Análise preliminar da amostra ................................................................................... 11
3.2. Governança de dados ................................................................................................... 12
3.2.1. Planejamento de Gestão de Dados ........................................................................... 12
3.2.2. Controle da Gestão de Dados .................................................................................... 18
3.3. Gestão da arquitetura de dados................................................................................... 21
3.4. Desenvolvimento de dados .......................................................................................... 25
3.5. Gestão de operações de dados .................................................................................... 29
3.6. Gestão de segurança de dados ..................................................................................... 33
3.7. Gestão de dados mestre e de referência ..................................................................... 36
3.8. Gestão de Data Warehousing e Business Intelligence ................................................ 38
3.9. Gestão de documentos e conteúdo ............................................................................. 40
3.10. Gestão de metadados ................................................................................................... 43
3.11. Gestão da qualidade de dados ..................................................................................... 45
3.12. Ferramentas de apoio a Gestão de Dados ................................................................... 47
4. REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................................... 50
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 5
1. INTRODUÇÃO
Neste estudo, é realizada uma análise da pesquisa realizada pela Dama-BR e Fumsoft, com o
objetivo de mapear o posicionamento das empresas com relação à Gestão e Governança de
Dados. A pesquisa foi realizada durante os meses de outubro e novembro de 2012, período
em que foi disponibilizado um questionário on-line. Este foi preenchido por empresas
convidadas pelas instituições realizadoras, sem nenhuma limitação prévia de tamanho, ramo
de atividade, faturamento ou número de colaboradores. A ideia foi buscar a primeira
impressão da Governança de Dados no Brasil, visto que tais dados nunca haviam sido
levantados no país em uma pesquisa quantitativa como esta. Foram obtidas 76 respostas
completas e seus resultados, na forma de tabelas e gráficos, estão disponibilizados nos sites
da Dama-BR e Fumsoft.
2. GESTÃO DE DADOS
A Gestão de Dados (no inglês, Data Management ou DM), conforme o DMBOK (2009), visa
controlar e alavancar eficazmente o uso dos ativos dados e sua missão e objetivos são
atender e exceder às necessidades de informação de todos os envolvidos (stakeholders) da
empresa em termos de disponibilidade, segurança e qualidade. É uma responsabilidade
tanto da tecnologia da informação de uma empresa quanto de seus clientes internos e
externos e envolve desde a alta direção, que utiliza dados na geração de informações
estratégicas, até profissionais de nível operacional, que muitas vezes são responsáveis pela
coleta e produção dos dados.
Governança de dados
Desenvolvimento de dados
Gestão de Metadados
Segundo o Gráfico 2, observa-se que as empresas da esfera de comércio e serviços com mais
de 100 colaboradores representam 38,5% das participantes, enquanto 19,2% são
microempresas da mesma área, com até nove empregados; 15,4% são empresas da área de
indústria, com mais de 500 colaboradores; 9% das empresas são de porte pequeno, da área
de comércio e serviços, com quadro entre 10 e 49 colaboradores; 7,7% são microempresas,
da área da indústria com até 19 empregados; 5,1% das empresas são de porte médio, do
segmento da indústria, com quadro entre 100 e 499 empregados; 3,8% são de empresas de
médio porte do segmento do comércio e indústria, com quadro entre 50 e 99 colaboradores
e 1,3% são de empresas pequenas, do segmento indústria, com quadro entre 20 e 99
colaboradores.
Como a pesquisa é inédita e seu objetivo era obter a primeira fotografia da situação da
Gestão de Dados no Brasil, não houve preocupação com a escolha técnica da amostra, do
ponto de vista estatístico. Dessa forma, a amostra apresenta uma variedade de empresas de
atributos diferentes (porte, número de colaboradores, natureza), fator que precisa ser
considerado quando das análises dos resultados, pois os conceitos de Gestão de Dados ainda
são novos e a probabilidade é que se encontre maior maturidade (ou seja, as melhores
práticas DMBOK aplicadas) em empresas com maior estrutura organizacional. Cabe ressaltar
que quase 43% das empresas respondentes são classificadas como micro e pequenas
empresas.
Além disso, empresas com áreas de atuação diferentes também podem ter comportamento
diferente com relação aos dados. Por exemplo, empresas do ramo financeiro, sujeitas a
maior regulamentação ou empresas que processam dados com objetivos diretos de negócios
também tendem a ter uma percepção diferente da importância dos dados nos seus
resultados. Por outro lado, empresas que prestam serviços de desenvolvimento de software
estão nesse momento, com os olhos mais voltados para a qualidade de seus processos do
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 12
que dos seus dados. Isso, obviamente, não é uma constatação científica, mas é uma
percepção colhida nas quase 80 empresas onde a Fumsoft desenvolveu projetos de melhoria
de qualidade de processos.
40%
Desenvolve e mantém uma 13%
8%
estratégia de dados 37%
3% A atividade é realizada
Estabelece os papéis e as 40%
14%
estruturas para a gestão de 9%
35% A atividade é realizada
dados 3%
consistentemente entre as linhas de
27% negócios
Identifica e designa gestores de 12%
4% A atividade é realizada, monitorada e
dados (data stewards) 54%
4% medida
23%
Planeja e patrocina projetos e 17%
5%
serviços de gestão de dados 55%
0%
15%
Estima valores de ativos de 6%
5%
dados e custos associados 72%
1%
Programas e Projetos (outros dois P´s da GD) que deverão ser pensados como
ações estruturadas/iniciativas para o alcance desses objetivos.
Assim sendo, conforme visto no Gráfico 5, um grupo de empresas em torno de 35% não tem
papéis e estruturas, um valor próximo dos que não têm nenhuma estratégia para dados,
flagrado no item anterior (37%). Um número relativamente expressivo de 63% afirmam ter
estruturas e papéis para a gestão de dados em algum grau, com 23% dizendo realizá-la com
amplitude entre linhas de negócios e com medição e monitoração (maior controle).
Esse número pode estar distorcido para cima e mereceria outra rodada futura, com uma
visão mais vertical para se capturar adequadamente a sua real fotografia. Um dos problemas
que pode gerar esses números elevados é a falta do pleno entendimento do que sejam
papéis e estruturas para a gestão de dados. Por exemplo, a simples existência da figura de
AD (Administrador de dados) e do ABD (Administrador de Bancos de dados) na área da TI,
por si só, não caracteriza a existência da Gestão de Dados no sentido amplo colocado. É
fundamental a existência de camadas em níveis estratégicos e táticos para garantir a
funcionalidade operacional dos dados nas empresas, como Comitê ou Conselho de GD
(Gestão ou Governança de Dados), CDO (Chief Data Officer), DMO (Data Management
Office), uma espécie de coordenador dos gestores de dados, além da figura dos próprios
(gestores ou stewards). Não basta ter somente ABD e AD, é preciso que haja GD!
Para o desenvolvimento desta atividade, os resultados obtidos pela pesquisa (Gráfico 5),
mostram que 59% dizem ter esses cuidados com a revisão e aprovação da arquitetura de
dados, enquanto 40% dizem não realizar tais práticas. Ter quase 60% das empresas
praticando a arquitetura de dados, conforme indagado, pode ser uma fotografia real, mas
me parece também um pouco alto. De novo, é mais um ponto que merece observação
cuidadosa. Normalmente as empresas têm uma arquitetura de dados focada em sistemas,
mas não necessariamente integradas e nem conectadas com outros tipos de arquiteturas,
numa visão estratégica. Há modelos de dados, em variados níveis de abstração (uns mais
lógicos e outros mais próximos da implementação), porém, sempre com forte sabor de
solução para aquele sistema específico e não dentro de um espectro mais corporativo.
A resposta dada pelas empresas (Gráfico 5) foi que 45% delas dizem realizar essa atividade,
embora somente 5% o façam com a completude necessária (atividade realizada, monitorada
e medida). Por outro lado, 55% dos respondentes disseram não realizá-la, o que joga uma luz
mais realista nas ações efetivas de dados, quando confrontado com os números mais
otimistas citados acima.
Para o DMBOK (2009), a atividade “Estimam valores de ativos de dados e custos associados”,
sugere uma intenção de se levantar o quanto as empresas percebem os dados como ativos
(um dos “clichês” de 2012). Na realidade, os dados são considerados ativos intangíveis e já
há movimentos em direção a posicioná-los como um ativo para o qual se estabelece
valoração. Por meios diretos ou indiretos, as empresas tentam definir valores derivados do
seu uso e aplicação. Uma delas é estabelecer um consenso sobre uma percentagem de valor
com que os dados contribuem para um projeto, relativizado a outros tipos de recursos que o
integram. Outra forma é pelo custo negativo que a sua baixa qualidade pode produzir, ou
pelos impactos negativos na reputação decorrentes dela (impactos pela baixa qualidade).
Outra forma é tentar estimar o quanto os concorrentes pagariam por aquele acervo de
dados existente. De toda a forma, essa prática é de baixo uso e o seu conceito ainda não
está maduro.
A valoração dos dados como “ativo” se reflete claramente nas respostas apresentadas n
Gráfico 5, onde dos participantes, 72% dizem não realizar a atividade e 27% dizem fazê-la.
Destes, somente 5% declaram ter a atividade feita na completude desejada. Muito
provavelmente essas empresas (entre 3 e 4, que representam 5% de quase 80 questionários
completados) são empresas que atuam no segmento de business de dados (bureau de
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 18
dados), onde a valoração dos dados, no caso seu insumo maior, é um fator crítico de sucesso
do seu negócio.
21%
Comunica e promove o valor dos 5%
4%
ativos de dados 64%
6%
Para a atividade “Monitora e garante conformidade com normas regulatórias” 57% das
empresas indicaram ter atividades para tal e 38% indicaram não realizá-la. Isso, obviamente,
depende do tipo de organização e do grau de controle externo a que ela está submetida. As
organizações do ramo financeiro, bancário e de seguros, serviços públicos, etc., na visão do
autor, normalmente possuem esses tipos de obrigações regulatórias e compuseram cerca de
35% das respondentes (Gráfico 6).
Enfim, para a atividade “Comunica e promove o valor dos ativos de dados” a pesquisa tenta
observar com que grau a empresa comunica o valor dos ativos de dados que possui. Está
associado ao item anteriormente discutido do Planejamento de Gestão de Dados, analisado
no Gráfico 5, que indaga sobre o valor, traduzido em números ou em elementos
comparativos, que o acervo dos dados existentes representa. Essas duas questões tem a ver
com o “clichê” que sugere que os dados devem ser vistos como ativos da empresa ou que
certas organizações já buscam elencar os dados nos seus controles contábeis.
Segundo o Gráfico 6, somente 30% das empresas respondentes dizem ter essa atividade
realizada, enquanto que 64,1% não realizam e 6,4% dizem não saber acerca desse ponto. É
importante notar que esse aspecto é o que apresentou o maior índice de não realização
(64%), juntamente com o seu equivalente na parte de planejamento (Estima valores de
ativos de dados e custos associados), que apontou 72%. Em resumo: A cultura nas empresas
brasileiras ainda carece de amadurecimento no sentido de reconhecer os dados como
elementos de valor tangível, mensurável, contábil e visto como um ativo organizacional.
38%
17%
Entende as necessidades de
3% A atividade é realizada
informações da organização 32%
10%
Com relação à gestão da Arquitetura de dados (baseado na proposta do TOGAF 9), o DMBOK
faz as seguintes considerações, evidenciadas no Gráfico 7:
a necessidade dos dados para atender suas estratégias de negócios, desenvolvendo uma
visão unificada entre elementos vitais como dados, processos, negócios, sistemas,
tecnologia, etc.
A arquitetura TOGAF 9 é uma das proposições para arquitetura corporativa, que visa a
definição de uma visão integrada entre informática e negócios. Esse conceito de arquitetura
corporativa nasceu em 1989, numa publicação da IBM, quando Zachman sugeriu algo para
socorrer a área de Informática, que cada vez mais não conseguia se acoplar e apoiar com
rapidez os movimentos de negócios da empresa. Dessa proposição de Zachman nasceram
outras, dentre elas o TOGAF 9. A proposição TOGAF 9 é uma das alternativas para essa
adoção de arquitetura corporativa e juntamente com a arquitetura de Zachman e do Gartner
Group (adquirido do Meta Group), formam as referências existentes para uma empresa que
deseja a sua criação. Nesse caso, a questão está direcionada para essa percepção de
entendimento do posicionamento estratégico da informação à luz da arquitetura
corporativa.
Os resultados coletados apresentados no Gráfico 7 foram que 58% das empresas disseram
sim e 32% disseram não. A incidência de quase 60% das empresas que responderam
afirmativamente pode ser um indicativo de que a percepção está amplificada e que a
resposta indique que as necessidades de informação da empresa tenham sido desvinculadas
de uma arquitetura maior, conforme a proposição da questão central.
Neste ponto aparece uma dúvida. A pergunta é acerca dos modelos de dados
organizacionais, ou seja, um nível bem mais conceitual do que os que normalmente são
desenvolvidos, quase à imagem dos modelos relacionais. Seria esse o entendimento dos
respondentes? A percepção que se tem hoje acerca dessas práticas é a clara dificuldade de
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 24
Esse será um dos grandes desafios da gestão estratégica de dados, visto que uma grande
massa de dados, estruturados ao longo de muitos anos, habita bases de dados desintegradas
e replicadas. Na minha visão, pouco se conseguirá fazer com relação a esse legado. As
soluções de gestão de dados deverão ser estabelecidas para serem trabalhadas na medida
em que novos sistemas forem desenvolvidos ou novos módulos de sistemas existentes
forem implementados. O problema está posto e neste caso, mexer no passado é quase
sempre traumático e pode comprometer a credibilidade das ações futuras de GD.
Implementação de dados:
No que tange a revisar (auditar) a qualidade dos modelos de dados e dos projetos de bancos
de dados, há lacunas significativas, bem como no gerenciamento e versionamento e
integração de modelos de dados. No que tange a testes, há também criação de ambientes
de BD de testes, com rotinas de conversão e preparação para deployment de BD em
ambientes de homologação ou de produção.
Se, por outro lado, observamos a faixa abaixo de 70%, percebe-se que neste ponto estão
práticas no plano lógico, ou aspectos mais explícitos de qualidade e controle sobre os dados,
como desenvolver e manter modelos lógicos de dados, rever a qualidade dos modelos de
dados, construir e testar produtos de informação (algo relacionado com Verificação de
Qualidade - VER) e aspectos de implantação e documentação. Em resumo, esse corpo de
conhecimento (de desenvolvimento de dados) está com síndrome de “academia de
ginástica”: O foco principal é no aspecto físico.
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 29
42%
12%
Adquire dados de fontes externas 19%
23%
4%
53%
10%
Planeja a recuperação de dados 26%
9%
3% A atividade é realizada
53%
Realiza Backup e Recovery 12%
32%
(Recuperação) de Bancos de Dados 3%
1%
A atividade é realizada
31%
Define níveis de serviços relacionados 8% consistentemente entre as
28%
a performance de banco de dados 32% linhas de negócios
1%
54% A atividade é realizada,
10%
Arquiva, retém, e elimina dados 24% monitorada e medida
10%
1%
50%
Entende os requisitos de tecnologia de 14%
A atividade não é realizada
19%
dados 12%
5%
51%
Define a arquitetura tecnológicas de 12%
22%
dados 13% Não Sei
3%
47%
12%
Avalia tecnologias de dados 21%
17%
4%
45%
Controla o estoque e acompanha as 12%
22%
licenças de tecnologia de dados 15%
6%
Gráfico 9 - Atividades de operações com dados executadas atualmente por profissionais de dados
Para a atividade “Adquire dados de fontes externas”, dos respondentes, 73% disseram que
sim, que adquirem dados de fontes externas. Por outro lado, 23% disseram não realizar essa
atividade. Esses números, apresentados no Gráfico 9, podem estar ligeiramente
amplificados, principalmente pelas empresas que usam os dados como centro do seu core
business. Empresas como bureau de serviços de dados têm, nesta atividade, o seu fator de
maior importância, coletando dados em fontes de informações oficiais e tratando-as, como
numa linha de produção, para oferecer aos seus clientes.
Para o DMBOK (2009) na atividade “Arquiva, retém e elimina dados”, entende-se que haja
um plano que define ações de arquivamento de dados (entendendo-se cópias, backups,
replicações, arquivos secundários, arquivos off-line, etc.). Também o plano deve definir
aspectos de tempo de retenção e de momentos ou ciclos de eliminação de dados. Os
números da pesquisa apresentados no Gráfico 9 indicam que 89% apontam ter planos para
tal e 10% indicam não tê-lo. O número aponta um bom índice de adoção dos conceitos.
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 32
Dos respondentes, 78% disseram possuir esse tipo de controle contra 15% que confirmaram
não possuir (Gráfico 9).
Nesse corpo de conhecimento, a pesquisa, compilada no gráfico 10, mostrou que esse
quesito foi o que mais apresentou viés positivo, comparando as atividades realizadas
(atividade é realizada, consistentemente entre as linhas de negócios e também com
monitoração e medida) com as não realizadas (Gráfico 10). Com exceção dos quesitos de
estabelecimento de um comitê de direção de segurança e de um grupo de aconselhamento
de segurança para políticas e revisões, todas as outras perguntas mostraram que a
realização das atividades vitais de segurança é maior do que a sua não realização. A
percepção da necessidade de segurança com 75% sim contra 21% não, a definição de
políticas de segurança com 72% sim contra 24% não, a definição de procedimentos para
responder a incidentes de segurança, com 61% sim a 32% não, a classificação da do grau de
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 34
confidencialidade da informação, com 68% sim a 28% não e a gerência de usuários, senhas,
grupos, etc, com 87% sim e 10% não, mostram que, conceitualmente, o assunto segurança
de dados é levado bem a sério nas empresas, embora sem a preocupação de aspectos de
governança, como a existência de um grupo ou comitê superior de aconselhamento que
defina e acompanhe o assunto.
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 35
A conclusão é que essa, certamente, é uma das áreas de Gestão de Dados mais
desenvolvida, senão a mais. Os aspectos de segurança e riscos consequentes são
naturalmente entendidos pela alta gerência, pois o assunto é critico. Por isso, os aspectos de
segurança são bem implementados. Políticas, padrões, procedimentos e auditoria de
segurança são bem resolvidos de maneira geral nas empresas. Os “hackers” e a computação
doméstica prestaram um bom serviço nesse segmento, criando o conceito de necessidade
imperiosa de se ter controles sobre quem acessa “o quê”, “como”, “quando” e “por quê?”.
0% 50% 100%
19%
Define e mantém regras de 6% A atividade é realizada
8% consistentemente entre as linhas de
Match Code (batimento) 58%
9% negócios
26%
Gerencia as mudanças dos dados 5%
6%
mestres e de referência 54%
9%
Se por um lado o corpo de conhecimento anterior (Segurança) foi um dos que apresentaram
maior viés positivo, essas práticas de MDM foram as que apresentaram os menores índices
de realização de atividades e também estão dentre os maiores indicadores de
desconhecimento. O indicador de desconhecimento pode ser interpretado nessa pesquisa
segundo duas óticas. O respondente “desconhece” o sentido central da pergunta ou
conhece do assunto, mas não tem certeza ou conhecimento da sua aplicação na empresa
(Gráfico 11). Em qualquer das duas linhas, esse ponto é relevante, pois a média das
percentagens da resposta “Não sei” foi 9%.
Embora tenha nascido dentro do domínio de clientes, o conceito de MDM hoje já é visto
como ampliado para outros tipos de dados mestres. Veio para resolver algo que, em tese,
deveria ter sido resolvido pelas abordagens de Bancos de Dados. Com a proliferação dos
dados, tabelas e sistemas, o conceito ganhou força e exige procedimentos. Com o crescente
número de fusões e merges de empresas, o problema de duplicação de dados mestres se
amplificou. Esse processo tem grande oportunidade de aplicação, principalmente em
empresas que não adotaram um ERP como solução maior de integração de sistemas. Nessa,
a própria estratégia de implementação do ERP já considera os aspectos de fontes únicas de
dados mestres. De qualquer forma, a abordagem envolve a busca de uma nova arquitetura
com uma camada de tecnologia, que alia análise de possíveis conflitos de dados, com
distribuição/replicação automática de atualizações por entre arquivos/bases de dados. Há
algumas topologias sugeridas para sua implementação e todas deverão ser cuidadosamente
analisadas, pois algumas estratégias implicam complexidades de técnicas de Bancos de
Dados distribuídos/replicados.
A Gestão de Data Warehousing (DW) e Business Intelligence (BI) de acordo com o DMBOK
(2009) consiste em planejar, implementar e controlar processos para prover dados de
suporte à decisão e apoio a colaboradores envolvidos em produção de relatórios, consultas e
análises. Dentre as atividades envolvidas, estão:
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 39
A pesquisa não apontou nenhuma novidade com relação aos aspectos que se esperava de
DW e BI. De acordo com o gráfico 12, todos os números apresentaram viés positivo, com
6,4% de desconhecimento médio. Os valores mais altos se apresentaram no entendimento
da necessidade de informações de BI (78%) contra 15% que disseram não ter essa
compreensão. A definição de uma arquitetura, a criação de depósitos informacionais e a
implementação de ferramentas para usuário foram atividades com índices de 65% a 69%
entre os respondentes. Essa é outra área de conhecimento com razoável maturidade
definida.
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 40
Hoje, grande parte das empresas já busca soluções de BI visando prover informações para
tomadas de decisão e análises mais elaboradas como analytics. Os desafios que surgirão
nesse campo ficam por conta do crescimento dos dados (Big Data) e do uso mais intensivo
de ferramentas de analytics (sentiment analysis, text mining, etc.), buscando entender novas
formas de dados (mídias sociais) ou novos elementos de aproximação com os seus usuários
(BI mobile). Isso não está explicitamente contemplado no modelo DMBOK, mas certamente
estará nos próximos releases. Os conceitos de aplicação de BI em Big Data ainda estão em
formação e sua ainda baixa incidência se alinha com os níveis de desenvolvimento flagrado
no outro corpo de conhecimento (dados não estruturados) e conteúdo.
Gestão de Conteúdo
• Definir e manter taxonomia corporativa para documentos e conteúdo. Já
mencionada anteriormente na função Gerência da Arquitetura de Dados como
“Definir e manter uma taxonomia e padrões de nomes (namespaces) de dados
para a empresa”.
• Documentar /indexar metadados sobre informações de conteúdo.
• Prover acesso e recuperação de conteúdos.
• Estabelecer Governança sobre qualidade de conteúdos.
50%
Planejamento para gestão de 9%
8%
documentos / registros 26%
8%
Implementa sistemas para gestão de 42%
documentos / registros para aquisição, 10%
10% A atividade é realizada
armazenamento, acesso, e controles de 29%
segurança 8%
53%
Realiza backup e Recuperação de 8%
10% A atividade é realizada
documentos / registros 22%
8% consistentemente entre as
linhas de negócios
47%
Retém e elimina documentos / 9%
6%
registros 26% A atividade é realizada,
12% monitorada e medida
31%
Audita gestão de documentos / 6%
3%
registros 45% A atividade não é realizada
15%
31%
Define e mantém taxonomia da 4%
4%
organização 50%
12% Não sei
31%
Documenta / Indexa metadados de 4%
3%
conteúdo de informação 53%
10%
36%
Fornece acesso e recuperação a 9%
4%
conteúdo 37%
14%
Para o DMBOK (2009) a essência deste processo é entender como a empresa trata os
documentos e conteúdos. No fundo, esse corpo de conhecimento começou com a
preocupação com os dados que não estão regularmente controlados via bancos de dados
relacionais e se desloca, hoje, em direção à gerência de todos os tipos de dados não
estruturados. Com o crescimento do conceito de Big Data, englobando dados não
tradicionais, esse item ganha importância e poderá ser revisto nas próximas atualizações do
modelo DMBOK.
objeto e na gerência de seu conteúdo, ou seja, as suas partes integrantes, assuntos, palavras
chaves, taxonomias de conhecimento, entre outras. Além disso, também a sua forma de
relacionamento com os dados estruturados que habitam os gerenciadores tradicionais deve
ser considerada.
A pesquisa, apresentada no Gráfico 13, demonstra que as respostas que possuem o viés
positivo (atividade realizada, realizada consistentemente e monitorada e auditada) são
exatamente as que tocam no sentido mais amplo da gerência de documentos
(Planejamento, implementação, recuperação e backup, retenção/descarte e acesso ao
conteúdo). Nas perguntas associadas a conceitos de qualidade (audita a gestão do processo)
e elementos mais evoluídos da gerência de documentos, como definição e manutenção de
taxonomia e indexação de metadados, observa-se o viés negativo (atividade não realizada e
“não sei”). Isso se explica, pois esses últimos elementos fazem parte das estruturas básicas
da Gerência de Conhecimento, patamar ainda em gestação na maioria das empresas.
Também a ausência de auditoria de qualidade sobre os processos expressa certo grau de
imaturidade das empresas, ainda praticando níveis mais artesanais e menos calcados em
modelos de maturidade.
Dentre as dez funções de gestão de dados propostas pelo DMBOK e abrangidas nesta
pesquisa, a Gestão de Documentos e conteúdo, é uma das que apresentaram os maiores
indicadores de “não sei”, com uma média 12,8%, mandando sinais para a área de
treinamento e/ou ambiente acadêmico. Esse é outro domínio que exige atenção dentro do
espectro de Gestão de Dados, não só pelo seu desconhecimento e pela sua operação, mas
também pelo que está por vir. Hoje há muitos sistemas isolados, já rodando nas empresas,
em áreas de dados especiais. Gerência Eletrônica de Documentos (GED) e sistemas de
tratamentos de dados georreferenciados são exemplos deles. Em primeiro lugar, são
sistemas implantados de forma isolada, com baixa conexão com sistemas corporativos e
normalmente com tecnologias independentes. Com o crescimento de Big Data, com novas
fontes de dados, como redes sociais, fotografias, dados de RFID, e-mails, entre outras, isso
certamente mudará. A empresa deverá analisar cuidadosamente a sua real necessidade e a
demanda por tipos específicos de dados, não devendo se importar com a pluralidade desses
ativos, mas sim com a especificidade de seus requisitos e com as necessidades demandadas
por seus negócios. Novas abordagens, como a gerência de conhecimento ou sentiment
analysis, web mining, text mining, pesquisa de reputação e imagem /tendência de churn em
mídias sociais, exigirão uma nova postura com relação a esse corpo de conhecimento.
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 43
44%
Entende os requisitos de meta- 8%
4%
dados 37%
8%
A atividade é realizada
36%
Define a arquitetura de meta- 4%
5%
dados 47%
8%
A atividade é realizada
36%
Desenvolve e mantém padrões 4% consistentemente entre as
4% linhas de negócios
de meta-dados 50%
6%
A atividade é realizada,
29%
Implementa um ambiente 5% monitorada e medida
4%
gerenciado de meta-dados 54%
8%
A atividade não é realizada
41%
1%
Cria e mantém meta-dados 4%
46%
8%
Não sei
32%
4%
Integra meta-dados 1%
55%
8%
33%
Gerencia repositórios de meta- 3%
6%
dados 50%
8%
Esse processo é aquele em que praticamente todas as respostas ficaram fora do viés
positivo, ou seja, houve a predominância absoluta da resposta “A atividade não é realizada”,
com um grau médio de “não sei” de quase 8%. A única resposta com viés positivo foi o
entendimento dos requisitos de metadados, na clássica imagem de que se entende a
importância daquilo como requisito, mas não se implanta. (Gráfico 14).
Outro ponto importante de se aprofundar aqui é com relação à diferença entre metadados
de negócios e metadados técnicos. Como a pesquisa não detalhou essa diferença, parte das
respostas positivas ainda podem estar direcionada para os metadados técnicos,
normalmente mantidos em ambientes de bancos de dados e de seus catálogos e não para os
metadados de negócios. O item “Cria e mantém metadados”, que apresentou um indicador
de 46% no viés positivo, empatado com o viés negativo, talvez possa ser explicado por esse
aspecto. (Gráfico 14).
se preocupam com uma arquitetura de metadados, afora aqueles que são produzidos
automaticamente pelos SGBD´s para abrigar informações físicas sobre tabelas, campos,
índices, triggers, entre outros. Mas isso é muito pouco, e nesse particular a Gestão
Estratégica de Dados terá muito trabalho pela frente.
40%
Define e promove a 10%
conscientização em qualidade 1%
47%
de dados 1%
A atividade é realizada
31%
Define requisitos de qualidade 9%
6%
de dados 51%
3%
A atividade é realizada
19% consistentemente entre as linhas de
Analisa, avalia e gera o perfil da 8% negócios
8%
qualidade dos dados 62%
4% A atividade é realizada, monitorada e
medida
19%
Define métricas de qualidade de 6%
9%
dados 63%
3% A atividade não é realizada
26%
Gerencia questões de qualidade 10%
9%
de dados 53%
3% Não sei
35%
Limpa e corrige defeitos de 8%
6%
qualidade de dados 47%
4%
Observa-se no Gráfico 15, que na maioria das questões, houve a prevalência do viés de não
realização das atividades (quatro questões contra duas). Os aspectos de definição de
requisitos de qualidade, de análise e avaliação da qualidade dos dados, de definição de
métricas para se gerenciar a qualidade e de gestões sobre qualidade se mostraram com viés
de não realização. Somente duas perguntas apresentaram viés positivo de realização: A
promoção da conscientização em qualidade de dados (com 51% para a realização sobre 47%
para a não) e a limpeza e correção de defeitos de qualidade de dados (com 49% sobre 47%).
Neste último, inclusive, há uma questão fundamental que não foi expressa na pesquisa: O
fato de se limpar e corrigir os defeitos de dados de forma preventiva e profilática e não de
forma reativa, como provavelmente ocorre na maioria das empresas. As respostas podem
ter sido dadas com a percepção de que existe a correção a posteriori e não a priori, que
seria, esta sim, o grande objetivo da prática.
Essa é outra dimensão que apresenta grande lacuna no espectro da gestão estratégica de
dados. A Qualidade de dados talvez seja um dos mais importantes domínios da GD e
paradoxalmente legado a um segundo plano. Há hoje diversas proposições de processos de
qualidade (MIT/Wang, Larry English, Danette McGilvray, Jack Olson, entre outros). O grande
desafio aqui é mostrar que a qualidade tem ROI e isso não é tarefa fácil pela intangibilidade
dos conceitos.
Aspectos mais amplos como disponibilidade dos dados (tê-los quando precisamos),
apresentação (forma de visualização) e amplitude (cobertura com que os dados atingem os
objetivos propostos) são considerados medianamente nas empresas. Embora seja de
fundamental importância e um dos pilares da Gestão estratégica de dados, a qualidade
ainda tem muito caminho a percorrer, conforme sugere a pesquisa e as percepções
qualitativas observadas nas empresas em que atuamos.
A pesquisa ainda abrangeu uma questão onde foi solicitado às empresas que citassem as
ferramentas que apoiavam a gestão de dados e suas funções. Segue abaixo a lista compilada
das principais ferramentas citadas:
ANÁLISE DA PESQUISA: O perfil das empresas brasileiras em gestão e governança de dados 48
Ferramentas de testes: Test Manager, Visual Studio, Team Foundation System (TFS),
Rational Test Suite, HP ALM, Wapt Pro, Red hat
SGBD: DB2, Oracle, Adabas, Postgres, SQL Azure, MS-SQL Server, MySQL, Firebird,
Informix, Sybase, MongoDB e Netezza (IBM)
Ferramentas de BI: Microstrategy, BO-Business Objects, IBM BDW, Oracle BI, MS,
SAP-BI, Pentaho, Powercenter, Oracle BIEE, Web Intelligence, Cognos, Hyperion,
CorVu, Oracle BI, MS-Analysis Services, ER Studio, Talend, Suite IBM
Ferramentas para gestão de Dados Mestres e de Referência: IBM WSI, Visual Studio,
Oracle UCM, Uniface, Suite IBM
Ferramentas para modelagem de dados: CA-Erwin, MS-Visual Studio, EA, SQL Server
Management Studio, Entity Framework, DBDesigner, Power Designer,SQL Developer
Data Modeler, Oracle Designer, Toad Data Modeler, MS-Sharepoint, ER Studio Data
Architect, ERwin-Navigator
4. REFERÊNCIAS BIBLIOGRÁFICAS
BARBIERI, C. Posts sobre Governança de Dados, Big Data, entre outros. Disponível em
http://blogdobarbi.blogspot.com
DMBOK. MOSLEY, M. ; BRACKETT, M.; EARLEY, S. HENDERSON, D. DAMA Guia para o corpo
de conhecimento em gerenciamento de dados. Technics Publications, versão brasileira
2012.
DMBOK. MOSLEY, M.; BRACKETT, M.; EARLEY, S.; HENDERSON, D. The DAMA Guide to The
Data Management Body of Knowledge: DAMA - DMBOK Guide. 1. ed. Estados Unidos:
Technics Publications, 2009.
SADALAGE P.; FOWLER, M. NoSQL Distilled: A Brief Guide to the Emerging World of
Polyglot Persistence. Addison-Wesley, 2013.