Escolar Documentos
Profissional Documentos
Cultura Documentos
Atributo
Um atributo é uma propriedade que identifica, descreve ou mede uma entidade. O
correspondente físico de um atributo em uma entidade é uma coluna, campo, tag ou nó em uma
tabela, visualização, documento, gráfico ou arquivo.
No exemplo abaixo, a entidade Organization possui os atributos de ID fiscal da organização,
Número de telefone da organização e Nome da organização. O funcionário possui os atributos:
Número do funcionário, Nome do funcionário, Sobrenome do funcionário e Data de nascimento
do funcionário. Os detalhes Dependente e Trabalho têm atributos que descrevem suas
características.
Domínio
Na modelagem de dados, um domínio é o conjunto completo de valores possíveis aos quais um
atributo pode ser atribuído. Um domínio fornece um meio de padronizar as características dos
atributos e restringe os dados que podem ser preenchidos no campo.
Por exemplo, o domínio Data, que contém todas as datas válidas possíveis, pode ser atribuído a
qualquer atributo de data em um modelo de dados lógico ou a colunas/campos de data em um
modelo de dados físico, como:
•EmployeeHireDate
•OrderEntryDate
•ClaimSubmitDate
•CourseStartDate
Os domínios são críticos para entender a qualidade dos dados. Todos os valores dentro do
domínio são válidos. Aqueles fora do domínio são chamados de valores inválidos. Um atributo
não deve conter valores fora do domínio atribuído. O domínio para EmployeeHireDate pode ser
definido simplesmente como datas válidas. Sob essa regra, o domínio para EmployeeHireDate não
inclui 30 de fevereiro de qualquer ano.
Modelagem e gerenciamento de dados
A Modelagem de Dados é um processo de descoberta e documentação de informações críticas
para o entendimento de uma organização por meio de seus dados. Os modelos capturam e
permitem o uso do conhecimento dentro de uma organização (ou seja, são uma forma crítica e
uma fonte de metadados). Eles podem até ser usados para melhorar a qualidade dessas
informações, por meio da aplicação de convenções de nomenclatura e outros padrões que
tornam as informações mais consistentes e confiáveis.
Os analistas e designers de dados atuam como intermediários entre os consumidores de
informações (as pessoas com requisitos de negócios para dados) e os produtores de dados que
capturam os dados de forma utilizável. Os profissionais de dados devem equilibrar os requisitos
de dados dos consumidores de informações e os requisitos de aplicação dos produtores de
dados.
Os projetistas de dados também devem equilibrar os interesses de curto e de longo prazo. Os
consumidores de informações precisam de dados em tempo hábil para atender demandas de
curto prazo e avaliar oportunidades. As equipes de projeto de desenvolvimento do sistema devem
atender às restrições de tempo e orçamento. No entanto, eles também devem atender aos
interesses de longo prazo de todas as partes interessadas, garantindo que os dados de uma
organização residam em estruturas de dados seguras, recuperáveis, compartilháveis e
reutilizáveis, e que esses dados sejam os íntegros, oportunos, relevantes e utilizáveis.
Portanto, modelos de dados e projetos de banco de dados devem fornecer um equilíbrio razoável
entre as necessidades de curto e de longo prazo da organização.
Lição módulo 3
3. Habilitando e Mantendo Dados
O foco do trabalho de design, como arquitetura e modelagem de dados, é fornecer informações
sobre a melhor forma de configurar as aplicações que disponibilizam dados utilizáveis, acessíveis
e atuais para a organização. Depois que os dados são configurados em armazéns e aplicações é
necessário um trabalho operacional significativo para que eles continuem a atender aos requisitos
organizacionais.
Este tópico visa descrever as funções de gerenciamento de dados que se concentram na ativação
e manutenção de dados. São elas:
•Armazenamento e Operações de Dados.
•Integração e interoperabilidade de dados.
•Armazenamento de dados.
•Gerenciamento de dados de referência.
•Gerenciamento de dados mestre.
•Gerenciamento de Documentos e Conteúdo.
•Armazenamento de Big Data.
Ralph Kimball define um data warehouse como "uma cópia dos dados de transação estruturados
especificamente para consulta e análise". A imagem a seguir ilustra a abordagem de Kimball, que
exige um modelo dimensional.
À medida que nos aproximamos da terceira década do milênio, muitas organizações estão
construindo armazéns de segunda e terceira geração ou adotando lagos de dados para
disponibilizar dados. Os lagos de dados (Data lake) disponibilizam mais dados a uma velocidade
mais elevada, criando a oportunidade de passar da análise retrospectiva das tendências de
negócios para a análise preditiva.
O gerenciamento de dados requer conhecimento e planejamento, além de exigir a adoção dos
seguintes princípios fundamentais:
Foco nos objetivos de negócios
Verifique se o data warehouse (DW) atende às prioridades organizacionais e resolve problemas
de negócios. Fazer isso requer uma perspectiva estratégica, que, na maioria das vezes, é uma
perspectiva da organização.
Finalidade em mente
O conteúdo do DW deve ser orientado pelas prioridades de negócios e pelo escopo da entrega de
dados finais para Business Intelligence - BI.
Criação de metadados
É fundamental para o sucesso da DW a capacidade de explicar os dados. Por exemplo, ser capaz
de responder a perguntas básicas como "Por que essa soma é X?" "Como isso foi calculado?" E
"De onde vêm os dados?" Os metadados devem ser capturados como parte do ciclo de
desenvolvimento e gerenciados como parte das operações em andamento.
Colaboração
Associar-se com outras iniciativas de dados, especialmente as de governança, qualidade e
metadados.