Você está na página 1de 51

Aula 01

Dados Estruturados
Tribunal de Contas da União – 2021 - FGV
Ementa
• Dados, Informação, Conhecimento e Inteligência

• Dados estruturados e não estruturados.

• Dados abertos.

• Coleta, tratamento, armazenamento, integração e recuperação de


dados
Dados, Informação,
Conhecimento e Inteligência
Gestão do conhecimento

Planejamento Ação Dado Informação

Ajustar Avaliação

Conhecimento
Dados
• RAW ou dados primários
• Discretos
• São fatos objetivos sobre um evento
• Informação em forma de texto, número ou símbolos
• Podem ser usados por computador
• Ex: 42, coelhos, maçãs, 09743245530, 40
• Itens de dados precisam fazer parte de uma
estrutura, como uma frase, para terem um
significado.
Dados
Definição:

Dados podem ser definidos como sucessões de fatos brutos, que


não foram organizados, processados, relacionados, avaliados ou
interpretados, representando apenas partes isoladas de eventos,
situações ou ocorrências.
Dados Dados

Não foram organizados,


Simples observações
processados, Não possuem um
Fatos brutos relacionados, avaliados significado definido.
sobre o estado do
mundo
ou interpretados.

Representado por
letras, números e
outros símbolos
Informação
• Uma interpretação sobre os dados
• Contextualizado, categorizado, calculado ou condensando.
• São fatos sobre uma situação, pessoa ou evento.
• Transforma-se os dados em informação com significado
• Filtrando, ordenando, estruturando
• Não existe conclusão, mas a organização dos dados permite
análise.
Informação
• Definição: Para transforma dados em informações precisamos que
os mesmos sejam:
• (1) precisos e oportunos
• (2) específicos e organizados para um propósito
• (3) apresentados dentro de um contexto que lhe dê significado e
relevância, e
• (4) que podem levar a um aumento na compreensão e diminuição da
incerteza.
• A informação é valiosa porque pode afetar o comportamento, uma
decisão ou um resultado.
Informação

Dados

Informação
Aumento na compreensão e diminuição da incerteza.
Possui propósito e contexto.
Envolve coleta, organização, categorização, orientação,

Significado combinação e interpretação.


e → Resultado do processo de acrescentar significado aos
relevância
dados.
Dados x Informação
Dados

Informação
são fatos brutos, em Consiste no
sua forma primária – e, agrupamento de dados
muitas vezes, os dados de forma organizada
podem não fazer para fazer sentido e
sentido sozinhos gerar conhecimento.
Conhecimento
• Nestes momentos as informações passam por um processo de
validação, com foco naquilo que se quer obter.
• Recebem tratamento adequado:
- Específico de acordo com os critérios inicialmente definidos
- Sob ponto de vista estratégico
- Caráter informativo
Conhecimento

Informação

Conhecimento
Informação em ação, contextual, relevante e acionável.
Informação valiosa da mente humana. Inclui reflexão,
síntese e contexto.
Propriedade subjetiva, inerente a quem analisa os
Reflexão e dados ou as informações.
síntese
Difícil de armazenar e estruturar.
Resumindo
Dados Informação Conhecimento
Simples observações sobre o estado do Dados dotados de relevância e propósito Informação valiosa da mente
mundo. humana. Inclui reflexão, síntese e
contexto
• Facilmente estruturado
• Requer unidade de análise
• Facilmente obtido por máquinas • De difícil estruturação
• Exige consenso em relação ao
• Frequentemente quantificado • De difícil captura em máquinas
significado
• Facilmente transferido • Frequentemente tácito
• Exige mediação humana
• De difícil transferência.
Inteligência
• Nesta etapa os tomadores de decisão aplicam ao conhecimento
gerado, suas habilidades, suas competências de negócio e
vivência na organização, para identificar direções estratégicas, tais
como:
- Novos projetos de pesquisa
- Acordos de cooperação
- Transferência de tecnologia
- Ações e reações da concorrência
Vamos incluir a inteligência!
Análise

Informação Inteligência
• Fatos brutos em sua • Informação valiosa
forma primária. da mente humana.
• Dados com • Conhecimento
• São sinais não • Adquirido por meio
significado, dotados aplicado somado à
processados de reflexão, análise
de relvância e experiência e
e avaliação.
propósito. intuição.

Dados Conhecimento

Processamento Aplicação e síntese


Ligando tudo!
Espiral do conhecimento
Questão
• Órgão: TCM-BA Cargo: Auditor de Contas
• O diretor de uma montadora de veículos necessita tomar uma decisão acerca da
continuidade ou não de um dos produtos vendidos no Brasil. Para tanto, solicitou um
relatório sobre as vendas de carros da marca do último trimestre de 2018, por faixa de
preço, região, modelo e cor. Nessa situação, no contexto de análise da informação, o
relatório representa
• A conhecimento.
• B inteligência.
• C dados.
• D informação.
• E sabedoria.
Questão
• Órgão: TCM-BA Cargo: Auditor de Contas
• O diretor de uma montadora de veículos necessita tomar uma decisão acerca da continuidade ou
não de um dos produtos vendidos no Brasil. Para tanto, solicitou um relatório sobre as vendas de
carros da marca do último trimestre de 2018, por faixa de preço, região, modelo e cor. Nessa
situação, no contexto de análise da informação, o relatório representa
• Experência
• A conhecimento.
Inteligência • Intuição
• B inteligência. • Complexidade

• C dados. • Confiabilidade
Conhecimento • Relevância
• D informação. • Importância
• E sabedoria.
• Dados que passam por algum
Informação processamento

• Fatos
Dados • Textos
• Imagens
Mapa mental
Dados estruturados e Não
estruturados
Dados estruturados

• Dados organizados em blocos semânticos (relações)


• Dados de um mesmo grupo possuem as mesmas
descrições (atributos)
• Descrições para todas as classes de um grupo possuem o
mesmo formato (esquema)
• Dados mantidos em um SGBD são chamados de Dados
Estruturados por manterem a mesma estrutura de
representação (rígida) e previamente projetada (esquema)
Exemplo de dados estruturados
XML
Formas de representação
Dados semiestruturados
Atualmente, muitos dados não são mantidos em Bancos de dados

Dados Web, por exemplo, apresentam uma organização bastante heterogênea.

A alta heterogeneidade dificulta as consultas a estes dados

• Que são classificados como semiestruturados


• Não são estritamente tipados
• Não são completamente não-estruturados

Os dados semiestruturados são dados onde o esquema de representação está presente (de forma explícita ou implícita)
Dados semiestruturados (Características)
Definição à • Esquemas são definidos após a existência dos dados
posteriori • Investigação de suas estruturas particulares

• Não existe um esquema padrão para os dados


Estrutura irregular • Coleções de dados são definidos de maneiras diferentes, contendo
informações incompletas

Estrutura implícita • Muitas vezes existe uma estrutura implícita

Estrutura parcial • Apenas parte dos dados disponíveis podem ter uma estrutura
Dados Não-estruturados
• São os dados que não possuem uma estrutura
definida.
• Normalmente caracterizados por documentos
textos, imagens, vídeos, etc.
• Nem as estruturas são descritas implicitamente
• Grande maioria dos dados atuais na Web e nas
empresas seguem este formato.
- Dados são independente de estruturas e
são armazenados.
Não estruturado
- Ex: Documentos em texto, PDFs, imagens e
vídeos.

Arquivos de dados em formato de texto com


Semiestruturado um padrão aparente
Ex: JSON, RDF, OWL, XML

Os dados possuem um modelo de dados,


Estruturado formato e estrutura.
Ex: Banco de dados.
Organizando
Característica Dados Estruturados Dados Semiestruturados Dados Não estruturados
Nem sempre há um
Esquema Pré-definido Não há esquema
esquema
Estrutura Regular Irregular Não tem estrutura
Estrutura independente dos Estrutura embutida nos Pode não ter estrutura
Relação dados x estrutura
dados dados alguma

Estrutura extensa (cada


Definição da Estrutura Estrutura reduzida dado/registro pode ter sua -
organização própria)

Evolução da Estrutura Fracamente evolutiva Fortemente evolutiva -

Prescritiva (esquemas
Momento da definição fechados com restrições de Estrutura descritiva -
integridade

Arquivos Word, Vídeo,


Exemplos Bancos de dados relacionais JSON, OWL, XML, RDF
áudio, PDF e imagens.
Questão (Inédita).
• A respeito de dados estruturados, semiestruturados não estruturados e abertos,
assinale o item correto.
• A) Os dados não estruturados são armazenados em bancos de dados tradicionais.
• B) Os dados semiestruturados misturam nomes de tipos de dados e valores de dados
precisam seguir uma estrutura predefinida fixa.
• C) Os dados estruturados referem-se à informação exibida na Web, especificada pela
HTML, em que a informação sobre os tipos dos itens de dados não existe.
• D) Diversos modelos de dados foram introduzidos para representar dados
semiestruturados, geralmente com base no uso de estruturas de dados de lista
ligada ou pilha, em vez das estruturas do modelo relacional
• E) Dados semiestruturados são autodescritivos, ou seja, a informação do esquema
no modelo semiestruturado é misturada com os objetos e seus valores de dados na
mesma estrutura de dados.
Tipos de dados
Dados Abertos
Motivação (Movimento de dados abertos)
• A filosofia por trás deste movimento é, em seus fundamentos,
centrada no cidadão.
• O livre acesso aos dados contribui para o aprimoramento das
instituições democráticas, devendo contribuir para enriquecer o
debate, estimular os servidores e a renovação dos serviços
públicos.
• Open Data é um processo político cuja mensagem é construída em
torno da transparência na inovação e no desenvolvimento da ação
pública.
Quais dados podem ser abertos?

Dados públicos ou informações provenientes do setor público

• Inclui todos os dados coletados por organismos públicos em todos os níveis

Dados de pesquisas científicas

• Em particular, de pesquisas com financiamento público

Dados do setor privado

• Que podem ser tornados públicos com os incentivos adequados e proteções de


privacidade.
Elementos
Disponibilidade e acesso Reutilização e redistribuição Participação universal

Os dados devem estar Os dados devem ser Todos devem ser


disponíveis como um disponibilizados de capazes de usar,
todo e devem ser forma a possibilitar a reutilizar e disseminar
acessíveis de forma sua reutilização e dados.
confortável e redistribuição, incluindo
modificável a possibilidade de
combinação com outros
conjuntos de dados
O que são dados abertos?
• Dados Abertos são livremente disponíveis para todos utilizarem e
redistribuírem como desejarem, sem restrição de licenças,
patentes ou mecanismos de controle. (disponibilidade e acesso)
• Todo dado público tem vocação para ser dado aberto. Como
praticamente todo dado governamental é público, é fundamental
que os governos implementem políticas para disponibilizá-los.
Dados são abertos quando qualquer pessoa pode livremente
acessá-los, utilizá-los, modificá-los e compartilhá-los para qualquer
finalidade, estando sujeito a, no máximo, a exigências que visem
preservar sua proveniência e sua abertura.
As três leis dos dados abertos
governamentais
Se o dado não pode ser encontrado e indexado na Web, ele
não existe.

Se não estiver aberto e disponível em formato compreensível


por máquina, ele não pode ser reaproveitado.

Se algum dispositivo legal não permitir sua replicação, ele


não é útil.
Oito princípios

Completos. Primários. Acessíveis. Atuais.

Processáveis Acesso não Formatos não Livres de


por máquina discriminatório proprietários licenças
Cinco motivos para abertura dos dados
Transparência na gestão pública

Contribuição da sociedade com serviços inovadores ao cidadão

Aprimoramento na qualidade dos dados governamentais

Viabilização de novos negócios

Obrigatoriedade por lei


Legislação vigente
• Lei complementar 101/2000 (Lei de Responsabilidade Fiscal – LRF)
• Lei Complementar 131/2009 (Lei da Transparência)
• Lei 12.527/2011 (Lei de Acesso à Informação - LAI)
• Instrução Normativa SLTI/MP – 4/2012, que instituiu a Infraestrutura
Nacional de Dados Abertos (INDA)
“Cabe destacar que a LAI aperfeiçoou a ideia de transparência ao dispor
que as informações de interesse coletivo ou geral produzidas por órgãos e
entidades públicas devem ser obrigatoriamente divulgadas em sítios
oficiais na internet, que deverão possibilitar a gravação de relatórios em
diversos formatos eletrônicos, inclusive abertos e não proprietários.”
Política de Dados Abertos do Poder
Executivo Federal
• Define regras para disponibilização de dados abertos
governamentais no âmbito do Poder Executivo Federal.
• Ela é constituída por uma série de documentos normativos, de
planejamento e de orientação.
• Os principais instrumentos que regulam a Política são
• Decreto nº 8.777, de 2016
• Decreto nº 9.903, de 2019
• Resolução nº 3 do Comitê Gestor da INDA (CGINDA)
• O órgão responsável pela gestão e monitoramento da Política é a
Controladoria-Geral da União (CGU), por meio da Infraestrutura
Nacional de Dados Abertos.
Questão.
• Sobre dados abertos assinale a alternativa correta:
• A) Os dados devem estar disponíveis como um todo e sob custo maior que um
custo razoável de reprodução, preferencialmente possíveis de serem baixados
pela internet.
• B) Os dados devem também estar disponíveis de uma forma conveniente e
não modificável.
• C) os dados devem ser fornecidos sob termos que permitam a reutilização e a
redistribuição, inclusive a combinação com outros conjuntos de dados.
• D) A interoperabilidade não é um elemento importante no contexto de dados
abertos.
• E) Uma das principais desvantagens associadas ao Open Data é que promove
o desenvolvimento de uma cultura centrada na partilha de informação e na
colaboração intersetorial.
Mapa Mental
Coleta, tratamento,
armazenamento, integração e
recuperação de dados.
Coleta

Recuperação Tratamento

Armazenamento Descarte
Ciclo de vida da informação

Descarte Manuseio

Confidencialidade Disponibilidade

Integridade

Transporte Armazenamento
Coleta

Recuperação Tratamento

Armazenamento Descarte
Coleta, tratamento, armazenamento,
integração e recuperação de dados.
Obrigado!
TCU – 2021 - FGV

Você também pode gostar