Escolar Documentos
Profissional Documentos
Cultura Documentos
DADOS
DADOS ESTRUTURADOS E NÃO
ESTRUTURADOS
Os principais tipos de dados básicos podem ser classificados em:
Dados Estruturados
Dados Não Estruturados
Dados Semi-Estruturados
ERRADO
(CESPE/TCE-SC/Auditor Fiscal de Controle Externo – Informática/2016)
A respeito de dados estruturados, não estruturados e abertos, julgue o item subsequente.
Em se tratando de dados estruturados, a informação de esquema está mesclada aos valores dos dados, e
cada objeto de dados pode ter atributos diferentes, que não são conhecidos com antecedência. Essa
característica os diferencia de dados não estruturados.
(CESPE/TCE-SC/Auditor Fiscal de Controle Externo – Informática/2016)
A respeito de dados estruturados, não estruturados e abertos, julgue o item subsequente.
Em se tratando de dados estruturados, a informação de esquema está mesclada aos valores dos dados, e
cada objeto de dados pode ter atributos diferentes, que não são conhecidos com antecedência. Essa
característica os diferencia de dados não estruturados.
ERRADO
DADOS SEMI-ESTRUTURADOS
Não são estritamente tipados
Não são complementamente não-estruturados
Os dados semi-estruturados são dados onde o esquema de representação está presente (de
forma explícita ou implícita)
Auto-descritivo
Uma análise do dado deve ser feita para que a sua estrutura possa ser identificada e extraída
Esquema pode ser mudado com facilidade
Provê flexibidade
DADOS SEMIESTRUTURADOS
Arquivos de intercâmbio eletrônico de dados (EDI Files)
Planilhas
Feeds RSS
Dados de sensores
XML – eXtensible Markup Language
RDF – Resource Description Framework
OWL – Web Ontology Language
JSON - JavaScript Object Notation
EXEMPLO DE XML
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
JSON
CARACTERÍSTICAS DO
SEMIESTRUTURADOS
a) Definição à posteriori: esquemas para dados semi-estruturados são usualmente definidos
após a existência dos dados, com base em uma investigação de suas estruturas particulares e da
análise de similaridades e diferenças. Isto não significa que sempre existe um esquema
associado a um dado semi-estruturado;
b) Estrutura irregular: coleções extensas de dados semanticamente similares estão
organizados de maneiras diferentes, podendo algumas ocorrências terem informações
incompletas ou adicionais em relação a outras. Em suma, não existe um esquema padrão para
esses dados. O exemplo do curriculum vitae se enquadra nesta característica;
c) Estrutura implícita: muitas vezes existe uma estrutura básica para os dados, porém, essa
estrutura está implícita na forma como os dados são apresentados. É necessário realizar uma
computação para obter essa estrutura;
CARACTERÍSTICAS DO
SEMIESTRUTURADOS
d) Estrutura parcial: apenas parte dos dados disponíveis pode ter alguma estrutura, seja
implícita ou explícita. Por exemplo, componentes de objetos que são arquivos bitmaps são não-
estruturados. Já dados pessoais podem ter uma estrutura básica implícita ou explícita. Como
consequência, um esquema para estes dados nem sempre é completo do ponto de vista
semântico e nem sempre todas as informações esperadas estão presentes;
e) Estrutura extensa: a ordem de magnitude de uma estrutura para estes dados é grande, uma
vez que os mesmos são muito heterogêneos. Supondo diferentes formatos para um curriculum
vitae, uma união de atributos significativos em cada formato pode produzir um esquema
extenso;
CARACTERÍSTICAS DO
SEMIESTRUTURADOS
f) Estrutura evolucionária: a estrutura dos dados modifica-se tão freqüentemente quanto os
seus valores. Dados Web apresentam este comportamento, uma vez que existe o interesse em
manter dados sempre atualizados;
g) Estrutura descritiva e não prescritiva: dada a natureza irregular e evolucionária dos dados
semi-estruturados, as estruturas de representação implícitas ou explícitas normalmente se
restringem a descrever o estado corrente de poucas ocorrências de dados similares. Desta forma,
não é possível prescrever esquemas fechados e muitas restrições de integridade com relação à
semântica dos atributos. Um sinônimo para estrutura descritiva é estrutura indicativa;
h) Distinção entre estrutura e dados não é clara: como a estrutura está embutida na descrição
dos dados, muitas vezes a distinção lógica entre estrutura e valor não é clara. Pode-se ter, por
exemplo, um endereço representado como um valor atômico em uma ocorrência de dado
(string) ou como um tipo definido pelo usuário (com atributos rua, número e complemento) em
outra ocorrência. Esta característica torna mais complicado o projeto de um BD para tais dados.
QUADRO COMPARATIVO
SEMI-ESTRUTURADO
Informação do esquema é misturada com os valores dos dados, já que cada objeto de dado
pode ter atributos diferentes que não são conhecidos antecipadamente. Logo, esse tipo de
dados é chamado de autodescritivo.
SEMI-ESTUTURADOS
Os rótulos (marcas, labels ou tags) nas
arestas direcionadas representam os
nomes de esquema: os nomes de
atributos, tipos de objeto (ou tipos de
entidade ou classes) e relacionamentos.
Os nós internos representam objetos
individuais ou atributos compostos. Os
nós de folha representam valores de
dados reais de atributos simples
(atômicos).
SEMI-ESTRUTURADOS
Fazem uso de indexação
Uso de NOSQL
Bancos de dados NoSQL são criados para modelos de dados específicos e têm esquemas flexíveis
São bancos não relacionais
DADOS NÃO ESTRUTURADOS
Não possuem organização predefinida
Não possuem estrutura definida
As estruturas não são descritas implicitamente
É maioria dos casos
Áudio, vídeo, textos, planilhas, e-mails, fotos...
Difícil fazer a pesquisa
heterogeneidade dos dados
Diversidade
Big Data
Heterogeneidade
CERTO
CEBRASPE (CESPE) - Analista Judiciário (TJ SE)/2014
Acerca de bancos de dados semiestruturados e bancos de dados NOSQL, julgue o item
subsecutivo.
CERTO
UEPA - Técnico em Gestão de Informática (FAPESPA)/2014
Dados semiestruturados são representados por:
a) Tabelas
b) Entidades
c) Objetos
d) Esquemas
e) Arquivos XML
UEPA - Técnico em Gestão de Informática (FAPESPA)/2014
Dados semiestruturados são representados por:
a) Tabelas
b) Entidades
c) Objetos
d) Esquemas
e) Arquivos XML