Escolar Documentos
Profissional Documentos
Cultura Documentos
dados modulo 1
Neste módulo, você aprenderá a:
Identificar formatos de dados comuns
Descrever as opções para armazenar dados em arquivos
Descrever as opções para armazenar dados em bancos de dados
Descrever as características das soluções de processamento de dados transacionais
Descrever as características de soluções de processamento de dados analíticos
Introdução
Ao longo das últimas décadas, a quantidade de dados gerados por sistemas,
aplicativos e dispositivos aumentou consideravelmente. Os dados estão em
todos os lugares, em uma infinidade de estruturas e formatos.
Agora é mais fácil coletar dados e mais barato armazená-los, o que torna os
dados acessíveis para quase todas as empresas. As soluções de dados incluem
tecnologias de software e plataformas que podem ajudar a facilitar a coleta, a
análise e o armazenamento de informações valiosas. Toda empresa gostaria
de aumentar suas receitas e gerar maiores lucros. Nesse mercado competitivo,
os dados são ativos valiosos. Quando analisados corretamente, os dados
fornecem uma infinidade de informações úteis e apresentam decisões
comerciais críticas.
Objetivos de aprendizagem
Neste módulo, você aprenderá a:
Dados estruturados
Dados semiestruturados
Dados semiestruturados são informações que têm alguma estrutura, mas que
permitem alguma variação entre instâncias da entidade. Por exemplo, embora
a maioria dos clientes possa ter um endereço de email, alguns podem ter
vários endereços de email e outros podem não ter nenhum.
// Customer 1
{
"firstName": "Joe",
"lastName": "Jones",
"address":
{
"streetAddress": "1 Main St.",
"city": "New York",
"state": "NY",
"postalCode": "10099"
},
"contact":
[
{
"type": "home",
"number": "555 123-1234"
},
{
"type": "email",
"address": "joe@litware.com"
}
]
}
// Customer 2
{
"firstName": "Samir",
"lastName": "Nadoy",
"address":
{
"streetAddress": "123 Elm Pl.",
"unit": "500",
"city": "Seattle",
"state": "WA",
"postalCode": "98999"
},
"contact":
[
{
"type": "email",
"address": "samir@northwind.com"
}
]
}
Observação
O JSON é apenas uma das muitas maneiras pelas quais os dados
semiestruturados podem ser representados. O importante aqui não é fornecer
um exame detalhado da sintaxe JSON, mas sim ilustrar a natureza flexível das
representações de dados semiestruturados.
Armazenamentos de dados
As organizações normalmente armazenam dados em formato estruturado,
semiestruturado ou não estruturado para registrar detalhes de entidades (por
exemplo, clientes e produtos), eventos específicos (como transações de
vendas) ou outras informações em documentos, imagens e outros formatos.
Os dados armazenados podem ser recuperados para análise e relatórios
posteriormente.
Armazenamentos de arquivos
Bancos de dados
Exploraremos esses dois tipos de armazenamento de dados nos tópicos
subsequentes.
Explorar o armazenamento de
arquivos
A capacidade de armazenar dados em arquivos é um elemento básico de
qualquer sistema computacional. Os arquivos podem ser armazenados em
sistemas de arquivos locais no disco rígido do seu PC e em mídia removível,
como unidades USB. Mas, na maioria das organizações, arquivos de dados
importantes são armazenados de maneira centralizada em algum tipo de
sistema de armazenamento de arquivos compartilhado. Cada vez mais, esse
local de armazenamento central está sendo hospedado na nuvem,
possibilitando um armazenamento econômico, seguro e confiável para
grandes volumes de dados.
FirstName,LastName,Email
Joe,Jones,joe@litware.com
Samir,Nadoy,samir@northwind.com
JSON
{
"customers":
[
{
"firstName": "Joe",
"lastName": "Jones",
"contact":
[
{
"type": "home",
"number": "555 123-1234"
},
{
"type": "email",
"address": "joe@litware.com"
}
]
},
{
"firstName": "Samir",
"lastName": "Nadoy",
"contact":
[
{
"type": "email",
"address": "samir@northwind.com"
}
]
}
]
}
{1>linguagem XML<1}
O XML é um formato de dados legível que foi popular nos anos 90 e 2000. Ele
tem sido amplamente substituído pelo formato JSON que é menos detalhado,
mas ainda há alguns sistemas que usam XML para representar dados. O XML
usa marcas delimitadas por colchetes angulares (<../>) para
definir elementos e atributos, conforme mostrado neste exemplo:
<Customers>
<Customer name="Joe" lastName="Jones">
<ContactDetails>
<Contact type="home" number="555 123-1234"/>
<Contact type="email" address="joe@litware.com"/>
</ContactDetails>
</Customer>
<Customer name="Samir" lastName="Nadoy">
<ContactDetails>
<Contact type="email" address="samir@northwind.com"/>
</ContactDetails>
</Customer>
</Customers>
O Avro é um formato baseado em linha. Ele foi criado pelo Apache. Cada
registro contém um cabeçalho que descreve a estrutura dos dados no
registro. Esse cabeçalho é armazenado como JSON. Os dados são
armazenados como informações binárias. Um aplicativo usa as
informações no cabeçalho para analisar os dados binários e extrair os
campos contidos neles. O Avro é um formato bom para compactar
dados e minimizar os requisitos de armazenamento e largura de banda
de rede.
Bancos de dados de grafo, que armazenam entidades como nós com links
para definir relações entre eles.
Linhas e colunas
Cabeçalho e rodapé
Páginas e parágrafos
2.
3.