Você está na página 1de 19

Tipos de dados

Índice

01 Vamos rever: O que são dados?


02 Dados estruturados
03 Dados não estruturados
04 Dados semi-estruturados
05 Conclusões
01 Vamos rever:
O que são dados?
#Dado Então...

Um dado é uma representação simbólica (numérica,


alfabética, algorítmica, espacial, etc.) de um
atributo ou variável, quantitativa ou qualitativa.
Os dados descrevem fatos ou eventos empíricos.

Portanto, um dado é um valor ou referência que um


software recebe por diferentes meios. Os dados
representam informações que o programador manipula
na construção de uma solução ou no desenvolvimento
de um algoritmo.
#Dado Lembre-se de que...

Só os dados não contêm informações relevantes.


Somente quando um conjunto de dados é examinado, à
luz de uma abordagem, hipótese ou teoria, que se
torna informativo.

Como os dados são exibidos?


Podemos encontrá-los como números, estatísticas ou
declarações descritivas que relatam os estados de
coisas. A seguir, veremos os tipos de dados.
02 Dados estruturados
Fontes relacionais e não
relacionais
Para entender a aplicação e
definição de cada etapa da ETL, ■ As fontes relacionais fornecem dados
precisamos entender as fontes e estruturados (tabelas).
tipos de dados.
■ Fontes não-relacionais fornecem dados não
Vejamos agora a diferença entre as estruturados ou dados semi-estruturados.
fontes de dados relacionais e não
relacionais.
SQL
Existem vários Sistemas de Gerenciamento de
Bancos de Dados Relacionais (RDBMS).

Estes sistemas permitem que os dados sejam


gerenciados em SQL (Structured Query Language).

SQL é uma linguagem estruturada para consulta e


manipulação de bancos de dados relacionais.

Em SQL, os bancos de dados relacionais têm a tarefa de


armazenamento. Em outras palavras, eles mantêm os
dados e os disponibilizam para outros sistemas e
aplicações.
Modelagem de dados + MER
Os sistemas de gerenciamento de banco de dados mais
populares atualmente no mercado são ORACLE,
Microsoft SQL Server, MySQL e PostgreSQL.

A palavra "relacional" se deve ao fato de que o objetivo


principal é relacionar os dados armazenados. Isto é feito
através de um processo chamado modelagem de dados,
em conjunto com o MER, ou mais conhecido como ER
(Entity and Relationship Model).

MER é a parte das ciências da computação que trata das


estruturas de construção para armazenamento e
recuperação de dados.
Modelagem de dados + MER

As estruturas construídas pela MER armazenam dados como se


fossem etiquetas, utilizando os conceitos de linhas e colunas.

MER relaciona esses dados e simplifica o trabalho de


armazenamento e recuperação dos mesmos.

Esta organização é geralmente feita por linhas e colunas


(semelhante a planilhas Excel), mas pode variar de acordo com a
fonte de dados.
Os dados estruturados são então…

Podemos concluir que são dados agrupados, salvos e armazenados de forma


organizada, para poderem ser recuperados em algum momento.
O processo de armazenamento dos dados é conhecido como persistência.
A unidade onde esses dados são armazenados é conhecida como um banco de
dados relacional.

Exemplos:

➔ Folhas de cálculo (Excel)


➔ Bancos de dados
➔ Arquivos XML
➔ Arquivos CSV
03 Dados não
estruturados
Dados não estruturados

Os bancos de dados em geral não contêm todas as


informações possíveis sobre algo que eles tenham
armazenado.

Como já dissemos, um dado é uma forma organizada de


informação. Mas a organização só ocorre se os campos
específicos forem preenchidos, de modo que a recuperação de
dados seja automatizada.

Portanto, quando não conseguimos identificar uma


organização dos dados armazenados, concluímos que se
trata de dados não estruturados.
Portanto, dados não estruturados são...

Tipos de dados que não possui estruturas bem definidas, alinhadas ou padronizadas.
Eles podem ser compostos de vários elementos dentro de um todo. Por exemplo, milhares de pixels únicos dentro da
paisagem de uma fotografia.

Exemplos:
➔ Fotos
➔ Áudios
➔ Vídeos
➔ Textos livres
➔ Emojis ou stickers
04 Dados
semi-estruturado
Dados semi-estruturados
Os dados semi-estruturados têm uma organização bastante heterogênea. A distinção entre estrutura e valor é
nebulosa, o que dificulta a consulta e a classificação.
Em geral, os dados semi-estruturados não são estritamente classificados, não são mantidos em um Sistema de
Gerenciamento de Banco de Dados, mas no que é conhecido como um Data Lake (conceito de armazenamento a ser
discutido posteriormente).
Exemplos:
➔ Arquivos de vídeo ➔ Documentos de texto
➔ Arquivos de áudio ➔ Informações sobre as mídias sociais
➔ Imagens ➔ E-mails
05 Conclusões
Conclusões

Do ponto de vista técnico, os dados são um conjunto de valores


decorrentes de variáveis quantitativas e qualitativas sobre
eventos, pessoas ou vários objetos.

Embora os termos "dados" e "informação" sejam frequentemente


utilizados de forma intercambiável, estes conceitos têm
significados diferentes.
Muito obrigado!

Você também pode gostar