Você está na página 1de 7

DP-900

Módulo 1 - Explorar os principais conceitos de dados

Explore os principais conceitos de dados

O que são dados?


São uma coleção de informações como cpf, nome, vídeos entre
outros. Dados formas entidades e entidades formam organizações,
cada identidade tem suas instâncias.

Dados Estruturados
(SQLServer // DB SQL Azure) → Dados estruturados seguem uma base
tabular, ou seja, são organizados de uma forma que as instâncias e
entidades se correlacionam para formar uma organização.

Dados Semiestruturados

(Não residem em um banco de dados estruturado, funciona mais


ou menos com um dicionário // JSON // Cosmo DB)

No caso de dados semiestruturados é possível ter uma estrutura


mais flexível, onde diferente do estruturado que segue um padrão

DP-900 1
rígido. No caso para um objeto você pode ter colunas x e y e no
objeto seguinte que segue a mesma linha de raciocínio é possível
ter os dados x, y e z.

Dados não estruturados


(Armazenamento por blob) → Basicamente eles não tem uma estrutura
definida (vídeos, arquivos em geral, emails, entre outros), sendo assim
não é muito eficaz organizar dados não estruturados em uma
organização tabular.

Armazenamento de arquivos

Texto delimitado (TSV, CSV …)

JSON

XML

Blob

Formatos de arquivo otimizados

Avro

Banco de dados

Relacional

Não relacional

Banco de dados chave valor

Banco de dados de documentos

Banco de dados de família de colunas

Banco de dados de grafo

Armazenamento de dados transversais versus analítico

O que é o processamento transacional online (OLTP)?

O que é esse conceito?

DP-900 2
Referencia uma situação no dia a dia de aplicações que
movimentam dados em diversos contextos online e
baseado nisso tem fatores para realizar essa transição de
forma mais segura e eficiente (Atomicidade, Consistência
Isolamento e durabilidade).

ACID

Atomicidade

Na atomicidade é referente a um método de segurança


no processamento dos dados, onde em uma
“passagem” de uma conta para outra só vai ocorrer se
tudo estiver correto, em qualquer outra ocasião os
dados vão permanecer onde estavam ocorrendo assim
uma falha de comunicação e evitando a perda de
dados em transito.

Consistência

Se sair x de uma conta automaticamente nessa conta


vai ter que ficar -x e a conta que receber x vai ter que
ficar com +x, ou seja, a consistência relacional no
processamento de dados.

Isolamento

Os processos tem que coexistir, ou seja, em uma


situação de transito e verificação tem que ser realizada
de forma mais atualizada possível.

Durabilidade

Se sair x de uma conta tem que chegar x no destino e


tem que se manter assim até que outra ação seja
tomada.

O que é o processamento analítico online (OLAP)?

O processamento analítico de dados é um processo que tem o


objetivo de tomada de decisão, ou seja, é importante para

DP-900 3
tomadas de decisão dentro da empresa utilizando ferramentas
como o Data Lake e o data warewharehouse.

Explorar funções

Administrador de banco de dados

Camadas de acesso

Backups

Resolve se der algum problema

Engenheiro de dados

Trabalha de fato com o processo de lapidação dos dados, faz o


tratamento.

Analista de dados

Faz a parte visual e analítica dos dados lapidados pelo engenheiro


para conseguir criar relatórios com informações úteis para a
empresa.

Explorar Serviços

SQL do Azure

Azure Data Studio

Se comunica com vários tipos de banco de dados

SQL Server Management Studio

Gerenciamento dos serviços de dados (locais e na nuvem)

Portal do Azure + CLI

Fazer os processos com o banco de dados sendo processado nas


linhas de comando do portal da Azure

Azure Synapse Studio

Azure Data Factory

Ferramenta que o engenheiro usa pra fazer o ELT (Extrair,


transformar e carregar)

DP-900 4
⁉️ O que são bancos de dados distribuídos?

⁉️ O que é o Data Warehouse?

⁉️ O que é um stakeholder?
Módulo 2 - Explorar dados relacionais no Azure

Linguagem SQL

DDL

Definição de dados → Comandos que interagem com tabelas


(Create, alter, drop)

DML

Manipulação de dados → Comandos que interagem com os dados


diretamente (Insert, update e delete)

TCL

DP-900 5
Transações → Alterações no banco de dados (Commit e Rollback
+ comandos DML)

DCL

Controle de dados → Níveis de acesso, segurança (Grant e


Revoke)

Identificar casos de uso do banco de dados relacional

Índice

O índice funciona mais ou menos como um filtro no banco para


facilitar o acesso a informações específicas no banco de dados

Exibição

É o resultado de uma consulta baseado no relacionamento do


banco de dados (chave primárias e estrangeiras) → Conjunto de
dados que estão sendo retornados baseado no contexto da
consulta.

Entidades

São informações que tem subi formações

Normalização

Cada entidade tem que ter sua própria tabela

Realizar as relações para facilitar a comunicação entre as tabelas

Relação

Facilitar a duplicação de dados através da referencia entre uma


tabela e outra.

Procedimento armazenado

Onde criamos regras para serem utilizadas posteriormente.

Não relacional

Análise de dados

Descritivas

DP-900 6
O que aconteceu? Sucesso ou fracasso de determinado objetivo.
Dados anteriores

Diagnostica

Tá tudo funcionando e como tá funcionando?

Preditiva

Com base em um histórico de dados vai ser possível trazer


possibilidades futuras (modelos de machine learning)

Prescritivas

Análise de tomadas de decisão em função da análise preditiva.

Cognitiva

Auto treinamento baseado em uma situação avulsa. Prever crises,


mudanças repentinas.

Serviços de Dados do Azure

DP-900 7

Você também pode gostar