Você está na página 1de 16

Power BI

Explorar os principais conceitos de


dados
O que são dados?
Coleção de fatos, números, descrições e/ou objetos armazenados de maneira
estruturada, semiestruturada e não estruturada.

Estruturados Semiestruturados Não estruturados


Como os dados são armazenados?
Arquivos Bancos de dados

Texto delimitado Relacionais Customer Product


FirstName,LastName,Email ID Email Address ID Name Price
Joe,Jones,joe@litware.com 1 joe@litware.com 1 Main St. 123 Hammer 2,99

Samir,Nadoy,samir@northwind.com 2 samir@northwind.com 123 Elm Pl. 162 Screwdriver 3.49


201 Wrench 4.25

JSON{(JavaScript Object Notation) Order LineItem


"customers": OrderN OrderDate Customer
[ o OrderNo ItemNo ProductID Quantida
de
{
1000 Sábado, 1 de 1
    "firstName": "Joe", janeiro de 2022 1000 1 123 1
    "lastName": "Jones" 1000 2 201 2
1001 Sábado, 1 de 2
}, janeiro de 2022
{ 1001 1 123 2
    "firstName": "Samir",
    "lastName": "Nadoy"
} • Tabelas normalizadas com chaves primárias para identificar
] exclusivamente as entidades
}
Linguagem XML • Consultados e gerenciados usando linguagem SQL
tr
em aba
Não relacionais Orders rta
-
lh
a
po
BLOB (objeto binário grande) Products
Key Value
Key Customer Product re e a
s
Su
e
Customers Name Address Name Price
trabalha
<Customer firstName="Joe" lastName="Jones"/> 123 “Hammer ($2.99)" Hard
162 "Screwdriver ($3.49)" Key Document 100
0
Joe Jones 1 Main St. Hamme
r
2.99 Ben em e

Formatos otimizados: "Wrench ($4.25)" 1 {


201 100
    "name": "Joe Jones" Samir 123 Elm Wrench 4.25 Grafo
} 1 Nadoy Pl.

10110101101010110010... Chave-valor 2 {
Família de colunas
    "name": "Samir Nadoy"
}

• Avro, ORC, Parquet Document


PROCESSAMENTO
Transacional vs Analítico
OLTP – Processamento transacional online OLAP – Processamento analítico online

Os dados são processados em uma Os dados são periodicamente


transação por vez. carregados, agregados e
armazenados em um cubo.
Normalmente processados em Data
Warehouses otimizados para
leitura.
Transacional vs Analítico
Cargas de trabalho transacionais
Os dados transacionais são informações que rastreiam as interações relacionadas às
atividades de uma organização. Abaixo estão suas características:

-► Atomicidade – cada transação é tratada como uma unidade


independente que resulta em sucesso completo ou falha
completa.

-► Consistência – as transações só podem conduzir os dados


do banco de dados de um estado válido para outro estado válido.

-► Isolamento – a execução concorrente de transações deixa o


banco de dados no mesmo estado.

-► Durabilidade – assim que uma transação tiver sido


confirmada, permanecerá assim.
Cargas de trabalho analíticas
As cargas de trabalho analíticas são usadas para análise de dados e tomada de decisões.

-► Resumos
Ex: quais são os clientes que compram
mais da Região Sudeste?

-► Tendências
Ex: qual é a estimativa de vendas de
chinelos para o verão?

-► Informações comerciais
Ex: quais marcas de eletrônicos vendem
mais?
Transacional vs Analítico
Tipos de processamento de dados
-► Batch – de Lotes
Os elementos de dados
são reunidos em um grupo.
Então, o grupo inteiro é
processado em um momento
futuro como um lote.

-► Streaming – de Fluxo
Cada novo dado é
processado quando chega.
Data Warehouse
Verificação de conhecimentos
Como os dados são organizados em uma tabela relacional?
❑ Linhas e colunas
❑ Cabeçalho e rodapé
❑ Páginas e parágrafos

Qual das alternativas a seguir é um exemplo de dados não estruturados?


❑ Um arquivo de texto delimitado por vírgula com os campos EmployeeID, EmployeeName e EmployeeDesignation
❑ Arquivos de áudio e vídeo
❑ Uma tabela no banco de dados relacional 

O que é data warehouse?


❑ Um banco de dados não relacional otimizado para operações de leitura e gravação
❑ Um banco de dados relacional otimizado para operações de leitura
❑ Um local de armazenamento para arquivos de dados não estruturados
Gerenciamento de Pipelines
Funções do profissional de dados

Administrador de Engenheiro Analista


Banco de Dados de Dados de Dados
Provisionamento, configuração e Pipelines de integração de dados Modelagem analítica
gerenciamento de banco de e processos ETL Relatórios e resumos de dados
dados Limpeza e transformação de Visualização de dados
Segurança do banco de dados e dados
acesso do usuário Esquemas de armazenamento de
Backups e resiliência do banco dados analíticos e cargas de
de dados dados
Monitoramento e otimização do
desempenho do banco de dados
Modelos de Cloud
Serviços de nuvem da Microsoft para dados

Armazenamentos de dados Engenharia e análise de dados


Azure SQL Azure Stream Analytics
Azure Data Factory
• Família de serviços de banco de • Processamento de dados em
dados relacional baseados no SQL • Pipelines de dados
tempo real para soluções de
Server IoT
Azure Synapse
Banco de Dados do Azure para Azure Data Explorer
Analytics
código aberto • Análise de dados em tempo
• Análise integrada de ponta real para logs e telemetria
• MariaDB a ponta
• MySQL • Pipelines, SQL, Apache
• PostgreSQL Spark, Data Explorer… Azure Purview
Azure Databricks • Governança de dados
Azure Cosmos DB empresariais
• Análise e processamento
• Sistema de banco de dados de dados do Apache Spark • Mapeamento e descoberta de
não relacional altamente dados
escalonável
Armazenamento do Azure Azure HDInsight Microsoft Power BI
• Plataforma Apache de • Modelagem de dados
• Armazenamento de arquivos,
código aberto analíticos
blobs e tabelas
• Visualização interativa de dados
• Namespace hierárquico para o
Data Lake Storage
Verificação de conhecimentos
Qual das tarefas a seguir é responsabilidade de um administrador de banco de dados?
❑ Fazer backup e restaurar bancos de dados
❑ Criar painéis e relatórios 
❑ Criar pipelines para processar dados em um data lake

Você também pode gostar