Você está na página 1de 6

Objetivos desta aula

Antes de tudo, vamos revisar os objetivos da aula 1:

• Reconhecer a diferença entre dados e informações.


• Conhecer o que é a análise de dados e as suas generalidades.
• Diferenciar as disciplinas que influenciam na análise de dados.
• Identificar os tipos de análise de dados.
• Reconhecer as etapas de Data Analytics Journey.
• Manipular um glossário técnico referente à análise de dados.
• Identificar tecnologias relativas à análise de dados.

Agora sim, deixando claro este panorama… o que pretendemos que você leve como
aprendizado desta aula?

• Reconhecer os tipos de estruturas de dados.


• Entender sua finalidade no mundo dos dados em geral.
• Compreender os processos ETL.
• Conhecer os conceitos data warehouse e data lake.
• Saber como este processo é aplicado na ferramenta Power BI.

Com o horizonte em vista, esperamos que você possa levar muitos aprendizados desta
proposta. Como sempre, não se esqueça de tomar nota dos temas que achar mais interessantes
e das dúvidas para retroalimentar a aula ao vivo.

Vamos em frente!

Anexo 02

Como seguimos?

Até aqui, falamos de dados estruturados, não-estruturados e semi-estruturados.

1
Reconhecer essas características e saber como os dados são classificados nos permitirá
compreender conteúdos que veremos mais à frente.

Agora sim, vamos conhecer sobre o ETL!

Conhecendo o ETL

Damos as boas-vindas a este bloco da aula, onde vamos aprofundar sobre o ETL.

Bom, mas… do que falamos quando nos referimos ao ETL?

As ferramentas de informática ETL são aquelas que cumprem a função de extrair, alterar e
carregar dados, referente ao acrônimo em inglês “Extract, Transform e Load” (em português:
extrair, transformar e carregar).

A seguir, contaremos do que se trata o processo realizado por esses tipos de ferramentas.

2
Como seguimos?

Continuamos a nos aprofundar neste emocionante mundo dos dados. Como já vimos, o
processo de ETL é utilizado para analisar, combinar e empregar as informações armazenadas em
diversos tipos de fontes.

Você tem curiosidade em saber mais?

A seguir, veremos algumas das diferentes soluções de TI nesta área.

3
Wow!

Como podemos ver, o mercado oferece muitas ferramentas ETL.

Precisamos aprender a usar todas essas ferramentas?

Não é preciso aprender todas essas soluções. A melhor é aquela que esteja ao seu alcance
na organização em que você trabalha. Essas ferramentas estão normalmente ligadas a outros
sistemas já utilizados na empresa: Microsoft, IBM, SAP, etc.

Dica: você pode aprender a usar uma destas soluções e visualizar os seus resultados.

4
Então, qual é a solução que vamos usar neste
Workshop?

Como vimos no infográfico, a Microsoft tem mais de uma ferramenta ETL. Existem soluções
para bancos de dados locais (SSIS), para bancos de dados na nuvem (Cloud), bem como soluções
locais e na nuvem para atender ao Excel e Power BI (Power Query / Dataflow).

Vamos dar uma olhada:

Como seguimos?

Até aqui, mostramos os tipos de dados, o processo de ETL, as diferentes soluções ETL que
podemos encontrar no mercado e uma mini-intro ao Power Bi, a ferramenta que vamos explorar ao
longo do Workshop.

5
Mas, antes de entrar em cheio no mundo do Power BI, vamos falar de data lake e data
warehouse.

Vamos lá!

Power BI

Power BI é uma coleção de serviços de software, aplicações e conectores que trabalham


em conjunto para transformar suas fontes de dados não-relacionais em informações coerentes,
visualmente imersivas e interativas.

Power Query

Power Query é um mecanismo de transformação e preparação de dados dentro do Power


BI. No material a seguir, veremos algumas das funcionalidades disponíveis desta ferramenta.

Recapitulando

Nesta aula, vimos que um dado é uma representação simbólica de um atributo ou variável,
quantitativa ou qualitativa, e existem diversos tipos:

• Dados estruturados (planilhas de cálculos, bases de dados, CSV, XML, etc).


• Dados não-estruturados (fotos, vídeos, etc).
• Dados semi-estruturados (e-mails, arquivos de áudio, etc)

Os termos “dados” e “informação” têm significados diferentes.

Vimos também o que é ETL e as diferentes instâncias deste processo.

• (E) Extração ou coleta de dados.


• (T) Transformação: padronização, limpeza, qualidade, consolidação e integridade.
• (L) Carregamento de resultados.

Lembre-se dos conceitos de data lake e data warehouse.

Com todas essas informações, iniciamos os passos para a instalação do PowerBI.

Muito conteúdo, não é?

Vamos encerrar esta parte do programa, mas não se esqueça de que vamos continuar na
aula ao vivo. Tome nota das passagens que considerar mais importantes e leve as suas reflexões
ou dúvidas que tenham surgido. Tudo isso retroalimenta a instância síncrona!

Você também pode gostar