Você está na página 1de 37

INTRODUÇÃO A CIÊNCIA DE DADOS

Prazer!
Ciência de Dados
INTRODUÇÃO A CIÊNCIA DE DADOS

Ciência de Dados
É o processo de exploração, manipulação e análise dos dados para a
descoberta e previsão através da criação de hipóteses, testes e validação com
o objetivo de responder perguntas do negócio e / ou fazer recomendações
capazes de serem diferenciais de negócio.

Todo esse processo precisa ter um forte embasamento estatístico e


matemático e ser diretamento ligado ao negócio, além de poder ser feito de
forma escalável e replicável.
INTRODUÇÃO A CIÊNCIA DE DADOS
Existe um método científico!
Observação, hipóteses, testes e
validação, análises, monitoramento.

Ciência de
Dados
Precisamos que existam dados armazenados (ou pelo
menos começar esse armazenamento).
Armazenamento, processamento, visualização.
000
INTRODUÇÃO A CIÊNCIA DE DADOS
Existe um método científico!
Observação, hipóteses, testes e O QUE EU QUERO
validação, análises, monitoramento.

Ciência de
Dados
Precisamos que existam dados armazenados (ou pelo
RESPONDER? menos começar esse armazenamento).
Armazenamento, processamento, visualização.
000
INTRODUÇÃO A CIÊNCIA DE DADOS
Existe um método científico!
Observação, hipóteses, testes e O QUE EU QUERO
validação, análises, monitoramento.

Ciência de
Dados
Qual a resposta da vida, do
Precisamos que existam dados armazenados (ou pelo
RESPONDER? universo e tudo mais?
menos começar esse armazenamento).
Armazenamento, processamento, visualização.

PYTHON IMPRESSIONADOR I HASHTAG PROGRAMAÇÃO


000
INTRODUÇÃO A CIÊNCIA DE DADOS
Existe um método científico!
Observação, hipóteses, testes e O QUE EU QUERO
validação, análises, monitoramento.

Ciência de
Dados
Qual a resposta da vida, do
Precisamos que existam dados armazenados (ou pelo
RESPONDER? universo e tudo mais?
menos começar esse armazenamento).
Armazenamento, processamento, visualização.

42PYTHON IMPRESSIONADOR I HASHTAG PROGRAMAÇÃO


INTRODUÇÃO A CIÊNCIA DE DADOS

Tecnologia /
Negócios
Automações

Data Science

Matemática /
Estatística
INTRODUÇÃO A CIÊNCIA DE DADOS

Tecnologia / Softwares tradicionais


(excel, SAS, etc) Negócios
Automações

Data Science

Machine Learning Soma, media,


estatística tradicional

Matemática /
Estatística
INTRODUÇÃO A CIÊNCIA DE DADOS

Softwares tradicionais
(excel, SAS, etc)

Machine Learning Soma, media,


estatística tradicional
INTRODUÇÃO A CIÊNCIA DE DADOS

Softwares tradicionais
(excel, SAS, etc)

O tamanho da base pode


tornar a análise inviável
Machine Learning Soma, media,
estatística tradicional
INTRODUÇÃO A CIÊNCIA DE DADOS

Conclusões que estão corretas mas


estatisticamente tem pouca validade
Softwares tradicionais
(excel, SAS, etc)

Cidade Temp Média


Cidade 1 30,5
Cidade 2 31,3
Machine Learning Soma, media,
estatística tradicional
INTRODUÇÃO A CIÊNCIA DE DADOS

Conclusões que estão corretas mas


estatisticamente tem pouca validade
Softwares tradicionais
(excel, SAS, etc)

Cidade Temp Média


Cidade 1 30,5
Cidade 2 31,3
Machine Learning Soma, media,
estatística tradicional

Cidade 2

Cidade 1
INTRODUÇÃO A CIÊNCIA DE DADOS

Softwares tradicionais
(excel, SAS, etc)

Decisões que não fazem


sentido para o negócio
Machine Learning Soma, media,
estatística tradicional
Canal Retorno do Investimento
TV 0,8
Jornal 1,1
Blogs / Sites 2,7
Orkut 5,3

A empresa deve usar o Orkut como principal


investimento para ações de marketing em 2022
INTRODUÇÃO A CIÊNCIA DE DADOS

Tecnologia / Softwares tradicionais


(excel, SAS, etc) Negócios
Automações

Data Science

Machine Learning Soma, media,


estatística tradicional

Matemática /
Estatística
INTRODUÇÃO A CIÊNCIA DE DADOS
Instagram: feed, reels, explorar,...
“ah, o algoritmo do Instagram...”
INTRODUÇÃO A CIÊNCIA DE DADOS
Instagram: feed, reels, explorar,...
“ah, o algoritmo do Instagram...”

Netflix: indicação de
filmes / séries
INTRODUÇÃO A CIÊNCIA DE DADOS

Carros autônomos
INTRODUÇÃO A CIÊNCIA DE DADOS

Carros autônomos
INTRODUÇÃO A CIÊNCIA DE DADOS

Carros autônomos
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Definição do Alinhamento de
problema expectativas

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Engenharia
de dados

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Análise Tratamento Definição do


Exploratória dos dados modelo

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Análise Tratamento Engenharia


Exploratória dos dados de dados

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Análise Tratamento Definição do


Exploratória dos dados modelo

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados

Implementação

Preparação
Validação
dos dados

Análise /
Modelagem
CRISP-DM (CRoss Industry Standard Process for Data Mining)
Entendimento
do negócio

Preparação / Entendimento
Visualização dos dados
Melhoria
contínua

Monitoramento
e ajustes Preparação
Validação
dos dados

Análise /
Modelagem
NOSSO PROCESSO DE CIÊNCIA DE DADOS
Definição do problema

Implementação Alinhamento de
expectativas

Melhoria
Apresentação contínua Entendimento
do resultado dos dados

Validação do Engenharia
modelo de dados

Monitoramento
e ajustes
Definição do Preparação
modelo dos dados

Tratamento dos dados Análise Exploratória


EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS
EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS
EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS

AUMENTAR
O ESTOQUE
EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS

AUMENTAR
O ESTOQUE
EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS

AUMENTAR
O ESTOQUE

7x
EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS

2004 AUMENTAR
O ESTOQUE

7x
EXEMPLO PRÁTICO DE CIÊNCIA DE DADOS

ENTENDIMENTO DO
PROBLEMA DE NEGÓCIO
2004 AUMENTAR
O ESTOQUE

HIPÓTESE: esse ítem vai


aumentar as vendas no
ente
próximo furacão

EXISTÊNCIA DE
DADOS HISTÓRICOS

TESTE DA HIPÓTESE: envio


7x
VALIDAÇÃO: aumento real
do estoque para as lojas da venda em 7x

Você também pode gostar