Você está na página 1de 29

Introdução a Ciência de Dados

Deck 01

Paulo Urbano (paulo@paulourbano.com)


CDA UTFPR
Facilitador
Paulo Urbano
○ Ciência da Computação, UFPE
○ Tecnologia da Informação, Uni Stuttgart, Alemanha
○ Data Science, Johns Hopkins/EaD
○ Coordenador/ gerente de projetos, CESAR Curitiba
Otimização
de Processo
Siderúrgico
Como aumentar eficiência
operacional de uma linha de
produção de aço laminado,
reduzindo incidência de
produtos com propriedades
mecânicas fora dos padrões
de qualidade?

Desenvolvimento de um
modelo de estimativa em
tempo real de propriedades
mecânicas de aço laminado a
partir de parâmetros da linha
de produção.
Case 1 - Laminação

https://www.youtube.com/watch?v=0l9_IHaGRUE
Case 1 - Laminação
Case 1 - Laminação
Case 1 - Laminação
Case 1 - Laminação
Processo de
laminação Dados Modelo de
históricos estimativa Estimativas

LE: 596 MPa


LR: 603 MPa
Along: 18,32%

Novos dados

Uso de dados históricos para estimativa de propriedades como limites de


escoamento e ruptura (LE, LR) de produtos de laminação, sem ensaios de tração
Case 1 - Laminação
Case 1 - Laminação
Assinatura
de Direção
Veicular
Como aumentar a taxa de
recuperação de veículos
rastreados furtados, reduzindo
o tempo de identificação do
sinistro?

Desenvolvimento de um
modelo de identificação de
modo de direção capaz de
sinalizar se uma pessoa
diferente do motorista
frequente está conduzindo o
veículo.
Case 2 - Seguradoras

Seguradora
Case 2 - Seguradoras
Case 2 - Seguradoras
Eficiência em
Geração de
Energia
Como aumentar a produção
de energia de
aerogeradores, aproximando
a produção real de energia
do potencial máximo do
equipamento?

Desenvolvimento de uma
sistema de monitoramento
em tempo real para
detecção de situações de
sub-performance,
permitindo intervenções de
caráter proativo.
Case 3 - Energia
Case 3 - Energia
Case 3 - Energia
Case 3 - Energia
Questionário
Questionário
Questionário
Ambiente de apoio
● Atividades e questionários durante as apresentações:
○ wooclap.com/CDAULA1

● Ambiente de execução exemplos:


○ Navegue para classroom.google.com
○ Google Classroom class code: sjv1tf
○ Conta Google necessária
Objetivos de aprendizagem
Ao final do módulo “Introdução a Ciência de Dados” é esperado
que os participantes sejam capazes:

1. Decompor problemas de negócio em partes e identificar


tarefas de Ciência de Dados para suas soluções;
2. Explicar as diferenças entre abordagens supervisionadas e
não supervisionadas de aprendizagem de máquina;
Objetivos de aprendizagem
3. Explicar o funcionamento do modelos de árvore de decisão
para classificação; modelos lineares para regressão;
abordagem K-Means para agrupamento; algoritmo apriori
para co-ocorrência;
4. Identificar situações de sobreajuste (overfitting) e seu
impacto em modelos preditivos;
5. Explicar a relevância de abordagens de validação cruzada
(cross validation);
Objetivos de aprendizagem
6. Interpretar resultados e métricas de avaliação de modelos
preditivos;
7. Com base em um problema de negócio e amostras de dados,
seguir o processo CRISP-DM e criar a descrição de uma
solução ;
Metodologia
● Apresentação de conceitos ilustrados por exemplos;
● Uso de ambiente em nuvem para compartilhamento e
processamento de dados;
● Avaliação por participação em aula através do ambiente
interativo e de questionário final
Referência

Data Science for Business:


What You Need to Know
about Data Mining and
Data-Analytic Thinking
(2013)

Foster Provost, Tom Fawcett


Licença do material:
Atribuição-NãoComercial-SemDerivações 4.0
Internacional (CC BY-NC-ND 4.0)

https://creativecommons.org/licenses/by-nc-nd/4.0/

Você também pode gostar