Você está na página 1de 129

APRESENTAÇÃO

DE APOIO

DATA SCIENCE (DS) COMO UMA


FERRAMENTA OU PRODUTO DE NEGÓCIOS
Ementa da disciplina
Design de produto em Data Science. Geração de valor para o cliente. Segmentação
do mercado, canais de comunicação, distribuição e relacionamento. Geração de receita.
Recursos, atividades e parceiros-chave.
Professores
CLÁUDIO AZEVEDO MICHAEL DA COSTA MÓRA
Professor Convidado Professor PUCRS

Cláudio Azevêdo é referência nacional em Tecnologia e Possui graduação em Ciência da Computação pela Universidade
crescimento, tendo uma atuação brilhante como gerentegeral do Federal do Rio Grande do Sul (1991), mestrado em Computação pela
Cabify, uma das startups mais disruptivas do setor e que cresceu Universidade Federal do Rio Grande do Sul (1993) e doutorado em
mais de 500% em 2017. Atualmente, é head de Growth na Zx Ciência da Computação pela Universidade Federal do Rio Grande do
Ventures, do grupo ABInbev, controlador de algumas das maiores Sul (2000). Atualmente é professor adjunto do Instituto de
empresas do mundo, como AMBEV, SABMiller e Budweiser. Mestre Informática. Tem experiência na área de Ciência da Computação, com
e PHD, é especialista em crescimento acelerado de negócios e ênfase em Inteligência Artificial, atuando principalmente nos seguintes
métodos de gestão baseados em técnicas aplicadas por startups temas: Inteligência Artificial, Aprendizagem de Máquina, Agentes
disruptivas como Cabify, Airbnb e Google. Cláudio Azevedo tem inteligentes e Sistemas Multiagentes, Engenharia de Software e
conhecimentos em Marketing, Transformação Digital, negociação, Desenvolvimento de Sistemas, Ensino de Programação e de Ciência da
expansão de negócios internacionais de tecnologia, operações e Computação.
gerenciamento de projetos complexos, metodologias ágeis, como
Scrum e Kanban. Tudo isso contribuiu para sua expertise na
construção de estratégias, no desenvolvimento de novos negócios
e na liderança de equipes multidisciplinares e multiculturais.
Encontros e resumo da disciplina
AULA 1 AULA 2 AULA 3

Com design de produto e pesquisa Data science, agora, já está


Devemos desenvolver produtos
conseguimos compreender o consolidada, é quase um
digitais focando no cliente e na
cliente. commodity.
resolução de problemas reais.

A ciência de dados proporciona um Conseguimos ver IA em,


Cada vez mais experimentamos uma
poder exponencial. praticamente, todas as áreas do
evolução rápida dos produtos.
conhecimento.

Toda a conversa de inteligência Não há como construir bons Não se faz ciência de dados sem
artificial não ocorre sem ciência produtos sem, de fato, colocar o conhecer o negócio.
de dados. cliente no centro.

CLÁUDIO AZEVEDO CLÁUDIO AZEVEDO MICHAEL DA COSTA MÓRA


Professor Convidado Professor Convidado Professor PUCRS
Prof. Dr. Michael da
Costa Móra
CIÊNCIA DE DADOS:
michael.mora@pucrs.br
E ONDE SE ENCAIXAM A
Escola Politécnica da
PUCRS
IA, O MACHINE
LEARNING E BIG DATA?
CIÊNCIA DE
DADOS? Uma Área em Fluxo
“Dados” (mesmo em volume) não são
novidade

Bancos de
Estatísticos ...
Dados

DADOS E BIG
DATA

Mas “Big Data”

Variedade e
Volume Velocidade
Complexidade
DADOS E
BIG DATA
QUANTO DADO É
“VOLUME”?
• Em 2008
• Google processava 20PB por
dia
• Facebook tinha 60TB de logs
diários
• eBay tinha 6.5PB de dados de
usuários + 50TB novos por dia
• 1000 projetos Genoma -> 200TB
QUANTO DADO É
“VOLUME”?
• Em 2019
• Algumas projeções
• Agregação e Estatística
• Data warehousing e OLAP

• Indexing, Searching, e Querying


E O QUE • Keyword based search
• Pattern matching (XML/RDF)
FAZER?
• Descoberta do Conhecimento
• Data Mining
• Modelagem Estatística
CIÊNCIA DE DADOS: UMA ÁREA
EM FLUXO

Como é
vista hoje
•Vem do “Big Data/Cloud computing” e Ciência da Complexidade

Um pouco
• Termo "Big Data" cunhado pelos astrônomos Cox e Ellsworth em 1997
•Termo usado em 2001
•William S. Cleveland. "Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics”.
•CODATA Data Science Journal, abril de 2002, pelo International Council for Science: Committee on Data for Science and Technology

de história
•The Journal of Data Science, em janeiro de 2003, Columbia University
•Popularidade em 2010
•Programas acadêmicos
•Organizações profissionais
•...
MASH-UP DE
DISCIPLINAS
MASH-UP DE
DISCIPLINAS
GARTNER´S
2014 HYPE
CYCLE
GARTNER´S
2020 HYPE
CYCLE
E OS PAPÉIS?
• Data Scientist
• The Sexiest Job of the 21st Century

• Concentração em Data Science


• Matemática e Matemática Aplicada
• Estatística Aplicada/Análise de Dados
• Fundamentos sólidos de programação (R, Python, Julia, SQL)
• Data Mining
• Data Base Storage e Management
• Machine Learning e discovery

• Data Engineer? Data Analyst?


E OS PROCESSOS?
CRoss Industry Standard Process for Data Mining (CRISP-DM)

CRoss Industry Standard Process for Data Mining (CRISP-DM)

Business Data Data


Modelling Evaluation Deployment
Understanding Understanding Preparation

Identify project Collect and review Select and cleanse Manipulate data and Evaluate model Apply conclusions to
objectives data data draw conclusions and conclusions business
E A INTELIGÊNCIA ARTIFICIAL?

Uma Área com muita


História
OBJETIVOS DA IA
• desenvolver sistemas para realizar tarefas que ainda
• são melhor realizadas por seres humanos que por máquinas, ou
• não possuem solução satisfatória pela computação convencional

• reproduzir o comportamento inteligente

• entender entidades inteligentes


OBJETIVOS
• Engenharia - construção
• Científicos - compreensão e teorização
• Filosóficos
• ???? as máquinas podem pensar ????

• O que é “Inteligência”?
• É possível emular comportamento
inteligente em máquinas?
• Até onde é possível ir?
19

UM POUCO DE FILOSOFIA
• Máquinas podem pensar???
• O que são máquinas?
• O que é pensar?
• O que quer dizer podem?
DIMENSÕES/ABORDAGENS
DA IA
Pensando

“A automação de atividades que nós “O estudo das faculdades


associamos com o pensamento mentais através do uso de
humano” modelos computacionais”

Como humanos Racionalmente

“A arte de criar máquinas que “O ramo da Ciência da


realizam funções que requerem Computação que estuda a
inteligência quando realizadas por automação de comportamento
pessoas” inteligente”

Agindo
DIMENSÕES/ABORDAGENS DA IA

conhecimento intensional (regras)

Sistemas de PLN
Sistemas Redes Sistemas
Nebulosos Bayesianas Especialistas
(fuzzy)
numérico Robôs simbólico
Algoritmos Sistemas de Sistemas
genéticos baseado
Aprendizagem em casos
simbólica indutiva
Sistemas baseados em
Redes Neurais
conhecimento extensional (exemplos)
PARADIGMAS (CLÁSSICOS)
• Simbólico (IA clássica ou GOFAI): metáfora lógica
• ex. sistemas especialistas, agentes,...

• Estatístico/Probabilístico
• Ex. Redes Bayesianas, sistemas difusos

• Conexionista: metáfora cerebral


• ex. redes neurais

• Evolucionista: metáfora da natureza


• ex. algoritmos genéticos, vida artificial
SUB-ÁREAS DA IA
• Resolução de problemas
• Representação de conhecimento
• Raciocínio lógico (teórico)
• Sistemas especialistas (prático)
• Processamento de linguagem natural (inter-
disciplinar)
• Agentes inteligentes, sistemas multi-agentes
• Redes Neurais
• Lógica Difusa
• ...
FUNDAMENTOS
Matemática

Filosofia Sociologia

Lingüística IA Psicologia

Neuro-fisiologia Computação
Genética
24
FILOSOFIA
• Sócrates, Platão, Aristóteles mente racional (400 AC)
• Descartes (1600) dualismo (natureza física x mente, livre
arbítrio)
• Materialismo mundo (cérebro e mente) funciona de acordo
com leis físicas
• Empiricismo fonte do conhecimento (observação dos fatos
e generalização de regras)
• Positivismo lógico conhecimento pode ser expresso em
teorias lógicas
MATEMÁTICA (LÓGICA)
• Aristóteles • Godel
• Boole • Turing
• Frege • Church
• Tarski • Bayes
• Hilbert
MATEMÁTICA
• Aristóteles – explica o raciocínio dedutivo
• Boole – 1840 formalização de operações lógicas
• Frege – 1880 lógica de primeira ordem, termo e predicado,
quantificação
• Tarski – 1940 relação dos objetos da lógica com objetos do mundo
(modelo)
• Hilbert – 1900 formalização da matemática
MATEMÁTICA
• Godel – 1930 incompletude da aritmética
• mostrou que existe um procedimento efetivo
para provar uma proposição verdadeira em
lógica de primeira ordem, mas que esta lógica
não poderia capturar o princípio de indução
matemática necessária para caracterizar os
números naturais

• Turing e Church – 1940 computabilidade


• Computabilidade x tratabilidade (complexidade)

• Bayes (1760) – probabilidade


PSICOLOGIA
• 1850 – primeiro laboratório de psicologia experimental
para estudo da visão humana
• pesquisa baseada na introspecção dos sujeitos
(subjetivismo)
• Behaviorismo (1900)
• Observação da ação (reação) dos sujeitos
PSICOLOGIA
• 1900 Psicologia cognitiva: metáfora computacional
do cérebro
• Crenças, objetivos, raciocínio: elementos para uma
teoria do comportamento humano
• Características de um agente baseado em
conhecimento
• o estímulo deve ser traduzido para uma
representação interna;
• a representação é manipulada por processos
cognitivos para derivar novas representações
internas;
• estas representações são re-traduzidas em ação.
ENGENHARIA COMPUTACIONAL
• Hardware
• Aumento da velocidade de processamento e
capacidade de memória
• Software
• Linguagens, metodologias, interfaces
LINGÜÍSTICA
• Chomsky – 1957 estruturas sintáticas

• Linguagem: estrutura das sentenças +


conhecimento do mundo

• Filosofia da linguagem – representação do


conhecimento

• Campo híbrido: processamento de linguagem


natural ou lingüística computacional
33

UM POUCO MAIS DE HISTÓRIA


• Inteligência
• Estudada há mais de 2000 anos por filósofos
• Raciocínio, memória, aprendizado, visão
• Inteligência Artificial
• surgiu na década de 50
• estuda a inteligência de maneira teórica e
experimental
HISTÓRIA
• Primeiro trabalho (1943)
• McCulloch and Pitts: implementação dos operadores
lógicos através de uma rede neural
• Primeiro Evento (1956)
• Newell and Simon – LogicTheorist (resolvedor de teoremas)
HISTÓRIA
• GPS (General Problem Solver) – 1960 Newell and
Simon
• Linguagem LISP – McCarthy 1958
• Micro-mundos – Minsky 1963 (problemas de domínios
limitados)
• O mundo dos blocos – 1968
• Linguagem Prolog - Edinburgh/Marseilles 1970
HISTÓRIA
 Primeiros programas de tradução automática (artigos científicos Russo –
Inglês) caíram em descrédito
◦ Exemplo
O espírito é forte mas a carne é fraca

A vodka é boa mas a carne é podre

 Financiamentos cancelados em 1966


 1966—73 IA “descobre” a complexidade computacional – pesquisa em
Redes Neurais quase desaparece
HISTÓRIA
• 1969 ressurgimento do entusiasmo
• Sistemas especialistas
• 70/80 Alguns sistemas famosos são
• SHRLDU (interface em linguagem natural aplicado
ao mundo de blocos)
• MYCIN (diagnostico médico)
• LUNAR (interface para geólogos interrogarem sobre
as mostras de rochas trazidas pela Appolo na missão
lunar - o primeiro usado por pessoas que não os
projetistas do sistema).
HISTÓRIA
• 1980 - Projeto japonês: a quinta geração de
computadores (IA, Prolog, PLN) repercusões no
financiamento global para a área de IA
• 1997 - Deep blue vence Kasparov
• algoritmos de busca
• computadores de alta velocidade
• hardware específico para xadrez
TENDÊNCIAS ATUAIS: O QUE É
POSSÍVEL COM A IA ATUAL?
• Which of the following can be done at present?
• Play a decent game of table tennis
• Drive safely along a curving mountain road
• Drive safely along Rua da Praia
• Buy a week’s worth of groceries on the web
• Buy a week’s worth of groceries at Mercado Público
• Play a decent game of truco
• Discover and prove a new mathematical theorem
• Design and execute a research program in molecular
biology
• Write an intentionally funny story
• Give competent legal advice in a specialised area of law
• Translate spoken English into spoken Swedish in real time
• Converse successfully with another person for an hour
• Perform a complex surgical operation
• Unload any dishwasher and put everything away
TENDÊNCIAS ATUAIS: O QUE É
POSSÍVEL COM A IA ATUAL?
• Which of the following can be done at present?
• Play a decent game of table tennis
• Drive safely along a curving mountain road
• Drive safely along Rua da Praia
• Buy a week’s worth of groceries on the web
• Buy a week’s worth of groceries at Mercado Público
• Play a decent game of truco
• Discover and prove a new mathematical theorem
• Design and execute a research program in molecular
biology
• Write an intentionally funny story
• Give competent legal advice in a specialised area of law
• Translate spoken English into spoken Swedish in real time
• Converse successfully with another person for an hour
• Perform a complex surgical operation
• Unload any dishwasher and put everything away
43

APLICAÇÕES
 Pesquisa operacional: busca e otimização, heurísticas
em geral

 Jogos: xadrez, damas, etc.

 Processamento de linguagem natural: tradução


automática, verificadores ortográficos e sintáticos,
interfaces para BDs, reconhecimento da fala, etc.

 Sistemas tutores: modelagem do aluno, escolha de


estratégias pedagógicas, etc.

 Percepção: visão, tato, audição, olfato, paladar...

 Robótica (software e hardware): manipulação,


navegação, etc.
GAME AGENTS
• Momento Clássico: Maio, 97: Deep Blue vs. Kasparov
• Primeiro jogo vencido contra campeão mundial
• Jogo "criativo inteligente"
• 200 milhões de cargos de diretoria por segundo
• Os humanos entenderam 99,9 dos movimentos do Deep Blue
• Pode fazer o mesmo agora com um cluster de PC

• 1996: Kasparov vence Deep Blue


“I could feel --- I could smell --- a new kind of intelligence
across the table.”

• 1997: Deep Blue Vence Kasparov


“Deep Blue hasn't proven anything.”

Text from Bart Selman, image from IBM’s Deep Blue pages
GAME AGENTS
• Reinforcement learning
Photo: Google / Getty Images
SIMULATED AGENTS

[Schulman, Moritz, Levine, Jordan, Abbeel, ICLR 2016]


GAME AGENTS
• Reinforcement learning

Pong Enduro Beamrider Q*bert


ROBOTICA
• Robótica
Parte mech. eng.
Parte IA
Realidade muito
mais difícil do que
Simulações!

• Tecnologias
• Veículos
• Resgate
• Ajuda em casa
• Muita automação...

• Lembre-se:
• Ignoramos aspectos mecânicos
• Métodos de planejamento
• Métodos de controle

Imagens de UC Berkeley, Boston Dynamics, RoboCup, Google


ROBOTS
ROBOTS

[Levine*, Finn*, Darrell, Abbeel, JMLR 2016]


56

APLICAÇÕES
• Sistemas especialistas: atividades que exigem
conhecimento especializado e não formalizado
• Tarefas: diagnóstico, previsão, monitoramento,
análise, planejamento, projeto, etc.
• Áreas: medicina, finanças, engenharia, química,
indústria, arquitetura, arte, computação,...
• Computação: bancos de dados dedutivos, interfaces
adaptativas, mineração de dados (data mining),
programação automática, etc.
DIFICULDADES
• Representação:
• Como traduzir uma tarefa em informação estruturada e
processos de informação
• Generalidade x eficiência
• Explosão combinatória (espaço de solução):
• reproduzir as jogadas possíveis do Xadrez
DIFICULDADES: XADREZ
• “Impossível” reduzir o problema a um formalismo
matemático
• Uma busca exaustiva do melhor movimento é
impraticável
• Solução baseada em heurísticas
DIFICULDADES: VISÃO
• como reconhecer uma maçã no supermercado?
• Contexto: maçãs serão encontradas junto com
outras frutas (conceito)
• Segmentação: como saber onde começa e acaba
uma fruta? É preciso reconhecer cores, textura,
tamanho
• Representação e similaridade: como diferenciar
maçãs de peras, mangas? Há vários modelos visuais
para representar formas de diferentes frutas,
comparáveis entre si
VISÃO
COMPUTACIONAL
Karpathy & Fei-Fei, 2015; Donahue et al.,
2015; Xu et al, 2015; many more
IA

• Paradigma simbólico: metáfora lingüística


• (IA clássica ou GOFAI Good Old Fashion)
• Resolução de problemas
• Representação de conhecimento
• Lógica
• Processamento de linguagem natural
• Agentes inteligentes
CONHECIMENTO

• É preciso ter conhecimento sobre:


• as propriedades relevantes do mundo
• como o mundo evolui
• os estados desejáveis
• as conseqüências das ações no mundo
63

REPRESENTAÇÃO
• Raciocínio:
• processo de construção de novas sentenças a partir de
outras sentenças.

https://replit.com/join/cqkiopae-mdmmora
segue-se
fatos fatos
Mundo

Representação implica
sentenças sentenças
E, CLARO:

• Aprendizagem de Máquina / Machine Learning


Machine Learning

Baseado no material preparado pela Profa. Silvia de Moraes


IA x ML
Conceito
Aprendizagem Indutiva
Paradigmas X Tarefas
Paradigmas X Tarefas
Paradigmas x Tarefas
Em resumo
Em Resumo (ainda)
Algumas Aplicações
Processo de Descoberta do Conhecimento
(KDD)
Agrupamento (Não-Supervisionado)
Características
Grupos: Níveis de Refinamento
Grupos: Níveis de Refinamento
Grupos: Níveis de Refinamento
Grupos: Níveis de Refinamento
Classificação
Características
Exemplo
Exemplo
Exemplo
Exemplo
Exemplo
Exemplo
Redes Neurais
Aplicações
RNA e o Cérebro Humano
Neurônio Biológico
Neurônio Biológico
Neurônio Artificial
Etapas de Construção
Deep Learning

Baseado no material preparado pelo Prof. J.B.Lopes Filho e do Prof. Rodrigo Barros
Deep Learning: Interesse Crescente
IA x ML x RN x DL
Deep Learning: O Desafio
Deep Learning: O Desafio
Deep Learning: O Desafio
Re-lembrando: Fluxo em Aprendizage de
Máquina
Re-lembrando: Fluxo em Machine Learning
Problemas Canônicos em ML
Algorimtmos em ML
Rumo a Deep Learning
Rumo a Deep Learning
ML vs. Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning
Deep Learning – Funções de Ativação
Deep Learning – Fluxo de Treinamento
Ainda similar...
Deep Learning - Gradiente Descendente
Deep Learning – Deep Autoenconders
Deep Learning – Convolutional Neural Nets
(CNN)
Deep Learning – Convolutional Neural Nets
(CNN)
Deep Learning – Recurrent Neural Nets
(RNN)
Deep Learning – Long Short – Term Memory
(LSTM)
Deep Learning – CNN + RNN –
Gerador de Legenda
Deep Learning - Requisitos
Ferramentas para Deep Learning
Deep Learning - Conclusões
Ciência de
Dados:
E onde se
encaixam a
IA, o
Machine
Learning e
Big Data?
Prof. Dr. Michael da Costa Móra

michael.mora@pucrs.br

Escola Politécnica da PUCRS

Você também pode gostar