Você está na página 1de 19

Analytics, Machine

Learning e Deep
Learning
Rafael de Freitas Souza
Conjunto de técnicas de programação voltadas à
coleta, ao tratamento, à manipulação, à organização,
Data Science à extração de informação e à apresentação de
dados, na forma de relatórios ou gráficos, visando
subsidiar o processo de tomada de decisão.
Técnicas de Data Science a
serem abordadas durante o
curso:
• Data Wrangling, Datasets e Escalas de
Mensuração de Variáveis;
• Algoritmos e Robôs;
• Web crawlers;
• Text Mining;
• Webscraping;
• Análise Espacial;
• Machine Learning;
• Deep Learning.
Refere-se à parte da Data Science que se utiliza de
algoritmos, em regra, da Estatística ou da Ciência
Data Analytics da Computação em busca de padrões, previsões ou
diagnósticos que subsidiem o processo de tomada
de decisão.
Parte da Inteligência Artificial que, a
partir de uma base de dados (em
regra, bidimensional), lança mão de
técnicas da Estatística ou da Ciência
da Computação para capturar
padrões e/ou tendências de dado
fenômeno estudado, que podem ser
entendidos como diagnósticos
(algoritmos não supervisionados) ou
como predições (algoritmos
supervisionados).

Machine Learning
Unsupervised Algorithms

• Clustering;
• Análise Fatorial – PCA;
• Análise de Correspondência Simples e
Múltipla.
Clustering
Conjunto de técnicas não
supervisionadas de machine
learning que, a partir de variáveis
métricas, estabelece uma
classificação para as observações.
Análise Fatorial – PCA

Técnica exploratória (diagnóstica) que, a partir


de variáveis métricas, busca a redução
estrutural da base de dados visando, em
regra, a verificação de constructos, a
construção de rankings e/ou a confecção de
fatores ortogonais entre si, portanto, livres da
multicolinearidade.
Análise de
Correspondência Simples e
Múltipla
Conjunto de técnicas não
supervisionadas que, a partir de
variáveis categóricas, pretende
calcular as coordenadas de cada
categoria de cada variável, para
então, considerá-las em um mapa
perceptual, possibilitando o
estudo de suas associações.
Supervised Algorithms

• Regressões Lineares Simples e Múltiplas;


• Regressões Logísticas Binárias e Multinomiais;
• Regressões para Dados de Contagem e Modelos para Zeros
Inflacionados;
• Modelos Hierárquicos Multinível;
• Árvores de Decisão;
• Random Forests;
• Redes Neurais.
Técnicas preditivas que visam o
estudo de determinada
variável dependente métrica
em função de uma ou mais
variáveis preditoras, tendo por
output um valor métrico
estimado pelo critério dos
mínimos quadrados ordinários.

Regressões Lineares
Técnicas supervisionadas que
buscam o estudo de
determinada variável
dependente categórica em
função de uma ou mais
variáveis preditoras, tendo por
output a probabilidade da
ocorrência de determinada
categoria da variável de
interesse, estimada pelo
critério da máxima
verossimilhança.

Regressões Logísticas
Técnicas confirmatórias que
visam o estudo de determinada
variável dependente métrica
de contagem, considerada sob
alguma exposição, em função
de uma ou mais variáveis
preditoras, tendo por output
um valor métrico estimado
pelo critério da máxima
verossimilhança.

Regressões para Dados de


Contagem
Espécie de regressão para
dados de contagem útil para
quando há um excesso no
aparecimento de zeros na
variável dependente. Também
conhecido como modelo de
eventos raros.

Modelos para Zeros


Inflacionados
Expansão natural das técnicas
preditivas vistas até o
momento, em que é possível a
consideração dos contextos
naturais do fenômeno
estudado.

Modelagem Hierárquica e
Multinível
Árvores de Decisão
Técnica preditiva que pode ter
como variável target um
fenômeno que se manifesta de
forma quantitativa ou
qualitativa, em função de
determinadas variáveis
preditoras. O resultado da
técnica será, igualmente,
métrico ou categórico, sendo
estimado com a ajuda de
alguma medida de impureza.
Random Forests Técnica confirmatória que pode
ter como variável target um
fenômeno que se manifesta de
forma quantitativa ou
qualitativa, em função de
determinadas variáveis
preditoras. Seu resultado é
dado em razão da estimação
de um grande número de
árvores de decisão, em que as
variáveis utilizadas para cada
uma delas são selecionadas de
forma randômica.
Redes Neurais Técnica confirmatória que pode
ter como variável target um
fenômeno que se manifesta de
forma quantitativa ou
qualitativa, em função de
determinadas variáveis
preditoras. Seu resultado se dá
através da escolha de uma
dada função de ativação que
se utiliza de inúmeras iterações
de valores iniciais randômicos
considerados em cada um de
seus neurônios.
Parte da Inteligência Artificial que, a
partir de tensores (costumeiramente,
bases de dados com 3 ou mais
dimensões), utiliza, em sua maior
parte, redes neurais com múltiplas
camadas para o reconhecimento e
classificação de padrões e tendências
em objetos de mundo real, sejam eles
pessoas, imagens, sons ou vídeos.

Deep Learning  Reconhecimento de Imagens;


 Análises de Mídias.

Você também pode gostar