Escolar Documentos
Profissional Documentos
Cultura Documentos
Learning e Deep
Learning
Rafael de Freitas Souza
Conjunto de técnicas de programação voltadas à
coleta, ao tratamento, à manipulação, à organização,
Data Science à extração de informação e à apresentação de
dados, na forma de relatórios ou gráficos, visando
subsidiar o processo de tomada de decisão.
Técnicas de Data Science a
serem abordadas durante o
curso:
• Data Wrangling, Datasets e Escalas de
Mensuração de Variáveis;
• Algoritmos e Robôs;
• Web crawlers;
• Text Mining;
• Webscraping;
• Análise Espacial;
• Machine Learning;
• Deep Learning.
Refere-se à parte da Data Science que se utiliza de
algoritmos, em regra, da Estatística ou da Ciência
Data Analytics da Computação em busca de padrões, previsões ou
diagnósticos que subsidiem o processo de tomada
de decisão.
Parte da Inteligência Artificial que, a
partir de uma base de dados (em
regra, bidimensional), lança mão de
técnicas da Estatística ou da Ciência
da Computação para capturar
padrões e/ou tendências de dado
fenômeno estudado, que podem ser
entendidos como diagnósticos
(algoritmos não supervisionados) ou
como predições (algoritmos
supervisionados).
Machine Learning
Unsupervised Algorithms
• Clustering;
• Análise Fatorial – PCA;
• Análise de Correspondência Simples e
Múltipla.
Clustering
Conjunto de técnicas não
supervisionadas de machine
learning que, a partir de variáveis
métricas, estabelece uma
classificação para as observações.
Análise Fatorial – PCA
Regressões Lineares
Técnicas supervisionadas que
buscam o estudo de
determinada variável
dependente categórica em
função de uma ou mais
variáveis preditoras, tendo por
output a probabilidade da
ocorrência de determinada
categoria da variável de
interesse, estimada pelo
critério da máxima
verossimilhança.
Regressões Logísticas
Técnicas confirmatórias que
visam o estudo de determinada
variável dependente métrica
de contagem, considerada sob
alguma exposição, em função
de uma ou mais variáveis
preditoras, tendo por output
um valor métrico estimado
pelo critério da máxima
verossimilhança.
Modelagem Hierárquica e
Multinível
Árvores de Decisão
Técnica preditiva que pode ter
como variável target um
fenômeno que se manifesta de
forma quantitativa ou
qualitativa, em função de
determinadas variáveis
preditoras. O resultado da
técnica será, igualmente,
métrico ou categórico, sendo
estimado com a ajuda de
alguma medida de impureza.
Random Forests Técnica confirmatória que pode
ter como variável target um
fenômeno que se manifesta de
forma quantitativa ou
qualitativa, em função de
determinadas variáveis
preditoras. Seu resultado é
dado em razão da estimação
de um grande número de
árvores de decisão, em que as
variáveis utilizadas para cada
uma delas são selecionadas de
forma randômica.
Redes Neurais Técnica confirmatória que pode
ter como variável target um
fenômeno que se manifesta de
forma quantitativa ou
qualitativa, em função de
determinadas variáveis
preditoras. Seu resultado se dá
através da escolha de uma
dada função de ativação que
se utiliza de inúmeras iterações
de valores iniciais randômicos
considerados em cada um de
seus neurônios.
Parte da Inteligência Artificial que, a
partir de tensores (costumeiramente,
bases de dados com 3 ou mais
dimensões), utiliza, em sua maior
parte, redes neurais com múltiplas
camadas para o reconhecimento e
classificação de padrões e tendências
em objetos de mundo real, sejam eles
pessoas, imagens, sons ou vídeos.