Noções de Algoritmos de Aprendizado Supervisionados e Não Supervisionados 04

Aprendizagem de máquina
Noções de algoritmos de aprendizado supervisionados e não

supervisionados
Professor Eduardo Benjamin

Título: Aprendizagem de máquina
(Machine Learning)
Noções de algoritmos de aprendizado supervisionados e não
supervisionados
o Aprendizagem de
máquina
2º 1.2. Noções de algoritmos de
aprendizado supervisionados e não
B supervisionados
L
O Segmento
C 03
O
Pergunta: o que é aprendizagem de máquina?
Aprendizagem de máquina é a
ideia de que há algoritmos
genéricos que podem dizer algo
interessante sobre um conjunto
de dados sem que você tenha que
escrever nenhum código
específico ao problema. Ao invés
de escrever código, você alimenta
o algoritmo com dados e ele
constrói sua própria lógica a partir
dos dados.
Algoritmo: passos predeterminados (resolução de um problema)
Um tipo de algoritmo é classificador. Ele pode atribuir dados para
diferentes grupos.
O algoritmo “Naive Bayes” é um

Algoritmo
classificador de
probabilístico baseado no
Classificação
“Teorema de Bayes”, o qual foi criado
Naive Bayes
por Thomas Bayes (1701 - 1761) para
tentar provar a existência de Deus.
Algoritmos para aprender…
Os algoritmos (programas de computador) podem fazer previsões a partir de
amostras ou tomar decisões guiadas unicamente por dados, sem qualquer tipo de
programação. Embora semelhante, em certos aspectos, da estatística
computacional, que faz previsões com o uso dos computadores, o aprendizado de
máquina é usado em tarefas computacionais onde criação e programação de
algoritmos explícitos é impraticável.
Processamento de
Filtragem Diagnóstico Sistemas Detecção de
linguagem natural
de SPAM médico de busca fraude
na web semântica
Aprendizado de máquina. Como a coisa funciona?
1. Aprendizagem supervisionada
Métodos de 2. Aprendizagem
aprendizagem não-supervisionada
3. Aprendizagem por reforço

Aprendizado de máquina. Como a coisa funciona?
A aprendizagem supervisionada: é útil nos casos em que uma
propriedade (rótulo) está disponível para um determinado conjunto de
dados (conjunto de treinamento).
O aprendizado não supervisionado: é útil nos casos em que o desafio é
descobrir relacionamentos implícitos em um dado conjunto de dados
não-rotulado (os itens não são pré-atribuídos).
O aprendizado de reforço: está entre estes dois extremos – existe
alguma forma de feedback disponível para cada passo ou ação preditiva,
mas sem etiqueta precisa ou mensagem de erro.
Aprendizagem supervisionada
É principalmente utilizada quando o
sistema já sabe quais entradas estão
associadas com quais saídas e precisa
aprender um meio de entender essa
associação. Utiliza a detecção de padrões
para estabelecer previsões. Um exemplo
de aprendizagem supervisionada é a
categorização de e-mails, separando do Observar as
que é relevante e o que é SPAM. características
Treinar seus colaboradores
Corretor de Bairro Mts2 Quartos Banheiros Garagem Valor

Imóveis (mil)
Jardins 345 6 3 2 carros 700

Ajudar seu time
Centro 200 3 1 3 carros 345
Aplicativo V.José 340 5 3 4 carros 900

1 suíte
supervisionada
Nesta abordagem o modelo Exemplos rotulados
aprende a executar uma
tarefa a partir de exemplos
rotulados, ou seja, a partir das
respostas corretas, que de Pato
Gato Vaca
alguma forma devem ser
passadas para o modelo. Apresentar → Treinar → Testar
1. O algoritmo irá explorar, através de treino, recursos úteis das imagens, como
número de pernas ou cor para encontrar padrões úteis que vinculam imagens a
seus rótulos corretos.
2. Após um treinamento bem-sucedido, podemos usar o algoritmo totalmente

treinado para tentar prever os rótulos de um novo conjunto de imagens invisíveis
(como uma assinatura visual de um rosto, que um software de reconhecimento
facial para tentar identificar alguém). Geralmente julgamos o desempenho do
algoritmo por sua precisão na previsão dessas novas imagens invisíveis.
3. O aprendizado supervisionado pode ser aplicado a uma ampla gama de

problemas, como detecção de spam de e-mail ou previsão do preço das ações.
“1”
Algoritmo “2”
genérico de “3”
aprendizagem “4”
de máquina “5”
“6”
Algoritmo SPAM
genérico de
email aprendizagem
de máquina
NÃO SPAM
Aprendizagem supervisionada Gato
Algoritmo de
aprendizagem
supervisionada
Pato
Vaca
supervisionada
Este aprendizado é iterativo e é realizado até que uma
condição seja atingida, geralmente uma porcentagem
aceitável de acertos, ou seja, a ideia é sempre de minimizar
os erros que a inteligência artificial produz. Essa condição de
parada com base na acurácia máxima
acurácia máximaé possível pois se trata
de aprendizado com resultado conhecido.
B supervisionados
L
O Segmento
C 04
O
Algoritmos de aprendizagem supervisionada
1. Árvores de Decisão
2. Classificação Naïve
Bayes
3. Regressão Linear de
Mínimos Quadrados
4. Regressão logística
5. Support Vector
Machine
6. Ensemble Methods
Algoritmo Aprendizagem Supervisionada: Árvores de Decisão
Uma árvore de decisão é uma ferramenta de apoio

que utiliza um gráfico ou modelo de decisões e suas
possíveis consequências, incluindo resultados de
eventos fortuitos, custos de recursos e utilidade.
1. Algoritmo Aprendizagem Supervisionada: Árvores
de Decisão
Do ponto de vista
Como umda decisão
método,
de negócios, uma árvore
permite-lhe de
abordar
decisãooéproblema
o número demínimo
uma
de perguntas
formaque devem ser
estruturada e
respondidas para avaliar
sistemática para a
probabilidade
chegarde tomar uma
a uma
decisãoconclusão
correta, nalógica.
maioria
das vezes.
O algoritmo C4.5 (mineração de dados)
Atua como um classificador de árvore de decisão. Usado

para gerar uma árvore de decisão. O algoritmo C4.5 é muito
útil para gerar uma decisão útil, que é baseada em uma
amostra de dados a partir do recebimento de um conjunto
de dados que representam coisas que já estão classificadas.
Também conhecido como classificador estatístico.
Um breve exemplo de uma árvore de decisão
2. Algoritmo Aprendizagem Supervisionada: “Naïve
Bayes”
Tornou-se popular na área de Aprendizado de Máquina
(Machine Learning) para categorizar textos baseado na
frequência das palavras usadas.
Filtros de SPAM
Mineração de emoções Mineração

de textos
Separação de documentos
O algoritmo “Naïve Bayes” “Naïve” = ingênuo
Desconsidera completamente a correlação entre as variáveis (features).
Vermelha
O algoritmo não vai
levar em consideração
a correlação entre
Arredondada esses fatores, tratando
cada um de forma
independente.
10 cm diâmetro
O algoritmo “Naïve Bayes” é muito popular na
área de Machine Learning para classificação de
textos.
Por ser muito simples e rápido, possui um desempenho relativamente
maior do que outros classificadores. Além disso, o Naïve Bayes só
precisa de um pequeno número de dados de teste para concluir
classificações com uma boa precisão.
O algoritmo não leva em consideração a correlação entre as

características dos elementos analisados, tratando cada um de forma
independente.
Determinando probabilidades (diagnóstico de uma nova doença)
20 pessoas
90% receberam Positivo no
possuíam a
teste da doença
doença (20%)
100 30% das pessoas que não
80 pessoas
pessoas possuíam a doença também
estavam
saudáveis (80%) receberam o teste positivo
•A 100
pergunta neste caso
pessoas realizaram seria: Se uma nova pessoa realizar
o teste.
• 20% das pessoas que realizaram o teste possuíam a doença.
o teste e receber um resultado positivo, qual a
• 90% das pessoas que possuíam a doença, receberam positivo no teste.
probabilidade de não
• 30% das pessoas que elapossuíam
possuira doença,
a doença?
receberam positivo no teste.
O algoritmo de Naïve Bayes
1º) Encontrar uma probabilidade a ▪P(doença|positivo) = 20% * 90%
posteriori (possuir a doença, dado que
recebeu um resultado positivo), ▪P(doença|positivo) = 0,2 * 0,9
multiplicando a probabilidade a priori
(possuir a doença) pela probabilidade de ▪P(doença|positivo) = 0,18
“receber um resultado positivo, dado que 18%
tem a doença”.
▪P(não doença|positivo) = 80% * 30%

2º) Computar a probabilidade a posteriori
da negação (Não possuir a doença, dado ▪P(não doença|positivo) = 0,8 * 0,3
que recebeu um resultado Positivo). 24%
▪P(não doença|positivo) = 0,24
O algoritmo de Naïve Bayes (normalização–base 100%)
Após isso precisamos normalizar os dados, para que a soma das duas
probabilidades resulte 1 (100%).
Podemos concluir que se o
Para isso, dividimos o resultado pela soma dasdo
resultado duas
testeprobabilidades.
da nova
pessoa for positivo, ela
possui aproximadamente
▪P(doença|positivo) = 0,18/(0,18+0,24) = 0,4285
43% (0,4285) de chance de
▪P(não doença|positivo) = 0,24/(0,18+0,24) = 0,5714
estar doente.
▪0,4285 + 0,5714 = 0,9999.. ou aproximadamente 1.

3. Algoritmo Aprendizagem Supervisionada:
Regressão Linear de Mínimos Quadrados
Provavelmente, você já ouviu falar de regressão linear antes. Least
squares regression é um método para a realização de regressão linear.
Regressão linear é como uma tarefa de encaixar uma linha reta através de
um conjunto de pontos. Existem várias estratégias possíveis para isso e a
de “mínimos quadrados comuns”. Podemos desenhar uma linha e, em
seguida, para cada um dos pontos de dados, medir a distância vertical
entre o ponto e a linha e somá-los. A linha ajustada seria aquela em que
esta soma de distâncias é a menor possível.
Regressão Linear de Mínimos Quadrados
Linear refere-se ao tipo de
modelo que você está
usando para ajustar os
dados.
Mínimos quadrados refere-

se ao tipo de métrica de erro
que você está minimizando.
Regressão logística
A regressão logística é uma poderosa forma estatística de
modelar um resultado binomial com uma ou mais variáveis
explicativas. Ela mede a relação entre a variável
dependente categórica e uma ou mais variáveis
independentes, estimando as probabilidades usando uma
função logística, que é a distribuição logística cumulativa.
Regressão logística
E geral, as regressões podem ser
usadas em aplicações, tais como:
• Pontuação de crédito
• Medir as taxas de sucesso das
campanhas de marketing
• Prever as receitas de um
determinado produto
B supervisionados
L
O Segmento
C 05
O
5. Algoritmo Aprendizagem Supervisionada: SVM -
Support Vector Machine
SVM é um algoritmo binário da classificação. Dado um conjunto de pontos de 2
tipos em lugar N dimensional, SVM gera um hiperplano (N – 1) dimensional para
separar esses pontos em 2 grupos. Ele é um algoritmo de aprendizado
supervisionado, cujo objetivo é classificar determinado conjunto de pontos de
dados que são mapeados para um espaço de características multidimensional
usando uma função kernel (função que retorna o produto escalar das imagens de
seus argumentos ), abordagem utilizada para classificar problemas. Nela, o limite
de decisão no espaço de entrada é representado por um hiperplano em dimensão
superior no espaço (VAPNIK et al., 1997 e SARADHI et al., 2005).
Explicando o algoritmo SVM - Support Vector Machine
O SVM realiza a separação de um conjunto de objetos com diferentes
classes, ou seja, utiliza o conceito de planos de decisão.
Ao entrarem novos objetos na análise,
estes
Na serão
Figura aoclassificados como
lado é possível amarelos
observar
se estiverem
duas à direita
classes de e como
objetos: verdeverdes
ou caso
situem-seEssa
amarelo. à esquerda.
linha queNeste caso,define
os separa
oconseguimos
limite em queseparar, por meioosdepontos
se encontram uma
linha, oeconjunto
verdes os pontosdeamarelos.
objetos em seu
respectivo grupo, o que caracteriza um
classificador linear.
No entanto, problemas de classificação
costumam ser mais elaborados, sendo
necessário realizar a separação ótima por
meio de estruturas mais complexas. O
SVM propõe a classificação de novos
objetos (teste) com base em dados
disponíveis (treinamento). Como pode-se
observar ao lado. A separação ótima
nesse caso ocorreria com a utilização de
uma curva.
Em termos de escala, alguns dos

maiores problemas que foram
resolvidos usando SVMs (com
implementações adequadamente
modificadas) são publicidades em
display, reconhecimento de site de
splice humano, detecção de gênero
baseada em imagem, classificação
Na esquerda da Figura acima observamos
Observa-se que à direita da Figura acima há a complexidade
uma separaçãoem separar
linear dos os objetos
objetos. originais.
Assim, ao
de imagem em grande escala etc.
Para mapeá-los,
invés de construirutilizamos
uma curva um conjuntocomo
complexa, de funções matemáticas,
no esquema conhecido
à esquerda; o SVMcomo Kernels
propõe, nesse
(funções
caso, essaque retornam
linha o produto
ótima capaz escalarosdas
de separar imagens
pontos de dos
verdes seusamarelos.
argumentos). Esse
mapeamento é conhecido como o processo de reorganização dos objetos.
Ensemble Methods
São algoritmos de aprendizagem que constroem um
conjunto de classificadores e, em seguida, classificam novos
pontos de dados, tendo um ponderado voto de suas
previsões. O método de conjunto original é a média
bayesiana, mas os algoritmos mais recentes incluem
codificação de saída, correção de erros, bagging e reforço.
Funcionam
6. Algoritmoatravés de métodos
Aprendizagem de conjunto e são
Supervisionada:
superiores aos modelos individuais
Ensemble Methods
Eles reduzem a variância: A opinião
agregada de um
É improvável quemonte
eles sede modelos é se
sobrepõem:
menos
você tembarulhenta
modelos do que a opinião
individuais que não única
se
de um dos modelos.
sobrepõem Em finanças,
e está combinando as isso é
chamado
previsões diversificação
de cada modelo – uma carteira
de uma
mista
maneirade simples
muitas ações
(média,será muito menos
média
variável do que
ponderada, apenaslogística),
regressão um dos estoques
então não
sozinho.
há espaçoÉ para
por isso que seus modelos
sobrecarga.
serão melhores com mais pontos de dados
do que menos.
Classificadores Ensemble, tipos
Bagging e Boosting
Um classificador ensemble (também chamado de comitê de
learners, mistura de especialistas ou sistema de
classificadores múltiplo), consiste em um conjunto de
classificadores treinados individualmente, classificadores de
base, cujas decisões são de alguma forma combinadas
(Marques et al., 2012).
Bagging e Boosting
O Bagging (Bootstrap Aggregating), um método proposto por Breiman
em 1996, gera um conjunto de dados por amostragem bootstrap dos
dados originais. O conjunto de dados gera um conjunto de modelos
utilizando um algoritmo de aprendizagem simples por meio da
combinação por votos para classificação. O seu uso é particularmente
atraente quando a informação disponível é de tamanho limitado.
Bagging e Boosting
No Boosting, de forma semelhante ao Bagging, cada classificador é treinado usando
um conjunto de treinamento diferente. A abordagem por Boosting original foi
proposta por Schapire em 1990. A principal diferença em relação ao Bagging é que
os conjuntos de dados reamostrados são construídos especificamente para gerar
aprendizados complementares e a importância do voto é ponderado com base no
desempenho de cada modelo, em vez da atribuição de mesmo peso para todos os
votos. Boosting é considerado uma das descobertas mais significativas em
aprendizado de máquina (LANTZ, 2013).
Aprendizagem não supervisionada
Em alguns casos, apesar de existir o objetivo da tarefa
desejada, os resultados finais não são conhecidos e,
portanto, não se tem os rótulos para passar ao modelo.
Por exemplo: dada uma coleção de artigos, deseja-se

agrupá-los automaticamente de acordo com a frequência
de algumas palavras ou contagem de páginas. Não se sabe
quantos grupos serão formados.
Em alguns casos, apesar de existir o objetivo da tarefa
desejada, os resultados finais não são conhecidos e,
portanto, não se tem os rótulos para passar ao modelo.
Por exemplo: dada uma coleção de artigos, deseja-se

agrupá-los automaticamente de acordo com a frequência
de algumas palavras ou contagem de páginas. Não se sabe
quantos grupos serão formados.
Bairro Mts2 Quartos Banheiros Garagem Valor
É como se alguém lhe mostrasse uma
(mil) lista de números em uma folha de
papel e dissesse “Eu não sei o que
Jardins 345 6 3 2 carros ??? estes números significam, mas talvez
Centro 200 3 1 3 carros ??? você possa descobrir se há algum
V.José 340 5 3 4 carros
padrão ou agrupamento, ou alguma
???
1 suíte coisa que inter-relacione estes dados!
Bairro Mts2 Quartos Banheiros Garagem Valor
(mil) O fazer com estes dados?
Jardins 345 6 3 2 carros ???
Centro 200 3 1 3 carros ??? Que tal um algoritmo que identifica
V.José 340 5 3 4 carros ??? segmentos de mercados nos seus
1 suíte
dados.
Há compradores de imóveis próximo da universidade
Sabendo sobrelocal
estes
preferem casas menores mas com muitos tipos
quartos, para de
diferentes
criação de repúblicas estudantis. clientes pode ajudar
a direcionar
Há compradores de imóveis em condomínios seuscasas
preferem
esforços de MKT.
com 3 quartos que tenham muita área construída.
É nesse contexto que se apresenta o aprendizado não-supervisionado.

Este modelo aprende a executar uma tarefa a partir de dados não-
rotulados (sem um resultado conhecido), apenas com base em suas
características e padrões semelhantes, ou seja, o modelo deduz
estruturas a partir de uma amostra do problema; bem utilizado em
situações com muitas observações e muitas features como: áudios,
imagens e vídeos.
Aprendizagem de máquina não
supervisionada
Manipulam dados que não são explicitamente rotulados. Em vez
disso, algoritmos não supervisionados tentam encontrar algum tipo de
estrutura subjacente nos dados. Algumas observações estão
agrupadas? Existem relações interessantes entre os diferentes
recursos? Quais recursos carregam a maior parte das informações?
Geralmente não há necessidade
Avaliar o desempenho de treinar
de um algoritmo de algoritmos não
aprendizado não
O aprendizado não
supervisionados,
supervisionado umsupervisionado
é pois eles podem
tanto é comumente
ser
subjetivo eaplicados usado emparte
dependediretamente
em grande tarefas
aos dos
como
dados mineração de texto
de específicos
detalhes interesse. e redução de dimensionalidade.
da tarefa.
B supervisionados
L
O Segmento
C 06
O
Algoritmos de aprendizagem não supervisionada
1. Algoritmos de
Agrupamento
(Clustering)Classificação
2. Decomposição em valores
singulares
3. Análise de Componentes
Principais
4. Análise de componentes
independentes
1. Algoritmo Aprendizagem Não Supervisionada:
Agrupamento (Clustering)Classificação
O clustering ou análise de agrupamento de dados é o conjunto de técnicas de
prospecção de dados que visa fazer agrupamentos automáticos de dados segundo o
seu grau de semelhança. O critério de semelhança faz parte da definição do
problema e, dependendo, do algoritmo
É a tarefa de agrupar um conjunto de objetos de tal forma que os do mesmo grupo

(cluster) são mais semelhantes uns aos outros do que aqueles em outros grupos.
Algoritmo K-Means (algoritmo baseado em Clustering)
A ideia do algoritmo K-Means (também chamado de K-Médias) é
fornecer uma classificação de informações de acordo com os próprios
dados. Esta classificação, como será vista a seguir, é baseada em análise
e comparações entre os valores numéricos dos dados.
Desta maneira, o algoritmo automaticamente vai fornecer uma
classificação automática sem a necessidade de nenhuma supervisão
humana, ou seja, sem nenhuma pré-classificação existente. Por causa
desta característica, o K-Means é considerado como um algoritmo de
mineração de dados não supervisionado.
Algoritmo K-Means
Dados a serem classificados
Dimensão
Ocorrências ou
pontos
Geralmente, trabalha-se com

dados contínuos neste
algoritmo, mas nada impede que
dados discretos sejam utilizados,
deste que eles sejam mapeados
para valores numéricos
correspondentes.
Refere à qualidade de algo. Descrição de cores, textura, de
Qualitativos
experiências, entrevista.
Refere a números. O número de bolas de golfe, o tamanho,

Dados
Quantitativos o preço, a nota da prova.
Categoriza o item descrito. A condição de “usadas” das

Categóricos bolas de tênis, novas, usadas.
Dados discretos, aborda-se um valor exato, tal como

Discretos quantidade de peças defeituosas.
Resultam de infinitos valores possíveis que correspondem
Contínuos a alguma escala contínua que cobre um intervalo de
valores. Idade, renda, gastos, vendas, faturamento, etc.
Algoritmo K-Means (criar classificações)
Dados a serem classificados O algoritmo vai indicar uma
classe (cluster) e vai dizer quais
linhas pertencem a esta classe.
O usuário deve fornecer ao
algoritmo a quantidade de
classes que ele deseja. Este
número de classes que deve ser
passada para o algoritmo é
chamado de k e é daí que vem
a primeira letra do algoritmo:
K-Means.
Para gerar as classes e classificar as ocorrências, o algoritmo faz uma
comparação entre cada valor de cada linha por meio da distância. Geralmente
utiliza-se a distância euclidiana (distância entre dois pontos) para calcular o
quão ‘longe’ uma ocorrência está da outra. A maneira de calcular esta distância
vai depender da quantidade de atributos da tabela fornecida.
Após o cálculo das distâncias o algoritmo calcula centroides (centro
geométrico) para cada uma das classes. Conforme o algoritmo vai iterando, o
valor de cada centroide é refinado pela média dos valores de cada atributo de
cada ocorrência que pertence a este centroide. Com isso, o algoritmo gera k
centroides e coloca as ocorrências da tabela de acordo com sua distância dos
centroides.
01 - Fornecer valores para os centroides.
02 - Gerar uma matriz de distância entre cada ponto e os
centroides.
03 - Colocar cada ponto nas classes de acordo com a sua
Passos
distância do centroide da classe.
04 - Calcular os novos centroides para cada classe.
05 - Repetir até a convergência.

Decomposição em valores singulares
Na álgebra linear, a SVD é uma fatoração de uma matriz complexa real. Para uma
dada matriz m* n M, existe uma decomposição tal que M = UΣV, onde U e V são
matrizes unitárias e Σ é uma matriz diagonal.
SVD (Singular Value Decomposition) é uma fatoração de matrizes, mais geral do que
a diagonalização, e que serve também para matrizes retangulares. Essencialmente,
ela consiste em encontrar duas bases (em vez de apenas uma que é o caso de
autovetores da diagonalização) que sejam adaptadas à matriz A.
Análise de Componentes Principais
A Análise de Componentes Principais ou PCA (Principal Component Analysis) é uma
técnica de análise multivariada que pode ser usada para analisar inter-relações
entre um grande número de variáveis e explicar essas variáveis em termos de suas
dimensões inerentes (Componentes).
Método que tem como objetivo básico, a análise de dados, visando sua redução,
eliminação de sobreposições e a escolha da forma mais representativas de dados a
partir de combinações lineares (expressões construídas a partir de um conjunto de
termos, multiplicando cada termo por uma constante) das variáveis originais.
SVD e PCA
Singular Value Decomposition(SVD): realizar a
SVD
reduçãoconsiste
de postoem e aum processodede
aproximação baixo-
Métodos
SVD e PCAnuméricos
tem sido oriundos
fatoração
posto de uma dematriz
matrizes capaz de
N-dimensional. Objetivos
da Álgebra Linear (AL) e da distintos:
representar (1) eficiência de manipulação
uma matriz de dados de dados
A por
extensivamente aplicados a
Estatística (ES)da
têm se arrays, (2) redução da dimensionalidade dos dados e
variadas áreas computação. meio de três
(3) remoção outras
dos ruídos dosmatrizes U,S e V.
dados originais.
tornado cruciais
Mineração para o
de Dados,
Aprendizado de Maquina,
sucesso de variadas tarefas
Recuperação de Informação,
computacionais, tais como PCA é uma
Principal técnica estatística
Component multivariada
Analysis(PCA): explicar a que
Processamento Digital de Sinais,
Classificação Automática de possui como
estrutura objetivo explorar adeestrutura
de variância-covariância um conjuntode
dentre outras. variabilidade
de variáveis pordos
meiodados.
de poucasOscombinações
principais
Documentos.
lineares
conceitosentre essas variáveis.
estatísticos (1) reduçãoo de
para entender dados e
processo
(2)
são:interpretação destesedados.
média, variância covariância.
Análise de componentes independentes
ICA (Independent Component Analysis) é uma técnica estatística para
revelar fatores ocultos que estão subjacentes a conjuntos de variáveis
aleatórias, medições ou sinais.
A ICA está relacionada ao PCA, mas é uma técnica muito mais
poderosa, capaz de encontrar os fatores subjacentes das fontes
quando esses métodos clássicos falham completamente. Suas
aplicações incluem imagens digitais, bancos de dados de
documentos, indicadores econômicos e medições psicométricas.
Aprendizagem por reforço
A Aprendizagem Por Reforço é o treinamento de modelos de aprendizado
de máquina para tomar uma sequência de decisões.
O agente aprende a atingir uma meta em um ambiente incerto e
potencialmente complexo.
No aprendizado por reforço, o sistema de inteligência artificial enfrenta

uma situação. O computador utiliza tentativa e erro para encontrar uma
solução para o problema. Para que a máquina faça o que o programador
deseja, a inteligência artificial recebe recompensas ou penalidades pelas
ações que executa. Seu objetivo é maximizar a recompensa total.
Aprendizagem por reforço
Emprega um sistema de recompensas e penalidades para obrigar o
computador a resolver um problema sozinho. O envolvimento humano é
limitado à mudança do ambiente e ao ajuste do sistema de recompensas
e penalidades.
O aprendizado por reforço é útil quando não existe uma “maneira

adequada” de executar uma tarefa, mas existem regras que o modelo
deve seguir para desempenhar corretamente suas tarefas. Abaixo a
performance de um agente sendo treinado em um jogo clássico do Atari.
Agente sendo treinado em um jogo clássico do Atari.
Performance inicial 15m de treinamento 30m de treinamento

Como pode
ser cobrado
em prova?
Dentre os métodos de mineração de dados, existem aqueles que são
supervisionados e os não supervisionados. Assinale a alternativa que
apresenta corretamente um dos métodos supervisionados mais comuns
para a aplicação da mineração de dados que é voltado às tarefas
frequentes do dia a dia.
A) Regras de associação.
B) Bubble sort.
C) Clusterização.
D) Classificação.
E) Formulação.
Com relação a mineração de dados e aprendizado de máquina as
técnicas utilizadas podem ser categorizadas em supervisionadas e não
supervisionadas.
As técnicas de árvores de decisão, agrupamento e regras de associação
são categorizadas, respectivamente, como
A) não supervisionada, não supervisionada, não supervisionada

B) não supervisionada, supervisionada e não supervisionada
C) supervisionada, não supervisionada e não supervisionada
D) supervisionada, não supervisionada e supervisionada
E) supervisionada, supervisionada e supervisionada
Dois funcionários de uma empresa de crédito discutiam sobre quais
algoritmos deveriam usar para ajudar a classificar seus clientes como
bons ou maus pagadores. A empresa possui, para todos os empréstimos
feitos no passado, um registro formado pelo conjunto de informações
pessoais sobre o cliente e de como era composta a dívida inicial. Todos
esses registros tinham classificações de bons ou maus pagadores, de
acordo com o perfil de pagamento dos clientes. A partir desses dados, os
funcionários querem construir um modelo, por meio de aprendizado de
máquina, que classifique os novos clientes, que serão descritos por
registros com o mesmo formato.
A melhor opção, nesse caso, é usar um algoritmo
A) supervisionado, como SVM
B) supervisionado, como K-means
C) não supervisionado, como regressão linear
D) não supervisionado, como árvores de decisão
E) semi-supervisionado, como redes bayesianas

(A) supervisionado, como SVM - Resposta correta. Trata-se de um aprendizado
supervisionado com particionamento.
(B) supervisionado, como K-means - K-means é um algoritmo usado para clusterização,
ou seja, é não supervisionado
(C) não supervisionado, como regressão linear - Regressão Linear é dado por uma
equação de reta, mas trata-se de um aprendizado supervisionado
(D) não supervisionado, como árvores de decisão - em árvore de decisão há rótulos e
esquemas pré-definidos. Isso caracteriza aprendizado supervisionado.
(E) semi-supervisionado, como redes bayesianas - A questão afirma "Todos esses
registros tinham classificações de bons ou maus pagadores" o que deixa evidente que
não se trata de um aprendizado semi-supervisionado.
REFERÊNCIAS
• A introdução à aprendizagem de máquina mais fácil do mundo
https://medium.com/machina-sapiens/aprendizagem-dem%C3%A1quina-%C3%A9-divertido-8fe1513ce59f
• Aprendizagem supervisionada x não supervisionada

https://ichi.pro/pt/aprendizagem-supervisionada-x-nao-supervisionada-em-2minutos-126284139655746
• Revista Zum
https://revistazum.com.br/entrevistas/entrevista-trevor-paglen/
• Grupo Viceri
https://www.viceri.com.br/insights/as-classificacoes-dos-algoritmos-de-machine-learning
• VAPNIK et al., 1997 e SARADHI et al., 2005).
http://www.kdnuggets.com/2016/08/10-algorithms-machine-learning-engineers.html

Noções de Algoritmos de Aprendizado Supervisionados e Não Supervisionados 04

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Noções de Algoritmos de Aprendizado Supervisionados e Não Supervisionados 04

Enviado por

Direitos autorais:

Formatos disponíveis

Aprendizagem de máquina

Noções de algoritmos de aprendizado supervisionados e não

Professor Eduardo Benjamin

O algoritmo “Naive Bayes” é um

3. Aprendizagem por reforço

Treinar seus colaboradores

Corretor de Bairro Mts2 Quartos Banheiros Garagem Valor

Jardins 345 6 3 2 carros 700

Aplicativo V.José 340 5 3 4 carros 900

2. Após um treinamento bem-sucedido, podemos usar o algoritmo totalmente

3. O aprendizado supervisionado pode ser aplicado a uma ampla gama de

Uma árvore de decisão é uma ferramenta de apoio

Atua como um classificador de árvore de decisão. Usado

Mineração de emoções Mineração

O algoritmo não leva em consideração a correlação entre as

▪P(não doença|positivo) = 80% * 30%

▪0,4285 + 0,5714 = 0,9999.. ou aproximadamente 1.

Mínimos quadrados refere-

Em termos de escala, alguns dos

Por exemplo: dada uma coleção de artigos, deseja-se

Por exemplo: dada uma coleção de artigos, deseja-se

É nesse contexto que se apresenta o aprendizado não-supervisionado.

É a tarefa de agrupar um conjunto de objetos de tal forma que os do mesmo grupo

Geralmente, trabalha-se com

Refere a números. O número de bolas de golfe, o tamanho,

Categoriza o item descrito. A condição de “usadas” das

Dados discretos, aborda-se um valor exato, tal como

05 - Repetir até a convergência.

No aprendizado por reforço, o sistema de inteligência artificial enfrenta

O aprendizado por reforço é útil quando não existe uma “maneira

Performance inicial 15m de treinamento 30m de treinamento

A) não supervisionada, não supervisionada, não supervisionada

A) supervisionado, como SVM

B) supervisionado, como K-means

C) não supervisionado, como regressão linear

D) não supervisionado, como árvores de decisão

E) semi-supervisionado, como redes bayesianas

• Aprendizagem supervisionada x não supervisionada

• VAPNIK et al., 1997 e SARADHI et al., 2005).

Você também pode gostar