Você está na página 1de 67

TECNOLOGIA DA INFORMAÇÃO

Profa. Emannuelle Gouveia


@Emannuellegouveia
MACHINE LEARNING

Prof. Emannuelle Gouveia


@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
Há muito, a humanidade se pergunta se o computador pararia algum
dia de ser essa máquina limitada e dependente de intervenção humana e
passaria a ser capaz de pensar e agir com inteligência.
Na esteira dessa ideia, Alan Turing, que era um grande entusiasta da
área, concluiu que nós poderíamos considerar que o computador tinha se
tornado inteligente quando ele fosse capaz de passar por uma bateria de
perguntas feitas a ele e a um humano, por um interrogador humano, e com
as respostas em mãos, o interrogador não fosse capaz de distinguir quem
teria sido o autor das respostas, se o homem ou a máquina.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
O termo “inteligência artificial” foi utilizado pela primeira vez em 1956
por um pesquisador americano chamado John McCarthy e, de acordo com
ele, a inteligência artificial se refere à ciência e à engenharia de construir
máquinas inteligentes.
Uma outra definição seria que a inteligência artificial é o campo da
ciência da computação que lida com a simulação de comportamento
inteligente em computadores.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
Eis alguns subcampos da IA

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
A machine learning é apenas um dos subcampos da IA.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
A inteligência artificial surgiu em meados da década de 1950; o
aprendizado de máquina começa a ser estudado no início da década e 1980;
e a última década foi marcada pelo aprendizado profundo.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
A IA, em geral, trata de programas que podem sentir, raciocinar, agir e
se adaptar a fim de imitar a inteligência humana por meio de diversas
técnicas, incluindo o aprendizado de máquina.
O aprendizado de máquina trata de algoritmos cujo desempenho
melhoram à medida que eles são expostos a mais dados no decorrer do
tempo.
E o aprendizado profundo é um subconjunto do aprendizado de
máquina em que um software é capaz de treinar a si mesmo para executar
diversas tarefas por meio da utilização de redes neurais para aprender algo a
partir de uma quantidade massiva de dados.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
O Aprendizado de Máquina (Machine Learning) é a ciência e a arte de
programar computadores para que eles possam aprender com os dados, ou
ainda, o campo de estudo que dá aos computadores a capacidade de
aprender sem ser explicitamente programado.
Dessa forma, podemos estabelecer um paralelo entre o aprendizado de
máquina e programação tradicional.
Na programação tradicional, os dados são as entradas, as regras foram
pré-definidas por um programador, o computador executa as regras na
sequência determinada e é gerado o resultado que nós chamamos de saída.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
No aprendizado de máquina, nós entramos com os dados e com vários
exemplos de resultados passados e a máquina gera as regras estatísticas na
forma de um modelo matemático que é composto de diversas funções e
parâmetros e capaz de identificar padrões a partir de exemplos.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
Poderíamos citar como exemplo, soluções para identificar gatos em
uma imagem, ou hidrantes ou outros elementos quaisquer.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
Quanto mais exemplos de resultados você oferece, mais o algoritmo é
treinado, mais regras são aprendidas e mais ajustado se torna o modelo.
Essa é a etapa do processo de aprendizado de máquina chamada de
Treinamento e é bastante custosa, pois devemos colocar quantidades
massivas de dados para que os resultados sejam cada vez mais refinados.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO

Em seguida, temos a etapa de Inferência, menos custosa e ocorre


quando utilizamos uma programação bem próxima à programação
tradicional, mas usando regras aprendidas na etapa anterior, e novos dados
para gerar resultados.
O cientista de dados será responsável pela etapa de treinamento a fim
de gerar regras aprendidas e assim possibilitar que outros softwares as
utilizem. Esse treinamento é feito com os resultados aprendidos como
entrada e com novos dados para processar e gerar novos resultados.
As regras geradas podem ser utilizadas por outros softwares com a
programação clássica para inferir resultados.
Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO

Lembrando que a inferência é probabilística e não determinística, ou


seja, ela identificará uma alta ou uma baixa probabilidade de termos um
determinado resultado.
Ou seja, o processo é muito similar ao aprendizado humano. Somos
capazes de reconhecer elementos e identificá-los depois que somos
treinados para isso.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING - CONTEXTO
Assim sendo, o aprendizado de máquina é bastante relevante para os
casos que a criação de regras seria inviável, extremamente custosa ou
maçante.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Como vimos, os usos para o aprendizado de máquina são os mais diversos


possíveis e novos surgem todos os dias, mas existem diferentes abordagens
de algoritmos de aprendizado de máquina que podem ser classificadas
conforme veremos.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Aprendizado Supervisionado: trata-se de um conjunto de técnicas de


aprendizado para treinar um modelo com dados rotulados manualmente,
isto é, um especialista/supervisor externo diz qual é a saída esperada para
cada dado histórico utilizado no treinamento.
São as técnicas mais comumente empregadas no contexto de aprendizado
de máquina e geralmente utilizadas para identificar padrões específicos,
prever resultados dado um conjunto de amostras de treinamento.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Observe que a saída desejada para cada exemplo de entrada já é


conhecida no aprendizado supervisionado, isto é, os dados de saída são
previamente rotulados.
Essa abordagem também é chamada de tarefa de previsão e é bastante
semelhante à aprendizagem humana sob a supervisão de um professor, pois
o mesmo fornece bons exemplos para que o aluno memorize e o aluno
então deriva as regras gerais desses exemplos específicos.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Nesse caso, o processo de aprendizagem de um algoritmo em relação


ao conjunto de dados de entrada é acompanhado por um supervisor ou
professor que sabe quais são as respostas certas, o algoritmo faz as
predições sobre o conjunto de dados de entrada e ele vai corrigindo a saída
à medida que suas respostas não são de acordo o resultado esperado.
Um exemplo bem legal é o teste de Captcha.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Toda vez que vocês ouvirem falar em aprendizado supervisionado,


vocês devem saber que:

(1) trata-se da abordagem mais comum de aprendizado de máquina;


(2) existe um supervisor ou professor responsável por treinar o algoritmo;
(3) o supervisor conhece de antemão os rótulos. Logo, o supervisor decide
qual é o resultado esperado em cada contexto. É ele quem escolhe o rótulo
no aprendizado supervisionado e o utiliza para treinar o algoritmo.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Em suma: o aprendizado supervisionado é uma abordagem de


aprendizado de máquina em que um supervisor já conhece de antemão o
resultado (rótulo/classe) e pode guiar o aprendizado mapeando as entradas
em saídas por meio do ajuste de parâmetros em um modelo capaz de prever
rótulos desconhecidos.
O Rótulo também pode ser chamado de categoria, classe, sinal, variável
alvo ou, em inglês, de target, label ou tag.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Vale salientar que os problemas de aprendizado supervisionado


geralmente tratam de uma variável quantitativa ou qualitativa.
Se os rótulos se referem a um conjunto infinito de valores numéricos
contínuos a tarefa se chama regressão (Ex: > 100,00 ou < 100,00) e se os
rótulos se referem a um conjunto finito e não ordenado de valores
categóricos a tarefa se chama classificação (Ex: Alto ou Baixo).

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Os modelos supervisionados mais conhecidos são:


árvores de decisão,
regressão linear,
regressão logística,
redes neurais,
K-Nearest Neighbors (KNN),
Support Vector Machines (SVM).

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Aprendizado Não-Supervisionado: trata-se de um conjunto de técnicas


para treinar um modelo em que não se sabe a saída esperada para cada
dado usado no treinamento, ou seja, não utiliza rótulos/categorias para as
amostras.
Os algoritmos são formulados de tal forma que podem encontrar
estruturas e padrões adequados nos dados por conta própria, sem a
existência de um supervisor ou professor para rotular os dados.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Sendo assim, o algoritmo identifica as semelhanças nos dados


apresentados e reage com base na presença ou ausência dessas tais
semelhanças. Essa abordagem, que também é chamada de tarefa de
descrição, permite que o algoritmo aprenda a categorizar dados
autonomamente.
Observe que agora a ideia não é prever nada e, sim, organizar os dados
de alguma forma ou descrever sua estrutura.
Existem dois grandes sub-grupos de aprendizado não-supervisionado:
Agrupamentos (Clustering) e Regras de Associação (Association Rules).

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

As regras de associação são um tipo de aprendizado não-


supervisionado que permite estabelecer regras capazes de verificar como
determinados elementos em um conjunto estão intimamente associados,
isto é, se a presença de um elemento implica a presença de outro dentro em
uma mesma transação.
Os principais modelos são: Apriori e PCA (Principal Component
Analysis).
Ex: arrumação de um supermercado.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

O agrupamento é um tipo de aprendizado não-supervisionado em que


se busca encontrar padrões em um conjunto de dados e agrupá-los em
subconjuntos que, ao comparar dados de um mesmo grupo, sejam o
máximo possível homogêneos/semelhantes e, ao comparar dados de grupos
diferentes, sejam o máximo possível heterogêneos/diferentes.
Os principais modelos são: k-Means e Agrupamento Hierárquico.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Vale sempre salientar que o aprendizado não supervisionado pode retornar


associações ou agrupamentos que não os são desejados.
Por isso, é necessário decidir o tipo de algoritmo que a solução precisa.
O aprendizado não-supervisionado é bem mais barato que o aprendizado
supervisionado.
Cabe, de acordo com o resultado desejado e as variáveis do projeto, decidir
qual a técnica que melhor se aplica.

Ex: agrupamento de itens em uma loja on-line.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Aprendizado Semi-Supervisionado: trata-se de um meio termo entre o


aprendizado supervisionado e o não-supervisionado.
Nesse caso, utilizamos dados rotulados e não-rotulados para o
treinamento.
Em geral, utiliza-se uma pequena quantidade de dados rotulados e uma
grande quantidade de dados não-rotulados, visto que dados não rotulados
são mais baratos e são obtidos com menos esforço.
Ela pode ser aplicada para o agrupamento, regras de associação,
classificação ou regressão.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Aprendizado por Reforço: trata-se de um conjunto de técnicas que


utilizam tentativa e erro para descobrir decisões ótimas de como interagir
com ambiente ou com outros agentes.
Sua meta é reforçar ou recompensar uma ação considerada positiva e
punir uma ação considerada negativa.
Ex: robôs aspiradores.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – TIPOS DE APRENDIZADO

Em suma: algoritmos de aprendizado por reforço baseiam-se em reforço


positivo/negativo para otimização de resultado.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Trata-se de uma técnica de aprendizado supervisionado para distribuir


um conjunto de dados de entrada em categorias ou classes pré-definidas de
saída.
Nele o supervisor pode escolher um conjunto de features (também
chamados de características ou qualidades) que são os valores que
caracterizam de forma útil as coisas que desejamos classificar.
E depois inserir dados de treinamento para ir afinando o aprendizado.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO
No gráfico de dispersão temos: no eixo horizontal, temos a envergadura
em milímetros; no eixo vertical, temos a massa em gramas. Observe na
imagem da direita que é possível ver dois agrupamentos, mas no meio
(círculo roxo) existe uma sobreposição.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Imagine que eu trace uma linha reta vertical na altura dos 45 milímetros
de envergadura e afirme que tudo que estiver à esquerda provavelmente é
uma mariposa imperatriz e tudo à direita uma mariposa luna. Além disso, eu
posso traçar uma linha horizontal na altura dos 0,75 gramas de massa e
afirmar que tudo que estiver abaixo desse valor provavelmente é uma
mariposa imperatriz. Com isso, vejam na imagem ao lado que se forma um
quadrante em que sua parte inferior esquerda representa prováveis
mariposas imperatriz e o restante representa as mariposas luna.
Essas linhas que dividem o espaço de decisão são chamadas de limites
de decisão porque auxiliam a indicar qual será o classificador sugerido

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Se olharmos atentamente, podemos verificar que 86 mariposas


imperatriz (vermelho) terminaram de forma correta dentro da região de
decisão (em vermelho), mas 14 delas acabaram de forma incorreta no
território da mariposa luna (em azul). Por outro lado, 82 mariposas luna
(azul) foram classificadas corretamente (em azul), com 18 caindo para o lado
errado (em vermelho).
E isso é bom ou ruim?

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Nós podemos representar esses valores por meio de uma matriz de


confusão ou de erro.
Consiste em uma tabela utilizada para avaliar a qualidade de um
modelo que mostra as frequências de classificação para cada
classificador/rótulo do modelo. Trata-se geralmente de uma tabela com
duas linhas e duas colunas que exibe a quantidade de erros e acertos de
classificação de uma amostra de dados.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Essa é a nossa matriz de confusão! Note que ela possui dois eixos:
horizontal, que indica o valor previsto ou esperado; e vertical, que indica o
valor real.
Para avaliar o desempenho do algoritmo, nós podemos utilizar a
métrica de acurácia, isto é, a divisão do número de acertos pelo total de
predições. Em nosso caso, tivemos 82+86 = 168 acertos em uma amostra de
200 mariposas. Dessa forma, a nossa acurácia foi de 168/200 = 84%.
Observe que não há como desenharmos linhas que nos forneçam 100%
de acurácia!

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

O trabalho dos algoritmos de aprendizado de máquina é tentar


maximizar as classificações corretas enquanto minimiza seus erros.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Nós podemos generalizar a matriz de confusão da seguinte forma:

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Outras formas de medir o desempenho do algoritmo é com técnicas como: a


Sensibilidade, Precisão e F1-Score.
Dependendo do contexto, o desempenho pode ser medido de maneira
diferente para refletir melhor a efetividade da medição, por exemplo, em
alguns casos, ter falsos-negativos não é tão relevante, mas em outros pode
ser e etc.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

A precisão pode ser utilizada em situações em que falsos-positivos são


mais prejudiciais que os falsos-negativos. Por exemplo: ao classificar ações
da bolsa de valores como boas ou ruins, um falso-positivo pode fazer uma
pessoa investir em uma ação ruim e ter prejuízos; já um falso-negativo pode
fazer uma pessoa não investir em uma ação boa e deixar de ter lucros, mas
ela não terá prejuízos, logo é menos prejudicial.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Já o recall pode ser utilizado em situações em que falsos-negativos são


mais prejudiciais que os falsos-positivos. Por exemplo: ao classificar uma
pessoa com vacinado ou não-vacinado, um falso-positivo pode fazer uma
pessoa saudável não pegar um avião com outras pessoas; já um falso-
negativo pode fazer uma pessoa infectada pegar um avião com outras
pessoas e infectá-las com seu vírus.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

ÁRVORE DE DECISÃO

Uma das principais ferramentas de classificação é a árvore de decisão,


que consiste basicamente em uma representação gráfica de regras de
classificação.
Conseguem demonstrar visualmente as condições para categorizar
dados por meio de uma estrutura que contém nó raiz, nós folha e nós finais.
Na imagem seguinte, eles elementos estão representados
respectivamente por um quadrado, um círculo e um triângulo.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

É possível atravessar a árvore de decisão partindo do nó raiz até cada


folha por meio de diversas regras de decisão e o nó final contém sempre
uma das classes pré-definidas.
É importante destacar também que uma árvore de decisão pode ser
utilizada tanto para classificação quanto para regressão, mas o nosso foco
aqui será na árvore de classificação porque nossas classes são categóricas e
finitas e, não, contínuas e infinitas.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Cada nó interno denota um teste de um atributo, cada ramificação


denota o resultado de um teste e cada nó folha apresenta um rótulo de uma
classe definida de antemão por um supervisor. O objetivo dessa técnica é
criar uma árvore que verifica cada um dos testes até chegar a uma folha,
que representa a categoria, classe ou rótulo do item avaliado.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

A árvore de decisão, por si só, não tem a ver com aprendizado de


máquina, mas o seu processo de construção automático e recursivo, a partir
de um conjunto de dados, pode ser considerado um algoritmo de
aprendizado de máquina.
O processo de construção do modelo de uma árvore de decisão se
chama indução e busca fazer diversas divisões ou particionamentos dos
dados em subconjuntos de forma automática, de modo que os subconjuntos
sejam cada vez mais homogêneos.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

O algoritmo da árvore de decisão analisará, em cada nó, várias variáveis


previamente colocadas e aprenderá ao pouco as suas relevâncias,
assumindo uma decisão para cada uma dessas variáveis (e seus possíveis
pontos de corte) a fim de descobrir quais são as melhores para realizar o
particionamento dos dados de modo que se formem dois subgrupos mais
homogêneos possíveis.
Ex: um software de análise de concessão de cartão de crédito.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

O algoritmo vai fazer milhares de testes com cada uma das variáveis, vai
testar diversos pontos de corte diferentes e diversas sequências de análise
de variáveis diferentes. O que importa aqui é que nós vamos sair de um
grupo muito misturado (menos homogêneo) para dois subgrupos menos
misturados (mais homogêneos, o que chamamos de Ganho de Informação
ou Redução de Entropia.

OBS: Lembrando que entropia é a medida que nos diz o quanto um conjunto
de dados está desorganizado ou misturado.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Note que sempre que dividimos um grupo em outros subgrupos, esses


subgrupos serão mais puros à medida que seus dados forem mais
homogêneos.
Temos diversas métricas para calcular a pureza de um subgrupo como:
Índice de Gini, Redução de Variância, etc).

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Para encontrar modelos cada vez mais puros, falamos que ocorrem as
divisões nos nós, mas esse processo precisa ser finito para evitar o
overfitting que é um único dado para cada nó folha.
Há diversas maneiras de definir um limite para as divisoes: nós
podemos definir uma altura/profundidade máxima da árvore e quando esse
limite for atingido, interrompe as subdivisões ou podemos realizar a poda da
árvore que consiste em deixarmos a árvore crescer quanto quiser e depois
vamos reduzindo as divisões que sejam pouco significativas.

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
MACHINE LEARNING – CLASSIFICAÇÃO

Informática
Profa: Emannuelle Gouveia
@Emannuelle Gouveia
OBRIGADA
Prof. Emannuelle Gouveia
@emannuellegouveia

Você também pode gostar