Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
INTRODUÇÃO
Agenda:
Aprendizado de Máquina
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Introdução
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Aprendizado de Máquina
Obs.: destarte, o sistema classificador é treinado com uma base de dados, tornando-se apto
para lidar com informações distintas.
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Introdução
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Obs.: na prática, consiste na criação de uma função lógica que possibilita o aprendizado da
máquina, que pode ser aprimorada com o tempo.
20m
• (Russel& Norvig 1995): “[...] todo aprendizado pode ser visto como o aprendizado de
uma função”.
Aprendizado de Máquina
Tarefas Descritivas:
Tarefas Preditivas:
Aprendizado de Máquina
Paradigmas de AM:
• Simbólico.
– Construção de uma representação simbólica de um conceito por meio de exemplos
e contraexemplos.
25m
– Representação simbólica na forma de alguma expressão lógica, como árvores de
decisão e regras.
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Introdução
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Ao imaginar um espaço com dois atributos (x, y) e três grupos (A, B e C) que comparti-
lham espaço entre os dois atributos. A partir do momento que o K-NN, por exemplo, é inse-
rido no meio dos dois atributos, o classificador acabam adicionando-o ao grupo com que tiver
maior afinidade, ou seja, utiliza-se de exemplos conhecidos para criar novos exemplos.
Aprendizado de Máquina
Paradigmas de AM – Conexionista:
• Genético:
– Um classificador genético consiste de uma população de elementos de classificação
que competem para fazer a predição.
30m
– Elementos que possuem um desempenho ruim são descartados, enquanto os ele-
mentos mais fortes proliferam, produzindo variações.
– Alguns operadores genéticos básicos que aplicados à população geram novos indi-
víduos são: Reprodução, Cruzamento, Mutação e Inversão.
• Paradigmas de AM – Estatístico:
– Utilização de modelos estatísticos para encontrar uma boa aproximação do con-
ceito induzido.
– Vários desses métodos são paramétricos, assumindo alguma forma de modelo,
e então encontrando valores apropriados para os parâmetros do modelo a partir
dos exemplos.
ANOTAÇÕES
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Introdução
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
INTRODUÇÃO II
O slide abaixo inicia a aula com uma informação nova acerca do aprendizado de
máquina: a divisão entre o aprendizado supervisionado e o aprendizado não supervisionado,
duas facetas do aprendizado intuitivo, que parte de exemplos externos coletados de uma
base de dados.
No aprendizado supervisionado, os exemplos estão rotulados, isto é, a classe é conhe-
cida, enquanto que no aprendizado não supervisionado não existe uma classe associada.
No aprendizado supervisionado ocorrem problemas de regressão e classificação.
Os exemplos estão rotulados quando a saída é conhecida. Tratam-se de diversos atribu-
tos de entradas que resultam em uma saída (x1, x2, x3, xn = y1). Quando a classe de saída
é conhecida, tem-se o aprendizado supervisionado, quando não há exemplo de saída, então
há um problema de exemplos que não são rotulados.
Seguindo o exemplo do classificador de pessoas, o modelo que possui a saída esperada
com base nas informações de uma pessoa que já recebeu crédito no passado, tem-se o
aprendizado supervisionado. Contudo, quanto não se tem tais informações acerca dos pre-
cedentes dessa pessoa, então o aprendizado não é supervisionado, pois os exemplos ofer-
tados, apesar de pautadas em determinada realidade, não constituem uma definição acerca
da pessoa em questão.
5m
ANOTAÇÕES
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Aprendizado de Máquina
Aprendizado de Máquina
Indutor: Programa que gera uma hipótese (classificador) a partir de um conjunto de exemplos.
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Domínio:
– Conjunto de valores que um atributo pode assumir.
• Classe:
– Atributo especial que descreve o fenômeno de interesse (somente no Aprendizado
Supervisionado).
• Tipos de atributo:
– Nominal (ou discreto ou categórico), quando o atributo assume valores em um con-
junto finito, sendo que alguns indutores podem também aceitar uma subdivisão entre
os atributos nominais:
15m
– Ordenado: o domínio é ordenado, mas a diferença absoluta dos valores é des-
conhecida (ex.: escala de temperatura: baixa, média, alta ou severidade de um
machucado).
– Não ordenado: não existe uma ordem entre os valores (ex.: cor: vermelho, verde,
azul; ocupação; estado civil, raça).
– Contínuo (ou numérico ou real), quando o domínio é ordenado e pode ser represen-
tado por um valor real (ex.: peso um número real).
• Tipos de atributo:
• Desconhecido ou faltante.
• Não se aplica: quando a informação não faz sentido em determinado contexto.
• Atributos relevantes e irrelevantes: certas informações podem influenciar conside-
ravelmente a depender do contexto e outras informações não. A cor de uma fruta em
uma foto, por exemplo, pode ser essencial para identificá-la, diferentemente do que
aconteceria com a data em que a foto foi tirada.
ANOTAÇÕES
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ATENÇÃO
Durante a modelagem dos dados, a dimensionalidade pode fazer com que o excesso de
atributos em um modelo o torne ineficiente.
20m
Conjunto de exemplos:
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
O conjunto de exemplos é introduzido no indutor para prever a classe a partir dos dados
fornecidos e devolver o valor de um rótulo.
25m
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Introdução II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
O erro real, por outro lado, ocorre quando o indutor é treinado com um conjunto de dados
de treinamento e testa o indutor com um conjunto de teste, que não passou pelo treinamento.
Dessa forma, torna-se possível encontrar a taxa de erro verdadeira do classificador.
Em outros termos, a seleção de 500 exemplos de pessoas aprovadas em concurso inse-
ridas é feita, separando-se 400 casos para serem introduzidos no indutor e outros 100 casos
para utilizar como teste no classificador. Dessa forma, é possível observar a saída com taxa
de erro verdadeira.
30m
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Introdução III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
INTRODUÇÃO III
Aprendizado de Máquina
• Classificador:
– Dado um conjunto de treinamento, um indutor gera como saída um classificador
(hipótese ou descrição de conceito) de forma que, dado um novo exemplo, ele possa
predizer precisamente sua classe.
– Cada exemplo é um par (x, f(x)), onde x é a entrada e f(x) é a saída (f desconhecida!).
– se y=f(x) assume valores discretos y ∈ {C1, C2,…,Ck}: classificação.
– se y=f(x) assume valores reais: regressão.
– Indução ou inferência indutiva: dada uma coleção de exemplos de f(·), retornar
uma função h(·) que aproxima f(·), ou seja, h(x) ≅ f(x).
O classificador é criado para simular a função de f(x). O classificador gera uma função
equivalente à função que está aprendendo.
Aprendizado de Máquina
Classificador:
A função F(x), dentre as opções abaixo, é o exemplo (b), pois é possível identificar todos
os elementos presentes no espaço bidimensional para a classificação. Contudo, diversas
funções diferentes podem ser utilizadas para representar F(x).
5m
O melhor classificador é aquele que mais se aproxima da função real.
ANOTAÇÕES
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Introdução III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Bias: qualquer critério de preferência de uma hipótese sobre outra (além da consistên-
cia com os exemplos).
• Um indutor é instável se uma pequena perturbação (variação) no conjunto de treina-
mento pode causar modificação no classificador gerado.
• Um indutor é estável se o classificador gerado não muda muito caso os exemplos de
treinamento se alterem.
• Há sempre um trade-off entre bias e variância:
– indutores instáveis, em geral, geram classificadores com alta variância mas com
pequeno bias.
– indutores estáveis, em geral, geram classificadores com baixa variância, mas com
alto bias.
Overfitting (overtraining):
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Introdução III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
O gráfico acima mostra uma área enfatizada que representa um conjunto extremamente
específico gerado pela repetição do conjunto de treinamento, o que pode acarretar em erros
quando as variáveis divergirem da hipótese induzida.
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Introdução III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Nos primeiros dois conjuntos (a) e (c), os desempenhos são perfeitos, enquanto que os
modelos incompletos revelam certas inconsistências.
• Aprendizado Supervisionado:
– Compreender o relacionamento entre os atributos e a classe.
– Predizer a classe de novos exemplos o melhor possível.
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Introdução III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Aprendizado Supervisionado:
Neste caso, qualquer resultado pode ser obtido com base nos dados ofertados para
o indutor.
ANOTAÇÕES
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Introdução III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
O exemplo acima mostra o modelo preditivo gerado pelo sistema supervisionado, que
permite ao modelo entender o que é um pato a partir dos exemplos dados e identificar uma
imagem diferente de um pato por já conseguir identificar os padrões ofertados. O segundo
exemplo mostra um resultado incerto ofertado pelo modelo não supervisionado, que não
busca trabalhar com uma previsão, mas apenas descreve os dados ofertados.
25m
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Métricas de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
MÉTRICAS DE CLASSIFICAÇÃO
APRENDIZADO DE MÁQUINA
Matriz de Confusão
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Métricas de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Métricas de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Observa-se que se pode colocar o valor previsto e o valor verdadeiro no eixo x ou y, sem
afetar os resultados.
10m
Métricas
• Verdadeiro positivo (VP): quando o método diz que a classe é positiva e, ao verificar a
resposta, vê-se que a classe era realmente positiva;
• Verdadeiro negativo (VN): quando o método diz que a classe é negativa e, ao verificar
a resposta, vê-se que a classe era realmente negativa;
• Falso positivo (FP): quando o método diz que a classe é positiva, mas ao verificar a
resposta, vê-se que a classe era negativa;
• Falso negativo (FN): quando o método diz que a classe é negativa, mas ao verificar a
resposta, vê-se que a classe era positiva.
15m
A acurácia avalia o percentual de acertos, ou seja, ela pode ser obtida pela razão entre
a quantidade de acertos e o total de entradas:
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Métricas de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Em outras palavras, é a relação entre o que o modelo realmente acertou e o que o modelo
classificou como positivo, tendo acertado ou não.
A revocação (sensibilidade ou recall) é uma métrica que indica, das amostras positivas
existentes, quantas o modelo conseguiu classificar corretamente.
Verdadeiros Positivos = 80, Falsos Positivos = 10.
Navalha de Occam
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Métricas de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Maldição da Dimensionalidade
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
DIRETO DO CONCURSO
1. (FGV/2021/TJ-RO/ANALISTA JUDICIÁRIO/ANALISTA DE SISTEMA/DESENVOLVI-
MENTO DE SISTEMA) A Inteligência Artificial (IA) apoia o desenvolvimento de soluções
tecnológicas capazes de realizar atividades similares às capacidades cognitivas huma-
nas. Como exemplo, a plataforma Sinapses, desenvolvida pelo Tribunal de Justiça do
Estado de Rondônia (TJRO) e adaptada para uso nacional, gerencia o treinamento su-
pervisionado de modelos de IA. Em soluções de IA, a tecnologia que possui a capacida-
de de melhorar o desempenho na realização de alguma tarefa por meio da experiência
usando dados de treinamento, podendo ser supervisionado ou não, é o(a):
a. Motor de Inferência (Inference Engine) de Sistemas Especialistas (Expert Systems);
b. Raciocínio Automatizado (Automated Reasoning);
c. Compreensão de Linguagem Natural (Natural-Language Understanding);
d. D Representação do Conhecimento (Knowledge Representation) usando Lógica de
Primeira Ordem (First Logic Order);
e. Aprendizado de Máquina (Machine Learning).
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
d. 1781.
e. 1782.
RESOLUÇÃO
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
Quanto mais verdadeiros legumes, verdadeiras hortaliças e verdadeiras frutas houver no
modelo, mais o modelo está acertando.
RESOLUÇÃO
Obs.: caberia recurso, porque o ideal seria arredondar o 0,909 para 0,91, não para 0,90.
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
RESOLUÇÃO
Com base na tabela:
VP = 8;
FN = 2;
FP = 4;
VN = 6.
Começando com a acurácia:
15m
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
Se há alguém supervisionando e trazendo informações, trata-se de classificação supervi-
sionada; se não, é classificação não supervisionada.
I. Não existe relação entre as classificações.
II. É uma espécie de cluster.
III. No agrupamento, que é método não supervisionado, não há rótulos: o próprio sistema
atribui os exemplos em classes, sem conhecimento dos rótulos. Porém, é possível que, no
conjunto de validação, o programador conheça os rótulos para verificar se o agrupamento
foi bem ou não.
IV. No método de K-médias, as classes não têm valor médio.
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
seu desempenho medido e melhorado por meio dos erros e de acertos decorrentes da
experiência de detecção.
20m
COMENTÁRIO
Aprender com experiência significa que a máquina é treinada com um conjunto de dados e
fica experiente nesse conjunto, de modo que é capaz de fazer previsões em um conjunto
de dados que ela não conhece.
COMENTÁRIO
Árvore de decisão é supervisionada; agrupamento e regras de associação não são super-
visionados.
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
Underfitting é quando a máquina não é treinada o suficiente e, por isso, o sistema come-
te erros.
25m
Overfitting, por outro lado, é quando se treina demais; no entanto, se o sistema deve avaliar
um conjunto de dados ao qual ele não teve acesso anteriormente, ele erra.
ANOTAÇÕES
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Questões de Concurso e Introdução à Aprendizagem de Máquina
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
GABARITO
1. e
2. e
3. c
4. E
5. c
6. d
7. b
8. C
9. c
10. b
11. d
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
APRENDIZADO DE MÁQUINA
CLASSIFICAÇÃO E ÁRVORES DE DECISÃO
Classificação
Um problema de classificação tem um valor discreto como saída. Utilizando como exem-
plo os dados abaixo, em que o tributo é a idade, e a classificação é se a pessoa gosta de
abacaxi na pizza ou não: é atribuído 1 para quem gosta de abacaxi na pizza, e 0 para quem
não gosta. Jogando esses dados em um problema de classificação, o modelo vai dizer se a
pessoa gosta ou não de abacaxi na pizza a partir de sua idade.
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Assim, em classificação, tem-se valor discreto na saída; é uma classe, um valor não con-
tínuo, um ABC, um 0 ou 1. Atribui-se um objeto/evento a uma categoria, pertencente a um
conjunto finito de categorias.
Alguns exemplos de algoritmo de aprendizagem de máquina de classificação já comuns
na literatura e utilizados no dia a dia:
Exemplos de Classificadores:
• Árvore de Decisão;
5m
• Random Forest;
• k-Nearest Neighbor;
• Naïve Bayes;
• Regressão Logística;
• Análise Discriminante Linear;
• SVM (Support Vector Machines);
• RNA (Redes Neurais Artificiais) – esta merece maior atenção, por ser a mais conhe-
cida e a mais é cobrada em concursos.
ANOTAÇÕES
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
DIRETO DO CONCURSO
1. (CESPE/2018/POLÍCIA FEDERAL/AGENTE DE POLÍCIA FEDERAL) Julgue o item que
segue, relativo a noções de mineração de dados, big data e aprendizado de máquina.
Situação hipotética: Na ação de obtenção de informações por meio de aprendizado de
máquina, verificou-se que o processo que estava sendo realizado consistia em exami-
nar as características de determinado objeto e atribuir-lhe uma ou mais classes; verifi-
cou-se também que os algoritmos utilizados eram embasados em algoritmos de apren-
dizagem supervisionados.
Assertiva: Nessa situação, a ação em realização está relacionada ao processo de
classificação.
COMENTÁRIO
A classificação é um processo de aprendizagem supervisionado em que são analisadas as
características de determinado objeto para atribuir-lhe um ou mais rótulos (classes).
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
a. Não está relacionado à classificação.
b. K-Prototypes é um algoritmo de agrupamento.
c. A classificação é supervisionada.
d. Essa métrica não está relacionada à classificação.
COMENTÁRIO
a. Regras de associação são não supervisionadas.
b. Bubble sort é algoritmo de ordenação.
c. Clusterização é não supervisionada.
e. Formulação não é parte dessa matéria.
ÁRVORE DE DECISÃO
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Raiz: é a primeira decisão a ser tomada pelo usuário. A partir dela as pessoas são redi-
recionadas a outras decisões, de acordo com sua escolha nessa questão;
• Nós: são todas as decisões apresentadas ao longo da árvore;
• Folhas: são os resultados da árvore de decisões. A classificação é realizada nas folhas.
10m
ATENÇÃO
Não é cobrada em concursos a construção matemática por trás de uma árvore de decisão.
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
É importante notar que as folhas não estão apenas ao fim das árvores. Alguns galhos
da árvore são mais complexos e necessitam de mais decisões para chegar à classificação,
enquanto outros, mais simples, permitem chegar a ela mais rapidamente.
Em resumo, a árvore de decisão é um método de classificação com diversas tomadas de
decisão até chegar na classificação. Essas árvores dividem o espaço de características em
eixos paralelos retangulares e rotulam cada retângulo com uma classe.
Podem ser reescritas como um conjunto de regras, por exemplo, em forma normal disjun-
tiva (DNF) e, por isso, pode ser lida:
– red ^ circle → pos
green → pos
– red ^ circle → A
blue → B; red ^ square → B
green → C; red ^ triangle → C
ANOTAÇÕES
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Atributos contínuos podem ser usados, fazendo o nó dividir o domínio do atributo entre
dois intervalos baseados em um limite (ex.: tamanho < 3 e tamanho ≥ 3). Além disso, não é
preciso normalizar os dados para que sejam utilizados nas árvores, diferentemente do que é
feito nas redes neurais artificiais.
15m
As árvores de classificação têm valores discretos nas folhas, pois é onde fica a classifica-
ção; as árvores de regressão têm valores reais nas folhas.
Algoritmos para encontrar árvores consistentes são eficientes e podem processar gran-
des quantidades de dados de treinamento. Quanto mais dados de treinamento a árvore de
decisão tiver, melhor ela será.
Como dito anteriormente, as árvores de decisão não necessitam de manipulação de
dados (exemplo: métodos de normalização). Alguns conceitos são de difícil aprendizagem
em árvores de decisão, gerando árvores extremamente grandes ‒ por exemplo, XOR, que
resulta em um valor lógico verdadeiro se e somente se os dois operandos forem diferentes;
ou seja, se um for verdadeiro e o outro for falso. As árvores não são tão boas para trabalhar
dados não lineares; elas funcionam, mas ficam gigantescas.
A maioria dos algoritmos de aprendizagem de árvores derivam do algoritmo ID3:
Algoritmo Básico
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Overfitting
Quando mais nódulos forem colocados na árvore, melhor fica o treinamento, e a acurácia
se aproxima de 1. Porém, enquanto o conjunto de treinamento melhora, o conjunto de teste
se estabiliza e, então, se deteriora. Isso acontece, porque a árvore de decisão vai apren-
dendo e criando nós, crescendo, de acordo com o conjunto de treinamento – que, geral-
mente, não representa o conjunto de exemplos por completo.
Quando se adicionam exemplos aos quais a árvore de decisão não teve acesso, ela
começa a errar a classificação na medida em que ela se especializa no conjunto de treina-
mento. Isso resulta em overfitting.
• Pré-Poda: parar de crescer a árvore quando não há mais dados suficientes para fazer
previsões confiáveis (ou seja, quando o conjunto de testes começar a dar errado);
• Pós-Poda: constrói-se a árvore toda, mas só vai funcionar com o treinamento, e depois
são removidas as sub-árvores com menos relevância, ou seja, com mais erros.
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Testes Estatísticos: usa o teste para determinar se a regularidade observada foi devida
ao acaso, ou se aquele pedaço de árvore, de maneira relevante e estatisticamente
comprovada, piora o modelo;
• Comprimento da Descrição Mínima (MDL): determina se a complexidade adicional da
hipótese é mais complexa que lembrar explicitamente as exceções resultantes da poda.
DIRETO DO CONCURSO
4. (IADES/2018/SES – DF/ANALISTA DE SISTEMAS) A árvore de decisão apresentada é
utilizada para decidir se a compra de um notebook deve ser realizada ou não. De acor-
do com essa árvore de decisão, qual perfil resultaria em uma indicação positiva quanto
à compra do computador?
a. Jovem estudante.
b. Jovem estudante sem emprego fixo.
ANOTAÇÕES
www.grancursosonline.com.br 9
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
As indicações positivas são as que resultam em “sim”; há três “sim” nas folhas da árvore,
resultados das seguintes sequências: jovem, não estudante e com emprego fixo; pessoa de
meia-idade, com boa saúde e sem seguro de vida; e uma pessoa idosa com crédito razoável.
25m
COMENTÁRIO
b. A árvore de decisão não é uma tabela.
c. A árvore de decisão não é uma matriz.
d. Essa não é a principal característica da árvore.
www.grancursosonline.com.br 10
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
A entropia das árvores de decisão está ligada à quantidade de nós que cada árvore está
criando. É a quantidade de informação que está associada às respostas que podem ser
obtidas às perguntas formuladas, representando o grau de incerteza associado aos dados.
A entropia, então, é a incerteza relacionada ao conjunto de dados que é colocado na árvore
de decisão, e influencia diretamente a construção da decisão.
COMENTÁRIO
O algoritmo de construção de árvore trabalha minimizando a entropia dos dados: quanto
menos decisões necessárias, melhor.
8. (CESPE-CEBRASPE/2021/SERPRO/ANALISTA/ESPECIALIZAÇÃO: CIÊNCIA DE
DADOS) As árvores de decisão apresentam significativa independência dos dados de
treinamento, o que garante forte estabilidade dos caminhos em caso de mudanças
nos dados.
COMENTÁRIO
A árvore de decisão é criada de acordo com o conjunto de treinamento. Se esse conjunto
for mudado, a árvore criada será completamente diferente.
30m
ANOTAÇÕES
www.grancursosonline.com.br 11
APRENDIZADO DE MÁQUINA
Introdução à Classificação e Árvores de Decisão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
GABARITO
1. C
2. e
3. d
4. d
5. a
6. C
7. C
8. E
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 12
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ALGORITMOS DE CLASSIFICAÇÃO
Random Forest
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
DIRETO DO CONCURSO
(QUADRIX/2022/CRA-PR/ANALISTA SISTEMAS I) Com relação aos conceitos de
machine learning e deep learning, julgue o item.
Entre as técnicas de machine learning, a random forest é capaz de solucionar proble-
mas de classificação e de regressão, por meio da construção e dos treinamentos de
árvores de decisão.
k-Nearest Neighbors
KNN é um algoritmo que classifica novos dados com base em uma medida de similari-
dade entre seus “vizinhos” mais próximos, ou seja, aqueles que têm características seme-
lhantes às suas.
Nesse método, utiliza-se a distância (usualmente a Euclidiana) entre uma nova observa-
ção e as demais observações de um training set para observação mais próxima. .
5m
abaixo, é possível observar exemplos com duas variáveis de dois atributos, em que os
vermelhos são da classe vermelha e os azuis da classe azul. Com isso, classifica-se um
novo elemento com base numa medida de similaridade entre os seus vizinhos. Esse novo
elemento é representado pelo quadradinho cinza.
Por sua vez, dependendo da medida de similaridade que se utilizará, será possível ava-
liar de qual dos atributos (vermelho ou azul) o quadrado cinza está mais próximo.
Nesse método, geralmente se utiliza a distância euclidiana, que é aquela distância repre-
sentada no gráfico pelas linhas cinzas. Já o “k” determina o número de vizinhos que serão
utilizados para a classificação. Em suma, o KN consiste em plotar um conjunto de dados de
treinamento no espaço dimensional onde se sabe qual é a classe de cada um. No exemplo
ANOTAÇÕES
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Sendo k igual a 2, o quadrado cinza é da classe azul. Caso k seja igual a 5, ele migra para
a classe vermelha. Agora observe nas próximas imagens a confirmação do que foi dito sobre
essa migração de classe do k de acordo com os diferentes valores que ele pode possuir.
ANOTAÇÕES
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
O elemento que acabou de ser inserido na base treinamento será roxo. Isso porque dos
três mais próximos dele dois são roxos.
Nessa imagem acima, sendo o k igual a 3, o elemento vermelho será roxo. Já se o k for
igual a 6, o vermelho se torna amarelo. Portanto, esta é a ideia do K-NN: constrói-se um
espaço dimensional e, de acordo com o número de variáveis, plota-se todos os elementos
de treinamento, de modo que cada um terá sua classe definida (roxo, amarelo, azul, etc). .
10m
A partir disso, plota-se novos elementos no espalho n dimensional, verificando quais são os
vizinhos mais próximos.
DIRETO DO CONCURSO
1. (CESGRANRIO/2021/BANCO DO BRASIL/AGENTE DE TECNOLOGIA) Um pesqui-
sador conseguiu uma base de dados que mostrava terrenos classificados de acordo
com: características físicas; tipo de negócio a ser nele implantado; risco esperado, que
compreendia os rótulos alto, médio, baixo ou nenhum. Decidiu, então, usar um algo-
ANOTAÇÕES
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
• Letra a: É um algoritmo que se utiliza para reduzir principalmente a dimensionalidade.
• Letra d: É um algoritmo mais de agrupamento.
• Letra e: É uma rede neural artificial não supervisionada que é utilizada para problemas
de agrupamento.
COMENTÁRIO
Pode-se classificar os classificadores em paramétricos e não paramétricos. Isso não tem
nada a ver com o número de parâmetros e sim com a função que eles irão mapear. Nes-
se sentido, se um classificador utiliza uma função majoritariamente para classificar que
já existe no mercado, ele é paramétrico. Então, a regressão logística é um classificador
paramétrico e se comporta como uma função. Já se o classificador não se comporta como
uma função, ele é não paramétrico. .
15m
Por serem não lineares, a maioria dos algoritmos de classificação exprimem funções que
não são possíveis de serem expressas por meio de uma equação.
ANOTAÇÕES
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
• Imputar dados é inserir dados onde se eles estão faltantes.
• Mesmo existindo variações, a principal função de distância é a euclidiana.
• Posto isso, a escolha da função de distância pode influenciar significativamente nos re-
sultados da imputação.
20m
Naive Bayes
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Teorema de Bayes:
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Ou seja, duas pessoas a cada dez mil que chegam no consultório tem meningite. Veja
que a probabilidade de meningite que uma pessoa que chega no consultório é de 1 a cada
50.000. Porém, se a pessoa já chega reclamando de torcicolo, a chance é dez vezes maior
da pessoa ter meningite. .
25m
Assim, pega-se todos os outros atributos para calcular as probabilidades condicionais de
cada um dos sintomas. A partir disso, junta-se todas essas probabilidades no classificador
para se obter a probabilidade final da pessoa ter meningite.
O nome dele é Naive Bayes porque ele faz duas suposições ingênuas:
Por exemplo: a cor da casca de uma fruta sendo vermelha, a chance do outro atributo
(interior) ser amarela é grande. Logo, dado que uma fruta é vermelha por fora, a probabili-
dade do interior da fruta ser amarela é alta. Assim, existe uma dependência entre esses dois
atributos no classificador de fotos de fruta.
De todo modo, mesmo sabendo que essa é uma suposição ingênua, Bayes fez a propo-
sição de que os atributos de um conjunto de dados não dependem um do outro.
• Cada evento contribui igualmente para classificar o resultado. (Isso quer dizer que
cada exemplo que se utiliza tem o mesmo poder de classificação. Ou seja, eles ajudam
igualmente na classificação).
ANOTAÇÕES
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Prevê uma tabela de probabilidades condicionais e depois calcula a saída com base
nessa tabela. .
30m
DIRETO DO CONCURSO
4. (CESPE/CEBRASPE/2021/SEFAZ-CE/AUDITOR FISCAL DE TECNOLOGIA DA
INFORMAÇÃO DA RECEITA ESTADUAl) A classificação Naive Bayes parte da supo-
sição de que as variáveis envolvidas em machine learning são independentes entre si.
COMENTÁRIO
Não é necessário um conjunto gigante de amostras para conseguir realizar o treinamento
de um modelo usando o classificador de Naive Bayes.
ANOTAÇÕES
www.grancursosonline.com.br 9
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
Entropia é uma característica das árvores de decisão.
GABARITO
1. C
2. b
3. C
4. C
5. C
6. d
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 10
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Uma Rede Neural Artificial consiste em uma estrutura conexionista, na qual o pro-
cessamento é distribuído por um grande número de pequenas unidades densamente
interligadas.
• A habilidade das redes neurais em realizar mapeamentos não lineares entre suas entra-
das e saídas as tem tornado prósperas no reconhecimento de padrões e na modela-
gem de sistemas complexos.
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Por exemplo, em vez de o auditor ir pessoalmente, cria-se uma rede abastecida com
fotos de satélite. A rede neural ia absorvendo as experiências, aprendendo e se tornava
capaz analisar sozinha se a obra foi feita ou não.
5m
– Classificação de padrões de escrita e fala.
– Reconhecimento de faces com visão computacional.
– Sistemas de controle e previsão financeira.
– Identificaçãode anomalias e patologias na área médica com base em imagens.
– Controle automatizado de equipamentos eletrônicos.
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Na maioria das aplicações, usa-se uma rede feed-forward com uma única camada escon-
dida e com função de ativação sigmóide nos neurônios da camada escondida e com função
de ativação linear nos neurônios da camada de saída.
ANOTAÇÕES
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Assim, de uma forma que resuma os tipos acima, eles são capazes de receber informa-
ções sem organização e organizá-las numa saída.
• Método do gradiente descendente: ajusta os parâmetros das redes para melhor adaptar
um conjunto de treinamento de pares entrada – saída.
• Taxa de aprendizado (learning rate): indica a que ritmo os pesos são atualizados. Isso
pode ser fixado ou alterado de modo adaptativo. O método atual mais popular é cha-
mado Adam, o qual é um método que adapta a taxa de aprendizado.
20m
• Quando devemos parar o treinamento, i.e. parar de atualizar os pesos?
• Escolha óbvia: continuar o treinamento até que o erro seja menor do que um valor
préestabelecido.
• Porém, isto implica em sobre ajuste (overfitting)!!!
ANOTAÇÕES
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Curiosidade
O site de busca Google também usa rede neural. Lá, a rede estava tão competente que
começou a “pensar” como humano. Assim, o sistema de autopreenchimento começou a com-
pletar a busca com frases racistas, homofóbicas e pornográficas, uma vez que essas áreas
causam satisfação em certos grupos humanos. Visto isso, foi necessário fazer intervenções.
25m
• Mínimos Locais:
– O treinamento é um processo de otimização por gradiente em uma superfície.
– Nesta superfície existem “vales” com menor profundidade que outros; estes são os
mínimos locais, e não representam a melhor solução.
– O algoritmo backpropagation pode permitir a entrada em um mínimo local, não permi-
tindo que se encontre a melhor solução do problema mapeado pela rede.
ANOTAÇÕES
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Algoritmos de Classificação III
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Observe que a bolinha sai e retorna alimentando as outras bolinhas. Essa rede neural foi
criada e teve sucesso na relação de séries temporais. Observa-se a relação da informação
ao longo do tempo.
ANOTAÇÕES
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Markov Chain
Essa rede visa identificar padrões em imagens e vídeos. Além disso, ela entra no con-
texto de Deep learn. Que é um aprendizado de máquina mais aprofundado.
ANOTAÇÕES
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• RedeNeural Convolucional
– Por essas características, a aplicação mais comum das CNNs é na classificação
de imagens.
– Os filtros acentuam atributos dos objetos necessários à sua correta classificação.
– Uma CNN especializada em classificar rostos, por exemplo, nas primeiras cama-
das reconhece contornos, curvas e bordas; mais adiante, usa essa informação para
reconhecer boca, olhos, orelha e nariz; e no final, reconhece o rosto inteiro.
– Além de imagens, qualquer informação com regularidade local pode se beneficiar do
uso de CNNs, como áudio por exemplo.
ANOTAÇÕES
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
RELEMBRANDO
O aprendizado não supervisionado não possui o rótulo e a classificação para fazer o trei-
namento dos dados. Se abastece o sistema e o algoritmo, deve realizar o agrupamen-
to sozinho.
– Quando um neurônio é excitado, o seu redor, uma área entre 50 e 100 μm, também
sofre excitação e, a partir desta distância, sofre inibição, de forma a impedir a propa-
gação do sinal a áreas não relacionadas.
– Os neurônios de saída da RNA competem entre si para serem ativados, onde apenas
um neurônio de saída (ou um neurônio por grupo) está “ligado” a qualquer instante.
– O neurônio vencedor define uma vizinhança topológica (em função da grade) de
neurônios excitados.
– Ela usa aprendizado competitivo para classificar os dados sem supervisão.
15m
– Os dados de entrada são comparados com os valores dos neurônios (inicializados
aleatoriamente) por meio de uma métrica de similaridade, e as conexões que repre-
sentam maior similaridade são fortalecidas.
ANOTAÇÕES
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Uma rede SOM funciona com vários neurônios posicionados no espaço, conforme
imagem abaixo:
DIRETO DO CONCURSO
1. (CESPE/MPOG/TECNOLOGIA DA INFORMAÇÃO/2013) As redes neurais são sistemas
computacionais embasados em codificação do conjunto das possíveis soluções, e não
nos parâmetros de otimização; para relacionar cada caso a uma categoria, entre as
várias categorias existentes, elas utilizam regras.
20m
COMENTÁRIO
A rede neural artificial é não linear, ou seja, não há a utilização de regras de classificação.
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
A questão estabelece a relação com NEURÔNIOS humanos, portanto, é a rede NEURAL.
COMENTÁRIO
Embora o gabarito seja simples, convém entender a questão como uma afirmação acerca
do tema, sendo, assim, informações a respeito das redes neurais.
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
b) Não existe essa disposição em duas redes simétricas. Há uma entrada de dados, uma
função de ativação e uma saída.
c) É o contrário, as RNA é que são construídas por perceptrons.
d) Conjunto de algoritmos não.
e) Utiliza-se, na verdade, o gradiente do erro.
25m
COMENTÁRIO
Imagine o gráfico com o erro x o treinamento.
Erro
T
Conforme acontecem treinamentos, o erro vai diminuindo. Por sua vez, o conjunto de va-
lidação também diminui, mas em um momento ele cresce, a partir do ponto de overfitting
(treino em excesso com os mesmos dados).
Val
Erro
Train
T
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Tipos de Redes Neurais e Questões
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
O correto é dizer que a saída dos neurônios volta para as camadas anteriores.
GABARITO
1. E
2. c
3. e
4. a
5. E
6. C
7. C
8. E
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Funções de Ativação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
FUNÇÕES DE ATIVAÇÃO
A função de ativação é uma função matemática que decide se um neurônio será ativado
ou não. É responsável por receber os números que chegam aos dendritos do neurônio, pro-
cedimento seguido pela saída pelo axônio. Tal entrada de dados, geralmente, apresenta
diversos números que passam por um somatório. O valor que adentra a função de ativação,
um número x, passa pela função de ativação e gera o valor de saída y, alimentando o próximo
neurônio ou a própria saída da rede neural. Ocorre uma transformação não linear da entrada
em saída, uma vez que informações são sumarizadas, gerando o valor de saída.
• Função limiar: caso o valor de entrada seja negativo, a saída do neurônio é igual a zero;
caso o valor de entrada seja positivo, a saída do neurônio é igual a um.
ANOTAÇÕES
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Funções de Ativação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Função linear: aplica um fator de multiplicação ao valor que recebe. Neste caso, o
neurônio só não será ativado caso o valor recebido seja 0:
– f(x) = ax
5m
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Funções de Ativação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Trata-se de uma função que permite a entrega de valores intermediários entre 0 e 1 como
saída da ativação de seu neurônio.
• Função softmax: Softmax é uma generalização da função sigmóide para casos não biná-
rios. É aplicada na camada de saída caso exista mais de uma classificação possível
para a saída do conjunto de dados, ou seja uma saída não binária.
– A função softmax recebe como entrada um vetor z de K números reais e o normaliza
em uma distribuição de probabilidade que consiste em K probabilidades proporcio-
nais aos exponenciais dos números de entrada.
• Função Gaussiana: função radial, isto é, função utilizada para desfoque radial de ima-
gens típica usada majoritariamente em redes RBF (função de base radial). A depender
de seus parâmetros, pode atribuir diversos tamanhos.
ANOTAÇÕES
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Funções de Ativação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Além da Sigmóide, pode-se fazer uso das funções Tangente, ReLU (caso a entrada seja
0, terá saída de 0, assim como para outros números, cuja saída será equivalente ao valor de
entrada) e Leaky ReLU.
ANOTAÇÕES
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Funções de Ativação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ATENÇÃO
A função de ativação, inserida no neurônio, recebe dados e os converte em uma saída
única, que é a ativação ou não do neurônio. Uma vez ativado, o neurônio resultará em um
número que entrará na próxima camada da rede neural (ou a saída da rede neural), caso
contrário, resultará em 0. Neurônios não ativados são importantes para a camada de saída,
que permite uma classificação assertiva a partir dos exemplos fornecidos na entrada.
10m
DIRETO DO CONCURSO
1. (FGV/PREFEITURA DE NITERÓI-RJ/ANALISTA DE POLÍTICAS PÚBLICAS E GESTÃO
GOVERNAMENTAL/GESTÃO DE TECNOLOGIA/2018) No contexto das redes neurais,
é comum o uso da função sigmóide no papel de função de ativação. Assinale a defini-
ção correta dessa função na referida aplicação.
a. .
b. .
c. .
d. .
e. .
ANOTAÇÕES
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Funções de Ativação
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
A função sigmóide é a mais cobrada em concursos.
COMENTÁRIO
O peso e o valor de entrada multiplicados são somados e inseridos na função de ativação,
que, provavelmente, diminuirá a entropia de dados e resultará em 0 ou 1, minimizando o
problema relacionado aos pesos da rede neural, especialmente se tratando de uma fun-
ção degrau.
15m
GABARITO
1. e
2. C
3. E
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
REGRESSÃO
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Regressão Linear
Principal ferramenta de regressão é denominada dessa forma por ser uma reta traçada a
partir de uma relação em um diagrama de dispersão. Essa reta resume uma relação entre os
dados de duas variáveis e também pode ser utilizada para realizar previsões.
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Resíduo e Erro
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
As correlações podem ser positiva (r maior que 0) e negativa (r menor que 0). A corre-
lação negativa representa o aumento da variável independente e a diminuição da variável
dependente.
ANOTAÇÕES
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ATENÇÃO
Nas questões de regressão, estima-se um número que seja o resultado de uma previsão
a partir da entrada de um conjunto de dados x. Para isso, o algoritmo mais utilizado é a
regressão linear, ou seja, com a construção de uma reta que funciona como um modelo,
atribuindo um novo x para descobrir o valor y. Calcula-se a, a inclinação da reta, e b, o al-
cance da reta no eixo y.
DIRETO DO CONCURSO
1. (CESGRANRIO/2018/BANCO DO BRASIL/ESCRITURÁRIO) Para ilustrar a importân-
cia da análise gráfica em análises de regressão linear, F. J. Anscombe produziu quatro
conjuntos de pares (x, y) a partir das mesmas estatísticas suficientes, como: coeficien-
tes linear e angular; soma dos quadrados dos resíduos e da regressão; e número de
observações. Os diagramas de dispersão para as quatro bases de dados, juntamente
com a reta da regressão (y = 4 + 0,5 x), encontram-se abaixo.
ANOTAÇÕES
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
Os outliers devem ser excluídos ao se trabalhar com regressão linear, dado que podem
introduzir erros nas análises.
20m
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Regressão
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
GABARITO
1. d
2. d
3. a
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ALGORITMOS DE AGRUPAMENTO
CLUSTERIZAÇÃO
A primeira imagem introduz variadas formas geométricas com diferentes traços em seus
interiores, representando o conjunto de dados de treinamento. Ao sofrer o processo de cluste-
rização, aprendendo os dados inseridos, a máquina poderá agrupar os dados conforme suas
correspondências, representado pelos quatro grupos distintos formados na segunda imagem.
ANOTAÇÕES
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Grupo é um conceito subjetivo, uma vez que varia conforme a perspectiva de identificação:
Desta forma, é possível classificar, por exemplo, os mesmos animais em grupos diferen-
tes a partir de uma classificação distinta:
ANOTAÇÕES
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ATENÇÃO
A clusterização nada mais é do que o agrupamento de um conjunto de dados, organizados
em clusters.
Ao agrupar, deve-se considerar duas distâncias: a interna, a distância entre cada um dos
elementos do próprio agrupamento, e a externa, que separa um agrupamento de outro.
5m
Seleção de Atributos
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Os atributos devem ter também uma redundância mínima entre eles, uma vez que os
algoritmos de agrupamentos, via de regra, são sensíveis ao impacto que os dados
exercem sobre a clusterização.
Medida de Proximidade
• Medida para quantificar quão similar ou dissimilar são dois vetores de atributos.
• É ideal que todos os atributos contribuam de maneira igual no cálculo da medida de
proximidade.
10m
• Um atributo não pode ser dominante sobre o outro, ou seja, é importante normali-
zar os dados.
Critério de Agrupamento
Algoritmo de Agrupamento
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
MEDIDAS DE DISSIMILARIDADE
• Métrica lp ponderada;
• Métrica Norma l∞ ponderada;
• Métrica l2 ponderada (Mahalanobis);
• Métrica lp especial (Manhattan); e
• Distância de Hamming.
MEDIDAS DE SIMILARIDADE:
• Métodos Hierárquicos;
• Métodos Particionais;
• Métodos Baseados em Densidade;
• Métodos Baseados em Grade;
• Métodos Baseados em Modelos;
ANOTAÇÕES
www.grancursosonline.com.br 5
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
www.grancursosonline.com.br 6
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Algoritmos de Particionamento
Algoritmos Hierárquicos
No caso concreto abaixo, há quatro grupos fruto do algoritmo hierárquico, que forma
grupos a partir da inserção de exemplos de treinamento.
ANOTAÇÕES
www.grancursosonline.com.br 7
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
Aglomerativos (Bottom-Up)
Divisivos (Top-Down)
• Atuam na direção oposta, isto é, eles produzem uma sequência de agrupamentos com
um número crescente de clusters a cada passo.
• Os agrupamentos produzidos em cada passo resultam da partição de um único clus-
ter em dois.
• Clusters são definidos como regiões densas, separadas por regiões menos densas
que representam os ruídos.
• Algoritmos Baseados em Grade.
• Usam uma estrutura de dados em grade de multiresolução.
www.grancursosonline.com.br 8
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
• Os métodos de clusterização baseados em Lógica Fuzzy são métodos não ‘hard’, que
permitem associar um indivíduo a todos os clusters usando uma função de pertinên-
cia. Sendo assim, se um elemento está na fronteira, poderá fazer parte da direita ou
esquerda, a depender do algoritmo aplicado.
• A Lógica Fuzzy apresenta algoritmos com partições etéreas, com bordas menos
definidas.
Têm suas raízes no método de clusterização ART (Teoria Ressonante Adaptativa) ou nos
Mapas Auto Organizáveis de Kohonen.
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
www.grancursosonline.com.br 9
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
ALGORITMOS DE AGRUPAMENTO II
K-Means
www.grancursosonline.com.br 1
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
DIRETO DO CONCURSO
1. (CESPE/CEBRASPE/2021/POLÍCIA FEDERAL/ESCRIVÃO DE POLÍCIA FEDERAL)
Acerca dos conceitos de mineração de dados, aprendizado de máquina e bigdata, jul-
gue o próximo item.
www.grancursosonline.com.br 2
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
COMENTÁRIO
A proximidade intracluster é o fator decisivo para que elementos façam parte do mesmo
grupo, uma vez que a distância interna é menor se comparada à distância externa.
COMENTÁRIO
Em algoritmos de clusterização hierárquica, em que se tem dendrogramas, caracteriza-se
como bottom-up.
10m
COMENTÁRIO
Quanto mais distante um exemplo estiver, menor sua influência sobre a posição do cluster.
O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos;
cada observação pertence ao grupo mais próximo da média.
COMENTÁRIO
O ‘k’ se refere aos grupos, enquanto ‘n’ aos exemplos do conjunto de treinamento.
ANOTAÇÕES
www.grancursosonline.com.br 3
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
5. (CESPE/CEBRASPE/2013/SERPRO/ANALISTA/NEGÓCIOS EM TECNOLOGIA DA
INFORMAÇÃO) Com relação a datamining, datawarehouse, gerenciamento de conteú-
do, ambientes colaborativos e portais corporativos, julgue os próximos itens.
COMENTÁRIO
Sabe-se que um dos métodos de agrupamento é a Lógica Fuzzy, que permite que um ele-
mento esteja em mais de um grupo, dadas as fronteiras etéreas.
www.grancursosonline.com.br 4
APRENDIZADO DE MÁQUINA
Algoritmos de Agrupamento II
Viu algum erro neste material? Contate-nos em: degravacoes@grancursosonline.com.br
GABARITO
1. C
2. C
3. C
4. C
5. E
6. b
7. b
�Este material foi elaborado pela equipe pedagógica do Gran Cursos Online, de acordo com a aula
preparada e ministrada pelo professor Vitor Alexandre Kessler de Almeida.
A presente degravação tem como objetivo auxiliar no acompanhamento e na revisão do conteúdo
ministrado na videoaula. Não recomendamos a substituição do estudo em vídeo pela leitura exclu-
siva deste material.
ANOTAÇÕES
www.grancursosonline.com.br 5