Escolar Documentos
Profissional Documentos
Cultura Documentos
Marcilio Souto
DIMAp/UFRN
1
Motivação
2
O que é Aprendizado?
Memorizar alguma coisa
3
Aprendizado de Máquina
Principal preocupação
Construção de programas de computador que
melhoram seu desempenho por meio de experiência
4
Inferência Indutiva (1/2)
Indução
Um processo de raciocínio para uma conclusão sobre todos os membros de
uma classe por meio do exame de apenas uns poucos membros da classe
De maneira geral, raciocínio do particular para o geral
Por exemplo, se eu noto que:
Todos os pacientes com Déficit de Atenção atendidos em 1986 sofriam
de Ansiedade
Todos os pacientes com Déficit de Atenção atendidos em 1987 sofriam
de Ansiedade
...
Posso inferir logicamente que Todos os pacientes que sofrem de Déficit
de Atenção também sofrem de Ansiedade
Isto pode ser ou não verdade, mas propicia uma boa generalização
5
Inferência Indutiva (2/2)
6
Aprendizado de Máquina - uma definição
7
Aprendizado de Máquina - Exemplo (1/2)
8
Aprendizado de Máquina - Exemplo (2/2)
Navegação de um robô
9
Tipos de Aprendizado de Máquina (1/3)
Aprendizado Supervisionado
10
Tipos de Aprendizado de Máquina (2/3)
Aprendizado Não-Supervisionado
11
Tipos de Aprendizado de Máquina (3/3)
AM
Não-
Supervisionado
Supervisionado
k-means
Metódos Hierárquicos
SOM
Classificação Regressão
k-NN k-NN
Árvores de Decisão Adaline
Naive Bayes Multi-Layer Perceptron
Perceptron/Adaline
Multi-Layer Perceptron
12
Entrada: Conceitos, Instâncias, Atributos
Marcilio Souto
DIMAp/UFRN
13
Tópicos
Terminologia
O que é um Conceito?
Classificação, associação, agrupamento, previsão
numérica
O que é um exemplo?
Relações, flat files, recursão
O que é um atributo?
Nominal, ordinal, intervalar, razão
Preparação da entrada
ARFF, atributos, valores perdidos, ...
14
Terminologia
Componentes da Entrada
Conceitos
“Coisas” que podem ser aprendidas
Instâncias
Exemplos individuais e independentes de um conceito
Atributos
Medidas de características de uma instância
15
Terminologia - Exemplo (1/2)
Conceito
Instância
Atributos
16
Terminologia - Exemplo (2/2)
Atributos
g1 g 2 gj gN-
Instância 1gN Câncer
1
Instância Norma
2
Instância l
3
Instância i
Instância Câncer
m
17
O que é um Conceito?
18
O que é uma Instância?
Definições
Objeto a ser classificado, associado ou agrupado
Exemplo individual e independente do conceito a ser aprendido
Carecterizada por um conjunto pré-determinado de atributos
Entrada para o indutor (algoritmo ou esquema de aprendizado):
conjunto de instâncias ou conjunto de dados
Representado como uma única relação (flat file)
Forma bastante restrita de entrada
Não representa relações entre objetos
Forma mais comum para a maioria dos indutores
19
Instância - Exemplo: Árvore Genealógica
Peter =
Peggy Grace
=
Ray
M F F M
Anna Nikki
F F
20
Árvore Genealógica Representada como uma
Tabela
21
A Relação “irmã-de”
22
Relação Completa em uma Tabela
23
Geração de um flat file
Denormalização
Várias relações são usadas para formar apenas uma
Possível com qualquer conjunto finito de relações
Problemática: relacionamentos sem um número pré-
deteminado de objetos
Conceito de família nuclear
Fonecedor”
24
A Relação “ancestral-de”
25
Recursão
26
O que é um atributo?
27
Escala Nominal ou Categórica
28
Escala Ordinal
29
Escala Intervalar
40oF?
30
Escala de Razão
31
Para que tipos específicos de atributos?
32
Preparação da Entrada
33
O formato ARFF
%
% ARFF file for weather data with some numeric features
%
@relation weather
@data
sunny, 85, 85, false, no
sunny, 80, 90, true, no
overcast, 83, 86, false, yes
...
34
Tipos de Atributos no WEKA
“menor-que” e “maior-que”
Escala de razão se cálculos de disntâncias são
35
Valores Perdidos (Missing Values)
Incapazidade de mesuração
36
Valores Perdidos - Exemplo
37
Valores Imprecisos
38
Se familiarizando com os dados
39
Bibliografia
40
k-NN (k Vizinhos Mais Próximos)
Marcilio Souto
DIMAp/UFRN
41
k-NN (k Nearest Neighbor)
Algoritmo de aprendizado mais simples
Este algoritmo suponhe que todos os padrões (instâncias) são
pontos no espaço n-dimensional Rn
Os vizinhos mais próximos de um padrão são definidos em termos
da distância Euclidiana padrão
Seja um padrão x arbitrário descrito pelo vetor de características
<a (x), a (x),...,a (x)>, em que a (x) representa o valor do
1 2 n r
r-ésimo atributo de x, então a distância euclidiana entre xi e
xj
n
2
d xi , x j r 1
a r xi ar x j
42
k-NN (k Nearest Neighbor)
Algoritmo de Treinamento:
Para cada padrão de treinamento <x,f(x)>, adicione o