Escolar Documentos
Profissional Documentos
Cultura Documentos
LAMFO
Outline
1 Introduction
Aprendizagem
3 Generalização
4 Dilema Viés-Variância
Aprendizagem
Framework da Aprendizagem
Aprendizagem
A Prova
1 Função ideal
2 Disponibilidade dos dados
3 Objetivo
Tal como temos várias questões de provas anteriores e suas respos-
tas. Precisamos APRENDER o padrão e GENERALIZÁ-lo para a
prova. Essa nos dá perguntas nunca vistas antes, mas aprendemos
o padrão. O âmago da questão é sabermos responder as perguntas
novas da prova.
Aprendizagem
A Matemática da Aprendizagem
Aprendizagem
Desafios
Desafios
1 Dados com ruído
2 Amostra não representa a população
3 Algoritmo não generaliza bem
Aprendizagem
Desafios
Desafios
1 Dados com ruído → Temos que lidar
2 Amostra não representa a população → Estatística!
3 Algoritmo não generaliza bem → Overfitting
Outline
1 Introduction
Aprendizagem
3 Generalização
4 Dilema Viés-Variância
Aprendizagem Estatística
Aprendizagem Estatística
CUIDADO
Aprendizagem Estatística
Desigualdade de Hoeffding
P [|Ein (h) − Eout (h)| > ] ≤ 2 exp −22 N
Aprendizagem Estatística
Desigualdade de Hoeffding
P [|Ein (h) − Eout (h)| > ] ≤ 2 exp −22 N
r
1 2
Eout (g) ≤ Ein (g) + ln
2N δ
Aprendizagem Estatística
Desigualdade de Hoeffding
P [|Ein (h) − Eout (h)| > ] ≤ 2 exp −22 N
"Avaliando uma hipótese, quando o tamanho amostral N aumenta,
torna-se exponencialmente improvavél que Ein (h) e Eout (h) se dis-
tem mais que "
Aprendizagem Estatística
Analogia da Prova
Teste
P [|Ein − Eout | > ] ≤ 2 exp −22 N
Aprendizagem Estatística
Analogia da Prova
Teste
P [|Ein − Eout | > ] ≤ 2 exp −22 N
Treino
P [|Ein − Eout | > ] ≤ 2 · M · exp −22 N
Aprendizagem Estatística
Dicotomias 2N
Aprendizagem Estatística
Problemas Binários
mH (N ) = max |H (x1 , · · · , xN )|
x1 ,··· ,xN ∈X
mH (N ) ≤ 2N
Aprendizagem Estatística
Dicotomias em Perceptron
Outline
1 Introduction
Aprendizagem
3 Generalização
4 Dilema Viés-Variância
Dimensão VC
Exemplos
mH (N ) ≤ N dvc + 1
Teorema. Para qualquer tolerância δ > 0,
s
8 4mH (2N )
Eout (g) ≤ Ein (g) + ln
N δ
com probabilidade ≥ 1 − δ.
Então, com dados suficientes, toda e qualquer hipótese no H infinito
com dimensão VC finita vai generalizar.
Dimensão VC
2N
P [|Ein − Eout | > ] ≤ 2M e−2
1 2
P [|Ein (g) − Eout (g)| > ] ≤ 4mH (2N )e− 8 N
Outline
1 Introduction
Aprendizagem
3 Generalização
4 Dilema Viés-Variância
Dilema Viés-Variância
Dilema Viés-Variância
O Bom Intermediário
O Pavor do Overfitting
LAMFO