Você está na página 1de 63

Anlise Forense de

Documentos Digitais

Prof. Dr. Anderson Rocha


anderson.rocha@ic.unicamp.br
http://www.ic.unicamp.br/~rocha

Reasoning for Complex Data (RECOD) Lab.


Institute of Computing, Unicamp
Av. Albert Einstein, 1251 - Cidade Universitria
CEP 13083-970 Campinas/SP - Brasil
Organizao
Organizao

Conceitos de Imagem Digital


Operaes com Imagens
Aprendizado de Mquina

A. Rocha, 2012 Anlise Forense de Documentos Digitais 3


Organizao

Aprendizado de Mquina
Supervisionado
No-Supervisionado
Semi-Supervisionado
Avaliao e Comparao de Mtodos
A. Rocha, 2012 Anlise Forense de Documentos Digitais 4
Imagem
Imagem

De acordo com [Gomes & Velho 1996], para


trabalharmos com imagens, devemos estabelecer
um universo matemtico no qual seja possvel
definir diversos modelos abstratos destas

Em seguida, precisamos criar um universo de


representao onde procuramos esquemas que
permitam uma representao discreta desses
modelos

A. Rocha, 2012 Anlise Forense de Documentos Digitais 6


Imagem

O objetivo da representao discreta desses


modelos codificar a imagem no computador

Quando observamos uma fotografia, ou uma


cena no mundo real, recebemos de cada ponto
do espao um impulso luminoso que associa
uma informao de cor a esse ponto

A. Rocha, 2012 Anlise Forense de Documentos Digitais 7


Imagem

Nesse sentido, podemos definir uma imagem


contnua (no discreta) como a aplicao
I:U !C

onde U R3 uma superfcie e C um espao


vetorial

Na maioria das aplicaes, U um subconjunto


plano e C um espao de cor

A. Rocha, 2012 Anlise Forense de Documentos Digitais 8


Imagem

A funo I na definio chamada de funo


imagem

O conjunto U chamado suporte da imagem


O conjunto de valores de I , que um
subconjunto de , chamado de conjunto de
C
valores da imagem

A. Rocha, 2012 Anlise Forense de Documentos Digitais 9


Imagem

Quando C um espao de cor de dimenso 1,


dizemos que a imagem monocromtica ou em
tons de cinza

Aespacial
representao mais comum de uma imagem
consiste em tomar um subconjunto
discreto U U do domnio da imagem, uma
0

espao de cor C associado a um dispositivo


grfico e representar a imagem pela amostragem
da funo imagem I ! U 0

A. Rocha, 2012 Anlise Forense de Documentos Digitais 10


Imagem

chamado de elemento da imagem ou pixel


Cada ponto i i do subconjunto discreto
(x , y ) U 0

Para a representao em computador, devemos


tambm trabalhar com modelos onde a funo
imagem I toma valores em um subconjunto
discreto do espao de cor C

Esse processo de discretizao chamado de


quantizao

A. Rocha, 2012 Anlise Forense de Documentos Digitais 11


Imagem

Ode caso mais utilizado de discretizao espacial


uma imagem consiste em tomar o domnio
como sendo um retngulo e discretizar esse
retngulo usando os pontos de um reticulado
bidimensional

Dessa forma a imagem pode ser representada de


forma matricial por uma matriz
(mn)
A = (aij = (I(xi , yj ))

A. Rocha, 2012 Anlise Forense de Documentos Digitais 12


Imagem
Cada elemento aij , i = 1, . . . , m e j = 1, . . . n
da matriz representa o valor da funo imagem
I no ponto de coordenadas (xi , yj ) do
reticulado

Dessa forma, cada ponto aij um vetor do


espao de cor representando a cor do pixel na
coordenada (i, j) da imagem

A. Rocha, 2012 Anlise Forense de Documentos Digitais 13


Imagem
Se cada ponto possui trs valores associados e
cada valor precisa de oito bits para ser
representado, ento cada pixel dessa imagem
pode ser representado com 24 bits

A imagem dita de 24 bits


Se cada pixel tambm codifica transparncia, a
imagem tem um quarto canal, chamado alfa,
tornando-se uma imagem de 32 bits

A. Rocha, 2012 Anlise Forense de Documentos Digitais 14


136 6 Digital Images

Imagem
amostragem
Images
codificao
Gomes & Velho

decodificao
reconstruo Fig. 6.1. Abstraction levels in the representation of an im
Representao Representao Representao
Contnua Discreta
Note that these levels will be Simblica
realized concretely in differen
image processing system. For this reason, in order to obtain a u
for image processing, we must use transformations to pass from
another, and we must also be able to manipulate descriptions on
(see Chapter 2).

Fig. 6.1. Abstraction levels


6.2in The
the representation
Spatial Modelof an image.

A. Rocha, 2012 Anlise Forense de Documentos Digitais 15 fo


Although there are several mathematical models appropriate
Note that these levels will be realized concretely in different ways in an
Espaos de Cor
Odispositivo
espao de cor pode variar de acordo com o
de exibio (e.g., monitor, impressora)

Espaos de cor
RGB (Vermelho,Verde, Azul)
CMYK (Ciano, Magenta, Amarelo, Preto)
HSV (Matiz, Saturao e Brilho)
etc.
A. Rocha, 2012 Anlise Forense de Documentos Digitais 16
Espao de cor RGB
Oa reproduo
propsito principal do sistema RGB
de cores em dispositivos
eletrnicos

monitores de TV e computador

Wikipedia.org
datashows

scanners

cmeras digitais

fotografia tradicional

A. Rocha, 2012 Anlise Forense de Documentos Digitais 17


Imagem

A. Rocha
A. Rocha, 2012 Anlise Forense de Documentos Digitais 18
Imagem

A. Rocha (Montagem)
* The Persistence of Memory by Salvador Dali

A. Rocha, 2012 Anlise Forense de Documentos Digitais 19


Espao de cor CMYK
Modelo de cores subtrativas

Wikipedia.org
Contraposio ao RGB
Apropriado para impressoras
K vem de keyed (alinhamento) da
placa de impresso de cor preta com
as outras

Wikipedia.org

A. Rocha, 2012 Anlise Forense de Documentos Digitais 20


Espao de cor HSV
Matiz (tonalidade): verifica o tipo da

Wikipedia.org
cor (abrange todas as cores do
espectro)

Saturao (pureza): valores baixos so


prximos do cinza.Valores altos so
prximos da cor pura

Brilho: define o brilho (intensidade) da


cor

A. Rocha, 2012 Anlise Forense de Documentos Digitais 21


Operaes com
Imagens
Quantizao

Mapeamento dos nmeros reais em valores


discretos

Tipicamente utiliza-se bytes (256 valores) ou


inteiros curtos (65536 valores)

A. Rocha, 2012 Anlise Forense de Documentos Digitais 23


Warping
Modifica o domnio da funo de imagem.

A. Rocha, 2012 Anlise Forense de Documentos Digitais 24


Transformaes - Atributos

l u r
b
arestas
can
al

A. Rocha, 2012 Anlise Forense de Documentos Digitais 25


Decomposio em Canais
de Cores
Quando separamos a imagem em suas cores
bsicas representadas no espao de cores
0
C C

Se o espao de cores utilizado um espao


RGB, temos os componentes vermelho (Red),
verde (Green), e azul (Blue);

A. Rocha, 2012 Anlise Forense de Documentos Digitais 26


Decomposio Wavelet
L H3

V3 D3 H2

V2 D2 H1

A. Rocha

V1 D1

A. Rocha

A. Rocha, 2012 Anlise Forense de Documentos Digitais 27


Decomposio em Planos
de Bits
Quando
de bits
decompomos a imagem em seus planos

Por exemplo, aps a decomposio da imagem


de 24 bits em seus trs canais de cores (R,G,B),
podemos ainda, fazer uma decomposio por
planos de bits.

Cada canal de cor possui 8 bits e possui 8 planos


de bits por canal de cor

A. Rocha, 2012 Anlise Forense de Documentos Digitais 28


Decomposio em Planos
de Bits

A. Rocha
* Decomposio da imagem em canais de bits

A. Rocha, 2012 Anlise Forense de Documentos Digitais 29


Nomenclaturas
Nomenclatura

Diferentes reas tem nomes distintos para


coisas parecidas
Aprendizado de Mquina
Reconhecimento de Padres
Aprendizado Estatstico
Minerao de Dados
A. Rocha, 2012 Anlise Forense de Documentos Digitais 31
Aprendizado de
Mquina
Aprendizado de Mquina

Aprendizado de Mquina uma rea da


Inteligncia Artificial concentrada no
desenvolvimento de tcnicas que permitem que
computadores sejam capazes de aprender com
a experincia [Mitchell 1997]

Extrao de informaes e extrapolao do


conhecimento a partir de dados

A. Rocha, 2012 Anlise Forense de Documentos Digitais 33


Aprendizado de Mquina

Alguns problemas que utilizam aprendizado de


Mquina [Mitchell 1997] [Friedman et al. 2001]
reconhecimento de caracteres
reconhecimento da fala
predio de ataques cardacos
deteco de fraudes em cartes de crditos
A. Rocha, 2012 Anlise Forense de Documentos Digitais 34
Aprendizado de Mquina

Na soluo desses problemas, podemos ter


classificadores fixos ou baseados em
aprendizado, que, por sua vez, pode ser
supervisionado ou no-supervisionado
[Friedman et al. 2001]

A. Rocha, 2012 Anlise Forense de Documentos Digitais 35


Definio Classificadores

Podemos ver um classificador, matematicamente, como


um mapeamento a partir de um espao de
caractersticas X para um conjunto discreto de rtulos
(labels) Y

Em IA, um classificador de padres um tipo de motor


de inferncia que implementa estratgias eficientes para
computar relaes de classificao entre pares de
conceitos ou para computar relaes entre um
conceito e um conjunto de instncias
[Dudaetal.2000]

A. Rocha, 2012 Anlise Forense de Documentos Digitais 36


Classificadores

Classificadores podem ser


Supervisionados
Semi-Supervisionados
No-Supervisionados

A. Rocha, 2012 Anlise Forense de Documentos Digitais 37


Classificadores

Classificadores supervisionados consistem em


tcnicas em que procuramos estimar uma funo
de classificao f a partir de um conjunto de
treinamento

Ovalores
conjunto de treinamento consiste de pares de
de entrada X, e sua sada desejada Y
[Friedman et al. 2001]

A. Rocha, 2012 Anlise Forense de Documentos Digitais 38


Classificadores

Valores observados no conjunto X so


denotados por x , isto , x a i-sima
i i
observao em X

Odasnmero de variveis que constituem cada uma


entradas em em X p

Assim, X tem n observaes, chamados de


vetores de caractersticas

A. Rocha, 2012 Anlise Forense de Documentos Digitais 39


Classificadores

Cada vetor de entrada composto por p graus


de liberdade (dimenses ou variveis)

A(regresso)
sada da funo f pode ser um valor contnuo
ou pode predizer a etiqueta (label)
de um objeto de entrada (classificao)

A. Rocha, 2012 Anlise Forense de Documentos Digitais 40


Classificadores

Aparatarefa do aprendizado predizer o valor da funo


qualquer objeto de entrada que seja vlido aps
ter sido suficientemente treinado com um conjunto de
exemplos [Bishop 2006]

Alguns exemplos de classificadores supervisionados so


Support Vector Machines
Linear Discriminant Analysis,
Boosting
A. Rocha, 2012 Anlise Forense de Documentos Digitais 41
Aprendizado No-Supervisionado

Um outro grupo de tcnicas de aprendizado,


no utilizam exemplos de treinamento
marcados (classe conhecida)

Conhecidos como tcnicas para aprendizado


no-supervisionado

Esta forma de aprendizado, na maioria das


vezes, trata o seu conjunto de entrada como
um conjunto de variveis aleatrias

A. Rocha, 2012 Anlise Forense de Documentos Digitais 42


Aprendizado No-Supervisionado

Um modelo de distribuio conjunta (joint


distribution model) ento construdo para a
representao dos dados

Desta forma, o objetivo deste aprendizado avaliar


como os dados esto organizados e agrupados
[Friedman et al. 2001]

Tcnicas de Maximizao de Esperana [Baeza-Yates


2003], por exemplo, podem ser utilizadas para
aprendizado no-supervisionado

A. Rocha, 2012 Anlise Forense de Documentos Digitais 43


Aprendizado Semi-Supervisionado

Um outro grupo de tcnicas de aprendizado


envolve abordagens mistas
Supervisionado
No Supervisionado
So as tcnicas Semi-Supervisionadas
A. Rocha, 2012 Anlise Forense de Documentos Digitais 44
Modelagem de
Problemas
Modelagem de Problemas

Problemas so descritos por variveis


Dois tipos
Reais
Categricas

A. Rocha, 2012 Anlise Forense de Documentos Digitais 46


Modelagem de Problemas

Como transitar entre os dois tipos de variveis?


possvel converter uma representao em
outra?

A. Rocha, 2012 Anlise Forense de Documentos Digitais 47


Modelagem de Problemas

Simplicidade vs. Complexidade


O que realmente importante?
Precisamos realmente de todos os dados
possveis para tomar uma deciso?

A. Rocha, 2012 Anlise Forense de Documentos Digitais 48


Modelagem de Problemas

Dimenso do vetor de caractersticas tem


efeitos colaterais importantes:

Dimenso alta
Distncias mdias ficam grandes
Dados ficam esparsos
Maldio da Dimensionalidade
A. Rocha, 2012 Anlise Forense de Documentos Digitais 49
Aprendizado
Supervisionado
(Primeiros Passos)
Aprendizado Supervisionado

Dados para Aprendizado Supervisionado


Give me more data
Classificao vs. Regresso

A. Rocha, 2012 Anlise Forense de Documentos Digitais 51


Aprendizado Supervisionado

Ser que quanto mais complexo nosso modelo


de predio melhor o resultado?

A. Rocha, 2012 Anlise Forense de Documentos Digitais 52


Exemplo KNN

K-Vizinhos mais Prximos (KNN)


Um exemplo de tcnica baseada em instncias.
No h aprendizado
decises so feitas para cada instncia

A. Rocha, 2012 Anlise Forense de Documentos Digitais 53


KNN k = 1 1-Nearest Neighbor Classifier

.. ..
.. .. o.... .... o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
o o .. .. .. .. .. ..o ..
..
.. ..
......................................... .. .. ..
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
..
... ... ... ... o ... ...
.. ..
.. .. o o .. ..o .. .. ... ...o
o ..
..
.. .. .. .. .. .. .. .. .. .. .. .. .. o .. ..
.. ..
.. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
.. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
. . . . . . . . . . . . .
.. ..
o o o
.. .. .. ..o . .o .. .. ..o.. .. .. ..o
..
..
.. ..
....................................
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.
.. ..
.. ..
.. .. ... ...o .. .. .. .. ..o .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o oo
.. ..
.. .. o ...o
o
..
... ... ... ... ... ... o
..
.. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
... ...
.. . ... ...
..
.. .. o ... ... ... ...o... ... ... .... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....o.....o..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....
. . . . . ..
. . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... .. ..
.. ..
o.. .. o ... ... ... ... ... ... ... ... ...oo... ... ... ... ... ... ... ...o
..
..
.. ..
.. ..
o .. ..o
.. ..
.. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
... ...
.. ..
... ...
..
.
.. ..
.. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. oo .. o .. .. o .. .. .. .. o .. .. . .. ... o
. ... ... ... ... ... ... ... ... ... ... ... ... ...o
.. .. ..
... ... ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. .. .. .. ... ... ...
o .. o
o o o.....o..... ..... o.....o..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....o..... ..... ..... ..... o
.. .. .. .. .. .. .. .. .. .. .. .. o .. .. .................. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. ..o ... ... ... ... ... ... ... ... ... ... ...o... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o o .. .. .. .. .. o.. ..o
.. .. o.. .. .. .. .. ..o.. .. .. .. ..o o
.. .. .. .. .. ... ... ... ... o .. .. .. .. .. .. .. .. .. .. .. .. .. ..o
.. .. .. ..o .. .. .. o
.. .. ..........
.. .. .. .. .. .. .. ... ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. .. .. .. . .. ..
oo
oooo.. o .. .. .. .. ... .. ..
... ... ... ... ... ...o...
.. .. . . . . . . . ... . . . . . . . . . .. ..
. . . . . . . . .. .. .. .. .. .. .. .. .. ..
o o...o..... ..... o.....o..... o..... ..... ..... ..... ..... ..... ..... .....o..... o
.. .. .. ...o ... o ...o ... ... ... ... ... ...o
.. .. ... ... ... ...o... ... ... ... ... ... ... ... ... ... ... ... o
.. .. ... o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . .. .. ..o . . . . . . . .o o .. .. .. .. .. ..
o o .. ... ... ... ... ... ... ... ... ... ... ... ... o
.. .. .. .. .. .. ..
. . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o o .. .. ... ... ... ... ...o... ... ... ... ... ...o
.. .. .. .. ... ... o .. ..o .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. o. o . . .o .
. .. o .o .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. ... o
. .. ..
. . . . . . . . . o . . .. ..
. . . ...o ..
... ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. ..
.. ..
.. ..
.. .. .. .. ..
.. ..
o.. ..o.. o.. .. o.. .. .. .. o.. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. . .. .. . . . . . . . . . . . . .o. . . . .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
... ... ... ... ... ... ...o... o .. .. .. .. .. .. .. .. o
.. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... o
.. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ...
.. ..
. . .o ..........o o .. o . . . . . . . . . . . . . . . .o o
.. .. o .. .. .. .. .. .. .. .. .. ..
o .... .... .... .... .... .... .... o.... o.... .... .... .... .... .... ....o.... ....o.... o.... o....oo.... .... .... o.... .... .... ....o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
.. .. . ... . . . . . . . . . .
.. .. . . . . . . . . . . .. .. . . . .
. . . . . . . . . . . . .. .. .. .. .. ..
. . . . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... .. .. .. ..
.. .. . . . . . . ..o..o.. ..o .. ..o . .. .. .. o .. ..
. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..o .. .. .. .. .. .. .. .. ... ... .. .. ... ... ... ... ...
.. ... ... ... ... ... ... o
..o ..............
.. .. .. o ..
.. .. .. ... ... ... o .. .. .. ... o .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
... ... ... ... ... ... ... ... ... ...o... ... ... ... ...o...o
.. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ...
.. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. ... ...
o... ... ... ... ... ... ... ... ... ... ... ... ... ... ...o... ...oo... ... ... o
.. .. .. . .. ..
.. o .. ..
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. .. .. ... ... ... ... ... ... ... ... ... ...
.. ..
.. .. .. .. .. ..o ..
.. .. .. ..o.. .. .. o .. .. .. .. .. .. .. ... o .. .. . . . . . . . .o .. ..
.................. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o ... ... ...o... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
... ... ... ... ...o
. . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. o . . . . . . .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. ..o.. .. .. .. .. .. ...o... ... ... ... ...o
.. .. .. .. ..
o. . . . . . . . . . . . . . . . . . . . . .

J. Friedman et al.
.. .. . ... ... ... ... . .. .. . .. .. .. . ..
...
.. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. o .. o
.. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. ..
... ... ... ... ... ... ... ... ... ... ... ... ... o ... ... ... ... ... ... ... o ... ... o ... ... ... ... ...o
... ... ... ...
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. o .. .. ......................... .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. .. .. ..
. . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ...o
.. ..
.. .. .. .. .. o. . . . . . . . . . . . . . . . .
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. ..
.. .. .. .. .. .. ..
................ .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. .. o . .. .. . .. .. .. . .. .

Figure 2.3: The same classification example in two


Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais 54
KNN k = 15 15-Nearest Neighbor Classifier

.. ..
.. .. o.... .... o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
o o .. .. .. .. .. ..o ..
..
.. ..
......................................... .. ..
.. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. ..
..
..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
o o .. ..o .. .. o . . .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. ... ...o
.. .. .. .. .. .. ..
............................ .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. o .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. ..o . . .. .. ..o.. .. .. ..o
.. .. ..
.................................... .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o o o
.. .. .. .. ... ...o .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. ..o . . . .. ..o
o oo
.. ..
.. .. o ..o
..
.. .. .. ... ... ... o
..
.. ..
...................................... .. .. ..
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. .. o .... .... .... ....oo.... .... .... .... .... .... .... .... .... .... .... .... .... .... ....o....o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
o.. .. o ... ... ... ... ... ... ... ... ...oo... ... ... ... ... ... ... ...o
..
..
.. ..
.. .. .. ..o
.. ..
.. ..
..
..
. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. .. .. .. .. .. ..o.. .. .. .. ..o.. .. o
.. .. .. o .. .. ..o... o
.. .. .. ... o .. .. .. .. .. .. .. .. .. .. .. .. ..o
.. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
o o . o . . o . ..
. . . . . . . .
o...o... ... ...o... ... ... ... ... ... ... ... ... ... ... ... ...o... ... ... ... o . . . o
.. .. . . . .
. .
. .
. .
. .
. . . .
... ..
.. .
. .
. .
. o . . .. .. .. . ..
. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . .o. . . . . . .
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. . . . . ..
. . . . . . . . . . . .. ... . . . . . .. .. .. .. .. .. .. ..o
. . . . .. ..
. . . . . . . . ..
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
o o .. .. .. .. .. o.. ..o
.. ..
..
.. o o
.. .. .. .. .. ..o
.. ..
.. .. .. .. ..o
.. .. o . .
.. .. .. .. .. .. .. o . . .. ..
. .
.. .. . .
.. .. .. .. .. .. .. o
o .. .. .. .. .. .. ..o
..
.. .. .. .. .. .. .. .. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
oo
ooooo.....oo .. .. .. .. .. ..o..
.. .. . . . . . ..
. . . . .
.. .. .. .. .. .. .. .. .. .. .. .. .. o . . . . .
. .. o .. ..
. . . . . . . . . . .. ..
. . .. .. .. .. .. .. .. .. .. .. .. .. ... o
. . . . . . . . . . ... . .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o .. .. .. .. o .. .. .. .. .. .. .. .. .. .. .. ...o
.. .. ... .. .. .. .. .. .. .. .. .. ..o
.. ...o .. ..o .. .. .. ..o .. .. .. o .. .. .. .. .. .. .. .. .. .. .. .. o
.. ..
.. o .. .. ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o .. ..
.. ... ... ...o...o... o
o.. .. .. .. .. o
..
... ...o .. .. .. o .. ..
.. ...o .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. ..
. . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
o .. ..
.. .. .. .. .. .. .. .. .. .. .. .. ..o
..
... . . . . o..o.. .. ..o . . .
.o
.. ..
.
.. ..
.
.. .. o o . . .. ..
.. .. .. .. .. .. .. .. .. .. .. .. ... ... o
.. .. .. .. .. ..o.. .. .. ..o.. .. .. .. .. .. ...o
. .. ..
..
. .. .. .. .. .. .. .. .. .. .. .. .. ..
............. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
.. ..
.. ..
.. ..
.. ..
..
..
.. ..
.. ..
o.. ..o.. o.. .. o.. .. .. .. o.. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. . . . . . . . .. . . . . . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. ... ...o... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. . . . .. .. .. .. .. o .. . . . . .. .. .. .. o . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. .. ....... .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. ..
... ... ... o .. .. .. ..o .. ... ... ... ... o
..
o .. o.. .. .. ... ... o .. .. .. o .. .. .. .. .. .. .. .. o .. ..
.. .. o ..
.. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... .. .. .. .. .. .. .. .. .. ... ... ... ... ...
o .... .... .... .... .... .... .... o.... o.... .... .... .... .... .... ....o.... ....o.... .... o....oo.... .... .... o.... .... .... ....o.... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ...
... ... o ... ... ... ... o
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . ..
...o
.. .. ... ... ... ... ... ... o ...o...o... ...o
.. ... o
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...o
.. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... o ... ...o... ... ... ... o
.
.. ..
.. ..
..
.. ...o...o .. .. .. .. ..
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. ..
.. ..
.. ..
.. ..
.. ...
. .. ..
.. ... ... ... ... ... ... ...
o.... .... .... .... .... .... .... .... .... .... .... .... .... .... ....o.... ....oo.... .... .... o
.. ..
.. ..
..
..
.. ..
.. ..
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.o .. .. .. .. .. .. .. ..o
.. ..
.. ..
..................
..
..
.. ..
.. ..
... ...
.. ..
..
..
... ...
.. ..
... ...
.. ..
... ...
.. ..
...
..
... ...
.. ..
... ... ...o
.. .. ... ... ...o ... ... ... ...o... ... ... o
.. ... ... ... ... ... ... ... ... o
.. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
o .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. ... ... ... ... .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
... ... ... ... ...o
. . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. o . . . . . . .. .. .. ..o
.. .. .. .. .. .. .. ..o.. .. .. .. .. .. ...o... ... ... ... ...o
.. .. .
o.. .. .. .. .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... ....

J. Friedman et al.
.. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. o .o
.. .. .. .. .. .. .. .. .. .. .. .. .. ... ... o
.. .. .. .. .. .. .. ..
. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . .. .. .. .. o
.. .. ... ... ... ... ...o
.. .. . .. ..
. . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . .. .. . .. .. .. . ..
.. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. ... .. .. ... ...o .. .. o
... ... ... ...
..................... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. .. .. ..
. . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ...o
.. .. .. .. .. o. . . . . . . . . . . . . . . . .
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. ..o.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. o
.. .. .. .. .. .. ..
................ .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
.. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. .. o . .. .. . .. .. .. . .. .

Figure 2.2: The same classification example in two


Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais 55
Avaliao e
Comparao
Avaliao e Comparao

Vis e Varincia
Treinamento e Teste
Matriz de Confuso
Mtricas e Critrios

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais 57


Avaliao e Comparao

Conjuntos de validao e teste


Validao cruzada

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais 58


Curvas ROC

Especificidade
E = TN / (TN + FP)
Sensitividade
S = TP / (TP + FN)
(Sensitividade) vs. (1 - Especificidade) = Curva
Caracterstica de Operao (ROC)

Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais 59


Curvas ROC

Wikipedia.org
Rocha & Goldenstein, 2010 CSI: Anlise Forense de Documentos Digitais 60
Referncias
Referncias
1. [Baeza-Yates 2003] R. Baeza-Yates. Clustering and Information Retrieval. Kluwer Academic Publishers. 1 edition.
2. [Bishop, 2006] C. M. Bishop. Pattern Recognition and Machine Learning. Springer, 1 edition, 2006.
3. [Duda et al. 2001] R. O. Duda, P. E. HART and D. G. STORK. Pattern Classification. Wiley-Interscience, 2, 2000.
4. [Friedman et al. 2001] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1
edition, 2001.
5. [Gomes & Velho, 1996] J. Gomes L. Velho. Computao Grfica: Imagem. IMPA-SBM, 1.
6. [Gonzalez & Woods, 2007] R. Gonzalez and R. Woods. Digital Image Processing. Prentice-Hall, 3 edition.
7. [Mitchell 1997] T. M. Mitchell. Machine Learning. McGraw-Hill, 1 edition, 1997.

A. Rocha, 2012 Anlise Forense de Documentos Digitais 62


Obrigado!

Você também pode gostar