Escolar Documentos
Profissional Documentos
Cultura Documentos
PLAN
LOREM OF ATTACK
Parte 1 IPSUM Parte 2 – FACE DETECTION
Parte 3 Parte 4 Parte 5
Redes neurais para Redes neurais
Detecção de Reconhecimento Rastreamento convolucionais para
classificação de
faces facial de objetos imagens classificação de
imagens
Parte 11
Parte 12 Parte 13 Parte 14 Parte 15
Reconhecimento
Deep dream Transferência de GANs (Generative Segmentação
de gestos e Adversarial
estilo de imagens
ações Networks)
DETECÇÃO DE FACES
RGB
32 pixels
32 pixels
32 x 32 = 1024 pixels
32 x 32 x 3 = 3072
CLASSIFICADOR CASCADE
AdaBoost
Training
Faces
Mais de 160.000
2356
combinações em uma 8921
imagem 24x24!
CLASSIFICADOR CASCADE
CLASSIFICADOR CASCADE
HOG – HISTOGRAMS OF ORIENTED GRADIENTS
42 55 48
35 38 33
38 30 32
12 15 18
Binário = 11100010
5 8 3
Se >= 8: 1 1 1 1
8 1 2 Se < 8: 0
0 8 0
1 0 0
Edge Corner
110 201
240
Fonte: https://bytefish.de/blog/local_binary_patterns/
LBPH (LOCAL BINARY PATTERNS HISTOGRAMS)
1. Radius 12 15 18
2. Neighbors 5 8 3
3. grid_x and grid_y 8 1 2
4. Threshold
Fonte: https://en.wikipedia.org/wiki/Local_binary_patterns
RASTREAMENTO DE OBJETOS
Source: https://www.groundai.com/project/enkcf-ensemble-of-kernelized-correlation-filters-for-high-speed-object-tracking/1
CSRT (DISCRIMINATIVE CORRELATION FILTER WITH
CHANNEL AND SPATIAL RELIABILITY)
1. Da esquerda para direira: “training patch” com a seleção do objeto a ser rastreado
2. HOG para extrair informação útil da imagem
3. Apliação de “Random Markov Test” para gerar probabilidades
4. “Training patch” mascarado usando um mapa de confiança
Fonte: https://www.arxiv-vanity.com/papers/1611.08461/
REDES NEURAIS ARTIFICIAIS PARA
CLASSIFICAÇÃO DE IMAGENS
1. Intuição sobre redes neurais artificiais
2. Redes neurais usando todos os pixels das imagens
3. Extração de características com o OpenCV
4. Redes neurais usando as características das imagens
PIXELS
RGB
32 pixels
32 pixels
32 x 32 = 1024 pixels
32 x 32 x 3 = 3072
PIXELS
0,1,1,1,0,0,1,0,1,0,0,1,1,1,0,0,0,0,1,0,0,1,1,1,0,9
0,1,1,1,0,0,1,0,0,0,0,1,1,1,0,0,1,0,1,0,0,1,1,1,0,6
EXTRAÇÃO DE CARACTERÍSTICAS
TRANSFERÊNCIA
TRANSFERÊNCIA DE APRENDIZAGEM
0 1 0 1 0 2
0 1 0 1 0 2 1 2
0 20 11 10 21 0 2 1 2 1
0 2 1 1 2 3 32 21 2
1 20 02
2 13
1 01 12 0 3 32 21 2
2 Elefante
ImageNet 1
1
3123
2
20 31 1 0
03
2 123 11
2
12 0 3
3
33
3
523
52
3
12
12
2
2
3 Cobra
1 3 3 0 302 211 01 12 0 3 33 35 2
1 31 113 233 253 32 1
1 3 1 1 302 522 13 11 2
3
3
33
3
35
5
2
3 Leão
1 13 31 33 35 2
3 3 5
13 13 23 23 32 1 2
1 1 3 5
1 13 31 33 35 2 3
Características 1 3 1 3 5
3
gerais 5
gerais 5
Fonte: EPFL
AUTOENCODERS
1. Introdução ao Tesseract
2. Implementação
RECONHECIMENTO DE GESTOS E AÇÕES
http://human-pose.mpi-inf.mpg.de/
MPII – PONTOS CORPORAIS
8 Quadril direito
DEEP DREAM
0 1 0 1 0 2
0 1 0 1 0 2 1 2
0 20 11 10 21 0 2 1 2 1
0 2 1 1 2 3 32 21 2
1 20 02
2 13
1 01 12 0 3 32 21 2
2 Elephant
ImageNet 1
1
31
23
2
20 31 1 0
03
2 123 112
12 0 3
3
33
3
523
52
3
12
12
2
2
3 Snake
1 3 3 0 302 211 01 12 0 3 33 35 2
1 31 13 33 253 32
1 2 1
1 3 1 1 302 522 13 11 2
3
3
33
3
35
5
2
3 Lion
1 13 31 33 35 2
3 3 5
13 13 23 23 32 1 2
1 1 3 5
1 13 31 33 35 2 3
Características gerais 1 3 1 3 5
3
Activations (ReLU)
TRANSFERÊNCIA DE ESTILO
REDES ADVERSARIAIS GENERATIVAS
Fonte: Garcia et al
Fonte: Pexels
MASK R-CNN
• Construída baseado em: R-CNN (2013), Fast R-CNN (2015) e Faster R-CNN
(2015), all by Girshick et al.
Fonte: https://arxiv.org/abs/1703.06870
R-CNN, FAST R-CNN E FASTER R-CNN