Escolar Documentos
Profissional Documentos
Cultura Documentos
Thiago Schons
Universidade Federal de Ouro Preto
Thiago Schons
Universidade Federal de Ouro Preto
ii
Resumo
iii
Abstract
Biometric systems are in global expansion due to the need of security, promoting the
emergence of new and robust biometric modes. From this context, interest in electro-
encephalogram based biometric systems has aroused researcher’s interest because it’s a
modality in which the signal changes according to the task being performed by the indivi-
duals during the recording session, providing more integrity and authenticity. However,
EEG biometric modality is susceptible to noise and has problems of scale, accuracy and
signal capture in uncontrolled environments. Methods based on Convolutional Neural
Networks (CNN) have been explored in the literature for signal processing and signifi-
cant results in classification have been obtained. In this scenario, the proposed method
is based on CNN for biometric verification and for evaluation of a database containing
109 individuals, with signals of 64 electrodes. A technique for data augmentation is
proposed for the deep learning network training data. The results obtained shows that
the method is a promising path in the representation of brain signals because the equal
error rate (EER) got reduced from 4,5% to 0.19% in baseline tests in comparison to the
literature.
iv
Agradecimentos
Quero agradecer também meus orientadores Gladston Moreira Juliano Prates e Edu-
ardo José da Silva Luz, pela paciência, empenho e dedicação. Confiaram em mim e
permitiram que este trabalho se concretizasse sem nunca terem economizado esforços
para transmitir conhecimento.
A meus pais e irmãos, que são meu porto seguro e estão sempre me dando apoio
incondicional, sem eles não conseguiria chegar onde estou.
A minha namorada Adriana que fez parte de tudo, me acompanhou nos momentos
bons e difı́ceis, do inı́cio ao fim dessa jornada. Me motivou sempre e acreditou no meu
potencial encarando tudo sempre com muito amor.
v
Sumário
Lista de Tabelas ix
1 Introdução 1
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Fundamentação Teórica 5
2.2 Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3 Revisão da Literatura 19
3.2 Multitarefas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
vi
4 Rede Neural de Convolução para Biometria Baseada em EEG 25
4.1 Pré-Processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
5 Experimentos e Discussões 31
5.2 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
A Apêndices 41
A.1 Publicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Referências Bibliográficas 50
vii
Lista de Figuras
2.1 Curva DET com a relação entre FAR, FRR e EER. Extraı́da/adaptada
de (Du and Chang 2007). . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.2 Curvas DET dos resultados satisfatórios obtidos com o uso de tarefas. . . 37
viii
Lista de Tabelas
ix
“Não existe um caminho para a felicidade, a felicidade é o caminho”
— Mahatma Gandhi
x
Capı́tulo 1
Introdução
A tecnologia está evoluindo muito nos últimos anos e assim como os sistemas de se-
gurança, também evoluem técnicas de invasão. Nesse contexto, os sistemas biométricos
também estão em evolução constante, porém formas de captura de caracterı́sticas ro-
bustas e discriminantes entre pessoas são desejáveis, principalmente para novas formas
de biometria.
O presente trabalho lida com o uso dos sinais do eletroencefalograma (EEG) para
a tarefa biométrica. O sinal de EEG é a medida da atividade elétrica cerebral por
meio de eletrodos posicionados na região do escalpo em posições estratégicas. A medida
é feita com base no somatório de pequenos impulsos elétricos que são emitidos pelos
neurônios (Boubakeur et al. 2017). As faixas cerebrais podem ser divididas em faixas
de frequência, e as mais relevantes de EEG estão relacionadas as bandas: Delta (0.5, 40
Hz), Theta (4-8 Hz), Alpha (8-14 Hz), Beta (14-30 Hz) e Gamma (> 30 Hz).
1
2 Introdução
et al. 2016). Isso torna a biometria mais flexı́vel em caso de ataque ao banco de dados,
pois se os dados forem roubados, como no caso da impressão digital, iris ou qualquer
caracterı́stica fı́sica, estas informações deveriam ser descartadas, por motivo de segu-
rança (Boubakeur et al. 2017). Usando deste artifı́cio, a biometria baseada em EEG
torna-se mais efetiva, pois a mesma modalidade pode ser reutilizada, somente alterando
a tarefa designada para o indivı́duo e recadastrando os dados biométricos no banco de
dados, mudando assim os sinais de EEG e impossibilitando o uso de dados roubados,
fornecendo assim mais integridade e autenticidade (Boubakeur et al. 2017)
A biometria por EEG é promissora quando analisada de uma perspectiva futura, mas
tem uma grande limitação atualmente, que são os dispositivos para aquisição dos dados.
Os sensores evoluı́ram muito nos últimos anos e em paralelo ficaram e estão ficando
mais baratos, porém o tempo de preparação e a necessidade de pessoal qualificado para
manuseio das máquinas de coleta ainda são um empecilho. A impedância gerada entre
couro cabeludo e os eletrodos tem que ser reduzida com o uso de gel condutor com o
intuito de aumentar a qualidade do sinal (Ma et al. 2015).
O primeiro sistema biométrico baseado em EEG foi introduzido por (Stassen 1980).
Utilizando classificação do espectro de EEG, eles conseguiram obter 90% de probabili-
dade de confiança analisando dados de 82 sujeitos. Posteriormente, (Poulos et al. 1999b)
mostrou a viabilidade na utilização de sinais de EEG para tarefas biométricas, e desde
então, o interesse da comunidade cientı́fica nesse ramo da biometria aumentou. Mui-
tas abordagens fazendo uso de EEG foram propostas, como em (Fraschini et al. 2015),
que realizou a tarefa de verificação biométrica em cima da base de dados de EEG Phy-
sionet (Goldberger et al. 2000) (também utilizada no presente trabalho). Nessa base
existem sinais de sujeitos em estado de repouso e é feita uma análise em dois cenários:
olhos abertos (EO) e olhos fechados (EC). Os autores fizeram um estudo sobre as fai-
xas de frequência comumente empregadas e constaram que a faixa gamma (30-50 Hz),
onde foi reportado um equal error rate de 4,4% é mais discriminante que as outras.
A abordagem é baseada em sincronização de fases, na qual o Eigenvector Centrality é
obtido a partir de cada nó (sujeito) que está inserido na rede para compor o vetor de
caracterı́sticas e então efetuar a classificação.
No trabalho proposto por (Yang et al. 2016), são consideradas quatro tipos de tarefas,
em que os sujeitos realizam tarefas motoras ou imaginárias durante a gravação dos sinais
e somente nove dos 64 eletrodos foram escolhidos para participar dos experimentos. A
base de dados da Physionet é considerada e uma mistura de dados de treino a teste
são feitos a partir das quatro tarefas, em diferentes seções. O equal error rate (EER)
Introdução 3
Os protocolos de testes utilizados pelas abordagens baseadas em CNN para EEG (Das
et al. 2017, Ma et al. 2015, Mao et al. 2017), usam bases de dados e abordagens diferentes,
não permitindo comparações. O único que permitiria comparações é o trabalho de
Ma et al. (2015), contudo, foram utilizados somente dados de 10 indivı́duos, dos 109
disponı́veis e usando o modo biométrico de identificação, inviabilizando comparações.
Neste trabalho, os resultados alcançados mostram que o uso de CNN para biometria
com EEG é um caminho promissor, pois conseguiu resultados que superaram trabalhos
considerados estado-da-arte em verificação, como os trabalhos de (Fraschini et al. 2015)
e (Yang et al. 2016), reduzindo o EER de 0,19% para EO-EC e para 0.08% usando
tarefas.
4 Introdução
1.1 Objetivos
1.2 Estrutura
Fundamentação Teórica
Este capı́tulo apresenta a base teórica dos temas abordados na dissertação e é organi-
zado da seguinte forma: A Seção 2.1 apresenta uma discussão sobre pré-processamento
de sinais. A Seção 2.2 trata dos conceitos básicos sobre biometria, a Seção 2.3 sobre
aprendizado em profundidade e redes neurais de convolução. A Seção 2.4 explica a
técnica de data augmentation. e finalmente, a Seção 2.5 explica a base de dados da Phy-
sionet, de onde surgiu e quais são os objetivos da mesma. A familiarização do leitor com
esses conceitos é de fundamental importância para o entendimento do trabalho como
um todo.
Os sinais de EEG enfrentam um grande desafio na sua captação, pois há muitas li-
mitações nos sensores que efetuam a captação de caracterı́sticas cerebrais de pessoas.
Dados brutos de EEG são vulneráveis à contaminação de diversos ruı́dos, entre es-
tes estão: atividades elétricas de movimentos corporais, ruı́do térmico e batimentos
cardı́acos. A extração também passa por limitações como a propagação do sinal por
camadas da cabeça, tal como osso e couro cabeludo. A interação entre os sensores e os
sinais também representam barreiras por gerar impedância, que é reduzida com uso de
gel condutor (Ma et al. 2015).
5
6 Fundamentação Teórica
2.2 Biometria
Formas de biometria tradicionais como impressão digital (Batool and Tariq 2011) e
face (K. et al. 2009) são mais difundidas atualmente, porém novas tecnologias de ex-
tração de caracterı́sticas estão sendo desenvolvidas e assim surgem sistemas biométricos
providos de novas fontes, tais como: iris, áudio, sinais vitais, marcha, eletrocardiograma,
e eletroencefalograma.
Para um sistema ser qualificado como biométrico deve ser composto por qualquer carac-
terı́stica fı́sica ou comportamental que é denominada modalidade biométrica e tem que
satisfazer uma série de requisitos, que segundo (Jain et al. 2004) são:
De acordo com (Lumini and Nanni 2017), diferentes sistemas biométricos seguem um
mesmo padrão que é composto por 4 componentes:
4. Módulo de Decisão: Neste módulo a identidade é aceita ou rejeitada, com base nos
graus de similaridade do módulo de comparação, ou seja, verifica se o indivı́duo é
quem ele proclama ser, ou se pertence a um certo grupo de indivı́duos.
Ainda de acordo com (Lumini and Nanni 2017), um sistema biométrico é basicamente
um sistema de reconhecimento de padrões, onde são adquiridos dados biométricos de
um indivı́duo e comparado a um conjunto de dados armazenados no banco de dados.
E dependendo do contexto o sistema biométrico pode operar nos modos de registro,
verificação ou identificação, como descritos a seguir.
1. Modo de Verificação: Neste modo, o usuário fornece sua identificação por meio de
uma modalidade biométrica e o sistema é responsável por efetuar a validação caso
o indivı́duo seja quem ele proclama ser, em outras palavras, o sistema compara
com informações presentes no banco de dados, referentes à identidade previamente
informada ao sistema. O modo de verificação é também conhecido como identi-
ficação positiva (na qual o propósito é dar acesso exclusivo a somente uma pessoa),
algumas aplicações mais difundidas são as senhas alfanuméricas e cartões de reco-
nhecimento.
genuino, se S(X1 , X2 ) ≥ t
(X1 , X2 ) ∈ (2.1)
impostor, caso contrário
Fundamentação Teórica 9
A tarefa de verificação pode ser modelada pela Equação 2.1, onde S é a função que
mede a similaridade entre dois vetores de caracterı́sticas (X1 e X2 ), essa medida é
feita utilizando distância euclidiana e t é um limiar predefinido (Jain et al. 2004).
A identidade de uma pessoa é reivindicada e classificada como genuı́na quando
os pares são semelhantes e impostor caso contrário. Depois disso, as curvas de
distribuição genuı́nas (intra-classe) e impostor (inter-classe) são geradas a partir
de pontuações de similaridade.
Ik , Se max S(XIq , XIk ) ≥ t, k = 1, 2, ..., N
(Xq ) ∈ k (2.2)
I
N +1 , caso contrário
A formulação matemática por dissimilaridade pode ser expressa pela Equação 2.2,
na qual Xq é o vetor de caracterı́sticas, Ik é a identidade a ser comparada as outras
no banco de dados (k ∈ 1, 2, ..., N, N + 1). Se o vetor não combinar com algum
dos vetores armazenados no banco de dados, será considerado do tipo N + 1, ou
não pertencente ao grupo.
Em geral, a grande maioria dos trabalhos de biometria com EEG se dão no cenário
de identificação, e diversos autores reportam 100% de reconhecimento (vide Capı́tulo 3)
de indivı́duos, isso se dá devido a carência de um protocolo experimental, dificultando
a comparação de resultados. Inicialmente, a referencia base do presente trabalho é o
artigo apresentado em (Fraschini et al. 2015) que utiliza um protocolo rı́gido, baseado em
verificação. O protocolo é reprodutı́vel e mais adequado para efeitos comparativos entre
trabalhos da literatura. Ainda, este protocolo é desafiador pois há grande dificuldade
em obter desempenhos próximos da otimalidade.
10 Fundamentação Teórica
O EER é definido como o ponto em que a FAR é igual a FRR. As curvas FARs e
FRRs são originados a partir da comparação de pares intra-classe e inter-classes. Já
a curva DET é formada por meio de comparação das instâncias do conjunto de teste,
num esquema todos contra todos, para a tarefa de verificação. Na curva DET é plotada
a taxa de erro nos dois eixos, fornecendo tratamento uniforme para os tipos de erros
amostrados, e é utilizada uma escala para ambos os eixos, que efetua uma difusão do
gráfico, melhorando a distinção de diferentes sistemas com bom desempenho (Martin
et al. 1997). Na Figura 2.1 é possı́vel a visualização da relação das taxas de erro e o
ponto onde encontra-se o EER.
Figura 2.1: Curva DET com a relação entre FAR, FRR e EER. Extraı́da/adaptada
de (Du and Chang 2007).
processa e armazena dados para possı́vel uso no futuro é algo almejado para o ramo de
inteligência artificial e, inclusive, há razões para acreditar que o sistema visual humano
contém modelos generativos de múltiplas camadas (Felleman and Essen 1991, Lee et al.
1998) e inclusive fı́sicos.
As redes neurais de convolução (LeCun et al. 1989), que também são conhecidas por
redes neurais convolutivas, ou CNN, são um tipo especializado de redes neurais para
processamento de dados e possuem uma topologia conhecida e semelhante a uma grade.
Estas redes tem imenso sucesso em aplicações práticas que envolvem visão computaci-
12 Fundamentação Teórica
onal. O nome rede neural de convolução indica uma operação matemática denominada
convolução. A convolução é um tipo especializado de operação linear e redes convolutivas
são basicamente nós em camadas que fazem uso da convolução ao invés da multiplicação
da matriz geral em pelo menos uma de suas camadas.
O processo de uma rede neuronal convolucional tal como descrito em (Pinto and Cox
2011) é ilustrado pelo diagrama da Figura 2.2. Em resumo as redes neuronais convolu-
cionais são compostas de múltiplas camadas, onde cada uma delas realiza um processo
de filtragem por um banco de kernels(convolução), ativação, pooling e normalização.
N ormalizaçã
Camada 0: Entrada −−−−−−−→ N 0
Fundamentação Teórica 13
A entrada para o processo de Filtragem é uma amostra N j−1 . Esta amostra é filtrada
utilizando um banco de k j filtros denotado por Φj para gerar uma amostra multi-banda
com k j bandas denotado por F j . Cada banda da amostra multi-banda F j é dado por:
onde ◦ denota a operação de convolução sobre a saı́da da camada anterior N j−1 com o
filtro Φji . De fato os filtros de Φj tem três dimensões, onde a terceira dimensão é igual
ao número de bandas da saı́da da camada anterior, i.e., k j−1 . O processo de filtragem
tem os seguintes parâmetros:
• O tamanho dos filtros tridimensionais fsj × fsj × fdj , onde fdj = k j−1
No método proposto em (Pinto and Cox 2011), todos os filtros são gerados aleatori-
amente com uma distribuição uniforme, média 0 e norma 1. Já em (LeCun et al. 1998),
os coeficientes dos filtros são aprendidos por meio de um processo supervisionado.
1 Se x < 0.
Ativação(x) = (2.3)
0 Caso contrário.
Este processo de ativação visa justamente imitar a função de um neurônio que tem
seu sinal de saı́da ativado apenas se uma determinada quantidade de energia é recebida.
qj
p j
j
P = Subamostragemα ( (Aji )p I(aj × aj )) (2.4)
• O exponente pj
Pj
Nj = (2.5)
kP j ⊗ I(bj × bj × k j )k
Técnicas de data augmentation estão sendo propostas para superar o problema da es-
cassez de dados, esta técnica pode ser feita de diversas maneiras, e com maior facilidade
em problemas de visão computacional, pois pode-se gerar dados novos com muita facili-
dade através de manipulações de imagem, como mudança no escalonamento, rotação e
outras transformações afim(DeVries and Taylor 2017). Estas técnicas básicas irão per-
mitir o foco não só globalmente, como também localmente nas imagens, dando ênfase a
objetos que poderiam não ser detectados com as imagens originais, permitindo assim o
modelo a aprender mais para obter maior generalização.
Enfim, existem diversas maneiras de aumentar os dados da base de treino para obter
16 Fundamentação Teórica
melhores resultados, a melhor forma vai depender muito das caracterı́sticas do problema
em questão. Nesta dissertação o uso de sobreposição dos dados foi aplicada e a descrição
do método é explicitada na Seção 4.2.2.
A Physionet (Goldberger et al. 2000) é uma popular base de dados que oferece acesso
gratuito a diversas coleções de registros de sinais fisiológicos. É um serviço público do
PhysioNet Research Resource for Complex Physiologic Signals e tem financiamento pelo
National Institute of General Medical Sciences (NIGMS) e pelo National Institute of
Biomedical Imaging and Bioengineering (NIBIB).
O PhysioNet Resource foi criado no ano de 1999 e tem como finalidade estimular
investigações no estudo de sinais biomédicos e fisiológicos complexos tal como pesquisas
atuais.
Algumas bases de dados são voltadas para sinais de eletroencefalograma, e uma delas
é muito popular para uso em testes de sistemas biométricos, é disponı́vel publicamente1 .
As gravações foram adquiridas de 109 sujeitos diferentes, utilizando 64 eletrodos posi-
cionados na região do escalpo para armazenar os sinais (Conforme a Figura 2.4), cada
1
http://physionet.org/pn4/eegmmidb/
Fundamentação Teórica 17
eletrodo é amostrado na frequência de 160 Hz. A base de dados foi criada pelos desen-
volvedores do sistema de instrumentação BCI2000 e mantido pela Physionet. A Figura
2.3 mostra o sinal de EEG do eletrodo (FC5 ) nos primeiros 10 segundos de gravação,
onde cada grid corresponde a 0,2 segundos
Na base de dados há 14 diferentes sessões de aquisições para cada indivı́duo. Duas
dessas 14 sessões contém 60 ou 61 segundos de duração, uma feita com o paciente em
estado de repouso com os olhos abertos (EO) e outra com olhos fechados (EC). As 12
sessões restantes tem dados de 2 minutos de gravação cada, na qual os indivı́duos realizam
4 diferentes tarefas motoras ou imaginárias (T1-T4) em 3 sessões ou runs (R1-R3), as
atividades atribuı́das as tarefas são:
Revisão da Literatura
A biometria com sinais de EEG é um método muito promissor, por, teoricamente, ser
menos suscetı́vel a fraudes, que podem ser efetuadas em outras formas de biometria.
Sinais de EEG são formados pelo fluxo da corrente iônica dos neurônios do cérebro.
No cérebro há várias regiões e cada uma é ativada conforme a necessidade corporal.
São normalmente explorados em aplicações médicas para diagnóstico de doenças como
vasculares cerebrais, epilepsias e outros distúrbios (Subasi and Ismail Gursoy 2010).
Usados na maioria dos estudos direcionados à biometria com EEG, as bases de dados
contém sinais gravados de indivı́duos em estado de repouso com olhos abertos (EO) ou
com olhos fechados (EC) (Pozo-Banos et al. 2014). Por isso a Seção 3.1 aborda sobre
trabalhos que utilizam estas bases de dados e a Seção 3.2 é sobre trabalhos direcionados
a bases de dados com gravações de indivı́duos realizando tarefas motoras ou imaginárias.
Em 1980 a biometria com EEG foi introduzida por (Stassen 1980), em seu trabalho o
objetivo era caracterizar uma pessoa por meio do padrão de espectro de EEG e classificar
o espectro utilizando uma modificação de um método de reconhecimento de fala. A
investigação se mostrou promissora, pois obteve 90% de probabilidade de confiança para
análise de 82 sujeitos com idade entre 20 e 35 anos.
19
20 Revisão da Literatura
(Paranjape et al. 2001) fez uma análise sobre 349 segmentos de EEG a partir de 40
indivı́duos, do qual aplicou modelos autorregressivos em várias ordens, fez uma análise
discriminante e conseguiu 80% de acurácia na identificação de pessoas.
(Palaniappan and Mandic 2007a) propôs uma análise sobre a capacidade de potências
de frequência dominante nos sinais VEP (Visual Evoked Potential ) aplicada à frequência
gamma para realização de biometria, utilizando um conjunto de dados abrangentes e
várias técnicas de classificação. As técnicas utilizadas compreendem K-Nearest Neighbor
(KNN), classificadores da Elman Neural Network (ENN) e 10-fold Cross Validation. A
acurácia máxima foi obtida pelo ENN com média de 98.12 (desvio padrão).
O trabalho de (Tangkraingkij et al. 2009) analisa quais os eletrodos de EEG que tem
maior potencial para identificação biométrica, ou seja, os que são mais discriminantes. A
gravação dos dados foi feita com os indivı́duos em estado de repouso com olhos abertos
e o algoritmo de análise de componentes independentes foi usado para separar dados
de EEG derivados de vários canais e separá-los em fontes independentes. Após isso
aplicaram rede neural para classificação. A classificação obteve 100% de acurácia para
20 indivı́duos, usando todos os 16 eletrodos disponı́veis e conseguiram manter o resultado
usando apenas 3, apontando os mais discriminantes, são eles: Fp1, P3 e C4, que podem
ser vistos na Figura 3.1.
Algumas abordagens com redes neurais de convolução também foram propostas, (Ma
et al. 2015) fez uso de CNN com 5 camadas, contendo duas camadas de convolução, duas
de pooling e finalizando com uma fully connected. A avaliação é dada em cima da base
de dados da Physionet, contudo, de 109 indivı́duos somente 10 foram selecionados para
teste. Dos 60 segundos disponı́veis, 55 foram separados em fragmentos de 1 segundo para
treinamento e os 5 restantes para teste amostrados a 160 Hz. Filtros passa-banda são
empregados em diversas faixas de frequência. Os testes foram executados com dados dos
indivı́duos em estado de repouso com olhos abertos, olhos fechados e ambos. As taxas
de classificação no cenário de identificação variaram de 64 a 86%.
3.2 Multitarefas
O primeiro estudo sobre atividade mental para biometria baseada em EEG foi em (Pa-
laniappan 2005). Neste trabalho foram extraı́das caracterı́sticas a partir de um modelo
autorregressivo (AR) de sexta ordem. A base de dados utilizada contém dados de 9 in-
divı́duos amostradas a 250 Hz e os sinais foram adquiridos durante 10 segundos para cada
tarefa com 6 eletrodos. Quatro tarefas são realizadas durante as sessões de gravação:
cálculos matemáticos, observar uma figura geométrica rodando, composição de cartas
Revisão da Literatura 23
Em (Yang et al. 2016) foi usada a transformada Wavelet numa forma discreta, que tá
sendo muito bem avaliada pela comunidade cientı́fica, uma vez que porque tem capaci-
dade de capturar informação de sinais nos domı́nios de tempo e frequência. As frequência
são divididas em nı́veis de classificação do qual dois são utilizados, o primeiro varia de
20 em 20 Hz no domı́nio de 0 a 80, e o segundo de de 10 em 10 Hz no mesmo domı́nio.
Os dados EEG adquiridos de I eletrodos são segmentados em tempo em N janelas so-
brepostas; Cada janela sobrepõe seu vizinho em 50%. Para uma dada janela de tempo,
os dados de cada um dos eletrodos são transformados usando a transformada wavelet
packet decomposition (WPD) multi-nı́vel seguido por uma fase de realce de caracterı́stica
onde as derivadas dos coeficientes WPD são calculadas. Para cada uma destas faixas
melhoradas, o desvio padrão (SD) é calculado. Os SD para todas as bandas e todos os
eletrodos são então concatenados para produzir o vector de caracterı́sticas para classi-
ficação utilizando um classificador LDA. As decisões do classificador de todas as janelas
24 Revisão da Literatura
de tempo são fundidas usando uma regra de votação majoritária. Os desempenhos deste
sistema foram investigados para os cenários de identificação e verificação e a base de
dados utilizada contém dados de pessoas executando as tarefas descritas na seção 2.5.
Três protocolos de testes foram adotados por (Yang et al. 2016), o primeiro protocolo
investiga o impacto das regiões de eletrodos (lobo frontal, córtex motor e lobo occipital)
e tipos de tarefas no desempenho do sistema. O segundo explora o uso de diferentes
tarefas para treinamento e teste do sistema e consiste em usar dados de teste diferente
dos dados de treino. Finalmente, o terceiro analisa a eficácia da combinação de dados de
diferentes tarefas para treinamento com teste em apenas um tipo de tarefa e gravação
(run T1R2). O resultado obtido foi 100% de acurácia no cenário de identificação e
2,63% EER no melhor cenário para verificação treinando nas tarefas T1+T2 e testando
em T1R2, com uso de 9 eletrodos.
Uma abordagem de CNN é proposta por (Das et al. 2017) no qual os sinais passam
por filtragem para redução de ruı́dos e na CNN são consideradas as seguintes camadas:
uma de convolução, duas max pooling, uma de ativação, uma de perda e finalmente a
fully connected. No protocolo de testes, foram adquiridos dados de 40 indivı́duos, onde
os mesmos são submetidos a estı́mulos visuais a partir de uma sequência de formas
geométricas que são mostradas em um monitor. O circulo é considerado estı́mulo alvo
e os observadores devem se concentrar nas ocorrências do alvo, ignorando o restante.
Uma taxa de acurácia de 98,8% é encontrada para o esquema não-alvo contra não-alvo
e 90.65% para alvo contra não-alvo.
Capı́tulo 4
Neste capı́tulo será descrita a metodologia empregada para biometria baseada em EEG
através de rede neural de convolução. A Seção 4.1 descreve o pré-processamento utilizado
para filtrar os sinais e as bandas de frequência utilizadas. A Subseção 4.2.1 explica como
é feita a divisão dos dados para treino, teste e validação e a Subseção 4.2.2 irá explicar
como a técnica de data augmentation é utilizada. Por fim, a Seção 4.3 descreve a
metodologia de obtenção da arquitetura e parâmetros para a rede neural de convolução.
4.1 Pré-Processamento
Um filtro passa banda FIR (Filtro de resposta a impulso finita) é responsável pelo
processo de filtragem e foi utilizado para obter os sinais nas faixas de frequências dese-
jadas, foram escolhidas 3 frequências de corte para realizar os experimentos. A primeira
banda cobre das frequências delta até gamma (1-50Hz), a segunda está relacionada ao
25
26 Rede Neural de Convolução para Biometria Baseada em EEG
Delta < 4 Hz
Theta 4-7 Hz
Alpha 8-12 Hz
Beta 12-35 Hz
Gamma > 35 Hz
final da alpha até a high beta (10-30 Hz) e a terceira preserva o final da beta até a faixa
gamma (30-50 Hz).
A etapa de treinamento para CNN consiste em apresentar os dados que vão ser
responsáveis por ajustar o modelo, com o objetivo de emparelhar a entrada com o
resultado esperado.
Os dados de teste devem ser independentes dos dados de treinamento, porém segue
a mesma distribuição de probabilidade que o conjunto de treino. O objetivo é treinar
o modelo e generalizar o desempenho de um classificador, fazendo-o se encaixar bem
no conjunto de dados de teste, ou seja o conjunto de dados de testes é um conjunto de
amostras de exemplos para testar a eficácia do modelo.
Figura 4.1: Exemplo de distribuição dos segmentos de EEG usados para treino em EO
e teste em EC.
Seguindo o protocolo de avaliação proposto por (Fraschini et al. 2015), os dados de EEG
foram divididos em segmentos de 12 segundos cada (1920 amostras), portanto, ao dividir
os 60 segundos de EO e EC, resultaria em 5 segmentos por indivı́duo e para tarefas (T1-
T4) 10 segmentos. No entanto, 5 ou 10 segmentos por indivı́duo não é suficiente para
treinamento de uma rede neural de convolução.
riabilidade no modelo, porém nos sinais de EEG isso pode gerar perda de caracterı́sticas,
por esse motivo a sobreposição dos dados foi proposta, mantendo o sinal original mas
multiplicando sua quantidade nas instâncias de treino.
Figura 4.2: Data augmentation com janela deslizante de tamanho 12 segundos. Temos
em a) janela na posição offset 0, primeiro segmento criado. b) offset de 5 segundos. c)
offset de 10 segundos e d) último segmento criado, após a janela deslizar sobre todo o
sinal.
Assim como citado na Subseção 2.3.1, uma rede neural de convolução necessita de uma
arquitetura, e sua estrutura tı́pica é composta de uma série de operações empilhadas que
inicia com camadas de convolução, seguido por ativação, no caso do presente trabalho
com ReLu, pooling, normalização e enfim, camadas fully connected (LeCun et al. 2015).
Na Figura 4.3 pode-se ter uma noção melhor do funcionamento do modelo adotado.
A entrada tem tamanho 1920 × 1 × 64, e os filtros são unidimensionais, proporcional-
mente adaptados para o sinal de EEG. O valor 1920 corresponde a um segmento de 12
segundos, o valor 1 significa que o sinal é uni-dimensional e finalmente, 64, corresponde
a quantidade de eletrodos disponı́veis.
A biblioteca MatConvNet (Vedaldi and Lenc 2015) foi utilizada para a criação e
treinamento da CNN, esta biblioteca foi criada para ser utilizada no MATLAB, sua
implementação é open source e é voltado para aplicações de visão computacional.
Experimentos e Discussões
No presente trabalho a base de dados Physionet (Goldberger et al. 2000) foi utilizada
para treinamento e avaliação do método proposto. A base foi melhor detalhada na Seção
2.5, porém com o intuito de facilitar a leitura do documento, é novamente apresentada
aqui.
31
32 Experimentos e Discussões
está relacionada a uma diferente tarefa, seja ela motora ou imaginaria, onde o indivı́duo
recebe a instrução para executá-la durante a gravação. Considerando essas 14 sessões,
há duas sessões base que contém 60 ou 61 segundos cada, nas duas o sujeito está em
estado de repouso, uma com os olhos abertos (EO) e outra com os olhos fechados (EC).
O restante das sessões estão relacionadas a 4 tipos de tarefas (T1-T4), em 3 sessões de
captação de sinais (R1-R3) e as amostras contém dois minutos de gravação. Na primeira
e terceira tarefa são executadas ações imaginárias e na segunda e quarta ações motoras.
5.2 Experimentos
A realização dos experimentos neste trabalho, foi separada em duas partes. Ini-
cialmente foram executados testes referentes às amostras baseline (EO-EC), buscando
investigar a faixa de frequência mais discriminante. A segunda parte dos experimen-
tos foram executados utilizando a melhor banda de frequência dos testes baseline para
algumas tarefas e testar seu funcionamento em ambientes menos controlados.
Durante a fase de treino, 90% dos dados são separados pra treinamento e 10% para
validação, assim como foi explicado na Seção 4.2.1. O data augmentation é usado nos
dados de treino e para a seção de EO, permitiu criar 384 ou 392 (de 60 ou 61 segundos
disponı́veis) segmentos de 1920 amostras (12 segundos) por indivı́duo. Para as sessões
envolvendo tarefas (T1-T4), são criados 889 ou 905 (123 ou 125 segundos) segmentos
para cada indivı́duo.
Na CNN três learning rates (LRs) são distribuı́dos durante 60 épocas, a distribuição
pode ser vista na Tabela 5.2. Essa distribuição de LRs foi obtida pela observação do
erro de validação, quando o erro estagnava, o LR era dividido por 10. Os mini batches
tem tamanho 100 para demandar menos recursos de memória e coeficiente de momento
em 0.9 (para acelerar a descida do gradiente) são considerados durante todo o treino.
O peso dos filtros é inicializado aleatoriamente e o algoritmo stochastic gradient descent
(SGD) é usado para otimização. A operação de dropout é posicionada após a última
camada, em 10% para melhora na validação.
34 Experimentos e Discussões
LR Épocas
0.01 2
0.001 35
0.0001 23
Os testes são realizados em EC, quando o treino é feito em EO, e T1R2, quando
envolvem tarefas. O uso de sobreposição dos dados (data augmentation) é descartado,
pois somente na fase de treino é necessária grande quantidade de dados, visando a
generalização e melhor aprendizado do modelo e também para manter compatibilidade
com o protocolo de (Fraschini et al. 2015) para avaliação, com mesma quantidade de
pares intra-classes e inter-classes na tarefa de verificação. Para teste 5 segmentos são
extraı́dos de EC e 10 segmentos de T1R2.
A Tabela 5.3 mostra o EER obtido para cada faixa de frequência testada, na banda
que compreende 01-50 Hz, o EER obtido é de 11.2%, obtendo o pior resultado relativo
aos testes de frequência. Na faixa referente a 10-30 Hz o EER obteve uma melhora
considerável, com 6.25%. A faixa gamma, de 30-50 Hz se destacou, pois conseguiu
0.19% de EER, a performance foi absolutamente maior que o restante dos testes.
A Figura 5.1 mostra o desempenho dos experimentos realizados por meio da curva
DET, a curva expressa a relação entre FAR, FRR e EER por meio de variação de limiar.
A curva relacionada a frequência de 30-50 Hz superou todos os outros experimentos e
também resultados publicados na literatura. Como mostrado por (Fraschini et al. 2015),
a melhor faixa de frequência para biometria baseada em EEG é a faixa gamma, embora
a discrepância de resultados com as outras faixas de frequência são maiores aqui.
Experimentos e Discussões 35
0.3
Freq. 01-50Hz
Freq. 10-30Hz
Freq. 30-50Hz
0.25
0.2
False Rejection Rate
0.15
0.1
0.05
0
0 0.05 0.1 0.15 0.2 0.25 0.3
False Acceptance Rate
Figura 5.1: Curva DET para os experimentos propostos testando as faixas de frequência.
Na Tabela 5.4 encontra-se uma comparação com o trabalho de (Fraschini et al. 2015),
considerado estado-da-arte na biometria de EEG. E como pode-se perceber o método
proposto com o uso de redes neurais de convolução reduziu de forma significativa o EER.
O protocolo de testes utilizado é o mesmo, por isso os efeitos comparativos tornam-se
válidos para os métodos.
Em (Yang et al. 2016), foi proposta uma mistura de dados de treinamento e teste
36 Experimentos e Discussões
para T1-T4, incluindo treino com uma ou mais tarefas com teste em T1R2, treino nas
4 tarefas individualmente usando a R1 e R3 delas e testando em todas as tarefas em
R2. No entanto, nesta dissertação o treinamento é realizado com todos os registros de
tarefas disponı́veis na base de dados, com exceção de T1R2, que foi escolhida para teste,
sem acúmulo de tarefas nos dados de treino.
Os resultados dos testes multitarefas podem ser vistos na Tabela 5.5. A arquitetura
não generalizou para todas as tarefas propostas, porém para T2R1-T1R2 e T1R1-T1R2
obteve resultados bons, em um deles inclusive, superou o melhor dos testes baseline (EO-
EC) feitos nesta dissertação. A mesma arquitetura foi utilizada nos dois cenários, no
entanto, nos testes baseline o aprendizado é facilitado, pois há evidências que em estado
de repouso, as atividades elétricas se organizam e coordenam as funções neuronais (Ma
et al. 2015), trabalhando de uma forma mais sistematizada, esta mesma arquitetura não
funcionou bem para tarefas, apesar de ter obtido EER de 0,08%, no caso de T1R1-T1R2
e 0,2% para T2R1-T1R2.
A Figura 5.2 representa o desempenho dos dois melhores resultados obtidos expressos
pela curva DET. As curvas referentes aos outros resultados obtidos não foram feitas
por não obterem desempenho comparável, inseri-las geraria uma discrepância enorme,
impossibilitando a visualização das curvas referentes a T1R1-T1R2 e T2R1-T1R2.
Figura 5.2: Curvas DET dos resultados satisfatórios obtidos com o uso de tarefas.
Na Tabela 5.6 encontra-se uma comparação com o trabalho de (Yang et al. 2016), que
fez testes com uma mistura nos dados de treino e testes nas tarefas, o autor conseguiu
no melhor caso 2,63% EER treinando em T1+T2 e testando em T1R2. O método
proposto nessa dissertação parece ser promissor, pois os resultados encontrados que estão
demonstrados na tabela reduziram muito o EER, e a utilização de 64 eletrodos também
mostra a robustez do método, visto que nem todos os eletrodos contribuem para a
identificação de indivı́duos (Yang et al. 2016), alguns podem se comportar somente como
sinais ruidosos e prejudicar a eficácia do método. Novos experimentos são desejáveis com
uma menor quantidade de eletrodos mais biometricamente relevantes para verificar se
pode haver melhora nos resultados. O presente trabalho deixa a desejar na generalização.
Três trabalhos foram encontrados na literatura que usam CNN para biometria ba-
seada em EEG (Das et al. 2017, Ma et al. 2015, Mao et al. 2017), todos eles usam o
38 Experimentos e Discussões
modo de identificação, cada um com uma base de dados diferente. O único que propôs
testes na base da Physionet foi (Ma et al. 2015), todavia, os autores usaram somente
dados de 10 indivı́duos, facilitando as chances de acertos, pois quanto menor a quanti-
dade de indivı́duos, menores são as chances de erro, tornando assim o protocolo mais
fraco. Nenhum dos trabalhos utilizou do artifı́cio de data augmentation para gerar maior
quantidade de dados para treinamento.
Os melhores resultados encontrados nas tarefas (vide Tabela 5.5) mostram que o uso
de CNN para biometria com EEG é possı́vel e se for encontrada uma arquitetura capaz
de fazer uma generalização mais efetiva este será um caminho promissor.
39
40 Conclusões e Trabalhos Futuros
e T1R1, com 0,2% e 0,08% de EER, respectivamente, mostrando que resultados próximos
da otimalidade podem ser alcançados. O único problema foi a não generalização para o
restante dos testes.
Novas investigações devem ser realizadas, com o propósito de promover uma gene-
ralização maior com testes multitarefas. Podem ser exploradas: a proposta de novas
arquiteturas, exploração de outras faixas de frequência e apuração no uso de data aug-
mentation com novas técnicas e diferentes sobreposições de sinais.
O sistema biométrico baseado em EEG pode ser promissor no futuro por ser difı́cil
de ser clonado e, como os sinais mudam conforme o pensamento/tarefa que está sendo
executada pelo indivı́duo, fornece mais integridade e autenticidade nesta modalidade
biométrica. Com os grandes avanços tecnológicos nos aparelhos de captação de sinais
de EEG, pode-se promover uma difusão nessa modalidade futuramente, pois esta ainda
lida com problemas como bases de dados com pouca quantidade de indivı́duos.
Apêndice A
Apêndices
A.1 Publicações
41
Convolutional Network for EEG-Based
Biometric
1 Introduction
Humankind has urged for safety in all spheres of our society, thus, as technology
evolves in this direction, also evolves efforts to overcome security systems. In
this context, current biometric systems are in constant development, and new
forms of capture discriminant and robust traits among people are desirable.
The present work deals with the use of electroencephalogram (EEG) signals for
biometry task, since the EEG is difficult to fake or steal.
The seminal work presented in [8] showed the feasibility of using the EEG to
biometric task, and since that, many approaches using EEG have been proposed
such as in [2] where authors performed biometric verification on Physionet EEG
database. Authors concluded that the best frequency band for EEG biometric is
the gamma band (30-50 Hz), where they reported 4.4% of equal error rate (EER).
Their approach is based on phase synchronization, in which the Eigenvector
Centrality obtained from every node (subject) is the feature vector. Signals on
resting condition are considered for the analyses in two scenarios.: eyes open and
eyes closed.
In [12], four different task conditions, related to signal motor movement and
imagery tasks are investigated. A novel wavelet-based feature was used to extract
EEG feature. Experiments were conducted in Physionet EEG data and a mixture
of data, from different sessions, is used for training. Only nine electrodes are
considered and the lowest EER achieved is 4.5%.
Several machine learning and pattern recognition techniques were investi-
gated aiming to identify a person by means of EEG signals, however, to the best
of our knowledge, deep learning based methods as Convolutional Neural Net-
works (CNN) [7] have not been evaluated yet. Deep learning has been used to
represent patterns in several computer vision and patterns recognition problems,
and outstanding results have been reported [1, 5].
In this work, a novel approach for EEG representation based on deep learning
is proposed. The approach is also evaluated on the Physionet database, and
data augmentation techniques are explored to train a deep convolutional neural
network. Results show that the use of CNN in EEG biometrics is a promising
path, outperforming baseline methods by lowering the EER from 4.4% to 0.19%
in the best scenario.
The remainder of this paper is organized as follows. Section 2 contains the
approach with the methodology and a description of the database used. In Sec-
tion 3, we show the experimental results and a discussion about it. Finally, in
Section 4, the conclusions are presented.
2 Approach
In this section, the Physionet EEG database is described as the proposed method,
based on the convolutional network, along with the required pre-preprocessing
steps.
2.2 Methodology
Data pre-preprocessing: To further investigate the feasibility of the method,
only resting state EEG data is considered. Thus, the baseline sessions - data
captured where the subject is with EO and EC - are used during experiments.
All EEG recording signals are band-pass filtered in 3 frequency bands. The
first band covering from delta to gamma frequencies (1-50 Hz), the second band
3
http://physionet.org/pn4/eegmmidb/
4
http://www.bci2000.org
are related to low to high beta (10-30 Hz), and the third one preserves the range
of gamma (30-50 Hz) frequency. A total of 61 seconds of raw wave are used for
training and test.
per subject. For evaluation, five segments of 12 seconds are extracted for each
subject from EC session, i.e., no overlapping during the test (See Figure 3).
During training, the input signal, represented by a 12 seconds length EEG
time series, is feed-forwarded through network layers. Each layer represents
one or more CNN operations: convolutional filter; pooling; stride; rectification
(RELU); normalization (L2 Norm). Convolutional stride and padding are set to
one. Pooling layer performs a max-pooling operation, and when there is down-
sampling (stride > 1), it happens in conjunction with pooling. The stack of
layers are followed by Fully-Connected (FC) layers and the last FC layer is for
classification. These FC layers can be seen as multi-layer-perceptron (MLP) net-
work.
The final layer is a soft-max loss one. The FC layer with 1×1 filter size is used
for dimension reduction and rectified linear activation. The network architecture
is presented in Table 1.
For training the network, three learning rates of value L = [0.01, 0.001, 0.0001]
are distributed over the epochs, mini batches are set to size 100, and a momentum
coefficient of 0.9 is considered during all training. Filter weights are randomly
initialized and stochastic gradient descent is used for optimization. The dropout
operation is placed before the last layer with 10% to minimize overfitting.
During the training phase, 90% of the data is reserved for training and 10%
for validation as shown in Figure 3. The CNN are trained for over 60 epochs.
Evaluation is carried in verification mode and the metric used to report re-
sults is Equal Error Rate (EER) which, in turn, is defined as the point where the
Fig. 3: The distribution of ECG segments used for training and testing.
False Acceptance Rate (FAR) is equal to the False Rejection Rate (FRR). FAR
and FRR are generated from intra-class and inter-class pairs comparison. The
present protocol produces 1086 genuine (intra-class) pairs and 146610 impostors
(inter-class) pairs. In Figure 4, DET curve shows the relationship between FAR,
FRR, EER by means of a threshold variation.
The DET curves in Figure 4 depicts the performance for the detailed ex-
periments. The curve related to 30-50 Hz resulted in an overall performance of
0.19% EER as shown in Table 2, overcoming results published in the literature.
As shown in Fraschini et. al. [2], the best frequency band for EEG biometrics is
the gamma band. The results presented here confirm the findings in [2] regard-
ing frequency band, however, the discrepancy of results with other frequency
bands was greater here. More experiments are needed to investigate whether
this phenomenon extends to other tasks (T1-T4) or even other databases.
Results presented in Table 3 compares the proposed method with state-of-
the-art approaches. As can be noticed, the proposed method significantly reduced
the EER. The usage of all 64 EEG channels shows the robustness of the method
since it was able to handle all electrodes, even if not all of them effectively
contribute to the identification of individuals [12].
4 Conclusions
In this work, the use of CNN in an EEG-based biometric system is investigated
for the first time. When compared to the baseline methods presented in the
0.3
Freq. 01-50Hz
Freq. 10-30Hz
Freq. 30-50Hz
0.25
0.2
False Rejection Rate
0.15
0.1
0.05
0
0 0.05 0.1 0.15 0.2 0.25 0.3
False Acceptance Rate
literature (under the Physionet EEG database), EEG data represented by the
CNN model showed a lower EER for person recognition (verification mode).
The contribution of this paper is the proposed deep CNN architecture and the
data augmentation technique, which is of paramount importance in the training
process. The sliding window strategy for generating new training samples allowed
the deep network architecture to learn efficiently even with reduced data.
Results showed that the proposed EEG-based biometric system can be a
promising method for future real-world applications since researchers are devel-
oping hardware to facilitate embedding a CNN model, such FPGA-based deep
learning acceleration and NVIDIA TX1 5 .
5
http://www.nvidia.com/
Acknowledgements
The authors thank UFOP and funding Brazilian agencies CNPq, Fapemig and
CAPES. We gratefully acknowledge the support of NVIDIA Corporation with
the donation of the Titan X Pascal GPU used for this research.
References
1. Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., Kuksa, P.:
Natural language processing (almost) from scratch. J. Mach. Learn. Res. 12, 2493–
2537 (Nov 2011), http://dl.acm.org/citation.cfm?id=1953048.2078186
2. Fraschini, M., Hillebrand, A., Demuru, M., Didaci, L., Marcialis, G.L.: An eeg-
based biometric system using eigenvector centrality in resting state brain networks.
IEEE Signal Process. Lett. 22(6), 666–670 (2015)
3. Goldberger, A.L., Amaral, L.A.N., Glass, L., Hausdorff, J.M., Ivanov, P.C., Mark,
R.G., Mietus, J.E., Moody, G.B., Peng, C.K., Stanley, H.E.: PhysioBank, Phys-
ioToolkit, and PhysioNet: Components of a new research resource for complex
physiologic signals. Circulation 101(23), e215–e220 (2000 (June 13))
4. Jain, A.K., Ross, A., Prabhakar, S.: An introduction to biometric recognition.
IEEE Trans. Cir. and Sys. for Video Technol. 14(1), 4–20 (Jan 2004)
5. Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classification with deep con-
volutional neural networks. In: Proceedings of the 25th International Conference
on Neural Information Processing Systems. pp. 1097–1105. NIPS’12, Curran As-
sociates Inc., USA (2012), http://dl.acm.org/citation.cfm?id=2999134.2999257
6. Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classification with deep con-
volutional neural networks. In: Pereira, F., Burges, C.J.C., Bottou, L., Weinberger,
K.Q. (eds.) Advances in Neural Information Processing Systems 25, pp. 1097–
1105. Curran Associates, Inc. (2012), http://papers.nips.cc/paper/4824-imagenet-
classification-with-deep-convolutional-neural-networks.pdf
7. LeCun, Y., Bengio, Y., Hinton, G.: Deep learning. Nature 521(7553), 436–444
(2015)
8. Poulos, M., Rangoussi, M., Chrissikopoulos, V., Evangelou, A.: Person identifi-
cation based on parametric processing of the EEG. In: Electronics, Circuits and
Systems, 1999. Proceedings of ICECS ’99. The 6th IEEE International Conference
on. vol. 1, pp. 283–286 (1999)
9. Reitermanov, Z.: Data splitting. In: WDS’10 –Proceedings of Contributed Papers.
pp. 31–36 (2010)
10. Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale
image recognition. CoRR abs/1409.1556 (2014), http://arxiv.org/abs/1409.1556
11. Vedaldi, A., Lenc, K.: Matconvnet – convolutional neural networks for MATLAB.
In: Proceeding of the ACM Int. Conf. on Multimedia (2015)
12. Yang, S., Deravi, F., Hoque, S.: Task sensitivity in EEG biometric recognition.
Pattern Analysis and Applications pp. 1–13 (2016)
13. Zeiler, M.D., Fergus, R.: Visualizing and Understanding Convolutional Networks,
pp. 818–833. Springer International Publishing, Cham (2014)
Referências Bibliográficas
Acquarelli, J., Marchiori, E., Buydens, L. M. C., Tran, T. N. and van Laarhoven, T.:
2017, Convolutional neural networks and data augmentation for spectral-spatial clas-
sification of hyperspectral images, CoRR abs/1711.05512.
URL: http://arxiv.org/abs/1711.05512
Batool, A. and Tariq, A.: 2011, Computerized system for fingerprint identification for
biometric security, 2011 IEEE 14th International Multitopic Conference, pp. 102–106.
Boubakeur, M. R., Wang, G., Zhang, C. and Liu, K.: 2017, Eeg-based person recogni-
tion analysis and criticism, 2017 IEEE International Conference on Big Knowledge
(ICBK), pp. 155–160.
Cecotti, H., Eckstein, M. P. and Giesbrecht, B.: 2014, Single-trial classification of event-
related potentials in rapid serial visual presentation tasks using supervised spatial
filtering, IEEE Transactions on Neural Networks and Learning Systems 25(11), 2030–
2042.
Das, R., Maiorana, E. and Campisi, P.: 2017, Visually evoked potential for EEG biome-
trics using convolutional neural network, 25th European Signal Processing Conference,
EUSIPCO 2017, Kos, Greece, August 28 - September 2, 2017, pp. 951–955.
URL: https://doi.org/10.23919/EUSIPCO.2017.8081348
Delorme, A., Sejnowski, T. and Makeig, S.: 2006, Technical note enhanced detection of
artifacts in eeg data using higher-order statistics and independent component analysis.
DeVries, T. and Taylor, G. W.: 2017, Dataset Augmentation in Feature Space, ArXiv
e-prints .
50
REFERÊNCIAS BIBLIOGRÁFICAS 51
Fraschini, M., Hillebrand, A., Demuru, M., Didaci, L. and Marcialis, G. L.: 2015, An eeg-
based biometric system using eigenvector centrality in resting state brain networks,
IEEE Signal Process. Lett. 22(6), 666–670.
Geisler, W. S. and Albrecht, D. G.: 1992, Cortical neurons: isolation of contrast gain
control, Vision Research 32(8), 2429–2454.
Goldberger, A. L., Amaral, L. A. N., Glass, L., Hausdorff, J. M., Ivanov, P. C., Mark,
R. G., Mietus, J. E., Moody, G. B., Peng, C.-K. and Stanley, H. E.: 2000, PhysioBank,
PhysioToolkit, and PhysioNet: Components of a new research resource for complex
physiologic signals, Circulation 101(23), e215–e220.
Hinton, G. E., Srivastava, N., Krizhevsky, A., Sutskever, I. and Salakhutdinov, R.: 2012,
Improving neural networks by preventing co-adaptation of feature detectors, CoRR
abs/1207.0580.
URL: http://arxiv.org/abs/1207.0580
Hirose, Y., Yamashita, K. and Hijiya, S.: 1991, Back-propagation algorithm which varies
the number of hidden units, Neural Networks 4(1), 61 – 66.
URL: http://www.sciencedirect.com/science/article/pii/089360809190032Z
Jain, A. K., Ross, A. and Prabhakar, S.: 2004, An introduction to biometric recognition,
IEEE Trans. Cir. and Sys. for Video Technol. 14(1), 4–20.
K., R., N., S., Raja, K. B., R., V. K. and Patnaik, L. M.: 2009, Advanced biometric
identification on face, gender and age recognition, 2009 International Conference on
Advances in Recent Technologies in Communication and Computing, pp. 23–27.
Kostı́lek, M. and Št’astný, J.: 2012, Eeg biometric identification: Repeatability and
influence of movement-related eeg, 2012 International Conference on Applied Electro-
nics, pp. 147–150.
52 REFERÊNCIAS BIBLIOGRÁFICAS
Krizhevsky, A., Sutskever, I. and Hinton, G. E.: 2012, Imagenet classification with
deep convolutional neural networks, Proceedings of the 25th International Conference
on Neural Information Processing Systems, NIPS’12, Curran Associates Inc., USA,
pp. 1097–1105.
URL: http://dl.acm.org/citation.cfm?id=2999134.2999257
Kumar, S., Arumuganathan, R., Sivakumar, K. and Vimal, C.: 2009, An adaptive
method to remove ocular artifacts from eeg signals using wavelet transform, 5.
LeCun, Y., Bengio, Y. and Hinton, G.: 2015, Deep learning, Nature 521(7553), 436–444.
LeCun, Y., Boser, B., Denker, J. S., Henderson, D., Howard, R. E., Hubbard, W. and
Jackel, L. D.: 1989, Backpropagation applied to handwritten zip code recognition,
Neural Computation 1(4), 541–551.
LeCun, Y., Bottou, L., Bengio, Y. and Haffner, P.: 1998, Gradient-based learning applied
to document recognition, Proceedings of the IEEE 86(11), 2278–2324.
Lee, T. S., Mumford, D., Romero, R. and Lamme, V. A.: 1998, The role of the primary
visual cortex in higher level vision, Vision Research 38(15), 2429 – 2454.
URL: http://www.sciencedirect.com/science/article/pii/S0042698997004641
Lumini, A. and Nanni, L.: 2017, Overview of the combination of biometric matchers,
Information Fusion 33, 71 – 85.
URL: http://www.sciencedirect.com/science/article/pii/S1566253516300446
Ma, L., Minett, J. W., Blu, T. and Wang, W. S. Y.: 2015, Resting state eeg-based
biometrics for individual identification using convolutional neural networks, 2015 37th
Annual International Conference of the IEEE Engineering in Medicine and Biology
Society (EMBC), pp. 2848–2851.
Mao, Z., Yao, W. X. and Huang, Y.: 2017, Eeg-based biometric identification with
deep learning, 2017 8th International IEEE/EMBS Conference on Neural Engineering
(NER), pp. 609–612.
Marcel, S. and Millan, J. d. R.: 2007, Person authentication using brainwaves (eeg) and
maximum a posteriori model adaptation, IEEE Trans. Pattern Anal. Mach. Intell.
29(4), 743–752.
URL: http://dx.doi.org/10.1109/TPAMI.2007.1012
REFERÊNCIAS BIBLIOGRÁFICAS 53
Martin, A., Doddington, G., Kamm, T., Ordowski, M. and Przybocki, M.: 1997, The
det curve in assessment of detection task performance, pp. 1895–1898.
Mohammadi, G., Shoushtari, P., Molaee Ardekani, B. and Shamsollahi, M. B.: 2006,
Person identification by using ar model for eeg signals, Proceeding of World Academy
of Science, Engineering and Technology 11, 281–285.
Palaniappan, R.: 2005, Identifying individuality using mental task based brain computer
interface, 2005 3rd International Conference on Intelligent Sensing and Information
Processing, pp. 238–242.
Palaniappan, R. and Mandic, D. P.: 2007a, Biometrics from brain electrical activity:
A machine learning approach, IEEE Transactions on Pattern Analysis and Machine
Intelligence 29(4), 738–742.
Palaniappan, R. and Mandic, D. P.: 2007b, Eeg based biometric framework for automa-
tic identity verification, J. VLSI Signal Process. Syst. 49(2), 243–250.
URL: http://dx.doi.org/10.1007/s11265-007-0078-1
Paranjape, R. B., Mahovsky, J., Benedicenti, L. and Koles’, Z.: 2001, The electroen-
cephalogram as a biometric, Canadian Conference on Electrical and Computer En-
gineering 2001. Conference Proceedings (Cat. No.01TH8555), Vol. 2, pp. 1363–1366
vol.2.
Pinto, N. and Cox, D.: 2011, Beyond simple features: A large-scale feature search appro-
ach to unconstrained face recognition, IEEE International Conference on Automatic
Face Gesture Recognition and Workshops, pp. 8–15.
Poulos, M., Rangoussi, M., Chrissikopoulos, V. and Evangelou, A.: 1999a, Parametric
person identification from the eeg using computational geometry, Electronics, Circuits
and Systems, 1999. Proceedings of ICECS ’99. The 6th IEEE International Conference
on, Vol. 2, pp. 1005–1008 vol.2.
Poulos, M., Rangoussi, M., Chrissikopoulos, V. and Evangelou, A.: 1999b, Person identi-
fication based on parametric processing of the EEG, Electronics, Circuits and Systems,
1999. Proceedings of ICECS ’99. The 6th IEEE International Conference on, Vol. 1,
pp. 283–286.
Pozo-Banos, M. D., Alonso, J. B., Ticay-Rivas, J. R. and Travieso, C. M.: 2014, Elec-
troencephalogram subject identification: A review, Expert Systems with Applications
54 REFERÊNCIAS BIBLIOGRÁFICAS
Rolls, E. and Deco, G.: 2002, Computational Neuroscience of Vision, Oxford University
Press.
Sadasivan, P. K. and Dutt, D. N.: 1995, Line interference cancellation from corrupted eeg
signals using modified linear phase fir digital filters, Proceedings of the First Regional
Conference, IEEE Engineering in Medicine and Biology Society and 14th Conference
of the Biomedical Engineering Society of India. An International Meet, pp. 3/35–3/36.
Schons, T., Moreira, G. J. P., Silva, P. H. L., Coelho, V. N. and Luz, E. J. S.: 2018,
Convolutional network for eeg-based biometric, in M. Mendoza and S. Velastı́n (eds),
Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications,
Springer International Publishing, Cham, pp. 601–608.
Simonyan, K. and Zisserman, A.: 2014, Very deep convolutional networks for large-scale
image recognition, CoRR abs/1409.1556.
URL: http://arxiv.org/abs/1409.1556
Singh, B., Mishra, S. and Tiwary, U. S.: 2015, Eeg based biometric identification with
reduced number of channels, 2015 17th International Conference on Advanced Com-
munication Technology (ICACT), pp. 687–691.
Soni, Y. S., Somani, S. B. and Shete, V. V.: 2016, Biometric user authentication using
brain waves, 2016 International Conference on Inventive Computation Technologies
(ICICT), Vol. 2, pp. 1–6.
Stassen, H.: 1980, Computerized recognition of persons by eeg spectral patterns, Elec-
troencephalography and Clinical Neurophysiology 49(1), 190 – 194.
URL: http://www.sciencedirect.com/science/article/pii/0013469480903685
Subasi, A. and Ismail Gursoy, M.: 2010, Eeg signal classification using pca, ica, lda and
support vector machines, Expert Syst. Appl. 37(12), 8659–8666.
URL: http://dx.doi.org/10.1016/j.eswa.2010.06.065
REFERÊNCIAS BIBLIOGRÁFICAS 55
Tangkraingkij, P., Lursinsap, C., Sanguansintukul, S. and Desudchit, T.: 2009, Selec-
ting relevant eeg signal locations for personal identification problem using ica and
neural network, 2009 Eighth IEEE/ACIS International Conference on Computer and
Information Science, pp. 616–621.
Vedaldi, A. and Lenc, K.: 2015, Matconvnet – convolutional neural networks for MA-
TLAB, Proceeding of the ACM Int. Conf. on Multimedia.
Yang, S. and Deravi, F.: 2017, On the usability of electroencephalographic signals for
biometric recognition: A survey, IEEE Transactions on Human-Machine Systems .
URL: http://kar.kent.ac.uk/61551/
Yang, S., Deravi, F. and Hoque, S.: 2016, Task sensitivity in EEG biometric recognition,
Pattern Analysis and Applications pp. 1–13.
Yong, X., Ward, R. K. and Birch, G. E.: 2008, Robust common spatial patterns for
eeg signal preprocessing, 2008 30th Annual International Conference of the IEEE
Engineering in Medicine and Biology Society, pp. 2087–2090.