Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstract Automatic Contact Classification System (ACCS) is a useful decision support tool for sonar operators to identify
threats during submarine operation. Novelty Detection System (NDS) is an important complementary tool to recognize contacts
belonging to unknown classes to which special attention should be dispensed for him. This work analyses the development on an
unknown class recognition system based on principal components. A new scheme using principal components specialized on
known classes is developed to identify novelty. Using real data, acquired in an acoustic ray, the proposed system achieves an av-
erage efficiency of recognition of unknown classes of 62.9%, which represents an expressive result.
Keywords Passive sonar, Novelty Detection, PCA, Decision Support Systems, Pattern Recognition
Resumo Sistemas de classificação automática de contatos (SCAC) constituem uma importante ferramenta de apoio à decisão
para operadores de sonar na identificação de ameaças durante a operação de submarinos. Sistemas de detecção de novidades
(SDN) são uma importante ferramenta complementar para o reconhecimento de contatos pertencentes a classes desconhecidas,
para as quais atenção especial deve ser por ele dispensada. Esta trabalho analisa o desenvolvimento de um sistema de identifica-
ção de classes desconhecidas utilizando componentes principais. Um novo esquema utilizando componentes principais especia-
lizadas nas classes conhecidas é desenvolvido para a identificação de novidades. Utilizando dados reais, obtidos em raia acústi-
ca, o sistema proposto apresenta uma eficiência média de identificação de novas classes de 62,9%, o que representa um resulta-
do expressivo.
Palavras-chave Sonar passivo, Detecção de novidades, PCA, Sistemas de Suporte a Decisão, Reconhecimento de Padrões
121
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
122
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
é, aquelas sob as quais foram extraídas as componen- se vencedora é calculado, explorando-se, no entanto,
tes deste detector. a especialização nas classes conhecidas.
3. 2 Detector de Especializado
3.3 Dimensionamento dos Detectores de Novidade
Visto que a eficácia do detector baseado em
PCA está diretamente relacionada à qualidade de Dois parâmetros fundamentais e interdependen-
representação das classes de dados, a adoção de de- tes na operação dos detectores anteriormente apre-
tectores especializados, isto é, considerando compo- sentados são: o número de componentes principais
nentes extraídas exclusivamente para cada classe adotadas e o limiar de decisão.
conhecida, ou mesmo, para subclasses e partições Considerando um número arbitrário de compo-
correspondentes, pode levar a um melhor mapeamen- nentes de principais e, inicialmente, duas classes
to e, consequentemente, a uma melhor eficácia. (uma conhecida e outra desconhecida), a distribuição
Assim, supondo um problema de K classes co- da variável de decisão do detector possui formato
nhecidas, pode-se considerar a extração de compo- similar ao apresentado na Figura 1, comportando-se,
nentes principais para cada classe isoladamente, re- naturalmente, como um detector binário [8]. Por con-
sultando na produção de erros de reconstrução con- sequência, para o limiar indicado, tem-se uma proba-
forme as equações: bilidade de detecção (PD) da classe conhecida e de
2 reconhecimento da classe desconhecida (PDN): o
e1 (I W1W1T )(x μ1 ) primeiro definido pelo quantitativo de eventos da
(2) classe conhecida que produz uma saída abaixo do
2 limiar; enquanto o segundo, por aqueles da classe
eK (I WK WKT )(x μ K ) desconhecida que originam uma saída acima do limi-
onde W1 a WK são matrizes cujas colunas são defi- ar.
nidas pelas componentes principais extraídas para
cada classe, bem como μ1 a μ K são os vetores mé-
dios de cada classe.
Note que cada classe pode utilizar um dado nú-
mero de componentes, porém, para uma maior sim-
plicidade, nesta proposta foi considerada uma mesma
complexidade para todas elas, a qual foi ajustada por
validação cruzada.
Dois critérios foram considerados para a utiliza-
ção dos erros especializados no processo de identifi-
cação de novidades: Figura 1: Distribuição da variável de decisão da saída do detector
para a classe conhecida e desconhecida.
a) Critério de Erro Mínimo:
Da observação da Figura 1, pode-se perceber
Neste caso, para cada um dos K erros produzi- que para cada valor de limiar escolhido, tem-se um
dos, identifica-se o menor deles, que será comparado par PD e PDN. De posse de vários valores de limiar,
com o limiar arbitrado para a identificação de novi- é possível traçar uma curva, aqui referida como de
dades. Este critério pressupõe que o detector mais qualidade do detector de novidade, cuja área com o
adequado para a identificação de um vetor como no- eixo pode ser utilizada com medida de qualidade, a
vidade é aquele que melhor representa o próprio ve- semelhança da curva ROC [13], conforme ilustrado
tor, isto é, o que produz o menor valor de erro. na Figura 2Erro! Fonte de referência não encon-
trada.. Numa situação ideal, a área desta curva seria
b) Critério do Centróide Mais Próximo: 1, representando 100% de PD e PDN.
123
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
ai , j representa área da curva de qualidade para o par Na sequência, os pontos espectrais são submeti-
de classes de índice i e j. dos ao algoritmo TPSW (Two-Pass Slit Window)
Deste modo, através da área média das curvas [17], o qual estima o ruído de fundo do ambiente de
de qualidade para cada componente, é possível pro- medição, já que este não contribui, de forma signifi-
duzir uma figura de mérito para o detector em função cativa, para a classificação. Os parâmetros utilizados
do número de componentes principais adotadas, es- foram N = 50, P = 4 e α = 20, sendo a escolha basea-
colhendo-se, assim, um número de componentes que da e, resultados apresentados em [16].
maximize a área desta curva ou que represente um Finalmente, é realizada uma normalização do
compromisso interessante entre complexidade e efi- espectro resultante para que este apresente energia
ciência. unitária, o que resulta entre 2432 (classe A) até 7075
Uma vez definido o quantitativo de componen- (classe E) janelas espectrais.
tes, define-se o limiar de decisão de novidade, consi-
derando-se uma probabilidade mínima de detecção 5. Resultados
das classes conhecidas arbitrária.
Para o desenvolvimento, dimensionamento e
4. Base de dados avaliação dos detectores de novidade baseados em
PCA, a base de dados foi dividida, classe-a-classe,
Este projeto se utilizou uma base de dados dis- em 3 conjuntos: desenvolvimento, validação e teste:
ponibilizada pelo Instituto de Pesquisas da Marinha o primeiro, destinado a extração das componentes; o
do Brasil (IPqM) [14], o IPqM. segundo, para a definição do número de componentes
Esta base é constituída pelo ruído irradiado de e do limiar de novidade; e, por fim, o terceiro, para
25 navios pertencentes a 8 classes distintas, contendo estimar o desempenho final. Os eventos foram divi-
de 2 a 5 navios cada uma. Um total de 263 corridas didos aleatoriamente entre os conjuntos, segundo as
de prova obtidas em raia acústica (ambiente de medi- seguintes proporções aproximadas: 70% (desenvol-
ção controlado, com número finito de variáveis moni- vimento), 10% (teste) e 20% (validação).
toradas) está disponível. Em cada corrida, o navio Das 8 classes disponíveis, foram escolhidas me-
percorre a raia acústica se deslocando em condições tade como conhecidas (A,B,C e H); e a outra metade,
de maquinaria e operação constantes. Cada navio como desconhecidas (D, E, F e G), em concordância
realiza ainda diferentes corridas, cada uma em uma com trabalhos anteriores.
condição operativa diferente. O dimensionamento dos 3 detectores sob
Os sinais adquiridos foram pré-processados a avaliação foi baseado análise da curva média de
partir da cadeia apresentada na Figura 3Erro! Fonte qualidade do detector por número de componentes,
juntamente com a curva de qualidade do detector
124
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
125
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
126
Anais do XX Congresso Brasileiro de Automática
Belo Horizonte, MG, 20 a 24 de Setembro de 2014
127