Você está na página 1de 17

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

futura internet

Artigo

Sistema de localização interna usando impressão digital e detecção


de novidade para avaliação de confiança
Helmer Augusto de Souza Mourão† e Horácio Antonio Braga Fernandes de Oliveira *,†

Instituto de Computação, Universidade Federal do Amazonas, Manaus 69080-900, Brasil; helmer@ufam.edu.br


* Correspondência: horacio@icomp.ufam.edu.br † Esses
autores contribuíram igualmente para este trabalho.

Abstrato:Os sistemas de localização indoor são usados para localizar dispositivos móveis dentro de
edifícios onde as soluções tradicionais, como os sistemas globais de navegação por satélite (GNSS), não
funcionam bem devido à falta de visibilidade direta dos satélites. A impressão digital é uma das soluções
mais conhecidas para localização indoor. Baseia-se na intensidade do sinal recebido (RSS) de pacotes
transmitidos entre dispositivos móveis e nós âncora. No entanto, os valores de RSS são conhecidos por
serem instáveis e ruidosos devido aos obstáculos e à dinamicidade dos cenários, causando imprecisões
nas estimativas de posição. Essa instabilidade e ruído geralmente fazem com que o sistema indique um
local que não tem certeza se é o correto, embora seja o mais provável com base nos cálculos. Essa
propriedade do RSS pode fazer com que os algoritmos retornem uma localização com baixo nível de
confiança. Se pudéssemos escolher resultados mais confiáveis, teríamos um resultado global com
melhor qualidade. Assim, em nossa solução, criamos uma fase de verificação do nível de confiança do
resultado da localização. Para isso, utilizamos a probabilidade de predição fornecida pelo KNN e a
detecção de novidade para descartar classificações pouco confiáveis e muitas vezes erradas. Neste
----
--- trabalho, propomos o LocFiND (Localization using Fingerprinting and Novelty Detection), uma solução
Citação:de Souza Mourão, HA; de baseada em impressão digital que usa probabilidade de predição e detecção de novidades para avaliar a
Oliveira, HABF Sistema de confiança das posições estimadas e mitigar imprecisões causadas por RSS na fase de localização.
Localização Interna Usando Implementamos nossa solução em uma área escolar de grande escala do mundo real usando
Impressão digital e detecção de dispositivos baseados em Bluetooth.
novidades para avaliação de confiança.
Internet futura2022,14, 51. https:// Palavras-chave:localização interior; sistema de posicionamento; impressões digitais; Bluetooth; aprendizado de máquina
doi.org/10.3390/fi14020051

Editor Acadêmico: Eirini Eleni


Tsiropoulou 1. Introdução
O problema de localização de dispositivos móveis ou pessoas tem recebido atenção crescente nas
Recebido: 16 de dezembro de 2021
últimas décadas, especialmente na robótica [1], redes de sensores [2], e até redes veiculares [3].
Aceito: 27 de janeiro de 2022

Publicado: 7 de fevereiro de 2022


Smartphones e outros dispositivos vestíveis podem usar o Sistema Global de Navegação por Satélite
(GNSS), que inclui o Sistema de Posicionamento Global (GPS), para obter uma localização ao ar livre. No
Nota do Editor:O MDPI permanece neutro
entanto, os dados GNSS podem ser problemáticos em ambientes internos devido à má recepção dos
em relação a reivindicações jurisdicionais em
sinais de satélite [4]. Assim, vários sistemas de localização indoor têm sido propostos para resolver este
mapas publicados e afiliações institucionais.
problema, todos eles com diferentes requisitos de hardware e desempenhos [5–7].
Muitas tecnologias de rede sem fio têm sido usadas em sistemas de localização. Algumas
dessas tecnologias incluem WiFi, Bluetooth, identificação por radiofrequência (RFID), banda ultra
larga (UWB) e redes celulares [8]. Aliadas a essas tecnologias, muitas técnicas têm sido propostas
Direito autoral:© 2022 pelos autores.
para a estimativa de distâncias como Time of Arrival (ToA), Time Difference of Arrival (TDoA),
Licenciado MDPI, Basel, Suíça. Este Received Signal Strength (RSS) e Angle of Arrival (AoA).9]. Mesmo com essas várias tecnologias, não
artigo é um artigo de acesso aberto existe uma solução única e definitiva devido às muitas peculiaridades dos ambientes (por exemplo,
distribuído sob os termos e condições obstáculos, layouts), hardware (por exemplo, processamento e limitações de energia) e requisitos
da licença Creative Commons (por exemplo, precisão, dados em tempo real ) [8].
Attribution (CC BY) (https:// Uma tecnologia que tem sido empregada é o uso de beacons Bluetooth Low Energy (BLE) que
creativecommons.org/licenses/by/ apresentam as seguintes vantagens: tamanho pequeno, peso leve, baixo custo, economia de energia e
4.0/). são amplamente suportados por dispositivos inteligentes [10]. Dispositivos BLE podem ser operados em

futuro Internet2022,14, 51. https://doi.org/10.3390/fi14020051 https://www.mdpi.com/journal/futureinternet


Internet futura2022,14, 51 2 de 17

vários níveis de potência de transmissão com o RSS mais estável em um alto nível de potência de
transmissão [11,12], mas tem implicações práticas importantes para a eficiência energética, resultando
em uma compensação entre o desempenho do local e a vida útil da bateria [13].
RSS é uma das informações mais populares e disponíveis usadas pelos sistemas de
localização. Uma das razões para sua ampla adoção é que ela não requer equipamentos extras e
pode ser encontrada na maioria dos dispositivos equipados com comunicação sem fio [14]. O RSS é
uma medida da intensidade do sinal recebido dos pacotes. Uma técnica comum para sistemas de
localização interna é a impressão digital, que usa dados RSS para construir mapas de rádio,
também conhecidos como bancos de dados de impressões digitais. Na fase offline, os mapas RSS
são criados com base nos valores RSS obtidos nos diferentes pontos da área onde queremos ter o
serviço de localização. Em seguida, um classificador usa essa informação para estimar a posição
dos nós na fase online. Um classificador comumente usado para esse fim é o k-Nearest Neighbors
(kNN), usado pelo RADAR [15,16].
A ideia principal da técnica de impressão digital é baseada na suposição de que cada
localização espacial dentro de casa pode ser identificada por um único conjunto de RSSs
mensuráveis.4]. No entanto, como o RSS é muito suscetível a ruídos no ambiente, o RSS
geralmente pode causar erros nas estimativas de localização. Por exemplo, nosso principal
aplicativo neste artigo visa fornecer informações de localização para pequenos dispositivos
alimentados por bateria para serem usados por alunos em escolas e permitir várias aplicações
interessantes, como registro automático de frequência de alunos, controle de entrada e saída e
assim por diante . Porém, nas primeiras versões do nosso sistema de localização, a instabilidade do
RSS fazia com que os alunos “pulassem” de sala em sala, mesmo estando estáticos.
Várias técnicas são propostas na literatura para lidar com o ruído RSS [17–22]. A maioria dessas
soluções concentra-se na média dos valores de RSS ou na realização de outras transformações no banco
de dados de impressões digitais. No entanto, esse ruído pode afetar não apenas os dados de
treinamento, mas também os dados recebidos na fase online, principalmente quando se considera que,
na maioria das vezes, o treinamento é feito em um prédio vazio enquanto a fase online ocorre em um
cenário mais movimentado e dinâmico. Infelizmente, a média de vários valores de RSS não é uma opção
para a fase online de nosso aplicativo, pois os dispositivos móveis são extremamente limitados em
energia e não é possível trocar ou recarregar suas baterias. Assim, precisamos de uma solução que
também considere o impacto dessa variação do RSS na fase online sem exigir o envio de pacotes de
dados adicionais.
A principal limitação dos sistemas de localização baseados em RSS é a flutuação do
RSS, que pode induzir diversos erros mesmo quando se utilizam técnicas de aprendizado
de máquina. Essa flutuação pode resultar em classificações/posições com baixa
confiabilidade. Assim, um passo intuitivo é detectar e descartar essas classificações para
obter resultados mais confiáveis e com melhor qualidade. Assim, em nossa proposta de
solução, criamos uma etapa adicional denominada “Avaliação de Confiança”. Para isso,
utilizamos a probabilidade de predição fornecida pelo KNN e a técnica Novelty Detection
para detectar e descartar classificações que não são consideradas confiáveis e, muitas
vezes, possuem erros maiores. Isso é feito usando a probabilidade de predição, que é
um passo adicional na técnica KNN baseada nas distâncias dos k vizinhos mais próximos.
Adicionalmente,

Neste trabalho, propomos um novo sistema de localização chamado LocFiND (Localization


using Fingerprinting and Novelty Detection), uma solução baseada em impressão digital que utiliza
técnicas de detecção de novidade para avaliar a confiança das posições estimadas na fase online
permitindo ao sistema descartar algumas das estimativas de posição que teriam erros inaceitáveis
devido a dados RSS ruidosos que sofreram alguma degradação inesperada do ambiente. Três
técnicas de avaliação de confiança foram propostas, uma mais simples e outra mais rígida, mas
descartam muitas posições que podem ser úteis. Para tentar reduzir essas perdas, também foi
proposta uma abordagem híbrida que recupera alguns desses locais descartados.
Internet futura2022,14, 51 3 de 17

Para nossa aplicação e avaliação de desempenho, usamos nós âncora baseados em Bluetooth e
dispositivos móveis do tipo smartwatch para serem usados pelos alunos. Implementamos nossa
solução em uma área escolar real de grande escala e comparamos seu desempenho com a solução
tradicional baseada em impressão digital kNN. Nossos resultados mostram que nossa solução foi capaz
de melhorar tanto a precisão da localização quanto o número de posições fixas ao descartar dados RSS
ruidosos.
As principais contribuições deste documento são as seguintes:

1. O uso de técnicas de detecção de novidades para avaliar a confiança das previsões.


2. Considerando que temos ruído na fase de localização e resolvendo este problema
sem exigir o envio de pacotes de dados extras, o que consumiria mais energia dos
dispositivos móveis.
3. Implementar e avaliar o desempenho da solução proposta em uma aplicação escolar
de larga escala do mundo real.
Este artigo está organizado da seguinte forma. Seção2mostra nosso trabalho relacionado. Seção3
descreve nossa proposta de solução LocFiND. Na seção4, apresentamos nossa metodologia e os
resultados de nossa avaliação de desempenho. Na seção5, discutimos a aplicação de nossa solução.
Finalmente, Seção6mostra nossas conclusões e trabalhos futuros.

2. Trabalho relacionado

No RADAR [15,16], um dos primeiros sistemas de localização utilizando RSS e fingerprinting, as


leituras do RSS são feitas em diferentes pontos do local onde a localização será realizada. Cada leitura
contém os valores RSS recebidos dos roteadores WiFi. Essas informações são registradas em um banco
de dados de impressões digitais. Após esse treinamento, quando um usuário solicita sua localização, os
valores de RSS da solicitação são comparados com os observados na fase de treinamento por meio do
classificador kNN, que retornará a posição mais provável de onde a solicitação foi enviada.

No Sistema Horus [23,24], uma técnica de agrupamento conjunto é proposta para a estimativa de
localização usando um método probabilístico. Nesse sistema, cada coordenada possível em que o
candidato esteja é considerada uma classe ou categoria. Para minimizar o erro de distância, o local é
escolhido onde sua probabilidade é maior. Aumentar o número de amostras em cada local de
amostragem melhora a precisão, pois melhora a estimativa da média e desvio padrão da distribuição
gaussiana usada. Sistemas probabilísticos semelhantes também foram propostos em outros trabalhos [
25–27]. Um método baseado em treinamento para determinar a localização usando classificadores
baseados em redes neurais é proposto em [28]. Em uma abordagem mais ampla, os autores em [29]
comparou os vários classificadores mencionados: redes neurais, kNN e métodos probabilísticos. Seus
resultados mostram que todas as técnicas tiveram um bom desempenho em diferentes cenários.

Em [30], vários experimentos foram realizados para mostrar que as técnicas de localização para
ambientes internos baseadas em treinamento (fingerprinting) têm melhor desempenho do que as
tradicionais baseadas em trilateração/multilateração. A principal razão apontada foi o fenômeno
multipercurso, no qual o comportamento do sinal é afetado pelos diversos obstáculos encontrados em
tais cenários. No entanto, uma observação levantada neste trabalho é que as técnicas de localização
baseadas em treinamento sofrem degradações na precisão da localização em ambientes dinâmicos,
onde as propriedades do local podem mudar com o tempo (por exemplo, reorganização de armários,
mesas, divisórias).
Devido ao multicaminho, desvanecimento da sombra e algumas restrições de hardware, valores
discrepantes nas medições de RSS não são incomuns. Se a medição for um uutiler, seja na fase off-line ou on-
line, a estimativa de posição resultante provavelmente será a errada [31]. Em [19], uma técnica de detecção de
outliers chamada iF_Ensemble foi desenvolvida. A solução proposta é capaz de analisar a qualidade do RSS
usando uma combinação de métodos de aprendizado de máquina supervisionados, não supervisionados e
ensemble. Nesta solução, a floresta de isolamento (iForest) é usada como um método de aprendizado não
supervisionado. O método de aprendizado supervisionado inclui classificadores de máquina de vetor de
suporte (SVM), kNN e floresta aleatória (RF).
Internet futura2022,14, 51 4 de 17

Em [17], os autores propõem uma nova rede neural de regressão generalizada de largura de
banda múltipla (GRNN) com a abordagem de posicionamento interno do filtro outlier, chamada GROF,
para melhorar a precisão e a robustez do posicionamento. Ele usa um novo tipo de arquitetura de
núcleo de largura de banda múltipla para obter um desempenho de regressão mais flexível do que o
GRNN tradicional. Além disso, um esquema de filtragem de outliers é usado para melhorar a robustez do
sistema contra a flutuação do RSS causada pelo ambiente dinâmico.
Uma consulta de limite probabilístico k-vizinho mais próximo (Tk-PNN) é proposta em [32]. Esta
solução retorna conjuntos de k resultados com probabilidades superiores a algum limite T. O resultado é
refinado usando filtros para remover resultados com o auxílio de um índice espacial e seleção
probabilística de candidatos.
Em [33], uma consulta de limite probabilístico kNN (PTkNN) é usada. Ele usa uma combinação de
três técnicas para o processamento eficiente de consultas PTkNN. Métrica de distância mínima de
caminhada interna (MIWD) para podar objetos que estão muito distantes, estimativa de probabilidade
eficiente para podar candidatos não qualificados e uma avaliação de probabilidade eficiente para o
candidato restante e os k-subconjuntos. Da mesma forma, em [34], é utilizado o algoritmo probabilístico
KNN (pkNN) que utiliza a probabilidade de RSS no rádio-mapa como ponderação para calcular a distância
euclidiana. Esta solução também filtra os valores de RSS cuja probabilidade é inferior a 3%.

Em [35], foi proposto um método baseado em iBeacon integrando um algoritmo de trilateração e


um método de impressão digital que usa matriz de peso para diferenciar a contribuição de beacons em
várias distâncias e adotar similaridade de cosseno para revelar a tendência consistente entre dois vetores
RSSI para reduzir efeitos de RSS flutuações. Na segunda fase, as trajetórias dos pedestres são
segmentadas e aplicado um filtro de Kalman (KF) para melhorar as localizações derivadas do cálculo
morto de pedestres (PDR). A última etapa usa outro KF para derivar locais em cada caminho segmentado,
fundindo o posicionamento baseado em BLE e o PDR. A precisão de posicionamento do método baseado
em iBeacon é RMSE 2,75 m. Quando o smartphone é segurado de forma constante, os testes de
posicionamento de fusão resultam em RMSE de 2,39 e 2,22 m para as duas rotas.

Ref. [36] avaliou os desempenhos de localização BLE com base na impressão digital RSS. Eles
apresentaram um aplicativo baseado em Ray-Launching para emular a propagação do sinal de
radiofrequência (RF) BLE em um ambiente interno de escritório. Um local de trabalho de medição
apropriado e sua configuração são propostos para medir os valores RSS e são usados para criar
um mapa RSSfingerprinting. A precisão da determinação da posição é calculada e avaliada. Os
resultados mostram que o desempenho da tecnologia BLE, para fins de localização indoor,
depende muito do número de nós BLE considerados e do método de avaliação aplicado (por
exemplo, número de setores considerados).
Em [37], é usado BLE com várias âncoras e vários canais de rádio para melhorar a
confiabilidade das medições de potência. O trade-off precisão-complexidade afeta as quatro
técnicas de aprendizado supervisionado mais populares (k-vizinhos mais próximos, máquinas de
vetores de suporte, floresta aleatória e rede neural artificial). Eles foram avaliados em ambientes
uni e bidimensionais com quatro âncoras estáticas. O melhor resultado é obtido pelo Random
Forest com uma precisão de classificação superior a 99%.
Outra técnica de localização de estimativa de pedestres (PDR) é proposta em [38]. Os autores
usaram os sensores do smartphone para estimar a localização de um pedestre com menor custo de
instalação. Atualmente, os smartphones possuem vários sensores inerciais (por exemplo, acelerômetro,
giroscópio e magnetômetro) que podem ser usados para detecção de mobilidade e localização [39].
Em [40], usando um magnetômetro, uma abordagem de impressão digital de intensidade de campo
magnético é usada para localizar um pedestre interno. Sensores de acelerômetro e giroscópio também são
usados para encontrar a distância percorrida pelo pedestre e a estimativa de direção combinada com os
padrões de força do campo magnético para formular um banco de dados de impressões digitais. Experimentos
foram conduzidos com vários modelos de smartphones e eles foram capazes de localizar um pedestre a 1,21 m
a 50% e a 1,93 m a 75%, independentemente do dispositivo usado para localização. O desempenho da
abordagem proposta é comparado ao K-Nearest Neighbor (KNN).
Internet futura2022,14, 51 5 de 17

A localização do campo geomagnético tem um limite porque os smartphones possuem sensores


magnéticos embutidos de diferentes fabricantes. Em [41], os autores propõem o uso de dados de campo
geomagnético coletados de vários smartphones para fazer o banco de dados de padrão de campo
geomagnético (MP). A avaliação usando quatro smartphones diferentes demonstra que usar um banco
de dados com vários smartphones tem o mesmo desempenho quando comparado ao uso de um único
smartphone. Além disso, a comparação de desempenho com pesquisas anteriores indica que o
desempenho geral dos smartphones é melhorado.
Em todos esses trabalhos não há avaliação da qualidade das posições devolvidas. Assim, mesmo
um resultado que o sistema não tem certeza se está correto ainda é retornado pelo sistema. Isso pode
levar a erros de localização maiores e, em um aplicativo do mundo real, pode fazer com que a posição do
usuário salte entre salas diferentes, mesmo quando o usuário está estático. Nossa solução proposta
tenta resolver esse problema analisando cuidadosamente a qualidade do posicionamento antes de
passá-lo para o aplicativo.
Nestes trabalhos, embora tentem melhorar a precisão usando probabilidades e outros filtros, a
maioria deles é baseada em refinar o banco de dados de treinamento e/ou combinar informações de
várias amostras para análise estatística, tornando-os mais difíceis de serem usados por dispositivos
móveis com restrição de energia. dispositivos. Neste trabalho, estamos propondo uma abordagem
diferente combinando um sistema de detecção de novidade com a probabilidade de previsão para filtrar
essas estimativas de posição não confiáveis sem descartar informações úteis e corretas de dispositivos
móveis.

3. LocFiND—Localização usando impressão digital e detecção de novidades


Nesta seção, apresentamos nossa solução proposta chamada LocFiND (Localization using
Fingerprinting and Novelty Detection). O principal objetivo da nossa solução é fornecer a
localização de dispositivos móveis em ambientes internos para diferentes serviços baseados em
localização. Neste tipo de ambiente, espera-se que as soluções tradicionais (eg, GNSS, GPS) não
funcionem muito bem [42].
Propomos três variações de nossa solução: uma ingênua que usa apenas a probabilidade de
previsão e duas versões estendidas que usam a detecção de novidade para refinar os resultados.
Nesses aplicativos, é comum que a pessoa localizada carregue algum tipo de dispositivo, que
pode ser usado para estimar sua localização. Outro requisito de nosso aplicativo é que esse
dispositivo móvel seja discreto, ou seja, cada pessoa carregue um dispositivo bem pequeno,
alimentado por bateria. Para permitir a localização, nossos nós móveis enviam informações para
nós âncora baseados em Bluetooth para que haja menor interferência com a rede de dados sem
fio no local.
Como em outras soluções, o LocFiND pode ser dividido em duas fases distintas, conforme ilustrado
na Figura1. Na primeira fase, de treinamento, são coletadas amostras para treinar o algoritmo. O banco
de dados de impressões digitais obtido segue o formato descrito,

Aeu={RSSeu,1,RSSeu,2, . . . ,RSSeu,n,AULAeu} (1)

ondeAeué o conjunto de pacotes coletadoseu,RSSeu,né o RSS do pacoteeurecebido no nó âncora n,


eAULAeué a classe (ou rótulo) que pode ser mapeada para o local em que o pacote foi enviado.
Todos esses dados serão usados pelo algoritmo de treinamento supervisionado para gerar um
modelo.
Para a marcação das amostras, foram utilizadas duas granularidades. Para classificação de
quartos AULAeu= {41, 57, 40, 53, 39, 47, 51, 62, 45, 43, 61, 46, 16, 63} , onde cada número
representa o ID de uma sala. Para a classificação de pontos específicos dentro das salas, as
etiquetas têm o formato R_X_Y que representa o R como o ID da sala, X como a linha e Y como a
coluna dentro da sala (com células de aproximadamente 2 m×2 metros).
Na segunda fase, online, são executados os procedimentos para estimar a localização dos
dispositivos móveis. Uma arquitetura centralizada foi escolhida principalmente devido às limitações dos
nós móveis (por exemplo, economia de energia e hardware limitado). Nesta fase, um mobile node envia
um pacote de dados que será recebido pelos nodos âncora que irão medir o RSS para
Internet futura2022,14, 51 6 de 17

este pacote e encaminhar as informações para um servidor central. O servidor poderá então
estimar o local para onde o pacote foi enviado e, assim, a localização do dispositivo móvel.

Figura 1.Arquitetura LocFiND: a fase de treinamento gera o banco de dados de impressões digitais, que é
usado na fase online para estimar a posição dos dispositivos móveis.

O servidor central usa um algoritmo KNN com o banco de dados de impressões digitais da
fase de treinamento, assim retornará não apenas a classe, mas também as probabilidades da
amostra pertencer a cada uma das diferentes classes. Essas probabilidades serão então avaliadas
por nossas abordagens propostas para a avaliação de confiança para a classificação final. A
métrica de medição de similaridade usada no KNN é a distância euclidiana.
Conforme mencionado anteriormente, os valores de RSS variam mesmo quando o nó não está em
movimento. Isso ocorre devido às características do ambiente e obstáculos que podem alterar o sinal
momentaneamente causando erros tanto na fase de treinamento quanto na fase online.
Muitos trabalhos na literatura tratam do ruído RS na fase de treinamento [43], mas a
informação do sinal na fase online sofre do mesmo problema ou pior já que, na maioria das vezes,
o treinamento é feito em um prédio vazio enquanto a fase online ocorre em um cenário mais
lotado e dinâmico. Assim, precisamos de soluções que também levem em consideração o impacto
dessa variação do RSS na fase online.
Um passo intuitivo seria descartar e ignorar os dados em que temos baixa confiança no momento
da localização. No entanto, depois de algum tempo sem informações de localização, essa informação
ausente começará a ser perceptível. Assim, não podemos simplesmente começar a ignorar qualquer
informação que possa não ser confiável. A questão que fica é como definir, na fase online, se um
conjunto de RSS's recebidos pode ser considerado confiável para a correta classificação. Referimo-nos a
esta etapa como Avaliação de confiança em nossa arquitetura LocFiND.
Como mencionado anteriormente, propomos três técnicas diferentes no LocFiND para avaliar
a confiança das posições estimadas:
1. Probabilidade de previsão: usa a probabilidade de previsão estimada para decidir se aceita
a classe estimada.
2. Detecção de novidades: utiliza a técnica de detecção de novidades para identificar a confiabilidade da
amostra classificada.
3. Abordagem híbrida: usa detecção de probabilidade e novidade para melhorar as
soluções isoladas.
Essas três técnicas são explicadas e detalhadas nas próximas seções.

3.1. Usando probabilidade de previsão

Na primeira técnica, denominada Probabilidade de Predição, avaliamos a confiança da


posição estimada usando a probabilidade de classificação, disponível na implementação do KNN
scikit-learn. Nesta implementação, a função predict_proba retorna as probabilidades que uma
amostra possui de pertencer a cada uma das diferentes classes (posições treinadas, rótulos). A
classe mais provável é o resultado da classificação. Para estimativa de probabilidade, os preditores
geralmente implementam métodos que quantificam a confiança das previsões. No KNN, as
probabilidades de cada classe são a média ponderada normalizada dos indicadores para as k
classes mais próximas, ponderadas pela distância inversa [44].
A abordagem de Probabilidade de Predição usa o modelo gerado pelo KNN usando o banco de
dados de impressões digitais da fase de treinamento. O modelo avalia cada nova amostra online
recebida e retorna as probabilidades de que ela pertença a cada uma das classes disponíveis. Em
Internet futura2022,14, 51 7 de 17

Nessa abordagem, escolhemos a classe com maior probabilidade e, se essa probabilidade for
maior que um limiteα, a classificação é aceita e a nova posição estimada é enviada para a
aplicação. Caso contrário, o resultado é rejeitado. Figura2mostra o diagrama completo para
esta avaliação de confiança.

Figura 2.Avaliação de confiança usando probabilidade de predição: classificações com probabilidades baixas são
descartadas para melhorar a precisão.

3.2. Usando a detecção de novidade

Na solução anterior, como mostraremos na Seção4, mesmo descartando classificações com


baixa probabilidade de predição, ainda temos algumas classificações erradas. Nesta seção,
definimos uma nova abordagem que ajuda a decidir quais classificações devem ser descartadas.
Nesta solução, que chamamos simplesmente de Detecção de Novidade, verificamos (ou seja,
confirmamos) se a amostra classificada realmente pertence à classe que foi estimada pelo
classificador (KNN escolhe a classe que mais se aproxima). Para isso, utilizamos o conceito de
novidade, conceito utilizado na área de detecção de outliers. A novidade pode ser definida como a
tarefa de reconhecer se uma amostra testada difere, em alguns aspectos, dos dados coletados
durante a fase de treinamento [45].
A detecção de amostras novas e nunca vistas é uma habilidade importante para qualquer sistema de
classificação. Ao perceber que não é possível treinar um sistema de aprendizado de máquina com todos os tipos
de dados que o sistema provavelmente encontrará, torna-se importante ser capaz de diferenciar entre
informações de dados conhecidos e desconhecidos durante a fase online [46].
A detecção de novidade refere-se à identificação de padrões novos ou anormais incorporados em uma
grande quantidade de dados normais. A novidade (anomalia, outlier, exceção) acontece quando uma amostra
não está em conformidade com o comportamento normal esperado [47]. Ao contrário das abordagens de
detecção de outliers, que são feitas em treinamento, a detecção de novidades define se uma nova amostra (fase
online) pertence ou não a uma classe. Uma arquitetura de detecção de novidade é representada na Figura3.

Figura 3.Detecção de novidades usando One-Class SVM.

As técnicas de detecção de novidades podem ser implementadas usando diferentes técnicas, como
técnicas baseadas em máquinas de vetores de suporte, técnicas baseadas em agrupamento, técnicas baseadas
no vizinho mais próximo e técnicas estatísticas [48].
Uma técnica de detecção de novidade não supervisionada comumente usada é baseada em SVM. Ele
constrói um esquema de limite esférico que agrupa e inclui a maioria das amostras de dados normais. Qualquer
amostra nova e não vista que caia fora dos limites do grupo é detectada como novidade. Em trabalhos recentes
sobre detecção de novidade baseada em SVM, uma variação chamada OC-SVM (one-class SVM) é usada, pois
possui alguns truques de kernel que permitem separar facilmente dados normais e novos em espaços
dimensionais superiores [49], que é o caso do nosso sistema de localização com 15 dimensões (ou seja, nós
âncora).
Nesta avaliação da parte de confiança do LocFiND, primeiro usamos a probabilidade de
predição, como na Seção anterior3.1, para ter uma primeira avaliação do próprio KNN quanto ao
Internet futura2022,14, 51 8 de 17

confiabilidade da classificação. Então, para uma segunda validação do resultado, utilizamos o conceito de
detecção de novidades para confirmar se uma determinada amostra realmente pertence àquela classe.
Assim, a mesma probabilidade de predição explicada anteriormente com o limiarαé usado. No
entanto, as classificações são posteriormente validadas usando a detecção de novidade implementada
usando o One-Class SVM. Além de passar no teste de threshold, uma nova validação é feita pelo
algoritmo da novidade que testa se aquela amostra realmente pertence à classe escolhida (aquela com
maior probabilidade retornada pelo KNN). Somente quando ambos os testes são aprovados, uma
classificação é aceita. Este processo de decisão completo para a avaliação da confiança é representado na
Figura4.

Figura 4.Avaliação da confiança usando a técnica de detecção de novidade: a precisão é melhorada pelo
descarte adicional de classificações não confiáveis.

3.3. Abordagem Híbrida: Combinando Probabilidade de Previsão com Detecção de Novidade

As seções anteriores3.1e3.2são mais confiáveis e precisos, mas, como mostramos na Seção4, ele
descarta e ignora um grande número de estimativas de posição, deixando o sistema com poucas
informações de posição. Assim, nesta seção, propomos uma nova técnica denominada Abordagem
Híbrida. Chamamos de híbrido porque combina a avaliação de confiança das duas configurações
anteriores, cada uma sendo aplicada a um limiar utilizado em diferentes etapas e técnicas. O primeiro
limite é uma estimativa de probabilidade, enquanto o segundo é um fator de novidade. Assim, esta
abordagem híbrida combina a primeira e a segunda abordagens.
Para entender a abordagem híbrida, precisamos primeiro entender o comportamento do
limite de probabilidadeα. Quanto menor o limite de probabilidade, maiores os erros de
classificação, resultando em um maior erro médio de localização. Porém, neste caso, também
temos um número maior de estimativas de posição, o que é bom para a aplicação. Se
aumentarmos esse limite, melhoramos a precisão, mas também reduzimos o número de
classificações aceitas, deixando o sistema sem estimativas de posição suficientes.
Na abordagem híbrida, inicialmente usamos o mesmo limite de probabilidadeαcomo nas seções
anteriores. No entanto, em vez de simplesmente rejeitar as classificações que não passam nesse filtro,
usamos a detecção de novidade para dar uma segunda chance para algumas dessas classificações que
seriam descartadas de outra forma. Para isso, usamos um segundo limite de probabilidade mais baixo β
e use a detecção de novidade para confirmar as classificações acima desse segundo limite.
O resultado desse processo de decisão, representado na Figura5, é que as classificações com altas
probabilidades de predição (limiarα) não são verificados pela detecção de novidades. Classificações com
probabilidades de predição mais baixas, mas ainda superiores ao limiteβ, será confirmado pela detecção
da novidade. Finalmente, classificações com probabilidades de predição menores queβou que não
passaram na verificação de novidade, são descartados.

Figura 5.Avaliação da confiança usando a abordagem híbrida: um compromisso entre precisão e


número de estimativas de posição.
Internet futura2022,14, 51 9 de 17

4. Avaliação de Desempenho
Nesta seção, avaliamos o desempenho de nossa solução LocFiND proposta e suas
abordagens para a avaliação da confiança das posições estimadas. Discutiremos os resultados de
nossa solução comparada de várias formas, para ter uma melhor visão de seu funcionamento e
um melhor entendimento de seu comportamento.

4.1. Metodologia
Avaliamos o desempenho de nossa solução em um ambiente de teste real em grande escala, mostrado na
Figura6. Como estamos focados em aplicações baseadas em dispositivos móveis pequenos, de baixo
processamento, baixo consumo de energia e operados por bateria, utilizamos nós e âncoras com tecnologia
BLE. Figura7a mostra o hardware usado para os dispositivos móveis, um dispositivo vestível baseado em
smartwatch, enquanto a Figura7b mostra o hardware usado como nós âncora para a coleta de dados de
localização.

quarto 02
Banheiros quarto 03 quarto 04 quarto 05 quarto 06
06
05

quarto 01

07
09 08

quarto 11 quarto 10 quarto 09 quarto 08 quarto 07

Amostras coletadas de RSSI Nós âncora

Figura 6.Mapa de aplicativo/testbed do mundo real: área de 645 m2(43m×15 m), 11 quartos com média de 42 m2(7m×6
m), 3 salões, 15 nós de ancoragem e 150 pontos de referência. Para cada ponto de referência, 100 amostras foram
coletadas para um total de 15.000 amostras. Foram utilizados 11 dispositivos móveis diferentes, 9 para treinamento e 3
para teste.

(b)
(a)
Figura 7.Nós de dispositivo [20]. (a) Dispositivos semelhantes a smartwatch baseados em Bluetooth são usados como dispositivos móveis.

(b) Os pontos de acesso baseados em Bluetooth são usados como nós âncora.

Como nossa principal aplicação é a localização de alunos, nosso testbed foi implantado
em uma área escolar de 645 m2composto por 15 espaços (11 quartos e 3 salões). O mapa
completo da área é representado na Figura6. Para cobrir toda a área, 15 nós de ancoragem
foram instalados no teto das salas em locais onde era conveniente conectá-los à rede
elétrica. Esses nós âncora são representados em azul na Figura6. Essa base foi coletada e
utilizada em outros trabalhos do nosso grupo de pesquisa [20].
Para executar a fase de treinamento do LocFiND e gerar o banco de dados de impressões digitais,
distribuímos uniformemente 150 pontos de referência (RPs) por toda a área. Esses RPs são representados
Internet futura2022,14, 51 10 de 17

como pontos cinzas na Figura6. Para cada RP, fomos até aquele local e começamos a enviar pacotes de dados
usando 11 dispositivos móveis diferentes. Coletamos um total de 100 amostras por RP para um total de 15.000
amostras em nosso banco de dados de impressões digitais. Finalmente, em nossos resultados mostrados nas
seções a seguir, usamos as amostras de nove dispositivos móveis como treinamento e as amostras de outros
três dispositivos móveis como teste. Assim, as amostras utilizadas para teste são de aparelhos nunca vistos no
treinamento.
Para escolha dos parâmetros do KNN foi utilizado o método GridSearchCV do scikit-learn, que é
uma ferramenta de seleção de parâmetros utilizando validação cruzada na base de treinamento,
evitando assim overfitting. Usando GridSearchCV com cinco dobras, definimos os principais parâmetros
em KNN o valor dek=9. Selecionandoknão é uma ciência exata porque é difícil estimar o quão bem sua
dobra representa seu conjunto de dados geral. Por esse motivo, usamos o GridSearchCV com uma
validação cruzada de 5 vezes para encontrar o melhorkvalor sem sobreajustar o sistema. Por fim,
também usamos diferentes dispositivos para treinamento e teste, para que os valores em teste sejam de
dispositivos nunca vistos. Isso aumenta as chances da solução proposta funcionar com novos
dispositivos em uma aplicação do mundo real.
Como linha de base de comparação para os resultados, uma solução tradicional baseada em
impressão digital que usa o banco de dados RSS e KNN (comk=9) foi usado, tendo uma precisão de 96%
para classificação de sala e 36% para estimativa de ponto com um erro médio de 1,9 m. Como neste caso
não há avaliação de confiança, 100% das estimativas de posição foram enviadas para o aplicativo. Nosso
objetivo para o LocFiND é melhorar essas classificações e o erro médio de localização, ao mesmo tempo
em que fornecemos o máximo possível de estimativas de posição para o aplicativo.

4.2. Avaliação de confiança usando probabilidade de previsão


Conforme mencionado na Seção3.1, a avaliação de confiança usando a probabilidade de
predição usa o limiteαpara decidir se aceita ou descarta uma classe/posição estimada com base na
probabilidade da amostra pertencer a essa classe. Apenas amostras com probabilidade de
predição maior queαsão aceitos.
Figura8a mostra a relação entre o valor do limiarα, e a precisão final das classificações aceitas
(em vermelho), bem como a porcentagem de estimativas aceitas (em azul). Da mesma forma,
Figura8b mostra o comportamento do erro médio de localização (em vermelho) e, novamente, a
porcentagem de estimativas aceitas (em azul) à medida que aumentamos o limiteα. Finalmente,
Figura8c mostra o comportamento da acurácia da estimativa da sala, ou seja, estamos usando o
nome da sala como classes. Esses resultados mostram várias características de nossa solução
LocFiND proposta que discutiremos nos próximos parágrafos.

80 100 2. 0 100 100,0 100


Predi ctions ( % )

Predi ctions ( % )

1. 8 99,5 95
70 80 80
Room Accura cy (%)

99,0 90
1. 6
Previsões aceitas (%)

98,5 85
Erro médio (m)
Precisão (%)

60 60 1. 4 60
98,0 80
50 40 1. 2 40 97,5 75
Acessar pted

Acessar pted

1. 0
97,0 70
40 20 20
0. 8 96,5 65

30 0 0. 6 0 96,0 60
20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90
Três deve (%) Três h antigo α (%) Limite α (%)

(a) (b) (c)


Fi figura 8. Résults para º e avaliar ion de confi dence usin probabilidade de predição g: relação entre
º e valor de elet tritura hlo dα(x-a xé ), o perc eestágio de um as estimativas aceitas (em azul) e (a) o final
accuradoria opés
ele aceita pd
te classificar cta íons, (b) t he média erro de localização, e (c) a precisão da sala.

st, as espera td
e , como nós eu
Abeto nvinco t elelimiar dα, o número de estimativas aceitas , pois
decreas es (blue c você
rv e na figura você
re8a–c). No entanto estamos aceitando maior qualidade e,
predital ons, o um ccvocêatrevido em ce
r ases (Fi gure8a) , portanto, o erro médio de localização
decreas es (F figura 8b) e o e room acc você atrevido também aumenta (Figura8c).

Paraem stância, cmo aparado to uma tradição eu


kN onal N, no caso da Figura8a, b, um limite
α =40 % accept 85 % of o pr edficção c hile incre Asing a precisão de 36% a 41% e m a
decresi ng tele ave rage locali zaerro de ção r de 1.9 1,7 m. No caso da precisão da sala,
forα= 4% 0 , então você
mber de um ccepted pr edicções r permaneceu quase o mesmo em 99,6%, enquanto
Internet futura2022,14, 51 11 de 17

aumentando apenas ligeiramente a precisão para 96,4%. Isso ocorre principalmente porque é mais fácil estimar os
quartos e o classificador é capaz de fazer isso com probabilidades mais altas.
Por outro lado, quando usamos um limiarα= 80%, apenas 20% das estimativas de posição
foram encaminhadas para o aplicativo, conforme ilustrado na Figura8a, b. No entanto, essas
estimativas foram muito confiáveis, com quase 70% de precisão e um erro de localização inferior a
0,9 m. O melhor resultado veio da acurácia da sala, em que 92% das previsões foram aceitas com
uma acurácia de quase 99%.
Para entender melhor como os erros de localização são distribuídos, a Figura9
mostra a função de distribuição cumulativa para os limiaresα= 25%, 45% e 75%. Este
gráfico mostra a porcentagem de estimativas (y-eixo) com um erro menor que ox-eixo.
Nesta curva, quanto menorxvalor do eixo e quanto maior oy-axis, melhor, pois isso
significa que a maioria das estimativas tem erros menores. Como podemos ver, por
exemplo, ao usar um limiarα= 25%, apenas 68% das estimativas resultaram em erro
menor ou igual a 2 m. Por outro lado, para um limiarα= 75%, quase 85% das estimativas
resultaram em erros menores ou iguais a 2 m.

100

90

80
Frequência (%)

70

60

50
Limite α = 25% Limite
40 α = 45% Limite α =
75%
30
0 2 4 6 8 10
Erro (m)
Figura 9.Função de distribuição cumulativa do erro de localização usando probabilidade de
previsão com limitesα= 25%, 45% e 75%: mostra a porcentagem de estimativas (y-eixo) com um
erro menor que ox-eixo.

Assim, como podemos ver, a escolha de qual limiar usar depende muito do cenário
e do tipo de aplicação. O principal desafio é como decidir qual é o melhor caso para
nosso cur problema de aluguel: um número mais alto de posição estimada informações com menor precisão
menos e stimações com hmaior precisão. No entanto, nós c ou facilitar essa decisão se
posso eu ppercorra esta solução on usando bett er mecanismos para a avaliação da confiança.
Assim, eu n nosso LocFiND ssolução, usamos d Novidade Dete ação para melhorar esta avaliação
de confiança dence.

4.3. eva lução da Confide nce Usando Novelt y Detecção


Como mencionado em S eção3.2, em ou der para mais eu melhorar a precisão do local-
ização sistema, nós intr oproduziu o novembro edetecção de lty te st. Este teste avalia se ss/
uma amostra eu
e pertence ao determinada classe (KN N classe prevista posição). Essa abordagem
usa o e limite acα, bu t usa a novela detecção de y para i melhora ainda mais a avaliação
de confiança dência.

Similar ao reshold seção iosa, Fi gure10mostra t relação entre as estimativas de


do t hanteriorα(x-ax yeu s), a porcentagem ge de aceito e valor (em azul) e o valor final10a),
preciso do aceite d classificações ( curva vermelha na Fig a curva ed de localização média
erro (r ecurva d na Figu re10b) e o r precisão do oom (r na Figura10c).
Internet futura2022,14, 51 12 de 17

80 100 2.0 100 100,0 100

1.8 99,5 95
70 80 80
99,0 90

Precisão da sala (%)


1.6

Previsões aceitas (%)

Previsões aceitas (%)

Previsões aceitas (%)


98,5 85

Erro médio (m)


Precisão (%)
60 60 1.4 60
98,0 80
50 40 1.2 40 97,5 75
1,0
97,0 70
40 20 20
0,8 96,5 65

30 0 0,6 0 96,0 60
20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90
Limite (%) Limite α (%) Limite α (%)

(a) (b) (c)


Figura 10.Resultados para avaliação de confiança usando detecção de novidade: relação entre o
valor do limiarα(x-eixo), a porcentagem de estimativas aceitas (em azul) e (a) a precisão final das
classificações aceitas, (b) o erro médio de localização, e (c) a precisão da sala. Em comparação com
os resultados anteriores, a precisão da localização é melhorada, mas ao custo de reduzir o número
de estimativas aceitas.

Como podemos ver, a detecção de novidades foi realmente capaz de melhorar tanto a
precisão da localização quanto o erro médio. No entanto, foi à custa de um número menor de
previsões aceitas. Por exemplo, em comparação com a probabilidade de previsão na Seção4.2,
como podemos ver na figura10a, para um limite deα= 40%, a precisão da classificação é próxima
de 45%, aumentada de 40%. Quanto ao erro médio de localização, mostrado na Figura10b,
diminuiu de 1,8 m para 1,7 m. Porém, em ambos os casos, as previsões aceitas passaram de 85%
para 68%. No caso da acurácia da sala, ela aumentou de 96,4% para 97,7%, enquanto as previsões
aceitas diminuíram de 99,6% para 87%.
Por outro lado, para um limiarα= 80% os resultados não mudam significativamente já que, na
maioria dos casos, as estimativas com altas probabilidades de predição também passaram no teste de
detecção de novidade.
Finalmente, Figura11mostra a função de distribuição cumulativa para os limiares α=
25%, 45% e 75%. Quando comparados com os resultados anteriores, podemos notar
algumas melhorias nos erros de localização. Por exemplo, ao usar um limiteα= 25% e
considerando as estimativas com erros menores ou iguais a 2 m, o número de
estimativas aumentou de 68% para 72%.
100

90

80
Frequência (%)

70

60

50
T hreter α = 25%
40 T hreter α = 45%
T hreter α = 75%
30
0 2 4 6 8 10
Error (m)
Figure 1 1Cm
. você
ulativo di t ibuição fvocê
nção de the localizati on err ou usar detecção de novidade com estimativas
senhor

d α= 25%, 45%, um d 75
olás % : um alto her por cento age do po sição de limite resultou em erros menores.

Comoc ec um ver, even embora h o novembro ele


te detecto n é capaz de melhorar a precisão, não foi
º e custo of acaceito predficção . Em seguida ramal seção, c possível mostrar os resultados para o nosso ai credo

approach for o ev au euação de confiden ce, que tenta para híbrido minimizar esse problema.

4.4. eva euu oti n de Co nd


fi eantes de nós eu
ng o Hy brId Approac h
Emthé seção, c e mostrar asegundo disco você sé a res você
lts da nossa terceira abordagem híbrida
evaluate the confiar neo c f o e stimado posições. A s meu mencionada na Seção3.3, combina
º e prévo eunósdois ap pa ro ches eu n ordem para eu
mprovar ac curacy enquanto reduz o número de
discartão ed estimatio ns.
Internet futura2022,14, 51 13 de 17

Foi observado nas seções anteriores que quanto menor o limite de probabilidade, maior o erro de
localização. Assim, nesta solução híbrida, utilizamos a probabilidade de predição para valores maiores de
αcomo um primeiro filtro inicial. Em seguida, usamos um limite de probabilidade mais baixoβpara obter
estimativas possivelmente erradas e aplicar o teste de detecção de novidade mais rigoroso, para
confirmar suas previsões. Assim, esperamos mitigar a perda de previsões nas maiores probabilidades e,
assim, ter algumas estimativas perdidas apenas nas previsões com probabilidades menores.
Como nas seções anteriores, a Figura12mostra nossos resultados ao usar a abordagem
híbrida para a avaliação da confiança. No caso da figura12a, podemos notar que a precisão da
localização é muito próxima daquelas obtidas pela abordagem de detecção de novidades (como
mostrado na Seção4.3). Por outro lado, o número de previsões aceitas é muito semelhante ao
obtido pela abordagem de previsão de probabilidade (como mostrado na Seção4.2). Por exemplo,
para o limiarα= 40, a precisão é de 42%, próxima da segunda abordagem e, em termos de
predições aceitas, aumentou de 64% para 70%, semelhante à primeira abordagem. Esses
resultados mostram que essa abordagem híbrida pode chegar a um compromisso, melhorando a
localização enquanto diminui apenas ligeiramente o número de estimativas descartadas.
80 100 2.0 100 100,0 100

%)
1.8 99,5 95
70 80 80

Aceitaram Previsões (%)

precisão (%)
99,0 90
1.6

Aceitaram previsões (
Previsões aceitas (%)

98,5 85
Erro médio (m)
Precisão (%)

60 60 1.4 60
98,0 80
50 40 1.2 40 97,5 75

Sala A
1,0
97,0 70
40 20 20
0,8 96,5 65

30 0 0,6 0 96,0 60
20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90
Limite (%) Limite α (%) Limite α (%)

(a) (b) (c)


Figura 12.Resultados para a avaliação da confiança usando a abordagem híbrida: relação entre o
valor do limiarα(x-eixo), a porcentagem de estimativas aceitas (em azul) e (a) a precisão final das
classificações aceitas, (b) o erro médio de localização, e (c) a precisão da sala. Um compromisso é
alcançado tendo melhores estimativas de localização enquanto aumenta o número de previsões
aceitas.

O mesmo pode ser observado para o erro médio de localização, mostrado na Figura12b. Por
fim, no caso da acurácia da sala, mostrada na Figura12c, a abordagem híbrida também foi capaz
de melhorar essa precisão ao ter quase o mesmo número de amostras aceitas quando comparada
à probabilidade de previsão.
Figura13mostra a função de distribuição cumulativa do erro de localização usando nosso
º ree ap paro ches f ort ele avalia você
ação de co nconfiança eu n três configurações de limites diferentes.
A s nós c an see, o hybrid ap pbarata ha s um erro curve quase igual ou melhor que o
m stricte tive chnique bvocê
minério de novot, como visto eu
no pré vicioso r resultados, tem um maior número de
acaceitar d estimatio ns.
100 100 100

90 90 90

80 80 80
fluência (%)
Frequência (%)

Frequência (%)

70 70 70

60 60 60
Frequencia

50 50 50
α = 2 5%
Probabilidade: Probabilidade: α = 45% Probabilidade: α = 70%
40 = 25%
Novidade%: α 40 Novidade%: α = 45% 40 Novidade%: α = 70% H%brid: α
H%brid: α = 4 5% β, = 25 % H%brid: α = 70% β, = 45% = 90% β, = 70%
30 30 30
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
Erro (m) Erro (m) Erro (m)

(a) (b) (c)


Fi figura 1 3. C oparin ght e cumulnoive distrib você função de ção em dia e erro de localização usando nossas três

proaches , (a) Usando euoc er problema abilidade 25% (b) Usando l superior p probabilidades de 45%, e (c) Usando inferior
probabili ty 70%.

5. Aplicar cb
a ilidade, S te
r ngisso, and Fraco nesses de t he Pro sistema colocado
ou r main mo euatiem for implementar pt ting um eu interior sistema de localização é localizar
televisão

stvocê
dente s em
sIdeias co h olá
. ho nósver, em t eleprimeira versão síon de nosso sistema, a posição instável
estimati ons resultado ed emtele st você
dents ju mping fro meu quarto para o quarto, mesmo que fossem
Internet futura2022,14, 51 14 de 17

realmente estático. Para reduzir esses saltos e melhorar a precisão e estabilidade do nosso
sistema, começamos a procurar soluções para avaliar e melhorar a confiança das previsões.
Assim, propusemos e aplicamos a solução LocFiND, nosso sistema de localização, que foi
capaz de melhorar significativamente os resultados e a estabilidade, mantendo a sensação de um
sistema em tempo real. Nossa solução tem a vantagem de escolher os resultados mais confiáveis,
com base na avaliação de probabilidade e novidade. Isso torna o sistema mais resiliente, pois
mesmo que tenhamos algum problema de comunicação, perda de pacote ou interferência até um
limite, o sistema pode continuar funcionando apenas descartando as informações problemáticas.
Para outros cenários, dependendo dos requisitos da aplicação, nossa solução proposta pode ser
facilmente ajustada para ter uma porcentagem aceitável de estimativas descartadas, melhorando
consideravelmente a precisão e a estabilidade do sistema.
No entanto, descartar dados causa alguns problemas para avaliar os resultados, pois a
quantidade final de resultados é menor do que se usássemos todos os dados. Neste trabalho, a
avaliação foi baseada na acurácia e erro médio. A precisão pode ser definida comoa=h/n, e o erro
médio comoae=e/n, ondehé o número de resultados de classificação corretos eeé a soma dos
erros associados aos resultados considerados válidos pelos algoritmos, ené o número de saídas
válidas do algoritmo. No entanto, como nosso algoritmo descarta alguns dados, o valor denpara
eles torna-se diferente, tornando a comparação entre eles não totalmente justa. Assim, na maioria
dos resultados, incluímos a porcentagem de previsões aceitas para deixar claro que, embora o erro
tenha diminuído, o número de previsões aceitas também diminuiu.
Por fim, sabe-se que os valores de RSS informados pelos dispositivos são um pouco
dependentes do hardware e podem variar de um fabricante para outro. Ainda que isso
pudesse afetar o desempenho dos sistemas de localização, no caso de nossa aplicação, em
que implementamos a solução proposta na área escolar, isso não foi um problema, pois todo
o hardware era similar e do mesmo fabricante.

6. Conclusões e Trabalhos Futuros


Neste artigo, propomos e avaliamos o desempenho de uma nova abordagem para localização
indoor, o LocFiND (Localization using Fingerprinting and Novelty Detection). Em nossa solução, as
informações recebidas na fase online só serão aceitas após passarem por uma avaliação de confiança.
Em seguida, propomos três abordagens diferentes para essa avaliação de confiança. Uma primeira
usando apenas a probabilidade de classificação, outra adicionando detecção de novidades e uma
abordagem híbrida que usa probabilidade de previsão e detecção de novidades para melhorar a
precisão da localização enquanto tenta descartar o mínimo de informações possível.
A principal contribuição de nossa solução é a possibilidade de remover resultados não confiáveis
(que podem ter sido afetados por informações ruidosas) na fase online, enquanto a maioria dos
trabalhos na literatura avalia o impacto do ruído na fase de treinamento ou coleta de dados. A principal
preocupação de nossa abordagem é como descartar o menor número possível de estimativas e, ao
mesmo tempo, aumentar a precisão e a estabilidade. Assim, nossa solução fornece uma importante
compensação entre precisão e o número de estimativas que podem ser descartadas sem comprometer
o sistema.
Nossos resultados mostram que podemos ter configurações menos restritas, para um
limiar α=40%, que melhora a precisão da posição de 36% para 44% e o erro médio de
localização de 1,9 m para 1,6 m em comparação com um kNN tradicional, descartando
apenas 30% das estimativas. Por outro lado, podemos ter configurações mais restritas, para
um limiar α=80%, que pode melhorar a precisão para quase 70% e o erro médio de
localização para 0,9 m, mas aceitando apenas 18% das estimativas. Em termos de precisão da
sala, que era o foco principal de nossa aplicação, o LocFiND foi capaz de melhorar a precisão
de 96% para quase 99,5%, descartando apenas 20% das estimativas para um limiteα= 90%.
Em trabalhos futuros, pretende-se propor e analisar outros métodos de avaliação da confiança. Por
exemplo, o valor residual, usado principalmente no método dos mínimos quadrados, pode ser usado
para calcular uma “distância” entre a nova amostra e os vizinhos mais próximos no banco de dados de
impressões digitais. Nosso objetivo é avaliar como esta e outras medidas de discrepâncias podem ser
usadas para melhorar nossa solução.
Internet futura2022,14, 51 15 de 17

Outro ponto que podemos adiantar é o problema gerado pelo descarte de informações não
confiáveis na fase de localização. Buscamos definir, dado o tempo de resposta exigido pelo sistema,
quanta informação podemos descartar sem prejudicar seu funcionamento. Podemos definir quantidades
mínimas de dados distribuídos ao longo do tempo como um requisito do aplicativo, que define o limite
máximo de descarte de dados.
Também em trabalhos futuros, pretendemos comparar nosso trabalho com uma abordagem mais
robusta e de ponta, diferente do KNN. Nossa solução proposta possui algumas particularidades que a
tornam um pouco diferente da maioria das soluções propostas, principalmente a característica de
descartar classificações não confiáveis baseadas na detecção de novidades. Como a maioria das
soluções conhecidas não descarta essas classificações, seria difícil, neste trabalho atual, fazer a
comparação sem deixar de ver os ganhos isolados obtidos por nossa avaliação do passo de confiança.

Contribuições do autor:Os autores contribuíram igualmente para este trabalho. Todos os autores leram e
concordaram com a versão publicada do manuscrito.

Financiamento:Esta pesquisa foi parcialmente financiada pelo Instituto de Inovação, Pesquisa e


Desenvolvimento Científico e Tecnológico do Amazonas (IPDEC), Positivo Technologies e, conforme
artigo 48 do Decreto nº 6.008/2006, Samsung Eletrônica da Amazônia Ltda, nos termos da Lei Federal Lei
no 8.387/1991, por meio do convênio no 003, firmado com o ICOMP/UFAM.

Declaração de Disponibilidade de Dados:Os códigos e bases utilizados na parte de experimentação deste trabalho
estão disponíveis emhttps://github.com/hasm/doc(acessado em 15 de janeiro de 2022).

Conflitos de interesse:Os autores declaram não haver conflito de interesses.

Referências
1. Zafari, F.; Gkelias, A.; Leung, KK Uma Pesquisa de Sistemas e Tecnologias de Localização Interna.IEEE Comun. Sobreviver Tutor.2019, 21,
2568–2599. [CrossRef]
2. Boukerche, A.; Oliveira, HA; Nakamura, EF; Loureiro, AA Sistemas de localização para redes de sensores sem fios.IEEE Wire.
Comum.2007,14, 6–12. [CrossRef]
3. Balico, LN; Loureiro, AAF; Nakamura, EF; Barreto, RS; Pazzi, RW; Oliveira, HABF Previsão de Localização em Redes Veiculares Ad
Hoc.IEEE Comun. Sobreviver Tutor.2018,20, 2784–2803. [CrossRef]
4. Wang, B.; Chen, Q.; Yang, LT; Chao, H. Localização interna de smartphone via crowdsourcing de impressão digital: desafios e
abordagens.IEEE Wire. Comum.2016,23, 82–89. [CrossRef]
5. Gu, Y.; Lo, A.; Niemegeers, I. Uma pesquisa de sistemas de posicionamento interno para redes pessoais sem fio.IEEE Comun. Sobreviver Tutor.
2009,11, 13–32. [CrossRef]
6. Harle, R. Uma Pesquisa de Sistemas de Posicionamento Inercial Interno para Pedestres.IEEE Comun. Sobreviver Tutor.2013,15, 1281–1293. [
CrossRef]
7. Subbu, KP; Zhang, C.; Luo, J.; Vasilakos, AV Analysis e status quo de sistemas de localização internos baseados em smartphones.IEEE Wire.
Comum.2014,21, 106–112. [CrossRef]
8. Liu, H.; Darabi, H.; Banerjee, P.; Liu, J. Pesquisa de técnicas e sistemas de posicionamento interno sem fio.IEEE Trans. Sist. Homem Cibern.
Parte C Ap. Rev.2007,37, 1067–1080. [CrossRef]
9. Yassin, A.; Nasser, Y.; Awad, M.; Al-Dubai, A.; Liu, R.; Yuen, C.; Raulefs, R.; Aboutanios, E. Avanços recentes em localização interna:
uma pesquisa sobre abordagens teóricas e aplicações.IEEE Comun. Sobreviver Tutor.2017,19, 1327–1346. [CrossRef]
10. Zhuang, Y.; Yang, J.; Li, Y.; Qi, L.; El-Sheimy, N. Localização interna baseada em smartphone com sinalizadores Bluetooth de baixa energia.
Sensores2016,16, 596. [CrossRef]
11. Castillo-Cara, M.; Lovón-Melgarejo, J.; Bravo-Rocca, G.; Orozco-Barbosa, L.; García-Varea, I. Um estudo empírico da configuração de potência de
transmissão para mecanismos de localização interna baseados em Bluetooth.Sensores2017,17, 1318. [CrossRef]
12. Sie, MK; Kuo, CH Estimativa de localização interna usando beacon BLE com vários níveis de potência de transmissão. Nos Anais da Conferência
Internacional IEEE 2017 sobre Eletrônicos de Consumo-Taiwan (ICCE-TW), Taipei, Taiwan, 12–14 de junho de 2017; pp. 323–324.
[CrossRef]
13. Qureshi, UM; Umair, Z.; Hancke, GP Avaliando as implicações da variação dos níveis de potência de transmissão Bluetooth Low Energy
(BLE) na exatidão e precisão da localização interna sem fio.Sensores2019,19, 3282. [CrossRef]
14. Sadowski, S.; Spachos, P. Localização interna baseada em RSSI com a Internet das Coisas.Acesso IEEE2018,6, 30149–30161. [CrossRef]
15. Bahl, P.; Padmanabhan, V. RADAR: Um sistema de rastreamento e localização de usuário baseado em RF embutido. Em Proceedings of the IEEE
INFOCOM 2000, Conference on Computer Communications. Décima Nona Conferência Anual Conjunta das Sociedades de Computação e
Comunicações IEEE (Cat. No.00CH37064), Tel Aviv, Israel, 26–30 de março de 2000; Volume 2, pp. 775–784. [CrossRef]
16. Bahl, P.; Bahl, P.; Padmanabhan, VN; Balachandran, A.Melhorias no sistema de localização e rastreamento do usuário RADAR; Relatório
técnico; Microsoft: Redmond, WA, EUA, 2000.
Internet futura2022,14, 51 16 de 17

17. Chen, Z.; Wang, J. GROF: Localização interna usando uma rede neural de regressão geral de largura de banda múltipla e filtro de outlier.
Sensores2018,18, 3723. [CrossRef] [PubMed]
18. Sim, Y.; Wang, B. RMapCS: construção de mapa de rádio a partir de amostras de crowdsourcing para localização interna.Acesso IEEE2018, 6,
24224–24238. [CrossRef]
19. Bhatti, MA; Riaz, R.; Rizvi, SS; Shokat, S.; Riaz, F.; Kwon, SJ Detecção de outliers em localização interna e Internet das Coisas (IoT) usando
aprendizado de máquina.J. Comun. Netw.2020,22, 236–243. [CrossRef]
20. Assayag, Y.; Oliveira, H.; Souto, E.; Barreto, R.; Pazzi, R. Sistema de Posicionamento Interno Usando Estimativa de Modelo Dinâmico.Sensores 2020
,20, 7003. [CrossRef]
21. Ashraf, I.; Hur, S.; Park, Y. Posicionamento interno em diferentes smartphones comerciais usando pontos de acesso Wi-Fi Área de cobertura.
Sensores2019,19, 4351. [CrossRef] [PubMed]
22. Ali, MU; Hur, S.; Parque, S.; Park, Y. Colhendo a precisão do posicionamento interno explorando vários recursos do vetor de força do
sinal recebido.Acesso IEEE2019,7, 52110–52121. [CrossRef]
23. Youssef, MA; Agrawala, A.; Shankar, AU WLAN Localização Determinação via Agrupamento e Distribuições de Probabilidade. Em
Proceedings of the First IEEE International Conference on Pervasive Computing and Communications (PERCOM '03), Fort Worth,
TX, EUA, 26 de março de 2003; IEEE Computer Society: Washington, DC, EUA, 2003; pág. 143.
24. Youssef, M.; Agrawala, A. Manipulação de correlação de amostras no sistema Horus. Em Proceedings of INFOCOM 2004, Vigésima
Terceira Conferência Anual Conjunta das Sociedades de Computação e Comunicações IEEE, Hong Kong, China, 7–11 de março de
2004; Volume 2, pp. 1023–1031. [CrossRef]
25. Roos, T.; Myllymäki, P.; Tirri, H.; Misikangas, P.; Sievänen, J. Uma abordagem probabilística para a estimativa de localização do usuário WLAN.Int. J.
Wirel. Inf. Netw.2002,9, 155–164. [CrossRef]
26. Castro, P.; Chiu, P.; Kremenek, T.; Muntz, RR Um serviço de localização de salas probabilísticas para ambientes de rede sem fio. Em Proceedings of
the 3rd International Conference on Ubiquitous Computing (UbiComp '01); Springer: Londres, Reino Unido, 2001; pp. 18–34.
27. Pinto, BHOUV; de Oliveira, HABF; Souto, EJP Otimização de Fatores para o Projeto de Sistemas de Posicionamento Interno Usando um Algoritmo
Baseado em Probabilidade.J. Sens. Atuador Netw.2021,10, 16. [CrossRef]
28. Battiti, R.; Nhat, TL; Villani, A.Computação com reconhecimento de localização: um modelo de rede neural para determinar a localização em LANs sem fio;
Relatório técnico; Universidade de Trento: Trento, Itália, 2002.
29. Saha, S.; Chaudhuri, K.; Sanghi, D.; Bhagwat, P. Determinação da localização de um dispositivo móvel usando sinais de ponto de acesso IEEE
802.11b. Em Proceedings of the 2003 IEEE Wireless Communications and Networking (WCNC 2003), Nova Orleans, LA, EUA, 16–20 de março de
2003; Volume 3, pp. 1987–1992. [CrossRef]
30. Hamza, LNC Uma abordagem de sistema dinâmico para impressão digital de localização de rádio em redes locais sem fio. In Proceedings of the
IEEE 2009 IEEE International Symposium on Intelligent Signal Processing (WISP 2009), Budapeste, Hungria, 26–28 de agosto de 2009; pp. 253–
258.
31. Chen, YC; Juang, JC Sistema de localização interna baseado em detecção de outliers para redes de sensores sem fio.Int. J. Navig. Obs.2012, 2012,
961785. . [CrossRef]
32. Cheng, R.; Chen, L.; Chen, J.; Xie, X. Avaliando Probabilidade Limite K-Nearest-Neighbor Consultas sobre Dados Incertos. EmProceedings
of the 12th International Conference on Extending Database Technology: Advances in Database Technology (EDBT '09); Association for
Computing Machinery: Nova York, NY, EUA, 2009; pp. 672–683. [CrossRef]
33. Yang, B.; Lu, H.; Jensen, CS Limiar Probabilístico k Consultas do Vizinho Mais Próximo sobre Objetos em Movimento no Espaço Interno Simbólico.
EmProceedings of the 13th International Conference on Extending Database Technology (EDBT '10); Association for Computing Machinery:
Nova York, NY, EUA, 2010; pp. 335–346. [CrossRef]
34. Yang, L.; Chen, H.; Cui, Q.; Fu, X.; Zhang, Y. Probabilistic-KNN: Um Novo Algoritmo para Cenário de Localização Interna Passiva. Em Proceedings of
the 2015 IEEE 81st Vehicular Technology Conference (VTC Spring), Glasgow, Reino Unido, 11–14 de maio de 2015; pp. 1–5.
[CrossRef]
35. Liu, L.; Li, B.; Yang, L.; Liu, T. Abordagem de Posicionamento Interno em Tempo Real Usando iBeacons e Sensores de Smartphone.Appl. ciência2020, 10,
2003. [CrossRef]
36. Pelant, J.; Tlamsa, Z.; Benes, V.; Polak, L.; Kaller, O.; Bolecek, L.; Kufa, J.; Sebesta, J.; Kratochvil, T. Localização interna de dispositivos BLE
baseada em impressão digital RSS mapeada por modos de propagação. Nos Anais da 27ª Conferência Internacional Radioelektronika
(RADIOELEKTRONIKA) de 2017, Brno, República Tcheca, 19–20 de abril de 2017; pp. 1–5. [CrossRef]
37. Polak, L.; Rozum, S.; Slanina, M.; Bravenec, T.; Fryza, T.; Pikrakis, A. Estimativa de localização interna baseada em impressão digital da intensidade
do sinal recebido empregando aprendizado de máquina.Sensores2021,21, 4605. [CrossRef] [PubMed]
38. Qian, J.; Mãe, J.; Ying, R.; Liu, P.; Pei, L. Um método aprimorado de localização interna usando sensores inerciais de smartphones. In Proceedings
of the International Conference on Indoor Positioning and Indoor Navigation, Montbeliard, França, 28–31 de outubro de 2013; pp. 1–7.
[CrossRef]
39. Yang, Z.; Wu, C.; Zhou, Z.; Zhang, X.; Wang, X.; Liu, Y. A mobilidade aumenta a capacidade de localização: uma pesquisa sobre localização interna sem fio
usando sensores inerciais.Computação ACM. Sobreviver2015,47, 1–34. [CrossRef]
40. Ashraf, I.; Hur, S.; Shafiq, M.; Kumari, S.; Park, Y. GUIDE: Localização interna de pedestres baseada em sensores de smartphones com
dispositivos heterogêneos.Int. J. Comun. Sist.2019,32, e4062. [CrossRef]
41. Ashraf, I.; Hur, S.; Park, Y. Melhorando o desempenho da localização interna baseada em campo magnético usando padrões magnéticos de
vários smartphones.Sensores2020,20, 2704. [CrossRef]
Internet futura2022,14, 51 17 de 17

42. Basiri, A.; Lohan, ES; Moore, T.; Winstanley, A.; Peltola, P.; Colina, C.; Amirian, P.; Figueiredo e Silva, P. Desafios dos serviços baseados em
localização indoor, requisitos e usabilidade das soluções atuais.Comput. ciência Rev.2017,24, 1–12. [CrossRef]
43. Swangmuang, N.; Krishnamurthy, P. Análises de impressões digitais de localização para um posicionamento interno eficiente. Nos Anais da Sexta
Conferência Internacional Anual IEEE de 2008 sobre Computação e Comunicações Pervasivas (PerCom), Hong Kong, China, 17–21 de março de
2008; pp. 100–109. [CrossRef]
44. Buitinck, L.; Loupe, G.; Blondel, M.; Pedregosa, F.; Mueller, A.; Grisel, O.; Niculae, V.; Prettenhofer, P.; Gramfort, A.; Grobler,
J.; e outros Design de API para software de aprendizado de máquina: experiências do projeto Scikit-Learn. 2013, pp. 108–122.
Disponível:https://hal.inria.fr/hal-00856511/document(acessado em 15 de janeiro de 2022).
45. Pimentel, MA; Clifton, DA; Clifton, L.; Tarassenko, L. Uma revisão da detecção de novidade.Processo de sinal.2014,99, 215–249. [CrossRef]

46. Markou, M.; Singh, S. Detecção de novidades: Uma revisão — Parte 1: Abordagens estatísticas.Processo de sinal.2003,83, 2481–2497. [CrossRef]
47. Miljković, D. Revisão dos métodos de detecção de novidades. Nos Anais da 33ª Convenção Internacional MIPRO, Opatija, Croácia, 24–28 de maio
de 2010; pp. 593–598.
48. Sayyed, S.; Deolekar, R. Uma pesquisa sobre detecção de novidade usando métodos de conjunto de nível. Nos Anais da Conferência Internacional
de 2017 sobre Comunicação Inventiva e Tecnologias Computacionais (ICICCT), Coimbatore, Índia, 10–11 de março de 2017; pp. 415–418. [
CrossRef]
49. Ding, X.; Li, Y.; Belatreche, A.; Maguire, LP Uma avaliação experimental de métodos de detecção de novidades.neurocomputação2014, 135, 313–
327. [CrossRef]

Você também pode gostar