Escolar Documentos
Profissional Documentos
Cultura Documentos
com
futura internet
Artigo
Abstrato:Os sistemas de localização indoor são usados para localizar dispositivos móveis dentro de
edifícios onde as soluções tradicionais, como os sistemas globais de navegação por satélite (GNSS), não
funcionam bem devido à falta de visibilidade direta dos satélites. A impressão digital é uma das soluções
mais conhecidas para localização indoor. Baseia-se na intensidade do sinal recebido (RSS) de pacotes
transmitidos entre dispositivos móveis e nós âncora. No entanto, os valores de RSS são conhecidos por
serem instáveis e ruidosos devido aos obstáculos e à dinamicidade dos cenários, causando imprecisões
nas estimativas de posição. Essa instabilidade e ruído geralmente fazem com que o sistema indique um
local que não tem certeza se é o correto, embora seja o mais provável com base nos cálculos. Essa
propriedade do RSS pode fazer com que os algoritmos retornem uma localização com baixo nível de
confiança. Se pudéssemos escolher resultados mais confiáveis, teríamos um resultado global com
melhor qualidade. Assim, em nossa solução, criamos uma fase de verificação do nível de confiança do
resultado da localização. Para isso, utilizamos a probabilidade de predição fornecida pelo KNN e a
detecção de novidade para descartar classificações pouco confiáveis e muitas vezes erradas. Neste
----
--- trabalho, propomos o LocFiND (Localization using Fingerprinting and Novelty Detection), uma solução
Citação:de Souza Mourão, HA; de baseada em impressão digital que usa probabilidade de predição e detecção de novidades para avaliar a
Oliveira, HABF Sistema de confiança das posições estimadas e mitigar imprecisões causadas por RSS na fase de localização.
Localização Interna Usando Implementamos nossa solução em uma área escolar de grande escala do mundo real usando
Impressão digital e detecção de dispositivos baseados em Bluetooth.
novidades para avaliação de confiança.
Internet futura2022,14, 51. https:// Palavras-chave:localização interior; sistema de posicionamento; impressões digitais; Bluetooth; aprendizado de máquina
doi.org/10.3390/fi14020051
vários níveis de potência de transmissão com o RSS mais estável em um alto nível de potência de
transmissão [11,12], mas tem implicações práticas importantes para a eficiência energética, resultando
em uma compensação entre o desempenho do local e a vida útil da bateria [13].
RSS é uma das informações mais populares e disponíveis usadas pelos sistemas de
localização. Uma das razões para sua ampla adoção é que ela não requer equipamentos extras e
pode ser encontrada na maioria dos dispositivos equipados com comunicação sem fio [14]. O RSS é
uma medida da intensidade do sinal recebido dos pacotes. Uma técnica comum para sistemas de
localização interna é a impressão digital, que usa dados RSS para construir mapas de rádio,
também conhecidos como bancos de dados de impressões digitais. Na fase offline, os mapas RSS
são criados com base nos valores RSS obtidos nos diferentes pontos da área onde queremos ter o
serviço de localização. Em seguida, um classificador usa essa informação para estimar a posição
dos nós na fase online. Um classificador comumente usado para esse fim é o k-Nearest Neighbors
(kNN), usado pelo RADAR [15,16].
A ideia principal da técnica de impressão digital é baseada na suposição de que cada
localização espacial dentro de casa pode ser identificada por um único conjunto de RSSs
mensuráveis.4]. No entanto, como o RSS é muito suscetível a ruídos no ambiente, o RSS
geralmente pode causar erros nas estimativas de localização. Por exemplo, nosso principal
aplicativo neste artigo visa fornecer informações de localização para pequenos dispositivos
alimentados por bateria para serem usados por alunos em escolas e permitir várias aplicações
interessantes, como registro automático de frequência de alunos, controle de entrada e saída e
assim por diante . Porém, nas primeiras versões do nosso sistema de localização, a instabilidade do
RSS fazia com que os alunos “pulassem” de sala em sala, mesmo estando estáticos.
Várias técnicas são propostas na literatura para lidar com o ruído RSS [17–22]. A maioria dessas
soluções concentra-se na média dos valores de RSS ou na realização de outras transformações no banco
de dados de impressões digitais. No entanto, esse ruído pode afetar não apenas os dados de
treinamento, mas também os dados recebidos na fase online, principalmente quando se considera que,
na maioria das vezes, o treinamento é feito em um prédio vazio enquanto a fase online ocorre em um
cenário mais movimentado e dinâmico. Infelizmente, a média de vários valores de RSS não é uma opção
para a fase online de nosso aplicativo, pois os dispositivos móveis são extremamente limitados em
energia e não é possível trocar ou recarregar suas baterias. Assim, precisamos de uma solução que
também considere o impacto dessa variação do RSS na fase online sem exigir o envio de pacotes de
dados adicionais.
A principal limitação dos sistemas de localização baseados em RSS é a flutuação do
RSS, que pode induzir diversos erros mesmo quando se utilizam técnicas de aprendizado
de máquina. Essa flutuação pode resultar em classificações/posições com baixa
confiabilidade. Assim, um passo intuitivo é detectar e descartar essas classificações para
obter resultados mais confiáveis e com melhor qualidade. Assim, em nossa proposta de
solução, criamos uma etapa adicional denominada “Avaliação de Confiança”. Para isso,
utilizamos a probabilidade de predição fornecida pelo KNN e a técnica Novelty Detection
para detectar e descartar classificações que não são consideradas confiáveis e, muitas
vezes, possuem erros maiores. Isso é feito usando a probabilidade de predição, que é
um passo adicional na técnica KNN baseada nas distâncias dos k vizinhos mais próximos.
Adicionalmente,
Para nossa aplicação e avaliação de desempenho, usamos nós âncora baseados em Bluetooth e
dispositivos móveis do tipo smartwatch para serem usados pelos alunos. Implementamos nossa
solução em uma área escolar real de grande escala e comparamos seu desempenho com a solução
tradicional baseada em impressão digital kNN. Nossos resultados mostram que nossa solução foi capaz
de melhorar tanto a precisão da localização quanto o número de posições fixas ao descartar dados RSS
ruidosos.
As principais contribuições deste documento são as seguintes:
2. Trabalho relacionado
No Sistema Horus [23,24], uma técnica de agrupamento conjunto é proposta para a estimativa de
localização usando um método probabilístico. Nesse sistema, cada coordenada possível em que o
candidato esteja é considerada uma classe ou categoria. Para minimizar o erro de distância, o local é
escolhido onde sua probabilidade é maior. Aumentar o número de amostras em cada local de
amostragem melhora a precisão, pois melhora a estimativa da média e desvio padrão da distribuição
gaussiana usada. Sistemas probabilísticos semelhantes também foram propostos em outros trabalhos [
25–27]. Um método baseado em treinamento para determinar a localização usando classificadores
baseados em redes neurais é proposto em [28]. Em uma abordagem mais ampla, os autores em [29]
comparou os vários classificadores mencionados: redes neurais, kNN e métodos probabilísticos. Seus
resultados mostram que todas as técnicas tiveram um bom desempenho em diferentes cenários.
Em [30], vários experimentos foram realizados para mostrar que as técnicas de localização para
ambientes internos baseadas em treinamento (fingerprinting) têm melhor desempenho do que as
tradicionais baseadas em trilateração/multilateração. A principal razão apontada foi o fenômeno
multipercurso, no qual o comportamento do sinal é afetado pelos diversos obstáculos encontrados em
tais cenários. No entanto, uma observação levantada neste trabalho é que as técnicas de localização
baseadas em treinamento sofrem degradações na precisão da localização em ambientes dinâmicos,
onde as propriedades do local podem mudar com o tempo (por exemplo, reorganização de armários,
mesas, divisórias).
Devido ao multicaminho, desvanecimento da sombra e algumas restrições de hardware, valores
discrepantes nas medições de RSS não são incomuns. Se a medição for um uutiler, seja na fase off-line ou on-
line, a estimativa de posição resultante provavelmente será a errada [31]. Em [19], uma técnica de detecção de
outliers chamada iF_Ensemble foi desenvolvida. A solução proposta é capaz de analisar a qualidade do RSS
usando uma combinação de métodos de aprendizado de máquina supervisionados, não supervisionados e
ensemble. Nesta solução, a floresta de isolamento (iForest) é usada como um método de aprendizado não
supervisionado. O método de aprendizado supervisionado inclui classificadores de máquina de vetor de
suporte (SVM), kNN e floresta aleatória (RF).
Internet futura2022,14, 51 4 de 17
Em [17], os autores propõem uma nova rede neural de regressão generalizada de largura de
banda múltipla (GRNN) com a abordagem de posicionamento interno do filtro outlier, chamada GROF,
para melhorar a precisão e a robustez do posicionamento. Ele usa um novo tipo de arquitetura de
núcleo de largura de banda múltipla para obter um desempenho de regressão mais flexível do que o
GRNN tradicional. Além disso, um esquema de filtragem de outliers é usado para melhorar a robustez do
sistema contra a flutuação do RSS causada pelo ambiente dinâmico.
Uma consulta de limite probabilístico k-vizinho mais próximo (Tk-PNN) é proposta em [32]. Esta
solução retorna conjuntos de k resultados com probabilidades superiores a algum limite T. O resultado é
refinado usando filtros para remover resultados com o auxílio de um índice espacial e seleção
probabilística de candidatos.
Em [33], uma consulta de limite probabilístico kNN (PTkNN) é usada. Ele usa uma combinação de
três técnicas para o processamento eficiente de consultas PTkNN. Métrica de distância mínima de
caminhada interna (MIWD) para podar objetos que estão muito distantes, estimativa de probabilidade
eficiente para podar candidatos não qualificados e uma avaliação de probabilidade eficiente para o
candidato restante e os k-subconjuntos. Da mesma forma, em [34], é utilizado o algoritmo probabilístico
KNN (pkNN) que utiliza a probabilidade de RSS no rádio-mapa como ponderação para calcular a distância
euclidiana. Esta solução também filtra os valores de RSS cuja probabilidade é inferior a 3%.
Ref. [36] avaliou os desempenhos de localização BLE com base na impressão digital RSS. Eles
apresentaram um aplicativo baseado em Ray-Launching para emular a propagação do sinal de
radiofrequência (RF) BLE em um ambiente interno de escritório. Um local de trabalho de medição
apropriado e sua configuração são propostos para medir os valores RSS e são usados para criar
um mapa RSSfingerprinting. A precisão da determinação da posição é calculada e avaliada. Os
resultados mostram que o desempenho da tecnologia BLE, para fins de localização indoor,
depende muito do número de nós BLE considerados e do método de avaliação aplicado (por
exemplo, número de setores considerados).
Em [37], é usado BLE com várias âncoras e vários canais de rádio para melhorar a
confiabilidade das medições de potência. O trade-off precisão-complexidade afeta as quatro
técnicas de aprendizado supervisionado mais populares (k-vizinhos mais próximos, máquinas de
vetores de suporte, floresta aleatória e rede neural artificial). Eles foram avaliados em ambientes
uni e bidimensionais com quatro âncoras estáticas. O melhor resultado é obtido pelo Random
Forest com uma precisão de classificação superior a 99%.
Outra técnica de localização de estimativa de pedestres (PDR) é proposta em [38]. Os autores
usaram os sensores do smartphone para estimar a localização de um pedestre com menor custo de
instalação. Atualmente, os smartphones possuem vários sensores inerciais (por exemplo, acelerômetro,
giroscópio e magnetômetro) que podem ser usados para detecção de mobilidade e localização [39].
Em [40], usando um magnetômetro, uma abordagem de impressão digital de intensidade de campo
magnético é usada para localizar um pedestre interno. Sensores de acelerômetro e giroscópio também são
usados para encontrar a distância percorrida pelo pedestre e a estimativa de direção combinada com os
padrões de força do campo magnético para formular um banco de dados de impressões digitais. Experimentos
foram conduzidos com vários modelos de smartphones e eles foram capazes de localizar um pedestre a 1,21 m
a 50% e a 1,93 m a 75%, independentemente do dispositivo usado para localização. O desempenho da
abordagem proposta é comparado ao K-Nearest Neighbor (KNN).
Internet futura2022,14, 51 5 de 17
este pacote e encaminhar as informações para um servidor central. O servidor poderá então
estimar o local para onde o pacote foi enviado e, assim, a localização do dispositivo móvel.
Figura 1.Arquitetura LocFiND: a fase de treinamento gera o banco de dados de impressões digitais, que é
usado na fase online para estimar a posição dos dispositivos móveis.
O servidor central usa um algoritmo KNN com o banco de dados de impressões digitais da
fase de treinamento, assim retornará não apenas a classe, mas também as probabilidades da
amostra pertencer a cada uma das diferentes classes. Essas probabilidades serão então avaliadas
por nossas abordagens propostas para a avaliação de confiança para a classificação final. A
métrica de medição de similaridade usada no KNN é a distância euclidiana.
Conforme mencionado anteriormente, os valores de RSS variam mesmo quando o nó não está em
movimento. Isso ocorre devido às características do ambiente e obstáculos que podem alterar o sinal
momentaneamente causando erros tanto na fase de treinamento quanto na fase online.
Muitos trabalhos na literatura tratam do ruído RS na fase de treinamento [43], mas a
informação do sinal na fase online sofre do mesmo problema ou pior já que, na maioria das vezes,
o treinamento é feito em um prédio vazio enquanto a fase online ocorre em um cenário mais
lotado e dinâmico. Assim, precisamos de soluções que também levem em consideração o impacto
dessa variação do RSS na fase online.
Um passo intuitivo seria descartar e ignorar os dados em que temos baixa confiança no momento
da localização. No entanto, depois de algum tempo sem informações de localização, essa informação
ausente começará a ser perceptível. Assim, não podemos simplesmente começar a ignorar qualquer
informação que possa não ser confiável. A questão que fica é como definir, na fase online, se um
conjunto de RSS's recebidos pode ser considerado confiável para a correta classificação. Referimo-nos a
esta etapa como Avaliação de confiança em nossa arquitetura LocFiND.
Como mencionado anteriormente, propomos três técnicas diferentes no LocFiND para avaliar
a confiança das posições estimadas:
1. Probabilidade de previsão: usa a probabilidade de previsão estimada para decidir se aceita
a classe estimada.
2. Detecção de novidades: utiliza a técnica de detecção de novidades para identificar a confiabilidade da
amostra classificada.
3. Abordagem híbrida: usa detecção de probabilidade e novidade para melhorar as
soluções isoladas.
Essas três técnicas são explicadas e detalhadas nas próximas seções.
Nessa abordagem, escolhemos a classe com maior probabilidade e, se essa probabilidade for
maior que um limiteα, a classificação é aceita e a nova posição estimada é enviada para a
aplicação. Caso contrário, o resultado é rejeitado. Figura2mostra o diagrama completo para
esta avaliação de confiança.
Figura 2.Avaliação de confiança usando probabilidade de predição: classificações com probabilidades baixas são
descartadas para melhorar a precisão.
As técnicas de detecção de novidades podem ser implementadas usando diferentes técnicas, como
técnicas baseadas em máquinas de vetores de suporte, técnicas baseadas em agrupamento, técnicas baseadas
no vizinho mais próximo e técnicas estatísticas [48].
Uma técnica de detecção de novidade não supervisionada comumente usada é baseada em SVM. Ele
constrói um esquema de limite esférico que agrupa e inclui a maioria das amostras de dados normais. Qualquer
amostra nova e não vista que caia fora dos limites do grupo é detectada como novidade. Em trabalhos recentes
sobre detecção de novidade baseada em SVM, uma variação chamada OC-SVM (one-class SVM) é usada, pois
possui alguns truques de kernel que permitem separar facilmente dados normais e novos em espaços
dimensionais superiores [49], que é o caso do nosso sistema de localização com 15 dimensões (ou seja, nós
âncora).
Nesta avaliação da parte de confiança do LocFiND, primeiro usamos a probabilidade de
predição, como na Seção anterior3.1, para ter uma primeira avaliação do próprio KNN quanto ao
Internet futura2022,14, 51 8 de 17
confiabilidade da classificação. Então, para uma segunda validação do resultado, utilizamos o conceito de
detecção de novidades para confirmar se uma determinada amostra realmente pertence àquela classe.
Assim, a mesma probabilidade de predição explicada anteriormente com o limiarαé usado. No
entanto, as classificações são posteriormente validadas usando a detecção de novidade implementada
usando o One-Class SVM. Além de passar no teste de threshold, uma nova validação é feita pelo
algoritmo da novidade que testa se aquela amostra realmente pertence à classe escolhida (aquela com
maior probabilidade retornada pelo KNN). Somente quando ambos os testes são aprovados, uma
classificação é aceita. Este processo de decisão completo para a avaliação da confiança é representado na
Figura4.
Figura 4.Avaliação da confiança usando a técnica de detecção de novidade: a precisão é melhorada pelo
descarte adicional de classificações não confiáveis.
As seções anteriores3.1e3.2são mais confiáveis e precisos, mas, como mostramos na Seção4, ele
descarta e ignora um grande número de estimativas de posição, deixando o sistema com poucas
informações de posição. Assim, nesta seção, propomos uma nova técnica denominada Abordagem
Híbrida. Chamamos de híbrido porque combina a avaliação de confiança das duas configurações
anteriores, cada uma sendo aplicada a um limiar utilizado em diferentes etapas e técnicas. O primeiro
limite é uma estimativa de probabilidade, enquanto o segundo é um fator de novidade. Assim, esta
abordagem híbrida combina a primeira e a segunda abordagens.
Para entender a abordagem híbrida, precisamos primeiro entender o comportamento do
limite de probabilidadeα. Quanto menor o limite de probabilidade, maiores os erros de
classificação, resultando em um maior erro médio de localização. Porém, neste caso, também
temos um número maior de estimativas de posição, o que é bom para a aplicação. Se
aumentarmos esse limite, melhoramos a precisão, mas também reduzimos o número de
classificações aceitas, deixando o sistema sem estimativas de posição suficientes.
Na abordagem híbrida, inicialmente usamos o mesmo limite de probabilidadeαcomo nas seções
anteriores. No entanto, em vez de simplesmente rejeitar as classificações que não passam nesse filtro,
usamos a detecção de novidade para dar uma segunda chance para algumas dessas classificações que
seriam descartadas de outra forma. Para isso, usamos um segundo limite de probabilidade mais baixo β
e use a detecção de novidade para confirmar as classificações acima desse segundo limite.
O resultado desse processo de decisão, representado na Figura5, é que as classificações com altas
probabilidades de predição (limiarα) não são verificados pela detecção de novidades. Classificações com
probabilidades de predição mais baixas, mas ainda superiores ao limiteβ, será confirmado pela detecção
da novidade. Finalmente, classificações com probabilidades de predição menores queβou que não
passaram na verificação de novidade, são descartados.
4. Avaliação de Desempenho
Nesta seção, avaliamos o desempenho de nossa solução LocFiND proposta e suas
abordagens para a avaliação da confiança das posições estimadas. Discutiremos os resultados de
nossa solução comparada de várias formas, para ter uma melhor visão de seu funcionamento e
um melhor entendimento de seu comportamento.
4.1. Metodologia
Avaliamos o desempenho de nossa solução em um ambiente de teste real em grande escala, mostrado na
Figura6. Como estamos focados em aplicações baseadas em dispositivos móveis pequenos, de baixo
processamento, baixo consumo de energia e operados por bateria, utilizamos nós e âncoras com tecnologia
BLE. Figura7a mostra o hardware usado para os dispositivos móveis, um dispositivo vestível baseado em
smartwatch, enquanto a Figura7b mostra o hardware usado como nós âncora para a coleta de dados de
localização.
quarto 02
Banheiros quarto 03 quarto 04 quarto 05 quarto 06
06
05
quarto 01
07
09 08
Figura 6.Mapa de aplicativo/testbed do mundo real: área de 645 m2(43m×15 m), 11 quartos com média de 42 m2(7m×6
m), 3 salões, 15 nós de ancoragem e 150 pontos de referência. Para cada ponto de referência, 100 amostras foram
coletadas para um total de 15.000 amostras. Foram utilizados 11 dispositivos móveis diferentes, 9 para treinamento e 3
para teste.
(b)
(a)
Figura 7.Nós de dispositivo [20]. (a) Dispositivos semelhantes a smartwatch baseados em Bluetooth são usados como dispositivos móveis.
(b) Os pontos de acesso baseados em Bluetooth são usados como nós âncora.
Como nossa principal aplicação é a localização de alunos, nosso testbed foi implantado
em uma área escolar de 645 m2composto por 15 espaços (11 quartos e 3 salões). O mapa
completo da área é representado na Figura6. Para cobrir toda a área, 15 nós de ancoragem
foram instalados no teto das salas em locais onde era conveniente conectá-los à rede
elétrica. Esses nós âncora são representados em azul na Figura6. Essa base foi coletada e
utilizada em outros trabalhos do nosso grupo de pesquisa [20].
Para executar a fase de treinamento do LocFiND e gerar o banco de dados de impressões digitais,
distribuímos uniformemente 150 pontos de referência (RPs) por toda a área. Esses RPs são representados
Internet futura2022,14, 51 10 de 17
como pontos cinzas na Figura6. Para cada RP, fomos até aquele local e começamos a enviar pacotes de dados
usando 11 dispositivos móveis diferentes. Coletamos um total de 100 amostras por RP para um total de 15.000
amostras em nosso banco de dados de impressões digitais. Finalmente, em nossos resultados mostrados nas
seções a seguir, usamos as amostras de nove dispositivos móveis como treinamento e as amostras de outros
três dispositivos móveis como teste. Assim, as amostras utilizadas para teste são de aparelhos nunca vistos no
treinamento.
Para escolha dos parâmetros do KNN foi utilizado o método GridSearchCV do scikit-learn, que é
uma ferramenta de seleção de parâmetros utilizando validação cruzada na base de treinamento,
evitando assim overfitting. Usando GridSearchCV com cinco dobras, definimos os principais parâmetros
em KNN o valor dek=9. Selecionandoknão é uma ciência exata porque é difícil estimar o quão bem sua
dobra representa seu conjunto de dados geral. Por esse motivo, usamos o GridSearchCV com uma
validação cruzada de 5 vezes para encontrar o melhorkvalor sem sobreajustar o sistema. Por fim,
também usamos diferentes dispositivos para treinamento e teste, para que os valores em teste sejam de
dispositivos nunca vistos. Isso aumenta as chances da solução proposta funcionar com novos
dispositivos em uma aplicação do mundo real.
Como linha de base de comparação para os resultados, uma solução tradicional baseada em
impressão digital que usa o banco de dados RSS e KNN (comk=9) foi usado, tendo uma precisão de 96%
para classificação de sala e 36% para estimativa de ponto com um erro médio de 1,9 m. Como neste caso
não há avaliação de confiança, 100% das estimativas de posição foram enviadas para o aplicativo. Nosso
objetivo para o LocFiND é melhorar essas classificações e o erro médio de localização, ao mesmo tempo
em que fornecemos o máximo possível de estimativas de posição para o aplicativo.
Predi ctions ( % )
1. 8 99,5 95
70 80 80
Room Accura cy (%)
99,0 90
1. 6
Previsões aceitas (%)
98,5 85
Erro médio (m)
Precisão (%)
60 60 1. 4 60
98,0 80
50 40 1. 2 40 97,5 75
Acessar pted
Acessar pted
1. 0
97,0 70
40 20 20
0. 8 96,5 65
30 0 0. 6 0 96,0 60
20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90
Três deve (%) Três h antigo α (%) Limite α (%)
st, as espera td
e , como nós eu
Abeto nvinco t elelimiar dα, o número de estimativas aceitas , pois
decreas es (blue c você
rv e na figura você
re8a–c). No entanto estamos aceitando maior qualidade e,
predital ons, o um ccvocêatrevido em ce
r ases (Fi gure8a) , portanto, o erro médio de localização
decreas es (F figura 8b) e o e room acc você atrevido também aumenta (Figura8c).
aumentando apenas ligeiramente a precisão para 96,4%. Isso ocorre principalmente porque é mais fácil estimar os
quartos e o classificador é capaz de fazer isso com probabilidades mais altas.
Por outro lado, quando usamos um limiarα= 80%, apenas 20% das estimativas de posição
foram encaminhadas para o aplicativo, conforme ilustrado na Figura8a, b. No entanto, essas
estimativas foram muito confiáveis, com quase 70% de precisão e um erro de localização inferior a
0,9 m. O melhor resultado veio da acurácia da sala, em que 92% das previsões foram aceitas com
uma acurácia de quase 99%.
Para entender melhor como os erros de localização são distribuídos, a Figura9
mostra a função de distribuição cumulativa para os limiaresα= 25%, 45% e 75%. Este
gráfico mostra a porcentagem de estimativas (y-eixo) com um erro menor que ox-eixo.
Nesta curva, quanto menorxvalor do eixo e quanto maior oy-axis, melhor, pois isso
significa que a maioria das estimativas tem erros menores. Como podemos ver, por
exemplo, ao usar um limiarα= 25%, apenas 68% das estimativas resultaram em erro
menor ou igual a 2 m. Por outro lado, para um limiarα= 75%, quase 85% das estimativas
resultaram em erros menores ou iguais a 2 m.
100
90
80
Frequência (%)
70
60
50
Limite α = 25% Limite
40 α = 45% Limite α =
75%
30
0 2 4 6 8 10
Erro (m)
Figura 9.Função de distribuição cumulativa do erro de localização usando probabilidade de
previsão com limitesα= 25%, 45% e 75%: mostra a porcentagem de estimativas (y-eixo) com um
erro menor que ox-eixo.
Assim, como podemos ver, a escolha de qual limiar usar depende muito do cenário
e do tipo de aplicação. O principal desafio é como decidir qual é o melhor caso para
nosso cur problema de aluguel: um número mais alto de posição estimada informações com menor precisão
menos e stimações com hmaior precisão. No entanto, nós c ou facilitar essa decisão se
posso eu ppercorra esta solução on usando bett er mecanismos para a avaliação da confiança.
Assim, eu n nosso LocFiND ssolução, usamos d Novidade Dete ação para melhorar esta avaliação
de confiança dence.
1.8 99,5 95
70 80 80
99,0 90
30 0 0,6 0 96,0 60
20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90
Limite (%) Limite α (%) Limite α (%)
Como podemos ver, a detecção de novidades foi realmente capaz de melhorar tanto a
precisão da localização quanto o erro médio. No entanto, foi à custa de um número menor de
previsões aceitas. Por exemplo, em comparação com a probabilidade de previsão na Seção4.2,
como podemos ver na figura10a, para um limite deα= 40%, a precisão da classificação é próxima
de 45%, aumentada de 40%. Quanto ao erro médio de localização, mostrado na Figura10b,
diminuiu de 1,8 m para 1,7 m. Porém, em ambos os casos, as previsões aceitas passaram de 85%
para 68%. No caso da acurácia da sala, ela aumentou de 96,4% para 97,7%, enquanto as previsões
aceitas diminuíram de 99,6% para 87%.
Por outro lado, para um limiarα= 80% os resultados não mudam significativamente já que, na
maioria dos casos, as estimativas com altas probabilidades de predição também passaram no teste de
detecção de novidade.
Finalmente, Figura11mostra a função de distribuição cumulativa para os limiares α=
25%, 45% e 75%. Quando comparados com os resultados anteriores, podemos notar
algumas melhorias nos erros de localização. Por exemplo, ao usar um limiteα= 25% e
considerando as estimativas com erros menores ou iguais a 2 m, o número de
estimativas aumentou de 68% para 72%.
100
90
80
Frequência (%)
70
60
50
T hreter α = 25%
40 T hreter α = 45%
T hreter α = 75%
30
0 2 4 6 8 10
Error (m)
Figure 1 1Cm
. você
ulativo di t ibuição fvocê
nção de the localizati on err ou usar detecção de novidade com estimativas
senhor
d α= 25%, 45%, um d 75
olás % : um alto her por cento age do po sição de limite resultou em erros menores.
approach for o ev au euação de confiden ce, que tenta para híbrido minimizar esse problema.
Foi observado nas seções anteriores que quanto menor o limite de probabilidade, maior o erro de
localização. Assim, nesta solução híbrida, utilizamos a probabilidade de predição para valores maiores de
αcomo um primeiro filtro inicial. Em seguida, usamos um limite de probabilidade mais baixoβpara obter
estimativas possivelmente erradas e aplicar o teste de detecção de novidade mais rigoroso, para
confirmar suas previsões. Assim, esperamos mitigar a perda de previsões nas maiores probabilidades e,
assim, ter algumas estimativas perdidas apenas nas previsões com probabilidades menores.
Como nas seções anteriores, a Figura12mostra nossos resultados ao usar a abordagem
híbrida para a avaliação da confiança. No caso da figura12a, podemos notar que a precisão da
localização é muito próxima daquelas obtidas pela abordagem de detecção de novidades (como
mostrado na Seção4.3). Por outro lado, o número de previsões aceitas é muito semelhante ao
obtido pela abordagem de previsão de probabilidade (como mostrado na Seção4.2). Por exemplo,
para o limiarα= 40, a precisão é de 42%, próxima da segunda abordagem e, em termos de
predições aceitas, aumentou de 64% para 70%, semelhante à primeira abordagem. Esses
resultados mostram que essa abordagem híbrida pode chegar a um compromisso, melhorando a
localização enquanto diminui apenas ligeiramente o número de estimativas descartadas.
80 100 2.0 100 100,0 100
%)
1.8 99,5 95
70 80 80
precisão (%)
99,0 90
1.6
Aceitaram previsões (
Previsões aceitas (%)
98,5 85
Erro médio (m)
Precisão (%)
60 60 1.4 60
98,0 80
50 40 1.2 40 97,5 75
Sala A
1,0
97,0 70
40 20 20
0,8 96,5 65
30 0 0,6 0 96,0 60
20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90 20 30 40 50 60 70 80 90
Limite (%) Limite α (%) Limite α (%)
O mesmo pode ser observado para o erro médio de localização, mostrado na Figura12b. Por
fim, no caso da acurácia da sala, mostrada na Figura12c, a abordagem híbrida também foi capaz
de melhorar essa precisão ao ter quase o mesmo número de amostras aceitas quando comparada
à probabilidade de previsão.
Figura13mostra a função de distribuição cumulativa do erro de localização usando nosso
º ree ap paro ches f ort ele avalia você
ação de co nconfiança eu n três configurações de limites diferentes.
A s nós c an see, o hybrid ap pbarata ha s um erro curve quase igual ou melhor que o
m stricte tive chnique bvocê
minério de novot, como visto eu
no pré vicioso r resultados, tem um maior número de
acaceitar d estimatio ns.
100 100 100
90 90 90
80 80 80
fluência (%)
Frequência (%)
Frequência (%)
70 70 70
60 60 60
Frequencia
50 50 50
α = 2 5%
Probabilidade: Probabilidade: α = 45% Probabilidade: α = 70%
40 = 25%
Novidade%: α 40 Novidade%: α = 45% 40 Novidade%: α = 70% H%brid: α
H%brid: α = 4 5% β, = 25 % H%brid: α = 70% β, = 45% = 90% β, = 70%
30 30 30
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
Erro (m) Erro (m) Erro (m)
proaches , (a) Usando euoc er problema abilidade 25% (b) Usando l superior p probabilidades de 45%, e (c) Usando inferior
probabili ty 70%.
5. Aplicar cb
a ilidade, S te
r ngisso, and Fraco nesses de t he Pro sistema colocado
ou r main mo euatiem for implementar pt ting um eu interior sistema de localização é localizar
televisão
stvocê
dente s em
sIdeias co h olá
. ho nósver, em t eleprimeira versão síon de nosso sistema, a posição instável
estimati ons resultado ed emtele st você
dents ju mping fro meu quarto para o quarto, mesmo que fossem
Internet futura2022,14, 51 14 de 17
realmente estático. Para reduzir esses saltos e melhorar a precisão e estabilidade do nosso
sistema, começamos a procurar soluções para avaliar e melhorar a confiança das previsões.
Assim, propusemos e aplicamos a solução LocFiND, nosso sistema de localização, que foi
capaz de melhorar significativamente os resultados e a estabilidade, mantendo a sensação de um
sistema em tempo real. Nossa solução tem a vantagem de escolher os resultados mais confiáveis,
com base na avaliação de probabilidade e novidade. Isso torna o sistema mais resiliente, pois
mesmo que tenhamos algum problema de comunicação, perda de pacote ou interferência até um
limite, o sistema pode continuar funcionando apenas descartando as informações problemáticas.
Para outros cenários, dependendo dos requisitos da aplicação, nossa solução proposta pode ser
facilmente ajustada para ter uma porcentagem aceitável de estimativas descartadas, melhorando
consideravelmente a precisão e a estabilidade do sistema.
No entanto, descartar dados causa alguns problemas para avaliar os resultados, pois a
quantidade final de resultados é menor do que se usássemos todos os dados. Neste trabalho, a
avaliação foi baseada na acurácia e erro médio. A precisão pode ser definida comoa=h/n, e o erro
médio comoae=e/n, ondehé o número de resultados de classificação corretos eeé a soma dos
erros associados aos resultados considerados válidos pelos algoritmos, ené o número de saídas
válidas do algoritmo. No entanto, como nosso algoritmo descarta alguns dados, o valor denpara
eles torna-se diferente, tornando a comparação entre eles não totalmente justa. Assim, na maioria
dos resultados, incluímos a porcentagem de previsões aceitas para deixar claro que, embora o erro
tenha diminuído, o número de previsões aceitas também diminuiu.
Por fim, sabe-se que os valores de RSS informados pelos dispositivos são um pouco
dependentes do hardware e podem variar de um fabricante para outro. Ainda que isso
pudesse afetar o desempenho dos sistemas de localização, no caso de nossa aplicação, em
que implementamos a solução proposta na área escolar, isso não foi um problema, pois todo
o hardware era similar e do mesmo fabricante.
Outro ponto que podemos adiantar é o problema gerado pelo descarte de informações não
confiáveis na fase de localização. Buscamos definir, dado o tempo de resposta exigido pelo sistema,
quanta informação podemos descartar sem prejudicar seu funcionamento. Podemos definir quantidades
mínimas de dados distribuídos ao longo do tempo como um requisito do aplicativo, que define o limite
máximo de descarte de dados.
Também em trabalhos futuros, pretendemos comparar nosso trabalho com uma abordagem mais
robusta e de ponta, diferente do KNN. Nossa solução proposta possui algumas particularidades que a
tornam um pouco diferente da maioria das soluções propostas, principalmente a característica de
descartar classificações não confiáveis baseadas na detecção de novidades. Como a maioria das
soluções conhecidas não descarta essas classificações, seria difícil, neste trabalho atual, fazer a
comparação sem deixar de ver os ganhos isolados obtidos por nossa avaliação do passo de confiança.
Contribuições do autor:Os autores contribuíram igualmente para este trabalho. Todos os autores leram e
concordaram com a versão publicada do manuscrito.
Declaração de Disponibilidade de Dados:Os códigos e bases utilizados na parte de experimentação deste trabalho
estão disponíveis emhttps://github.com/hasm/doc(acessado em 15 de janeiro de 2022).
Referências
1. Zafari, F.; Gkelias, A.; Leung, KK Uma Pesquisa de Sistemas e Tecnologias de Localização Interna.IEEE Comun. Sobreviver Tutor.2019, 21,
2568–2599. [CrossRef]
2. Boukerche, A.; Oliveira, HA; Nakamura, EF; Loureiro, AA Sistemas de localização para redes de sensores sem fios.IEEE Wire.
Comum.2007,14, 6–12. [CrossRef]
3. Balico, LN; Loureiro, AAF; Nakamura, EF; Barreto, RS; Pazzi, RW; Oliveira, HABF Previsão de Localização em Redes Veiculares Ad
Hoc.IEEE Comun. Sobreviver Tutor.2018,20, 2784–2803. [CrossRef]
4. Wang, B.; Chen, Q.; Yang, LT; Chao, H. Localização interna de smartphone via crowdsourcing de impressão digital: desafios e
abordagens.IEEE Wire. Comum.2016,23, 82–89. [CrossRef]
5. Gu, Y.; Lo, A.; Niemegeers, I. Uma pesquisa de sistemas de posicionamento interno para redes pessoais sem fio.IEEE Comun. Sobreviver Tutor.
2009,11, 13–32. [CrossRef]
6. Harle, R. Uma Pesquisa de Sistemas de Posicionamento Inercial Interno para Pedestres.IEEE Comun. Sobreviver Tutor.2013,15, 1281–1293. [
CrossRef]
7. Subbu, KP; Zhang, C.; Luo, J.; Vasilakos, AV Analysis e status quo de sistemas de localização internos baseados em smartphones.IEEE Wire.
Comum.2014,21, 106–112. [CrossRef]
8. Liu, H.; Darabi, H.; Banerjee, P.; Liu, J. Pesquisa de técnicas e sistemas de posicionamento interno sem fio.IEEE Trans. Sist. Homem Cibern.
Parte C Ap. Rev.2007,37, 1067–1080. [CrossRef]
9. Yassin, A.; Nasser, Y.; Awad, M.; Al-Dubai, A.; Liu, R.; Yuen, C.; Raulefs, R.; Aboutanios, E. Avanços recentes em localização interna:
uma pesquisa sobre abordagens teóricas e aplicações.IEEE Comun. Sobreviver Tutor.2017,19, 1327–1346. [CrossRef]
10. Zhuang, Y.; Yang, J.; Li, Y.; Qi, L.; El-Sheimy, N. Localização interna baseada em smartphone com sinalizadores Bluetooth de baixa energia.
Sensores2016,16, 596. [CrossRef]
11. Castillo-Cara, M.; Lovón-Melgarejo, J.; Bravo-Rocca, G.; Orozco-Barbosa, L.; García-Varea, I. Um estudo empírico da configuração de potência de
transmissão para mecanismos de localização interna baseados em Bluetooth.Sensores2017,17, 1318. [CrossRef]
12. Sie, MK; Kuo, CH Estimativa de localização interna usando beacon BLE com vários níveis de potência de transmissão. Nos Anais da Conferência
Internacional IEEE 2017 sobre Eletrônicos de Consumo-Taiwan (ICCE-TW), Taipei, Taiwan, 12–14 de junho de 2017; pp. 323–324.
[CrossRef]
13. Qureshi, UM; Umair, Z.; Hancke, GP Avaliando as implicações da variação dos níveis de potência de transmissão Bluetooth Low Energy
(BLE) na exatidão e precisão da localização interna sem fio.Sensores2019,19, 3282. [CrossRef]
14. Sadowski, S.; Spachos, P. Localização interna baseada em RSSI com a Internet das Coisas.Acesso IEEE2018,6, 30149–30161. [CrossRef]
15. Bahl, P.; Padmanabhan, V. RADAR: Um sistema de rastreamento e localização de usuário baseado em RF embutido. Em Proceedings of the IEEE
INFOCOM 2000, Conference on Computer Communications. Décima Nona Conferência Anual Conjunta das Sociedades de Computação e
Comunicações IEEE (Cat. No.00CH37064), Tel Aviv, Israel, 26–30 de março de 2000; Volume 2, pp. 775–784. [CrossRef]
16. Bahl, P.; Bahl, P.; Padmanabhan, VN; Balachandran, A.Melhorias no sistema de localização e rastreamento do usuário RADAR; Relatório
técnico; Microsoft: Redmond, WA, EUA, 2000.
Internet futura2022,14, 51 16 de 17
17. Chen, Z.; Wang, J. GROF: Localização interna usando uma rede neural de regressão geral de largura de banda múltipla e filtro de outlier.
Sensores2018,18, 3723. [CrossRef] [PubMed]
18. Sim, Y.; Wang, B. RMapCS: construção de mapa de rádio a partir de amostras de crowdsourcing para localização interna.Acesso IEEE2018, 6,
24224–24238. [CrossRef]
19. Bhatti, MA; Riaz, R.; Rizvi, SS; Shokat, S.; Riaz, F.; Kwon, SJ Detecção de outliers em localização interna e Internet das Coisas (IoT) usando
aprendizado de máquina.J. Comun. Netw.2020,22, 236–243. [CrossRef]
20. Assayag, Y.; Oliveira, H.; Souto, E.; Barreto, R.; Pazzi, R. Sistema de Posicionamento Interno Usando Estimativa de Modelo Dinâmico.Sensores 2020
,20, 7003. [CrossRef]
21. Ashraf, I.; Hur, S.; Park, Y. Posicionamento interno em diferentes smartphones comerciais usando pontos de acesso Wi-Fi Área de cobertura.
Sensores2019,19, 4351. [CrossRef] [PubMed]
22. Ali, MU; Hur, S.; Parque, S.; Park, Y. Colhendo a precisão do posicionamento interno explorando vários recursos do vetor de força do
sinal recebido.Acesso IEEE2019,7, 52110–52121. [CrossRef]
23. Youssef, MA; Agrawala, A.; Shankar, AU WLAN Localização Determinação via Agrupamento e Distribuições de Probabilidade. Em
Proceedings of the First IEEE International Conference on Pervasive Computing and Communications (PERCOM '03), Fort Worth,
TX, EUA, 26 de março de 2003; IEEE Computer Society: Washington, DC, EUA, 2003; pág. 143.
24. Youssef, M.; Agrawala, A. Manipulação de correlação de amostras no sistema Horus. Em Proceedings of INFOCOM 2004, Vigésima
Terceira Conferência Anual Conjunta das Sociedades de Computação e Comunicações IEEE, Hong Kong, China, 7–11 de março de
2004; Volume 2, pp. 1023–1031. [CrossRef]
25. Roos, T.; Myllymäki, P.; Tirri, H.; Misikangas, P.; Sievänen, J. Uma abordagem probabilística para a estimativa de localização do usuário WLAN.Int. J.
Wirel. Inf. Netw.2002,9, 155–164. [CrossRef]
26. Castro, P.; Chiu, P.; Kremenek, T.; Muntz, RR Um serviço de localização de salas probabilísticas para ambientes de rede sem fio. Em Proceedings of
the 3rd International Conference on Ubiquitous Computing (UbiComp '01); Springer: Londres, Reino Unido, 2001; pp. 18–34.
27. Pinto, BHOUV; de Oliveira, HABF; Souto, EJP Otimização de Fatores para o Projeto de Sistemas de Posicionamento Interno Usando um Algoritmo
Baseado em Probabilidade.J. Sens. Atuador Netw.2021,10, 16. [CrossRef]
28. Battiti, R.; Nhat, TL; Villani, A.Computação com reconhecimento de localização: um modelo de rede neural para determinar a localização em LANs sem fio;
Relatório técnico; Universidade de Trento: Trento, Itália, 2002.
29. Saha, S.; Chaudhuri, K.; Sanghi, D.; Bhagwat, P. Determinação da localização de um dispositivo móvel usando sinais de ponto de acesso IEEE
802.11b. Em Proceedings of the 2003 IEEE Wireless Communications and Networking (WCNC 2003), Nova Orleans, LA, EUA, 16–20 de março de
2003; Volume 3, pp. 1987–1992. [CrossRef]
30. Hamza, LNC Uma abordagem de sistema dinâmico para impressão digital de localização de rádio em redes locais sem fio. In Proceedings of the
IEEE 2009 IEEE International Symposium on Intelligent Signal Processing (WISP 2009), Budapeste, Hungria, 26–28 de agosto de 2009; pp. 253–
258.
31. Chen, YC; Juang, JC Sistema de localização interna baseado em detecção de outliers para redes de sensores sem fio.Int. J. Navig. Obs.2012, 2012,
961785. . [CrossRef]
32. Cheng, R.; Chen, L.; Chen, J.; Xie, X. Avaliando Probabilidade Limite K-Nearest-Neighbor Consultas sobre Dados Incertos. EmProceedings
of the 12th International Conference on Extending Database Technology: Advances in Database Technology (EDBT '09); Association for
Computing Machinery: Nova York, NY, EUA, 2009; pp. 672–683. [CrossRef]
33. Yang, B.; Lu, H.; Jensen, CS Limiar Probabilístico k Consultas do Vizinho Mais Próximo sobre Objetos em Movimento no Espaço Interno Simbólico.
EmProceedings of the 13th International Conference on Extending Database Technology (EDBT '10); Association for Computing Machinery:
Nova York, NY, EUA, 2010; pp. 335–346. [CrossRef]
34. Yang, L.; Chen, H.; Cui, Q.; Fu, X.; Zhang, Y. Probabilistic-KNN: Um Novo Algoritmo para Cenário de Localização Interna Passiva. Em Proceedings of
the 2015 IEEE 81st Vehicular Technology Conference (VTC Spring), Glasgow, Reino Unido, 11–14 de maio de 2015; pp. 1–5.
[CrossRef]
35. Liu, L.; Li, B.; Yang, L.; Liu, T. Abordagem de Posicionamento Interno em Tempo Real Usando iBeacons e Sensores de Smartphone.Appl. ciência2020, 10,
2003. [CrossRef]
36. Pelant, J.; Tlamsa, Z.; Benes, V.; Polak, L.; Kaller, O.; Bolecek, L.; Kufa, J.; Sebesta, J.; Kratochvil, T. Localização interna de dispositivos BLE
baseada em impressão digital RSS mapeada por modos de propagação. Nos Anais da 27ª Conferência Internacional Radioelektronika
(RADIOELEKTRONIKA) de 2017, Brno, República Tcheca, 19–20 de abril de 2017; pp. 1–5. [CrossRef]
37. Polak, L.; Rozum, S.; Slanina, M.; Bravenec, T.; Fryza, T.; Pikrakis, A. Estimativa de localização interna baseada em impressão digital da intensidade
do sinal recebido empregando aprendizado de máquina.Sensores2021,21, 4605. [CrossRef] [PubMed]
38. Qian, J.; Mãe, J.; Ying, R.; Liu, P.; Pei, L. Um método aprimorado de localização interna usando sensores inerciais de smartphones. In Proceedings
of the International Conference on Indoor Positioning and Indoor Navigation, Montbeliard, França, 28–31 de outubro de 2013; pp. 1–7.
[CrossRef]
39. Yang, Z.; Wu, C.; Zhou, Z.; Zhang, X.; Wang, X.; Liu, Y. A mobilidade aumenta a capacidade de localização: uma pesquisa sobre localização interna sem fio
usando sensores inerciais.Computação ACM. Sobreviver2015,47, 1–34. [CrossRef]
40. Ashraf, I.; Hur, S.; Shafiq, M.; Kumari, S.; Park, Y. GUIDE: Localização interna de pedestres baseada em sensores de smartphones com
dispositivos heterogêneos.Int. J. Comun. Sist.2019,32, e4062. [CrossRef]
41. Ashraf, I.; Hur, S.; Park, Y. Melhorando o desempenho da localização interna baseada em campo magnético usando padrões magnéticos de
vários smartphones.Sensores2020,20, 2704. [CrossRef]
Internet futura2022,14, 51 17 de 17
42. Basiri, A.; Lohan, ES; Moore, T.; Winstanley, A.; Peltola, P.; Colina, C.; Amirian, P.; Figueiredo e Silva, P. Desafios dos serviços baseados em
localização indoor, requisitos e usabilidade das soluções atuais.Comput. ciência Rev.2017,24, 1–12. [CrossRef]
43. Swangmuang, N.; Krishnamurthy, P. Análises de impressões digitais de localização para um posicionamento interno eficiente. Nos Anais da Sexta
Conferência Internacional Anual IEEE de 2008 sobre Computação e Comunicações Pervasivas (PerCom), Hong Kong, China, 17–21 de março de
2008; pp. 100–109. [CrossRef]
44. Buitinck, L.; Loupe, G.; Blondel, M.; Pedregosa, F.; Mueller, A.; Grisel, O.; Niculae, V.; Prettenhofer, P.; Gramfort, A.; Grobler,
J.; e outros Design de API para software de aprendizado de máquina: experiências do projeto Scikit-Learn. 2013, pp. 108–122.
Disponível:https://hal.inria.fr/hal-00856511/document(acessado em 15 de janeiro de 2022).
45. Pimentel, MA; Clifton, DA; Clifton, L.; Tarassenko, L. Uma revisão da detecção de novidade.Processo de sinal.2014,99, 215–249. [CrossRef]
46. Markou, M.; Singh, S. Detecção de novidades: Uma revisão — Parte 1: Abordagens estatísticas.Processo de sinal.2003,83, 2481–2497. [CrossRef]
47. Miljković, D. Revisão dos métodos de detecção de novidades. Nos Anais da 33ª Convenção Internacional MIPRO, Opatija, Croácia, 24–28 de maio
de 2010; pp. 593–598.
48. Sayyed, S.; Deolekar, R. Uma pesquisa sobre detecção de novidade usando métodos de conjunto de nível. Nos Anais da Conferência Internacional
de 2017 sobre Comunicação Inventiva e Tecnologias Computacionais (ICICCT), Coimbatore, Índia, 10–11 de março de 2017; pp. 415–418. [
CrossRef]
49. Ding, X.; Li, Y.; Belatreche, A.; Maguire, LP Uma avaliação experimental de métodos de detecção de novidades.neurocomputação2014, 135, 313–
327. [CrossRef]