Você está na página 1de 13

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

Recebido em 30 de janeiro de 2018, aceito em 9 de março de 2018, data de publicação em 21 de março de 2018, data da versão atual em 23 de abril de 2018.

Identificador de objeto digital 10.1109/ACCESS.2018.2817800

Melhorando a localização interna usando


redes neurais convolucionais em
dispositivos computacionalmente restritos

KLEMEN BREGAR E MIHAEL MOHORČIČ, (Membro Sênior, IEEE)


1Departamento de Sistemas de Comunicação, Instituto Jožef Stefan, 1000 Ljubljana, Eslovênia
2Jožef Stefan International Postgraduate School, 1000 Ljubljana, Eslovênia

Autor correspondente: Klemen Bregar ( klemen.bregar@ijs.si )

Este trabalho foi financiado em parte pela Agência de Pesquisa da Eslovênia através do Esquema para Jovens Pesquisadores sob o Grant P2-0016
e Grant L2-7664 e em parte pela Comunidade Européia por meio do H2020 eWINE Project sob o Grant 688 116.

ABSTRATOA localização interna é um dos principais facilitadores para várias áreas de aplicativos e serviços que dependem de localizações precisas de pessoas, bens e ativos, desde automação residencial e vida assistida até

maior automação de processos logísticos e de produção e otimização de rede sem fio. As soluções existentes fornecem vários níveis de precisão, que também dependem da complexidade do ambiente de rádio interno. Neste

artigo, propomos dois métodos para reduzir o erro de localização em condições internas sem linha de visada (NLoS) usando informações brutas de resposta ao impulso do canal (CIR) obtidas de rádios de banda ultralarga que

não requerem conhecimento prévio sobre o ambiente de rádio. Os métodos são baseados na classificação de canal NLoS e modelos de regressão de erro de alcance, ambos usando redes neurais convolucionais (CNNs) e

implementados na estrutura computacional TensorFlow. Primeiro, mostramos que a classificação de canal NLoS usando dados CIR brutos supera as abordagens existentes baseadas em recursos de sinal de entrada derivados.

Demonstramos ainda que o estado do canal NLoS previsto e as informações de erro de alcance previstas, usadas em combinação com algoritmos de estimativa de localização de mínimos quadrados (LS) e LS ponderados,

melhoram significativamente o desempenho de localização interna. Também avaliamos o desempenho computacional e a adequação dos algoritmos baseados em CNN propostos em várias plataformas de computação com

uma ampla gama de recursos diferentes e mostramos que em um sistema de localização distribuído, eles também podem ser usados em dispositivos computacionalmente restritos. Primeiro, mostramos que a classificação de

canal NLoS usando dados CIR brutos supera as abordagens existentes baseadas em recursos de sinal de entrada derivados. Demonstramos ainda que o estado do canal NLoS previsto e as informações de erro de alcance

previstas, usadas em combinação com algoritmos de estimativa de localização de mínimos quadrados (LS) e LS ponderados, melhoram significativamente o desempenho de localização interna. Também avaliamos o

desempenho computacional e a adequação dos algoritmos baseados em CNN propostos em várias plataformas de computação com uma ampla gama de recursos diferentes e mostramos que em um sistema de localização

distribuído, eles também podem ser usados em dispositivos computacionalmente restritos. Primeiro, mostramos que a classificação de canal NLoS usando dados CIR brutos supera as abordagens existentes baseadas em

recursos de sinal de entrada derivados. Demonstramos ainda que o estado do canal NLoS previsto e as informações de erro de alcance previstas, usadas em combinação com algoritmos de estimativa de localização de mínimos

quadrados (LS) e LS ponderados, melhoram significativamente o desempenho de localização interna. Também avaliamos o desempenho computacional e a adequação dos algoritmos baseados em CNN propostos em várias

plataformas de computação com uma ampla gama de recursos diferentes e mostramos que em um sistema de localização distribuído, eles também podem ser usados em dispositivos computacionalmente restritos.

Demonstramos ainda que o estado do canal NLoS previsto e as informações de erro de alcance previstas, usadas em combinação com algoritmos de estimativa de localização de mínimos quadrados (LS) e LS ponderados, melhoram significativamente o desempenho de localização inte

TERMOS DO ÍNDICEResposta ao impulso do canal, rede neural convolucional, aprendizado profundo, localização interna,
sem linha de visão, mitigação de erro de alcance, banda ultralarga.

I. INTRODUÇÃO redes sem fio. Nos ambientes mais exigentes, onde um grande
A importância das informações sobre a localização interna está número de dispositivos precisam de alta qualidade de serviço (QoS),
aumentando nos serviços e aplicativos de comunicação modernos. serão necessárias redes densas de células pequenas.
Essas informações podem ser usadas para estender os serviços de Em uma rede dinâmica de pequenas células densas, onde muitos usuários
rastreamento e navegação para pessoas e mercadorias de estão em constante movimento, muitos eventos de transferência ocorrem
ambientes externos para ambientes internos, para guiar veículos regularmente. Para o provisionamento de QoS desejado e, assim, evitando a
autônomos dentro de instalações de fabricação e para otimização de sobrecarga de células individuais, são necessários algoritmos de transferência
rede sem fio para facilitar as aplicações acima. inteligentes e eficientes. A localização do usuário rastreada com precisão pode
Os sistemas de comunicação sem fio de próxima geração precisarão ser usada para prever a localização futura do usuário e, assim, prever os
atender a um número crescente de usuários móveis, vários dispositivos próximos eventos de transferência. Com informações de contexto suficientes,
conectados de Internet das Coisas (IoT) e veículos inteligentes com um controlador de sistema pode reservar recursos para novos usuários e
maiores larguras de banda e tempos de resposta mais curtos. O aumento prever sua liberação quando o usuário deixar a área de cobertura da célula.
necessário na capacidade das redes sem fio móveis pode ser obtido com
uma combinação de macrocélulas e pequenas células conectadas em Os sistemas globais de navegação por satélite (GNSS), como o sistema
sistemas auto-organizados, heterogêneos e dinâmicos. de posicionamento global (GPS), são geralmente suficientes para

2169-3536 2018 IEEE. Traduções e mineração de conteúdo são permitidas apenas para pesquisa acadêmica.
VOLUME 6, 2018 O uso pessoal também é permitido, mas a republicação/redistribuição requer permissão IEEE. Consulte 17429
http://www.ieee.org/publications_standards/publications/rights/index.html para obter mais informações.
K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

aplicações devido à sua precisão e ampla disponibilidade em a avaliação do sistema de classificação de canais proposto é
smartphones e outros dispositivos. Para uso em ambientes internos, realizada em várias plataformas de computação com diferentes
no entanto, seus sinais são muito fracos ou degradados por efeitos capacidades computacionais. SeçãoIXconclui o papel.
multipercurso, exigindo diferentes abordagens. Os sistemas de
localização indoor requerem infraestrutura especial, que pode fazer II. TRABALHO RELATADO
parte dos meios de comunicação existentes (por exemplo, pontos de Diferentes abordagens de localização interna na literatura podem ser
acesso WiFi) ou precisa ser instalada adicionalmente (por exemplo, grosseiramente classificadas em três grupos principais de acordo com as
beacons Bluetooth). Esses sistemas são baseados em características informações de modelagem em que se baseiam: métodos baseados no
de propagação de sinal e, para maior desempenho de localização, indicador de força do sinal recebido (RSSI), métodos baseados no ângulo
eles geralmente precisam de medições e procedimentos de de chegada (AoA) e métodos baseados no tempo algoritmos de
calibração extensos e demorados. localização [1].
Uma abordagem alternativa, habilitada por rádios de banda A fonte mais proeminente de erros em algoritmos de localização
ultralarga (UWB), é baseada na medição do tempo de voo (ToF) entre baseados em RSSI vem da alta dependência da variabilidade do
dois nós e aprimorada por informações detalhadas sobre as canal causada pela natureza dinâmica e imprevisível dos efeitos do
características do canal de propagação obtidas da resposta ao canal de rádio (sombreamento, propagação de caminhos múltiplos,
impulso do canal (CIR). As características de propagação derivadas reflexões, desvanecimento do canal e assim por diante) [2], [3]. A
da informação CIR podem ser usadas para mitigar desvios de ToF maioria dos métodos avançados e precisos de localização interna
causados por caminhos de propagação de sinal prolongados baseados em RSSI são métodos de impressão digital RSSI [3], [4],
devido a obstáculos no ambiente, melhorando significativamente o onde um dispositivo é posicionado com base na impressão digital
desempenho de localização. RSSI capturada de vários pontos de acesso (APs). No entanto, a
Neste artigo, propomos uma nova abordagem para localização maioria desses métodos é complexa e requer extensas medições e
interna usando dois algoritmos de rede neural convolucional (CNN) calibração do ambiente. Algoritmos de impressão digital adaptáveis
trabalhando em dados CIR brutos obtidos do rádio UWB para cada foram desenvolvidos recentemente para eliminar a necessidade de
pacote recebido. O primeiro algoritmo, usado para detectar recalibração periódica completa do sistema devido à natureza
condições de canal sem linha de visada (NLoS), elimina a dinâmica do ambiente [5].
necessidade de procedimentos de extração de recursos. O segundo Os sistemas de localização baseados em AoA dependem da direção de
algoritmo para regressão de erro de alcance é usado para reduzir o propagação capturada da onda de rádio no arranjo de antena receptora.
impacto da estimativa de alcance NLoS na precisão da localização, Se grande resolução de ângulo e conseqüentemente grande precisão de
ponderando contribuições de alcance individuais de acordo com o localização são desejadas, então arranjos de antenas complexos são
erro de alcance estimado. Para investigar a adequação da necessários no lado do receptor [6], o que não é prático ou mesmo
classificação de canal CNN complexa e modelos de regressão de inviável na maioria dos casos.
erro de alcance em dispositivos computacionalmente restritos na Os algoritmos de localização baseados em tempo são baseados na
borda da rede, também realizamos comparações de desempenho medição do tempo de propagação do sinal entre um transmissor e um
em termos de tempos de cálculo em várias plataformas de receptor. Algoritmos de localização de tempo de chegada (ToA) ou
computação. diferença de tempo de chegada (TDoA) podem ser implementados se a
As principais contribuições deste documento são as seguintes: sincronização precisa do relógio for assegurada entre todos ou nós de
• Uma nova abordagem para localização interna usando CNN referência dentro do sistema, respectivamente [1].
para classificação de canal e regressão de erro de alcance em No posicionamento interno de dispositivos sem fio com recursos
traços CIR brutos unidimensionais, em vez de recursos limitados, como o considerado neste estudo, geralmente não há
derivados. sincronização de relógio disponível entre os nós. Nesse caso, os métodos
• Avaliação de desempenho do algoritmo de classificação de variação bidirecional (TWR) ou tempo de ida e volta (RTT) podem ser
proposto em diferentes plataformas de computação, desde usados. Nos sistemas de alcance TWR, cada pacote é carimbado em
computadores embarcados de baixo custo até PCs pessoais de ambos os lados e viaja duas vezes entre o transmissor e o receptor. Com
alto desempenho. essa abordagem, são coletados dois timestamps em um receptor e dois
O restante deste artigo está organizado da seguinte forma. Seção timestamps em um transmissor. Isso elimina as diferenças do relógio
IIresume alguns trabalhos relacionados da literatura. SeçãoIII local no cálculo do tempo de voo (ToF), mas requer boa estabilidade do
descreve a arquitetura do sistema de localização e a Seção4descreve relógio para reduzir a influência da variabilidade do relógio local e início
o equipamento de medição e o processo de construção de conjuntos preciso e eficiente da determinação do registro de data e hora do quadro
de dados de localização e classificação NLoS. Na seçãoV, são [7] desde cada nanossegundo de erro no ToF significa aproximadamente
descritos dois métodos de localização de nó que são 30 cm de erro na estimativa de alcance. Os rádios de pulso UWB com sua
subsequentemente usados em combinação com a classificação de largura de banda ultralarga (normalmente mais de 500 MHz) e pulsos de
canal baseada em CNN recentemente proposta e os algoritmos de transmissão muito curtos oferecem altas resoluções temporais e
mitigação de erro de localização definidos na SeçãoVI. Na seçãoVII, espaciais e grande imunidade ao desvanecimento de multipercurso em
diferentes algoritmos de localização são testados usando a detecção comparação com tecnologias de comunicação baseadas em portadora de
NLoS proposta e modelos de erro de alcance baseados em CNN, e banda estreita. No entanto, grande capacidade de resolução multipath
na SeçãoVIII, um desempenho crítico

17430 VOLUME 6, 2018


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

FIGURA 1.A figura mostra duas abordagens, como o erro de alcance e sua contribuição para a precisão da localização podem ser mitigados. A primeira abordagem detecta a
condição NLoS e remove os intervalos NLoS do processo de localização. A segunda abordagem estima o erro de alcance e o utiliza como um peso no processo de localização.

sozinho não elimina os efeitos do multipath e CNNs (por exemplo, campos receptivos, pesos compartilhados,
propagação NLoS [8], [9]. subamostragem espacial e assim por diante) são extraídas de suas
Erros de alcance introduzidos por propagação multipath e NLoS contrapartes biológicas e aplicadas para garantir algum grau de
em ambientes internos podem facilmente atingir alcances de metros mudança de entrada, escala e invariância de distorção [14]. Até onde
e devem ser detectados e mitigados adequadamente para evitar sabemos, não houve implementação anterior de classificação NLoS
erros de localização maiores. As abordagens de mitigação de erro de ou mitigação de erro de alcance com base em dados CIR brutos
localização podem ser classificadas como técnicas de identificação usando CNNs.
NLoS e técnicas de mitigação de erro de alcance. A identificação
NLoS é usada para detectar corretamente os nós NLoS, que podem III. ARQUITETURA DO SISTEMA
posteriormente ser eliminados do pool de nós usados para As arquiteturas para dois sistemas de localização interna, uma baseada
localização [10]. Isso é útil quando temos um grande número de nós na classificação de alcance NLoS e a outra baseada na estimativa de erro
âncora disponíveis, muitos deles com um link LoS para um nó de alcance, são conceitualmente representadas na Fig.1 juntamente com
localizado. As técnicas de identificação NLoS usam principalmente representações gráficas de manipulação de alcance em ambas as
estatísticas de canal e forma de onda (RSSI, curtose, assimetria, abordagens. O sistema superior usa a classificação NLoS com um
atraso médio excessivo e assim por diante) como dados de entrada. procedimento para eliminar todos os intervalos NLoS do pool de âncoras
Alguns deles são baseados em testes de razão de verossimilhança de localização. É composto por várias partes funcionais. O bloco de
ou testes de hipóteses binárias [9], [11], que dependem de funções classificação de entrada com uma unidade de classificação NLoS
de distribuição de probabilidade de vários parâmetros para a reconhece medições de faixa NLoS com base em dados CIR acessíveis
realização do canal atual. Outros métodos são baseados em para cada medição de faixa. Se uma medição de alcance para um
algoritmos de aprendizado de máquina, como Support Vector determinado par de nós for reconhecida como uma medição NLoS, o nó
Machine (SVM) [10], [12], Gaussian Processes (GP) [11] e Relevance correspondente será removido do conjunto de nós âncora disponíveis
Vector Machine (RVM) [12]. para localização; caso contrário, ele é alimentado diretamente para a
A mitigação de erro de alcance é realizada de maneira unidade de estimativa de localização.
semelhante à identificação NLoS. Alguns trabalhos usam testes de O segundo sistema de localização representado na parte inferior
hipóteses binárias com modelos de propagação e erro [11], mas a da Fig.1usa uma CNN para estimativa de erro de alcance e
maioria dos exemplos na literatura é baseada nos mesmos subsequente redução do erro de localização sem reduzir o número
algoritmos de aprendizado de máquina da identificação NLoS. Em de nós âncora de localização disponíveis, ponderando contribuições
muitos casos, os autores preveem o erro de alcance com base nas de alcance individuais de acordo com o erro de alcance estimado. O
características do canal e o subtraem do alcance estimado bloco de regressão de erro de entrada estima o tamanho do erro de
anteriormente [10], [12], [13], mas em outros casos, eles estimam os alcance com base em um modelo construído durante o treinamento
pesos usados para a ponderação adicional de intervalos mitigados da rede neural com conjunto de dados de localização descrito na
para melhorar ainda mais a precisão da localização [12]. SeçãoIV-C. As estimativas de erro de alcance são então usadas nos
Recentemente, os algoritmos de treinamento para redes neurais foram processos de localização para remover o erro previsto dos intervalos
aprimorados a ponto de sinais totalmente dimensionais, como imagens, estimados ou, no caso do estimador de localização baseado em
formas de onda e assim por diante, poderem ser alimentados a um algoritmo mínimos quadrados ponderados (WLS), também para ponderar
de classificação sem extrações complexas de recursos e transformações de estimativas de intervalo individuais.
entrada. Com o advento de unidades de processamento gráfico de propósito
geral acessíveis (GPGPUs) e melhorias nos mecanismos de treinamento de 4. MEDIDAS
redes neurais de aprendizado profundo, as CNNs como seu subconjunto Esta seção descreve os procedimentos e equipamentos de medição
tornaram-se cada vez mais populares e viáveis para uso pronto para usados para coletar o conjunto de dados de classificação UWB NLoS
produção. Idéias arquitetônicas para interno e o conjunto de dados de mitigação de erro de localização.

VOLUME 6, 2018 17431


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

A campanha de medição foi dividida em duas fases. A


primeira fase incluiu a coleta de dados LoS e NLoS em vários
ambientes internos representativos sem medições de
alcance. A segunda fase incluiu medições em um ambiente
de escritório com nós posicionados em uma grade
predefinida com distâncias exatas conhecidas entre os nós.

A. EQUIPAMENTO DE MEDIÇÃO E CONFIGURAÇÃO


Para experimentar diferentes abordagens de localização,
desenvolvemos uma placa de rádio autônoma personalizada, que é
FIGURA 3.Arquitetura do sistema de medição e localização.
representada na Fig.2. É baseado em uma tecnologia de rádio de
impulso UWB (IR-UWB) usando um transceptor de baixo custo
atualmente disponível, DecaWave DWM10001. O DWM1000 é um
módulo transceptor sem fio compatível com IEEE 802.15.4-2011 IR- foram coletados para construir um modelo mais genérico e evitar o

UWB com uma antena de cerâmica integrada que permite alcance ajuste excessivo ao ambiente específico.

interno com uma precisão de 10 cm. É muito demorado construir um extenso conjunto
de dados com localizações de nós predefinidas em
muitos ambientes internos diferentes. Assim, para
acelerar o processo de aquisição de conjuntos de
dados para classificação, omitimos o posicionamento
estrito dos nós em uma grade predefinida. Em vez
disso, um nó UWB foi colocado em uma posição fixa
aleatória em um ambiente interno selecionado e as
medições foram feitas enquanto movia o outro nó
UWB pelo ambiente. Primeiro, 3.000 medições foram
coletadas para condições de canal LOS e, em seguida,
3.000 medições foram coletadas para condições NLoS
no mesmo ambiente. Para garantir que as medições
coletadas estejam sempre de acordo com o estado do
FIGURA 2.Placa IR-UWB com DWM1000. canal desejado,

O módulo DWM1000 IR-UWB é combinado com um poderoso No conjunto de dados para classificação das condições do canal,

microcontrolador STM32F103 com 512 kB FLASH e 64 kB de consideramos 7 ambientes internos diferentes: dois ambientes de

memória RAM. Pode ser alimentado via USB, um dispositivo escritório, uma pequena oficina, dois apartamentos, uma cozinha com

externo ou uma bateria. A conexão de dados entre o nó UWB e sala de jantar e uma sala de aquecimento. Cada um desses ambientes

a plataforma de experimentação pode ser estabelecida através possui características específicas de propagação de multipath, que

de uma porta serial virtual USB ou interface USART acessível em agregam riqueza ao conjunto de dados e evitam que o modelo resultante

um conector de extensão. para classificação de LoS e NLoS seja superajustado a um único

Na campanha de medição, dois nós UWB são conectados via ambiente.

USB a dois computadores single-board (SBC) separados com No conjunto de dados, cada ponto de medição inclui a estimativa
sistema operacional GNU/Linux e daí para a estação de trabalho de alcance (com base em um ToF estimado), valor RSS, nível de ruído
de experimentação via WiFi ou rede Ethernet, conforme e CIR.
ilustrado na Fig.3. O protocolo de transferência MQTT é usado
para controle de nó e coleta de medições para manter a C. CONJUNTO DE DADOS DE LOCALIZAÇÃO

complexidade do aplicativo de medição no nível mais baixo Para testar o desempenho dos algoritmos de mitigação de erro de
possível. localização, um conjunto de dados com intervalos medidos e distâncias
reais entre nós e âncoras deve ser construído. A partir de distâncias

B. CONJUNTO DE DADOS DE CLASSIFICAÇÃO NLOS conhecidas e estimadas entre os nós, os erros de alcance são calculados

Para construir um modelo de classificação baseado em CNN para e posteriormente usados para construir um modelo de regressão de

separação de canais LoS e NLoS, é necessário um extenso conjunto de erro de alcance para mitigação de erros de localização.

dados representando ambas as classes. Como cada ambiente interno é Para isso, definimos uma grade com 1mespaçamento entre

diferente em termos de características de propagação de multipercurso, pontos em dois ambientes de escritório. Um nó foi colocado em uma

as medições em vários ambientes internos diferentes têm posição aleatória em uma grade e o segundo nó foi posicionado
sucessivamente em diferentes posições na grade. Para cada ponto
módulo 1DWM1000,https://www.decawave.com/products/ da grade, foram feitas 100 medições. As medições foram
dwm1000-module posteriormente separadas em dois grupos diferentes de acordo com

17432 VOLUME 6, 2018


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

os ambientes de escritório em que foram inseridos. Um grupo foi usado


como dados de treinamento e o segundo grupo foi usado como dados de
teste para avaliar o desempenho da mitigação de erros sem superajuste
do ambiente.
Cada ponto de dados no conjunto de dados inclui as posições
xey de um nó, posições xey de uma âncora, estimativa de
alcance baseada em um ToF estimado, valor RSS, nível de ruído
e envelope CIR acumulado.

V. LOCALIZAÇÃO DO NÓ
Para uma estimativa de localização de nó em sistemas de localização
baseados em alcance sem conhecimento prévio da geometria do
ambiente, precisamos de vários nós âncora com localizações conhecidas.
Para uma localização 2D, precisamos de três âncoras e, para uma
localização 3D, precisamos de pelo menos 4 âncoras dentro do alcance
FIGURA 4.A figura mostra o erro de variação para diferentes faixas e
de um nó. Vários algoritmos de estimação têm sido investigados na
diferentes situações de NLoS e LoS.
literatura, mas por simplicidade e abordagem não probabilística,
selecionamos os algoritmos de mínimos quadrados (LS) e de mínimos
quadrados ponderados (WLS). a posição estimadaθ̂de um nó pode ser expresso com o
estimador WLS derivado no Apêndice B e definido em (4)
A. ESTIMATIVA DE LOCALIZAÇÃO DE MENOS QUADRADOS

A distância entre uma âncora e um nó com localização desconhecida


é formulada como uma distância euclidiana θ̂WLS= (HTWH)−1HTWx. (4)
Ao introduzir a matriz de ponderaçãoC, o erro de alcance estimado
deu=‖p̂e−peu‖ (1)
para um intervalo individual pode ser multiplicado por um intervalo

ondedeué o intervalo medido entre o nó e a i-ésima âncora,p̂ estimado para aumentar favoravelmente a ponderação de âncoras mais

eé uma posição estimada desconhecida de um nó, e peué próximas. Os pesos para uma matriz de ponderação podem ser

uma posição da i-ésima âncora. calculados pelo inverso do produto do intervalo estimadodeue estimativa

Seguindo a derivação fornecida no Apêndice A, um sistema quadrada do erro de alcanceεeu(5)

predefinido de equações lineares em forma de matriz pode ser 1


escrito e a posição estimadaθ̂de um nó pode ser calculado ceu= . (5)
deueu
ε
2
usando um estimador LS conforme definido em (2)
VI. CLASSIFICAÇÃO NLOS E ESTIMAÇÃO DE ERRO DE
θ̂LS= (HTH)−1HTx, (2) RANGE USANDO CNN
Para o modelo de classificação NLoS e modelo de regressão de erro de
ondeHé uma matriz de observação exé um vetor de dados
alcance, decidimos usar CNN devido à sua invariância de deslocamento
observados.
de entrada superior e capacidade de aprender modelos complexos. Essas
características tornam possível omitir a necessidade de pré-
B. ESTIMATIVA DE LOCALIZAÇÃO DE MENOS QUADRADOS PESADOS
processamento de dados de entrada e derivar vetores de entrada de
Com mínimos quadrados ordinários, a suposição implícita é ter variações baixa dimensão do CIR. A classificação proposta e as estruturas CNN de
constantes de erros de alcance. No entanto, os intervalos de NLoS regressão de erro de alcance funcionam em dados CIR brutos obtidos
normalmente têm erros de alcance aumentados, como mostrado na Fig.4 diretamente do rádio DW1000 IR-UWB em cenários de localização em
. De fato, os erros de alcance aumentam com a gravidade da condição tempo real. Implementamos estruturas CNN usando uma biblioteca de
NLoS e com o aumento da distância de propagação. A contribuição dos software de código aberto para computação numérica usando gráficos
intervalos NLoS para a precisão da localização é destrutiva, e a de fluxo de dados, a saber, TensorFlowMT[15]. Sua implementação é
ponderação de intervalos medidos individualmente de acordo com o erro muito eficiente; assim, ele também pode executar estruturas CNN
de intervalo esperado pode ajudar a enfatizar as contribuições dos complexas em tempo real em dispositivos computacionalmente restritos,
intervalos mais confiáveis. como smartphones de baixo custo ou pequenos computadores de placa
Com a introdução da diagonalNxNmatriz de ponderação única (SBCs) baseados em ARM, por exemplo, Raspberry Pi, Beagle-Bone
definida positivaC(3) e assim por diante.
- - A principal contribuição deste trabalho é a forma como a CNN é
c1 0 ... 0
utilizada. Tradicionalmente, as CNNs são alimentadas em 2 dimensões
- c2 ... 0 --
-0 (3) amostras de entrada de imagens. Reduzimos a dimensionalidade da
C= -. . .. . . -,
-.. .. . .- CNN para aceitar traços de entrada unidimensionais na forma
0 0 ... cn de dados CIR. A carga computacional para aprender e

VOLUME 6, 2018 17433


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

processos de iniciação é, portanto, muito menor em comparação com seleciona o máximo dos dois valores de entrada e a janela de
suas contrapartes bidimensionais. agrupamento é deslocada para dois valores de entrada por vez.
Nesse caso, a dimensão de entrada é reduzida por um fator de
A. ESTRUTURA DE REDE NEURAL CONVOLUCIONAL 2. Uma boa prática em CNNs é que o número de pesos
A CNN é organizada em uma estrutura em camadas. Cada unidade em uma permaneça constante em toda a rede neural. Seguindo a
única camada convolucional tem seu próprio campo receptivo local (uma fatia camada de redução espacial, o número de pesos pode ser
dedicada) de uma entrada. Consiste em vários neurônios artificiais individuais, mantido constante com um aumento adequado no número de
organizados verticalmente em planos com diferentes conjuntos de pesos para planos dentro das camadas convolucionais [16].
realizar múltiplas extrações de recursos em entradas idênticas. Os pesos de Após uma série de camadas convolucionais e de redução espacial, ocorre
uma unidade são compartilhados com todas as unidades em uma camada. uma camada totalmente conectada. Uma combinação de camadas
Todas as unidades da camada geram um conjunto de saídas chamado de mapa convolucionais com camadas de redução espacial funciona como uma unidade
de recursos, que alimenta a próxima camada. Uma estrutura em camadas de pré-processamento de entrada automática que substitui os procedimentos
genérica de um exemplo de CNN é representada na Fig.5. complexos tradicionais de extração de recursos. Eles servem como uma
camada de extração automática de recursos, fornecendo recursos para a
seguinte camada neural totalmente conectada. Uma camada totalmente
conectada tem todos os neurônios conectados a todas as saídas da última
camada convolucional. Em seguida, uma camada de leitura calcula a saída
correspondente.
No caso da classificação NLoS, uma camada de leitura
consiste em dois neurônios totalmente conectados com um
algoritmo de regressão softmax nas saídas dos neurônios. O
primeiro neurônio prediz a classe NLoS e o segundo neurônio
prediz a classe LoS. A função de saída de regressão softmax
transforma as saídas numéricas dos neurônios da camada de
leitura em valores binários (a saída mais forte obtém um valor
de 1 e a outra obtém um valor de 0).
Para a regressão de erro de alcance, a camada de leitura consiste
em um único neurônio com uma função de ativação linear
retornando o valor numérico do erro de alcance previsto.

B. TREINAMENTO CNN
Treinar uma rede neural com espaços de parâmetros de alta dimensão
requer algoritmos de otimização eficientes. As funções objetivas são
muitas vezes estocásticas devido à subamostragem de dados internos,
regularização de abandono e outras fontes de ruído. Kingma e Ba [17]
propuseram um algoritmo de otimização estocástica
FIGURA 5.Representação gráfica de uma arquitetura CNN. computacionalmente eficiente, Adam, que requer apenas gradientes de
primeira ordem com pouco requisito de memória, é invariante ao
A função de ativação para cada neurônio individual na redimensionamento diagonal dos gradientes e é adequado para
estrutura da CNN proposta é uma função de unidade linear problemas de alta dimensão. Ele fornece convergência de aprendizado
retificada (ReLU). O ReLU fornece uma boa quantidade de não rápida e confiável que pode ser consideravelmente mais rápida do que
linearidade ao sistema e é fácil e rápido de calcular. Também algoritmos de otimização semelhantes (por exemplo, Adagrad, SGD e
não afeta o desempenho real da CNN por uma margem assim por diante) [17].
significativa em comparação com funções de ativação mais Para evitar o overfitting de uma rede neural em pelo menos algum grau, a
complicadas, como função sigmóide logística ou função de regularização de abandono é usada para evitar coadaptações complexas nos
ativação tangente hiperbólica. dados de treinamento. Em cada amostra de treinamento, cada neurônio em
Uma das camadas funcionais em uma CNN é uma camada de uma camada totalmente conectada é omitido aleatoriamente da rede com uma
redução espacial, onde os dados de saída da camada anterior probabilidade predefinida (normalmente definida como 0,5 [18]).
são reduzidos para minimizar os efeitos das posições espaciais
dos recursos detectados. Selecionamos a função de redução Em nosso caso, em vez de expor todo o conjunto de dados de treinamento
espacial max pooling, que seleciona o valor máximo dos valores à rede neural treinada de uma vez, lotes menores de 256 amostras escolhidas
cobertos na janela de pooling atual e o propaga para a próxima aleatoriamente são alimentados na rede durante iterações consecutivas de
camada. O tamanho da janela de agrupamento define a redução aprendizado. Dessa forma, garantimos uma convergência mais robusta com
espacial da entrada. Se a largura de uma janela de pooling for 2 uma frequência de atualização de modelo mais alta em comparação com os
e o tamanho do passo (passo) for 2, então o pooling algoritmos de aprendizado em lote completo usuais.

17434 VOLUME 6, 2018


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

C. ALIMENTANDO A ENTRADA PARA CNN Biblioteca de aprendizado de máquina Python scikit-learn [19]. A
Os dados de resposta ao impulso do canal em um acumulador DW1000 implementação do SVM foi testada com uma função de kernel linear e
CIR têm 992 compartimentos para a frequência de repetição de pulso com um kernel de função de base radial (RBF).
(PRF) de 16 MHz e 1016 amostras para o PRF de 64 MHz com uma A rede neural MLP (NN) foi definida como uma MLP de 3 camadas
resolução de aproximadamente 1 ns ou precisamente meio período da com uma camada oculta, onde a camada de entrada possui 6
frequência fundamental de 499,2 MHz. neurônios, a camada oculta possui 152 neurônios e a camada de
Cada envelope de resposta ao impulso no acumulador começa a saída possui um neurônio. A função de ativação neural selecionada
aumentar em compartimentos de acumuladores ligeiramente diferentes, foi a unidade linear retificada (ReLU). A estrutura MLP foi
e o tempo CIR inicial relativo exato é, portanto, variável. O DW1000 determinada durante um processo de otimização onde o candidato
detecta e determina o índice bin inicial do sinal com um algoritmo NN de melhor desempenho foi selecionado. A estrutura foi treinada
proprietário integrado e pode ser facilmente acessado durante o tempo usando o algoritmo de otimização de gradiente descendente
de pós-processamento. estocástico (SGD) com uma taxa de aprendizado adaptável, taxa de
Em um acumulador CIR, aproximadamente 152 bins armazenam a aprendizado iniciallr=0.1, condição de paradapara mim=10−7, e as
maior parte das informações disponíveis sobre as características de sinapses de rede iniciais definidas para valores aleatórios.
propagação no ambiente. A visualização de um exemplo de CIR de 152 Para avaliar o desempenho dos algoritmos de aprendizado de
binlong é representada na Fig.6. Durante os processos de aprendizado, máquina, algumas métricas padrão baseadas na matriz de confusão
classificação e regressão, os primeiros 152 bins CIR são usados, foram calculadas [20]. Na matriz de confusão, as linhas representam
começando no primeiro bin de índice de caminho detectado por um i as classes reais das amostras e as colunas representam as classes
atribuídas no processo de classificação. As atribuições resultantes se
enquadram em quatro categorias, chamadas de verdadeiro positivo
(TP), verdadeiro negativo (TN), falso positivo (FP) e falso negativo
(FN).
As métricas de desempenho de classificação aplicadas são as
seguintes:
PT+TN
• Precisão:PT+TN+PF+FNfornece a porcentagem de instâncias
classificadas corretamente.
• Precisão:PT
PT+PFrepresenta a porcentagem de corretamente

classificou instâncias NLoS dentro de todas as instâncias que foram


classificadas como instâncias NLoS.
PT
• Sensibilidade:
PT+FNé a taxa de verdadeiro positivo ou uma fração

de instâncias classificadas corretamente dentro da classe NLoS.


• F1 ou média harmônica de precisão e sensibilidade:
2·precisão·sensibilidade
precisão+sensibilidade.
Os resultados para as quatro abordagens estão resumidos na
FIGURA 6.Um exemplo de dados LoS CIR.
Tabela1. O método proposto usando CNN mostra desempenho
semelhante ao das abordagens padrão baseadas em recursos
VII. AVALIAÇÃO DE DESEMPENHO DE CLASSIFICAÇÃO E derivados e os supera ligeiramente. O número de instâncias
LOCALIZAÇÃO classificadas incorretamente é distribuído de maneira mais
A avaliação de desempenho das estruturas CNN propostas para uniforme entre duas classes possíveis, o que significa que
classificação NLoS e regressão de erro de alcance foi realizada números semelhantes de instâncias NLoS e LoS são classificados
usando diferentes subconjuntos de dados coletados durante a incorretamente.
campanha de medição, conforme descrito na Seção4e como foi
usado para o treinamento de modelos CNN para evitar resultados B. DESEMPENHO DE LOCALIZAÇÃO DE
tendenciosos ou excessivamente otimistas. DIFERENTES ABORDAGENS
Em seguida, avaliamos o desempenho de localização de diferentes
A. COMPARAÇÃO DE DESEMPENHO DE CLASSIFICAÇÃO NLOS abordagens LS e WLS, comparando aquelas com e sem
O método de classificação NLoS proposto baseado em CNN usando
dados CIR brutos precisa ser avaliado em relação a abordagens padrão
TABELA 1.Desempenho de classificação NLoS.
em que recursos pré-calculados de dados CIR são usados. Para a
abordagem clássica baseada em recursos, calculamos ou reutilizamos
recursos de sinal prontamente disponíveis: valor RSS, valor RSS do
primeiro caminho, atraso médio em excesso, propagação do atraso do
quadrado médio da raiz (RMS), curtose e assimetria.
For o NLoS cl assificação m sed em pr calculado
tributoeu BA

CIR características, nós usado multil avocê por céptron (MLP) e


jantar ort vetor ma chinês (SVM ) implementar mentao é do

VOLUME E 6, 2018 17435


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

técnicas de mitigação de erros. Em todos os casos, a mitigação de erros também alto. No entanto, com um número crescente de âncoras, a
foi realizada usando a classificação NLoS baseada em CNN proposta e estimativa de localização torna-se refinada, conforme ilustrado na
modelos de regressão de erros. Fig.7 (LS) e resumidos na Tabela3.

1) ESTIMADOR DE LOCALIZAÇÃO LS COM INTERVALOS DE LOS TABELA 3.Precisão do estimador de localização LS.
O melhor desempenho de localização interna é obtido quando todos os
intervalos usados na estimativa de localização são intervalos de LoS.
Espera-se que todas as faixas de LoS tenham erros de alcance mínimos e,
portanto, contribuam com menos erros para a localização estimada do
que suas contrapartes de NLoS. Os intervalos de LoS no experimento são
filtrados com base no conhecimento prévio registrado durante a
campanha de medição. Os resultados são apresentados na Tabela2e na
Fig.7 (LS_LOS). Desempenho de localização semelhante é difícil de
alcançar em cenários da vida real devido a um ambiente de rádio em
constante mudança e à ausência de informações exatas de LoS, que só
podem ser previstas com alguma certeza. 3) ESTIMADOR DE LOCALIZAÇÃO LS COM CLASSIFICAÇÃO NLOS
Nesta abordagem, a classificação CNN é usada para detectar e
MESA 2.Precisão do estimador LS para faixas de LoS. eliminar intervalos NLoS do pool de âncoras de localização. O
desempenho é menor do que no caso de conhecimento prévio
perfeito de NLoS na SeçãoVII-B.1. No entanto, tais cenários de
localização só podem ser usados efetivamente em ambientes onde
um número abundante de âncoras LoS está disponível. Os
resultados são apresentados na Tabela4e na Fig.7(LS_CLASS).

TABELA 4.Precisão do estimador de localização LS com classificação NLoS.

4) ESTIMADOR DE LOCALIZAÇÃO LS COM MITIGAÇÃO


DE ERROS DE ALCANCE
Nesse caso, o erro de alcance é estimado para cada alcance medido
no pool de localização. As estimativas de erro de alcance são
calculadas com base no CIR e nas informações de erro de alcance
disponíveis no conjunto de dados de localização usando o modelo
CNN. O erro estimado é subtraído do alcance medido, e o alcance
FIGURA 7.Precisão de localização para diferentes algoritmos de localização e mitigado resultante é usado no estimador de localização LS. Os
diferentes números de âncoras. resultados estão representados na Fig.7(LS_REG) e na Tabela5.

2) ESTIMADOR DE LOCALIZAÇÃO LS SEM MITIGAÇÃO DE ERROS TABELA 5.Precisão do estimador de localização LS com mitigação de erro de alcance.

O estimador de localização LS é o método de localização mais simples


baseado em medições de alcance de um nó a várias âncoras. É usado
quando nenhum conhecimento prévio é usado sobre variações de
medição de alcance e, portanto, suposições estatísticas sobre os dados
medidos. Consequentemente, o desempenho esperado
forma nce grealmente depends ligado º e qualidade da gama disponível
medida ents. No caso de N Gamas de LoS, erros de alcance e
são altos, um nd portanto , a expectativa erros de posicionamento são

17436 VOLUME 6, 2018


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

5) ESTIMADOR DE LOCALIZAÇÃO WLS menor e sem necessidade de análise para acessar os dados. Há também
As informações do regressor de erro de alcance da CNN podem ser uma versão anterior da implementação móvel, TensorFlow Mobile5, mas
usadas como um fator de ponderação na estimativa de localização WLS. ambas as implementações suportam apenas plataformas móveis, como
Como mostrado na Fig.7(WLS) e na Tabela6, uma precisão muito maior Android ou iOS. Em dispositivos GNU/Linux, apenas a distribuição padrão
pode ser alcançada do que com o estimador LS simples à medida que o do TensorFlow pode ser usada com o melhor de nosso conhecimento.
número de âncoras disponíveis aumenta.

TABELA 6.Precisão do estimador de localização WLS. A. PLATAFORMAS DE COMPUTAÇÃO EM TESTE


Para testar e avaliar o desempenho dos algoritmos baseados em
CNN propostos, selecionamos 6 plataformas de computação
amplamente acessíveis e difundidas. Classificamo-las em dois
grupos distintos: plataforma de capacidade restrita e plataforma de
linha de performance. As plataformas de capacidade restrita
destinam-se ao uso em nós de sensores distribuídos, terminais de
usuários remotos ou gateways de borda. As plataformas da linha de
desempenho destinam-se ao uso em aplicações de computação
intensiva, centralizadas e em nuvem.
Uma das plataformas de computação de capacidade restrita e de
6) ESTIMADOR DE LOCALIZAÇÃO WLS COM MITIGAÇÃO DE baixo orçamento mais populares é o Raspberry Pi6executando o
ERROS DE VARIEDADE Raspbian baseado em Debian7Sistema operacional GNU/Linux.
A combinação de estimador de localização WLS e mitigação de erro Todas as versões do Raspberry Pi usam microprocessadores ARM
de alcance com regressão de erro de alcance CNN mostra o melhor semelhantes aos encontrados em smartphones. Na avaliação,
desempenho de localização de todos os métodos sem filtrar os usamos a versão 1 (RPI1) com microprocessador ARM1176JZF-S
intervalos de NLoS. Os resultados são mostrados na Tabela7e na Fig. single-core, 512MB de RAM e clock de 700MHz, além da mais recente
7(WLS_REG). e poderosa versão 3 (RPI3) com CPU quadcore ARM Cortex-A53 , 1
GB de RAM e frequência de CPU de 1,2 GHz. A terceira plataforma de
TABELA 7.Precisão do estimador de localização WLS com mitigação de erro de computação de capacidade restrita é representada por um netbook
alcance. (NET) da Asus baseado em um processador Intel Atom N450 x86 de
64 bits com dois threads, 2 GB de RAM e frequência básica de CPU
de 1,66 GHz.
As plataformas de computação de linha de desempenho são
representadas por um computador ultrabook e dois laptops de
estação de trabalho de alto desempenho. O ultrabook Lenovo Yoga
(UB) é baseado em uma CPU Intel i7-4500U de 64 bits com 4 threads,
frequência de CPU básica de 1,8 GHz e 8 GB de RAM. As demais
plataformas de alto desempenho são um HP EliteBook 8560w (WS1)
baseado em uma CPU Intel i7-2670QM com 8 threads e 8 GB de RAM
e um Dell XPS15 (WS2) baseado em uma CPU Intel i7-6700HQ com 8
VIII. AVALIAÇÃO DE DESEMPENHO COMPUTACIONAL threads e 16 GB de RAM. Todas as plataformas selecionadas são
Conforme descrito na SeçãoVI, selecionamos o TensorFlow para a executadas no sistema operacional Ubuntu 16.04.3 LTS GNU/Linux
implementação do CNN, pois ele funciona bem em várias plataformas de idêntico, exceto as plataformas Raspberry Pi que executam o
computação, desde estações de trabalho, servidores ou clusters até sistema operacional Raspbian baseado em Debian 9.1 GNU/Linux.
smartphones de baixo custo e SBCs executando SOs GNU/Linux. De fato, Os parâmetros das plataformas selecionadas são coletados na
estávamos particularmente interessados na possibilidade de Tabela8.
implementar e operar algoritmos baseados em CNN em dispositivos
computacionalmente restritos. TensorFlow Lite2foi lançado recentemente
B. DEFINIÇÃO DO TESTE DE DESEMPENHO
e foi especialmente projetado e otimizado para rodar em smartphones
Desenvolvemos um teste de desempenho específico para avaliar a
com o mínimo de recursos possível. Em vez de usar os buffers de
rapidez com que uma plataforma com o modelo de classificação de canal
protocolo padrão3para serialização de dados estruturados, FlatBuffers4a
NLoS baseado em CNN pode classificar amostras de entrada de acordo
serialização de dados é introduzida com uma pegada de código que é
com o tamanho do lote de amostras. TensorFlow é otimizado para
uma ordem de grandeza
cálculos numéricos em grandes multidimensionais organizados

2TensorFlow Lite,https://www.tensorflow.org/mobile/
tflite/ 5TensorFlow Mobile,https://www.tensorflow.org/mobile/
3Prot ocoeu s, https :/ / developers.google.com/
Amortecedor 6Raspberry Pi,https://www.raspberrypi.org/
protocolo- buffers/ 7Raspbian, https://www.raspberrypi.org/downloads/
4FlatBuffe rs,https:// google.git hub.io/flatbuffers/ raspbian/

VOLUME 6, 201 8 17437


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

TABELA 8.Plataformas computacionais utilizadas na avaliação de desempenho. C. RESULTADOS DE DESEMPENHO


Os requisitos de desempenho para plataformas de computação
dependem da posição em que são usadas em uma rede. No caso de um
sistema de localização UWB que explora informações CIR, um dispositivo
final requer apenas a capacidade de processar algumas ou no máximo
algumas dezenas de amostras CIR por segundo, e um dispositivo de
borda, como um nó âncora, requer algumas centenas de amostras por
segundo para fornecer taxas de atualização de localização suficientes.
Quando a localização é fornecida em um nível de infraestrutura
centralizado, uma plataforma de computação central deve fornecer
vários milhares de links processados e também ser capaz de processar
outras tarefas de computação.
Todas as plataformas testadas apresentam comportamento
semelhante quanto ao tamanho dos lotes de amostra. O desempenho
aumenta com o aumento do tamanho do lote e para quando os recursos
matrizes de valores numéricos (tensores) e espera-se que funcione de computação são utilizados de forma otimizada. O TensorFlow foi
melhor com lotes maiores de amostras de entrada. O teste é escrito projetado para funcionar de maneira ideal com blocos maiores de dados,
na linguagem de programação Python (versão 2.7) usando as o que fica evidente nos gráficos de desempenho representados na Fig.8.
bibliotecas de extensão Python NumPy, scikit-learn [19] e Pandas. O desempenho com tamanhos de lote pequenos é limitado pela
velocidade de carregamento de dados e pelos tempos de resposta de
componentes individuais na cadeia computacional (carregamento de
Algoritmo 1Algoritmo de teste de desempenho dados, escalonamento de dados e classificação). Com lotes de amostras
dados_definir←carregar_dados maiores, há menos procedimentos de manipulação de dados por
amostra e, com CPUs multithread, a carga de trabalho pode ser
paraeu=0para11fazer distribuída com mais eficiência. A maioria das plataformas testadas
começar_tempo←atual_tempo atinge desempenho máximo com lotes de 1024 amostras, exceto as
paraj=1para1000fazer plataformas menos poderosas RPI1 e NET. Essas plataformas atingem o
classificar(dados_set.getNextBatch(2eu)) desempenho máximo mais cedo devido ao tamanho menor da memória,
fim para menor número de threads de CPU e menor desempenho da CPU.
fim_tempo←atual_tempo A plataforma RPI1 é capaz de processar 92
desempenho[eu]← (1000∗2eu)/(fim_tempo−começar_tempo) fim classificações por segundo em um tamanho de lote de
para 4 amostras. Isso é suficiente para processamento no
nível do dispositivo final, satisfazendo o requisito
mínimo para localização 3D. O desempenho máximo
O script de teste é apresentado em pseudocódigo no Algoritmo1. O alcançado com a plataforma RPI1 é de 212
algoritmo carrega e inicializa o modelo de classificação dentro do classificações por segundo com um tamanho de lote
ambiente TensorFlow. Em seguida, ele carrega os dados de teste de de 256 amostras. A plataforma RPI3 mais nova e
arquivos .csv e os formata de acordo com os requisitos definidos durante aprimorada é poderosa o suficiente para executar
o estágio de treinamento do modelo de classificação NLOS. Primeiro, 152 como um dispositivo de borda com 514 classificações
bins do primeiro índice de caminho indicado dentro do acumulador CIR por segundo com um tamanho de lote de 4 amostras,
de estimativa de intervalo individual são retirados e adicionados à matriz 3577 classificações por segundo com um tamanho de
do conjunto de dados de teste. Em seguida, um algoritmo de teste mede lote de 256 amostras e atinge desempenho máximo
o tempo para executar 1.000 iterações de classificação com tamanhos de de 4252 classificações por segundo com um tamanho
lote de amostra sucessivamente crescentes. Os tamanhos dos lotes de do lote de 2048 amostras.
amostra aumentam com 2n, ondenvai de 0 a 11, ou seja, comporta de 1 a No lado de alto desempenho das plataformas testadas,
2048 amostras. adequadas para soluções de localização centralizadas, a plataforma
Durante o procedimento de classificação, cada amostra CIR é primeiro UB de nível básico atinge 3723 classificações por segundo com um
centralizada e dimensionada removendo a média e dimensionando para unidade de tamanho de lote de 4 amostras, 17339 classificações por segundo
variância elemento a elemento com base em estatísticas relevantes com- com um tamanho de lote de 256 amostras e atinge o pico
colocados no conjunto de dados de treinamento. O lote de amostra padronizado desempenho de 18.183 classificações por segundo com um
é t hen alimentado ao T ensorFlow im plemmentação de t ele treinou tamanho de lote de 512 amostras. A plataforma WS1 de alto
CNN classificação NLoS modelo de cátion . O número de classificado desempenho atinge 1223 classificações por segundo com um
samples durante o 1000 iterações s é dividido por t ele passou tamanho de lote de 4 amostras, 29182 classificações por segundo
comtempo de colocação para obter o cl assificação perfo rmance of para um tamanho de lote de 256 amostras e atinge desempenho
um pl atform sob tes t. máximo de 34933 classificações por segundo com um lote

17438 VOLUME 6, 2018


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

FIGURA 8.Desempenho de classificação de diferentes plataformas de hardware.

tamanho de 2048 amostras. O laptop de estação de trabalho mais construir uma classificação NLoS mais geral e modelos de regressão de
recente WS2 atinge 1686 classificações por segundo com um erro de alcance para validação adicional.
tamanho de lote de 4 amostras, 39713 classificações por segundo Ao fornecer resultados de localização interna mais confiáveis, os
em um tamanho de lote de 256 amostras e desempenho máximo de novos métodos propostos implicam maior dimensionalidade dos
50531 amostras por segundo com um tamanho de lote de 2048 dados de entrada, que combinados com a complexidade da CNN
amostras. geram maiores demandas de computação em comparação com as
Os resultados apresentados acima confirmam que, em um sistema de abordagens clássicas. No entanto, a avaliação do desempenho
localização distribuído, o algoritmo de classificação NLoS baseado em computacional em várias plataformas de computação indica que
CNN proposto usando o TensorFlow também pode ser utilizado em elas atendem aos requisitos da implementação do TensorFlow dos
dispositivos de ponta e/ou borda com capacidade restrita. Assim, em métodos com um escopo de localização adequadamente restrito.
comparação com a implementação centralizada, a implementação que Assim, os métodos propostos podem melhorar a localização interna
utiliza computação em dispositivos finais e periféricos em implantações centralizadas e distribuídas, esta última exigindo
• evita a necessidade de transferir grandes quantidades de dados CIR otimização da topologia da rede, ao mesmo tempo em que oferece
para as plataformas de computação em servidores de localização uma boa compensação em termos de largura de banda necessária
centralizados ou na nuvem, para transferir dados CIR e permite menor latência.
• atinge menor latência na localização, o que é essencial em
diversos domínios de aplicação, e APÊNDICE A
• garante maior escalabilidade. ESTIMADOR DE LOCALIZAÇÃO DE MENOS QUADRADOS
O estimador LS escolheθtal que faz um modelo de sinal s[n]
IX. CONCLUSÃO mais próximo dos dados observadosx[n]. O critério de erro
Neste artigo, uma nova abordagem para localização interna é proposta e
LS é definido por (A.1). O valor deθque minimizaJ(θ) é o
avaliada usando dois métodos baseados em CNN trabalhando em dados
estimador LS.
UWB CIR brutos. Em particular, os dois métodos usam classificação de
−1
N∑
canal NLoS e modelos de regressão de erro de alcance para reduzir o
erro na localização interna sem qualquer conhecimento prévio do J(θ) = (x[n] −s[n])2 (A.1)
ambiente de rádio. A comparação de desempenho da classificação de n=0
canal NLoS confirma que o método com dados CNN e CIR bruto supera Para localização 2-D, a distância euclidiana entre uma
ligeiramente os métodos baseados em recursos CIR derivados âncora e um nó é formulada como em (A.2)
estatisticamente. Quando usado com estimadores de localização LS e √
WLS como técnicas para mitigação de erros de localização, a classificação
deu= (xeu−x)2+ (yeu−y)2 (A.2)
NLoS baseada em CNN proposta e a regressão de erros melhoram
significativamente o desempenho de localização dos métodos LS e WLS ondedeué o intervalo medido entre o nó e a i-ésima âncora,xeuey
de linha de base. A regressão de erro de alcance usada em todos os eusão as coordenadas da i-ésima âncora, exe ysão as
intervalos disponíveis tem um desempenho melhor do que a filtragem de coordenadas de um nó que ainda não são conhecidas.
intervalos NLoS. Como parte do trabalho futuro, campanhas de medição Aplicando a abordagem LS linear para um parâmetro escalar,
extensas adicionais são planejadas em diferentes ambientes internos assumimos (A.3), ondeh[n] é uma sequência conhecida.
para capturar mais condições de propagação de LoS e NLoS e,
posteriormente, s[n] =θh[n] (A.3)

VOLUME 6, 2018 17439


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

O critério de erro LS agora é transformado na forma em ( o erro de estimativa LS dado na Eq. (A.6) pode ser reescrita como (
A.4). B.2)

−1 −1
N∑
N∑
J(θ) = (x[n] − θh[n])2 (A.4) J(θ) = ceu(x[n] −s[n])2
n=0 n=0
= (x− Hθ)TC(x− Hθ). (B.2)
Para (A.3), a notação de matriz em (A.5) pode ser usado para o
sinals= [s[0]s[1]. . .s[N−1]]T,ondeHé um conhecidoN×p matriz de Os pesos para uma matriz de ponderação (B.1) pode ser
observação de posto completop. calculado pelo inverso do produto do intervalo estimadodeue
estimativa quadrada de erro de alcanceεeu(B.3)
s=Hθ (A.5) 1
ceu= 2
. (B.3)
deuεeu
O estimador LS pode ser encontrado minimizando (A.6),
resultando em (A.7). A posição estimadaθ̂de um nó agora pode ser expresso
−1 com o estimador WLS definido em (B.4)
N∑
J(θ) = (x[n] −s[n])2 θ̂WLS= (HTWH)−1HTWx. (B.4)
n=0
= (x− Hθ)T(x− Hθ) θ̂= (A.6) REFERÊNCIAS
[1] N. Patwari, JN Ash, S. Kyperountas, AO Hero, RL Moses e
(HTH)−1HTx (A.7) NS Correal, ''Localizando os nós: localização cooperativa em redes de sensores
sem fio,''Processo de Sinal IEEE. Mag., vol. 22, não. 4, pp. 54–69, julho de 2005.
Reescrevendo (A.2) fornece (A.8).
[2] H.-S. Ahn e W. Yu, ''Localização interna baseada em RSSI adaptável ao ambiente''

− 2xeux−2yeuy+x2+y2=d̂2 eu−x2eu−y2eu (A.8) IEEE Trans. Autom. ciência Eng., vol. 6, não. 4, pp. 626–633, outubro de 2009.

[3] K. Wu, J. Xiao, Y. Yi, D. Chen, X. Luo e LM Ni, ''CSI-based indoor


Para linearizar o sistema de equações não lineares, introduzimos localization,''IEEE Trans. Distribuição Paralela Sist., vol. 24, não. 7,
uma nova variável em (A.9) pp. 1300–1309, julho de 2013.
[4] S. Yiu e K. Yang, ''Processo gaussiano assistido localização de impressões
R=x2+y2 (A.9) digitais,''IEEE Internet Things J., vol. 3, não. 5, pp. 683–690, outubro de 2016.
[5] S. He, B. Ji e S.-HG Chan, ''Chameleon: Atualização livre de pesquisa de um banco de
dados de impressões digitais para localização interna''IEEE Computação Pervasiva., vol.
e defina a localização estimada com (A.10).
15, não. 4, pp. 66–75, outubro de 2016.
[ ] [6] H.-J. Shao, X.-P. Zhang e Z. Wang, ''Algoritmos eficientes de forma fechada para
θ̂=x y RT (A.10) autolocalização baseada em AOA de nós sensores usando variáveis auxiliares,''
IEEE Trans. Processo de sinal., vol. 62, nº. 10, pp. 2580–2594, maio de 2014.
Agora podemos escrever o sistema de equações na forma matricial [7] S. Gezicie outros, ''Localização via rádios de banda ultralarga: uma olhada nos aspectos

- - de posicionamento para futuras redes de sensores''Processo de Sinal IEEE. Mag., vol.


− 2x1 − 2y1 1 22, não. 4, pp. 70–84, julho de 2005.

---2x2 − 2y2 1-- [8] D. Dardari, A. Conti, U. Ferner, A. Giorgetti, e MZ Win, ''Ampliando com sinais de
largura de banda ultralarga em ambientes multipercurso''Proc. IEEE, vol. 97, nº.
H= -. . --. (A.11)
-.. ... .
2, pp. 404–426, fevereiro de 2009.
[9] B. Silva e GP Hancke, ''Identificação sem linha de visada baseada em IR-
− 2xN − 2yN 1 UWB em ambientes hostis: Princípios e desafios''IEEE Trans. Ind.
- - Informat., vol. 12, não. 3, pp. 1188–1195, junho de 2016.
d̂12−x2 1−y2 1 [10] S. Maranoe outros, ''Identificação e mitigação de NLOS para localização com base
-d̂2 2−x2 2−y 2 - em dados experimentais UWB,''IEEE J. Sel. Áreas Comun., vol. 28, não. 7, pp.
- 2-
x= - - (A.12) 1026–1035, setembro de 2010.
- ... - [11] Z. Xiao, H. Wen, A. Markham, N. Trigoni, P. Blunsom e
J. Frolik, ''Identificação e mitigação fora da linha de visada usando a intensidade
d̂N2−x2 N−yN 2 do sinal recebido''IEEE Trans. Comun. sem fio, vol. 14, não. 3, pp. 1689–1702,
março de 2015.
que nos fornece um sistema predefinido de equações lineares em [12] T. Van Nguyen, Y. Jeong, H. Shin e MZ Win, ''Aprendizado de máquina para
uma forma normal onde a posição pode ser calculada usando o localização de banda larga''IEEE J. Sel. Áreas Comun., vol. 33, nº. 7, pp.
1357–1380, julho de 2015.
estimador LS definido na Eq. (A.7).
[13] H. Wymeersch, S. Marano, WM Gifford e MZ Win, ''Uma abordagem de
aprendizado de máquina para mitigação de erro de alcance para localização
APÊNDICE B UWB,''IEEE Trans. Comum., vol. 60, não. 6, pp. 1719–1728, junho de 2012.
[14] Y. LeCun, L. Bottou, Y. Bengio e P. Haffner, ''Aprendizado baseado em gradiente
ESTIMADOR DE LOCALIZAÇÃO DE MÍNIMOS QUADRADOS PESADOS
aplicado ao reconhecimento de documentos''Proc. IEEE, vol. 86, nº. 11, pp.
Com a introdução da diagonalNxNmatriz de ponderação 2278–2324, novembro de 1998.
definida positivaC(B.1) [15] M. Abadie outros(2015).TensorFlow: aprendizado de máquina em larga escala em
sistemas heterogêneos. [On-line]. Disponível: https://www.tensorflow.org/
- -
c1 0 ... 0 [16] Y. LeCun e Y. Bengio, ''Redes convolucionais para imagens, fala e séries
temporais'', emO Manual de Teoria do Cérebro e Redes Neurais, MA
- c2 . . . 0 --
-0 Arbib, Ed. Cambridge, MA, EUA: MIT Press, 1998, pp. 255–258. [On-line].
C= -. .. . . -, (B.1)
-.. ... . .-
Disponível: http://dl.acm.org/citation.cfm?id=303568.303704
[17] DP Kingma e J. Ba. (2014). ''Adam: Um método para otimização
0 0 ... cn estocástica.'' [Online]. Disponível: http://arxiv.org/abs/1412.6980

17440 VOLUME 6, 2018


K. Bregar, M. Mohorčič: Melhorando a localização interna usando CNNs em dispositivos computacionalmente restritos

[18] GE Hinton, N. Srivastava, A. Krizhevsky, I. Sutskever e MIHAEL MOHORČIČ (M'02–SM'10) recebeu o


R. Salakhutdinov. (2012). ''Melhorando as redes neurais prevenindo a co- B.Sc., M.Sc. e Ph.D. graus em engenharia elétrica
adaptação de detectores de características.'' [Online]. Disponível: http:// pela University of Ljubljana, Ljubljana, em 1994,
arxiv.org/abs/1207.0580 1998 e 2002, respectivamente, e o M.Phil.
[19] F. Pedregosae outros, ''Scikit-learn: aprendizado de máquina em Python,''J. Mach. graduou-se em engenharia elétrica pela
Aprender. Res., vol. 12, pp. 2825–2830, outubro de 2011. [Online]. Disponível: http://
University of Bradford, Bradford, Reino Unido,
hal.inria.fr/hal-00650905
em 1998. Atualmente é chefe do Departamento
[20] M. Kulin, C. Fortuna, E. De Poorter, D. Deschrijver e I. Moerman, ''Projeto
de Sistemas de Comunicação e consultor
baseado em dados de redes sem fio inteligentes: uma visão geral e
científico do Jožef Stefan Institute e professor
tutorial''Sensores, vol. 16, não. 6, pág. 790, 2016. [Online]. Disponível:
associado do Jožef Stefan Interna-
http://www.mdpi.com/1424-8220/16/6/790
Escola Nacional de Pós-Graduação. Ele é autor ou co-autor de mais
de 140 artigos de periódicos e conferências, co-autor de dois livros e
KLEMEN BREGARrecebeu o B.Sc. graduou-se em colaborador de nove capítulos de livros. Seus interesses de pesquisa
engenharia elétrica pela University of Ljubljana, incluem o desenvolvimento e avaliação de desempenho de
Ljubljana, em 2013. Ele atualmente está cursando o protocolos e arquiteturas de rede para sistemas de comunicação
Ph.D. licenciatura em tecnologias de informação e sem fio e móveis e gerenciamento de recursos em redes terrestres,
comunicação com a Jožef Stefan International estratosféricas e de satélites. Seu interesse de pesquisa recente está
Postgraduate School. Atualmente é Assistente de focado em redes de rádio cognitivas, aplicações inteligentes de
Pesquisa no Departamento de Sistemas de redes de sensores sem fio, composição dinâmica de serviços de
Comunicação, Jožef Stefan Institute, Ljubljana. Seus comunicação e testbeds experimentais sem fio. Ele participou de
interesses de pesquisa incluem o desenvolvimento muitos projetos de pesquisa cofinanciados pela UE desde 1996 e
de sistemas embarcados, sensores sem fio atualmente está envolvido nos projetos H2020 eWINE, Fed4FIRE+,
redes sor, sistemas de sensores biomédicos e aprendizado de máquina. Seus NRG-5 e SAAM.
interesses de pesquisa recentes incluem localização interna, sistemas de
comunicação de largura de banda ultralarga, redes biomédicas de sensores sem fio e
a aplicação de redes neurais de aprendizado profundo. Ele está atualmente envolvido
nos projetos H2020 eWine e SAAM e contribui para um projeto nacional de pesquisa
aplicada sobre técnicas avançadas de traçado de raios na caracterização do ambiente
de rádio e localização de rádio (L2-7664).

VOLUME 6, 2018 17441

Você também pode gostar