Escolar Documentos
Profissional Documentos
Cultura Documentos
Estudo Dirigido SLAM PDF
Estudo Dirigido SLAM PDF
São Luís
2016
ANDRÉ FELIPE DA SILVA OLIVEIRA
São Luís
2016
Resumo
Este trabalho consiste em uma revisão bibliográfica a cerca de localização simultânea
e mapeamento aplicada a robôs móveis. Neste trabalho é abordado sobre os tipos
de filtros, tipos de modelos de movimento, tipos de medição e a aplicação deles no
contexto de localização simultânea e mapeamento. Todo o trabalho é fundamento
em uma abordagem probabilística.
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1 FILTROS PROBABILÍSTICOS . . . . . . . . . . . . . . . . . 7
1.1 Filtro de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Parametrizados . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.1 Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2 Filtro de Kalman estendido . . . . . . . . . . . . . . . . . . . . . . 15
1.3 Não-parametrizados . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.1 Filtro histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3.1.1 Filtro discreto de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3.1.2 Estados contínuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.2 Filtro de partículas . . . . . . . . . . . . . . . . . . . . . . . . . . 20
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . 34
6
Introdução
Sempre que se fala em robôs autônomos, pensa-se que ele deve ser capaz
de reconhecer e atuar no ambiente ao seu redor, mesmo que esse ambiente seja
inicialmente desconhecido. Quando se fala em robôs moveis, atuação do robô se da
na forma de locomoção no ambiente e com isso a sua autonomia passa por reconhecer
ou mapear o ambiente em que esta inserido. SLAM (Simultaneous Localization
and Mapping) é uma área cujo objetivo é mapear ambientes desconhecidos, de
forma a fornecer ao robô móvel informação suficiente para que este possa exercer
sua autonomia (um mapa e a localização do robô neste mapa de forma precisa e
confiável).
SLAM envolve varias áreas de pesquisas, sendo algumas delas controle,
tratamento de dados , processamento de imagens e mapeamento. As aplicações
são as mais variadas possíveis, sendo uma das mais utilizadas em motivações de
trabalho, a utilização de robôs que se usam de SLAM para salvamento em ambientes
desconhecidos.
Os primeiros trabalhos relevantes publicados sobre SLAM foram realizados
pelos pesquisadores R.C. Smith e P. Cheeseman em (SMITH; CHEESEMAN, 1986)
e (SMITH; SELF; CHEESEMAN, 1990). Outro trabalho pioneiro foi o de Hugh
F. Durrant-Whyte em (LEONARD; DURRANT-WHYTE, 1991) através de uma
abordagem algorítmica computacionalmente tratável.
Neste trabalho esta dividido da seguinte forma, onde no Capítulo 1 explana-
se sobre filtros bastante utilizados no estudo e implementação de SLAM, no Capítulo
2 fala-se sobre os modelos de movimentos probabilísticos predominantes em SLAM,
no Capítulo 3 se aborda as técnicas de medição probabilísticas e no Capítulo 4 é
explanado sobre filtros SLAM em uma abordagem probabilística.
7
1 Filtros Probabilísticos
2013):
p(xt |xt−1 , ut ), (1.2)
dessa forma, tem-se então que o estado atual do robô depende do estado anterior e
a ação de movimento que ocorreu sobre a ação anterior, gerando assim o estado
atual.
Sabendo que a medição é diretamente vinculada ao estado do robô, ou seja,
sua localização, pode-se dizer que (FALLIS, 2013):
ou seja, a medição depende apenas da posição atual do robô, independe das posições
anteriores e movimentos por ele executado.
Para entender as sessões a seguir, é preciso introduzir um conceito de robótica
probabilística chamada de crença (belief ). Crença é o conhecimento interno do robô
sobre o estado do ambiente (seu posicionamento). Um estado não pode ser medido
diretamente e o robô deve inferir seu posicionamento através dos dados fornecidos
pelas medições. É preciso saber distinguir um estado verdadeiro de uma crença
interna do robô.
A robótica probabilística representa a crenças como uma distribuição proba-
bilística condicional (Distribuição de crenças). A crença atribui uma probabilidade
para cada hipotese possível de ser o estado real. Pode-se chamar a crença sobre a
variável estado xt de bel(xt ) e dessa forma pode-se dizer que (FALLIS, 2013):
Também assume-se que o sensor do robô contem ruído e que o ruído do sensor
segue as seguintes condições de probabilidade:
Dessa forma a chance de falso negativo é caso a porta esteja aberta e o sensor
detecte ela fechada com a probabilidade ocorrer de 0.4. No caso de falso positivo a
porta esta fechada e o sensor detecta ela aberta com a probabilidade de 0.2.
Analisando as probabilidades das Fórmulas 1.10 e 1.11 e se considerar que
a única ação que o robô pode exercer sobre a porta é empurra-la, pode-se então
inferir que:
Z
bel(x1 ) = p(x1 |u1 , x0 ) bel(x0 )dx
X
bel(x1 ) = p(x1 |u1 , x0 ) bel(x0 )
x0
bel(x1 = estaAberto)
= p(X1 = estaAberto | U1 = f azerN ada, X0 = estaAberto) bel(X0 = estaAberto)
+p(X1 = estaAberto | U1 = f azerN ada, X0 = estaF echado) bel(X0 = estaF echado)
bel(x1 = estaAberto) = 1 · 0.5 + 0 · 0.5 = 0.5
(1.17)
e então:
Através desse exemplo e até este ponto, pode-se dizer que existe uma chance
de aproximadamente 0.983 da porta estar aberta caso as medições estejam corretas.
Capítulo 1. Filtros Probabilísticos 13
Ainda de acordo com (FALLIS, 2013), ele compara isso a uma chance de um avião
em voou com piloto automatico, ter uma chance de 0.983 de não cair.
Através desse exemplo, pode-se perceber a importância da aplicação de
filtros para prever a possibilidade de situações possíveis, no caso do SLAM, os
filtros são utilizados para confirmar medições (ex.: qual a possibilidade de realmente
existir uma parede em um determinado local) e analisar o quão confiáveis essas
medições podem ser.
Na tentativa de melhorar ainda mais a precisão dos filtros, pois este é um
dos pilares fundamentais na utilização dos mesmos, atrela-se o filtro de Bayes a
conceitos de probabilidade. Nos tópicos a seguir, se aborda sobre alguns filtros
derivados do filtro de Bayes e fundamentados em probabilidade.
1.2 Parametrizados
Os filtros parametrizados tem por característica serem um estimador de es-
tados recursivo, também chamados de filtros gaussianos. Esses filtros são conhecidos
por serem implementações tratáveis do filtro de Bayes.
Os filtros gaussianos tem uma característica básica em que as crenças são
representadas por distribuições normais multivariadas, que é dada pela Equação
(FALLIS, 2013):
1
− 12
p(x) = det(2πΣ) exp − (x − µ)T Σ−1 (x − µ) , (1.26)
2
onde x é o estado, µ é a média e σ é a covariância.
Filtros gaussianos são unimodais, ou seja, eles possuem apenas um único
máximo. Inferir um estado posterior é uma característica de muitos problemas de
rastreamento em robótica, em que o estado posterior inferido se encontra próximo
ao estado verdadeiro e com apenas uma pequena margem de incerteza.
Em (FALLIS, 2013) é dito que a representação de uma gaussiana por
média e covariância é chamada de representação de momentos, isto porque a
média e a covariância são os primeiros e segundo momento de uma distribuição de
probabilidade. Todos os outros momentos são zero para distribuição normal.
Capítulo 1. Filtros Probabilísticos 14
xt = At xt−1 + Bt ut + εt (1.27)
zt = Ct xt + δt . (1.29)
o robô acaba se movendo em trajetórias circulares, que não podem ser descritas
através de uma transição de próximo estado linear.
O filtro de Kalman estendido tenta resolver este problema tratando a
probabilidade do próximo estado e a probabilidade de medição através de funções
não lineares, sendo estas g e h, respectivamente. Através dessa idéia, pode-se dizer
que:
Este modelo é baseado nas Equações 1.27 e 1.29 e uma generalização delas.
Porém, sendo g e h funções arbitrarias, a crença deixa de ser uma gaussiana e a
atualização da crença também deixa de ser exata para as funções não lineares g e
h.
Segundo (FALLIS, 2013), o filtro de Kalman estendido (EKF) calcula uma
aproximação da verdadeira crença e representa essa aproximação por uma gaussiana.
Dessa forma, a crença bel(xt ) no tempo t é representada pela média µt e a covariância
Σt . Por este motivo, o EKF herda do filtro de Kalman a representação da crença,
mudando apenas que no EKF, a crença passa a ser apenas uma aproximação,
enquanto o filtro de Kalman é exato.
O EKF tem uma ideia que que o viabiliza chamada de linearização (FALLIS,
2013). A gaussiana projetada através da função não-linear de próximo estado g é
não gaussiana. O motivo disso é porque a não-linearidade em g distorce a crença
de forma que destrói a a sua forma gaussiana.A linearização aproxima g através
de uma função linear, que é tangente a g na média da gaussiana. Ainda segundo
(FALLIS, 2013), a linearização de g aproxima a propagação da crença de forma
que torna ela equivalente ao do filtro de Kalman. O mesma técnica se aplica a h.
A técnica de linearização utilizada pelo EKF é a expansão de Taylor, essa
técnica constrói uma aproximação linear para g a partir de seus valores e inclinação.
A inclinação é calculada pela derivada parcial:
∂g(ut , xt−1 )
g 0 (ut , xt−1 ) := (1.34)
∂xt−1
Capítulo 1. Filtros Probabilísticos 17
Para gaussiana o estado mais provável é a média do posterior µt−1 , isso quer
dizer que g é aproximado pelo valor de µt−1 (e ut também), dito isto, a extrapolação
linear é determinado por um termo proporcional ao gradiente de g com µt−1 e ut :
∂h(xt )
Sabendo que h0 (xt ) := ∂xt
, tem-se:
1 1
p(zt |xt ) ≈ det(2πQt )− 2 exp{− [zt − h(µ̄t ) − Ht (xt − µ̄t )]T
2
−1
Qt [zt − h(µ̄t ) − Ht (xt − µ̄t )]} (1.38)
1.3 Não-parametrizados
Segundo (FALLIS, 2013), alternativo aos filtros paramétricos (gaussianos),
tem-se os filtros não-paramétricos. Os filtros paramétricos não ficam presos de
forma funcional a uma forma de estado posterior única, como acontece com os
filtros gaussianos.
Os filtros não-paramétricos se utilizam de uma aproximação do estado poste-
rior, através de número finito de valores, cada um correspondendo aproximadamente
a uma região do espaço de estado. O número de parâmetros utilizados para estimar
uma aproximação do próximo estado pode variar e a qualidade da aproximação
depende diretamente desse número de parâmetros utilizados. Quando o número
de parâmetros tende ao infito, a aproximação tende ao próximo estado de forma
exata, porém, quanto maior o número de parâmetros, maior o custo computacional,
felizmente que serão apresentados tem a possibilidade de adaptar se o número
de parâmetros para a complexidade do estado posterior. Dessa forma, quando o
estado posterior tem uma pequena complexidade, utiliza-se um pequeno número de
parâmetros e quando tem uma alta complexidade, o número de parâmetros cresce.
A técnicas que serão apresentadas aqui, histograma e filtro de partículas,
não tem fortes hipóteses paramétricas sobre o estado posterior, porém elas são
adequadas para representar crenças complexas e multimodais. São uma boa escolha
quando tem que se lidar com fases de incertezas globais e quando encontra problemas
com difíceis associação de dados.
Segundo (FALLIS, 2013), técnicas em que se é possível adaptar o número
de parâmetros são chamadas de adaptativas e aquelas que são capazes de adaptar
Capítulo 1. Filtros Probabilísticos 19
O |xk,t | representa o volume da região xk,t e pk,t a probabilidade para cada região
xk,t . O estado médio x̂k,t é calculado por:
Z
x̂k,t = |xk,t |−1 xt dxt (1.41)
xk,t
será utilizado ztk para se referir a uma medição individualmente. Após definir a foram
como as medições são expressas, aproxima-se p(zt |xt , m) através do produtório das
medições individuais.
K
p(ztk |xt , m)
Y
p(zt |xt , m) = (3.2)
k=1
neste ambiente:
m = {m1 , m2 , ..., mN }, (3.3)
Segundo (FALLIS, 2013), o problema SLAM ocorre quando o robô não tem
acesso ao mapa do ambiente em que esta inserido e por sua vez, também não tem
acesso a sua pose. No SLAM, o robô mapeia o ambiente ao ser redor e ao mesmo
tempo se localiza neste ambiente.
Ainda segundo (FALLIS, 2013), da perspectiva probabilística, exitem duas
formas principais do problema SLAM, sendo a primeira delas a online SLAM, que
envolve estimar a pose posterior através das poses momentâneas ao longo do mapa.
Sendo representado pela seguinte forma:
Referências
BAILEY, T.; NIETO, J.; GUIVANT, J.; STEVENS, M.; NEBOT, E. Consistency
of the ekf-slam algorithm. In: 2006 IEEE/RSJ International Conference on
Intelligent Robots and Systems. [S.l.: s.n.], 2006. p. 3562–3568. ISSN 2153-0858.
Citado na página 31.
DIOSI, A.; KLEEMAN, L. Advanced sonar and laser range finder fusion for
simultaneous localization and mapping. In: Intelligent Robots and Systems, 2004.
(IROS 2004). Proceedings. 2004 IEEE/RSJ International Conference on. [S.l.:
s.n.], 2004. v. 2, p. 1854–1859 vol.2. Citado na página 28.
PAZ, L. M.; TARDÓS, J. D.; NEIRA, J. Divide and conquer: Ekf slam in
o(n). IEEE Transactions on Robotics, v. 24, n. 5, p. 1107–1120, Oct 2008. ISSN
1552-3098. Citado na página 31.
Referências 35