Filtro Kalman

UNIVERSIDADE ESTADUAL DE CAMPINAS
FACULDADE DE ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
SISTEMAS ESTOC ÁSTICOS LINEARES
&
FILTRO DE KALMAN
IA-856 I DENTIFICAÇ ÃO E F ILTRAGEM
J O ÃO B OSCO R. DO VAL

WAGNER C ARADORI DO A MARAL
19 de maio de 2004
arquivo filtro Kalman.tex

FILTRO DE KALMAN
SISTEMAS LINEARES ESTOC ÁSTICOS
Considere o sistema com:

Ruı́do aditivo nas variáveis de estado e na equação de observação

xk+1 = Axk + Buk + Fek
y = Cx + Dν
k k k
onde:
– A, B, F,C, D são matrizes de dimensão n × n, n × m, n × `, r × n, r × ` res-

pectivamente,
– {ek } é uma seqüência de vetores de v.a.’s gaussianas de média nula, não

correlacionados e cov(ek ) = E[ek e0k ] = Q = Q0 > 0, ek ∼ N(0, Q);
– {νk } é uma seqüência de vetores de v.a.’s gaussianas de média nula, não

correlacionados e cov(νk ) = E[νk ν0k ] = R = R0 > 0, νk ∼ N(0, R);
– x0 ∼ N(x̄0 , Σ0 );
* O estado inicial x0 , {ek } e {νk } são não correlacionados (→ independentes)

entre si;
* yk forma a sequência de observações do sistema, i.e., não há observação do

vetor de estados {xk }, a não ser indiretamente através de {yk }.
P ROBLEMA DE CONTROLE : Utilizar uma lei de controle por realimentação na

forma
uk = g(yk )
para o estudo do filtro, faremos uk ≡ 0.
2
FILTRO DE KALMAN
Suponha uk ≡ 0, E[x0 ] = x̄0 , cov(x0 ) = P0 . Então P(k) := cov(xk ) satisfaz
P(k + 1) = AP(k)A0 + FQF 0 , P(0) = P0 (1)
e 
CP(k)C0 + DRD0 , se j = 0
cov(yk , yk− j ) = (2)
CA j P(k − j)C0 , se j = 1, . . . , k
e
E[xk ] := x̄k satisfaz x̄k+1 = Ax̄k , x̄0 = E[x0 ] (3)
PROVA : (3) trivial, (1): Definindo x̃k := xk − x̄k , ỹk = yk − ȳk , ȳk = E[yk ] podemos
concluir que
x̃k = Ax̃k−1 + Fek−1 = A j x̃k− j + A j−1 Fek− j + · · · + Fek−1
Como x̃k− j é não correlacionado com ek−1 , . . . , ek− j ,
0 j
E[x̃k x̃k− j ] = A P(k − j)
E[x̃k e0k− j ] = A j−1 FQ
Assim podemos avaliar:
cov(yk yk− j ) = E[ỹk ỹ0k− j ] =

E[(Cx̃k + Dνk )(Cx̃k− j + Dνk− j )0 ] =
CA j P(k − j)C0
como x̃k e ek são não correlacionados
cov(yk ) = E[(Cx̃k + Dνk )(Cx̃k + Dνk )0 ]

= CP(k)C0 + DRD0
3
FILTRO DE KALMAN
e
cov(xk+1 ) = P(k + 1) = E[(Ax̃k + Fek )(Ax̃k + Fek )0
= AP(k)A0 + FQF 0
FILTRO DE KALMAN
Assuma adicionalmente que DD0 > 0. Isso implica que ` ≥ r. Senão, terı́amos
um vetor λ tal que λ0 D = 0, o que leva à
λ0 yk = λ0Cxk
e certas combinações lineares de componentes do vetor de estados xk poderiam

ser medidas precisamente, sem ruı́do.
Notação:
- x̂k| j o melhor estimador linear de xk dada a seqüência de observações y j =
(y0 , . . . , y j );
- x̃k| j = xk − x̂k| j o erro de estimação;
- x̂k|k−1 estimador “um passo a frente”.
Distribuições “um passo a frente”: p(xk+1 |xk , uk ) e p(yk |xk )?
Calculando E[Fek ] = FE[ek ] = 0, cov(Fek ) = E(Fek −0)(Fek −0)0 = FE[ek e0k ]F 0 =
FQF 0 portanto
Fek ∼ N(0, FQF 0 )
e portanto,
p(xk+1 |xk , uk ) ∼ N(Axk + Buk , FQF 0 )
p(yk |xk ) ∼ N(Cxk , DRD0 )
4
FILTRO DE KALMAN
Note que uk não altera a covariância, qualquer que seja {uk }, a condicional
p(xk+1 |xk , uk ) é sempre gaussiana.
Qual é a probabilidade de transição em múltiplos estágios:
p(xk+m |xk , uk , uk+1 , . . . , uk+m−1 )?
Utilizando uma polı́tica em malha aberta:

m−1 m−1
m
xk+m = A xk + ∑A m−1−t
Buk+t + ∑ Am−1−t Fek+t
t=0 t=0
então,
p(xk+m |xk , uk , uk+1 , . . . , uk+m−1 )

m−1
m
≡ N(A xk + ∑ Am−1−t Buk+t , Σk+m|k )
t=0
onde
m−1
∑A

m−1−t
Σk+m|k = cov Fek+t
t=0
m−2
∑A

m−1−t
= cov Fek+t + Fek+m−1
t=0
hm−2
= cov A ∑ A
i
m−2−t
Fek+t + Fek+m−1
t=0
= AΣk+m−1|k A0 + FQF 0 com Σk|k = 0

Quando m = 1
p(xk+1 |xk , uk ) ≡ N(Axk + Buk , FQF 0 )
Observações:
1) Não importa qual seja a lei de controle, uk = g(yk ), a distribuição condicio-

nal de xk+1 é gaussiana.
5
FILTRO DE KALMAN
2) A distribuição não condicional não é gaussiana em geral.

Exemplo: x0 ∼ N(0, 1), w0 ∼ N(0, 1), x1 = x0 + u0 + w0
Suponha que u0 = x02 . Então, x1 = x0 + x02 + w0 e p(x1 ) não é gaussiana.
Porém p(x1 |x0 , u0 ) é gaussiana.
Em resumo, se 
xk+1 = Axk + Fek
y = Cx + Dν
k k k
(sistema sem controle). Média:
x̄k+m = Am x̄k
Covariância:
E[(xk+m − x̄k+m )(xk+m − x̄k+m )0 ] := Σk+m
como
m−1
m
(xk+m − x̄k+m ) = A (xk − x̄k ) + ∑ Am−1−t Fek+t
t=0
então
m−1
m
Σk+m = A Σk A + m0
∑ Am−1−t FQF 0(Am−1−t )0
t=0
Para a variável de saı́da:

ȳk = Cx̄k
y
definindo Σk :=cov((yk − ȳk )(yk − ȳk )0 ), então
y
Σk = CΣkC0 + DRD0
6
FILTRO DE KALMAN
e também:
E[(yk+m − ȳk+m )(yk − ȳk )0 ] := CAm ΣkC0
Caso x0 , ek , νk não sejam gaussianas, as fórmulas de média e covariância ainda

valem.
ESTIMAÇ ÃO DE ESTADO PARA SISTEMAS LINEARES

xk+1 = Ak xk + Fk ek
y = C x + D ν
k k k k k
x0 , w0 , w1 , . . . , ν0 , ν1 , . . . independentes
x0 ∼ N(x̄0 , Σ0 ) ek ∼ N(0, Q) νk ∼ N(0, R)
Sistema Linear Gaussiano variante no tempo k → (Ak , Fk ,Ck , Dk ) seqüências de
matrizes conhecidas.
Já vimos que:
1. p(·|·) é gaussiano. Aqui:
p(xk |yk ) ∼ N(x̂k|k , Σk|k )
onde x̂k|k = média condicional, Σk|k = covariância condicional.
2. Se x e y são dois vetores de v.a.’s gaussianas conjuntas com x ∼ N(x̄, Σ x ),

y ∼ N(ȳ, Σy ) e cov(x, y) = Σxy
x̂ = E[x|y] = x̄ + Σxy Σ−1

y (y − ȳ)
y Σyx
cov(x|y) = Σx − Σxy Σ−1
Prova: exercı́cio do curso de probabilidade.
7
FILTRO DE KALMAN
3. Notação x̃ = x − x̂. Temos que E[x̃] = 0, e então cov(x̃|y) = cov(x|y). Além

disso,
E[x̃(y − ȳ)0 ] = E{[(x − x̄) − Σxy Σ−1 0

y (y − ȳ)](y − ȳ) } =
Σxy − Σxy Σ−1

y Σy = 0
Portanto x̃ e y são não correlatos, portanto independentes (pois gaussianos).
F ILTRO DE K ALMAN
Notação:
x̂k|k = E[xk | yk ] (melhor estimador de xk dada yk )

x̂k+1|k = E[xk+1 | yk ] (estimador de x “um passo”a frente)
x̃k|k = xk − x̂k|k (erro de estimação de xk )
x̃k+1|k = xk+1 − x̂k+1|k (erro de estimação “um passo”a frente)
Σk|k = cov(x̃k|k ) (matriz de covariância do erro de estimação)
Σk+1|k = cov(x̃k+1|k ) (covariância do erro “um passo”a frente)
Passo 1 (atualização temporal):
x̂k+1|k = E[xk+1 | yk ] (média)

= E[Ak xk + Fk ek | yk ] = Ak x̂k|k
Então
x̃k+1|k = xk+1 − x̂k+1|k
= Ak xk + Fk ek − Ak x̂k|k = Ak x̃k|k + Fk ek
e portanto
Σk+1|k = Ak Σk|k A0k + Fk QFk0 (covariância do erro)
8
FILTRO DE KALMAN
Passo 2 (Atualização Temporal da Saı́da):
yk|k−1 = E[yk | yk−1 ]

= E[Ck xk + Dk νk | yk−1 ] = Ck x̂k|k−1
ỹk|k−1 = yk − yk|k−1
= Ck xk + Dk νk −Ck x̂k|k−1 = Ck x̃k|k−1 + Dk νk
e portanto,
y
cov(ỹk|k−1 ) = Σk|k−1 = Ck Σk|k−1Ck0 + Dk RD0k
Passo 3 (correlação cruzada):
E[xk ỹ0k|k−1 ] = E[xk (Ck x̃k|k−1 + Dk νk )0 ]

= E[(x̃k|k−1 + x̂k|k−1 )(Ck x̃k|k−1 + Dk νk )0 ]
= Σk|k−1Ck0 + 0
Passo 4: A informação contida em (yk−1 , yk ) é a mesma que aquela em (yk−1 , ỹk|k−1 ).
x̂k|k = E[xk | yk ] (4)

= E[xk | yk−1 , yk ] = E[xk | yk−1 , ỹk|k−1 ]
−1
y

= x̂k|k−1 + E[xk ỹk|k−1 ] Σk|k−1
0
ỹk|k−1
−1
= x̂k|k−1 + Σk|k−1Ck Ck Σk|k−1Ck + Dk RDk
0 0 0
(yk −Ck x̂k|k−1 )
(Atualização de Medida média)

Segue também de (4) que
−1
y

x̃k|k = x̃k|k−1 − Σk|k−1Ck0 Σk|k−1 ỹk|k−1
então
−1
y

cov(x̃k|k ) = cov(x̃k|k−1 ) − E[xk ỹ0k|k−1 ] Σk|k−1 E[xk ỹ0k|k−1 ]0
9
FILTRO DE KALMAN
o que leva a:
−1
Σk|k = Σk|k−1 − Σk|k−1Ck0 Ck Σk|k−1Ck + Dk RDk
0 0
Ck Σk|k−1
(Atualização de Medida covariância)

Note que as eqs. de atualização de medida permitem expressar:
x̂k+1|k = Ak x̂k|k (5)

= Ak x̂k|k−1 + Ak Lk (yk −Ck x̂k|k−1 ), x̂0|−1 = x̄0
com Lk definido por:
−1
Lk = Σk|k−1Ck0 Ck Σk|k−1Ck + Dk RDk
0 0
(6)
e
Σk+1|k = Ak Σk|k A0k + Fk QFk0 (7)
= Ak Σk|k−1 A0k −
−1
Ak Σk|k−1Ck Ck Σk|k−1Ck + Dk RDk
0 0 0
Ck Σk|k−1 A0k +
+ Fk QFk , com Σ0|−1 = Σ0

Equações (5), (6) e (7) definem o Filtro de Kalman.
Obs1: ỹk|k−1 = yk − Ck x̂k|k−1 é chamado de Processo de Inovação, ỹk|k−1 é inde-

pendente de yk−1 .
Obs2: Se o que deseja é:

x̂k|k Problema de Filtragem
x̂k|k-1 Problema de Predição
x̂k|k+n Problema de Interpolação ou Smoothing
10
FILTRO DE KALMAN
EXEMPLO : Baseado na rotina de demonstração do Matlab kalmdemo.
% Given the following discrete plant

A = [ 1.1269 -0.494 0.1129
1 0 0
0 1 0 ]
B = [ -0.3832
0.5919
0.5191 ]
% Design a Kalman filter to estimate the output y based on the
% noisy measurements yv[n] = C x[n] + v[n]
% A time-varying Kalman filter is able to perform well even
% when the noise covariance is not stationary. However for this
% demonstration, we will use stationary covariance, matrices Q and R.
% The time varying Kalman filter has the following update equations
%
% Time update: x[n+1|n] = Ax[n|n] + Bu[n]
%
% P[n+1|n] = AP[n|n]A’ + B*Q*B’
%
%
% Measurement update:
% x[n|n] = x[n|n-1] + M[n](yv[n] - Cx[n|n-1])
% -1
% M[n] = P[n|n-1] C’ (CP[n|n-1]C’+R)
%
% P[n|n] = (I-M[n]C) P[n|n-1]% function KALMAN.
% This function determines the optimal
% steady-state filter gain M based on the process noise
% covariance Q and the sensor noise covariance R.
% First specify the plant + noise model.
% CAUTION: set the sample time to -1 to mark plant
% as discrete
11
FILTRO DE KALMAN
sys = ss(A,B,C,D,-1);
% Enter the process noise covariance:

Q = 1;
% Enter the sensor noise covariance:
R = 2;
% Generate a sinusoidal input vector (known)

t = [0:100]’;
u = sin(t/5);
% Generate process noise and sensor noise vectors
randn(’seed’,0)
w = sqrt(Q)*randn(length(t),1);
v = sqrt(R)*randn(length(t),1);
% Now simulate the response using LSIM

% Generate the noisy plant response
y = lsim(sys,u+w); % w = process noise
yv = y + v; % v = meas. noise
% Now implement the filter recursions in a FOR loop:

P=B*Q*B’; % Initial error covariance
x=zeros(3,1); % Initial condition on the state
ye = zeros(length(t),1);
ycov = zeros(length(t),1);
for i=1:length(t)
% Measurement update
Mn = P*C’/(C*P*C’+R);
x = x + Mn*(yv(i)-C*x); % x[n|n]
P = (eye(3)-Mn*C)*P;
ye(i) = C*x;
errcov(i) = C*P*C’;
12
FILTRO DE KALMAN
% Time update
x = A*x + B*u(i); % x[n+1|n]
P = A*P*A’ + B*Q*B’;
end
% Let’s see how this filter works by generating some data and
% comparing the filtered response with the true plant response.
PSfrag replacements
ek νk
”
eal
“id
uk + + yk
yk
+
Planta
+
x̂k
Filtro
13
FILTRO DE KALMAN
% Compare true response with filtered response

figure, plot(t,y,’b’,t,ye,’r--’,t,yv,’k.’),
xlabel(’No. of samples’), ylabel(’Output’)
legend(’y real’,’y estimado’,’y observado’)
title(’Response with time-varying Kalman filter’)
Response with time−varying Kalman filter

6
y real
y estimado
y observado
2
Output
−2
−4
−6
0 10 20 30 40 50 60 70 80 90 100
No. of samples
14
FILTRO DE KALMAN
figure, plot(t,y-yv,’g’,t,y-ye,’r--’),
legend(’erro de y = ruido v’,’erro de estimacao de y’)
xlabel(’No. of samples’), ylabel(’Error’)
5
erro de y = ruido v
erro de estimacao de y
4
1
Error
−1
−2
−3
−4
0 10 20 30 40 50 60 70 80 90 100
No. of samples
15
FILTRO DE KALMAN
% The time varying filter also estimates the output covariance

% during the estimation. Let’s plot it to see if our filter reached
% steady state (as we would expect with stationary input noise).
figure
plot(t,errcov), ylabel(’Error Covar’),
0.6
0.55
0.5
0.45
0.4
Error Covar
0.35
0.3
0.25
0.2
0.15
0.1
0 10 20 30 40 50 60 70 80 90 100
% From the covariance plot we see that the output covariance did
% indeed reach a steady state in about 5 samples. From then on,
% our time varying filter has the same performance as the steady
% state version.
% Compare covariance errors
MeasErr = y-yv;
MeasErrCov = sum(MeasErr.*MeasErr)/length(MeasErr);
EstErr = y-ye;
EstErrCov = sum(EstErr.*EstErr)/length(EstErr);
% Covariance of error before filtering (measurement error)

MeasErrCov
>> MeasErrCov = 2.2277
% Covariance of error after filtering (estimation error)
EstErrCov
>> EstErrCov = 0.3394
16

Filtro Kalman

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Filtro Kalman

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE ESTADUAL DE CAMPINAS

FACULDADE DE ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO

SISTEMAS ESTOC ÁSTICOS LINEARES

IA-856 I DENTIFICAÇ ÃO E F ILTRAGEM

J O ÃO B OSCO R. DO VAL

arquivo filtro Kalman.tex

SISTEMAS LINEARES ESTOC ÁSTICOS

Considere o sistema com:

– A, B, F,C, D são matrizes de dimensão n × n, n × m, n × `, r × n, r × ` res-

– {ek } é uma seqüência de vetores de v.a.’s gaussianas de média nula, não

– {νk } é uma seqüência de vetores de v.a.’s gaussianas de média nula, não

* O estado inicial x0 , {ek } e {νk } são não correlacionados (→ independentes)

* yk forma a sequência de observações do sistema, i.e., não há observação do

P ROBLEMA DE CONTROLE : Utilizar uma lei de controle por realimentação na

para o estudo do filtro, faremos uk ≡ 0.

Suponha uk ≡ 0, E[x0 ] = x̄0 , cov(x0 ) = P0 . Então P(k) := cov(xk ) satisfaz

P(k + 1) = AP(k)A0 + FQF 0 , P(0) = P0 (1)

x̃k = Ax̃k−1 + Fek−1 = A j x̃k− j + A j−1 Fek− j + · · · + Fek−1

Como x̃k− j é não correlacionado com ek−1 , . . . , ek− j ,

E[x̃k e0k− j ] = A j−1 FQ

Assim podemos avaliar:

cov(yk yk− j ) = E[ỹk ỹ0k− j ] =

como x̃k e ek são não correlacionados

cov(yk ) = E[(Cx̃k + Dνk )(Cx̃k + Dνk )0 ]

e certas combinações lineares de componentes do vetor de estados xk poderiam

p(xk+m |xk , uk , uk+1 , . . . , uk+m−1 )?

Utilizando uma polı́tica em malha aberta:

p(xk+m |xk , uk , uk+1 , . . . , uk+m−1 )

= AΣk+m−1|k A0 + FQF 0 com Σk|k = 0

1) Não importa qual seja a lei de controle, uk = g(yk ), a distribuição condicio-

2) A distribuição não condicional não é gaussiana em geral.

(sistema sem controle). Média:

Para a variável de saı́da:

Caso x0 , ek , νk não sejam gaussianas, as fórmulas de média e covariância ainda

ESTIMAÇ ÃO DE ESTADO PARA SISTEMAS LINEARES

1. p(·|·) é gaussiano. Aqui:

p(xk |yk ) ∼ N(x̂k|k , Σk|k )

onde x̂k|k = média condicional, Σk|k = covariância condicional.

2. Se x e y são dois vetores de v.a.’s gaussianas conjuntas com x ∼ N(x̄, Σ x ),

x̂ = E[x|y] = x̄ + Σxy Σ−1

Prova: exercı́cio do curso de probabilidade.

3. Notação x̃ = x − x̂. Temos que E[x̃] = 0, e então cov(x̃|y) = cov(x|y). Além

E[x̃(y − ȳ)0 ] = E{[(x − x̄) − Σxy Σ−1 0

Σxy − Σxy Σ−1

Portanto x̃ e y são não correlatos, portanto independentes (pois gaussianos).

x̂k|k = E[xk | yk ] (melhor estimador de xk dada yk )

Passo 1 (atualização temporal):

x̂k+1|k = E[xk+1 | yk ] (média)

Passo 2 (Atualização Temporal da Saı́da):

yk|k−1 = E[yk | yk−1 ]

Passo 3 (correlação cruzada):

E[xk ỹ0k|k−1 ] = E[xk (Ck x̃k|k−1 + Dk νk )0 ]

Passo 4: A informação contida em (yk−1 , yk ) é a mesma que aquela em (yk−1 , ỹk|k−1 ).

x̂k|k = E[xk | yk ] (4)

(Atualização de Medida média)

(Atualização de Medida covariância)

x̂k+1|k = Ak x̂k|k (5)

+ Fk QFk , com Σ0|−1 = Σ0

Obs1: ỹk|k−1 = yk − Ck x̂k|k−1 é chamado de Processo de Inovação, ỹk|k−1 é inde-

Obs2: Se o que deseja é:

EXEMPLO : Baseado na rotina de demonstração do Matlab kalmdemo.

% Given the following discrete plant

% Enter the process noise covariance: