Você está na página 1de 10

CMC-301-3 – Funções da Física Matemática – Aula 04

Aula 04: Desenvolvimento em Série de Funções Arbitrárias em Funções Ortogonais:


Equações Diferenciais Própria-Adjuntas. Problema de Sturm-Liouville.

Desenvolvimento em Série de Funções Arbitrárias em Funções


Ortogonais
Assim como no caso dos vetores é possível expressar uma função mais ou menos
“arbitrária” como uma combinação linear de membros de uma coleção particular infinita de

funções. Assim, é possível aproximar f ( x ) por ∑c ϕ i i , onde ϕ i são funções ortogonais
i =1
definidas no intervalo a ≤ x ≤ b . Considerando que a expansão existe, o problema é
encontrar os coeficientes ci . Multiplicando ambos os lados por ϕ k ( x ) e integrando, tem-se

f ( x )ϕ k ≅ c1ϕ1ϕ k + c 2ϕ 2ϕ k +  + c k ϕ k ϕ k + 

b b b b

∫ f (x )ϕ
a
k dx ≅ ∫ c1ϕ1ϕ k dx + ∫ c 2ϕ 2ϕ k dx +  + ∫ c k ϕ k ϕ k dx + 
a a a

Pela definição de produto interno e da teoria das funções ortogonais, tem-se

f ( x ), ϕ k = c k ϕ k , ϕ k .

A norma é definida como

ϕ k = ϕ k ,ϕ k
1/ 2
.

Assim,

f ( x ), ϕ k .
1
ck =
ϕk
2

Todo sistema ortogonal para o qual cada ϕ k ≠ 0 (8a Proposição) pode ser
convertido num sistema ortonormal dividindo cada ϕ k pela sua norma. Sendo assim tem-se
ϕk = 1 e

c k = f ( x ), ϕ k .

Como veremos posteriormente, quando estudarmos séries de Fourier, a dedução


das fórmulas de Euler para os coeficientes da série de Fourier, utiliza o fato de que o
conjunto empregado para a expansão (aproximação) é ortogonal sobre um intervalo de

24
CMC-301-3 – Funções da Física Matemática – Aula 04
comprimento 2π . As funções: 1, cosx, senx, cos 2 x, sen 2 x,  , que ocorrem nas séries de
Fourier, formam um conjunto ortogonal sobre o intervalo − π ≤ x ≤ π . O conjunto
( )( )
ortonormal correspondente é 1 / π 1 / 2 , cosx, senx, cos2 x, sen 2 x,  . Essas funções
formam um conjunto particular de funções ortogonais, no primeiro caso, e ortonormais, no
segundo caso, que, quando utilizadas nas fórmulas dos coeficientes c k , geram os
coeficientes de Fourier. Portanto, a série de Fourier e os coeficientes de Fourier são casos
∞ ∞
particulares da série ∑ ciϕ i com os coeficientes ck dados acima. Assim, a série
i =1
∑c ϕ
i =1
i i é

chamada de série de Fourier generalizada, ou simplesmente série de Fourier, de f em


relação ao sistema ortogonal (ortonormal) de funções dado; e os números c k são
chamados de coeficientes (ou constantes) de Fourier de f em relação ao sistema ortogonal
(ortonormal) de funções dado.
Se o conjunto de funções é ortonormal, as constantes de Fourier satisfazem à

desigualdade de Bessel f , f ≥ ∑ ci2 . Assim, a série do segundo membro converge e,
i =1

portanto, ci → 0 quando i → ∞ .

Equações Diferenciais Própria-Adjuntas


Considere um sistema de duas equações diferenciais lineares homogêneas de
primeira ordem2

φ1′ = a11 ( x )φ1 + a12 ( x )φ 2 (1.a)


φ 2′ = a 21 ( x )φ1 + a 22 ( x )φ 2 , (1.b)

onde aik ( x ) são funções da variável real x. A matriz de coeficientes de (1) é dada por

a a12 
A( x ) =  11 .
 a 21 a 22 

Um sistema de equações diferenciais lineares homogêneas de primeira ordem é


chamado adjunto para (1) se sua matriz de coeficientes B é a negativa da transposta de A,
ou seja,

B = − AT .

Uma vez que

2
Todas as definições que são dadas aqui para um sistema de duas equações diferenciais lineares e
homogêneas de primeira ordem podem ser imediatamente generalizadas para sistemas de n equações
diferenciais lineares e homogêneas de primeira ordem.

25
CMC-301-3 – Funções da Física Matemática – Aula 04
a a 21 
AT =  11 ,
 a12 a 22 

o sistema

ψ 1′ = −a11 ( x )ψ 1 − a 21 ( x )ψ 2 (2.a)
ψ 2′ = −a12 ( x )ψ 1 − a 22 ( x )ψ 2 (2.b)

é, de acordo com a definição, adjunto para (1). Da mesma forma, (1) é adjunto para (2).
A denominação “adjunto” deriva do seguinte fato: Se φ1(1) ( x ) , φ 2(1) ( x ) e φ1(2 ) ( x ) ,
φ 2(2 ) ( x ) são duas soluções linearmente independentes de (1), isto é, se

φ1(1) φ1(2 )
[ ]
∆ φ (1) , φ (2 ) =
φ 2(1) φ 2(2 )
≠ 0,

então ψ 1(1) ( x ) =
φ 2 , ψ 2(1) ( x ) = − φ 2(1) e ψ 1(2 ) ( x ) = − φ1(2 ) , ψ 2(2 ) ( x ) = φ1(1) são duas
1 (2 ) 1 1 1
∆ ∆ ∆ ∆
soluções linearmente independentes de (2). Assim, a matriz das soluções (ou matriz
solução) de (2),

ψ (1) ψ 1(2 ) 
Ψ ( x ) =  1(1) 
(2 )  ,
ψ
 2 ψ 2 

parece ser a transposta da inversa (ou adjunta) da matriz solução de (1),

 φ (1) φ (2 ) 
Φ( x ) =  1(1) 1(2 )  ,
φ 2 φ 2 

isto é, Ψ ( x ) = (Φ −1 ( x )) .
T

Uma equação diferencial de segunda ordem pode ser reduzida para um sistema de
duas equações diferenciais de primeira ordem. Em particular, uma equação diferencial
linear e homogênea de segunda ordem pode ser reduzida para um sistema de duas equações
diferenciais lineares e homogêneas de primeira ordem. Considerando

y ′′ + a1 ( x ) y ′ + a 2 ( x ) y = 0 , (3)

onde os ai ( x ) são funções da variável real x, e fazendo y = y1 e y ′ = y 2 , então

y1′ = y 2 (4.a)
y ′2 = −a 2 ( x ) y1 − a1 ( x ) y 2 , (4.b)

26
CMC-301-3 – Funções da Física Matemática – Aula 04
com a matriz de coeficientes

 0 1 
A( x ) =   .
 − a 2 ( x ) − a1 ( x )

Dado que,

 0 − a 2 ( x )
A( x ) =   ,
T

 1 − a 1 ( x ) 

o sistema que é adjunto para (4) é

z1′ = a 2 z 2 (5.a)
z ′2 = − z1 + a1 z 2 . (5.b)

Derivando (5.b), substituindo z1′ por a 2 z 2 , de acordo com (5.a), e escrevendo z ao


invés de z 2 , tem-se


z ′′ − [a1 ( x )z ] + a 2 z = 0 . (6)

Denominam-se (3) e (6) de equações diferenciais adjuntas porque seus sistemas


correspondentes de equações diferenciais de primeira ordem são adjuntos de acordo com a
definição adotada.
No caso do coeficiente de y ′′ em (3) não ser 1, mas sim uma função a 0 ( x ) ≡/ 0 ,

a 0 ( x ) y ′′ + a1 ( x ) y ′ + a 2 ( x ) y = 0 , (7)

em analogia a (6), denomina-se

[a0 z ]″ − [a1 z ]′ + a 2 z = 0 (8)

de equação diferencial adjunta para (7).


Nota-se que a definição prévia é um caso especial desta definição mais geral para
a0 ≡ constante. Entretanto, se a0 é alguma função de x, então a equação diferencial adjunta
como definida em (8) difere daquela que é obtida de (6) após divisão por a 0 ( x ) .
Os operadores

d2
L[(⋅)] = a 0 ( x ) 2
(⋅) + a1 (x ) d (⋅) + a2 (x )(⋅) (9)
d x dx
e

27
CMC-301-3 – Funções da Física Matemática – Aula 04
d2
M [(⋅)] = 2
[a0 (x )(⋅)] − d [a1 (x )(⋅)] + a2 (x )(⋅) , (10)
d x dx

onde o ponto (⋅) denota o lugar onde deve ser colocada a função sobre a qual se aplica o
operador, são chamados de operadores diferenciais adjuntos.

Teorema 1: (identidade de Lagrange)3. Se L e M são operadores diferenciais adjuntos de


segunda ordem ⇒ ∃Q = Q( x, y, y ′, z , z ′) , tal que

zL[ y ] − yM [z ] = Q( x, y, y ′, z , z ′) .
d
dx

″ ′
Prova: zL[ y ] − yM [z ] = a0 y ′′z + a1 y ′z + a 2 yz − y (a0 z ) + y (a1 z ) − a 2 yz

a 0 y ′z − y (a 0 z ) + y (a1 z ) .
d 
= (c.q.d.)
dx  

Corolário: Se L e M são operadores diferenciais adjuntos de segunda ordem, então

x2

x2

∫ (zL[y ] − yM [z ])dx = a0 y ′z − y(a0 z ) + ya1 z 


x1
  x1
.

Tentando resolver certos problemas da física matemática (corda vibrante,


membrana vibrante, certos problemas de condução do calor) pode–se chegar, via método de
separação de variáveis, nas seguintes equações diferenciais de primeira ordem:

y ′′ + λy = 0 , (11)
( )
x 2 y ′′ + xy ′ + λx 2 − µ 2 y = 0 , (equação de Bessel) (12)
x 2 y ′′ + 2 xy ′ + λy = 0 , (equação de Euler-Cauchy) (13)
(1 − x )y ′′ − 2 xy ′ + λy = 0 ,
2
(equação de Legendre) (14)

onde y é a variável dependente, x a variável independente e λ , µ ∈ R .


Observe que as equações (11) a (14) podem ser escritas na forma

L[ y ] = [ p(x ) y ′] + q(x ) y = 0 ,
d
(15)
dx

com p(x ) = 1 , q( x ) = λ , no caso da equação (11); p( x ) = x , q( x ) = (λx 2 − µ 2 ) / x , no caso


da equação (12), após divisão por x; p( x ) = x 2 , q( x ) = λ , no caso da equação (13) e,
finalmente, p( x ) = 1 − x 2 , q( x ) = λ , no caso da equação (14).

3
O seguinte teorema e seu corolário são verdadeiros para operadores adjuntos de qualquer ordem.

28
CMC-301-3 – Funções da Física Matemática – Aula 04
O fato de todas essas equações poderem ser escritas na forma (15) é bastante
significativo e reside no seguinte teorema:

Teorema 2: Um operador diferencial de segunda ordem, L, é adjunto para si próprio, ou


própio-adjunto, se, e somente se, ele tem a forma

d  d 
L[(⋅)] =  p ( x ) (⋅) + q( x )(⋅) = 0 ,
dx  dx 

onde p( x ) é diferenciável.
A expressão L[ y ] é chamada uma expressão diferencial própria-adjunta de
segunda ordem e L[ y ] = 0 é chamada uma equação diferencial própria-
adjunta de segunda ordem4.

Prova: Se expandirmos L, obtém-se

d2
L[(⋅)] = p ′( x ) (⋅) + p(x ) 2 (⋅) + q(x )(⋅) = 0
d
dx d x

O operador adjunto M é, de acordo com (10),

d2 d2
M [(⋅)] = [ ( )( )] [ ( )( )] ( )( ) ( ) (⋅) + p ′(x ) d (⋅) + q(x )(⋅) ,
d
2
p x ⋅ − p ′ x ⋅ + q x ⋅ = p x 2
d x dx d x dx

isto é, L = M .
Por outro lado, se

d2
L[(⋅)] = a 0 ( x ) 2
(⋅) + a1 (x ) d (⋅) + a2 (x )(⋅) (9)
d x dx
e
d2
M [(⋅)] = 2
[a0 (x )(⋅)] − d [a1 (x )(⋅)] + a2 (x )(⋅) (10)
d x dx

são iguais, então segue depois da realização de todas as derivadas indicadas que

a0′ = a1 = p ′( x ) . (c.q.d.)

De acordo com o teorema 1, a identidade de Lagrange para expressões


diferenciais própria-adjuntas toma a forma

4
Operadores próprio-adjuntos podem ser definidos para todos os operadores de ordem par pelo adjunto L=L.
Operadores diferenciais de ordem ímpar, entretanto, são chamados próprio-adjuntos se o adjunto L=-L, por
razões óbvias.

29
CMC-301-3 – Funções da Física Matemática – Aula 04

zL[ y ] − yL[z ] = [ p(x )( y ′z − yz ′)] .


d
(16)
dx

Problema de Sturm-Liouville
Vários conjuntos ortogonais importantes surgem como soluções de equações
diferenciais de segunda ordem do tipo que se obtém trocando q( x ) em (15) por
q( x ) + λp( x ) :

d
[r (x ) y ′] + [q(x ) + λp(x )]y = 0 , (17)
dx

sobre certo intervalo a ≤ x ≤ b , satisfazendo às seguintes condições de contorno

(a ) k1 y + k 2 y ′ = 0 em x = a ; (b ) l1 y + l 2 y ′ = 0 em x = b , (18)

aqui λ é um parâmetro real e k1 , k 2 , l1 , l 2 são constantes reais dadas, no mínimo uma delas,
em cada condição (18), sendo diferente de zero.
O problema dado na Equação (17) sob as condições de contorno (18) é conhecido
como, um problema de valor de contorno próprio-adjunto, ou um problema de Sturm-
Liouville, em homenagem aos dois matemáticos que investigaram esse problema com
grande sucesso5. Veremos que as equações de Legendre, Bessel, e outras igualmente
importantes podem ser escritas sob a forma (17).
Naturalmente, este problema possui a solução trivial y = 0 para qualquer valor do
parâmetro λ . As soluções y ≠ 0 são chamadas funções características (ou funções
próprias ou, ainda, autofunções) do problema, e os valores de λ para os quais tais soluções
existem, são chamados valores característicos (ou valores próprios ou, ainda, autovalores)
do problema.

Exemplo: Determinar os valores e as funções características do seguinte problema de


Sturm-Liouville

y ′′ + λy = 0 , y (0 ) = 0 , y (π ) = 0 .

Da teoria das equações diferenciais ordinárias tem-se que a equação característica é


α 2 + λ = 0 . Se λ = −υ 2 (ou seja, λ < 0 ) a solução geral da equação é
y ( x ) = c1eυx + c 2 e −υx . De y (0 ) = 0 , tem-se c1 + c 2 = 0 e de y (π ) = 0 , tem-se
c1eυπ + c 2 e −υπ = 0 . Tem-se, portanto, o seguinte sistema linear

5
Jacques Charles François Sturm (1803-1855), matemático suíço, Joseph Liouville (1809-1882), matemático
francês, conhecido por seu importante trabalho de pesquisa na análise complexa.

30
CMC-301-3 – Funções da Física Matemática – Aula 04
 1 1   c1  0
= .
eυπ
 e −υπ  c 2  0

O determinante da matriz é e −υπ − eυπ ≠ 0 . Então o sistema tem apenas a solução trivial
c1 = c 2 = 0 e y = 0 . Esta não é uma função característica. Para λ = 0 a situação é
semelhante. Para λ = υ 2 > 0 a solução geral é y ( x ) = Acosυx + Bsenυx . Das condições de
contorno obtém-se y (0 ) = A = 0 e então, y (π ) = Bsenυπ = 0 para υ = 0, ± 1, ± 2,  . Para
υ = 0 tem-se y ≡ 0 . Para λ = υ 2 = 1, 4, 9, 16 , tomando B = 1 , obtém-se y ( x ) = senυx ,
υ = 1, 2, . Estas são as funções características do problema. Os valores característicos são
λ = υ 2 = 1, 4, 9, 16 onde υ = 1, 2, .
Pode-se demonstrar que para as condições bem gerais impostas sobre as funções
p, q e r em (17), o problema de Sturm-Liouville possui um número infinito de valores
característicos; a teoria, um tanto complicada, foge do escopo da disciplina.
Além disso, as funções características são ortogonais, como é demonstrado a
seguir.

1o Teorema: Sejam r ( x ) , q( x ) e p( x ) reais e contínuas no intervalo a ≤ x ≤ b na equação


de Sturm-Liouville (17). Sejam y m ( x ) e y n (x ) funções características do
problema de Sturm-Liouville (17) e (18), correspondentes aos valores
característicos λm e λn , respectivamente. Sejam as derivadas y ′m ( x ) e y n′ (x )
continuas no intervalo. Então, y m e y n são ortogonais no intervalo em relação
a função peso p( x ) .
Se r (a ) = 0 , (18a) pode ser omitida do problema. Se r (b ) = 0 , então (18b)
pode ser omitida. Se r (a ) = r (b ) , (18) pode ser substituída por

y (a ) = y (b ) ; y ′(a ) = y ′(b ) . (19)

Demonstração: ym satisfaz à:
d
[r (x ) y m′ ] + [q(x ) + λm p(x )]y m = 0 , e yn à:
dx
d
[r (x ) y n′ ] + [q(x ) + λn p(x )]y n = 0 . Multiplicando a primeira equação por y n e a segunda
dx
por − y m e somando, obtém-se

d
[r (x ) y m′ ]y n − d [r (x ) y n′ ]y m + q(x ) y m y n − q(x ) y m y n + (λm − λn ) p(x ) y m y n = 0 ,
dx
 dx

d
[r ( x ) y′n ym − r ( x ) ym′ yn ]
dx
ou
(λm − λn ) p(x ) y m y n =
d
[r (x ) y n′ y m − r (x ) y ′m y n ]. Integrando sobre x de a até b,
dx
tem-se

31
CMC-301-3 – Funções da Física Matemática – Aula 04
b
(λm − λn )∫ py m y n dx = [r ( y n′ y m − y m′ y n )]ba . (20)
a

A expressão no segundo membro de (20) vale

r (b )[ y n′ (b ) y m (b ) − y m′ (b ) y n (b )] − r (a )[ y n′ (a ) y m (a ) − y m′ (a ) y n (a )] . (21)

1o Caso: Se r (a ) = 0 e r (b ) = 0 , então a expressão (21) é nula. Assim, o primeiro membro


de (20) deve ser nulo e como λm e λn são distintos, obtemos a ortogonalidade desejada

∫ p(x )y (x )y (x )dx = 0 ;
a
m n m≠ n, (22)

sem o emprego das condições de contorno (18).

2o Caso: Se r (b ) = 0 e r (a ) ≠ 0 , então a primeira parcela de (21) é nula. De (18a) obtém-se

k1 y n (a ) + k 2 y n′ (a ) = 0 , k1 y m (a ) + k 2 y m′ (a ) = 0 .

Seja k 2 ≠ 0 . Então, multiplicando a primeira equação por y m (a ) e a segunda por − y n (a ) e


somando, obtém-se

k 2 [ y ′n (a ) y m (a ) − y ′m (a ) y n (a )] = 0 .

Como k 2 ≠ 0 a expressão entre colchetes deve ser nula. Esta expressão é idêntica à
segunda parcela de (21). Assim (21) é igual a zero e de (20) obtém-se (22). Se k 2 = 0
então, por hipótese, k1 ≠ 0 , e o desenvolvimento da demonstração é semelhante.

3o Caso: Se r (a ) = 0 e r (b ) ≠ 0 , a demonstração é semelhante ao 2o caso, mas em lugar de


(18a) devemos empregar (18b).

4o Caso: Se r (a ) ≠ 0 e r (b ) ≠ 0 , temos empregar ambas as condições de contorno (18) e


proceder como nos 2o e 3o casos.

5o Caso: Se r (a ) = r (b ) . Então (21) passa a ter a forma

r (b )[ y n′ (b ) y m (b ) − y m′ (b ) y n (b ) − y n′ (a ) y m (a ) + y m′ (a ) y n (a )] ,

e de (19) segue-se que a expressão entre colchetes é nula. Desta forma, (20) implica (22),
como anteriormente. Assim fica completa a demonstração do 1o Teorema.

32
CMC-301-3 – Funções da Física Matemática – Aula 04
2o Teorema: Se o problema de Sturm-Liouville (17) e (18) satisfaz à condição enunciada no
1o Teorema e p( x ) > 0 em todo o intervalo a ≤ x ≤ b (ou p( x ) < 0 em todo o
intervalo a ≤ x ≤ b ), então todos os valores característicos do problema são
reais.

Demonstração: Sejam λ = α + iβ um valor característico do problema e


− y ( x ) = u ( x ) + iv( x ) uma função característica correspondente; α , β , u , v ∈ R . Substituindo
em (17) obtém-se
d
[ru ′ + irv′] + (q + αp + iβp )(u + iv ) = 0 .
dx

Essa equação complexa é equivalente ao seguinte par de equações para as partes real e
imaginária:
d
[ru ′] + (q + αp )u − βpv = 0 ,
dx
d
[rv ′] + (q + αp )v + βpu = 0 .
dx

Multiplicando a primeira equação por v e a segunda por − u e somando, obtém-se

( )
− β u2 + v2 p = u
d
dx
[rv′] − v d [ru ′]
dx
=
d
[rv ′u − ru ′v].
dx

Integrando sobre x de a até b, encontramos

− β ∫ (u 2 + v 2 ) pdx = [r (uv ′ − u ′v )]a .


b
b

Das condições de contorno decorre que a expressão à direita é zero: podemos demonstrá-lo
de maneira análoga ao 1o Teorema. Como y é uma função característica, u 2 + v 2 ≡/ 0 .
Como y e p são contínuas e p > 0 (ou p < 0 ) para todo x entre a e b, a integral no primeiro
membro não é nula. Assim, β = 0 , o que significa que λ = α é real. Desta forma, a
demonstração fica completa.

Exemplo: Considere y m satisfazendo à: y m′′ + λm y m = 0 , e y n à: y n′′ + λn y n = 0 .


Multiplicando a primeira equação por y n e a segunda por − y m e somando,

obtém-se (λ m − λ n ) y m y n = [ y n′ y m − y m′ y n ] . Integrando sobre x de 0 até π ,


d
dx
b
tem-se (λm − λn )∫ y m y n dx = [ y n′ y m − y ′m y n ]0 = 0 , y ′(0 ) = y ′(π ) = 0 , y m ⊥ y n .
π

33

Você também pode gostar