Você está na página 1de 186

Introdução às Equações Diferenciais Parciais

Prof. Luiz Augusto F. de Oliveira

15 de junho de 2021
2
Sumário

1 Equações Diferenciais Parciais de Primeira Ordem 5


1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Equações Lineares - O Caso Bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Equações Quase-Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Equações Quase-Lineares - O Caso n-Dimensional . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5 A Equação Não-Linear f (x1 , ..., xn , u, ux1 , ..., uxn ) = 0 . . . . . . . . . . . . . . . . . . . . . . 17
1.6 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.6.1 Movimento Unidirecional de Ondas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.6.2 Equações de Segunda Ordem Redutíveis . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.3 A Equação das Ondas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7 A Formula de d'Alembert Revisitada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.8 Exemplos Resolvidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2 Formas Canônicas de Equações de Segunda Ordem 37


2.1 Redução à Forma Canônica de Equações Diferenciais Parciais
de Segunda Ordem em Duas Variáveis Independentes . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Exemplos Resolvidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.3 Observação Final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 Séries de Fourier 51
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 A Origem das Séries de Fourier - Uma Explicação . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3 Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4 A Propriedade de Mínimo da Série de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.5 Convergência Puntual da Série de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.6 Séries de Fourier versus Derivação e Integração Termo a Termo . . . . . . . . . . . . . . . . . 73
3.7 A Forma Complexa da Série de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

4 O Método de Separação de Variáveis - Conjuntos Ortogonais 83


4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2 O Método de Separação de Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.3 O Problema de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.3.1 O Problema de Dirichlet num Retângulo . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.3.2 O Problema de Dirichlet em Coordenadas Polares . . . . . . . . . . . . . . . . . . . . . 91
4.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

5 Conjuntos Ortogonais - Completude 97


5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.2 Espaços com Produto Interno e Conjuntos Ortogonais . . . . . . . . . . . . . . . . . . . . . . 97
5.3 Polinômios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.4 Outros Conjuntos Ortonormais de Polinômios . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

3
6 Espaços L2 - Conjuntos Ortonormais Completos 115
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.2 Espaços L2 [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.3 Outros Tipos de Espaços L2 [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.4 O Teorema de Weierstrass . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

7 O Problema de Sturm-Liouville 123


7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.2 O Problema de Sturm-Liouville Regular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.3 O Problema de Sturm-Liouville Singular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

8 Funções de Bessel 135


8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.2 A Equação de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
8.3 Soluções da Equação de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
8.4 Propriedades das Funções de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
8.5 Comportamento Assintótico e Zeros das Funções de Bessel . . . . . . . . . . . . . . . . . . . . 143
8.6 Conjuntos Ortonormais de Funções de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

9 Transformação de Fourier 153


9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
9.2 O Produto de Convolução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
9.3 A Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
9.4 O Teorema de Inversão de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
9.5 A Transformada de Fourier em L2 (R) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
9.6 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
9.6.1 A equação unidimensional do calor - barra innita . . . . . . . . . . . . . . . . . . . . 172
9.6.2 A equação unidimensional do calor - barra semi-innita . . . . . . . . . . . . . . . . . 175
9.6.3 A Equação de Laplace num semi-espaço . . . . . . . . . . . . . . . . . . . . . . . . . . 177

4
Capítulo 1

Equações Diferenciais Parciais de Primeira


Ordem

1.1 Introdução

De modo informal, uma equação diferencial parcial de primeira ordem é uma relação da forma
F (x1 , x2 , ..., xn , u, ux1 , ux2 , ..., uxn ) = 0

envolvendo uma função desconhecida u de n variáveis x1 , ..., xn e suas derivadas parciais de primeira ordem.
Nosso objetivo é determinar uma função u que admite derivadas parciais de primeira ordem numa região D
do espaço Rn tal que

F (x1 , x2 , ..., xn , u(x1 , x2 , ..., xn ), ux1 (x1 , x2 , ..., xn ), ..., uxn (x1 , x2 , ..., xn )) = 0

para todo (x1 , x2 , ..., xn ) ∈ D. Quando u satisfaz esse requisito, dizemos que u é uma solução da equação
diferencial em D. Quando n = 1, a equação dada assume a forma F (x, u, u0 ) = 0 e representa uma equação
diferencial ordinária de primeira ordem, que você já estudou anteriormente.

Para ganharmos alguma familiaridade na compreensão desse vasto e riquíssimo mundo constituído pe-
las equações diferenciais parciais, vamos primeiro nos concentrar em um particular tipo delas, a saber, as
equações diferenciais parciais de primeira ordem quase-lineares, que têm a forma
n
X
aj (x1 , x2 , ..., xn , u)uxj + b(x1 , x2 , ..., xn , u) = 0.
j=1

Como veremos, esse tipo de equação admite um tratamento totalmente geométrico e servirá de guia para
avançarmos na compreensão de equações mais gerais.

1.2 Equações Lineares - O Caso Bidimensional

Vamos primeiro considerar equações diferenciais lineares nas quais a função incógnita é uma função de duas
variáveis reais.

Denição 1.2.1. Suponha que a, b, c e h sejam funções denidas num subconjunto aberto D do plano R2 .
Uma função u:D→R é uma solução da equação diferencial parcial linear de primeira ordem
a(x, y)ux + b(x, y)uy + c(x, y)u = h(x, y) (1.2.1)

se as derivadas parciais ux e uy existem em todos os pontos de D e, para cada (x, y) ∈ D, temos

a(x, y)ux (x, y) + b(x, y)uy (x, y) + c(x, y)u(x, y) = h(x, y).

5
A relação (1.2.1) é chamada uma equação diferencial parcial linear. Adicionamos ainda o adjetivo de
primeira ordem pois em (1.2.1) comparecem apenas derivadas parciais de primeira ordem da função incógnita
u. Quando h(x, y) = 0 para todo (x, y) ∈ D, dizemos que (1.2.1) é uma equação linear homogênea. A equação

a(x, y)ux + b(x, y)uy + c(x, y)u = 0 (1.2.2)

é chamada equação homogênea associada a (1.2.1).


Com esse nível de generalidade, é quase impossível desenvolver qualquer teoria útil para estudar soluções
de (1.2.1) - lembre-se que mera existência de derivadas parciais de u não implica sequer continuidade de
u. Por isso, num primeiro momento, vamos sempre admitir que os coecientes a, b, c e h são, pelo menos,
funções contínuas em D e que uma solução u de (1.2.1) é uma função com derivadas parciais contínuas em
D.
Mesmo sem sabermos se (1.2.1) admite alguma solução, vamos iniciar nosso estudo discutindo temas
relativos à natureza do conjunto de suas soluções. O primeiro resultado enfatiza a importância da equação
(1.2.2) relativamente à equação (1.2.1).

Proposição 1.2.1. (a) Se u1 e u2 são soluções de (1.2.1), então u1 −u2 é uma solução da equação homogênea
associada (1.2.2);

(b) O conjunto S de todas as soluções de (1.2.2) é um subespaço vetorial de C 1 (D).

O segundo resultado, como veremos, é de grande importância operacional para determinar uma solução
particular de (1.2.1) e é conhecido como método da superposição. Ele é descrito na seguinte

Proposição 1.2.2. Suponha que h(x, y) = h1 (x, y) + h2 (x, y) para todo (x, y) ∈ D. Se u1 e u2 são soluções
de
a(x, y)ux + b(x, y)uy + c(x, y)u = h1 (x, y)
e
a(x, y)ux + b(x, y)uy + c(x, y)u = h2 (x, y),
respectivamente, então u(x, y) = u1 (x, y) + u2 (x, y) é uma solução de

a(x, y)ux + b(x, y)uy + c(x, y)u = h1 (x, y) + h2 (x, y).

As demonstrações das Proposições 1.2.1 e 1.2.2 são imediatas e deixadas para o leitor.

De concreto até o momento, a única coisa que sabemos é que (1.2.2) tem pelo menos uma solução: a
solução trivial u ≡ 0. Vamos examinar alguns exemplos.

Exemplo 1.2.1. Considere a equação homogênea 2ux + 3uy = 0.


Solução. Queremos determinar uma função não-nula u denida num subconjunto D do plano R2 que admite
derivadas parciais em D e tal que 2ux (x, y) + 3uy (x, y) = 0 para todo (x, y) ∈ D.
Trocando (x, y) por (x + 2t, y + 3t), a equação anterior implica que

2ux (x + 2t, y + 3t) + 3uy (x + 2t, y + 3t) = 0

para todo (x, y) ∈ D e para todo número real t.


Admitindo que u é uma função de classe C 1, usando a Regra da Cadeia, concluímos que

d
u(x + 2t, y + 3t) = 0,
dt
de onde decorre que a função t 7→ u(x + 2t, y + 3t) é constante, para todo (x, y) ∈ R2 e t real.

Tomando os valores t = 0 e depois t = −y/3, obtemos u(x, y) = u(x − 2y/3, 0) para todo (x, y). Essa
expressão mostra que o valor u(x, y) só depende do valor de u no ponto (x − 2y/3, 0), que é arbitrário. Dito
de outra forma, se soubermos os valores de u ao longo do eixo-x, digamos u(x, 0) = φ(x), podemos computar
2
o valor de u em qualquer ponto (x, y) ∈ R por meio da expressão u(x, y) = φ(x − 2y/3).

6
Escrevendo f (t) = φ(t/3), u(x, y) = f (3x − 2y). Concluímos
a formula anterior pode ser escrita como
assim que se u é uma solução de classe C1
2ux + 3uy = 0, então existe uma função f : R → R de
da equação
1 2
classe C tal que u(x, y) = f (3x − 2y) para todo (x, y) ∈ R . Reciprocamente, é muito simples demonstrar
que funções desta forma são soluções de 2ux + 3uy = 0. Assim, para a equação diferencial 2ux + 3uy = 0,
podemos descrever o subespaço S da Proposição 1.2.1 como

S = {u ∈ C 1 (R2 ) : u(x, y) = f (3x − 2y) e f ∈ C 1 (R}.

Por analogia ao tratamento dado às soluções de equações diferenciais ordinárias lineares, vamos nos referir
a u(x, y) = f (3x − 2y), f ∈ C 1 (R), como a expressão da solução geral da equação 2ux + 3uy = 0.
Em particular, as funções un (x, y) = sen(3nx − 2ny), n ≥ 1 inteiro, são exemplos de soluções não-nulas
da equação 2ux + 3uy = 0. linearmente independentes, esse
Como o conjunto dessas funções é um conjunto
exemplo mostra que, com as notações da Proposição 1.2.1, o subespaço vetorial S não tem dimensão nita -
um fato que denitivamente contrasta com o correspondente resultado para equações diferenciais ordinárias
lineares.

Ainda nesse exemplo, suponha que queiramos obter uma solução que satisfaça a seguinte condição:
u(x, 0) = φ(x), para todo x ∈ R. Nesse caso, deveremos então escolher f : R → R tal que f (3x) = φ(x) para
todo x. Isso implica que f (t) = φ(t/3) para todo t ∈ R. Assim, u(x, y) = φ((3x − 2y)/3) fornece a única
solução de 2ux (x, y) + 3uy (x, y) = 0 que satisfaz u(x, 0) = φ(x). ♣

Exemplo 1.2.2. Determine a solução da equação

3ux − 4uy − 2u = 2 sen 3x + 5 cos 2y

que satisfaz u(x, 0) = 1 + x2 , x ∈ R.


Solução. Primeiro, vamos examinar a equação homogênea associada
3ux − 4uy = 2u.

Trocando x por x + 3t e y por y − 4t, concluímos que se u é uma solução, então

3ux (x + 3t, y − 4t) − 4uy (x + 3t, y − 4t) = 2u(x + 3t, y − 4t),

que é equivalente a
d
[u(x + 3t, y − 4t)] = 2u(x + 3t, y − 4t).
dt
2t
Segue então que u(x + 3t, y − 4t) = Ce , para todos x, y e t, onde C é uma constante independente de t.
2t
Tomando t = 0, obtemos C = u(x, y) e, assim, u(x + 3t, y − 4t) = u(x, y)e , para todos x, y e t. Agora,
y
escolhemos t =
4 e obtemos

uh (x, y) = e−y/2 u(x − 3y/4, 0) = e−y/2 f (4x − 3y)

como solução geral da equação homogênea associada, onde f :R→R é uma função arbitrária de classe
C 1.
Agora, vamos procurar uma solução particular da equação não-homogênea. Para isso, vamos utilizar o
Princípio da Superposição da Proposição 1.2.2. Primeiro, vamos procurar uma solução particular de

3ux − 4uy − 2u = 2 sen 3x.

Um momento de reexão, mostra que podemos tomar uma solução independente de y, isto é, solução da
0
equação ordinária 3v (x) − 2v(x) = 2 sen 3x. A solução geral dessa última é dada por

2 x 2(x−s)/3
Z  
2x/3 18 2x/3 18 4
v(x) = Ce + e sen 3s ds = C + e − cos 3x − sen 3x.
3 0 85 85 85

2
Escolhemos u1p (x, y) = − 85 (9 cos 3x + 2 sen 3x) como solução particular de 3ux − 4uy − 2u = 2 sen 3x.

7
Agora, vamos procurar uma solução particular de 3ux − 4uy − 2u = 5 cos 2y . Novamente, procuramos
solução independente de x, isto é, solução particular de −4w0 (y) − 2w(y) = 5 cos 2y . Como antes, a solução
geral dessa última é dada por

Z y  
−y/2 5 −(y−s)/2 5 20 5
w(y) = Ce − e cos 2s ds = C − e−y/2 − sen 2y − cos 2y
4 0 34 34 34
5
e escolhemos u2p (x, y) = − 34 (cos 2y + 4 sen 2y) como solução particular de 3ux − 4uy − 2u = 5 cos 2y .
Finalmente, podemos escrever a solução geral da equação proposta:

2 5
u(x, y) = e−y/2 f (4x − 3y) − (9 cos 3x + 2 sen 3x) − (cos 2y + 4 sen 2y),
85 34
onde f é uma função arbitrária de classe C 1.
Agora, para determinar a solução que satisfaz u(x, 0) = 1 + x2 , devemos determinar f :R→R tal que

2 5
f (4x) − (9 cos 3x + 2 sen 3x) − = 1 + x2 ,
85 34
para todo x. Assim,
f (t) = 1 + (t/4)2 + 5/34 + 2/85[9 cos(3t/4) + 2 sen(3t/4)].
Logo, a solução de 3ux (x, y) − 4uy (x, y) − 2u(x, y) = 2 sen 3x + 5 cos 2y que satisfaz u(x, 0) = 1 + x2 é
dada por

(4x − 3y)2
 
−y/2 5 2
u(x, y) = e 1+ + + [9 cos(3(4x − 3y)/4) + 2 sen(3(4x − 3y)/4)]
16 34 85
2 5
− (9 cos 3x + 2 sen 3x) − (cos 2y + 4 sen 2y), ♣
85 34

Agora que sabemos que equações da forma (1.2.1) admitem soluções, nossa preocupação é desenvolver
um método geral que nos permita obtê-las. Para isso, suponha que u é uma solução da equação linear de
primeira ordem
a(x, y)ux (x, y) + b(x, y)uy (x, y) + c(x, y)u(x, y) = h(x, y)
numa região D do plano. Se γ(t) = (x(t), y(t)), t ∈ I , um intervalo de R, é uma curva de classe C1 contida
em D, então, pela Regra da Cadeia, temos

d
[u(x(t), y(t)] = ux (x(t), y(t))x0 (t) + uy (x(t), y(t))y 0 (t).
dt
Se as componentes de γ satisfazem as equações x0 (t) = a(x(t), y(t)) e y 0 (t) = b(x(t), y(t)), então a função
t 7→ u(x(t), y(t)) satisfaz a equação diferencial ordinária linear

d
u(x(t), y(t)) = −c(x(t), y(t))u(x(t), y(t)) + h(x(t), y(t)),
dt
que, uma vez integrada, fornece os valores da função u sobre os pontos de D que pertencem à curva γ .
Portanto, nossa esperança de determinar uma solução u de (1.2.1) em D é conhecer seus valores sobre todas as
curvas integrais do campo de vetores V (x, y) = (a(x, y), b(x, y)) denido em D. Essas observações constituem
quase a totalidade da demonstração do Teorema que enunciaremos abaixo a respeito de existência e unicidade
de solução de (1.2.1). Antes, porém, convém discutir alguns conceitos que serão usados na demonstração.

Denição 1.2.2. Considere a equação de primeira ordem

(1.2.1) a(x, y)ux + b(x, y)uy + c(x, y)u = h(x, y)

com coecientes de classe C1 numa região aberta D ⊂ R2 . Uma curva integral do campo de vetores
V (x, y) := (a(x, y), b(x, y)) é chamada uma curva característica de (1.2.1).

8
Assim, uma curva característica de (1.2.1) é uma solução do sistema de equações diferenciais ordinárias
x0 = a(x, y)

(1.2.3)
y 0 = b(x, y).

Denição 1.2.3. Seja S uma curva de classe C1 contida em D.


(i) Dizemos que característica para (1.2.1) no ponto p = (x0 , y0 ) ∈ S se V (x0 , y0 ) é tangente a S em p;
S é

(ii) Dizemos que S é não característica para (1.2.1) se V (p) não é tangente a S para todo ponto p ∈ S .

Nos Exemplos 1.2.1 e 1.2.2 acima, a curva S = {(x, 0) : x ∈ R} é não característica para cada uma das
equações consideradas. De fato, no primeiro Exemplo, V (x, y) = (2, 3) e no segundo, V (x, y) = (3, −4), e
ambos têm segunda componente não-nula.

Denição 1.2.4. Seja S uma curva de classe C1 contida em D e seja φ : S → R uma função denida em
S. Dizemos que uma função u : D → R é uma solução do problema de Cauchy para (1.2.1) em D com
condição inicial φ sobre S se u é de classe C 1 em D, u é solução de (1.2.1) em D e u(x, y) = φ(x, y) para
todo (x, y) ∈ S .

O problema de Cauchy para (1.2.1) em D com condição u=φ sobre S é também chamado de Problema
de Valor Inicial e nos referiremos a ele escrevendo

a(x, y)ux + b(x, y)uy = c(x, y)u, (x, y) ∈ D
(1.2.4)
u|S = φ.

Já estamos em condições de enunciar o Teorema Fundamental de Existência e Unicidade de Solução para


equações do tipo (1.2.1). Trata-se do seguinte

Teorema 1.2.1. a, b, c e h de classe


Considere a equação linear de primeira ordem (1.2.1) com coecientes
C1 numa região aberta D ⊂ R2 . Seja S uma curva de classe C 1 contida em D e suponha que S é não
característica para (1.2.1). Seja φ : S → R uma função de classe C 1 denida em S . Então, existem uma
1
vizinhança W de S contida em D e uma única função u : W → R de classe C tal que u|S = φ e u é solução
de (1.2.1) em W , isto é,

a(x, y)ux (x, y) + b(x, y)uy (x, y) + c(x, y)u(x, y) = h(x, y)

para todo (x, y) ∈ W .

A título de mostrar como o Teorema 1.2.1 pode ser utilizado para resolver problemas de Cauchy e, simul-
taneamente, mostrar como sua demonstração pode ser conduzida, vamos reexaminar a versão homogênea do
Exemplo 1.2.2 no seguinte

Exemplo 1.2.3. Determine a solução da equação

3ux (x, y) − 4uy (x, y) − 2u(x, y) = 0

que satisfaz u(x, 0) = 1 + x2 , x ∈ R.


Solução. Aqui, a curva S S = {(x, 0) : x ∈ R}, a função inicial é φ(s) = 1 + s2 e o campo
é o eixo-x:
de vetores denido pela equação dada é V (x, y) = (3, −4). Como V (x, y) não é tangente a S para todo
(x, y) ∈ S , concluímos que S é não característica para 3ux − 4uy − 2u = 0 e, portanto, o problema de Cauchy
tem solução única. Para obter a solução, primeiro parametrizamos S , por exemplo, como g(s) = (s, 0), com
s ∈ R e consideramos o sistema de equações ordinárias com condições iniciais
 0
 x = 3, x(0) = s
y 0 = −4, y(0) = 0
 0
z = 2z, z(0) = φ(s) = 1 + s2 .

9
Obtemos x(t, s) = 3t + s, y(t, s) = −4t e z(t, s) = e2t φ(s), para todos t e s. Das duas primeiras expressões,
y 3y
eliminamos t e s obtendo t = − e s = x −
4 4 que, substituídos na terceira expressão, conduz a u(x, y) =
3y 3y
z(t, s) = e−y/2 φ(x − 4 ) = e−y/2 1 + (x − 4 )2 . Portanto,

24xy − 9y 2
 
−y 2 /2 2
u(x, y) = e 1+x −
16

é a (única) solução. ♣

Exemplo 1.2.4. α um número real. Uma função f : R2 → R se diz homogênea de grau α se f (tx, ty) =
Seja
tα f (x, y), para todos (x, y) ∈ Df e t > 0. Se f é diferenciável, então a Regra da Cadeia mostra que
xfx (x, y) + yfy (x, y) = αf (x, y), para todo (x, y) ∈ Df . Nesse exemplo, vamos examinar as soluções da
equação
xux (x, y) + yuy (x, y) = αu(x, y)
com condição u|S = φ, onde S é a circunferência unitária x2 + y 2 = 1 e φ:S→R é uma função dada.

Solução. Para obter a solução, primeiro parametrizamos S , por exemplo, como g(s) = (cos s, sen s), com
s ∈ [0, 2π] . O campo de vetores aqui é V (x, y) = (x, y) e S é não característica - de fato, V (x, y) é
perpendicular a S em cada ponto (x, y) ∈ S . Portanto, o problema de Cauchy (1.2.4) tem solução única.
Para obtê-la, consideramos o sistema de equações ordinárias com condições iniciais

 0
 x = x, x(0) = cos s
y 0 = y, y(0) = sen s
 0
z = αz, z(0) = φ(g(s)).

Obtemos x(t, s) = et cos s, y(t, s) = et sen s z(t, s) = eαt φ(g(s)), para todos t
e e s.
2t = x2 + y 2 x y
Das duas primeiras expressões, eliminamos t e s obtendo e e g(s) = ( √ , √ );
x2 +y 2 x2 +y 2
substituindo na terceira, concluímos que

!
x y
u(x, y) = z(t, s) = φ p ,p (x2 + y 2 )α/2 .
x2 + y 2 x2 + y 2

xux + yuy
Portanto, as soluções de = αu são funções homogêneas de grau α. O domínio de todas as soluções
2
contém, pelo menos, R \{(0, 0)}. ♣

Exercício 1.2.1. Discuta a continuidade e/ou classe de diferenciabilidade das soluções de xux + yuy = αu
na origem (0, 0) para os diversos valores de α. Utilize um computador para esboçar os grácos de algumas
funções homogêneas de grau 2 tomando, por exemplo, φ(s) = cos ns quando (x, y) = (cos s, sen s), n ≥ 1
inteiro.

Exemplo 1.2.5. Vamos examinar as soluções da equação

x2 ux (x, y) + uy (x, y) = αu(x, y)

com condição u(x, 0) = φ(x), x ∈ R, é uma função dada e α é um número real xado.

Solução. Novamente, S é o eixo-x. Primeiro parametrizamos S , por exemplo, como g(s) = (s, 0), com s ∈ R.
O campo de vetores aqui é V (x, y) = (x2 , 1) e S é não característica para x2 ux (x, y) + uy (x, y) = αu(x, y):
para todo x, V (x, 0) = (x2 , 1) nunca é paralelo ao eixo-x. Portanto, o problema de Cauchy (1.2.4) tem
solução única. Para obtê-la, consideramos o sistema de equações ordinárias com condições iniciais

 0
 x = x2 , x(0) = s
y 0 = 1, y(0) = 0
 0
z = αz, z(0) = φ(s).
s
Obtemos x(t, s) = 1−st , y(t, s) = t e z(t, s) = eαt φ(s), para todos t e s.

10
x
Das duas primeiras expressões, eliminamos t e s obtendo t = y e s = 1+xy ; substituindo na terceira,
obtemos a solução procurada:
 
x
u(x, y) = z(t, s) = φ eαy .
1 + xy
Qual o domínio de u? Claro, o domínio de u depende da escolha do dado inicial, mas todas as soluções
têm em comum o fato de que ele deve ser uma vizinhança de S . Em geral, o domínio maximal de u deve ser
tomado como a componente conexa de R2 \{(x, y) : xy = −1} que contém o eixo-x.

D
S
x

xeαy
Por exemplo, se φ(x) = x, então u(x, y) = 1+xy e seu domínio é o conjunto aberto

D = {(x, y) ∈ R2 : xy > −1}

hachurado na gura acima. ♣

Para nalizar essa Seção, vamos discutir as ideias da demonstração do Teorema 1.2.1. A demonstração
segue exatamente como procedemos para encontrar as soluções dos exemplos apresentados: primeiro, obtemos
uma parametrização de S : S = {g(s) : s ∈ I}; em seguida, consideramos as soluções de (1.2.3) com condições
iniciais (x(0), y(0)) = g(s) e z(0) = φ(g(s)), obtendo-se as soluções x = x(t, s), y = y(t, s) e z = z(t, s).
Das duas primeiras expressões, eliminamos t e s em função de x e y que, substituindo em z = z(t, s) nos
fornece o valor de u no ponto (x, y): u(x, y) = z(t, s). Obviamente, a justicativa de todo esse procedimento
está baseado fundamentalmente nos Teoremas de Existência e Unicidade e Dependência Diferenciável das
soluções de equações diferenciais ordinárias. A hipótese  S é não característica é essencial na demonstração
e é ela que permite utilizar o Teorema da Função Inversa para obter t e s em função de x e y .1

1.3 Equações Quase-Lineares

Equações diferenciais parciais quase-lineares de primeira ordem em duas variáveis independentes são equações
da forma
a(x, y, u)ux (x, y) + b(x, y, u)uy (x, y) = c(x, y, u). (1.3.1)

Observe que os coecientes de ux , uy e c podem agora também depender da função incógnita u. [Quando
a, b e c são independentes de u, (1.3.1) é uma equação linear]. Vamos sempre admitir que as funções a, b
1 3
e c são de classe C num aberto U de R . Para simplicar a exposição, vamos admitir que U é da forma
U = D × R, onde D é um conjunto aberto do plano.
O tratamento de (1.3.1) é muito semelhante ao que zemos para equações lineares e vamos nos concentrar
apenas no problema de Cauchy, que consiste no seguinte: se S é uma curva de classe C1 contida em D e
φ:S→R é uma função dada, determinar uma solução u de (1.3.1) denida numa vizinhança de S em R2
que satisfaz u(x, y) = φ(x, y) para todo (x, y) ∈ S . Para isso, vamos começar examinando alguns aspectos
geométricos implícitos na equação (1.3.1). Começamos lembrando que se u é uma função de classe C1 de
duas variáveis x e y denida em D, então

~ (x, y) = (−ux (x, y), −uy (x, y), 1)


N
1
A demonstração pode ser encontrada em G. B. Folland [9].

11
é um vetor normal ao gráco de u em cada um de seus pontos (x, y, u(x, y)) ∈ U .
Seja A o campo de vetores denido em U por A(x, y, z) = (a(x, y, z), b(x, y, z), c(x, y, z)). Se u é uma
solução da equação quase-linear (1.3.1) em D, temos a identidade

a(x, y, u(x, y))ux (x, y) + b(x, y, u(x, y))uy (x, y) = c(x, y, u(x, y)), para todo(x, y) ∈ D,

que é equivalente a
~ (x, y) = 0,
A(x, y, u(x, y)) · N para todo(x, y) ∈ D.
Isso signica que, em cada ponto (x, y, u(x, y)), o vetor A(x, y, u(x, y)) é tangente ao gráco de u e, portanto,
devemos esperar que o gráco de u contenha as curvas integrais de A.
Para justicar essa armação, lembremos que γ(t) = (x(t), y(t), z(t)), t ∈ I , é uma curva integral de A
se γ satisfaz γ 0 (t) = A(γ(t)) para todo t ∈ I . Seja γ uma tal curva satisfazendo γ(t0 ) = (x0 , y0 , z0 ) e seja
w : D → R uma função de classe C 1 arbitrária. Então
d
[z(t) − w(x(t), y(t))] = c(x(t), y(t), z(t)) −a((x(t), y(t), z(t)))wx (x(t), y(t))
dt (1.3.2)
−b(x(t), y(t), z(t))wy (x(t), y(t)).

Decorre que se u é uma solução de (1.3.1), então t ∈ I 7→ z(t) − u(x(t), y(t)) é constante. Portanto,
z(t) = u(x(t), y(t)) para todo t ∈ I se e somente se z0 = u(x0 , y0 ). Isso signica que se o gráco de u contém
um ponto de uma curva integral de A, então ele contém toda a curva integral.

Reciprocamente, se w é uma função de classe C 1 em D que satisfaz w(x(t), y(t)) = z(t) para toda curva
integral γ(t) = (x(t), y(t), z(t)) de A, então w é uma solução de (1.3.1). De fato, para todo (x0 , y0 , z0 ) ∈ U ,
existe uma curva integral de A que satisfaz γ(t0 ) = (x0 , y0 , z0 ); de (1.3.2) concluímos que w é solução de
(1.3.1):
a(x0 , y0 , w(x0 , y0 ))wx (x0 , y0 ) + b(x0 , y0 , w(x0 , y0 ))wy (x0 , y0 ) = c(x0 , y0 , w(x0 , y0 )).

S ∗ : curva de condições iniciais


u

S∗
u = u(x, y)
u|S = φ
curva integral de A
S
y
(x, y)
x S

devemos procurar u de modo que seu gráco seja uma reunião de curvas integrais de A.
Isso indica que
Uma forma bastante simples de obter o gráco de uma tal solução u é tomar a reunião de todas as curvas
integrais de A que passam pelos pontos de uma curva xada S ∗ contida em D × R que não seja tangente a
A (isto é, em cada ponto de p ∈ S ∗ , o vetor A(p) é transversal a S ∗ em p). (Veja a gura.)
Aqui entra em cena o dado inicial u|S = φ: escolhemos S∗ como o gráco de φ, isto é, tomamos
S∗ = {(x, y, φ(x, y)) : (x, y) ∈ S}. Logo, a reunião das curvas integrais de A que passam por pontos de S∗ é
o gráco da solução u de (1.3.1), denida numa vizinhança de S , que satisfaz a condição u|S = φ.

Como curvas integrais de A, as componentes de γ devem satisfazer o sistema de Equações Diferenciais


Ordinárias  0
 x = a(x, y, z)
y 0 = b(x, y, z)
 0
z = c(x, y, z).

O sistema obtido acima deve ainda ser suplementado com condições iniciais da seguinte forma: se S é
parametrizada pela função g(s) = (g1 (s), g2 (s)), com s ∈ I (um intervalo de R), então tomamos x(0) = g1 (s),

12
y(0) = g2 (s) e z(0) = φ(g(s)). Assim, o problema de valor inicial que deverá ser considerado é o seguinte
 0
 x = a(x, y, z), x(0) = g1 (s)
y 0 = b(x, y, z), y(0) = g2 (s) (1.3.3)
 0
z = c(x, y, z), z(0) = φ(g(s)).

O restante do argumento é o mesmo utilizado na Seção anterior: as soluções de (1.3.3) dependem dos
parâmetros t e s; das equações x = x(t, s) e y = y(t, s) obtidas resolvendo (1.3.3) determinamos t e s como
funções de x e y (aqui entra em ação o Teorema da Função Inversa!) e depois substituímos as funções obtidas
na equação z = z(t, s) obtendo a função procurada u = u(x, y) = z(t, s).

Naturalmente, para que toda essa empreitada para obter solução de (1.3.1) tenha sucesso, é necessário
admitir uma hipótese crucial: as curvas integrais de A cortam S ∗ transversalmente. Essa hipótese é satisfeita
se admitirmos que o par (S, φ) é não característico para (1.3.1), conforme a seguinte
Denição 1.3.1. Sejam S uma curva de classe C1 contida em D e φ : S → R uma função de classe
C 1 em S . Dizemos que o par (S, φ) é não característico para (1.3.1) se, para todo (x, y) ∈ S , o vetor
A(x, y, φ(x, y)) = (a(x, y, φ(x, y)), b(x, y, φ(x, y)), c(x, y, φ(x, y))) não é tangente a S ∗ no ponto (x, y, φ(x, y)).

Já estamos em condições de enunciar o Teorema Fundamental de Existência e Unicidade de solução para


equações quase-lineares (1.3.1). Trata-se do seguinte

Teorema 1.3.1. Considere a equação quase-linear de primeira ordem

(1.3.1) a(x, y, u)ux + b(x, y, u)uy + c(x, y, u) = 0

com coecientes a, b e c de classe C 1 numa região U = D ×R, onde D é um subconjunto aberto de R2 . Sejam
S uma curva de classe C 1 contida em D e φ : S → R uma função de classe C 1 denida em S . Suponha que
(S, φ) é não característico para (1.3.1). Então, existem uma vizinhança W de S contida em D e uma única
1
função u : W → R de classe C tal que u|S = φ e u é solução de (2.1) em W , isto é,

a(x, y, u(x, y))ux (x, y) + b(x, y, u(x, y))uy (x, y) = c(x, y, u(x, y))

para todo (x, y) ∈ W .


Observação 1.3.1. Quando S é parametrizada por S : (x, y) = (g1 (s), g2 (s)), com s ∈ I , um modo analítico
de concluir que o par (S, φ) é não característico para (2.1) é mostrar que a matriz

a(g1 (s), g2 (s), φ(g1 (s), g2 (s))) g10 (s)


 

b(g1 (s), g2 (s), φ(g1 (s), g2 (s))) g20 (s)


tem determinante diferente de zero.

Exemplo 1.3.1. Em R2 , determinar a solução de uux + uy = 1 que satisfaz u = 12 s no segmento x = y = s,


0 < s < 1.
Solução. Trata-se de obter a solução da equação quase-linear dada que satisfaz a condição u|S = φ, onde S
é a curva parametrizada por g(s) = (s, s), com 0 < s < 1 e φ : S → R é dada por φ(x, x) = 21 x. O vetor A
é dado por A(x, y, u) = (u, 1, −1). Para vericar a condição de que (S, φ) é não característico, tomamos um
ponto (x, y) ∈ S e olhamos o vetor v(x, y) = (a(x, y, φ(x, y)), b(x, y, φ(x, y))) = (φ(x, y), 1).

Como (x, y) ∈ S implica x = y = s, com 0 < s < 1, temos v(x, y) = (φ(s, s), 1) = ( 21 s, 1). O vetor
tangente
0
a S em (x, y) é dado por g (s) = (1, 1). Como 0 < s < 1, o determinante
 
s/2 1 s
det = − 1 6= 0
1 1 2
e, portanto, o par (S, φ) é não característico.

O sistema (1.3.3) nesse caso implica resolver as equações ordinárias

dx dy du
=u , =1 , =1
dt dt dt

13
s
com condições iniciais x(0) = s, y(0) = s e u(0) = 2 . Obtemos imediatamente

1 1 1
x(t, s) = t2 + st + s , y(t, s) = t + s e u(t, s) = t + s
2 2 2
Agora, eliminamos t e s das duas primeiras equações:

t2 + st + 2s = 2x y 2 − 2x

2x − 2y
implica t= e s= .
t+s=y y−2 y−2
Substituindo na terceira equação obtemos a solução desejada:

y 2 + 2x − 4y y x−y
u(x, y) = = + .
2(y − 2) 2 y−2
A vizinhança (maximal e conexa) W que contém S prevista pelo Teorema 1.3.1, nesse caso, pode ser tomada
como o semiplano W = {(x, y) : y < 2}. ♣
Exemplo 1.3.2. Em R2 , determinar a solução de uux + uy = 0 que satisfaz u(x, 0) = φ(x).
Solução. Aqui, trata-se de obter soluções da equação quase-linear dada que satisfaz a condição u|S = φ,
onde S é a curva parametrizada por g(s) = (s, 0), com s∈R e φ:S→R é uma função dada.

O vetor A A(x, y, u) = (u, 1, 0). A condição  (S, φ) é não característico está satisfeita para
é dado por
qualquer φ, uma vez que v(s, 0) = (a(s, 0, φ(s)), b(s, 0, φ(s))) = (φ(s), 1) é transversal ao eixo-x, independen-
temente de φ.

O sistema (1.3.3) nesse caso implica resolver as equações ordinárias

dx dy du
=u , =1 , =0
dt dt dt
com condições iniciais x(0) = s, y(0) = 0 e u(0) = φ(s). Obtemos imediatamente

x(t, s) = φ(s)t + s , y(t, s) = t e u(t, s) = φ(s).

Agora, precisamos eliminar t e s das duas primeiras equações:



s + tφ(s) = x
t = y,

isto é, inverter a transformação T : (s, t) 7→ (s + tφ(s), t).


Como a matriz Jacobiana de T tem determinante ∆ = tφ0 (s) + 1, a transformação admite uma inversa
local numa vizinhança de cada um dos pontos (t0 , s0 ) tais que t0 φ0 (s0 ) 6= −1. Não vamos persistir nessa
direção para exibir a solução u; de qualquer forma, temos a certeza de que a solução existe, é única e pode ser
aproximada por erro arbitrariamente pequeno numa vizinhança de qualquer ponto xado (x0 , 0). A reunião
dessas vizinhanças constitui a vizinhança W prevista no Teorema 1.3.1.

Observe que as curvas características de uux +uy = 0, isto é, as curvas x = s+tφ(s) e y = t, representam,
no plano xy , uma família de retas x = φ(s)y + s parametrizadas por s ué
e o valor de constante em cada
uma dessas retas: u(x, y) = φ(s), o inverso do coeciente angular da reta x = φ(s)y + s. Vamos examinar o
efeito da escolha de φ na solução de uux + uy = 0 em dois exemplos simples:
(a) Suponha que φ(x) = αx, onde α é uma constante real não-nula. Nesse caso, as curvas características
é a família de retas x = s(αy + 1), que têm (0, − α1 ) como único ponto em comum; portanto, a solução
1
correspondente não pode estar denida em (0, − ) (u não pode tomar dois valores distintos num ponto).
α
Podemos constatar isso diretamente, pois a solução, nesse caso, é

αx
u(x, y) = .
1 + αy

(b) Considere φ(x) = x2 . Nesse caso, as curvas características é a família de retas x = s2 y + s parame-
trizadas por s e o valor de u é constante em cada uma dessas retas: u(x, y) = s2 , o inverso do coeciente

14
angular da reta x = s2 y + s. Entretanto, se s1 6= ±s2 , então as correspondentes retas se interceptam no
s s
ponto ( 1 2 ,
−1
s1 +s2 s1 +s2 ) e temos um choque: u teria dois valores distintos num ponto. Novamente, podemos

exibir u explicitamente: nesse caso, a equação yφ(s) + s = x se escreve como ys


2 + s − x √= 0 e obtemos

−1± 1+4xy
s = x, se y = 0 e s = 2y , se y 6= 0. Continuidade de s implica escolher s(x, y) = −1+ 2y1+4xy [observe
que s → x quando y → 0].

Substituindo na terceira equação obtemos a solução desejada:

  2
2x
√ , y 6= 0

se
u(x, y) = φ(s) = .
 21 + 1 + 4xy
x , se y = 0.

Nesse caso, podemos escrever uma única formula para a solução u como
 2
2x
u(x, y) = √
1 + 1 + 4xy
e a vizinhança (maximal e conexa) W que contém S prevista pelo Teorema 1.3.1 pode ser tomada como o
conjunto W = {(x, y) : 1 + 4xy ≥ 0}, que tem um aspecto semelhante ao do Exemplo 1.2.5. ♣
Observação 1.3.2. Trocando y por t, a equação do Exemplo 1.3.2 se escreve como

ut + uux = 0
(1.3.4)
u(x, 0) = φ(x).
e é conhecida como equação de Burger. Ela é exemplo de uma equação de evolução hiperbólica e faz parte
de um contexto maior de equações de primeira ordem não-lineares da forma ut + [f (u)]x = 0, que tem sido
objeto de intensos estudos. Equações deste tipo estão ligadas ao estudo de leis de conservação e transporte. A
equação de Burger está ligada a uma primeira tentativa (anos 1950) de modelar problemas de transporte e foi
também considerada num modelo para estudar o comportamento da componente x do campo de velocidades
de um uido invíscido e incompressível unidimensional governado pelas equações de Navier-Stokes sem forças
externas e com pressão nula. Para maiores informações, o leitor interessado pode consultar o texto de Mikel
Landajuela [15] ou de Zenhe Zang [25].

1.4 Equações Quase-Lineares - O Caso n-Dimensional


Agora vamos estender os resultados das seções anteriores ao caso n-dimensional. Uma equação quase-linear
na função incógnita u = u(x1 , x2 , ..., xn ) é uma equação da forma

n
X
aj (x1 , ..., xn , u)uxj = c(x1 , ..., xn , u), (1.4.1)
j=1

onde admitiremos que a1 , an e c são funções de classe C 1 num conjunto aberto U de Rn+1 .
..., Não há perda
de generalidade em supor que U é da forma U = D × R, onde D é um aberto em R .
n

O problema de Cauchy (também conhecido como problema de valor inicial) para (1.4.1) consiste no
seguinte: dada uma hipersuperfície S de classe C 1 contida em D e uma função φ : S → R de classe C 1 ,
determinar uma função u de classe C1 numa vizinhança W de S tal que u(x1 , x2 , ..., xn ) = φ(x1 , x2 , ..., xn )
para todo (x1 , x2 , ..., xn ) ∈ S e u satisfaz (1.4.1) em W, isto é,

n
X
aj (x1 , ..., xn , u(x1 , ..., xn ))uxj (x1 , ..., xn ) = c(x1 , ..., xn , u(x1 , ..., xn )),
j=1

para todo (x1 , ..., xn ) ∈ W . O problema de Cauchy para (1.4.1) em D com dados iniciais (S, φ) será indicado
por
 n
X
aj (x1 , ..., xn , u)uxj = c(x1 , ..., xn , u), x ∈ D


(1.4.2)
 j=1
u|S = φ.

15
Nessas notas, uma hipersuperfície de classe C 1 é um conjunto não-vazio S dado pelo conjunto de nível
S = F −1 (0) := {(x1 , x2 , ..., xn ) ∈ D : F (x1 , x2 , ..., xn ) = 0} de uma função F de classe C1 denida em D
que satisfaz a seguinte propriedade:

∇F (x1 , ..., xn ) 6= ~0 sempre que F (x1 , ..., xn ) = 0.

Por exemplo, S = {x ∈ Rn : x21 + ... + x2n = 1} é uma hipersuperfície de Rn : basta considerar


F (x1 , ..., xn ) = x21
+ ... + x2n − 1. Da mesma forma, o hiperplano xn = 0 é uma hipersuperfície de Rn :
S = F −1 (0), onde F (x1 , ..., xn ) = xn . Quando n = 3 e S = F −1 (0), S é também chamada de superfície de
nível 0 de F .

Decorre do Teorema da Função Implícita que se S é uma hipersuperfície de Rn , então para cada ponto
p ∈ S, V de p
existem uma vizinhança
n U de 0
em R , uma vizinhança em R
n−1 e uma função
g : U → Rn de
1
classe C tais que o conjuntoS ∩V é a imagem da aplicação g , isto é, S ∩V = {g(s1 , ..., sn−1 ) : (s1 , ..., sn−1 ) ∈
U }. A função g satisfaz ainda a seguinte propriedade: o conjunto de vetores {gs1 (s), gs2 (s), ..., gsn−1 (s)} é
linearmente independente, para todo s ∈ U .

Nesse contexto, referimos-nos a g como uma parametrização da vizinhança S ∩ V e a (s1 , ..., sn−1 ) ∈ U
como parâmetros. O leitor já está familiarizado com esses conceitos quando S é uma curva em R2 ou uma
superfície em R3 . Os casos que consideraremos são aqueles nos quais a superfície inteira é a imagem de uma
única parametrização. Uma situação desta natureza é quando S é o gráco de uma função de n − 1 variáveis
f : B ⊂ Rn−1 → R; S então tem a forma

S = {(x1 , x2 , ..., xn−1 , f (x1 , x2 , ..., xn−1 )) : (x1 , x2 , ..., xn−1 ) ∈ B};

nesse caso, parametrizamos S por

g(s1 , s2 , ..., sn−1 ) = (s1 , s2 , ..., sn−1 , f (s1 , s2 , ..., sn−1 )),

com (s1 , s2 , ..., sn−1 ) ∈ B .


A generalização dos conceitos discutidos anteriormente é imediata. Escrevendo x = (x1 , x2 , ..., xn ),
considere o campo de vetores A:U → Rn+1 denido pelos coecientes de (1.4.2) por

A(x, y) = (a1 (x, y), a2 (x, y), ..., an (x, y), c(x, y)).

Se u é uma função de x, o vetor normal ao gráco de u Rn+1 é proporcional a (ux1 , ..., uxn , −1) e,
em
portanto, a equação (1.4.1) nos diz que A é tangente ao gráco y = u(x) de uma solução u de (1.4.2). Isso
sugere que devemos procurar u como uma reunião de curvas integrais de A em R
n+1 que contenha o gráco

de φ. Para isso, resolvemos o sistema de equações diferenciais ordinárias

dxj dy
= aj (x, y), 1 ≤ j ≤ n , = c(x, y)
dt dt
com condições iniciais na superfície S ∗ = {(x, φ(x)) : x ∈ S} (o gráco da função φ : S → R).
A condição  S é não característica para (1.4.2) agora signica que os vetores A e {∂g/∂s1 , ..., ∂g/∂sn }
são linearmente independentes em todo ponto (x, y) ∈ S ∗ . Essa condição estará satisfeita se
 
∂g1 /∂s1 ... ∂g1 /∂sn−1 a1 (g(x), φ(g(x)))
 ∂g2 /∂s1 ... ∂g2 /∂sn−1 a2 (g(x), φ(g(x))) 
det   6= 0. (1.4.3)
 
. . .
. . .
 . . . 
∂gn /∂s1 ... ∂gn /∂sn−1 an (g(x), φ(g(x)))

Teorema 1.4.1. Suponha que S é uma hipersuperfície de classe C1 em Rn e que a1 , a2 , ... an , c e φ são
1
funções reais de classe C . Suponha que o vetor

(a1 (x, φ(x)), a2 (x, φ(x)), ..., an (x, φ(x))

não é tangente a S em qualquer ponto x ∈ S. Então, existe uma vizinhança W de S em Rn tal que o
problema de Cauchy (1.4.2) tem uma única solução u:W →R 1
de classe C .

16
Exemplo 1.4.1. Determinar, em R3 , a solução de xux + 2yuy + uz = 3u que satisfaz u = φ(x, y) no plano
z = 0.
Solução. Aqui, a hipersuperfície inicial S é o plano z =0 e a função φ:S →R é arbitrária. O vetor A
indicado no texto é
A(x, y, z, u) = (x, 2, 1, −2u).
Uma parametrização de S é g(s1 , s2 ) = (s1 , s2 , 0) e a condição de transversalidade (1.4.3)
 
1 1 s1
det  0 1 2  6= 0.
0 0 1
está satisfeita em todo S. Portanto, o problema de Cauchy tem solução única. Para encontrar a solução,
resolvemos
dx dy dz du
=x , = 2y , =1 , = 3u
dt dt dt dt
com condições iniciais
x(0) = s1 , y(0) = s2 , z(0) = 0 , u(0) = φ(s1 , s2 ).
Obtemos
x(t) = s1 et , y(t) = s2 e2t , z(t) = t , u(t) = φ(s1 , s2 )e3t .
Eliminando t, s1 , s2 das 3 primeiras equações, obtemos t = z , s1 = xe−z e s2 = ye−2z , que substituídos
na quarta fornece
u(x, y, z) = φ(xe−z , ye−2z )e3z
como a única solução do problema dado. ♣

1.5 A Equação Não-Linear f (x1 , ..., xn , u, ux1 , ..., uxn ) = 0


Vamos primeiro considerar o caso n=2 escrevendo a equação na forma

F (x, y, u, ux , uy ) = 0. (1.5.1)

O problema de Cauchy (ou problema de valor inicial) para (1.5.1) consiste no seguinte: dada uma curva
S no plano das variáveis xey e uma função φ denida em S , obter uma função u de classe C 1 denida numa
vizinhança V de S que satisfaz (1.5.1) em V e a condição inicial u(x, y) = φ(x, y) em todos os pontos (x, y)
da curva S.

Se S S : (x, y) = (g1 (s), g2 (s)), s ∈ I e φ(g1 (s), g2 (s)) = z(s), nosso problema
é parametrizada por
consiste em procurar uma superfície integral u = u(x, y) de (1.5.1) que passa pela curva x = g1 (s),
y = g2 (s), z = z(s). Isso será obtido passando por S ∗ = {(g1 (s), g2 (s), z(s)) : s ∈ I} uma faixa que
constituirá o gráco da solução u.

Vamos admitir que g1 , g2 e z são funções de classe C 1 numa vizinhança de um ponto s = s0 e seja P =
(x0 , y0 , z0 ) = (g1 (s0 ), g2 (s0 ), z(s0 )) ∈ S ∗ . Vamos procurar uma faixa contendo S ∗ procurando inicialmente
funções p = h1 (s) e q = h2 (s) tais que
 0
z (s) = h1 (s)g10 (s) + h2 (s)g20 (s)
(1.5.2)
F (g1 (s), g2 (s), z(s), h1 (s), h2 (s)) = 0.

Geometricamente, a segunda equação de (1.5.2) é interpretada como p = h1 (s) e q = h2 (s) são os candidatos
a valores iniciais das derivadas parciais da esperada solução u sobre a curva S ∗ ; a primeira é uma leitura
d
para a derivada
ds [u(g1 (s), g2 (s))].
Como a segunda equação em (1.5.2) é não linear, pode existir uma, várias ou nenhuma solução (h1 , h2 )
satisfazendo as condições (1.5.2). Entretanto, se o sistema

pg10 (s0 ) + qg20 (s0 ) = z 0 (s0 )




F (x0 , y0 , z0 , p, q) = 0

17
tem uma solução (p0 , q0 ) e o determinante

g10 (s0 ) Fp (x0 , y0 , z0 , p0 , q0 )


 
∆ := det = g10 (s0 )Fq (x0 , y0 , z0 , p0 , q0 ) − g20 (s0 )Fp (x0 , y0 , z0 , p0 , q0 ) 6= 0
g20 (s0 ) Fq (x0 , y0 , z0 , p0 , q0 )

então, pelo Teorema da Função Implícita, existe um único par (h1 , h2 ) de funções h1 = h1 (s), h2 = h2 (s) de
classe C1 numa vizinhança I de s0 que resolvem (1.5.2) em I.

Para construir nossa faixa que contém S∗, procederemos como no caso de equações quase-lineares. Ad-
mitindo que F 2
é uma função de classe C , derivamos a equação F (x, y, z, p, q) = 0 com relação a x e a y
obtendo
∂F ∂F ∂F ∂F ∂F ∂F
Fx + p+ px + qx = 0 e Fy + q+ py + qy = 0.
∂z ∂p ∂q ∂z ∂p ∂q
Como queremos qx = py , as equações anteriores mostram que p e q devem ser soluções das seguintes equações
parciais quase-lineares:
∂F ∂F ∂F ∂F ∂F ∂F
px + py = −Fx − p e qx + qy = −Fy − q .
∂p ∂q ∂z ∂p ∂q ∂z

Essas equações podem ser resolvidas usando o método de integração ao longo das características, resol-
vendo equações ordinárias da forma

x0 = Fp (x, y, z, p, q) e y 0 = Fq (x, y, z, p, q) (1.5.3)

(cujas soluções são as curvas características de (1.5.1)), e as equações


p0 = −Fx (x, y, z, p, q) − pFz (x, y, z, p, q) e q 0 = −Fy (x, y, z, p, q) − qFz (x, y, z, p, q). (1.5.4)

Ao longo de uma característica, queremos ter z(t) = u(x(t), y(t)) como antes. Isso implica que z0 =
zx x0 + zy y0 = zx Fp + zy Fq = pFp + qFq e, portanto, deveremos impor que

z 0 = pFp (x, y, z, p, q) + qFq (x, y, z, p, q) (1.5.5)

Desta forma, o método de integração ao longo das características (1.5.3), (1.5.4) e (1.5.5) sugere procurar
soluções do seguinte sistema de equações diferenciais ordinárias

 0
 x = Fp (x, y, z, p, q)
 y 0 = Fq (x, y, z, p, q)



p0 = −Fx (x, y, z, p, q) − pFz (x, y, z, p, q) (1.5.6)
q 0 = −Fy (x, y, z, p, q) − qFz (x, y, z, p, q)




 0
z = pFp (x, y, z, p, q) + qFq (x, y, z, p, q),

satisfazendo condições iniciais

x(0) = g1 (s) , y(0) = g2 (s) , p(0) = h1 (s) , q(0) = h2 (s) e z(0) = φ(g(s)) = z(s). (1.5.7)

Uma vez resolvido (1.5.6) com condições iniciais (1.5.7), obtemos a solução

x = x(t, s) , y = y(t, s) , p = p(t, s) , q = q(t, s) e z = z(t, s).

As equações x = x(t, s), y = y(t, s) e z = z(t, s) constituirão as equações paramétricas da superfície


almejada.

O Teorema de Existência e Unicidade de solução para o problema de valor inicial para (1.5.1) pode
nalmente ser enunciado :
2

2
Para mais detalhes, demonstração e interpretações geométricas, recomendamos o excelente livro de Fritz John [13].

18
Teorema 1.5.1. Suponha que D é um conjunto aberto de R2 e que F : D × R3 → R é uma função de classe
C 2 . Suponha que S 1
é uma curva regular de classe C contida em D parametrizada por (x, y) = g(s) =
(g1 (s), g2 (s)), s ∈ I e suponha que φ:S→R é uma função contínua. Dena z(s) = φ(g1 (s), g2 (s)), s ∈ I .
Suponha que existam funções h1 , h2 : I → R de classe C 1 tais que

h1 (s)g10 (s) + h2 (s)g20 (s) = z 0 (s) para todo x∈I (1.5.8)

F (g1 (s), g2 (s), z(s), h1 (s), h2 (s)) = 0 para todo x ∈ I, (1.5.9)

Então, existem uma vizinhança U de S em R2 e uma função u:U →R de classe C1 tal que u é solução
de (1.5.1) e u|S = φ.

Observe que as condições (1.5.8) e (1.5.9) dependem fortemente da escolha do par (S, φ). Quando (S, φ)
satisfaz (1.5.8) e (1.5.9), dizemos que (S, φ) é não característicopara a equação (1.5.1). Diferentes escolhas
de h1 e h2 , se possíveis, dão origem a diferentes soluções de (1.5.1).
Uma vez mais, a demonstração do Teorema 1.5.1 consiste em resolver o sistema de equações ordinárias
(1.5.3), (1.5.4) e (1.5.5) com condições iniciais

(1.5.7) x(0) = g1 (s) , y(0) = g2 (s) , p(0) = h1 (s) , q(0) = h2 (s) e z(0) = z(s)

obtendo a solução

x = x(t, s) , y = y(t, s) , p = p(t, s) , q = q(t, s) e z = z(t, s).

Usando o Teorema da Função Inversa, as duas primeiras equações x = x(t, s) e y = y(t, s) permitem
eliminar t e s em função de x e y, que substituídos nas demais, determinam u = u(x, y) = z(t, s). As
condições (1.5.8) e (1.5.9) garantem que o Teorema da Função Inversa pode ser aplicado.

Exemplo 1.5.1. Determinar uma solução da equação ux uy = u tal que u = x2 quando y = 0.

Solução. Aqui, F (x, y, z, p, q) = pq − z e portanto Fx = Fy = 0, Fz = −1, Fp = q e Fq = p. A curva S


é o eixo-x, que parametrizamos por S : g(s) = (x, 0), x ∈ I = R e a função inicial é φ(x, y) = x2 . Logo,
z(s) = s2 , s ∈ I .

As hipóteses (1.5.8) e (1.5.9) requerem a existência de funções h1 e h2 tais que h1 (s) · 1 + h2 (s) · 0 = 2s
s
e h1 (s)h2 (s) = s2 para todo s. Logo, h1 (s) = 2s e h2 (s) = 2 é a única solução.

Agora, resolvemos o sistema

x0 = q , y0 = p , p0 = p , q0 = q , z 0 = 2pq

com condições iniciais

s
x(0) = s , y(0) = 0 , p(0) = 2s , q(0) = e z(0) = s2 .
2
Resultam

s s
x(t, s) = (1 + et ) , y(t, s) = 2s(et − 1) , p(t, s) = 2set , q(t, s) = et e z(t, s) = s2 e2t .
2 2
y
Eliminando t e s das duas primeiras equações obtemos set = x + 4 e, portanto,

 y 2
u(x, y) = x +
4
é a solução procurada. ♣

19
Exemplo 1.5.2. ux u2y = 4.
Considere a equação
2
(a) Mostre que o problema de Cauchy ux uy = 4, u = x quando y = 0 tem duas soluções;
2
(b) Mostre que o problema de Cauchy ux uy = 4, u = y quando x = 0 tem solução única;
2 2
(c) O problema de Cauchy ux uy = 4, u = x quando y = 0 tem solução? Quantas?

Solução. Aqui, F (x, y, z, p, q) = pq 2 − 4 e, portanto, Fx = Fy = 0 = Fz = 0, Fp = q 2 e Fq = 2pq .

(a) No caso (a), a curva S é o eixo-x e S : (x, y) = (g1 (s), g2 (s)) = (s, 0), s ∈ R é uma parametrização de
S. Também, z(s) = φ(g(s)) = s para todo s.
Agora, devemos procurar funções h1 e h2 que satisfaçam as hipóteses (1.5.8) e (1.5.9), isto é

h1 (s) · 1 + h2 (s) · 0 = 1 e h1 (s)h2 (s)2 − 4 = 0 para todo s.



Logo, h1 (s) = 1 e existem duas possibilidades para a escolha de h2 : h+
2 (s) = 2 ou h2 (s) = −2. Pelo Teorema
1.5.1, para cada escolha de h2 , a equação tem uma única solução u, denidas numa vizinhança do eixo-x tais
que u(x, 0) = x.

Vamos determinar a solução u correspondente à escolha h+


2 (s) = 2. Para isso, devemos considerar o
sistema (1.5.6), que toma a forma

x0 = q 2 , y 0 = 2pq , p0 = 0 , q0 = 0 , z 0 = 3pq 2 ,

com condições iniciais

x(0) = s , y(0) = 0 , p(0) = 1 , q(0) = h+


2 (s) , z(0) = s.

Obtemos

x(t, s) = 4t + s , y(t, s) = 4t , p(t, s) = 1 , q(t, s) = h+


2 (s) e z(t, s) = 12t + s.

Eliminando t e s das duas primeiras equações obtemos s = x − y e t = y4 que, substituídos na última, dá


a solução u(x, y) = x + 2y . Refaça o cálculo acima e comprove que a solução correspondente a h2 (s) = −2
conduz à solução u(x, y) = x − 2y .

(b) Nesse caso, a curva S é o eixo-y e S : (x, y) = (g1 (s), g2 (s)) = (0, s), s ∈ R é uma parametrização de
S. Também, z(s) = φ(g(s)) = s para todo s.
Para que funções h1 e h2 satisfaçam as hipóteses (1.5.8) e (1.5.9), devemos ter

h1 (s) · 0 + h2 (s) · 1 = 1 e h1 (s)h2 (s)2 − 4 = 0 para todo s.

Logo, h2 (s) = 1 e h1 (s) = 4 são unicamente determinados. Pelo Teorema 1.5.1, a equação tem uma única
solução u, denidas numa vizinhança do eixo-y tais que u(0, y) = y .
Para determinarmos a solução u, devemos considerar o sistema (1.5.6), que toma a forma

x0 = q 2 , y 0 = 2pq , p0 = 0 , q0 = 0 , z 0 = 3pq 2 ,

com condições iniciais

x(0) = 0 , y(0) = s , p(0) = 4 , q(0) = 1 , z(0) = s.

Obtemos
x(t, s) = t , y(t, s) = 8t + s , p(t, s) = 4 , q(t, s) = 1 e z(t, s) = 12t + s.
Logo, t=x e s = y − 8x e a solução é u(x, y) = 4x + y .

(c) Novamente, a curva Séo eixo-x e S : (x, y) = (g1 (s), g2 (s)) = (s, 0), s ∈ R é uma parametrização de
S. Também, z(s) = φ(g(s)) = s2 para todo s.

20
Para que funções h1 e h2 satisfaçam as hipóteses (1.5.8) e (1.5.9), devemos ter

h1 (s) · 1 + h2 (s) · 0 = 2s e h1 (s)h2 (s)2 − 4 = 0 para todo s.

Logo, h1 (s) = 2s e 2sh2 (s)2 = 4. Essa última impõe uma restrição sobre a curva S : devemos tomá-la como
o eixo-x positivo e devemos esperar que existam duas soluções. Vamos examinar a solução correspondente à
2
escolha h2 (s) = √ , s > 0. Para isso, devemos considerar o sistema (1.5.6), que nesse caso é
s

x0 = q 2 , y 0 = 2pq , p0 = 0 , q0 = 0 , z 0 = 3pq 2 ,

com condições iniciais

2
x(0) = s , y(0) = 0 , p(0) = 2s , q(0) = √ , z(0) = s2 .
s

Obtemos

4t √ 2
x(t, s) = s + , y(t, s) = 8t s , p(t, s) = 2s , q(t, s) = √ e z(t, s) = 24t + s2 .
s s

4t

Para determinar u, precisamos inverter a função Φ(s, t) = (x, y) = (s + s , 8t t). Como Φ(s, 0) = (s, 0)
e o jacobiano
" #
4t 4
∂(x, y) 1−
= 4t
s2 √
s
∂(s, t) √
s
8 s

∂(x,y) √
satisfaz
∂(s,t) (s, 0) =8 s para todo s > 0, segue-se que Φ (s, 0),
é inversível em torno de qualquer ponto

com s > 0. A inversa local permite denir a solução u numa vizinhança de cada ponto (x, 0) com x > 0. Não
consigo obter fórmulas explícitas para a solução. Sabemos apenas que ela está denida numa vizinhança do
eixo-x e contida no conjunto aberto


12 3 5/2
V = {(x, y) : x > 0 e y< √ x }
25 5
5y
e tem como expressão u(x, y) = √
2 s
+ xs, ondes > 0 é uma raiz da equação 4s5 − 8xs4 + 4x2 s3 − y 2 = 0.
O mesmo raciocínio se aplica à outra escolha de h2 . ♣

Observação 1.5.1. (Adendo ao texto) Para estimar o domínio de denição da solução do Exemplo anterior,
√ y
observe que podemos eliminar x = s + 4t
t s e y(t, s) = 8t s e obter (x − s)s = 2 s . Assim,
das equações √
√ √
s é uma solução positiva da equação 2(x − s)s s = y . Denindo σ = s, a equação se escreve como

2σ 5 − 2xσ 3 + y = 0, da qual procuramos uma solução σ > 0 que satisfaz σ → x quando y → 0. Ora,
3 2
xado x > 0, o gráco do polinômio r(σ) = 2u (x − u ) tem o aspecto da gura abaixo. Concluímos que
√ q
dados
5
x , então a equação r(σ) = y tem uma única raiz real σ = σ ∗ (x, y) > 3x
12√3 5/2
x > 0 e y < 25 5 tal que
∗ √ ∗
σ (x, y) → x quando y → 0. O Teorema da Função Implícita assegura que σ é também uma função de
∞ ∗ 2
classe C . Logo, s = (σ ) é a primeira componente da função inversa do Exemplo anterior.


12√3 5/2
25 5
x

√ q √ x
− x 3x x
5

21
1.6 Aplicações

1.6.1 Movimento Unidirecional de Ondas


Suponha que u(x, t) x no instante t ≥ 0 de um movimento ondulatório
representa a posição do ponto
descrito por uma equação diferencial. O dado inicial u(x, 0) = φ(x) representa o formato inicial da onda. Se
o movimento é governado por uma equação diferencial parcial da forma ut + cux = 0, dizemos que u é uma
onda unidimensional.
Alguns modelos interessantes devido à suas aplicações físicas são aqueles em que c é constante - caso em
que obtemos uma equação linear - e c = u (ou mais geralmente, c = c(u)) - caso em obtemos uma equação
quase-linear. Vamos discutir a seguir apenas o caso em que c é constante
3 (alguns exemplos quase-lineares

serão tratados nos Exercícios no nal da seção).

Vamos nos referir à equação equação da onda unidirecional. A constante c é chamada


ut + cux = 0 como
velocidade de propagação da onda e seu sinal indica a direção de propagação. Como é de simples vericação,
a solução que no instante inicial t = 0 tem o formato de uma curva u = φ(x) é dada por u(x, t) = φ(x − ct).
Para todo instante t > 0, o formato da onda é o gráco de x 7→ u(x, t) e é o mesmo que o da função φ, porém
transladado horizontalmente de |c|t unidades para a esquerda se c < 0 e para a direita se c > 0.

Um problema com valores de fronteira também pode ocorrer em equações de ondas unidimensionais.
Um exemplo é aquele no qual o meio de propagação da onda é uma semi-reta innita x > 0 e se procura
determinar uma solução de ut + cux = 0 na região Ω = (0, ∞) × (0, ∞) e na fronteira de Ω se assume que
u(x, 0) = φ(x), x > 0 (a onda inicial) e u(0, t) = h(t), t > 0 (i.e., o movimento ondulatório do ponto x = 0).
Nesses casos, sempre procuramos uma solução que seja, pelo menos, contínua em (0, 0). Naturalmente,
admitiremos implicitamente que φ e h são contínuas em (0, ∞).

Vamos examinar mais detidamente esse problema, ainda usando o método de integração ao longo das
características. As características para o problema de valor inicial ut + cux = 0, (x, t) ∈ Ω, u(x, 0) = φ(x),
x > 0, são determinadas pelas soluções do sistema

dt dx
=1 =c
dτ dτ
com condições iniciais
t(0, s) = 0 x(0, s) = s,
e são, portanto dadas por t(τ, s) = τ e x(τ, s) = cτ + s. Eliminando τ e s, obtemos x − ct = s, uma família
de reta no plano xt, parametrizada pelo parâmetro s > 0.
Quando c < 0, x − ct = s intercepta os eixos x e t nos pontos (s, 0) e (0, −c/s).
cada reta da família
Como a equação impõe que u seja constante em cada curva característica, deveremos ter u(s, 0) = u(0, −s/c),
i.e., φ(s) = h(−s/c) para todo s > 0. Assim, excluindo o caso especial no qual os dados na fronteira de Ω
satisfazem φ(s) = h(−s/c) para todo s > 0, o problema de fronteira citado não tem solução quando c < 0.
(Essa conclusão está de acordo com nossa intuição: uma onda que viaja para a esquerda não pode satisfazer
a equação em Ω.)
Quando c > 0, a região Ω é dividida em duas partes pela reta x − ct = 0:
(i) a parte superior Ω
+ = {(x, t) : ct > x, x > 0}, que contém as características que interceptam o eixo-t,
caso em u(x, t) = h(t − xc );
(ii) e a parte inferior Ω− = {(x, t) : ct < x, x > 0}, que contém as características que interceptam o eixo-x,
caso em que u(x, t) = φ(x − ct).
Na reta x = ct, o valor de u pode ser dado por u(ct, t) = φ(0) ou u(ct, t) = h(0) desde que os limites
laterais de φ e h pela direita coincidam: φ(0+) = h(0+) - o que implica continuidade de u em (0, 0). Em
resumo,
1
se φ e h são de classe C em (0, ∞) e φ(0) = h(0), então a (única) solução contínua em Ω do
problema proposto é

h(t − x/c) se ct ≥ x > 0
u(x, t) =
φ(x − ct) se 0 < ct < x
3
Para o tratamento geral c = c(u), veja D. Trim [21].

22
Observação 1.6.1. Diferenciabilidade de u ao longo da reta x = ct exige que h0 (0+) = −cφ0 (+0).

1.6.2 Equações de Segunda Ordem Redutíveis


Alguns tipos de equações lineares de segunda ordem podem ser estudadas utilizando a técnica empregada
para equações de primeira ordem. Por exemplo, uma equação que possa ser colocada na forma

(I) (a(x, y)ux + b(x, y)uy )x = f (x, y) ou (II) (a(x, y)ux + b(x, y)uy )y = f (x, y)
admitem o seguinte tratamento: denido v(x, y) = a(x, y)ux +b(x, y)uy , a equação da forma (I) se transforma
no sistema 
a(x, y)ux + b(x, y)uy = v(x, y)
vx = f (x, y)
no caso (I) e expressão análoga no caso (II).

Que condições iniciais e/ou condições de fronteira podem ser impostas para que o problema tenha solução?
Que signicado tem a condição  S é não característica? As respostas a essas questões ainda vai aguardar
um pouco mais de tempo até realizarmos um estudo sistemático de equações lineares de ordem dois. Para
o momento, vamos nos concentrar numa equação especial de ordem dois, com coecientes constantes, que
admite um tratamento da forma descrita: a equação das ondas.

1.6.3 A Equação das Ondas


A equação diferencial parcial utt = c2 uxx , onde c é uma constante positiva, é conhecida como equação das
ondas. Para sermos mais precisos, ela é a versão unidimensional da equação das ondas, devido ao fato de que
suas soluções dependem apenas uma variável real x (e, naturalmente, de t, que é interpretado como tempo).
Diversos fenômenos de acústica, luz, óptica e vibrações conduzem à equação das ondas.

Vamos iniciar nossos estudos considerando a equação das ondas não-homogênea quando a variável x
pertence a todo (−∞, ∞), isto é, a equação

utt = c2 uxx + F (x, t), x ∈ R, t > 0. (1.6.1)

Aqui, c>0 é uma constante e o termo não-homogêneo F é uma função contínua em R × (0, ∞). Conside-
raremos o problema de Cauchy para (1.6.1), isto é, complementaremos (1.6.1) com as seguintes condições
iniciais:
u(x, 0) = φ(x) e ut (x, 0) = ψ(x), x ∈ (−∞, ∞), (1.6.2)

onde φ 2
é de classe C e ψ 1
é de classe C em (−∞, ∞).
Uma vez que
∂2u 2
  
2∂ u ∂ ∂ ∂u ∂u
− c = −c +c
∂t2 ∂x2 ∂t ∂x ∂t ∂x
para toda função u C 2 , nossa estratégia para procurar soluções de (1.6.1) toma a seguinte forma:
de classe
2
se u é uma solução de classe C de (1.6.1), então a função v(x, t) = ut (x, t) + cux (x, t) é solução de vt − cvx =
F (x, t). Reciprocamente, se v é uma solução de classe C 1 de vt − cvx = F (x, t) e se u é uma solução de
2
classe C de ut + cux = v(x, t), então u é solução de (1.6.1). Portanto, soluções de (1.6.1) podem (e serão!)
obtidas a partir do sistema de equações lineares não-homogêneo

vt − cvx = F (x, t)
ut + cux = v(x, t).
Observe que a primeira equação do sistema é desacoplada da segunda e que na solução de ambas pelo método
empregado anteriormente (o método de integração ao longo das características) é necessário escolher uma
curva S não característica para ambas. Ora, o campo vetorial denido pela primeira é V1 (x, t) = (1, −c) e
pela segunda, V2 = (1, c). Como c > 0, os dois campos são transversais ao eixo-x e, portanto, podemos tomar
S = {(x, 0) : x ∈ R} como curva inicial não característica para ambas equações do sistema. As condições
iniciais que escolheremos para v e u sobre S serão

v(x, 0) = ψ(x) + cφ0 (x) e u(x, 0) = φ(x), x ∈ (−∞, ∞). (1.6.3)

23
Vamos resolver a primeira equação. Para isso, examinamos suas curvas características, ou seja, as soluções
das equações
dx dt
= −c=1 e
dτ dτ
com condições iniciais t(0, s) = 0 e Obtemos t(τ, s) = τ e x(τ, s) = −cτ + s e, portanto, as
x(0, s) = s.
curvas características da primeira equação é a família de retas x + ct = s. Para determinarmos v , resolvemos

dy
= F (x(τ, s), t(τ, s)) = F (−cτ + s, τ )

com condição inicial y(0, s) = ψ(s) + cφ0 (s), resultando
Z τ
0
y(τ, s) = ψ(s) + cφ (s) + F (s − cξ, ξ) dξ.
0

Como v(x, t) = y(τ, s), com τ =t e s = x + ct, obtemos

Z t
v(x, t) = ψ(x + ct) + cφ0 (x + ct) + F (x + c(t − ξ), ξ) dξ.
0

Agora, temos que resolver a equação ut + cux = v(x, t) com condição inicial u(x, 0) = φ(x). Aqui, as
características satisfazem
dt dx
=1 e =c
dτ dτ
com condições iniciais t(0, s) = 0 e x(0, s) = s.
Obtemos t(τ, s) = τ e x(τ, s) = cτ + s e, portanto, as curvas características da segunda equação é a
família de retas x − ct = s. Para determinarmos u, resolvemos

dy
= v(x(τ, s), t(τ, s)) = v(s + cτ, τ )

com condição inicial y(0, s) = φ(s), resultando
Z τ
y(τ, s) = φ(s) + v(s + cη, η) dη.
0

Logo, u(x, t) = y(τ, s) = y(t, x − ct) se escreve como

Z t
u(x, t) = φ(x − ct) + v(x − ct + cη, η) dη.
0

Nas próximos parágrafos, computamos a integral acima. Da expressão de v obtida anteriormente, temos
Z η
v(x − ct + cη, η) = ψ(x − ct + cη + cη) + cφ0 (x − ct + cη + cη) + F (x − ct + cη + c(η − ξ), ξ) dξ
Z η 0
= ψ(x − ct + 2cη) + cφ0 (x − ct + 2cη) + F (x − ct + 2cη − cξ, ξ) dξ
0

e, portanto,

Z t Z t Z η 
0
v(x − ct + cη, η)dη = ψ(x − ct + 2cη) + cφ (x − ct + 2cη) + F (x − ct + 2cη − cξ, ξ) dξ dη
0 0 0

é a soma de 3 integrais. A mudança de variável x − ct + 2cη = s cuida da primeira integral:

Z t
1 x+ct
Z
ψ(x − ct + 2cη) dη = ψ(s) ds.
0 2c x−ct
A segunda integral é muito simples:

Z t
1
cφ0 (x − ct + 2cη) dη = [φ(x + ct) − φ(x − ct)].
0 2

24
A terceira integral é a integral iterada da função (ξ, η) 7→ F (x − ct + 2cη − cξ, ξ) sobre o triângulo
T = {(ξ, η) : 0 ≤ η ≤ t e 0 ≤ ξ ≤ η}. Nessa região, fazemos a mudança de variáveis x − ct + 2cη − cξ = s e
ξ = τ : por meio da transformação L(s, τ ) = (ξ, η) [translação + rotação + cisalhamento], o triângulo T é a
a imagem da região ∆ = ∆(x, t) = {(s, τ ) : 0 ≤ τ ≤ t e x − ct ≤ s ≤ x + ct}. O jacobiano de L é igual 1/2c
1
e, portanto, dξdη =
2c dsdτ . Logo,
Z t Z η ZZ ZZ
1
dη F (x − ct + 2cη − cξ, ξ) dξ = F (x − ct + 2cη − cξ, ξ) dξdη = F (s, τ ) ds dτ
0 0 2c
Z tT Z x+c(t−τ ) ∆(x,t)

= dτ F (s, τ ) ds.
0 x−c(t−τ )

η τ s = x − ct + cτ
η = ξ s = x + ct − cτ
t (x, t)
T L

∆(x, t)

ξ s
x − ct x x + ct

Coletando todos esses cálculos, concluímos que

Z x+ct Z t Z x+c(t−τ )
1 1 1
u(x, t) = [φ(x + ct) + φ(x − ct)] + ψ(s) ds + dτ F (s, τ ) ds (1.6.4)
2 2c x−ct 2c 0 x−c(t−τ )

é a única solução da equação (1.6.1) que satisfaz as condições iniciais (3.2.1).


Para referência futura, vamos registrar nossos cálculos nos próximos dois Teoremas. O primeiro trata da
solução geral da equação homogênea (F ≡ 0) e o segundo trata da obtenção de uma solução particular da
equação não-homogênea (F 6 0).
= A expressão (1.6.4) é o resultado da aplicação do Princípio da Superposição
à equação utt − c2 uxx = F (x, t).

Teorema 1.6.1. Suponha que φeψ são funções de classe C2 e C 1 , respectivamente, denidas em (−∞, ∞).
Então, o problema homogêneo de valor inicial

utt = c2 uxx , x ∈ R, t > 0.




u(x, 0) = φ(x) e ut (x, 0) = ψ(x), x ∈ (−∞, ∞)

tem uma única solução de classe C2 em R × (0, ∞), dada por


4

Z x+ct
1 1
u(x, t) = [φ(x + ct) + φ(x − ct)] + ψ(s) ds.
2 2c x−ct

Teorema 1.6.2. Suponha que F contínua em R × (0, ∞). Então, o problema não-homogêneo

utt = c2 uxx + F (x, t), x ∈ R, t > 0.




u(x, 0) = 0 e ut (x, 0) = 0, x ∈ (−∞, ∞)

tem uma única solução de classe C2 em R × (0, ∞), dada por

Z t Z x+c(t−τ )
1
u(x, t) = dτ F (s, τ ) ds.
2c 0 x−c(t−τ )
4
Expressão originalmente obtida por Jean-Baptiste le Rond d'Alembert (1717-1783) [6], publicada em 1747.

25
O Teorema 1.6.1 revela alguns fatos importantes a respeito da solução da equação homogênea. A primeira
1
parcela
2 [φ(x + ct) + φ(x − ct)] mostra que o valor de uma solução u no ponto (x, t) depende dos valores da
posição inicial φ em apenas dois pontos: x − ct e x + ct e seu valor é a média dos valores da posição inicial.
R x+ct
1
O termo
x−ct ψ(s) ds é o valor médio da velocidade inicial ψ em todo o intervalo [x − ct, x + ct]. Por
2c
essas razões, o intervalo [x − ct, x + ct] é chamado de domínio de dependência da solução u no ponto (x, t).
Agora, xado um ponto (x0 , 0), os pontos do plano (x, t) tal que ∆(x, t) contém (x0 , 0) é chamado domínio
de inuência do ponto x0 .
τ x = x0 − ct
s = x + ct − cτ s = x − ct + cτ x = x0 + ct
(x, t)
Domínio de
Inuência de
(x0 , 0)
∆(x, t)

s
x − ct x x + ct x0 x

Os resultados do Teorema 1.6.1 também ressaltam o caráter hiperbólico da equação das ondas: a di-
ferenciabilidade de sua soluções não melhora com o passar do tempo t. A classe de diferenciabilidade de
uma solução é a mesma que a dos dados iniciais φ e ψ. A esse proposito, em toda nossa discussão sem-
pre admitimos que os dados iniciais fossem funções de classe C1 ou C 2. Entretanto, em grande parte das
aplicações, necessitamos de usá-las para funções descontínuas. Como conciliar teoria e prática? Graças ao
avanço das ideias, inclusive da extensão do conceito de solução, levadas a efeito a partir dos anos 1935 por S.
5
Sobolev , esses resultados permanecem válidos mesmo quando os dados iniciais forem funções descontínuas.
Nos exercícios, você terá oportunidade de lidar com várias dessas situações.

Outra propriedade importante revelada pelo Teorema 1.6.1 é que a solução depende continuamente dos
dados iniciais : se
6 (u1 , φ1 , ψ1 ) e (u2 , φ2 , ψ2 ) indicam as soluções de (1.6.1), (1.6.2), então a diferença u1 − u2
satisfaz
Z x+ct
1 1
u1 (x, t) − u2 (x, t) = [φ1 (x + ct) − φ2 (x + ct) + φ1 (x − ct) − φ2 (x − ct)] + [ψ1 (s) − ψ2 (s)] ds.
2 2c x−ct

Supondo que os dados iniciais são funções limitadas em (−∞, ∞), obtemos

|u1 (x, t) − u2 (x, t)| ≤ sup |φ1 (s) − φ2 (s)| + t sup |ψ1 (s) − ψ2 (s)|,
−∞<s<∞ −∞<s<∞

e, portanto

sup |u1 (x, t) − u2 (x, t)| ≤ sup |φ1 (s) − φ2 (s)| + t sup |ψ1 (s) − ψ2 (s)|,
−∞<x<∞ −∞<s<∞ −∞<s<∞

para todo t ≥ 0.
Exercício 1.6.1. Seja u a solução de utt = 4uxx em R × (0, ∞), com condições iniciais u(x, 0) = 0 e
ut (x, 0) = ψ(x) , onde

1 se −2<x<5
ψ(x) =
0 caso contrário.

Prove que u(x, t) = 0 quando x > 5 + 2t ou x < −2 − 2t. Determine u(x, t) quando −2 − 2t ≤ x ≤ 5 + 2t.
Exercício 1.6.2. Determine a solução de
 
utt = 9uxx + 4 cos(x + t), x ∈ R, t > 0 utt = 9uxx + 4 cos(x + t), x ∈ R, t > 0
(a) 1 (b) 1
u(x, 0) = 1+x 2 e ut (x, 0) = 0, x ∈ R. u(x, 0) = 0 e ut (x, 0) = 1+x 2, x ∈ R.
5
Sergei Lvovich Sobolev (São Petersburgo, 6 de outubro de 1908 - Moscou, 3 de janeiro de 1989) foi um matemático russo,
aluno de Vladimir Smirnov. Na década de 1930 trabalhou no Instituto de Matemática Steklov. Sobolev introduziu noções
atualmente fundamentais em diferentes áreas da Matemática, como por exemplo os espaços de Sobolev. Trabalhou com funções
generalizadas, atualmente estudadas no âmbito da teoria das distribuições.
6
A demonstração apresentada no texto mostra a continuidade apenas na norma do supremo.

26
1.7 A Formula de d'Alembert Revisitada

Vamos retornar à equação das ondas e deduzir uma vez mais a formula de d'Alembert para o problema de
valor inicial, desta vez usando o Teorema de Green.

Para cada ponto (x, t) do plano, considere a região ∆(x, t) do plano determinada pelo triângulo de
vértices A = (x, t), B = (x − ct, 0) e C = (x + ct, 0), onde c é uma constante positiva, como na gura abaixo,
correspondente a t > 0.

τ A = (x, t)

∆(x, t)

ξ
(x − ct, 0) = B C = (x + ct, 0)

No plano das variáveis (ξ, τ ), as equações das retas AB e AC são dadas por

reta AB : c(τ − t) = ξ − x e AC : −c(τ − t) = ξ − x.

Suponha que u é uma função de classe C 2 denida em R2 . Tomando como F~ o campo de vetores de
1
classe C denido por F~ (ξ, τ ) = (uτ (ξ, τ ), c2 uξ (ξ, τ )) e considerando a orientação positiva da fronteira de
∆(x, t), pelo Teorema de Green obtemos
Z ZZ
2
uτ dξ + c uξ dτ = [c2 uξξ (ξ, τ ) − uτ τ (ξ, τ )] dξdτ.
∂∆(x,t) ∆(x,t)

Vamos computar a integral de linha, parametrizando a fronteira de ∆(x, t):

lado AB : γ1 (s) = (x, t) + s(−ct, −t) com 0 ≤ s ≤ 1;


lado BC : γ2 (s) = (s, 0) com x − ct ≤ s ≤ x + ct;
lado CA : γ3 (s) = (x + ct, 0) + s(−ct, t) com 0 ≤ s ≤ 1

Temos

Z Z 1
uτ dξ + c2 uξ dτ = [uτ (x − cts, t − ts)(−ct) + c2 uξ (x − cts, t − ts)(−t)] ds
∂∆(x,t) Z 0x+ct
+ [uτ (s, 0)(1) + c2 uξ (s, 0) × 0] ds
Zx−ct
1
+ [uτ (x + ct − cts, ts)(−ct) + c2 uξ (x + ct − cts, ts)(t)] ds.
0
Usando a Regra da Cadeia, mudança de variável e o Teorema Fundamental do Cálculo, podemos escrever a
igualdade anterior como

Z Z 1 Z x+ct
d
uξ dξ + uτ dτ = [cu(x − cts, t − ts) − cu(x + ct − cts, ts)] ds + uτ (s, 0) ds.
∂∆(x,t) 0 ds x−ct
Z x+ct
= c[u(x − ct, 0) − u(x, t)] − c[u(x, t) − u(x + ct, 0)] + uτ (s, 0) ds
Z x+ct x−ct
= −2cu(x, t) + c[u(x − ct, 0) + u(x + ct, 0)] + uτ (s, 0) ds.
x−ct

Portanto,

Z x+ct ZZ
1 1 1
uτ τ (ξ, τ ) − c2 uξξ (ξ, τ ) dξdτ,
 
u(x, t) = [u(x + ct, 0) + u(x − ct, 0)] + uτ (s, 0) ds +
2 2c x−ct 2c ∆(x,t)

para todo (x, t) ∈ R2 com t > 0. Assim, obtemos as mesmas conclusões do Teoremas 1.6.1 e 1.6.2:

27
(1) se u é solução da equação da onda homogênea utt = c2 uxx em todo R2 e satisfaz as condições iniciais
u(x, 0) = φ(x) e ut (x, 0) = ψ(x), então
Z x+ct
1 1
u(x, t) = [φ(x + ct) + φ(x − ct)] + ψ(s) ds,
2 2c x−ct

para todo (x, t) ∈ R2 com t > 0.


(2) se u é solução da equação da onda não-homogênea utt = c2 uxx + h(x, t) em todo R2 e satisfaz as condições
iniciais u(x, 0) = φ(x) e ut (x, 0) = ψ(x), então

1 x+ct 1 t
Z Z Z x+c(t−τ )
1
u(x, t) = [φ(x + ct) + φ(x − ct)] + ψ(s) ds + dτ h(ξ, τ ) dξ,
2 2c x−ct 2c 0 x−c(t−τ )

para todos x∈R e t > 0. Essa é uma espécie de fórmula da variação das constantes .
Exercício 1.7.1. Os dois métodos (integração ao longo das características e o imediatamente acima) em-
pregados na dedução da solução da equação das ondas sugerem a mudança de variáveis ξ = x + ct, η = x − ct
diretamente na equação. Use essa mudança de variáveis e dê uma outra demonstração do Teorema 1.6.1.
Essa mudança funciona para obter uma solução da equação não-homogênea como no Teorema 1.6.2?

1.8 Exemplos Resolvidos

Exemplo 1.8.1. Determine a solução geral u = u(x, y) das seguintes equações diferenciais parciais lineares:
(a) uy + 2yu = 0 (b) uxx − 9u = 0 (c) uxy − 2ux = 0.

Solução. (a)uy + 2yu = 0 é uma equação linear homogênea de primeira ordem que só contém a derivada
com relação a y . Ela pode ser resolvida como uma equação diferencial ordinária de variáveis separadas.
Outra forma
y2 y2 y2
é multiplicar ambos os lados da equação por e , obtendo e uy + 2ye u = 0. O lado esquerdo
é a derivada do produto e a equação se escreve como

∂ y2
[e u(x, y)] = 0.
∂y

independente de y
2
Logo, existe uma função f tal que ey u(x, y) = f (x). Portanto, a solução geral é

2
u(x, y) = f (x)e−y ,

onde f é uma função arbitrária.

(b) uxx − 9u = 0 é uma equação linear homogênea de segunda ordem que só contém a derivada com relação
a x. Ela pode ser resolvida como uma equação diferencial ordinária com coecientes constantes. As raízes
características são soluções de λ2 − 9 = 0, isto é, são λ1 = −3 e λ2 = 3. Assim, as soluções dependem de
duas constantes arbitrárias (isto é, funções que não dependem de x) f (y) e g(y) tais que

u(x, y) = f (y)e−3x + g(y)e3x ,

para todos (x, y). Assim, a solução geral é dada por

u(x, y) = f (y)e−3x + g(y)e3x ,

onde f e g são funções arbitrárias.

(c)uxy −2ux = 0 é uma equação linear homogênea de segunda ordem que, permutando a ordem de derivação,
(uy − 2u)x = 0. Isso implica que uy − 2u não depende de x e, portanto, existe uma
pode ser escrita como
função f tal que
uy − 2u = f (y).
Essa última é uma equação ordinária que, multiplicada pelo fator integrante e−2y se transforma em

∂ −2y
[e u] = f (y)e−2y .
∂y

28
Integrando, obtemos Z y
e−2y u(x, y) = f (t)e−2t dt + g(x),
y0
onde y0 é um número real arbitrário e g = g(x) é uma função arbitrária que não depende de y. Assim,
podemos escrever Z y
u(x, y) = e 2y
f (t)e−2t dt + g(x)e2y .
y0
Na igualdade acima, a primeira parcela é uma função que só depende de y e é arbitrária, que vou indicar
por h(y). Logo, a solução geral pode ser escrita como

u(x, y) = h(y) + g(x)e2y ,

onde h e g são funções arbitrárias. ♣


Observação. Se estivermos procurando soluções de classe C1 ou C 2 , as funções arbitrárias acima nominadas
deverão ser tomadas na correspondente classe de diferenciabilidade. Nesse momento, não estamos muito
preocupados com diferenciabilidade, mas sim com a forma das soluções. Se você desejar, admita que todas
as funções arbitrárias envolvidas nas respostas são de classe C ∞.
Exemplo 1.8.2. Determine a solução de cada um dos problemas de Cauchy:

(a) ut + 4ux = 0, com u(0, t) = sen 3t (b) ut + xux = 1, com u(x, 0) = φ(x)
Solução. (a) Trata-se de um problema de valor inicial, onde a curva S é constituída pelo eixo-t com dado
u(0, t) = sen 3t sobre essa curva. Tomemos g(s) = (0, s) como parametrização de S . Escrevendo a
inicial
equação como 4ux + ut = 0, o campo de vetores denido pela equação é V (x, t) = (4, 1). Como o vetor
0 0
tangente a S em cada ponto é g (s) = (0, 1), concluímos que V (x, t) nunca é paralelo a g (s) e, portanto, S
é não característica. As características da equação satisfazem o sistema
 0
 t =1
x0 = 4
 0
u =0

com condições iniciais t(0) = s, x(0) = 0 e u(0) = sen 3s. (Estamos usando
0 = d
dτ .)
x x
Obtemos t(τ ) = τ + s, x(τ ) = 4τ e u(τ ) = sen 3s. Segue-se que τ = 4 e s = t− 4 . Substituindo na
terceira equação, obtemos  x
u(x, t) = sen 3 t − .
4
(b) Trata-se de um problema de valor inicial, onde a curva S é constituída pelo eixo-x com dado inicial
u(x, 0) = φ(x) sobre essa curva. Tomemos g(s) = (s, 0) como parametrização de S . Escrevendo a equação
como xux + ut = 1, o campo de vetores denido pela equação é V (x, t) = (x, 1). Como o vetor tangente
0 0
a S em cada ponto é g (s) = (1, 0), concluímos que V (x, t) nunca é paralelo a g (s) e, portanto, S é não
característica. As características da equação satisfazem o sistema
 0
 t =1
x0 = x
 0
u =1
com condições iniciais t(0) = 0, x(0) = s e u(0) = φ(s). Obtemos t(τ ) = τ , x(τ ) = seτ e u(τ ) = τ + φ(s).
Segue-se que τ =t e s = xe−t . Substituindo na terceira equação,
−t
concluímos que u(x, t) = t + φ(xe ) é a
solução procurada. ♣
Outra forma equivalente para resolver o item (b): seja (x(t), t) a curva em R2 que satisfaz x0 (t) = x(t) e
passando pelo ponto (x0 , 0) quando t = 0. A equação dada signica que

d
u(x(t), t) = ux (x(t), t)x0 (t) + ut (x(t), t) = 1.
dt
Portanto, u(x(t), t) = u(x0 , 0) + t = φ(x0 ) + t. Como x(t) = x0 et , obtemos x0 = xe−t que, substituindo,
resulta u(x, t) = t + φ(xe−t ).

29
Exemplo 1.8.3. Determine a solução dos problemas de vibração de uma corda innita abaixo:

 
utt − uxx = 0, x ∈ R, t > 0 utt = 4uxx + xt, x ∈ R, t > 0
(a) (b)
u(x, 0) = x e ut (x, 0) = x, x ∈ R. u(x, 0) = sen x e ut (x, 0) = cos x, x ∈ R.

Solução. (a) É imediato, usando a Formula de d'Alembert com c = 1, φ(x) = x e ψ(x) = x:


Z x+t
1 1 1
u(x, t) = [x − t + x + t] + s ds = x + [(x + t)2 − (x − t)2 ] = x(1 + t).
2 2 x−t 4

(b) Aqui, c=2 e φ(x) = sen x e ψ(x) = cos x e a solução da equação homogênea associada é

Z x+2t
1 1
uh (x, t) = [sen(x − 2t) + sen(x + 2t)] + cos s ds = 2 sen x cos 2t.
2 2 x−2t

Agora, pelo Teorema 1.6.2 com F (x, t) = xt, a função

t x+2(t−τ ) t t
τ2 τ3 xt3
Z Z Z 
1
up (x, t) = dτ ξτ dξ = xτ (t − τ ) dτ = x t − =
4 0 x−2(t−τ ) 0 2 3 0 6

xt3
é uma solução particular. Portanto, u(x, t) = 6 + 2 sen x cos 2t é a solução procurada. ♣

Exemplo 1.8.4. Usando o método de características, determine a solução do problema de valor de fronteira

 utt = c2 uxx , x > 0, t > 0,


u(x, 0) = 0, ut (x, 0) = 0, x > 0


u(0, t) = h(t), t > 0.

Solução. As curvas características da equação utt = c2 uxx são as retas x−ct = constante e x+ct = constante.
A reta x − ct = 0 divide o primeiro quadrante em duas regiões

D1 = {(x, t) : x ≥ ct ≥ 0} e D2 = {(x, t) : 0 ≤ x ≤ ct},

representadas na gura abaixo.

t x − ct = 0

D2 : 0 ≤ x ≤ ct

A = (x0 , t0 )
D1 : x ≥ ct ≥ 0
x0
(0, t0 − c ) =P
A = (x0 , t0 )

B 0 B0 C C 0 x

Consideremos um ponto A = (x0 , t0 ) com x0 > 0 e t0 > 0. As características que passam pelo ponto A são
dadas por x − ct = x0 − ct0 e x + ct = x0 + ct0 , que intersectam o eixo-x nos pontos B = (x0 − ct0 , 0) e
C = (x0 + ct0 , 0), respectivamente.
2
Se u é solução de utt = c uxx , usamos a formula de d'Alembert para expressar u(x0 , t0 ) como

1 x0 +ct0
Z
1
(∗) u(x0 , t0 ) = [u(x0 − ct0 , 0) + u(x0 + ct0 , 0)] + ut (s, 0) ds.
2 2c x0 −ct0

Essa expressão mostra que se (x0 , t0 ) pertence a D1 e se u satisfaz as condições iniciais u(x, 0) = 0 e
ut (x, 0) = 0 quando x > 0, então u(x0 , t0 ) = 0: isso segue imediatamente da gura acima, pois x0 − ct0 ≥ 0

30
quando (x0 , t0 ) ∈ D1 e, assim, as duas parcelas que compõem (*) são nulas. [Na gura, B e C estão
representados como B 0 e C 0 , respectivamente.]
Se (x0 , t0 ) pertence ao interior da região D2 , temos x0 − ct0 < 0 e x0 + ct0 > 0 [são os valores das
1
R x0 +ct0
abscissas de B e C na gura acima]. Assim, as parcelas u(x0 + ct0 , 0) = 0 e ut (s, 0) ds = 0 em
2c 0
(*) são nulas, mas não temos nenhuma informação das outras parcelas. Para lidar com esse esse fato, vamos
procurar funções φ, ψ : (−∞, 0] → R tais que, tomando
 
0 se x>0 0 se x>0
(∗∗) u(x, 0) = ut (x, 0) =
φ(x) se x≤0 ψ(x) se x ≤ 0,

a solução resultante dada por (*) também satisfaça u(0, t) = h(t) para t > 0.
Substituindo em (*), concluímos que, se (x0 , t0 ) ∈ D2 , então

Z 0 Z 0
1 1 1 1
u(x0 , t0 ) = u(x0 − ct0 , 0) + ut (s, 0) ds = φ(x0 − ct0 ) + ψ(s) ds.
2 2c x0 −ct0 2 2c x0 −ct0

Para que u(0, t0 ) = h(t0 ) para todo t0 > 0, é necessário que φ e ψ sejam escolhidas de modo que
Z 0
1 1
h(t0 ) = φ(−ct0 ) + ψ(s) ds
2 2c −ct0

para todo t0 > 0. Provavelmente, a opção mais econômica


7 seja escolher ψ≡0 em (−∞, 0] (caso em ut (·, 0)
em (**) resulta identicamente nula) e φ(x) = 2h(−x/c) x ≤ 0.
para
Com essa escolha, podemos nalmente escrever a solução u(x0 , t0 ), para (x0 , t0 ) ∈ D2 , como

 x0 
u(x0 , t0 ) = h t0 − .
c
Conclusão: A função

0 se x ≥ ct
u(x, t) =
h t − xc

se x < ct
é a única solução do problema dado. Observe que u não contínua em (0, 0), a menos que h(0) = 0. ♣

Exemplo 1.8.5. (a) Usando o método de características, determine a solução do problema de valor de
fronteira
 utt = c2 uxx , x > 0, t > 0,

u(x, 0) = f (x), ut (x, 0) = g(x), x > 0


ux (0, t) = 0, t > 0.

(Admita que u é contínua em x=0 e t = 0.)


(b) Mostre que a solução obtida em (a) pode ser obtida estendendo a posição inicial (f ) e a velocidade
inicial (g ) como funções pares a (−∞, ∞).

1 se 4<x<5
(c) Determine a solução quando g=0 e f (x) =
0 caso contrário.

Solução. A solução apresentada a seguir é praticamente a mesma do Exemplo anterior, mas vamos repeti-la
em quase toda sua totalidade de modo a xar as ideias envolvidas. De novo, as curvas características da
equação utt = c2 uxx são as retas x − ct = constante e x + ct = constante e a reta x − ct = 0 divide o primeiro
quadrante em duas regiões

D1 = {(x, t) : x ≥ ct ≥ 0} e D2 = {(x, t) : 0 ≤ x ≤ ct},

representadas na gura anterior.


Consideremos um ponto A = (x0 , t0 ) com x0 > 0 e t0 > 0. As características que passam pelo ponto A
são dadas por x − ct = x0 − ct0 e x + ct = x0 + ct0 , que intersectam o eixo-x nos pontos B = (x0 − ct0 , 0)
7 R0
Você pode escolher qualquer função ψ e depois tomar φ(x) = 2h(−x/c) − 1
c −x/c
ψ(s) ds - o resultado nal será o mesmo!

31
e C = (x0 + ct0 , 0), respectivamente. Se u é solução de utt = c2 uxx , usamos a formula de d'Alembert para
expressar u(x0 , t0 ) como

Z x0 +ct0
1 1
(∗) u(x0 , t0 ) = [u(x0 − ct0 , 0) + u(x0 + ct0 , 0)] + ut (s, 0) ds.
2 2c x0 −ct0

Essa expressão mostra que se (x0 , t0 ) pertence a D1 e se u satisfaz as condições iniciais u(x, 0) = f (x) e
ut (x, 0) = g(x) quando x > 0, então
Z x0 +ct0
1 1
(1) u(x0 , t0 ) = [f (x0 − ct0 ) + f (x0 + ct0 ))] + g(s) ds.
2 2c x0 −ct0

Essa expressão segue imediatamente da gura anterior, pois x0 − ct0 ≥ 0 quando (x0 , t0 ) ∈ D1 . [Na gura,
B e C 0
estão representados como B e C 0 , respectivamente.]
Se (x0 , t0 ) pertence ao interior da região D2 , temos x0 − ct0 < 0 e x0 + ct0 > 0 R[são os valores das
1 x0 +ct0
abscissas de B e C na gura acima]. Assim, as parcelas u(x0 + ct0 , 0) = f (x + ct) e 2c 0 ut (s, 0) ds =
g(s) ds em (*) são conhecidas, mas não temos nenhuma informação das outras parcelas. Para lidar
1
R x0 +ct0
2c 0
com esse esse fato, vamos procurar funções φ, ψ : (−∞, 0] → R tais que, tomando

 
f (x) se x > 0 g(x) se x > 0
(∗∗) u(x, 0) = ut (x, 0) =
φ(x) se x ≤ 0 ψ(x) se x ≤ 0,

a solução resultante dada por (*) também satisfaça ux (0, t) = 0 para t > 0.

Substituindo em (*), concluímos que, se (x0 , t0 ) ∈ D2 , então

Z 0 Z x0 +ct0
1 1 1 1
(2) u(x0 , t0 ) = φ(x0 − ct0 ) + ψ(s) ds + f (x0 + ct0 ) + g(s) ds.
2 2c x0 −ct0 2 2c 0

Derivando essa expressão com relação a x0 , temos

∂u 1 1 1 1
(x0 , t0 ) = φ0 (x0 − ct0 ) − ψ(x0 − ct0 ) + f 0 (x0 + ct0 ) + g(x0 + ct0 ).
∂x0 2 2c 2 2c
Para que ux (0, t0 ) = 0 para todo t 0 > 0, é necessário que φ e ψ sejam escolhidas de modo que
1 0 1 1 1
φ (−ct0 ) − ψ(−ct0 ) + f 0 (ct0 ) + g(ct0 ) = 0
2 2c 2 2c
para todo t0 > 0. Isso implica que φ e ψ devem satisfazer

1 0 1
[φ (−ct0 ) + f 0 (ct0 )] − [ψ(−ct0 ) − g(ct0 )] = 0
2 2c
para todo t0 > 0, ou, de forma equivalente,

1 0 1
[φ (x) + f 0 (−x)] − [ψ(x) − g(−x)] = 0
2 2c
para todo x < 0.
Vamos fazer a escolha trivial: vamos tomar ψ(x) = g(−x) e φ(x) = f (−x) para x ≤ 0. Da forma
escolhida, resulta que as funções iniciais u(·, 0) e ut (·, 0) de (**) são funções pares. Com essa escolha,
podemos nalmente escrever a solução u(x0 , t0 ), para (x0 , t0 ) ∈ D2 : substituindo φ e ψ em (2), obtemos

1 0 1 x0 +ct0
Z Z
1 1
u(x0 , t0 ) = φ(x0 − ct0 ) + ψ(s) ds + f (x0 + ct0 ) + g(s) ds.
2 2c x0 −ct0 2 2c 0
Z 0 Z x0 +ct0
1 1 1 1
= f (−x0 + ct0 ) + g(−s) ds + f (x0 + ct0 ) + g(s) ds
2 2c Zx0 −ct0 2 2c Z0
−x0 +ct0 x0 +ct0
1 1 1 1
= f (−x0 + ct0 ) + g(s) ds + f (x0 + ct0 ) + g(s) ds
2 2c 0 2 2c 0

32
Conclusão: A solução do problema dado é a função

1 x+ct
 Z
1
 [f (x − ct) + f (x + ct))] + g(s) ds se x ≥ ct


2 Z −x+ct 2c x−ct
u(x, t) =
1 x+ct
Z
 1 f (−x + ct) + 1


1
g(s) ds + f (x + ct) + g(s) ds se x < ct.
2 2c 0 2 2c 0

1 se 4<x<5
(c) Quando g = 0 e f (x) = , as extensões pares de f e g são (vou ainda designa-las
0 caso contrário
por f e g) g ≡ 0 e

1 se 4<x<5 ou −5<x<4
f (x) =
0 caso contrário.

Nesse caso, a solução u é


1
[f (x − ct) + f (x + ct))] se x ≥ ct


u(x, t) = 2
1 1

 f (−x + ct) + f (x + ct) se x < ct.
2 2
1
O valores que u assume são apenas os números 0, 2 e 1 nas regiões indicadas na gura abaixo. ♣

0 1
2

1
0

1
2

0 1
2

1
−5 −4 4 5 x

1.9 Exercícios

Exercício 1.9.1. Determine a solução de cada um dos seguintes problemas de valor inicial:
a) xux + yuy = u, u = x quando y = x2 ;
2 2
b) x ux + y uy = 4, u = 1 quando xy = x + y e x > 1;
c) ux + uuy = 4u, u = x quando y = x;
d) ux − uuy = u, u = 3x quando y = 2x;
2 2
e) 2y(u − 3)ux + (2x − u)uy = y(2x − 3), u = 0 quando x + y = 2x;
2 2 2 2
f ) x(y + u)ux − y(x + u)uy = (x − y )u, u = 1 quando x + y = 0;
2 2
g) u(x + y)ux + u(x − y)uy = x + y , u = 0 quando y = 2x.

Exercício 1.9.2. xux + yuuy = −xy .


Considere a equação
(a) Determine a solução que satisfaz u = c quando xy = 1;
(b) Determine a solução que satisfaz u = c quando x = 0;
(b) Determine a solução que satisfaz u = c quando x = 1.

33
Exercício 1.9.3. Determine a solução de 2ux + uuy = 2 tal que u = −y quando y 2 = −4x. Descreva o
domínio de denição da solução.

Exercício 1.9.4. Para que valores do número real m, o problema de Cauchy


xux + yuu = u
u(x, y) = φ(x, y) quando y = mx

tem solução? Unicidade?

Exercício 1.9.5. Qual o domínio de existência da solução do problema de valor inicial para ux + uy = u2
com u(x, y) = x quando y = x.

Exercício 1.9.6. Discuta o problema de valor inicial para xux + yuy = 4 que satisfaz
(a) u(x, y) = t2 quando x = t e y = t + 1, t ≥ 1;
2
(b) u(x, y) = t quando x = t e y = 3t, t ≥ 1;
(a) u(x, y) = 4 ln t quando x = t e y = 3t, t ≥ 1.

Exercício 1.9.7. Por que a equação ux + uy = u não tem solução que satisfaz u=1 quando y = x?

Exercício 1.9.8. Determine a solução de uux + uy = 0 que satisfaz u = φ(x) quando y = 0, onde


 1, se x≤0
φ(x) = 1 − x, se 0<x<1 .
0, x > 1.

se

Exercício 1.9.9. Determine a solução de ux + 2uuy = 1


(a) que satisfaz u = x quando y = x;
(b) que
2
satisfaz u = x quando y = x .
2

Exercício 1.9.10. Determine a solução de (u + y)ux + yuy = x − y que satisfaz u = y 2 + 2 quando x = y − 1.

Exercício 1.9.11. Resolva ut − 3ux = 0 com u(x, 0) = cos x.

Exercício 1.9.12. Resolva ut + 4ux = 0 com u(0, t) = sen 3t.

Exercício 1.9.13. Resolva a equação da onda unidirecional amortecida ut + cux + βu = 0 com condição
inicial u(x, 0) = φ(x), onde c>0 e β > 0.

Exercício 1.9.14. (a) Determine, em forma integrada, a solução do problema não-homogêneo para a equação
da onda unidirecional ut + cux = F (x, t) com condição inicial u(x, 0) = f (x), onde c é uma constante.
(b) Escreva a solução de (a) quando F (x, t) = x + t.

Exercício 1.9.15. Seja c > 0. Determine a solução do problema de valor de fronteira ut + cux = 0 para
x>0 e t>0 se u(x, 0) = φ(x), x > 0 e u(0, t) = h(t), t > 0.

Exercício 1.9.16. (a) Resolva ut + xux = 1 com u(x, 0) = φ(x);


(b) Resolva ut + 3tux = u com u(x, 0) = φ(x).

Exercício 1.9.17. Determine a solução de ut + 2uux = 0 tal que u(x, 0) = φ(x), onde


 1, se x < 0
φ(x) = 1 + Lx , se 0 < x < L
2, se x > L.

Compare a solução com a solução limite quando L → 0 da equação ut + 2uux = 0 tal que u(x, 0) = ψ(x),
onde 
1, se x < 0
ψ(x) =
2, se x > 0.

34
Exercício 1.9.18. Sejam c > 0 e h > 0. Determine a solução de utt = c2 uxx tal que u(x, 0) = 0 e
ut (x, 0) = ψ(x), onde

1, se |x| < h
ψ(x) =
0, se |x| > h.
(Sugestão: considere as regiões ct < h e ct > h).

Nos próximos exercícios, as notações p e q indicam derivadas parciais da função u: p = ux e q = uy .

Exercício 1.9.19. (Exercícios tomados do livro de D. Trim [21]) Determine, se possível, a solução de cada
dos problemas de valor inicial abaixo (p e q indicam ux e uy e C é a curva dada):

(1) pq = 4, C : y = 0, u = x (2) u = p2 − q 2 , C : 4u + x2 = 0, y = 0
2 2 2
(3) p + q = 4u, C : u = x + 1, y = 0 (4) p + q 2 + u = 0, C : u = y, x = 0
1 2 2
(5) u = 2 (p + q ) + (p − x)(q − y), C : y = u = 0.

Exercício 1.9.20. Determine, se possível, a solução da equação parcial pu = q cujo gráco contém as
seguintes curvas:
(a) C : y = x3 , u = 1 (b) C : u = x, y = 0 (c) C : y = x3 , u = x (d) C : u = y = x, x ≥ 0.

Exercício 1.9.21. Estude existência e unicidade de solução da equação parcial p2 + q 2 = α 2 cujo gráco
contém a curva x
2 + y2 = 1, u = K , onde α≥0 e K são parâmetros reais.

Exercício 1.9.22. Discuta o número de soluções de p2 + q 2 = 5 que satisfazem u=y quando x = 0.

Exercício 1.9.23. A voltagem v e a corrente i num cabo elétrico ao longo do eixo-x satisfazem o sistema
de equações

ix + Cvt + Gv = 0
vx + Lit + Ri = 0,
onde C , G, L e R são a capacitância, condutância, indutância e resistência por unidade de comprimento do
cabo. Mostre que v e i satisfazem a equação do telégrafo
uxx = LCutt + (RC + LG)ut + RGu.

Exercício 1.9.24. Dena u(x, t) = w(x, t)eat na equação do telégrafo do exercício anterior. Qual a equação
que w satisfaz? Mostre que, se LC 6= 0, então a pode ser escolhido de modo que esta equação seja da forma
wxx = Awtt + Bw. (Isto é, a equação resultante não apresenta termo com derivada de primeira ordem.)

Exercício 1.9.25. Seja u uma solução da equação das ondas 3-dimensional

∂2u ∂2u ∂2u ∂2u


 
= c2 + 2 + 2 .
∂t2 ∂x2 ∂y ∂z

u tem simetria esférica, isto é, u(x1 , x2 , x3 , t) = v(r, t), onde r =


p
Suponha que x2 + y 2 + z 2 . Dena w
por w(r, t) = rv(r, t). Prove que w é solução da equação wtt = c2 wrr . Utilizando a formula de d'Alembert,
escreva uma formula para a solução geral da equação da onda tridimensional.

35
36
Capítulo 2

Formas Canônicas de Equações de Segunda


Ordem
Vamos tratar apenas o caso em que a incógnita é uma função de duas variáveis. O caso geral é mais
complicado e o leitor interessado pode consultar a referência I. Petrovsky [18]. Quase todo o material
contido neste Capítulo foi inspirado nessa obra.

2.1 Redução à Forma Canônica de Equações Diferenciais Parciais

de Segunda Ordem em Duas Variáveis Independentes

Considere a equação diferencial de segunda ordem

∂2u ∂2u ∂2u


 
∂u ∂u
A(x, y) 2 + 2B(x, y) + C(x, y) 2 + F x, y, u, , = 0. (2.1.1)
∂x ∂x∂y ∂y ∂x ∂y

Admitiremos que os coecientes A, B e C são funções de classe C2 em duas variáveis x e y denidas numa
2 3
região aberta D do plano R ; a classe de diferenciabilidade da função F : D×R → R não é muito importante
2
neste momento, mas podemos supor que ela é também de classe C . Admitiremos também que procuramos
soluções u de (2.1.1) de classe C2 em D.
Vamos considerar uma mudança de variáveis em D denida por uma transformação T : D → R2 de classe
C 2 dada por
ξ = ξ(x, y), η = η(x, y), (2.1.2)

com jacobiano
∂ξ ∂ξ
∂(ξ, η) ∂x (x, y) ∂y (x, y)

(x, y) =

∂η ∂η
∂(x, y)

∂x (x, y) ∂y (x, y)

diferente de zero na região D. É então possível, usando o Teorema da Função Inversa, resolver o sistema
(2.1.2) de forma única para determinar x e y como funções x = x(ξ, η), y = y(ξ, η) de classe C2 para (ξ, η)
em algum conjunto aberto D̃. Nas novas variáveis, a equação (2.1.1) toma a forma

"    2 #
∂2u ∂ξ 2 ∂ξ ∂ξ ∂ξ
2
A + 2B +C
∂ξ ∂x ∂x ∂y ∂y
2
 
∂ u ∂ξ ∂η ∂ξ ∂η ∂ξ ∂η ∂ξ ∂η
+2 A +B +B +C (2.1.3)
∂ξ∂η ∂x ∂x
"  ∂x ∂y ∂y ∂x ∂y ∂y
 2 #
∂2u ∂η 2
  
∂η ∂η ∂η ∂u ∂u
+ 2 A + 2B +C + F1 ξ, η, u, , = 0.
∂η ∂x ∂x ∂y ∂y ∂ξ ∂η

Agora, vamos considerar a equação parcial de primeira ordem

 2  2
∂φ ∂φ ∂φ ∂φ
A + 2B +C =0 (2.1.4)
∂x ∂x ∂y ∂y

37
na função incógnita φ = φ(x, y). Vamos lidar separadamente com os casos B 2 > AC , B 2 < AC e B 2 = AC
em toda a região D . Não vamos considerar o caso quando a expressão B
2 − AC troca de sinal em D ou
quando ela se anula em algum ponto de D sem se anular em todo D.
Vamos primeiro considerar que B
2 > AC em D, hiperbólica
caso em que dizemos que a equação (2.1.1) é
em D. reais e distintas e pode ser resolvida, digamos,
Nesse caso, a equação (2.1.4) tem duas soluções
determinando ∂φ/∂x em função de ∂φ/∂y , dando origem ao seguinte sistema linear de equações de primeira
ordem
∂φ1 ∂φ1
 p
 A
 = [−B − B 2 − AC]
∂x ∂y (2.1.5)
∂φ2 p
2
∂φ2
 A
 = [−B + B − AC] .
∂x ∂y
Agora, usamos o método de integração ao longo de características para determinarmos soluções não
constantes φi = φi (x, y) (i = 1, 2) de (2.1.5). Para isso, escolhemos curvas distintas e transversais Ci
(i= 1, 2) que são não características para cada uma das equações de (2.1.5). É um tanto trabalhoso mostrar
que as funções φ1 e φ2 assim obtidas podem ser escolhidas com classe de diferenciabilidade C 2 e que o
jacobiano de φ1 e φ2 com relação a x e y nunca se anula em alguma sub-região G de D . Portanto, podemos
tomar
ξ = ξ(x, y) = φ1 (x, y) , η = η(x, y) = φ2 (x, y) (2.1.6)

como mudança de variável.


1 Fazendo assim, os termos de (2.1.3) que contém ∂ 2 u/∂ξ 2 e ∂ 2 u/∂η 2 se anulam.
2
Ao mesmo tempo, o coeciente de ∂ u/∂ξ∂η é diferente de zero em D. Dividindo (2.1.3) pelo coeciente de
2
∂ u/∂ξ∂η , essa equação ca reduzida à forma canônica
∂2u
 
∂u ∂u
= F2 ξ, η, , (2.1.7)
∂ξ∂η ∂ξ ∂η
em toda a região de denição G das funções φ1 e φ2 .
Se tomarmos agora ξ =α+β e η = α − β, a equação (2.1.7) torna-se

∂2u ∂2u
 
∂u ∂u
− = Φ α, β, , . (2.1.8)
∂α2 ∂β 2 ∂α ∂β
Qualquer uma das formas (2.1.7) e (2.1.8) é chamada uma forma canônica de (2.1.1) em G.
Observação 2.1.1. Se o coeciente A é nulo, então uma das equações (2.1.5) se torna indeterminada (se,
por exemplo, B > 0, então a segunda delas se torna indeterminada). Isso não causará qualquer transtorno
uma vez que A ≡ 0 implica que a equação (2.1.4) se reduz a
 2
∂φ ∂φ ∂φ
2B +C =0
∂x ∂y ∂y
e o sistema (2.1.5) se torna
 2B ∂φ ∂φ1

1
∂x + C ∂y = 0
∂φ2
 = 0.
∂y
Para obter a forma canônica neste caso, determinamos uma solução não constante φ1 (x, y) da primeira
equação e escolhemos φ2 (x, y) independente de y de modo que o jacobiano de φ1 e φ2 seja não nulo. Às
vezes, a escolha φ2 (x, y) = x resolve o problema. O caso C ≡ 0 é tratado da mesma forma. Se A ≡ C ≡ 0,
a equação (2.1.1) já está escrita na forma canônica.

Consideremos agora o caso em que a equação (2.1.1) é parabólica em D, isto é, o caso em que B 2 = AC
em toda a região D. Nesse caso, as duas equações do sistema (2.1.5) coincidem com uma única equação

∂φ ∂φ
A +B =0
∂x ∂y
1
A rigor, a solução geral de cada uma das equações (2.1.5) dene uma família de curvas φi (x, y) = constante em G, chamadas
curvas características de (2.1.1).

38
ou, equivalentemente, com a equação
∂φ ∂φ
B +C = 0.
∂x ∂y
Suponha que φ(x, y) = k seja a solução geral desta última equação em alguma região G do plano xy
e suponha que φ é de classe C 2 com gradiente não nulo em G. Escolha uma família de curvas ψ(x, y) =
constante contidas na região G tal que a função ψ seja de classe C 2 e que o jacobiano

∂φ ∂φ
∂x ∂y
∂ψ ∂ψ
∂x ∂y

é não nulo na região G. Se, por exemplo, ∂φ/∂x > 0 em G, podemos tomar ψ(x, y) = y . Com essa escolha,
a mudança de variáveis
ξ = φ(x, y) e η = ψ(x, y)
torna o coeciente de ∂ 2 u/∂ξ 2 em (2.1.3) identicamente nulo em G. O coeciente de ∂ 2 u/∂ξ∂η se torna

   
∂φ ∂φ ∂φ ∂φ ∂φ ∂ψ
A +B + B +C .
∂x ∂y ∂x ∂x ∂y ∂y

que é identicamente nulo em G, φ é solução de Aφx + Bφy = 0 e Bφx + Cφy = 0.


uma vez que
Como B 2 = AC em toda a região D e A, B e C não são simultaneamente nulos, então um dos coecientes
A ou C é diferente de zero. Suponha que A 6= 0 em algum ponto (x0 , y0 ). Então, nesse ponto, o coeciente
2 2
de ∂ u/∂η na equação (2.1.3) tem a expressão

2 2
∂ψ 2
   
∂ψ ∂ψ ∂ψ ∂ψ 1 ∂ψ
A + 2B +C = A +B .
∂x ∂x ∂y ∂y A ∂x ∂y

Essa expressão não pode ser zero: caso contrário o jacobiano de φ e ψ seria zero nesse ponto. Da mesma
forma, podemos mostrar que se C 6= 0 num ponto, então o coeciente de ∂ 2 u/∂η 2 é diferente de zero nesse
ponto. Isso signica que esse coeciente não se anula em toda a região G, o que legitima dividir a equação
(2.1.3) por esse coeciente para obter

∂2u
 
∂u ∂u
+ F2 ξ, η, u, , = 0. (2.1.9)
∂η 2 ∂ξ ∂η

A equação (2.1.9) é chamada forma canônica da equação (2.1.1) na região G.


Se a equação (2.1.1) é linear, então (2.1.9) também é linear e tem a forma

∂2u ∂u ∂u
2
= A1 + B1 + C1 u + D1 .
∂η ∂ξ ∂η

É um exercício simples demonstrar o seguinte fato: a mudança u = zv(ξ, η), onde

 Z 
1
v(ξ, η) = exp B1 (ξ, η)dη ,
2

transforma essa última na equação


∂2z ∂z
2
= A1 + C2 z + D 2 ,
∂η ∂ξ
onde C2 e D2 são calculados a partir de C1 e D1 e v.
Para nalizar, vamos examinar o caso em que a equação (2.1.1) é elíptica em D, isto é, quando AC > B 2
em D. Nesse caso, o sistema (2.1.5) tem coecientes não reais e é dado por
∂φ1 ∂φ1
 p
 A
 = [−B − i AC − B 2 ]
∂x ∂y (2.1.10)
∂φ2 p ∂φ2
 A
 = [−B + i AC − B 2 ] .
∂x ∂y

39
Admitindo que os coecientes A, B e C são funções reais analíticas, os coecientes de (2.1.10) são também
funções analíticas de (x, y) em D. Seja

φ(x, y) = φ∗ (x, y) + iφ∗∗ (x, y)


uma solução analítica não constante de uma das equações (2.1.10) numa vizinhança de um ponto (x0 , y0 ).2
Tomemos
ξ = φ∗ (x, y) e η = φ∗∗ (x, y) (2.1.11)

como mudança de variáveis em (2.1.1). Os detalhes de que (2.1.10) tem uma solução analítica e que (2.1.11)
tem jacobiano diferente de zero numa vizinhança de (x0 , y0 ) podem ser encontrados em Petrovsky [18].
Vamos computar os coecientes de (2.1.3) pela mudança de variáveis (2.1.11). Separando partes real e
imaginárias da equação
 2  2
∂φ ∂φ ∂φ ∂φ
A + 2B +C =0
∂x ∂x ∂y ∂y
obtemos

 2  2  2  2
∂ξ ∂ξ ∂ξ ∂ξ ∂η ∂η ∂η ∂η
A + 2B +C =A + 2B +C , (2.1.12)
∂x ∂x ∂y ∂y ∂x ∂x ∂y ∂y
 
∂ξ ∂η ∂ξ ∂η ∂ξ ∂η ∂ξ ∂η
A +B + +C = 0.
∂x ∂x ∂x ∂y ∂y ∂y ∂y ∂y
Dividindo (2.1.3) por um dos lados de (2.1.12), obtemos

∂2u ∂2u
 
∂u ∂u
+ 2 = F2 ξ, η, u, , . (2.1.13)
∂ξ 2 ∂η ∂ξ ∂η
Essa forma da equação (2.1.1) é chamada sua forma canônica em G.
Observação 2.1.2. O argumento utilizado acima permite reduzir nossa equação elíptica à forma canônica
numa vizinhança de um ponto (x0 , y0 ) no qual existe uma solução analítica não constante da equação (2.1.10).
Pode-se mostrar que tal redução é possível sem admitir que A, B e C sejam analíticas: é suciente que esses
coecientes sejam de classe C 2.
Observação 2.1.3. Como dissemos, as curvas integrais obtidas resolvendo as equações (2.1.5) são chamadas
curvas características da equação (2.1.1). Quando (2.1.1) é hiperbólica, ela tem um par de características
reais independentes; quando é parabólica, apenas uma característica real e quando elíptica, não tem caracte-
rísticas reais. Em qualquer desses casos, determinamos soluções φx de (2.1.4), obtendo equações parciais de
primeira ordem como (2.1.5) ou (2.1.10) e procuramos suas soluções utilizando, como é de regra, o método
de integração ao longo das características. Entretanto, em nossa abordagem de formas canônicas, não ne-
cessitamos de determinar a solução geral destas equações: tudo que precisamos é escrever a família de suas
curvas características. Para levar adiante essa ideia, vamos lembrar que ao resolver
√ x0 = 1 e y 0 = −λ(x, y),
onde λ = [−B ± B 2 − AC]/A (no caso A 6= 0) e eliminar as variáveis t e s (que têm origem ao empregar
o método), terminamos com uma equação φ(x, y) = k , onde k é uma constante arbitrária. Por essa razão,
dizemos que φ(x, y) = k é a solução geral de (2.1.5).

Uma forma muito simples de obter essa solução geral é observar que podemos obtê-la diretamente da
seguinte forma: uma vez que x0 = 1 implica que x = x(t) é crescente, podemos escrever sua solução na forma
y = y(x). Decorre, então, que y satisfaz a equação diferencial ordinária

dy
= −λ(x, y),
dx
onde, como dissemos acima, λ são as soluções da equação Aλ2 − 2Bλ + C = 0. Assim, a equação diferencial
ordinária que, uma vez resolvida, fornecem as características de (2.1.1) é
 2
dy dy
A − 2B +C =0 se A 6= 0 (2.1.14)
dx dx
2
Pode-se usar o Teorema de Cauchy-Kowalewsky para obter uma tal solução numa vizinhança de (x0 , y0 ) tomando um valor
inicial φ(x0 , y) = β(y) para x = x0 com β 0 (y0 ) 6= 0.

40
ou  2
dx dx
C − 2B +A=0 se C 6= 0. (2.1.15)
dy dy
(ATENÇÃO: As equações (2.1.14) e (2.1.15) devem ser comparadas com (2.1.4) e (2.1.1)!)
Resumimos nossa discussão no seguinte

Teorema 2.1.1. Suponha que u é uma solução de classe C2 da equação diferencial parcial

∂2u ∂2u ∂2u


 
∂u ∂u
(2.1.1) A(x, y) 2 + 2B(x, y) + C(x, y) 2 + F x, y, u, , =0
∂x ∂x∂y ∂y ∂x ∂y
em que os coecientes A, B e C são funções de classe C2 em duas variáveis x e y denidas numa região
aberta D 2
do plano R . Então, dado (x0 , y0 ) ∈ D, existe uma vizinhança G de (x0 , y0 ) e uma mudança de
coordenadas ξ = ξ(x, y), η = η(x, y), (x, y) ∈ G, de classe C 2 que transforma (2.1.1) em sua forma canônica.
A forma canônica é de um dos seguintes tipos: escrevendo u = u(ξ, η), temos:

(I) se B 2 − AC > 0 em D (caso em dizemos que (2.1.1) é hiperbólica em D), então a forma canônica de
(2.1.1) em G é de um dos seguintes tipos:

∂2u ∂2u ∂2u


   
∂u ∂u ∂u ∂u
(2.1.7) = F2 ξ, η, , ou (2.1.8) − = Φ α, β, , .
∂ξ∂η ∂ξ ∂η ∂α2 ∂β 2 ∂α ∂β
(II) se B 2 − AC = 0 em D (caso em que dizemos que (2.1.1) é parabólica em D), então a forma canônica
de (2.1.1) em G é do tipo

∂2u
 
∂u ∂u
(2.1.9) + F2 ξ, η, u, , = 0.
∂η 2 ∂ξ ∂η
(III) se B 2 − AC < 0 em D (caso em que dizemos que (2.1.1) é elíptica em D), então a forma canônica
de (2.1.1) em G é do tipo

∂2u ∂2u
 
∂u ∂u
(2.1.13) + 2 = F2 ξ, η, u, , .
∂ξ 2 ∂η ∂ξ ∂η
Para obter uma mudança de variáveis, consideremos a equação diferencial ordinária
 2
dy dy
(2.1.14) A − 2B +C =0 se A 6= 0
dx dx
ou
 2
dx dx
(2.1.15) C − 2B +A=0 se C 6= 0.
dy dy
Temos:

(I) se B 2 − AC > 0 em D, então existem duas famílias φ1 (x, y) = k e φ2 (x, y) = k de curvas, chamadas
curvas características de (2.1.1) em D, obtidas como soluções gerais de (2.1.14) ou (2.1.15) e a mudança
de variáveis que reduz (2.1.1) à sua forma canônica (2.1.7) ou (2.1.8) pode ser tomada como ξ = φ1 (x, y) e
η = φ2 (x, y);
B 2 − AC = 0 em D, então (2.1.14) ou (2.1.15) coincidem e denem apenas uma família φ(x, y) = k
(II) se
de curvas, novamente chamadas de curvas características de (2.1.1) em D ; escolhendo uma família de curvas
ψ(x, y) = k de classe C 2 tal que o jacobiano das funções ξ = φ(x, y) e η = ψ(x, y) é diferente de zero em G,
então ξ = φ(x, y) e η = ψ(x, y) é uma mudança de variáveis que reduz (2.1.1) à sua forma canônica (2.1.9)
em G;

B 2 − AC < 0 em D, então (2.1.14) ou (2.1.15) têm uma família φ(x, y) = k de soluções não reais
(III) se
e tomamos ξ = Re(φ(x, y)) e η = Im(φ(x, y)) como uma mudança de variáveis que reduz (2.1.1) à sua forma
canônica (2.1.13) em G.

Observação 2.1.4. 1. A forma canônica de uma equação da forma (2.1.1) não é única e depende da escolha
da mudança de coordenadas.
2. Em algumas situações, a determinação da forma canônica pode ser útil para encontrar a solução geral
de uma equação linear dada. Veremos alguns exemplos a seguir.

41
2.2 Exemplos Resolvidos

Exemplo 2.2.1. A equação unidimensional das ondas c2 uxx − uyy = 0 (c > 0) é o exemplo típico de uma
equação hiperbólica em duas variáveis. Aqui, A = c2 , B = 0, C = −1 e B 2 − AC = c2 > 0; portanto, a
2
equação é hiperbólica em todo o plano R . Suas curvas características podem ser dadas (cf. (2.1.15)) pela
equação diferencial
 2
dx
− + c2 = 0,
dy
dx
que é equivalente a = c ou dx
dydy = −c, cujas soluções são as famílias de retas x + cy = k e x − cy = k .
Usando a mudança ξ = x + cy , η = x − cy , obtemos sua forma canônica uξη = 0. Daqui, concluímos que a
2
solução geral é u(ξ, η) = f (ξ) + g(η), onde f e g são funções de classe C arbitrárias. Logo, a solução geral
2
da equação c uxx − uyy = 0 é
u(x, y) = f (x + cy) + g(x − cy),
onde f e g são funções de classe C2 arbitrárias. ♣

Exemplo 2.2.2. A equação unidimensional do calor c2 uxx − uy = 0 (c > 0) é o exemplo típico de uma
equação parabólica em duas variáveis. Aqui, A = c2 , B = 0, C = 0 e B 2 − AC = 0; portanto, a equação
2
é parabólica em todo o plano R . As curvas características são dadas pela família de retas y = k, uma vez
que elas são dadas (cf. (2.1.14)) pela equação diferencial

 2
2 dy
c = 0.
dx
1
A equação uxx = u é a sua forma canônica.
c2 y

Exemplo 2.2.3. A equação de Laplace bidimensional uxx + uyy = 0 é o exemplo típico de uma equação
elíptica em duas variáveis. Aqui, A = 1, B = 0, C = 1 e B 2 − AC = −1 < 0; portanto, a equação é elíptica
2
em todo o plano R . Ela não tem características reais e já está na sua forma canônica. ♣

As equações descritas nos Exemplos anteriores são as mais simples que apresentam os 3 tipos de com-
portamento (elíptico, parabólico ou hiperbólico) no plano R2 . Em comum, elas têm a propriedade que seu
tipo é constante em todo o plano. O próximo exemplo mostra que o tipo de uma equação pode mudar de
uma região para outra; num certo sentido, ele é o mais simples exemplo de uma equação de tipo misto que
apresenta simultaneamente os 3 tipos da classicação discutida.

Exemplo 2.2.4. Consideremos a equação de Tricomi3


yuxx + uyy = 0. Aqui, temos A = y , B = 0 e C = 1,
2
de modo que B − AC = −y . Portanto, a equação é hiperbólica em D
− = {(x, y) : y < 0} e elíptica em
+
D = {(x, y) : y > 0}. (Por extensão e abuso de linguagem, diremos que ela é parabólica em y = 0, embora
y = 0 não represente um subconjunto aberto do plano.) Vamos determinar sua forma canônica em cada uma
dessas regiões.
Em D− , as curvas características são soluções de (ver (2.1.15))

 2
dx
+ y = 0.
dy

Separando variáveis, obtemos dx = ± −y dy e, portanto, 3x ± 2(−y)3/2 = C é a solução geral. Podemos,
então, tomar
ξ = 3x + 2(−y)3/2 e η = 3x − 2(−y)3/2
como mudança de variáveis: de fato, o jacobiano

3 −3(−y)1/2

∂(ξ, η) = 18(−y)1/2

(x, y) =
∂(x, y) 3 3(−y)1/2
3
Francesco Giacomo Tricomi (1897-1978) foi um matemático italiano. Publicou a equação que leva seu nome em 1923, que
se revelou importante na descrição de objetos movendo-se em velocidade supersônica.

42
ξ+η
é diferente de zero na região D− e a inversa é x= 6 , y = −( ξ−η
4 )
2/3 . Agora, mudamos as variáveis:

ux = uξ ξx + uη ηx = 3(uξ + uη ) e uy = uξ ξy + uη ηy = 3(−y)1/2 (−uξ + uη )

uxx = 3(uξξ ξx + uξη ηx + uηξ ξx + uηη ηx ) = 9(uξξ + 2uξη + uηη )

3
uyy = − (−y)−1/2 [−uξ + uη ] + 3(−y)1/2 [−uξξ ξy − uξη ηy + uηξ ξy + uηη ηy ]
2 √3
3 4
=− [−uξ + uη ] − 9y[uξξ − 2uξη + uηη ].
2 (ξ − η)1/3
Portanto,

√3
3 4
yuxx + uyy = 9y[uξξ + 2uξη + uηη ] − [−uξ + uη ] − 9y[uξξ − 2uξη + uηη ]
√ 2 (ξ − η)1/3
3
3 4
= 36uξη − [−uξ + uη ].
2 (ξ − η)1/3

Logo, a forma canônica em D− é



3
4(uξ − uη )
uξη = − .
24(ξ − η)1/3

Consideremos agora a equação em D+ = {(x, y) : y > 0}. Vamos usar novamente a equação

 2
dx
+y =0
dy
dx √
para determinar as curvas características nessa região. Temos
dy = ±i y e, separando variáveis, obtemos a
solução geral
3x ± 2iy 3/2 = C.
De nossa discussão anterior, tomamos ξ = 3x η = 2y 3/2 .
e Como o jacobiano


∂(ξ, η) 3 0
= 9y 1/2

(x, y) =
∂(x, y) 0 3y 1/2

é diferente de zero na região D+ , ξ = 3x e η = 2y 3/2 é uma mudança de variáveis legítima, com inversa
ξ
x= 3, y= ( η2 )2/3 . Agora, mudamos as variáveis:

ux = uξ ξx + uη ηx = 3uξ , uy = uξ ξy + uη ηy = 3y 1/2 uη e uxx = 3(uξξ ξx + uξη ηx ) = 9uξξ

3 3 3
uyy = y −1/2 uη + 3y 1/2 [uηξ ξy + uηη ηy ] = y −1/2 uη + 3y 1/2 uηη 3y 1/2 = uη + 9yuηη .
2 2 η
1
Portanto, uξξ + uηη + 3η uη =0 é a forma canônica da equação yuxx + uyy = 0 em D+ . ♣

Exemplo 2.2.5. Consideremos a equação x2 uxx − y 2 uyy = 0.


A = x2 , B = 0, C = −y 2 e B 2 − AC =
Temos
x2 y 2 .
Portanto, trata-se de uma equação hiperbólica em cada um dos quadrantes xy > 0 e xy < 0.
Sejam Q1 = {(x, y) : x > 0, y > 0}, Q2 = {(x, y) : x < 0, y > 0}, Q3 = {(x, y) : x < 0, y < 0} e
Q4 = {(x, y) : x > 0, y < 0}.
A equação diferencial das curvas características dessa equação é a mesma em todas as sub-regiões Qi e
é dada por
 2
2 dy
x − y 2 = 0.
dx
dy
Em cada quadrante Qi , temos
dx = ± xy , que têm φ1 (x, y) = xy = k1 e φ2 (x, y) = y
x = k2 como
soluções gerais. Portanto, as curvas características são famílias de semi-retas partindo da origem e hipérboles

43
xy =constante. A mudança ξ = xy , η = xy é uma bijeção de cada Qi em si mesmo, tem jacobiano igual a
2y
x 6= 0 em cada Qi e tem inversa global Qi → Qi dada por
p p p p
x = ξη −1 , y = ξη em Q1 e x = − ξη −1 , y = − ξη em Q3 ;
p p p p
x = − −ξη −1 , y = −ξη em Q2 e x = −ξη −1 , y = − −ξη em Q4 ;
y
Agora, fazemos a mudança ξ = xy , η = x:

y 1
ux = uξ ξx + uη ηx = yuξ − uη e uy = uξ ξy + uη ηy = xuξ + uη ;
x2 x

uxx = y(uξξ ξx + uξη ηx ) + x2y3 uη − xy2 (uηξ ξx + uηη ηx )


= y[yuξξ + (− xy2 )uξη ] + x2y3 uη − xy2 [yuηξ + uηη (− xy2 )]
2 2
= y 2 uξξ − 2 xy 2 uξη + xy 4 uηη + x2y3 uη .
uyy = x(uξξ ξy + uξη ηy ) + x1 (uηξ ξy + uηη ηy ) = x(xuξξ + x1 uξη ) + x1 (xuηξ + x1 uηη )
= x2 uξξ + 2uξη + x12 uηη .
Portanto, x2 uxx − y 2 uyy = −4ξηuξη + 2ηuη . Logo,

1
uξη = uη

é a forma canônica de x2 uxx − y 2 uyy = 0. ♣

Exemplo 2.2.6. Considere a equação uxx + 2uxy + uyy = 2ux − 2uy + 3. Temos A = 1, B = 1, C = 1 e
B2 − AC = 0. Portanto, trata-se de uma equação parabólica em todo o plano R2 . As curvas caraterísticas
satisfazem  2
dy dy
−2 + 1 = 0,
dx dx
dy
isto é,
dx = 1. Portanto, as curvas características constituem uma família de retas x − y = k e tomamos
ξ = x−y como uma nova variável. Agora, queremos determinar outra variável η = η(x, y) de modo que o
jacobiano
∂(ξ, η) 1 −1
(x, y) =
∂(x, y) ηx ηy
seja não nulo. Existem innitas escolhas para η , mas vamos escolher η(x, y) = y . Então, o jacobiano é igual
a 1 e (x, y) 7→ (ξ, η) tem uma inversa global x = ξ + η e y = η . Agora, fazemos a mudança ξ = x − y , η = y :

ux = uξ ξx + uη ηx = uξ e uy = uξ ξy + uη ηy = −uξ + uη ;

uxx = uξξ ξx + uξη ηx = uξξ , uxy = uξξ ξy + uξη ηy = −uξξ + uξη


uyy = (−uξξ ξy − uξη ηy ) + (uηξ ξy + uηη ηy ) = uξξ − 2uξη + uηη .
Substituindo na equação, obtemos sua forma canônica

uξξ + 2(−uξξ + uξη ) + uξξ − 2uξη + uηη = 2uξ − 2(−uξ + uη ) + 3,

isto é, uηη = 4uξ − 2uη + 3. A mudança u = e−η v transforma essa última na equação vηη = 4vξ + 3eη . ♣

Exemplo 2.2.7.
2
Mostre que a equação uxx + x2 uxy − ( x2 + 14 )uyy = 0 é hiperbólica em todo plano xy .
Determine as curvas características e represente-as geometricamente

Solução. x2 2 2 2
Temos A = 1, B = 2 , C = −( x2 + 14 ) e, portanto, B 2 − AC = 14 [x4 + x2 + 41 ] = 1 2
2 (x + 21 ) >0
2
para todo (x, y). Portanto, a equação é hiperbólica em R . As curvas características são determinadas pelas
soluções da equação ordinária
2
x2 1
  
dy dy2
−x − + = 0.
dx dx 2 4

44
Resolvendo, obtemos

dy x2 ± x4 + 2x2 + 1 x2 ± (x2 + 1)
= =
dx 2 2
dy dy x3
e, portanto,
dx = x2 + 12 ou
dx = − 12 . A primeira equação fornece y= 3 + x2 + C1 e a segunda, y = − x2 + C2
cúbicas y = x3 + x2 + C1 e uma família
3
como soluções. Assim, as curvas características são uma família de
de retas y = − x2 + C2 , onde C1 e C2 são constantes arbitrárias.

Desta forma, podemos tomar φ1 (x, y) = 2x3 + 3x − 6y e φ2 (x, y) = x + 2y para expressar a solução
geral de cada uma das equações características na forma φ1 (x, y) = C1 e φ2 (x, y) = C2 . Agora, tomamos
ξ = 2x3 + 3x − 6y e η = x + 2y como mudança de variáveis. O jacobiano destas funções com relação a x e a y
2
é igual a 12(x + 1) a, assim, a transformação é localmente inversível em torno de cada ponto do plano, com

inversa de classe C . Para mostrar que a mudança de variáveis é inversível em todo o plano, eliminamos
2y = η − x da segunda equação; substituindo na primeira, obtemos a seguinte equação para determinar x:

2x3 + 6x − ξ − 3η = 0. (2.2.1)

Como é fácil vericar, essa última equação tem uma única raiz real x = x(ξ, η) para quaisquer valores de ξ
e η. A inversa é então dada por x = x(ξ, η) e y = 21 (η − x(ξ, η)). Isso demonstra a armação.

Efetuando a mudança de variáveis indicada, obtemos a forma canônica da equação dada em todo o plano.
Aplicação cuidadosa da Regra de Cadeia conduz à forma canônica:

ux = uξ ξx + uη ηx = 3(2x2 + 1)uξ + uη e uy = uξ ξy + uη ηy = −6uξ + 2uη ;

uxx = (2x2 + 1)2 uξξ + 6(2x2 + 1)uξη + uηη + 12xuη , uyy = 4[9uξξ − 6uξη + uηη ]
uxy = −18(2x2 + 1)uξξ + 12x2 uξη ηy + 2uηη .
Substituindo na equação, obtemos

12(x2 + 1)2 uξξ + 12xuξ = 0.

Portanto, a forma canônica é dada por


uξη = q(ξ, η)uξ ,
−x
onde q(ξ, η) = (1+x2 )2
e x = x(ξ, η) é a única solução real de (2.2.1). ♣

Exemplo 2.2.8. Determine a forma canônica e dê a solução geral da equação diferencial parcial

uxx + 3uxy − 4uyy = x + y.

Solução. Trata-se de uma equação linear com coecientes constantes e não-homogênea. Vamos primeiro
procurar uma solução particular da equação não-homogênea. A forma especial do termo não-homogêneo
(x + y) sugere procurar uma solução particular, usando o Princípio da Superposição, como soma de duas
soluções particulares:
x3
u1p dependendo só de x: u001p = x implica u1p (x) = 6
3
u2p dependendo só de y : −4u001p = y implica u1p (x) = − y24 .
x3 y3
Logo, up (x, y) = 6 − 24 é uma solução particular de uxx + 3uxy − 4uyy = x + y .
Agora, vamos considerar a equação homogênea uxx + 3uxy − 4uyy = 0. Como B 2 − AC = 9 + 4 = 13,
temos uma equação hiperbólica, cujas características são soluções da equação
 2  
dy dy
−3 − 4 = 0.
dx dx
dy dy
Logo,
dx = −1 e
dx = 4, cujas soluções são dadas por y = −x + C1 e y = 4x + C2 . Tomemos ξ =x+y
e η = 4x − y como mudança de variáveis. Temos:

ux = uξ ξx + uη ηx = uξ + 4uη uy = uξ ξy + uη ηy = uξ − uη

45
uxx = (uξξ ξx + uξη ηx ) + 4(uηξ ξx + uηη ηx ) = uξξ + 8uξη + 16uηη
uxy = (uξξ ξy + uξη ηy ) + 4(uηξ ξy + uηη ηy ) = uξξ + 3uξη − 4uηη
uyy = (uξξ ξy + uξη ηy ) − (uηξ ξy + uηη ηy ) = uξξ − 8uξη + uηη .
Logo,

uxx + 3uxy − 4uyy = (uξξ + 8uξη + 16uηη ) + 3(uξξ + 3uξη − 4uηη ) − 4(uξξ − 8uξη + uηη )
= 49uξη .

Portanto, a forma canônica é uξη = 0. Integrando com relação a η, obtemos uξ (ξ, η) = f1 (ξ) e integrando
com relação a ξ,
u(ξ, η) = f (ξ) + g(η),
onde f e g são funções arbitrárias. Portanto, u(x, y) = f (x + y) + g(4x − y) é a solução geral da equação
homogênea. Logo, pelo Princípio da Superposição,

x3 y3
u(x, y) = − + f (x + y) + g(4x − y)
6 24
é a solução geral da equação original, onde f e g são funções arbitrárias. ♣

Exemplo 2.2.9. Determine a região em que a equação é elíptica, parabólica ou hiperbólica, e reduza-a à
forma canônica:

(a) x2 uxx − 2xyuxy + y 2 uyy = 0 (b) uxx + 2uxy + 5uyy − 3ux + 5uy = 0
Solução. (a) Como o discriminante B 2 − AC = (−2xy)2 − 4(x2 )(y2 ) ≡ 0 , concluímos que a equação é
parabólica em todo o plano R2 e a equação que fornece as características é dada por
 2    2  
2 dy dy 2 2 dx dx
(∗) x + 2xy +y =0 ou y + 2xy + x2 = 0,
dx dx dy dy

correspondentes aos casos x 6= 0 ou y 6= 0, respectivamente. Observe que os pontos sobre os eixos x e y são
pontos singulares destas equações e devemos esperar surpresas:
(i) se x 6= 0, então (*) tem a única solução

dy y
=− ;
dx x
(ii) se y 6= 0, então (*) tem a única solução

dx x
=− .
dy y
dy
Como
dx = − xy e
dx
dy = − xy são equações diferenciais ordinárias com variáveis separáveis, é muito fácil
obter suas soluções: nos dois casos, a solução geral é dada por xy = C , onde C é uma constante arbitrária.

A equação que determina as características sugere que podemos tomar ξ = xy como uma das funções que
compõem a mudança de variáveis que conduz a equação dada à sua forma canônica. A outra função deverá
ser escolhida como uma função η = η(x, y) tal que o jacobiano

∂(ξ, η) y x
=
∂(x, y) ηx ηy

seja diferente de zero em toda a região considerada.

Vamos escolher η = y e considerar qualquer um dos semiplanos


D+ = {(x, y) : y > 0} ou D− = {(x, y) : y < 0}
∂(ξ,η)
como nossa região de interesse. Com essa escolha, o jacobiano
∂(x,y) é igual a y e é muito simples vericar
ξ
que a transformação T : (x, y) ∈ D± 7→ (ξ, η) ∈ D± é injetora, sobrejetora e tem inversa x= η, y = η. Pelo

46
Teorema da Função Inversa, ela é um difeomorsmo de classe C∞ e, portanto, é uma legítima mudança de
variáveis em D
+ e em D− .
Vamos, portanto, tomar qualquer um dos semiplanos

D+ = {(x, y) : x > 0} ou D− = {(x, y) : y < 0}.

como nossa região de interesse e considerar a mudança de variáveis

(†) ξ = xy , η = y.

Com essa escolha, calculamos ξx = y , ηx = 0, ξy = x, ηy = 1,

ux = uξ ξx + uη ηx = yuξ uy = uξ ξy + uη ηy = xuξ + uη

uxx = y(uξξ ξx + uξη ηx ) = y 2 uξξ


uxy = uξ + y(uξξ ξy + uξη ηy ) = uξ + xyuξξ + yuξη
uyy = x(uξξ ξy + uξη ηy ) + (uξη ξy + uηη ηy ) = x2 uξξ + 2xuξη + uηη .
Substituindo na equação x2 uxx − 2xyuxy + y 2 uyy = 0, obtemos

x2 y 2 uξξ − 2xyuξ − 2x2 y 2 uξξ − 2xy 2 uξη + x2 y 2 uξξ + 2xy 2 uξη + y 2 uηη = 0

isto é, y 2 uηη − 2xyuξ = exy , ou seja, η 2 uηη − 2ξuξ = 0. Portanto, uηη = u é a forma canônica de
η2 ξ
x2 uxx − 2xyuxy + y 2 uyy = 0 no sistema de coordenadas ξη .
(b) Consideremos agora a equação uxx + 2uxy + 5uyy − 3ux + 5uy = 0. Como o discriminante B 2 − AC =
(2)2 − 4(1)(5) = −16, concluímos que se trata de uma equação elíptica em todo o plano R2 . A equação que
fornece as características (não reais!) é dada por

 2  
dy dy
(∗) −2 + 5 = 0,
dx dx
dy
ou seja,
dx = 1 ± 2i. Agora, a solução geral é dada por −y + x ± 2xi = C , onde C é uma constante arbitrária.
Tomando partes real e imaginária, a mudança de variáveis sugerida é

(†) ξ =x−y , η = 2x.

Com essa escolha, temos ux = uξ ξx + uη ηx = uξ + 2uη , uy = uξ ξy + uη ηy = −uξ ,

uxx = (uξξ ξx + uξη ηx ) + 2(uηξ ξx + uηη ηx ) = uξξ + 4uξη + 4uηη

uxy = −(uξξ ξx + uξη ηx ) = −uξξ − 2uξη e uyy = −(uξξ ξy + uξη ηy ) = uξξ .


Substituindo na equação uxx + 2uxy + 5uyy − 3ux + 5uy = 0, obtemos

uξξ + 4uξη + 4uηη + 2(−uξξ − 2uξη ) + 5uξξ − 3(uξ + 2uη ) + 5(−uξ ) = 0

isto é,
4uξξ + 4uηη − 8uξ − 6uη = 0.
Portanto, a forma canônica de uxx + 2uxy + 5uyy − 3ux + 5uy = 0 no sistema de coordenadas ξη é
3
uξξ + uηη = 2uξ + 2 uη .
Vamos procurar uma mudança de variável u(ξ, η) = v(ξ, η)eαξ+βη com o objetivo de eliminar os termos
que contém derivadas de primeira ordem. Temos

uξ = (αv + vξ )eαξ+βη e uη = (βv + vη )eαξ+βη ,

uξξ = (αvξ + vξξ + α2 v + αvξ )eαξ+βη e uηη = (βvη + vηη + β 2 v + βvη )eαξ+βη ,

47
Substituindo e cancelando o fator eαξ+βη , obtemos

3
2αvξ + vξξ + α2 v + 2βvη + vηη + β 2 v = 2(αv + vξ ) + (βv + vη ),
2
isto é,    
3 2 2 3
vξξ + vηη = 2α + β − α − β v + (2 − 2α)vξ + − 2β vη .
2 2
Escolhendoα = 1 e β = 43 , os coecientes do termos contendo derivadas primeira são nulos e como
2α + 32 β − α2 − β 2 = 25
16 , concluímos que
25
vξξ + vηη = v
16
é a forma canônica procurada. ♣
Exemplo 2.2.10. Determine a solução geral das seguintes equações diferenciais parciais:
2
(a) x uxx + 2xyuxy + y 2 uyy + xyux + y 2 uy = 0 (b) xuxx − yuxy + ux = 0
Solução. (a) Como B 2 − AC = (2xy)2 − 4(x2 )(y 2 ) ≡ 0, concluímos que a equação é parabólica em todo o
2
plano R . A equação que fornece as características é dada por

 2    2  
2 dy dy 2 2 dx dx
(∗) x − 2xy +y =0 ou y − 2xy + x2 = 0,
dx dx dy dy
correspondentes aos casos x 6= 0 ou y 6= 0, respectivamente. Observe que os pontos sobre os eixos x e y são
pontos singulares destas equações e, mais uma vez, devemos esperar surpresas:
(i) se x 6= 0, então (*) tem a única solução

dy y
= ;
dx x
(ii) se y 6= 0, então (*) tem a única solução

dx x
= .
dy y
dy y dx x
Novamente,
dx = x e dy = y são equações diferenciais ordinárias com variáveis separáveis e é muito fácil
obter suas soluções: no primeiro caso, a solução geral é dada por y = Cx e no segundo, x = Cy , onde C
é uma constante arbitrária. Qualquer uma delas exclui um dos eixos coordenados e, por essa razão, vamos
examinar a equação em cada um dos 4 quadrantes abertos

Q1 = {(x, y) : x > 0, y > 0} , Q2 = {(x, y) : x < 0, y > 0},

Q3 = {(x, y) : x < 0, y < 0} e Q4 = {(x, y) : x > 0, y < 0}.

A equação que determina as características sugere que podemos tomar ξ = y


x como uma das funções que
compõem a mudança de variáveis que conduz a equação dada à sua forma canônica. A outra função deverá
ser escolhida como uma função η = η(x, y) tal que o jacobiano
∂(ξ, η) − xy2 1


= x
∂(x, y) ηx ηy

seja diferente de zero em toda a região considerada.

Em denitivo, vamos tomar qualquer um dos quadrante Qj (j = 1, 2, 3, 4) como nossa região de interesse
e vamos escolher η=y como segunda equação para compor nossa mudança de variáveis:

y
(†) ξ= , η = y.
x
∂(ξ,η)
Com essa escolha, o jacobiano
∂(x,y) é igual a − xy2 e é muito simples vericar que a transformação
η
T : (x, y) ∈ Qj 7→ (ξ, η) ∈ D, onde D é um dos Qk , é injetora, sobrejetora e tem inversa x= ξ, y = η. Pelo

48
Teorema da Função Inversa, ela é um difeomorsmo de classe C∞ e, portanto, é uma legítima mudança de
variáveis.
[ Observação. Verique que D = Qj se j=1 ou j = 2, D = Q4 se j=3 e D = Q3 se j = 4.]
Com essa escolha, calculamos ξx = − xy2 , ηx = 0, ξy = 1
x, ηy = 1,

y 1
ux = uξ ξx + uη ηx = − uξ uy = uξ ξy + uη ηy = uξ + uη
x2 x
y2 2y y y 1
uxx = uξξ + 3 uξ uxy = −
uξξ − 2 uξη − 2 uξ
x4 x x3 x x
1 1 2
uyy = (uξξ ξy + uξη ηy ) + (uξη ξy + uηη ηy ) = 2 uξξ + uξη + uηη .
x x x
Substituindo, o Lado Esquerdo (LE) da equação (a) se torna LE=

y2 y2 2y 2 y2 y2
 
2y y y 1 2
uξξ + uξ + 2xy − uξξ − uξη − uξ + uξξ + uξη + y uηη − uξ + uξ + y 2 uη
x2 x x3 x2 x2 x2 x x x

isto é,
LE = y 2 uηη + y 2 uη = η 2 (uηη + uη ).

Portanto, com essa escolha de coordenadas a forma canônica da equação x2 uxx + 2xyuxy + y2 uyy + xyux +
y 2 uy =0 em qualquer um dos quatro quadrantes abertos é uηη + uη = 0.
Para obtermos a solução geral desta última, integramos com relação a η, obtendo uη + u = f (ξ), que
pode ser escrita como
(eη u(ξ, η))η = f (ξ)eη .
Integrando novamente com relação a η, concluímos que

u(ξ, η) = f (ξ) + g(ξ)e−η .

Voltando às variáveis originais, concluímos que uma expressão para a solução geral da equação dada é

y y
u(x, y) = f + e−y g ,
x x
onde f e g são funções arbitrárias.

(b) Agora, consideremos a equação xuxx −yuxy +ux = 0. Como o discriminante é B 2 −AC = (−y)2 −4(x)(0) =
y2 > 0 para y 6= 0, concluímos que a equação é hiperbólica nos dois semi-planos D
+ = {(x, y) : y > 0} e

D− = {(x, y) : y < 0}. A equação que fornece as características é dada por

 2  
dy dy
(∗) x +y = 0,
dx dx

cujas soluções são


dy dy
=0 e x + y = 0.
dx dx
As famílias de soluções destas equações ordinárias são

y = C1 e xy = C2 ,

onde C1 e C2 são constantes arbitrárias. Isso nos leva a considerar ξ=y e η = xy como mudança de variáveis
para a determinação da forma canônica. Entretanto, o fato de que o jacobiano


∂(ξ, η) 0 1
= = −y
∂(x, y) y x

implica que devemos considerar os casos y>0 e y<0 separadamente.

49
Vamos primeiro examinar o caso y > 0. Nesse caso, a transformação

0
(x, y) ∈ D+ = {(x, y) : y > 0} 7→ (ξ, η) ∈ D+ = {(ξ, η) : ξ > 0}

é um difeomorsmo de classe C∞ cuja inversa é dada pela transformação


0 7→ (x, y) ∈ D +
(ξ, η) ∈ D+ denida
por x= η
ξ, y = ξ. Logo, essa mudança é uma legítima mudança de variáveis.
O caso y<0 admite um tratamento análogo. Nesse caso, a transformação

(x, y) ∈ D− = {(x, y) : y < 0} 7→ (ξ, η) ∈ D−


0
= {(ξ, η) : ξ < 0}

é um difeomorsmo de classe C∞ 0 7→ (x, y) ∈ D − denida


(ξ, η) ∈ D−
cuja inversa é dada pela transformação
η
por x = , y
ξ = ξ . Logo, essa mudança é também uma legítima mudança de variáveis. Temos: ξx = 0, ηx = y ,
ξy = 1, ηy = x,
ux = uξ ξx + uη ηx = yuη uy = uξ ξy + uη ηy = uξ + xuη
uxx = y(uηξ · 0 + yuηη ) = y 2 uηη uxy = uη + y(uηξ · 1 + xuηη ) = uη + yuηξ + xyuηη .
Portanto,

xuxx − yuxy + ux = xy 2 uηη − y(uη + yuηξ + xyuηη ) + yuη = −y 2 uξη = −ξ 2 uξη .

Assim, a forma canônica da equação xuxx − yuxy + ux = 0 em D (ou em D0 ) é uξη = 0.


Integrando com relação a η, obtemos uξ = f1 (ξ), que, integrando com relação a ξ, resulta em

u(ξ, η) = f (ξ) + g(η),

onde f e g são funções arbitrárias.

Voltando às variáveis x e y, podemos escrever a solução geral da equação proposta como

u(x, y) = f (y) + g(xy),

onde f e g são funções arbitrárias. ♣

2.3 Observação Final

Os conceitos tratados na Seção anterior podem ser generalizados para dimensão n ≥ 3, com devidas adapta-
ções. O estudo sistemático destas questões foge ao alcance de nosso objetivo imediato; por isso, vamos nos
concentrar apenas nas equações clássicas da Física Matemática, a saber:

(I) a equação de Laplace: ∆u = f (x)


(II) a equação das ondas: utt = c2 ∆u + f (x, t)
(III) a equação de transmissão de calor: ut = c2 ∆u + f (x, t)
A notação ∆u indica o operador Laplaciano de u e é denido como
n
∂2u ∂2u X ∂2u
∆u(x) = (x) + ... + (x) = (x).
∂x21 ∂x2n
i=1
∂x2i

Essas 3 constituem os protótipos de equações elípticas, hiperbólicas e parabólicas, que serão discutidas
nos próximos capítulos.

50
Capítulo 3

Séries de Fourier

3.1 Introdução

Séries de Fourier tem sua origem no nal do século XVIII e seu nome é uma merecida homenagem ao
gênio criador desse conceito, J. B. Joseph Fourier .
1 Originalmente, esse conceito foi introduzido como
um ferramental matemático para estudar as soluções de problemas envolvendo transmissão de calor. A
contribuição de Fourier na compreensão da natureza do calor e sua transmissão causaram um forte impacto
nas ciências naturais e no pensamento humano e suas investigações deixaram um legado rico e fértil para o
desenvolvimento da própria Matemática que perduram até hoje. Praticamente, todo o desenvolvimento da
Matemática dos séculos XIX e XX, de uma forma ou outra, giraram em torno do estudo da convergência de
uma série trigonométrica. Sem sombra de dúvida, elas foram as responsáveis por todo o desenvolvimento da
Análise Clássica e lançaram as bases do que hoje conhecemos por Análise Moderna e suas áreas ans. Vale a
pena a consultar o sítio https://mathshistory.st-andrews.ac.uk/Biographies/Fourier/ para a leitura de uma
breve biograa de J. Fourier.
Nessas notas, vamos abordar uma pequena porção desta imensa área do conhecimento em um nível de
razoável profundidade, que lhe permitirá apreciar, não só a beleza do tema, como também sua aplicação na
solução de diversos problemas concretos .
2

3.2 A Origem das Séries de Fourier - Uma Explicação

Por razões didáticas, vamos apresentar um tratamento com séries de Fourier na solução de um problema
de natureza completamente diferente de sua origem: o problema de uma corda vibrante. Historicamente, o
problema de uma corda vibrante homogênea (como as de um instrumento musical) antecede Fourier e foi
estudado por diversos matemáticos do século XVIII - como, por exemplo, Jean le Rond d'Alembert (1717
Paris -1783 Paris), Leonhard Euler (1707 Basiléia -1783 São Petersburgo), Daniel Bernoulli (1700 Países
Baixos -1782 Basiléia), e Joseph-Louis Lagrange (1736 Turim -1813 Paris) - e consiste (em sua forma mais
simples) em determinar uma função u : (0, `) × (0, ∞) → R que satisfaz a equação diferencial parcial

∂2u 2
2∂ u
(x, t) = c (x, t)
∂t2 ∂x2

para todos x ∈ (0, `) e t>0 e ainda as condições de fronteira u(0, t) = u(`, t) = 0. Aqui, c é uma constante
positiva, que depende da massa da corda e de sua elasticidade.

Na equação diferencial acima mencionada, u = u(x, t) representa a posição, no instante t > 0, do ponto
x ∈ (0, `) ao longo do movimento transversal causado pela vibração de uma corda elástica, que supomos ter
comprimento `. As condições de fronteira u(0, t) = u(`, t) = 0 signicam que as extremidades x=0 e x=`
são mantidas xas durante todo o movimento da corda e são chamadas condições de Dirichlet.
1
Jean-Baptiste Joseph Fourier (21 de março de 1768, Auxerre - 16 de maio de 1830, Paris) foi um matemático e físico francês,
célebre por iniciar a investigação sobre a decomposição de funções periódicas em séries trigonométricas convergentes chamadas
séries de Fourier e a sua aplicação aos problemas da condução do calor.
2
Para um estudo mais profundo, veja N. K. Bary [2].

51
Como equação de segunda ordem em t, para determinarmos o movimento, precisamos fornecer a posição
inicial de cada ponto x ∈ (0, `), bem como sua velocidade inicial. Para isso, supomos que cada ponto x da
corda tem posição inicial u(x, 0) = φ(x) e velocidade inicial ut (x, 0) = ψ(x), 0 < x < `, onde φ, ψ : [0, `] → R
são funções dadas. Desta forma, u deverá ser solução do seguinte problema de valor de fronteira (ou problema
de contorno) 
 ∂2u 2
2∂ u
(x, t) = c (x, t), 0 < x < `, t > 0 (3.2.1)
∂t2 ∂x2
 u(0, t) = u(`, t) = 0, t≥0
e condição inicial
u(x, 0) = φ(x) , ut (x, 0) = ψ(x), para 0 ≤ x ≤ `. (3.2.2)

Vamos procurar solução de (3.2.1) seguindo o método proposto originalmente por Fourier. Esse método
recebe hoje o nome de método de Fourier ou método de separação de variáveis (a razão deste último é
explicada pela sua metodologia) e consiste em procurar soluções de (3.2.1) na forma do produto de duas
funções de variáveis separadas u(x, t) = X(x)T (t). As funções não nulas X e T , denidas em (0, `) e
0 < t < ∞, respectivamente, devem então satisfaz a condição X(x)T 00 (t) = c2 X 00 (x)T (t) (notação 0 está
sendo empregada para indicar derivada tanto com relação a x quanto a t, mas isso não causará confusão).
Segue-se que
1 T 00 (t) X 00 (x)
= .
c2 T (t) X(x)
Como o lado esquerdo depende apenas de t e o lado direito apenas de x, os dois membros devem ser constantes
e, portanto, existe uma constante λ tal que

T 00 (t) = λc2 T (t) e X 00 (x) = λX(x)


para todos t>0 e 0 < x < `.
Vamos examinar as soluções de X 00 (x) = λX(x) com condição de fronteira X(0) = X(`) = 0. O valor
λ = 0 conduz à solução geral X(x) = Ax + B e, para satisfazer X(0) = X(`) = 0,√devemos√ter A = B = 0 e
X é a solução nula, que não nos interessa. Se λ > 0, a solução geral é X(x) = Ae
x λ + B −x λ e as condições
√ √
de fronteira implicam A + B = 0 e Ae
` λ + B −` λ = 0; novamente, concluímos que A = B = 0. Se λ < 0, a
√ √
solução geral é X(x) = A cos (x −λ) + B sen (x −λ); as condições de fronteira implicam

A=0 e B sen (` −λ) = 0.

Como queremos uma solução não nula, devemos tomar λ de modo que sen (` −λ) = 0, isto é,
 nπ 2
λ = λn := − , com n = 1, 2, . . . .
`
As correspondentes soluções de X 00 (x) = λn X(x) são então dadas por
 nπx 
X(x) = Xn (x) = sen , com n = 1, 2, . . . .
`
Agora, para cada n ≥ 1, a solução geral da equação T 00 (t) = c2 λn T (t) é
   
cnπt cnπt
T (t) = Tn (t) = an cos + bn sen ,
` `
onde an e bn são constantes arbitrárias.

Assim, para cada inteiro n ≥ 1, a função


    
cnπt cnπt  nπx 
un (x, t) = an cos + bn sen sen ,
` ` `
é uma solução de (3.2.1). Como a equação diferencial de (3.2.1) é linear, soma de um número nito arbitrário
de soluções é ainda uma solução de (3.2.1) e, portanto, qualquer função da forma

N     
X cnπt cnπt  nπx 
uN (x, t) = an cos + bn sen sen
` ` `
n=1

52
é ainda uma solução de (3.2.1), para qualquer escolha de constantes arbitrárias an e bn .
Todavia, funções da forma uN conduzem a soluções de (3.2.1) cujos valores iniciais são apenas polinômios
trigonométricos: o dado inicial φ deve ser uma função da forma
N
X  nπx 
φ(x) = uN (x, 0) = an sen .
`
n=1

Essa observação deve ter encorajado Fourier a considerar funções que pudessem ser representadas por somas
de uma série innita da forma
∞     
X cnπt cnπt  nπx 
u(x, t) = an cos + bn sen sen .
` ` `
n=1

Ainda assim, persiste a seguinte pergunta: como devem ser escolhidos os coecientes an e bn para que
u(x, 0) = φ(x) e ut (x, 0) = ψ(x)? Agindo de modo puramente formal e admitindo que as séries envolvidas são
convergentes para todos os valores de x ∈ [0, `] e t ≥ 0, a solução u deverá satisfazer as seguintes condições
em t = 0:

X  nπx 
φ(x) = an sen
`
n=1

e [derivando formalmente a série para u(x, t) com relação a t e colocando t = 0],



cπ X  nπx 
ψ(x) = nbn sen .
` `
n=1

Esse era um problema novo na época de Fourier: dada uma função arbitrária φ : [0, `] → R satisfazendo
φ(0) = φ(`) = 0, existe uma sequência {an }∞
n=1 de números reais tais que, para 0 ≤ x ≤ `, temos

X  nπx 
φ(x) = an sen ? (3.2.3)
`
n=1

Acreditando ser possível, Fourier partiu em busca da determinação da sequência dos coecientes {an }.
kπx

Seu raciocínio: para cada inteiro k ≥ 1, multiplique (3.2.3) pela função sen ` e integre em [0, `]; obtemos

Z `   ∞
Z `X  
kπx  nπx  kπx
φ(x) sen dx = an sen sen dx.
0 ` 0 n=1 ` `

De maneira ainda puramente formal, trocando a ordem entre integral e soma, obtemos
Z `   ∞ Z `  
kπx X  nπx  kπx
φ(x) sen dx = an sen sen dx.
0 ` 0 ` `
n=1

Como Z `   
 nπx  kπx 0 , se n 6= k
sen sen dx = `
0 ` ` 2 , se n=k
concluímos que
Z `  
2 kπx
ak = φ(x) sen dx. (3.2.4)
` 0 `
De maneira análoga, obtemos
Z `  
2 kπx
cπkbk = ψ(x) sen dx. (3.2.5)
` 0 `
Desta forma, outra das grandes contribuições que Fourier legou ao mundo foi o de examinar a possibilidade
de expressar uma função arbitrária como soma de uma série trigonométrica. Fourier estava rmemente
convencido desta possibilidade. Observemos que, até então, apenas funções dadas por somas de séries de

53
potencias eram conhecidas. Esse era, portanto, um problema novo em sua época e muitos o receberam com
reservas - anal, perto de 50 anos deveriam se passar para que Dirichlet, Dedekind e outros formulassem
uma denição satisfatória do conceito de função. A resposta a essa pergunta tornou-se preocupação central
dos matemáticos, dominando as pequisas por praticamente todo o século 19.

De todo modo, como veremos, quando φ e ψ satisfazem algumas hipóteses adicionais, a formula obtida por
Fourier para a solução do problema (3.2.1), (3.2.2) é correta e hoje ela pode ser enunciada como uma espécie
de algorítmo: dadas funções integráveis φ, ψ : [0, `] → R satisfazendo φ(0) = φ(`) = 0 e ψ(0) = ψ(`) = 0,
obtenha as sequências {an } e {bn } denidas por (3.2.4) e (3.2.5) e considere a função u(x, t) denida por
∞     
X nπct nπct  nπx 
u(x, t) = an cos + bk sen sen .
` ` `
n=1

Então, u é uma solução de (3.2.1) e (3.2.2). (Bem entendido, é uma solução desde que ela esteja bem denida
e que se possa trocar integração com soma innita - discutiremos esses conceitos mais adiante.) A expressão
da solução mostra ainda que todas as soluções da equação das ondas (3.2.1) é uma função periódica com
2` 2`
relação à variável t, de período mínimo
c : u(x, t + c ) = u(x, t) para todos x e t.
Terminamos essa Seção examinando um exemplo simples.

Exemplo 3.2.1. Suponha que `=π e que φ pulso triangular unitário num ponto 0 < x0 < π, isto é,
é um
uma função (cujo gráco segue abaixo) dada por φ(x) = 1δ (x−x0 +δ) se x0 −δ ≤ x ≤ x0 , φ(x) = − 1δ (x−x0 −δ)
se x0 ≤ x ≤ x0 + δ e φ(x) = 0 se |x − x0 | > δ (com 0 < δ < x0 ) e que ψ ≡ 0.

y
(x0 , 1)

x0 − δ x0 x0 + δ π x

Então, bn = 0 para todo n e an é dado por

Z π Z x0 Z x0 +δ 
2 2 1 1
an = φ(x) sen nx dx = (x − x0 + δ) sen nx dx − (x − x0 − δ) sen nx dx .
π 0 π x0 −δ δ x0 δ

Temos

  x0  x0 +δ
πδ cos nx 1 cos nx 1
an = −(x − x0 + δ) + 2 sen nx − −(x − x0 − δ) + 2 sen nx
2  n n x0 −δ  n n x0 
−δ cos nx0 sen nx0 sen n(x0 − δ) sen n(x0 + δ) δ cos nx0 sen nx0
= + − − − −
n n2 n2 n2 n n2
1 2
= 2 [2 sen nx0 − sen n(x0 − δ) − sen n(x0 + δ)] = [2 sen nx0 − 2 sen (nx0 ) cos(nδ)]
n πδn2
2 sen(nx0 )
= [1 − cos(nδ)].
n2
Portanto,

4 X sen(nx0 )[1 − cos(nδ)]
u(x, t) = cos nct sen nx. (3.2.6)
πδ n2
n=1

é a solução de (3.2.1), (3.2.2) (com ψ = 0). ♣


Antecipando resultados que só mais tarde seriam obtidos por diversos outros matemáticos (dentre os
quais K. Weierstrass (1815-1897)), podemos hoje armar que a série (3.2.6) é uniformemente e absolutamente
convergente para todos os valores de x e de t e, como consequência, a troca entre integral e soma innita está
justicada nesse exemplo. Portanto, a função denida por (3.2.6) é, de fato, uma solução genuína de (3.2.1)
e (3.2.2) (isto é, u é uma função de classe C2 em (x, t) ∈ Ω := (0, `) × (0, ∞), satisfaz a equação utt = c2 uxx

54
em Ω, u é contínua em Ω̄ e satisfaz as condições iniciais e de fronteira de Ω̄). Deste fato, decorre que a função
inicial φ pode ser representada como soma da série absolutamente e uniformemente convergente

4 X sen(nx0 )[1 − cos(nδ)]
φ(x) = sen nx
πδ n2
n=1

para todo x ∈ [0, π].


Algumas observações devem ser feitas. Na última identidade, a função do lado esquerdo está denida
apenas quando 0≤x≤π enquanto que a do lado direito está denida para todo x real. Que conclusão
podemos tirar disso? Como cada parcela da soma do lado direito é uma função ímpar, a função soma
resultante S(x) é também uma função ímpar denida em toda a reta real [S(−x) = −S(x) para todo
x]; como S(x) = φ(x) em [0, π], a função S é a extensão ímpar 2π -periódica φ̃ de φ a (−∞, ∞), isto é,
S(x) = φ̃(x) para todo x, onde φ̃ é a função dada por φ̃(x) = φ(x) se x ∈ [0, π], φ̃(x) = −φ(−x) se
x ∈ [−π, 0] e φ̃(x + 2π) = φ̃(x) para todo x ∈ R.
Usando a identidade 2 sen nx cos nct = sen(n(x + ct)) + sen(n(x − ct)), temos


2 X sen(nx0 )[1 − cos(nδ)]
u(x, t) = [sen(n(x + ct)) + sen(n(x − ct))]
πδ n2
n=1

e, portanto, podemos escrever u na forma

1
u(x, t) = [φ(x + ct) + φ(x − ct)],
2
que é a expressão obtida por D'Alembert para uma solução de (3.2.1), (3.2.2).

Essa última expressão revela que para t > 0, o gráco da função x ∈ [0, π] 7→ u(x, t) é a média de duas
ondas de perl φ: uma que se desloca para a esquerda com velocidade ct e outra que se desloca para a direita
com mesma velocidade. O leitor deveria consultar o sítio - https://pt.wikipedia.org/wiki/Equação da onda
- para visualizar a dinâmica de u(·, t) para os diversos valores de t.
Para ilustrar o desenvolvimento da onda, vamos retomar o Exemplo 3.2.1 e considerar dois casos parti-
culares.

Exemplo 3.2.2. x0 = δ = π2 no Exemplo 3.2.1. Nesse caso, φ


Suponha que é uma onda triangular com o
aspecto da gura ao lado. Nesse caso, φ é uma onda triangular com
8 sen(nπ/2) y
o aspecto da gura ao lado. Temos an =
π 2 n2
[1 − cos(nπ/2)] e, y = φ(x)
8(−1)k
portanto, an = 0 se n é par e a2k+1 = π 2 (2k+1)2
se n = 2k + 1 é ímpar.

Logo,

8 X (−1)n sen(2k + 1)x 0 π π x
φ(x) = 2
π2 (2k + 1)2
k=0
e a solução de (3.2.1) e (3.2.2) (com ψ = 0) é dada por


8 X (−1)n sen(2k + 1)x
u(x, t) = 2 cos(2k + 1)ct.
π (2k + 1)2
k=0

A gura ao lado mostra o gráco da aproximação u ≈ u3 da solução, com a


escolha c = 2, onde
 
8 sen 3x cos 6t sen 5x cos 10t sen 7x cos 14t
u3 (x, t) = 2 sen x cos 2t − + − .
π 32 52 72

Abaixo estão representados os grácos de y = u3 (x, ti ) para alguns valores


xados de t = ti . Geometricamente, esse grácos são obtidos tomando a
projeção no plano xu da curva que se obtém como a interseção do gráco de
u com o plano t = ti . Usamos os valores t1 = 0.1 (laranja), t2 = 0.5 (azul),
t3 = π4 ≈ 0, 785 (verde), t4 = 1 (amarelo), t5 = 1.3 (vermelho) e t6 = 1.5
(preto).

55
y y y

x x x
π π π

y y y

x x x
π π π

A corda elástica apresenta vibrações verticais, sem muita alteração do seu perl, modicando apenas
sua amplitude, e tem período temporal igual a π. Nas 6 tomadas do perl da onda, correspondentes aos
instante de tempo t = ti acima apresentados, o movimento da onda é no sentido descendente, com amplitude
decrescente até o instante t = t3 , quando a corda volta à sua posição de repouso, seguindo o movimento
descendente (representados pelas cores amarelo, vermelho e preto), quando alcança sua maior amplitude no
π
instante t= 2 (seu semi-período); em seguida, recomeça seu movimento ascendente e retorna à sua posição
inicial quando t = π, completando um ciclo, e assim sucessivamente. Essas conclusões estão de acordo com
nossa experiência e expectativa do movimento da corda. ♣
Exemplo 3.2.3. Ainda no Exemplo 3.2.1, tomemos x0 = δ , δ < π2 . Nesse caso, φ é uma onda triangular
2
com o aspecto da gura ao lado. Como an = πδn 2 [2 sen(nδ) − sen(2nδ)], a y
função φ é dada por y = φ(x)

2 X [2 sen(nδ) − sen(2nδ)]
φ(x) = sen nx x
δπ n2 0 2δ π
n=1
e a solução u de (3.2.1), (3.2.2) (com ψ = 0) é então


2 X [2 sen(nδ) − sen(2nδ)]
u(x, t) = sen nx cos nct.
δπ n2
n=1
π
Vamos escolher δ= 8 e c=2 e usar a aproximação u ≈ u4 (x, t) somando apenas os quatro primeiros
termos da série. Obtemos a seguinte aproximação para u4 :

u4 (x, t) = 1.621[0.058 sen x cos 2t + 0.103 sen 2x cos 4t + 0.126 sen 3x cos 6t + 0.125 sen 4x cos 8t]
= 0.094 sen x cos 2t + 0.167 sen 2x cos 4t + 0.204 sen 3x cos 6t + 0.203 sen 4x cos 8t.

O gráco da aproximação de u = u4 (x, t) está representado na gura abaixo.

56
Abaixo apresentamos os grácos deu = u4 (x, t) para valores de t = kπ
8 , com k = 0, 1, 2, · · · 8. Neles, pode-
π
mos observar que a onda se move para a direita enquanto 0 ≤ t ≤ (seu semi-período). No instante seguinte,
2
ela reinicia seu movimento, agora para a esquerda, porem reetida com relação ao eixo-x. Quando t = π , ela
retorna à sua posição inicial. Convidamos o leitor a consultar o sítio - https://pt.wikipedia.org/wiki/Equação
da onda - para visualizar a evolução dinâmica do pulso u(·, t). ♣

y y y

x x x
π π π π π π
4 4 4

y y y

x x x
π π π π π π
4 4 4

y y y

x x x
π π π π π π
4 4 4

3.3 Séries de Fourier

Em toda essa Seção, consideraremos funções denidas no intervalo [−π, π]. Para adaptar os resultados obtidos
b−a
para uma função f denida num intervalo arbitrário [a, b], é suciente mudar a variável x=a+ 2π (t + π)
g(t) = f a + b−a

e considerar
2π (t + π) denida em [−π, π].
Iniciamos a discussão registrando nosso entendimento do conceito de função integrável que será utilizado
em todo esse texto.

Denição 3.3.1. Dizemos que f : [−π, π] → R é integrável se f e |f | são integráveis em [−π, π].
Aqui, f pode inclusive ser uma função não limitada; nesse caso, tratamos a integral como uma integral
impropria de uma função denida em [−π, π]. Na maior parte dos exemplos, lidaremos com funções que
são contínuas por partes, isto é, funções contínuas em [−π, π], exceto num número nito de pontos t1 ,
t2 , · · · , tN , nos quais, digamos −π < tj < π , os limites laterais à direita f (tj +) := limt→tj + f (t) e à
esquerda f (tj −) := limt→tj − f (t) existem e são nitos. (Quando tj = π ou tj = −π , postulamos a existência
do correspondente limite lateral). Dessa forma, toda função contínua por partes em [−π, π] é limitada e
integrável. Os valores que f assume em um conjunto nito de pontos é irrelevante para integrabilidade de f .
Quando se zer necessário, usaremos a notação CP [−π, π] para indicar a totalidade das funções contínuas
por partes em [−π, π].

Denição 3.3.2. f : [−π, π] → R é uma função integrável e n ≥ 0 é um número inteiro, os números reais
Se

1 π 1 π 1 π
Z Z Z
a0 = f (t) dt (n = 0) , an = f (t) cos nt dt e bn = f (t) sen nt dt (se n ≥ 1) (3.3.1)
π −π π −π π −π
são chamados coecientes de Fourier de f . Se {an }∞
n=0 e {bn }∞
n=1 são sequências denidas por (3.3.1) para
uma dada função integrável f : [−π, π] → R, a série trigonométrica

a0 X
+ (an cos nx + bn sen nx) (3.3.2)
2
n=1

57
é chamada a série de Fourier associada a f .
Quando queremos nos referir a uma série trigonométrica (3.3.2) como a serie de Fourier associada a f ,
escreveremos

a0 X
f∼ + (an cos nx + bn sen nx).
2
n=1
Observemos que a expressão (3.3.2) é simplesmente a notação para uma série trigonométrica e não
signica, a priori, que se trata de uma série convergente. Como cada termo da série (3.3.2) é uma função
periódica de período 2π , se a série for convergente para um especial valor x = x0 , então ela também será
convergente para todo x da forma x = x0 + 2kπ , com k ∈ Z. Em particular, se para qualquer valor real de
x, a série (3.3.2) for convergente, ca denida uma função S : R → R que a cada x associa o valor S(x) =
soma da série (3.3.2), isto é,

a0 X
S(x) = + (an cos nx + bn sen nx).
2
n=1
A discussão central que norteará essas notas é estabelecer as propriedades gerais de uma possível soma
S da série (3.3.2) e suas relações com a função f que lhe deu origem. Primeiro, vamos examinar alguns
exemplos.

Exemplo 3.3.1. Determinar a série de Fourier da função f (t) = t, −π ≤ t ≤ π.


Solução. Os coecientes de Fourier de f são dados por
Z π Z π
1 1
an = t cos nt dt e bn = t sen nt dt.
π −π π −π
Obtemos imediatamente an = 0 (pois o integrando é uma função ímpar). Integração por partes cuida do
cáculo de bn :

1 π
 Z 
1 t π 1h π π i 2 2
bn = − cos nt|−π + cos nt dt = − cos nπ − cos nπ + 0 = − cos nπ = (−1)n+1 .
π n n −π π n n n n
Portanto, a série


(−1)n+1 sen nx
 
X sen 2x sen 3x sen 5x
f ∼2 = 2 sen x − + − + ...
n 2 3 5
n=1

é a série de Fourier de f. ♣
Antes de prosseguir, vamos registrar alguns fatos que serão úteis no cálculo dos coecientes de Fourier e
que já foram usados no Exemplo 3.3.1.

(a) Se f é uma função impar, então an = 0, para todo n e bn pode ser calculado a partir do fato que
t 7→ f (t) sen nt é uma função par:
Z π Z π
1 2
bn = f (t) sen nt = f (t) sen nt dt;
π −π π 0

(b) Se f é uma função par, então bn = 0, para todo n e an podem ser calculado a partir do fato que
t 7→ f (t) cos nt é uma função par:
1 π 2 π
Z Z
an = f (t) cos nt = f (t) cos nt dt;
π −π π 0

(c) Para todos n, k ∈ N, temos


Z π Z π Z π
sen nt dt = cos nt dt = 0 , sen nt cos kt dt = 0,
−π −π −π
Z π  Z π 
0, se n 6= k 0, se n 6= k
sen nt sen kt dt = δnk = e cos nt cos kt dt = δnk = .
−π π, se n=k −π π, se n=k

58
Observação 3.3.1. As relações enunciadas em (c), cujas demonstações são imediatas, são conhecidas na
literatura Matemática como Relações de Ortogonalidade. A razão do nome reside no seguinte fato: o conjunto
V = C2π (R) das funções contínuas f :R→R e 2π -periódicas constitui um espaço vetorial real e a forma
bilinear Z π
hf, gi := f (t)g(t) dt
−π

confere a V uma estrutura de espaço com produto interno. Considere em V as funções en e fn denidas por

1 cos nx sen nx
e0 = √ , en (x) = √ e fn (x) = √ ,
2π π π

para n inteiro positivo. As relações de ortogonalidade signicam que B = {e0 , en , fn : n ∈ N} é um conjunto


ortonormal de V . As parcelas que compõem o termo geral da série de Fourier (3.3.2) podem, nesse contexto,
ser interpretadas como

a0
= hf, e0 ie0 (x) , an cos nx = hf, en ien (x) e bn sen nx = hf, fn ifn (x)
2

e a soma parcial de ordem N de (3.3.2) pode ser entendida como a projeção3 do vetor f no subespaço gerado
pelos 2N + 1 primeiros vetores VN = [e0 , en , fn : n = 1, 2, ..., N ]:

N N
a0 X X
se SN (x) = + (an cos nx + bn sen nx) , então SN = hf, e0 ie0 + [hf, en ien + hf, fn ifn ]. ♣
2
n=1 n=1

Voltaremos a explorar mais tarde a linha de pensamento esboçada nas considerações feitas na Observação
3.3.1 no contexto do estudo da convergência de uma série de Fourier. Para o momento, vamos considerar
mais exemplos e desenvolver alguns conceitos. Vamos primeiro considerar o conceito conhecido como série
de Fourier de senos e série de Fourier de cossenos.

Denição 3.3.3. Suponha que f : [0, π] → R é uma função integrável denida no intervalo [0, π].
(i) a função f˜ : [−π, π] → R denida por


f (t), se 0≤t≤π
f˜(t) =
f (−t), se −π ≤t<0

é chamada extensão par de f ao intervalo [−π, π];


(ii) a função f˜ : [−π, π] → R denida por


f (t), se 0≤t≤π
f˜(t) =
−f (−t), se −π ≤t<0

é chamada extensão ímpar de f ao intervalo [−π, π].

f é contínua em [0, π] e f (0) 6= 0, então a extensão ímpar de f é descontínua em t = 0;


Observe que se
por outro lado, se f (0) = 0, então a extensão ímpar de f é contínua em [−π, π]. A extensão par de uma
função contínua f em [0, π] ao intervalo [−π, π] é sempre uma função contínua em [−π, π].

Exemplo 3.3.2. Determine a série de senos e a série de cossenos da função f (t) = π−t
2 , 0 ≤ t ≤ π.

Solução. Nesse Exemplo, o que realmente se deseja é obter a série de Fourier das extensões ímpar e par de
f ao intervalo [−π, π], respectivamente dadas por

π−t π−t
 
2 , se 0≤t≤π 2 , se 0≤t≤π
f˜i (t) = e f˜p (t) =
− π+t
2 , se −π ≤t<0 π+t
2 , se − π ≤ t < 0.
3
Com ligeiras modicações, a armação é verdadeira quando f tem quadrado integrável - Ver a próxima Seção.

59
y
π y
2 π
2
y = f˜i (t)
−π t
t
π
−π π
y = f˜p (t)
− π2
Consideremos primeiro a extensão ímpar f˜i . Como função ímpar, seus coecientes de Fourier an = 0
para todo n ≥ 0. Vamos calcular os coecientes bn lembrando que t 7→ f˜i (t) sen nt é uma função par:

1 π ˜ 2 π 2 π π−t 1 π
Z Z Z Z
bn = f (t) sen nt = f (t) sen nt dt = sen nt dt = (π − t) sen nt dt.
π −π π 0 π 0 2 π 0

Integração por partes mostra que

 Z π 
1 cos nt π cos nt 1
bn = (π − t) | + dt = .
π n 0 0 n n
π−t
Portanto, a série de Fourier de senos de f (t) = 2 é a série


X sen nx
f∼ .
n
k=1

Para obtermos a série de Fourier de cossenos, devemos considerar a série de Fourier de f˜p . Resulta bn = 0
para todo n,
π π
1 2 π2
 
π−t
Z Z
1 2 π
a0 = f˜p (t) dt = dt = π − =
π −π π 0 2 π 2 2
e

π π Z π
1 − (−1)n
 
π−t
Z Z
1 2 1 sen nt π sen nt
an = f˜p (t) cos nt dt = cos nt dt = (π − t) |0 + dt = = .
π −π π 0 2 π n 0 n πn2
2
Assim, an = 0 se n é par e se n = 2k + 1, então a2k+1 = π(2k+1)2
. Logo,


π X 2 cos nx
f∼ +
4 π(2k + 1)2
n=0

π−t
é a série de Fourier de cossenos de f (t) = 2 . ♣

Exemplo 3.3.3. Determine a série de senos e a série de cossenos da função f (t) = cos t, 0 ≤ x ≤ π.
Solução. A extensão ímpar da função f (t) = cos t ao intervalo [−π, π] é a função dada por

cos t, se 0≤t≤π
f˜(t) =
− cos t, se − π ≤ t < 0.

Como função ímpar, os coecientes de Fourier an = 0 para todo n ≥ 0. Vamos calcular os coecientes bn
lembrando que t 7→ f˜(t) sen nt é uma função par:

1 π ˜ 2 π 2 π
Z Z Z
bn = f (t) sen nt = f (t) sen nt dt = cos t sen nt dt.
π −π π 0 π 0

Se n = 1, então
Z π
1 1
b1 = sen 2t dt = − [cos 2π − cos 0] = 0.
π 0 2π

60
Se n ≥ 2, então

π
cos(n + 1)t cos(n − 1)t π 2n[1 + (−1)n ]
Z  
1 1
bn = [sen(n + 1)t + sen(n − 1)t] dt = − − = .
π 0 π n+1 n−1 0 π(n2 − 1)
8k
Portanto, bn = 0 se n é ímpar e se n = 2k , então b2k = π(4k2 −1)
. Logo, a série de Fourier de senos de

f (t) = cos t é a série



X 8k
f∼ sen 2kx.
π(4k 2 − 1)
k=1

Para obtermos a série de Fourier de cossenos, devemos considerar a extensão par da função f (t) = cos t
ao intervalo [−π, π]. Resulta f˜(t) = cos t para todo t ∈ [−π, π] e as relações de ortogonalidade mostram
imediatamente que an = 0 para todo n 6= 1 e bn = 0 para todo n. Como

1 π ˜ 1 π
Z Z
a1 = f (t) cos t dt = cos2 t dt = 1
π −π π −π

segue que a série de cossenos de f coincide com f em [0, π]. ♣


Exercício 3.3.1. Determine a série de Fourier de cossenos da função f (t) = sen t, 0 ≤ x ≤ π .
Para nalizar essa Seção, vamos examinar a relação entre o decaimento dos coecientes de Fourier de f
e a propriedade de diferenciabilidade de f. Temos a seguinte

Proposição 3.3.1. Suponha que f e f0 são integráveis em [−π, π]. Então, para todo n ≥ 1, temos

1 1 (−1)n
an [f ] = − bn [f 0 ] e bn [f ] = an [f 0 ] + [f (π) − f (−π)].
n n n
Como consequência, para todo n ≥ 1, temos
Z π Z π
1 1
|an [f ]| ≤ |f 0 (t)| dt e |bn [f ]| ≤ |f 0 (t)| dt.
nπ −π nπ −π

A demonstração decorre imediatamente da formula de integração por partes.

3.4 A Propriedade de Mínimo da Série de Fourier

Nessa seção vamos estabelecer algumas propriedades gerais da série de Fourier de uma função integrável
f : [−π, π] → R que, além do seu interesse histórico e matemático, desempenhará papel importante no estudo
da convergência puntual da série. Retornando ao contexto de espaço vetorial mencionado na Observação
3.3.1, vamos destacar o seguinte fato: no que concerne às propriedades algébricas de espaço vetorial com
produto interno, todo nosso tratamento de conjuntos ortonormais e a fórmula da projeção de f no subespaço
VN pode ser realizado no conjunto L 2 [−π, π] das funções reais de quadrado integrável em [−π, π]:
L 2 [−π, π] = {f : [−π, π] → R : f 2 é integrável}.

Embora pareça irrelevante, essa observação é extremamente importante já que, no conjunto L 2 [−π, π],
a fórmula que dene o produto interno
Z π
hf, gi = f (x)g(x) dx
−π

só não satisfaz condição de ser positiva denida:


Z π
hf, f i = f (x)2 dx = 0 nem sempre implica que f = 0.
−π

(Essa última é uma das razões que motivou H. Lebesgue a desenvolver sua teoria de integração, assunto que
foge ao escopo dessas notas - entretanto, ver Capítulo 5.)

61
Comecemos calculando a distância entre f ∈ L 2 [−π, π] e sua projeção no espaço VN mencionado na
Observação 3.3.1: VN é o subespaço gerado pelas funções e0 , en e fn , para 1 ≤ n ≤ N , onde

1 cos nx sen nx
e0 = √ , en (x) = √ e fn (x) = √ ,
2π π π

para n inteiro positivo. Como vimos, o conjunto BN = {e0 , en , fn : 1 ≤ n ≤ N } é uma base ortonormal de
VN e a projeção de f em VN é o vetor

N
X
SN = hf, e0 ie0 + [hf, en ien + hf, fn ifn ].
n=1

Portanto, a distância entre f e sua projeção em VN é

kSN − f k2 = hSN − f, SN − f i = kSN k2 − 2hSN , f i + kf k2


N N
" #
X X
= hf, e0 i2 + (hf, en i2 + hf, fn i2 ) − 2 hf, e0 i2 + (hf, en i2 + hf, fn i2 ) + kf k2
n=1 n=1
N
X
= kf k2 − hf, e0 i2 − (hf, en i2 + hf, fn i2 )
n=1

já que hen , ek i = δn,k , hfn , fk i = δn,k e hen , fk i = 0.


Por outro lado, se α0 , αn e βn (1 ≤ n ≤ N ) são números reais arbitrários e ΣN indica a combinação
linear
N
X
ΣN = α0 e0 + (αn en + βn fn ),
n=1

então SN − f é ortogonal a ΣN . Pelo Teorema de Pitágoras, kΣN − f k2 = kSN − f k2 + kΣN − SN k2 , isto é,

N
X
kΣN − f k2 = kSN − f k2 + (α0 − hf, e0 i)2 + [(αn − hf, en i)2 + (βn − hf, fn i)2 ]
n=1

Assim, kΣN − f k ≥ kSN − f k para todo ΣN e kΣN − f k = kSN − f k se e somente se α0 = hf, e0 i,


αn = hf, en i e βn = hf, fn i para todo n = 1, 2, ..., N .
Esse aspecto minimizante do erro da aproximação de f por uma soma parcial de sua série de Fourier é
registrado no seguinte

Teorema 3.4.1. Se ∈ L 2 [−π, π], então o erro quadrático médio


" N
#2
Z π
α0 X
E(α0 , α1 , ..., βn ) := f (x) − − (αn cos nx + βn sen nx) dx
−π 2
n=1

tem valor mínimo se e somente se αn e βn são os coecientes de Fourier de f:


Z π Z π Z π
1 1 1
α0 = f (t) dt , αn = f (t) cos nt dt e βn = f (t) sen nt dt.
π −π π −π π −π

Voltando à expressão do cálculo de kSN − f k2 , o fato de que seu valor é um numero não-negativo implica
que
N
X
hf, e0 i2 + (hf, en i2 + hf, fn i2 ) ≤ kf k2
n=1

para todo N ≥ 1. Agora, tomando o quadrado de cada uma das identidades

a0
= hf, e0 ie0 (x) , an cos nx = hf, en ien (x) e bn sen nx = hf, fn ifn (x)
2

62
e integrando em [−π, π], obtemos

πa20
= hf, e0 i2 , πa2n = hf, en i2 e πb2n = hf, fn i2 .
2
Assim, a desigualdade anterior pode ser escrita como

N π
a20 X 2
Z
1
+ (an + b2n ) ≤ f (x)2 dx.
2 π −π
n=1

Como essa última vale para qualquer N ≥ 1, N → ∞, obtemos


fazendo


a20 X 2 1 π
Z
2
+ (an + bn ) ≤ f (x)2 dx.
2 π −π
n=1

Essa desigualdade é conhecida como Desigualdade de Bessel. Devido a sua importância e para futura
referência, registramo-la no seguinte

Teorema 3.4.2. (Desigualdade de Bessel) Suponha que f : [−π, π] → R tem quadrado integrável. Então,


a20 X 2 1 π
Z
2
+ (an + bn ) ≤ f (x)2 dx. (3.4.1)
2 π −π
n=1

Segue do Teorema 3.4.2 que as sequências {an } e {bn } têm limite zero quando n → ∞. Esse resultado é
um caso particular do famoso Lema de Riemann-Lebesgue, dado no seguinte
Teorema 3.4.3. (Lema de Riemann-Lebesgue) Suponha que f : [−π, π] → R é integrável. Então,
Z π Z π
lim f (t) cos nt dt = lim f (t) sen nt dt = 0.
n→∞ −π n→∞ −π

Observação 3.4.1. Não é verdade que a desigualdade de Bessel seja válida para qualquer função integrável.
O simples exemplo f (t) = √1 , se t 6= 0 e f (0) = 0 mostra uma função integrável em [−π, π] (verique!)
|t|
para a qual bn = 0 para todo n e
1 π 1 1 π 2 π 1
Z Z Z
4
a0 = p dt = √ , an = f (t) cos nt dt = √ cos nt dt (se n ≥ 1).
π −π |t| π π −π π 0 t
Mudança de variável nt = s transforma a última integral em
Z π Z nπ
2 1cos s ds 2
an = √ cos nt dt = √
√ .
0π 0 t s π n
R ∞ cos s ds √
Como a integral imprópria
0

s
é convergente (verique!), segue que nan tem limite quando n → ∞.
P 2
Isso implica que an tende a zero (como previsto pelo Lema de Riemann), mas an resulta divergente. ♣
A demonstração do Lema de Riemann-Lebesgue é um pouco mais delicada e não será tratada aqui.
4

Voltando uma vez mais à expressão do cálculo de SN , vimos que se f é uma função de L 2 [−π, π], então

N
# "
π
a20 X 2
Z
2 2 2
kSN − f k = f (x) dx − π + (an + bn ) .
−π 2
n=1

Essa expressão mostra que

∞ π
a20 X 2
Z
1
lim kSN − f k = 0 se e somente se + (an + b2n ) = f (x)2 dx.
N →∞ 2 π −π
n=1
5
Sem demonstração , vamos enunciar o resultado mais importante desta Seção no seguinte

4
Para uma demonstração, ver, e.g., F. A. Baidoo [1].
5
Para uma demonstração, consultar N. K. Bary [2].

63
Teorema 3.4.4. Se f : [−π, π] → R é uma função de quadrado integrável e SN é a soma parcial de ordem
N de sua série de Fourier,
N
a0 X
SN (x) = + (an cos nx + bn sen nx),
2
n=1

então limN →∞ kSN − f k = 0, isto é,

" N
#2
Z π
a0 X
lim f (x) − + (an cos nx + bn sen nx) dx = 0.
N →∞ −π 2
n=1

Decorre do Teorema 3.4.4 a seguinte identidade, conhecida como Identidade de Parseval6 .

Teorema 3.4.5. (Identidade de Parseval) Se f : [−π, π] → R é uma função de quadrado integrável, então

N π
a20 X 2
Z
1
+ (an + b2n ) = f (x)2 dx. (3.4.2)
2 π −π
n=1

Também do Teorema 3.4.4 decorre o seguinte

Teorema 3.4.6. Se f e g são funções de quadrado integrável em [−π, π] com séries de Fourier


a0 X
f∼ + (an cos nx + bn sen nx)
2
n=1


c0 X
g∼ + (cn cos nx + dn sen nx),
2
n=1
então
Z π ∞
1 a0 c0 X
f (t)g(t) dt = + (an cn + bn dn ). (3.4.3)
π −π 2
n=1

A aplicação da identidade de Parseval em exemplos concretos conduz a diversos resultados surpreendentes;


veremos alguns deles nos próximos exemplos.

Exemplo 3.4.1. Vimos no Exemplo 3.3.1 que a série de Fourier da função f (t) = t, −π ≤ t ≤ π , é dada por


X 2
(−1)n+1 sen nx.
n
n=1

A identidade de Parseval aplicada a esse exemplo mostra que


1 π 2 2π 2
Z
X 4
= x dx = ,
n2 π −π 3
n=1

da qual se obtém o célebre resultado (atribuído a Euler)


X 1 1 1 π2
= 1 + + + ... = . ♣
n2 22 32 6
n=1

Exemplo 3.4.2. No Exemplo 3.3.2 determinamos as séries de Fourier de senos e cossenos da função f (t) =
π−t
2 , 0≤t≤π e obtivemos as seguintes séries:

(a) a série de senos de f é



X sen nx
n
k=1
6
A Identidade de Parseval, ou seu equivalente, Teorema 3.4.4, estabelece o importante fato que o sistema trigonométrico é
completo em L 2 [−π, π]: se f é ortogonal a todos os en , então f = 0 (exceto num conjunto de medida nula).

64
e a identidade de Parseval fornece


1 π ˜ 2 2 π
Z π
π2
Z Z
X 1 2 1 2 1 3 π
= f (x) dx = f (x) dx = (π − x) dx = (x − π) |0 =
n2 π −π π 0 2π 0 6π 6
n=1

que já encontramos no exemplo anterior.

(b) a série de cossenos de f é a série


π X 2 cos nx
+ .
4 π(2k + 1)2
n=0

A identidade de Parseval nesse caso se escreve como

∞ π π π
π2 X π2
Z Z Z
4 1 2 1
+ = f˜(x)2 dx = f (x)2 dx = (π − x)2 dx = ,
8 π 2 (2k + 1)4 π −π π 0 2π 0 6
n=0

de onde resulta a intrigante fórmula


X 1 1 1 1 π4
= 1 + + + + ... = . ♣
(2k + 1)4 34 54 74 96
n=0

A partir desses resultados, podemos elaborar um pouco mais, escrevendo

∞ ∞ ∞ ∞
!
X 1 1 X 1 1 X 1 X 1
4
= = + ,
(2k) 16 k4 16 (2k)4 (2k + 1)4
k=1 k=1 k=1 k=0

de onde resulta
∞ ∞
X 1 1 X 1 π4
4
= 4
= .
(2k) 15 (2k + 1) 1440
k=1 k=0
Logo,
∞ ∞ ∞
X 1 X 1 X 1 π4
= + = .
k4 (2k)4 (2k + 1)4 90
k=1 k=1 k=0

Persistindo um pouco mais, consideremos a função


  f (x) = x3 em [−π, π], para a qual temos an = 0 e
12π 2π 2
bn = (−1)n n3
− n para todo n. Da Identidade de Parseval, resulta

∞  π
4π 4 48π 2 2π 6
 Z
X 144 1
+ − 4 = x6 dx = .
n6 n2 n π −π 7
n=1

Consequentemente,

X 1 π6
= .
n6 945
n=1
P∞ 1 π8 P∞ 1
Podemos continuar nessa linha de raciocínio e obter n=1 n8 = 9450 e, eventualmente, n=1 n2s para
s≥1 inteiro. Uma tal formula existe e sua expressão envolve os famosos números de Bernoulli. Para uma
exposição concisa sobre esse tema, consulte https://lucaszanella.com/pt/artigos/mat/bernoulli.

função zeta de Riemann e o estudo de suas propriedades é um imenso


P∞ 1
A função ζ(s) := n=1 ns é chamada
campo em que há muito a se explorar. Curiosamente, apenas ζ(2s) são conhecidos - a primeira demonstração
7
de que ζ(3) é irracional só veio a público em 1977 e se deve a Roger Apéry . O valor aproximado de ζ(3)
(conhecido como constante de Apéry) é ζ(3) = 1, 202056903159549... e até hoje não se sabe se ele é um
número algébrico ou transcendente. O leitor interessado nesse tema encontrará grande prazer na leitura do
excelente livro de J. Havil .
8

7
Roger Apéry (Rouen, 14 de novembro de 1916  Caen, 18 de dezembro de 1994) foi um matemático greco-francês, mais
conhecido pelo Teorema de Apéry, estabelecendo que ζ(3) é um número irracional.
8
Julian Havil, The Irrationals, A Story of the Numbers You Can't Count On, Princeton University Press, 2012.

65
Observação 3.4.2. De sua denição, os coecientes de Fourier não se alteram se a função f tiver seus valores
modicados em um conjunto nito de pontos (ou mais geralmente, em todos os pontos de um subconjunto
de medida nula de [−π, π]). Mesmo que a soma da série de Fourier de f resultar numa função S(x) denida
para todo x real, o resultado do Teorema 3.4.4 signica apenas que S é a única função que melhor aproxima
f em L 2 [−π, π]), isto é, S é a função que minimiza o erro quadrático médio. Isso não deve ser confundido
com aproximação puntual, assunto que trataremos na próxima Seção. ♣

3.5 Convergência Puntual da Série de Fourier

Nessa Seção vamos estudar a convergência da série de Fourier de uma função f em um ponto especíco
x = x0 de [−π, π]. Vamos iniciar a discussão obtendo uma expressão para a soma de suas N primeiras
parcelas.
Lembremos que se f : [−π, π] → R é uma função integrável e

1 π π
Z Z
1
an = f (t) cos nt dt e bn = f (t) sen nt dt
π π π π

(cf. 3.3.1) são seus coecientes de Fourier, então para cada inteiro N ≥ 1, a soma parcial de ordem N da
série de Fourier de f é a função SN : R → R denida por

N
a0 X
SN (x) = + (an cos nx + bn sen nx). (3.5.1)
2
n=1

Substituindo (3.3.1) em (3.5.1), podemos escrever SN na forma

Z π N Z
1 1X π
SN (x) = f (t) dt + f (t)[cos nt cos nx + sen nt sen nx] dt
2π −π π −π
n=1
Z " N
#
1 π 1 X
= + cos n(x − t) f (t) dt.
π −π 2
n=1

Proposição 3.5.1. Para todo número real x 6= 2kπ , com k inteiro, tem-se

1 sen (n + 21 )x
+ cos x + cos 2x + ... + cos nx = . (3.5.2)
2 2 sen( x2 )
Demonstração. Para cada x real, os números

e−inx , e−(n−1)x , ..., e−ix , 1, eix , ..., ei(n−1)x , enx

constitui 2n + 1 termos em progressão geométrica de razão eix , cuja soma é


ei(2n+1)x − 1
sn := e−inx + e−(n−1)x + ... + e−ix + 1 + eix + ... + ei(n−1)x + enx = e−inx ,
eix − 1
se eix 6= 1 e sn = 2n+1, se eix = 1. Rearranjando as parcelas da soma no lado esquerdo e usando o conhecido
ix
fato que 2 cos x = e + e
−ix e 2i sen x = eix − e−ix , ela pode ser escrita como

sn = 1 + 2[cos x + cos 2x + ... + cos nx],

Quanto ao lado direito, escrevemos

ei(2n+1)x − 1 −inx i(n+1/2)x e


i(n+1/2)x − e−i(n+1/2)x ei(n+1/2)x − e−i(n+1/2)x sen (n + 12 )x
e−inx = e e = = .
eix − 1 eix/2 (eix/2 − e−ix/2 ) eix/2 − e−ix/2 sen( x2 )
Portanto,
1 sen (n + 21 )x
+ cos x + cos 2x + ... + cos nx = ,
2 2 sen( x2 )
como queríamos demonstrar.

66
Exercício 3.5.1. Demonstre que se x 6= 2kπ , com k inteiro, então

sen( n+1
2 )x nx
sen x + sen 2x + ... + sen nx = sen( ). (3.5.3)
sen( x2 ) 2

Assim, a soma parcial de ordem N da série de Fourier de f pode ser escrita como
Z π
SN (x) = DN (x − t)f (t) dt, (3.5.4)
−π

onde DN indica o núcleo de Dirichlet de ordem N , de acordo com a seguinte


Denição 3.5.1. Para cada inteiro n ≥ 1, a função contínua Dn : [−π, π] → R denida por
n
" #
1 1 X sen (n + 21 )s
Dn (s) = + cos ks =
π 2 2π sen( 2s )
k=1

se x 6= 0 e Dn (0) = π1 (n + 12 ), é chamada núcleo de Dirichlet de ordem n.


A gura abaixo mostra os grácos da funções Dn para n = 5, n = 7 e n = 10.

−π π x

Figura 3.1: Núcleos de Dirichlet Dn , com n=5 (vermelho), n=7 (azul) e n = 10 (laranja).

Observação 3.5.1. A continuidade de Dn em s = 0 segue de

1 sen (n + 12 )s 2 · s/2
   
1 1 1
lim Dn (s) = lim n + = n+ .
s→0 2π s→0 2 (n + 21 )s sen(s/2) π 2

As principais propriedades da família {Dn }∞


n=1 que utilizaremos são coletadas na seguinte

Proposição 3.5.2. Para cada inteiro n ≥ 1, Dn : [−π, π] → R satisfaz as seguintes propriedades:


(−1)n Rπ
(i) Dn é contínua; (ii) Dn é uma função par; (iii) Dn (−π) = Dn (π) =
2π ; (iv)
−π Dn (s) ds = 1.

Demostração. (i) é a Observação 3.5.1; (ii) e (iii) são imediatas e (iv) decorre da Proposição 3.5.2.

Observação 3.5.2. Do resultado (iii) da Proposição 3.5.2 também decorre que Dn pode ser (e será) estendida
de modo 2π -periódico a toda a reta real como uma função de classe C∞ em R. ♣

Todo o busílis relativo à convergência da série de Fourier de uma função f num ponto x0 ∈ [−π, π] é
saber se existe um número real ` (dependendo de x0 ) tal que limN →∞ [SN (x0 ) − `] = 0. Com isso em mente,
vamos primeiro obter uma expressão tratável para calcular a diferença SN (x0 ) − `, onde ` é um número real
a ser determinado.

Decorre de (3.5.4), da periodicidade de DN e das propriedades (ii) e (iv) da Proposição 3.5.2, que a
diferença SN (x0 ) − ` pode ser escrita como
Z π Z π Z π
SN (x0 ) − ` = DN (x0 − t)f (t) dt − ` DN (x0 − t) dt = DN (x0 − t)[f (t) − `] dt. (3.5.5)
−π −π −π

67
Suponhamos inicialmente que −π < x0 < π . Para cada δ > 0 (com 0 < δ < min{π − x0 , x0 + π}), vamos
Rπ Rπ R x0 −δ R x0 +δ R π
escrever
−π como soma de 3 integrais
−π = −π + x0 −δ + x0 +δ e examinar cada uma delas. Começamos
com a primeira: escrevemos

x0 −δ x0 −δ  
f (t) − `
Z Z
1 1
DN (x0 − t)[f (t) − `] dt = sen N + (x0 − t) dt.
−π π −π 2 sen( x02−t ) 2
Como −π ≤ t ≤ x0 − δ , temos −x0 + δ ≤ −t ≤ π ; daí, δ ≤ x0 − t ≤ x0 + π e, portanto, 2δ ≤ x02−t ≤ x02+π <
x −t
π. Daí decorre que existe m > 0 tal que 2| sen( 0
2 )| ≥ m para todo t ∈ [−π, x0 − δ]. Disso concluímos que
a função
f (t) − `
t ∈ [−π, x0 − δ] 7→

2 sen( x02−t )

é integrável em [−π, x0 − δ]. Pelo Lema de Riemann-Lebesgue (Teorema 3.4.3), concluímos que

Z x0 −δ
lim DN (x0 − t)[f (t) − `] dt = 0.
N →∞ −π

Procedemos da mesma forma com a terceira integral:

π π  
f (t) − `
Z Z
1 1
DN (x0 − t)[f (t) − `] dt = sen N + (x0 − t) dt.
x0 +δ π x0 +δ 2 sen( x02−t ) 2
x0 −π
Novamente, t ∈ [x0 +δ, π] implica −π ≤ ≤ x02−t ≤ − 2δ e assim, existe m > 0 tal que 2| sen( x02−t )| ≥ m
2
para todo t ∈ [x0 + δ, π]. Disso, como anteriormente, concluímos que a função

f (t) − `
t ∈ [x0 + δ, π] 7→

x −t
2 sen( 2 )
0

é integrável em [x0 + δ, π] e, novamente pelo Lema de Riemann-Lebesgue, obtemos


Z π
lim DN (x0 − t)[f (t) − `] dt = 0.
N →∞ x0 +δ

Concluímos assim que a existência do limite de SN (x0 )−` depende apenas da existência do limite quando
N →∞ da integral intermediária, isto é, da existência do limite quando N → ∞ de
Z x0 +δ
DN (x0 − t)[f (t) − `] dt.
x0 −δ

Os valores desta última integral dependem apenas dos valores f (t) nos pontos de uma vizinhança arbi-
trariamente pequena de x0 ; portanto, seu limite, se existir, só depende dos valores de f numa vizinhança
arbitrariamente pequena de x0 . Esses cálculos constituem-se na demonstração do que é conhecido como
Princípio da Localização de Riemann9 , que enunciamos formalmente no seguinte
Teorema 3.5.1. (Princípio da Localização de Riemann) A convergência ou divergência da série de Fourier
num ponto x0 depende apenas do comportamento da função f numa vizinhança de x0 .
Uma última observação: a mudança de variável x0 − t = −s transforma a última integral em

Z x0 +δ Z δ
DN (x0 − t)[f (t) − `] dt = DN (s)[f (x0 + s) − `] dt.
x0 −δ −δ
9
Georg Friedrich Bernhard Riemann (Breselenz, Reino de Hanôver, 17 de setembro de 1826  Selasca, Itália, 20 de julho
de 1866) foi um matemático alemão, com contribuições fundamentais para a análise e a geometria diferencial. Começou seus
estudos na Universidade de Göttingen e continuou na Universidade Humboldt de Berlim. Obteve o doutorado na Universidade
de Göttingen, com uma tese no campo da teoria das funções complexas, tendo Carl Friedrich Gauss como orientador. Na tese são
introduzidos as equações diferenciais de Cauchy-Riemann e o conceito de superfícies de Riemann, que trouxeram considerações
topológicas à análise. Com uma denição própria, a integral de Riemann, abriu caminho para a generalização deste conceito
no século XX, a integral de Lebesgue, e daí para horizontes mais amplos como a relatividade geral.

68
Movidos pelo argumento utilizado nas duas integrais consideradas anteriormente, e tendo em mente o
Lema de Riemann-Lebesgue, somos conduzidos a conjecturar a respeito da integrabilidade absoluta da função

f (x0 + s) − `
s ∈ [−δ, δ] 7→
sen( 2s )

no intervalo [−δ, δ]. O fato de o denominador da fração se anular em s=0 conjugado com um momento
de reexão sugere que uma possibilidade para que essa função seja absolutamente integrável em [−δ, δ] é
admitir f contínua em x0 , tomar ` = f (x0 ) e exigir que a função

f (x0 + s) − f (x0 )
s ∈ [−δ, δ] 7→

sen( 2s )

seja integrável. De fato, vale o seguinte

Teorema 3.5.2. Seja f : [−π, π] → R uma função integrável. Suponha que x0 é um ponto no interior de
[−π, π] no qual f é contínua e satisfaz a seguinte propriedade: a função

f (x0 + h) − f (x0 )
h 7→
h
é absolutamente integrável numa vizinhança de h = 0. Então, a série de Fourier S(x0 ) de f, em x0 , é
convergente e temos S(x0 ) = limN →∞ SN (x0 ) = f (x0 ).

Demonstração. É imediata usando o Lema de Riemann-Lebesgue (Teorema 3.4.3) e limt→0 sen t/t = 1:
δ +δ

f (x0 + s) − f (x0 ) f (x0 − s) − f (x0 )
Z Z
ds é nita se e somente se ds é nita. ♣
−δ
2 sen( 2s )
−δ
s

Observação 3.5.3. A condição de integrabilidade absoluta de h 7→ f (x0 +h)−f


h
(x0 )
numa vizinhança de h = 0
é chamada condição de Dini. Como se comprova facilmente, essa condição estará satisfeita em x0 se f
satiszer qualquer uma das seguintes condições:

(1) (Condição de Derivabilidade em x0 ) f é derivável em x0 .


(2) (Condição de Lipschitz em x0 ) Existe L>0 tal que |f (x0 + h) − f (x0 )| ≤ L|h| para |h| ≤ δ .
(3) (Condição de Hölder em x0 ) Existem L>0 e α>0 tais que |f (x0 + h) − f (x0 )| ≤ L|h|α para |h| ≤ δ .

Exercício 3.5.2. Mostre que se f satisfaz qualquer uma das condições (1), (2) ou (3), então f é contínua
em x0 .

Exemplo 3.5.1. (i) Qualquer função de classe C 1 denida num intervalo aberto I satisfaz uma condição de
Lipschitz em qualquer ponto x0 ∈ I . De fato, se x0 ∈ I e δ > 0 é tal que x0 + h ∈ I para todo h com |h| ≤ δ
e se M= sup{|f 0 (t)| : |t − x0 | ≤ δ}, então, pelo Teorema do Valor Médio, temos

|f (x0 + h) − f (x0 )| ≤ M |h|, para todo h com |h| ≤ δ.

(ii) A funçãof (x) = |x| não é de classe C 1 em qualquer intervalo aberto contendo x0 = 0, mas satisfaz
a condição de Lipschitz |f (x0 + h) − f (x0 )| = ||x0 + h| − |x0 || ≤ |h| em qualquer ponto x0 .
p
(iii) A função f (x) = |x| não satisfaz uma
p condição de Lipschitz em x = 0, mas satisfaz uma condição
de Hölder em x0 = 0: |f (x0 + h) − f (x0 )| = |h| ≤ |h|1/2 para todo h.

(iv) Se α>0 e f (x) = |x|α sen(1/x), se x 6= 0 e f (0) = 0, então f satisfaz uma condição de Hölder em
x0 = 0.

Vamos agora analisar o caso em que f é descontínua num ponto interior x0 de [−π, π]. O leitor pode
imaginar diversos exemplos de comportamento surreal de f numa vizinhança de x0 e a questão da conver-
gência da série de Fourier em x0 pode ser uma pergunta de imensa diculdade. Entretanto, um caso de
tratamento muito simples é aquele em que, embora descontínua em x0 , os limites laterais de f existem em

69
x0 . Usaremos as notações f (x0 −) e f (x0 +)para indicar os limites laterais à esquerda e à direita de f em
x0 , repectivamente, e lembramos que, se existirem, eles são denidos por
f (x0 −) = lim f (x) e f (x0 +) = lim f (x).
x→x0 − x→x0 +

Com o objetivo de ressaltar a importância dos limites laterais de f no contexto da convergência de sua
(x0 −)
série de Fourier, vamos tomar ` = f (x0 +)+f
2 em (3.5.5) e refazer os cálculos anteriores para concluir que
(x0 −)
a existência do limite de SN (x0 ) − f (x0 +)+f
2 só depende da existência do limite de

Z 0 Z δ
DN (s)[f (x0 + s) − f (x0 −)] ds + DN (s)[f (x0 + s) − f (x0 +)] ds
−δ 0

que pode, como antes, ser escrito como

0
1 δ f (x0 + s) − f (x0 +)
   
f (x0 + s) − f (x0 −)
Z Z
1 1 1
sen N + s ds + sen N + s ds.
π −δ 2 sen( 2s ) 2 π 0 2 sen( 2s ) 2

Agora, impomos a condição de Dini em cada subintervalo lateral [−δ, 0] e [0, δ]: admitimos que ambas

0 +δ

f (x0 − s) − f (x0 −) f (x0 − s) − f (x0 +)
Z Z
ds e ds
−δ
s
0
s

são nitas. Essas observações constituem-se na demonstração do seguinte

Teorema 3.5.3. Seja f : [−π, π] → R uma função integrável. Suponha que x0 é um ponto no interior de
[−π, π] no qual f é descontínua, mas os limites laterais f (x0 +) e f (x0 −) existem. Suponha ainda f satisfaz
a seguinte propriedade: as funções

f (x0 + h) − f (x0 −) f (x0 + h) − f (x0 +)


h ∈ [−δ, 0) 7→ e h ∈ (0, δ] 7→
h h
são absolutamente integráveis numa vizinhança de h = 0. Então, a série de Fourier S(x0 ) de f, em x0 , é
1
convergente e temos S(x0 ) = limN →∞ SN (x0 ) = 2 [f (x0 +) + f (x0 −)].

Um critério muito simples e largamente utilizado para vericar as hipóteses de integrabilidade absoluta
exigida no Teorema 3.5.3 é analisar a existência das derivadas laterais de f em x0 :

f (x0 + h) − f (x0 +) f (x0 + h) − f (x0 −)


f 0 (x0 +) := lim e f 0 (x0 −) := lim .
h→0+ h h→0− h

Quando ambas existem, a função f satisfaz as condições do Teorema 3.5.3. Registramos essa conclusão no
seguinte

Corolário 3.5.1. Seja f : [−π, π] → R uma função integrável. Suponha que x0 é um ponto no interior de
[−π, π] no qual f é descontínua, mas os limites laterais f (x0 +) e f (x0 −) existem. Suponha ainda que f
satisfaz a seguinte propriedade: as derivadas laterais

f (x0 + h) − f (x0 +) f (x0 + h) − f (x0 −)


f 0 (x0 +) := lim e f 0 (x0 −) := lim
h→0+ h h→0− h

existem. Então, a série de Fourier S(x0 ) de f, em x0 , é convergente e temos S(x0 ) = limN →∞ SN (x0 ) =
1
2 [f (x0 +) + f (x0 −)].

Resta nalmente considerar os casos x0 = −π e x0 = π . Em qualquer um desses casos, em nossa fórmula


básica

π π  
f (t) − `
Z Z
1 1
SN (x0 ) − ` = DN (x0 − t)[f (t) − `] dt = sen N + (x0 − t) dt,
−π π −π 2 sen( x02−t ) 2

70
o integrando apresenta um problema nos pontos t = −π e t = π, onde sen((x0 − t)/2) se anula. A solução é
tomar um número δ>0 e invocar o Lema de Riemann para concluir que

π−δ  
f (t) − `
Z
1 1
sen N + (x0 − t) dt → 0
π −π+δ 2 sen( x02−t ) 2

quando N → ∞. Nos intervalos [−π, −π + δ] e [π − δ, π], procedemos com os mesmos argumentos utilizados
no caso em que tratamos com limites laterais: suponha que existam os limites laterais

f (−π+) := lim f (s) e f (π−) := lim f (s)


s→−π+ s→π−

e que as funções

f (π + h) − f (π−) f (−π + h) − f (−π+)


h ∈ [−δ, 0) 7→ e h ∈ (0, δ] 7→
h h
sejam absolutamente integráveis. Então, limN →∞ SN (−π) e limN →∞ SN (π) existem e

1
lim SN (0) = lim SN (π) = [f (π−) + f (−π+)].
N →∞ N →∞ 2
Denição 3.5.2. Dizemos que uma função f : R → R é contínua por partes no intervalo [a, b] se ela é
limitada e contínua em todos os pontos de [a, b], exceto num número nito de pontos {x1 , x2 , ..., xk } de [a, b]
e, para cada 1 ≤ j ≤ k, os limites laterais

f (xj −) = lim f (x) e f (xj +) = lim f (x)


x→xj − x→xj +

existem.

O resultado principal a respeito da convergência puntual de uma série de Fourier pode ser agora enunciado
como

Teorema 3.5.4. Seja f : [−π, π] → R uma função contínua por partes em [−π, π]. Sejam {x1 , x2 , ..., xk } os
pontos de [a, b] nos quais f é descontínua e suponha que, para cada 1 ≤ j ≤ k , as derivadas laterais

f (x0 + h) − f (x0 +) f (x0 + h) − f (x0 −)


f 0 (x0 +) := lim e f 0 (x0 −) := lim
h→0+ h h→0− h
existem. Seja SN a soma parcial de ordem N da série de Fourier de f,
N
a0 X
SN (x) = + (an cos nx + bn sen nx).
2
n=1

Então, para cada x0 ∈ [−π, π], limN →∞ SN (x0 ) existe e temos


o limite


 f (x0 ), se f é contínua em x0
1
lim SN (x0 ) = [f (x 0 +) + f (x0 −)], se f é descontínua em x0
N →∞  12
[f (−π+) + f (π−)], se x0 = π ou x0 = −π.
2

Observação 3.5.4. Como dissemos anteriormente, quando a série de Fourier S(x) de uma função f é
convergente em todos os pontos x ∈ [−π, π], ela é também convergente em todos os pontos x ∈ (−∞, ∞).
Assim, S é uma função 2π -periódica denida em todo R. ♣

Para estabelecer a relação entre S e f, daremos a seguinte denição

Denição 3.5.3. Seja f : [−π, π] → R satisfazendo as hipóteses do Teorema 3.5.4. A função f˜ : R → R


denida por f (x) = f (x), se x ∈ [−π, π) e, se x ∈ [−π + 2kπ, π + 2kπ) para algum k inteiro, por f˜(x) =
˜
f (x − 2kπ), é chamada extensão 2π -periódica de f a R.

71
Observamos que, da forma como foi denida, se f é contínua por partes, então f˜ é 2π -periódica e é
contínua à direita em qualquer x ∈ R.
Assim, a conclusão do Teorema 3.5.4 pode ser formulada da seguinte forma: se f satisfaz as hipóteses do
1 ˜
Teorema 3.5.4, então sua série de Fourier S(x) converge para
2 [f (x+) + f˜(x−)], para todo x ∈ R.

Exemplo 3.5.2. Suponha que o gráco de uma função f é, em cada um dos subintervalos abertos (−π, x1 ),
(x1 , x2 ), (x2 , x3 ) e (x3 , π) indicados na gura abaixo, a restrição de um polinômio a esse subintervalo.
y
11
3
3

−π x1 x2 x3 π x

Então, f é contínua e derivável em todos os pontos de [−π, π] exceto em x1 , x2 , x3 e x = ±π , nos quais


os limites laterais de f e de f0 existem. Temos

lim f (x) = 3 lim f (x) = 2 lim f (x) = 3 lim f (x) = 3


x→x1 + x→x2 + x→x3 + x→−π+
11
lim f (x) = 2 lim f (x) = lim f (x) = 2 lim f (x) = 0.
x→x1 − x→x2 − 3 x→x3 − x→π−

Logo, a série de Fourier de f é convergente em (−∞, ∞) e sua soma dene uma função S : R → R dada
1 ˜
por S(x) = 2 [f (x+) + f (x−)] para todo x ∈ R, onde f˜ é a extensão 2π -periódica de f a (−∞, ∞). Em
˜
particular,

5 17 5 3
S(x1 + 2kπ) = , S(x2 + 2kπ) = , S(x3 + 2kπ) = , S((2k + 1)π) = , para todo k ∈ Z. ♣
2 6 2 2
Exercício 3.5.3. (a) Prove que

 
sen 2x sen 3x sen 4x
x = 2 sen x − + − + ... , para − π < x < π.
2 3 4
 
π 4 cos 3x cos 5x cos 7x
|x| = − cos x + + + + ... , para − π < x < π.
2 π 32 52 72
(b) Justique as seguintes identidades

π 1 1 1 1 π2 1 1 1 1
(i) = 1 − − + − + ... (ii) = 1 + 2 + 2 + 2 + 2 + ...
4 3 5 7 9 8 3 5 7 9
(c) Usando a Identidade de Parseval, mostre que

1 1 1 1 1 π2 1 1 1 1 1 π4
(i) 1+ + + + + + ... = . (ii) 1+ + + + + + ... = .
22 32 42 52 62 6 34 54 74 94 114 196

(d) Calcule S1 (728), S1 (327), S2 (1735) e S2 (2703), onde S1 , S2 : R → R são denidas por

∞ ∞
X (−1)n+1 sen nx X cos (2k + 1)x
S1 (x) = e S2 (x) = .
n (2k + 1)2
n=1 k=0

Exercício 3.5.4. Considere h(x) = −1


ln[0.4x(π−x)] e dena h(0) = h(π) = 0. Mostre que h é contínua e positiva
em [0, π]. Considere o prolongamento 2π -periódico par de h. Você pode demonstrar a convergência da série
de Fourier de h em x = 0? Justique.

72
Quando f˜ é contínua em (−∞, ∞), podemos melhorar signicativamente o resultado do Teorema 3.5.4
com o seguinte

Teorema 3.5.5. Suponha que f : [−π, π] → R é contínua e f (−π) = f (π). Suponha ainda que a derivada
f 0 (x) existe em todo x ∈ (−π, π) exceto possivelmente em um número nito de pontos e que |f 0 |2 é integrável.
Então a série de Fourier de f é uniformemente convergente em (−∞, ∞), isto é,


N

˜ a0 X
lim sup f (x) − − [an cos nx + bn sen nx] = 0,

N →∞ x∈(−∞,∞) 2
n=1

onde f˜ é a extensão 2π periódica de f a R.

Observe que a hipótese f (−π) = f (π) implica que f˜ é contínua em (−∞, ∞).
Demonstração do Teorema 3.5.5. É suciente demonstrar o resultado quando f é derivável em todos os
0 2
pontos de [−π, π], o que faremos no que segue. Como |f | é integrável, a fórmula de integração por partes
mostra que

Z π Z π
1 sen nt π
πan [f ] = f (t) cos ntdt = [f (π) sen nπ + f (−π) sen nπ] − f 0 (t) dt = bn [f 0 ],
−π n −π n n

mostra que, para todo n ≥ 1, temos

 
1 1 1
|an [f ]| ≤ |bn [f 0 ]| ≤ 0 2
+ |bn [f ]| .
n 2 n2
P∞
Agora, usamos a Desigualdade de Bessel para concluir que a série n=1 |an [f ]| é convergente. Da mesma
P∞ 10 uma
forma, concluímos que n=1 |bn [f ]| é convergente. O resultado segue agora do Teste de Weierstrass,
vez que cada termo da série de Fourier de f

a0 X
f∼ + [an cos nx + bn sen nx] ,
2
n=1

satisfaz |an cos nx + bn sen nx| ≤ |an | + |bn |, para todos n≥1 e x ∈ R.

3.6 Séries de Fourier versus Derivação e Integração Termo a Termo

Nessa Seção vamos discutir o comportamento de uma Série de Fourier quanto às operações de derivação e
integração. Vamos sempre admitir que f é uma função denida em todo R e é periódica de período mínimo
2L > 0. Você sempre pode supor que f foi originalmente denida em [−L, L] e considerar sua extensão
2L-periódica a todo o intervalo (−∞, ∞).
Iniciamos observando que se f : R → R é 2L-periódica e derivável em todo ponto x, então a função
f0 : R → R é também 2L-periódica. A demonstração deste fato decorre imediatamente da denição de
derivada.
R xEntretanto, primitivas de uma função periódica não são necessariamente periódicas. De fato,
F (x) = 0 f (t) dt é 2L-periódica se somente se F (x + 2L) = F (x), que é equivalente a F (2L) = 0, isto é,
f tem média zero em [−L, L]. (A média de uma função f num intervalo [a, b] é o número b−a 1
Rb
a f (x)dx).
1
RL
Como g = f −
2L −L f (x)dx tem média zero, então g é 2L-periódica e, portanto, tem uma série de Fourier.
0
O que estudaremos nessa Seção é a relação entre as séries de Fourier de f com as de f e de g .

Por ser mais simples, vamos começar com a derivação. Seja f : [−L, L] → R uma função contínua
satisfazendo f (−L) = f (L) 0
e suponha que a derivada f (x) existe em todo x ∈ (−π, π) exceto possivelmente
10
O Teste de Weierstrass estabelece que se {fn }∞ n=1 é uma sequência de funções reais (ou complexas) denidas Pem I e se
{Mn }∞ n=1 é uma sequênciaP de números reais não-negativos tais que |fn (x)| ≤ Mn para todos x ∈ I e n ≥ 1 e ∞ n=1 Mn é
convergente, então a série ∞ n=1 fn é uniformemente convergente em I , isto é, existe uma função f : I → R (ou C) tal que
limN →∞ supx∈I |f (x) − N n=1 fn (x)| = 0. Se cada f é contínua em I , então f é contínua em I . Se cada fn é integrável em
P
Rb n Rb
[a, b] ⊂ I , então f é integrável em [a, b] e temos a f (x) dx = ∞n=1 a fn (x) dx.
P

73
em um número nito de pontos e que |f 0 |2 é integrável . Do Teorema 3.5.5, sabemos que a série de Fourier
de f é uniformemente convergente para a a extensão 2L-periódica f˜ de f , isto é, para todo x ∈ (−∞, ∞),
temos

a0 X h  nπx   nπx i
f˜(x) = + an cos + bn sen . (3.6.1)
2 L L
n=1
0
Uma vez que f é integrável, ela também tem uma série de Fourier. O próximo resultado mostra que a série
0
de Fourier de f é a série obtida de (3.6.1) por derivação termo a termo.

Teorema 3.6.1. Suponha que f : [−L, L] → R é contínua e f (−L) = f (L). Suponha ainda que a derivada
f 0 (x) existe em todo x ∈ (−L, L), exceto possivelmente em um número nito de pontos, e que |f 0 |2 é
integrável. Então a
0
série de Fourier de f é dada por


π Xh  nπx   nπx i
f0 ∼ nbn cos − nan sen . (3.6.2)
L L L
n=1

Observação 3.6.1. Embora a armação (3.6.1) seja verdadeira para todo x, a fórmula (3.6.2) signica
0
apenas que a série de Fourier da função f é a série do lado direito. Os Exemplos 3.7.1 e 3.7.2 mostram que
continuidade de f e a hipótese de que f (−L) = f (L) não podem ser removidas: nesses exemplos, a derivada
da função original f é nula exceto em dois pontos, a série de Fourier de f converge em todo um intervalo,
mas a série obtida por derivação termo a termo não é uma série de Fourier.

Demonstração do Teorema 3.6.1. A desigualdade |f 0 (x)| ≤ 21 [1 + |f 0 (x)|2 ] nos pontos onde existe mostra
RL
0 (x)|dx é nito e, portanto, f 0 é absolutamente integrável. Vamos computar os coecientes de
que
−L |f
0 0
Fourier de f . Como na demonstração do Teorema 3.5.5, podemos supor que f existe em todos os pontos
de [−L, L]. O Teorema Fundamental do Cálculo implica que

Z L
La0 [f 0 ] = f 0 (t)dt = f (L) − f (−L) = 0
−L

e integração por partes implica

L
nπ L
Z   Z  
0 0nπt nπt
Lan [f ] = f (t) cos dt = f (L) cos nπ − f (−L) cos nπ + f (t) sen dt = nπbn [f ]
−L L L −L L
Z L
nπ L
  Z  
0 0 nπt nπt
Lbn [f ] = f (t) sen dt = f (L) sen nπ − f (−L) sen nπ − f (t) cos dt = −nπan [f ],
−L L L −L L
e o Teorema está demonstrado.

Teorema 3.6.2. Suponha que f : [−L, L] → R é uma função tal que |f |2 é integrável e seja


a0 X h  nπx   nπx i
f∼ + an cos + bn sen (3.6.3)
2 L L
n=1

sua série de Fourier. Se f˜ é 2L-periódico de f a (−∞, ∞), então


o prolongamento

Z xh ∞ ∞   nπx 
˜ a0 i L X bn L X bn  nπx  a
n
f (t) − dt = + − cos + sen , (3.6.4)
0 2 π n π n L n L
n=1 n=1

para todo x∈R e a convergência é uniforme em (−∞, ∞).


Demonstração.
Rx
g(x) = f˜(t) − a20 . Então, g tem média zero e, portanto F (x) := 0 g(s)ds é 2L-
Seja
periódica e F (L) = F (−L). Pelo Teorema Fundamental do Cálculo, F é contínua em (−∞, ∞) e é derivável
em todo ponto x0 onde f˜ é contínua e nesses pontos, F (x0 ) = f˜(x0 ); assim, F satisfaz todas as hipóteses
0

do Teorema 3.5.5. Logo, sua série de Fourier converge uniformemente para F, isto é, para todo x ∈ R,

A0 X h  nπx   nπx i
F (x) = + An cos + Bn sen ,
2 L L
n=1

74
onde An = An [F ], Bn = Bn [F ] são os coecientes de Fourier de F.
Tudo que precisamos agora é calcular esses coecientes. Se n ≥ 1, integração por partes, convergência
uniforme e Relações de Ortogonalidade mostram que

L L
L2
Z  nπx  Z
L  nπx 
LAn = F (x) cos dx = − f (x) sen dx = − bn [f ]
−L L nπ −L L nπ
L L
L2
Z  nπx  Z
L  nπx 
LBn = F (x) sen dx = f (x) cos dx = an [f ].
−L L nπ −L L nπ
Para calcular A0 , substituímos x=0 na igualdade acima:

∞ ∞
A0 X A0 X L
F (0) = + An = − bn [f ].
2 2 nπ
n=1 n=1

Substituindo os valores encontrados, obtemos o resultado.

Outra forma de escrever (3.6.4) é

Z x ∞  
˜ a0 x L X an  nπx  b 
n
 nπx 
f (t)dt = + sen + cos −1 ,
0 2 π n L n L
n=1

para todo x ∈ R. Essa última enfatiza a integração termo a termo da série (3.6.3).

Exemplo 3.6.1. Vimos no Exercício 3.5.3 que


 
sen 2x sen 3x sen 4x
x = 2 sen x − + − + ... , para − π < x < π.
2 3 4
 
π 4 cos 3x cos 5x cos 7x
|x| = − cos x + + + + ... , para − π < x < π.
2 π 32 52 72
Como f (x) = |x| é contínua em [−π, π], f (−π) = f (π) = π e sua derivada f 0 (x) = x
|x| se x 6= 0, o Teorema
3.6.2 pode ser aplicado e mostra que a série
 
4 sen 3x sen 5x sen 7x
sen x + + + + ...
π 3 5 7
x
é a série de Fourier da função sinal de x, dada por g(x) = |x| , x 6= 0, g(0) = 0. Esta última série é convergente
1
e sua soma é igual a
2 [g̃(x+) + g̃(x−)] para todo x ∈ R, onde g̃ é a extensão 2π -periódica de g . O Teorema
3.6.2 não pode ser aplicado para a série resultante (nem para a primeira desse Exemplo) - por que?
Integrando termo a termo a primeira série acima, obtemos

x2
 
1 − cos x 1 − cos 2x 1 − cos 3x 1 − cos 4x
=2 − + − + ...
2 12 22 32 42

X (−1)n−1 ∞ ∞
X cos nx π2 X cos nx
=2 + 2 = + 2 , para − π < x < π.
n2 n2 4 n2
n=1 n=1 n=1

Integrando uma vez mais, obtemos

x3 π2x
 
sen x sen 2x sen 3x sen 4x
= +4 + + + + ...
3 2 13 23 33 43   
2 sen 2x sen 3x sen 4x sen x sen 2x sen 3x sen 4x
= π sen x − + − + ... + 4 + + + + ... ,
2 3 4 13 23 33 43
para −π < x < π .
Desta forma, você pode obter as séries de Fourier das funções, dadas em [−π, π], por xn , n = 4, 5, 6, ... e
mesmo qualquer polinômio. As séries obtidas convergem uniformemente em R para a extensão 2π -periódica
da função que a gerou.

75
Exemplo 3.6.2. Você já ouviu dizer que, dentre todas as curvas planas simples e fechadas de um dado
perímetro, a que encerra maior área é o círculo. Esse é o famoso problema isoperimétrico. Vamos mostrar
como esse resultado pode ser demonstrado usando a teoria desenvolvida nas Seções anteriores.
11

Daremos a demonstração no caso em que as curvas consideradas sejam lisas por partes. Para isso,
suponhamos que x = x(s), y = y(s) seja a representação paramétrica de uma curva lisa por partes, simples
e fechada γ, e parametrizada pelo comprimento de arco. Suponhamos ainda que γ tenha comprimento 2π ,
de modo que as funções x e y satisfazem x(0) = x(2π) e y(0) = y(2π). Escrevendo o desenvolvimento de
séries de Fourier de x e y como


a0 X
x(s) = + (an cos ns + bn sen ns)
2
n=1

c0 X
y(s) = + (cn cos ns + dn sen ns),
2
n=1

obtemos

X
0
x (s) = (−nan sen ns + nbn cos ns)
n=1
X∞
y 0 (s) = (−ncn sen ns + ndn cos ns).
n=1

Como x0 (s)2 + y 0 (s)2 = 1, a Identidade de Parseval implica que

Z 2π ∞
X
2π = [x0 (s)2 + y 0 (s)2 ] ds = π n2 (a2n + b2n + c2n + d2n ).
0 n=1

Agora, expressamos a área delimitada por γ usando o Teorema de Green e o Teorema 3.4.6 como

Z Z 2π ∞
1 1 πX
A= −ydx + xdy = [x(s)y 0 (s) − y(s)x0 (s)]ds = 2n(an dn − bn cn ).
2 γ 2 0 2
n=1

Subtraindo as duas últimas igualdades e completando quadrados, obtemos


2A X
2− = {n2 (a2n + b2n + c2n + d2n ) − 2n(an dn − bn cn )}
π
n=1
X∞
= {(nan − dn )2 + (nbn + cn )2 + (n2 − 1)(c2n + d2n )} ≥ 0.
n=1

Assim, a área delimitada por uma curva de comprimento 2π é menor ou igual a π. Além disso, a igualdade
A=π é equivalente a

nan − dn = 0 , nbn + cn = 0 e (n2 − 1)(c2n + d2n ) = 0 para todo n ≥ 1.

Se n > 1, a última igualdade implica cn = 0 e dn = 0 e as duas primeiras implicam an = 0 e bn = 0. Se


n = 1, então a1 = d1 e b1 = −c1 e a condição
Z 2π
2π = [x0 (s)2 + y 0 (s)2 ] ds = π(a21 + b21 + c21 + d21 )
0

implica a21 +b21 = 1. Portanto, existe uma constante α em [0, 2π) tal que a1 = cos α e b1 = sen α. Substituindo
esses valores nas expressões de x e de y, obtemos

a0 a0
x(s) = + cos α cos s + sen α sen s = + cos(s − α)
2
c0 c20
y(s) = − sen α cos s + cos α sen s = + sen(s − α),
2 2
11
Baseado em G. Chilov [5].

76
e a curva é uma circunferência de raio 1 e centro no ponto ( a20 , c20 ).
Se o comprimento total da curva γ é igual a um número ` 6= 2π , efetuamos a homotetia u = 2π 2π
` x, v = ` y
0 0
que transfroma a curva γ numa curva γ de comprimento 2π delimitando área A = (
2π 2
` ) A. Do que acabamos
0 `2 0
de demonstrar, A ≤ π implica A ≤
4π e, quando γ assume seu extremo numa circunferência de raio 1, a
`
curva correspondente γ é igualmente uma circunferência de raio
2π . A demonstração está completa. ♣

3.7 A Forma Complexa da Série de Fourier

Como vimos, se f : [−L, L] → R é uma função absolutamente integrável num intervalo [−L, L], sua série de
Fourier é a série

a0 X h  nπx   nπx i
f∼ + an cos + bn sen ,
2 L L
n=1

onde
Z L   Z L  
1 nπt 1 nπt
an = f (t) cos dt e bn = f (t) sen dt.
L −L L L −L L
Usando a identidades
 nπx   nπx 
einπx/L + e−inπx/L = 2 cos e einπx/L − e−inπx/L = 2i sen
L L
podemos reescrever

∞  
a0 X an  inπx/L −inπx/L
 b 
n inπx/L −inπx/L
f∼ + e +e + e −e
2 2 2i
n=1

ou ainda
∞     
a0 X an bn inπx/L an bn −inπx/L
f∼ + + e + − e .
2 2 2i 2 2i
n=1
a0
Denindo c0 = 2 e ck = 21 (ak − ibk ) e c−k = 12 (ak + ibk ) para todo k ≥ 1, a fórmula acima pode ainda
ser escrita como

X
f∼ cn einπx/L , (3.7.1)
n=−∞

onde ck são dados por


Z L
1
ck = f (t)e−ikπt/L dt (3.7.2)
2L −L

para todo k ∈ Z.
A série (3.7.1) com coecientes denidos por (3.7.2) é a forma complexa da série de Fourier de f . Sempre
podemos passar da forma real para a forma complexa e vice-versa tendo em conta as relações

2c0 = a0 , 2ck = ak − ibk a0 = 2c0 , ak = ck + c−k


2c−k = ak + ibk bk = i(ck − c−k )

O coeciente c0 é sempre real e representa o valor médio de f no intervalo [−L, L].

Exemplo 3.7.1. Suponha que L=π e que f é um pulso retangular de altura A



A, se − a ≤ x ≤ a
f (x) =
0 se a < |x| ≤ π,

onde 0<a<π A são constantes.


e Então,

Z π Z π
1 aA 1 A A sen na
c0 = f (t) dt = e cn = f (t)e−int dt = [e−ina − eina ] =
2π −π π 2π −π −2inπ nπ

77
y
A

−π −a a π x

π
Figura 3.2: Somas parciais Sn do Exemplo 3.7.1 quando a= 2 e n=4 (vermelho) e n=5 (azul).

e a série de Fourier de f é


A X sen na inx A sen na aA
f∼ e . [Convenção: adotamos = quando n = 0]
π n=−∞ n nπ π

Para obter a série de Fourier real de f , basta somar os termos simétricos: para n ≥ 1,
A h sen na inx sen na −inx i 2A sen na
cn einx + c−n e−nx = e + e = cos nx
π n n nπ
e a série de Fourier real é

!
A X sen na
f∼ a+2 cos nx.
π n
n=1
π
Tomando, por exemplo, a= 2 , a série se escreve como

!
A π X cos(2k + 1)x
f∼ +2 (−1)k
π 2 2k + 1
k=0

e o gráco de algumas somas parciais estão representados na Figura 3.2. ♣



0, se − π ≤ x ≤ 0
Exemplo 3.7.2. Suponha L=π e que f é um degrau de altura A, f (x) =
A, se 0 < x ≤ π,
onde A
é uma constante. Então,
Z π Z π
1 A 1 A A
c0 = f (t) dt = e cn = f (t)e−int dt = [e−inπ − 1] = [1 − (−1)n ]
2π −π 2 2π −π −2inπ 2πin
e a série de Fourier de f é

A X A
f∼ + [1 − (−1)n ]einx .
2 2πin
n=−∞,n6=0

y
A

−π π x

Figura 3.3: Somas parciais Sn do Exemplo 3.7.2 para n=4 (vermelho) e n=5 (azul).

Para obter a série de Fourier real de f, n ≥ 1,


basta somar os termos simétricos: para

A[1 − (−1)n ] einx e−inx A[1 − (−1)n ]




cn einx + c−n e−nx = + = sen nx
2πi n −n nπ
e

A X sen (2k + 1)x
f ∼ + 2A .
2 (2k + 1)π
k=0
é a série de Fourier real de f. ♣

78
Se V indica espaço vetorial das funções cujo quadrado é absolutamente integráveis em [−L, L], isto é,
V = {f : [−L, L] → C : |f |2 é integrável},

então, a fórmula
12
Z L
hf, gi = f (x)g(x) dx
−L

dene um produto interno em


RL
V e, como de costume, a norma de uma função em V é dada por kf k2 =
2
−L |f (x)| dx. Com essa linguagem, podemos adaptar todos os conceitos discutidos na Seção 3.4 para o caso
presente. As funções fn (x) = e
inπx/L , para n ∈ Z, são duas a duas ortogonais:

Z L
hfk , fn i = ei(k−n)πx/L dx = 0
−L

se k 6= n e hfk , fn i = 2L, se k = n. Portanto, o conjunto S = {en : n ∈ Z}, onde en (x) = √12L einπx/L , é um

sistema ortonormal em V . A projeção de f ∈ V no vetor en é dada por hf, en ien = 2Lcn en . Isso signica
que (hf, en ien )(x) = cn einπx/L , para todo x.
A soma parcial simétrica SN da série de Fourier (3.7.1), dada por

N
X
SN (f )(x) = ck eikπx/L
k=−N

é assim interpretada como


N
X
SN (f ) = hf, ek iek ,
k=−N

um vetor que pertence ao subespaço VN gerado por 2N + 1 vetores VN = [e−N , e−N +1 , ..., e−1 , e0 , e1 , ..., eN ].
Como {en }N
n=−N é uma base ortonormal de VN , temos

N
X
kSN (f ) − f k2 = kf k2 − |ck |2
k=−N
PN
e, portanto, kSN (f ) − f k2 → 0 quando N → ∞ 2
k=−N |ck | → 0 quando N →
se e somente se kf k2 −
∞. Qualquer uma dessas condições é equivalente ao fato que o conjunto {en }∞
n=−∞ constitui um sistema
ortonormal completo em V . Delas ainda decorre a Desigualdade de Bessel

X
|ck |2 ≤ kf k2
k=−∞

e a Identidade de Parseval ∞
X
|ck |2 = kf k2 ,
k=−∞

4|cn |2 = 4|c−n |2 = a2n + b2n |cn |2


P
para todo f ∈ V. Como para todo n ≥ 0, a soma duplica todas as
parcelas. A Identidade de Parseval clássica

∞ L
a20 X 2
Z
1
+ (an + b2n ) = |f (x)|2 dx
2 L −L
n=1

escrita em função dos coeentes cn se torna

∞ Z L
X 1
2
|cn | = |f (x)|2 dx.
n=−∞
2L −L
12
z indica o conjugado do número complexo z .

79
3.8 Exercícios

1. Determine a série de Fourier das funções abaixo, determine sua soma e esboce seu gráco:
 
a, −π < x ≤ 0 ax, −π < x ≤ 0
a) f (x) = b) f (x) =
b, 0 < x ≤ π bx, 0 < x ≤ π
c) f (x) = |x|, −π < x ≤ π
ax
d) f (x) = e , −π < x ≤ π, a 6= 0
e) f (x) = sen(ax), −π < x ≤ π, a ∈
/Z f ) f (x) = ax + b, −π < x ≤ π
g) f (x) = | cos x|, −π < x ≤ π

2. Determine as séries de Fourier de senos e de cossenos das funções abaixo, determine suas somas e
esboce seus grácos:

a) f (x) = ax, 0 ≤ x ≤ π b) f (x) = x2 , 0 ≤ x ≤ π


c) f (x) = ax + b, 0 ≤ x ≤ π d) f (x) = sen x, 0 ≤ x ≤ π .

3. Mostre que

a) 1 = π4 (sen x + 13 sen 3x + 15 sen 5x + ...), 0 < x < π ;

b) π − x = 2(sen x + 12 sen 2x + 13 sen 3x + ...), 0 < x < π ;


π2 cos 2x cos 3x
c) x2 = 3 + 4(− cos x + 22
− 32
+ ...), −π < x < π ;
π2 cos 4x cos 6x
d) x(π − x) = 6 − (cos 2x + 22
+ 32
+ ...), 0 < x < π ;
e) x(π − x) = π8 (sen x + sen 3x
33
+ sen 5x
53
+ ...), 0 < x < π .

4. Usando o exercício anterior, verique as seguintes igualdades:

π 1 1 1 (−1)n π2 1 1 1
a)
4 =1− 3 + 5 − 7 + ··· + 2n+1 + ··· ; b)
6 =

1+ 22
+ 32
+ ··· + n2
+ ··· ;
n−1
π 3 P∞ (−1) 3 2π 3 1 1 1 1 1
c)
32 = n=1 (2n−1)3 ; d)
128 =1+ 33
− 53
− 73
+ 93
+ 113
− ··· ;


√ 1
√ 1
√ 1 1
√ √ √ √
e)
4 = 2+1+ 3 2− 5 2− 3 − 7 2 + 91 2 + 1
5 + 1
11 2− 1
13 2 − ....

5. Calcule a soma de cada uma das séries


P∞ 1 P∞ (−1)n−1
a) n=0 (2n+1)2 b) .
n=1 n2

6. Determine c1 , c2 e c3 de modo que cada uma das integrais abaixo assumam o menor valor possível:
Rπ Rπ
a)
−π [x − c1 sen x − c2 sen 2x − c3 sen 3x]2 dx b)
−π [x
2 − c1 ]2 dx

c)
−π [| cos x| − c1 − c2 sen x − c3 cos x]2 dx.

7. Determine a série de Fourier da função f (x) periódica de período 1 e que satisfaz f (x) = x2 se 0 ≤ x < 1.
Qual a soma de série quando x = 999/2? E quando x = 999?

8. a) Determine a série de Fourier da função ímpar f, periódica de período 4, e que satisfaz f (x) = x se
0≤x≤1 e f (2 − x) = f (x) se 0 ≤ x < 1;
∞  
X (2n − 1)x
b) Determine b1 , b2 , b3 , ... tais que bn sen =x se 0<x<1 e f (2 − x) = f (x) se
2
n=1
0 < x < 1;
∞  
X (2n − 1)x
c) Determine c1 , c2 , c3 , ... tais que cn sen =1−x se 0<x<1 e f (2 − x) = f (x) se
2
n=1
0 < x < 1;
d) Qual o valor da soma de série do item c) quando x = 200? E quando x = 201?

80
9. Determine constantes a e b tais que a série de senos de f (x) = x3 + ax, 0 ≤ x ≤ π , seja da forma


X sen nx
b (−1)n .
n3
n=1

10. Usando a Identidade de Parseval, prove que


∞ ∞
π4 X 1 π6 X 1
(a) = (b) = .
90 n4 945 n6
n=1 n=1

11. Calcule
∞ ∞
X 1 X 1
(a) (b) .
(2n − 1)4 (4n2 − 1)2
n=1 n=1

Respostas

a+b sen((2n−1)x)
+ π2 (b − a)
P
1. (a) .
2 2n−1
n=1
a+b
soma: a,(2k − 1)π < x < 2kπ ; b, se 2kπ < x < (2k + 1)π ;
se
2 , se x = kπ , k ∈ Z.
∞ ∞
b−a 2 cos(2n−1)x
(−1)n sinnnx .
P P
(b)
4 π + π (a − b) (2n−1)2 − (a + b)
n=1 n=1
b−a
soma: ax, se (2k − 1)π < x ≤ 2kπ ; bx, se 2kπ ≤ x < (2k + 1)π ; 2 π , se x = (2k + 1)π , k ∈ Z.

π 4 P cos(2n−1)x
(c)
2 − π (2n−1)2
.
n=1
soma: |x|, se −π ≤ x ≤ π e sua extensão periódica para x ∈ R.

sinh(aπ) 2 sinh(aπ) P (−1)n
(d)
aπ + π n2 +a2
(a cos(nx) − n sin(nx)).
n=1
soma: eax , se −π < x < π ; cosh(aπ), se x = ±π e a sua extensão periódica para x ∈ R.

2 sin(aπ) n
(−1)n−1 n2 −a
P
(e)
π 2 sin(nx).
n=1
soma: sin(ax), para −π < x < π ; 0 para x = ±π e sua extensão periódica para x ∈ R.

(−1)n−1 sinnnx .
P
(f ) b + 2a
n=1
soma: ax + b, para −π < x < π ; b, para x = ±π , e sua extensão periódica, para x ∈ R.

 
2 P (−1)n−1 cos(2nx)
(g)
π 1+2 4n2 −1
.
n=1
soma: | cos x|, x ∈ R.

(−1)n−1 sinnnx .
P
2. (a) série de senos: 2a
n=1
soma: ax, −π < x < π ; 0 para x = ±π
para e sua extensão periódica para x ∈ R.

aπ 4a P cos(2n−1)x
série de cossenos:
2 − π (2n−1)2
.
n=1
soma: a|x|, para −π ≤ x ≤ π e sua extensão periódica para x ∈ R.
∞ ∞
sin(2n−1)x
(−1)n−1 sinnnx − π8
P P
(b) série de senos: 2π .
(2n−1)3
n=1 n=1
soma: x2 0 ≤ x < π ; −x2 , para −π ≤ x ≤ 0;
para 0 para x = ±π e sua extensão periódica para x ∈ R.

π2
(−1)n cosn2nx .
P
série de cossenos:
3 + 4
n=1
soma: x2 , para −π ≤ x ≤ π e sua extensão periódica para x∈R

P 2 n
(c) série de senos:
nπ [b − (aπ + b)(−1) ] sin nx.
n=1
soma: ax − b, se −π < x ≤ 0; ax + b, se 0 < x < π ; 0, se x = 0, ±π e sua extensão periódica, se x ∈ R.

aπ 4a P cos(2n−1)x
série de senos:
2 +b− π (2n−1)2
.
n=1
soma: a|x| + b, para −π ≤ x ≤ π e sua extensão periódica de a|x| + b para x ∈ R.

81
(d) série de senos: sin x.
soma: sin x, para x ∈ R.

2 4 P cos 2nx
série de cossenos:
π − π 4n2 −1
.
n=1
soma: | sin x| para x ∈ R.
π π π π
4. (a) use 3a) e x= 2 ; (b) use 3d) e x = 0; (c) use 3e) e x= 2 ; (d) use 3e) e x = 4 ; (e) use 3b) e x = 4.
π2 π2 2π 2
5. (a)
8 b)
12 . c1 = 2, c2 = −1, c3 = 32
6. (a) (b) c1 =
3 ,
4
(c) c1 = , c2 = c3 = 0.
π

1 1
cos( nπx 1 nπx 1
P  
7.
3 + π 2 n2 4 ) − πn sin( 2 ) , S(999) = 0 e S(999/2) = 2.
n=1

8 P (−1)k 8 (−1)(n−1)
8. (a) 2
π (2k+1)2
sin( (2k+1)πx
2 ). (b) bn = π 2 (2n−1)2
para n ≥ 1.
k=0
4 (−1)n 8
(c) cn =
(2n−1)π + (2n−1)2 π 2
, para n ≥ 1. (d) S(200) = S(0) = 0; S(201) = S(1) = 0.
π4 π2 1
9. a = −π 2 e b = 12. 10. (a) Use f (x) = x3 . (b) Use exercício 9. 11. (a)
96 (b)
16 − 2.

82
Capítulo 4

O Método de Separação de Variáveis -


Conjuntos Ortogonais

4.1 Introdução

Quando possível sua aplicação, o método de separação de variáveis (ou método de Fourier) é uma ferramenta
poderosa para a obtenção de soluções de problemas que envolvem uma equação diferencial parcial e algumas
condições complementares, chamadas condições iniciais e/ou condições de fronteira.
Já utilizamos esse método na discussão da solução da equação das ondas, tratada no início do Capítulo
anterior. Vamos mais uma vez exemplicar o método, estudando o exemplo em que a equação parcial é a
equação do calor, a origem das séries de Fourier. Em sua forma mais simples, o problema consiste em obter as
soluções da equação do calor unidimensional com condutividade térmica c > 0 constante e pode ser enunciado
da seguinte forma: determinar uma função contínua u : [0, π] × [0, ∞) → R que admite derivadas parciais ut ,
ux e uxx no retângulo aberto Ω = (0, π) × (0, ∞) e suas derivadas parciais satisfazem ut (x, t) = cuxx (x, t)
para todo (x, t) ∈ Ω; u também satisfaz as condições de fronteira u(0, t) = u(π, t) = 0 para todo t ≥ 0 e a
condição inicial u(x, 0) = φ(x) para 0 ≤ x ≤ π.
Observe que a fronteira de Ω F1 = {0} × [0, ∞), F2 = [0, π] × {0} e
é composta de três segmentos
F3 = {π} × [0, ∞). As condições de fronteira em F1 e u é nula nos pontos de F1 ∪ F3 ,
F3 signicam que
enquanto que na fronteira F2 o valor de u é o de uma função φ dada a priori. Como a variável t na equação
do calor representa o tempo, referimos-nos à condição de fronteira em F2 como condição inicial e a função
φ como valor inicial ou dado inicial.
Todas essas considerações e linguagem serão doravante reduzidas ao seguinte enunciado: determine a
solução do problema

ut = cuxx , 0 < x < π, t > 0
u(0, t) = u(π, t) = 0 t > 0
que satisfaz u(x, 0) = φ(x), para 0 ≤ x ≤ π.
Na próxima seção, vamos discutir esse e outros exemplos aos quais o método de separação de variáveis
se aplica.

4.2 O Método de Separação de Variáveis

A equação diferencial parcial ut = cuxx é usada como modelo de transmissão de calor ao longo de uma barra
homogênea construída de material com condutividade térmica constante c > 0. Aqui, u = u(x, t) representa
a temperatura de um ponto x da barra no instante t > 0. Supondo que a barra tem comprimento ` e,
durante todo o processo, a temperatura é mantida constante (que tomaremos como zero) nos extremos x=0
e x = ` da barra, nos perguntamos: qual é a função u = u(x, t) denida para x ∈ [0, `] e t > 0 que satisfaz
ut = cuxx quando 0 < x < ` e t > 0 e as condições de fronteira u(0, t) = u(`, t) = 0? A resposta a essa
pergunta depende de qual é a distribuição da temperatura no inicio do processo, isto é, depende do valor
inicial u(x, 0), que admitiremos ser uma função φ : [0, `] → R. Assim, a procura da solução deste problema

83
conduz à discussão das soluções de

ut = cuxx , 0 < x < `, t > 0 (4.2.1)

com condições de Dirichlet homogêneas na fronteira


u(0, t) = u(`, t) = 0, t>0 (4.2.2)

e condição inicial
u(x, 0) = φ(x), 0 ≤ x ≤ `. (4.2.3)

As condições (4.2.1), (4.2.2) e (4.2.3) constituem um problema de valor de fronteira e condição inicial e será
indicado abreviadamente por

 ut (x, t) = cuxx (x, t), 0 < x < `, t > 0
u(0, t) = u(`, t) = 0, t > 0
u(x, 0) = φ(x), 0 ≤ x ≤ `.

Como zemos no Capítulo 3, vamos procurar uma solução não-nula de ut = cuxx que seja de variáveis
separadas u(x, t) = X(x)T (t). Substituindo, obtemos X(x)T 0 (t) = 00
cX (x)T (t), e portanto
T 0 (t) X 00 (x)
=
cT (t) X(x)
se T e X não são nulas. (Esperamos que o uso de
0 para indicar a derivada tanto com relação a
t e a x não
cause confusão). Como o lado esquerdo depende apenas de t e o lado direito apenas de x, então ambas devem
se constantes e, assim,
0 00
existe uma constante λ tal que (I) T (t) = cλT (t) e (II) X (x) = λX(x). A constante
λ é chamada constante de separação e devemos, em princípio, considerá-la como um número complexo.
A solução da primeira equação é imediata: T (t) = T0 ecλt , onde T0 é uma constante arbitrária. Quanto à
segunda, procuramos uma função não-nula X que satisfaz

X 00 (x) = λX(x), 0 < x < `



(4.2.4)
X(0) = X(`) = 0.

O sistema (4.2.4) é chamado umproblema de autovalores e, quando existe um valor λ ∈ C e uma função
não-nula X tais que o par (λ, X) é uma solução de (4.2.4), dizemos que λ é um autovalor de (4.2.4) e que X
é um autovetor (ou autofunção) de (4.2.4) correspondente a λ.

Para estudar os autovalores de (4.2.4), observamos primeiro que multiplicando a equação por X(x)
(conjugado de X(x)) e integrando por partes em [0, π], obtemos

Z ` Z ` Z ` Z `
00 0 0
λ 2
|X(x)| dx = X(x)X (x) dx = X(x)X (x)|`0 − 2
|X (x)| dx = − |X 0 (x)|2 dx
0 0 0 0

uma vez que X(0) = X(`) = 0. Concluímos assim que λ deve ser um número real não-positivo, que
vamos escrever na foma λ = −µ2 , com µ ≥ 0. Logo, a equação diferencial em (4.2.4) se escreve como
X 00 (x) + µ2 X(x) = 0.
A possibilidade µ=0 a e b tais que X(x) = ax + b para todo x ∈ [0, `]
implica que existem constantes
e a condição de fronteira X(0) = X(`) = 0
a = b = 0; portanto λ = 0 não é um autovalor de
implica que
(4.2.4). Logo, µ > 0 e a autofunção correspondente é da forma X(x) = c1 cos µx + c2 sen µx, onde c1 e c2 são
constantes arbitrárias. As condições de fronteira agora implicam c1 = 0 e c2 sen(µ`) = 0. Como queremos
soluções não-nulas, devemos tomar c2 6= 0 e, portanto, devemos ter sen(µ`) = 0. As soluções desta equação
são os números µ` = kπ , com k inteiro. Logo, µ deve ser um número real da forma µ = kπ/`. Assim, para
2
cada inteiro n ≥ 1, obtemos valores λ = λn = −(nπ/`) para os quais (9.6.2) tem uma solução não-nula
2 2 2
un (x, t) = e−cn π t/` sen(nπx/`).
Como a equação (4.2.1) é homogênea, soma de soluções é uma solução e, assim, a função


2 π 2 t/`2
X
u(x, t) = an e−cn sen(nπx/`) (4.2.5)
n=1

84
é uma solução de (4.2.1) desde que a série seja convergente. E quanto à condição inicial u(x, 0) = φ(x),
0 ≤ x ≤ π? Bem, você coloca t=0 em (4.2.5) e obtém


X
φ(x) = an sen(nπx/`),
n=1

de onde você rapidamente identica que an são os coecientes de Fourier da extensão ímpar de φ ao intervalo
[−`, `], que são dados por
Z `
2
bn [φ] = φ(x) sen(nπx/`) dx (4.2.6)
` 0
para n = 1, 2, . . . . Mas o que garante que a série (4.2.5) é convergente quando t = 0? Bem, você tem que
procurar uma classe de funções φ às quais essa operação se aplica. Do que vimos sobre séries de Fourier,
podemos com certeza tomar φ na classe CP [0, `] da funções φ tais que φ e sua derivada φ0 sejam contínuas
por partes em [0, `]. Tendo feito essa escolha, podemos enunciar o seguinte Teorema/Algorítimo:

Teorema 4.2.1. Suponha que φ : [0, `] → R seja uma função tal que φ e φ0 sejam contínuas por partes. Se
a série de Fourier de senos de φ é

X
φ(x) = bn [φ] sen(nπx/`),
n=1
então a solução do problema (4.2.1) com condição inicial φ é dada por


2 π 2 t/`2
X
(4.2.5) u(x, t) = bn [φ]e−cn sen(nπx/`).
n=1

Portanto, todo seu trabalho para obter a solução de (4.2.1) com condição inicial φ é determinar os
coecientes bn [φ] da série de Fourier de senos de φ usando (4.2.6) e escrever a série (4.2.5).

Observação 4.2.1. Quando φ apresenta um ponto de descontinuidade em algum ponto x0 ∈ [0, `], a igual-
1
dade (4.2.5) quando t = 0 deve ser entendida que u(x0 , 0) é igual a
2 [φ(x0 +) + φ(x0 −)]. Quando φ é
contínua e φ0 t = 0 é estrita e vale em todos os pontos de
é contínua por partes, a igualdade (4.2.5) quando
2 2 2
[0, `]. Quandot > 0, a expressão (4.2.5) mostra que bn [φ]e−cπ n t/` são os coecientes de Fourier da série
de senos da função x ∈ [0, `] 7→ u(x, t). A série converge uniformemente e é uma função de classe C
∞ em

Ω = (0, `) × (0, ∞) e é, portanto, uma solução genuína da equação ut = cuxx em Ω. A vericação das demais
condições de fronteira são imediatas.

De (4.2.6) decorre que |bn [φ]| ≤ 2 sup |φ(x)| para todo n≥1 e como
x∈[0,`]

∞ ∞
X 2 −1)πt/`2
X 2 1
e−c(n ≤ e−c(n−1)πt/` =
n=1 n=1
1 − e−cπ2 t/`2

para todos n≥1 e t > 0, concluímos que

∞ 2 2
2 t/`2
X 2 −1)π 2 t/`2 2e−cπ t/`
|u(x, t)| ≤ e−cπ |bn [φ]|e−c(n ≤ sup |φ(x)|
n=1
1 − e−cπ2 t/`2 x∈[0,π]

para todos t > 0 e φ ∈ CP [0, `]. Assim, para toda φ ∈ CP [0, `], a temperatura u(·, t) tende uniformemente
a zero quando t → ∞. Esse fato explica a observação experimental que, com o passar do tempo, a barra
esfria e sua temperatura tende exponencialmente para zero. ♣
Se, em vez de condições de Dirichlet na fronteira, tomarmos condições de Neumann homogêneas
ux (0, t) = ux (`, t) = 0, (4.2.7)

o método de separação de variáveis conduz às mesmas conclusões anteriormente obtidas, exceto que o pro-
blema de autovalores (4.2.4) agora se escreve como

X 00 (x) = λX(x),

0<x<`
0 0 (4.2.8)
X (0) = X (`) = 0.

85
A mesma análise anterior mostra que, novamente, os autovalores são números reais não-positivos, com a
diferença que agora λ = λ0 = 0 X0 (x) = 1,
é um autovalor de (4.2.8) correspondente à autofunção constante
2
0 ≤ x ≤ `. As autofunções correspondentes a autovalores não-nulos λ = −µ , com µ > 0, devem ser
0 0
procuradas entre as funções X(x) = c1 cos µx + c2 sen µx que satisfazem X (0) = X (`) = 0, isto é, c1 = 0 e
c2 µ cos µ` = 0. Como µ e c2 devem ser não-nulos, devemos ter

 2
(2n − 1)π
λ = λn = − ,
2`

para todo n ≥ 1. As autofunções correspondentes são

 
(2n − 1)πx
φn (x) = cos .
2`

Desta forma, um resultado semelhante ao Teorema 4.2.1 para o caso de condições de fronteira de Neumann
para a equação do calor pode ser formulado e é dada no seguinte

Teorema 4.2.2. Suponha que φ : [0, `] → R seja uma função tal que φ e φ0 sejam contínuas por partes. Se
a série de Fourier de cossenos de φ é


a0 X
φ(x) = + an [φ]φn (x),
2
n=1

então a solução da equação (4.2.1) com condições de fronteira de Neumann (4.2.7) e condição inicial φ é dada
por
∞  
a0 X (2n − 1)πx
u(x, t) = + an [φ]eλn t cos ,
2 2`
n=1

2
R`
onde λn e an [φ] são dados por λ0 = 0 e a0 [φ] = ` 0 φ(x) dx e

 2 `  
(2n − 1)π (2n − 1)πx
Z
2
λn = − e an [φ] = φ(x) cos dx
2` ` 0 2`

para n ≥ 1.

Em particular,
 Z ` 
1
lim u(x, t) − φ(x) dx = 0.
t→∞ ` 0

Outro problema clássico que agora consideraremos é substituir as condições de fronteira em (4.2.2) por
condições de fronteira periódicas, isto é, impomos as condições
u(0, t) = u(`, t) e ux (0, t) = ux (`, t). (4.2.9)

Condições de fronteira periódicas são utilizadas, por exemplo, quando se considera a transmissão de calor
em um anel circular de comprimento `.
Uma vez mais, vamos empregar método de separação de variáveis. Escrevendo u(x, t) = X(x)T (t) e
substituindo, obtemos T (t) = T0 eλt , onde T0 é uma constante arbitrária e (λ, X) satisfaz

 00
X (x) = λX(x), 0 < x < `
(4.2.10)
X(0) = X(`) e X 0 (0) = X 0 (`).

Novamente, para estudar os autovalores de (4.2.10), observamos primeiro que multiplicando a equação
por X(x) e integrando por partes em [0, `], obtemos

Z ` Z ` Z ` Z `
λ |X(x)|2 dx = X(x)X 00 (x) dx = X(x)X 0 (x)|`0 − |X 0 (x)|2 dx = − |X 0 (x)|2 dx
0 0 0 0

86
uma vez que X(0) = X(`) e X 0 (0) = X 0 (`). Concluímos assim que λ deve ser um número real não-positivo,
que vamos escrever na foma λ = −µ2 , com µ ≥ 0. Logo, a equação diferencial em (4.2.10) se escreve como
X 00 (x) + µ2 X(x) = 0.
Novamente, λ0 = 0 é um autovalor de (4.2.10) com autofunção correspondente φ0 (x) = 1. As autofunções
correspondentes a autovalores não-nulos λ = −µ2 , com µ > 0, devem ser procuradas entre as funções
X(x) = c1 cos µx + c2 sen µx que satisfazem X(0) = X(`) e X 0 (0) = X 0 (`), isto é,
 
c1 = c1 cos µ` + c2 sen µ` (1 − cos µ`)c1 − sen µ` c2 = 0
, i.e.
c2 = −c1 sen µ` + c2 cos µ` sen µ` c1 + (1 − cos µ`)c2 = 0.

Como c21 + c22 6= 0, segue-se que (1 − cos µ`)2 + sen2 µ` = 0 e, portanto, cos µ` = 1. Logo, µ` = 2nπ com
n = 0, 1, 2, . . . e, assim, λ = λn = −(2nπ/`)2 são os autovalores de (4.2.10) com correspondentes autofunções
linearmente independentes φn e ψn dadas por

φn (x) = cos(2nπx/`) e ψn (x) = sen(2nπx/`),

para n ≥ 1. Como existem duas autofunções linearmente independentes correspondentes ao mesmo autovalor
λn 6= 0, dizemos que λn são autovalores de multiplicidade dois de (4.2.10). Obviamente, λ0 = 0 é o único
autovalor de multiplicidade 1 de (4.2.10). Como antes, escrevemos a solução de (4.2.1) na forma

∞     
c0 X −(2nπt/`)2 2nπx 2nπx
u(x, t) = + e cn cos + dn sen . (4.2.11)
2 ` `
n=1

Para que a solução (4.2.11) satisfaça a condição inicial u(x, 0) = φ(x) para 0 ≤ x ≤ `, devemos ter

∞     
c0 X 2nπx 2nπx
φ(x) = + cn cos + dn sen . (4.2.12)
2 ` `
n=1

De (4.2.12), multiplicando por φ por φn e por ψn e integrando em [0, `], decorre que

Z `   Z `  
2 2nπx 2 2nπx
cn = φ(x) cos dx e dn = φ(x) sen dx
` 0 ` ` 0 `

A série (4.2.12) é a série de Fourier da extensão `-periódica da função φ, que é uma função ímpar com
relação à reta y = φ(0), como mostrado na gura abaixo.

−` ` x

Figura 4.1: Gráco da função φ (amarelo) e o gráco de sua extensão `-periódica (vermelho).

Naturalmente, há diversas outras condições de fronteira que podem ser impostas num problema de valores
de fronteira para a equação (4.2.1) num domínio [0, `]. Por exemplo, considere a classe de problemas de
autovalores dependendo de parâmetros reais a0 e a` , dada por

X 00 (x) = λX(x), 0 < x < `



(4.2.13)
a0 X 0 (0) + (1 − a0 )X(0) = 0 e a` X 0 (`) + (1 − a` )X(`) = 0.

As condições de fronteira em (4.2.13) são exemplos de condições de fronteira mistas e inclui as condições
de Dirichlet (a0 =0 e/ou a` = 0) e condições de Neumann (a0 =1 ou a` = 1) nos pontos x=0 e/ou x = `.

87
Quando a0 6= 0, 1, obtemos a condição de Robin em x = 0, etc. Se a0 6= 0 e a` 6= 0, então multiplicando a
equação por X(x) e integrando por partes em [0, `], obtemos

` ` `
a` − 1 a0 − 1
Z Z Z
00
λ 2
|X(x)| dx = X(x)X (x) dx = |X(`)|2 − |X(0)|2 − |X 0 (x)|2 dx
0 0 a` a0 0

a0 −1 a` −1
uma vez que X 0 (0) = a0 X(0) e X 0 (`) = a` X(`). Portanto, para essa classe de problemas de fronteira,
os autovalores são reais.

Devido a complexidade da análise no caso geral, vamos considerar apenas o caso a0 = 0 e a` 6= 0.


1−a`
Escrevendo
a` = h, vamos considerar (4.2.13) com condições de fronteira X(0) = 0 (condição de Dirichlet
em x= 0) e X 0 (`) + hX(`) = 0 (condição de Robin em x = `) e admitir que h ≥ 0 é um parâmetro real.
O caso h=0 corresponde à condição de Neumann em x=` e é um modelo de transmissão de calor no
qual a temperatura é mantida xa u=0 na extremidade x = ` não x=0 da barra e em há uma troca de
calor com ambiente. No caso h > 0, a extremidade x = 0 é mantida a temperatura u = 0, enquanto que na
1
extremidade x = ` há uma troca de calor com meio ambiente dada por ux (`) = − u(`, t).
h
Podeλ = 0 ser um autovalor? Se sim, então existe uma solução não-nula de X 00 (x) = 0 tal que X(0) = 0
0
e X (`) + hX(`) = 0. Isso implica X(x) = Ax + B , B = 0 e A + hA` = 0. Como 1 + h` 6= 0, temos X(x) ≡ 0;
portanto, λ = 0 não é autovalor.

Podeλ = µ2 , com µ > 0 ser um autovalor? Se sim, então existe uma solução não-nula de X 00 (x) =
µ2 X(x) = 0 tal que X(0) = 0 e X 0 (`) + hX(`) = 0. Isso implica X(x) = C1 eµx + C2 e−µx com
 
C1 + C2 = 0 C2 = −C1
, i.e.
µ[C1 eµ` − C2 e−µ` ] + h[C1 eµ` + C2 e−µ` ] = 0 C1 [(µ + h)e2µ` + (µ − h)] = 0.

h−µ
A segunda equação é equivalente a C1 = 0 ou e2µ` = h+µ . A gura abaixo mostra que não existem autovalores
h−µ 2µ` .]
tais que µ ≥ 0. [Em azul, o gráco de f (µ) = h+µ e, em vermelho, de g(µ) = e

h µ

Logo, λ < 0. Escrevendo µ > 0, a solução de X 00 (x) + µ2 X(x) = 0 é X(x) = C1 cos µx +


λ = −µ2 , com
C2 sen µx e as condições de fronteira implicam C1 = 0 e C2 (sen µ` + hµ cos µ`) = 0. Como queremos C2 6= 0,
devemos ter h sen µ` + µ cos µ` = 0.
 2
(2n−1)π
Se h = 0 (condição de Neumann em x = l), então os autovalores são λn = , com autofunções
2l
correspondentes un (x) = sen( (2n−1)πx
2l ), com n ≥ 1.
Seh > 0, então os autovalores são λn = µ2n com autofunções correspondentes un (x) = sen(µn x), com
n ≥ 1, onde µn são as soluções positivas da equação tg(µ`) = −µ/h.

y
π 3π 5π
x= 2 x= 2 x= 2

µ1 µ2 µ3
µ

y = −µ/h

88
Vamos examinar mais detalhadamente o caso h > 0. {µn }∞
n=1 satisfaz 0 < µ1 <
Como vimos, a sequência
µ2 < . . . e µn → ∞ quando n → ∞. Como função de h, temos µk = µk (h) → kπ quando h → 0+, para
cada k ≥ 1 xado. É um exercício interessante mostrar que as autofunções Xn (x) = sen(µn x) são duas a
duas ortogonais e você deve fazer a demonstração, bem como obter a norma de Xn em L2 (0, `). [Se corretos,
2 1
pelos meus cálculos, kXn k = [l + 2
2
h
h +µ2n
].] Portanto, denindo φn (x) = Xn (x)
kXn k , o conjunto S = {φn : n ≥ 1}
1
é um conjunto ortonormal completo em L (0, `).
2

Vamos registrar a discussão acima no seguinte

Teorema 4.2.3. Suponha que φ : [0, `] → R seja uma função tal que φ e φ0 sejam contínuas por partes. Se


X
φ(x) = bn [φ] sen(µn x),
n=1

onde {µn }n=1 é a sequência crescente das raízes positivas da equação tg(`µ) = −hµ e
Z ` Z `
1 2
bn [φ] = φ(x) sen(µn x) dx com kXn k = sen2 (µn x) dx,
kXn k2 0 0

então a solução do problema ut = cuxx com condição inicial φ e condições de fronteira u(0, t) = 0 e ux (`, t) +
hu(`, t) = 0 é dada por

2
X
u(x, t) = bn [φ]e−cµn t sen(µn x).
n=1

O leitor atento não se surpreenderá ao perceber que as conclusões dos três Teoremas são as mesmas.
De fato, a única coisa que muda em cada uma delas é o conjunto ortonormal das autofunções e respectivos
autovalores dos problemas de fronteira (4.2.4), (4.2.8), (4.2.10) e (4.2.13). Isso é um exemplo de como o
método de separação de variáveis é eciente e permite tratar vários problemas de diferentes naturezas de
uma forma unicada. Como veremos mais adiante, ele também permite tratar casos mais complexos como
equações e/ou condições de fronteira não-homogêneas. Antes, porém, vamos abordar um problema onde a
complexidade se deve ao fato de que a dimensão do domínio é maior que 1.

4.3 O Problema de Dirichlet

O problema de Dirichlet consiste em encontrar uma solução da equação de Laplace numa região D que
assume valores dados na fronteira ∂D de D:
∆u = 0 em D, u(x) = f (x) para x ∈ ∂D. (4.3.1)

∆u(x) = nk=1 uxk xk (x) indica o Laplaciano da função u no ponto x ∈ D.


P
Aqui, É costume também
escrever ∇2 u para indicar o Laplaciano de u. Vamos sempre admitir que D ⊂ Rn é um região aberta e
conexa.

Fisicamente, uma solução do problema (4.3.1) representa um estado estacionário da distribuição da


temperatura em D quando a temperatura na fronteira de D é conhecida. Também pode representar o
potencial eletrostático numa região D livre de cargas quando o potencial em ∂D é conhecido.

Este problema pode ser estudado em qualquer numero de dimensões. O caso unidimensional é trivial:
seD = (a, b) é um intervalo não-trivial e u(a) = A e u(b) = B são os valores de u na fronteira de D, então
b−a (x − a) é a única solução de (4.3.1). Para o caso n > 1, é muito simples mostrar que (4.3.1)
u(x) = A + B−A
tem no máximo uma solução: se u1 e u2 são soluções de (4.3.1), então a diferença u = u1 − u2 é solução de
∆u = 0 e u = 0 em ∂D e isso implica que u ≡ 0 em D. (Basta usar as Identidades de Green).
Surpreendentemente, o problema de existência de solução de (4.3.1) adquire uma complexidade enorme
quando n>1 e uma discussão profunda envolve a geometria do domínio D. Não vamos tratar o caso geral;
contentar-nos-emos em considerar apenas o caso bidimensional para algumas regiões simples, às quais se
aplica o método de separação de variáveis. Outras condições de fronteira para a equação ∆u = 0 serão
considerados oportunamente.

1
A completude de S será justicada mais tarde, quando estudarmos problemas Sturm-Liouville.

89
4.3.1 O Problema de Dirichlet num Retângulo
A situação mais simples é aquela em que D é um retângulo. Vamos tomar um retângulo com lados de
comprimentos l e L e escolher a origem como o canto inferior esquerdo. Assim, D = [0, l] × [0, L] = {(x, y) :
0 ≤ x ≤ l, 0 ≤ y ≤ L} e o problema de valores de fronteira a ser estudado é

uxx + uyy = 0, (x, y) ∈ D
u(x, 0) = f1 (x), u(x, L) = f2 (x), u(0, y) = g1 (y), u(l, y) = g2 (y),

onde f1 , f2 são dadas em [0, l] e g1 , g2 são dadas em [0, L].


É imediato que uma solução u deste problema pode ser escrita como soma u = v + w, onde v e w são
soluções, respectivamente, dos problemas em que g1 = g2 = 0 e em que f1 = f2 = 0, isto é, soluções de

vxx + vyy = 0, (x, y) ∈ D
v(x, 0) = f1 (x), v(x, L) = f2 (x), v(0, y) = 0, v(l, y) = 0
e 
wxx + wyy = 0, (x, y) ∈ D
w(x, 0) = 0, w(x, L) = 0, w(0, y) = g1 (y), w(l, y) = g2 (y),
respectivamente. Além disso, como esses problemas são idênticos (basta trocar os papéis de x e y ), vamos

y y y
u = f2 v = f2 w=0
L L L
u = g1 D u = g2 = v=0 D v=0 + w = g1 D w = g2

∆u = 0 ∆v = 0 ∆w = 0
0 u = f1 l x 0 v = f1 l x 0 w=0 l x

examinar apenas o primeiro, isto é, vamos considerar o problema



uxx + uyy = 0, (x, y) ∈ D
(4.3.2)
u(0, y) = u(l, y) = 0, u(x, 0) = f1 (x), u(x, L) = f2 (x).

Vamos aplicar o método de separação de variáveis. Esquecendo por alguns momentos os termos não-
homogêneos e substituindo u(x, y) = X(x)Y (y) na equação, obtemos X 00 (x)Y (y) + X(x)y 00 (y) = 0, isto é,
Y 00 (y)/Y (y) = −X 00 (x)/X(x). Colocando Y 00 (y)/Y (y) e −X 00 (c)/X(x) iguais a uma constante µ2 , obtemos
 00
X (x) + µ2 X(x), X(0) = X(l) = 0
Y 00 (y) − µ2 Y (y) = 0.

A equação paraX já é bastante familiar e dispensa explicações: os autovalores são λn = −µ2n = −( nπ


l )
2

com autofunções sen(nπx/l), para n ≥ 1 inteiro. Em outras palavras, estamos lidando ainda com séries de
00 2
Fourier de senos na variável x. Quanto a Y , qualquer solução da equação Y (y) − µ Y (y) com µ = (nπ/l)
2

é uma combinação linear de cosh(nπy/l) e de senh(nπy/l), e portanto, estamos procurando uma solução u
de (4.3.2) da forma

X
u(x, y) = [αn cosh(nπy/l) + βn senh(nπy/l)] sen(nπx/l) (4.3.3)
n=1

e precisamos apenas determinar as constantes αn e βn para que (4.3.3) satisfaça as condições u(x, 0) = f1 (x)
e u(L, x) = f2 (x) (condições inicial e nal, podemos dizer). Isso implica que


X ∞
X
f1 (x) = αn sen(nπx/l) e f2 (x) = [αn cosh(nπL/l) + βn senh(nπL/l)] sen(nπx/l).
n=1 n=1

Segue-se, então, que


Z l
2
αn = bn [f1 ] = f1 (x) sen(nπx/l) dx
l 0

90
e Z l
αn cotgh(nπL/l)
βn = −αn cotgh(nπL/l)bn [f2 ] = − f2 (x) sen(nπx/l) dx.
2l 0
A solução u é agora obtida substituindo essas expressões em (4.3.3).

Podemos escrever a solução numa forma mais simétrica substituindo cosh(nπy/l) e senh(nπy/l) por
senh(nπ(y − L)/l) e senh(nπy/l) Y 00 (y) − (nπ/l)2 Y (y) = 0; obtemos
como base das soluções de

∞  nπx      nπy 
X nπ(L − y)
u(x, y) = sen An senh + Bn senh , (4.3.4)
l l l
n=1

onde    
nπL nπL
An = an cossech e Bn = bn cossech
l l
e an e bn são os coecientes da série de Fourier de senos de f1f2 , respectivamente:
e

l
2 l
Z Z
2  nπx   nπx 
an = f1 (x) sen dx e bn = f2 (x) sen dx.
l 0 l l 0 l

4.3.2 O Problema de Dirichlet em Coordenadas Polares


Agora, vamos considerar o problema de Dirichlet uxx + uyy = 0 num retângulo polar

D = {(r cos θ, r sen θ) : r0 < r < r1 , α < θ < β}.


y
u = f (θ)

D
u=0
r1
u = g(θ)
u=0
β
r0
α
x
0

Para isso, necessitamos da expressão do Laplaciano em coordenadas polares:

1 1
∇2 u = uxx + uyy = urr + ur + 2 uθθ .
r r
Como no caso de um retângulo cartesiano, a solução pode ser escrita como soma das soluções em que
u é nula nas duas partes radiais da fronteira de D ou nas duas partes circulares da fronteira de D. Vamos
estudar o primeiro destes casos (veja gura); se tempo houver, consideraremos o segundo caso. Por uma
rotação de coordenadas (lembre-se que o Laplaciano é invariante por rotação do plano - Exercício!), podemos
supor que o ângulo inicial α é igual a 0 e, portanto, vamos considerar o problema
( 1 1
urr + ur + 2 uθθ = 0 em D
r r (4.3.5)
u(r, 0) = u(r, β) = 0 para r0 ≤ r ≤ r1 , u(r0 , θ) = g(θ), u(r1 , θ) = f (θ)

Como de costume, começamos procurando soluções como produto u(r, θ) = R(r)Θ(θ) que satisfaça apenas
as condições de fronteira homogêneas u(r, 0) = u(r, β) = 0. Para tais soluções, temos

r2 R00 (r) + rR0 (r) Θ00 (θ)


=−
R(r) Θ(θ)

e, após igualar essas expressões a uma constante µ2 , obtemos

Θ00 (θ) + µ2 Θ(θ) = 0, Θ(0) = Θ(β) = 0, (4.3.6)

91
r2 R00 (r) + rR0 (r) − µ2 R(r) = 0. (4.3.7)

A equação (4.3.6) é nossa velha conhecida e implica que os autovalores são µ2 = (nπ/β)2 com autofunções
sen(nπθ/β). A equação (4.3.7) é uma equação de Euler
r2 R00 (r) + rR0 (r) − (nπ/β)2 R(r) = 0.

Equações de Euler constituem exemplos das poucas equações com coecientes variáveis cujas soluções podem
ser obtidas por métodos elementares; na verdade, elas admitem soluções da forma R(r) = rλ . Para determinar
λ, substituímos: o resultado é [λ(λ − 1) + λ − µ2 ]rλ = 0, isto é, λ = ±µ = ±nπ/β . Portanto, encontramos a
seguinte expressão para a possível solução da equação de Laplace em D :

∞  
X nπθ
u(r, θ) = sen (an rnπ/β + bn e−nπ/β ).
β
n=1

Falta apenas determinar as constantes an e bn para que a solução satisfaça as condições de fronteira em
(4.3.5). Mas isso é muito fácil: basta escrever as séries de Fourier de senos de f e g como

∞   ∞  
X nπθ X nπθ
f (θ) = cn sen e g(θ) = dn sen
β β
n=1 n=1

e tomar an e bn como as soluções de


(
nπ/β −nπ/β
an r1 + bn r1 = cn
nπ/β −nπ/β
an r0 + bn r0 = dn .

Exercício 4.3.1. Determine an e bn e escreva explicitamente a solução u(r, θ).

De maneira análoga, podemos considerar o problema de Dirichlet para a equação de Laplace numa coroa
circular
D = {(r cos θ, r sen θ) : r0 ≤ r ≤ r1 },

y
u = f (θ)

D
x
u = g(θ)

isto é, o problema de valores de fronteira

( 1 1
urr + ur + 2 uθθ = 0 em D
r r (4.3.8)
u(r0 , θ) = g(θ), u(r1 , θ) = f (θ).

Empregando o método de separação de variáveis uma vez mais, obtemos equações diferenciais como (4.3.6)
e (4.3.7). As condições de fronteira anteriormente consideradas em θ=0 e θ=β são agora trocadas pela
exigência de que u seja 2π -periódica em θ. Assim, em vez da condição de fronteira como (4.3.6), vamos
procurar
00 2
soluções 2π -periódicas de Θ + µ Θ = 0.

O caso µ = 0 merece atenção especial: uma vez que a solução geral de Θ00 (θ) = 0 é Θ(θ) = aθ + b,
a condição de 2π -periodicidade implica que a = 0 e Θ(θ) = b, uma constante. Portanto, µ = 0 é um
autovalor com correspondente autofunção constante Θ0 = 1. Se µ 6= 0, então Θ(θ) = c1 cos µθ + c2 sen µθ ;
2π -periodicidade força µ = n, um número inteiro. Assim, λn = −n2 são autovalores com autofunções sen nθ
e cos nθ .

92
Quanto a R, temos: quando µ = 0, R é solução da equação

r2 R00 (r) + rR0 (r) = 0,


que são dadas por R(r) = c1 + c2 ln r; quando µ = n 6= 0, R é solução de

r2 R00 (r) + rR0 (r) − n2 R(r) = 0,


cuja solução geral será escolhida como R(r) = a1 (r/r1 )n + a2 (r/r0 )−n .
Assim, para cada inteiro n ≥ 1, obtemos soluções

un (r, θ) = (cn (r/r1 )n + dn (r/r0 )−n )(an cos θ + bn sen nθ)


= (r/r1 )n (an cn cos nθ + bn cn sen nθ) + (r/r0 )−n (an dn cos nθ + bn dn sen nθ).

Escrevendo An = an cn , Bn = bn cn , Cn = an dn e Dn = bn dn , as soluções un podem ser escritas como

un (r, θ) = (r/r1 )n (An cos nθ + Bn sen nθ) + (r/r0 )−n (Cn cos nθ + Dn sen nθ).
Assim, o método de separação de variáveis conduz à expressão

∞  ∞ 
r n r −n
X  X 
u(r, θ) = (A0 + B0 ln r) + (An cos nθ + Bn sen nθ) + (Cn cos nθ + Dn sen nθ) (4.3.9)
r1 r0
n=1 n=1

como solução da equação de (4.3.8). Observe que se An , Bn , Cn e Dn são constante reais arbitrárias, mas
limitadas, isto é, satisfazem
|An | + |Bn | + |Cn | + |Dn | ≤ K
para alguma constante K e para todo n ≥ 1, então as séries dadas em (4.3.9) são convergentes quando
r0 < r < r1 e θ ∈ R. Assim, u é uma função denida em (r0 , r1 ) × R e é simples vericar que u é uma solução
de (4.3.8). Para que ela satisfaça as condições de fronteira, devemos exigir que

∞  ∞
r0 n
X  X
g(θ) = (A0 + B0 ln r0 ) + (An cos nθ + Bn sen nθ) + (Cn cos nθ + Dn sen nθ)
r1
n=1 n=1
e
∞ ∞ 
r1 −n
X X 
f (θ) = (A0 + B0 ln r1 ) + (An cos nθ + Bn sen nθ) + (Cn cos nθ + Dn sen nθ).
r0
n=1 n=1

Essas condições permitem obter A0 , B0 , An , Bn , Cn e Dn em função dos coecientes de Fourier de f


e de g (que agora são séries completas de senos e cossenos). Uma vez substituídos na expressão acima,
obtém-se a solução de (4.3.8). Para isso usamos as relações de ortogonalidade. Por exemplo, integrando as
duas expressões em [0, 2π], temos
Z 2π
πa0 [g] = g(θ) dθ = 2π(A0 + B0 ln r0 )
0
Z 2π
πa0 [f ] = f (θ) dθ = 2π(A0 + B0 ln r1 )
0
de onde obtemos
a0 [g] ln r1 − a0 [f ] ln r0 a0 [f ] − a0 [g]
A0 = e B0 = .
2 ln(r1 /r0 ) 2 ln(r1 /r0 )
Da mesma forma, multiplicando por cos kθ, k ≥ 1, e integrando em [0, 2π], concluímos que

Z 2π  k
r0
πak [g] = g(θ) cos kθ dθ = πAk + πCk
0 r1
Z 2π  −k
r1
πak [f ] = f (θ) cos kθ dθ = πAk + πCk
0 r0
e, portanto,
ak [f ] − ak [g](r0 /r1 )k ak [g] − ak [f ](r0 /r1 )k
Ak = e Ck = .
1 − (r0 /r1 )2k 1 − (r0 /r1 )2k

93
Exercício 4.3.2. Determine Bk e Dk acima indicados e escreva a solução de (4.3.8).

Finalmente, podemos permitir r0 tender a zero e considerar o problema de Dirichlet num disco
D = {(r cos θ, r sen θ) : 0 ≤ r ≤ r1 },

isto é, o problema de valores de fronteira

( 1 1
urr + ur + 2 uθθ = 0 em D
r r (4.3.10)
u(r1 , θ) = f (θ).

Comparando com (4.3.8), a condição na fronteira interna desaparece mas deixa como herança uma outra
condição: queremos determinar a solução de (4.3.10) que seja contínua numa vizinhança de (0, 0).
Aplicando o método de separação de variáveis como no caso da coroa, escolhemos R e Θ no presente caso
de forma que u(r, θ) = R(r)Θ(θ) seja uma função contínua numa vizinhança de (0, 0). Com essa escolha, e
seguindo os cálculos efetuados anteriormente, concluímos que a expressão da solução de (4.3.10) é dada por

∞ 
r n
X 
u(r, θ) = A0 + (An cos nθ + Bn sen nθ). (4.3.11)
r1
n=1

Os coecientes An e Bn devem ser determinados para que u(r1 , θ) = f (θ), isto é, para que


X
f (θ) = A0 + (An cos nθ + Bn sen nθ).
n=1

1
R 2π 1
R 2π 1
R 2π
Isso implica que A0 = 2π 0 f (t) dt, An = π 0 f (t) cos nt dt e Bn = π 0 f (t) sen nt dt. Substituindo em
(4.3.11), obtemos
∞ 
" #

r n
Z 
1 X
u(r, θ) = 1+2 cos n(θ − t) f (t) dt. (4.3.12)
2π 0 r1
n=1

A função P : [0, r1 ) × [0, 2π] → R denida por

∞ 
" #
r n

1 X
P (r, θ) = 1+2 cos nθ (4.3.13)
2π r1
n=1

é chamada núcleo de Poisson para o problema de Dirichlet no disco D = {(x, y) : x2 + y2 ≤ r1 }.


Como se comprova facilmente, a série em (4.3.12) converge quando 0 ≤ r < r1 , com convergência uniforme
em qualquer disco fechado D2 = {(r, θ) : 0 ≤ r ≤ r2 }, qualquer que seja r2 < r1 (o que justica a permutação
entre a integral e a soma innita) e, portanto, a função u denida por (4.3.12) é a solução de (4.3.10).

Para obter uma expressão para o núcleo de Poisson, procedemos da seguinte forma: para todo z ∈ C com
1
|z| < 1, temos 1−z =1+z+ z2 + ··· + zn + ... (série geométrica) e, portanto


1+z X
= (1 + z + z 2 + · · · + z n + . . . ) + (z + z 2 + z 3 + · · · + z n+1 + . . . ) = 1 + 2 zn.
1−z
n=1

Como
1+z (1 + z)(1 − z) 1 + z − z − |z|2 1 + 2iIm(z) − |z|2
= = = ,
1−z (1 − z)(1 − z) 1 − z − z + |z|2 1 − 2Re(z) + |z|2
substituindo z = ρeiθ = ρ(cos θ + i sen θ), com 0 ≤ ρ < 1, concluímos que


X 1 + 2iρ sen θ − ρ2
1+2 ρn einθ = .
1 − 2ρ cos θ + ρ2
n=1

94
Assim, para 0 ≤ ρ < 1, temos

∞ ∞
X 1 − ρ2 X ρ sen θ
1+2 ρn cos nθ = e ρn sen nθ = .
1 − 2ρ cos θ + ρ2 1 − 2ρ cos θ + ρ2
n=1 n=1

Logo, para todos 0 ≤ r < r1 e θ ∈ [0, 2π], o núcleo de Poisson é dado por

1 r12 − r2
P (r, θ) = (4.3.14)
2π r12 − 2r1 r cos θ + r2

e a solução de (4.3.10) pela formula de Poisson



r12 − r2
Z
1
u(r, θ) = f (t) dt. (4.3.15)
2π 0 r12 − 2r1 r cos (θ − t) + r2

4.4 Exercícios

Exercício 4.4.1. Cada um dos itens abaixo utiliza a equação ∇2 u = 0 em D, onde D é o quadrado
D = {(x, y) : 0 ≤ x ≤ l, 0 ≤ y ≤ l}.
(i) Determine a solução de ∇2 u = 0 em D, sujeita às condições de fronteira u(x, 0) = u(0, y) = u(l, y) = 0
e u(x, l) = x(l − x);
(ii) Determine a temperatura de equilíbrio em D se os lados x = 0 e x = l são isolados, o lado y=0 é
mantido à temperatura zero e o lado y=l é mantido à temperatura u(x, l) = x;

(iii) Considere o problema de Neumann

∇2 u = 0 em D, ux (0, y) = ux (l, y) = uy (x, 0) = 0 e uy (x, l) = f (x).


Rl
Mostre que esse problema tem solução se e somente se
0 f (x) dx = 0. Determine a(s) solução(ões) quando
l3
f (x) = x(l − x) − 3.

8l2 X 1 (2n − 1)πx (2n − 1)πy
Resp. (i) u(x, y) =
3 3
sen senh .
π (2n − 1) senh(2n − 1)π l l
n=1

y 4l X 1 (2n − 1)πx (2n − 1)πy
Resp. (ii) u(x, y) = − 2 2
cos senh .
2 π (2n − 1) senh(2n − 1)π l l
n=1

X lan nπx nπy
Resp. (iii) u(x, y) = C + cos cosh , onde an são os coecientes da série de
nπ senh nπ l l
n=1
Fourier de cossenos de f , com a0 = 0, e C é uma constante arbitrária.

Exercício 4.4.2. Determine a temperatura de equilíbrio numa faixa semi-innita D : 0 ≤ x ≤ l, 0 ≤ y < ∞


se u(0, y) = u(l, y) = 0 e u(x, 0) = f (x). (Por razões físicas, devemos tomar u limitada no faixa.)

2 l
Z
X
−nπy/l nπx nπx
Resp. u(x, y) = cn e sen , cn = f (x) sen dx.
l l 0 l
n=1

Exercício 4.4.3. Suponha que a fronteira interna da coroa D = {(r, θ) : r0 ≤ r ≤ 1} é isolada e a fronteira
externa r=1 é mantida à temperatura u(1, θ) = f (θ).
(a) Determine a temperatura de equilíbrio;

(b) Qual a solução quando f (θ) = 1 + 2 sen θ?



rn + r02n r−n inθ
Z π
X 1 r2 + r02
Resp. (a) u(r, θ) = cn e , cn = f (θ) dθ; (b) u(r, θ) = 1 + 2 sen θ.
n=−∞
1 + r02n 2π −π r(1 + r02 )

95
96
Capítulo 5

Conjuntos Ortogonais - Completude

5.1 Introdução

Quando utilizamos o método de separação de variáveis para obter soluções das equações clássicas da Física-
Matemática, somos invariavelmente conduzidos ao problema de representar uma função f como soma de uma
série obtida a partir de uma coleção innita S de funções especiais, que constituem um conjunto ortogonal.
Esse foi, por exemplo, o tratamento dado à solução do problema de valor inicial para a equação do calor
ut = cuxx , −π < x < π e t > 0, u(x, 0) = φ(x), −π < x < π , e condições de fronteira u(−π, t) = u(π, t) = 0.
Naquela oportunidade, obtivemos a solução como


2
X
u(x, t) = e−cn t bn [φ] sen nx,
n=1

ondebn = bn [φ] são os coecientes de Fourier da extensão ímpar de φ ao intervalo [−π, π], relativos ao sistema
√ √
trigonométrico S = {en , fn } constituído das funções en (x) = cos nx/ π e fn (x) = sen nx/ π , n ∈ N. Como
vimos, S é um sistema ortonormal relativamente ao produto interno
Z π
hf, gi = f (x)g(x)dx
−π

no espaço vetorial V, digamos, das funções contínua no intervalo [−π, π]. Às vezes, referimo-nos à formula
acima como a expansão da solução da equação do calor em série de Fourier.

A série de Fourier é apenas um exemplo de expansão de uma função em uma série innita de funções
pertencentes a um xado conjunto ortogonal de funções. Nesse capítulo, vamos discutir o conceito geral de
expansão ortogonal e mostrar como eles surgem no estudo de diversas equações diferenciais. Embora nossas
aplicações estejam concentradas primordialmente em conjuntos de funções reais, é importante discutir o caso
complexo, como zemos quando consideramos a forma complexa da série de Fourier.

Na próxima Seção vamos rever os conceitos de espaço com produto interno, ortogonalidade, conjuntos
ortogonais, projeção ortogonal e introduziremos o importante conceito de conjuntos ortonormais completos.
Faremos esse estudo de um ponto de vista abstrato para que os resultados obtidos sejam usados em qual-
quer situação cabível, evitando assim a desnecessária repetição de argumentos conhecidos em cada situação
particular. Nas Seções seguintes apresentaremos exemplos novos de conjuntos ortogonais tais como classes
de polinômios ortogonais (por exemplo, polinômios de Legendre, polinômios de Hermite, etc) e funções de
Bessel.

5.2 Espaços com Produto Interno e Conjuntos Ortogonais

Seja H um espaço vetorial complexo. Começamos lembrando que um produto interno em H é uma aplicação
h·, ·i : H → C que satisfaz as seguintes condições: para todos a, b, c em H e λ, µ em C, temos

hλa + µb, ci = λha, ci + µhb, ci,


(5.2.1)
ha, λb + µci = λha, bi + µha, ci.

97
hb, ai = ha, bi (5.2.2)

ha, ai > 0 para todo a 6= 0. (5.2.3)

(Como usual, z indica o conjugado do número complexo z .)


norma
p
A de um vetor a∈H é denida da forma usual kak = ha, ai. Interpretamos ka − bk como a
distância entre a e b. São imediatas as seguintes propriedades.

Proposição 5.2.1. Para quaisquer a e b em H, temos

(i) ka + bk2 = kak2 + 2Reha, bi + kbk2 .


(ii) |ha, bi| ≤ kakkbk. (Desigualdade de Cauchy-Schwarz)

(iii) ka + bk ≤ kak + kbk. (Desigualdade Triangular)

Demonstração. (i) decorre imediatamente de (5.2.1) e (5.2.2).

(ii) Podemos supor que b 6= 0 e, trocando a por αa, onde α = e−iθ se ha, bi = reiθ , podemos supor que
ha, bi é real. De (i) segue-se que, para todo t real,

0 ≤ ka + tbk2 = kak2 + 2tha, bi + t2 kbk2 .

Isso implica que o discriminante 4ha, bi2 − 4kak2 kbk2 ≤ 0, donde segue o resultado.

(iii) A demonstração de (iii) segue imediatamente da Desigualdade de Cauchy-Schwarz e do fato que


Rez ≤ |Rez| ≤ |z| para todo z ∈ C. 

Exemplo 5.2.1. O exemplo típico de um espaço vetorial complexo com produto interno, de dimensão nita
n, é espaço Cn = {(a1 , a2 , . . . , an ) : aj ∈ C} com o produto interno usual

ha, bi = a1 b1 + a2 b2 + · · · + an bn
p
quando a = (a1 , a2 , . . . , an ) e b = (b1 , b2 , . . . , bn ). A norma de a é dada por kak = |a1 |2 + · · · |an |2 . ♣

Exemplo 5.2.2. Um exemplo de um espaço vetorial complexo com produto interno, de dimensão innita,
é espaço P de todo os polinômios com coecientes complexos. Um produto interno em P pode ser dado
por: se p e q são polinômios, denimos
Z 1
hp, qi = p(x)p(x) dx.
−1

A vericação das propriedades (5.2.1), (5.2.2) e (5.2.3) são imediatas. (Verique!) ♣

Exercício 5.2.1. Mostre que


Z 1
hf, gi = f (x)g(x) dx.
−1

dene um produto interno no espaço das funções contínuas no intervalo [−1, 1].
Denição 5.2.1. (a) Dizemos que dois vetores f1 e f2 em H são ortogonais se hf1 , f2 i = 0.
(b) Dizemos que {f1 , f2 , ..., fn , . . . } é um conjunto ortogonal se fj 6= 0 para todo j e hfj , fl i = 0 para
j 6= l. Se, além disso, kfj k = 1 para todo j , dizemos que {f1 , f2 , ..., fn , . . . } é um conjunto ortonormal.
Decorre da Proposição 5.2.1 (i) que a e b são ortogonais se e somente se ka + bk2 = kak2 + kbk2 . Esse
resultado é conhecido como Teorema de Pitágoras e pode ser estendido para um número nito qualquer de
parcelas: para todo k ≥ 1, temos

{f1 , f2 , ..., fk } é ortogonal se e somente se kf1 + f2 + ... + fk k2 = kf1 k2 + kf1 k2 + · · · + kfk k2 .

A próxima denição estende o conceito de ortogonalidade a um subconjunto de H.

Denição 5.2.2. Seja S um subconjunto de H. Dizemos que f é ortogonal a S se hu, f i = 0 para todo
u ∈ S.

98
O conjunto dos vetores ortogonais a S é indicado por S⊥ e é imediato que S⊥ é um subespaço vetorial de
H. f ∈
Se S ⊥ , então f é ortogonal a qualquer combinação linear de elementos de S e, portanto, f ∈ [S]⊥ ,
onde [S] indica o subespaço vetorial gerado por S. Como [S]⊥ ⊂ S ⊥ , temos S ⊥ = [S]⊥ . Claro, {0}⊥ = H e
H ⊥ = {0}.

Denição 5.2.3. Suponha que S = {e1 , e2 , . . . , en , . . . } seja um conjunto ortonormal em H . Se f é um


elemento de H , o número ck = ck [f ] = hf, ek i é chamado o k -ésimo coeciente de Fourier de f relativamente
a S. k=1 ck ek é chamada série de Fourier de f com relação a S .
P∞
A série

Nesse ponto, o leitor atento terá percebido que se faz necessário uma discussão mais detalhada sobre o
P∞
signicado de k=1 ck ek . Para esse m, e também para xarmos linguagem, coletamos os diversos conceitos
que usaremos sistematicamente na seguinte

Denição 5.2.4. Dizemos que uma sequência {aP


de vetores de H

n }n=1 é convergente se existe a ∈ H tal
quelimn→∞ kan − ak = 0. Dizemos que a série n=1 an é convergente ∞
e tem soma s se a sequência das
somas parciais sn = a1 + a2 + · · · + an converge para s, isto é,


Xn
lim ak − s = 0.

n→∞
k=1

Dizemos que {an }∞ é uma sequência de Cauchy se limn,m→∞ kan − am k = 0. Finalmente, dizemos que H
n=1
é completo (ou um espaço de Hilbert), se toda sequência de Cauchy em H é convergente.
Suponha que S = {e1 , e2 , . . . , en , . . . }Pseja um conjunto ortonormal em H. Se f é um elemento de H e
P∞ ∞
existe uma série n=1 λn en tal que f = n=1 λn en , então

N
X N
X
hf, ek i = h lim λn en , ek i = lim λn hen , ek i = lim λk = λk .
N →∞ N →∞ N →∞
n=1 n=1

Assim, a única forma de obter f como soma de uma série convergente de combinações lineares de en é
tomar sua série de Fourier em relação a S. Isso mostra a importância de se considerar apenas a convergência
da série de Fourier de um vetor dado f em H.
Nas considerações que seguem, vamos sempre usar a notação cn ou cn [f ] para indicarmos os coecientes
de Fourier de f, dados por cn = cn [f ] = hf, en i, n = 1, 2, . . . .
O estudo da convergência da série de Fourier de
PN f é bastante geométrico e depende de uma boa com-
preensão das suas somas parciais σN = k=1 ck fk . Observe que a soma parcial σN de ordem N se escreve
como
N
X
σN = hf, e1 ie1 + hf, e2 ie2 + · · · + hf, eN ieN = hf, ek iek
k=1

e se confunde com a projeção de f no subespaço VN = [{e1 , e2 , . . . , eN }] de H gerado pelos N primeiros


vetores: a projeção de f sobre VN é o vetor

projV
N
f = hf, e1 ie1 + hf, e2 ie2 + · · · + hf, eN ieN . (5.2.4)

H f H f
f −h

eN eN h
VN e1 projV
N
f = σN VN e1 projV
N
f = σN

Figura 5.1: Projeção de f em VN (à esquerda) e f −h para h∈H (à direita).

99
hf − σN , ej i = hf, ej i − N
P
Como k=1 ck hek , ej i = cj − cj hej , ej i = 0 para todo 1 ≤ j ≤ N , o vetor f − σN é
ortogonal a todos os vetores de VN . Assim, se h = α1 e1 + α2 e2 + · · · + αN eN é um vetor de VN , do Teorema
de Pitágoras, obtemos

N
X
2 2 2 2
kf − hk = kf − σN k + kσN − hk = kf − σN k + (ck − αk )2
k=1
e concluímos a seguinte propriedade de mínimo de σN :
Teorema 5.2.1. Para cada N ≥ 1, seja VN = [{e1 , e2 , . . . , eN }] e seja f ∈ H . Então, para todo h ∈ VN ,
temos kf − hk ≥ kf − σN k e kf − hk = kf − σN k se e somente se h = σN = projVN f .
Logo, σN = projVN f é o único vetor de VN mais próximo de f.
Ainda do Teorema de Pitágoras, temos

N
X
2 2 2
kf k = kσN k + kf − σN k = |ck |2 + kf − σN k2 , (5.2.5)
k=1
PN 2 2
de onde decorre que k=1 |ck | ≤ kf k para todo N ≥ 1. Fazendo N → ∞, obtemos
Teorema 5.2.2. Se S = {en }∞n=1 é um conjunto ortonormal em H , então, para todo f ∈ H , a série numérica
P ∞ 2
k=1 |hf, ek i| é convergente e temos

X
|hf, ek i|2 ≤ kf k2 . (5.2.6)
k=1
A desigualdade (5.2.6) é chamada desigualdade de Bessel. Agora, se N > M , ortogonalidade de S implica

N
X M
X N
X N
X
2 2 2
kσN − σM k = k hf, ek iek − hf, ek iek k = k hf, ek iek k = |hf, ek i|2
k=1 k=1 k=M +1 k=M +1

e, do Teorema 5.2.2, segue que limN,M →∞ kσN − σM k = 0. Logo, {σN }∞


N =1 é uma sequência de Cauchy em
H . Admitindo que H é completo, concluímos que existe g em H tal que limN →∞ kσN − gk = 0 e a pergunta
que se impõe é: Qual a relação entre g e f ? Bem, tudo acontecer! Vejamos um exemplo.

Exemplo 5.2.3. Consideremos o espaço H = L2 [−π, π] das funções reais cujo quadrado é integrável, com
o produto interno denido por Z π
hf, gi = f (x)g(x) dx.
−π
Vamos oportunamente voltar a considerar este espaço com mais detalhes, mas, no momento, acredite que
H é um espaço completo. [Se você se sentir mais confortável, tome H = CP [−π, π], o conjunto das funções
contínuas por partes em [a, b] - a conclusão será a mesma.] Em H, ∞
consideremos S = {en }n=1 , constituído
sen
√2nx .
das funções en (x) = π
É fácil vericar que S é um conjunto ortonormal. Consideremos a função

f (x) = x. Temos

1 sen 2nx x cos 2nx π
Z π  
1 π
cn [f ] = √ x sen 2nx dx = √ 2
− =− ,
π −π π 4n 2n −π n

n=1 hf, en ien de f relativa a S é dada por f ∼ −


P∞ P∞ sen 2nx
e a série de Fourier n=1 .
n
y
π

π
2

−π π x

− π2

−π

100
g : [−π, π] → R denida por g(x) = − ∞ sen 2nx
P
Seja n=1 . Com algum trabalho, é possível mostrar que a série
n
que dene g converge para a extensão π -periódica da função (ainda indicada por g ) dada por

 x + π2 se π < x < 0

g(x) = 0 se x=0
π
x − 2 se 0 < x < π

e, portanto, f (x) 6= g(x) para todo x ∈ [−π, π], x 6= 0. Os grácos de f (verde) e de g (vermelho) estão
indicados na gura acima. A distância entre f egé
0 π
π3
Z Z
2 2
kf − gk = [x − (x + π/2)] dx + [x − (x − π/2)]2 = .
−π 0 2

Vamos calcular a distância entre f e um subespaço VN = [{e1 , e2 , . . . , eN }]. Do Teorema 5.2.1 e do


Teorema de Pitágoras, para todo h ∈ VN , temos

π N N
2π 3 π3
Z
2 2 2 2
X 1 X 1
kf − hk ≥ kf − projVN f k = kf k − kprojVN f k = |f (x)|2 dx − π = − π >
−π k2 3 k2 2
k=1 k=1

π2 P∞ 1
uma vez que
6 = k=1 k2 .
Esse exemplo mostra que a bola aberta
q B(f, r) = {h ∈ H : kh − f k < r} de centro f e raio r, com

0<r< π3
2 , em H, não intersecta VN para todo N ≥ 1. Logo, o conjunto dos pontos de acumulação da

reunião ∪∞
N =1 VN é diferente de H. ♣

Voltando às nossas considerações, e usando as mesmas notações, o Exemplo 5.2.3 mostra que g 6= f
é uma possibilidade real e, quando acontece, o vetor f − g é um vetor não nulo e ortogonal a S (já que
g e f têm os mesmos coecientes de Fourier relativos a S ). Como o referido exemplo ilustra, os termos

da sequência {σN }N =1 (em que cada termo é o vetor de VN mais próximo de f ), embora convergente, se
mantém afastada de f - e portanto, existe uma bola aberta de centro f que não intersecta VN , para todo
N . Asim, intuitivamente, para que f seja a soma de sua série de Fourier, é necessário que, para cada N ≥ 1,
exista um vetor zN em VN tal que lim zN = f . Essa importante propriedade recebe um nome que registramos
na seguinte

Denição 5.2.5. Dizemos que um conjunto ortonormal S = {e1 , e2 , . . . , en , . . . } é completo se o fecho do


conjunto ∪∞
N =1 VN é um conjunto denso.

Observação 5.2.1. Os conceitos H é um espaço completo e S é um conjunto ortonormal completo não


devem se confundidos. O primeiro signica que H não tem buracos, isto é, toda sequência de Cauchy
de elementos de H converge para um elemento de H, enquanto que o segundo signica que S tem uma
quantidade suciente para gerar todos os elementos de H. É comum denominar um espaço completo de
um espaço de Hilbert e um conjunto ortonormal uma base hilbertiana ou base de Hilbert ou,
completo S de
simplesmente, uma base de H . A frase  S é um conjunto total em H  é também empregada para se referir
a uma base S de H. ♣

Outra forma alternativa para a denição de conjunto ortonormal completo é exigir que [S]⊥ = {0}. Isto
equivale a dizer que se f ∈H é ortogonal a todo elemento de S , então f = 0. Também, da identidade (5.2.5)

N
X
kf k2 = |ck |2 + kσN − f k2 ,
k=1
P∞
segue que S é completo se e somente se kσN − f k → 0, que por sua vez é equivalente a kf k2 = n=1 |cn |
2

para todo f em H. Essas observações são coletadas no seguinte

Teorema 5.2.3. Sejam H um espaço de Hilbert e S = {e1 , e2 , . . . , ...} um sistema ortonormal em H . Então,
as seguintes armações são equivalentes:

(i) S é completo;

101
N
X
(ii) f = lim ck ek em H, onde ck são os coecientes de Fourier de f relativos a S;
N →∞
k=1
XN
(iii) lim kf − ck ek k = 0, onde ck são os coecientes de Fourier de f relativos a S;
N →∞
k=1
(iv) lim hcn [f ], cn [g]i = hf, gi, para todos f e g em H , onde cn [f ] e cn [g] são os coecientes de Fourier
n→∞
de f e de g relativos a S , respectivamente;
X∞
(v) |ck |2 = kf k2 , onde ck são os coecientes de Fourier de f relativos a S ;
k=1
(vi) se hf, ek i = 0 para todo k, então f = 0.
A igualdade (v) é chamada Identidade de Parseval.
Para que o desenvolvimento de uma função em série de funções ortogonais seja uma ferramenta útil nas
H e selecionar um conjunto ortonormal completo S de
aplicações, é necessário denir um espaço de Hilbert
funções em H . As aproximações dos elementos de H são obtidas usando a projeção ortogonal de H sobre
subespaços de dimensão nita, como descritos no texto. Frequentemente, H é conhecido mas o mesmo não
acontece com S . O máximo que temos é um conjunto F = {f1 , f2 , . . . , fn , . . . } linearmente independente
de elementos de H . Felizmente, o próximo resultado nos ensina a obter uma base ortogonal a partir de F
e nos fornece um algorítimo para a construção de conjuntos ortogonais G em H . O algorítimo é conhecido
como processo de ortogonalização de Gram-Schmidt, que você certamente já conhece quando estudou espaços
vetoriais de dimensão nita. Vamos usar a mesma técnica para a construção de sistemas ortogonais a partir
de um conjunto linearmente independente qualquer de vetores de H . A completude de sistemas ortonormais
será discutida no próximo Capítulo.

Teorema 5.2.4. Seja F = {f1 , f2 , ..., fn , ...} um conjunto qualquer, nito ou innito, de vetores de um
espaço vetorial com produto interno H com a seguinte propriedade: qualquer número nito deles é um
conjunto linearmente independente. Então, é possível determinar constantes ajk tais que o conjunto de
vetores G = {g1 , g2 , ..., gn , ...} denidos pelas relações

g1 = f1 ,
g2 = a21 f1 + f2 ,
g3 = 231 f1 + a32 f2 + f3 ,
. (5.2.7)
.
.
gn = an1 f1 + an2 f2 + an3 f3 + · · · + an,n−1 fn−1 + fn ,
.
.
.

tem as seguintes propriedades:

(i) G = {g1 , g2 , ..., gn , ...} é um conjunto ortogonal;


(ii) para cada N ≥ 1, o subespaço VN = [f1 , f2 , ..., fN ] gerado por f1 , f2 , ..., fN é igual ao subespaço
[g1 , g2 , ..., gN ] gerado por g1 , g2 , ..., gN . Em particular, BN = { kgg11 k , kgg22 k , ..., kggN
Nk
}é uma base ortonormal
de VN .
Decorre do Teorema 5.2.4 que a projeção ortogonal PN : H → V N é dada por

hf, g1 i hf, g2 i hf, gN i


PN f = fV = projVN f = 2
g1 + 2
g2 + . . . gN
kg1 k kg2 k kgN k2
para todo f em H.
Demonstração. As constantes ank serão determinadas de modo que hgn , fk i = 0 para 1 ≤ k ≤ n − 1.
Tomando o produto interno do vetor gn denido em (5.2.7) com fk , 1 ≤ k ≤ n − 1, obtemos o sistema linear


 an1 hf1 , f1 i + an2 hf2 , f1 i + an3 hf3 , f1 i + · · · + an,n−1 hfn−1 , f1 i = −hfn , f1 i
 an1 hf1 , f2 i + an2 hf2 , f2 i + an3 hf3 , f2 i + · · · + an−1,n hfn−1 , f2 i = −hfn , f2 i

.
.

 .

an1 hf1 , fn−1 i + an2 hf2 , fn−1 i + an3 hf3 , fn−1 i + · · · + an,n−1 hfn−1 , fn−1 i = −hfn , fn−1 i.

102
Como o determinante

hf1 , f1 i hf2 , f1 i hf3 , f1 i . . . hfn−1 , f1 i

hf1 , f2 i hf ,
2 2 f i hf ,
3 2 f i . . . hfn−1 , f2 i
(5.2.8)

..
.

hf1 , fn−1 i hf2 , fn−1 i hf3 , fn−1 i . . . hfn−1 , fn−1 i

é diferente de zero se e somente se {f1 , f2 , . . . , fn−1 } é linearmente independente, o sistema acima tem solução
única e suas incógnitas são determinadas de forma única pela Regra de Cramer. O restante da demonstração
segue por indução. 
Exercício 5.2.2. Demonstre que (5.2.8) é diferente de zero se e somente se {f1 , f2 , . . . , fn−1 } é linearmente
independente.

Na próxima Seção exemplicaremos essa construção no contexto dos Polinômios de Legendre.

Observação 5.2.2. O determinante (5.2.8) é chamado gramniano dos vetores f1 , f2 , . . . , fn−1 . Quando
n = 3, seu módulo representa o volume do paralelepípedo gerado pelas arestas f1 , f2 e f3 . ♣

5.3 Polinômios de Legendre

Polinômios de Legendre foram originalmente apresentados em 1782 por Adrien-Maire Legendre na publicação
[16] de seus estudos sobre a expressão da intensidade do potencial gravitacional, medido por um observador
situado na origem (0, 0), exercido num ponto P de coordenadas (r, θ) por uma massa situada no ponto (a, 0),
como na gura

z
P
R

r
a θ

O potencial gravitacional em P é proporcional ao inverso da distância de P à massa e, portanto, proporcional


a 1/R. Como R2 = r2 + a2 − 2ar cos θ, temos
1 1
=√ .
R r2 + a2 − 2ar cos θ
Se r > a, podemos escrever
1 1
= p ,
R 2
r 1 + η − 2η cos θ
a
onde η= r < 1. Olhando essa última expressão como função de η, os Polinômios de Legendre surgem como
os coecientes do desenvolvimento em série de MacLaurin desta função:


1 X
p = Pk (cos θ)η k .
2
1 + η − 2η cos θ k=0

Escrevendo x = cos θ, os polinômios de Legendre Pk = Pk (x) são, portanto, denidos por



1 X
p = Pk (x)η k (5.3.1)
2
1 + η − 2xη k=0

e a função do lado esquerdo η ∈ (−1, 1) 7→ √ 1


1+η 2 −2xη
, para −1 ≤ x ≤ 1, é chamada função geradora da

1
sequência dos polinômios de Legendre {Pk }. Observe que quando −1 ≤ x ≤ 1, a função η 7→ √ está
1+η 2 −2xη
denida e é analítica em (−1, 1) e a série em (5.3.1) é convergente quando η ∈ (−1, 1) .

103
Colocando x=0 em (5.3.1) e utilizando a série binomial


1X 1 · 3 · 5 · · · · (2k − 1) 2k
= (−1)k η ,
2k k!
p
1+η 2
k=0

válida para todo η ∈ (−1, 1), concluímos que

1 · 3 · 5 · · · · (2n − 1)
Pk (0) = 0 se k é ímpar e P2n (0) = (−1)n . (5.3.2)
2n n!
1
Colocando x=1 em (5.3.1), o lado esquerdo se torna
1−η para todo η ∈ (−1, 1) e, comparando com a
1 P∞ k
série geométrica
1−η = k=0 η , concluímos que Pk (1) = 1 para todo k ≥ 0.
1
Da mesma forma, se x = −1, o lado esquerdo de (5.3.1) se torna 1+η para todo η ∈ (−1, 1); comparando
1 P ∞ k k k
com a série geométrica
1+η = k=0 (−1) η , concluímos que Pk (−1) = (−1) . Portanto, Pk (−1) = 1 se n é
par e Pn (−1) = −1 se n é ímpar.

Por outro lado, usando indução (ou a expressão da derivada n-ésima da função composta f (t) = (1 +
t)−1/2 ,
t= − 2xη ), podemos mostrar que cada coeciente
η2 Pn (x) em (5.3.1) é, de fato, um polinômio de
grau n em x, cuja expressão tem a forma
1 · 3 · 5 · · · (2n − 1) n (2n)! n
Pn (x) = x + ··· = n x + ··· . (5.3.3)
n! 2 (n!)2

Observemos também que o efeito da troca de x por −x na função do lado esquerdo de (5.3.1) é equivalente
à troca de η por −η e, portanto,

∞ ∞
1 X 1 X
p = Pk (−x)η k e p = Pk (x)(−η)k .
1 + η 2 + 2xη k=0 1 + η 2 − 2x(−η) k=0

Disso concluímos que Pn (−x) = (−1)n Pn (x) para todos n ≥ 0. Logo, Pn é um polinômio par se n é par e
Pn é um polinômio ímpar se n é ímpar.

Naturalmente, como coecientes do desenvolvimento em série de MacLaurin, Pn pode ser computado


diretamente. Por exemplo,

! !
1 d 1
P0 (x) = p = 1, P1 (x) = p = x,
1 + η 2 − 2xη dη 1 + η 2 − 2xη
η=0 η=0
!
1 d2 1 1
P2 (x) = = (3x2 − 1),
2! dη 2
p
1 + η 2 − 2xη 2
η=0
etc. A seguir estão listados os 10 primeiros Polinômios de Legendre

P0 (x) = 1, P1 (x) = x, P2 (x) = 12 (3x2 − 1), P3 (x) = 21 (5x3 − 3x), P4 (x) = 18 (35x4 − 30x2 + 3),
P5 (x) = 81 (63x5 − 70x3 + 15x) , P6 (x) = 1
16 (231x
6 − 315x4 + 105x2 − 5) ,

1 7 5 3
P7 (x) = 16 (429x − 693x + 315x − 35x),
1 8 6 4 2
P8 (x) = 128 (6435x − 12012x + 6930x − 1260x + 35),
1 9 7 5 3
P9 (x) = 128 (12155x − 25740x + 18018x − 4620x + 315x),
1
P10 (x) = 256 (46189x10 − 109395x8 + 90090x6 − 30030x4 + 3465x2 − 63)
e os grácos dos oito primeiros estão esboçados na gura abaixo.
Vamos agora mostrar que os Polinômios de Legendre também podem ser obtidos utilizando o processo
de ortogonalização de um conjunto conveniente, descrito na Seção precedente. Para isso, considere o espaço
vetorial H de todos os polinômios reais com o produto interno dado por

Z 1
hf, gi = f (x)g(x) dx.
−1

104
y y
1 1

−1 1 x −1 1 x

−1

Figura 5.2: Polinômios de Legendre Pn . À esquerda, com n = 0 (preto), n = 2 (verde), n = 4 (azul) e n = 6


(vermelho); à direita, com n=1 (verde), n = 3 (azul), n = 5 (vermelho) e n = 7 (preto). Observe o número de zeros
de cada um deles em [−1, 1].

É uma tarefa bastante simples vericar que essa expressão dene um produto interno em H e é deixada
como exercício ao leitor. O conjunto de funções S = {f0 , f1 , . . . }, onde f0 (x) = 1, f1 (x) = x, f2 (x) = x2 , ...,
fn (x) = xn , . . . é linearmente independente, pois qualquer combinação linear nita e não-trivial de elementos
de S é um polinômio não-nulo.

Seguindo o processo indicado em (5.2.7) do Teorema 5.2.4, primeiro tomamos g0 (x) = f0 (x) = 1. Devemos
agora escolher a10 tal que g1 = a10 f0 + f1 seja ortogonal a g0 ; isso implica determinar a10 tal que
Z 1
[a10 · 1 + x] · 1 dx = 0.
−1

Segue que a10 = 0 e, portanto, g1 (x) = x.


Na sequência, queremos determinar a20 e a21 tais que g2 = a20 f0 + a21 f1 + f2 seja ortogonal a f0 e f1 ;
isso é equivalente às equações
Z 1 Z 1
2
[a20 · 1 + a21 x + x ] · 1 dx = 0 e [a20 · 1 + a21 x + x2 ] · x dx = 0,
−1 −1
2 2
que são equivalentes a 2a20 + 3 =0 e
3 a21 = 0. Segue-se que a20 = − 13 e a21 = 0 e obtemos o polinômio
1
g2 (x) = x2 − 3.
Prosseguindo, queremos agora determinar a30 , a31 e a32 tais que g3 = a30 f0 + a31 f1 + a32 f2 + f3 seja
ortogonal a f0 , f1 e f2 ; isso é equivalente às equações
Z 1
[a30 · 1 + a31 x + a32 x2 + x3 ] · 1 dx = 0
−1
Z 1
[a30 · 1 + a31 x + a32 x2 + x3 ] · x dx = 0
−1
Z 1
[a30 · 1 + a31 x + a32 x2 + x3 ] · x2 dx = 0,
−1
2 2 2 2
que são equivalentes a 2a30 + a32 = 0,
3 3 a31 + 5 =0 e
3 a30 + 25 a32 = 0. Segue-se que a30 = a32 = 0 e
3 3 3
a31 = − 5 e obtemos o polinômio g3 (x) = x − 5 x.
Para obter g4 , devemos determinar a40 , a41 , a42 e a43 tais que g4 = a40 f0 + a41 f1 + a42 f2 + a43 f3 + f4
seja ortogonal a f0 , f1 , f2 e f3 . Essas restrições são equivalentes às equações
Z 1
[a40 · 1 + a41 x + a42 x2 + a43 x3 + x4 ] · 1 dx = 0
−1
Z 1
[a40 · 1 + a41 x + a42 x2 + a43 x3 + x4 ] · x dx = 0
−1

105
Z 1
[a40 · 1 + a41 x + a42 x2 + a43 x3 + x4 ] · x2 dx = 0
−1
Z 1
[a40 · 1 + a41 x + a42 x2 + a43 x3 + x4 ] · x3 dx = 0,
−1

que são equivalentes a 2a40 + 32 a42 + 25 = 0, 23 a41 + 25 a43 = 0, 23 a40 + 25 a42 + 27 = 0 e 25 a41 + 72 a43 = 0. Segue-se
3
que a40 = 35 , a41 = 0, a42 = − 67 e 43 = 0 e obtemos o polinômio g3 (x) = x4 − 76 x2 + 35 3
.

Esse processo pode ser continuado indenidamente e encontramos um conjunto ortogonal {g0 , g1 , g2 , . . . }
gn (x)
de polinômios reais dois a dois ortogonais. A normalização Pn (x) = gn (1) dos polinômios acima obtidos
conduz aos polinômios

1 1 1
P0 (x) = 1, P1 (x) = x, P2 (x) = (3x2 − 1), P3 (x) = (5x3 − 3x), P4 (x) = (35x4 − 30x2 + 3),
2 2 8
que são os cinco primeiros polinômios de Legendre!

É importante ressaltar que esse processo de ortogonalização de {1, x, x2 , . . . } junto com a normalização
Pn (1) = 1 conduz, de fato, aos Polinômios de Legendre e poderíamos usá-lo para denir esses polinômios. Não
vamos fazer a demonstração deste fato, mas mencionar que existem diversas maneiras de denir os Polinômios
de Legendre. Por exemplo, na mesma época em que Legendre anunciou suas descobertas, Lagrange deniu
os mesmos polinômios usando a relação de recorrência

(n + 1)Pn+1 (x) = (2n + 1)xPn (x) − nPn−1 (x), (5.3.4)

n = 1, 2, . . . , com P0 (x) = 1 e P1 (x) = x. Poderíamos usar (5.3.4) para denir os Polinômios de Legendre.

Uma geração mais tarde, em 1815, em sua tese de doutorado, Olinde Rodrigues obteve a surpreendente
fórmula
1 dn 2
Pn (x) = (x − 1)n , (5.3.5)
2n n! dxn
conhecida como Formula de Rodrigues, para descrever os polinômios de Legendre [quando n = 0, denimos
P0 (x) = 1]. Essa poderia igualmente ser adotada como denição dos Polinômios de Legendre.

Exercício 5.3.1. Tomando n = 1, 2, 3, 4 e 5, verique as fórmulas (5.3.4) e (5.3.5) para os primeiros polinô-
mios de Legendre.

Exemplo 5.3.1. Determine a expansão em série de polinômios de Legendre da função

f (x) = x4 − 5x3 − 2x + 4.

Solução. Uma vez que f é um polinômio de grau 4, sua expansão em série de Polinômios de Legendre é
nita e só contém os polinômios Pk com k ≤ 4. Para determiná-la, nenhum cálculo de integrais é necessário:
se a4 é o coeciente dominante de P4 , então a diferença f − a−1 4 P4 é um polinômio de grau 3; em seguida,
−1
escolhemos uma constante c tal que f − a4 P4 − cP3 é um polinômio de grau 2 e, procedendo desta forma,
escrevemos f como combinação linear de P0 , . . . , P4 . Aos cálculos: como P4 (x) = 18 (35x4 − 30x2 + 3), temos
8
f− 35 P4 é o polinômio

8 8 1 30 137
f (x) − P4 (x) = x4 − 5x3 − 2x + 4 − × (35x4 − 30x2 + 3) = −5x3 + x2 − 2x + .
35 35 8 35 35
Agora, P3 (x) = 21 (5x3 − 3x) e, portanto, f− 8
35 P4 + 2P3 é o polinômio

8 30 137 1 30 137
f (x) − P4 (x) + 2P3 = −5x3 + x2 − 2x + + 2 × (5x3 − 3x) = x2 − 8x + .
35 35 35 2 35 35
Novamente, P2 (x) = 12 (3x2 − 1) e, portanto f− 8
35 P4 + 2P3 − 20
35 P2 é o polinômio

8 30 137 20 1 147
f (x) − P4 (x) + 2P3 = x2 − 8x + − × (3x2 − 1) = −8x + .
35 35 35 35 2 35

106
8 20
Uma vez mais, P1 (x) = x e, portanto f− 35 P4 + 2P3 − 35 P2 + 8P1 é o polinômio

8 147 147
f (x) − P4 (x) + 2P3 = −8x + + 8x = .
35 35 35
8 20 147
Finalmente, f− 35 P4 + 2P3 − 35 P2 + 8P1 − 35 P0 = 0, de onde concluímos

8 20 147
f= P4 − 2P3 + P2 − 8P1 + P0 ,
35 35 35
ou, se preferir
8 20 147
x4 − 5x3 − 2x + 4 = P4 (x) − 2P3 (x) + P2 (x) − 8P1 + P0 (x),
35 35 35
para todo x ∈ R. ♣

Mais adiante veremos um exemplo menos trivial; entretanto, a técnica empregada na solução do Exemplo
5.3.1 é muito mais importante que sua solução. Para que não passe despercebida, vamos (como G. Folland
em [8]), destacá-la na seguinte

Proposição 5.3.1. Suponha que {pn }∞ n=0 é uma sequência de polinômios tais que o grau de pn é exatamente
igual a n, para todo n ≥ 0. Então, todo polinômio de grau k, com k = 0, 1, . . . , é uma combinação linear de
p0 , p1 , . . . , pk .

Demonstração. Se f é um polinômio de grau k , escolha uma constante ck tal que ck pk tem o mesmo
coeciente dexk na expressão de f . Então, f −ck pk é um polinômio de grau k−1 e, portanto, podemos escolher
uma constante ck−1 tal que f −ck pk e ck−1 pk−1 têm o mesmo coeciente em x
k−1 ; portanto f −c p −c
k k k−1 pk−1
P k
tem grau k − 2 e procedemos indutivamente para escolher constantes ck−2 , . . . , c0 tais que f − j=0 j pj = 0.
c
Pk
Desta forma, f = j=0 cj pj , e a demonstração está completa. 

Observação 5.3.1. O resultado da Proposição anterior é bastante conhecido e sua demonstração decorre
imediatamente de argumentos utilizados em disciplinas de Álgebra Linear básica: o conjunto {p0 , p1 , . . . , pk }∪
{f } no espaço vetorial dos polinômios de grau ≤ k é linearmente dependente e, portanto, existem constantes
a0 , a1 , . . . , ak tais que f = a0 p0 + a1 p1 + · · · + ak pk . Esse argumento é legítimo, mas a determinação de
a0 , a1 , . . . , ak pode ser muito trabalhosa. Por essa razão, preferimos o argumento utilizado na solução do
Exemplo 5.3.1. ♣

Exercício 5.3.2. Refaça o Exemplo 5.3.1 com f (x) = x4 − 2x3 + 3x2 − 1.

Os Polinômios de Legendre também podem ser denidos como soluções de equações diferenciais lineares.
Os próximos resultados tratam desta questão e foram tomados do livro de G. Folland [8].

Teorema 5.3.1. Para todo n ≥ 0, temos

[(1 − x2 )Pn0 (x)]0 + n(n + 1)Pn (x) = 0.

Demonstração. Seja g(x) = [(1 − x2 )Pn0 (x)]0 . Como Pn0 tem grau n − 1, g tem grau n. De (5.3.3), temos

1 · 3 · 5 · · · (2n − 1) n (2n)! n
Pn (x) = x + ··· = n x + ···
n! 2 (n!)2

1 · 3 · 5 · · · (2n − 1) n−1 (2n)!n n−1


Pn0 (x) = nx + ··· = n x + ··· ,
n! 2 (n!)2
(2n)!n n−1 (2n)!n n+1
(1 − x2 )Pn0 (x) = n 2
x + ··· − n x + ···
2 (n!) 2 (n!)2
e, portanto
(2n)!n(n + 1) n
g(x) = [(1 − x2 )Pn0 (x)]0 = − x + ··· .
2n (n!)2

107
Portanto, o coeciente de xn no polinômio de g + n(n + 1)Pn é igual a zero e, assim, g + n(n + 1)Pn é um
polinômio de grau n − 1. Portanto, existem constantes c0 , c1 , . . . , cn−1 tais que
n−1
X
g(x) + n(n + 1)Pn (x) = [(1 − x2 )Pn0 (x)]0 + n(n + 1)Pn (x) = cj Pj (x).
j=0

Da ortogonalidade dos Pk , as constantes cj são calculadas por

hg + n(n + 1)Pn , Pj i hg, Pj i + n(n + 1)hPn , Pj i hg, Pj i


cj = 2
= 2
=
kPj k kPj k kPj k2
uma vez hPn , Pj i = 0 para j ≤ n − 1. Agora,

Z 1
hg, Pj i = [(1 − x2 )Pn0 (x)]0 Pj (x) dx.
−1

Integrando por partes duas vezes, os termos de fronteira se anulam (pois x2 − 1 = 0 para x = ±1) e obtemos

Z 1
hg, Pj i = Pn (x)[(1 − x2 )Pj0 (x)]0 dx.
−1

Como [(1 − x2 )Pj0 (x)]0 é um polinômio de grau j , ele é combinação linear de P0 , P1 . . . , Pj e, portanto,
ortogonal a Pn . Assim, cj = 0 para todo j . Logo,

[(1 − x2 )Pn0 (x)]0 + n(n + 1)Pn (x) = 0,

o que termina a demonstração. 


O Teorema 5.3.1 mostra que os Polinômios de Legendre Pn são autofunções da equação de Legendre

[(1 − x2 )y 0 ]0 + λy = 0 (5.3.6)

correspondentes aos autovalores λ = n(n + 1).


Observação 5.3.2. A rigor, os termos autovalor e autofunção se aplicam a problemas de Sturm-Liouville,
compostos por uma equação diferencial de segunda ordem denida num intervalo e certas condições de
fronteira nos seus extremos. Na equação (5.3.6), o termo 1 − x2 se anula na fronteira do intervalo [−1, 1],
tornando singular qualquer problema de Sturm-Liouville para (5.3.6) no intervalo [−1, 1]. Problemas de
Sturm-Liouville (regulares e singulares) serão considerados no próximo capítulo. ♣
Teorema 5.3.2. Para todo n ≥ 1, temos

0 0
Pn+1 (x) − Pn−1 (x) = (2n + 1)Pn (x).

Demonstração. A derivada segunda de (x2 − 1)n+1 é igual a

d
[2(n + 1)x(x2 − 1)n ] = 2(n + 1)[(x2 − 1)n + 2nx2 (x2 − 1)n−1 ]
dx
e escrevendo x2 = (x2 − 1) + 1, reescrevemos

d2 2
(x − 1)n+1 = 2(n + 1)(2n + 1)(x2 − 1)n + 4(n + 1)n(x2 − 1)n−1 .
dx
Pela Formula de Rodrigues (5.3.5), temos

1 dn−1 d2 2
Pn+1 (x) = (x − 1)n+1
2n+1 (n + 1)! dxn−1 dx2
(2n + 1) dn−1 2 1 dn−1 2
= (x − 1) + (x − 1)n−1
2n n! dxn−1 2n−1 (n − 1)! dxn−1
(2n + 1) dn−1 2
= (x − 1) + Pn−1 (x).
2n n! dxn−1

108
Derivando ambos os lados e usando mais vez a Formula de Rodrigues, concluímos que

0 0
Pn+1 (x) = (2n + 1)Pn (x) + Pn−1 (x),

donde segue o resultado. 


Decorre do Teorema 5.3.2 que Pn+1 − Pn−1 é uma primitiva de (2n + 1)Pn , isto é, para todo n ≥ 1, temos
Z
1
Pn (x) dx = [Pn+1 (x) − Pn−1 (x)] + constante. (5.3.7)
2n + 1

Vamos nalmente obter o conjunto ortonormal dos polinômios de Legendre. Para isso, precisamos calcular
a norma de cada polinômio, cujo valor é dado pelo seguinte

Teorema 5.3.3. Os polinômios de Legendre são ortogonais em L2 [−1, 1] e temos

2
kPn k2 = . (5.3.8)
2n + 1
Demonstração. Primeiramente, vamos completar a demonstração de que {Pn }∞
n=0 é um conjunto ortogonal.
Para isso, vamos usar a Formula de Rodrigues: Para qualquer função f : [−1, 1] → C de classe C n , temos
1 1
dn
Z Z
n
2 n!hf, Pn i = f (x) n (x2 − 1)n dx = (−1)n f (n) (x)(x2 − 1)n dx.
−1 dx −1

Isso segue imediatamente usando integração por partes n vezes e o fato que as derivadas de Pn até ordem
n − 1 são nulas em −1 e 1, já que (x−2 = (x − 1)n 1)n (x
+ 1)n tem derivadas nulas até ordem n − 1.
Se f é um polinômio de grau menor que n, então f
(n) ≡ 0 e, portanto, hf, Pn i = 0. Isso é verdadeiro
para f = P0 , P1 , ..., Pn−1 ; assim, Pn é ortogonal a todo Pk com k < n. Usando o mesmo raciocínio com os
papeis de n e k invertidos, obtemos hPn , Pm i = 0 para todo m > n. Logo, os polinômios Pn são dois a dois
ortogonais.
Se f = Pn , f (n) (x) = 1 · 3 · 5 · · · · (2n − 1) e portanto
a formula (5.3.3) mostra que

1 · 3 · 5 · · · · (2n − 1) 1
Z
2
kPn k = (1 − x2 )n dx.
2n n! −1

Efetuando a mudança x = y e usando as propriedades das funções Beta e Gama, obtemos
Z 1 Z 1 Z 1
Γ(n + 1)Γ(1/2)
2 n
(1 − x ) dx = 2 2 n
(1 − x ) dx = 2 (1 − y)n y −1/2 dy =
−1 0 √ 0 Γ(n + 3/2)
n! π n! 2n+1 n!
= = 1 3 = .
Γ(n + 3/2) ( 2 )( 2 ) . . . (n + 12 ) 1 · 3 · 5 . . . (2n + 1)

Substituindo, obtemos
2
kPn k2 = ,
2n + 1
o que completa a demonstração. 
Nota: Lembrar que a funções Beta e Gama são denidas por
Z 1 Z ∞
B(p, q) = (1 − x)p−1 xq−1 dx e Γ(α) = tα−1 e−t dt,
0 0

para todos p > 0, q > 0 e α>0 e valem as seguintes relações:

Γ(p)Γ(q) √
B(p, q) = , Γ(α + 1) = αΓ(α) e Γ(1/2) = π.
Γ(p + q)
Concluindo, a série de Fourier-Legendre de uma função f : [−1.1] → R é dada


X
f∼ cn Pn , (5.3.9)
n=0

109
onde Pn são os polinômios de Legendre denidos por (5.3.1) ou (5.3.5) e

Z 1
2n + 1
cn = f (x)Pn (x) dx. (5.3.10)
2 −1

Escrevendo

X Pn
f∼ (kPn kcn )
kPn k
n=0

relativamente ao sistema ortonormal {Pn /kPm k}∞ 2


n=0 e aceitando que este é um sistema completo em L [−1, 1],
a identidade de Parseval toma a forma

1 ∞
2|cn |2
Z X
|f (x)|2 dx = .
−1 2n + 1
n=0

Para analisar a convergência puntual da série de Fourier-Legendre num ponto especíco x ∈ [−1, 1] ou
sua convergência uniforme num subintervalo de [−1, 1], procedemos como zemos anteriormente para tratar
dessas questões na série de Fourier. Primeiro escrevemos uma soma parcial sn como

n n Z 1 n Z 1
X X (2k + 1)Pk (x) X Pk (x)Pk (t)
sn (x) = ck Pk (x) = f (t)Pk (t) dt = f (t) (2k + 1) dt.
2 −1 −1 2
k=1 k=1 k=1

Para cada n ≥ 1, a função


n
X Pk (x)Pk (t)
Ln (t, x) = (2k + 1)
2
k=1

é chamada núcleo de Fourier-Legendre de ordem n. Essas funções têm propriedades muito semelhantes aos
núcleos de Dirichlet estudados anteriormente. Uma delas é a identidade de Christofel-Darboux
n + 1 Pn+1 (x)Pn (t) − Pn (x)Pn+1 (t)
Ln (t, x) = .
2 t−x

Operando com os núcleos de Fourier-Legendre da mesma forma que zemos com os núcleos de Dirichlet,
podemos demonstrar o seguinte

Teorema 5.3.4. Suponha que f e f0


são funções contínuas por partes em [−1, 1] e seja x0 ∈ [−1, 1]. Tem-se:
(i) se f é contínua em x0 , então a série de Fourier-Legendre converge para f (x0 ).
1
(ii) se f é descontínua em x0 , então a série de Fourier-Legendre converge para [f (x0 +) + f (x0 −)].
2
(iii) (i) se f é contínua em (−1, 1), então, para todo δ > 0, a série de Fourier-Legendre converge unifor-
memente para f (x) em todo intervalo [−1 + δ, 1 − δ]. Isto é, para todo 0 < δ < 1, temos

lim sup |sn (x) − f (x)| = 0.


n→∞ |x|≤1−δ

Exemplo 5.3.2. Determinar a expansão da função f : [−1, 1] → R defnida por


1 se 0≤x≤1
f (x) =
−1 se −1≤x<0

em série de Fourier-Legendre.

Solução. 1
R1
Vamos calcular cn . Como P0 (x) = 1, temos c0 = 2 −1 f (x) dx = 0, pois f é uma função ímpar.
Da mesma forma, como P1 (x) = x,
Z 0 Z 1 
3 3
c1 = (−1)x dx + x dx = .
2 −1 0 2

110
Para n ≥ 2, de (5.3.7), temos

Z 1 Z 0 Z 1
2
cn = f (x)Pn (x) dx = (−1)Pn (x) dx + (+1)Pn (x) dx
2n + 1 −1 −1 0
1 1
=− [Pn+1 (x) − Pn−1 (x)]|0−1 + [Pn+1 (x) − Pn−1 (x)]|10
2n + 1 2n + 1
1
= {−[Pn+1 (0) − Pn−1 (0)] + [Pn+1 (−1) − Pn−1 (−1)] − [Pn+1 (0) − Pn−1 (0)]}
2n + 1
1 2
= {−2[Pn+1 (0) − Pn−1 (0)] − [(−1)n+1 − (−1)n−1 ]} = − [Pn+1 (0) − Pn−1 (0)]
2n + 1 2n + 1
uma vez que Pn+1 (1) = Pn−1 (1) = 1 e Pk (−1) = (−1)k .
De (5.3.2), sabemos que Pk (0) = 0 se k é ímpar e P2k (0) = (−1)k 1·3·5····(2k−1)
2k k!
. Logo, an = 0 se n é par e
se n = 2k + 1, com k = 1, 2, . . . , então

c2k+1 = −[P
 2(k+1) (0) − P2k (0)] 
k+1 1 · 3 · 5 · · · · (2k + 1) k 1 · 3 · 5 · · · · (2k − 1)
= − (−1) − (−1)
2k+1 (k + 1)!   2k k!
1 · 3 · 5 · · · · (2k − 1) 2k + 1
= (−1)k 1+
2k k! 2(k + 1)
1 · 3 · 5 · · · · (2k − 1)
= (−1)k (4k + 3).
2k+1 (k + 1)!
Logo,

1 X 1 · 3 · 5 · · · · (2k − 1)
f ∼ P1 (x) + (−1)k (4k + 3)P2k+1 (x)
2 2k+1 (k + 1)!
k=1
é a série de Fourier-Lgendre de f. ♣
Exemplo 5.3.3. Uma importante aplicação do desenvolvimento de uma função em série de Fourier-Legendre
é a solução do seguinte problema de Dirichlet: determinar uma função contínua u denida na bola fechada
B = {(x, y, z) ∈ R3 : x2 + y2 + z2 ≤ 1} que satisfaz a equação de Laplace

∂2u ∂2u ∂2u


+ 2 + 2 =0
∂x2 ∂y ∂z

quando x2 + y 2 + z 2 < 1 e a condição de fronteira u=g quando x2 + y 2 + z 2 = 1.


Quando g é uma função que só depende do angulo φ entre o ponto (x, y, z) e o eixo-z , digamos g(x, y, z) =
f (φ) cos φ = z ), o método de separação de variáveis pode ser empregado e conduz à seguinte solu-
(pois
ção/algoritmo: primeiro, obtenha o desenvolvimento de f (cos φ) em série de Fourier-Legendre:


X
f (φ) = γn Pn (cos φ);
n=1

a solução procurada é então dada por


X
u(r, φ) = γn rn Pn (cos φ),
n=1
p
onde r = x2 + y 2 + z 2 .
Solução. Em coordenadas esféricas

x = r sen φ cos θ , y = r sen φ sen θ , z = r cos φ,

com r ∈ [0, ∞), θ ∈ [0, 2π] φ ∈ [0, π], o Laplaciano de u é dado por
e

∂2u
   
1 ∂ 2 ∂u 1 1 ∂ ∂u
∆u = 2 r + 2 + 2 sen φ .
r ∂r ∂r r sen2 φ ∂θ2 r sen φ ∂φ ∂φ

111
Uma solução de ∆u = 0 que não depende de θ satisfaz a equação
   
∂ 2 ∂u 1 ∂ ∂u
r + sen φ = 0.
∂r ∂r sen φ ∂φ ∂φ

Vamos usar o método de separação de variáveis escrevendo u(r, φ) = R(r)V (φ). Substituindo, concluímos
que existe um constante λ tal que
   
d 2 dR d dV
(I) r = λR(r) e (II) sen φ = −λV (φ) sen φ.
dr dr dφ dφ

A constante λ, bem como as funções R e V podem, a priori, ser complexas. Se (λ, R) é solução de (I),
então, multiplicando (I) por R e integrando em [0, r] usando integração por partes, obtemos

Z r Z r   Z r
2 d 2 dRdR(r) r 2R(r) dR(r)
λ |R(r)| dr = r R(r) dr = r R(r) |0 − r2 dr
0 0 dr dr dr 0 dr dr
2
Z r Z r 2
r2 d 2 R(r) r2 d 2 2 R(r)

= [R(r)R(r)] − r dr = |R(r)| − r dr.
2 dr dr 2 dr dr

0 0

Como o lado direito é real, concluímos que λ é um número real.


Vamos primeiro examinar a equação (II), fazendo a mudança de variável s = − cos φ. Observe que
φ ∈ [0, π] 7→ s ∈ [−1, 1] é uma função crescente, bijetora, derivável com inversa φ = arccos(−s)
√ derivável
0
e φ (s) = √ 1 2 2
para todo −1 < s < 1. Também, sen φ = 1 − s implica sen φ = 2
1 − s . Denindo
1−s2
V (φ) = y(s), onde s = − cos φ, da Regra da Cadeia resulta

dV dy ds dy
= = sen φ
dφ ds dφ ds
dy
e, assim, sen φ dV
dφ = ds sen2 φ. Derivando, obtemos

d2 y
 
d dV dy
sen φ = 2 sen3 φ + 2 sen φ cos φ
dφ dφ ds ds

Substituindo em (II), temos

d2 y dy
2
sen3 φ + 2 sen φ cos φ = −λy(s) sen φ
ds ds
e, dividindo por sen φ, concluímos que se −1 < s < 1, então

d2 y dy
(1 − s2 ) − 2s + λy(s) = 0,
ds2 ds
que também pode ser escrita na forma

[(1 − s2 )y 0 (s)]0 + λy(s) = 0, (5.3.11)

onde
0 indica a derivada 0 = d
ds .
A equação assim obtida é uma equação de Legendre da forma (5.3.6). Como o polinômio de Legendre
Pn satisfaz
[(1 − x2 )Pn0 (x)]0 + n(n + 1)Pn (x) = 0,
para todo x ∈ (−1, 1), uma escolha possível é λ = n(n + 1) e y(s) = Pn (s), onde n ≥ 0 é um número inteiro.1
A
2 0
escolha λ = 0 implica que existe uma constante real A tal que (1 − s )y (s) = 2A, cuja solução é

y(s) = A[ln(1 − s) + ln(1 + s)] + B = A ln(1 − s2 ) + B, −1 < s < 1,


1
Como veremos mais adiante, devido à completude do conjunto dos polinômios de Legendre em L2 [−1, 1], essa é a única
escolha possível para λ e y .

112
onde AeB são constante arbitrárias. Em correspondência, as soluções da equação (I) com λ=0 são dadas
C
por R(r) = r + D, onde C e D são constantes arbitrárias.

Assim, o valor λ=0 produz a solução u(r, φ) = ( Cr + D)(A ln(sen φ) + B) da equação original. Todavia,
para que essa solução seja limitada em (0, 1] × (0, π) é necessário que A = C = 0 e, portanto, u é constante,
digamos u0 (r, φ) = 1.
Vamos agora examinar os valores λn = n(n + 1), com n ≥ 1 inteiro. Já temos uma solução V (φ) =
Pn (− cos φ) = (−1)n P n (cos φ) da equação (II). A correspondente solução de (I) deve ser solução da equação

r2 R00 (r) + 2rR0 (r) − n(n + 1)R(r) = 0

em [0, 1]. Esta última é uma equação de Cauchy-Euler e, como tal, admite soluções da forma R(r) = rα ,
onde (substituindo) α satisfaz α(α − 1) + 2α − n(n + 1) = 0. Isso implica que α = n ou α = −(n + 1). Assim,
a solução geral de (I) para λ = n(n + 1) é

R(r) = C1 rn + C2 r−(n+1)

para todo r ∈ (0, 1], onde C1 e C2 são constantes arbitrárias. Entretanto, para que essa solução seja limitada
em (0, 1], devemos tomar C2 = 0 e, assim, podemos escolher Rn (r) = rn .
Portanto, para cada n ≥ 1 inteiro, a função un (r, φ) = (−1)n rn Pn (cos φ) é uma solução da equação
original ∆u = 0 no interior de B e, portanto,


X
u(r, φ) = (−1)n an rn Pn (cos φ)
n=0

é uma solução da equação original, para quaisquer constantes an ∈ R. Para que u(r, φ) satisfaça a condição
de fronteira u(1, φ) = f (φ), devemos tomar an tais que


X
f (arccos(−x)) = (−1)n an Pn (x).
n=0

Isso implica que (−1)n an = γn são o coecientes de Fourier-Legendre de f (arccos(−x)) em relação à base
ortonormal de {Pn }∞
n=0 . Isso encerra a discussão do Exemplo. ♣

5.4 Outros Conjuntos Ortonormais de Polinômios

Usando o processo de Gram-Schmidt discutido no Teorema 5.2.4 combinado com o produto interno denido
em L2w [a, b] com uma função peso w, é possível construir uma innidade de conjuntos ortonormais completos
de
2 2 n
polinômios em Lw [a, b]: basta ortogonalizar o conjunto linearmente independente {1, x, x , . . . , x , . . . }
com relação ao produto interno
Z b
hf, gi = w(x)f (x)g(x) dx.
a

A seguir, veremos alguns exemplos. Em primeiro lugar, o que deu origem a esse texto:

Exemplo 5.4.1. Para a = −1, b = 1 e w(x) = 1, obtemos os polinômios de Legendre Pn . ♣

Exemplo 5.4.2. Para a = −1, b = 1 e w(x) = √ 1


1−x2
, obtemos os polinômios de Chebychev (ou Tchébyshev)

Tn (x) = cos(n arccos x).


Os polinômios de Chebyshev satisfazem a Fórmula de Rodrigues cos nθ = Tn (cos θ) para todo n = 0, 1, 2, . . . .
Os cinco primeiros polinômios de Chebyshev são T0 (x) = 1, T1 (x) = x, T2 (x) = 2x2 − 1, T3 (x) = 4x3 − 3x e
T4 (x) = 4 2
8x −8x +1 e satisfazem a relação de recorrência Tn+1 (x) = 2xTn (x)−Tn−1 (x). Como cada Tn é um
polinômio de grau exatamente igual a n, pela Proposição 5.3.1, Tn é uma combinação linear dos polinômios

113
de Legendre {P0 , P1 , . . . , Pn }. Portanto, {Tn }∞
n=0 é uma base ortogonal de L2w [−1, 1]. Uma função geradora
dos polinômios de Chebyshev é dada por


1 − tx X
2
= Tn (x)tn ,
1 − 2xt + t
n=0

bastante semelhantes àquela dos polinômios de Legendre. ♣

Exemplo 5.4.3. Para a = −∞, b = ∞ e w(x) = e−x


2
, obtemos os polinômios Hermite Hn , que podem ser
dados pela fórmula de Rodrigues

1 2 2
Hn (x) = √ ex [e−x ](n) . ♣
2n n!π

Exemplo 5.4.4. Para a = 0, b = ∞ e w(x) = e−x , obtemos os polinômios de Laguerre Ln , que podem ser
denidos pela fórmula
1 x n −x (n)
Ln (x) = e [x e ] . ♣
n!
Todos esses conjuntos de polinômios são exemplos de conjuntos ortonormais no espaço L2w apropriado.

114
Capítulo 6

Espaços L2 - Conjuntos Ortonormais


Completos

6.1 Introdução

Lembremos que uma função f : [a, b] → C é contínua por partes se ela é contínua em todos os pontos de [a, b],
com a exceção de um número nito deles, nos quais os limites laterais de f existem. Mais precisamente,

Denição 6.1.1. Dizemos que f : [a, b] → C é contínua por partes se existem a ≤ x1 < x2 < · · · < xN ≤ b
tais que
(i) f é contínua em x0 , qualquer que seja x0 6= xk , 1 ≤ k ≤ N ;
(ii) para todo 1 ≤ k ≤ N , os limites laterais

f (xk +) := lim f (x) e f (xk −) := lim f (x)


x→xk + x→xk −

existem. Se x1 = a e/ou xN = b, exigimos apenas a existência dos limites laterais à direita e/ou à esquerda
f (a+) e/ou f (b−), respectivamente.

Claramente, toda função contínua por partes é limitada e, portanto, integrável em [a, b]. Também, a
soma e o produto de funções contínua por partes resultam funções contínuas por partes; em particular, o
conjunto
CP [a, b] = {f : [a, b] → C : f é contínua por partes}

é um espaço vetorial. Se as funções são reais,CP [a, b] é um espaço vetorial real. Se f é contínua em todos
os pontos de [a, b],f obviamente satisfaz as condições da Denição 6.1.1 e concluímos que C[a, b] é um
então
subespaço vetorial de CP [a, b].
Dadas duas funções f e g em CP [a, b], a formula

Z b
hf, gi = f (x)g(x) dx (6.1.1)
a

dene uma aplicação bilinear em CP [a, b] que satisfaz todas as propriedades de um produto interno em
CP [a, b], exceto a seguinte:
f 6= 0 implica hf, f i > 0.
A razão é que funções que são nulas em todos os pontos de[a, b] exceto num número nito deles tem integral
zero. Entretanto, essa formula dene um produto interno no subespaço C[a, b], de acordo com o seguinte

Exercício 6.1.1. Demonstre que se f é contínua em [a, b] e ab |f (x)|2 dx = 0, então f ≡ 0.


R

Uma forma de tornar (6.1.1) um produto interno em CP [a, b] é sugerido pela soma da série de Fourier e
consiste em considerar somente funções f ∈ CP [a, b] com a propriedade que

1
f (x) = [f (x+) + f (x−)] para todo x ∈ (a, b), f (a) = f (a+), f (b) = f (b−).
2

115
Exercício 6.1.2. Suponha que f ∈ CP [a, b] satisfaz propriedade anterior e que f (x0 ) 6= 0. Mostre que
existe um intervalo I contendo x0 tal que |f (x)| > 0 para todo x ∈ I e portanto hf, f i > 0.
Com esse entendimento, o espaço CP [a, b] munido da distancia d(f, g) = kf − gk, onde

Z b
kf − gk2 = |f (x) − g(x)|2 dx (6.1.2)
a

é a norma induzida pelo produto interno (6.1.1), parece ser um bom espaço de funções para estudar desen-
volvimentos de funções em séries de funções ortogonais. Entretanto, ele padece de um problema muito sério:
sequências de Cauchy em CP [a, b] podem não ser convergentes. Eis um exemplo:

Exemplo 6.1.1. Para n ≥ 1, seja fn : [0, 1] → R por

0 ≤ x ≤ n1

0 se
fn (x) = 1 1
x1/4
se
n < x ≤ 1.

1
Cada fn é contínua em todos os pontos de [0, 1], exceto em xn = lim fn (x)
n , no qual temos x→x = 0,
n−

lim fn (x) = n1/4 e, portanto, fn ∈ CP [0, 1] para todo n. Se n > m, temos


x→xn +
Z 1 Z 1/m  
2 1 1/m 1 1
|fn (x) − fm (x)| dx = dx = 2x1/2 |1/n =2 √ −√ ,
0 1/n x1/2 m n

que tende a zero quando m, n → ∞. Assim, {fn } é uma sequência de Cauchy em CP [0, 1]; entretanto, para
cada x ∈ [0, 1], temos limn→∞ fn (x) = f (x), onde

0 se x=0
f (x) = 1
x1/4
se 0 < x ≤ 1,

que não pertence a CP [a, b] pois não é uma função limitada em [0, 1]. ♣
Outro exemplo extremo, admitindo que você tem conhecimento de que o conjunto dos números racionais
é enumerável.

Exemplo 6.1.2. Seja Q = {r1 , r2 , . . . , rn , . . . } uma enumeração dos números racionais do intervalo [0, 1] e
dena fn : [0, 1] → R por

0 se x ∈ {r1 , r2 , . . . , rn }
fn (x) =
1 se x∈/ {r1 , r2 , . . . , rn }.
Cada fn é contínua em todos os pontos de [0, 1], exceto em r1 , r2 , . . . , rn e em cada um deles temos
R1
limx→rk ± fn (x) = 1 e, portanto fn ∈ CP [0, 1] para todo n. Também, temos
0 fn (x) dx = 1 para todo
ne Z 1
kfn − fm k2 = |fn (x) − fm (x)|2 dx = 0,
0
n > m, então fn (x) − fm (x) = 0 exceto em rm+1 , . . . , rn . Assim, {fn }∞
pois se n=1 é uma sequência de Cauchy
em CP [0, 1]. Entretanto, não existe uma função g em CP [0, 1] para a qual a sequência converge. De fato,
um candidato natural para fazer o papel de g seria a função f : [0, 1] → R dada por


0 se x é racional
f (x) =
1 se x é irracional

que, como sabemos, não é Riemann-integrável nem pertence a CP [0, 1]. ♣


O Exemplo 6.1.1 mostra a necessidade de ampliar a classe CP [a, b] para incluir mais funções integráveis

em [a, b] (observe que f (x) = 1/ x é integrável em (0, 1] no sentido de uma integral impropria) e o Exemplo
6.1.2 mostra que precisamos também ampliar nosso entendimento de funções integráveis: ele mostra que os
termos de uma sequência de funções em CP [a, b] podem ganhar mais e mais descontinuidades e, embora
cada uma delas seja Riemann-integrável, a função limite pode não ser uma função Riemann-integrável.

116
Assim, precisamos rever todos nossos conceitos e é inevitável até a revisão do conceito de integral.
Felizmente, essas questões foram examinadas por H. L. Lebesgue que, em sua tese, em 1902, apresentou uma
extensão do conceito de integral e deu uma resposta satisfatória ao problema em tela. Não vamos aqui fazer
um estudo profundo de suas ideias, mas apenas recolher alguns resultados da teoria que serão de grande
utilidade.

Para nossos propósitos, não necessitamos conhecer a construção ou detalhes das propriedades da integral
de Lebesgue e tudo que precisamos é de algumas denições e alguns resultados importantes que vamos utilizar
sem demonstração.

6.2 Espaços L2 [a, b]


Indicamos por L2 [a, b] o espaço das funções cujo quadrado é (Lebesgue) absolutamente integráveis em [a, b],
isto é,
Z b
2
L [a, b] = {f : [a, b] → R : |f (x)|2 dx < ∞}.
a
Rb
Esse espaço inclui todas as funções para as quais a integral de Riemann, possivelmente imprópria,
a |f (x)|2 dx
é convergente, como a função f do Exemplo 6.1.1.
1 2
Como |f (x)g(x)| ≤ 2 [|f (x)| + |g(x)|2 ], temos

Z b Z b Z b 
1 2 2
|f (x)g(x)| dx ≤ |f (x)| dx + |g(x)| dx
a 2 a a

e, portanto, a integral
Z b
hf, gi = f (x)g(x) dx
a

é absolutamente convergente e (6.1.1) está bem denido para funções f e g em L2 [a, b].
Como no caso deCP [a, b], existe um pequeno problema com a positividade para hf, f i já que a condição
Rb
a |f | = 0 não implica que f é identicamente nula em [a, b], mas apenas que f = 0 em quase todo ponto. A
interpretação correta desta frase é a seguinte: dizemos que uma propriedade sobre números reais é verdadeira
para quase todo x se ela é verdadeira para todo x, exceto para aqueles que pertencem a um conjunto de medida
nula1 . A teoria da integral de Lebesgue mostra que se f ∈ L2 [a, b], então hf, f i = 0 se e somente se f (x) = 0
para quase todo x ∈ [a, b]. Desta forma, considerando como idênticas duas funções cujos valores diferem
apenas num conjunto de medida nula, obtemos f = 0. Essa noção mais fraca de igualdade é compatível com
aquela comumente empregada para funções e é a mais adequada em vários outros contextos.

As propriedades cruciais sobre L2 [a, b] que necessitaremos estão contidas no seguinte

Teorema 6.2.1. (i) O conjunto L2 [a, b] com a distancia d(f, g) = kf − gk dada por (6.1.2) é um espaço
completo;
f ∈ L 2 [a, b], existe uma sequência {fn }∞
(ii) Para toda n=1 de funções contínuas em [a, b] tais que kfn −
f k → 0 quando n → ∞;
(iii) As funções fn em (ii) podem ser tomadas como restrições a [a, b] de funções de classe C
∞ denidas

em todo R;
(iv) As funções fn em (iii) podem ser tomadas como restrições a [a, b] de funções (b − a)-periódicas de
classe C
∞ ou de funções de classe C ∞ que se anulam fora de um conjunto limitado.

No exemplo a seguir mostraremos uma possível aproximação de uma função em CP [a, b] por uma função
contínua.

Exemplo 6.2.1. Suponha que f é uma função em CP [a, b] cujo gráco tenha o aspecto da gura abaixo.

1
Dizemos que um subconjunto E de R tem medida nula se, para qualquer ε > 0, existe uma sequência de intervalos abertos
I1 , I2 , . . . , In , . . . , de comprimentos l1 , l2 , . . . , ln , . . . , tais que E ⊂ ∪∞
n=1 In e
P∞
n=1 ln < ε. Por exemplo, qualquer conjunto nito
ou enumerável E tem medida nula. O conjunto dos números racionais tem medida nula.

117
a x0 − δ x0 x0 + δ b x

Para cada δ>0 sucientemente pequeno, considere a função fδ : [a, b] → R denida por

|x − x0 | > δ

f (x), se
fδ (x) = f (x0 −δ)+f (x0 +δ) f (x0 +δ)−f (x0 −δ)
2 + 2δ (x − x0 ), se |x − x0 | ≤ δ.
O trecho do gráco de fδ x0 −δ e x0 +δ é a reta que passa pelo pontos (x0 −δ, f (x0 −δ) e (x0 +δ, f (x0 +δ)
entre
e portanto fδ é contínua em[a, b]. É imediato que se |f (x)| ≤ M em [a, b], então |fδ (x)| ≤ 2M em [a, b].
2 2
Usando a desigualdade (s − t) ≤ 2(s + t ), temos
2

Z x0 +δ 2
2
f (x0 − δ) + f (x0 + δ) f (x0 + δ) − f (x0 − δ)
kf − fδ k = f (x) − − (x − x 0 ) dx
x0 −δ
2 2δ
Z x0 +δ ( 2 2 )
f (x 0 − δ) + f (x 0 + δ) f (x0 + δ) − f (x0 − δ)
≤2 f (x) − + (x − x0 ) dx
x −δ
2 2δ
Z 0x0 +δ  2 8M 2 2δ 3

4M
≤2 2(4M 2 + 4M 2 ) + 2 |x − x0 |2 dx = 64M 2 δ + 2 ×
x0 −δ δ δ 3
208M 2 δ
= < 70M 2 δ.
3
√ 1
Portanto, kf − fδ k < 9M δ para todo δ > 0. Se tomarmos δ =
n , obtemos uma sequência de funções
9M
contínuas gn tais que kgn − f k < √ para todo n = 1, 2, . . . . ♣
n
Uma vez demonstrado que podemos aproximar uma função f ∈ CP [a, b] por uma função contínua g da
forma descrita no Exemplo 6.2.1, podemos agora aproximar g ∞
por funções de classe C . De fato, podemos
aproximar g por um polinômio utilizando o Teorema de Aproximação de Weierstrass (veja Teorema 6.4.2).
Essa aproximação é uniforme em todo o intervalo [a, b] e, portanto, é também uma aproximação de f na
norma de L2 [a, b]. denso em L2 [a, b] e demonstra,
Esse argumento mostra que o conjunto dos polinômios é
em particular, que o conjunto constituído pelos polinômios de Legendre é um sistema ortonormal completo
em L2 [−1, 1].
Da mesma forma, utilizando o Teorema 6.2.1 (iv), podemos aproximar uma função f ∈ L2 [−π, π] por
uma função 2π -periódica g ∞
de classe C ; como a série de Fourier de g converge uniformemente para g,
o truncamento desta última produz um polinômio trigonométrico TN que aproxima f 2
em L [−π, π]. Isso
demonstra que o sistema trigonométrico
 
1 sen x cos x sen 2x cos 2x
√ , √ , √ , √ , √ ,... ,
π π π π π
ou seu equivalente { √12π einx }n∈Z , são conjuntos ortonormais completos em L2 [−π, π].

6.3 Outros Tipos de Espaços L2 [a, b]


Vamos apresentar algumas generalizações dos resultados da seção anterior que nos serão úteis mais tarde.
Primeiro, trocamos o elemento dx da medida linear de comprimento de [a, b] por um elemento de medida
com peso w(x) dx. Para ser mais preciso, uma função contínua w : (a, b) → R satisfazendo w(x) > 0 em
(a, b) será chamada uma função peso2 sobre [a, b]. O espaço L2w é denido por
 Z b 
L2w [a, b] = f : [a, b] → C : 2
|f (x)| w(x) dx < ∞
a
2
Podemos permitir w(x) ≥ 0 em (a, b). Entretanto, para que a norma de f seja estritamente positiva quando f 6= 0, devemos
exigir que w não se anula em nenhum subintervalo de (a, b).

118
e o produto interno e norma, respectivamente, por

Z b Z b
hf, gi = f (x)g(x)w(x) dx e kf k2w = |f (x)|2 w(x) dx.
a a

Segundo, podemos trocar o intervalo [a, b] por uma semi-reta ou mesmo toda a reta real e considerar
espaços com peso L2w [a, ∞), L2w (−∞, b] ou mesmo L2w (−∞, ∞). As denições são imediatas.

Indicando por D qualquer um dos conjuntos [a, b], [a, ∞), (−∞, b] ou (−∞, ∞), as conclusões nos Teorema
6.2.1 permanecem válidas. Para referência futura, vamos transcreve-lo no seguinte

Teorema 6.3.1. (i) O conjunto L2 (D) é um espaço completo;

(ii) Para toda f∈ L2 (D), existe uma sequência {fn }∞


n=1 de funções contínuas em D tais que kfn −f k → 0
quando n → ∞;
(iii) As funções fn em (ii) podem ser tomadas como restrições a D de funções de classe C∞ denidas em
todo R;
(iv) As funções fn em (iii) podem ser tomadas como restrições a D de funções de classe C∞ que se
anulam fora de um conjunto limitado.

6.4 O Teorema de Weierstrass

A demonstração do Teorema de Weierstrass apresentada a seguir é uma re-leitura daquela de Anton R. Schep
em [20] e é essencialmente a mesma apresentada por K. Weierstrass em 1885.

Teorema 6.4.1. Seja f :R→R uma função limitada e uniformemente contínua. Para cada h > 0, dena
Sh f : R → R por
Z ∞
1 u−x 2
(Sh f )(x) = √ f (u)e−( h
)
du.
h π −∞

Então, Sh f é uma função de classe C∞ e converge uniformemente para f quando h → 0+, isto é,

lim sup{|Sh f (x) − f (x)| : x ∈ R} = 0.


h→0+

Demonstração. Seja ε > 0. Como f é limitada e uniformemente contínua, existem M > 0 e δ > 0 tais
que|f (x)| ≤ M para todo x e |f (x1 ) − f (x2 )| ≤ ε/2 sempre que |x1 − x2 | ≤ δ . Usando o fato de que
R ∞ −z 2 √
−∞ e dz = π e a mudança u − x = hz , temos

Z ∞ Z ∞
1 u−x 2 1 2
√ e−( h
)
du = √ e−z h dz = 1,
h π −∞ h π −∞

para qualquer h > 0. Assim, para cada x ∈ R, podemos escrever

Z ∞
1 u−x 2
f (x) = √ f (x)e−( h
)
du
h π −∞

e portanto
Z ∞
1 u−x 2
Sh f (x) − f (x) = √ [f (u) − f (x)]e−( h
)
dt.
h π −∞

119

εδ π
Seja h0 > 0 tal que h0 < 4M . Então, para todos x e 0 < h < h0 , temos

Z ∞
1 u−x 2
|Sh f (x) − f (x)| ≤ √ |f (u) − f (x)|e−( h ) du
h π Z−∞ Z
1 −( u−x 2 1 u−x 2
= √ )
|f (u) − f (x)|e h du + √ |f (u) − f (x)|e−( h ) du
h π Z |u−z|≤δ Z h π |u−x|≥δ
ε u−x 2 2M u−x 2
≤ √ e−( h ) du + √ e−( h ) du
2h π Z|u−x|≤δ h Z π |u−x|≥δ

ε −( u−x 2 2M 2
≤ √ )
e h du + √ e−z h|z| dz
2h π Z−∞ h π Z|z|≥δ/h

ε u−x 2 4M h 2
≤ √ e−( h ) du + √ |z|e−z dz
2h π −∞Z δ π |z|≥δ/h
ε 4M h ∞ −z 2
≤ + √ ze dz
2 δ π 0
ε 2M h ε ε
= + √ < + = ε.
2 δ π 2 2

Como ε>0 é arbitrário, a demonstração está completa. 

Teorema 6.4.2. Seja f : [a, b] → R uma função contínua. Então, em [a, b], f é o limite uniforme de

polinômios. Isto é, existe uma sequência de polinômios {pn }n=1 tal que

lim sup{|f (x) − pn (x)| : x ∈ [a, b]} = 0.


n→∞

Demonstração. Primeiro, estendemos f a uma função limitada e uniformemente contínua em R denindo


f (x) = f (a)(x − a + 1) em [a − 1, a], f (x) = −f (b)(x − b − 1) e f (x) = 0 para x ∈ R\[a, b]. Sejam R > 0 tal
que f (x) = 0 para |x| > R e M > 0 tal que |f (x)| ≤ M para todo x. Seja ε > 0 dado. Do Teorema 6.4.1,
ε
existe h0 > 0 tal que |Sh0 f (x) − f (x)| <
2 para todo x ∈ R. Como f (u) = 0 para |u| > R, podemos escrever

Z R
1 u−x 2
Sh0 f (x) = √ f (u)e−( h
)
du.
h0 π −R

Como a série

2
X (−1)n
e−t = t2n
n!
k=0

converge uniformemente no intervalo [− 2R 2R


h0 , h0 ], existe N ≥1 tal que


N

2 X
−t (−1)n 2n εh0 π
e − t <
n! 4RM
k=0

2R u−x 2R
para |t| ≤ h0 . Assim, tomando |x| ≤ R e |u| ≤ R, temos t= h0 satisfaz |t| ≤ h0 e concluímos que

N  √
(−1)n u − x 2n εh0 π
u−x 2 X 
−( h0 )
e − < .
n! h0 4RM
k=0

Seja
N
1 X (−1)n R u − x 2n
Z  
PN (x) = √ f (u) du.
h0 π n! −R h0
k=0

Então, PN é um polinômio de grau ≤ 2N . Vamos mostrar que |f (x) − PN (x)| ≤ ε para todo x ∈ [a, b]. De

120
fato, se x ∈ [a, b], |x| ≤ R e |f (x) − PN (x)| ≤ |f (x) − Sh0 f (x)| + |Sh0 f (x) − PN (x)|. Como
temos

N

1 Z R u − x 2n
Z RX
(−1)n
 
−( u−x )2 1
|Sh0 f (x) − PN (x)| = √ f (u)e h du − √ f (u) du

h0 π −R h0 π −R n! h0
k=0
N
" #
1 Z R (−1)n u − x 2n
 
u−x 2 X
= √ f (u) e−( h ) − du

h0 π −R n! h0
k=0
N
(−1)n u − x 2n
Z R  
1 u−x 2 X
≤ √ |f (u)| e−( h ) − du

h0 π −R n! h0
√ k=0
1 εh0 π ε
≤ √ × 2RM × = ,
h0 π 4RM 2
ε ε
concluímos que se x ∈ [a, b], então |f (x) − PN (x)| ≤ 2 + 2 = ε, que completa a demonstração. 

Corolário 6.4.1. Se f : [a, b] → R tem quadrado integrável, então existe um sequência de polinômios
{pn }∞
n=1 tais que
Z b
lim |f (x) − pn (x)|2 dx = 0.
n→∞ a

Em outras palavras, o conjunto dos polinômios é denso em L 2 [a, b].

Demonstração. Seja f uma função em L 2 [a, b] e ε > 0. Então, existe uma função contínua g : [a, b] → R
tal que
b
ε2
Z
|f (x) − g(x)|2 dx <
a 4

e existe uma sequência de polinômios {pn }n=1 tal que

lim sup |g(x) − pn (x)| = 0.


n→∞ a≤x≤b

Como Z b
|g(x) − pn (x)|2 dx ≤ (b − a) sup |g(x) − pn (x)|2
a a≤x≤b

existe n0 ∈ N tal que se n ≥ n0 , então

b
ε2
Z
|g(x) − pn (x)|2 dx ≤ .
a 4

Portanto, n ≥ n0 implica kf − pn k ≤ kf − gk + kg − pn k < ε e , assim, limn→∞ kf − pn k = 0. 


O Teorema 6.4.1 também demonstra o Teorema 6.2.1 (iii). Para a demonstração de (iv) é necessário
1 −z 2
trocar √ e
π
por uma função de classe C ∞ com suporte compacto. Voltaremos a esse assunto mais tarde.
Uma resenha histórica do Teorema de Weierstrass e sua equivalência com aproximação de funções contí-
nuas por polinômios trigonométricos pode ser encontrada no excelente texto de Allan Pinkus [19].

121
122
Capítulo 7

O Problema de Sturm-Liouville

7.1 Introdução

Em capítulos anteriores, tivemos contato com as bases ortogonais {sen nx} e {cos nx} para o espaço L2 (0, π)
quando procuramos as soluções dos problemas de valor de fronteira

u00 (x) + λ2 u(x) = 0, u(0) = u(π) = 0

e
u00 (x) + λ2 u(x) = 0, u0 (0) = u0 (π) = 0.
Da mesma forma, a base ortogonal {einx }∞
n=−∞ para L2 (−π, π) foi obtida considerando funções periódicas e
também como solução do problema de fronteira

u00 (x) + λ2 u(x) = 0, u(−π) = u(π), u0 (−π) = u0 (π).

Na realidade, existe uma classe muito ampla de problemas de valores na fronteira sobre um intervalo
[a, b] que conduzem a bases ortogonais de L2 [a, b]. O estudo de alguns desses problemas constitui o objetivo
do presente capítulo.

7.2 O Problema de Sturm-Liouville Regular

Inicialmente, vamos recordar alguns conceitos de álgebra linear em espaços de dimensão nita. Lembremos
que uma transformação linear T : Ck → Ck é auto-adjunta ou hermitiana se
hT a, bi = ha, T bi para todos a, b ∈ Ck .

Um dos resultados básicos de Álgebra Linear, conhecido como Teorema Espectral ou Teorema dos Eixos
Principais, arma que se T é autoadjunto, então existe uma base ortonormal de Ck constituída de autovetores
de T. O que faremos nessa Seção é estudar um resultado análogo deste teorema para operadores diferenciais
denidos em L2 (a, b).

Denição 7.2.1. Suponha que S : DS → L2 (a, b) e T : DT → L2 (a, b) são operadores lineares denidos em
certos subespaços DS e DT de L2 (a, b). Dizemos que S é o adjunto de T (ou que T é o adjunto de S ) se

hS(f ), gi = hf, T (g)i para todos f ∈ DS e g ∈ DT .

Dizemos que S é autoadjunto ou hermitiano se


hS(f ), gi = hf, S(g)i para todos f, g ∈ DS .

(Em situações mais gerais, essas denições precisam ser mais elaboradas e envolvem os domínios DS e DT ;
para nossos propósitos, elas são sucientes.)

123
Agora, suponha que L é um operador diferencial de segunda ordem com coecientes reais da forma
L(f ) = rf 00 + qf 0 + pf,

onde r, q p são
e funções reais de classe C2 no intervalo [a, b]. Vamos admitir que o coeciente líder r é
não-nulo em [a, b] que, sem perda de generalidade, supomos r(x) > 0 para todo x ∈ [a, b]. (A existência
de pontos singulares onde r=0 complica consideravelmente nosso estudo; mais tarde, vamos considerar o
caso em que r seja nulo em um ou nos dois pontos extremos).

Tomando DL = C 2 [a, b], o espaço das funções de classe C 2 em [a, b], como o domínio de L, nos pergun-
tamos: qual o adjunto de L? Ao escrevermos a integral que dene hL(f ), gi, vamos mover as derivadas de f
para g usando integração por partes:

Z b Z b b
Z b
00 0 0 0 0
g|ba f (rg)0 a f (rg)00 dx;

(rf )g dx = rf − f (rg) dx = rf g − +
a a a
Z b Z b
0
(qf )g dx = qf g|ba − f (qg)0 dx.
a a
Como r, q e p são reais, temos

Z b
hL(f ), gi = (rf 00 + qf 0 + pf )g dx
Za b b (7.2.1)
f (rg)00 − (qg)0 + pg dx + rf 0 g − f (rg)0 + qf g a
  
=
a b
= hf, L∗ (g)i + r(f 0 g − f g 0 ) + (q − r0 )f g a ,


onde L∗ é o adjunto formal de L, denido por


L∗ (g) = (rg)00 − (qg)0 + pg = rg 00 + (2r0 − q)g 0 + (r00 − q 0 + p)g. (7.2.2)

Denição 7.2.2. Dizemos que L é formalmente autoadjunto se L∗ = L.


Comparando os coecientes de L∗ , concluímos que L é formalmente
L e autoadjunto se e somente se
2r0 −q =q e r
00 − q0 = 0, isto é,
0
quando q = r . Neste caso, L tem a forma

L(f ) = rf 00 + r0 f 0 + pf = (rf 0 )0 + pf. (7.2.3)

Observe que quando L é formalmente autoadjunto, o segundo termo de fronteira em (7.2.1) se anula: q(a) =
r0 (a) e q(b) = r0 (b). Essas observações constituem a demonstração da seguinte

Proposição 7.2.1. (Identidade de Lagrange) Se L é formalmente autoadjunto, então


b
hL(f ), gi = hf, L(g)i + r(f 0 g − f g 0 ) a .

(7.2.4)

Evidentemente, a discrepância entre adjunto formal e o adjunto de L é a presença dos termos de fronteira
em (7.2.4). Ela pode ser eliminada se restringirmos L a um domínio menor DL , consistindo de funções
que satisfazem condições de fronteira convenientes. É frequentemente apropriado impor duas condições de
fronteira independentes para as funções f no domínio de L da forma

B1 (f ) = α1 f (a) + α10 f 0 (a) + β1 f (b) + β10 f 0 (b) = 0,


(7.2.5)
B2 (f ) = α2 f (a) + α20 f 0 (a) + β2 f (b) + β20 f 0 (b) = 0,

onde αj , αj0 , βk e βk0 são constantes.

Denição 7.2.3. Dizemos que as condições de fronteira (7.2.5) são autoadjuntas (relativamente ao operador
L = L(f ) = rf 00 + qf 0 + pf ) se

b
r(f 0 g − f g 0 ) a = 0

para todos f, g satisfazendo (7.2.5). (7.2.6)

124
Quase todas condições de fronteira que consideraremos são da forma

αf (a) + α0 f 0 (a) = 0, βf (b) + β 0 f 0 (b) = 0


(7.2.7)
(α, α0 , β, β 0 ∈ R; (α, α0 ) 6= (0, 0); (β, β 0 ) 6= (0, 0)).

Condições de fronteira da forma (7.2.7) são chamadas separadas, uma vez que cada uma delas envolve
uma condição em exatamente um extremo.

Proposição 7.2.2. Condições de fronteira separadas são autoadjuntas (relativas a qualquer operador L).
Demonstração. Suponha que f e g satisfazem, em x = a, a condição

αf (a) + α0 f 0 (a) = 0, αg(a) + α0 g 0 (a) = 0.

Vamos mostrar que a expressão r(a)(f 0 (x)g(x) − f (x)g 0 (x)) em (7.2.4) se anula em x = a. Isso é imediato
se α= 0, pois então f 0 (a) = g 0 (a)= 0. Se α 6= 0, reescrevemos a condição em x = a como f (a) = cf 0 (a) e
g(a) = cg 0 (a) e obtemos

r(a)(f 0 (a)g(a) − f (a)g 0 (a)) = r(a)(cf 0 (a)g 0 (a) − cf 0 (a)g 0 (a)) = 0.

Da mesma forma, se f e g satisfazem, em x = b, uma condição separada

βf (b) + β 0 f 0 (b) = 0, βg(b) + β 0 g 0 (b) = 0,

então r(f 0 g − f g 0 ) = 0 em x = b. O restante da demonstração segue da Identidade de Lagrange (7.2.4). 


Existe um conjunto de condições de fronteira não-separadas que são frequentemente utilizadas, que se
chamam condições de fronteira periódicas
f (a) = f (b), f 0 (a) = f 0 (b).

Elas são condições autoadjuntas relativas a L se r(a) = r(b). (Verique!)

Já temos todos os ingredientes para formular os problemas de valores na fronteira que consideraremos e
que nos permitirão construir bases ortogonais de L2 (a, b).
Denição 7.2.4. Um problema regular de Sturm-Liouville no intervalo [a, b] é especicado pelos seguintes
dados:

(i) um operador formalmente autoadjunto L denido por L(f ) = (rf 0 )0 + pf , onde r, r0 e p são reais e
contínuas em [a, b] e r(x) > 0 para x ∈ [a, b];
(ii) um conjunto de condições de fronteira autoadjuntas B1 (f ) = 0 e B2 (f ) = 0 para o operador L;
(iii) uma função contínua e positiva w : [a, b] → R.
O objetivo é encontrar todas as soluções f do problema de valores de fronteira
L(f ) + λwf = 0, isto é, [r(x)f 0 (x)]0 + p(x)f (x) + λw(x)f (x) = 0, a < x < b,
(7.2.8)
B1 (f ) = B2 (f ) = 0,

onde λ é uma constante.

Como veremos, para a maioria dos valores de λ, (7.2.8) tem apenas a solução trivial f (x) ≡ 0 em [a, b]. Se
(7.2.8) tem solução não-nula, λ é chamado um autovalor do problema de Sturm-Liouville e as correspondentes
chamadas autofunções.
soluções não-nulas f são
1 Se f e g satisfazem (7.2.8), então qualquer combinação

linear c1 f + c2 g também satisfaz (7.2.8); portanto, o conjunto

Vλ = {f ∈ C 2 [a, b] : f é solução de (7.2.8)}

é um subespaço vetorial de C 2 [a, b], chamado autoespaço correspondente a λ. Como soluções de

[r(x)f 0 (x)]0 + p(x)f (x) + λw(x)f (x) = 0, a < x < b,


1
No sentido comum da palavra autovalor , λ é um autovalor, não de L, mas do operador M denido por M (f ) = −w−1 L(f ).

125
cada subespaço Vλ tem dimensão menor ou igual a 2.
No próximo resultado, registramos as propriedades elementares de autovalores e autofunções do problema
(7.2.8), que mostram a importância das autofunções do ponto de vista de conjuntos ortogonais. Vamos
lembrar que se w>0 é uma função peso em [a, b], o produto interno com peso hf, giw é dado por

Z b
hf, giw = f (x)g(x)w(x) dx = hwf, gi = hf, wgi. (7.2.9)
a

Teorema 7.2.1. Considere o problema de Sturm-Liouville regular (7.2.8). Temos:

(a) Todos os autovalores são reais;

(b) Autofunções correspondentes a autovalores distintos são ortogonais com relação à função peso w, isto
é, se f e g são autofunções correspondentes aos autovalores λ e µ, respectivamente, e λ 6= µ, então

Z b
hf, giw = f (x)g(x)w(x) dx = 0.
a

(c) Para todo autovalor λ, o autoespaço correspondente Vλ tem dimensão no máximo 2. Se as condições
de fronteira são separadas, então Vλ é sempre unidimensional.

Demonstração. (a) Se λ é um autovalor com autofunção f, de (7.2.4) e (7.2.9), temos

λkf ||2w = hλwf, f i = −hL(f ), f i = −hf, L(f )i = hf, λwf i = λhf, wf i = λkf k2w ,

uma vez que f satisfaz condições de fronteira autoadjuntas. Como kf kw > 0, conlcuimos que λ = λ, isto é,
λ é real.

(b) Suponha que L(f )+λwf = 0 e L(g)+µwg = 0, com f e g não-nulas. Como acabamos de demonstrar,
λ e µ são reais e, como anteriormente,

λhf, giw = hλwf, gi = −hL(f ), gi = −hf, L(g)i = hf, µwgi = µhf, wgi = µhf, giw .

Assim, se λ 6= µ, devemos ter hf, giw = 0.


(c) O Teorema Fundamental de Existência e Unicidade de soluções para equações diferenciais ordinárias
arma que para quaisquer constantes c1 e c2 , existe uma única solução de L(f ) + λwf = 0 satisfazendo
as condições iniciais f (a) = c1 ef 0 (a) = c2 . Assim, qualquer solução é especicada por duas constantes
arbitrárias c1 e c2 e, portanto, o espaço de todas as soluções de L(f ) + λwf = 0 tem dimensão 2. Portanto, o
espaço de todas as soluções que satisfazem as duas condições de fronteira tem dimensão no máximo 2. Além
disso, se as condições de fronteira são separadas, uma delas é da forma αf (a) + α0 f 0 (a) = 0. Isso estabelece
0
uma relação linear αc1 + α c2 = 0 sobre as constantes c1 e c2 e, portanto, reduz a dimensão do espaço solução
para 1. (Naturalmente, a outra condição de fronteira geralmente reduz a dimensão para zero; esta é a razão
do por que existem soluções não-triviais apenas para valores especiais de λ.) 
Até esse momento, não é nada evidente que um dado problema de Sturm-Louville tem alguma autofunção.
Na verdade, ele tem uma innidade delas e, mais surpreendente, elas formam uma base hilbertiana do espaço
L2w [a, b]. Esse é o conteúdo do seguinte

Teorema 7.2.2. Para qualquer problema de Sturm-Liouville regular


(rf 0 )0 + pf + λwf = 0, B1 (f ) = B2 (f ) = 0

num intervalo [a, b], existe uma base ortonormal {φn }∞


n=1 de L2w [a, b] consistindo de autofunções. Se λn é o
autovalor correspondente a φn , então limn→∞ λn = +∞. Como consequência, para qualquer f ∈ L2 [a, b],
temos 2
Z b n
X
lim f (x) − hf, φ iφ (x) w(x) dx = 0

n n
n→∞ a
k=1
e a Identidade de Parseval
Z b ∞
X
|f (x)|2 w(x) dx = |hf, φn i|2 ,
a n=1

126
onde Z b
hf, φn i = f (x)φn (x)w(x) dx.
a

Além disso, se f é qualquer função de classe C2 em [a, b] e satisfaz as condições de fronteira B1 (f ) =


converge uniformemente para f .
P∞
B2 (f ) = 0, então a série n=1 hf, φn iw φn

Exemplo 7.2.1. Considere L(f ) = f 00 em [0, 2π], com condições de fronteira periódicas
f (0) = f (2π), f 0 (0) = f 0 (2π).

Aqui, r ≡ 1, p ≡ 0 e assim L é formalmente autoadjunto. Também, se f e g satisfazem f (0) = f (2π),


f 0 (0) = f 0 (2π) e g(0) = g(2π), g 0 (0) = g 0 (2π), então
 0 2π
r(f g − f g 0 ) 0 = [f 0 (2π)g(2π) − f (2π)g 0 (2π)] − [f 0 (0)g(0) − f (0)g 0 (0)] = 0

e, portanto, a condição (7.2.6) está satisfeita. Tomando w = 1, concluimos que

f 00 (x) + λf (x) = 0, 0 < x < 2π




f (0) = f (2π), f 0 (0) = f 0 (2π)


satisfaz todas as condições da Denição 7.2.8 e é, portanto, um problema de Sturm-Liouville regular em
[0, 2π].
Para determinarmos os autovalores e autofunções, escrevemos λ = µ2 . As soluções de f 00 (x) + µ2 f (x) = 0
são f (x) = C1 cos µx + C2 sen µx se µ 6= 0 e f (x) = Ax + B se µ = 0. Para satisfazer as condições de
fronteira, devemos ter:
(i) seµ = 0, a condição f 0 (0) = f 0 (2π) está satisfeita para quaisquer A e B , mas a condição f (0) = f (2π)
implica B = 2Aπ + B e, portanto, A = 0. Assim, λ0 = 0 é um autovalor e f0 (x) = 1 é uma autofunção
associada.
(ii) Se µ 6= 0, as condições de fronteira implicam C1 = C1 cos 2µπ + C2 sen 2µπ e µC2 = µ[−C1 sen 2µπ +
C2 cos 2µπ , isto é, 
[1 − cos 2µπ]C1 − sen 2µπC2 = 0
sen 2µπC1 + [1 − cos 2µπ]C2 = 0
Como (C1 , C2 ) 6= (0, 0), devemos ter ∆(λ) := [1 − cos 2µπ]2 + sen2 2µπ = 0, isto é, cos 2µπ = 1. Logo,
2µπ = 2kπ , k = 1, 2, . . . . Assim, se k ≥ 1, então λk = k 2 é um autovalor. Associadas a λk , as funções
fk (x) = cos kx e gk (x) = sen kx são autofunções linearmente independentes.

O conjunto ortonormal {φ0 , φn , ψn }n=1 , onde

1 cos nx sen nx
φ0 (x) = √ , φn (x) = √ , ψn (x) = √ ,
2π π π
são as normalizações das autofunções, é a base das séries de Fourier clássicas de funções f ∈ L2 [0, 2π].
Segue da última conclusão do Teorema 7.2.2 que, para toda função f 2
de classe C em [0, 2π] que satisfaz
f (0) = f (2π) e f 0 (0) = f 0 (2π), a série de Fourier de f,

a0 X
+ [an cos nx + bn sen nx],
2
n=1
em que
Z 2π Z 2π
1 1
an = √ f (x) cos nx dx e bn = √ f (x) sen nx dx,
π 0 π 0
converge absoluta e uniformemente para f em [0, 2π], isto é,

N
a0 X
lim sup f (x) − − [an cos nx + bn sen nx] = 0.

N →∞ 0≤x≤2π 2
n=1

Obviamente, essas informações não são novas e apenas foram re-apresentadas para mostrar a utilização
de problemas de Sturm-Liouville para obter base ortonormais de L2 [0, 2π]. ♣

127
Exercício 7.2.1. Escreva a identidade de Parseval para o sistema ortonormal trigonométrico obtido acima.

Exercício 7.2.2. Use o mesmo operador do Exemplo anterior L(f ) = f 00


C 2 [0, π], mas com condições
em
de
2
fronteira de Dirichlet f (0) = f (π) = 0 e obtenha uma base ortonormal de L [0, π]. Escreva a identidade
de
0 0
Parseval. Repita o Exercício considerando a condição de fronteira de Neumann f (0) = f (π) = 0.

Exemplo 7.2.2. Considere L(u) = u00 em [0, l], com condições de fronteira

u(0) = 0, u0 (l) = hf (l),

onde h≥0 é um parâmetro real.

Seja fazendo o cálculo diretamente ou utilizando a Proposição 7.2.2, é fácil vericar que temos em mãos
um problema de Sturm-Liouville regular em [0, l]. Em particular, os autovalores são reais.

Podeλ = 0 ser um autovalor? Se sim, então existe uma solução não-nula de u00 (x) = 0 tal que u(0) = 0
0 + hu(l) = 0. Isso implica u(x) = Ax + B , B = 0 e A + hAl = 0. Como 1 + hl 6= 0, temos u(x) ≡ 0;
e u (l)
portanto, λ = 0 não é autovalor.

Podeλ = −µ2 , com µ > 0 ser um autovalor? Se sim, então existe uma solução não-nula de u00 (x) −
µ2 u(x) = 0 tal que u(0) = 0 e u0 (l) + hu(l) = 0. Isso implica u(x) = C1 eµx + C2 e−µx com
 
C1 + C2 = 0 C2 = −C1
, i.e.
µ[C1 eµl − C2 e−µl ] + h[C1 eµl + C2 e−µl ] = 0 C1 [(µ + h)e2µl + (µ − h)] = 0.
h−µ
A segunda equação é equivalente a C1 = 0 ou e2µ` = h+µ . A gura abaixo mostra que não existem
autovalores tais que λ < 0.

h µ

h−µ
Figura 7.1: Grácos das funções f (µ) = h+µ (azul) e g(µ) = e2µ` (vermelho).

Logo, λ > 0. Escrevendo λ = µ2 , comµ > 0, a solução de u00 (x) + µ2 u(x) = 0 é u(x) = C1 cos µx +
C2 sen µx e as condições de fronteira implicam C1 = 0 e C2 (sen µl + hµ cos µl) = 0. Como queremos C2 6= 0,
devemos ter h sen µl + µ cos µl = 0.
Se h=0 (condição de Neumann em x = l), então os autovalores são

 2
(2n − 1)π
λn =
2l

com autofunções correspondentes un (x) = sen( (2n−1)πx


2l ), com n ≥ 1.
Seh > 0, então os autovalores são λn = µ2n com autofunções correspondentes
un (x) = sen(µn x), com
n ≥ 1, onde µn são as soluções positivas da equação tg(µl) = µ/h.

Vamos examinar mais detalhadamente o caso h > 0. Como vimos, a sequência {µn }n=1 satisfaz 0 < µ1 <
µ2 < . . . e µn → ∞ quando n → ∞. Como função de h, temos µk = µk (h) → kπ/l quando h → ∞, para cada
k ≥ 1 xado. Esses, νk = kπ/l, são exatamente os autovalores do problema de Dirichlet em [0, l]. Não nos
preocuparemos com isso agora, mas é interessante estudar os comportamento das autofunções normalizadas
correspondentes quando h → ∞. Você está convidado a comprovar que as autofunções un (x) = sen(µn x)
são duas a duas ortogonais 2
, bem como obter a norma de un em L (0, l). [Se corretos, pelos meus cálculos,
un (x)
kun k2 = 12 [l + h2 +µ
h
2 ] .] Portanto, denindo φn (x) =
kun k , o conjunto S = {φn : n ≥ 1} é um conjunto
n
2
ortonormal completo em L (0, l). ♣

128
y
π 3π 5π
x= 2l x= 2l x= 2l
y = µ/h

µ1 µ2 µ

Figura 7.2: Grácos das funções f (µ) = tg(lµ) (vermelho) e g(µ) = µ/h (azul).

Em particular, se f : [0, l] → R é uma função de classe C2 e satisfaz as condições de fronteira f (0) = 0


0
e f (l) = hf (l), então a série de Fourier de f relativa ao conjunto ortonormal {φn }∞ é uniformemente
n=1
convergente para f em [0, l]:

X
f (x) = bn [f ] sen(µn x),
n=1

uniformemente em [0, l], onde {µn }n=1 é a sequência das raízes positivas da equação h tg(lµ) = µ e

Z l Z l
1 2
bn [f ] = φ(x) sen(µn x) dx com kun k = sen2 (µn x) dx.
kun k2 0 0

No próximo exemplo, vamos usar o fato bem conhecido que a solução geral da equação de Euler-Cauchy

x2 y 00 (x) + axy 0 (x) + by(x) = 0 (x > 0)

é dada por y = c1 xr1 + c2 xr2 , onde r1 e r2 são as raízes da equação r(r − 1) + ar + b = 0. (Se as
r r
raízes coincidem, r1 = r2 , a solução geral é y = c1 x 1 + c2 x 1 ln x.) Se r1 e r2 são não-reais, usamos
xiθ = eiθ ln x = cos(θ ln x) + i sen(θ ln x).

Exemplo 7.2.3. Seja b>1 e considere o problema de autovalor

(xu0 )0 + λx u = 0, 1 < x < b




u(1) = 0, u(b) = 0.

Aqui, L é o operador L(u)(x) = (xu0 )0 (x), 1 ≤ x ≤ b e w(x) = 1


x . Como x>1 e w(x) > 1/b para todo
x ∈ (1, b), temos um problema de Sturm-Liouville regular.

Para encontrar os autovalores e autofunções, procuramos soluções da equação de Euler equivalente


x2 u00 (x) + xu0 + λu(x) = 0 da forma u(x) = xr que satisfazem u(1) = 0 e u(b) = 0. Substituindo, ob-
temos r(r − 1) + r + λ = 0, isto é, r2 + λ = 0.
Do Teorema 7.2.1, já sabemos que λ λ = 0 ser um autovalor? A equação r2 = 0
é um número real. Pode
2 00 0
tem duas raízes iguais e a solução geral de x u (x)+xu (x) = 0 é u(x) = c1 +c2 ln x; as condições de fronteira
implicam c1 = 0 e c2 ln b = 0. Como b > 1, u é identicamente nula e concluímos que 0 não é um autovalor.
√ 2 00 0
Pode λ < 0 ser um autovalor? Nesse caso, r = ± −λ e a solução geral de x u (x) + xu + λu(x) = 0 é
√ √
u(x) = c1 e −λx + c2 e− −λx . Condições de fronteira implicam
( √ √
c1 e √−λ + c2 e− −λ√
=0
c1 e b −λ + c2 e−b −λ = 0.

129

−λ

−λ

Como o determinante ∆ = e(1−b) − e(b−1) = 2 senh((1 − b) −λ) 6= 0 (pois b > 1), segue-se que
c1 = c2 = 0 e, portanto, λ < 0 não pode ser autovalor de L.

Logo, λ > 0 e escrevendo λ = µ2 , com µ > 0, a solução de r2 + λ = 0 são r = ±iµ e a solução geral de
x2 u00 (x) + xu0 + λu(x) = 0 é dada por u(x) = c1 cos(µ ln x) + c2 sen(µ ln x). Agora, as condições de fronteira

implicam c1 = 0 e c2 sen(µ ln b) = 0. Para que u 6= 0, devemos ter sen(µ ln b) = 0 e, portanto, µ =
ln b ,
k = 1, 2, 3, . . . .
nπ 2
Assim, os autovalores são λn = ( ln b) e as autofunções são un (x) = sen( nπlnlnb x ), n = 1, 2, 3, . . . .
nπ ln x
Para normalizar un , vamos calcular sua norma. Mudando de variável
ln b = t, obtemos

Z b   Z nπ
nπ ln x 1 ln b ln b
kun k2w = sen 2
dx = sen2 t dt = .
1 ln b x nπ 0 2

Portanto,
r  
2 nπ ln x
φn (x) = sen
ln b ln b
são as autofunções normalizadas e λn = ( lnnπb )2 são os autovalores do problema dado. ♣
A título de exemplo, vamos determinar a série de Fourier da função g(x) = 1 em relação ao sistema {φn }.
Como
Z b Z br r
2 ln b nπ
  Z
dx 2 nπ ln x dx
hg, φn iw = g(x)φn (x) = sen = sen t dt,
1 x 1 ln b ln b x ln b nπ 0
q
temos hg, φn iw = 0 se n é par e hg, φn iw = ln2b 2nπ
ln b
se n é ímpar. Logo, a série de Fourier de g é

∞  
4X 1 (2n − 1)π ln x
g(x) ∼ sen .
π 2n − 1 ln b
n=1

A Identidade de Parseval é

Z b ∞ ∞
1 X 8 ln b X 1
ln b = g(x)2 dx = |hg, φn iw |2 = 2
.
1 x π (2n − 1)2
n=1 n=1

Exemplo 7.2.4. Novamente, seja b > 1 e considere o problema de autovalor


 2 0 0
(x u ) + λu = 0, 1 < x < b
u(1) = 0, u(b) = 0.

Aqui, L é o operador L(u)(x) = (xu0 )0 (x), 1 ≤ x ≤ b e w(x) = 1. Como x>1 e w(x) > 1/b para todo
x ∈ (1, b), temos um problema de Sturm-Liouville regular.

Para encontrar os autovalores e autofunções, procuramos soluções da equação de Euler equivalente


x2 u00 (x) + 2xu0 + λu(x) = 0 da forma u(x) = xr que satisfazem u(1) = 0 e u(b) = 0. Substituindo,
2
obtemos r(r − 1) + 2r + λ = 0, isto é, r + r + λ = 0.

Do Teorema 7.2.1, já sabemos que λ é um número real e a mesma análise do Exemplo anterior mostra que
2
√ r +r+λ = 0
raízes reais de conduzem à solução nula. Portanto, 1 − 4λ < 0 e as raízes são r = 21 (−1 ± iµ),
onde µ = 4λ − 1.
Logo, a solução geral de x2 u00 (x) + 2xu0 + λu(x) = 0 é dada por
    
−1/2 µ ln x µ ln x
u(x) = x c1 cos + c2 sen .
2 2

Agora, as condições de fronteira implicam c1 = 0 e c2 b−1/2 sen(µ ln b/2) = 0. Para que u 6= 0, devemos
2kπ
ter sen(µ ln b/2) = 0 e, portanto, µ =
ln b , k = 1, 2, 3, . . . .
Logo, os autovalores são λn =
1 nπ 2 −1/2 sen( nπ ln x ), n = 1, 2, 3, . . . .
4 + ( ln b ) e as autofunções são un (x) = x ln b

130
nπ ln x
Agora, com a mudança de variável
ln b = t, obtemos

Z b   Z nπ
nπ ln x 1 ln b ln b
kun k2w = sen 2
dx = sen2 t dt = .
1 ln b x nπ 0 2

Portanto,
r  
2 −1/2 nπ ln x
φn (x) = x sen
ln b ln b
são as autofunções normalizadas
e λn =
1 nπ 2
4 + ( ln b ) são os autovalores do problema dado. Do Teorema 7.2.2,

{φn }n=1 é um conjunto ortonormal completo de L2 [1, b]. ♣

Um comentário a respeito da demonstração do Teorema 7.2.2: os exemplos acima discutidos nos dão
uma indicação da maneira de obter os autovalores. Primeiro, determinamos duas soluções linearmente
independentes {y1 (·; λ), y2 (·; λ)} da equação (linear homogênea de segunda ordem)

[r(x)y 0 (x)]0 + p(x)y(x) + λw(x)y(x) = 0

e escrevemos sua solução geral na forma u(x) = c1 y1 (x; λ) + c2 y2 (x; λ), a < x < b, onde c1 e c2 são constantes
a serem determinadas. Aqui, a propriedade de que y1 (·; λ) e y2 (·; λ) dependem analiticamente de λ ∈ C (que
decorre da teoria básica de existência, unicidade, dependência contínua, analítica, etc) é usada em toda a sua
plenitude e mostra que os valores de λ devem procurados entre aqueles que se obtém impondo as restrições
B1 (u) = 0 e B2 (u) = 0. Dessas restrições, resulta uma equação ∆(λ) = 0, onde ∆ é uma função inteira,
isto é, uma função analítica em todo o plano complexo. Daí, resulta que suas raízes são todas isoladas e
têm multiplicidade nita (em nossos problemas, a multiplicidade é, no máximo, dois). Essa é a parte fácil
da demonstração do Teorema 7.2.2. Embora fundamental, esse argumento ainda deixa uma lacuna: por que
∆(λ) = 0 tem alguma solução? A resposta positiva a essa pergunta mostra a importância do resultado do
Teorema. Sua demonstração completa é estudada em disciplinas mais avançadas de Matemática e não será
discutida aqui.

Entretanto, é muito fácil obter limitação inferior dos autovalores, conforme a seguinte

Exemplo 7.2.5. Considere o problema de Sturm-Liouville (7.2.8) e suponha que as condições de fronteira
são separadas, de um dos seguintes tipos:

(i) y(a) = y(b) = 0 ou (ii) y 0 (a) = αy(a) e y 0 (b) = βy(b), com α≥0 e β ≤ 0.
Então, existe um número real m tal que λn ≥ m para todo autovalor λn de (7.2.8).

Demonstração. Sejam λ um autovalor e y uma autofunção associada satisfazendo

Z b
kyk2w = |y(x)|2 w(x) dx = 1.
a

1 1
Rb Rb
Seja k>0 tal que
k < w(x) < k . Então,
k a |y(x)|2 dx ≤ kyk2w ≤ k a |y(x)|2 dx.
Multiplicando a equação λw(x)y(x) = −[r(x)y 0 (x)]0 − p(x)y(x) por y(x) e usando integração por partes,
obtemos Z b Z b Z b
λ w(x)|y(x)|2 = −r(x)y 0 (x)y(x)|ba + r(x)|y 0 (x)|2 − p(x)|y(x)|2 dx,
a a a
isto é,
Z b Z b
λ=− p(x)|y(x)| dx + 2
r(x)|y 0 (x)|2 dx − r(b)y 0 (b)y(b) + r(a)y 0 (a)y(a).
a a

Seja c∈R tal que p(x) ≤ c. No caso (i), temos

Z b Z b Z b Z b Z b
0 0 c
λ=− p(x)|y(x)| dx+ 2
r(x)|y (x)| dx ≥ −c 2 2
|y(x)| dx+ r(x)|y (x)| dx ≥ − + 2
r(x)|y 0 (x)|2 dx
a a a a k a

e, portanto, λ ≥ −c/k e tomamos m = −c/k .

131
No caso (ii), temos

Z b Z b Z b
2 0 2 2 2 c
λ=− p(x)|y(x)| dx + r(x)|y (x)| dx − βr(b)|y(b)| + αr(a)|y(a)| ≥ − p(x)|y(x)|2 dx ≥ −
a a a k

e novamente tomamos m = −c/k . 

Generalizações. A teoria de Sturm-Liouville pode ser generalizada para algumas equações de ordem su-
perior. Como um exemplo, consideremos o operador L(f ) = f (4) sobre um intervalo [0, l]. Um análogo da
identidade de Lagrange para L é

Z b
(∗) [f (4) (x)g(x) − f (x)g (4) (x)] dx = [f 000 g − f g 000 + f 0 g 00 − f 00 g 0 ]ba .
a

Para a equação de quarta ordem L(f ) − λf = 0 precisamos quatro condições de fronteira envolvendo f,
f 0 , f 00 e f 000 . Um tal conjunto de condições de fronteira é chamada autoadjunto se o lado direito de (*) se
anula quando ambas f e g satisfazem essas condições. Um exemplo de condições de fronteira autoadjuntas
é impor, em x=0 e em x = l, um par de qualquer uma das seguintes condições

f = f 0 = 0, f = f 00 = 0, f 0 = f 000 = 0, f 00 = f 000 = 0.

Uma vez escolhidas condições de fronteira autoadjuntas, podemos demonstrar os mesmos resultados do
Teorema 7.2.1. Em particular, os autovalores são reais e as autofunções correspondentes são ortogonais em
L2 [0, l]. Pode-se mostrar que o resultado análogo do Teorema 7.2.8 também é verdadeiro, isto é, o conjunto
dos autofunções constituem uma base ortonormal de L2 [0, l]. Como exercício, determine os autovalores e
autofunções do problema
u(4) (x) − λu(x) = 0, 0 < x < l


u(0) = u00 (0) = 0, u(l) = u00 (l) = 0.

7.3 O Problema de Sturm-Liouville Singular

No parágrafo anterior estudamos a equação diferencial

rf 00 + r0 f 0 + pf + λwf = 0

num intervalo fechado e limitado [a, b], no qual admitimos que as funções r, r0 , p e w fossem contínuas e que
r e w fossem estritamente positivas e mostramos que o conjunto de todas suas soluções formam um conjunto
ortogonal completo. Entretanto, em alguns exemplos práticos, essas hipóteses podem ser enfraquecidas, como
mostra o exemplo dos polinômios de Legendre e o das funções de Bessel, o que nos leva a discutir problemas
de Sturm-Liouville singulares. Especicamente, consideraremos as seguintes modicações:

(i) o coeciente líder r pode se anular em um ou nos dois pontos extremos de [a, b]. Além disso, a função
peso w pode se anular ou tender a innito em um ou nos dois pontos extremos e a função |p| pode tender a
innito em um ou nos dois pontos extremos de [a, b];
(ii) o intervalo [a, b] pode ser não limitado, isto é, a = −∞ e/ou b = ∞;
O primeiro problema é decidir que especie de condições de fronteira devemos impor. Como queremos
usar os conceitos de produto interno e ortogonalidade como no caso regular, queremos usar apenas soluções
de rf 00 + r0 f 0 + pf + λwf = 0 que tenham quadrado integrável. Entretanto, no caso (i) as soluções podem
não ter quadrado integrável pois elas podem car não limitadas em um ou nos dois pontos extremos de [a, b],
enquanto que no caso (ii) as soluções podem não ter quadrado integrável, pois não decaem a zero no innito.
Assim, devemos distinguir dois casos concernentes ao comportamento das soluções em cada um dos pontos
extremos; vamos considerar o extremo a.
Caso I . Todas as soluções de rf
00 + r0 f 0 + pf + λwf = 0 pertencem a L2w [a, c] para a < c < b. Neste caso,
impomos uma condição sobre o comportamento da solução, como, por exemplo, f (x) seja limitada quando
x → a+

132
Caso II. Nem todas as soluções pertencem a L2w [a, c]. Neste caso, não impomos nenhuma condição em a,
exceto a que automaticamente venha do problema em consideração, isto é, a solução pertença a L2w [a, c].
Em qualquer caso, exigimos que as condições impostas sejam autoadjuntas, isto é, se f e g satisfazem as
condições dadas, então os termos de fronteira na Identidade de Lagrange (7.2.4) se anulam. Mais precisa-
mente, como f e g podem ter singularidades em a e em b ou a e/ou b podem ser innito, essa exigência será
formulada como
h ib−
lim r(x)(f 0 (x)g(x) − f (x)g 0 (x)) = 0. (7.3.1)
δ,→0+ a+δ

Sendo L(f ) = (rf 0 )0 + pf , a condição (7.3.1) implica que

hL(f ), gi = hf, L(g)i

para quaisquer funções de classe C2 que satisfazem as condições de fronteira discutidas acima. Portanto,
todos os resultados do Teorema 7.2.1 se aplicam ao problema de autovalores L(u) + λu = 0 e concluímos que
todos os autovalores são reais e que as autofunções correspondentes a autovalores distintos são ortogonais.

Quanto aos resultados do Teorema 7.2.8, a situação é diferente: não temos garantia de que existam
autofunções sucientes para formarem uma base ortonormal. Algumas vezes existem, algumas vezes não
existem. Quando existem, ainda é possível expandir uma função arbitrária em L2w [a, b] que satisfazem as
condições de fronteira em termos das autofunções, mas a expansão pode envolver uma integral em vez de
uma série.

Como um exemplo da segunda possibilidade, considere a equação diferencial

f 00 (x) + λf (x) = 0 em (−∞, ∞).

A solução geral é

c1 cos νx + c2 sen νx ou c1 eiνx + c2 e−iνx (λ = ν 2 ).

Nenhuma dessas soluções, para qualquer valor de λ, pertence a L2 (−∞, ∞), exceto a solução nula.
Entretanto, como veremos, qualquer f ∈ L2 (−∞, ∞) pode ser escrita como uma integral das funções eiνx
quando ν varia de −∞ a ∞, por meio da transformação de Fourier. Esse será um tópico a ser abordado
mais tarde.

Como exemplo da primeira possibilidade, considere a equação de Legendre

[(1 − x2 )y 0 (x)]0 + λy(x) = 0, −1 < x < 1.

Aqui temos r(x) = 1 − x2 se anula nos extremos do intervalo [−1, 1] e impomos a condição de que uma
solução y deve ser limitada quando x → 1− e x → −1+. A condição (7.3.1) aqui é trivialmente vericada
uma vez que
h i1−
lim (1 − x2 )(f 0 (x)g(x) − f (x)g 0 (x)) = 0,
δ,→0+ −1+δ

pois f e g são limitadas quando x → 1− e x → −1+. Logo, temos um problema de Sturm-Liouville singular
em [−1, 1]. Os autovalores são λn = n(n+1) e as autofunções correspondentes são os polinômios de Legendre
Pn (x), como vimos em capítulo anterior. Nesse caso, o conjunto {Pn }∞ 2
n=0 é uma base ortonormal de L [−1, 1].
No próximo Capítulo, vamos discutir um problema de Sturm-Liouville singular para uma equação de
Bessel
x2 f 00 (x) + xf 0 (x) + (x2 − ν 2 )f (x) = 0.

133
134
Capítulo 8

Funções de Bessel

8.1 Introdução

Ao considerar problemas de vibrações de uma membrana plana que ocupa uma região Ω ⊂ R2 , somos levados
a considerar a equação

utt (x, u, t) = c2 (uxx (x, y, t) + uyy (x, y, t)), (x, y) ∈ Ω, t > 0


∂u
complementada com condições de fronteira, digamos, α(x, y)u(x, y, t)+β(x, y) ∂N (x, y, t) = 0 para (x, y) ∈ ∂Ω
e t > 0, além de condições iniciais u(x, y, 0) = u0 (x, y) e ut (x, y, 0) = u1 (x, y), x ∈ Ω.
Da mesma forma, condução de calor sobre uma região Ω conduz ao estudo de uma equação da forma

ut (x, u, t) = K(uxx (x, y, t) + uyy (x, y, t)), (x, y) ∈ Ω, t > 0

com condição de fronteira como aquela acima referida e condição inicial u(x, y, 0) = u0 (x, y), (x, y) ∈ Ω.
Mostraremos que o método de separação de variáveis permite tratar esses dois problemas de uma forma
unicada. Se u(x, y, t) = v(x, y)T (t), (x, y) ∈ Ω e t ∈ R, a primeira equação se transforma em

v(x, y)T 00 (t) = c2 T (t)(vxx (x, y) + vyy (x, y)).

Supondo T e v diferentes de zero e dividindo pelo produto T v, obtemos

T 00 (t) vxx (x, y) + vyy (x, y)


2
=
c T (t) v(x, y)

e assim, existe uma constante a∈C tal que T 00 (t) = ac2 T (t) e vxx (x, y) + vyy (x, y) = av(x, y). Agora, a
∂v
transforma em α(x, y)v(x, y) + β(x, y)
condição de fronteira imposta ao problema se
∂N (x, y) = 0.
A equação para determinar T é nossa velha conhecida e suas soluções dependem da constante de separação
a. Portanto, a novidade que temos em mãos é estudar o problema

(x, y) ∈ Ω
(
vxx (x, y) + vyy (x, y) = av(x, y),
∂v
α(x, y)v(x, y) + β(x, y) (x, y) = 0, (x, y) ∈ ∂Ω
∂N

Até esse momento, não zemos nenhuma hipótese a respeito da região Ω. Entretanto, é conveniente
admitir que Ω é um aberto limitado, conexo e sua fronteira é uma curva fechada simples e de classe C 2. A
normal N que aparece na condição de fronteira é sempre tomada como a normal unitária exterior.

Para economizar notação, vamos escrever ∆u(x, y) = vxx (x, y) + vyy (x, y) = div∇u(x, y), chamado
Laplaciano de u. ∇2 u para o Laplaciano de u. Se v é solução de ∆v = av em Ω,
Alguns autores escrevem
então
2 2
multiplicando por v , obtemos a|v| = v∆v = div(v∇v) − |∇v| . Integrando em Ω, obtemos

ZZ ZZ ZZ
a |v(x, y)|2 dxdy = v(x, y)∆v(x, y) dxdy = [div(v∇v) − |∇v|2 ] dxdy.
Ω Ω Ω

135
Usando o Teorema do Divergente (ou Teorema de Green), a formula anterior pode ser escrita como

ZZ ZZ ZZ
2 2 ∂v
a |v(x, y)| dxdy = − |∇v(x, y)| dxdy + v(x, y) (x, y)ds.
Ω Ω ∂Ω ∂N

Agora, usamos a condição de fronteira: se β ≡ 0 em ∂Ω (caso em que consideramos a condição de fronteira


de Dirichlet) ou α ≡ 0 em ∂Ω (caso em que consideramos a condição de fronteira de Neumann), a integral
sobre a fronteira é zero e temos
ZZ ZZ
2
a |v(x, y)| dxdy = − |∇v(x, y)|2 dxdy.
Ω Ω

Isso indica que a é um número real e a ≤ 0. Se α e β são não nulas e tem o mesmo sinal (caso em que
chamamos de condição de fronteira de Robin), temos
ZZ ZZ ZZ
2 2 α(x, y)
a |v(x, y)| dxdy = − |∇v(x, y)| dxdy − |v(x, y)|2 ds
Ω Ω ∂Ω β(x, y)

e obtemos ainda a ≤ 0.
Vamos escrever a = −λ2 , onde λ ≥ 0 e vamos resumir as conclusões de nossa discussão no seguinte
algorítimo: Se (λ, v), com v não identicamente nula, é uma solução de

∆v(x, y) + λ2 v(x, y) = 0, (x, y) ∈ Ω


(
∂v (8.1.1)
α(x, y)v(x, y) + β(x, y) (x, y) = 0, (x, y) ∈ ∂Ω
∂N
√ √
então, para quaisquer números reais aλ e bλ , a função u(x, y, t) = [aλ cos(c λt) + bλ sen(c λt)]v(x, y) é uma
2
solução da equação utt = c ∆u em Ω × (0, ∞),

Assim, nosso problema é examinar as soluções do problema (8.1.1). Um resultado fundamental a respeito
(8.1.1), que não demonstraremos em sua generalidade, é que (8.1.1) tem uma innidade de soluções não-nulas.
Mais precisamente, temos

Teorema 8.1.1. Existe uma sequencia innita λ1 < λ2 ≤ λ3 , . . . , com λn → ∞ tal que se λ = λn , então
(8.1.1) tem solução não-nula n=1 é um conjunto ortonormal completo (também chamado
φn e o conjunto {φn }∞
uma base ortonormal) de L2 (Ω).

Segue-se então que



X
u(x, y, t) = [an cos(cλn t) + bn sen(cλn t)]φn (x, y)
n=1

é a solução geral da equação das ondas. As constantes an e bn são determinadas de modo que u(x, y, 0) =
u0 (x, y) e ut (x, y, 0) = u1 (x, y). Resulta
ZZ ZZ
an = u0 (x, y)φn (x, y) dxdy e cλn bn = u1 (x, y)φn (x, y) dxdy,
Ω Ω

para todo n ≥ 1. Completividade do conjunto {φn }∞


n=1 implica que

ZZ N
X
lim [f (x, y, t) − [an cos(cλn t) + bn sen(cλn t)]φn (x, y)]2 dxdy = 0,
n→∞ Ω n=1

para todo t ≥ 0.
Os valores de λ = λn para os quais (8.1.1) tem solução não-nula são chamados autovalores do operador
−∆ e uma solução correspondente φn é chamada uma autofunção do operador −∆. Para um dado λ, o
conjunto das soluções de (8.1.1) é um subespaço vetorial de C 2 (Ω), chamado auto-espaço correspondente a
λ.

136
Da mesma forma, de posse da informação contida no Teorema 8.1.1, a solução da equação do calor
ut = K∆u (K > 0), com condição inicial u0 e com a mesma condição de fronteira considerada no inicio é
dada por

2
X
u(x, y, t) = bn e−Kλn t φn (x, y),
n=1

onde, para todo n ≥ 1, ZZ


bn = u0 (x, y)φn (x, y) dxdy.

Assim, as soluções dos problemas para as equações da onda e do calor (e mais outras que não consi-
deraremos) podem ser tratadas de uma maneira unicada e só dependem do conhecimento dos autovalores
do problema (8.1.1). O estudo desse último depende, obviamente, da região Ω. Casos simples como o de
um retângulo podem ser considerados sem qualquer diculdade . O caso de um disco será considerado na
próxima seção e apresentará um ingrediente novo: a equação de Bessel.

8.2 A Equação de Bessel

SejaD = {(x, y) : x2 + y 2 < b2 } o disco de centro (0, 0) e raio b > 0. Em coordenadas polares, a equação
∆v + λ2 v = 0, (x, y) ∈ D, se escreve como

1 1
vrr + vr + 2 vθθ + λ2 v = 0
r r
com 0<r<b 0 ≤ θ ≤ 2π . A
e condição de fronteira se escreve na forma αv(b, θ) + βvr (b, θ) = 0, onde α e
β são constantes e 0 ≤ θ ≤ 2π .
Vamos aplicar o método de separação de variáveis tomando v = R(r)Θ(θ). Obtemos, apos multiplicar
por r2 , a equação
r2 R00 rR0 Θ00
+ + λ2 r 2 = − .
R R Θ
Assim, ambos os lados são iguais a uma constante, que designaremos por ν 2, e assim, chegamos às equações
Θ00 + ν 2Θ = 0, que já é bastante familiar, e

r2 R00 (r) + rR0 (r) + (λ2 r2 − ν 2 )R(r) = 0, (8.2.1)

que é nova. A equação (8.2.1) pode ser ainda simplicada pela mudança de variável x = λr. Substituindo
R(r) = f (x),

R(r) = f (λr) , R0 (r) = λf 0 (λr) , R00 (r) = λ2 f 00 (λr) e r = x/λ

na equação (8.2.1) obtemos

 x 2 x 0
λ2 f 00 (x) + λf (x) + (x2 − ν 2 )f (x) = 0,
λ λ
isto é,

x2 f 00 (x) + xf 0 (x) + (x2 − ν 2 )f (x) = 0. (8.2.2)

Essa é a equação de Bessel de ordem ν . Ela e suas variantes têm diversas aplicações em Física e Engenha-
ria, especialmente em problemas que envolvam alguma simetria circular. As soluções da equação (8.2.2) são
chamadas funções de Besssel. A próxima seção contém uma exposição de algumas propriedades básicas das
funções de Bessel. Vamos retornar à solução do problema dos autovalores de −∆ mais tarde. Por enquanto,
contente-se com o fato de que devemos ter que ν precisa ser um número inteiro para que Θ seja 2π -periódica
e poderíamos nos contentar em estudar a equação de Bessel apenas para valores inteiros de ν - isso seria uma
perda muito grande. Vamos, portanto, na próxima seção considerar o caso geral ν ≥ 0.

137
8.3 Soluções da Equação de Bessel

Nessa seção vamos construir soluções da equação de Bessel por meio de série de potencias. Embora possamos
considerar que xeν sejam complexos, vamos considerar o caso real e sempre admitiremos que x > 0 e ν ≥ 0.
Inicialmente, lembremos que x = 0 é um ponto singular regular da equação (8.2.2). Para obter suas
soluções, empregamos o método de Frobenius escrevendo


X
r
f (x) = x an xn , x > 0,
n=0

onde r e an são números reais a serem determinados e a0 6= 0. Substituindo


X ∞
X ∞
X
n+r 0 n+r−1 00
f (x) = an x , f (x) = (n + r)an x , f (x) = (n + r)(n + r − 1)an xn+r−2
n=0 n=0 n=0

em (8.2.2), obtemos


X
[(n + r)(n + r − 1)an xn+r + (n + r)an xn+r + an xn+r+2 − ν 2 an xn+r ] = 0.
n=0

Separando o termo em xn+r+2 e renomeando o índice de somatória,


X ∞
X
n+r+2 r+2 r+3
an x = a0 x + a1 x + ··· = an−2 xn+r ,
n=0 n=2

a identidade anterior se transforma em


X
(r2 − ν 2 )a0 xr + [(r + 1) − ν 2 ]a1 xr−1 + {[(n + r)2 − ν 2 ]an + an−2 }xn+r = 0.
n=2

Para que a série de potências seja nula, seus coecientes devem ser todos nulos e assim obtemos as seguintes
equações

(I) (r2 − ν 2 )a0 = 0, (II) [(r + 1)2 − ν 2 ]a1 = 0, (III) [(n + r)2 − ν 2 ]an + an−2 = 0, para n ≥ 2.

Vamos primeiro considerar o caso ν > 0. Como admitimos que a0 6= 0, da equação (I) decorre
que r = ±ν . Suponhamos que r = ν (o outro caso será considerado a seguir). A equação (II) implica que
(2ν + 1)a1 = 0 e, portanto, devemos tomar a1 = 0. A equação (III) se escreve como
an−2
an = − , para n ≥ 2. (8.3.1)
n(n + 2ν)

Segue-se que, se n é ímpar, então an = 0: a1 = a3 = a5 = · · · = a2n+1 = 0. De (8.3.1), temos

a0 a2 a0
a2 = − , a4 = − = ,
2(2 + ν) 4(4 + 2ν) 2 · 4(2 + 2ν)(4 + 2ν)
e, em geral,

(−1)k (−1)k
a2k = = 2k .
2 · 4 . . . (2k)(2 + 2ν)(4 + 2ν) . . . (2k + 2ν) 2 k!(1 + ν)(2 + ν) . . . (k + ν)

Portanto, se ν > 0, uma solução da equação de Bessel (8.2.2) é dada por


X (−1)k x2k+ν
f (x) = a0 , x > 0,
22k k!(1 + ν)(2 + ν) . . . (k + ν)
k=0

onde a0 é uma constante arbitrária.

138
Vamos normalizar f fazendo a escolha de a0 como

1
a0 = ,
2ν Γ(ν + 1)
onde Γ(ν + 1) indica o valor da função gama em ν + 1. Da igualdade funcional Γ(z + 1) = zΓ(z) decorre que

Γ(k + ν + 1) = (k + ν)Γ(k + ν) = · · · = (k + ν)(k − 1 + ν) . . . (1 + ν)Γ(ν + 1).

Com essa escolha de a0 , a solução f se escreve como


X (−1)k  x 2k+ν
Jν (x) = , x > 0. (8.3.2)
k!Γ(k + ν + 1) 2
k=0

Uma aplicação simples do Critério da Razão mostra que, para todo x ∈ R, a série (8.3.2) é absolutamente
convergente e Jν (0) = 0 para todo ν > 0. A função Jν é chamada a função de Bessel (de primeira especie)
de ordem ν .
Quando r = −ν , as equações (II) e (III) se transformam em (1 − 2ν)a1 = 0 e n(n − 2ν)an = an−2 , n ≥ 2 e
temos problema em determinar an quando 2ν for um número inteiro. Se 2ν = 2k + 1 for um número inteiro
ímpar, a escolha a2k+1 = 0 é compatível com a equação resultante 0a2k+1 = an−2 = 0 e assim obtermos
a2k+1 = 0 para todo k ≥ 0. Se 2ν = 2k é um número inteiro par, o método não fornece nenhuma solução
e temos usar outro argumento - que será apresentado a seguir. Portanto, excluindo o caso em que ν é um
número inteiro, procedendo como zemos anteriormente, obtemos a2k+1 = 0 e

(−1)k (−1)k
a2k = = 2k .
2 · 4 . . . (2k)(2 − 2ν)(4 − 2ν) . . . (2k − 2ν) 2 k!(1 − ν)(2 − ν) . . . (k − ν)

Logo, obtemos a solução


X (−1)k  x 2k−ν
J−ν (x) = , x > 0, (8.3.3)
k!Γ(k − ν + 1) 2
k=0

que é a mesma expressão (8.3.2), trocando ν por −ν .


Agora, examinamos o caso ν = n, um número inteiro não negativo. Já sabemos que, se n≥0 é inteiro,
então Jn é dada por

∞ ∞
X (−1)k  x 2k+n X (−1)k  x 2k+n
Jn (x) = = , x > 0,
k!Γ(k + n + 1) 2 k!(k + n)! 2
k=0 k=0

onde usamos o fato de que Γ(k + 1) = k!.


Denição 8.3.1. Para todo inteiro n ≥ 1, denimos a função de Bessel J−n por

∞ ∞
X (−1)k  x 2k−n X (−1)n+m  x 2m+n
J−n (x) = = , x > 0.
k!(k − n)! 2 m!(m + n)! 2
k=n m=0

Observe que a denição é equivalente a J−n (x) = (−1)n Jn (x), para todo n inteiro.

Falta apenas considerar o caso ν = 0. Nesse caso, a equação (I) tem r =0 como raiz dupla e só
obtemos a solução
∞ ∞
X (−1)k  x 2k X (−1)k  x 2k
J0 (x) = = , x > 0.
k!Γ(k + 1) 2 (k!)2 2
k=0 k=0

Para encontrar a outra solução, o leitor está convidado a consultar o parágrafo 5.8 do livro de W. E.
Boyce e R. C. DiPrima, para obter a solução


" #
2  x X (−1)m+1 Hm  x 2m
Y0 (x) = γ + ln J0 (x) + , x > 0,
π 2 (m!)2 2
m=1

139
onde
1 1 1
Hm = 1 + + + ··· +
2 3 m
e γ = limn→∞ (Hn − ln n) ≈ 0, 5772 é a constante de Euler-Mascheroni.

Para todo ν 6= inteiro, as funções Jν e J−ν são linearmente independentes, pois

xν x−ν
Jν (x) ≈ e J−ν (x) ≈ para x ≈ 0.
2ν Γ(ν + 1) 2−ν Γ(−ν + 1)
Assim, a solução geral de (8.2.2) é f (x) = c1 Jν (x) + c2 J−ν (x), x > 0, onde c1 e c2 são constante arbitrárias.

y
1

h x

Figura 8.1: Grácos das funções J0 (vermelho), Y0 (azul) e J2 (laranja).

Quando n é um número inteiro, temos J−n (x) = (−1)n Jn (x), e Jn e J−n não são linearmente indepen-
dentes. Para contornar esse problema, vamos trocar a segunda solução J−ν pela função Yν , conhecida como
função de Weber1 ou função de Bessel de segunda especie, denida por
cos(νπ)Jν (x) − J−ν (x)
Yν (x) = . (8.3.4)
sen(νπ)
Como combinação linear de Jν e J−ν , Yν é uma solução da equação de Bessel (8.2.2). Também, Jν e Yν
são linearmente independentes e podemos usá-las como base de soluções da equação de Bessel para escrever
sua solução geral na forma f (x) = c1 Jν (x) + c2 Yν (x), x > 0, onde c1 e c2 são constantes arbitrárias. Observe
que quando ν é um número inteiro, a expressão (8.3.4) é indeterminada. Entretanto, pode-se mostrar (regra
de L'Hospital) que se n é um número inteiro e x 6= 0, então o limite de Yν , quando ν → n, existe e tem-se

Yn (x) = lim Yν (x).


ν→n

Nas listas de exercícios da disciplina você terá oportunidade de calcular esse limite. A propriedade mais
importante de Yn é seu comportamento quando x → 0+, que é descrito por

(n − 1)!  x −n
Yn (x) ≈ − quando x → 0 + (n = 1, 2, 3, . . . ),
π 2
2 x
Y0 (x) ≈ ln quando x → 0 + (n = 0).
π 2
Em vista de sua importância, vamos coletar a seguir algumas propriedades imediatas sobre funções de
Bessel de ordem inteira, que serão úteis mais tarde. São os seguintes: para todo inteiro n ≥ 0, Jn está
denida em (−∞, ∞) e temos

 x n  1 1  x 2 1  x 4 1  x 6 
Jn (x) = − + − + ...
2 0!n! 1!(n + 1)! 2 2!(n + 2)! 2 3!(n + 3)! 2

1  x 2 1  x 4 1  x 6
J0 (x) = 1 − + − + ...
(1!)2 2 (2!)2 2 (3!)2 2
x  1 1  x 2 1  x 4 1  x 6

J1 (x) = − + − + ...
2 0!1! 1!2! 2 2!3! 2 3!4! 2
1
Em homenagem ao matemático alemão Heinrich Weber (1842-1913).

140
1
J0 (0) = 1 , J00 (0) = 0 e J000 (0) = −1. J1 (0) = 0 , J10 (0) = e J000 (0) = 0.
2

Jn (0) = 0, para todo n ≥ 1.

8.4 Propriedades das Funções de Bessel

Existem fórmulas que relacionam as diversas funções de Bessel entre si e com outras funções especiais;
algumas tem natureza algébrica e outras envolvem integrais ou séries innitas. Nessa seção, vamos discutir
algumas mais elementares e que serão úteis em nossos estudos.

Começamos com algumas identidades algébricas relacionando Jν e suas derivadas com as funções adja-
centes Jν−1 e Jν+1 : Para todos x e ν, temos

d  −ν
x Jν (x) = −x−ν Jν+1 (x),

(8.4.1)
dx
d ν
[x Jν (x)] = xν Jν−1 (x), (8.4.2)
dx
xJν0 (x) − νJν (x) = −xJν+1 (x), (8.4.3)

xJν0 (x) + νJν (x) = xJν−1 (x), (8.4.4)

xJν−1 (x) + xJν+1 (x) = 2νJν (x), (8.4.5)

Jν−1 (x) − Jν+1 (x) = 2νJν0 (x). (8.4.6)

Demonstração. Para demonstrar (8.4.1) e (8.4.2), usamos a série de potencias para Jν (x), efetuar as
derivadas indicadas e renomear o índice de soma. Para demonstrar (8.4.3) e (8.4.4), basta efetuar as derivadas
indicadas em (8.4.1) e (8.4.2)

(−ν)x−ν−1 Jν (x) + x−ν Jν0 (x) = −x−ν Jν+1 (x)

νxν−1 Jν (x) + xν Jν0 (x) = xν Jν−1 (x)


e multiplicar, respectivamente, por xν+1 e x−ν+1 . Finalmente, (8.4.5) e (8.4.6) decorre da subtração e soma
de (8.4.3) e (8.4.4). 
Como uma primeira aplicação destas formulas, vamos mostrar que as funções de Bessel de ordem semi-
inteiro podem ser escritas em termos de funções elementares familiares. Vamos começar com J−1/2 . Como


        
k 1 k 1 3 1 1
2 Γ k+ =2 k− k− ... Γ = (2k − 1)(2k − 3) . . . (1) π,
2 2 2 2 2

temos
∞ 1 ∞
1/2 X 1/2
(−1)k x2k− 2 (−1)k x2k
 
X 2 2
J−1/2 (x) = −1/2 [2k k!][2k Γ(k + 1 )]
= = cos x.
2 2
πx (2k)! πx
k=0 k=0

Da mesma forma,

∞ 1 ∞
1/2 X 1/2
(−1)k x2k+ 2 (−1)k x2k+1
 
X 2 2
J1/2 (x) = 1/2 [2k k!][2k Γ(k + 1 + 1)]
= = sen x.
2 2
πx (2k + 1)! πx
k=0 k=0

Portanto,
 1/2  1/2
2 2
J1/2 (x) = sen x e J−1/2 (x) = cos x.
πx πx

141
De (8.4.5) com ν = 1/2 e ν = −1/2, obtemos

 1/2 
1 2 sen x 
J3/2 (x) = J (x) − J−1/2 (x) = − cos x
x 1/2 πx x
 1/2 
1 2 cos x 
J−3/2 (x) = J1/2 (x) − J−1/2 (x) = − + sen x .
x πx x
Para registro,

 1/2   1/2 
2 sen x  2 cos x 
J3/2 (x) = − cos x e J−3/2 (x) = − + sen x .
πx x πx x

1
Por aplicação repetida da formula de recorrência (8.4.5) concluímos que, se ν =n+ 2 , então

Jn+ 1 (x) = x−1/2 [Pn (x) cos x + Qn (x) sen x]


2

onde Pn e Qn são funções racionais. [Nota: dentre as funções de Bessel, as de ordem semi-inteiro são as
únicas funções elementares.]
y


2 3π
π π 2π x
2

Figura 8.2: Grácos das funções J−1/2 (azul), J1/2 (vermelho), J−3/2 (laranja) e J3/2 (verde).

Exercício 8.4.1. Determine as expressões de J5/2 e J−5/2 e identique P2 e Q2 .

Tomando ν=0 em (8.4.2), obtemos J00 (x) = J−1 (x) = −J1 (x) para todo x ≥ 0.
O próximo grupo de resultados mostram como gerar as funções de Bessel de ordem inteira. A demons-
tração pode ser encontrada no livro de G. Folland [8], p. 134.

A função geradora para Jn (x): para todos x e z 6= 0, temos

∞   
X x n 1
Jn (x)z = exp z− . (8.4.7)
n=−∞
2 z

Colocando z = eiθ em (8.4.7) e lembrando que


1
2 (z − z −1 ) = i sen θ, temos


X
Jn (x)einθ = eix sen θ .
n=−∞

Como o lado direito desta última igualdade é uma função 2π -periódica em θ e a expressão do lado esquerdo
é uma série de Fourier, concluímos que os coecientes Jn (x) na série devem ser os coecientes de Fourier da
função θ 7→ eix sen θ , isto é, para todo n ∈ Z, temos

Z π
1
Jn (x) = eix sen θ−inθ dθ. (8.4.8)
2π −π

142
Esta é uma nova formula para Jn , completamente diferente de sua denição original como série de
potencias e muito útil. Por exemplo, ela mostra imediatamente que |Jn (x)| ≤ 1 para todo x real:

π Z Z π
1 1
|Jn (x)| ≤ |eix sen θ−inθ | dθ = dθ = 1,
2π −π 2π −π
um fato nada evidente da série de potencias (8.3.2). Ela mostra também que as derivadas de Jn também são
todas limitadas: Z π
1
Jn(k) (x) = (i sen θ)k eix sen θ−inθ dθ.
2π −π
Como, para x real,
eix sen θ−inθ = cos(x sen θ − nθ) + i sen(x sen θ − nθ),

e θ ∈ [−π, π] 7→ sen(x sen θ − nθ) é uma função ímpar, temos −π sen(x sen θ − nθ) dθ = 0 e, portanto,

Z π
1 π
Z
1
Jn (x) = cos(x sen θ − nθ) dθ = cos(x sen θ − nθ) dθ,
2π −π π 0
pois θ ∈ [−π, π] 7→ cos(x sen θ − nθ) é uma função par. Como J−n (x) = (−1)n Jn (x), temos
1 π
Z
Jn (x) = [cos(x sen θ) cos(nθ) + sen(x sen θ) sen(nθ)] dθ,
π 0
1 π
Z
n
(−1) Jn (x) = [cos(x sen θ) cos(nθ) − sen(x sen θ) sen(nθ)] dθ.
π 0
Se n é par, somamos essas duas expressões e dividindo por 2; se n é ímpar, subtraímos as expressões e
dividimos por 2, para obter a seguinte

Proposição 8.4.1. Para todo inteiro n, temos

1 π 2 π/2
Z Z
Jn (x) = cos(x sen θ) cos(nθ) dθ = cos(x sen θ) cos(nθ) dθ, se n é par,
π Z0 π Z0
1 π 2 π/2
Jn (x) = sen(x sen θ) sen(nθ) dθ = sen(x sen θ) sen(nθ) dθ, se n é ímpar.
π 0 π 0
A segunda igualdade é justicada notando que as funções integrandas têm grácos que são simétricos em
π
relação à reta x= 2 . Na gura, à esquerda, o gráco de y = cos(x sen θ) cos(nθ), com n =4 e n=6 e à

y y
1 1

π π x π π x
2 2

direita, de y = sen(x sen θ) sen(θ), com n=3 e n = 5.

8.5 Comportamento Assintótico e Zeros das Funções de Bessel

O tema que discutiremos nessa seção é a localização aproximada dos zeros das funções de Bessel, um problema
de fundamental importância nas aplicações. Para termos uma ideia do comportamento assintótico destas
funções quando x tende a innito, vamos examinar a função g(x) = x1/2 f (x), onde f é uma solução da
equação de Bessel

(8.2.2) x2 f 00 (x) + xf 0 (x) + (x2 − ν 2 )f (x) = 0.

Substituindo

g(x) g 0 (x) g(x) g 00 (x) g 0 (x) 4g(x)


f (x) = , f 0 (x) = − 3/2 , f 00 (x) = − 3/2 + 5/2
x1/2 x 1/2 2x x1/2 x 4x

143
na equação (8.2.2) e multiplicando o resultado por x−3/2 , obtemos

1
00 4 − ν2
g (x) + g(x) + g(x) = 0.
x2

Observe que quando ν2 = 1


4 , a equação transformada é g 00 (x) + g(x) = 0, donde se deduz facilmente
as expressões das funções de Bessel J1/2 e J−1/2 . Quando x é muito grande, o termo ( 41 − ν 2 )/x2 é muito
pequeno e é razoável esperar que as soluções desta última equação se comportem como as soluções da equação
g 00 (x) + g(x) = 0. Como as soluções desta são da forma a sen(x + b) e a cos(x + b), esperamos que as soluções
f da equação de Bessel se comportem como f (x) = ax−1/2 cos(x + b) ou f (x) = ax−1/2 sen(x + b). De fato,
nossa intuição está correta, mas a demonstração não é simples e mesmo a determinação dos valores de a
e b não é uma tarefa fácil. O resultado está registrado no próximo Teorema, cuja demonstração não será
apresentada, mas pode ser consultada em textos mais avançados.

Teorema 8.5.1. ν ∈ R, existe uma constante Cν tal que, se x ≥ 1, então


Para cada
r
2  νπ π  Cν
Jν (x) = cos x − − + Eν (x), onde |Eν (x)| ≤ 3/2 . (8.5.1)
πx 2 4 x
x−3/2 ,
p
Pelo Teorema 8.5.1, temos então a = 2/π e b = −(2ν + 1)π/4, com erro que tende a zero como
mais rápido que o termo x
−1/2 .

A expressão (8.5.1) para o comportamento assintótico de Jν ajuda a explicar o signicado da segunda


solução Yν denida em (8.3.4). Trocando −ν em (8.5.1), temos
ν por
r
2  νπ π 
J−ν (x) ≈ cos x + − ,
πx 2 4
para x  1. Como
 νπ π   νπ π   νπ π 
cos x + − = cos(νπ) cos x − − − sen(νπ) sen x − − ,
2 4 2 4 2 4
se ν não é um inteiro, combinando as formulas (8.3.4) e (8.5.1), encontramos
r
cos(νπ)Jν (x) − J−ν (x) 2  νπ π 
Yν (x) = ≈ sen x − − (8.5.2)
sen(νπ) πx 2 4

para x  1, com erro menor que Cx−3/2 . Assim, se pensarmos em Jν como uma aproximação para uma
onda amortecida da forma cosseno, então Yν é a correspondente onda seno amortecida.
Observação 8.5.1. Pode-se mostrar que a relação (8.5.2) continua valendo mesmo se ν é um número inteiro.

De (8.5.1) e da formula de recorrência (8.4.4), podemos determinar o comportamento assintótico da


derivada Jν0 . Sabemos, de (8.4.4), que

ν
Jν0 (x) = Jν−1 (x) − Jν (x)
x
e r r
 
2 (ν − 1)π π 2  νπ π 
Jν−1 (x) = cos x − − + Eν−1 (x) = − sen x − − + Eν−1 (x).
πx 2 4 πx 2 4
Logo, para x ≥ 1, temos
r
2  νπ π 
Jν0 (x) =− sen x − − + Ẽν (x),
πx 2 4
onde Ẽν (x) = Eν−1 (x) − xν Jν (x) satisfaz

 1/2
Cν−1 2 |ν| |ν|Cν Cν0
|Ẽν (x)| ≤ + + ≤ .
x3/2 π x3/2 x5/2 x3/2
Em resumo, temos

144
Proposição 8.5.1. Para cada ν ∈ R, existe uma constante Cν0 tal que, se x ≥ 1, então
r
0 2  νπ π  Cν0
Jν (x) = − sen x − − + Ẽν (x), onde |Ẽν (x)| ≤ 3/2 . (8.5.3)
πx 2 4 x

Para as aplicações que temos em mente, vamos precisar de uma razoável descrição de como se distribuem
as raízes das equações Jν (x) = 0 e cJν (x) + xJν0 = 0, onde c é uma constante real. Para tratar esse problema
de uma forma unicada, vamos estudar o problema de descrever os zeros positivos da equação

aJν (x) + bxJν0 (x) = 0, (8.5.4)

onde ν ≥ 0, a, b ∈ R e (a, b) 6= (0, 0).


Em primeiro lugar, observamos que a função x−ν [aJν (x) + bxJν0 (x)] é a soma de uma série de potencias
que converge para todo valor real de x. Portanto, ela dene uma função analítica inteira no plano complexo
e, assim, seus zeros são isolados. Portanto, as soluções positivas da equação (8.5.4) podem ser arranjados
numa sequencia crescente
0 < λ1 < λ2 < λ3 < . . . ,
com limn→∞ λn = ∞. O tema central de nossa discussão é o estudo da localização desses zeros e seu
comportamento assintótico quando n → ∞. Nesse estudo, devemos distinguir os casos b = 0 e b 6= 0, isto é,
devemos considerar separadamente as equações Jν (x) = 0 e cJν (x) + xJν0 (x) = 0, onde c = a/b.
Vamos primeiro considerar o caso b = 0. Jν pode
O comportamento assintótico dos zeros positivos de
ser obtido imediatamente dos resultados sobre o comportamento assintótico das funções Jν e Jν0 descritas
anteriormente. De fato, sabemos que Jν (x) é aproximadamente x
−1/2 cos(x − νπ − π ) para x sucientemente
2 4
νπ π ν 3
grande e, portanto, seus zeros deverão ocorrer muito próximos daqueles de cos(x−
2 − 4 ), que são (n+ 2 + 4 )π
para inteiros positivos n sucientemente grandes. Para ser mais precisos, temos o seguinte resultado

Proposição 8.5.2. Suponha que f é uma função real derivável que satisfaz

|f (x) − cos x| ≤ ε e |f 0 (x) + sen x| ≤ ε para x ≥ M π,

onde ε  1. Então, para todo inteiro n ≥ M, f tem um único zero zm em cada intervalo [mπ, (m + 1)π] e
|zm − (m + 21 π)| < 2ε.

Demonstração. Temos cos(m + 12 )π = 0. Como |f (x) − cos x| ≤ ε, f tem sinais opostos


cos mπ = (−1)m e
em mπ e em (m + 1)π e, portanto, tem um zero em (mπ, (m + 1)π) e tais zeros se localizam próximos de
(m + 12 )π . Mas sen(m + 21 )π = (−1)m e a condição |f 0 (x) + sen x| ≤ ε implica que f 0 (x) 6= 0 para x próximo
1 1
de (m + )π . Portanto, f é estritamente crescente ou decrescente próximo de (m + )π e tem um único zero.
2 2

Agora, aplicamos a Proposição 8.5.2 à função

1 1
f (x) = x̃1/2 Jν (x̃), com x̃ = x + νπ + π.
2 4
Como f 0 (x) = x̃1/2 Jν0 (x̃) + 12 x̃−1/2 Jν (x̃), as estimativas (8.5.1) e (8.5.3) mostram que |f (x) − cos x| e |f 0 (x) +
sen x| são menores que uma constante vezes x−1 e, portanto, podem ser tornadas tão pequeno quanto se
queira tomando x sucientemente grande. Assim, existe M > 0 tal que as soluções da equação Jν (x) = 0
1 3
com x > M ocorrem em pontos próximos de (m + ν + )π , onde m é um inteiro.
2 4
Um argumento análogo pode ser aplicado à função

1 1
f (x) = cx̃−1/2 Jν (x̃) + x̃1/2 Jν0 (x̃), com x̃ = x + νπ − π.
2 4
Por (8.5.3), o segundo termo em f (x) é aproximadamente sen(x + 12 π) = cos x e o primeiro é dominado por
x−1 por (8.5.1). Temos

1 1
f 0 (x) = − cx̃−3/2 Jν (x̃) + cx̃−1/2 Jν0 (x̃) + x̃−1/2 Jν0 (x̃) + x̃1/2 Jν00 (x̃).
2 2

145
Os três primeiros termos são dominados por x̃−1 e da equação de Bessel temos

Jν00 (x̃) = −x̃−1 Jν0 (x̃) − (1 − ν 2 x̃−2 )Jν (x̃),

de modo que
f 0 (x̃) = x̃1/2 Jν (x̃) + (termos de ordem x−1 ).
Estimativa (8.5.1) implica que f 0 (x) cos(x + 21 π) = − sen x. Portanto, a Proposição
é aproximadamente
0
8.5.2 pode ser aplicada a f para concluir que a função cJν (x̃) + x̃Jν (x̃) = x
1/2 f (x) tem zeros proximos dos
1 0
pontos (m + )π para valores grandes de m. Em outras palavras, cJν (x) + xJν (x) tem zeros aproximados
2
1 1
em (m + ν + )π para m sucientemente grande.
2 4
Permanece sem resposta a questão de localizar os zeros positivos intermediários de
0 (x).
aJν +bxJnu Vamos
nos contentar em obter um limitante inferior para o menor zero positivo destas funções sob a condição ν≥0
e a≥0 e b ≥ 0. (Os casos em que ν < 0, a < 0 ou b<0 não são frequentes nas aplicações.)

Proposição 8.5.3. Suponha que ν ≥ 0, a ≥ 0, b ≥ 0 e (a, b) 6= (0, 0). Se ων é o menor zero positivo de
aJν (x) + bxJν0 (x) = 0, então ων > ν .

Demonstração. Ver G. Folland [8], p. 142.

Observação 8.5.2. O resultado da Proposição 8.5.3 é suciente para nossos propósitos, mas existem es-
timativas mais precisas para ων . Pode-se mostrar (ver paragrafo 15.3, p. 486 de George N. Watson [24])
que
p p
ν(ν + 2) < ων < 2(ν + 1)(ν + 3).
Assim, ων é da mesma ordem que ν. ♣

Reunimos todas essas informações no seguinte

Teorema 8.5.2. Suponha que ν ≥ 0, a ≥ 0, b ≥ 0 e (a, b) 6= (0, 0). Seja

0 < λ1 < λ2 < λ3 < . . .

a sequencia dos zeros positivos de aJν (x) + bxJν0 (x). Então, λ1 > ν e temos:

(i) Se b = 0, então existe um inteiro M = M (ν) tal que

 
1 3
λk ∼ k+M + ν+ π quando k → ∞.
2 4

(ii) Se b > 0, então existe um inteiroM = M (ν, a/b) tal que

 
1 1
λk ∼ k + M + ν + π quando k → ∞.
2 4

(Aqui,  an ∼ bn  signica que a diferença an − bn tende a zero quando n → ∞.)

8.6 Conjuntos Ortonormais de Funções de Bessel

Vamos lembrar que a equação diferencial (8.2.1) da qual obtivemos a equação de Bessel é

x2 f 00 (x) + xf 0 (x) + (λ2 x2 − ν 2 )f (x) = 0, (8.6.1)

e que todas as soluções desta equação são funções f (x) = g(λx), onde g satisfaz a equação de Bessel (i.e., a
equação (8.6.1) com λ = 1). Dividindo por x, (8.6.1) pode ser reescrita como

ν2
[xf 0 (x)]0 − f (x) + λ2 xf (x) = 0. (8.6.2)
x

146
Isto é uma equação do tipo das que compõem um problema de Sturm-Liouville que estudamos anterior-
mente, isto é, do tipo

ν2
(rf 0 )0 + pf 0 + λ2 wf = 0 onde r(x) = x, p(x) = − , w(x) = x.
x
Se considerarmos essa equação em um intervalo [a, b] com 0<a<b e impusermos condições de fronteira
da forma
αf (a) + α0 f 0 (a) = 0, βf (b) + β 0 f 0 (b) = 0,
obtemos um problema regular de Sturm-Liouville. As autofunções serão da forma

f (x) = cλ Jν (λx) + dλ Yν (λx), (8.6.3)

onde cλ e dλ devem ser escolhidos para que f satisfaça as condições de fronteira. Desta forma, obtemos
2
uma base ortonormal de Lw [a, b] consistindo de funções da forma (8.6.3), onde w(x) = x. Em geral, a
determinação dos autovalores λ e dos coecientes cλ e dλ podem envolver cálculos desagradáveis de realizar
e não vamos prosseguir nessa linha.

Mais importante e interessante é considerar a equação (8.6.2) em um intervalo [0, b] com a hipótese
ν ≥ 0. Nessas condições, o problema de Sturm-Liouville resultante ésingular, pois o coeciente líder r se
anula quando x = 0 e o coeciente p tende para −∞. Resulta que não é apropriado impor qualquer condição
0 0
de fronteira do tipo αf (a) + α f (a) = 0 em x = 0 - de fato, todas soluções são da forma (8.6.3) e tais funções
(e suas derivadas) são não limitadas quando x → 0 a menos que dλ = 0. Como em x = b podemos colocar
uma condição de fronteira daquelas que consideramos anteriormente, vamos, em denitivo, considerar, para
ν ≥ 0, o seguinte problema de Sturm-Liouville singular

ν2
xf 00 (x) + f 0 (x) − f (x) + λ2 xf (x) = 0, 0 < x < b,
x (8.6.4)

f (0+) existe e é nito, βf (b) + β 0 f (b) = 0.

Segue-se que, se f é uma solução não-nula de (8.6.4), então existe uma constante não-nula c tal que
f (x) = cJν (λx) e, para que ela satisfaça a condição de fronteira βf (b) + β 0 f 0 (b) = 0, devemos ter

βJν (λb) + β 0 λJν0 (λb) = 0. (8.6.5)

A equação (8.6.5) foi estudada no Teorema 8.5.2 e sabemos que ela tem uma innidade de soluções λn > 0
tais que λn → ∞ quando n → ∞. Cada raiz λn determina uma solução não-nula Jν (λn x) de (8.6.4) e são,
portanto, os autovalores e as autofunções do problema (8.6.4).
Vamos mostrar que autofunções f (x) = Jν (λn x) e g(x) = Jν (λk x) correspondentes a autovalores distintos
0 0 ν2
vericar que o operador L(f ) = (xf ) −
são ortogonais. Para isso, basta
x f satisfaz a condição

hL(f ), gi = hf, L(g)i.

Utilizando a Identidade de Lagrange no intervalo [ε, b] (ε > 0) e obtemos

Z b h ib
hL(f ), gi − hf, L(g)i = [L(f )(x)g(x) − f (x)L(g)(x)] dx = xf 0 (x)g(x) − xf (x)g 0 (x) .
ε ε

A condição de fronteira em b implica bf 0 (b)g(b)−bf (b)g 0 (b) = 0. Em x = ε, temos εf 0 (ε)g(ε)−εf (ε)g 0 (ε) =
0 se ν=0 e se ν > 0, então f (ε), g(ε), εf 0 (ε), e εg 0 (ε) são limitadas por Cεν , então

εf 0 (ε)g(ε) − εf (ε)g 0 (ε) ≤ Cε2ν → 0

quando ε → 0.

147
Observação 8.6.1. (a) λ=0 é um autovalor de (8.6.4) se e somente se β/β 0 = −ν/b. De fato, se λ = 0, a
equação de Bessel é uma equação de Euler

x2 y 00 + xy 0 − ν 2 y = 0

e suas soluções são y(x) = c1 xν + c2 x−ν se ν > 0 e y(x) = c1 + c2 ln x se ν = 0. Assim, se λ = 0 for um


ν
autovalor de (8.6.4), então c2 = 0 e a autofunção correspondente é dada por f (x) = x . Para a demonstração
da recíproca, consultar G. Folland [8].

(b) Se β0 = 0 ou β/β 0 ≥ −ν/b, não existem autovalores negativos. Para a demonstração, consultar G.
Folland [8], p. 146.

Em particular, se em (8.6.4) estivermos considerando a condição de Dirichlet f (b) = 0, então os auto-


valores são todos positivos. Se estivermos considerando a condição de Neumann f 0 (b) = 0, então λ = 0 é
um autovalor e a correspondente autofunção é constante em [0, b]. Se estivermos considerando a condição de
fronteira cf (b) + f 0 (b) = 0 e c ≥ −ν/b, então todos os autovalores são não-negativos. ♣
Uma consequência de toda nossa discussão até o presente momento é a construção de famílias de conjuntos
ortogonais de funções em [0, b]: para cada terna ν ≥ 0, β e β0, o conjunto das funções fk (x) = Jν (λk x) é um
conjunto ortogonal de funções em [0, b] com relação à função peso w(x) = x. De modo torna-lo um conjunto
ortonormal útil às aplicações, precisamos identicar as normas dessas funções, isto é, obter

Z b
kfk k2w = |fk (x)|2 x dx.
0

Para esse m, vamos a seguir enunciar alguns resultados que não demonstraremos. (Ver G. Folland [8]).
Como as autofunções são reais, retiramos os módulos nos enunciados.

Proposição 8.6.1. Se λ > 0, b > 0 e ν ≥ 0, tem-se


Z b
b2 λ2 b2 − ν 2
Jν (λx)2 x dx = Jν0 (λb)2 + Jν (λb)2 . (8.6.6)
0 2 2λ2
A equação (8.6.6) pode ser simplicada nos caso de condições de fronteira da forma Jν (λb) = 0 ou
cJν (λb) + λJν0 (λb) = 0. Em conjunto com a formula de recorrência (8.4.3), temos

b
b2 0 b2
Z
se Jν (λb) = 0, então Jν (λx)2 xdx = Jν (λb) = Jν+1 (λb)2 .
0 2 2
Z b  2
ν 2 b2 c2

b
se cJν (λb) + λJν0 (λb) = 0, então
2
Jν (λx) xdx = − 2+ Jν (λb)2 .
0 2 λ 2λ2
Agora podemos escrever uma quantidade imensa de conjuntos ortonormais de funções de Bessel denidas
em [0, b] obtidas dos problemas de Sturm-Liouville (8.6.4). Uma última pergunta crucial permanece: Esses
conjuntos ortonormais são bases? O Teorema estudado anteriormente não pode ser aplicado, uma vez que
no caso presente temos um problema singular. Entretanto, a resposta é sim, esses conjuntos ortonormais são
bases, mas a demonstração foge ao escopo dessas notas (Ver G. Watson [24]). Vamos registrar esses fatos no
seguinte

Teorema 8.6.1. Suponha que ν ≥ 0, b > 0 e w(x) = x.



(a) Sejam {λn }n=1 os zeros positivos de Jν (x) e sejam φk (x) = Jν (λk x/b). Então, {φk }∞ é uma base
k=1
2
ortogonal de L [0, b] e
b2
kφk k2w = Jν+1 (λk )2 .
2
(b) Suponha que c ≥ −ν . Sejam {λ̃k }∞
k=1 os zeros positivos de cJν (x) + xJν0 (x) e ψk (x) = Jν (λ̃k x/b). Se
c ≥ −ν , então {ψk }∞ k=1 é uma base ortogonal de L2w [0, b]. Se c = −ν , então {ψk }∞k=0 é uma base ortogonal
2 ν
de Lw [0, b], onde ψ0 (x) = x . Temos ainda

b2 (λ̃2k − ν 2 + c2 ) b2ν+2
kψk k2w = Jν (λ̃k )2 (k ≥ 1), kψ0 k2w = .
2λ̃2k 2ν + 2

148
Segue do Teorema 8.6.1 que, se f ∈ L2w [0, b], então f pode ser expandida em série de Fourier-Bessel
∞ Z b
X 1
f= ck φk , ck = f (x)φk (x) xdx
kφk k2w 0
n=1

ou em série de Dini ∞ Z b
X 1
f= dk ψk , dk = f (x)ψk (x) xdx.
kψk k2w 0
n=1

As séries convergem em norma de L2w [0, b], mas sob condições convenientes, elas também convergem
puntualmente ou uniformemente em [0, b]. Excluindo os extremos 0 e b, o comportamento destas séries é
como o da série de Fourier clássica: se f é contínua por partes em [0, b], então as duas séries convergem para
1
2 [f (x+) + f (x−)] para todo x ∈ (0, b). Uma vez que φk (b) = 0 no caso da condição de Dirichlet, temos
φk (0) = φ(b) = 0 e não podemos esperar convergência puntual nesses pontos a menos que f satisfaça a
mesma condição. A demonstração desses fatos pode ser encontrada em G. Watson [24].

Exemplo 8.6.1. Vamos retomar o Exemplo com que iniciamos essas notas, a saber, o problema de determinar
os autovalores de −∆ no disco D = {(x, y) : x2 + y 2 < b2 }, isto é, determinar as soluções não-nulas de

∆v(x, y) + λ2 v(x, y) = 0, x2 + y 2 < b2


(
(8.1.1) ∂v
α(x, y)v(x, y) + β(x, y) (x, y) = 0, x2 + y 2 = b2 .
∂N
Utilizando coordenadas polares x = r cos θ, y = r sen θ e o método de separação de variáveis tomando
v = R(r)Θ(θ), concluímos que R e Θ satisfazem as equações Θ00 (θ) + ν 2 Θ(θ) = 0 e

r2 R00 (r) + rR0 (r) + (λ2 r2 − ν 2 )R(r) = 0,

para 0 < r < b. Vamos tomar condições de fronteira impondo que R seja contínua em r=0 e, em r = b,
uma condição da forma αR(b) + α0 R(b) = 0, onde α 0
e α são constantes.

A 2π -periodicidade de Θ implica que ν deve ser um número inteiro, digamos, ν = n, com n ≥ 0, e


Θ(θ) = an cos nθ + bn sen nθ. Como vimos, a solução da equação para R é R(r) = f (λr), onde f é uma
solução da equação de Bessel

x2 f 00 (x) + xf 0 (x) + (x2 − n2 )f (x) = 0.


Assim, R(r) = Jn (λr), n = 0, 1, 2, . . . . Para que R satisfaça a condição de fronteira αR(b) + α0 R0 (b) = 0,
devemos ter

αJn (λb) + α0 λJn0 (λb) = 0.

Não podemos usar essa expressão para decidir se λ = 0 é ou não um autovalor, pois as duas parcelas
se anulam quando λ = 0. Entretanto, como já vimos, quando λ = 0, a equação para R é uma equação de
n
Euler, cujas soluções são R(r) = c1 r + c2 r
−n , se n > 0 e R(r) = c + c ln r , se n = 0. Limitação de R numa
1 2
n
vizinhança de zero implica c2 = 0 em qualquer caso e a condição de fronteira em b implica αb + α nb
0 n−1 = 0.
0 0
Assim, λ = 0 é um autovalor de (8.1.1) se e somente se αb + α n = 0. Se α = 0 (condição de Dirichlet na
fronteira), então zero não é um autovalor e se α = 0 (condição de Neumann na fronteira), então λ = 0 é um
0
autovalor com correspondente autofunção constante, digamos, φ0 (r) = 1. Quando α e α tem mesmo sinal,
λ = 0 não é um autovalor.
Dos resultados do Teorema 8.5.2, sabemos também que o primeiro zero positivo da equação αJn (λb) +
α0 λJn0 (λb) = 0 satisfaz λb > n. Assim, se zero não é um autovalor de (8.1.1), então o menor autovalor
satisfaz λ1 ≥ λ10 /b, onde λ10 é o menor zero positivo de J0 .
Observe que o primeiro autovalor de (8.1.1) com condição de Dirichlet (α
0 = 0) corresponde a n=0 e
λ10 é simples e a primeira autofunção φ1 (x, y) = φ1 (r, θ) = J0 (λ10 r) é não-nula no interior de D.
Em resumo: os valores λ2 tais que o problema (8.1.1) tem solução não-nula pertencem ao conjunto

{λn,k : existe n≥0 tal que αJn (λn,k b) + α0 λJn (λn,k b) = 0}.

149
Cada autovalor tem multiplicidade dois, exceto o primeiro, e as autofunções correspondentes são dadas por

φn,k (r, θ) = Jn (λn,k r) cos nθ e ψn,k (r, θ) = Jn (λn,k r) sen nθ,


onde λn,k αJn (λb)+α0 λJn (λb) = 0. O conjunto de todas essas funções formam
é uma raiz positiva da equação
2 2
uma base ortogonal de L (D). O desenvolvimento de uma função f ∈ L (D) em série de Fourier-Bessel é
dada por uma série dupla


X
f (r, θ) = Jn (λn,k r)[an,k cos nθ + bn,k sen nθ],
n,k=0

com os coecientes de Fourier-Bessel sendo calculados a partir da base ortonormal acima discutida.

Observação 8.6.2. Na tabela abaixo, apresentamos os cinco primeiros zeros λn,k da função de Bessel Jn (x)
quando n = 0, 1, . . . , 5.

k J0 (x) J1 (x) J2 (x) J3 (x) J4 (x) J5 (x)


1 2.4048 3.8317 5.1356 6.3802 7.5883 8.7715
2 5.5201 7.0156 8.4172 9.7610 11.0647 12.3386
3 8.6537 10.1735 11.6198 13.0152 14.3725 15.7002
4 11.7915 13.3237 14.7960 16.2235 17.6160 18.9801
5 14.9309 16.4706 17.9598 19.4094 20.8269 22.2178
Na tabela abaixo, apresentamos os cinco primeiros zeros λ0n,k da derivada da função de Bessel Jn0 (x)
quando n = 0, 1, . . . , 5.

k J00 (x) J10 (x) J20 (x) J30 (x) J40 (x) J50 (x)
1 3.8317 1.8412 3.0542 4.2012 5.3175 6.4156
2 7.0156 5.3314 6.7061 8.0152 9.2824 10.5199
3 10.1735 8.5363 9.9695 11.3459 12.6819 13.9872
4 13.3237 11.7060 13.1704 14.5858 15.9641 17.3128
5 16.4706 14.8636 16.3475 17.7887 19.1960 20.5755
Fonte: https://mathworld.wolfram.com/BesselFunctionZeros.html

Da primeira tabela acima, os primeiros nove zeros de Jn são, aproximadamente, λ0,1 = 2.40, λ1,1 =
3.83, λ2,1 = 5.14, λ0,2 = 5.52, λ3,1 = 6.38, λ1,2 = 7.02, λ4,1 = 7.59, λ2,2 = 8.42. Logo, as autofunções
correspondentes são

λ u(r, θ) = Jn (λn,k r) cos nθ u(r, θ) = Jn (λn,k r) sen nθ

λ0,1 u(r, θ) = J0 (2.40r)

λ1,1 u(r, θ) = J1 (3.83r) cos θ u(r, θ) = J1 (3.83r) sen θ

λ2,1 u(r, θ) = J2 (5.14r) cos 2θ u(r, θ) = J2 (5.14r) sen 2θ

λ0,2 u(r, θ) = J0 (5.52r)

λ3,1 u(r, θ) = J3 (6.38r) cos 3θ u(r, θ) = J3 (6.38r) sen 3θ

λ1,2 u(r, θ) = J1 (7.02r) cos θ u(r, θ) = J1 (7.02r) sen θ

λ4,1 u(r, θ) = J4 (7.59r) cos 4θ u(r, θ) = J4 (7.59r) sen 4θ

λ2,2 u(r, θ) = J2 (8.42r) cos 2θ u(r, θ) = J2 (8.42r) sen 2θ


Nas guras a seguir estão esboçados os grácos dessas funções. No primeiro conjunto, os grácos das que
tem a forma u(r, θ) = Jn (λn,k r) cos θ, chamadas pares, e as outras, chamadas ímpares.

150
(a) u(r, θ) = J0 (λ0,1 r) (c) u(r, θ) = J2 (λ2,1 r) cos 2θ
(b) u(r, θ) = J1 (λ1,1 r) cos θ

(e) u(r, θ) = J3 (λ3,1 r) cos 3θ


(f ) u(r, θ) = J1 (λ1,2 r) cos θ
(d) u(r, θ) = J0 (λ0,2 r)

(g) u(r, θ) = J4 (λ4,1 r) cos 4θ (i) u(r, θ) = J5 (λ5,1 r) cos 5θ


(h) u(r, θ) = J2 (λ2,2 r) cos 2θ

Figura 8.3: As primeiras autofunções pares u(r, θ) = Jn (λn,k r) cos nθ do Laplaciano no disco unitário, com
condição de Dirichlet na fronteira.

151
(b) u(r, θ) = J1 (λ2,1 r) sen 2θ (c) u(r, θ) = J2 (λ2,1 r) sen 2θ
(a) u(r, θ) = J1 (λ1,1 r) sen θ

(e) u(r, θ) = J4 (λ4,1 r) sen 4θ


(d) u(r, θ) = J1 (λ1,2 r) sen θ (f ) u(r, θ) = J2 (λ2,2 r) sen 2θ

Figura 8.4: As primeiras autofunções ímpares u(r, θ) = Jn (λnk r) sen nθ do Laplaciano no disco unitário,
com condição de Dirichlet na fronteira.

152
Capítulo 9

Transformação de Fourier

9.1 Introdução

Vamos primeiro efetuar alguns cálculos para motivar o resultado nal. Suponha que f : (−∞, ∞) → C é
uma função. Para qualquer l > 0, podemos expandir f em série de Fourier no intervalo [−l, l] e queremos
saber o que acontece com essa expansão quando l → ∞. Para isso, vamos escrever a expansão de f : para
x ∈ [−l, l], temos
∞ Z l
1 X
f (x) = cn,l eiπnx/l , cn,l = f (y)e−iπxy/l dy.
2l n=−∞ −l

Seja ∆ξ = π/l e ξn = n∆ξ = nπ/l. Então, essas formulas se tornam

∞ Z l
1 X
f (x) = cn,l eiξn x ∆ξ, cn,l = f (y)e−iξn y dy.
2π n=−∞ −l

Suponhamos que f se anula rapidamente quando x → ±∞. Então, cn,l não muda muito se estendermos
o domínio de integração de [−l, l] para (−∞, ∞):
Z ∞
cn,l ≈ f (y)e−iξn y dy.
−∞

Essa última integral é uma função apenas de ξn , que indicaremos por fˆ(ξn ), e agora temos


1 X ˆ
f (x) ≈ f (ξn )eiξn x ∆ξ (|x| < l).
2π n=−∞

Essa formula se parece muito com uma soma de Riemann. Se zermos l → ∞, temos ∆ξ → 0 e ≈ se
torna = e a soma se transforma numa integral:
Z ∞ Z ∞
1
f (x) = fˆ(ξ)eiξx dξ, onde fˆ(ξ) = f (x)e−iξx dx. (9.1.1)
2π −∞ −∞

Todo essa argumentação com integrais, limites, etc carecem de justicativas, são completamente não-
rigorosos, mas o resultado nal é correto se a função f satiszer certas condições. Esse é o tema central de
nossa discussão e os resultados serão demonstrados no seu devido tempo. A função fˆ é chamada transformada
de Fourier de f e (9.1.1) é chamado Teorema de Inversão de Fourier.
Denição 9.1.1. Se f : (−∞, ∞) → C é uma função absolutamente integrável, a função fˆ : (−∞, ∞) → C
denida por Z ∞
fˆ(ξ) = f (x)e−iξx dx
−∞
é chamada transformada de Fourier de f . Da mesma forma, se g : (−∞, ∞) → C é absolutamente integrável,
a função Z ∞
1
ǧ(x) = g(ξ)eiξx dξ
2π −∞
é chamada transformada inversa de g.

153
Com essas notações, a formula (9.1.1) pode ser escrita como (fˆ)ˇ= f .
O espaço de todas as funções absolutamente integráveis em (−∞, ∞) será indicado por L1 (R):
Z ∞
L1 (R) = {f : |f (x)| dx < ∞}.
−∞

Observe que o espaço L1 (R) não é um subconjunto de L2 (R) nem L2 (R) é um subconjunto de L1 (R). Por
exemplo, sejam

x−2/3 , x−2/3 ,
 
se 0<x<1 se x>1
f (x) = e g(x) =
0, caso contrário 0, caso contrário

Exercício 9.1.1. Verique que f pertence a L1 (R) mas não a L2 (R) e que g pertence a L2 (R) mas não a
L1 (R).

Vamos nesse contexto ampliar o conceito de função contínua por partes de forma a permitir também que
as funções possam ser não limitadas em vizinhanças de um número nito de pontos isolados, com a condição
de que elas sejam absolutamente integráveis em R. Por exemplo, a função f acima denida é contínua por
partes.

Os seguintes resultados serão úteis:

(i) Se f ∈ L1 (R) e f f ∈ L2 (R). De fato,


é limitada, então

Z ∞ Z ∞
|f | ≤ M =⇒ |f |2 ≤ M |f | =⇒ |f (x)|2 dx ≤ M |f (x)| dx < ∞. (9.1.2)
−∞ −∞

(ii) Se f ∈ L2 (R) e f se anula fora de um intervalo limitado [a, b], então f ∈ L1 (R). Isso segue imediata-
mente da Desigualdade de Cauchy-Schwarz:

Z ∞ Z b Z b 1/2
1/2 2
|f (x)| dx = 1 · |f (x)| dx ≤ (b − a) |f (x)| dx < ∞. (9.1.3)
−∞ a a

9.2 O Produto de Convolução

O produto de convolução de duas funções f e g denidas em R é a função f ∗g denida por

Z ∞
(f ∗ g)(x) = f (x − y)g(y) dy, (9.2.1)
−∞

em todos os pontos x para os quais a integral existe. Várias condições para f e g podem impostas para que
a integral seja absolutamente convergente para todo x em R. Por exemplo:

(i) Se f ∈ L1 (R) e g é limitada, então

Z ∞ Z ∞ Z ∞
|f (x − y)g(y)| dy ≤ M |f (x − y)| dy = M |f (y)| dy < ∞.
−∞ −∞ −∞

(ii) Se f é limitada e g ∈ L1 (R), então


Z ∞ Z ∞
|f (x − y)g(y)| dy ≤ M |g(y)| dy < ∞.
−∞ −∞

(iii) Se f e g estão em L2 (R), então pela Desigualdade de Cauchy-Schwarz, temos

Z ∞ Z ∞ 1/2 Z ∞ 1/2
2 2
|f (x − y)g(y)| dy ≤ |f (x − y)| dy |g(y)| dy < ∞.
−∞ −∞ −∞

154
(iv) Se f é contínua por partes e g é limitada e nula fora de um intervalo limitado [a, b], então (f ∗ g)(x)
existe para todo x. Isso decorre imediatamente do fato de que a função y 7→ f (x − y) é limitada em [a, b]
para qualquer x.
(v) Se f e g estão ambas em L1 (R), então (f ∗ g)(x) existe para quase todo x e f ∗g pertence a L1 (R).
Para a demonstração, consultar G. B. Folland [7], Ÿ8.1.

Essa lista não esgota as possibilidades para a existência de f ∗ g. Nas propriedades que seguem, estamos
sempre supondo que a convolução está denida.

Teorema 9.2.1. A convolução satisfaz as propriedades algébricas da multiplicação usual:

(i) f ∗ (ag + bh) = a(f ∗ g) + b(f ∗ h) para quaisquer constantes a e b;


Z ∞ Z ∞
(ii) f ∗ g = g ∗ f , isto é, (f ∗ g)(x) = f (x − y)g(y) dy = f (y)g(x − y) dy = (g ∗ f )(x);
−∞ −∞
(iii) f ∗ (g ∗ h) = (f ∗ g) ∗ h.

Demonstração. (i) é imediata. Para demonstrar (ii), fazemos a mudança de variáveis z = x − y:


Z ∞ Z ∞
(f ∗ g)(x) = f (x − y)g(y) dy = f (z)g(x − z) dz = (g ∗ f )(x).
−∞ −∞

Para demonstrar (iii), trocamos a ordem de integração:

Z ∞ Z ∞Z ∞
(f ∗ g) ∗ h(x) = (f ∗ g)(x − y)h(y) dy = f (z)g(x − y − z)h(y) dz dy
Z−∞
∞ Z ∞
−∞ −∞ Z

= f (z)g(x − z − y)h(y) dy dz = f (z)(g ∗ h)(x − z) dz = f ∗ (g ∗ h)(x).
−∞ −∞ −∞

Teorema 9.2.2. Suponha que f é diferenciável e que as convoluções f ∗ g e f 0 ∗ g estão bem denidas.
Então, f ∗g é diferenciável e (f ∗ g)0 = f 0 ∗ g . Da mesma forma, se g é diferenciável, então (f ∗ g)0 = f ∗ g 0 .

Demonstração. Use a derivação sob o sinal de integral:

Z ∞ Z ∞
0 d
(f ∗ g) (x) = f (x − y)g(y) dy = f 0 (x − y)g(y) dy = (f 0 ∗ g)(x).
dx −∞ −∞

Como f ∗ g = g ∗ f, o mesmo argumento funciona trocando os papeis de f e g. 


Decorre do Teorema 9.2.2 que se uma das funções f ou g é de classe C
∞ e a outra pertence a L1 (R),
então f ∗g é uma função de classe C∞ em R.
Para tentar aclarar o signicado da convolução, vamos supor que f é uma função absolutamente integrável
arbitrária e que
R∞ g também é integrável e nula fora de um intervalo [a, b], com integral não nula. Podemos
supor que
−∞ g(x) dx = 1 (se não for, basta dividir g pelo valor de sua integral e renomeá-la). Então, a
convolução
Z ∞ Z b
(f ∗ g)(x) = f (x − y)g(y) dy = f (x − y)g(y) dy
−∞ a

pode ser aproximada pela soma de Riemann

Z b N
X
f (x − y)g(y) dy ≈ f (x − ȳj )g(ȳj )∆yj (9.2.2)
a j=1

relativa a uma partição P : a = y0 < y1 < y2 < · · · < yN −1 < yN = b do intervalo [a, b] e a uma escolha de
pontos ȳj ∈ [yj−1 , yj ] com norma kP k sucientemente pequena.
Se MP indica a soma de Riemann
N
X
MP = g(ȳj )∆yj
j=1

155
relativa a P e à mesma escolha de ȳj , a soma de Rieman (9.2.2) pode ser escrita como

 
N N N
X 1 X X
f (x − ȳj )g(ȳj )∆yj =  f (x − ȳj )g(ȳj )∆yj  × g(ȳj )∆yj
MP
j=1 j=1 j=1

A soma entre colchetes é a média ponderada dos valores de f nos pontos x − ȳ1 , x − ȳ2 , . . . , x − ȳN −1 ,
x − ȳN com pesos g(ȳ1 )∆y1 , g(ȳ2 )∆y2 , . . . g(ȳN )∆yN e
 
N N N Z b
X 1 X X
lim f (x − ȳj )g(ȳj )∆yj = lim  f (x − ȳj )g(ȳj )∆yj  × g(ȳj )∆yj = f (x − y)g(y) dy.
kP k→0 kP k→0 MP a
j=1 j=1 j=1

Assim, a convolução (f ∗ g)(x) é uma média ponderada dos valores de f numa vizinhança de x com pesos
denidos pela função g. Essas ideias carão mais claras nos exemplos que seguem.

Exemplo 9.2.1. Comecemos com um exemplo simples: seja f = χ[−1,1] a função característica do intervalo
[−1, 1], isto é, a função dada por f (x) = χ[−1,1] (x) = 1 se −1 < x < 1 e igual a 0 em caso contrário. Então,

y y
2
y = f (x) y = (f ∗ f )(x)
1

−1 1 x −2 2 x

f ∗f está bem denida e, usando a mudança de variável y − x = t, temos


Z ∞ Z 1 Z x+1
(f ∗ f )(x) = f (y)f (y − x) dy = f (y − x) dy = f (t) dt
−∞ −1 x−1

para todo x ∈ R. Assim, (f ∗ f )(x) é a área sob o gráco de f entre x−1 e x + 1, que é dada por


 0, se x < −2 ou x > 2
(f ∗ f )(x) = x − 2, se −2≤x≤0
2−x 0 < x ≤ 2.

se

Segue-se então que

Z ∞ Z 1 Z x+1
[(f ∗ f ) ∗ f ](x) = (f ∗ f )(y − x)f (y) dy = (f ∗ f )(y − x) dy = (f ∗ f )(t) dt
−∞ −1 x−1

e 
 0, se x < −3 ou x > 3
 1
 2
2 (x + 3) , se − 3 ≤ x ≤ −1
[(f ∗ f ) ∗ f ](x) =
 3 − x2
 se −1<x≤1
 1 2
2 (x − 3) se 1 ≤ x ≤ 3.

y
3
y

y = f (x) y = [(f ∗ f ) ∗ f ](x)


1

−1 1 x −3 3 x

156
Exemplo 9.2.2. Sejam a>0 e ga denida por

1

2a , se −a<x<a
ga (x) =
0, caso contrário

Se h é uma função contínua por partes qualquer intervalo [a, b], então (h ∗ ga )(x) está denida e, para todo
x ∈ R, temos
Z ∞ Z a Z x+a
1 1
(h ∗ ga )(x) = h(x − y)ga (y) dy = h(x − y) dy = h(t) dt.
−∞ 2a −a 2a x−a

Assim, (h ∗ ga )(x) é o valor médio (ou média) da função h no intervalo [x − a, x + a]. Em particular, h ∗ ga
é contínua em todo R. Se h é contínua num intervalo I, então (h ∗ ga )(x) → h(x) quando a → 0+, para
todo x ∈ I. Esse exemplo mostra que o produto de convolução de duas funções é tão boa ou melhor que as
funções.

y y
y = f (x) y = (f ∗ ga )(x)
1 1

−1 1 x −1 − a a−1 1−a 1+a x

Por exemplo, se f (x) = χ[−1,1] (x) = 1 se x ∈ [−1, 1] e =0 se |x| > 1 e se 0 < a < 1, então (verique!)


 0 se x < −1 − a ou x > 1 + a
x+a  1
Z 
1 2a (x + a + 1) se −1−a≤x≤a−1
(f ∗ ga )(x) = f (t) dt =
2a x−a 
 1 se a−1≤x≤1−a
 1
2a (1 + a − x) se 1−a≤x≤1+a

Exemplo 9.2.3. Considere a função ga f (x) = x − x3 . Então,


do Exemplo 9.2.2 e seja

Z ∞ Z a Z x+a
1 1
(f ∗ ga )(x) = f (x − y)ga (y) dy = f (x − y) dy = (t − t3 ) dt.
−∞ 2a −a 2a x−a

Portanto,
 
1 1 1
(f ∗ ga )(x) = [(x + a)2 − (x − a)2 ] − [(x + a)4 − (x − a)4 ] = (1 − a2 )x − x3 .
2a 2 4

Assim, (f ∗ ga )(x) − f (x) = −a2 x e, portanto, (f ∗ ga )(x) → f (x) quando a → 0+, para todo x. Mais
ainda, a convergência é uniforme em cada intervalo limitado: