Você está na página 1de 229

ANÁLISE FUNCIONAL

para APLICAÇÕES – Posologia

Carlos A. de MOURA

UERJ – Inst. de Mat. e Estatı́stica1


LNCC/MCT2

Editora Ciência Moderna

1 Professor Titular Visitante


2 Pesquisador Titular Aposentado
Obrigado, SANDRA,
tudo como você
teoremas – firmeza
algoritmos – clareza
poemas – beleza
nada sem você

Ao meu pai, JOÃO


(Seu JOCA),
solene motorista,
que tanto soube aprender
no balanço das boléias,
tantas estradas vencendo
ao longo da vida –
também via
de contı́nuo ensinar . . .
Sumário

Notação iv

Prefácio v

I Roteiro 1
I.1 Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . 1
I.2 Convite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

II Os Conceitos Básicos 7
II.1 Espaços Vetoriais Reais:
Notação e Exemplos . . . . . . . . . . . . . . . . . . . . . . . 7
II.2 Norma, Distância . . . . . . . . . . . . . . . . . . . . . . . . . 11
II.3 Produto Interno . . . . . . . . . . . . . . . . . . . . . . . . . . 14
II.4 Convergência . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
II.5 Funções Contı́nuas . . . . . . . . . . . . . . . . . . . . . . . . 20
II.6 Conjuntos Abertos, Fechados, Densos . . . . . . . . . . . . . 21
II.7 As Seqüências de Cauchy . . . . . . . . . . . . . . . . . . . . . 25
II.8 Espaço–quociente . . . . . . . . . . . . . . . . . . . . . . . . . 27
II.9 Completamento de um Espaço Normado . . . . . . . . . . . . 31
II.10 O Princı́pio da Extensão Contı́nua . . . . . . . . . . . . . . . . 35
II.11 Os Operadores Lineares . . . . . . . . . . . . . . . . . . . . . 38
II.12 Os Operadores Invertı́veis . . . . . . . . . . . . . . . . . . . . 45
II.13 Normas Equivalentes . . . . . . . . . . . . . . . . . . . . . . . 48
II.14 A Integral de Lebesgue . . . . . . . . . . . . . . . . . . . . . . 52
II.14.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . 52
II.14.2 Definição, Propriedades, o Espaço L1 (IR) . . . . . . . . 56
II.14.3 Os Conjuntos de Medida Nula . . . . . . . . . . . . . . 58

i
II.14.4 Os Espaços Lp (IR) , 1 < p < ∞ . . . . . . . . . . . . . 61
II.14.5 O Espaço L∞ (IR) . . . . . . . . . . . . . . . . . . . . 64
II.14.6 Teoremas de Convergência . . . . . . . . . . . . . . . . 65
II.14.7 O Teorema de Fubini; Diferenciação × Integração . . 69

III O Dual de um Espaço Normado 73


III.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
III.2 Formas Lineares e Hiperplanos . . . . . . . . . . . . . . . . . . 73
III.3 O Teorema de Representação de Riesz . . . . . . . . . . . . . 76
III.3.1 O Teorema de Representação de Lax–Milgram . . . . . 79
III.4 O Teorema da Projeção . . . . . . . . . . . . . . . . . . . . . 82
III.5 Representação de alguns Duais . . . . . . . . . . . . . . . . . . 87
III.6 O Bidual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
III.7 A Representação de Radon-Nikodym . . . . . . . . . . . . . . 93
III.8 A Terminologia de Dirac . . . . . . . . . . . . . . . . . . . . . 94

IV Espaços de Sobolev, Distribuições 95


IV.1 Introdução e Notação . . . . . . . . . . . . . . . . . . . . . . 95
IV.2 Os Espaços de Sobolev H k (Ω) e H0k (Ω) . . . . . . . . . . . 97
IV.3 Derivada Fraca e Regularização . . . . . . . . . . . . . . . . . 101
IV.4 As Distribuições . . . . . . . . . . . . . . . . . . . . . . . . . 103
IV.5 Funções e Distribuições Vetoriais . . . . . . . . . . . . . . . . 109
IV.6 O Teorema do Traço . . . . . . . . . . . . . . . . . . . . . . . 111
IV.7 Os Espaços de Sobolev de Ordem Real . . . . . . . . . . . . . 113
IV.7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . 113
IV.7.2 Representações da função δ . . . . . . . . . . . . . . 114
IV.7.3 O espaço dual H −1 (0, 1) . . . . . . . . . . . . . . . . 121
IV.7.4 Os espaços H −p , p inteiro . . . . . . . . . . . . . . . 124
IV.7.5 Os espaços H s , s real qualquer . . . . . . . . . . . . 125
IV.8 Transformadas de Fourier e Laplace . . . . . . . . . . . . . . 127
IV.8.1 A Transformada de Fourier de Funções . . . . . . . . . 128
IV.8.2 As Distribuições Temperadas . . . . . . . . . . . . . . 133
IV.8.3 A Transformada de Laplace . . . . . . . . . . . . . . . 136

V Os três Princı́pios Básicos 141


V.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
V.2 O Teorema de Hahn-Banach . . . . . . . . . . . . . . . . . . . 141

ii
V.2.1 Aplicação – Um Problema de Dirichlet . . . . . . . . . 145
V.3 Aplicação Aberta, Gráfico Fechado . . . . . . . . . . . . . . . 152
V.4 A Convergência Fraca . . . . . . . . . . . . . . . . . . . . . . 155
V.5 O Teorema da Limitação Uniforme . . . . . . . . . . . . . . . 157
V.5.1 Uma Aplicação a Esquemas Numéricos . . . . . . . . . 160

VI A Compacidade 165
VI.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
VI.2 A Compacidade em C 0 e em Lp . . . . . . . . . . . . . . . . 166
VI.3 A Convergência Fraco∗ . . . . . . . . . . . . . . . . . . . . . . 169
VI.4 Teoremas de Rellich e de Imersão . . . . . . . . . . . . . . . . 171

VII Bases Hilbertianas e Aproximação 173


VII.1 Ortogonalização . . . . . . . . . . . . . . . . . . . . . . . . 173
VII.2 As Séries de Fourier . . . . . . . . . . . . . . . . . . . . . . . 175
VII.3 Espaços Separáveis, Aproximação . . . . . . . . . . . . . . . 180
VII.3.1 Um Exemplo – os Elementos Finitos . . . . . . . . . 181
VII.4 Compacidade: base de auto-vetores . . . . . . . . . . . . . . 189

VIII A Derivada em Espaços Normados 193


VIII.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
VIII.2 Teoremas do Valor Médio . . . . . . . . . . . . . . . . . . . 197
VIII.3 Derivadas de Ordem Superior . . . . . . . . . . . . . . . . . 199
VIII.4 Métodos Iterativos . . . . . . . . . . . . . . . . . . . . . . . 202

Bibliografia 207

Índice Remissivo 211

iii
Notação

`∞
0 , `

, c , c 0 , `2 , 9
C k [a, b] , C ∞ [a, b] , C0∞ (IR) , 10
S(IR) , 11
kxkp , kxk∞ , 12
kf kp , kf kr,p , 13
δt0 (f ) , 21
B[v0 ; r] , B(v0 ; r) , 22
F (f )(t) , 48
ΨA , 53
L1 (A) , 56
Lp (A) , 61
L∞ (A) , 64
V 0 , V ∗ , 73
D ı , 96
H0k (Ω) , H k (Ω) , 97
D(Ω) , 103
D 0(Ω) , 105
Lp (0, T ; B) , 109
supp, 129
o( h ), 194

iv
PREFÁCIO

Os tópicos rotulados de Análise Funcional – conceitos, definições, resulta-


dos – constituem sólido exemplo de uma estrutura matemática desenvolvida a
partir e com o objetivo de tratar aplicações – problemas originários da Fı́sica,
das Engenharias, mesmo de outras áreas da Matemática. Esta também a fi-
nalidade deste livro: familiarizar o leitor que necessite aplicar tal instrumento
a especı́ficos tópicos de seu interesse, mas que não pretenda nem se proponha
a desenvolver pesquisas nessa teoria. Procure, sim, utilizá-la com segurança
e precisão, fugindo de falaciosos deslizes e equı́vocos a que um contato mais
superficial sempre conduz1 .

Enfatiza-se a motivação, a justificativa, o caminho para a utilização, mas em


grande número de situações não são incluı́das demonstrações, em cada um
desses casos apresentando-se a referência favorita do autor. Demonstrações
completas – ou às vezes apenas seu roteiro – são expostas quando indispensável
seu conhecimento e familiaridade para um uso seguro do resultado a que con-
duzem. Ou também quando indicam uma técnica que, ela mesma, estará
presente nessas mesmas aplicações.

Um fio condutor se detecta na presente exposição: é o contemplar das idéias


do completamento de um espaço métrico e da extensão contı́nua de o-
peradores. Este o instrumento que nos permite, por exemplo, introduzir de
uma forma rápida a integral de Lebesgue, os espaços de Sobolev, e que conduz
à quase ubı́qua técnica de regularização, ou dos mollifiers, na terminologia
predileta de K.O. Friedrichs.

Esta é a terceira versão de [16], redigido para uma escola de curta duração
e que, devido à inexistência de textos com a orientação deste, foi utilizado
posteriormente em vários contextos, até chegar a uma segunda versão [17],
que seguiu o mesmo percurso. O incentivo de muitos colegas que os utilizaram
motivou a aventura desta nova redação, mais cuidadosa e com algumas adições.
1
Daı́ o subtı́tulo – este é um guia para usar a ferramenta, não para aperfeiçoá-la.

v
As versões anteriores não contemplavam aplicações por estarem essas incluı́das
em outros minicursos das escolas para as quais foram redigidas. A presente
versão inclui aplicações adicionais, todas ligadas à Análise Numérica – ele-
mentos finitos, estabilidade para solução aproximada de equações diferenciais.
Também os resultados sobre a integral de Lebesgue estão reunidos, formando
agora um elenco mais completo. As Transformadas de Fourier e de Laplace,
junto com as Distribuições Temperadas, passaram também a compor o rol de
tópicos apresentados.

A perspicácia das observações, tanto matemáticas como relativas à linguagem


e ao caráter da exposição, fruto de cuidadosa leitura prévia do Professor Di-
namérico Pombo, colega do Instituto de Matemática da UFF, foram incentivo
e ajuda inestimáveis.
Ao Professor David Isaacson, do Rensslaer Polytechnic Institute, devo um
diálogo encorajador, que eu sempre trazia de volta à memória ao esmorecer,
ajudando-me a seguir firme nesta empreitada.
Grande parte deste livro foi redigido enquanto o autor era Professor Visitante
dos Institutos de Matemática e de Computação da Universidade Federal Flu-
minense – UFF, aos quais expresso meu agradecimento pelo apoio recebido.
Sua conclusão se deu durante o presente perı́odo de atuação como visitante no
ambiente acolhedor do Instituto de Matemática e Estatı́stica da UERJ, cujo
apoio é um prazer reconhecer.

CONVENÇÕES

A notação utilizada segue o padrão de textos matemáticos, teóricos ou de


aplicações; exceções, descritas ao ser introduzidas, ou nos parágrafos que
seguem. Empregamos as seguintes convenções, todas usuais.

IN : os inteiros positivos
Z/ : os inteiros
IQ : os racionais
IR : os reais
IRN : o espaço euclideano a N dimensões

vi
IC : os complexos

Para dois conjuntos A e B , denotará A\B um terceiro conjunto, o dos


elementos de A que não pertencem a B .

Dados os reais a , b , com −∞ < a ≤ b < ∞ , denotaremos por [a, b]


o intervalo fechado { x ∈ IR ; a ≤ x ≤ b } , enquanto para o intervalo
aberto { x ∈ IR ; a < x < b } usaremos indistintamente ]a, b[ e (a, b) ,
com análoga convenção para os intervalos semi-abertos.

Seqüências serão denotadas por {xn }n∈IN , (xn )n∈IN ou, mais simplesmente,
por {xn } ou (xn ) , eventualmente empregando-se também ı́ndices superiores.
Idêntico abuso de notação para funções: f (x) , f (•) , ou f .

O sı́mbolo := numa dada expressão é utilizado com o significado de que


“o segundo membro” está definindo o que aparece no “primeiro membro”.
Quanto ao sı́mbolo • , para sinalizar o final de algum tópico, seu emprego
foi parcimonioso, aparecendo apenas quando sua ausência criaria dúvidas. Ob-
serve que utilizamos também esse sı́mbolo para indicar qual o argumento de
interesse em determinadas expressões, como f ( • ) , k • k ou outras seme-
lhantes.

Finalmente, é sempre preciso estar atento à notação que, neste texto, per-
mitimos ser “una donna mobile”, com mutações de capı́tulo para capı́tulo, se
conveniente, como por exemplo em:
Z
kf kL2 = kf k0 = kf k2 = kf k0,2 = { f 2 }1/2 ,
Z Z
kf kH 1 = kf k1 = kf k1,2 = { f2 + (f 0 )2 }1/2 .

ITINERÁRIO

Procuramos no Capı́tulo I motivar e, até certo ponto, justificar a teoria desen-


volvida. No Capı́tulo II são introduzidas ou relembradas definições e notações
tanto para espaços abstratos como para especı́ficos espaços de funções. Nisto
necessitamos da Integral de Lebesgue, que desenvolvemos por um caminho

vii
quase geodésico, no caso da reta real, indicando as modificações para o IRN .
O Capı́tulo III estuda as propriedades de duais, espaços indissociavelmente
ligados àqueles espaços introduzidos no Capı́tulo anterior; em particular, as
identificações clássicas – e indispensáveis – para operar com os mesmos. São
eles instrumentos usados no Capı́tulo IV, onde se introduzem as funções ideais,
ou generalizadas, que permitem falar com rigor, por exemplo, da delta de Dirac.
São construı́dos ainda os Espaços de Sobolev e introduzidas as Transformadas
de Fourier e de Laplace.
O que se convencionou chamar de tripé da Análise Funcional Linear compõe o
material do Capı́tulo V, sendo algumas aplicações apresentadas. O Capı́tulo VI
introduz um conceito fundamental para a construção de seqüências de aproxi-
mações à medida que permite garantir sua convergência, em muitas situações.
Até esse ponto, o encadeamento lógico da leitura é linear. Já o Capı́tulo VII,
penúltimo, depende apenas de conceitos dos Capı́tulos II e III, enquanto o
último usa só o que se introduziu no Capı́tulo II. No Capı́tulo VII são apresen-
tados resultados básicos de espaços de Hilbert, fundamentais tanto para apro-
ximações numéricas quanto para aplicações em Fı́sica, v.g. Mecânica Quântica.
(Nesse contexto, a teoria espectral é discutida apenas para operadores com-
pactos, sugerindo-se para o caso geral a consulta a [5, 52]. Estas são também
referências para a teoria dos semigrupos que, apesar de sua importância em
variadas aplicações, ver p.ex. [36], não discutimos.)
O último capı́tulo generaliza o conceito de derivada para funções definidas
em espaços normados. Essa generalização possibilita que nesses espaços se
utilizem algoritmos de aproximação, como o de Newton-Raphson, além de
diferentes métodos de otimização.

Rio de Janeiro, 24 de junho de 2002

P.S.: Contatos poderão ser estabelecidos por intermédio de


demoura@ime.uerj.br e http://ime.uerj.br/~demoura/AFUNCIONAL .

viii
Capı́tulo I

Roteiro

Muitas das aplicações ou resultados teóricos que se baseiam no forma-


lismo matemático fazem uso dos três princı́pios (matematicamente
incorretos) que seguem.

• Princı́pio da “permutabilidade universal”: é indiferente a ordem do


cálculo para combinações de integrais, séries, derivadas ou limites,
sendo invariante o resultado obtido por qualquer dos caminhos que
seja escolhido;
• Princı́pio da “analogia entre ı́ndices discretos e contı́nuos”: pro-
priedades válidas para somatórios permanecem válidas para inte-
grais;
• Princı́pio “da convergência irrestrita”: qualquer seqüência, série
ou integral imprópria que se obtenha em um dado desenvolvimento
teórico é necessariamente convergente, a menos que tenha sido
cometido algum erro na construção do modelo matemático a que
se chegou.1

I.1 Alguns Exemplos


A teoria matemática evolui guiada por duas solicitações que se completam:
uma interna, gerada por questionamentos com origem na estrutura de seus
1
Livre tradução de [21], pp. xi

1
2 CAPÍTULO I. ROTEIRO

próprios conceitos, definições e implicações, enfim, na busca de resultados pu-


ramente matemáticos; a outra, externa, advém das diferentes áreas cientı́ficas
ou tecnológicas que empregam algum arcabouço matemático para seu avanço
teórico ou para simplificações em suas rotinas. E é no contexto dessa utilização
que, inúmeras vezes, têm surgido – como fruto da necessidade de dispor de
entes ou resultados matemáticos ainda inexistentes, ou mesmo equivocada-
mente imaginados – inesperados saltos na teoria.
Por outro lado, ocorre também – e com perigosa freqüência – ou a utilização
equivocada de resultados corretos, ou o emprego de premissas errôneas, como
aquelas citadas, com alguma ironia, no texto acima. As conseqüências decor-
rentes são imprevistas, ou imprevisı́veis – e falsas. E sendo o instrumen-
tal matemático complementado por um acervo computacional cada vez mais
poderoso, chega-se a uma impossibilidade quase completa de avaliação ou ve-
rificação das conclusões obtidas.
Os exemplos que apresentamos a seguir ilustram tópicos que discutiremos ou
motivam tais discussões, indicando também riscos ligados àqueles “princı́pios”.

Exemplo 1 É notoriamente convergente a chamada série harmônica al-


ternada: ∞
X (−1)ı
h = . (I.1)
ı ı=1
Suponhamos que alguém se depare com a série
−1 + 1/2 + 1/4 −1/3 + 1/6 + 1/8 + 1/10 + 1/12 −1/5 + 1/14 + 1/16 + . . .
e observe que seus termos são os mesmos da série harmônica alternada, con-
cluindo, de maneira natural, e aceitável, ser esta uma série que também con-
verge, e para o mesmo limite daquela.
Pergunta-se então: para a soma de “infinitas parcelas” continuam a valer as
propriedades da comutatividade e da asssociatividade que se verificam para
somas com um número finito de parcelas? Em outras palavras: dada uma per-
mutação dos naturais, isto é, uma função biunı́voca e sobrejetora do conjunto
dos naturais sobre si mesmo
τ : IN → IN ,
tem-se necessariamente, para (I.1), que
∞ ∞
X (−1)τ (ı) X (−1)ı
= ?
ı=1 τ (ı) ı=1 ı
I.1. ALGUNS EXEMPLOS 3

A resposta surpreende! Dependendo da permutação τ , tudo pode ocorrer:


a nova série pode divergir, ou pode convergir para qualquer valor na reta (e
mesmo na reta estendida). De uma forma mais explı́cita, dado qualquer real
γ , existe uma permutação dos naturais τ = τγ para a qual

X (−1)τ (ı)
γ = .
ı=1 τ (ı)
Este resultado não se restringe à série harmônica alternada, é válido para qual-
quer série de reais condicionalmente convergente, cf. [44], Teorema 3.55,
onde se encontra uma formulação ainda mais geral.

Exemplo 2 Identifiquemos o plano IR2 com o toro do IR3 , isto é, conside-
remos os pontos (t, y) do quadrado unitário Q := [0, 1[×[0, 1[ associados
aos pontos do plano por meio da identificação
#
t com t + n , n ∈ Z/
.
y com y + m , m ∈ Z/
Tomemos agora a curva Cα,β dada por

Cα,β := {(t, y(t)) , y := α + βt ; −∞ < t < +∞ , 0 ≤ α < 1 , β ∈ IR } ,


no IR2 , pensando na identificação que apresentamos, ou seja, consideremos
essa curva no toro do IR3 .
Se β ∈ IQ , é de fácil verificação que a curva Cα,β é periódica no toro. Por
outro lado, verifica-se também pelo mesmo argumento que, se β 6∈ IQ , então
Cα,β não é periódica. Mais ainda, neste caso, com algum esforço adicional se
deduz que, para todo α ∈ [0, 1) , a curva Cα,β exibe a propriedade seguinte:
qualquer que seja o ponto que se escolha sobre o toro e o grau de proximidade
que se exija, é possı́vel encontrar um ponto sobre essa curva que diste do dado
ponto (sobre o toro) menos que aquela distância arbitrada.
Este exemplo nos mostra como pequenas alterações em determinados parâ-
metros de “entrada” para um dado modelo matemático podem conduzir a al-
terações extremamente fortes nos dados de “saı́da”: passamos de curvas com
um peso pouco significativo no toro para outras que mostram sua presença em
qualquer local sobre ele, ou seja, curvas que “preenchem o toro”.
Enfatizamos a ocorrência desta instabilidade mesmo com um modelo tão sim-
ples, quase poderı́amos dizer linear.
4 CAPÍTULO I. ROTEIRO

Exemplo 3 Em2 1872 Weierstrass causou um choque na comunidade ma-


temática ao exibir uma função contı́nua em todo seu domı́nio – a reta real
– mas que não tem derivada em ponto algum. É o que ocorre, por exemplo,
com a função definida, cf. [8, 50], como o limite da série uniformemente
convergente de funções infinitamente deriváveis

X cos(3ı x)
f (x) = .
ı=0 2ı
Nos anos 30 Paul Dirac, ao pesquisar os fundamentos matemáticos de um mo-
delo para a mecânica de partı́culas atômicas, precisou introduzir uma função
que necessitava satisfazer ao mesmo tempo as condições
#
δ(x) = 0
R
∀ x 6= 0
, (I.2)
IR δ(x) f (x) dx = f (0) ∀ f ∈ F

onde F denota um conjunto de funções convenientemente escolhido, cf. [20].


Desde que em (I.2) tenhamos ou integrais de Riemann ou de Lebesgue, ne-
nhuma função tradicional pode satisfazer ambas as condições. Apesar disso
os fı́sicos durante muito tempo seguiram utilizando (com sucesso) este ente
matemático sem que suas bases matemáticas estivessem ainda estruturadas.
Apesar do desconforto dos matemáticos, esse instrumental permaneceu sendo
usado antes da formalização, permitindo resultados teóricos que eram justifi-
cados experimentalmente. Difundiu-se a terminologia de função δ de Dirac,
ou simplesmente -função δ.
Foi Laurent Schwartz, juntamente com outros matemáticos, de forma indepen-
dente, que desfez o impasse introduzindo a teoria das distribuições , ou funções
generalizadas. As distribuições possuem um comportamento bem diferente re-
lativamente ao processo de limites. Por exemplo, se uma distribuição T é a
soma de uma dada série X
T = Tı , (I.3)
ı
uma derivada arbitrária de T – que existe sempre – pode ser obtida por meio
da diferenciação termo-a-termo de (I.3), ou seja,
X
T [n] = Tı[n] .
ı
2
Livre tradução de [6], pp. 208, 216
I.1. ALGUNS EXEMPLOS 5

Compare este comportamento com o da função de Weierstrass.


Exemplo 4 Seja x0 um racional positivo, 0 < x0 ∈ IQ , e a ele associemos a
seqüência de racionais (xn )n∈IN definida por
1 xn
xn+1 := + , n≥0 .
xn 2
Uma análise da função φ(x) := 1/x + x/2 e da sua derivada indica
que diferentes racionais positivos x0 para os quais x20 < 2 conduzem a
diferentes seqüências e, para todas essas, se verifica que, sendo n ≥ 1 ,

0 < xn ∈ IQ , x2n > 2

xn+1 < xn  . (I.4)
2
se xn > β ∀ n, então β ≤ 2

Em outras palavras, criamos seqüências estritamente decrescentes de racionais


positivos. Mais que isso, seqüências sujeitas à limitação inferior expressa na
última relação em (I.4).
Observe: se qualquer dessas seqüências convergir, seu limite ζ deve satisfazer
1 ζ
ζ = +
ζ 2
e, portanto,
ζ2 = 2 , (I.5)
o que inibe ser este limite um número racional.
Sendo decrescentes e limitadas inferiormente as seqüências (xn )n∈IN , deduz-se
que qualquer delas é uma seqüência de Cauchy. Este fato se pode demonstrar
diretamente, com o auxı́lio da série geométrica. É possı́vel ainda verificar
que dadas duas dessas seqüências, (xn )n∈IN e (x̃n )n∈IN , arbitrariamente
escolhidas, tem-se que
lim |xı − x̃ı | = 0 . (I.6)
ı→∞

As seqüências (xn )n∈IN que construı́mos podem ser identificadas entre si,
e identificadas ainda ao número ζ , inexistente entre os racionais e para o
qual é válida (I.5). Esta identificação deve incluir ainda todas as seqüências de
Cauchy (x̃n )n∈IN que satisfizerem (I.6) para pelo menos uma das seqüências
(xn )n∈IN que construı́mos, e portanto para todas elas.
É este um dos caminhos utilizados para introduzir a reta real: incorporar os
6 CAPÍTULO I. ROTEIRO

irracionais por meio do “completamento” do conjunto dos racionais, criando


um conjunto onde todas as seqüências de Cauchy são convergentes.

I.2 Convite

A construção apresentada no Exemplo 4 da seção anterior vai ser muitas vezes


seguida ao longo do presente texto, em diferentes contextos, mais gerais que
aquele dos racionais, mas por ele inspiradas. É uma alternativa que permite
concluir algumas construções de modo extremamente rápido e elegante, sem-
pre complementadas com o importante Princı́pio da Extensão Contı́nua,
descrito no capı́tulo que segue.

Em três dos exemplos acima, buscamos sempre identificar diferentes conceitos


ou entes matemáticos. Uma importante face da pesquisa matemática é justa-
mente a busca, em meio a diferentes estruturas, daquela que permite identi-
ficar entes, conceitos, propriedades aparentemente dı́spares. Podemos mesmo
dizer que a matemática tem por objetivo central encontrar propriedades que
lhe permitam associar, identificar conceitos supostos distantes ou desconexos.
E com o termo identificação estamos incluindo também a aproximação, quando
se intercambiam entes sabidamente distintos.
Observemos que o conceito de aproximar subentende diferentes maneiras de
medir distâncias, mas deve ser enfatizado que não basta a proximidade avaliada
quantitativamente, com o padrão escolhido: pode ser indispensável que se pre-
servem ainda determinadas propriedades, para o que é preciso uma avaliação
qualitativa. O que temos em mente são aspectos como leis (de conservação, de
decaimento, p.ex.), ou perfis (monotonicidade, limitações, regularidade).

Referir-se a estruturas matemáticas equivale a mencionar funções, e são esses


os entes que estudamos, dissecamos, agrupamos, aproximamos, enfim, anali-
samos. Esmiucemos portanto os caminhos da Análise Funcional.
Capı́tulo II

Os Conceitos Básicos

Com o objetivo de fixar a terminologia e a notação que estaremos usando,


recordamos alguns conceitos da Álgebra Linear com os quais esperamos seja o
leitor familiar. Apresentaremos uns quantos exemplos, utilizados não apenas
para ilustrar as definições e resultados expostos, mas também por seu interesse
per se em diferentes aplicações. Chamamos a atenção do leitor para o fato de
serem os Exercı́cios uma parte essencial do texto; mesmo não os resolvendo,
é importante sua leitura, indispensável a meditação sobre os enunciados, pois
muitos deles serão mencionados e empregados mais adiante.

II.1 Espaços Vetoriais Reais:


Notação e Exemplos
Recordemos que um espaço vetorial real é um conjunto V qualquer, com
cujos elementos se pode operar da mesma maneira que operamos com os ve-
tores do espaço a três dimensões, isto é, onde temos uma soma e um produto
por escalar que satisfazem às seguintes condições.

i) Dados quaisquer elementos v1 , v2 de V , sua soma é outro elemento de


V , único, denotado por v1 + v2 , e valem:

a) v1 + v2 = v2 + v1 ;
b) (v1 + v2 ) + v3 = v1 + (v2 + v3 ) ;

7
8 CAPÍTULO II. OS CONCEITOS BÁSICOS

c) existe um elemento, denotado por 0 , chamado zero, tal que, para


todo v em V ,

v+0=v ;

d) dado v em V, arbitrário, existe outro elemento, dito simétrico de


v e denotado por −v , que satisfaz

v + −v = 0 .

ii) Dados um real α e um elemento v ∈ V, a eles está associado


um (também único) elemento de V , o produto de α por v , deno-
tado αv , de tal modo que, sendo αı ∈ IR e vı ∈ V , arbitrários, tem-se:

a) α(v1 + v2 ) = αv1 + αv2 ; c) (α1 α2 )v = α1 (α2 v) ;

b) (α1 + α2 )v = α1 v + α2 v ; d) 1v = v .
Concluı́mos a partir destas propriedades que:

0v = 0,

( − α)v = − ( αv) .
Observe que o sinal “ − ” e o sı́mbolo “ 0 ” possuem significados distintos
no primeiro e no segundo membro das duas igualdades acima. Tem-se
também que
α0 = 0
e que tanto o zero como o simétrico de um dado elemento v são únicos.
Mais ainda:
αv = 0 ⇐⇒ α = 0 ou v = 0 ,
o que equivale a

αv = βv ⇐⇒ α = β ou v = 0 .

Os elementos de V são chamados vetores, o zero é o vetor nulo do espaço,


as operações introduzidas são chamadas de soma de vetores e produto de
um real por um vetor.
II.1. ESPAÇOS VETORIAIS REAIS: NOTAÇÃO E EXEMPLOS 9

Exemplo 1 O conjunto das N-uplas de reais

x = (x1 , . . . , xN ) , xı ∈ IR ,

com as operações definidas componente–a–componente (como nos casos fa-


miliares com N = 2, 3) é denotado por IRN .

Exemplo 2 Uma generalização do Exemplo 1 é obtida quando consideramos


conjuntos de seqüências de reais x = (x1 , x2 , . . .) = (x )∈IN , com diferentes
restrições, introduzindo as operações também componente–a–componente:

x + y = (xı )ı∈IN + (yı )ı∈IN := (xı + yı )ı∈IN ,

α x = α (xı )ı∈IN := (αxı )ı∈IN .


a) `∞
0 := o conjunto das seqüências quase nulas, isto é,
"
existe N = N(x) para o qual
x∈ `∞
0 ⇐⇒
xı = 0 se ı > N .

b) `∞ := {x = (xı )ı∈IN ; |xı | ≤ M = M(x)} , o conjunto das seqüências


limitadas;
(Observe: a cada seqüência se associa um diferente limitante!)

c) c := o conjunto das seqüências convergentes;

d) c0 := o conjunto das seqüências cujo limite é nulo;

e) `2 := o conjunto das seqüências de quadrado somável, ou seja, das


seqüências

X
x = (xı )ı∈IN para as quais |xı |2 < ∞ ;
ı=1

Verifica-se que
`∞ 2
0 ⊂ ` ⊂ c0 ⊂ c ⊂ `

,
sendo cada espaço contido propriamente no seguinte da lista.
10 CAPÍTULO II. OS CONCEITOS BÁSICOS

Exemplo 3 Denotamos por PN o conjunto de todos os polinômios de


grau < N , sendo para dois elementos p(x), q(x) ∈ PN a soma vetorial
definida como a soma usual de dois polinômios: se

X
N −1
p(x) = a x ,
=0

X
N −1
q(x) = b x ,
=0

então
X
N −1
(p + q)(x) := p(x) + q(x) = (a + b )x .
=0

Da mesma forma, para um real α ,


P −1
(αp)(x) := αp(x) = N 
=0 α a x . •

Em todos os exemplos de espaços de funções que consideramos a seguir, as


operações de soma e produto por escalar serão sempre tomadas ponto a ponto,
isto é,
(f1 + f2 )(x) := f1 (x) + f2 (x) ,
(α f )(x) := α[f (x)] .
Exemplo 4

a) Considere o conjunto das funções reais contı́nuas definidas em [0,1] ,


denotado comumente por C 0 [0, 1] . Em geral podemos tomar também
C k [0, 1] , k ≥ 1 , o conjunto das funções definidas em [0,1] cujas
derivadas até a ordem k existem e são contı́nuas. É usual a notação

\

C [0, 1] := C k [0, 1] .
k=0

As funções deste espaço são ditas infinitamente deriváveis.

b) Tomemos as funções reais definidas em toda a reta, infinitamente de-


riváveis, que se anulam fora de um intervalo finito (que varia com cada
função !). O conjunto de tais funções é denotado por C0∞ (IR) .
II.2. NORMA, DISTÂNCIA 11

Exercı́cio 1 Verifique ser um elemento de C0∞ (IR) a chamada função-sino:


"
exp[ x21−1 ] , |x| < 1 1/e 6
φ(x) := .
0 , |x| ≥ 1 φ
-
−1 0 1 x

c) Considere agora as funções reais φ(x) infinitamente deriváveis, definidas


na reta e que satisfazem:

dk φ(x)
p
M(φ, k, p) := max x < ∞ (II.1)
x∈IR dx
k

para quaisquer k, p ≥ 0 inteiros. Tais funções são ditas rapidamente


decrescentes. O conjunto dessas funções com uma apropriada noção
de convergência é denotado por S(IR) e conhecido como o espaço de
Schwartz. A ele voltaremos repetidas vezes.

Exercı́cio 2 Verifique que se


2
ψ(x) := exp−x

então ψ(x) e ψ (p(x)) pertencem a S(IR) , para um polinômio p não


constante arbitrário.

II.2 Norma, Distância


A grosso modo, a Análise Funcional estuda espaços vetoriais onde sabemos
medir distâncias. Essencialmente o objetivo da Análise Numérica é aproxi-
mar elementos em que estamos interessados por outros, mais acessı́veis, mas
sempre de uma forma tal que tenhamos um controle do que tal substituição
está provocando, isto é, do erro que estamos cometendo.
Diz-se que uma função não–negativa, definida em um espaço vetorial real V ,

n : V → IR+
é uma norma se valem
12 CAPÍTULO II. OS CONCEITOS BÁSICOS

i) n(x + y) ≤ n(x) + n(y) ∀x, y ∈ V ;

ii) n(αx) = |α|n(x) ∀α real, ∀x ∈ V ;

iii) n(x) = 0 ⇒ x=0.


É comum usarmos kxk em lugar de n(x) .
Esta noção generaliza a de módulo de um vetor no espaço a três dimensões.
Ela é interpretada como a distância do vetor x ao vetor 0 , isto é, à origem,
de forma que a distância entre dois vetores x e y é dada por kx − yk . A
propriedade i) é chamada de desigualdade do triângulo devido a sua inter-
pretação geométrica.

É claro que num mesmo espaço vetorial podemos ter diferentes normas. Ve-
remos que certas propriedades (ditas topológicas) de um tal espaço podem
variar ou não, dependendo da norma que escolhermos.

Exemplo 1 Em IRN , considere as três normas seguintes:


X
N
kxk1 := |x | , (II.2)
=1
v
uN
uX
kxk2 := t |x |2 , (II.3)
=1

kxk∞ := max |x | . (II.4)


1≤x≤N

Exercı́cio 3 Tome N = 2 e desenhe os cı́rculos unitários, com cada uma


dessas normas, isto é, obtenha o gráfico de

{x ∈ IR2 ; kxkp ≤ 1} , com p = 1, 2, ∞ .

Exemplo 2 Em `∞ ,
kxk∞ := sup |x | (II.5)
∈IN

define uma norma. Em `2 , podemos considerar, além da norma (II.5),


v
uX
u∞
kxk2 := t |x |2 . (II.6)
=1
II.2. NORMA, DISTÂNCIA 13

E em `∞
0 , podemos tomar, aém dessas duas, uma terceira norma, qual seja:


X
kxk1 := |x | .
=1

Exemplo 3 Em PN podemos considerar a norma

kpk := max |p(x)|


a≤x≤b

onde [a, b] é um intervalo fixo arbitrário (com a < b ).

Exemplo 4 Em C k [0, 1] são exemplos de normas


Z 1
kf k1 := |f (x)|dx ,
0
s
Z 1
kf k2 := |f (x)|2 dx , (II.7)
0

kf k∞ := max |f (x)| ,
a≤x≤b

ou, mais geralmente, se 0 ≤ r ≤ k ,


X
r
kf kr,1 := kd f /dx k1 ,
=0
v
uX
u r
kf kr,2 := t (kd f /dx k2 )2 , (II.8)
=0

kf kr,∞ := max kd f /dx k∞ .


0≤≤r

Observe que, dada uma seqüência y = (yn ) ∈ `2 , se definirmos a função


seccionalmente constante fy em [0, ∞[ por

fy (x) := yn , n≤x<n+1, n = 0, 1, . . .

são válidas as igualdades



X
kfy k22 = |yn |2 = kyk22 ,
n=0
14 CAPÍTULO II. OS CONCEITOS BÁSICOS

o que até certo ponto justifica usarmos a mesma notação para estas normas
em diferentes espaços.
A única dificuldade na demonstração de que as definições acima efetivamente
conduzem a normas é a verificação da desigualdade do triângulo no caso das
normas k•k2 . Tal demonstração se torna evidente se fizermos uso de conceitos
introduzidos na próxima seção.

II.3 Produto Interno


No espaço IR3 é familiar o conceito de produto interno de dois vetores:
é o número que dá o comprimento da projeção de um vetor sobre o outro,
multiplicado pelo módulo deste e afetado do sinal do co–seno do ângulo entre
os dois. Dado um espaço vetorial arbitrário, uma função real

p : V ×V → IR
(x, y) → p(x, y)

é dita um produto interno se satisfaz, para quaisquer x, y, z ∈ V e qualquer


λ ∈ IR as propriedades1 :
"
i)p(x, x) ≥ 0
positividade
p(x, x) = 0 ⇒ x=0
simetria " ii) p(x, y) = p(y, x) .
iii) p(x + y, z) = p(x, z) + p(y, z)
bilinearidade
iv) p(λx, y) = λp(x, y)

Notações usuais para um produto interno são < x, y > , < x|y > , (x, y) ,
(x|y) , ou ainda x•y . Em geral utilizaremos a notação (x|y) , mas nos
reservaremos o direito ao emprego eventual de qualquer das outras três.

Dado um produto interno, a partir dele podemos introduzir uma norma. De


fato, a interpretação geométrica de produto interno acima descrita justifica
definir q
kxk := (x|x) . (II.9)
1
Note que, valendo a simetria, a linearidade em relação a uma variável implica que o
mesmo se verifica para a outra, donde a bilinearidade.
II.3. PRODUTO INTERNO 15

Para verificar a desigualdade do triângulo, necessitamos demonstrar a chama-


da desigualdade de Cauchy–Buniakowski–Schwarz:

| (x|y) | ≤ (x|x)1/2 (y|y)1/2 . (II.10)

Uma vez demonstrada (II.10), deduz-se

(x + y|x + y) = (x|x) + 2(x|y) + (y|y)


≤ (x|x) + 2(x|x)1/2 (y|y)1/2 + (y|y)
h i2
= (x|x)1/2 + (y|y)1/2 ,

o que mostra ser efetivamente k•k , conforme introduzida em (II.9), uma


norma.
Demonstremos (II.10). Sendo t real arbitrário, para quaisquer x e y em
V se verifica a desigualdade

(x + ty|x + ty) ≥ 0 .

Desenvolvendo-a, vem:

0 ≤ (y|y)t2 + 2(x|y)t + (x|x) .

Da positividade do trinômio segue

4(x|y)2 − 4(y|y)(x|x) ≤ 0 ,

ou
|(x|y)| ≤ (x|x)1/2 (y|y)1/2 .
Exercı́cio 4 Verifique que as normas introduzidas acima com um ı́ndice 2,
respectivamente (II.3), (II.6), (II.7) e (II.8), são todas provenientes de um pro-
duto interno. •

Um espaço munido de produto interno é dito euclidiano. Observe que nem


toda norma provém de um produto interno. Aquelas dadas por um produto
interno são, com relação a vários conceitos, as mais convenientes, pois a geome-
tria dos espaços euclidianos é essencialmente a mesma do IR3 , não “per-
mitindo” seres disformes como as bolas descritas no Exercı́cio 3 acima.
16 CAPÍTULO II. OS CONCEITOS BÁSICOS

Exercı́cio 5 Verifique que, num espaço euclidiano, para v, w arbitrários,


vale
kv + wk2 + kv − wk2 = 2kvk2 + 2kwk2 . (II.11)
A interpretação geométrica desta identidade justifica chamá-la de regra do
paralelogramo2 .

II.4 Convergência
Diz-se que uma seqüência (xn )n∈IN de elementos de V é convergente se,
para algum x ∈ V , se tem

lim kxn − xk = 0 . (II.12)


n→∞

Um tal x é dito ser limite da seqüência (xn )n∈IN , e a desigualdade do


triângulo implica ser este limite único. Diremos também que (xn ) aproxima
x , ou que x é aproximado pela seqüência (xn ) .
As operações com limite a que estamos habituados no caso de números reais
continuam sendo válidas em V . Supondo que limn xn = x , tem-se:

a. limn αn = α =⇒ limn αn xn = αx (∀α ∈ IR)

b. limn yn = y =⇒ limn (xn + yn ) = x + y  . (II.13)
c. limn yn = y =⇒ limn (xn |yn ) = (x|y)

Esta é uma das noções de convergência com que vamos lidar. É a chamada
convergência forte ou convergência em norma. A convergência (ou não)
de uma dada seqüência depende não só da própria seqüência mas também da
norma utilizada.

Exercı́cio 6 Verifique que, com qualquer das normas introduzidas acima


N
para o IR , via relações (II.2) a (II.4), tem-se

kxn − xk → 0 ⇐⇒ xn − x → 0 ,

sendo xn e x ,  = 1, . . . , N , as componentes de xn e x , respectivamente.

2
Demonstra-se que, se (II.11) é válida em um espaço normado V , para quaisquer vetores
v , w , a norma em V provém de algum produto interno.
II.4. CONVERGÊNCIA 17

Exercı́cio 7 Uma seqüência

(fn )n∈IN em C 0 [0, 1]

converge para
f ∈ C 0 [0, 1]
no sentido da norma k•k∞ se e só se

fn → f

uniformemente.
(Diz-se que a norma k•k∞ é a norma da convergência uniforme.)

Exercı́cio 8

a) A seqüência (fn )n∈IN de C 0 [0, 1] definida por

6
1– fn
D
D
 D 
 D nx 0 ≤ x ≤ 1/n
 D 
fn (x) :=  2 − nx 1/n ≤ x ≤ 2/n
 D
 D 0 2/n ≤ x ≤ 1
 D
 D
 D -
1/n 2/n

converge para f ≡ 0 no sentido da norma k•k2 , ou seja, da média


quadrática, mas não no sentido da norma k•k∞ .

b) A situação reversa à de a) é impossı́vel, pois se kfn − f k∞ → 0 , temos


necessariamente kfn − f k2 → 0 .
(Precisamos do fato de ser o domı́nio das fn limitado!)
Exercı́cio 9 Em C 0 (IR) podemos considerar tanto a norma k•k∞ , como
k•k2 . Seja φ(x) a função–sino descrita no Exercı́cio 1 e seja a seqüência
φ(x/n2 )
ψn (x) := .
n
18 CAPÍTULO II. OS CONCEITOS BÁSICOS

Verifique que
kψn k∞ → 0 mas kψn k2 não tende a 0. •

Como já dissemos, em última análise nosso objetivo é o de aproximar fun-


ções, ou seja, construir seqüências que convirjam para uma dada função. Mas
a noção de convergência varia com a norma no espaço de funções que consi-
deramos. Uma pergunta natural é: como se comparam estas noções de con-
vergência com aquela mais familiar, a de convergência pontual?
Recordamos que, sendo X um conjunto arbitrário e

φn : X → IR , n = 1, 2, . . . ,

funções quaisquer, diz-se que φn converge pontualmente para φ em X se

lim φn (x) = φ(x) ∀x ∈ X .


n

É importante mencionar que esta definição continua fazendo sentido se as


funções φn assumirem valores num espaço normado V .

Conforme observado acima, a convergência em C 0 [0, 1] com a norma k•k∞


é equivalente à convergência uniforme, implicando portanto convergência pon-
tual e em média quadrática. Por outro lado, convergência em média quadrática
não implica convergência pontual, nem esta implica naquela. É o que mostram
os dois exemplos que seguem.

Exemplo 1 Considere

2x x ∈ [0, 1/2]

h(x) :=  2(1 − x) x ∈ [1/2, 1]
0 x 6∈ [0, 1]

e
hn (x) := h(2kn x − mn ),

onde #
kn := max`∈IN {2` ≤ n}
.
mn := n − 2kn
II.4. CONVERGÊNCIA 19

6 6 6 6 6
1– h1 1– h2 1– h3 1– h4 1– h5 ...
D D D D D
 D  D  D  D  D
 D  D  D  D  D
 D  D  D  D  D
 D  D  D  D  D
 D  D  D  D  D
 D  D  D  D  D
 D  D  D  D  D
 D  D  D  D  D
 D -  D -  D -  D -  D -
1/2 1 1/4 1/2 1/2 1 1/8 1/4 1/4 1/2

Para uma infinidade de pontos da forma 2ı+1 /2N , com ı = 0, 1, . . . , N − 2,


as funções hn assumem valores que se alternam, ou são 0 ou 1. Portanto,
não se verifica
R 2
a convergência pontual dessa seqüência. Mas o cálculo das in-
tegrais hn demonstra a convergência de (hn ) para a função 0 , em média
quadrática.

Exemplo 2 Tome a seqüência

6
n– gn
D 
 D n2 x 0 ≤ x ≤ 1/n
 D 
gn (x) :=  (2 − nx)x 1/n ≤ x ≤ 2/n .
 D
 D 0 2/n ≤ x ≤ 1
 D
 D
 D
 D
 D -
1/n 2/n

Esta seqüência converge pontualmente para a função nula em [0,1] mas se


R
verifica que gn2 não converge para zero.

Exemplo 3 Já em C 1 [0, 1] , convergência na norma k•k1,2 implica con-


vergência na norma k•k∞ . De fato, para f ∈ C 1 [0, 1] , tem-se

Z 1
|f (s)|ds = |f (x0 )|
0
20 CAPÍTULO II. OS CONCEITOS BÁSICOS

para algum x0 ∈ [0, 1] . Como, para x arbitrário em [0, 1] , vale


Z x
f (x) − f (x0 ) = f 0 (s)ds ,
x0

segue que Z Z
1 1
|f (x)| ≤ |f (s)|ds + |f 0 (s)|ds .
0 0
Usando a desigualdade de Schwarz (de fato, de CBS, relação (II.10)),
Z 1
| φ(x)ψ(x)dx| ≤ kφk2 kψk2
0

com ψ := 1 e φ := f ou f 0 , vem
|f (t)| ≤ kf k2 + kf 0 k2 .
Portanto, temos
kf k2∞ ≤ kf k22 + kf 0 k22 + 2kf k2 kf 0 k2
(II.14)
≤ 2{kf k22 + kf 0 k22 } = 2kf k21,2 ,

pois 2|ab| ≤ a2 + b2 .

II.5 Funções Contı́nuas


Dados dois espaços normados V , W e uma função
φ :V → W ,
diz-se que φ é contı́nua se, para toda seqüência convergente (vn ) em V ,
se verifica necessariamente que
lim φ(vn ) = φ( lim vn ) .
n→∞ n→∞

Exemplo

a) São contı́nuas as n projeções


#
δ : IRn → IR,
1≤x≤n
x = (x1 , . . . , xn ) → δ (x) := x , 1 ≤ x ≤ n
independentemente da norma considerada em IRn ;
II.6. CONJUNTOS ABERTOS, FECHADOS, DENSOS 21

b) Para 0 ≤ t0 ≤ 1 ,

δt0 : C 0 [0, 1] → IR
f → δt0 (f ) := f (t0 )

é contı́nua relativamente a k•k∞ mas não o é se tomarmos k•k2 ;

c) Dado um espaço euclidiano V e um vetor fixo w ,

φw : V → IR ,
v → φw (v) := (v|w)

é sempre contı́nua (relativamente à norma associada a este produto in-


terno!), como conseqüência da desigualdade (II.10);

d) Também é contı́nua
#
φ : C 0 [0, 1] → C 0 [0, 1]
R ,
f → [φ(f )](t) := 0t G(s, f (s))ds

para G ∈ C 1 (IR2 ) e relativamente a k•k∞ . •


É de imediata verificação que:
i) φ1 , φ2 : V → W contı́nuas ⇒ φ1 + φ2 contı́nua,

ii) α ∈ IR , φ : V → W contı́nua ⇒ αφ contı́nua.


O conceito de continuidade não necessita ser introduzido apenas para funções
definidas em todo o espaço, como acima: o domı́nio pode ser um subconjunto
arbitrário de V . De fato, a formulação apresentada exige apenas que se possa
falar na convergência de seqüências, exigindo-se portanto apenas a noção de
distância.

II.6 Conjuntos Abertos, Fechados, Densos


Diz-se que um subconjunto F de um espaço normado V é fechado se o limite de
qualquer seqüência convergente (vn ) de elementos de F está necessariamente
em F . Em outras palavras, os elementos de F só podem aproximar elementos
do próprio F .
22 CAPÍTULO II. OS CONCEITOS BÁSICOS

Dados v0 ∈ V e r > 0 , a bola fechada de centro em v0 e raio r é o


conjunto
B[v0 ; r] := { v ∈ V ; kv − v0 k ≤ r } .
É conseqüência da desigualdade do triângulo que B[v0 ; r ] é sempre um con-
junto fechado.

Exercı́cio 10

a) Verifique que em C 0 [0, 1] o conjunto {f ; |f (t)| ≤ 1 , 0 ≤ t ≤ 1 } é


fechado relativamente à norma k•k2 .

b) Verifique que {x ∈ `2 ; |xı | ≤ 1/ı} é fechado em `2 relativamente à


norma k•k2 .
(Este conjunto é conhecido como o cubo de Hilbert.) •

Dado X ⊂ V , consideramos o conjunto de todos os elementos de V que


podem ser aproximados por vetores de X . Este conjunto é chamado de
fecho de X e denotado por X . Em outras palavras, x ∈ X se e só se x for
limite de alguma seqüência (xn ) com xn ∈ X .

Exercı́cio 11 Verifique que, para v0 ∈ X, r > 0, B[v0 ; r] é o fecho de


B(v0 ; r) := {v ∈ V ; kv − vo k < r }. •

Denomina-se este último conjunto de bola aberta de centro em v0 e raio r .


Um conjunto X ⊂ V é dito aberto se seu complementar é fechado, ou seja,
se seus elementos só podem ser aproximados por vetores que estejam em X .
Uma outra caracterização é dada pelo

Exercı́cio 12. Um conjunto X ⊂ V é aberto se e só se, para todo x0 ∈ X ,


existe uma bola aberta de centro em x0 inteiramente contida em X . Verifica-
se que B(v0 ; r) é sempre aberta, para qualquer r > 0 e todo v0 ∈ V . •

Diz-se que X ⊂ V é denso (em V ) se X = V , isto é, se todo elemento


de V pode ser aproximado por elementos de X .

Exercı́cio 13 Verifique que `∞


0 é denso em `2 com a norma k•k2 e
em c0 (com a norma k•k∞ ), mas não é denso em c ou em `∞ .
II.6. CONJUNTOS ABERTOS, FECHADOS, DENSOS 23

Exercı́cio 14 É C0∞ (IR) denso em S(IR) com a norma k•k∞ ? E com a


norma k•k2 ?

Um exemplo importante de um conjunto denso em C 0 [0, 1] é o espaço de


todos os polinômios, quer tomemos k•k∞ ou k•k2 . No primeiro caso, este é
precisamente o conteúdo do Teorema de Aproximação de Weierstrass ([44],
pp.146). A segunda afirmação é conseqüência daquele resultado.

Exercı́cio 15 Verifique que o conjunto dos polinômios a coeficientes racionais


também é denso em C 0 [0, 1] , na norma da convergência uniforme. E em L2 ?

Em certas situações, dispor de alguns dados sobre conjuntos densos é equi-


valente a dispor de tais dados sobre todo o espaço. Por exemplo, suponha que
g ∈ C 0 [0, 1] é tal que
Z 1
xr g(x)dx = 0 (II.15)
0

para r = 0, 1, . . . ; será que se pode dizer que


Z 1
f (x)g(x)dx = 0 (II.16)
0

para f ∈ C 0 [0, 1] arbitrária?


Ora, de (II.15) segue que (II.16) é válida se f é um polinômio. Sendo o
funcional Z 1
f → f (x)g(x)dx
0

contı́nuo com respeito à norma k•k ∞ , e tomando-se uma seqüência de poli-


nômios (pn ) que aproxima f , também no sentido dessa norma, conclui-se
que (II.16) é válida para toda f ∈ C 0 [0, 1] .

Exercı́cio 16 Conclua que g ≡ 0 . •

Da mesma forma, dada g : IR → IR , se sabemos que g é contı́nua e


se anula nos racionais, podemos concluir que g ≡ 0 .

Na realidade estes dois exemplos ilustram uma situação geral: uma função
contı́nua f : V → W é caracterizada pelos seus valores em qualquer
24 CAPÍTULO II. OS CONCEITOS BÁSICOS

conjunto X denso em V . Ou seja,



f1 , f2 : V → W contı́nuas

f1 (x) = f2 (x) , ∀x ∈ X  =⇒ f1 ≡ f2 .
X denso em V

Este resultado sugere uma outra pergunta: suponhamos que f está definida
(e é contı́nua) em X que é denso em V . Será que f pode ser estendida
continuamente a todo V , isto é, será que existe

F :V →W

contı́nua e tal que

F (x) = f (x) para todo x∈X?

Já sabemos que se tal F existir, ela é única. Neste caso dizemos que F é a
extensão contı́nua de f . Mas observando, por exemplo, a função
#
f : {x ∈ IR, x 6= 0} → IR
,
x → f (x) := sen(1/x)

conclui-se que tal extensão pode não existir em determinadas situações.

A idéia que surge naturalmente para conseguir definir uma extensão, e poder
garantir ser ela contı́nua, é tentar, para um arbitrário

x ∈ V \X := {x ∈ V ; x 6∈ X} ,

introduzir
F (x) := lim f (xn ) ,
n

sendo xn ∈ X com a propriedade: xn → x .

Em que situações se assegura a existência deste limite e sua independência


da seqüência (xn ) escolhida? Como veremos mais abaixo, condições sobre f
e sobre o espaço W precisam ser impostas.
II.7. AS SEQÜÊNCIAS DE CAUCHY 25

II.7 As Seqüências de Cauchy


A definição de uma seqüência convergente de vetores (xn )n∈IN em um espaço
normado V , cf. (II.12), é extrı́nseca, pois lança mão de um dado externo
à tal seqüência, a saber, seu limite. Ocorre que, em muitas situações, não se
conhece, ou mesmo se está procurando determinar, ou mostrar que existe, ou
aproximar esse limite. Esta a justificativa para introduzir o chamado critério
de Cauchy.
Para qualquer seqüência convergente (xn )n∈IN , segue da desigualdade do
triângulo que:
Dado um número  > 0 arbitrário, existe um M = M() tal
que, se n, m > M , então

kxn − xm k <  .

Seqüências que satisfazem este critério são ditas seqüências de


Cauchy.

Tem-se, é evidente, que toda seqüência convergente é de Cauchy. Seria


então realmente útil dispor da recı́proca, já que o critério de Cauchy envolve
apenas os elementos da seqüência que está sob estudo, é intrı́nseco.
Para ilustrar este ponto, consideremos a função θ ∈ C0∞ (IR) definida por

6 1h {1/(1−|x|)} i |x| ≤ 1
1 
θ(x) := 
 exp e
|x|−2
1 < |x| < 2
0 2 ≤ |x|
-
−2 −1 0 1 2 x

e com ela construamos a seqüência


2
ψn (x) := θ(x/n) exp−x .

Exercı́cio 17 Verifique que, se tomarmos a norma k•k∞ em C0∞ (IR) , a


seqüência {ψn } é de Cauchy. Mas é possı́vel provar que ela não converge em
C0∞ (IR) , segundo essa norma. •
26 CAPÍTULO II. OS CONCEITOS BÁSICOS

Um exemplo que tem o mesmo sabor é o seguinte: em `∞


0 considere
"
n 1/  ≤ n
x = (xn )∈IN com xn := .
0 >n

Exercı́cio 18 Verifique que (xn ) é uma seqüência de Cauchy em `∞0 , quer


tomemos a norma k•k∞ ou k•k2 ; mas ela não converge em `∞ 0 , tomando
qualquer dessas duas normas. •

Existe um fato comum a estes dois exemplos. Observe que

C0∞ (IR) ⊂ S(IR), `∞ 2


0 ⊂ ` ⊂ `

.

As seqüências (ψn ) e (xn ) consideradas estão portanto em S(IR) e `2 ,


respectivamente. E sucede que, sendo
2
ψ(x) := e−x ∈ S(IR) ,

x = (x )∈IN := (1/)∈IN ∈ `2 ⊂ `∞ ,


temos que
ψn → ψ em S(IR) ,
no sentido da norma k•k∞ , e

xn → x em `2 ou `∞ .

Assim, as seqüências de Cauchy consideradas não são convergentes para os


espaços inicialmente escolhidos, mas tornam-se convergentes desde que to-
memos o espaço “correto”. Os espaços que tentamos a princı́pio não eram
suficientemente “ricos” de elementos para permitir a convergência.

Um espaço normado em que toda seqüência de Cauchy converge é dito espaço


de Banach; já um espaço euclidiano com esta mesma propriedade chama-se
espaço de Hilbert.

Exemplos de espaços de Banach são os espaços IRN , independentemente


da norma escolhida, enquanto o espaço C 0 [0, 1] é de Banach se tomarmos a
norma k•k∞ , mas não o é se tomarmos k•k2 . A verificação desta última
II.8. ESPAÇO–QUOCIENTE 27

afirmação é feita considerando-se, por exemplo, para n > 2 , a seqüência


definida como segue.

1–
6 fn

 
 0 0 ≤ x ≤ 12 − 1
 x  n
 
fn (x) :=  n 2 − 14 + 1 1
− n1 ≤ x ≤ 12 + 1
 2 2 n
1
 1 2
+ n1 ≤ x ≤ 1

 1
...1 -
 2
→ | n2 | ←

Exercı́cio 19 Demonstre que C 1 [0, 1] é completo quando munido da norma


k•k1,∞ , mas não é de Banach com a norma k•k∞ .

Exercı́cio 20 Demonstre que, para 1 ≤ p < ∞ , os espaços



X
`p := {x = (x ) ; x ∈ IR e |x |p < ∞}
=1

também são completos, quando munidos da norma


X
kxkp := { |x |p }1/p .

Exercı́cio 21 Verifique que, com a norma k•k∞ , são completos os espaços


`∞ , c e c0 .

Exercı́cio 22 Verifique que se 1 ≤ p < q ≤ ∞ , então `p ⊂ `q , `p 6= `q .

II.8 Espaço–quociente
Introduziremos agora a noção de espaço-quociente, conceito motivado por
diferentes situações, entre as quais a do

Exemplo 1. Seja P o espaço de todos os polinômios a coeficientes reais



X
P := {p(x) := aı xı ; a = (aı ) ∈ `∞
0 } .
ı=0
28 CAPÍTULO II. OS CONCEITOS BÁSICOS

Se desejamos computar os valores p(x̄) de um elemento arbitrário de P


para, digamos, |x̄| ≤ 1/2 , teremos na prática de nos restringir aos termos
de grau < N , para algum N , o qual vai depender do número de dı́gitos
com que podemos operar, pois na aritmética finita de um computador digital,
xN = 0 para N grande, se |x| < 1 . Isto equivale à impossibilidade de
distinguir dois polinômios que só diferem nos termos de grau ≥ N, quando
consideramos |x| < 1 . •

Dizemos que dois polinômios p e q são equivalentes se

TN (p − q) = 0 , (II.17)

onde TN é o operador de truncamento

TN : P → PN
P∞ P −1 ı .
p(x) := ı=0
ı
aı x → (TN p)(x) := N
ı=0 aı x

Denotamos então p ∼ q ou p RN q . Observemos que valem:

a. reflexividade p ∼ p ∀p ∈ P
b. simetria p ∼ q ⇐⇒ q ∼ p ∀p , q ∈ P (II.18)
c. transitividade p ∼ q , q ∼ r =⇒ p ∼ r ∀p , q , r ∈ P

Dizemos que (II.17) define uma relação de equivalência.


A cada p ∈ P está associada sua classe de equivalência

p∗ := {q ∈ P ; q ∼ p },

que é o conjunto de polinômios que só diferem de p nos termos de grau


≥ N . O conjunto dessas classes de equivalência é dito o conjunto-quociente,
denotado P/ ∼ .

Introduzamos em P/ ∼ , operações que o tornam um espaço vetorial:


#
a) p∗ + q ∗ := (p + q)∗
. (II.19)
b) λp∗ := (λp)∗

Observe que, em princı́pio, o segundo membro das relações (II.19) poderia


depender dos “representantes” das classes de equivalência considerados e assim
II.8. ESPAÇO–QUOCIENTE 29

não terı́amos operações bem definidas em P/ ∼ . De uma forma mais clara,


considere por exemplo (II.19.b). Se p1 ∼ p2 , então p∗1 = p∗2 e, portanto,
λ(p∗1 ) = λ(p∗2 ) pode ser definido tanto por (λp1 )∗ como por (λp2 )∗ , e é
necessário então que cheguemos ao mesmo elemento de P/ ∼ . E, de fato,

p1 ∼ p2 =⇒ (λp1 ) ∼ (λp2 ) =⇒ (λp1 )∗ = (λp2 )∗ , ∀λ ∈ IR .

Exercı́cio 23 Mostre que (II.18.a) efetivamente define uma soma em P/ ∼ ,


o qual, com as operações que introduzimos, é um espaço vetorial. •

Para obter o espaço P/ ∼ , dito espaço-quociente, identificamos elemen-


tos que estão ligados por certa propriedade. A situação é análoga àquela dos
vetores livres do espaço a três dimensões que são identificados quando têm
mesma direção, mesmo sentido e mesmo valor absoluto.
Notemos agora que, sendo

X
FN := {p(x) := aı xı ; (aı ) ∈ `∞
0 com aı = 0 se 0 ≤ ı < N} ,
ı=N

então 0∗ = FN e (II.17) pode ser reescrita

p ∼ q ⇐⇒ p − q ∈ FN . (II.170 )

A relação ∼ é definida por meio do operador TN ou do seu núcleo FN .


Num contexto mais geral, dado E , espaço vetorial e F ⊂ E , subespaço,

x ∼F y ⇐⇒ x − y ∈ F (II.20)

define sempre uma relação de equivalência (ou seja, satisfaz as propriedades


descritas em (II.18) ) e E/ ∼F é um espaço vetorial quando introduzimos as
operações da mesma forma que em (II.19) .

@
@ @ a =dist(X ∗ , Y ∗ )
@ @
x
@1@ -
@
Ry a@ X ∗
@ @

Y@
30 CAPÍTULO II. OS CONCEITOS BÁSICOS

Exemplo 2 Sejam E := IR3 , 0 6= y ∈ IR3 fixo e F := Y a reta


gerada por y , ou seja, Y := {x ∈ IR3 ; x = αy , α ∈ IR} . Tem-se que, para
todo x ∈ IR3 , a classe de equivalência x∗ é a reta paralela a Y que passa
por x .

É possı́vel neste caso medir a distância entre duas classes x∗1 , x∗2 , ou melhor,
introduzir a norma de x∗ := distância de x à reta Y .
Motivados por este exemplo, podemos tentar estudar as noções acima no con-
texto de espaços normados. Mais precisamente, quando E é um espaço nor-
mado, dado F subespaço de E , como introduzir uma norma em E/ ∼F ?
Se observarmos que, em qualquer espaço normado,

kxk = distância de x à origem,

e que em E/ ∼F , 0∗ = F , ou seja, F é a origem do espaço–quociente,


torna-se natural definirmos

kx∗ k := distância de x∗ a F , (II.21)

desde que tenhamos a noção de distância entre dois conjuntos. Esta é intro-
duzida, para A , B ⊂ E (= espaço normado) por:

dist (A, B) := inf{ka − bk ; a ∈ A , b ∈ B} .

Verifica-se então que

kx∗ k = inf{kx − f k ; f ∈ F } , (II.210 )

sendo que, no segundo membro desta identidade, x pode ser substituı́do por
qualquer y ∈ x∗ , daı́ ser (II.210 ) tomada como uma definição alternativa.
Pode-se ainda verificar que é satisfeita a identidade

kx∗ k = inf { kxk ; x ∈ x∗ } . (II.2100 )

Resta a pergunta: (II.21) define de fato uma norma? Observe que nenhuma
hipótese topológica foi feita sobre F . Em particular, se F não é fechado
II.9. COMPLETAMENTO DE UM ESPAÇO NORMADO 31

e x ∈ F , mas x 6∈ F , então x∗ 6= 0∗ = F , apesar de se verificar que


kx∗ k = 0 , pois existe uma seqüência

fn ∈ F , fn → x .

Ocorre que esta é precisamente a hipótese necessária, como mostra o

Exercı́cio 24. a) Dado um espaço normado N , se F ⊂ N é subespa-


ço fechado, (II.210 ) define uma norma em E/ ∼F , onde ∼F é introduzida
em (II.20).
b) Se N é de Banach, E/ ∼F também é de Banach.

II.9 Completamento de um Espaço Normado


Nos exemplos apresentados na Seção 7, a convergência de uma dada seqüência
de Cauchy seria sempre obtida se tomássemos, em lugar do espaço inicial-
mente considerado, um espaço maior. É esta a idéia que reside por trás
do que denominamos completamento de um espaço normado. Trata-se de
um processo geral que nos permite introduzir um contexto no qual todas as
seqüências de Cauchy de um dado espaço normado são convergentes.

Seja V um espaço normado arbitrário. A partir de V construiremos


um espaço de Banach W̃ de tal forma que, num certo sentido a ser precisado,
V é denso em W̃ .

Sendo W o conjunto de todas as seqüências de Cauchy (x ) com x em


V , podemos tentar tornar W um espaço normado mediante as definições:

i) (x ) + (y ) := (x + y )

ii) α(x ) := (αx ) .
iii) k(x )kW := lim kx kV

A desigualdade do triângulo implica que i) efetivamente define um elemento


de W , fato que é evidente no caso de ii). Para comprovar que iii) define
realmente uma norma, é necessário verificar de saı́da a existência do limite
no segundo membro. Necessitamos para isto da desigualdade (II.22), que tem
interesse per se.
32 CAPÍTULO II. OS CONCEITOS BÁSICOS

Sejam x , y vetores arbitrários de um espaço normado. Da desigualdade do


triângulo segue
kxk = kx − y + yk ≤ kx − yk + kyk ,
a qual implica

(A) kxk − kyk ≤ kx − yk .

Ao permutarmos y e x em (A) deduzimos:

(B) − kx − yk ≤ kxk − kyk .

Das relações (A) e (B) decorre

−kx − yk ≤ kxk − kyk ≤ kx − yk ,

ou seja,
| kxk − kyk | ≤ kx − yk . (II.22)
(Observe que apenas se utilizou na obtenção desta relação a desigualdade do
triângulo e que, para todo vetor x , se tem k − xk = kxk .)
Ocorre que a “função” introduzida em W mediante iii) não é uma norma.
Com efeito, o zero de W é

(x )∈IN , onde x = 0 ∀ ∈ IN ,

mas lim kx kV = 0 implica apenas que (x ) é uma seqüência que aproxima
o vetor nulo de V .
A situação no espaço W lembra aquela descrita na seção anterior, em que
(II.21) não define uma norma em E/ ∼F por não ser fechado o subespaço
F . Temos agora um espaço que só passará a ser normado após introduzir-
mos uma identificação entre seus elementos, ou melhor, após definirmos uma
relação de equivalência. Convém tratar este problema num contexto geral e,
em seguida, particularizar para W .

Seja N um espaço vetorial onde está definida uma semi-norma s(•) ,


isto é, uma função não negativa, homogênea e que satisfaz a desigualdade do
triângulo3 . Em outras palavras,

s(x) = 0 =⇒ x = 0
3
Desigualdade que, neste contexto, é também chamada de sub-aditividade.
II.9. COMPLETAMENTO DE UM ESPAÇO NORMADO 33

é a única propriedade de uma norma que s pode não satisfazer. Para obter,
a partir de N , um espaço normado, consideremos o subespaço

F := {x ∈ N ; s(x) = 0 } .

No espaço–quociente N/ ∼F introduzimos

kMk := s(y) , ∀y ∈ M , com M ∈ N/ ∼F .

Para qualquer y ∈ M , s(y) tem sempre o mesmo valor, já que

y1 , y2 ∈ M ⇐⇒ y1 − y2 ∈ F ⇐⇒ s(y1 − y2 ) = 0

e, com o raciocı́nio já empregado para chegar a (II.22),

|s(y1) − s(y2 )| ≤ s(y1 − y2 ) ,

sendo s conseqüentemente uma norma em N / ∼F .

Agora, escolhamos para N o espaço W de seqüências de Cauchy acima


f o espaço–quociente, ou por outra, W
introduzido, denotaremos por W f será
o espaço W após identificarmos duas seqüências de Cauchy x = (x ) e
y = (y ) de elementos de V quando

lim kx − y kV = 0 .

Usaremos a notação k•k∼ para a norma de W f .


Observemos que, dado v ∈ V , a seqüência constante w := (w ) , com
w := v para todo  ∈ N , está em W . O elemento v ∈ V está associado
f determinada por este elemento w ∈ W ,
de maneira natural à classe w̃ ∈ W
e temos
kw̃k∼ = kvkV . (II.23)
É neste sentido que dizemos ser V ⊂ W f . Usaremos a notação Ve para este
f
subconjunto de W que passamos a identificar com o espaço originalmente
considerado V .
Em outras palavras, Ve é o conjunto das (classes de) seqüências cujo limite
existe (em V ). A propriedade (II.23) indica que a função

v ∈ V → ṽ ∈ Ve ⊂ W
f
34 CAPÍTULO II. OS CONCEITOS BÁSICOS

preserva a norma ou, para usar o jargão matemático, é uma isometria.

Mostremos que, dado qualquer w̃ ∈ W f , ele pode ser aproximado, com um


grau de precisão arbitrário, por elementos ṽ ∈ Ve .
Seja (w ) ∈ W um “representante” da classe w̃ ∈ W f dada, e seja  > 0
arbitrário. Sendo (w ) uma seqüência de Cauchy, existe N = N() tal que,
se m, n ≥ N , temos
kwm − wn kV <  .
É claro então que (v ) definida por v := wN () , para todo  , está associada
a um elemento ṽ ∈ Ve e que

kṽ − w̃k∼ <  .

Provaremos agora que W f é um espaço de Banach.


Seja (w̃n ) uma seqüência de Cauchy em W f . Para cada n , é possı́vel
determinar um elemento ṽn ∈ Ve tal que kṽn − w̃n k∼ < 1/n . A seqüência
(ṽn ) é de Cauchy, uma vez que é válida a cadeia de desigualdades que segue:

kṽn − ṽm k∼ ≤ kṽn − w̃n k∼ + kw̃n − w̃m k∼ + kw̃m − ṽm k∼

≤ 1/n + 1/m + kw̃n − w̃m k∼ .


Mas observe que, dado ṽ ∈ Ve , a ele está associado (univocamente) um
elemento v ∈ V . Podemos então considerar os vn ∈ V , obtidos a partir
dos ṽn . A seqüência (vn ) pertence a W (por que?) e afirmamos ser ela (ou
melhor, w̃, a classe por ela determinada em W f ) o limite de (w̃ ) .
n
De fato, temos

kw̃n − w̃k ≤ kw̃n − ṽn k∼ + kṽn − w̃k∼ ≤ 1/n + lim kvn − vj kV → 0 ,


j

o que encerra a demonstração.

Esta construção poderia ser desenvolvida em qualquer espaço métrico M ,


isto é, num conjunto onde esteja definida a noção de distância, o que significa
uma função
d : M × M → IR+
(II.24)
(x, y) → d(x, y) ≥ 0
II.10. O PRINCÍPIO DA EXTENSÃO CONTÍNUA 35

que satisfaça 
d(x, y) = d(y, x)
d(x, y) = 0 ⇐⇒ x = y   .
d(x, z) ≤ d(x, y) + d(x, z)
Diz-se ser completo um espaço métrico onde qualquer seqüência de Cauchy
converge.

Exemplo 1 Motivou e orientou esta construção geral, o caso em que

V = IQ := conjunto dos racionais,

já discutido no Capı́tulo I. Obtém-se então


f = IR .
W

Exercı́cio 25 Se o espaço de saı́da V já é completo, que se obtém para Ve


f ?
e W

Exemplo 2 O espaço V := C 0 [0, 1] com a norma k•k2 não é completo.


Quando tomamos seu completamento obtemos W f := conjunto das funções
reais, definidas em [0, 1] , cujo quadrado é integrável no sentido de Lebesgue.
Este fato pode ser o caminho para a definição da integral de Lebesgue (ver
Seção 14), ou pode ser demonstrado, no caso de ser a introdução daquela in-
tegral desenvolvida com outros instrumentos.

Exemplo 3 Quando para V tomamos o espaço C 1 [0, 1] com a norma


f o espaço de Sobolev H 1 (0, 1) , que será estudado
k•k1,2 , obtemos para W
com mais detalhes no Capı́tulo IV.

II.10 O Princı́pio da Extensão Contı́nua


Voltemos ao exemplo (ou contra-exemplo) da Seção 6.

Exemplo 1 A função

f : IR\{0} → IR
x → sen(1/x)
36 CAPÍTULO II. OS CONCEITOS BÁSICOS

não admite extensão contı́nua para a reta IR . De fato, existem seqüências


de reais (xn ) que convergem para zero e tais que (f (xn )) não é conver-
gente. Ocorre que, embora a função f seja contı́nua, à medida que tomamos
x̄ próximo da origem, o gráfico de f se torna cada vez mais sinuoso na
vizinhança de x̄ . Tornam-se os valores de |f 0 (x)| cada vez maiores, sig-
nificando que pequenas variações em x implicam em (proporcionalmente)
grandes variações de f (x) . A situação é semelhante para
#
f : IR\{ −1, 0, 1 } → IR
.
x → f (x) := 1/x(x2 − 1)

Exemplo 2 Considere agora f como qualquer das funções cos x , exp−|x|


−1
ou tg x , definidas em toda a reta IR , e verifique que, dado um real x0
arbitrário, mesmo sem informações sobre f (x0 ) , é sempre possı́vel determinar
este valor, com apenas o emprego dos valores de f (x) , para x 6= x0 . Em
outras palavras, se estivesse f definida apenas em IR \{x0 } , só haveria uma
alternativa para defini-la em toda a reta e mantê-la contı́nua – seria usando o
próprio valor de f (x0 ) . •

O que distingue estes dois exemplos pode ser descrito pela seguinte observação:
sempre que tivermos uma seqüência de Cauchy (xn ) no domı́nio das funções
do Exemplo 2, verifica-se que (f (xn )) também é de Cauchy. Ou, refor-
mulando: tais funções transformam seqüências de Cauchy em seqüências de
Cauchy. Já as funções de Exemplo 1 não satisfazem esta propriedade.

Dizemos que uma função


f : D⊂M → N
é uniformemente contı́nua se, dado  > 0 , existe δ = δ() > 0 (ou seja,
um real positivo δ , que depende apenas de  ), e tal que tenhamos
kf (x) − f (y)kN <  sempre que kx − ykM < δ, x , y ∈ D .
Aqui, M e N são espaços normados arbitrários.

Exercı́cio 26 Sejam M , N espaços normados quaisquer.


a) Se f : M → N é uniformemente contı́nua então f preserva
seqüências de Cauchy.
II.10. O PRINCÍPIO DA EXTENSÃO CONTÍNUA 37

b) Dado D ⊂ IRn limitado, então f : D → N é uniformemente


contı́nua se e só se ela preserva seqüências de Cauchy.
Exercı́cio 27 Seja f : D ⊂ IRn → IR . Se são limitadas as derivadas
parciais ∂f /∂x para  = 1, 2, . . . , n , então f é uniformemente contı́nua. •

Suponhamos agora que D seja um subconjunto denso de um espaço nor-


mado M , e seja f : D → N uma função uniformemente contı́nua.
Se tivéssemos suposto apenas f contı́nua e tentássemos estender f para
x ∈ M\D mediante a escolha natural
f (x) := lim f (xn ) , (II.25)
n

onde xn → x , xn ∈ D , tal definição poderia não ser consistente: seqüências


(xn ) distintas que aproximassem o mesmo x poderiam gerar limites dife-
rentes. Sendo porém f uniformemente contı́nua, podemos garantir que tal
limite, existindo, é único. De fato, sejam (xn ) e (yn ) seqüências em D que
convergem para o mesmo elemento x ∈ M\D . A seqüência (zn ) definida
por
z2k := xk , z2k−1 := yk , k = 1, 2, . . . ,
converge para x , sendo portanto uma seqüência de Cauchy. Conclui-se que
(f (zk )) também é seqüência de Cauchy e conseqüentemente

lim f (xk ) = lim f (yk ) .


k k
Como garantir a existência do limite em (II.25), para todo x ∈ M\D ? A
dificuldade não estará nem ligada ao espaço M nem à função f , mas ao
espaço N , pois as seqüências (f (xn )) , apesar de serem de Cauchy, podem
não convergir. É claro que se N for de Banach, teremos o contexto correto,
e podemos resumir o raciocı́nio acima no
Princı́pio da Extensão Contı́nua. Seja D um subconjunto
denso de um espaço normado M e seja

f : D → N
uma função uniformemente contı́nua. Se N for um espaço
completo, então existe uma única extensão contı́nua de f a todo
o espaço M . Mais ainda, a extensão preserva a continuidade
uniforme.
38 CAPÍTULO II. OS CONCEITOS BÁSICOS

Exemplo 3 Em C 1 [0, 1] consideremos a função


#
δt̃ : C 1 [0, 1] → IR
,
f → δt̃ (f ) := f (t̃)

onde t̃ ∈ [0, 1] é arbitrário, fixo. Tomando a norma k•k1,2 verificamos que


δt̃ é contı́nua. Com efeito, suponhamos fn → f . Como se verifica, para
g ∈ C 1 [0, 1] , que

g(x)2 ≤ 2( kgk22 + kg 0 k22 ) = 2kgk21,2 , ∀x ∈ [0, 1] ,

segue √
|fn (t̃) − f (t̃)| ≤ 2kfn − f k1,2 ,
e conclui-se que δt̃ é contı́nua.

Exercı́cio 28 Prove que δt̃ é uniformemente contı́nua. •

Já mencionamos que o completamento de C 1 [0, 1] com a norma k•k1,2


nos dá o espaço de Sobolev H 1 [0, 1] . A partir da observação no Exercı́cio
anterior, concluı́mos que a função δt̃ pode ser estendida continuamente a
H 1 [0, 1] . Mais ainda, já que para as funções de C 1 [0, 1] se pode deduzir que4
R 2
|f (t1 ) − f (t2 )|2 = tt12 f 0 (s)ds ≤
R t2 0 2 2
(II.26)
t1 |f (s)| ds · |t1 − t2 | ≤ |t1 − t2 | · kf k1,2 ,

podemos pensar nos elementos de H 1 [0, 1] como sendo funções uniforme-


mente contı́nuas.

II.11 Os Operadores Lineares


Dada uma função f : X → Y , existe sempre interesse em saber quais
são as propriedades do conjunto X que f preserva. Por exemplo, vimos
que as funções uniformemente contı́nuas preservam seqüências de Cauchy.
4
Em (II.26), a primeira desigualdade pode ser obtida como conseqüência de (II.40), ou
mesmo de CBS (II.10).
II.11. OS OPERADORES LINEARES 39

No completamento, vimos que um elemento v ∈ V está associado a um


elemento ṽ ∈ Ṽ ⊂ W , sendo que

kṽk∼ = kvkV ,

isto é, tal associação preserva a norma. No contexto de espaços vetoriais


estudamos as transformações (ou operadores) lineares:

T : V → W , V, W espaços vetoriais,

é dita linear se

T (α1 v1 + α2 v2 ) = α1 T (v1 ) + α2 T (v2 )

para quaisquer v1 , v2 ∈ V , α1 , α2 ∈ IR.


No caso de operadores lineares é comum suprimirmos os parênteses, denotando
T v em lugar de T (v) .

Em espaços de dimensão finita, os operadores lineares estão associados a ma-


trizes. Praticamente todos os exemplos que vimos acima são de operadores
lineares. Exceção apenas para
Z x
f → f (x0 ) + G(t, f (t))dt ,
x0

que só é linear se G for linear na segunda variável. Em particular, também


é linear a identificação

ı : V f
→ Ṽ ⊂ W
v → Ve

de um espaço com um conjunto denso de seu completamento.

Exemplo 1 Seja a equação

utt = uxx , t > 0 , 0≤x≤1, (II.27)

que modela as vibrações transversais livres de uma corda flexı́vel. Tomemos


as condições de contorno

u(0, t) = u(1, t) = 0 (II.270 )


40 CAPÍTULO II. OS CONCEITOS BÁSICOS

que descrevem estar a corda com seus extremos fixos. Tem-se que, dadas φ
e ψ arbitrárias, mas suficientemente regulares5 , pode-se determinar univoca-
mente u = u(x, t) satisfazendo (II.27)–(II.270) e as condições iniciais6
#
u(x, 0) = φ(x)
. (II.2700 )
ut (x, 0) = ψ(x)

Assim, podemos definir, para cada t0 fixo, o operador

{φ, ψ} → u(•, t0 ) ∈ C 0 [0, 1] ,

onde u representa o estado do sistema em t0 , ou seja, o deslocamento da


corda para t = t0 , ou ainda, o valor da solução de (II.27)–(II.2700) no instan-
te t0 . Verifica-se que, graças à linearidade da equação e das condições de
contorno e iniciais, mais a unicidade do problema, este é um operador linear. •

Uma dúvida natural: qual a relação entre linearidade e continuidade?


Suponhamos que a transformação linear T seja contı́nua em v0 . Para qual-
quer v , se vn → v temos que (vn + v0 − v) → v0 e conseqüentemente,
pela continuidade em v0 ,

T (vn + v0 − v) → T v0 .

Mas, pela linearidade,

T (vn + v0 − v) = T vn + T v0 − T v

de modo que
T vn − T v → 0 ou T vn → T v .
Assim, para verificar se T é contı́nua basta verificar se ela é contı́nua em um
ponto v0 arbitrário. Esta condição pode ser expressa por:

T (suposta linear) é contı́nua em todo V ,


⇐⇒ T é contı́nua na origem { v = 0 } .
5
– isto é, possuem todas as derivadas exigidas pelos cálculos que tivermos de efetuar –
6
Ou seja, tem-se a existência e a unicidade de soluções para este problema.
II.11. OS OPERADORES LINEARES 41

Exemplo 2 Considere
#
T : C 1 [0, 1] → C 0 [0, 1]
.
f → T f := f 0
Se em ambos os espaços tomarmos a norma k•k∞ verificamos que T não
é contı́nua. De fato, sendo fn (x) := (1/n)sen nx , kfn k ≤ 1/n ↓ 0 , mas
fn0 (x) = cos nx , e portanto kfn0 k∞ = 1 . •

É claro que a noção de continuidade depende das normas consideradas. Se


C 1 [0, 1] estiver munido da norma k•k1,2 , e C 0 [0, 1] da norma k•k2 , o
operador T no Exemplo 2 resultará contı́nuo.

Outro fato sobre transformações lineares:


T é contı́nua ⇐⇒ T é limitada
ou seja, T leva bolas em bolas:
{T x; kxk ≤ r1 } ⊂ B(0; r2 )
onde r2 = r2 (T, r1 ) .
De fato, suponhamos T contı́nua e seja (xn ) uma seqüência de elementos da
bola B(0; r1 ) . Afirmamos que (T xn ) é limitada pois, caso contrário, existiria
uma subseqüência7 xnk com xnk 6= 0 e limk kT xnk k = +∞ . Tomando
yk := xnk /kT xnk k
tem-se que yk → 0 mas kT yk k = 1 , o que contradiz a continuidade de T .
De maneira análoga, supondo T limitada, se T não é contı́nua, existe uma
seqüência (xn ) , xn → 0 e tal que T xn não tende a zero. Isto implica
na existência de uma subseqüência (xnk ) tal que kT xnk k ≥ ρ , para algum
ρ > 0 . A seqüência yk := xnk /kxnk k é limitada mas ocorre então que
kT yk k → ∞ . •

Denotaremos, para T contı́nua e linear,


|||T ||| := sup kT xk/kxk = sup kT xk = sup kT xk , (II.28)
x6=0 kxk=1 kxk≤1
7
Dizemos que {xnk } é subseqüência de {xn } se {nk } for uma seqüência estrita-
mente crescente.
42 CAPÍTULO II. OS CONCEITOS BÁSICOS

do que decorre que, para todo x ∈ V ,

kT xk ≤ |||T ||| · kxk ,

onde deixamos implı́cita a notação kxkV e kT xkW , prática que será seguida
quando não suscitar dúvidas.

Exemplo 3 Seja
T : IRN → V
linear, onde V é um espaço normado arbitrário e {e1 , . . . , eN } , a base
canônica do IRN . Se
vı := T eı e kxk1 ≤ 1 ,
X X
kT xkV = kT αı eı kV = k αı vı kV
X
≤ max kvı kV |αı | = max kvı kV kxk1 = max kvı kV .
Por conseguinte, vale a desigualdade

|||T ||| ≤ max kvı kV . (II.29)

Exercı́cio 29 Demonstre que se verifica a igualdade em (II.29). •

Exemplo 3A Da mesma forma como no Exemplo 3, verifica-se que

kxk∞ ≤ 1 =⇒ kT xk ≤ N max kvı kV (II.290 )

ou ainda, X
kT xk ≤ kvı kV ; (II.2900 )
e também vale
X X X X
kT xk ≤ |αı |kvı kV ≤ ( αı2 )1/2 ( kvı k2V )1/2 ≤ ( kvı k2V )1/2 (II.29000 )

se kxk2 ≤ 1 .

Exercı́cio 30 Demonstre que existem vetores para os quais se verifica a


igualdade em todas as relações (II.290 ), (II.2900 ) e (II.29000 ). •

Este exemplo ilustra uma situação geral:


II.11. OS OPERADORES LINEARES 43

Dada uma transformação linear arbitrária, definida em um espaço


vetorial de dimensão finita, ela é sempre contı́nua, independen-
temente das normas escolhidas, no domı́nio e no contra-domı́nio
(ver detalhes na Seção 13).
Definição Se T é uma transformação linear contı́nua, o número |||T ||| ,
introduzido em (II.28), é chamado de norma de T como operador ou, pro-
visoriamente, de “norma”.

Exercı́cio 31 Verifique que

|||T ||| = inf{α ∈ IR ; kT xk ≤ αkxk , ∀x }


= diâmetro {T x ; kxk ≤ 1} .
A “norma” de T é então o fator de dilatação (ou contração) da bola unitária
quando sujeita à ação de T . Resumindo, obtivemos acima o

Teorema 1 Seja T : M → N uma transformação linear entre dois


espaços normados. São equivalentes:
a) T é contı́nua na origem;

b) T é contı́nua em algum ponto xM ;

c) T é contı́nua em qualquer ponto xM ;

d) T é uniformemente contı́nua;

e) T é lipschitziana, isto é, existe uma constante K para a qual

kT x − T ykN ≤ Kkx − ykM ∀x , y ∈ M ;

f ) T leva a bola unitária de M dentro de alguma bola de N ;

g) A imagem de qualquer bola de M está contida em alguma bola de N ;

h) T transforma limitados de M em limitados de N .


Devido à propriedade h), as transformações lineares contı́nuas são também
conhecidas por limitadas.
44 CAPÍTULO II. OS CONCEITOS BÁSICOS

Sejam X e Y dois espaços normados fixos. Denotamos por IB(X, Y )


o conjunto de todas as transformações lineares limitadas de X em Y .
Tomando em IB(X, Y ) a “norma” definida em (II.28), verifica-se que este é
de fato um espaço normado, e podemos escrever simplesmente norma (sem o
emprego das “ ”) .
Quando X = Y é comum usar-se IB(X) em lugar de IB(X, X) .
É evidente que se II : X → X é o operador identidade, então

II ∈ IB(X) e |||II||| = 1 .

Observe também que se

T ∈ IB(X, Y ) , S ∈ IB(Y, Z) ,

valem
S · T ∈ IB(X, Z)
e
||| S · T ||| ≤ ||| S ||| · ||| T ||| .
Exercı́cio 32 Se Y é um espaço de Banach, IB(X, Y ) também é.

Exemplo 4 Consideremos, para um t̃ > 0 fixado, o operador associ-


ado à equação de propagação da onda
#
Wt̃ : C02 [0, 1] × C 1 [0, 1] → C 2 ( [0, 1] × [0, t̃] )
.
{φ, ψ} → u(x, t) := solução de (II.27)–(II.2700 )

Em V := C02 [0, 1] × C 1 [0, 1] tomamos a norma


2
k{φ, ψ}kV := ( kφ0 k2 + kψk22 )1/2

e, em Im(Wt̃ ) , a imagem de Wt̃ em C 2 ( [0, 1] × [0, t̃] ) , a norma

ku(x, t)kW := max ( kux (•, t)k22 + kut (•, t)k22 )1/2 .
0≤t≤t̃

(Note que, considerando todo o espaço C 2 ( [0, 1] × [0, t̃] ) , esta não é uma
norma.)
II.12. OS OPERADORES INVERTÍVEIS 45

Dado um instante qualquer t0 , introduz-se a chamada energia do sistema


em t0 por meio de
Z 1
E(t0 ) := [ux (x, t0 )2 + ut (x, t0 )2 ]dx .
0

Verifica-se a identidade
Z 1 Z 1
d
E(t) = 2 [uxt ux + utt ut ]dx = 2 ut [utt − uxx ]dx + 2ut ux |10 = 0 ,
dt 0 0

sendo a última igualdade conseqüência de ser nulo o integrando, por (II.27), e


nulo o termo de fronteira, por (II.270 ).
Conseqüentemente, temos a conservação da energia, ou seja, a energia per-
manece constante ao longo do tempo, do que decorre, para toda u ∈ Im(Wt̃ ) ,

ku(•, •)kW = max {E(t)}1/2 = E(0)1/2 = k{φ, ψ}kV


0≤t≤t̃

=⇒ |||Wt̃ ||| = 1 .
Exercı́cio 33 Calcule (ou estime) a norma dos operadores lineares descritos
nos Exemplos I.5.1 e Exercı́cios 27 e 28.

II.12 Os Operadores Invertı́veis


Dada a transformação T : X → Y , entre dois espaços normados, o
conjunto {x; T x = 0} dos zeros de T é chamado núcleo (ou kernel) de
T , denotado ker (T ) . Sempre que T é contı́nua, ker (T ) é fechado. Mais
ainda:

Se T é linear, ker (T ) é um subespaço vetorial.

Com esta terminologia, um resultado anteriormente apresentado pode ser re-


enunciado da seguinte forma:

Se T é contı́nua e seu núcleo contém um subconjunto denso (re-


lativamente ao domı́nio de T ) então

T ≡ 0.
46 CAPÍTULO II. OS CONCEITOS BÁSICOS

Sabemos que se T é linear, 0 ∈ ker(T ) . Se {0} = ker(T ) , teremos:

T x1 = T x2 =⇒ T (x1 − x2 ) = 0 =⇒ x1 − x2 = 0 =⇒ x1 = x2 ,

e assim T é necessariamente biunı́voca, existindo sua inversa T −1 . Esta


inversa é necessariamente linear. Será T −1 necessariamente contı́nua, se T
for contı́nua e linear?

Exemplo 1 Seja C̃ 1 [0, 1] o conjunto das funções de C 1 [0, 1] que se anulam


na origem, com a norma k•k∞ . A transformação

T : C̃[0, 1] → C̃ 1 [0, 1] R
f → (T f )(x) := 0x f (s)ds

é linear e contı́nua se tomamos a norma k•k∞ em C̃[0, 1] , que é o espaço


das funções de C 0 [0, 1] nulas na origem. Este fato provém das desigualdades
Z x Z x
| f (s)ds| ≤ kf k∞ ds ≤ kf k∞ .
0 0

A transformação T também é biunı́voca pois f = 0 se T f = 0 .


Sendo #
S : C̃[0, 1] → C̃[0, 1]
,
g → (Sg)(x) := g 0 (x)
S é a inversa de T , mas S não é contı́nua. De fato, tomando g(x) := xn ,
Z x xn+1
(T gn )(x) = tn dt = ,
0 n+1
logo, tem-se que

tn+1 1
kT gn k∞ = max = ↓0 .
0≤t≤1 n + 1 n+1
Ocorre que
kgn k∞ = max |tn | = 1
0≤t≤1
e, como
gn = Shn com hn (t) := tn+1 /(n + 1) ,
II.12. OS OPERADORES INVERTÍVEIS 47

temos khn k∞ → 0 mas kShn k∞ = 1 e, portanto, S é descontı́nua. •

Estas considerações motivam o

Exercı́cio 34. Seja T : X → Y uma função linear e contı́nua


entre dois espaços normados. A inversa de T existe, definida na imagem de
T , denotada por Im(T ) ⊂ Y , e é contı́nua se e só se existe δ > 0 tal que,

kxk = 1 , então kT xk > δ .

Exemplo 2 O conjunto das funções f : IR → IR , integráveis no sentido


de Riemann em cada intervalo fechado e limitado e tais que existe
Z N
lim |f (x)|dx ,
M,N →∞ −M

será denotado por L̃1 (IR) quando munido da norma


Z ∞
kf k1 := |f (x)|dx .
−∞

Seja Ca (IR) o conjunto das funções f : IR → IC contı́nuas8 que se anulam


no infinito, isto é,
lim f (x) = 0 , (II.30)
|x|→∞

com a norma
kf k∞ := sup |f (x)| .
−∞<x<∞

O operador transformada de Fourier

F : L̃1 (IR) → Ca (IR)


R∞ (II.31)
f → (F f )(t) := −∞ f (x)e−itx dx
8
No presente contexto necessitamos de espaços vetoriais complexos – EVC – para cuja
definição repete-se aquela de EVR, os escalares substituı́dos agora por complexos. Quando
se tem um produto interno, a comutatividade se transforma em

< u|v >= < v|u > .


48 CAPÍTULO II. OS CONCEITOS BÁSICOS

é linear e contı́nuo9 .

Exercı́cio 35 Estime a norma de F da forma mais precisa que puder e


verifique que F não tem inversa contı́nua, baseando-se na seqüência
"
1 |x| ≤ n
fn (x) := .
0 |x| > n

II.13 Normas Equivalentes


Já nos defrontamos mais de uma vez com certos conceitos ou resultados que
podem ou não depender da norma considerada. É então necessário um critério
para, dadas duas normas, sabermos quais informações sobre uma delas impli-
cam em informações sobre a outra.

Exemplo 1 Tomemos C 0 [0, 1] e denotemos por V2 este espaço veto-


rial quando considerado com a norma da média quadrática, e por V∞ este
mesmo espaço agora munido da norma k•k∞ .
A identidade
II : V2 → V∞
x → II(x) = x
é evidentemente uma transformação linear. Pergunta-se: II é contı́nua?
Basta lembrarmos que a continuidade de II seria equivalente a valer a seguinte
implicação, que é falsa:

convergência em k•k2 =⇒ convergência em k•k∞ .

Exemplo 2 Em C̃ 1 [0, 1] , f → kf 0 k2 define uma norma, que denotaremos


por k•kd , para a qual se verifica

kf kd ≤ kf k1,2 .

Como, para x ∈ [0, 1] ,


Z x
f (x) = f 0 (s)ds , f ∈ C̃ 1 [0, 1] ,
0
9
A propriedade da transformada de Fourier descrita em II.30 é conhecida como o Lema
de Riemann-Lebesgue. Para uma demonstração, ver [30], pp.303.
II.13. NORMAS EQUIVALENTES 49

vem Z Z Z
x x 1
2 0 2
|f (x)| ≤ |f (s)| ds 1 ds ≤ x |f 0 (s)|ds
0 0 0
e, portanto,
Z 1 Z 1 Z 1
2
|f 0 (x)|2 dx ≤ xdx |f 0 (s)|2 ds = kf 0k2 /2 .
0 0 0

Conhecida por desigualdade de Wirtinger ou de Friedrichs, esta estimativa


é um caso particular da desigualdade de Poincaré. Ela implica que, para
f ∈ C̃ 1 [0, 1] , vale

2 1 2 2 3 2
kf k21,2 = kf k22 + kf 0 k2 ≤ kf 0 k2 + kf 0 k2 = kf 0 k2 .
2 2
As duas desigualdades
s
3 0
kf 0 k2 ≤ kf k1,2 ≤ kf k2
2
mostram que a identidade é contı́nua e tem inversa contı́nua quando tomada
entre os espaços

C̃ 1 ([0, 1], k•k1,2 ) e C̃ 1 ([0, 1], k•kd ) .

Dizemos que duas normas são equivalentes se toda seqüência convergente


com relação a qualquer dessas duas normas é também convergente com res-
peito à outra. Mais precisamente, k•k1 e k•k2 são duas normas equivalentes
sobre o espaço X se existem constantes α , β > 0 tais que

αkxk1 ≤ kxk2 ≤ βkxk1 , ∀x ∈ X .

Num espaço munido de normas equivalentes, as seqüências convergentes e, por


conseguinte, os conceitos a elas relacionados, são os mesmos.
Seja V um espaço vetorial real. Diremos que V tem dimensão finita N ,
para N ∈ IN , denotando dim (V ) = N , se existe uma transformação linear

T : IRN → V (II.32)

que seja biunı́voca e sobrejetora.


Demonstraremos agora o seguinte resultado, já mencionado:
50 CAPÍTULO II. OS CONCEITOS BÁSICOS

Teorema Num espaço normado de dimensão finita, todas as nor-


mas são equivalentes.
Já vimos, cf. Exemplo 3, Seção 11, que T em (II.32) é contı́nua, quer tomemos
qualquer das normas k•k1 , k•k2 ou k•k∞ . Afirmamos que T −1 também
é contı́nua. Com esse objetivo, basta mostrar que, para um certo ρ > 0 , se
tem
kT xkV ≥ ρkxkp ∀x 6= 0 x ∈ IRN , p = 1, 2, ∞ ,
ou, equivalentemente,

||T x||V ≥ ρ ∀x ∈ IRN , ||x||p = 1 ,

ou ainda,
inf ||T x||V > 0 .
||x||p =1

Sucede que se
inf ||T x||V = 0
||x||p =1

ocorrer, existirá uma seqüência {xn ∈ IRN , ||xn ||p = 1} tal que

||T xn ||V → 0 .

Ora, a seqüência {xn } sendo limitada, e sendo xn = (x1n , x2n , . . . , xN


n ) , implica
que cada seqüência {xn }n , j = 1, . . . , N é limitada. Conseqüentemente,
j

podemos extrair de {x1n }n uma subseqüência convergente. E assim sucessi-


vamente, componente a componente, chegaremos a uma subseqüência {xjk }k
de {xn }n em IRN . Esta será convergente pois, como já vimos, condição
necessária e suficiente para uma seqüência do IRN convergir em qualquer das
normas ||•||p , p = 1, 2, ∞ , é que cada uma das seqüências de reais formada
k
pelas componentes seja convergente. Assim, tem-se que xk → x0 .
Já que ||xn ||p = 1 , teremos limk ||xk ||p = 1 , o que implica kx0 kp = 1 .
Como T é contı́nua,

lim T xk = T (lim xk ) = T x0 ,


k k

e concluı́mos então que T x0 = 0 , o que contradiz o fato de ser T biunı́voca.


A continuidade de T −1 que acabamos de demonstrar implica na equivalência
de duas normas arbitrárias num espaço de dimensão finita V qualquer.
II.13. NORMAS EQUIVALENTES 51

O restante da demonstração é deixado como exercı́cio.

Observações

a) O ingrediente fundamental em que se baseia a demonstração


acima é o Teorema de Bolzano-Weierstrass que afirma:
“Toda seqüência limitada na reta (ou em IRN ) admite uma sub-
seqüência convergente”.
Este é um resultado estritamente de dimensão finita, o que fica
explicitado na demonstração acima. De fato, é válida uma certa
recı́proca:
b) Se num espaço normado V , de cada seqüência limitada se
pode extrair uma subseqüência convergente, então este espaço tem
dimensão finita.
Exercı́cio 36 Verifique que o conjunto {cos nx}n≥0 em C 0 [0, 2π] é limitado
na norma k•k2 mas não admite nenhuma subseqüência convergente. (Suges-
tão: critério de Cauchy.)

Exemplo 3 Tomemos o espaço PN dos polinômios de grau < N e


consideremos as duas normas:
R1 
||p||2 := ( p2 (x)dx)1/2
0 1/2 
R1 R 1  dp 2  .
||p||1,2 := 0 p2 (x)dx + 0 dx
(x) dx

Como o espaço PN tem dimensão N , as duas normas são equivalentes.


Ou seja, para cada N fixo, existem constantes sn e SN positivas tais que,
qualquer que seja p ∈ PN ,
sN ||p||2 ≤ ||p||1,2 ≤ SN ||p||2 .

A existência da constante sn é clara ( sn = 1 ), mas não se pode afirmar


o mesmo para SN , se desconhecermos o resultado acima demonstrado. No
contexto da Análise Numérica, a constante SN é denominada função esta-
bilidade do par {(PN , ||•||1,2 ) , (PN , ||•||2 )} .

Exercı́cio 37 Verifique que temos necessariamente

SN ↑ ∞ se N ↑ ∞.
52 CAPÍTULO II. OS CONCEITOS BÁSICOS

Baseando-nos num resultado a ser enunciado mais adiante (e que é um dos


teoremas básicos da Análise Funcional, o Teorema da Aplicação Aberta),
pode-se enunciar o

Teorema 1. Dado um espaço vetorial V , sejam ||•||1 e ||•||2 definidas


sobre V tais que V se torna um espaço normado completo quando consi-
deramos quaisquer delas. Então a existência de K1 > 0 satisfazendo

||x||1 ≤ K1 ||x||2 , ∀x ∈ V

é equivalente à existência de K2 > 0 para o qual

||x||2 ≤ K2 ||x||1 , ∀x ∈ V .

II.14 A Integral de Lebesgue


II.14.1 Introdução
O objetivo desta Seção é apresentar fatos básicos na teoria da Integral de
Lebesgue, relevantes (ou indispensáveis) para as aplicações que desenvolve-
mos.
A Integral de Lebesgue é uma generalização da Integral de Riemann que per-
mite obter resultados mais poderosos, notadamente com relação a propriedades
de convergência.
Num intervalo [a, b] finito10 , a classe R[a, b] das funções limitadas e in-
tegráveis no sentido de Riemann – que chamaremos de integráveis a Riemann
– está estritamente contida na classe das funções integráveis no sentido de
Lebesgue, ou integráveis a Lebesgue – L[a, b] . De fato, o Exemplo 2 exibe
uma função limitada que pertence a L[a, b] \ R[a, b] . Para estas funções, o
funcional Integral de Lebesgue é uma extensão da Integral de Riemann, pois
R
para f ∈ R[a, b] o valor de ab f (x)dx independe de qual das duas integrais
consideremos. Quando tomamos, porém, a integral imprópria de Riemann,
ou seja, se [a, b] não é finito ou se considerarmos funções não limitadas, a
situação se altera, como verificaremos no
Exemplo 1. A função limitada f (x) := (1/x) sen x não é integrável
10
O termo limitado é, às vezes, preferido por não induzir a idéia de se ter um conjunto
com um número finito de pontos.
II.14. A INTEGRAL DE LEBESGUE 53

a Lebesgue11 na reta IR mas sua integral imprópria no sentido de Riemann


existe, pois temos, integrando por partes, que
Z Z B
B sen x cos x
lim dx = − lim dx ,
B→∞ π/2 x B→∞ π/2 x2
e o limite no segundo membro existe.
Analogamente, a função não limitada
"
x−1 sen (1/x) 0<x≤1
f (x) :=
0 x=0
R1
não é integrável a Lebesgue, pois 1/n |f (x)|dx ↑ ∞ . Mas, como
Z 1 Z n
1 sen (x)
sen (1/x) dx = dx ,
1/n x 1 x
sua integral imprópria no sentido de Riemann existe. •

Nesta seção denotaremos por ΨA a função caracterı́stica do conjunto A ,


"
1 x∈A
ΨA (x) := . (II.33)
0 x 6∈ A

Exemplo 2 A função f (x) := ΨIQ (x) , caracterı́stica dos racionais, não é


integrável a Riemann em nenhum intervalo [a, b] : dada qualquer partição

∆ := { a = x0 < x1 < . . . < xn = b } ,

tem-se para as somas superiores


" #
X
n
S∆ (f ) := (xı − xı−1 ) sup f (x) = b−a ,
ı=1 xı−1 ≤x≤xı

enquanto para as somas inferiores


X
n  
S∆ (f ) := (xı − xı−1 ) inf f (x) = 0 ,
xı−1 ≤x≤xı
ı=1
11
Esta afirmação poderá ser verificada com os resultados apresentados na Seção II.14.6.
54 CAPÍTULO II. OS CONCEITOS BÁSICOS

de modo que a integral superior


Z b
f (x)dx := inf S∆ (f )
a ∆

vale (b − a) , sendo distinta da integral inferior


Z b
f (x)dx := sup S∆ (f ) = 0 .
a ∆

Observe que, sendo {qn } uma enumeração dos racionais e


"
1 x = qı 1 ≤ ı ≤ N
fN (x) := ,
0 demais valores

temos que
fN ∈ R[a, b] , lim fN (x) = ΨIQ (x) ,
N →∞

de forma que o limite pontual (monótono!) f de funções de R[a, b] pode


não ser integrável a Riemann, mesmo quando kf k∞ < ∞ . (Compare este
exemplo com o resultado descrito no Teorema da Convergência Monótona,
Seção II.14.6.)
Demonstraremos na Seção (II.14.3) que ΨIQ é integrável a Lebesgue e, de
fato, que sua integral vale zero, pois os pontos onde ela é diferente de zero
compõem um conjunto “irrelevante”, neste contexto.
Tem-se ainda que, se g := ΨIQ − (1/2) , |g| ∈ R[a, b] mas é evidente
que g não é também integrável a Riemann. (Esta situação não ocorre com
a Integral de Lebesgue: as funções f e |f | são – ou não são – integráveis a
Lebesgue simultaneamente.) •

A integral inferior de uma função f (x) , no sentido de Riemann, pode também


ser definida como
Z b Z b
f (x)dx = sup { g(x)dx ; g ∈ E },
a a

onde E denota o conjunto das funções-escada em [a, b] :


X
n
g ∈ E ⇐⇒ g := cı Ψ[xı−1 ,xı] ,
ı=1
II.14. A INTEGRAL DE LEBESGUE 55

para alguma partição de [a, b] e um conjunto {cı } de constantes. As funções


g em E têm sua integral definida por
Z b X
n
g(x) dx := cı (xı−1 , xı ) ,
a ı=1

consistentemente com a noção de área sob uma curva, e a partir de E estende-


se a noção de integral para funções mais gerais.
Uma alternativa para definir a integral de Lebesgue é tomar S , o conjunto
das chamadas funções simples, isto é, funções cuja imagem é um conjunto
finito. Tais funções podem ser escritas na forma

X
n
f := cı Ψ E ı
ı=1

onde os conjuntos Eı não são necessariamente intervalos, mas sim conjuntos


aos quais se pode atribuir uma medida, m(Eı ) , e portanto pomos
Z b X
n
f (x)dx = cı m(Eı ) .
a ı=1

Sendo S ⊃ E , esperamos então poder aproximar um número maior de


funções e, para estas, poder definir sua integral.
Construindo a integral de Riemann, concentramo-nos em intervalos no eixo
dos x , ao tomar as funções-escada. Na integral de Lebesgue, damos ênfase
aos intervalos no eixo dos y pois utilizamos as funções simples seguintes:
para A ≤ f (x) ≤ B , consideramos uma partição {yı} de [A, B] e
tomamos g ∈ S com
X
n
g(x) := y ı Ψc ı ,
ı=1

onde cı := f −1 ([yı−1 , yı]) . Observe que, como cı não é necessariamente


um intervalo, necessitamos impor condições sobre f para poder medir os
conjuntos cı .
Tais fatos não se tornam claros na abordagem da integral de Lebesgue que
apresentamos a seguir. Estas idéias são porém essenciais para sugerir a razão
de obtermos dessa forma uma integral mais poderosa que a de Riemann.
56 CAPÍTULO II. OS CONCEITOS BÁSICOS

II.14.2 Definição, Propriedades, o Espaço L1(IR)


Consideremos C0 (IR) , o espaço das funções reais contı́nuas, definidas na reta
e que se anulam fora de um intervalo finito (que varia com cada função). A
expressão Z
||f ||1 := |f (x)|dx

define12 uma norma em C0 (IR) . Verifica-se, usando as funções do Exercı́cio


17, que o espaço normado assim obtido não é completo. Denotaremos seu
completamento por L1 (IR) . Os elementos de L1 (IR) são ditos funções
generalizadas.
Dada f ∈ L1 (IR) e x0 ∈ IR , não tem sentido nos referirmos ao valor
assumido por f em x0 . Tal fato é motivado por não ser contı́nuo o funcional

δx0 : C0 (IR) → IR
f → δx0 (f ) := f (x0 )

relativamente à norma ||•||1 .


Apesar desta “deficiência” das funções generalizadas, poderemos falar em
noções e operadores que são introduzidos pontualmente, isto é, exigem (ou
exigiriam) o conhecimento do valor de f em pontos de seu domı́nio.
Sendo Z
L(f ) := f (x)dx

linear e contı́nua em C0 (IR) , ela admite uma única extensão contı́nua ao


espaço L1 (IR) . Tal extensão é denominada a integral de Lebesgue, a qual
está definida portanto para funções generalizadas.
As propriedades lineares da integral de Riemann
R R R
f +g = f + g
R R (II.34)
αf = α f

são evidentemente preservadas, pois construı́mos uma extensão linear. Além


disso, para f ∈ C0 (IR) , temos a positividade,
R
f ≥ 0 =⇒ f (x)dx ≥ 0 , (II.35)
12
R
No que segue, indicará sempre a integral em toda a reta IR .
II.14. A INTEGRAL DE LEBESGUE 57

uma propriedade que, em princı́pio, não se coloca para elementos de L1 (IR) ,


visto que verificar ser f ≥ 0 pressupõe o conhecimento pontual de f . Con-
tornamos esta dificuldade lançando mão outra vez do princı́pio da extensão
contı́nua:
Considere para a ∈ IR fixo, o operador não linear
#
Ta : C0 (IR) → C0 (IR)
,
f → Ta f := fa

onde "
f (x) se f (x) ≤ a
fa (x) := .
a se f (x) > a
Este é o chamado operador de truncamento e satisfaz

||Ta f − Ta g||1 ≤ ||f − g||1 .

Logo, Ta é uniformemente contı́nuo e podemos estendê-lo continuamente a


todo o espaço L1 (IR) . Observando que, para f ∈ C0 (IR),

f ≤a ⇐⇒ Ta f = f , (II.36)

toma-se (II.36) como definição, quando f ∈ L1 (IR) .


Da mesma forma, definimos

f ≥a ⇐⇒ T−a (−f ) = −f .

O valor absoluto de uma função generalizada pode ser introduzido a partir do


operador Ta , com a = 0 , por:

|f | := f+ + f− ,

onde denotamos

f− := −Ta (f ), f+ := −Ta (−f ) (a := 0) .

Segue da definição que |f | ∈ L1 (IR) e que


Z Z Z
|f | = f+ + f− . (II.37)
58 CAPÍTULO II. OS CONCEITOS BÁSICOS

Observe também que vale


Z Z Z
f= f+ − f− . (II.38)

Em um outro caminho para construir a integral de Lebesgue, define-se a in-


tegral de uma função f , quando (II.37) é finita, por meio da expressão (II.38).

Exercı́cio 38 Demonstre que, para f, g ∈ L1 (IR) ,

f, g ≥ 0 =⇒ f +g ≥0.

Exercı́cio 39 Demonstre que, para α > 0 , f ∈ L1 (IR) ,

|f | ≤ α ⇐⇒ f ≤α e f ≥ −α .

Exercı́cio 40 Verifique que, para f ∈ L1 (IR) ,

lim TN f = f .
N →∞

Exercı́cio 41 Verifique: se f ∈ L1 (IR) ,

f ≥ 0 ⇐⇒ ∃ fn ∈ C0 (IR) , fn ≥ 0 e fn → f .

A partir do resultado no Exercı́cio 41, é imediata a verificação de que em


L1 (IR) também é válida a positividade – propriedade (II.35) – para a integral
de Lebesgue.

II.14.3 Os Conjuntos de Medida Nula


Da mesma forma que, construı́do o conjunto dos números reais via comple-
tamento dos racionais, é conveniente utilizarmos uma caracterização menos
abstrata para os irracionais – qual seja, a representação decimal – buscaremos
uma equivalente “visualização” das funções generalizadas. Veremos que as
funções generalizadas podem ser pensadas como funções, no sentido estrito,
desde que sejamos condescendentes, deixando-as indefinidas em conjuntos su-
ficientemente pequenos do seu domı́nio.
Um conjunto M ⊂ IR é definido como tendo13 medida nula se for
13
Em todo este Capı́tulo, os termos medida e integral se referem à medida e à integral de
Lebesgue
II.14. A INTEGRAL DE LEBESGUE 59

possı́vel encontrar, para qualquer valor  > 0 , uma famı́lia de intervalos


In := (an , an + δn ) , n = 1, 2, . . . , cuja união ∪∞
n=1 In contenha M e tal
P
que n δn <  .
São exemplos de conjuntos de medida nula: quaisquer conjuntos enumeráveis e
a união enumerável de conjuntos de medida nula. Observe que a união qual-
quer de conjuntos de medida nula pode não ter medida nula. A existência de
um conjunto de medida nula não enumerável é de demonstração elaborada: o
exemplo mais conhecido é o conjunto de Cantor, ver [44], pp. 36 e 236.

Quando uma certa propriedade P é válida no complementar de um con-


junto de medida nula, dizemos que P é válida em quase toda parte, o que
abreviaremos por qtp. Assim, dizemos que uma função é nula qtp quando o
conjunto dos pontos de seu domı́nio onde ela assume valor diferente de zero
tem medida nula. Outro exemplo: as funções f ≡ 0 e g ≡ ΨIQ – cf.
(II.33) – coincidem qtp. Quando dizemos que uma seqüência fn (x) converge
qtp, significa que se tem a convergência pontual em um subconjunto contido no
domı́nio comum às funções dessa seqüência, sendo a medida desse subconjunto
necessariamente nula.
No Exemplo 2, Seção I.4 construı́mos uma seqüência {fn } que converge para
0 na norma k•k1 mas não é convergente em ponto algum. Se tomarmos,
porém, a subseqüência {f2k } , ela é pontualmente convergente. Esta situação
é geral, tendo em vista o que afirma o

Teorema (Riesz-Fischer). Toda seqüência {fn } em C0 (IR)


que é de Cauchy na norma ||•||1 admite uma subseqüência {fnk }
convergente qtp, isto é, que converge pontualmente, exceto em um
conjunto de medida nula.

Este resultado indica um modo mais fácil de “visualizar” as funções generali-


zadas de L1 (IR) : elas são precisamente os limites qtp de seqüências de Cauchy
em C0 (IR) . Ou seja, descrevendo de forma mais explı́cita:

Se tomarmos duas seqüências de Cauchy em C0 (IR) , associadas a


um mesmo elemento de L1 (IR) (duas seqüências equivalentes),
podemos construir, aplicando o Teorema de Riesz-Fischer, duas
funções definidas qtp. Demonstra-se que estas duas funções coinci-
dem qtp, motivando a introdução de uma relação de equivalência
no conjunto das funções f que são limite qtp de seqüências de
60 CAPÍTULO II. OS CONCEITOS BÁSICOS

Cauchy em C0 (IR) . Prova-se então que os elementos de L1 (IR)


estão em correspondência 1-1 com estas classes de equivalência e
pensamos nas funções generalizadas de L1 (IR) como classes de
funções definidas qtp.

Baseados nestas observações, justifica-se a afirmação de que ΨIQ ∈ L1 (IR) .


Pode-se enunciar o Teorema de Riesz-Fischer para funções de L1 (IR) :

Se fn ∈ L1 (IR) , n = 1, 2, . . . , e ||fn − f ||1 → 0 , então existe


uma subseqüência {fnk } que converge qtp para f .

É interessante comparar a demonstração do resultado enunciado no Exercı́cio


10 a) com a que podemos obter para o exercı́cio que segue, se fizermos uso
desta formulação do Teorema de Riesz-Fischer.

Exercı́cio 42 Verifique que { f ∈ L1 (IR); |f | ≤ 1 } é um subcon-


junto fechado de L1 (IR) .

Exercı́cio 43 a) Mostre que Ψ(a,b) ∈ L1 (IR) ⇐⇒ (a, b) é limitado.


b) Mostre que as funções seccionalmente contı́nuas pertencem
a L1 (IR) .

As noções introduzidas na presente seção, no contexto da reta IR , são válidas


para IRn , n ≥ 2 , não havendo diferença alguma na construção em qualquer
dos dois casos. Continuaremos mencionando a reta real, apenas para fixar
idéias no caso mais simples, mas tomaremos o cuidado de não fazer uso das
simplificações que nesta situação possam aparecer. Contudo, a noção de me-
dida de um conjunto – em particular de conjuntos de medida nula – para a
reta é tecnicamente mais simples do que aquela em dimensões maiores.

Diremos que a medida de um aberto A é dada por


Z
m(A) := sup { f (x)dx ; f ∈ C0 (IR), f ≤ ΨA } .
IR

Verifica-se que, quando A é um intervalo (a, b) , ou um n−policubo, o que


significa A := Πnı=1 (aı , bı ) , valem precisamente

m(A) = b − a ou m(A) = Πnı=1 (bı − aı ) .


II.14. A INTEGRAL DE LEBESGUE 61

Note que seria natural definir


Z
m(A) := ΨA (x) dx (II.39)

mas não sabemos (ainda) se ΨA ∈ L1 (IR) . Esta a motivação para o conceito


de conjuntos mensuráveis, aqueles para os quais se pode atribuir uma medida,
cf. Seção I.14.7.

Exercı́cio 44 Na reta, todo aberto Q pode ser escrito como união disjunta
de intervalos abertos Qı = (aı , bı ) :

Q = ∪N
ı=1 Qı , N ≤ ∞ , Qı ∩ Q = ∅ , ı 6=  .

Verifique que
X
N
m(Q) = (bı − aı ) .
ı=1

Exercı́cio 45 Seja {qı } uma enumeração dos racionais e seja  > 0 .


Considere o aberto

Q := ∪∞
ı=1 (qı − /2 , qı + /2 ) .
ı ı

Este é um aberto denso na reta. Verifique que sua medida é ≤ 2 . •

Dispondo assim da noção de medida para conjuntos mais gerais que inter-
valos, a definição que introduzimos pode ser substituı́da pela que segue:
Diremos que um conjunto N tem medida nula se, para cada  > 0 , existe
um aberto A ⊃ N tal que

m(A ) ≤  .

II.14.4 Os Espaços Lp (IR) , 1 < p < ∞


Para 1 < p < ∞ , denotaremos por Lp (IR) o completamento de C0 (IR)
quando munido da norma ||•||p , definida por
Z 1/p
||f ||p := |f (x)|p dx .
IR
62 CAPÍTULO II. OS CONCEITOS BÁSICOS

É evidente que em C0 (IR) a função ||•||p é não negativa, homogênea e


só se anula para f ≡ 0 . Quanto à desigualdade do triângulo, que neste
contexto leva o nome de desigualdade de Minkowski, será demonstrada a par-
tir de uma outra desigualdade, a qual apresenta grande interesse por si mesma,

A desigualdade de Hölder. Se f, g ∈ C0 (IR) , tem-se


Z
|f g| ≤ ||f ||p ||g||q (II.40)

desde que p, q ∈ (1, ∞) sejam expoentes conjugados, isto é, satisfaçam

1 1
+ =1 (II.41)
p q

ou, equivalentemente,
pq = p + q , (II.410 )

p = q/(q − 1) = 1/(q − 1) + 1 , (II.4100 )

q = p/(p − 1) = 1/(p − 1) + 1 . (II.41000 )

A desigualdade de Hölder (II.40) é uma conseqüência da relação

ap bq
ab ≤ + , (II.42)
p q

válida para a, b ≥ 0 e p, q expoentes conjugados. Esta desigualdade genera-


liza a conhecida relação entre a média aritmética e a média geométrica.
Como, na figura a seguir, a área do retângulo é sempre menor que a soma das
áreas A1 + A2 , e como
Z b
p
A1 = a /p , A2 = y 1/(p−1) dy = bq /q ,
a

segue (II.42).
II.14. A INTEGRAL DE LEBESGUE 63

y6 y6
y = xp−1

b b y = xp−1

A2 A1 A2
A1

- -
p−1 a x p−1 a x
a >b a <b

É claro que a desigualdade de Hölder é válida supondo que f ≡ 0 ou


g ≡ 0.
Quando ||f ||p = 1 = ||g||p , tem-se
Z Z
|f |p Z |g|q ||f ||pp ||g||qq 1 1
|f g| ≤ + = + = + =1. (II.400 )
p q p q p q

Para f, g arbitrárias e não nulas, aplicamos (II.400 ) a f /||f ||p e g/||g||q e


daı́ segue (II.40).

Exercı́cio 46 Obtenha a desigualdade de Hölder para as normas ||•||p


introduzidas no IRN ou em `∞0 por
"
P 1/p N ∈ IN para IRN
||x||p := j=1 |xj |
n p
, . •
N = ∞ para `∞0

A desigualdade de Minkowski Para f, g ∈ C0 (IR) , vamos obter a chamada


desigualdade de Minkowski:

||f + g||p ≤ ||f ||p + ||g||p . (II.43)


Como
|f + g|p ≤ |f + g|p−1(|f | + |g|)
e, por Hölder,
Z Z 1/q
|f | |f + g|p−1 ≤ ||f ||p |f + g|(p−1)q = ||f ||p||f + g||p/q
p ,
64 CAPÍTULO II. OS CONCEITOS BÁSICOS

concluı́mos, para o caso de ser f + g 6= 0 , que

||f + g||pp ≤ (||f ||p + ||g||p)||f + g||p/q


p ,

de onde segue (II.43), pois


!
1
p − p/q = p 1 − =1.
q

II.14.5 O Espaço L∞ (IR)


Se, seguindo os passos da construção de Lp (IR) , considerarmos o fecho de
C0 (IR) com relação à norma k•k∞ , obteremos apenas o espaço Ca (IR)
de funções contı́nuas nulas no ∞ , isto é, que satisfazem lim|x|→∞ f (x) =
0 . Tomando um espaço maior, com menos restrições, CL (IR) , qual seja, o
conjunto das funções contı́nuas e limitadas na reta, munido da norma ||•||∞ ,
verificamos que este já é um espaço completo.
Assim, se desejamos obter mais funções, em particular, funções definidas qtp
e medi-las com a norma ||•||∞ , devemos seguir um novo caminho.
Seja f mensurável, com o que queremos dizer: f é limite qtp de funções
de L1 (IR) . Para β > 0 , denotemos

Iβ := [−β, β]c = (−∞, −β) ∪ (β, ∞) .

Definamos então

||f ||∞ := inf{β; f −1 (Iβ ) tem medida nula}, (II.44)

sendo que ||f ||∞ := +∞ se o conjunto do qual devemos tomar o “ inf ” for
vazio.
Definimos agora

L∞ (IR) := {f mensurável ; ||f ||∞ < ∞} .

O segundo membro de (II.44) é denominado o supremo essencial de f .


Observe que f pode ser modificada num conjunto de medida nula de modo
a termos:
sup ess
sup |f (x)| = |f (x)| .
x x
II.14. A INTEGRAL DE LEBESGUE 65

É de grande importância em numerosas aplicações o

Teorema: L∞ (IR) é um espaço de Banach.

Com efeito, seja {fn } seqüência de Cauchy. Se

Ak := {x; |fk (x)| > ||fk ||∞ }

e
Bm,n := {x; |fm (x) − fn (x)| > ||fm − fn ||}
pomos
E := ∪∞
k,m,n=1 Ak ∪ Bm,n .

Então conclui-se que E tem medida nula. Modificamos fk (x) em E ,


pondo fk (x) = 0 , e concluı́mos que {fn } é uma seqüência de Cauchy de
funções limitadas, sendo assegurada sua convergência (uniforme) para uma
f ∈ L∞ (IR) , no complementar de E .
É comum considerarmos p := 1 e q := ∞ como expoentes conjugados,
pois para estes valores também se verifica a desigualdade de Hölder: para
g ∈ L1 (IR) , f ∈ L∞ (IR) temos
Z
|f g| ≤ ||f ||∞ ||g||1 .

II.14.6 Teoremas de Convergência


Introduzimos em II.15 uma relação de equivalência para funções que são limite
pontual qtp de seqüências de Cauchy em C0 (IR) . Para estas seqüências já se
sabia, a priori, que se verifica a convergência em norma e, conseqüentemente,
Z Z
lim fn = lim fn .

É então natural formular o seguinte problema: seja fn ∈ L1 (IR) tal que


n
fn (x) → f (x) qtp .

Pode-se então garantir que:

i) f ∈ L1 (IR) ?
66 CAPÍTULO II. OS CONCEITOS BÁSICOS
R n R
ii) fn → f?

Os exemplos abaixo mostram que nem sempre i) e ii) se verificam.

Exemplo 1 Tomemos f ≥ 0 , f ∈ C0 (IR) e fn (x) := f (x − n) .


Tem-se que fn → 0 pontualmente mas
Z Z
f = limn fn 6= 0 = limn fn . (II.45)

Exemplo 2 Para fn := Ψ[0,n] /n , (II.45) também se verifica, sendo que


neste caso a convergência das fn é uniforme.
As funções fn dos exemplos acima são uniformemente limitadas tanto pon-
tualmente como na norma k•k1 . Observe, porém, que não existe uma função
g ∈ L1 (IR) tal que
|fn | ≤ g ∀n .
Diz-se de uma seqüência que satisfaça esta propriedade ser dominada por g
e vale o seguinte

Teorema da Convergência Dominada (de Lebesgue). Se uma dada


seqüência fn convergir para f qtp e se fn for dominada por alguma
g ∈ L1 (IR) , então valem

i) f ∈ L1 (IR)
n
ii) kfn − f k1 → 0

e, conseqüentemente:
Z Z Z
limn fn = f = limn fn .

Exercı́cio 47 a) Calcule
Z  n
n x
limn→∞ 1+ exp−2x dx ;
0 n
b) Demonstre que, se f (x) := |x|α Ψ(0,1] (x) ,

f ∈ L1 (IR) ⇐⇒ α > −1 .
II.14. A INTEGRAL DE LEBESGUE 67

Este exercı́cio ilustra a técnica de truncamento de funções acoplada ao Teo-


rema da Convergência Dominada para o cálculo do valor de integrais em con-
juntos não limitados.

O resultado que segue, além de ter interesse per se, nos vai permitir falar
na integral de Lebesgue de uma função f ≥ 0 , ou f ≤ 0 , mesmo quando
f 6∈ L1 (IR) .

Teorema da Convergência Monótona (Lebesgue) Suponhamos que, para


1
n = 1, 2, . . . , fn ∈ L (IR) e
0 ≤ f1 ≤ f2 ≤ . . . ≤ fn ↑ f qtp . (II.46)
Então: Z
1
f ∈ L (IR) ⇐⇒ fn < M
e, neste caso, Z Z
f = limn fn . (II.47)
Demonstração Se f ∈ L1 (IR) , pelo Teorema da Convergência Dominada,
R
(II.47) se verifica e, portanto,
R
as integrais fn são uniformemente limitadas.
Reciprocamente, se fn < M, {fn } é seqüência de Cauchy em L1 (IR) ,
pois, para m > n ,
Z Z Z Z
kfm − fn k1 = |fm − fn | = (fm − fn ) = fm − fn
R
e, sendo a seqüência de reais { fn } monótona e limitada, ela é conver-
gente, logo de Cauchy. O teorema de Riesz-Fischer (ver II.15) nos garante
que lim fn = f (em L1 (IR) ) e mais, usando o Teorema da Convergência
Dominada, obtemos (II.47).
Seja f ≥ 0 e suponhamos que exista uma seqüência de funções em L1 (IR)
satisfazendo (II.46). Definimos então a integral de f como sendo o real
estendido14 dado por Z Z
f := limn fn .

É claro que, se f ≤ 0 e 0 ≥ fn ≥ fn+1 ↓ f , definimos


Z Z
f := − (−f ) .
14
isto é, um elemento de IR ∪ {−∞, ∞},
68 CAPÍTULO II. OS CONCEITOS BÁSICOS

Exercı́cio 48 Verifique que as definições acima são “boas”, ou seja, indepen-


dem das seqüências tomadas e coincidem com a introduzida para f ∈ L1 (IR) .
Observemos que para a definição acima precisamos supor, a priori, a existência
de seqüências de funções que aproximem f . De fato, para uma f arbitrária,
nem sempre é possı́vel encontrar uma seqüência com esta propriedade. Dire-
mos que f é mensurável se f for limite qtp de funções de L1 (IR) .

É útil comparar o teorema acima com o

Exemplo 3. Seja fn := Ψ[n,∞) . Tem-se que:


fn ≥ fn+1 ↓ 0
mas Z Z
∞ = limn fn 6= limn fn = 0 .
Por outro lado, se gn := − fn ,
gn ≤ gn+1 ↑ 0
mas Z Z
limn fn 6= limn fn .
Recordemos que, para uma seqüência arbitrária de reais {αn } , o conceito de
lim inf , introduzido como
lim inf αn := lim {inf αn } = sup {inf αn } ,
n→ ∞ k→∞ n≥k k n≥k

é um elemento da reta estendida, IR ∪ {−∞, +∞} , que existe independen-


temente de propriedades dos {αn } .
É uma conseqüência do Teorema da Convergência Monótona o

Lema de Fatou. Sejam fn ≥ 0 funções mensuráveis quaisquer. Então se


verifica sempre a desigualdade
Z   Z 
lim
n→ ∞
inf fn ≤ lim
n→ ∞
inf fn . (II.48)

Observe que, no primeiro membro desta desigualdade, integra-se uma função


definida pontualmente com a utilização do conceito de lim inf . A demonstra-
ção do Lema pode ser encontrada na Ref.[45], pp.22. Convém mencionar que
podemos ter a desigualdade estrita em (II.48), cf. Exemplos 2-3 nesta seção.
II.14. A INTEGRAL DE LEBESGUE 69

II.14.7 O Teorema de Fubini; Diferenciação × Inte-


gração
Os elementos de Lp (IR) , para 1 < p < ∞ , são também funções generali-
zadas como as que encontramos em L1 (IR) . Elas se tornam mais familiares
se pensadas como funções mensuráveis definidas qtp, com |f |p ∈ L1 (IR) .
Por continuidade, as desigualdades de Hölder e Minkowski continuam sendo
válidas em Lp (IR) .

Exercı́cio 49 Um conjunto E é dito mensurável se ΨE é uma função


mensurável. Dada f definida num conjunto E mensurável, diremos que
f ∈ Lp (E) se pertencer a Lp (IR) a extensão
"
ˆ := 0 x ∈
6 E
f(x) .
f (x) x ∈ E

Defina em Lp (IR) a relação de equivalência RE , para E mensurável,

f RE g ⇐⇒ f ΨE = gΨE qtp .

O espaço Lp (E) é então definido como o espaço quociente Lp (IR)/RE . Veri-


fique que esta definição é equivalente à anterior. •

Uma caracterização de funções simultaneamente integráveis no sentido de Le-


besgue e de Riemann, para um intervalo [a, b] finito, é o conteúdo do seguinte

Teorema 1.15 Seja f ∈ L1 (a, b) limitada. Então f ∈ R(a, b) se e


só se os pontos de descontinuidade de f compõem um conjunto no máximo
enumerável. •

Conforme observado anteriormente, cf. II.14.3, utilizamos até aqui apenas


a integração em subconjuntos da reta IR com o objetivo de simplificação. No
que segue, porém, estaremos lidando necessariamente com a integral tomada
em conjuntos do IRn , para n ≥ 2 .

Suponhamos seja Q := [a, b] × [α, β] ⊂ IR2 um retângulo limitado onde


15
A demonstração deste resultado se encontra, por exemplo, em [44], pp.248.
70 CAPÍTULO II. OS CONCEITOS BÁSICOS

está definida a função contı́nua f : Q → IR . É um fato importante que,


RR
para obter o valor da integral dupla Q f (s, τ ) ds dτ , podemos lançar mão
de qualquer das duas expressões seguintes, as quais relacionam uma integração
em duas variáveis a duas integrações (sucessivas) para uma única variável, ou
seja, integrais repetidas:
Z Z  R b hR β i
= f (s, τ ) dτ ds
R hR i
a α
f (s, τ ) ds dτ β b . (II.49)
Q = α a f (s, τ ) ds dτ

Um ponto crucial neste resultado costuma ser pouco percebido. A ênfase recai
comumente apenas no processo da troca de limites, ou mudança na ordem de
integração, expresso em (II.49). Quando dispomos de hipóteses mais fracas
– por exemplo, se apenas soubermos ser f Riemann-integrável –, a fim de
poder considerar (II.49), como garantir a integrabilidade das funções (de uma
variável)
R #
φτ (s) := f (s, τ ) ∀ τ ; Φ(τ ) := ab φτ (s) ds
R , (II.50)
λs (τ ) := f (s, τ ) ∀ s ; Λ(s) := αβ λs (τ ) dτ

cujas integrais aparecem em (II.49) ?

São estes os resultados abordados pelo

Teorema de Fubini.16 Seja

f : Q := [a, b] × [α, β] ⊂ IR2 → IR

uma função mensurável. Se f ∈ L1 (Q) , então – usando a notação intro-


duzida em (II.50) – se tem que

φτ ∈ L1 (a, b) qtp em (α, β) , Φ ∈ L1 (α, β)


λs ∈ L1 (α, β) qtp em (a, b) , Λ ∈ L1 (a, b)

e (II.49) se verifica.

16
A presente formulação se restringe ao IR2 e a retângulos, mas são válidas generaliza-
ções para conjuntos Q := E × F , tanto com E , F ⊂ IR mensuráveis arbitrários,
como sendo E ⊂ IRm , F ⊂ IRn também mensuráveis, com m , n ∈ IN quaisquer. A
demonstração e enunciados ainda mais gerais podem ser consultados em [45].
II.14. A INTEGRAL DE LEBESGUE 71

Exercı́cio 50 Denotando por Qı o quadrado [ı, ı + 1] × [,  + 1] ⊂ IR2 ,


para ı ,  = 0 , 1 , 2 , . . . , por Ψı := ΨQı , e tomando

1 =ı

aı :=  (1/2ı ) − 1 =ı+1 ,
0 demais valores
seja #
f : IR2 → IR
P .
(x, y) → f (x, y) := ∞ 
ı,=0 aı Ψı (x, y)

Verifique que, para esta função – que não pertence a L1 (IR2 ) – as integrais
repetidas correspondentes a (II.49) têm valores distintos.

Exercı́cio 51 Refaça o exercı́cio anterior, agora para uma função


f : [0, 1]2 → IR .

O Teorema de Fubini indica condições em que se pode alterar a ordem de ava-


liação de duas integrais iteradas. Já no Capı́tulo I chamávamos a atenção para
o fato de requerer sempre cuidado a inversão da ordem em que se tomam dois
processos-limite. Analisemos agora como “diferenciar sob o sinal de integral”,
ou seja, a interação de dois processos-limite distintos.

Considere, por exemplo, o operador definido num espaço de funções reais de


variável real f → g ,
Z
g (s) := K(x, s) f (x) dx , (II.51)
I

onde I é um intervalo – possivelmente não limitado – e, para cada s , ou


ao menos qtp, K(•, s) f (•) ∈ L1 (IR) . Questionamos se g(s) é derivável
quando existir a derivada parcial ∂K(x, s)/∂s e se vale
Z
d ∂
g(s) = K(x, s) f (x) dx . (II.52)
ds I ∂s

Em caso afirmativo, quais as hipóteses, precisamente.


Ora, provar (II.52) equivale a obter
Z Z
lim [∆s,h K(x, s) f (x) dx] = lim [∆s,h K(x, s)] f (x) dx
h→0 I I h→0
72 CAPÍTULO II. OS CONCEITOS BÁSICOS

para o operador de diferenças finitas

∆s,h φ(s) := [ φ(s + h) − φ(s) ] / h , h ∈ IR (II.53)

que, sendo linear, permite reescrever aquela relação como


Z Z
lim [∆s,h K(x, s)] f (x) dx = lim [∆s,h K(x, s)] f (x) dx .
h→0 I I h→0

Claro que, para estar definido o segundo membro de (II.52), necessitamos


f ( •) K(•, s) ∈ L1 (IR)
∂s
e verifica-se ser essa a única hipótese exigida: basta observar que se podem
garantir as condições do Teorema da Convergência Dominada, cf. subseção
anterior. Como em todo resultado que envolve diferenciação de uma seqüência
de funções, torna-se indispensável formular hipóteses sobre a derivabilidade da
função limite, nunca podendo ser extraı́das conclusões sobre a derivada – ou
diferenciabilidade – do limite apenas a partir de propriedades dos elementos
da seqüência (compare com o resultado para distribuições no Teorema IV.4.1).
Observemos finalmente que, sendo a derivada um operador local, a verificação
do teorema que segue pode se restringir a subintervalos do domı́nio de f afim
de obter as necessárias limitações para os operadores (II.53), ver por exemplo
[27].

Teorema 2 (Diferenciação da Integral) Sejam g definida por (II.51) e


f (•) , K(•, s) f (•) , f (•) K(•, s) ∈ L1 (IR) .
∂s
Então g é diferenciável, satisfazendo sua derivada a relação (II.52).

Observações Bibliográficas Expusemos uma construção da Integral de


Lebesgue que segue essencialmente [34]; [43] e [45] introduzem a noção de
medida axiomaticamente; [6] é bem claro, com muitos exemplos; em [22], [42]
e [44], exposições elegantes e razoavelmente breves, cada uma com uma difer-
ente abordagem. Vale a pena também consultar [32].
Capı́tulo III

O Dual de um Espaço Normado

III.1 Introdução

Estudaremos neste capı́tulo algumas propriedades das formas lineares sobre


um espaço normado V , isto é, dos operadores lineares

` : V → IR .

Denotaremos por V 0 o espaço vetorial de todas as formas lineares definidas


em V (dito o dual algébrico de V ), enquanto V ∗ representará o espaço
vetorial dos funcionais lineares contı́nuos sobre V , ou dual topológico de
V . Tem-se sempre que V ∗ ⊂ V 0 e já observamos (Exercı́cio II.32) que V ∗
é um espaço de Banach, quando munido da norma definida em (II.28), seja V
completo ou não. (Enfatizamos que, quando usarmos a notação V ∗ , estare-
mos sempre nos referindo a este espaço vetorial de formas lineares contı́nuas,
munido da norma de operadores!)

III.2 Formas Lineares e Hiperplanos

Num espaço vetorial V , um subespaço H é dito hiperplano se, dado


qualquer outro subespaço W para o qual H ⊂ W ⊂ V , se tem neces-
sariamente H = W ou W = V , isto é, H é um subespaço maximal. É

73
74 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

equivalente definir:

Exercı́cio 1 O subespaço H ⊂ V é um hiperplano se existe w ∈ V \H


tal que, para cada v ∈ V , se verifica

v = αw + h (III.1)

com α = α(v) ∈ IR e h = h(v) ∈ H , ou seja H ∪ {w} gera o espaço V .


L
Deduz-se que a expansão (III.1) é única, e por isso se escreve V = H [ω] .

Dada ` ∈ V 0 , denotamos por ker(`) o núcleo de ` :

ker(`) := { v ∈ V ; ` v = 0 }.

Se ` for não nula, ker(`) é um hiperplano: de fato, tomando w ∈ V , com


` w = 1 , e definindo, para cada v ∈ V ,

αv := `v hv := v − αv w ,

temos que hv ∈ ker(`) e v = αv w + hv .


Reciprocamente, dado um hiperplano H , podemos construir uma forma linear
cujo núcleo é H : basta atribuir um valor (arbitrário) para `w com v em
(III.1), e usar a linearidade naquela expressão para definir ` :

`v := α(`w) .

Tem-se ainda que

ker(`1 ) = ker(`2 ) , `1 , `2 ∈ V 0 =⇒ `1 = α`2 , para algum real α .

Quando ` ∈ V ∗ , ker(`) é fechado e, de fato, vale:

Um funcional linear ` é contı́nuo se e só se ker(`) é fechado.

Este resultado é conseqüência de que, se ` ∈ V 0 não é limitada, a imagem


por ` de qualquer bola é a reta IR .
Com efeito, sejam δ > 0 e α > 0 arbitrários. Sendo ` não limitada, existe
v = vδ com
kvδ k < δ , `vδ > α .
III.2. FORMAS LINEARES E HIPERPLANOS 75

Por linearidade

`{tvδ , −1 ≤ t ≤ 1} = [−`vδ , `vδ ] ⊃ [−α, α] .

Considere agora, para um real β 6= 0 qualquer,

Lβ := {v ∈ V ; `v = β} .

Sendo fechado o núcleo de ` , também é fechado Lβ , pois este conjunto é


uma translação de ker(`) :

Lβ = βw + ker(`) , com `w = 1 .

Como 0 6∈ Lβ , para alguma bola B(0; δ) devemos então ter

B(0; δ) ∩ Lβ = ∅ ,

o que contradiz ser a imagem de B(0; δ) por ` igual a toda a reta IR .


Observemos que o fecho de um subespaço vetorial é também um subespaço,
de forma que:

Um hiperplano, sendo um subespaço maximal, ou é denso, ou é


fechado.

Podem então ser caracterizadas as formas lineares de V 0 e V ∗ por:


#
` ∈ V∗ ⇐⇒ ker(`) é fechado
0 ∗ .
` ∈ V , ` 6∈ V ⇐⇒ ker(`) é denso
Exercı́cio 2

i) Verifique que, se φ ∈ C0∞ (IR) , então R


φ = ψ 0 , para alguma ψ ∈ C0∞ (IR) ⇐⇒ IR φ(x)dx = 0 .

ii) Demonstre que, para toda φ ∈ C0∞ (IR) , temos uma representação

φ = θ0 + αψ0 ,

sendo ψ0 ∈ C0∞ (IR) fixa e θ ∈ C0∞ (IR) variando com φ .


76 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

Consideremos agora o seguinte problema: dada uma forma linear contı́nua `


sobre um hiperplano H ⊂ V , como obter `˜ ∈ V ∗ , sendo `˜ extensão de
` ? Os casos de ` ≡ 0 ou H = V foram discutidos. Sendo pois, H um
hiperplano fechado e usando a notação de (41), qualquer extensão linear de `
deve necessariamente satisfazer
˜ = α`w
`v ˜ + `h ,

de modo que só temos a determinar o valor de `w ˜ . Ocorre que, se V


é um espaço de Banach, a escolha deste valor é irrelevante com relação à
continuidade de ˜
` . De fato, temos
˜ ≤ |α| |`w|
|`v| ˜ + k`| khk ≤ max{|`w|,
˜ k`k}(|α| + khk)
˜ k`k}βkvk ,
≤ max{|`w|,
onde a última desigualdade é conseqüência de ser
|||v||| := khk + |α|
uma norma equivalente à norma de V , conforme se deduz do Teorema 1,
Seção II.13, pois
kvk = kαw + hk ≤ max{kwk, 1}|||v||| .
Demonstramos assim o

Teorema 1. Seja H um hiperplano fechado de um espaço de Banach


V e seja ` um funcional linear contı́nuo sobre H . Quaisquer que sejam
w ∈ V \H e γ ∈ IR , é contı́nuo o funcional linear `˜ ∈ V 0 dado por
˜ := γ , `h
`w ˜ := `h , h ∈ H .

III.3 O Teorema de Representação de Riesz

Seja V um espaço de Hilbert e w ∈ V um vetor fixo. O funcional


fw : V → IR
(III.2)
v → fw v := (v|w)
III.3. O TEOREMA DE REPRESENTAÇÃO DE RIESZ 77

pertence a V ∗ , como observamos no Exemplo 1.5.1.c . De fato, temos


kfw k = kwk , (III.3)
pois fw w = kwk2 e, pela desigualdade de Schwarz, kfw k ≤ kwk .

Da linearidade do produto interno segue a linearidade da transformação


#
J : V → V∗
,
w → Jw := f w
e de (III.3) segue que J é uma isometria, portanto, biunı́voca. Os funcionais
em J(V ) têm assim uma representação natural relativa aos vetores de V .
Formula-se a pergunta: é J sobre? Ou seja, dada f ∈ V ∗ , é sempre possı́vel
determinar um vetor w ∈ V tal que f = fw ?
Se tal w existir ele é único e é necessariamente ortogonal a ker(f ) . Re-
ciprocamente, se ker(f ) é um hiperplano (fechado) para o qual é possı́vel
encontrar um vetor w̃ 6= 0 ortogonal, w̃ ⊥ ker(f ) , então f ∈ J(V ) . A
pergunta proposta é então respondida afirmativamente desde que possamos
encontrar para cada hiperplano fechado H , um vetor não nulo w̃ ⊥ H .

Seja u 6∈ H . O vetor u não é necessariamente ortogonal a H , mas a


partir dele construiremos w ∈ V , w 6= 0 , w ⊥ H .
Por analogia ao espaço IR3 , buscaremos o vetor w a partir da projeção
ortogonal de u sobre H : determinamos um vetor h0 ∈ H que minimiza
(em H ) a função ku − hk .
Sendo H fechado e u 6∈ H, denota-se
d : distância (u, H) := inf ku − hk > 0 .
h∈H

Seja {hn } uma seqüência em H para a qual


ku − hn k → d .
Afirmamos ser esta uma seqüência de Cauchy. Com efeito, usando a regra do
paralelogramo (II.11), deduz-se:
khm − hn k2 = k(hm − u) − (hn − u)k2
  2

= 2khm − uk2 + 2khn − uk2 − 2 hm +h
2
n
−u
2 2 2
≤ 2{khm − uk + khn − uk − 2 d } → 0
78 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

se m, n → ∞ , sendo a desigualdade obtida por valer (hm + hn )/2 ∈ H.


Como V é completo e H é fechado, H é necessariamente completo e
conseqüentemente hn converge para algum vetor h0 ∈ H .
Tem-se então que, tomando w := u − h0 , deduz-se ser d = kwk . Além
disso, (w|h) = 0 , ∀ h ∈ H . De fato, seja h ∈ H qualquer; para α ∈ IR
arbitrário se verifica

d2 ≤ kv − αhk2 = d2 − 2(w|h)α + khk2 α2 ,

o que implica ser nulo o coeficiente de α , (w|h) .


Finalmente, observemos que se existir outro vetor h1 ∈ H , h1 6= h0 , para
o qual d = ku − h1 k , então (h0 + h1 )/2 ∈ H e, outra vez por (II.11), segue

ku − (h0 + h1 )/2k2 = 2k(u − h0 )/2k2


+2k(u − h1 )/2k2 − k(h0 − h1 )/2k2 < d2 ,

o que contradiz ter h0 a propriedade de minimizar ku − hk , h ∈ H .


Resumindo, podemos enunciar o

Teorema (de Representação de Riesz). Seja H um espaço


de Hilbert. A cada forma linear contı́nua f ∈ H ∗ corresponde
um único vetor w = wf ∈ H tal que

f v = (w|v) , ∀v ∈ H . (III.20)

Reciprocamente, para cada w ∈ H fixo, (III.2) define uma forma


linear f = fw que pertence a V ∗ , e tem-se

kfw kH∗ = kwkH . (III.30)

Exercı́cio 3 Verifique que, num espaço de Hilbert,

kvk = sup (v|w) .


kwk=1
III.3. O TEOREMA DE REPRESENTAÇÃO DE RIESZ 79

III.3.1 O Teorema de Representação de Lax–Milgram

Dado um espaço de Hilbert H , o Teorema de Riesz nos permite identificar


as formas lineares contı́nuas de H ∗ aos vetores de H . O teorema que apre-
sentamos nesta seção é uma generalização deste resultado.

Seja B uma forma bilinear sobre H , isto é, a cada par (x, y) de ele-
mentos de H , B associa um real de modo que, para cada x fixo, B(x, •) é
um funcional linear e, da mesma forma, para y fixo, B(•, y) é linear. Supon-
hamos também que B seja limitada, com o que queremos dizer que existe
uma constante C para a qual se verifica a desigualdade

|B(x, y)| ≤ Ckxk kyk , ∀x, y ∈ H .

Esta propriedade implica que os funcionais βx := B(x, •) , isto é,

βx : H → IR
y → βx = B(x, y)

são limitados, sendo sua norma ≤ Ckxk .


É natural questionar: quais funcionais de H ∗ podem ser representados em
termos de B na forma acima? Em outros termos, qual a porção de H ∗ que
se pode gerar com as formas lineares definidas por meio da expressão com que
se introduziu βx ?
Observemos que, pelo Teorema de Riesz, dado x ∈ H , existe um único
v = v(x) ∈ H tal que

B(x, y) = (v | y) , ∀y ∈H. (III.4)

Trata-se então de determinar a imagem da transformação limitada

TB : H → H
,
x → TB x := v

onde v satisfaz (III.4). Imponhamos a condição de ser B coerciva, isto é,


de existir uma constante c > 0 tal que

|B(x, y)| ≥ c kxk2 ∀x ∈ H .


80 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

Então TB é necessariamente biunı́voca e, mais ainda, é contı́nua a aplicação


TB−1 : V := Im(TB ) → H , pois basta usar o Exercı́cio II.34 e a desigualdade

ckxk2 ≤ |B(x, x)| = |(TB x|x)| ≤ kTB xk kxk .

Sendo TB e sua inversa contı́nuas, o subespaço V é necessariamente com-


pleto, e é então um espaço de Hilbert. A ele podemos aplicar o Teorema de
Representação de Riesz relativamente aos funcionais de V ∗

v → (v|u) com u ∈ H arbitrário,

o que nos dá


(v|u) = (v|w) ,
para algum w = w(u) ∈ V e todo v ∈ V . Assim, u − w ∈ V ⊥ , mas

cku − wk2 ≤ |B(u − w|u − w)| = (TB {u − w}|u − w) = 0 ,

o que implica

u − w = 0 =⇒ u ∈ V =⇒ V = H .

Em resumo, demonstramos o

Lema de Lax–Milgram.1 Seja B uma forma bilinear limitada e


coerciva sobre o espaço de Hilbert H , munido do produto interno
(•|•) . Então, a cada x ∈ H está associado um único vetor
v = v(x) ∈ H tal que

(x | u) = B(v, u) , ∀u ∈ H .

Chamamos a atenção do leitor para o fato de não ser necessário supor B


simétrica. Fica claro existir uma simetria entre as variáveis x e y nos
argumentos que discutimos.

Exercı́cio 4 Verifique que, sob as hipóteses acima para B , se tem

kTB k = C , kTB−1 k = 1/c


1
Assim é este Teorema de Representação comumente mencionado na literatura.
III.3. O TEOREMA DE REPRESENTAÇÃO DE RIESZ 81

se
C := sup{kxk=kyk=1} B(x, y) , c := inf {kxk=1} B(x, x) . •

Exercı́cio 5 É uma conseqüência da desigualdade do triângulo

|B(x, y) − B(ξ, η)| ≤ |B(x, y) − B(x, η)| +


|B(x, η) − B(ξ, η)| ≤ C{ kx − ξk + ky − ηk .

que, como uma função de H 2 em IR , a forma B , sendo limitada e bilinear,


é contı́nua quando tomamos em H 2 quaisquer das normas

k(u, v)kp, H := k(kukH , kvkH )kp , p = 1, 2, ∞ .

Como aplicação do Lema de Lax–Milgram, consideremos agora a equação esta-


cionária de Stokes para a velocidade u = u(x) ∈ IR3 e a pressão interna
p = p(x) ∈ IR de um fluido confinado a uma região Ω ⊂ IR3 :
#
a) −ν4u + ∇p = f
em Ω
b) ∇·u = 0 . (III.5)
c) u = 0 em ∂Ω = fronteira de Ω

Aqui, ν > 0 é uma constante dada (coeficiente de viscosidade) e a força


externa f é conhecida.
Vamos operar de maneira informal, admitindo todo o grau de regularidade2 .
que necessitarmos para u , p e f .
Multiplicamos (III.5a) por uma função v , também regular e que satisfaz as
mesmas condições (III.5b) e (III.5c) impostas a u , e integramos sobre Ω .
Obtemos, após integração por partes,

ν(∇u, ∇v) − (p, ∇ · v) = (f, v)

onde, observe, estamos denotando por (•, •) o produto interno tanto para
funções vetoriais ( Ω → IR3 ), como para funções reais ( Ω → IR ).
A condição (III.5c) implica a anulação do termo de fronteira na primeira inte-
gração por partes, enquanto (III.5b) acarreta a anulação da segunda parcela.
Conclusão: u é solução da inequação variacional

ν(∇u, ∇v) = (f, v) ∀v ∈ V , (III.6)


2
Ver nota após (II.27)
82 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

onde V é o espaço de funções regulares que satisfazem (III.5b) e (III.5c).


Verifica-se, como no Exemplo II.13.2, que a forma bilinear (∇u, ∇v) é coer-
civa:
(∇u, ∇u) ≥ αkuk2
relativamente à norma Z
2
kuk := (u, u)dx ,

de forma que o Lema de Lax–Milgram garante a existência de u ∈ V


satisfazendo (III.6).
O passo final é provar que u , sendo regular, satisfaz (III.5a).

III.4 O Teorema da Projeção

No estudo das formas lineares sobre um espaço normado V , foi fundamental


observarmos que existe uma correspondência entre aquelas e os hiperplanos
de V , sendo que às formas contı́nuas estão associadas os hiperplanos fecha-
dos. No Teorema da Representação de Riesz, consideramos, para uma dada
` ∈ V ∗ , a projeção ortogonal sobre o hiperplano fechado ker(`) . Nesta
seção, estudaremos operadores de projeção ortogonal sobre subespaços fecha-
dos arbitrários num espaço de Hilbert.
O objetivo é demonstrar o Teorema da Projeção, um resultado que, ao mesmo
tempo, generaliza o Teorema da Representação de Riesz e é demonstrado como
uma conseqüência daquele. Será estabelecida uma correspondência 1-1 entre
os subespaços fechados de um espaço de Hilbert e os operadores de Projeção.

Diz-se que um operador linear P : V → V sobre um espaço vetorial


é uma projeção se P 2 = P . Neste caso, denotando a imagem de P por

Im(P ) := {v ∈ V ; v = P w para w ∈ V } ,

tem-se que M
V = Im(P ) ker(P ) ,
o que significa, V é a soma direta de Im(P ) e ker(P ) , ou seja, para cada
v ∈ V , se pode determinar um único par (v1 , v2 ) com
III.4. O TEOREMA DA PROJEÇÃO 83

v1 ∈ Im(P ) , v2 ∈ ker(P ) ,
v = v1 + v2 .
L
Reciprocamente, se V = V1 V2 , pode-se determinar um operador de
projeção P tal que
V1 = Im(P ) , V2 = ker(P ) .
Quando V é um espaço normado, as projeções que consideramos são supostas
limitadas. Tem-se que, sendo P um operador de projeção, o espaço V é
decomposto em soma direta de dois subespaços fechados. A recı́proca deste
resultado é válida, desde que V seja completo:
Dados um espaço de Banach B e dois subespaços fechados F1 e
L
F2 tais que B = F1 F2 , existe um (único) operador de projeção
P para o qual Im(P ) = F1 , ker(P ) = F2 .
A demonstração deste resultado se baseia num dos três princı́pios básicos da
Análise Funcional, o Teorema do Gráfico Fechado, e pode ser encontrada em
[47], pp. 237.

Num espaço de Banach arbitrário não se pode garantir a existência de proje-


ções. Já num espaço de Hilbert, temos um “grande” número delas, como pode
ser deduzido do

Teorema da Projeção. Seja V um espaço de Hilbert e U um subes-


paço fechado de V . Então
L
V = U U⊥ ,
onde denotamos U ⊥ := {v ∈ V ; (v|u) = 0 , ∀ u ∈ U } .

Se v = v1 + v2 , v1 ∈ U , v2 ∈ U ⊥ , sendo esta representação


univocamente determinada, o operador
PU : V → V
v → PU v := v1
é um operador de projeção. A continuidade de PU segue do Teorema de
Pitágoras3 :
kvk2 = kv1 k2 + kv2 k2 =⇒ kPU k ≤ 1 .
3
De fato, kPU k = 1 , já que em U , PU ≡ identidade.
84 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

Assim, deduzimos que a cada subespaço fechado de um espaço de Hilbert


corresponde um operador de projeção.
Demonstração Considere, para v ∈ U , fixo, o funcional
#
`v : U → IR
.
v∈U → `v u := (u|v)
Como `v ∈ U ∗ , o Teorema de Representação de Riesz garante a existência
de um único w = w(v) ∈ U tal que
`v u = (w|u) , ∀u ∈ U .
Logo:

(w − v|u) = 0 , ∀u ∈ U ,
ou seja,
w − v ∈ U⊥ .
Observe que
dist(v, U) = kv − wk
pois, para u ∈ U ,
kv − uk2 = kw + (v − w) − uk2 = k(v − w) + (w − u)k2
= kv − wk2 + kw − uk2 + 2(v − w|w − u)
= kv − wk2 + kw − uk2 ≥ kv − wk2 .

U⊥
6
v−w v
6 
-w
U

Geometricamente, a projeção ortogonal de um vetor v sobre um subespaço


vetorial fechado W é o vetor w de W que fornece a melhor aproximação
para v , ou seja, que minimiza a função
f (z) := kv − zk , z ∈ W .
III.4. O TEOREMA DA PROJEÇÃO 85

Conclui-se portanto que w é solução de um problema de otimização. Um tal


w é único e este resultado continua válido num contexto mais geral: exigimos
apenas que W seja um convexo4 fechado.
É o que enunciamos no

Teorema da Projeção (melhorado). Seja V um espaço de


6 ∅ um subconjunto convexo e fechado de V .
Hilbert e seja W =
Dado qualquer v ∈ V , existe um único w = w(v) = PW v em
W tal que

kv − zk ≤ kv − wk , ∀ z ∈ W , (III.7)

ou seja,

dist (v, W ) = inf kv − zk = kv − wk . (III.70 )


z∈W

É fácil ver que nenhuma das duas hipóteses pode ser dispensada: não sendo
W fechado, pode não valer a existência; se W não for convexo, mais de uma
solução pode existir. (Basta considerar em IR2 ,

v = (0, 0) e W := {(x, y); x > 1} ,

no primeiro caso, ou

W := {(x, y); x ≥ 1 − y ou x ≤ y − 1 } ,

no segundo.)

A demonstração do Teorema segue os passos da que apresentamos para provar


o Teorema de Riesz: construção de uma seqüência minimizante e verificação
de que seu limite existe em W .
O operador
PW : V → W
4
Diz-se que um conjunto C num espaço vetorial é convexo se, dados dois elementos
v1 , v2 ∈ C , o segmento que os une está contido em C , ou seja,

v1 , v2 ∈ C =⇒ tv1 + (1 − t)v2 ∈ C ∀t ∈ [0, 1] .


86 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

acima definido é dito ser a projeção sobre o convexo W . Observemos que,


para quaisquer z ∈ W , 0 ≤ θ ≤ 1 ,

kv − PW vk2 ≤ kv − [θz + (1 − θ)PW v]k2 =


= kv − PW v + θ(PW v − z)k2 =
= kv − PW vk2 + 2θ(v − PW v, PW v − z) + θ2 kPW v − zk2 .

Conseqüentemente, para qualquer θ > 0 ,

2(v − PW v, PW v − z) + θkPW v − zk2 ≥ 0 ,

o que implica
(v − PW v, PW v − z) ≥ 0 , ∀z ∈ W . (III.700 )
Reciprocamente, se w ∈ W satisfaz

(v − w, w − z) ≥ 0, ∀z ∈ W ,

então w = PW v .
De fato,

kv − zk2 = kv − w + w − zk2
= kv − wk2 + 2(v − w, w − z) + kw − zk2 ≥ kv − wk2 .

Concluı́mos que (III.7), (III.70 ) e (III.700 ) são todas formulações equivalentes.


Esta última é dita uma inequação variacional. Geometricamente ela expressa
a condição de formarem os vetores v − PW v e z − PW v um ângulo θ > 90◦ .

Quando W é um subespaço,
 v
podemos tomar z = y − PW v ' $

em (III.700 ), com y ∈ W ar- * C PW v

 -CW
bitrário, do que segue z
(v − PW v, y) ≥ 0 , ∀y ∈ W ,
e como −y ∈ W , deduz-se a & %
condição de ortogonalidade W
(v −PW v, PW v −z) = 0, ∀z ∈ W.
Neste caso, PW v é uma contração, pois

kPW v − PW v 0 k = kPW (v − v 0 )k ≤ kv − v 0 k .
III.5. REPRESENTAÇÃO DE ALGUNS DUAIS 87

Esta propriedade é ainda válida para W convexo fechado. Com efeito,


tem-se que
(PW v 0 − v 0 , z 0 − PW v 0 ) ≥ 0 , ∀z 0 ∈ W . (III.8)
Tomando na inequação (III.8) e em (III.700 ), respectivamente

z 0 := PW v e z := PW v 0 ,

e somando as inequações resultantes, obtém-se

(PW v − v − PW v 0 + v 0 , PW v 0 − PW v) ≥ 0

ou
kPW v 0 − PW vk2 ≤ (PW v 0 − PW v, v 0 − v)
≤ kPW v 0 − PW vk · kv 0 − vk .
Exercı́cio 6 Demonstre:
a) Se N é um subespaço de dimensão finita de um espaço normado, então
N é fechado.
b) Seja H um espaço de Hilbert e F ⊂ H um subespaço de dimensão
L ⊥
finita. Pelo Teorema da Projeção, H = F F . Neste caso particular (e
importante), demonstre tal resultado diretamente, porém, sem usar o Teorema
de Riesz.

Exemplo 1 Os operadores TN introduzidos na Seção I. 8 são operadores de


projeção. A partir das formas lineares no Exemplo I.5.1(a), também podemos
introduzir projeções em IRN .

III.5 Representação de alguns Duais

O Teorema de Representação de Riesz nos indica uma forma mais concreta


de operar com os funcionais limitados sobre um espaço de Hilbert. Mas, para
um espaço normado qualquer, não é possı́vel obter um resultado equivalente.
Quando, porém, lidamos com exemplos especı́ficos, é possı́vel obter repre-
sentações convenientes.
88 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

Exemplo 1 O dual de c0
Seja y = (y ) ∈ `1 . Definindo
#
f : c0 → IR
P , (III.9)
x = (x ) ∈ c0 → f x := ∞=1 x y

a desigualdade

X
|f x| ≤ |x | |y | ≤ kxk∞ kyk1
=1

nos mostra não só a convergência da série envolvida em (III.9), como também
que f é limitada. Assim:
f ∈ c∗0 .
Ocorre que todos os funcionais de c∗0 têm esta forma:

Teorema 1 Dada f ∈ c∗0 , existe y = yf = (y )∈ IN ∈ `1 tal


que

X
fx = y x , ∀x = (x ) ∈ c0
=1
e
kf k = kyk1 . (III.10)
Demonstração Se tal y existir, devemos ter y = f e , onde
"
 0 ı 6= 
e = (eı )ı = (δı ) , δı := (delta de Kronecker) .
1 ı=

Definamos então y := f e e tentemos verificar se y = (y ) pertence a `1


e se vale a representação enunciada.
Seja
X
N
xN := sgn(f e )e ∈ `∞
0 ⊂ c0 ,
=1
"
sgn(a)a = |a|, ∀a ∈ IR , a 6= 0
onde .
sgn(0) = 0
Então se deduz que
X
N X
N
f xN = |f e | = |y| ≤ kf k kxN k∞ = kf k ,
=1 =1
III.5. REPRESENTAÇÃO DE ALGUNS DUAIS 89

Logo, valem
y ∈ `1 e kyk1 ≤ kf k .
Como
X
N
N
k x e − xk∞ → 0 , ∀x = (x ) ∈ c0 ,
=1

conclui-se que

X
fx = y x ,
=1

e da desigualdade

X
|f x| ≤ |y x | ≤ kxk∞ kyk1
=1

segue que kf k ≤ kyk1 , provando (III.10). •

É uma conseqüência deste resultado o

Teorema 2. Dada f ∈ c∗ , existe z = zf ∈ `1 , tal que


X
f x = z1 (lim x ) + z+1 x .
j
=1

Demonstração Como c0 é um hiperplano fechado de c , pois


L
c=S c0 ,

onde S := {(α, α, α, . . .) ∈ `∞ , α ∈ IR } , do Teorema 1, Seção II.2 decorre


a representação acima para c∗ . •

Estas identificações são o que chamamos de isomorfismos isométricos, ou


seja, os operadores

T : c∗0 → `1 T : c∗ → `1
e
f → T f := yf f → T f := yf

são lineares, 1-1, sobre, e preservam a norma. Tem-se ainda o


90 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

Teorema 3. Sejam p , 1 ≤ p < ∞ e q , seu expoente conjugado,


dado por "
qp := p/(p − 1) p 6= 1
q =
q1 := ∞ p=1
Então
(`p )∗ = `q ,
ou, de uma forma mais precisa, o dual topológico de `p pode ser identificado
ao espaço `q :

A cada funcional f ∈ (`p )∗ corresponde um único elemento


y = yf ∈ `q tal que

X
fx = y x ∀ x = (x ) ∈ `p ,
=1

e reciprocamente. Mais ainda, esta correspondência é uma isome-


tria, pois
kf k = kyf kq .

A demonstração deste resultado segue a linha dos teoremas de representação


acima e é deixada ao leitor.

É natural questionar: temos

(`∞ )∗ = `1 ?

É de fácil verificação que `1 pode ser identificado a uma parte de (`∞ )∗ :

Exercı́cio 7 Para cada y ∈ `1 ,

fy : `∞ → IR
P
x = (x ) → fy x := ∞=1 x y

é um funcional de (`∞ )∗ e
kfy k = kyk1 .
É possı́vel demonstrar – mas os fatos de que dispomos no momento não são
ainda suficientes para isto – que nem todo funcional f ∈ (`∞ )∗ é da forma
III.5. REPRESENTAÇÃO DE ALGUNS DUAIS 91

fy , para algum elemento y ∈ `1 .

Enunciamos estes resultados de identificação para alguns espaços de seqüên-


cias – mais intuitivos – com o objetivo de familiarizar o leitor à idéia da
representação de duais, partindo de situações mais simples, onde não é difı́cil
obter as demonstrações. Estes resultados são todos casos particulares de outro
Teorema de Representação de Riesz que enunciamos da seguinte forma – mais
restrita do que aquela freqüentemente encontrada, cf. [44].

Teorema (Riesz) Dado um conjunto mensurável Ω ⊂ IRN ,


sejam 1 < p, q < ∞ expoentes conjugados reais, ou q := ∞ se
p=1.
A cada funcional ` ∈ [Lp (Ω)]∗ corresponde uma função

g = g` ∈ Lq (Ω) ,

única, tal que


Z
`f = f (x)g(x)dx ∀f ∈ Lp (Ω) , (III.11)

e reciprocamente. Mais ainda,

|||`||| = kg` kq . (III.12)

Exercı́cio 8 Demonstre que, para g ∈ Lq ( Ω ) , o funcional ` introduzido


por (III.11) está em [LP ( Ω )]∗ e, diretamente, que vale (III.12). •

É importante observar que



L1 ( Ω ) 6= [L∞ ( Ω )]∗ ,

no sentido desta identificação.

Algumas das demonstrações omitidas, bem como outros resultados nesta di-
reção, podem ser encontrados em [5], [49] ou [52].
92 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

III.6 O Bidual

Sendo V um espaço normado, consideremos o dual topológico de V ∗ , que


denotamos por V ∗∗ e denominamos bidual de V . Podemos imediatamente
dar exemplos de um grande número de elementos de V ∗∗ , como segue:
Definamos a transformação

J : V → V ∗∗

v → v : V∗ → IR  .

`∈V → v (`) := `v

É evidente a linearidade de v , e sua continuidade decorre de

|v (`)| = |`v| ≤ k`kV ∗ kvkV ,

o que implica
kv kV ∗∗ ≤ kvkV ∀v ∈ V . (III.13)
De fato, demonstraremos no Capı́tulo IV que vale sempre a igualdade em
(III.13), sendo então a aplicação J uma isometria entre V e um subespaço
de V ∗∗ , comumente mencionada como identificação canônica.

Exercı́cio 9

a) Se V := `p , ou V := Lp (Ω) , com 1 < p < ∞ , ou ainda, se V é um


espaço de Hilbert, J é sobrejetora.

b) Se dim(V ) < ∞ , J é sobrejetora. •


Espaços normados para os quais o correspondente operador J é sobre são
ditos reflexivos. O Exercı́cio 9 menciona os exemplos mais importantes de
espaços reflexivos.
Uma maneira de verificar que `∞ (ou L∞ (Ω) ) não é reflexivo é observar que
existem vetores x, y ∈ `∞ (ou, respectivamente, L∞ (Ω) ), com

kxk∞ = kyk∞ = kx + yk∞ = kx − yk∞ = 1 ,

fato que está proibido de ocorrer em espaços reflexivos, conforme se deduz do


Teorema de Milman, cf. [52], pp. 126.
III.7. A REPRESENTAÇÃO DE RADON-NIKODYM 93

Uma observação final: como V ∗∗ é completo e como

kv kV ∗ = kvkV ,

já sabemos que, no caso de V não ser completo, a função J não é sobre,
isto é, V não é reflexivo. Em outras palavras,

V reflexivo =⇒ V Banach .

III.7 A Representação de Radon-Nikodym

Retornemos à expressão (II.39)


Z Z
m(A) := ΨA (x) dx = 1 dx
IR A

que define a medida de Lebesgue de um conjunto A , mensurável na reta.


Se, em vez do real 1, utilizarmos outro real positivo qualquer, estaremos
modificando o valor da medida atribuı́da aos conjuntos mensuráveis, mas de
uma forma homogênea, independentemente de sua localização. Em outras
palavras, preservando a propriedade de ser a medida de Lebesgue invariante
por translação. Equivaleria porém a atribuir pesos diferentes a localizações
distintas definirmos, para µ : IR → IR+ mensurável,
Z
λ(A) := µ(x) dx . (III.14)
A

Sendo M a classe5 de subconjuntos mensuráveis da reta, a função

λ : M → [0, ∞]

é uma nova medida, pois

[
M X
M
λ( Aı ) = λ(Aı ) , M ∈ IN ∪ {∞} , Aı ∈ M disjuntos.
ı=1 ı=1
5
Esta classe forma uma σ -álgebra, o que significa: (i) ∅ , IR ∈ M ;
(ii) A ∈ M =⇒ Ac ∈ M (iii) Aı ∈ M , M ∈ IN ∪ {∞} =⇒ ∪M ı=1 Aı ∈ M
94 CAPÍTULO III. O DUAL DE UM ESPAÇO NORMADO

Deduz-se ainda que


m(A) = 0 =⇒ λ(A) = 0 , ∀ A mensurável. (III.15)
Esta relação entre duas medidas é denotada por λ << m . Diz-se ser λ
absolutamente contı́nua com relação a m .

O Teorema de Representação de Radon-Nikodym garante – ver [45, 43] – que,


se uma dada medida λ satisfizer (III.15) relativamente à medida de Lebesgue
no IRn , então ela tem necessariamente a forma (III.14), agora para alguma
µ : IRn → IR+ mensurável e qualquer A ∈ IRn mensurável.
A função µ é conhecida então como a derivada de Radon-Nikodym de λ
com relação a m , a medida de Lebesgue no IRn .

III.8 A Terminologia de Dirac


Ao desenvolver um formalismo matemático para modelar fenômenos fı́sicos
no nı́vel das partı́culas atômicas, Paul Dirac[20] utilizou a simetria descrita no
Teorema da Representação de Riesz. Como em inglês o sı́mbolo < | > , usado
para representar o produto interno, se chama bracket, ele distinguiu os vetores
à esquerda no colchete, ou seja, os funcionais de H ∗ , dos vetores à direita,
isto é, pertencentes ao próprio espaço H , chamando-os respectivamente de
bra e de cket, e denotando-os então com < v| e com |w > .
São ambos bra e cket vetores do espaço H , mas os bra’s são identificados
com os elementos do dual. Quando eles se unem (no produto interno) dão
origem a um escalar; e o produto por um escalar é denotado α |w > ou
< v| α , conforme se opere com um cket ou um bra. Da mesma forma, para
os operadores lineares se emprega a notação T |w > ou < v| T . Assim, a
condição que define um autovetor se expressa
T |w > = λ |w > ou < v| T = < v| λ .
Dada uma transformação T e os vetores < v| e |w > , os reais
{< v| T } |w > e < v| { T |w >}
são, em princı́pio, distintos. Se para um dado operador se tem sempre a
igualdade desses valores, ou seja, se se tem associatividade, tal operador é
chamado de auto-adjunto – ou de real, por Dirac. Para esses operadores é
permitido, sem ambigüidade, eliminar as chaves, escrevendo-se < v| T |w > .
Capı́tulo IV

Espaços de Sobolev,
Distribuições

IV.1 Introdução e Notação


Neste capı́tulo expomos os conceitos de distribuições e de espaços de Sobolev,
os quais se têm mostrado indispensáveis na abordagem – tanto teórica como
numérica – de diferentes problemas em equações diferenciais.
Nos capı́tulos anteriores, os exemplos apresentados, na grande maioria, en-
volviam funções de uma única variável real. Apresentaremos a seguir a notação
de Laurent Schwartz: permite a mesma escrever de forma compacta expressões
que envolvem derivadas de qualquer função de diversas variáveis.

Seja n ≥ 1 fixo. Dados n inteiros não negativos ı1 , ı2 , . . . , ın e, no


IRn , ξ := (ξ1 , ξ2, . . . , ξn ) denotaremos

ı := (ı1 , ı2 , . . . , ın )
P
|ı| := ı1 + ı2 + . . . + ın = n=1 ı  
 .
ı! := n
ı1 ! ı2 ! . . . ın ! = Π=1 ı ! 
ı1 ı2
ξı := ın
ξ1 ξ2 . . . ξn = Π=1 ξn ı

Sendo os ıj ı́ndices, dizemos que ı é um multi-ı́ndice e, por exemplo, aı


significará aı1 ı2 ...ın . Para dois multi-ı́ndices ı e ` ,
ı! ı1 ! ı2 ! . . . ın !
(ı` ) := = .
`! (ı − `)! `1 !`2 ! . . . `n ! (ı1 − `1 )! . . . (ın − `n )!

95
96 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Usaremos o sı́mbolo D para o operador de derivação parcial ∂/∂x , com


1 ≤  ≤ n , de forma que D estará denotando o vetor gradiente
D := (D1 , D2 , . . . , Dn )
e representaremos
∂ |ı|
D ı := D1ı1 D2ı2 . . . Dnın = .
∂xı11 ∂xı22 . . . ∂xınn
No presente capı́tulo as normas k•kp em IRp serão sempre denotadas por
|•|p e para a norma euclidiana |•|2 se usará simplesmente |•| .
Os exercı́cios que seguem ilustram a conveniência da notação de Schwartz.

Exercı́cio 1 (Teorema do Binômio) Para x , y ∈ IRn e ı ,  , k


multi-ı́ndices, se verifica
X ı!
(x + y)ı = x y k .
+k=ı
! k!

Exercı́cio 2 Se x ∈ IRn e |x|∞ < 1 , então


X 1
xı = .
ı (1 − x1 )(1 − x2 ) . . . (1 − xn )
Exercı́cio 3 Se x ∈ IRn e |x|1 < 1 , então
X |ı !| 1
xı = .
ı ı! (1 − x1 − x2 − . . . − xn )
Exercı́cio 4 Para x ∈ IRn e qualquer inteiro m > 0 , vale
X m! ı
x = (x1 + x2 + . . . + xn )m .
|ı|=m
ı!

Exercı́cio 5 (Fórmula de Leibnitz) Para f , g : IRn → IR


1
suficientemente deriváveis , se tem que
X ı!
D ı [ f (x) g(x) ] = [ D  f (x) ] [ D k g(x) ] .
+k=ı !k!
1
De fato, bastará supor em quase todos os contextos em que trabalharemos, que as
funções envolvidas não se encontram definidas em todo o espaço IRN citado, mas em
algum subconjunto aberto desse espaço, as hipóteses adicionais sendo explicitadas.
IV.2. OS ESPAÇOS DE SOBOLEV H K (Ω) E H0K (Ω) 97

Exercı́cio 6 Se f : IRn → IR possui derivadas de qualquer ordem, sua


série de Taylor é
X 1
f (x) = D ı f (0) xı .
ı ı !

IV.2 Os Espaços de Sobolev H k (Ω) e H0k (Ω)


Dado um aberto Ω ⊂ IRn e um inteiro k ≥ 0 , denotamos por C k (Ω)
o espaço das funções reais definidas em Ω tais que Dr f é contı́nua para
|r| ≤ k . E por C0k (Ω) representamos o subespaço de C k (Ω) formado pelas
funções f que se anulam fora de um compacto ⊂ Ω – o qual pode variar
com cada f . (Por compacto de IRn queremos dizer um conjunto fechado e
limitado.) Finalmente, pomos
C ∞ (Ω) := ∩∞ k
k=0 C (Ω) , C0∞ (Ω) := ∩∞ k
k=0 C0 (Ω) .

Em C0k (Ω) temos as normas


P 1/p 
R
kf kr,p := |ı|≤r Ω |D f (x)| dX
ı p
, dX := dx1 . . . dxn  ,
kf kr,∞ := ( supx∈Ω |D ı f (x)| )

para 0 ≤ r ≤ k . É claro que para r = 0 , kf k0,p = kf kp .


No que segue, trabalharemos apenas com k•kk,2 , que será denotada simples-
mente por k•kk , e introduzimos
C∗∞ (Ω) := { f ∈ C k (Ω) ; kf kk < ∞ } .
Ambos, C0k (Ω) e C∗k (Ω) , munidos da norma k•kk , não são completos.
O completamento destes espaços é denotado respectivamente por H0k (Ω) e
H k (Ω) . Trata-se, claramente, de espaços de Hilbert e seus elementos são
funções generalizadas obtidas de forma semelhante à que nos deu L1 (IR) (cf.
Seção II.14).
Para k = 0 , é evidente que
H k (Ω) = H00 (Ω) = L2 (Ω) . (IV.1)
Em C0k (Ω) e C∗k (Ω) tem-se que o produto interno é dado por
X
(f | g)k := (D ı f | D ı g) ,
|ı|≤k
98 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

onde Z
(f | g) := f g dX

denota o produto interno de L2 (Ω) .
Dada u ∈ H k (Ω) , existe {u } em C∗k (Ω) tal que ku − ukk → 0 .
Como, para todo multi-ı́ndice α com |α| ≤ k , se tem
kDα u − Dα u` k0 ≤ ku − u` kk ,
conclui-se que { Dα u } é uma seqüência de Cauchy em L2 (Ω) . Sendo
L2 (Ω) completo, existe vα ∈ L2 (Ω) tal que kDα u − vα k0 → 0 , e
podemos caracterizar H k (Ω) como o conjunto das funções de L2 (Ω) tais
que existem {u } em C∗k (Ω) e vα em L2 (Ω) satisfazendo
lim ku − uk0 = 0 , lim kD α u − vα k0 = 0 , |α| ≤ k . (IV.2)
 

No caso de u ∈ C∗k (Ω) , se ku − ukk → 0 , então (IV.2) é válida com


vα = D α u . Este fato nos motiva a pensar nas funções vα em (IV.2)
como uma certa generalização do conceito de derivada das funções de H k (Ω) ,
generalização esta que tornamos precisa na

Definição 1. Dada uma função u ∈ L2 (Ω) , diz-se que as funções


2
vα ∈ L (Ω) , |α| ≤ m , são suas derivadas no sentido forte se existir
uma seqüência { u } em C∗k (Ω) tal que
Z Z
lim |u − u|2 dX = lim |D αu − vα |2 dX = 0 , |α| ≤ m . (IV.2a)
 Ω  Ω

Diz-se também que a função u tem todas as derivadas (no sentido forte) de
ordem ≤ m .

Um problema imediatamente se põe, o da unicidade dessas derivadas. Do


Teorema da Divergência segue a fórmula de integração por partes:
se Ω0 ⊂ Ω e φ , ψ ∈ C∗k (Ω) , temos
Z Z Z
φ Dı ψ dX = φ ψ ηı dS − ψ Dı φ dX , 1 ≤ ı ≤ n (IV.3)
Ω0 ∂Ω0 Ω0

com η := (η1 , . . . , ηn ) a normal exterior a Ω0 . Agora, se tomarmos


φ ∈ C0k (Ω) , obtemos de (IV.3)
Z Z
φ Dı uk dX = − uk Dı φ dX , 1 ≤ ı ≤ n
Ω Ω
IV.2. OS ESPAÇOS DE SOBOLEV H K (Ω) E H0K (Ω) 99

ou, mais geralmente,


Z Z
α
φ D uk dX = (−1) α
uk D α φ dX , |α| ≤ k . (IV.4)
Ω Ω

De (IV.2) e (IV.4) se deduz que


Z Z
φ vα dX = (−1)α uk D α φ dX , |α| ≤ k , ∀φ ∈ C0k (Ω) . (IV.5)
Ω Ω

Se tivéssemos tanto as funções wα como vα derivadas de u no sentido


forte, obterı́amos necessariamente
Z Z
φ vα dX = φ wα dX , ∀φ ∈ C0k (Ω) ,
Ω Ω

ou seja,
(φ | vα − wα ) = 0 , ∀φ ∈ C0k (Ω) .
Como C0k (Ω) é denso em L2 (Ω) – cf. (IV.1) –, deduz-se que vα = wα .

Para k = 0 , tem-se que H k (Ω) = H0k (Ω) . Se k ≥ 1 , este


resultado é em geral falso. Por exemplo, seja Ω limitado e k = 1 . Para
X
n
z ∈ IR , |z| = 1 e f (x) := exp[< x|z >] = exp
n
x z ,
=1

temos
Dı f (x) = zı f (x) , ∆f (x) = |z|2 f (x) = f (x) .
Logo, para qualquer φ ∈ C01 (Ω) ,
X
n
(f | φı )1 = (f | φ) + (D f | D φ)
=1

= (f | φ) − (∆f | φ) = 0 .
Agora, f ∈ C ∞ (IRn ) , logo f ∈ C∗k (Ω) ⊂ H 1 (Ω) para todo k ≥ 0 ,
pois Ω é limitado. Como C01 (Ω) é denso em H01 (Ω) , não se pode ter
f ∈ H01 (Ω) , já que f ⊥ C01 (Ω) .

Conclusão: H01 (Ω) 6= H 1 (Ω) , para Ω limitado.


100 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Seja agora Ω := IRn . Pode-se demonstrar que C0k (Ω) é denso em C∗k (Ω) .
Com efeito, tomemos em IRn a função ψ(x) := θ(|x|) , onde θ foi
introduzida no Exercı́cio II.17. Dada f ∈ C∗k (Ω) , verifica-se que
f (x) = ψ( x/ ) f (x) → f (x)
no sentido da norma k•kk . (Este é o chamado truncamento de f .) De fato,
f (x) − f (x) = 0 se |x| ≤  ,
logo
X Z
kf − f k2k = |f (x) − D ı [ ψ(x/) f (x)]2 dX .
|x|≥
|ı|≤k

Mas, pelo Exercı́cio 5, vale


X ı!
Dı [ ψ(x/) f (x)] = [D p f (x)] [D ` ψ(x/)]
p+`=ı p! `!
X ı! 1
= D p f (x) |`| D ` ψ(x)|x=x/ .
p+`=ı p! `! 
Como ψ ∈ C0∞ (IRn ) , kD` ψk0,∞ é limitada para todo ` , com |`| ≤ k , o
que vem a implicar
X Z
kf − f k2k ≤ C |D p f (x)|2 dX , (IV.6)
|x|≥
|ı|≤k

para alguma constante C . O Teorema da Convergência Dominada garante


então que, se  → ∞ , o segundo membro de (IV.6) tende para 0, o que
conclui a demonstração do

Teorema 1. Se k ≥ 0 é um inteiro, tem-se


H k (IRn ) = H0k (IRn ) .
Exercı́cio 7 Se 0 ≤ k ≤ ` , então H k (Ω) ⊃ H ` (Ω) e
ı : H ` (Ω) → H k (Ω)
f → ı(f ) := f
é limitada e tem norma ≤ 1 . (Resultado análogo para H0k (Ω) . )
Exercı́cio 8 Defina a aplicação
D : H k (Ω) → H k−|α| (Ω)
para |α| ≤ k e mostre que ela é limitada, valendo kD α k ≤ 1 .
IV.3. DERIVADA FRACA E REGULARIZAÇÃO 101

IV.3 Derivada Fraca e Regularização


Podemos introduzir uma outra noção de derivada em H k (Ω) : é a chamada
derivada no sentido fraco. Diz-se que uma função vα ∈ L2 (Ω) é a derivada
de ordem α de u ∈ H k (Ω) no sentido fraco, se (IV.5) é satisfeita para
qualquer φ ∈ C0 (Ω) . Verifica-se que esta noção de derivada é equivalente
à anteriormente introduzida, sendo porém operacionalmente mais simples.
É evidente que se vα é derivada de ordem α de u ∈ H k (Ω) no sen-
tido forte, ela também é sua derivada no sentido fraco. Provaremos agora a
recı́proca. O interesse desta demonstração reside principalmente no fato de
envolver a mesma uma importante técnica, a da regularização. É essencial-
mente de [23] a seguinte

Demonstração. Seja φ a função-sino em IR introduzida no Exercı́-


cio II.1 eR seja ρ a função-sino no IRn ,R isto é, ρ(x) R := Cφ(|x|) , onde
C := [ IRn φ(|x|)dX]−1, de modo que IRn ρdX = |x|≤1 ρ(x)dX = 1 .
Dados um compacto K ⊂ Ω e  > 0 , com  < dist(K, ∂Ω) , se
u , vα ∈ L2 (Ω) e se (IV.5) é satisfeita, tomemos
Z  
−n y−x
J v(y) :=  ρ v(x) dX , (IV.7)
Ω 
para qualquer v ∈ L2 (Ω) .
Esta função é dita ser uma regularização de v , tendo sido o operador J
introduzido por Friedrichs. Trata-se de uma função C ∞ e como
R  
J v(y) = −n |y−x|≤ ρ y−x v(x) dX
R  (IV.8)
= |z|≤1 ρ(z)v(y − z) dZ ,
segue que
Z
J v(y) − v(y) = ρ(z) [v(y − z) − v(y)] dZ . (IV.9)
|z|≤1

Usando a desigualdade de Schwarz em (IV.8) concluı́mos que


R 2

|J v(y)|2 = |z|≤1 ρ(z) 1/2
[ρ(z) 1/2
v(y − z)] dZ
h i h i1/2 2
R 1/2 R 2
≤ |z|≤1 ρ(z) dZ |z|≤1 ρ(z) |v(y − z)| dZ
hR i R
= ρ(z) dZ |z|≤1 ρ(z) |v(y − z)|2 dZ
R |z|≤1
= |z|≤1 ρ(z) |v(y − z)|2 dZ ,
102 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

e por conseguinte
Z Z Z 
2 2
|J v(y)| dY ≤ |v(y − z)| dY ρ(z)dZ ,
K |z|≤1 K

onde usamos o Teorema de Fubini. Daı́ se deduz que

kJ vkL2 (K) ≤ kvkL2 (K0 ) (IV.10)

para qualquer compacto K0 ⊂ Ω cujo interior contenha K e para o qual


dist (K, Ω \ K0 ) >  .
Seja agora δ > 0 e tal que
Z
|v − w|2 dX < δ .
K0

Da linearidade de J e de (IV.10) deduz-se que


Z
|J v − J w|2 dX < δ ,
K0

enquanto de (IV.9) segue que, se  → 0 , J w(y) → w(y) uniformemente


em K . A conclusão é que, sendo  > 0 suficientemente pequeno, temos
Z
|J w − w|2 dX < δ .
K0

Combinando estas três últimas desigualdades, vem:


Z
|J v − v|2 dX → 0 se  → 0 , (IV.11)
K0

para qualquer v ∈ L2 (Ω) .  


Usamos agora o fato de estar a função ρ x−y 
em C0∞ e a definição de
derivada no sentido fraco para obter, a partir de (IV.7) aplicada a v := u ,
R  
Dα [J u(y)] = −n Ω Dyα ρ x−y u(x) dX
R   (IV.12)
= −n Ω ρ x−y
vα (x) dX ,

sendo a primeira igualdade decorrente da regra de derivação sob o sinal de


integral. É claro que o último membro de (IV.12) é igual a J vα (y) , ou seja,
D α (J u) = J vα , o que significa ser a derivação (clássica) da regularização
IV.4. AS DISTRIBUIÇÕES 103

de u igual à regularização da derivada (fraca) de u .


Aplicamos agora (IV.11) a v := vα , obtendo
Z
|J vα − vα |2 dX → 0 se  → 0 ,
K0

ou seja, pela observação acima,


Z
|Dα(J u) − vα |2 dX → 0 . (IV.13)
K0

Baseando-nos em (IV.11) e (IV.13) conclui-se que as regularizações J de u


fornecem a seqüência de funções u envolvidas na definição de derivada forte
de u , a menos do seguinte fato: em lugar da integração sobre Ω em (IV.2a),
temos K como domı́nio de integração em (IV.11) e (IV.13).
Em outras palavras, provamos apenas a existência local da derivada de ordem
α de u no sentido forte. A passagem para o caso geral é feita lançando mão
da técnica conhecida como partição da unidade, que omitiremos. O leitor
interessado pode consultar, por exemplo, [23] ou [2].

IV.4 As Distribuições
Nesta seção, Ω denotará sempre um aberto conexo2 de Rn . Introduzimos o
espaço das funções-teste D(Ω) , que é o conjunto C0∞ (Ω) munido da noção
de convergência abaixo descrita.

Dadas φ ∈ C0∞ (Ω) , diz-se que φ converge para φ em D(Ω) ,


D
denotando φ → φ , se:

i) existe um compacto K ⊂ Ω tal que φ (x) = 0 se x 6∈ K , para


todo  = 1, 2, . . . ;

ii) dado qualquer multi-ı́ndice α , com 0 ≤ |α| , se tem

lim sup |D α φ (x) − D α φ(x) | = 0 ,


→∞ x∈Ω

2
Um aberto A ⊂ IRn é conexo se, para todo p e todo q ∈ A , existe uma poligonal
P ⊂ A unindo p a q .
104 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

isto é, as funções φ e suas derivadas convergem uniformemente (com


relação a x ) para φ e as correspondentes derivadas; ou, ainda em
outros termos, se para cada k fixo, se tem que

k φ (x) − φ(x) kk,∞ → 0 se  → ∞ .

Necessariamente então, também se verifica que

φ ∈ C0∞ (Ω) .

Note que não introduziremos uma norma em C0∞ (Ω) , mas apenas esta noção
de convergência. Como já observamos no Capı́tulo II, praticamente todas as
noções topológicas que estaremos utilizando podem ser definidas a partir de
seqüências.

Exemplo 1 Sendo ρ a função-sino no IRn , introduzida na Seção 3,


verifica-se que
ρn (x) := ρ(x/n) / n

converge uniformemente para zero, o mesmo ocorrendo para suas derivadas,


mas não se tem convergência no sentido de D(IRn ) . De fato, i) não é válida.

É de imediata verificação que, para φ , φ , ψ , ψ ∈ D(Ω) e γ , γ, β , β ∈


IR ,  = 1, 2, . . . , tem-se:

D
φ → φ , γ → γ  D
D =⇒ γ φ + β ψ → γφ + βψ , (IV.14)
ψ → ψ β → β

D D
φ → φ =⇒ D α φ → Dα φ , ∀α multi-ı́ndice. (IV.15)

Motivada pela definição introduzida na Seção II.5, também no presente con-


D
texto definimos um operador T em D(Ω) como contı́nuo se φ → φ
implica T φ → T φ .
IV.4. AS DISTRIBUIÇÕES 105

Exercicio 9 Verifique que são contı́nuos os seguintes operadores em D(Ω) :


#
Dα : D(Ω) → D(Ω)
a) α multi-ı́ndice;
φ → Dα φ #
δx̄ : D(Ω) → IR
b) x̄ ∈ Ω fixo;
φ → φ (x̄) #
δx̄ : D(Ω) → IR
α
c) x̄ ∈ Ω fixo, α multi-ı́ndice;
φ → Dα φ (x̄) #
Mψ : D(Ω) → D(Ω)
d) ψ ∈ C ∞ (Ω) fixa;
φ → ψφ #
I : D(Ω) → RIR
e) .
φ → Ω φ dX

Os funcionais lineares contı́nuos3 definidos em D(Ω) são chamados dis-


tribuições, e o espaço de distribuições denotado por D 0 (Ω) , embora para
maior coerência com a notação que estamos utilizando, devêssemos empregar
D ∗ (Ω) . Se T ∈ D(Ω) , φ ∈ D(Ω) , denotaremos de agora em diante

< T , φ > := T (φ) .

Utilizaremos a notação D(a, b) no lugar de D((a, b)) para intervalos aber-


tos da reta, ou seja, quando Ω = (a, b) , o mesmo se aplicando para D 0 (a, b) .

Exemplo 2 São distribuições os funcionais b), c) , e) do Exercı́cio 9.


Exemplo 3 Seja f uma função localmente integrável em Ω , isto é, para
cada compacto K ⊂ Ω , supõe-se que f ∈ L1 (K) . (Denota-se geralmente
f ∈ L1loc (Ω) . ) Definimos a distribuição T (f ) por
Z
< T (f ) , φ > := f φ dX , ∀φ ∈ D(Ω) . (IV.16)

Observe que estamos permitindo que f 6∈ L1 (Ω) , mas apesar disso (IV.16)
existe sempre, para toda φ ∈ D(Ω) , pois na realidade a integral está
restrita a um certo compacto de Ω , fora do qual φ é nula. A linearidade de
T (f ) é evidente; sua continuidade, uma conseqüência direta do Teorema da
Convergência Dominada de Lebesgue.
3
A noção de continuidade utilizada é aquela via seqüências, como para espaços normados
e, claro, tomando a convergência introduzida em D(Ω) .
106 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Utilizando-se alguns fatos básicos da teoria da integração, é possı́vel concluir


que
f , g ∈ L1loc (Ω) , T (f ) = T (g) =⇒ f = g qtp,
ver [26], pp. 288. A notação Tf := T (f ) poderá também ser usada. •

É no sentido descrito no Exemplo 3 que se diz – informalmente – que toda


função é uma distribuição.
Observe que não vale a recı́proca: por exemplo, não existe f ∈ L1loc (Ω) tal
que T (f ) = δx̄ .
A distribuição δx̄ é chamada “função” delta de Dirac, e foi o sucesso obtido
na manipulação de “funções” como esta na Fı́sica e na Engenharia que mo-
tivou alguns matemáticos (Sobolev, Friedrichs, Schwartz, Gel’fand) a procurar
o contexto teórico adequado para estudá-las.

Apesar de nem toda distribuição ser dada por uma função na forma de (IV.16),
é possı́vel definir alguns conceitos e operadores em D 0 (Ω) que em princı́pio
só fazem sentido para funções. É uma situação semelhante àquela descrita na
Seção II.14, ao estudar as “funções generalizadas” de L1 (IR) . As distribuições
às vezes são também chamadas de funções ideais ou de funções generaliza-
das, cf. [14], [24].
Dada ψ ∈ C ∞ (Ω) , definimos para T ∈ D 0 (Ω) , o produto de uma função
por uma distribuição (ψ T ) ∈ D 0 (Ω) por:

< ψ T , φ > := < T , ψ φ > , ∀ φ ∈ D(Ω) . (IV.17)

Observe que quando T = T (f ) , tem-se ψ T = T (f ψ) , ou seja, quando


consideramos distribuições dadas por funções, o produto definido por meio de
(IV.17) é o produto usual de funções.
Da mesma forma, seja a ∈ IRn e f ∈ L1loc (IRn ) . Denotando por τ a f a
translação de f , isto é,

(τ a f )(x) := f (x − a) ,

vem, para φ ∈ D(IRn ) ,


R
< T (τ a f ) , φ > = RIRn f (x − a) φ(x) dX =
−a
IRn f (x) φ(x + a) dX = < T (f ) , τ φ>,
IV.4. AS DISTRIBUIÇÕES 107

o que motiva definir a translação para distribuições por meio de:

< τ a T , φ > := < T , τ −a φ > , φ ∈ D(IRn ) .

De uma maneira análoga, a fórmula de integração por partes (IV.3) nos dá,
para f ∈ C k (Ω) ,
R
< T (Dα f ) , φ > = φ (D α f ) dX =
Ω R
(−1)|α| Ω f (D α φ) dX = (−1)|α| < T (f ) , D α φ > ,

quaisquer que sejam φ ∈ D(Ω) e |α| ≤ k . Define-se então, para α um


multi-ı́ndice arbitrário,
∀ φ ∈ D(Ω)
< Dα T , φ > := (−1)|α| < T , Dα φ > . (IV.18)
∀ T ∈ D 0 (Ω)
Uma distribuição tem portanto derivadas de qualquer ordem.
Dada f ∈ L1loc (Ω) , diz-se que D α T (f ) é a derivada de f no sentido das
distribuições. Se f tiver derivada no sentido clássico, ou no sentido forte,
sua derivada no sentido das distribuições é a mesma.

Exemplo 4 Suponha que T ∈ D 0 (IR) satisfaz

DT = 0 .

Então T é constante, isto é, T = Ts , para alguma função constante s .


De fato, por (IV.18), para qualquer θ ∈ D(IR) , tem-se

0 = < DT , θ > = − < T , θ0 > .

Mas, pelo Exercı́cio III.2 ii), dada φ ∈ D(IR) , se verifica que

φ = θ0 + αφ0 ,

onde θ ∈ D(IR) e α ∈ IR variam com φ , enquanto φ0 ∈ D(IR) é uma


R R
função fixa. Explicitamente, α = ( φ)/( φ0 ) . Logo,
Z
0
< T , φ > = < T , θ + αφ0 > = α < T , φ0 > = s(x) φ(x) dx ,
IR
com Z
s(x) := < T , φ0 > / φ0 (t) dt = constante.
IR
108 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Exercı́cio 10 a) Calcule a derivada de ordem k da distribuição associada à


função de Heaviside
"
0 x < 0
H(x) := .
1 x > 0

b) Se ı := (1, 2, . . . , n) , calcule D ı Hn , para

Hn (x) := H(x1 ) H(x2 ) . . . H(xn ) .

Exercı́cio 11 Verifique que f (x) := log |x| ∈ L1loc (IR) e calcule a


derivada primeira de T (f ) . •

Definimos agora uma noção de convergência em D 0 (Ω) , a chamada con-


vergência pontual de distribuições . Diz-se que a seqüência T ∈ D 0 (Ω)
converge para T ∈ D 0 (Ω) se, para cada φ ∈ D(Ω) se tem

lim < T , φ > = < T , φ > .


É interessante comparar os resultados sobre derivação termo a termo de se-


qüências de funções com o

Teorema 1. Seja T ∈ D 0 (Ω) , com T → T ∈ D 0 (Ω) . Então, para
qualquer multi-ı́ndice α , é válida a convergência

Dα T → Dα T ,

ou seja, qualquer seqüência convergente de distribuições pode ser (licitamente)


derivada termo a termo.
Com efeito, seja φ ∈ D(Ω) e α um multi-ı́ndice. Então se tem

< Dα T , φ > =

(−1)α < T , Dα φ > → < T , Dα φ > =

= < DαT , φ > ,


o que, por definição, significa que T → T .

O Teorema de Banach-Steinhaus, numa formulação um pouco mais geral do


que a exposta no Cap. IV, implica o
IV.5. FUNÇÕES E DISTRIBUIÇÕES VETORIAIS 109

Teorema 2. Seja T ∈ D 0 (Ω) tal que, para cada φ ∈ D(Ω) ,


exista o lim→∞ < T , φ > . Então
< T , φ > := lim < T , φ >
→∞

define uma distribuição em D 0 (Ω) .

IV.5 Funções e Distribuições Vetoriais


Para o estudo de equações de evolução necessitamos de uma generalização dos
conceitos introduzidos na seção anterior.
Seja B um espaço de Banach com norma k•kB e, para T ∈ (0, ∞) e
1 ≤ p < ∞ fixos, definimos o espaço Lp (0, T ; B) como o completamento de
C 0 (0, T ; B) := { f : [0, T ] → B ; f é contı́nua } ,
quando munido da norma
(Z )1/p
T
|f |Lp (0,T ;B) := kf (t)kpB dt , 1 ≤ p < ∞.
0

(É importante notar que, quando T = ∞ , se deve completar, em vez de


C 0 (0, T ; B) , o espaço C00 (0, T ; B) .)
Praticamente todos os resultados válidos para os espaços de funções com valo-
res reais, isto é, quando B = IR , são válidos nesta situação. Em particular,
temos a desigualdade de Minkowski e as representações de duais:
(Z )1/p (Z )1/p (Z )1/p
T T T
kf + gkpB dt ≤ kf kpB dt + kgkpB dt ,
0 0 0
(IV.19)
para f , g ∈ L (0, T ; B) arbitrárias, sendo 1 ≤ p < ∞ ;
p

[Lp (0, T ; B)]∗ = [Lq (0, T ; B ∗)], q := (1 − 1/p)−1 , 1 ≤ p < ∞ . (IV.20)


A relação (IV.20) significa que, dada ` ∈ [Lp (0, T ; B)]∗ , existe uma única
G = G` ∈ Lq (0, T ; B ∗) tal que
Z T
`(f ) = G(t) · f (t) dt , ∀ f ∈ Lp (0, T ; B) , (IV.21)
0
110 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

onde representamos por G(t) · f (t) a dualidade, muitas vezes denotada por
< G(t) | f )t) > . Observe que é uma conseqüência da desigualdade de Hölder
a existência da integral em (IV.21): tem-se
|G(t) · f (t)| ≤ kG(t)kB∗ kf (t)kB
e, portanto,
Z
T

G(t) · f (t) dt ≤ |G|Lq (0,T ;B∗ ) |f |Lp (0,T ;B) . (IV.22)
0

A expressão (IV.22) pode ser pensada como a desigualdade de Hölder no pre-


sente contexto.
De maneira análoga, se B for um espaço de Hilbert com produto interno
( •|• )B , então L2 (0, T ; B) é também um espaço de Hilbert quando munido
do produto interno
Z T
< f (t)|g(t) > := ( f (t)|g(t) )B dt ,
0

sendo a desigualdade de Schwarz escrita na forma


< f |g > ≤ kf kL2 (0,T ;B) kgkL2 (0,T ;B) .
Finalmente, introduz-se L∞ (0, T ; B) como o espaço das funções f definidas
em (0, T ) , com valores em B , mensuráveis e para as quais
sup ess kf (t)kB < ∞ .
t

(Uma função f : [0, T ] → B é dita mensurável se for o limite qtp de uma


seqüência de funções em L1 (0, T ; B) .)

As distribuições com valores vetoriais (em B ) são os operadores lineares


contı́nuos de D(0, T ) em B , denotando-se o espaço dessas distribuições por
D 0 (0, T ; B) .
As funções f de Lp (0, T ; B) estão naturalmente associadas às distribuições
de D 0 (0, T ; B) mediante a correspondência
τ : Lp (0, T ; B) → D 0 (0, T ; B)
f → T (f ) : D(0, T ) → B
φ → < (IV.23)
nR T (f ), φ >:=o
T
0 φ(t)f (t)dt
IV.6. O TEOREMA DO TRAÇO 111

onde o sentido da integral é dado pelo mesmo procedimento do caso de funções


a valores reais: a extensão contı́nua do operador integral de Riemann definido
sobre C0 (0, T ; B) .

Noções como as de derivada e de convergência em D 0 (0, T ; B) são intro-


duzidas de maneira em tudo semelhante às definições dadas em D 0 (0, T ) , de
forma que não as repetiremos. É de grande importância o
Teorema 1. Sendo, para qualquer f ∈ Lp (0, T ; B) , 1 ≤ p < ∞ , definida
a distribuição T (f ) ∈ D 0 (0, T ; B) por meio de (IV.23), tem-se que:

i) se f1 , f2 ∈ Lp (0, T ; B) são tais que

< T (f1 ), φ > = < T (f2 ), φ > , ∀ φ ∈ D(0, T ) ,

então
f1 = f2 ;

ii) se f , f ∈ Lp (0, T ; B) e, para qualquer G ∈ Lq (0, T ; B∗) , se tem


que4
Z T
G(t) · [f (t) − f (t)]dt → 0 ,
0

então

< T (f ), φ > → < T (f ), φ > , ∀ φ ∈ D(0, T ) , (IV.24)

ou seja,
T (f ) → T (f ) no sentido de D 0 (0, T ; B) .

Diz-se que uma seqüência f que satisfaz (IV.24) converge para f no sentido
das distribuições .

IV.6 O Teorema do Traço


Os elementos de H k (Ω) pertencem a L2 (Ω) . Como tais, a eles estão associa-
das distribuições, e estas possuem derivadas de qualquer ordem. Sucede que
4
Diz-se, neste caso, que a seqüência f converge fracamente para a função f , um
conceito a ser introduzido de forma geral, e mais precisa, na Seção V.4
112 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

as derivadas de ordem ≤ k destas distribuições são justamente dadas pelas


derivadas no sentido forte (ou fraco) introduzidas nas seções IV.2 e IV.3. Em
outras palavras, temos o

Teorema 1. O espaço H k (Ω) pode ser definido como o conjunto das


funções de L2 (Ω) cujas derivadas no sentido das distribuições, de ordem
≤ k , pertencem a L2 (Ω) .

Seja agora Ω limitado. Nosso objetivo é caracterizar H0k (Ω) .


Observe que, a partir da caracterização genérica para H k (Ω) exposta acima,
ou seja, como uma função de L2 (Ω) com propriedades adicionais, não tem
sentido questionarmos os valores de uma dada função f ∈ H 1 (Ω) em ∂Ω :
além de ser f definida qtp e ser ∂Ω um conjunto de medida nula, nada se
exigiu sobre f em ∂Ω , ao definir H 1 (Ω) – recordemos – como o completa-
mento de C∗1 (Ω) .
Revisitemos inicialmente a Seção II.10. Lá obtivemos5 que é válida, para toda
f ∈ C∗1 (0, 1) ,
q
|f (t1 ) − f (t2 )| ≤ |t1 − t2 | kf k1,2 (IV.25)
e, como por (II.14) √
kf ||0,∞ ≤ 2 kf k1,2 , (IV.26)
concluı́mos que as funções de H 1 (0, 1) podem ser pensadas como uniforme-
mente contı́nuas. Com isto queremos dizer que, sendo os elementos de H 1 (0, 1)
classes de equivalência de funções, dada qualquer uma dessas classes, ela
contém uma função que é uniformemente contı́nua. Em outros termos, dada
uma função de H 1 (0, 1) , podemos modificar seus valores num conjunto de
medida nula, de modo a torná-la uma função uniformemente contı́nua.

Definamos para f ∈ C∗1 (0, 1) , o traço de f , denotado γ f , como


sendo o operador que gera (ou recupera) os valores de f na fronteira de
[0, 1] . Tem-se que γ pode ser definido como um operador limitado sobre
H 1 (0, 1) :

i) por (IV.25), toda f em C∗1 (0, 1) é uniformemente contı́nua em (0, 1) ,


podendo ser estendida a [0, 1] ;
5
desigualdade (II.26)
IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 113

ii) o operador f → γf é linear e, por (IV.26), limitado, logo uniforme-


mente contı́nuo em C∗1 (0, 1) , podendo ser estendido (univocamente) ao
completamento de C∗1 (0, 1) , isto é, a H 1 (0, 1) .
Finalmente, observemos que em H01 (0, 1) este operador é necessariamente
nulo. De fato, γ é nulo em C01 (0, 1) e – por continuidade – no seu fecho,
que é H 1 (0, 1) .
Serve este exemplo como motivação para o teorema do traço, enunciado a
seguir. Antes, definamos:

Dizemos que uma função f pertence a C k (Ω) se ela possuir uma extensão
f˜ ∈ C k (Ω̃) , onde o aberto Ω̃ ⊃ Ω .

Teorema do Traço Seja Ω um aberto limitado, cuja fronteira ∂Ω é


uma superfı́cie de classe C 2 . Então existe um único operador linear

γ : H 1 (Ω) → L2 (∂Ω) ,

chamado operador traço, tal que, se f ∈ C 1 (Ω) , então γf = f |∂Ω .


Tem-se ainda:
i) kγf kL2 (∂Ω) ≤ C kf kH 1 (Ω) ,
ii) ker (γ) = H01 (Ω) .
Uma observação: pode-se verificar que o operador γ não é sobre L2 (Ω) .
De fato, γ (H 1 (Ω) ) = H 1/2 (∂Ω) , onde H 1/2 (∂Ω) ⊂ L2 (∂Ω) é um dos
chamados espaços de Sobolev de ordem fracionária (ver próxima seção).
Referências para a demonstração deste teorema são [38], [4] ou [37], sendo o
último em português.
Uma formulação do Teorema do Traço para funções a valores vetoriais é
necessária no tratamento de equações diferenciais parciais de evolução.

IV.7 Os Espaços de Sobolev de Ordem Real


IV.7.1 Introdução
Os espaços de Sobolev H s (Ω) , para s inteiro, foram definidos e algumas
de suas propriedades estudadas em seções anteriores. Tivemos oportunidade
114 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

de, ao enunciar o Teorema do Traço, mencionar o espaço H 1/2 (Ω) , que ilus-
tra naquele contexto como podemos necessitar da generalização desses espaços
obtida quando se toma s real qualquer. É este o objetivo da presente seção.

IV.7.2 Representações da função δ

Considere para 0 < a ≤ 1 a função ψa definida por


"
cosh x / senh a 0 < x < a
ψa (x) = .
0 a < x < 1

Verifica-se que o funcional associado a ψa por meio de


Z 1 Z 1
`ψa (f ) := < ψa | f >H 1 = ψa f + ψa0 f 0 , f ∈ H 1 (0, 1) (IV.27)
0 0

é precisamente a função de Dirac δ(x − a) introduzida6 na Seção 4. Ou seja,


ψa é a representação em H 1 do funcional δa , garantida pelo Teorema de
Representação de Riesz.
Faz parte do folclore falar da função fantasma δ como um ente matemático
definido (intrinsecamente) pela propriedade
Z
δ(x − a) f (x) dx = f (a) , ∀f , (IV.28)

apesar de nenhuma função poder satisfazer simultaneamente (IV.28), para


toda f , se a integral em consideração for a de Riemann – ou mesmo a de
Lebesgue. (Deduz-se esta afirmativa por (IV.28) implicar ser δ(x) = 0 qtp ,
logo ser nula a integral de δf , para qualquer f . O emprego de subconjuntos
densos, fáceis de operar, é um caminho que facilita o argumento.)
A representação da δa descrita em (IV.27) é porém coerente com (IV.28)
desde que pensemos na integral daquela expressão como uma notação para o
produto interno em H 1 , e não em L2 .
Observe agora que, além desta identificação

ψa (x) ←→ δ (x − a) em H 1 (0, 1) ,
6
Mencionada também no Exemplo b, Seção II.5
IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 115

como ψ (esqueçamos o ı́ndice a . . . ) pertence a L2 (0, 1) , a ela está associado


também o funcional linear dado por

Lψ : L2 (0, 1) → IR
R . (IV.29)
f → Lψ (f ) := 01 ψ(x)f (x)dx =< ψ|f >L2

Ora, a expressão (IV.29) introduz ainda um funcional linear contı́nuo definido


em H 1 (0, 1) ⊂ L2 (0, 1) , o qual denotaremos por λ = λψ . De fato, tem-se
mesmo a desigualdade

|λ(f )| ≤ kψkL2 kf kL2 ≤ kψkL2 kf kH 1 , f ∈ H 1 (0, 1) (IV.30)

e portanto
kλψ k := sup |λ(f )| ≤ kψkL2 = kLψ k . (IV.31)
kf kH 1 =1

Nas passagens acima, ψ poderia ser substituı́da por uma função arbitrária
em L2 (0, 1) – é desta forma que construı́mos uma identificação, denotada por
I , de L2 (0, 1) com uma parte do dual de H 1 (0, 1) , a qual pode também ser
formalizada como passamos a descrever.

Sendo H 1 ⊂ L2 , e contı́nua7 a identidade II : H 1 → L2 , segue


que (L2 )∗ ⊂ (H 1 )∗ . A identificação I resulta da composição do ma-
peamento ı , dado pelo Teorema de Representação de Riesz em L2 , com a
identidade II – agora de (L2 )∗ em (H 1 )∗ :

ı II
L2 - (L2 )∗ - (H 1)∗


Com a notação L2 representaremos o espaço vetorial formado pelos elementos


de L2 , ignorando sua norma k•k2 . O procedimento que acabamos de
descrever permite introduzir em L2 uma outra norma, denotada por k•k˜−1 ,
qual seja:
7
Propriedade em geral expressa por “ H 1 está imerso continuamente em L2 ”
116 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Dada ψ ∈ L2 , sua norma fica definida como a norma do


funcional λψ ∈ (H 1 )∗ , cf. (IV.31).
Tem-se, por (IV.31), que

kψk˜−1 ≤ kψkL2 , ψ ∈ L2 (0, 1) . (IV.32)

A desigualdade (IV.32) induz naturalmente a questionar se as duas normas


em L2 são equivalentes, ou seja:
Existe α > 1 tal que
kψkL2 ≤ α kψk˜−1 , (IV.33)
para toda ψ ∈ L2 (0, 1) ?
Pedimos ajuda à função delta para responder.

Afirmação Existem funções ψn ∈ L2 (0, 1) tais que

lim sup kψn k˜−1 ≤ 1 mas kψn kL2 → ∞ se n → ∞ . (IV.34)

Demonstração Sejam
"
n 0 < x < 1/n
ψn (x) = n>0 . (IV.35)
0 x ≥ 1/n

Então √
kψn kL2 = n (IV.36)
e, por outro lado,
Z 1 Z 1/n
λψn (f ) := ψn f = n f → f (0) , f ∈ H 1 (0, 1) ,
0 0

visto que H 1 (0, 1) ⊂ C 0 ([0, 1]) . Conseqüentemente a seqüência ψn é


limitada segundo a norma kψk˜−1 , pois temos

lim sup kψn k˜−1 ≤ sup {|f (0)| ; kf kH 1 = 1 } ≤ 1 , (IV.37)

uma vez que, cf. (II.14), vale



kf k∞ ≤ 2kf kH 1 em H 1 (0, 1) .
IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 117

As expressões (IV.36) e (IV.37), que demonstram (IV.34), contradizem a via-


bilidade de (IV.33).

Uma informação adicional que se deduz a partir deste resultado é que o con-
junto L2 , quando munido da norma k•k˜−1 , não é um espaço completo:
conseqüência do Teorema 1 do Capı́tulo II.13, e cujo enunciado recordamos.

Dada uma norma comparável à norma original de um espaço de


Banach, as duas são equivalentes se e só se, munido da segunda,
ele ainda é completo.

Pode este fato ser demonstrado de uma forma mais construtiva: a seqüência
{ψn } definida em (IV.35) é de Cauchy no sentido da norma k•k˜−1 , mas não
é convergente em L2 relativamente a essa mesma norma. As relações
Z
kψn − ψm k˜−1 = sup f (ψn − ψm ) =
kf kH 1 =1

Z 1/n Z 1/m
sup {n f − m f} = sup { f (xn ) − f (xm ) } ≤
kf kH 1 =1 0 0 kf kH 1 =1

sup |xn − xm |1/2 kf 0 kL2 ≤ |xn − xm |1/2 ≤ [max {1/n, 1/m}]1/2 ,


kf kH 1 =1

– onde a primeira desigualdade provém de (II.26) – conduzem ao seguinte


raciocı́nio:
Se existisse g ∈ L2 (0, 1) tal que kψn − gk˜−1 → 0 , então , para toda
f ∈ H 1 (0, 1) , se verificaria

0 = lim < ψn − g|f >L2 = lim < ψn |f >L2 − < g|f >L2
. (IV.38)
= δ (f ) − < g|f >L2

Portanto, g teria de satisfazer


Z
g(x)f (x) = f (0) , ∀ f ∈ H 1 (0, 1) . (IV.39)

Isto, sabemos ser impossı́vel.

Lembramos que o conjunto L2 (0, 1) já foi obtido como um completamento.


118 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Agora, com esta nova norma, chamada norma negativa de P. Lax, pode-
mos tornar a completá-lo8 : obtemos assim um espaço que denotaremos9 por
H̃ −1 (0, 1) . Temos as relações

H̃ −1 (0, 1) ⊃ H 0 (0, 1) = L2 (0, 1) ⊃ H s (0, 1) , s ≥ 1 , (IV.40)

como também a desigualdade generalizada de Schwarz


Z
f g ≤ kf k˜−1 kgkH 1 , f ∈ H̃ −1 (0, 1) , g ∈ H 1 (0, 1) , (IV.41)

a qual se deduz de (IV.31):

< f | g/kgkH 1 > = λf (g/kgkH 1 ) ≤ kλf k =: kf k˜−1 .

Por construção, o espaço H̃ −1 (0, 1) ⊂ [H 1 (0, 1)]∗ . É natural questionar


agora:

Quão longe está H̃ −1 de se igualar a todo o (H 1 )∗ ?

Ou seja:

Teremos construı́do uma (nova) representação para (H 1 )∗ ? Caso


contrário, o que falta?

Ou ainda:

Quais são os funcionais sobre H 1 que não podem ser aproxima-


dos por funções de L2 , por meio da identificação `ψ descrita em
(IV.27)?

Consideremos mais uma vez a seqüência ψn ∈ L2 . A relação (IV.38), que


indica a impossibilidade da sua convergência em L2 , mostra também ser
ela, como seqüência de funcionais lineares, pontualmente convergente para
a função delta.
É comum encontrar na literatura (em termos matemáticos, pouco rigorosa)
8
Compare com o resultado no Exercı́cio II.9.25
9
Esta não é uma notação convencional, ao contrário de H −1 (0, 1) , cf. Subseção 3.
IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 119

exemplos semelhantes a este, apresentados como de seqüências convergentes


para a função delta, tendo em vista as funções ψn satisfazerem

limn ψn (x) = 0 x 6= 0
limn ψ
Rn
(x) = ∞ x=0   ,
limn ψn (x)f (x)dx = f (0) ∀f

e se supor que a função delta satisfaz



δ(x) = 0 x 6= 0
δ(x) = ∞
R
x=0   .
δ(x)f (x)dx = f (0) ∀f

Verificamos a seguir que é possı́vel obter resultados de convergência mais pro-


fundos. À medida que se tem conhecimento da convergência pontual dos fun-
cionais lineares associados à seqüência ψn , pode-se garantir que este limite
é também um funcional linear pertencente ao mesmo espaço10 . Em outras
palavras, completando o L2 , munido da norma k•k˜−1 , alcançamos os fun-
cionais δ que, já sabemos, não pertencem a L2 . Estamos assim motivados
a conjecturar o

Teorema 1 H̃ −1 (0, 1) = [H 1 (0, 1)]∗ .


(IV.42)
Demonstração Equivale (IV.42) a mostrar que I(L ) é denso em (H 1 )∗ .
2

Ou que: dado um funcional T sobre (H 1 )∗ –, ou seja, T ∈ (H 1 )∗∗ – que


se anule em I(L2 ) , tem-se necessariamente T = 0 .
Ora, sendo H 1 reflexivo, um tal T é a imagem de alguma φ ∈ H 1 pelo
isomorfismo canônico, T = Tφ onde:

T (`) = `(φ) , ∀` ∈ (H 1 )∗ . (IV.43)

Mas quando tomamos ` ∈ I(L2 ) , tem-se ` = `ψ para uma certa


ψ ∈ L2 , de modo que (IV.43) e a hipótese sobre T implicam

0 = T (`) = < ψ|φ >L2 , ∀ ψ ∈ L2 . (IV.44)

Em resumo, φ ∈ H 1 ⊂ L2 é ortogonal a L2 , logo nula, o que encerra a


demonstração.
10
Conseqüência do Teorema de Banach-Steinhaus, Seção IV.5, Exercı́cio 11
120 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Vale a pena reescrever o resultado que obtivemos na forma do

Teorema 10 . Qualquer funcional de H 1 (0, 1)∗ pode ser aproximado


no sentido da norma de operadores por funcionais do tipo
#
`ψ : H 1 (0, 1) → IR R ψ ∈ L2 (0, 1) .
f → `ψ (f ) := fψ

Juntando-se este resultado ao Teorema de Riesz chega-se às duas seguintes


representações do dual de H 1 (0, 1) :

Para todo funcional ` ∈ H 1 (0, 1)∗ e todo  > 0 , existem


funções ψ ∈ L2 (0, 1) e φ ∈ H 1 (0, 1) – esta, univocamente
determinada –, para as quais são válidas as seguintes identidade e
desigualdade
#
` (f ) = < f | φ >H 1 (0,1)
f ∈ H 1 (0, 1) . (IV.45)
`(f ) − < f |ψ >L2 (0,1) <  kf kH 1

É importante ter em mente que H̃ −1 e H 1 são dois espaços distintos,


identificados isometricamente ao mesmo espaço (H 1 )∗ . Graças a essas duas
identificações, (H 1 )∗ herda o produto interno de H 1 (Teorema de Repre-
sentação de Riesz) e o transfere – via (IV.29) – para o espaço H̃ −1 .

Encerramos esta subseção com as fórmulas variacionais duais

kψk˜−1 = sup {< ψ , f > ; kf kH 1 ≤ 1 } , ψ ∈ H̃ −1(0, 1) (IV.46)

kf kH 1 = sup {< ψ , f > ; kψk˜−1 ≤ 1 } , f ∈ H 1 (0, 1) (IV.47)


onde:

• < ψ, f > denota a ação do funcional ψ ∈ H̃ −1 (0, 1) = (H 1 )∗ sobre


f – comumente referida como de dualidade;

• a identidade (IV.46) repete (IV.31);

• e, finalmente, a identidade (IV.47) é uma conseqüência do Teorema de


Hahn-Banach – discutido no capı́tulo seguinte, cf. Exercı́cios III.3.3,
V.2.2 e (V.3).
IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 121
h i∗
Exercı́cio 12 H̃ −1 (0, 1) = H 1(0, 1) .

Sugestão Para f ∈ H 1 ,

`f : H̃ −1 → IR
ψ → `f (ψ) := < ψ , f >

define uma isometria. A demonstração de que ela é sobre (H̃ −1)∗ usa o
mesmo argumento apresentado para o Teorema 1.

IV.7.3 O espaço dual H −1(0, 1)


Em vez de trabalharmos com H 1 (0, 1) como na seção anterior, tomemos
agora H01 (0, 1) : todos os passos podem ser repetidos, o conjunto L2 (0, 1)
sendo munido desta vez da norma

kψk−1 := sup { < ψ|f >L2 ; f ∈ H01 (0, 1) , kf kH 1 ≤ 1 } (IV.48)

e seu completamento denotado por H −1 (0, 1) . As relações deduzidas para


k•k˜−1 e H̃ −1 continuam válidas para k•k−1 e H −1 ao trocar H 1 por
H01 . São particularmente dignas de atenção (IV.31)-(IV.32)-(IV.40)-(IV.41)-
(IV.42)-(IV.46)-(IV.47), como também o Teorema 2.1 e o Exercı́cio 2.1.
Após todo o trabalho de construção de H̃ −1 , as expressões em (IV.45) podem
ser avaliadas como insatisfatórias, pois a identificação a que chegamos é um
tanto vaga: a primeira nada acrescenta àquilo que o Teorema de Representação
de Riesz já disponibilizara, enquanto a segunda, de fato, reescreve informações
de que já dispúnhamos sobre completamento. Assim, gostarı́amos de poder
exibir uma caracterização mais concreta dos seus elementos. Não a obtemos
para H̃ −1 , mas no caso de H −1 é possı́vel chegar a algo mais palpável.

De fato, seja ψ ∈ H −1 (0, 1) = [H01 (0, 1)]∗ um funcional arbitrário.


Pelo Teorema de Representação de Riesz, existe uma única g ∈ H01 (0, 1) tal
que
< ψ, f > = < g|f >H 1 , f ∈ H01 (0, 1) ,
ou seja
Z 1 Z 1
< ψ, f > = gf + g 0 f 0 , f ∈ H01 (0, 1) .
0 0
122 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Suponhamos que f permita a integração por partes


Z 1 Z 1
< ψ, f > = gf − g f 00 , (IV.49)
0 0

expressão que nos motiva a tomar11 f ∈ C0∞ (0, 1) = D(0, 1) e reescrevê-la


na forma

< ψ , f > = < T (g) , f > − < D2 T (g) , f > . (IV.50)

Denotamos por T (g) a distribuição de D(0, 1) associada à função g , e por


D2 T (g) sua segunda derivada – cf. (IV.16) e (IV.18) – sendo que os colchetes
representam, no segundo membro, a dualidade < D 0(0, 1) , D(0, 1) > , e
no primeiro a de < H −1 , H01 >. O elemento ψ ∈ H −1 pode assim ser
identificado à distribuição S := [T (g) − D 2 T (g)] ∈ D(0, 1) , uma vez que
ele é a extensão única a H01 de S .
Estas considerações permitem portanto pensar em H −1 como o espaço das
distribuições obtidas a partir de H01 pelo operador

I − ∂ 2 /∂x2 : H01 → H −1 , (IV.51)

sendo a derivada ∂ 2 /∂x2 entendida no contexto que acabamos de descrever:


a extensão a H01 da derivada de uma distribuição. O operador em (IV.51)
é uma representação do isomorfismo canônico entre H01 e seu dual H −1 ,
o qual passaremos a pensar como um espaço de distribuições. A conclusão
inicialmente obtida ao adaptar (IV.45) a H01 e H −1 pode ser dispensada.
Observe que no caso de H 1 , não se pode chegar a uma representação tão sim-
ples: além de esbarrarmos na fórmula (IV.49) – termos na fronteira deverão
ser considerados – também é fundamental no raciocı́nio acima ser D(0, 1)
denso em H01 (0, 1) , a fim de se poder garantir a unicidade da extensão de S .

Considere agora, para chegar a uma outra representação de H −1 , a seguinte


generalização de (IV.29):
Dadas v1 , v2 ∈ L2 , tomando v := (v1 , −v2 ) ∈ L2 × L2 e

Lv : H01 → IR R R 0
f → < Lv , f > := f v1 − f v2 ,
11
Relevemos o abuso de notação nesta igualdade, que deve ser pensada apenas entre dois
conjuntos, sem referenciar estrutura alguma
IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 123

identificamos Lv a uma distribuição de H −1 , qual seja,

Lv ←→ v1 + v20 , v1 , v2 ∈ L2 .

Este raciocı́nio mostra que todo elemento de L2 × L2 dá origem a uma


distribuição de H −1 , por um mapeamento que claramente não é biunı́voco,
pois Lv = 0 se tomarmos v := (−u0 , u) , qualquer que seja u ∈ L2 para
a qual também u0 ∈ L2 . Mas este mapeamento é sobrejetivo, ou seja, vale o
Teorema 2. Dada ψ ∈ H −1 , tem-se (no sentido das distribuições) a
identidade
ψ = v1 + v20 , v1 , v2 ∈ L2 . (IV.52)
Mais ainda, é possı́vel encontrar v1 , v2 tais que

kψk−1 = {kv1 k2L2 + kv2 k2L2 }1/2 .

Demonstração Dada ψ ∈ H −1 , ela é naturalmente identificada a um


funcional λ definido sobre o gráfico G ⊂ L2 × L2 de

d/dx : H01 → L2 ,

já que este subespaço é isometricamente isomorfo a H01 . O funcional λ


admite uma extensão λ̃ a todo o espaço L2 × L2 , a qual preserva a norma
de λ e para a qual vale a representação
Z Z
λ̃ (w) = v1 w1 + v2 w2 , ∀ (w1 , w2 ) ∈ L2 × L2 ,

sendo v = (v1 , v2 ) ∈ L2 × L2 univocamente determinada. Em particular,


para ω ∈ H01 arbitrária, se tem que w := (ω , ω 0 ) ∈ G e
Z Z
< ψ , ω > = λ(w) = v1 ω + v2 ω 0 , ω ∈ H01 . (IV.53)

Observe que vale

kψk−1 = kλk = kλ̃k = kvkL2 ×L2

e que o raciocı́nio até aqui exposto também se aplica a H 1 , isto é, a repre-
sentação (IV.53) vale tanto para H 1 como para H01 . Só para o segundo
espaço porém é que se pode passar de (IV.53) a (IV.52) com a mesma linha
124 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

de raciocı́nio anteriormente elaborada.

Observação Dada ψ ∈ H −1 , vimos que (IV.53) é válida. Constru-


indo a distribuição T (v1 ) + DT (v2 ) , ela admite uma extensão contı́nua (não
necessariamente única) a H 1 , o que nos permite dizer que H̃ 1 é o espaço
de extensões de distribuições do tipo (IV.52). Essencialmente não é possı́vel
chegar à expressão (IV.52) para todos os funcionais de H̃ 1 por causa dos ter-
mos de fronteira. É possı́vel contudo chegar à seguinte representação – cf.[4],
p. 60:
Z Z
< ψ, w > = w1 v1 + w10 v1 + α0 w(0) + α1 w(1) ,

com v1 , v2 ∈ L2 e α0 , α1 ∈ IR .

IV.7.4 Os espaços H −p , p inteiro


Reuniremos agora as três maneiras de olhar para o espaço H −1 (0, 1) , já
formulando-as para H −p (0, 1) , p ≥ 1 inteiro, uma generalização natural:

H −p (0, 1) :=

completamento de L2 (0, 1) com a norma dos funcionais lineares


contı́nuos sobre H0p (0, 1) ;
= extensão a H0p (0, 1) das distribuições da forma

X
p
(k)
fk , com fk ∈ L2 (0, 1) ;
k=0

= extensão a H0p (0, 1) das distribuições da forma

X
p
(−1)k f (2k) , com f ∈ H0p (0, 1) .
k=0

Fica claro que

. . . ⊃ H −p ⊃ . . . ⊃ H −1 ⊃ H 0 = L2 ⊃ H01 ⊃ . . . ⊃ H0p ⊃ . . . , (IV.54)


IV.7. OS ESPAÇOS DE SOBOLEV DE ORDEM REAL 125

sendo cada espaço incluı́do densa e continuamente no seguinte da cadeia, e cada


inclusão sendo própria. A inclusão de H0p em H −p é compatı́vel com o iso-
P
morfismo canônico de Riesz; este é dado justamente por pk=0 (−1)k d2k /dx2k .
Finalmente, tem-se a identificação

(H −p )∗ = H0p , p ≥ 0 inteiro ,

e a fórmula generalizada de Schwarz

| < f | g >L2 | ≤ kf kH −p kgkH p , f , g ∈ L2 .

A mesma construção pode ser repetida para introduzir H −p (IR) ou H −p (Ω) ,


sendo Ω ⊂ IRn um aberto regular.

Exercı́cio 13 Considere os operadores

Dα : H p → H p−|α| , |α| ≤ p ,

generalizando o Exercı́cio IV.8.


00
Exercı́cio 14 Seja ψ ∈ L2 (0, 1) e −φ + φ = ψ , φ ∈ H 1 . Então φ dá
a representação de Riesz para a forma Lψ :

< Lψ , f > := < ψ | f >L2 = < φ | f >H 1 .

Em particular, tomando ψ ∈ H 1 , tem-se uma ilustração de como a mesma


função ψ pode ser identificada a diferentes elementos de H −1 . (No caso de
H̃ 1 , tome a condição de contorno ψ 0 (0) = ψ 0 (1) = 0 .)

IV.7.5 Os espaços H s , s real qualquer


Recordemos a definição: uma função u é localmente Hölder-contı́nua de
ordem α , 0 < α < 1 , em x0 , se
|u(x0 + y) − u(x0 )|
sup = K(x0 ) < ∞ .
y |y|α
E ela é uniformemente Hölder-contı́nua de ordem α se
|u(x0 + y) − u(x0 )|
sup sup = K < ∞ .
x0 y |y|α
126 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Esta é uma propriedade mais fraca que a derivabilidade, mais forte que a
continuidade. A constante K é uma semi-norma de u no espaço das funções
uniformemente Hölder-contı́nuas de ordem α .
Poderı́amos medir esta propriedade de u não de forma local, mas globalmente.
É esta a motivação que nos leva a introduzir, para u : IR → IR ,
Z Z " #2
dy u(x + y) − u(x)
|u|2α := dx . (IV.55)
|y| |y|α

As funções u para as quais |u|α < ∞ correspondem às funções Hölder-


contı́nuas, da mesma forma que se estendeu o conceito de derivada no contexto
dos espaços de Sobolev de ordem m , para m inteiro positivo.
Definimos agora H s , 0 < s < 1 , como

H s (IR) := {f ∈ L2 ; |f |s < ∞} ,

com a norma
kf k2H s := kf k2L2 + |f |2s .
Observe que uma dada f ∈ H p pertence a H p+1 se f (p) ∈ H 1 , e

kf k2H p+1 = kf k2H p + |f (p) |21 ,

onde |•|1 denota a seminorma |u|1 := ku0 kL2 . Assim, definimos, para todo
s ∈ IR , 1 ≤ m < s < m + 1 ,

H s (IR) := {f ∈ H m ; f (m) ∈ H s−m }

munindo-o da norma

kf k2H s := kf k2H m + |f (m) |2s−m .

Com esta definição e a introdução de H −s de forma análoga à já exposta


para s inteiro positivo, é possı́vel completar a cadeia (IV.54)

H s ⊃ H p se s < p , s , p ∈ IR , (IV.56)

sendo cada inclusão própria, contı́nua e densa.

No caso do IRn , só a notação se complica um pouco, além de ser necessário


IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 127

substituir em (IV.55) dy/|y| por dy/|y|n . Finalmente, quando Ω ⊂ IRn é


um aberto regular,

H s (Ω) := {f ∈ L2 (Ω) ; ∃ f˜ ∈ H s (IRn ) que estende f } ,

ou, recorrendo aos espaços-quociente,

H s (Ω) := H s (IRn ) / {v ; supp v ⊂ Ωc } .

Encerramos a exposição deste tópico mencionando que uma alternativa, em


muitas situações mais operacional, é introduzir os espaços H s via

H s (IRn ) := {T ∈ S ; (1 + |ξ|2 )s/2 T̂ ∈ L2 } ,

ou seja, as distribuições temperadas – que descrevemos na seção seguinte –


cuja transformada de Fourier tem um certo decaimento, cf. [1].
É ainda possı́vel introduzir os espaços H s via teoria de interpolação, à la
Lions, cf. [39].

IV.8 Transformadas de Fourier e Laplace


A análise de alguns funcionais ou operadores tem por objetivo gerar dire-
tamente informações sobre propriedades intrı́nsecas de elementos em estudo
no espaço onde esses operadores atuam. Enquadram-se nesse contexto as
derivadas, as integrais, a curvatura, o traço ou o determinante, por exemplo.
Outros operadores, conhecidos como transformadas, são introduzidos para,
a partir da correspondência que estabelecem entre os elementos sob análise
e suas respectivas imagens – às vezes no mesmo espaço, às vezes em outro –
facilitar a obtenção das informações que se buscam. Chegamos a elas, então,
a partir de dados no espaço-imagem EI , os quais permitem deduzir as pro-
priedades que investigávamos no espaço em que se trabalhava inicialmente, o
espaço de saı́da ES . Uma leitura indireta, portanto.
IR
@
I
@
@ φ = f ◦ T −1
f @
@
@
 T −1 -@
ES T EI
128 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

IV.8.1 A Transformada de Fourier de Funções


Um contexto mais apropriado que aquele descrito em (II.31) para operar com
a transformada de Fourier é o L1 (IR) . Sendo L̃1 (IR) um subespaço denso
de L1 (IR) e sendo F limitada, podemos, de forma única, estendê-la conti-
nuamente:
#
F : L1 (IR) → Ca (IR) R∞ . (IV.57)
f → (F f )(t) := −∞ f (x)e−itx dx

Contudo, para muitas aplicações não é ainda este o contexto adequado. De


fato, já havı́amos apontado a descontinuidade da inversa F −1 , relativamente
à norma k•k∞ em Ei = Ca (IR) . Além disso, as funções imagem de F ,
apesar de mais regulares que as de L1 (IR) , já que são sempre contı́nuas,
podem nem mesmo ser integráveis na reta, conforme o

Exercı́cio 15. Verifique que F (χA ) 6∈ L1 (IR) , para A := [−a, a] , ∀a > 0:


i. Sendo a = 1 , temos
sent
F (χA ) = 2 ;
t
ii. Para 0 6= a ∈ IR , se ha f (x) := f (ax) , então
1
F (ha f ) = h1/a F (f ) . (IV.58)
a

Outro aspecto pouco conveniente no tratamento da transformada de Fourier a


partir de L1 (IR) é: como caracterizar o espaço-imagem, Ei := F (L1 (IR)) ?
Conforme o Exemplo V.3.1, não se tem uma transformação sobrejetora.

Consideremos no domı́nio de F funções φ com maior regularidade, aquelas


cujas derivadas estão em L1 (IR) . Também essas derivadas possuem trans-
formada de Fourier, de forma que se deduz, utilizando duas vezes o lema de
Riemann-Lebesgue, uma relação para o decaimento de φ , cf. a notação em
(VIII.1):
Z Z
φ 0 (x) e−ixt dx = − φ(x)e−ixt [−it] dx = i/[1/t] F (φ)(t)

=⇒ F (φ)(t) = o(1/|t|) para |t| → ∞ .


IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 129

Com o emprego sucessivo da integração por partes chega-se, para n ≥ 0 , a


φ[n] ∈ L1 (IR) =⇒ F (φ)(t) = o(1/|t|n ) para |t| → ∞ . (IV.59)
O Teorema 2 de II.14.7 permite a diferenciação:
Z Z
d d h i
F (φ)(t) = φ(x)e−ixt dx = [−ix]φ(x)e−ixt dx . (IV.60)
dt dt
Portanto, se existe o primeiro momento de φ , ou seja, se xφ(x) pertence a
L1 (IR) , então sua transformada de Fourier é diferenciável. Analogamente se
deduzem resultados que relacionam momentos e derivadas de ordem superior.

Obtivemos ainda, sob as hipóteses para (IV.59) e (IV.60), expressões que


indicam como comutam o operador F com o de diferenciação. São elas,
denotando
(νn f )(t) := (it)n f (t) e (µn φ)(x) := (x/i)n φ(x) ,
  (IV.61)
[n] [n]
F φ (t) = (νn F (φ))(t) e (F (φ)) (t) = F (µn φ)(t) .

Define-se o suporte de uma função a valores reais (ou vetoriais) como o fecho
do complementar de seus zeros, i.e.,
supp f := f −1 ({0}c ) .
Exercı́cio 17 Alternativamente, o complementar do suporte de uma função é
o maior aberto onde ela se anula. Assim, se ela não se anula num dado ponto,
este ponto pertence ao suporte – que pode também conter zeros.

Consideremos as funções f contı́nuas e de suporte compacto, as quais


compõem o subconjunto C0∞ (IR) do espaço Ca (IR) introduzido no Exemplo
II.12.2. Todos os momentos dessas f existem e, portanto, F (f ) ∈ C ∞ (IR) .
Aparentemente, então, um melhor contexto para definir a transformada de
Fourier seria C0∞ (IR) , principalmente se pudermos garantir a compacidade
do suporte para as transformadas das funções de C0∞ (IR) . Observemos,
porém, que a partir do Exercı́cio 15 acima verifica-se:
Sendo f uma dada função de suporte compacto, dilatar ou contrair linear-
mente seu suporte – efetuar uma homotetia – induz uma correspondente trans-
formação na norma kF (f )k∞ .
130 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Esta pode ser pensada como uma indicação de que se relacionam o suporte de
f e o crescimento de F (f ) . O resultado que segue12 aponta nessa direção e
para a busca de ainda outro contexto onde aprofundar a pesquisa de F .

Teorema (Paley-Wiener) Seja f ∈ C0∞ (IR) e suponhamos para seu


suporte: supp(f ) ⊂ [−a, a] .
Então sua transformada F := F (f ) é analı́tica em IC e a cada inteiro N
está associada uma constante CN para a qual é válida
|F (ξ)| CN
≤ , ξ = ξ1 + iξ2 ∈ IC. (IV.62)
exp(a|ξ2 |) (1 + |ξ|)N
Reciprocamente, se F é analı́tica em IC e satisfaz uma famı́lia de estimativas
como (IV.62), para algum a > 0 , então existe uma função f ∈ C0∞ (IR) ,
com supp(f ) ⊂ [−a, a] e tal que
F (ξ) = F (f )(ξ) .

Sendo analı́tica, a transformada de uma dada função terá suporte compacto


apenas se for identicamente nula, donde a necessidade de se buscar um outro
espaço que seja transformado pela F em si próprio. É um espaço próximo
de C0∞ (IR) , o espaço S de Schwartz. A essa escolha nos induz justamente
a estimativa (IV.62).
Antes observemos que é um elemento de S a função gaussiana

16
g(x) := exp (−x2 /2)

-
0 x

e que g satisfaz
g 0 (x) = −x g(x) , ∀ x ∈ IR . (IV.63)
Aplicando F a ambos os membros de (IV.63) se obtém
d
i t F (g) (t) = −i F (µ1φ) (t) = −i (F (g)) (t) ,
dt
12
Ver [52] ou [45].
IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 131

ou seja, a mesma relação (IV.63), agora para G(t) := (F (g)) (t) ,

G0 (t) = −t G(t) .

Daı́ segue – visto terem g e G o mesmo domı́nio e g não se anular – que


d [−sG(s)]g(s) − G(s)[−sg(s)]
G/g (s) = = 0,
ds g 2 (s)
e por conseguinte existe uma constante λ para a qual

G (s) = λ g(s) , ∀ s ∈ IR .

Como Z √
G(0) = g(x)dx = 2π ,
a escolha de nova definição,
s
Z
1
F (f ) (t) := f (x) exp(−itx) dx , (IV.64)
2π IR

garante ser a função gaussiana g um ponto fixo de F .


Exercı́cio 16 Compare o efeito (simetria, presença nos cálculos, etc.) resul-
tante desta escolha para a constante com o que decorre das outras escolhas
usadas ao definir F , a saber,
 R
IR f (x)R exp(−2πitx) dx

F (f ) (t) :=  (1/2π) IR f (x)√exp(−itx) dx ,
R
IR f (x) exp(− 2π itx) dx

além, claro, daquela em (II.31).

O espaço S de funções rapidamente decrescentes é transformado por F


em um subespaço de funções ainda de S , fato que decorre das propriedades
enunciadas acima sobre decaimento no domı́nio e na imagem de F . Ser
S = F ( S ) decorre da fórmula de inversão13 , válida para toda f ∈ S :
Z
1
f (x) = √ F (t) exp(ixt) dt , F := F (f ) . (IV.65)
(2π) IR
13
Ver [30], pp.196, para uma elegante demonstração.
132 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

Assim,
f = F (ρF ) , ∀ f ∈ S , onde ρ F (t) := F (−t) .
De (IV.65) decorre ainda

< f | g >L2 (IR) = < F (f ) | F (g) >L2 (IR)

e, finalmente, a identidade de Plancherel-Parseval

kf k2 = kF (f )k2 , ∀ f ∈ S . (IV.66)

Como S é um subespaço denso de L2 (IR) , podemos estender continuamente


F a esse espaço e obter, em resumo, o

Teorema 1. A transformada de Fourier

F : L2 (IR) → L2 (IR) ,

extensão contı́nua do operador definido por (IV.64) para funções de S , é um


isomorfismo isométrico, sendo sua inversa dada, para elementos regulares de
L2 (IR) , por
Z
1
F̄ (f )(x) := √ f (t) exp(ixt) dt . (IV.67)
(2π) IR

Exercı́cio 18 Observe que, sendo (τ a f ) (x) := f (x − a) , se tem

F (τ a f ) (t) = exp(−iat) F ( f ) (t)

e conseqüentemente, basta apenas deduzir (IV.65) para x = 0 e para qualquer


f afim de se concluir ser a fórmula de inversão válida.
Exercı́cio 19 Examine as propriedades herdadas pelas restrições

F : H n (IR) → H n (IR) .

Encerramos a subseção observando ser válido o desenvolvimento apresentado


também para qualquer espaço IRn , n ≥ 1 , seguindo-se os mesmos passos
na fundamentação teórica.
IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 133

IV.8.2 As Distribuições Temperadas


A seção IV.4 introduz no espaço de distribuições D 0 (IR) operadores, como a
translação e a derivada, que fazem (inicialmente) sentido apenas para espaços
de funções. São exemplos da chamada definição via dualidade: um operador
Γ é definido no espaço dual D 0(IR) por intermédio de sua ação – ou melhor,
da ação de um operador γ que desejamos estender14 – no espaço D(IR) ,

Γ : D0 → D0

T → ΓT : D → IR  .
f → < Γ T , f > := < T , γf >

A transformada de Fourier para distribuições é estendida por esse mesmo cami-


nho, mas sendo o domı́nio de F o espaço S(IR) ⊃ D(IR) , é necessária uma
definição para S 0 (IR) , o dual topológico de S(IR) , e antes saber qual noção
de convergência utilizar em S – e portanto em S 0 . Uma vez estabelecidos
esses vı́nculos, a extensão da transformada de Fourier ao dual S 0 (IR) é

F : S0 → S0

T → FT : S → IR . (IV.68)
f → < F T , f >:= < T , F f >

A linearidade de F em S implica ser também linear a “extensão” em S 0 .


Trabalhando em15 S 0 (IR) com a noção de continuidade empregada em D 0 ,
qual seja, a da convergência pontual, ou fraco* – cf. seção VI.3 –
S 0 
T → T ⇐⇒ < T , f > → < T , f > , ∀ f ∈ S ,

se F for contı́nua em S , a definição (IV.68) a tornará automaticamente


contı́nua em S 0 .

Diremos que uma seqüência de funções (φ ) em S é convergente, no sentido


da topologia de S , e φ é seu limite se, sendo ψ := φ − φ ∈ S ,

dk ψ (x)
p  
M(ψ , k, p) := max x → 0, (IV.69)
x∈IR dx k

14
mais apropriadamente, generalizar
15
Novamente, a exposição se restringe à reta IR mas pode ser aplicada ao IRn , n ≥ 2 .
134 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

para quaisquer k, p ≥ 0 inteiros, cf. (II.1). Em outras palavras, se a seqüência


(ψ ) ∈ S e, além disso, o produto dela ou de cada uma de suas derivadas
por qualquer polinômio converge uniformemente para zero.
Como S(IR) ⊃ D(IR) , as distribuições de S 0 (IR) formam um subconjunto
de D 0 (IR) , que é próprio, como se verifica considerando por exemplo a dis-
tribuição associada à função localmente integrável exp(x2 ) . Os elementos de
S 0 (IR) não podem apresentar esse tipo de crescimento, por isso são chamados
de distribuições temperadas.
Essas distribuições ficam caracterizadas pelos valores que assumem em D(IR) ,
visto ser esse espaço denso em S(IR) , como se verifica, por exemplo, com o
Exercı́cio 20. Dada a função θ ∈ D(IR) usada no Exercı́cio II.7.17, a
seqüência (θn ) em D(IR) definida por
"
θ(x/n) |x| ≤ n
(θn )(x) := ,
θ(x − n + 1) |x| ≥ n

S
satisfaz θn φ → φ , ∀ φ ∈ S . •

Observe que, enquanto o desenvolvimento obtido para D 0 (IRn ) pode ser


aplicado a qualquer aberto Ω ⊂ IRn , a teoria de distribuições temperadas
se restringe aos espaços IRn .
Dizemos que uma distribução T ∈ D 0 (IR) se anula no aberto O ⊂ IR
se, para toda φ ∈ C0∞ (IR) , nula no complementar de O , se tem
< T , φ > = 0 . O suporte de T é então definido como
\
supp T := { Oc | T se anula em O } .

A função constante f ≡ 1 , que denotamos por 1I , está associada a – ou é –


uma distribuição temperada. Calculemos sua transformada de Fourier:
Z
< F 1I , φ > := < 1I , F φ > = 1 (F φ)(t)dt

Z " Z #
i0t 1 −ixt

= e √ e φ(x)dx dt = 2π φ(0) .

Assim se conclui que √
F 1I = 2π δ0 .
IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 135

Este resultado sugere questionar se vale em S 0 (IR) uma relação que correspon-
da a (IV.65), de modo a podermos formular em S 0 um resultado semelhante
ao Teorema IV.8.1. O operador F̄ , definido em (IV.67), é introduzido em
S 0 , de forma análoga à que seguimos para F . Para ele se verifica

< F̄(F T ) , φ > = < (F T ) , F̄ φ >

= < T , F (F̄φ) > = < T , φ > , ∀ φ ∈ S(IR) .


Uma vez que a correspondente identidade também é válida para F · F̄ , pode-
se enunciar o

Teorema 1. A Transformada de Fourier F : S 0 (IR) → S 0 (IR)


é um operador linear, contı́nuo, biunı́voco e sobrejetor, sendo o operador in-
verso também contı́nuo e dado por F̄ .

Dada a distribuição 1I , observe que o suporte de sua transformada de Fourier


é igual a [−a, a] , com a = 0 , verificando-se a estimativa |1I(x)| ≤ eax ,
fato que sugere a pesquisa de uma extensão do Teorema de Paley-Wiener para
distribuições. É o que expõe o resultado que segue, ver [52].

Teorema (Paley-Wiener para distribuições) Seja T ∈ S(IR) . Sua


transformada de Fourier F := F (T ) é uma função inteira – i.e., analı́tica
em IC – e existem constantes N ∈ IN , C > 0 , a > 0 para as quais é
válida
|F (ξ)|
≤ C(1 + |ξ|)N , ξ = ξ1 + iξ2 ∈ IC. (IV.70)
exp(a|ξ2 |)

Reciprocamente, se F é analı́tica em IC e satisfaz uma estimativa como


(IV.70), para constantes positivas a , C e N ∈ IN , então existe uma
distribuição T ∈ S(IR) tal que F := F (T ) .

Outra caracterização das distribuições temperadas é o conteúdo do seguinte

Teorema 2. Dada uma distribuição T ∈ S(IR) , a ela estão associa-


dos um inteiro ` e uma função f ∈ C 0 (IR) de crescimento polinomial –
isto é, tal que existe um polinômio que domina f (x) em todo seu domı́nio,
136 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

|f (x)| ≤ |p(x)| – satisfazendo


T = D` f .
Denota-se com D a derivada no sentido de D e vale a recı́proca.

Para encerrar a subseção enfatizamos a flexibilidade que as distribuições apor-


tam à transformada de Fourier, trazendo mais alternativas ao tratamento das
equações diferenciais.

IV.8.3 A Transformada de Laplace


Considere uma função f : IR → IC , nula para {t<0} e localmente
integrável. Dado p ∈ IC , p := ξ + iη = <(p) + i=(p) , para o qual a
integral Z Z ∞
f (t)e−pt dt = f (t) e−pt dt (IV.71)
IR 0
exista e seja finita, seu valor, denotado por L[f ](p) , define a integral de
Laplace de f no ponto p .
Observe que, dada f , a existência de L[f ](p) só depende da parte real de
p , o que sugere definir:
A abscissa de somabilidade a = af da integral de Laplace de uma função
f é dada por
Z
a := inf { ξ ∈ IR | e−ξt |f (t)|dt < ∞ } .
IR

Exercı́cio 21 Sendo H a função de Heaviside,


i. para f∓ (t) := exp(∓t2 )H(t) , se tem af ∓ = ∓∞ ;
ii. para
#
h(t) := H(t − 1)/t2 , g(t) := RH(t)et ,
,
ah = 0 , L[h](0) = 1 , ag = 1 , e−t g(t)dt = +∞
de forma que em geral não se tem definida L[f ](af ) . •

Dada uma função f para a qual af < +∞ , define-se sua transformada


de Laplace no semiplano { p ∈ IC | <(p) > af } por
Z ∞
L[f ](p) := f (t) e−pt dt . (IV.72)
0
IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 137

De forma similar à de Fourier, esta transformada exibe uma importante relação


com o operador de diferenciação, qual seja, mapeia-o num operador bem mais
simples. Além disso, as funções-imagem da transformada de Laplace apre-
sentam muito mais regularidade que as imagens da transformada de Fourier.
Esses fatos, descreve-os a seguinte

Proposição. Se f tem a ∈ IR como abscissa de somabilidade, então


L[f ](p) é holomorfa no seu domı́nio, o semiplano { p ∈ IC | <(p) > a } .
Para m ≥ 0 , as funções [(−t)m f (t)] possuem todas a mesma abscissa de
somabilidade a e, denotando as derivadas em IC por D m := dm /dpm ,
valem as relações

Dm L[f ](p) = L[(−t)m f ](p) , m ≥ 1 . (IV.73)

O operador L transforma portanto um conjunto de funções em outro, sendo


que o domı́nio de cada função-imagem varia com a função-origem. É este fato
que inibe a introdução da transformada de Laplace para distribuições seguir a
já costumeira definição via dualidade. O caminho adotado pode ser pensado
como uma generalização mais direta de (IV.71): como as funções do domı́nio
de L são distribuições16 , escrevendo

L[f ](p) = < Tf , φp > , com φp (t) := e−pt ,

tenta-se formalizar

L[T ](p) := < T , φp > , T = distribuição . (IV.74)

Nem especificamos ainda qual o espaço de distribuições onde opera L nem,


pior ainda, como atribuir um significado ao segundo membro de (IV.74), já
que φp não é função-teste, pelo menos dos espaços com que lidamos, D e S .

0
Denotamos com D+ o espaço das distribuições cujo suporte está contido em
IR+ := [0, +∞[ e adaptamos a esse espaço a construção da transformada de
0
Laplace para funções considerando, para T ∈ D+ :

σ(T ) := inf { ξ0 ∈ IR | φ−ξ T ∈ S, ∀ ξ > ξ0 } . (IV.75)


16
Nesta subseção as funções de D, S são consideradas tomando valores em IC ; as
distribuições de D0 , S são portanto funcionais complexos.
138 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES

0
No subespaço de D+ dado por
0
DL := { T ∈ D+ | σ(T ) < +∞} ,

a definição (IV.74) é formalizada como segue.

Tomemos α ∈ C ∞ (IR) que satisfaça


"
0 x ∈ ] − ∞, x0 ]
α(x) = ,
1 x ∈ [0, +∞[

sendo arbitrários tanto x0 < 0 como os valores assumidos por α em ]x0 , 0[ .


Dada T ∈ DL , sejam p ∈ IC com ξ := <(p) > σ(T ) e ξ1 ∈ ]σ(T ) , ξ[ ,
de forma que se tem

α(t) φ−(p−ξ1 ) (t) = α(t) e−(p−ξ1 )t ∈ S , φ−ξ1 (t) T = e−ξ1 t T ∈ S 0 ,

o que permite definir

L[T ](p) := < φ−ξ1 T , α φ−(p−ξ1 ) > . (IV.76)

Verifica-se que, fixados T ∈ DL e p ∈ { z ∈ IC | <(z) > σ(T ) } , o valor


da expressão (IV.76) independe de α e de ξ1 . Assim, é consistente essa
definição para L[T ](p) e escreve-se informalmente seu valor como

L[T ](p) := < T , e−pt > .

Exercı́cio 22 Demonstre a linearidade de L , num sentido a ser posto em


termos precisos. •

São propriedades adicionais do operador L :

Biunivocidade Dadas U , T ∈ DL ,

L [U] = L [T ] =⇒ U = T .

Crescimento polinomial A transformada L [T ] de cada dis-


tribuição T ∈ DL exibe um crescimento polinomial, isto é,
para cada semiplano fechado Rc := { z | <(z) ≥ c } contido
IV.8. TRANSFORMADAS DE FOURIER E LAPLACE 139

no domı́nio de L [T ] , se pode determinar um polinômio Pc que


satisfaz

| L [T ] (p) | ≤ | Pc (p) | , ∀ p ∈ Rc . (IV.77)

Reciprocamente, dada uma função holomorfa Γ(p) , cujo domı́nio


contenha algum semiplano do tipo Rc , para que ela seja a trans-
0
formada de Laplace de alguma distribuição T ∈ D+ ,

Γ(p) = L [T ] (p) ,

é suficiente que ela possua crescimento polinomial, ou seja, exista


algum polinômio e algum semiplano para os quais seja satisfeita
uma estimativa da forma (IV.77).

A demonstração dessas propriedades usa fortemente a representação para dis-


tribuições temperadas garantida pelo Teorema 2 da seção anterior, cf. [7, 46].

Finalmente, observemos que toda distribuição T de suporte compacto é


temperada. Pelo mesmo caminho percorrido para chegar à transformada de
Laplace em DL , se pode introduzir – com o emprego das mesmas funções α
para truncar o suporte de φ−itx = exp(−itx) , x ∈ IR , sem modificar seus
valores no suporte de T – a função:

< T , φ−it > := < T , α φ−it > . (IV.78)

Verifica-se que essa função é a distribuição F T , que ela pode ser estendida
a todo o plano como uma função holomorfa e que ela satisfaz (IV.78) para
t ∈ IC . Em resumo, temos o

Teorema 1. A transformada de Fourier de uma distribuição de suporte


compacto é uma função inteira cujos valores numéricos podem ser calculados
por meio da relação (IV.78).
140 CAPÍTULO IV. ESPAÇOS DE SOBOLEV, DISTRIBUIÇÕES
Capı́tulo V

Os três Princı́pios Básicos

V.1 Introdução
Discutiremos neste capı́tulo os chamados três princı́pios básicos da Análise
Funcional: o teorema de Hahn-Banach sobre extensão contı́nua de formas li-
neares, o teorema da Aplicação Aberta (uma conseqüência do qual foi usada na
demonstração do Teorema 1, Seção III.2), e o teorema de Banach-Steinhaus, ou
da Limitação Uniforme, que também já mencionamos (Teorema IV.4.2). Como
não vamos demonstrar nenhum destes resultados, nosso objetivo é motivar o
leitor, tentando convencê-lo de que são “razoáveis” os enunciados e indicando
como utilizá-los, ao exibir algumas de suas aplicações relevantes.
Demonstrações rigorosas destes resultados podem ser encontradas em qualquer
livro de Análise Funcional, em particular em [5], [29], [40], [43], [44] e [47], que
os abordam com o mesmo grau de generalidade destas notas. Já em [49] e [52],
um enfoque mais geral é apresentado.
Usaremos neste capı́tulo a convenção de denotar por N , N1 , N2 , etc.,
espaços normados, e por B , B1 , B2 , etc., espaços de Banach.

V.2 O Teorema de Hahn-Banach


Possui grande número de aplicações a seguinte caracterização dos subespaços
densos de um espaço normado:

Teorema 1 Um subconjunto D ⊂ N é denso se e só se, para toda

141
142 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

forma ` ∈ N ∗ ,
`(D) = {0} =⇒ ` ≡ 0 .
Demonstração Sendo D denso e ` contı́nua, ` é necessariamente nula se
se anular em D .
Reciprocamente, suponhamos que D̄ 6= N e aceitemos o resultado:
Proposição Dado um subespaço fechado próprio de N , existe um hiper-
plano fechado que o contém.
Ora, D̄ está então contido num hiperplano fechado H . Por observações
feitas na Seção III.2, podemos encontrar um funcional não nulo `H ∈ N ∗
que tem por núcleo H . Logo, `H (D) = {0} e `H 6= 0 , o que contradiz a
hipótese. •

A demonstração do Teorema 1 foi então obtida, a menos da Proposição acima,


que apenas enunciamos, sem demonstrá-la. Esta proposição, de certa forma
intuitiva, não é de demonstração imediata: trata-se de uma das conseqüências
do Teorema de Hahn-Banach.

Dado um espaço de Hilbert, seu dual fica completamente caracterizado por


meio do Teorema de Representação de Riesz. Por outro lado, na Seção III.5
foram apresentadas caracterizações dos duais de alguns espaços de Banach:
c0 , c , `p e Lp (Ω) , 1 ≤ p < ∞ . Mas, para um espaço normado arbitrário
N , não se pode, a partir dos dados de que dispomos até aqui, nem sequer
afirmar se em N ∗ existe algum funcional não nulo. De fato, se N tiver
dimensão infinita, a existência de ` ∈ N 0 , ` 6= 0 apenas pode ser garantida
usando o conceito de base de Hamel, cf. Seção VII.2. Este conceito também
nos permite demonstrar que, se N 0 = N ∗ , então dim(N) < ∞ , mas
para termos informações sobre a existência de elementos não nulos em N ∗ , o
instrumento a usar é o seguinte

Teorema de Extensão (Hahn-Banach). Seja S ⊂ N um subespaço e


` um funcional em S ∗ . Então existe `˜ ∈ N ∗ com
˜ N ∗ = k`kS ∗ ,
k`k ˜S = ` .
`| (V.1)

Chamamos a atenção do leitor para o fato de não necessitarmos neste Teorema


supor N completo nem S fechado.
V.2. O TEOREMA DE HAHN-BANACH 143

A idéia da demonstração é simples: obter uma extensão contı́nua `1 de `


L
para um subespaço S1 := S [w] , onde [w] := {v := αw ; α ∈ IR }
e w 6∈ S , de modo que `1 e ` tenham a mesma norma. Esta é a parte
artificiosa da demonstração. Repete-se o processo para `1 e S1 e, para
concluir que este processo conduz à extensão `˜ do enunciado, lança-se mão
de um argumento transfinito, o chamado Lema de Zorn.
Exemplo 1 Dado w ∈ N , existe ` ∈ N ∗ , com

k`k = 1 , ` w = kwk . (V.2)

Realmente, o funcional linear

`w : [w] → IR
(V.2a)
v := αw → ` v := αkwk

satisfaz k`k[w]∗ = 1 , donde o resultado. Obtém-se daı́ o


Exemplo 2 . Dados v1 6= v2 em N , existe ` ∈ N ∗ , com

` v1 6= ` v2 , k`k = 1 .

Outra conseqüência imediata:


Exemplo 3 Dado v ∈ N , temos

`v
kvk := sup `v = sup . (V.3)
{`∈V ∗ k`k=1} {`∈V ∗ `6=0} k`k

A relação (V.3) é chamada de fórmula dual (ou fórmula variacional dual) para
a norma de v : compare-a com
`v
k`k := sup `v = sup . (V.3∗ )
{v∈V kvk=1} {v∈V v6=0} kvk

A identidade (V.3) nos permite escrever, por exemplo, para 1 ≤ p < ∞ e


expoente conjugado q ,
Z
kf kp = sup f (x)g(x)dx , ∀f ∈ Lp (Ω) , (V.3a)
{g∈Lq (Ω) kgq k=1} Ω


X
kξkp = sup ξ η , ∀ξ = (ξ ) ∈ `p . (V.3b)
{η=(η )∈`q ;kηkq =1} =1
144 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

De (V.3) também se deduz que vale a igualdade em (III.13), isto é,

kv kV ∗∗ = kvkV ,

para todo v ∈ V (≡ espaço normado), sendo • a identificação canônica


entre V e o seu bidual V ∗∗ introduzida na Seção III.6.

Exemplo 4 Dado um subespaço fechado F e w 6∈ F , existe ` ∈ N ∗ ,


com `(F ) = {0} e ` w 6= 0 .
Em outras palavras, dado um subespaço fechado F e um vetor w fora dele,
existe um hiperplano fechado que contém F e não contém w . Este é precisa-
mente o conteúdo da Proposição mencionada na demonstração do Teorema 1
acima.

Exercı́cio 1 Um subespaço fechado F ⊂ N é a interseção de todos


os hiperplanos fechados que o contêm.

Exercı́cio 2 Demonstre os princı́pios variacionais conjugados (A) − (B).


Dado o subespaço S ⊂ N , seja F := {` ∈ N ∗ ; S ⊂ ker(`)} . Então:

(A) dist(x, S) := inf kx − sk = sup ` x/k`k ,


s∈S 06=`∈S

para todo x ∈ N ;

(B) dist(n, F ) := inf kn − `k = min kn − `k = sup n s/ksk ,


`∈F `∈F 06=s∈S

para todo n ∈ N ∗ . •

Diremos que um espaço normado (ou um espaço métrico) é separável se ele


contiver um subconjunto denso enumerável. O exercı́cio II.15 nos mostra que
C 0 [0, 1] é separável. Outros espaços separáveis são apresentados no

Exemplo 5 . Todos os espaços `p , com 1 ≤ p < ∞ , são separáveis.


De fato, o conjunto {q := (q ) ∈ `p ; q ∈ IQ ,  ∈ IN } é enumerável e denso.

Exemplo 6 O espaço `∞ não é separável.


Com efeito, suponhamos que {xn } seja um conjunto enumerável e denso em
V.2. O TEOREMA DE HAHN-BANACH 145

`∞ , com xn := (xn ) . O conjunto {x̂n } com x̂jn := xn /kxn k∞ é então 1

denso na bola unitária de `∞ . Definamos y = (y ) ∈ `∞ por


"
−sgn (x ) 6 0
x =
y := .
1 x = 0
Deduz-se daııque ky − x̂n k∞ ≥ 1 , ∀n ∈ IN , kyk∞ = 1 , o que contradiz
ser {x̂n } denso na bola unitária.
Utilizaremos agora o Teorema 1 para demonstrar que (`∞ )∗ 6= `1 , no sen-
tido exposto no Exercı́cio III.4 , ou mais precisamente, no Teorema 3 da Seção
III.5. Necessitamos inicialmente do

Teorema 2 . Quando N ∗ é separável, N também é necessariamente


separável.
Demonstração Seja {φn } um conjunto enumerável denso na bola unitária
de N ∗ . Afirmamos que o conjunto {xn } é denso na bola unitária de N ,
onde xn é escolhido de modo a satisfazer
|φn xn | ≥ kφn k/2 , kxn k ≤ 1 .
Se {xn } não for denso, pelo Teorema 1 podemos determinar um funcional
φ ∈ N ∗ , com kφk = 1 , tal que φ xn = 0 , ∀ n ∈ IN . Uma vez que
{φn } é um conjunto denso na bola unitária de N ∗ , existe uma seqüência
φnk → φ . Daı́ se deduz que
kφ − φnk k ≥ |(φ − φnk )xnk | = |φnk xnk | ≥ kφnk k/2 .
Como kφ − φnk k → 0 , conclui-se que φnk → 0 , ou seja, φ ≡ 0 , o que
contradiz ser kφk = 1 .

Exemplo 7 O espaço `∞ não é reflexivo, em particular (`∞ )∗ 6= `1 .


Com efeito, se tivéssemos (`∞ )∗ = `1 , seria `∞ necessariamente separável,
pelo Teorema 2.

V.2.1 Aplicação – Um Problema de Dirichlet


Apresentamos a seguir uma aplicação do Teorema de Hahn-Banach. Trata-se
da solução, via função de Green, do seguinte problema de Dirichlet.
1
Sem perda de generalidade, podemos supor que a seqüência nula não pertence a esse
conjunto.
146 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

Seja D um aberto limitado e conexo do plano xy , cuja fronteira C é


formada por um número finito de curvas regulares. Suporemos ademais que
cada ponto p de C é extremidade de um segmento cujos pontos, à exceção
de p , estão todos no exterior2 de D .
Dada uma função f contı́nua sobre C , pretende-se determinar u , harmônica
em D , ou seja, u que satisfaça

∂2u ∂2u
∆ u := + = 0 ,
∂x2 ∂y 2

contı́nua em D e tal que u ≡ f em C , ou seja,


"
∆u = 0 em D
. (V.4)
u = f em C

Denotando por H o espaço das funções contı́nuas em D e harmônicas em


D , e por V o espaço das funções reais contı́nuas em C , o princı́pio do
módulo máximo para funções harmônicas garante que o operador linear

A : H → V
u → Au := u|C ,

é biunı́voco. Conseqüentemente existe o operador inverso

A−1 : Im (A) ⊂ V → H

e trata-se de determinar V0 := Im (A) , ou seja, saber para quais funções de


V se pode resolver o problema da Dirichlet. Observe que se tomarmos tanto
em H como em V a norma k•k∞ , pelo princı́pio do módulo máximo, os
operadores A e A−1 resultarão contı́nuos. Necessitaremos no que se segue
das identidades de Green: se u , v ∈ C(Ω) , com Ω ⊂ IRp , tem-se
Z Z
{v ∆ u + (∇ u|∇ v)} dX = v (∇ u|n) dS , (V.5)
Ω ∂Ω

onde
∇ u := (∂u/∂x1 , . . . , ∂u/∂xp )
2 c
Exterior de D := D ( = complementar do fecho de D ).
V.2. O TEOREMA DE HAHN-BANACH 147

é o gradiente de u , dX := dx1 . . . dxp e n denota a normal exterior à


superfı́cie ∂Ω que é a fronteira de Ω . A identidade (V.5), chamada primeira
fórmula de Green, é conseqüência do Teorema da Divergência (ou de Gauss):
vale Z Z
div F dX = (F |n) dS , (V.6)
∂Ω

para todo campo vetorial F := (F1 , . . . , Fp ) ∈ C 1 (Ω) , sendo


X
p
div F := (∇|F ) = ∂Fı /∂xı
ı=1

o divergente de F . Basta aplicar (V.6) a F := v ∇u .


Se em (V.5) trocamos u por v , e vice-versa, por subtração chegamos à
chamada segunda fórmula de Green:
Z Z
∂v ∂u
{u ∆ v − v ∆u } dX = {u − v } dS , (V.7)
Ω ∂Ω ∂n ∂n
onde ∂u/∂n := (∇u|n) denota a derivada de u na direção de n . Em
particular, se u , v são ambas harmônicas, segue
Z
∂v ∂u
{u − v } dS = 0 . (V.7a)
∂Ω ∂n ∂n
Tomando agora v := 1 , conclui-se: se u é harmônica em Ω ,
Z
∂u
dS = 0 , (V.8)
Γ ∂n
para toda superfı́cie Γ contida em Ω .
De (V.8) se pode deduzir a propriedade do valor médio para funções harmô-
nicas. Tomemos para um dado x0 ∈ Ω a superfı́cie

Γ := { y ∈ IRp ; |y − x0 | ≤ r } ⊂ Ω .

Então
Z Z
∂u(y) d
0 = dS = { u(x0 + ry)}r p−1 dS
|y−x0 |=r ∂n |y|=1 dr
Z
d
= r p−1 {u(x0 + ry)} dS ,
dr |y|=1
148 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

o que implica que, para 0 < r ≤ r0 = r0 (x0 ) ,


Z
{u(x0 + ry)} dS = α = constante .
|y|=1

Determinaremos o valor dessa constante fazendo uso do Teorema do Valor


Médio do Cálculo Integral e da continuidade de u :
Z
α = lim u(x0 + ry) dS = u(x0 ) ωp−1 ,
r→0 |y|=1

sendo ωp−1 a área da superfı́cie da esfera unitária em IRp . Assim, para


x0 ∈ Ω arbitrário vale
Z
1
u(x0 ) = u(x0 + ry) dS
ωp−1 |y|=1

Z
1 dS
= u(z) ,
ωp−1 |y−x0 |=r r p−1
ou seja, Z
1
u(x0 ) = u(z) dS . (V.9)
ωp−1 r p−1 |z−x0 |=r

Exercı́cio 3 Demonstre que (V.9), que descreve a chamada primeira pro-


priedade do valor médio, é equivalente a
Z
p
u(x0 ) = u(z) dS , (V.10)
r p ωp |z−x0 |≤r

dita segunda propriedade do valor médio. •

A propriedade do módulo máximo para funções harmônicas é uma conseqüên-


cia de (V.9).
Voltamos agora a particularizar o estudo para p = 2 , podendo o caso
p > 2 ser encontrado em [28] ou [31].
Sejam

P0 := (x0 , y0 ) ∈ D fixo, r := [(x − x0 )2 + (y − y0 )2 ]1/2 > 0

e
v(x, y) := log r .
V.2. O TEOREMA DE HAHN-BANACH 149

Sendo  > 0 suficientemente pequeno e aplicando (V.7) a D := D\B ,


com B := B(P0 ; ) , segue que
Z Z !
∂ ∂u
0 = { + } u log r − log r dS
C ∂B ∂n ∂n
Z ! Z
∂ ∂u ∂u
= log r − log r dS − log  dS
C ∂n ∂n ∂B ∂n
Z

+
(log  ) dS . u
∂B ∂n
Usando (V.8) e o fato de sobre ∂B termos ∂ log /∂n = 1/  , se deduz que
Z Z !
1 ∂ ∂u
u dS = u log r − log r dS
 ∂B C ∂n ∂n

ou seja, graças a (V.9),


Z !
1 ∂ ∂u
u(x0 , y0) = u log r − log r dS . (V.11)
2π C ∂n ∂n

Subtraindo (V.11) de (V.7a) obtém-se


Z ( )
1 ∂ ∂u
u(x0 , y0 ) = u (v − log r ) − (v − log r ) dS .
2π C ∂n ∂n
Supondo v harmônica em D e que coincide com log r em C , segue que
Z
1 ∂
u(x0 , y0) = u ( v − log r ) dS . (V.12)
2π C ∂n
Uma função v com tais propriedades permite resolver, a partir de (V.12), o
problema proposto em (V.4) para uma f arbitrária. Esta é a motivação para
introduzirmos a noção de função de Green G(p; p0 ) associada ao problema
de Dirichlet em consideração: é uma função que, para cada p0 ∈ D fixo,
satisfaz #
a. G(p; p0 ) = 0 p ∈ C
, (V.13)
b. ∆ G(p; p0 ) = 0 p ∈ D
sendo contı́nua em D .
Nosso objetivo agora é demonstrar a existência de G .
150 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

Para cada ponto q ∈ D fixo, o funcional linear lq := δq A−1 é


contı́nuo (usamos aqui a notação do Exemplo lb, Seção II.5). Mais precisa-
mente, klkq = 1 já que para f ≡ 1 , A−1 f ≡ 1 . O Teorema de
Hahn-Banach nos garante a existência de uma extensão de lq , denotada por
Lq ∈ V ∗ , com kLq k = 1 .
Observemos que, para cada p ∈ IR2 \C fixo, a função

s → gp (s) := log |s − p|

é contı́nua em C , isto é,

p 6∈ D → gp ∈ V .

Como, para p ∈ IR2 fixo, a função s → log |s − p| é harmônica em


IR2 \{p} , conclui-se que

p ∈ D =⇒ gp ∈ V0 .

Definamos a função de Green G(p; q) do problema de Dirichlet em estudo:


Para p ∈ IR2 fixo, pomos

G(p; q) = − log |q − p| + k(p, q) , (V.14)

onde "
Lq (gp ) p ∈
6 C
k(p, q) = .
log |q − p| p ∈ C
Necessitamos provar a continuidade de G e que (V.13b) se verifica, já que
(V.13a) está satisfeita, pela definição introduzida.
Com efeito, seja q fixo. Para p ∈ C , ∆k(p, q) = 0 , enquanto que, para
p 6∈ C , se tem
0 = Lq ∆ qp = ∆k(p, q) .
Devemos justificar a segunda igualdade, ou seja, verificar que é válida a troca
na ordem de aplicação dos operadores ∆ e Lq . Com este objetivo, intro-
duzimos, para h > 0 , os operadores discretos

∆h : s(x, y) → [s(x + hy) + s(x − hy)

−4s(x, y) + s(x, y + h) + s(x, y − h)]/h2 .


V.2. O TEOREMA DE HAHN-BANACH 151

Verifica-se que, se v ∈ C 3 (D) , tem-se


lim ∆h v(x, y) = ∆ v(x, y)
h→0

uniformemente em cada compacto de D . Portanto, como


∆h Lq gp − Lq ∆gp = Lq ( ∆h gp − ∆gp ) ,
vale
k∆h Lq gp − Lq ∆gp k∞ ≤ k∆h gp − ∆gp k∞ → 0 ,
desde que o sup na norma k•k∞ seja tomado sobre um compacto arbitrário
em D . Logo, (V.13b) é válida, o que implica ser G contı́nua em D .
Resta demonstrar a continuidade de G para p ∈ C .
Se p ∈ D e q ∈ D , então Lq gp = log |p − q| . Logo, se p0 ∈ C , t ∈ D
e t → p0 então
k(t, q) = log |t − q| → log |p0 − q| = k(p0 , q) .
Mas nosso objetivo é mostrar que k(t, q) → k(p0 , q) para t → p0 com t
ponto interior a D . Para isto, mostraremos que, se p está suficientemente
próximo de p0 , é possı́vel determinar t = t(p) 6∈ D tal que
k(p, q) − k(t, q) → 0 se p → p0 . (V.15)
Dado p ∈ D , tome o segmento de reta unindo p ao ponto m de C
que está mais próximo de p . Continue este segmento até um ponto t que
satisfaça |t − m| = |m − p| . Para p suficientemente próximo de p0 ,
t 6∈ D e portanto
k(p, q) − k(t, q) = Lq (gp − gt ) .
Mas
p − ξ

gp (ξ) − gt (ξ) = log
ξ − t

e, usando as hipóteses sobre C , se demonstra (ver [15], ou o trabalho original


[33]) que se p → p0 então t(p) → p0 e |p−ξ|/|ξ −t| → 1 , uniformemente
com relação a ξ ∈ C . Daı́ segue que
kgp − gt k∞ → 0
e, pela continuidade de Lq , conclui-se (V.15).

Demonstramos assim que:


152 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

O problema de Dirichlet (V.4) admite solução única para f


contı́nua arbitrária, sob as hipóteses para a região D formuladas
na abertura desta seção.

V.3 Aplicação Aberta, Gráfico Fechado


Examinamos agora propriedades de aplicações lineares
T : B1 → B2 ,
sendo ambos B1 , B2 espaços de Banach.
Consideremos o espaço-produto
B1 × B2 := {z := (v1 , v2 ) ; vı ∈ Bı , ı = 1, 2 }
munido da norma
kzk = k(v1 , v2 )k := kv1 k + kv2 k (V.16)
e das operações de espaço vetorial definidas componente a componente.
Exercı́cio 4 Demonstre que B1 × B2 é um espaço de Banach. •

Sendo T linear, o gráfico de T ,


G(T ) := {(v1 , v2 ) ∈ B1 × B2 ; v2 = T v1 , v1 ∈ B1 }
é um subespaço de B1 × B2 . Supondo T contı́nua, conclui-se ser
G(T ) fechado. Aliás, a conclusão de ser G(T ) fechado independe de serem
B1 , B2 completos, e nem mesmo usa a linearidade: basta que seja T
contı́nua e B1 , B2 espaços métricos. A recı́proca deste resultado é precisa-
mente o

Teorema do Gráfico Fechado (de Banach). Seja T : B1 → B2


uma transformação linear. Se o gráfico de T for fechado em B1 × B2 com
a norma definida por (V.16), então T é contı́nua.

Observe que a linearidade de T é essencial: a função


f : IR → "IR
0 x=0
x →
1/x x 6= 0
V.3. APLICAÇÃO ABERTA, GRÁFICO FECHADO 153

tem o gráfico fechado, mas não é contı́nua.


Se B1 não for completo, a conclusão pode ser falsa, conforme é ilustrado pelo
Exemplo 2, Seção II.11 . Da mesma forma, a condição de B2 ser completo é
indispensável.

Exercı́cio 5 Todas as normas

kzkp := (kv1 kp + kv2 kp )1/p 1≤p<∞ ,

kzk∞ := max { kv1 k , kv2 k}


em B1 × B2 são equivalentes. •

Sabe-se que uma função entre dois espaços métricos, f : M1 → M2 ,


é contı́nua se e só se a imagem inversa f −1 (A) de qualquer aberto A ⊂ M2
é um aberto em M1 . No caso de ser f biunı́voca, denotando sua inversa por
g : f (M1 ) → M1 , se verifica que a imagem de todo aberto do domı́nio de
g – ou seja, da imagem de f – é um aberto em M1 . Assim, g mapeia os
abertos de seu domı́nio em abertos. Uma transformação com tal propriedade
é dita ser uma função aberta.
No contexto de espaços normados, vale o resultado do

Exercı́cio 6 . Dada uma função f : N1 → N2 linear, f é aberta se


existirem δ > 0 , ρ > 0 tais que

f (B(0; δ)) ⊃ B(0; ρ) .

Ou seja, no caso de uma transformação linear, para garantir ser ela aberta
basta supor que a imagem por f de uma certa bola aberta contenha alguma
bola aberta. •

Recordemos que toda função de variável complexa, analı́tica, cujo domı́nio


seja conexo, é necessariamente aberta, a menos que seja constante, cf. [45],
pp. 214. Sendo T ∈ L(IR, IR) , também é válido que, ou é ela aberta,
ou constante (ou melhor, nula). E, dada T ∈ L(IR2 , IR2 ) , tem-se uma
alternativa que generaliza a do caso real – ou T é aberta, ou é singular – a
qual se verifica também para todo IRn , com n ≥ 2 . Na realidade, esta é a
formulação válida em geral, se observarmos que, para um operador linear em
154 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

dimensão finita, as hipóteses de ser não-singular ( ker(T ) 6= {0} ) e de ser


sobre se equivalem:

Teorema da Aplicação Aberta. Seja T uma transformação de B1 em


B2 , suposta linear, contı́nua e sobre. Então T é aberta.

É fácil ver que este resultado implica o

Teorema dos Isomorfismos (de Banach). Seja T uma transformação


linear, contı́nua e biunı́voca de B1 sobre B2 . Então T −1 é contı́nua.
Demonstração Denotando S := T −1 : B2 → B1 , a imagem inversa de um
aberto A1 ⊂ B1 , S −1 (A1 ) = T (A1 ) é então aberta, como conseqüência
do teorema anterior e das hipóteses sobre T , do que segue a continuidade de
T −1 .

Observamos que este resultado pode também ser provado a partir do Teo-
rema do Gráfico Fechado:
A transformação T : B1 → B2 , tendo o gráfico fechado, implica em ser
o gráfico de T −1 igualmente fechado. Realmente, seja (vn , T −1 vn ) uma
seqüência em G(T −1 ) que converge para (v0 , w0 ) ∈ B2 × B1 . Por (V.16),
vn → v0 e T −1 vn → w0 . Pela continuidade de T , conclui-se que
vn → T w0 e, portanto, v0 = T w0 , ou w0 = T −1 v0 , o que significa:
(v0 , w0) ∈ G(T −1 ) , ou seja, G(T −1 ) é fechado. Conclusão: T −1 é contı́nua.

São, de fato, equivalentes os três teoremas enunciados nesta Seção. Vamos


agora indicar como, a partir do Teorema dos Isomorfismos, se pode obter
tanto o Teorema do Gráfico Fechado, como o Teorema da Aplicação Aberta.

Exercı́cio 7 Verifique: se as hipóteses do Teorema do Gráfico Fechado são


satisfeitas pelo operador T , então aplicando a

πT : G(T ) → B1
(x, T x) → πT x := x

o Teorema dos Isomorfismos, conclui-se que T é contı́nuo pois

kπT xk = kxk + kT xk .
V.4. A CONVERGÊNCIA FRACA 155

Exercı́cio 8 Seja T nas condições do Teorema da Aplicação Aberta. Então


F : = ker(T ) é fechado e, conseqüentemente, B̃1 := B1 / ∼F é um espaço
de Banach. A aplicação
#
T̃ : B̃1 → B2

x ∈ B̃1 → T̃ x∗ := T y , ∀y ∈ x∗

é linear, contı́nua, biunı́voca e sobre B2 , logo aberta, pelo Teorema dos Iso-
morfismos. Daı́ se conclui ser T aberta.
Já o Teorema 1 da Seção II.13 é uma conseqüência imediata do Teorema dos
Isomorfismos: basta tomarmos para T a identidade.

Uma conseqüência do Teorema do Gráfico Fechado será apresentada na Seção


5. O exemplo que segue exibe uma outra aplicação, onde voltamos ao Exercı́-
cio II.35 da Seção II.12:
Exemplo 1 A transformada de Fourier

F : L1 (IR) → Ca (IR)

não é sobrejetora.
Verificou-se, no citado Exercı́cio II.35, ser F −1 descontı́nua, o que implica
não ser ela sobre Ca (IR) , pois do contrário terı́amos uma contradição com o
Teorema dos Isomorfismos.

Conforme já anunciamos, o Teorema da Aplicação Aberta não será provado


neste texto. Mencionaremos apenas o fato de sua demonstração usar o Teo-
rema de Baire sobre espaços métricos completos, cf. [47], pp.74, ou [40],
pp.65. É também uma conseqüência do Teorema de Baire que justifica não
termos escolhido, no Exemplo II.14.2, uma seqüência de funções contı́nuas
fN para aproximar ΨIQ : o conjunto dos pontos de descontinuidade do limite
pontual de funções contı́nuas não pode ser “tão grande” – toda a reta, neste
caso –, ver [29].

V.4 A Convergência Fraca


Certas informações sobre elementos ou subconjuntos de um espaço normado
N podem ser deduzidas a partir de infomações sobre a ação dos funcionais
156 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

` ∈ N ∗ nestes elementos ou subconjuntos. Tal é o caso da fórmula (V.3), do


Teorema IV.2.1 e do Exercı́cio IV.2 .
Sendo (x ) uma seqüência convergente em N com limite x , para cada
` ∈ N ∗ vale
` x → ` x . (V.17)
Reciprocamente, suponhamos que, para a seqüência (x ) e o vetor x , se
verifica (V.17), qualquer que seja ` ∈ N ∗ . Pergunta-se: vale a convergência
forte
x → x ,
isto é, kx − xk → 0?
Exemplo 1 Seja e := (δN )N ∈ `2 . Pelo Teorema de Representação de
Riesz, qualquer que seja ` ∈ (`2 )∗ , existe v = (vN ) ∈ `2 tal que

X
` eN = v δN = v .
N =1

Assim, (e ) satisfaz (V.17) com x := 0 , já que

(vN ) ∈ `2 =⇒ lim vN = 0 .
N

Ocorre que ke k2 = 1 , portanto não se tem e → 0 .

Em um certo número de problemas, a definição abaixo apresenta grande im-


portância. Destacamos entre elas a formulação variacional de problemas na
Fı́sica.

Dizemos que uma seqüência (x ) em N converge fracamente para um


vetor x ∈ N se se verifica

lim ` x = ` x para todo funcional ` ∈ N ∗ . (V.18)


A primeira dúvida que surge é a da unicidade do limite fraco. Suponha-


mos que se verifica a convergência fraca de (x ) simultaneamente para x e
y . Pela unicidade do limite para uma seqüência de reais, qualquer que seja
` ∈ N ∗ , concluı́mos que
`x =`y .
V.5. O TEOREMA DA LIMITAÇÃO UNIFORME 157

A igualdade x = y segue então do Exemplo 2, Seção IV.2.


Exercı́cio 9 Verifique: se (x ) e (y ) são seqüências que convergem
fracamente para x e y , respectivamente, e se as seqüências de reais (α ) e
(β ) convergem respectivamente para α e β , então

lim (α x + β y ) = α x + β y (fracamente).


V.5 O Teorema da Limitação Uniforme


Toda seqüência { xn ; n ∈ IN } fracamente convergente é fracamente
limitada. Em outras palavras, para cada ` ∈ N ∗ , arbitrário, o conjunto
de reais {` xn ; n ∈ IN } é sempre limitado. Deseja-se demonstrar uma
limitação mais forte qual seja, que {k xn k; n ∈ IN } é limitado, a exemplo
do que ocorre com as seqüências fortemente convergentes. Levando em conta
(V.3), trata-se de estimar

{ ` xn ; n ∈ IN , ` ∈ N ∗ , k`k = 1 } ,

ou, usando a notação da Seção III.6,

{ Jxn ` ; n ∈ IN , ` ∈ N ∗ , k`k = 1 } .

Para cada n fixo, valem as relações

|xn `| ≤ kxn kN ∗∗ k`kN ∗ = kxn kN k`kN ∗ = kxn kN ,

da mesma forma que, para ` fixo,

|xn `| = |` xn | ≤ C1 (`) ,

já que (` xn ) é convergente.


Observe que as constantes C1 (`) e C2 (n) := kxn k independem de n e de
` , respectivamente. O objetivo é encontrar uma constante única C tal que

C1 (`) ≤ C ∀ ` ∈ N∗ , k`k = 1 ,
C2 (n) ≤ C ∀ n ∈ IN .

Examinemos uma situação mais geral:


158 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

Teorema da Limitação Uniforme (Banach–Steinhaus) Seja (Tα )α∈∆


uma famı́lia de operadores lineares contı́nuos, Tα : B → N , onde ∆ é
um conjunto qualquer, B é um espaço de Banach e N um espaço normado.
Denotando por S1 := { x ∈ B ; kxk = 1 }, suponhamos que se verificam
as limitações pontuais:

sup kTα xk ≤ C1 (x) , para cada x ∈ S1 , (V.19)


α∈∆

sup kTα xk ≤ C2 (α) , para cada α ∈ ∆ . (V.20)


x∈S1

Então existe uma constante C para a qual vale a limitação uniforme:

sup kTα xk ≤ C . (V.21)


{x∈S1 α∈∆}

A presente formulação enfatiza uma certa simetria entre as variáveis x e α ,


sendo mais corrente expressar este resultado na forma

Todo conjunto {Tα∈∆ } ⊂ L(B, N) pontualmente limitado é eqüicontı́nuo,


por ser uniformemente limitado.

Demonstração Seja L∞ (∆; Ñ ) o espaço de Banach das funções limi-


tadas de ∆ em Ñ , onde denotamos por Ñ o completamento de N ,
munido da norma
kf kL∞ (∆;Ñ ) := sup kf (α)kÑ .
α∈∆

Considere a transformação linear




S : B → L (∆; Ñ ) 
onde hx : ∆ → Ñ  .
x → Sx := hx
α → hx (α) := Tα x

Observemos que se S for limitada, como

kSk := supkxkB =1 kSxkL∞ (∆;Ñ ) = supkxkB =1 supα∈∆ khx (α)kÑ


= supkxkB =1 supα∈∆ kTα xkÑ ,

teremos obtido (V.21) com C := kSk . A fim de demonstrar a continuidade


de S , lançaremos mão do Teorema do Gráfico Fechado.
V.5. O TEOREMA DA LIMITAÇÃO UNIFORME 159

Seja (xn , Sxn ) uma seqüência de pontos no gráfico de S , e suponhamos


ser ela convergente para (x, y) , com y ∈ L∞ (∆; Ñ ) . Para mostrar que o
gráfico de S é fechado, devemos provar que y = Sx .
Como xn → x , para cada α ∈ ∆ ocorre a convergência
Tα xn → Tα x ,
ou seja,
lim
n
kTα xn − Tα xkN = 0 . (V.22)
Por outro lado,
0 = limn kSxn − ykL∞ (∆;Ñ ) = limn supα∈∆ khxn (α) − y(α)kÑ
(V.220 )
= limn supα∈∆ kTα xn − y(α)kÑ .
A partir das relações (V.22) e (V.220 ) concluı́mos que Tα x0 = y0 (α) , ou
seja, S x0 = y0 , pois
[S x0 ] (α) = hx0 (α) = Tα x0 = y0 (α) .
Finda a demonstração, podemos agora enunciar o seguinte resultado, que dis-
cutimos antes de enunciar o Teorema de Banach–Steinhaus:

Teorema 1 Seja (xn ) uma seqüência fracamente convergente no espaço


normado N . Então {kxn k ; n ∈ IN } é um conjunto limitado na reta, e
dizemos que (xn ) é fortemente limitada.
Observe que não necessitamos supor ser N de Banach, pois o Teorema de
Banach-Steinhaus é utilizado no espaço N ∗ , que sempre é completo.

Exercı́cio 10 Dizemos que uma seqüência (x ) em N é fracamente


de Cauchy se, para cada ` ∈ N ∗ , é de Cauchy a seqüência de reais (` x ) .
Demonstrar que toda seqüência fracamente de Cauchy é fortemente limitada.

Exercı́cio 11 Suponha que a seqüência de operadores limitados – isto é,


lineares e contı́nuos – Tn : B → N converge pontualmente para um
operador T , o que significa:
Tn x → T x , para cada x ∈ B .
Então o operador T é linear e contı́nuo.
160 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

V.5.1 Uma Aplicação a Esquemas Numéricos

Em 1928, Richard Courant, Kurt O. Friedrichs e Hans Lewy, no artigo [13],


marco do inı́cio da Análise Numérica das equações diferenciais parciais, ao for-
malizar a teoria para algoritmos de diferenças finitas, esclareceram o compor-
tamento às vezes surpreendente de alguns esquemas numéricos para as edp’s.
Introduziram naquele artigo o conceito de estabilidade, demonstrando que
tal propriedade está intimamente ligada à convergência. Passados quase 30
anos, Peter D. Lax observou, cf. [35], que a relação entre esses dois conceitos
é ainda mais profunda – eles são equivalentes, conforme expressa o resultado
que expomos a seguir, uma aplicação do Teorema de Banach-Steinhaus.

Tomemos a equação linear de difusão do calor como exemplo ilustrativo


dos conceitos introduzidos3 . O problema de valor inicial – PVI, ou de Cauchy,
#
∂u(x, t) ∂ 2 u(x, t) −∞ < x < ∞
− ν = 0 (V.23)
∂t ∂x2 0≤t≤T

u(x, 0) = φ(x) −∞<x<∞ (V.24)


pode ser formulado no contexto de espaços de funções como
d
u(t) = L u (t) , u(0) = φ , (V.25)
dt
para u ∈ C 1 (0, T ; H 1(IR)) e o operador diferencial L : X → H 1 (IR)
definido em X , subespaço de H 1 (IR) a ser especificado. Entre outros pontos
a considerar na escolha desse espaço, mencionamos que ele deve incorporar as
condições de contorno impostas a u – no caso de se considerar o problema
misto. Essa escolha deve ainda garantir que, com tal formulação, (V.25) es-
pecifica um problema bem-posto, segundo Hadamard: a coleção das soluções
que admite é suficientemente grande, dependendo unı́voca e continuamente dos
dados iniciais.
De uma forma precisa, seja X ⊂ H 1 (IR) tal que, se φ ∈ X , (V.25) admite
solução, estando definida uma famı́lia de operadores
#
E(t) : X → H 1 (IR)
, t ∈ ]0, T ] . (V.26)
φ → E(t)φ := u(t)
3
Seguimos simplificadamente a exposição em [41].
V.5. O TEOREMA DA LIMITAÇÃO UNIFORME 161

Diz-se ser este um problema bem posto segundo Hadamard se tivermos:


a. Existência X denso em H 1 (IR)
b. Unicidade E(t) univocamente definida
c. Continuidade E(t) uniformemente limitada
A primeira condição, uma formulação mais forte que a original de Hadamard,
garante a existência de soluções generalizadas. Se a função ψ ∈ H 1 (IR)\X ,
podemos aproximá-la por uma seqüência em X e, graças a c. , as soluções
cujo valor inicial são os elementos dessa seqüência, compõem uma seqüência
também convergente. O valor do limite é então atribuı́do à solução que tem
ψ como valor inicial. De novo, uma aplicação do Princı́pio da Extensão
Contı́nua, agora aos operadores E(t) .
A terceira condição é conhecida como dependência contı́nua dos dados ini-
ciais. Ela garante que, para pequenos erros – nas medidas ou nos cálculos –
associados ao valor inicial, pequenas alterações sofrerá a resposta do sistema.

Constroem-se aproximações numéricas para a solução u de (V.25) com


diferenças finitas de acordo com os seguintes passos.
Escolhido o parâmetro de discretização k := ∆t := T /N , calculamos, para
tn := nk e n = 1, . . . , N , simulações de un := u(tn ) , denotadas U n e
definidas inicialmente em um conjunto finito de pontos x :=  h ,  ∈ IN
com h := ∆x > 0 , por um esquema evolutivo4 .
As aproximações U n são inseridas em H 1 (IR) via alguma interpolação
a partir dos valores calculados em (x , tn ) e denotados Un , sempre para
1 ≤ n ≤ N ,  ∈ IN . Objetiva-se garantir Un ∼ un := u(x , tn ) , o que
significa ser o esquema convergente, conforme descreveremos.
O algoritmo que consideramos evolui seqüencialmente de acordo com
"
U0 := φ( h)  ∈ IN
, (V.27)
U n+1 := B(h, k) U n 0≤n<N
sendo B o operador de diferenças finitas escolhido. Por exemplo, talvez o
mais simples esquema para (V.23) seja
Un+1 − Un U n − 2Un + U−1
n
= σ +1 , (V.28)
k h2
4
Apenas para simplificar é que tomamos malhas uniformes – têm igual comprimento os
subintervalos de discretização tanto para x como para t .
162 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

do qual segue, denotando τ±h a translação para a direita, resp. esquerda,

k
B(h, k) U n := U n + (τ+h U n − 2U n + τ−h U n ) .
h2
Um esquema numérico simular, modelar discretamente uma dada equação
diferencial significa que as soluções da equação de diferenças finitas a ele as-
sociada aproximam a solução dessa equação diferencial. Sendo tal esquema
consistente, essa solução deveria também ser “quase” solução da equação de
diferenças – e é esta a condição que se impõe para definir um algoritmo con-
sistente. Ainda em outras palavras, como se espera que

U n+1 − U n
∼ LU n ,
k
sendo I a identidade, define-se consistência exigindo a condição
!
B(h, k) − I

lim − L u (t) = 0 , ∀ t ∈ [0, T ] (V.29)
h,k→0 k H 1 (IR)

para as soluções de (V.25), ou pelo menos para alguma famı́lia densa nesse
conjunto.

Suporemos a partir de agora que as malhas de discretização guardam uma


dependência, v.g., h = g(k) . A relação

U n+1 = B U n = . . . = Bn+1 U 0

implica que estão envolvidas nos cálculos para aproximação as potências dos
operadores B = B(k) , de forma que as soluções numéricas associadas ao
esquema em estudo dependem de dois parâmetros, k e n . É a partir dessas
observações que se introduz a

Definição (Convergência). O esquema numérico (V.27) é convergente se,


dadas quaisquer seqüências de inteiros (n` ) , (N` ) com as propriedades

`
a. n` , N` → ∞  ,
`
b. sendo k` := T /N` , n` k` → t para algum t ∈ ]0, T ]
V.5. O TEOREMA DA LIMITAÇÃO UNIFORME 163

for válido:

`
k B(k` )n` φ − E(t) φ k → 0 , φ ∈ X . (V.30)

Um conceito até então desconhecido e formalizado em [13] foi o de estabi-


lidade de um esquema numérico. Os operadores Bn , para n grande, se
destinam a aproximar o operador E de solução do PVI. Devem portanto se
manter limitados, mais ainda, uniformemente limitados. É o que exige a

Definição (Estabilidade). Dizemos que o esquema (V.27) é estável se

`
∃ C > 0 | k B(k` )n k ≤ C , ∀ n ∈ IN , k` → 0 . (V.31)

Uma outra justificativa para exigir a estabilidade dos esquemas numéricos:


(V.31) implica também que distorções introduzidas nos dados iniciais, in-
cluindo os erros de arredondamento, apesar de realimentados pela potenciação
de B , são mantidos limitados.

A definição (V.29) estabelece um vı́nculo local, uma vez que envolve esti-
mar a evolução da solução aproximada do nı́vel n para o nı́vel n + 1 ,
enquanto (V.30) e (V.31) são globais. Por outro lado, ao contrário das outras
duas, (V.31) só depende do esquema numérico, não mencionando a equação
analisada. Elas se relacionam por meio do

Teorema da Equivalência de Lax. Para um problema de valor inicial


bem posto, um esquema de diferenças finitas consistente é convergente se e só
se for estável.

Por contradição, para um esquema convergente suponhamos seja possı́vel en-


contrar φ ∈ X que dê origem a uma seqüência de aproximações não limitada,
contrariando (V.31),
kB(k` )n` φ k → ∞ . (V.32)
O teorema de Bolzano-Weierstrass implica ser possı́vel obter uma subseqüência
satisfazendo
`0
n`0 k`0 → t̄ para algum t̄ ∈ [0, T ] .
164 CAPÍTULO V. OS TRÊS PRINCÍPIOS BÁSICOS

A condição (V.30) implica ser essa subseqüência convergente, portanto não


pode valer (V.32). Assim, concluı́mos que, dada φ ∈ X , se tem uma
constante C1 (φ) para a qual
`
k B(k)n φ k ≤ C1 (φ) , ∀ n ∈ IN , k` → 0 .

Mas esta é justamente a condição sob a qual o Teorema de Banach-Steinhaus


assegura a limitação uniforme (V.31) e, por conseguinte, convergência im-
plica estabilidade.
Para o outro lado da demonstração, tı́pica de Análise Numérica, ver [41, 9].

Os conceitos introduzidos em (V.29), (V.30) e (V.31) podem se verificar (ou


não) independentemente da relação entre h e k . Diz-se então que um
tal esquema é incondicionalmente – ou condicionalmente – consistente, con-
vergente ou estável. Por exemplo, o esquema (V.28) é incondicionalmente
consistente, mas é estável – logo convergente – se e só se

h/k 2 = ∆t / (∆x)2 ≤ ν . (V.33)

Suponha que um esquema seja incondicionalmente estável mas condicional-


mente consistente. Este acoplamento, aparentemente vantajoso, pode causar
riscos computacionais, de acordo com o seguinte argumento.
Considere uma seqüência qualquer de aproximações numéricas. A estabili-
dade do esquema implica a limitação dessa seqüência e, pelo Teorema VI.3.1,
a convergência fraca de alguma de suas subseqüências. Essa convergência pode
conduzir à avaliação de que os parâmetros de discretização guardam a relação
exigida para a consistência do esquema empregado. Mas, como em determi-
nados problemas não se tem uma condição tão “nı́tida” como a descrita em
(V.33), a convergência obtida – e na prática testada internamente em alguma
parte do programa – pode estar gerando aproximações para um outro proble-
ma, ver [18] para detalhes.
Capı́tulo VI

A Compacidade

VI.1 Introdução

Dado X ⊂ M (= espaço métrico), diz-se que X é compacto se, de cada


seqüência {xn } de elementos de X , for possı́vel extrair uma subseqüência
{xnk } convergente para algum x0 ∈ X .

Exercı́cio 1 Seja T uma transformação contı́nua T : M1 → M2 ,


com M1 , M2 espaços métricos. Sendo K ⊂ M1 compacto, T (K) ⊂ M2
é necessariamente compacto. •

A bola B[0, π 1/2 ] ⊂ L2 (0, 2π) não é compacta, conforme exposto no


Exercı́cio II.36. Por outro lado, em qualquer espaço normado de dimensão
finita, um conjunto limitado e fechado é sempre compacto e, de fato, vale a
seguinte caracterização devida a F. Riesz, cf. [52], pp. 85:
Teorema 1 Dado um espaço normado N , as bolas fechadas são compactas
no sentido da norma – ou fortemente compactas – se e só se N tem di-
mensão finita.

O Teorema de Bolzano-Weierstrass afirma que os compactos de IRp são


os conjuntos fechados e limitados. Dado um espaço normado N de dimensão
finita p , ele é homeomorfo ao IRp , isto é, por definição, existe uma trans-
formação linear e contı́nua T : N → IRp , biunı́voca e sobrejetora, tal

165
166 CAPÍTULO VI. A COMPACIDADE

que T −1 também é contı́nua1 . Conseqüentemente, os conjuntos fechados e


limitados em N , estando em correspondência homeomorfa com os fechados
e limitados de IRp , são também compactos.
Para a demonstração da outra parte do teorema, consultar [52].

VI.2 A Compacidade em C 0 e em Lp
Segue da definição que todo conjunto compacto é fechado e limitado. Pelo
Teorema 1 acima enunciado, nos espaços de dimensão infinita necessitamos
de outras condições para garantir a compacidade de um dado conjunto. Não
existe uma caracterização geral: dispomos, sim, de resultados que descrevem
os conjuntos compactos de alguns espaços particulares.
Consideremos o espaço N := C 0 [0, 1] munido da norma k•k∞ e seja
F ⊂ N compacto. Dada {fn } , uma seqüência arbitrária em F , existe
uma subseqüência {fnk } tal que
lim k fnk − f k∞ = 0 ,
k→∞

para uma certa f ∈ F. Como f é uniformemente contı́nua, dado  > 0 ,


existe δ = δ(, f ) > 0 tal que
x1 , x2 ∈ [0, 1] , |x1 − x2 | < δ =⇒ |f (x1 ) − f (x2 )| <  . (VI.1)
Por outro lado, pode-se determinar K = K() tal que, se k ≥ K , se tem
|fnk (x) − f (x)| <  , ∀x ∈ [0, 1] .
Concluı́mos então que, se |x1 − x2 | < δ e k ≥ K ,
|fnk (x1 ) − fnk (x2 )| ≤ |fnk (x1 ) − f (x1 )|+
| f (x1 ) − f (x2 )|+ |f (x2 ) − fnk (x2 )| < 3 .
Assim, as funções fnk são não apenas uniformemente contı́nuas, mas o que
denominamos eqüicontı́nuas2 , o que significa: dado  > 0 , existe um
δ = δ() > 0 (o qual depende apenas de  ), para o qual
|x1 − x2 | < δ =⇒ |fnk (x1 ) − fnk (x2 )| <  , ∀k ∈ IN . (VI.2)
1
Qualquer transformação linear de N sobre IRp , sendo biunı́voca, é necessariamente
um homeomorfismo, conforme a observação que acompanha o Exemplo II.11.3A.
2
ou, mais propriamente, um conjunto eqüicontı́nuo
VI.2. A COMPACIDADE EM C 0 E EM LP 167

Conclui-se ser esta propriedade válida não apenas para a subseqüência {fnk },
mas para todo o conjunto3 F , e temos a seguinte caracterização dos com-
pactos em C 0 [0, 1] :

Teorema (Arzelà–Ascoli) Um subconjunto F fechado e limitado de


0
C [0, 1] é compacto se e só se for eqüicontı́nuo.
Este resultado ainda permanece válido se C 0 [0, 1] for substituı́do por C 0 (K) ,
sendo K um compacto qualquer, não necessariamente contido em IR , mas
em um espaço métrico arbitrário.

Demonstração Suponhamos que o compacto F não fosse eqüicontı́nuo.


Seria então possı́vel determinar um número ˜ para o qual nenhum δ > 0
existiria, satisfazendo (VI.1) para toda f ∈ F . Em outras palavras, para
cada δ > 0 que se escolhesse, seria possı́vel encontrar uma função em F que
não satisfizesse (VI.1). Isto implicaria na existência de uma seqüência {fn }
em F construı́da a partir dos valores de δ = δn := 1/n . Tal seqüência não
admitiria nenhuma subseqüência eqüicontı́nua e, conseqüentemente, dela não
se poderia extrair nenhuma subseqüência convergente.
A demonstração de que um conjunto fechado, limitado e eqüicontı́nuo de
C 0 [0, 1] é necessariamente compacto exige mais elaboração. Nela usaremos o
chamado processo diagonal de Cantor.
Tomemos um conjunto enumerável e denso de [0,1] – por exemplo, os racio-
nais. Vamos denotá-lo por {q1 , q2 , . . .} e seja {f } uma seqüência arbitrária
em F . Sendo F limitado na norma k•k∞ , a seqüência de reais {f (q1 )}
é limitada e, pelo Teorema de Bolzano-Weierstrass, podemos determinar uma
subseqüência {f1 } de {f } tal que {f1 (q1 )} seja convergente. Pelo mesmo
raciocı́nio, {f1 (q2 )} é limitada e daı́ se obtém {f2 } , subseqüência de {f1 }
com {f2 (q2 )} convergente.
Procede-se desta forma para cada um dos pontos qn e define-se gn := fnn .
Fixando m , {g }≥m é uma subseqüência de {fn } e, portanto, {g (qm )} é
convergente.
Vamos demonstrar que {g } é uniformemente convergente. Como F é
eqüicontı́nuo, escolhido  > 0 arbitrário, determinamos δ() > 0 tal
que (VI.1) se verifica para qualquer f ∈ F . Se k for suficientemente
grande e Qk := {q1 , . . . , qk } , para qualquer x ∈ [0, 1] se verifica que

3
Isto significa que, em (VI.2) se pode trocar ∀k ∈ IN por ∀f ∈ F .
168 CAPÍTULO VI. A COMPACIDADE

dist(x, Qk ) < δ . Seja então x ∈ [0, 1] fixo e q = q(x) ∈ Qk


satisfazendo |x − q| < δ . Tem-se:

|gm (x) − gm (x)| ≤ |gm (x) − gm (q)| +


(VI.3)
|gm (q) − gn (q)| + |gn (q) − gn (x)| .
Já que o conjunto Qk é finito, é possı́vel determinar N = N() tal que

m, n ≥ N =⇒ |gm (q) − gn (q)| <  , ∀g ∈ Qk .

Pela eqüicontinuidade de F , o primeiro e o terceiro termos no segundo mem-


bro de (VI.3) são majorados por  . A conclusão é de que a seqüência {gn } é
uniformemente de Cauchy, isto é, é de Cauchy com relação à norma k•k∞ .
Sendo C 0 [0, 1] completo nesta norma e F fechado, deduz-se a convergência
de {gn } para uma certa g ∈ F , o que encerra a demonstração.

Exemplo 1 Seja K ⊂ C 0 [0, 1] limitado. Suponhamos que toda f ∈ K


seja derivável e exista uma constante M tal que kf 0 k∞ ≤ M , ∀f ∈ K .
Segue dos Teoremas do Valor Médio e Arzelà–Ascoli que K̄ é compacto.

Exemplo 2 Usando as conseqüências do Exercı́cio II.28, conclui-se ser a bola


unitária fechada de H 1 (0, 1) limitada e eqüicontı́nua em (C 0 [0, 1], k•k∞ ) ,
logo compacta.

Exercı́cio 1 Seja X := {f : IR → IR , f é contı́nua e limitada },


munido da norma k•k∞ , e seja

0 x≤0

g(x) :=  x 0≤ x≤1 .
1 1≤ x

Verifique que F := {f ; f (x) = g(x − n) , n ∈ IN} é fechado, limitado e


eqüicontı́nuo em X , mas não é compacto.
O exercı́cio acima pretende ilustrar que, para garantir a compacidade de um
conjunto F de funções cujo domı́nio é não limitado, torna-se necessário impor
também condições sobre o comportamento assintótico dos elementos de F ,
para |x| ∼ ∞ , como mostra a condição ii) no seguinte
VI.3. A CONVERGÊNCIA FRACO∗ 169

Teorema (Fréchet-Kolmogorov). Dado p ∈ [1, ∞) fixo, tem-se que


um subconjunto fechado e limitado F de Lp (IR) é compacto se e só se:
R #
i) limt→0 RIR |f (s + t) − f (s)|p ds = 0 uniformemente
.
ii) limα→∞ |s|>α |f (s)|p ds = 0 para f ∈ F

Podemos pensar na condição i) como uma “medida da eqüicontinuidade” das


funções generalizadas de F . A demonstração pode ser lida em [52], pp. 275.

VI.3 A Convergência Fraco∗


Em seções anteriores, estudaram-se as noções de convergência forte e fraca.
Nos espaços duais, discute-se uma terceira noção: a da convergência fraco∗ .
Seja N um espaço normado e N ∗ seu dual. Diremos que uma seqüência de
funcionais (` ) em N ∗ converge fraco∗ para ` ∈ N ∗ se, para todo vetor
x ∈ N , ` x → ` x .
É equivalente exigir, para qualquer F ∈ J(N) , que F ` → F `0 , onde J
é a transformação que permite identificar N ao bi–dual N ∗∗ . Assim, se N
for reflexivo, a convergência fraco∗ é a mesma que a convergência fraca.
O limite fraco∗ de uma seqüência (` ) existindo, ele é único. Senão, suponha-
mos que, simultaneamente,
∗ ∗
` → ` 0 e ` → `00 ,

onde com esta notação estaremos representando a convergência fraco∗ . Pela


definição, `0 x = `00 x , para todo x ∈ N , logo `0 = `00 . É evidente que
as propriedades usuais de comportamento de processos-limite se verificam.
Observe que introduzimos em D 0 (0, T ) e D 0 (0, T ; B) precisamente a con-
vergência fraco∗ . Os dois teoremas que seguem justificam a introdução dos
conceitos de convergência fraca e fraco∗ .

Teorema 1 Se B é um espaço de Banach reflexivo e (x ) uma seqüência


limitada, ela contém uma subseqüência (xk ) fracamente convergente.
Portanto, os conjuntos fechados e limitados de B são fracamente compactos.

Teorema 2 Seja N um espaço normado qualquer. Então os conjuntos


fechados e limitados em N ∗ são fracamente∗ compactos. Em outras palavras,
170 CAPÍTULO VI. A COMPACIDADE

dado S ⊂ N ∗ , fechado e limitado, e dada qualquer seqüência (` ) em S , é



possı́vel determinar uma subseqüência (`k ) e ` ∈ S tais que `k → ` .

O interesse principal do Teorema 1 reside em aplicações aos espaços H k (Ω)


e Lp (Ω) , 1 < p < ∞ . Já o Teorema 2 é usualmente aplicado para
L∞ (Ω) = [L1 (Ω)]∗ . Apresentaremos apenas a

Demonstração do Teorema 1. Suporemos que B seja separável, o que


simplifica a demonstração e se justifica, pois encontramos esta propriedade na
maioria dos espaços de funções com que trabalhamos.
Pelo Teorema 2 da Seção IV.2, B ∗ é separável, pois seu dual B ∗∗ = J(B) é
separável. Seja (` ) densa em B ∗ e seja (x ) uma seqüência limitada em
B . Conseqüentemente (`1 x ) é limitada e portanto existe uma subseqüência
(x1 ) tal que (`1 x1 ) é convergente. Ora, (`2 x1 ) também é limitada, e então se
pode obter uma subseqüência (x2 ) de (x1 ) tal que (`2 x2 ) seja convergente.
Dessa forma, para cada p > 1 inteiro, se obtém (xp ) , subseqüência de
(xp−1
 ) , tal que (`k xp ) é convergente, para 1 ≤ k ≤ p .
A seqüência diagonal (x0 ) := (x ) satisfaz portanto a condição de (`k x0 )
ser convergente, para k = 1, 2, . . . .
Seja agora ` ∈ B ∗ arbitrária e seja  > 0 dado. A desigualdade
|` x0n − ` x0m | ≤ k` − `k k kx0n k + |`k x0n − `k x0m | + k`k − `k kx0m k
implica ser (`x0 ) de Cauchy, logo convergente. Assim, (`x0 ) é convergente,
qualquer que seja ` ∈ B ∗ , e só resta mostrar que existe x0 ∈ B tal que
` x0 = lim ` x0 .

Considere F := J x0 ∈ B ∗∗ . O funcional

F0 ` := lim F ` = lim ` x
 

é linear e contı́nuo pelo Teorema de Banach–Steinhaus. Dessa forma conclui-se


que F0 ∈ B ∗∗ = JB, logo F0 = J x0 , para algum x0 ∈ B . É imediato
verificar que
lim x0 = x0 (fraco).
j

A recı́proca do Teorema 1 é o
VI.4. TEOREMAS DE RELLICH E DE IMERSÃO 171

Teorema de Eberlein-Shmulyan: Suponhamos que toda seqüência limitada


do espaço de Banach B admita uma subseqüência fracamente convergente.
Então B é reflexivo.
A longa e tediosa demonstração deste resultado é encontrada em [52], pp. 141.

VI.4 Teoremas de Rellich e de Imersão


Dizemos que um operador linear T : N1 → N2 é compacto se a imagem
de qualquer conjunto limitado (de N1 ) tem fecho compacto (em N2 ). Ou
por outra, se de cada seqüência limitada (x ) em N1 , se pode obter uma
subseqüência (x0 ) tal que (T x0 ) seja convergente em N2 .

Exemplo 1 Considere o Exemplo 1 da Seção II.12 . Pelo Teorema de Arzelà–


Ascoli, é compacto o operador
Z x
f → f (s)ds .
0

Exemplo 2 Tomemos agora o operador


#
ı : H 1 (0, 1) → C 0 (0, 1)
.
f → ı(f ) := f

A desigualdade (3.25) e, outra vez, o Teorema de Arzelà–Ascoli implicam na


compacidade de ı . •

Descrevemos este fato dizendo que H 1 (0, 1) está compactamente imerso


em C 0 (0, 1) . Este é um exemplo de uma série de resultados conhecidos como
teoremas de imersão dos espaços de Sobolev. Essencialmente eles nos in-
formam que as funções dos espaços H k (Ω) , Ω ⊂ IRn , são mais regulares
do que seria de se esperar baseando-nos apenas na definição daqueles espaços.

Teorema (Relich) Seja Ω ⊂ IRn um aberto limitado. Dada uma seqüência


arbitrária (f ) em H0k (Ω) , k ≥ 1 , existe uma subseqüência (fp ) que
converge em H0k−` (Ω) , 1 ≤ ` ≤ k . Em outras palavras,

ı : H0k (Ω) → H0s (Ω)


f → ı(f ) := f
172 CAPÍTULO VI. A COMPACIDADE

é compacta para 0 ≤ s ≤ k − 1 .

Exemplo 3 Observe a condição de ser Ω limitado, ela é indispensável.


Com efeito, seja f ∈ H k (IRn ) e x0 ∈ IRn um vetor não nulo. Então

f (x) := f (x − x0 ) ,  ∈ IN

é uma seqüência limitada que, em H s (IRn ) , não admite subseqüência conver-


gente, para nenhum valor de s .
Para regiões não limitadas tem-se o

Teorema 1. Sejam Ω ⊂ IRn aberto e (fj ) uma seqüência limitada


em H 1 (Ω) . Então é possı́vel obter uma subseqüência (fp ) e uma função f0
em L2loc (Ω) para as quais
Z
p
|fp (x) − f0 (x)|2 dx → 0 ,
K

em cada compacto K ⊂ Ω .
O Teorema de Rellich continua válido para H k (Ω) (em lugar de H0k (Ω) ) desde
que ∂Ω tenha certa regularidade, ver [23], pp. 31.
Com relação à regularidade dos elementos de H k (Ω) é válido o

Teorema 2. Seja k > n/2 um inteiro. Então os elementos de H k (IRn )


são funções contı́nuas, isto é, para cada f ∈ H k (IRn ) é possı́vel determinar
g ∈ C 0 (IRn ) tal que g = f qtp.
Mais geralmente, se k − ` > n/2 , a menos de modificação em um conjunto
de medida nula, temos f ∈ C ` (IRn ) e

kf k`,∞ ≤ Ckf kk,2 ,

para alguma constante C = C(`, k) , que independe de f .

É um corolário do Teorema 2 que se podem obter as mesmas conclusões para


H0k (Ω) , sendo Ω um aberto do IRn . Novamente, propriedades semelhan-
tes para H k (Ω) podem ser deduzidas, desde que ∂Ω apresente suficiente
regularidade, ver [23], pp. 30, ou [39], pp. 80.
Capı́tulo VII

Bases Hilbertianas e
Aproximação

VII.1 Ortogonalização
Neste capı́tulo estaremos sempre trabalhando com um espaço de Hilbert real
H munido do produto interno (•|•) .

Dizemos que um conjunto S ⊂ H é ortogonal se seus elementos são


dois a dois ortogonais, isto é,
s1 , s2 ∈ S , s1 6= s2 =⇒ (s1 |s2 ) = 0 .
Um conjunto ortogonal é dito ser ortonormal se todos os seus elementos têm
norma igual a 1 . Assim, para S := {sı } , S é ortonormal se e só se
(sı |s ) = δı (δı := delta de Kronecker ).
Dado um conjunto ortonormal, ele é linearmente independente. De fato,
supondo que
X
N
α sı = 0 , (VII.1)
=1

para algum conjunto finito de reais {α } ,  = 1, . . . , N e de vetores


{sı }=1,...,N ⊂ S , obtém-se, multiplicando (VII.1) por cada um desses
vetores sıκ ,
ακ (sıκ |sıκ ) = ακ ksıκ k2 = ακ = 0 .

173
174 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

Reciprocamente, dada uma seqüência {s }∈IN de vetores linearmente inde-


pendentes, pode-se obter, a partir dela, uma outra seqüência {σ }∈IN , orto-
gonal e que gera o mesmo subespaço. (Dizemos que um conjunto A ⊂ H
gera o subespaço [A] , ou que [A] é o subespaço gerado por A , se qualquer
vetor v ∈ [A] pode ser escrito como
X
v = αı aı ,
ı∈I

para algum conjunto finito de vetores aı ∈ A e de reais αı .)


A verificação deste fato é feita pelo processo conhecido como de ortonorma-
lização de Gram-Schmidt, que passamos a descrever.
Defina
σ1 := s1 /ks1 k , (VII.2)
o que é possı́vel pois s1 6= 0 , já que {s } é linearmente independente. Seja
agora
s̃2 := s2 − (s2 |σ1 )σ1 . (VII.3)
Tem-se que (s̃2 |σ1 ) = 0 e que s̃2 6= 0 ; pomos então

σ2 := s̃2 /ks̃2 k . (V II.20 )

(Observe que em (VII.3) definiu-se s̃2 de modo a eliminar de s2 sua projeção


na direção de σ1 .) Define-se recursivamente, para n ≥ 2 ,

X
n−1
s̃n := sn − (sn |σ )σ , (V II.30 )
=1

σn := sn /ksn k . (V II.200 )
O conjunto {σ } tem as propriedades enunciadas.

Exercı́cio 1 (Processo de Gram-Schmidt modificado) O procedimento cons-


truı́do por meio de (VII.2) - (VII.3) pode ser substituı́do, com vantagens com-
putacionais1 , reorganizando os cálculos de acordo com o algoritmo descrito
a seguir. Verifique que, quando feitos os cálculos exatamente (isto é, com
precisão total, sem erros de arredondamento), chega-se ao mesmo conjunto
1
isto é, de forma a assegurar o que se chama de estabilidade computacional
VII.2. AS SÉRIES DE FOURIER 175

ortonormal em ambos os processos.

Para k = 1, . . . , n, efetue
p(k) := k
fim
Para k = 1, . . . , n, efetue
Atribua à variável J o menor valor de
j = k : n para o qual
ksp(j)k ≥ ksp(i) k ∀ i = k : n
σk := sp(J) /ksp(J) k
Para i = k : J − 1 efetue
p(i + 1) := p(i)
fim
Para i = k + 1 : n , efetue
sp(i) := sp(J) − (sp(J) |σk )σk
fim
fim

Observemos ainda que, em H , dado S := {sı }ı∈IN – um conjunto


enumerável e não vazio – é possı́vel dele extrair um subconjunto linearmente
independente S , tal que [S] = [S] .
Com efeito, definiremos recursivamente a subseqüência sık , supondo que
S 6= 0 , por:
a) ı1 := min{ ∈ IN ; s 6= 0 } ;

b) definidos ı1 , ı2 , . . . , ın , seja Vn := [{sı ; 1 ≤  ≤ n }], e então

ın+1 := min{ ∈ IN ; sı 6∈ Vn }.

(No caso em que { ∈ IN ; sı 6∈ Vn } = ∅ , é suficiente definir

S := {sı1 , sı2 , . . . , sın } .)

VII.2 As Séries de Fourier


Um conjunto ortonormal {ej } de vetores de H é chamado de um sistema
completo, ou uma base hilbertiana, se {e }⊥ = {0} , ou seja, o único vetor
176 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

de H ortogonal a todos os vetores {e } é o vetor nulo. (Suporemos sempre


{e } enumerável!)
Demonstraremos que, dado um sistema completo {e }∈IN , é possı́vel escrever
qualquer vetor x ∈ H na forma

X
x = x e (VII.4)
=1

para uma certa escolha dos reais x . Antes, é preciso definir o que se quer
dizer com uma série da forma (VII.4). Diremos que, dados os vetores {v } de
P
H , a série ∞
=1 v é convergente e tem v0 ∈ H por limite, escrevendo-se


X
v0 = v
=1

se
X
N
v0 = lim vj .
N →∞
=1

Suponhamos então que uma expansão na forma (VII.4) seja possı́vel para o
PN
=1 x e . Como xN → x , por iii), Seção II.4,

vetor x , e seja sN :=
(xN |eJ ) → (x|e ) , para todo  ∈ IN fixo.
Agora, sendo  < N ,

X
N
(xN |e ) = x δı = x .
=1

Conseqüentemente,
x = lim (xN |e ) → (x|e ) ,
N →∞

ou seja, se uma expansão da forma (VII.4) existir, os reais x são univoca-


mente determinados:

x = (x|e ) ,  = 1, 2, . . . . (VII.5)

Diz-se que a série no segundo membro de (VII.4), com os escalares x definidos


em (VII.5), é a expansão de Fourier do vetor x com relação à base {e } .
Os escalares x são chamados de coeficientes de Fourier de x na base
VII.2. AS SÉRIES DE FOURIER 177

{e } : são, a menos do sinal, o módulo das projeções de x nas direções e .

Trata-se agora de mostrar que efetivamente a expansão (VII.4) é válida, desde


que x seja definido por (VII.5).
Seja SN := [{e ;  ≤ N}] . Sabe-se que SN é um subespaço fechado
(Exercı́cio III.4a). Existe portanto a projeção ortogonal sobre SN , denotada
PN : H → SN . É imediato que
X
N
PN x = (x |e ) . (VII.6)
=1

(De fato, como observamos na parte b) do Exercı́cio 4, Seção III.4, no caso de


um subespaço de dimensão finita, podemos demonstrar o Teorema da Projeção
diretamente, ou seja, mostrar que (VII.6) define a projeção ortogonal SN .)
Conforme foi observado na Seção III.4, kPN k = 1 , logo kPN xk ≤ kxk , e
de (VII.6) vem
X
N
kPN xk2 = |x |2 ≤ kxk2 ,
=1

o que implica a chamada desigualdade de Bessel:



X
|x |2 ≤ kxk2 , ∀x ∈ H . (VII.7)
=1

Observe que (VII.7) é válida qualquer que seja o sistema ortonormal {e } ,
independentemente de ser ele completo ou não.
Da desigualdade de Bessel decorre que {x } ∈ `2 e, mais ainda, que a série
(VII.4) é convergente, pois {xN } é de Cauchy:
+P
NX +P
NX
kxN +P − xN k2 = k x e k2 = |x|2 → 0 , se N → ∞ , ∀P .
=N +1 =N +1

Assim, existe x0 ∈ H tal que

xN → x0 .

Resta mostrar que x0 = x . Ora, da mesma forma que (VII.5) foi obtida,
chega-se a
(x0 |e ) = x , (6.50 )
178 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

do que decorre
(x − x0 |e ) = 0 , ∀ ∈ IN .
Usamos agora o fato de ser {e } um sistema completo para concluir que
x0 = x e, portanto, vale (VII.4).
Dados dois vetores x, y ∈ H , usando-se outra vez a continuidade do
produto escalar – cf. (II.13.c) – vem
P P∞ 

(x|y) = =1 (x|e )e |
P k=1 (y|ek )ek 
P
=1 (x|e )e |
N N
= limN →∞ k=1 (y|ek )ek
PN PN
= limN →∞ =1 k=1 (x|e ) (y|ek ) (e |ek )
P P∞
= limN →∞ N =1 (x|e ) (y|e ) = =1 (x|e ) (y|e ) ,

ou seja, vale

X
(x|y) = (x|e ) (y|e ) . (VII.8)
=1

Daı́, se deduz em particular a identidade de Parseval: tomando y := x ,


segue

X
2
kxk = |(x|e )|2 . (VII.9)
=1

Esta identidade pode ser pensada como uma generalização do Teorema de


Pitágoras.
Observe que o fato de (VII.4) ser válida para todo x ∈ H implica em ser
[{e }] denso em H . Reciprocamente, se [{e }] é denso em H , o sistema
ortonormal {e } é necessariamente completo.
De fato, sendo PN a projeção ortogonal sobre SN definida em (VII.6),
tem-se que, para quaisquer reais α1 , . . . , αN ,
X
N
kx − PN xk2 ≤ kx − α e k2 ,
=1

ou seja, os coeficientes de Fourier oferecem a melhor aproximação possı́vel


para x em SN , no sentido, é claro, da norma de H . Isto significa que,
se pudermos aproximar os vetores de H por combinações lineares finitas dos
e ’s, necessariamente teremos xn → 0 , ou seja, (VII.4) será válida.

Diremos que um sistema ortonormal {e } é maximal se qualquer outro


VII.2. AS SÉRIES DE FOURIER 179

conjunto que contenha propriamente {e } não pode ser ortonormal. Tem-se
o seguinte
Teorema 1. Seja H um espaço de Hilbert e {e } um sistema ortonormal.
São equivalentes as seguintes condições sobre {e }∈IN :

i) {e } é maximal;

ii) {e } é completo (isto é, (x|e ) = 0 , ∀ ∈ IN =⇒ x = 0);


P∞
iii) x = =1 (x|e )e , ∀x ∈ H ;

iv) [ {e } ] é denso em H ;


P∞
v) (x|y) = =1 (x|e ) (y|e ) , ∀x , y ∈ H ;
P∞
vi) kxk2 = =1 (x|e )
2
, ∀x ∈ H .

Já demonstramos que ii) =⇒ iii) =⇒ iv) =⇒ v) =⇒ vi) .

Suponhamos que x0 6= 0 , mas (x0 |e ) = 0 , ∀ ∈ IN . Então {e }


é subconjunto próprio de {x0 /kx0 k} ∪ {e } , que é ortonomal. Logo, é válida
a implicação i) =⇒ ii).
De maneira análoga, se {e } não é maximal, existe {x0 } ∪ {e } ortonormal,
o que implica

X
0 = |(x0 |e )|2 = kx0 k2 6= 0 ;
=1

portanto, vi) =⇒ i) . •

Vale a pena observar que existe um outro conceito de base em espaços ve-
toriais de dimensão infinita: um conjunto β contido num espaço vetorial V
é chamado uma base de Hamel para V se, dado qualquer v ∈ V , existem
subconjuntos finitos {bı }ı∈I ⊂ β e {αı }ı∈I ⊂ IR tais que
X
v = αı bı .
ı∈I

Além disso, tal representação é única2 .


2
A demonstração da existência de uma tal base, para qualquer espaço vetorial, lança
mão do Lema de Zorn, ou, equivalentemente, do Axioma da Escolha, ver [40].
180 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

VII.3 Espaços Separáveis, Aproximação


Uma pergunta natural é: quando existe em H uma base Hilbertiana? Observe
que, no caso de conter uma tal base, esse espaço é necessariamente separável.
Com efeito, o conjunto de todas as combinações lineares finitas de elementos
de {ej } , com coeficientes racionais, é enumerável. A recı́proca é verdadeira,
de modo que temos o

Teorema 1 Um espaço de Hilbert é separável se e só contém uma base


Hilbertiana (enumerável).
Demonstração Seja S um conjunto enumerável, denso em H . Pode-se
portanto construir a partir de S um conjunto S1 enumerável e linearmente
independente tal que [S] = [S1 ] .
O processo de ortonormalização de Gram-Schmidt nos fornece um conjunto
ortonormal S2 , ainda enumerável (e denso em {x ∈ H ; kxk = 1} ), tal
que [S2 ] = [S] . Afirmamos que S2 é completo.
De fato, suponhamos que exista x0 ∈ H tal que (x0 |sk ) = 0 ∀sk ∈ S2 .
Sendo [S] = [S2 ] denso em H , existe uma seqüência {xN } tal que
xN → x0 , sendo cada xN uma combinação linear de elementos s ∈ S2 ,
X
M
 
xN := αN sN , com M = M(N).
=1

Como (xN |x0 ) = 0 , ∀N ∈ IN e (xN |x0 ) → kx0 k2 , conclui-se que


x0 = 0 , logo S2 é completo. •

Exercı́cio 2 Todo espaço de Hilbert separável é isometricamente isomorfo


ao espaço de seqüências `2 .
Em outras palavras, existe
J : `2 → H ,
linear, biunı́voca e sobre, tal que
(J x|J y)H = (x|y)`2 , ∀ x , y ∈ `2 .
Exemplo 1 O espaço L2 (0, 2π) , sendo o completamento de C 0 (0, 2π) , é
separável, já que, pelo Exercı́cio II.15, este último é um espaço separável. O
conjunto
β := { f ≡ 1 } ∪ { cos nx , sen nx }n∈IN
VII.3. ESPAÇOS SEPARÁVEIS, APROXIMAÇÃO 181

é ortogonal em L2 (0, 2π) . Verifica-se que ele é completo, como conseqüência


da seguinte versão do

Teorema de Aproximação de Weierstrass. Dada f ∈ C 0 (0, 2π) e


dado  > 0 , existe um polinômio trigonométrico p = p,f ,
N (,f )
X
p(x) := {ak cos kx + bk sen kx} ,
k=1

para o qual
kp − f k∞ <  .
De acordo com este Teorema, o fecho de [β] em C 0 (0, 2π) , na norma k•k∞ ,
contém C00 (0, 2π) . Logo, o fecho de [β] em L2 (0, 2π) contém C00 (0, 2π) ,
sendo portanto o próprio espaço L2 (0, 2π) .

Exemplo 2 Em algumas situações tornam-se necessários espaços de apro-


ximação em H : são subespaços de dimensão finita Vn ⊂ H , tais
que ∪∞ n=1 Vn seja denso em H . Uma possı́vel escolha para esses espaços
é VN := [ {e , 1 ≤  ≤ N} ] .

Exemplo 3 Os espaços H k (Ω) também são separáveis, desde que Ω sa-


tisfaça certas condições de regularidade. Uma forma de demonstrar este fato
é por meio da construção dos espaços de aproximação de elementos finitos,
como em [4], o caso de H 1 (0, 1) sendo exposto a seguir.

VII.3.1 Um Exemplo – os Elementos Finitos


Na subseção V.5.1 mencionamos aproximações numericamente construı́das
para a solução de uma dada equação diferencial, um resultado que, quando
foi obtido, contemplava algoritmos de diferenças finitas – aqueles de que dis-
punham os autores [13] na época. Esse método de solução se baseia na for-
mulação pontual (ou forte) do problema associado – de valor inicial, de con-
torno, ou misto. Já o método dos elementos finitos, que muito resumida-
mente apresentamos a seguir, é global, pois faz uso da formulação variacional
(também chamada fraca). É importante salientar que, apesar de ser às vezes
considerada esta última formulação como um artifı́cio matemático, de fato ela
é a mais natural para muitos problemas, pois reflete a modelagem global de
182 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

determinadas leis de comportamento. A formulação pontual – cuja dedução,


ao fazer a passagem de regiões com volumes definidos para outras com vo-
lumes “arbitrariamente pequenos”, incorpora uma abordagem assintótica – é
justamente a mais artificiosa.

Foi Richard Courant, em [12], quem pela primeira vez sugeriu os espaços de
elementos finitos, em um artigo que passou despercebido até ser essa técnica re-
descoberta nos anos 60, na área da Engenharia Civil (é de Argyris[3] a primeira
referência, sendo Clough[10] quem primeiro empregou o termo). Quando sub-
metida, anos depois, ao rigoroso crivo matemático, demonstraram-se teorica-
mente algumas de suas propriedades já conhecidas – e utilizadas – computa-
cionalmente.

Comparando ainda esta técnica com aquela discutida em V.5.1, observamos


que neste contexto os operadores diferenciais em estudo não são aproximados:
operam-se com eles próprios, contudo definidos nos espaços de aproximação
compostos pelos elementos finitos, ou seja, são tomadas suas restrições a
esses espaços. Em outras palavras, aproximam-se os espaços onde se buscam
as soluções, e estas satisfazem propriedades de minimização, como aquelas as-
sociadas às projeções ortogonais discutidas em III.4.

O teorema descoberto em 1891 por Karl Weierstrass, cf. pág. 23, pág. 181
ou [51], pode ser descrito dizendo que os polinômios possuem a propriedade
de mimetizar muito bem as funções contı́nuas: por melhor que seja o instru-
mento de medição de que disponhamos, dada uma função contı́nua arbitrária
no intervalo [a, b] , existe um polinômio que consegue confundir nosso ins-
trumento, o qual não vai poder distinguir entre esse polinômio e a função
inicialmente introduzida. Como a avaliação numérica de um polinômio exige
apenas operações algébricas (soma, multiplicação), facilmente processadas em
um computador, este resultado parece indicar um caminho insuperável para a
construção de algoritmos de aproximação.

Mas sucede que a essência da tarefa de aproximação está não apenas em


encontrá-la, mas principalmente em avaliar o erro numérico a ela associ-
ado, e o esforço computacional a ser dispendido. Melhor dizendo, são faces
complementares do mesmo problema, nenhum objetivo existindo em resolver
a primeira se informações não forem disponı́veis para as outras duas. Como
VII.3. ESPAÇOS SEPARÁVEIS, APROXIMAÇÃO 183

se demonstra que, para obter erros cada vez menores com as aproximações
garantidas pelo Teorema de Weierstrass, polinômios com graus cada vez mais
elevados são exigidos, essa aproximação conduz ainda a um outro tipo de er-
ros, aqueles gerados pela aritmética de precisão finita da computação digital,
os erros de arredondamento.

Dados N + 1 pontos distintos de [a, b] , {x } , a ≤ x0 < x1 < . . . < xN ≤ b ,


e uma função f ∈ C N +1 (a, b) , sendo h := max{x − x−1 , 1 ≤  ≤ N },
a expressão do erro de truncamento na interpolação de f com o (único)
polinômio pN = pN (f ) de grau N que coincide com f nesses pontos,
chamados nós de interpolação, é dada por
|f (x) − pN (x)| ≤ C hN +1 , a ≤ x ≤ b , (VII.10)
onde C = CN (f ) é uma constante associada a limitações para derivadas de
f em [a, b] .

Por um lado, (VII.10) indica que buscar a redução dos erros na aproximação
com polinômios, por meio da interpolação, não é um bom caminho, pois e-
xige um grau elevado para esses polinômios. Mas deve-se observar que essa
expressão indica também uma outra alternativa, justamente a que motivou a
construção do método dos elementos finitos, como passamos a descrever.

Em vez de trabalhar com aproximações globais, tomam-se aproximações lo-


cais, ou seja, interpolações definidas separadamente em sub-intervalos do in-
tervalo inicialmente considerado. Assim, é possı́vel fazer h → 0 sem que
N cresça, e portanto a estimativa (VII.10) seja ameaçada pelo valor de CN .
Uma outra justificativa para este procedimento é que a função f pode não
ter o grau de regularidade exigido por (VII.10) para valores elevados de N .
Lembremos ainda que funções seccionalmente polinomiais são utilizadas nas
fórmulas repetidas de integração numérica.

Descreveremos agora como aproximar H 1 (Ω) por elementos finitos quadráti-


cos, no caso de Ω = [a, b] ⊂ IR .

Certas dificuldades técnicas que ocorrem quando a região Ω tem dimensão


maior que 1 permanecem ocultas na presente discussão, que apesar disso já
introduz os aspectos mais relevantes da construção do método. Este o objetivo
184 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

de mantermos alguns detalhes na notação e na própria construção, os quais de


fato só se justificariam para dimensões maiores.

Tomemos N > 0 um inteiro arbitrário e consideremos uma partição T


de [a, b] composta de N intervalos fechados3 , os quais denominaremos ele-
mentos e denotaremos por e ∈ T .
Os dois pontos extremos e o o ponto médio de cada elemento são ditos nodos
desse elemento4 e denotados e1 < e2 < e3 , de modo que se tem
S
e∈T e = Ω
"
T ∅ ou .
e e0 =
{eı } = {e0 } , com {ı, } = {1, 3}
E, sendo
he := e3 − e1 = diam e , (VII.11)
h := max {he } , (V II.110 )
e∈T
vale
|eı − e | ≤ h , ∀ e ∈ T , ı,  = 1, 2, 3 .
A própria definição (VII.11) já enfatiza ser desnecessária a escolha de uma
partição regular, ou seja, formada por intervalos de igual comprimento. Tal
escolha precisa mesmo ser evitada em alguns problemas para melhorar a qua-
lidade da aproximação, ver por exemplo [25].
O espaço Vh ⊂ H 1 (Ω) a ser construı́do é formado por funções contı́nuas
que, dentro de cada elemento, coincidem com um polinômio de grau ≤ 2 .
Assim, cada função v ∈ Vh fica completamente caracterizada pelos seus
valores nos nodos eı , ı ∈ 1, 2, 3 , e ∈ T . Sendo φeı ∈ Vh as funções
de forma definidas para e ∈ T , ı,  = 1, 2, 3 por

φeı (e ) := δı ( δ é o delta de Kronecker) , (VII.12)


e, denotando
veı := v(eı ) ,
tem-se
3
X
v(x) = veı φeı (x) , ∀ v ∈ Vh , x ∈ e .
ı=1
3
Estamos abusando do termo “partição”, já que há interseções não vazias.
4
(para não confundir com os nós da partição)
VII.3. ESPAÇOS SEPARÁVEIS, APROXIMAÇÃO 185

Esta é a chamada representação local de v , válida apenas no elemento


e ∈ T . Com relação a esta base local, v apresenta coeficientes bem
simples: são os seus próprios valores nos 3 nodos eı . Por outro lado, para
qualquer elemento e ∈ T , as funções φeı podem ser calculadas em pontos
quaisquer do elemento por meio das mesmas funções de interpolação

θı : [−1, 1] → IR

dadas por (ver figura que segue)



θ1 (s) := s(s − 1)/2

 θ2 (s) := 1 − s2 ,
θ3 (s) := s(s + 1)/2

θ
6
1

θ1 (x) θ3 (x) θ2 (x)


- x
−1 0 1

e das mudanças de coordenadas


x − e1
ξe (x) := 2 −1, x ∈ e,
e3 − e1
ou seja,
xe (ξ) := [ξ(e3 − e1 ) + e3 + e1 ]/2 , −1 ≤ ξ ≤ 1 .
De fato, vale
φeı (x) = θı (ξe (x)) , x ∈ e , ∀ e ∈ T .
A notação introduzida em (VII.12) é propositadamente ambı́gua pois a mesma
função φ aparece com ı́ndices distintos conforme um nodo seja considerado
como em um ou noutro elemento. Ora, a famı́lia {φeı }ı=1,2,3; e∈T é uma base
186 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

de { Vh } , com Nh = 2N + 1 elementos, logo podemos indiciá-la na


forma {φı }1≤≤Nh , o que corresponde a reindiciar os nodos: temos agora uma
indiciação global {x }1≤≤Nh e uma representação global

X
Nh
v(x) = v(x ) φ (x) . (VII.13)
=1

As funções φ apresentam os perfis descritos na figura que segue. Observa-


se que o suporte de cada uma delas interseciona no máximo o suporte de
outras quatro. Dessa forma, o conjunto {φ } é apenas “quase” ortogonal:
os produtos internos < φı | φ > só podem ser distintos de zero para
no máximo cinco pares (ı, ) . Na solução numérica de equações diferen-
ciais, esta propriedade dos elementos finitos assegura que os sistemas lineares
gerados pelo algoritmo de resolução correspondem a matrizes esparsas – de
fato, matrizes de banda –, o que conduz a importante economia em esforço
computacional.

1 −6

e2 e3 e1 e2 e3 e1 e2
e1 = a
e1 |e2 e3 |0 |-
e1 e02 e03 e3 = b

/ e /| |
e0

Algumas funções φ da base global que construı́mos são “rasgadas” quando


consideradas na base local que corresponde a um dos elementos onde elas não
se anulam. As informações geradas a nı́vel de elemento necessitam assim ser
“costuradas” a fim de produzir as informações globais. É o que se chama a
montagem da matriz global do sistema a partir das matrizes associadas às
VII.3. ESPAÇOS SEPARÁVEIS, APROXIMAÇÃO 187

equações locais.

É importante relacionar algumas das propriedades da técnica dos elementos


finitos:

• A manipulação das funções φ é simples, essencialmente conduzida a


nı́vel de “máquina”, não exigindo esquemas numéricos de aproximação,
como ocorre, por exemplo, quando se escolhe a expansão em autofunções,
as quais exibem a aparente vantagem de produzir um sistema não apenas
esparso, mas diagonal;

• Os próprios coeficientes de uma dada função com relação à base φ


já fornecem importantes dados sobre essa função – são seus valores nos
nós e . Trata-se de uma importante propriedade quando a função a ser
aproximada é “dada” por outras propriedades, por exemplo, a solução
de um sistema de equações diferenciais.

• A rotina de construção de soluções aproximadas para um sistema de


equações diferenciais envolve grande número de passagens também pre-
sentes em outros problemas, permitindo assim a criação ágil de pro-
gramotecas com esse fim.

• A escolha da indexação e1 < e2 < e3 e x < x+1 implica terem


as matrizes associadas a forma de matrizes de banda. Claro que esta é
também a indexação natural em uma dimensão. Tal propriedade deixa
de ser válida para dimensões maiores, fazendo-se necessário pesquisar a
ordem mais conveniente para a indexação. Também a correspondência
entre ı́ndices globais e locais não fica tão simples, introduzindo-se para
isso as matrizes de incidência, cf.[39].

Quantifiquemos agora o grau de precisão – ou o nı́vel do erro – na aproxima-


ção gerada pelas funções que construı́mos. Definimos a chamada função de
interpolação
Πh : H 1 (Ω) → Vh
w → Πh (w) := wh ,
caracterizada por satisfazer as condições

wh (x ) = v(x ) ,  = 1, . . . , Nk ,
188 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

o que equivale, tendo em vista (VII.13), a


X
Nh
wh (x) := w(x ) φ (x) . (V II.130 )
=1

Recordando a notação para h introduzida em (VII.11) e denotando por


∆ := min {he } ,
e∈T

afirmamos, cf. [48], que, para toda função w ∈ C 2 (Ω) , vale


h3
kw − Πh wk1 ≤ C(w) ,

onde a constante C(w) depende de w – de fato, C(w) = C(kwkH 2 ) .
Conseqüentemente, tendo em vista ser o subespaço C 2 (Ω) denso em H 1 (Ω) ,
vale o seguinte

Teorema (aproximações seccionalmente quadráticas). Dada f ∈ H 1 (Ω) ,


pode-se construir uma seqüência de reais {hn } , com hn → 0 , e uma seqüên-
cia de funções f n ∈ V hn que satisfazem
k fn − f kH 1 = O (h2n ) .
A partir deste teorema pode-se demonstrar o resultado anunciado ao final da
seção anterior, o qual sugerimos como um

Exercı́cio. O espaço H 1 (Ω) é separável.

Uma formulação mais geral das propriedades de interpolação para elemen-


tos finitos unidimensionais, com malha uniforme é o conteúdo do

Teorema (aproximações seccionalmente polinomiais). Para r, `, N in-


teiros, 0 < r < ` − 1 e h = 1/(N + 1) , consideremos o espaço Sh`,r
das funções seccionalmente polinomiais, de classe C r (0, 1) , que coincidem
com um polinômio de grau ≤ ` − 1 em cada subintervalo. O operador de
interpolação nestes espaços
Πh : H 1 (0, 1) → Sh`,r
v → Vh
VII.4. COMPACIDADE: BASE DE AUTO-VETORES 189

satisfaz
k v − Vh kH 1 = O(h`−1) .
Formulações mais completas podem ser consultadas em [9], que também expõe
– cf. pp.112-114 – detalhes do resultado que apresentamos a seguir. Ele esta-
belece a conexão entre interpolação e solução numérica de equações diferenciais
por meio dos elementos finitos.

Suponhamos que a equação variacional

a(u, v) = l(v) , ∀ v ∈ V , (VII.14)

satisfaça as condições de Lax-Milgram descritas à pág. 79. Sendo Vh uma


famı́lia de subespaços de V com o parâmetro h → 0 , em cada um deles
consideramos a equação discretizada

a(uh , vh ) = l(vh ) , ∀ vh ∈ Vh . (VII.15)

Dizemos que os espaços Vh geram uma discretização convergente se, para


qualquer problema da forma VII.14 se tem, para as soluções encontradas por
VII.15,
lim ku − uh k = 0 .
h→0

A conexão mencionada é garantida pelo

Lema de Céa. Nas condições descritas acima para a , V , Vh , podemos


garantir a existência de uma constante C , que independe do subespaço Vh ,
para a qual
ku − uh k ≤ C inf ku − vh k .
vh ∈Vh

VII.4 Compacidade: base de auto-vetores


Considere em um espaço de Hilbert H o operador definido por

T : H → H
P P
x = n
x en → T x := (xn /n)en ,
190 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

onde { en } é uma base ortonormal de H .


Afirmamos que T é um operador compacto.
(Nesta seção, sempre que omitirmos a variação dos ı́ndices em seqüências e
somatórios, teremos , k, n percorrendo IN , ou algum subconjunto de IN ,
o que estará claro no contexto.)
Para verificar a afirmação acima, devemos tomar uma seqüência limitada ar-
bitrária {xj } ⊂ H e concluir a existência de uma subseqüência {xk } tal
que {T xk } seja convergente.

Etapa 1 (Construção da subseqüência) Como, pela desigualdade de Bessel,


X
|xn |2 ≤ kxk2H , ∀x = xn en ∈ H , (VII.16)

concluı́mos que a seqüência de reais {xn } é limitada, qualquer que seja a


componente n-ésima (fixa) considerada.
Seja n = 1 . É então possı́vel escolher uma subseqüência {x (1)} de {x } ,
tal que:

|x1 (1) − x̄1 | → 0 se  → ∞ , para algum real x̄1 .

Da mesma forma, sendo limitada, {x2 (1)} admite uma subseqüência conver-
gente para, digamos, x̄2 ∈ IR . Denotemos essa subseqüência de {x (1)}
por {x (2)} , valendo

|x2 (2) − x̄2 | → 0 se  → ∞ .

Este procedimento pode ser repetido, de forma a construirmos

{x (1)} , {x (2)} , . . . , {x (k)} , . . . ,

subseqüências de {x } ⊂ H , cada uma delas subseqüência da anterior e


com a propriedade:

|xk (k) − x̄k | → 0 se  → ∞ .

A subseqüência convergente que afirmamos existir é obtida pelo chamado “pro-


cesso diagonal de Cantor” (já utilizado na Seção V.2).
Vamos denotá-la por { x̃ı } , definindo-a por

x̃ı := xı (ı) , ı ∈ IN .
VII.4. COMPACIDADE: BASE DE AUTO-VETORES 191

Etapa 2 (Verificação da convergência) Afirmamos que o vetor


X
ȳ := (x̄n /n)en ∈ H
é o limite da seqüência {T x̃ı } , ou seja:
X
lim kT x̃ı − ȳk2 = lim |x̃nı − x̄n |2 /n2 = 0 . (VII.17)
ı→∞ ı
n

Observamos inicialmente que, de fato, ȳ ∈ H pois (cf. (VII.16))


X X
|x̄n /n|2 ≤ K n−2 ,

sendo K um limitante para kx k2 .


P −2
Seja agora  > 0 arbitrário. A convergência da série n implica ser
possı́vel determinar N = N() tal que

X
n−2 < /4K
n=N

e conseqüentemente

X
|x̃nı − x̄n |2 /n2 < /2 . (VII.18)
n=N

Basta agora, para obter (VII.17), comprovar que


X
N −1
|x̃nı − x̄n |2 /n2 < /2 .
n=1

Ora, como todas as (N − 1) componentes x̃nı convergem (para x̄n , respec-


tivamente) quando ı → ∞ , então é possı́vel encontrar I = I() para o
qual "
n 2 2 s≥I
|x̃s − x̄ | /n < /2
n N
. (VII.19)
n = 1, . . . , N − 1
Combinando (VII.18) e (VII.19) chega-se, para ı > I , à desigualdade
kT x̃ı − ȳk2 <  .
Exercı́cio 3 Observe que com esta mesma demonstração pode-se deduzir ser
compacto o chamado cubo de Hilbert, o subconjunto
K := { x = (xn ) ∈ `2 ; |xn | ≤ 1/n } .
192 CAPÍTULO VII. BASES HILBERTIANAS E APROXIMAÇ ÃO

O operador T é mais que um exemplo (talvez) complicado de operador


compacto: ele explica como atua uma grande famı́lia de operadores compactos,
aqueles que são ao mesmo tempo autoadjuntos, o que significa: satisfazem

(T x|y) = (x|T y) , ∀ x, y ∈ V . (VII.20)

Tais operadores têm uma caracterı́stica importante: sua imagem T (V ) pode


ser expandida em termos de uma base ortonormal formada por autovetores.
Relacionamos a seguir as principais propriedades ligadas a seu espectro.

a) Os autovalores de T são todos reais, formam um conjunto no máximo


enumerável { λı ; i ∈ IN } cujo único ponto de acumulação é a origem,
λı → 0 se ı → ∞ .

b) A cada autovalor λı corresponde um subespaço Vı de dimensão finita


δı , formado pelos autovetores associados a λı .

c) Autovetores correspondentes a autovalores distintos são ortogonais.

d) Cada autovalor pode ser obtido pelo princı́pio do mini-max:

|λı | = sup { (T x|T x) ; kxk = 1 , x ⊥ Vj ,  < ı } .


Capı́tulo VIII

A Derivada em Espaços
Normados

VIII.1 Introdução
Os problemas não lineares são muitas vezes tratados como perturbações de
problemas lineares, pelo fato de nos permitir a maior simplicidade destes, se os
conhecemos bem, inferir conclusões sobre aqueles. Tal é a idéia que repousa,
por exemplo, ao aproximar uma função real qualquer pela sua fórmula de
Taylor de primeira ordem, ou seja, usar o Teorema do Valor Médio

f (x0 + h) = f (x0 ) + f 0 (x0 + θh)h , θ ∈ (0, 1)

na forma aproximada

f (x0 + h) ≈ f (x0 ) + f 0 (x0 )h .

O conhecimento da derivada de uma função nos permite assim substituir esta


função, localmente, por uma aproximação linear. Generalizamos nesta seção
o conceito de derivada, de forma a englobar funções vetoriais.

Sejam M e N espaços normados e seja f : D ⊂ M → N uma função


arbitrária1 . Diremos que f é derivável no sentido de Fréchet no ponto x0
1
De fato, usaremos sempre esta notação, mas no que segue o domı́nio das funções pode
ser apenas uma parte aberta de M , ou do correspondente espaço.

193
194 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS

do seu domı́nio, se existir um operador limitado T = T (x0 , f ) : M → N


tal que
{f (x0 + h) − f (x0 ) − T h} = o(khk) , h → 0 . (VIII.1)
Em (VIII.1) utilizamos a notação empregada em (IV.59), querendo dizer que
kf (x0 + h) − f (x0 ) − T hkN
lim = 0.
h→0 khkM
É imediato verificar que:
a) Existe no máximo um operador limitado satisfazendo (VIII.1). Conse-
qüentemente, podemos nos referir a T como a derivada (de Fréchet)
de f no ponto x0 , denotando-a por f 0 (x0 ) .
b) Se f é uma função constante, sua derivada é o operador nulo
f 0 (x0 ) = 0 , ∀ x0 ∈ M .

c) Se f é um operador linear, então f 0 (x0 ) existe para qualquer x0 ∈ M


e, de fato,
f 0 (x0 ) = f , ∀ x0 ∈ M .
d) Se f é derivável no ponto x0 , ela é contı́nua neste ponto.
e) Sendo f derivável em x0 , para qualquer z ∈ M se tem
f (x0 + λz) − f (x0 )
lim = f 0 (x0 ) z . (VIII.2)
λ→0 λ
Independentemente de ser ou não f derivável em x0 , existindo o limite em
(VIII.2), ele é chamado a derivada direcional – ou derivada de Gâteaux – de
f em x0 na direção de z , denotada ∂f /∂z(x0 ) . É claro que se y := αz ,
então ∂f /∂y(x0 ) = ∂f /∂z(x0 ) .
Demonstremos a) e b).

Supondo que T1 e T2 satisfazem (VIII.1), segue que, dado  > 0


existe δ = δ() > 0 tal que
kT1 h − T2 hk ≤ kf (x0 + h) − f (x0 ) − T1 hk
+kf (x0 + h) − f (x0 ) − T2 hk ≤ 2khk ,
VIII.1. INTRODUÇÃO 195

desde que khk < δ . Dividindo-se ambos os membros desta desigualdade


por khk 6= 0 , segue da linearidade de T1 e T2 que

kT1 x − T2 xk ≤  , ∀ x ∈ M , kxk = 1 ,

logo T1 = T2 .
Para provar a continuidade de f num ponto x0 onde ela é derivável, usamos
a desigualdade do triângulo:

kf (x0 + h) − f (x0 )k ≤ kf (x0 + h) − f (x00 )hk


+ kf 0 (x0 )hk ≤ khk + kf 0 (x0 )k · khk → 0 .

f ) É de imediata verificação que, se f e g forem deriváveis em x0 , então


αf + βg também o será, para arbitrários reais α e β , tendo-se

(αf + βg)0 (x0 ) = αf 0 (x0 ) + βg 0(x0 ) .

g) Seja f : M → IR diferenciável e x0 um ponto onde f 0 (x0 ) = 0 .


Dizemos que x0 é um ponto estacionário, podendo ser um mı́nimo
local, um máximo local ou um ponto de sela. Em problemas de oti-
mização, ou minimização, é importante saber se todo ponto de mı́nimo
que se pesquisa é necessariamente estacionário.

Enunciamos agora a

Regra da Cadeia. Sejam as funções f : M → N , g : N → P , onde


M, N e P são espaços normados, e suponhamos que f 0 (x0 ) e g 0 (f (x0 ))
existam. Então a composta h := g ◦ f é derivável em x0 e vale

h0 (x0 ) = g 0(f (x0 )) ◦ f 0 (x0 ) .

Demonstração Devemos estimar

∆ := g(f (x0 + h)) − g(f (x0)) − [g 0 (f (x0 )) ◦ f 0 (x0 )]h .

Da desigualdade do triângulo vem, via adição e subtração do mesmo termo,

k∆k ≤ k g(f (x0 + h)) − g(f (x0)) − g 0 (f (x0 )) [f (x0 + h) − f (x0 )] k


+ k g 0(f (x0 )) [ f (x0 + h) − f (x0 ) − f 0 (x0 )h ] k ,
196 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS

donde se conclui que k∆k / khk → 0 , se khk → 0 , como conseqüência da


diferenciabilidade de g e de f , e da continuidade de f em x0 .

Exemplo 1 No caso de funções f : ⊂ IRn → IRp , o operador


f 0 (x0 ) : IRn → IRp , sendo linear, pode ser identificado a uma matriz.
Verifica-se que esta matriz é justamente a matriz Jacobiana
" #
∂fı
(x0 ) 1 ≤ı ≤ p, 1 ≤ ≤ n .
∂x
Exemplo 2 Seja o operador não linear
#
F : C 0 (0, 1) → C 1 (0, 1)
R ,
f → 0t G(S, f (S) dS
para uma dada G : IR2 → IR . Suporemos aqui que G é contı́nua e que
D2 G também é contı́nua2 . Temos, para cada f0 ∈ C 0 (0, 1) fixa, e para
h ∈ C 0 (0, 1) arbitrário,
R
[ F (f0 + h) − F (f0 ) ] (t) = 0t [ G(S, f0 (S) + h(S)) − G(S, f0 (S)) ] dS
R
= 0t [ D2 G(S, f0 (S) + θS h(S) ) h(S) ] dS .
Logo, como
Z t
F (f0 + h) − F (f0 ) − D2 G(S, f0 (S) ) h(S) dS =
0
Z t
[ D2 G(S, f0 (S) + θS h(S) ) − D2 G(S, f0 (s)) ] h(S) dS ,
0
sendo D2 G uniformemente contı́nua em qualquer compacto, obtém-se, para
arbitrários valores de  > 0 , a existência de correspondentes valores de
δ > 0 para os quais
Z
t
[ D2 G(S, f0 (S) + θS h(S) ) − D2 G(S, f0 (s)) ] h(S) dS ≤

0
Z t Z t


h(S)dS ≤ khk∞  dS ≤  khk∞ ,

0 0
desde que khk∞ < δ .
Assim, Z t
[ F 0 (f0 ) h ] = D2 G( S, f0 (S)) h(S) dS .
0
2
D2 G : notação para derivada parcial, introduzida na Seção III
VIII.2. TEOREMAS DO VALOR MÉDIO 197

VIII.2 Teoremas do Valor Médio


Descrevemos nesta seção um importante instrumento para a obtenção de de-
sigualdades, particularmente as chamadas estimativas a priori, fundamentais
no estudo da convergência de esquemas numéricos.
Tomemos f : M → IR e suponhamos que f seja derivável em todos os
pontos do segmento que une x1 a x0 , contido no domı́nio de f , ou seja,
que esteja definida a transformação

f0 : [x0 , x1 ] → L(M, IR)


x → f 0 (x) .

(Com L(M, N) estamos denotando o conjunto das transformações lineares


contı́nuas de M em N , aqui N = IR .)
Nestas condições,

ψ : [0, 1] → IR
λ → ψ(λ) := f ( x0 + λ(x1 − x0 ) )

é deriváve1 em [0, 1] , pois ψ = f ◦ g , sendo

g : [0, 1] → M
λ → g(λ) := x0 + λ (x1 − x0 )

derivável, em virtude de b), c) e f ). Aplicando-se o Teorema do Valor Médio


(do Cálculo Diferencial na reta) para ψ , conclui-se a existência de um ponto
x no segmento que une x0 a x1 , para o qual

f 0 (x)(x1 − x0 ) = f (x1 ) − f (x0 ) . (VIII.3)

Para obter (VIII.3) fizemos uso da regra da cadeia para ψ e, para g , da


identificação dos operadores de L(IR, M) aos vetores de M .

Demonstramos assim o Teorema do Valor Médio para funções reais com do-
mı́nio em um espaço normado qualquer. Sabe-se que este resultado não se
estende para funções a valores vetoriais, ainda que N = IR2 . Intuitivamente
falando, a razão de não termos uma tal extensão é que, quando f pode ser
“separada em componentes”, é possı́vel que se obtenham valores x distintos
para cada componente. Vale porém o
198 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS

Teorema 1 (Desigualdade do Valor Médio) . Seja f : M → N


derivável sobre o segmento [x0 , x1 ] ⊂ M . Então existe x̄ ∈ M , ou seja,
existe θ ∈ (0, 1) , sendo x̄ := x0 + θ (x1 − x0 ) , tal que

kf (x1 ) − f (x0 )k ≤ kx1 − x0 k · kf 0 (x̄)k ,

ou por outra,

kf (x1 ) − f (x0 )k ≤ kx1 − x0 k sup kf 0 ( x0 ) + θ(x1 − x0 ) )k . (VIII.4)


θ ∈ (0,1)

Demonstração Seja `˜ ∈ N ∗ arbitrária. Então g := `˜ f : M → IR é


diferenciável em [x0 , x1 ] , pela regra da cadeia, valendo

g 0(x) = `˜ f 0 (x) .

Pela versão real do Teorema do Valor Médio acima demonstrada,

kf (x1 ) − f (x0 )k = `˜ ◦ f 0 (x̄)) (x1 − x0 ) (VIII.5)

para algum x̄ ∈ [x0 , x1 ] , tal x̄ dependendo do funcional `˜ . (A identi-


dade (VIII.5) pode ser vista como uma formulação fraca do Teorema do Valor
Médio.)
Pelo Teorema de Hahn-Banach, existe um funcional ` ∈ N ∗ , com k`k = 1
e para o qual
kf (x1 ) − f (x0 )k = ` ( f (x1 ) − f (x0 ) ) .
Lançando mão de (VIII.5), segue que

kf (x1 ) − f (x0 )k ≤ k`k kf 0(x̄) (x1 − x0 )k = kf 0 (x̄) (x1 − x0 )k ≤

≤ k f 0 (x̄) k · kx1 − x0 k ,
pois k`k = 1 , o que encerra a demonstração.
Uma conseqüência imediata da desigualdade do Valor Médio:

Se f 0 (x) = 0 , para todo x num aberto conexo A de M ,


então f é constante em A .
VIII.3. DERIVADAS DE ORDEM SUPERIOR 199

VIII.3 Derivadas de Ordem Superior


Supondo f : M → N derivável em todo o seu domı́nio, está definida a
função g #
g := f 0 : M → L(M, N)
.
x → f 0 (x)
Pode-se questionar se uma tal g é derivável em x0 ∈ M . Caso afirmativo,
diz-se que f é duas vezes diferenciável em x0 , denotando-se esta derivada
por f 00 (x0 ) ∈ L(M, L(M, N) ) .
Examinemos os elementos B̃ de L(M, L(M, N ) ) . Para um dado x ∈ M ,
tem-se que B̃(x) ∈ L(M, N) ; logo, dado qualquer y ∈ M , segue que
B̃(x) y ∈ N . Observe que B̃(x) y é linear em x , para y fixo, bem como
linear em y , para x fixo; ou seja, a função (x, y) → B̃(x) y é bilinear.
Este fato permite identificar de uma forma natural o espaço L(M, L(M, N ) )
ao espaço β(M, N ) das transformações bilineares limitadas de M × M em
N , mais propriamente, de M × M em N . (Recordemos, cf. Seção II.7, que
uma transformação bilinear B ∈ β(M, N ) é dita ser limitada se

sup kB(x, y)kN < ∞ .


kxkM =kykM =1

O valor deste supremum é a norma de B .)


A identificação

ı : L(M, L(M, N) ) → β(M, N )

B̃ → B : M ×M → N 
(x, y) → B(x, y) := B̃(x) y

é linear, biunı́voca e sobrejetora. Como

kB(x, y)k = kB̃(x) yk ≤ kB̃(x)k kyk ≤ kB̃k kxk kyk , (VIII.6)

tal transformação é contı́nua. Se N for completo, L(M, L(M, N) ) e


β(M, N) são ambos espaços de Banach, podendo-se afirmar ter esta iden-
tificação uma inversa contı́nua, como uma conseqüência do Teorema dos Iso-
morfismos de Banach.
De fato, a continuidade da inversa ı−1 pode ser obtida diretamente e, mais
ainda, pode-se deduzir a igualdade kB̃k = kBk ainda que não sejam M
200 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS

e N completos. Dada B ∈ β(M, N) , sendo B̃(x)y = B(x, y) , isto é,


B̃ = ı−1 (B) , temos, para x fixo,

kB̃(x) yk ≤ kBk kxk kyk ,

ou seja,
kB̃(x)k ≤ kBk kyk ,
do que decorre
kB̃k ≤ kBk . (V III.60 )
As desigualdades (VIII.6) e (VIII.60 ) implicam na igualdade

kB̃k = kBk .

É mais cômodo e natural pensar então na segunda derivada de f como um


elemento de β(M, N) .
Seja agora f : M → IR uma função a valores reais e x0 um ponto de
mı́nimo para f . Sabe-se que f 0 (x0 ) = 0 e tem-se que a forma bilinear
f 00 (x0 ) é positiva, ou seja,

f 00 (x0 ) (x, x) > 0 , ∀ x ∈ M , x 6= 0 .

No caso em que M := IRp e N := IR , a transformação bilinear f 00 (x0 ) é


identificada à chamada matriz Hessiana
" #
∂2f
(x0 ) .
∂xı ∂x 1≤ı , ≤p

De maneira semelhante à acima descrita, se f 00 (x) existir para todo x num


certo aberto A de M , tem-se uma aplicação

f 00 : A ⊂ M → β(M, N) .

Existindo a derivada desta aplicação em x0 ∈ A , ela é chamada de derivada


de ordem 3 de f em x0 , denotada por f 000 (x0 ) , sendo ela um elemento
de L(M, β(M, N) ) – ou de L(M, L(M, N ) ). Da mesma forma que fizemos
acima, identificaremos

L(M, β(M, N) ) ⇐⇒ T (M, N) ,


VIII.3. DERIVADAS DE ORDEM SUPERIOR 201

onde T (M, N) denota o conjunto das aplicações trilineares T : M × M ×


M → N, que são lineares em cada coordenada separadamente.
Sempre de acordo com este esquema, a derivada de ordem k de f em x0
é denotada por f (k) (x0 ) , sendo uma aplicação k-linear, ou seja, multilinear
de ordem k de M em N , ou mais uma vez, do produto de k cópias de
M em N .
E, seguindo a mesma ordem de idéias apresentadas no Teorema do Valor
Médio, pode-se demonstrar, para f : M → IR , que

f (x0 + h) = f (x0 ) + f 0 (x0 )h + f 00 (x0 + θh)(h, h)/2! (VIII.7)

para algum θ , com 0 < θ < 1 , desde que existam f 0 (x) e f 00 (x) para
x ∈ {x0 + λh , 0 ≤ λ ≤ 1} .
Mais geralmente, com as hipóteses correspondentes, tem-se, denotando

h(k) := (h, h, . . . , h) ∈ M k ,

f (x0 + h) = f (x0 ) + f 0 (x0 )h + f 00 (x0 )h(2) /2!


(V III.70 )
+f 000 (x0 )h(3) /3! + . . . + f k (x0 + θh)h(k) /k! ,
que é a fórmula de Taylor de ordem k .
Para f : M → N , a desigualdade do valor médio se estende na forma

kf (x0 + h) − f (x0 ) − f 0 (x0 )hk ≤


(VIII.8)
kf 00 (x0 + θh)(h, h)k /2 ≤ kf 00 (x0 + θh)k khk2 /2

ou, mais geralmente,

kf (x0 + h) − f (x0 ) − f 0 (x0 )h − . . . − f (k−1) (x0 )h(k−1) /(k − 1)!k


(V III.80 )
= kf (k) (x0 + θh)h(k) /k!k ≤ kf (k) (x0 + θh)k khkk /k! ,

que é a expansão de Taylor de ordem k .

Exercı́cio 1 Seja f ∈ C0k (Ω) uma função real, onde Ω ⊂ IRn é


um aberto limitado. As normas
 1/2
X
k
kf kk,2 :=  kD `
f k20 
|`|=0
202 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS

e  1/2
X
k
|||f |||k :=  |||f ()|||20 
=0

são equivalentes. Aqui, |||T ||| denota a norma da aplicação multilinear T .


P
Sugestão: Basta demonstrar que |`|= kD ` f k20 e |||f ()|||20 são (seminormas)
equivalentes. Sucede que, sendo {em }1≤m≤n os vetores da base canônica do
IRn , isto é, em := (δm p
)1≤p≤n , e ` = (`1 , `2 , . . . , `n ) um multi-ı́ndice,
com |`| =  , tem-se
D` f (x) = f () (x) · ξ ,
onde
ξ := (e1 , . . . , e1 , e2 , . . . , e2 , . . . , en , . . . , en )
/ − −/ / − −/ / − −/ . (VIII.9)
`1 `2 `n

Desta observação, da equivalência das normas em IRS e do fato de ser [IRn ]


gerado pelos vetores ξ da forma (VIII.9), conclui-se o resultado que enunci-
amos.

VIII.4 Métodos Iterativos


Talvez o mais conhecido método iterativo seja o descrito no

Teorema do Ponto Fixo (Banach) . Suponhamos ser f : M → M


uma contração no espaço métrico completo M , com o que queremos dizer
que, sendo d a distância em M , existe uma constante ρ ∈ ]0, 1[ tal que

d( f (x1 ), f (x2 ) ) ≤ ρ d( x1 , x2 ) , ∀ x1 , x2 ∈ M . (VIII.10)

Então existe uma única solução da equação

f (x) = x , (VIII.11)

ou seja, a função f possui um único ponto fixo.


Tal ponto fixo x̄ pode ser obtido a partir do seguinte esquema iterativo:

x+1 := f (x ) para  ≥ 0 ; x0 arbitrário , (VIII.12)


VIII.4. MÉTODOS ITERATIVOS 203

pois a seqüência (x ) em (VIII.12) é convergente para x̄ e mais ainda:

ρ+1
d(x , x̄) ≤ d(x1 , x0 ) , (VIII.13)
1−ρ
e, portanto,

d(x+1 , x̄) ≤ C d(x , x̄) , C := d(x0 , x1 ) , (VIII.14)

ou seja, a convergência do esquema (VIII.12) é linear. •

A demonstração deste importante fato é simples e menos longa que o enuncia-


do: basta verificar, cf. [11], que a seqüência definida em (VIII.12) é de Cauchy,
o que se conclui ao examinar a soma
+p−1
NX
d(xN +p , xN ) ≤ d( xı+1 , xı ) .
ı=N

Exemplo 1 Considere M := [1, ∞) e


#
f : M → M
.
x → x + 1/x

Para esta função f , (VIII.11) não possui solução. Sucede porém que, para
algum ξ := x + θ(y − x) , 0 < θ < 1 , tem-se

f (x) − f (y) = f 0 (ξ) (x − y) = (1 − 1/ξ 2) (x − y)

e, conseqüentemente,
|f (x) − f (y)| < |x − y|
ou seja, (VIII.10) é satisfeita com p = 1 .

Este exemplo ilustra a necessidade de ser a constante ρ em (VIII.10) es-


tritamente < 1 .

Exercı́cio 2 Verifique que se f satisfizer todas as hipóteses do Teorema


acima, exceto (VIII.10), a qual se supõe válida para

f n := f •f n−1 , para algum n > 1 ,


204 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS

obtém-se a mesma conclusão. •

A partir do Teorema do Valor Médio – ou melhor, da Desigualdade do Valor


Médio – pode-se enunciar o

Teorema 1. Seja B um espaço de Banach e seja f : B → B


uma função diferenciável em B , tal que
sup kf 0 (x)k < 1 . (VIII.15)
x∈B

Então f é uma contração, a ela se aplica o Teorema do Ponto Fixo.

Exemplo 2 Voltemos ao Exemplo 2 da Seção VIII.1. Sendo a derivada


de Z t
F : f → G(S, f (S)) dS
0
dada por Z t
[F 0 (f0 )h] (t) := D2 G(S, f0 (S)) · h(S) dS ,
0
para toda f0 satisfazendo
sup |f0 (S)| ≤ α ,
0≤S≤t

tem-se que
| [F 0 (f0 )h](t) | ≤ t sup |h(S)| sup |D2 G(S, σ)| .
0≤S≤t 0≤S≤t
−α≤σ≤α

Assim, para t suficientemente pequeno, se verifica que kF 0 (f )k ≤ ρ < 1 ,


o que garante a demonstração da existência de solução para uma equação di-
ferencial ordinária – EDO – de primeira ordem. •

No estudo de soluções aproximadas de equações não lineares


F (x̄) = 0 (VIII.16)
para funções reais de variável real, os métodos são necessariamente iterativos
e entre os de melhor desempenho se inclui o de Newton-Raphson:
F (x )
x+1 := x − ,  ≥ 0 ; x0 dado. (VIII.17)
F 0 (x )
VIII.4. MÉTODOS ITERATIVOS 205

Tal método, quando convergente, apresenta a propriedade

|x+1 − x̄| ≤ C |x − x̄|2 , (VIII.18)

para alguma constante C , ou seja, sua ordem de convergência é quadrática


– compare (VIII.18) com (VIII.14).
No emprego de (VIII.17) é fundamental que F seja uma função derivável e
que F 0 (x ) 6= 0 . Observe que, sendo F 0(x) 6= 0 , (VIII.17) é precisamente
(VIII.12) aplicada a
f (x) := x − F (x)/F 0 (x) ,
pois, para f assim definida, (VIII.16) equivale a (VIII.11).
Observe também que este algoritmo de aproximação foi o que utilizamos na
construção do Exemplo 5, Seção II.1.
Para aplicar o Teorema 1 a f , supomos que F ∈ C 2 (IR) , além de ser
F 0 (x̄) 6= 0 . Deduz-se que:

f 0 (x) = F (x)F 00 (x)/F 0 (x)2 ,

donde se conclui que, para x → x̄ , f 0 (x) → 0 . Logo, se tomada em


uma “certa proximidade” da raiz x̄ , a função auxiliar f é uma contração,
definindo assim (VIII.17) uma seqüência convergente para x̄ .
A idéia é generalizar (VIII.17) para funções vetoriais. Enunciaremos então o

Método de Newton-Raphson. Seja F : B → B uma função num


espaço de Banach B . Suponhamos que F ∈ C 2 (B) . Desejamos obter
soluções aproximadas de
F (x̄) = 0 ,
tendo-se por hipótese F 0 (x̄) invertı́vel, com [F 0 (x̄)]−1 limitada. Então o
esquema iterativo

x+1 := x − [F 0 (x )]−1 F (x ) ,  ≥ 0 ; x0 dado, (V III.170 )

converge para x̄ , sendo quadrática a sua ordem de convergência.


Por exemplo, suponhamos que F̃ : IRp → IRp satisfaça as hipóteses acima,
sendo F̃ := (F1 , . . . , Fp ) e x̃ := (x1 , . . . , xp )t ∈ IRp , onde designamos por
(x1 , . . . , xp )t o transposto de (x1 , . . . , xp ) . O esquema de Newton assume a
forma
x̃+1 := x̃ − (Dk F` (x̃ ) )−1 F̃ (x̃ ) ,
206 CAPÍTULO VIII. A DERIVADA EM ESPAÇOS NORMADOS
 
onde (Dk F` ) = ∂F` /∂xk é a matriz Jacobiana de F̃ .
1≤`,k≤p

Algumas vezes, em lugar de (VIII.170 ), utilizamos o esquema modificado

x+1 := x − [F 0 (x0 )]−1 F (x ) ,  ≥ 0 ; x0 dado, (V III.1700 )

que tem a propriedade de não exigir a inversão de F 0 (x ) a cada iteração.


Utilizam-se também os esquemas ditos quase-Newton, nos quais o inverso da
derivada [F 0 (x )]−1 é simulado, em cada iteração, por um operador Hk
convenientemente definido,

x+1 := x − Hk F (x ) ,  ≥ 0 ; x0 dado, (V III.17000 )

ver, por exemplo, [19]).


Bibliografia

[1] R.A. Adams. Sobolev Spaces. Academic Press, New York, 1975.

[2] S. Agmon. Lectures on Elliptic Boundary Value Problems. Van Nostrand,


Princeton, 1965.

[3] J.H. Argyris. Energy theorems and structural analysis, part i: General
theory. Aircraft Engin., 26-27:347–356, 383–387, 397; 42–58, 80–94, 125–
134, 1954-55.

[4] J.P. Aubin. Approximation of Elliptic Boundary Value Problems. Wiley,


New York, 1972.

[5] G. Bachman, L. Narici. Functional Analysis. Academic Press, New York,


1966.

[6] R.G. Bartle. The Elements of Integration. Wiley, New York, 1966.

[7] E.J. Beltrami, M.R. Wohlers. Distributions and the Boundary Values of
Analytic Functions. Academic Press, New York, 1966.

[8] R.P. Boas Jr. A Primer of Real Functions. Carus Monograph 13, Math.
Assoc. of America, New York, 1960.

[9] P.G. Ciarlet, J.-L. Lions (eds.). Handbook of Numerical Analysis, volume
II (Part 1). North-Holland, Amsterdam, 1991.

[10] P.W. Clough. The finite element method in plane stress analysis. In Proc.
of the 2nd ASCE Conference on Electronic Computation, Pittsburgh, PA,
USA, 1960.

207
208 BIBLIOGRAFIA

[11] L. Collatz. Functional Analysis and Numerical Mathematics. Academic


Press, New York, 1966.

[12] R. Courant. Variational methods for the solution of problems of equilib-


rium and vibration. Bull. Amer. Math. Soc., 49:1–23, 1943.

[13] R. Courant, K.O. Friedrichs, H. Lewy. Über die partiellen Differenzen-


gleichungen der mathematisches Physik. Math. Ann., 100:32–74, 1928.
Versão inglêsa: IBM Journal, 11:215-234, 1967.

[14] R. Courant, D. Hilbert. Methods of Mathematical Physics. Interscience,


New York, 1953.

[15] M. Davis. A First Course in Functional Analysis. Gordon & Breach, New
York, 1966.

[16] C.A. de Moura. Análise Funcional e Aplicações. I Escola de Matemática


Aplicada, LAC/CBPF–CNPq, Rio de Janeiro, 1978.

[17] C.A. de Moura. Análise Funcional – um Roteiro in Elementos Finitos e


Aplicações à Mecânica dos Fluidos, pp. i-vi, 1-180. V Escola de Matemá-
tica Aplicada, LNCC–CNPq, Rio de Janeiro, 1984.

[18] C.A. de Moura. DES: an Explicit, Really Quadratic 2-level Scheme for
the Diffusion Equation. Jour. Comp. Inf., 3(1):99–115, 1993.

[19] J.E. Dennis Jr., R.B. Schnabel. Numerical methods for unconstrained
optimization and nonlinear equations. Prentice-Hall, Englewood Cliffs,
NJ, USA, 1983.

[20] P.A.M. Dirac. The Principles of Quantum Mechanics, 4th edition. Oxford
University Press, London, 1957.

[21] G. Fano. Metodi Matematici della Mecanica Quantistica. Zanichelli,


Bologna, 1967.

[22] W.H. Fleming. Functions of Several Variables. Addison-Wesley, Reading,


MA, USA, 1965.

[23] A. Friedman. Partial Differential Equations. Holt, New York, 1969.


BIBLIOGRAFIA 209

[24] I.M. Gel’fand, G.E. Shilov. Generalized Functions, Vol. I–IV. Academic
Press, New York, 1964.

[25] P. L. George. MODULEF: Génération automatique de maillages. Collec-


tion Didactique, INRIA, Rocquencourt, France, 1986.

[26] A. Gilioli. Equações Diferenciais Parciais Elı́ticas. IMPA, Rio de Janeiro,


1975.

[27] L.M. Graves. The Theory of Functions of Real Variables, 2nd ed.
McGraw-Hill Book, New York, 1956.

[28] G. Hellwig. Partial Differential Equations. Blaisdell, New York, 1964.

[29] C.S. Hönig. Análise Funcional e Aplicações. EDUSP, São Paulo, 1970.

[30] R. Iório Jr., V.M. Iório. Equações Diferenciais Parciais: uma Introdução.
Projeto Euclides, IMPA, Rio de Janeiro, 1988.

[31] F. John. Partial Differential Equations. Springer-Verlag, Berlin, 1974.

[32] A. Kolmogorov, S. Fomin. Elementos de la Teoria de Funciones y del


Analisis Funcional. Ed. MIR, Moscou, 1972.

[33] P.D. Lax. On the existence of Greens’s function. Proc. Amer. Math. Soc.,
3:526–531, 1952.

[34] P.D. Lax. Real Variables. NYU Lecture Notes, Courant Institute, New
York, 1970.

[35] P.D. Lax, R.D. Richtmyer. Survey of stability of the linear finite difference
schemes. Comm. Pure Appl. Math., 9:267–293, 1956.

[36] G.W. Mackey. Mathematical Foundations of Quantum Mechanics. Math-


ematical Physics Monograph Series, W.A. Benjamin, Inc., New York,
1963.

[37] L.A. Medeiros, M. Milla-Miranda. Espaços de Sobolev – Introdução aos


Problemas Elı́ticos não Homogêneos. Instituto de Matemática, UFRJ, Rio
de Janeiro, 2000.
210 BIBLIOGRAFIA

[38] S. Mizohata. The Theory of Partial Differential Equations. Cambridge


Press, Cambridge, UK, 1973.

[39] J.T. Oden, J.N. Reddy. An Introduction to the Mathematical Theory of


Finite Elements. Wiley Interscience, New York, 1976.

[40] D.P. Pombo, Jr. Introdução à Análise Funcional. EdUFF, Niterói, 1999.

[41] R.D. Richtmyer. Diference Methods for Initial-value Problems. Inter-


science Publishers, New York, 1957.

[42] F. Riesz, B. Nagy. Functional Analysis. Ungar, New York, 1966.

[43] H.L. Royden. Real Analysis. MacMillan, London, 1968.

[44] W. Rudin. Principles of Mathematical Analysis. McGraw Hill, New York,


1963.

[45] W. Rudin. Real and Complex Analysis. McGraw Hill, New York, 1966.

[46] L. Schwartz. Méthodes Mathématiques pour les Sciences Physiques, 2ème


édition. Hermann, Paris, 1965.

[47] G.F. Simmons. Introduction to Topology and Modern Analysis. McGraw


Hill, New York, 1963.

[48] G. Strang, G.J. Fix. An Analysis of the Finite Element Method. Prentice-
Hall, Englewood Cliffs, NJ, USA, 1973.

[49] A. Taylor. Introduction to Functional Analysis. Wiley, New York, 1958.

[50] E.C. Titchmarsh. The Theory of Functions, 2nd ed. Oxford University
Press, London, 1939.

[51] K. Weirstraβ. Mathematische Werke. Mayer und Müller, Berlin, 1894.

[52] K. Yosida. Functional Analysis. Springer-Verlag, Berlin, 1971.


Índice

abscissa de somabilidade, 136 Banach–Steinhaus, Teorema de, 141,


algoritmo, 174 157, 164
consistente, 162 base de auto-vetores, 192
convergente, 162 hilbertiana, 175
de diferenças finitas, 181 local, 185
Análise Numérica, 160 Bessel, desigualdade de, 177
aproximações com polinômios trigo- bidual, 92
nométricos, 181 bola aberta, fechada, 22
globais, 183 unitária fechada, 168
locais, 183 Bolzano–Weierstrass, Teorema de, 51
seccionalmente polinomiais, 188 bra, 94
seccionalmente quadráticas, 188 Buniakowski, desigualdade de, 15
argumento transfinito, 143
Céa, lema de, 189
Argyris, J.H., 182
Cantor, conjunto de, 59
assintótica, abordagem, 182
, processo diagonal de, 167, 191
autofunções, 187
Cauchy, critério de, 25
autovalor, 192
, desigualdade de, 15
autovetor, 94, 192
, problema de, 160
avaliação numérica, 182
, seqüência de, 25
Axioma da Escolha, 179
, seqüência fracamente de, 159
, seqüência uniformemente de,
Baire, Teorema de, 155 168
Banach, espaço de, 26 cket, 94
, Teorema do Gráfico Fechado de, Clough, R.W., 182
152 coercividade, 79
, Teorema do Ponto Fixo de, 202 compacidade, 165
, Teorema dos Isomorfismos de, da imersão, 171
154 compacto de IRn , 97

211
212 ÍNDICE

completamento de um espaço nor- pontual de operadores, 159


mado, 31 quadrática, 205
condições de contorno, 40 qtp, 59
iniciais, 40 Courant, R., 160, 182
conjunto aberto, 22 crescimento polinomial, 135, 138
compacto, 165 curvatura, 127
conexo, 103
de descontinuidade, 69 decaimento, 131
de medida nula, 58 derivação parcial, 96
denso, 22 derivada de distribuição, 107
denso enumerável, 144 de ordem k , 201
enumerável, 69 de Radon-Nikodym, 94
eqüicontı́nuo, 166 direcional, 194
fechado, 21 em espaço normado, 193
fortemente compacto, 165 no sentido forte, 98
fracamente compacto, 169 no sentido fraco, 101
fracamente∗ compacto, 169 parcial, 71
linearmente independente, 173 desigualdade do triângulo, 12
mensurável, 61, 69 do valor médio, 198
ortogonal, ortonormal, 173 determinante, 127
-quociente, 28 diferenças finitas, 160
conservação da energia, 45 , operador de, 72
consistência condicional, 164 diferenciar sob o sinal de integral,
continuidade da inversa, 47 71
contração, 86, 202 dimensão de um espaço vetorial, 50
convergência, 16, 160 Dirac, P., 4, 94
fraco∗ , 169 , função δ de, 4, 106, 114
em D 0 (Ω) , 108 , terminologia de, 94
em D(Ω) , 103 Dirichlet, problema de, 145
em S , 133 discretização convergente, 189
em norma, 16 distância, 12, 34
forte, 16, 156 de um ponto a um conjunto, 77
fraca, 111, 155 entre dois conjuntos, 30
linear, 203 distribuição, 4, 95, 105
no sentido das distribuições, 111 dada por função, 106
pontual, 18 temperada, 127, 133
pontual de distribuições, 108 divergente, 147
ÍNDICE 213

dual algébrico, topológico, 73 vetorial real, 7


de um espaço normado, 73 -produto, 152
topológico de S(IR) , 133 -quociente, 27, 29
dualidade, 120 espaços de aproximação, 181
, definição via, 133 homeomorfos, 165
espectro de operador autoadjunto,
Eberlein–Shmulyan, Teorema de, 171 192
EDO, existência de solução para, 204 esquema iterativo, 202
EDP, 160 numérico, 160
elemento finito, 181 quase-Newton, 206
quadrático, 183 estabilidade computacional, 174
energia do sistema, 45 estado do sistema, 40
eqüicontinuidade das funções gene- estimativas a priori, 197
ralizadas, 169 existência local, 103
equação de difusão do calor, 160 de soluções, 40
de propagação da onda, 44 dos irracionais, 5
diferencial parcial, 160 expansão de um vetor, 176
diferencial, aproximações da solução em auto-vetores, 190
de, 181 expoentes conjugados, 62
discretizada, 189 extensão contı́nua, 24
equivalência, classe de, 28
, relação de, 28 fórmula variacional dual, 120, 143
erro de arredondamento, 183 dual, 143
numérico, 182 Fatou, lema de, 68
esforço computacional, 182 fecho de um conjunto, 22
espaço de dimensão finita, 49 forma bilinear contı́nua coerciva, 80
de Sobolev de ordem fracionária, linear, 73
real, 113 formulação forte, fraca, pontual, 181
de Sobolev de ordem inteira ne- variacional, 156, 181
gativa, 124 Fourier, coeficientes de, 176
euclidiano, 15 , expansão de, 176
métrico, 34 , fórmula de inversão da trans-
métrico completo, 35 formada de, 131
normado reflexivo, 92 , série de, 175
separável, 144 , transformada de, 47, 127, 155
vetorial complexo, 47 Fréchet, derivada de, 193
vetorial de dimensão finita, 43 -Kolmogorov, Teorema de, 169
214 ÍNDICE

Friedrichs, desigualdade de, 49 funcionais pontualmente convergentes,


, K.O., v, 101, 106, 160 118
Fubini, Teorema de, 68 funcional linear contı́nuo, 73
função aberta, 153
analı́tica, 130, 153 Gâteaux, derivada de, 194
caracterı́stica, 53 Gauss, Teorema da Divergência de,
contı́nua, 20 147
contı́nua sem derivada em ponto Gel’fand, I.M., 106
algum, 4 geometria dos espaços euclidianos,
de interpolação, 187 15
definida via integral, diferen- gráfico de um operador, 152
ciação de, 69 gradiente, 147
definida qtp, 60 Gram-Schmidt, método de ortonor-
δ, 4 malização de, 174
estabilidade, 51 , método modificado de, 174
gaussiana, 130 Green, função de, 149
generalizada, 4, 56, 106 , identidades de, 146
harmônica, 146 , fórmulas de, 147
holomorfa, 137 Hölder, desigualdade de, 62
ideal, 106 Hadamard, 160
infinitamente derivável, 10 Hahn–Banach, Teorema de, 141
inteira, 135, 139 Hamel, base de, 142, 179
lipschitziana, 43 Heaviside, função de, 108
localmente Hölder-contı́nua, 125 Hilbert, cubo de, 22, 192
localmente integrável, 105 , espaço de, 26
mensurável, 64, 68, 110 hiperplano, 73
multilinear, 201 homotetia, 129
rapidamente decrescente, 11
seccionalmente contı́nua, 60 identificação canônica, 92, 144
simples, 55 imagem de um operador, 44, 82
trilinear, 201 imersão contı́nua, 115
uniformemente contı́nua, 36 indiciação global, 186
uniformemente Hölder-contı́nua, inequação variacional, 86
125 inexistência de solução racional, 5
-escada, 54 instabilidade, 4
-teste, 103 integrais repetidas, 70
funções de forma, 184 integral dupla, 70
ÍNDICE 215

imprópria, 53 iterativo, 202


inferior, 54 matriz de banda, esparsa, 186
superior, 54 hessiana, 200
interpolação polinomial, 183 jacobiana, 196
Isaacson, D., vi de incidência, 187
isometria, 34, 90 medida absolutamente contı́nua, 94
isomorfismo isométrico, 89, 180 de um aberto, 60
invariante por translação, 93
kernel, 45 nula, 58
Kronecker, delta de, 88, 184
melhor aproximação, 178
Laplace, integral de, 136 Milman, Teorema de, 92
, transformada de , 127, 136 Minkowski, desigualdade de, 62
Lax, norma negativa de, 118 modelagem global, 182
, P.D., 160 modelo matemático, 3
, Teorema de Equivalência de, mollifier, v
160 montagem da matriz global, 187
–Milgram, Lema de, 80 multi-ı́ndice, 95
–Milgram, Teorema de Repre-
sentação de, 79 nó, nodo, 184
Lebesgue, função integrável a, 52 de interpolação, 183
, integral de, 35, 55 núcleo de um operador, 45
, medida de, 93 Newton–Raphson, método de, 204
, Teorema da Convergência Do- norma, 11
minada de, 66 da convergência uniforme, 17
, Teorema da Convergência Monótona de operador, 43
de, 67 normas comparáveis, 117
lei de comportamento, 182 equivalentes, 48
Leibnitz, fórmula de, 96
Lewy, H., 160 operações algébricas, 182
limite de seqüência, 16 operação ponto a ponto, 10
fraco∗ , 169 operador autoadjunto, 94, 192
qtp, 59 compacto, 171, 190
Lions, J.-L., 127 de truncamento, 28, 57
lipschitziana, função, 43 identidade, 44
invertı́vel, 45
média quadrática, 17 linear, 39
método global, 181 local, 72
216 ÍNDICE

real, 94 projeção ortogonal, 77


ortogonalidade, 173 sobre um convexo, 86
otimização, problema de, 85, 195 propriedade do valor médio, 147, 148
topológica, 12
Paley-Wiener , Teorema de, 130 PVI, 160
para distribuições, 135
parâmetro de discretização, 161 qtp, quase toda parte, 59
Parseval, identidade de, 178
Radon-Nikodym, Teorema de Repre-
partição da unidade, 103
sentação de, 93
regular, 184
, derivada de, 94
permutação, 3
regra da cadeia, 195
perturbação de um problema, 193
do paralelogramo, 16
Pitágoras, Teorema de, 178
regularidade, 81
Plancherel–Parseval, identidade de,
em H k (Ω) , 172
132
regularização, 101
Poincaré, desigualdade de, 49
Rellich, Teorema de, 171
policubo, 60
representação de duais, 87
Pombo, D., vi
global, 186
ponto estacionário, 195
local, 185
fixo, 131, 202
representações da delta, 114
positividade, 56
reta estendida, 3, 68
precisão finita, aritmética de, 183 Riemann, função integrável a, 52
princı́pio da extensão contı́nua, 37 , integral de, 52
do módulo máximo, 146 –Lebesgue, lema de, 48, 128
do mini-max, 192 Riesz, F., 16
princı́pios variacionais conjugados, , isomorfismo canônico de, 125
144 , Teorema de Representação de,
básicos da Análise Funcional, 141 78, 93, 94
problema bem-posto, 160 –Fischer, Teorema de, 59
problema de contorno, 181
de valor inicial, 160, 181 série condicionalmente convergente,
misto, 181 3
processo diagonal, 167, 191 geométrica, 5
produto de função por distribuição, harmônica alternada, 2
106 Schwartz, espaço de, 11
de vetor por escalar, 7 , L., 4, 106
interno, 14 , notação de, 95
ÍNDICE 217

Schwarz, desigualdade de, 15 da Projeção (melhorado), 85


, desigualdade generalizada de, de Extensão (Hahn-Banach), 142
118 de Imersão, 171
, fórmula generalizada de, 125 do Binômio, 96
semi-norma, 32, 126 do Gráfico Fechado, 83, 152
seqüência de quadrado somável, 9 do Ponto Fixo, 202
dominada, 66 do Traço, 111
fortemente limitada, 159 do Valor Médio, 168, 197
fracamente limitada, 157 dos Isomorfismos de Banach, 154
minimizante, 85 teoria de interpolação, 127
quase nula, 9 topologia de S , 133
σ-álgebra, 93 toro, 3
sistema completo, 175 transformação linear, 39
ortonormal maximal, 178 limitada, 43
Sobolev, espaço de, 35, 95 translação de uma distribuição, 107
, S., 106 tripé da Análise Funcional, viii
soluções generalizadas, 161 truncamento, 100
soma de polinômios, 10 de funções, 67
de vetores, 7
unicidade da solução, 40
direta, 82
do limite, 16
inferior, superior, 53
do limite fraco, 156
Stokes, equação estacionária de, 81
uniformemente limitados, operadores,
sub-aditividade, 32
163
subespaço gerado, 174
maximal, 73 vetor, 7, 8
suporte de uma distribução, 134 gradiente, 96
função, 129 nulo, zero, 8
supremo essencial, 64 simétrico, 8
Taylor, fórmula de, 193 Weierstraβ, função de, 5
, série de, 97 , K., 4
Teorema da Aplicação Aberta, 52, , Teorema de Aproximação de,
141, 152, 154 23, 181
da Convergência Dominada, 66 , Teorema de Bolzano–, 51
da Convergência Monótona, 67 Wirtinger, desigualdade de, 49
da Limitação Uniforme, 141, 157
da Projeção, 82 Zorn, Lema de, 143, 179

Você também pode gostar