Você está na página 1de 42

Capítulo 8

Mínimos Quadrados

8.1 Introdução
Nos capítulos quatro e seis vimos como se resolvem problemas eletrostáticos
em coordenadas cartesianas, cilíndricas e esféricas. A técnica usada foi o da
separação de variáveis. Com geometria mais complexa esta técnica torna-
se muito trabalhosa senão impossível de ser implementada. É preciso então
desenvolver outras técnicas mais simples para contornar as dificuldades. En-
tre elas destacam-se os algoritmos dos elementos finitos e equações integrais
(método dos momentos e método dos elementos de fronteira). Estes algo-
ritmos se baseiam na generalização do método das projeções em espaços
euclidianos. Por isso vamos iniciar este capítulo com uma síntese sobre es-
paços euclidianos e o método das projeções, em particular, o método dos
mínimos quadrados.

8.2 Espaços Vetoriais


Um espaço vetorial real V é um conjunto1 de objetos chamados vetores,
munido com operações de adição e multiplicação por números reais denom-
inados de escalares, que satisfazem aos seguintes axiomas:

Axiomas da adição. Dados um par qualquer de vetores x e y em V ,


existe um único vetor x + y em V denomonado de soma de x e y em que
1
Coleção, classe, família e agregado são sinônimos de conjunto. Em muitos casos,
os elementos de um conjunto são também conjuntos. Por isso se diz, uma coleção de
conjuntos ou uma família de conjuntos. Conjunto de conjuntos não soaria bem.

521
522 CAPÍTULO 8. MÍNIMOS QUADRADOS

• a adição seja associativa

x+ (y + z) = (x + y) +z,

• a adição seja comutativa

x + y = y + x,

• exista um vetor 0 em V , chamado de vetor nulo, tal que

x + 0 = x para todo x de V,

• e para cada x de V exista um vetor −x em V , tal que

x + (−x) = 0.

Axiomas da multiplicação por escalar. Dados um vetor qualquer x


de V e um número real qualquer α, existe um único vetor αx em V chamado
de produto do escalar de α pelo vetor x, em que

• dados dois vetores x e y quaisquer,

α (x + y) = αx + αy,

• dados dois escalares α e β arbitrários,

(α + β) x = αx + βx,

• dados dois escalares α e β quaisquer,

(αβ) x = α (βx) ,

• e para todo vetor x,


1x = x.

O leitor não deve se desencorajar com o formalismo desses axiomas.


Eles parecem mais abstratos do que realmente os são. Simplesmente, eles
proporcionam uma estrutura operacional aos objetos que compõem a coleção
V . Espaços vetoriais reais também são denominados de espaços vetoriais
sobre R. Existem também espaços vetoriais sobre C. Nesse caso os escalares
são números complexos. Nesse livro usaremos primordialmente os espaços
8.2. ESPAÇOS VETORIAIS 523

vetoriais reais. Para facilitar a leitura omitiremos a palavra real, conotando


os espaços vetoriais reais simplesmente como espaços vetoriais.
Vejamos, agora, alguns exemplos importantes de espaços vetoriais

Exemplo 8.1. O exemplo mais simples de espaço vetorial é a coleção


das n-uplas (x1 , x2 , . . . xn ) de números reais, simbolizada por Rn , munida
das operações de adição e multiplicação por escalar assim definidas:

(x1 , x2 , . . . xn ) + (y1 , y2 , . . . yn ) = (x1 + y1 , x2 + y2 . . . xn + yn ) ,

α (x1 , x2 , . . . xn ) = (αx1 , αx2 , . . . αxn ) .


É fácil verificar que os elementos de Rn com essas operações satisfazem
a todos os oito axiomas que caracterizam os espaços vetoriais. Para tanto,
basta usar as propriedades algébricas dos números reais. Note que o vetor
nulo de Rn é a n-upla (0, 0, . . . 0). O espaço R2 é conhecido como o plano e
seus elementos são os vetores geométricos de duas componentes. O espaço
R3 chamado de espaço tridimensional é constituído de vetores geométricos
de três componentes. Por analogia, o conjunto R de números reais com
suas operações de adição e multiplicação é trivialmente um espaço vetorial,
denominado de reta. Aqui os números reais desempenham o duplo papel de
vetores e de escalares.

Exemplo 8.2. Seja P a família de todos os polinômios em x com coe-


ficientes reais, juntamente com as operações usuais de adição de polinômios
e multiplicação de polinômios por números reais. A família P é um espaço
vetorial.

Exemplo 8.3. Seja M a coleção de todas as matrizes n por n de


números complexos, munida da adição usual de matrizes complexas e mul-
tiplicação de matrizes complexas por números reais. Também, M é um
espaço vetorial.

Exemplo 8.4. Seja C [a, b] o conjunto de todas as funções contínuas


de variáveis reais definidas no intervalo fechado [a, b] da reta. Definem-se a
adição de dois vetores f e g por

(f + g) (x) = f (x) + g (x) ,

e a multiplicação de um vetor f por um escalar α por

(αf ) (x) = αf (x) .


524 CAPÍTULO 8. MÍNIMOS QUADRADOS

Como a soma de duas funções contínuas é uma função contínua e o


produto de uma função contínua por um numéro real é também uma função
contínua, segue imediatamente que C [a, b] é um espaço vetorial. A figura
abaixo ilustra esquematicamente as operações de adição e multiplicação por
escalar em alguns vetores de C [a, b]. Para isso escolhemos os vetores f =
f (x) = (x − 2)2 − 1, g = g (x) = −2 cos x + 3 e o vetor nulo 0 = o (x) = 0.
Em liguagem simbólica do Mathematica tem-se

In[1]:= f[x_]:= (x - 2)^2 - 1


g[x_]:= -2 Cos[x] + 3
o[x_]:= 0.0

Os gráficos dos vetores f , g e da soma f + g são gerados por

In[2]:= p1 = Plot[{f[x], g[x], f[x] + g[x]}, {x, 0, 4},


PlotStyle -> {Dashing[{0.02, 0.02}],
Dashing[{0.01, 0.01}], Dashing[{0.0, 0.0}]},
PlotRange -> {-1, 7},
Epilog -> {Text[’’f’’, {3.5, 2.0}],
Text[’’g’’, {3.5, 4.2}],
Text[’’f + g’’, {3.1, 7.2}]},
DisplayFunction -> Identity];

Os gráficos dos vetores f e −f são construídos por

In[3]:= p2 = Plot[{f[x], -f[x]}, {x, 0, 4},


PlotStyle -> {Dashing[{0.0, 0.0}],
Dashing[{0.02, 0.02}]},
Epilog -> {Text[’’f’’, {3.5, 2.0}],
Text[’’-f’’, {3.4, -2.0}]},
DisplayFunction -> Identity];

Os gráficos dos vetores f e 2f são gerados por

In[4]:= p3 = Plot[{f[x], 2 f[x]}, {x, 0, 4},


PlotStyle -> {Dashing[{0.0, 0.0}],
Dashing[{0.02, 0.02}]},
PlotRange -> {-2, 6},
Epilog -> {Text[’’f’’, {3.7, 1.0}],
Text[’’2f’’, {3.6, 5.0}]},
DisplayFunction -> Identity];
8.2. ESPAÇOS VETORIAIS 525

7 f + g 3
6 2 f
5
4 g 1
3
2 f -1 1 2 3 4
1 -2 -f
-1 1 2 3 4 -3
6 7
5 2f 6
4 5
3 4
2 3
1 f 2 f + 0
1 0
-1 1 2 3 4
-2 -1 1 2 3 4

Figura 8.1:

Os gráficos do vetor f , do vetor o e da soma f + o são construídos por

In[5]:= p4 = Plot[{f[x], o[x]}, {x, 0, 4},


PlotStyle -> {Dashing[{0.0, 0.0}],
Dashing[{0.02, 0.02}]},
PlotRange -> {-1, 7},
Epilog -> {Text[’’f + 0’’, {3.1, 2.3}],
Text[’’0’’, {3.6, 0.4}]},
DisplayFunction -> Identity];

Finalmente os gráficos acima mencionados são traçados por

In[6]:= Show[GraphicsArray[{{p1, p2}, {p3, p4}},


DisplayFunction -> $DisplayFunction]];

Exemplo 7.5. O conjunto de todas as funções contínuas por parte de


variáveis reais num interval fechado [a, b] da reta, simbolizado por CP [a, b],
constitui um espaço vetorial. Sabendo-se que a soma de duas funções con-
tínuas por partes é uma função contínua por partes e o produto de uma
função contínua por partes por um número real é uma função contínua por
partes, a verificação dos aximas é imediata [40].
Um subconjunto W de um espaço vetorial V , com as operação de adição
e multiplicação por escalares herdadas de V , é igualmente um espaço vetorial
se são satisfeitas as seguintes condições.

• Se x e y são elementos de W , então x + y é também elemento de W,


526 CAPÍTULO 8. MÍNIMOS QUADRADOS

• Se x é um elemento de W e α um número real, então αx é um elemento


de W ,

• O elemento 0 de V também é elemento de W.

Essas três propriedades garantem que os axiomas de adição e de multipli-


cação por escalares sejam satisfeitos a fortiori pelos elementos de.W . Assim,
W é chamado um subespaço de V . Vejamos alguns exemplos de subespaços
vetoriais.

Exemplo 8.6. O conjunto de vetores de R3 cuja terceira componente


seja identicamente zero, constitui um subespaço de R3 . Esse subespaço é
exatamente o R2 .

Exemplo 8.7. O conjunto R4 das matrizes do tipo


µ ¶
a b
com a, b ∈ C
−b a

é um subespaço do espaço vetorial real das matrizes dois por dois de


números complexos2 .

Exemplo 8.8. O conjunto das funções diferenciáveis num intervalo [a, b]


é um subespaço de C [a, b] . Basta observar que toda função diferenciável é
contínua.

Exemplo 8.9. O espaço vetorial C [a, b] é um subespaço de CP [a, b].


Toda função contínua é uma função contínua por partes.

Exemplo 8.10. Sejam x1 , x2 . . . xn elementos de um espaço vetorial


V .qualquer. Sejam α1 , α2 . . . αn números reais. Uma expressão do tipo

α1 x1 + α2 x2 . . . αn xn ,

é chamada de combinação linear de x1 , x2 . . . xn . Seja W o conjunto de


todas as combinações lineares de x1 , x2 . . . xn . É fácil verificar que W é um
subespaço de V. Nesse caso diz-se que x1 , x2 . . . xn gera W.
Os elementos x1 , x2 . . . xn de um espaço vetorial V são linearmente de-
pendentes se existem escalares α1 , α2 . . . αn não todos nulos tal que

α1 x1 + α2 x2 . . . αn xn = 0.
2
Este espaço vetorial é fundamental na teoria da relatividade restrita e em eletromag-
netismo avançado (eletrodinâmica)[6].
8.2. ESPAÇOS VETORIAIS 527

Por outro lado, se não existem tais escalares, então os vetores x1 , x2 . . . xn


são ditos linearmente independentes. Por exemplo, as funções sin θ e cos θ
de C[−∞, ∞] são linearmente independentes. Com efeito, suponhamos que
existam α e β tal que
α sin θ + β cos θ = 0.
Derivando essa expressão, vem

α cos θ − β sin θ = 0.

Multiplicando a primeira relação por β e a segunda por α

αβ sin θ + β 2 cos θ = 0,
α2 cos θ − αβ sin θ = 0.
¡ ¢
Somando a primeira com a segunda, resulta α2 + β 2 cos θ = 0. Como
α e β são reais, segue imediatamente que α = 0 e β = 0. Logo, sin θ e cos θ
são linearmente dependentes.

8.2.1 Bases
Definimos uma base de V como sendo uma seqüência {e1 , e2 . . . en } de
vetores linearmente independentes de V e que gera V .
Seja V um espaço vetorial e seja {e1 , e2 . . . en } uma base de V . Os
elementos de V podem ser representados por n-uplas relativas à essa base
da seguinte maneira
n
X
x = α1 e1 + α2 e2 . . . αn en = αi ei . (8.1)
i=1

Chamamos (α1 , α2 . . . αn ) de coordenadas do vetor x com respeito à base


em questão e αi a i-ésima coordenada de x.

Exemplo 8.11 No espaço vetorial R3 , as coordenadas do vetor (2, −3, π)


com respeito à base canônica {(1, 0, 0) , (0, 1, 0) , (0, 0, 1)} são (2, −3, π).

Exemplo 8.12 No espaço vetorial V gerado pelos t −t


t −t
© vetores
t −t
ª e e e , as
coordenadas do vetor 3e − 2e , com respeito à base e , e , são (3, −2).

Exemplo 8.13 ¡ As coordenadas


¢ do vetor (1, 0) com respeito à base
{(1, 1) , (−1, 3)} são 54 , − 14 . De fato, devemos encontrar α e β tal que

α (1, 1) + β (−1, 2) = (1.0) .


528 CAPÍTULO 8. MÍNIMOS QUADRADOS

Escrevendo essa equação em termos de coordenadas temos

α − β = 1,
α + 3β = 0.
5
Resolvendo o sistema resulta α = 4 e β = − 14 .

Exemplo 8.14 Um vetor do espaço vetorial R4 pode ser reescrito da


seguinte maneira
µ ¶ µ ¶
a b a1 + a2 i b1 + b2 i
x= =
−b a −b1 + b2 i a1 − a2 i
µ ¶ µ ¶ µ ¶ µ ¶
1 0 i 0 0 1 0 i
= a1 + a2 + b1 + b2 .
0 1 0 −i −1 0 i 0
Conclui-se que as coordenadas do vetor x são (a1 , a2 , b1 , b2 ) com respeito
à base ½µ ¶ µ ¶ µ ¶ µ ¶¾
1 0 i 0 0 1 0 i
, , ,
0 1 0 −i −1 0 i 0
É possível provar que qualquer duas bases de um espaço vetorial têm
o mesmo número de elementos [42]. Seja V um espaço vetorial contendo
uma base com n elementos. Dizemos que V tem dimensão n. O espaço
vetorial trivial formado apenas pelo vetor 0 não tem base e por conseguinte
tem dimensão zero. O espaço vetorial trivial ou qualquer espaço vetorial de
dimensão n são ditos espaços de dimensão finita. Todos os outros espaços
vetoriais são de dimensão infinitas.
Estritamente falando, o conceito de base, como apresentado acima, se
aplica apenas a espaços de dimensão finita. Contudo é possível estender a
idéia de base para espaços de dimensão infinita.[40]. Assim, 8.1 se tornaria,
formalmente,

X
v= αi ei , (8.2)
i=1
e o que antes seria uma simples somatória torná-se-ia uma série. Questões
delicadas sobre convergência de série teriam de ser estudadas cuidadosa-
mente. Também o conceito de vetores linearmente independentes teria que
ser re-analisado com mais profundidade.
A estrutura algébrica associada aos axiomas de adição e de multiplicação
por escalares que caracteriza os espaços vetoriais não é suficiente para lidar
com as questões sutis como as mencionadas acima. É preciso suprir o es-
paço vetorial de uma topologia para que tenhamos condições de falar em
8.2. ESPAÇOS VETORIAIS 529

distância entre dois vetores, em aproximação entre vetores e, por fim, em


convergência de séries do tipo 8.2. Isto será feito enriquecendo os espaços
vetoriais com uma estrutura geométrica. Para tanto, precisamos discutir,
primeiro, o conceito de operadores lineares.

8.2.2 Operadores Lineares


Um operador linear, também chamado de transformação linear, de um es-
paço vetorial V1 , em um espaço vetorial V2 é uma função L que associa a
cada vetor x de V1 um único vetor de V2 de uma maneira tal que

L (x1 + x2 ) = L (x1 ) + L (x2 ) , (8.3)

e
L (αx) = αL (x) , (8.4)
para todos os vetores x1 , x2 , x de V1 e todos escales α.O espaço vetorial V1 é
o domínio do operador L e o conjunto de vetores y de V2 tais que y = L (x)
para algum vetor x de V1 , é chamado de imagem de L e é designado de I (L).
É importante enfatizar que o domínio e a imagem são partes integrantes da
definição do operador linear L. Em outras palavras, um operador linear L é
constituído de três atores: o domínio, a imagem e a regra que associa a cada
elemento do domínio um único elemento da imagem satisfazendo as relações
(8.3) e (8.4). Simbolicamente escreve-se L : V1 → V2 , mas para facilitar a
comunicação é praxe escrever L (x) ou simplesmente Lx para designar um
operador linear.
Segue da definição que

L (α1 x1 + α2 x2 + . . . + αn xn ) = α1 L (x1 ) + α2 L (x2 ) + . . . + αn L (xn ) ,

em particular

L (x1 + x2 + . . . + xn ) = L (x1 ) + L (x2 ) + . . . + L (xn )

e
L (0) = 0.
Vejamos alguns xemplos de operadores lineares:

Exemplo 8.15 Seja x = (x1 , x2 ) um vetor arbitrário de R2 e façamos

L (x) = (x1 + x2 , −x2 ) .


530 CAPÍTULO 8. MÍNIMOS QUADRADOS

Obviamente, L é um operador linear de R2 em R2 . Geometricamente, L


representa um cisalhamento horizontal seguido de uma reflexão em relação
ao eixo horizontal de R2 .

Exemplo 8.16 Qualquer matriz A = (ai,j ), 1 ≤ i ≤ m e 1 ≤ j ≤ n,


m × n é um operador linear de Rn em Rm .

Exemplo 8.17 Seja V um espaço vetorial qualquer. A aplicação que


associa cada elemento x de V a ele próprio é obviamente um operador linear,
designado por I e chamado de operador identidade.

Exemplo 8.18 Sejam V1 , V2 espaços vetoriais quaisquer. A aplicação


que associa cada elemento x de V1 o elemento 0 de V2 é trivialmente um
operador linear, designado por O e chamado de operador nulo.

Exemplo 8.19 Consideremos o espaço C [a, b] de todas as funções reais


contínuas no intervalo [a, b] e para cada f de C [a, b] façamos
Z x
Lf = f (τ ) dτ , a ≤ x ≤ b.
a

Como Lf é contínua em [a, b], L pode ser visto como um operador de


C [a, b] em C [a, b] .

Exemplo 8.20 Designemos por C 1 [a, b] o espaço das funções continua-


mente diferenciáveis3 em [a, b] e designemos como D a operação de derivação
nesse espaço. Então,
df (x)
D (f ) =
dx
é um operador linear de C 1 [a, b] em C [a, b].

Exemplo 8.21 Consideremos X1 = C 2 [0, 1]. Para cada f =f (x) de X1


façamos
d2 f df
L1 (f ) = 2 + cos πx + x2 f (x) .
dx dx
É fácil verificar que L1 é um operador linear de X1 em C 2 [0, 1].
3
Uma função real é continuamente diferenciável num intervalo [a, b] quando ela possui
derivada contínua em todos pontos do intervalo [a, b]. Generalizando, uma função real é n
vezes continuamente diferenciáveis num intervalo [a, b] quando possui derivadas até ordem
n contínuas em todos os pontos do intervalo [a, b]. Neste caso o conjunto é simbolizado por
C n [a, b]. Se as derivadas de todas as ordens são contínuas, tem-se o conjunto C ∞ [a, b].
8.2. ESPAÇOS VETORIAIS 531
© ª
Exemplo 8.22 Consideremos X2 = f (x) ∈ C 2 [0, 1] tal que f (0) = f (1) = 0 .
Para cada f =f (x) de X2 façamos
d2 f df
L2 (f ) = + cos πx + x2 f (x) .
dx2 dx
É fácil verificar que L2 é um operador linear de X2 em C [0, 1]. Note que
L1 e L2 são dois operadores distintos, embora as expressões algébricas de
ambos sejam idênticas, os sues domínios são totalmente diferentes.

Exemplo 8.23 Consideremos X = Y = C [0, 1], e seja K (η, τ ) uma


função real contínua no retângulo [0, 1] × [0, 1]. Para cada f ∈ C [0, 1], defin-
imos Z 1
(Lf ) (η) = f (η) + K (η, τ ) f (τ ) dτ .
0
L é um operador linear de X em Y .
Exemplo 8.24 Consideremos X = Y = C [−1, 1] e definimos
Z 1
1 d2
(Lf ) (η) = f (η) − ln |η − τ | f (τ ) dτ .
2π dη 2 0
L é um operador linear de X em Y
O conjunto de todos os pontos x de V1 tais que L (x) = 0, designado
de M (L), é chamado de núcleo de L. É fácil verificar que M (L) é um
subespaço de V1 . Este subespaço é de suma importância no estudo dos
operadores lineares em V1 .
Se a imagem de L : V1 → V2 , designada de I (L), é próprio espaço V2 , o
operador é dito sobrejetivo. Por outro lado, o operador linear L diz-se inje-
tivo ou biunívoco se, e somente se, L (x1 ) = L (x2 ) implicas em x1 = x2 . Os
operadores lineares que são simultaneamente biunívocos e sobrejativos são
invertíveis e chamam-se isomorfismo. O inverso de um operador L invertível
é designado por L−1 .
Um exemplo importante de isomorfismo é o que associa cada vetor da
base de R4 (Exemplo 4 da subseção 7.2.1) aos vetores da base canônica de
R4 . Neste caso os espaços vetoriais R4 e R4 . Em outras palavras, do ponto
de vista de espaços vetoriais, eles são idênticos.
Sejam V1 , V2 espaços vetoriais quaisquer. O conjunto de todos os oper-
adores lineares de V1 em V2 , designado de L (V1 , V2 ), forma um novo espaço
vetorial em que a adição e a multiplicação por escalares são definidas de
modo natural da seguinte maneira, Sejam L : V1 → V2 e T : V1 → V2 dois
operadores lineares. Escrevemos,
(L + T ) (x) = L (x) + T (x) ,
532 CAPÍTULO 8. MÍNIMOS QUADRADOS

e
(αL) (x) = αL (x)
onde x ∈ V1 e α um número real. O elemento zero de L (V1 , V2 ) é o operador
nulo.
Como prometido, vamos agora complementar os nossos espaços vetori-
ais com uma estrutura geométrica que permitirá, entre outros benefícios,
definir bases em espaços de dimensão infinita e construir os fundamentos
dos algoritmos numéricos acima mencionados.

8.2.3 Espaços Euclidianos.


Para iniciar vamos definir o que seja um produto interno de dois vetores
de um espaço vetorial.
O produto interno, também chamado produto escalar, de dois vetores
x e y é um número real, simbolizado por hx, yi, que satisfaz as seguintes
propriedades

• hx, yi = hy, xi

• hαx, yi = α hx, yi para todo número real α

• hx1 + x2 , yi = hx1 , yi + hx2 , yi

• hx, xi ≥ 0, e hx, xi = 0 se e somente se x = 0.

Um espaço vetorial munido de um produto interno (produto escalar) é


conhecido como espaço Euclidianos ou espaço pré-Hilbert. No caso de x e y
serem complexos, hx, yi é substituído por hx, yi sendo y o conjugado de y.

Exemplo 8.25 Sejam x = (x1 , x2 , . . . xn ) e y = (y1 , y2 , . . . yn ) vetores


de Rn e definimos hx, yi pela expressão
n
X
hx, yi = x1 y1 , x2 y2 , . . . xn yn = xi yi . (8.5)
i=1

É imediato que as quatro propriedades mencionadas acima são integralmente


satisfeitas [40]. Conseqüentemente, Rn juntamente com esse produto interno
constituem um espaço euclidiano. Quando se fala no espaço euclidiano Rn
subtende-se que o produto interno é este definido acima. É possível definir
outros produtos internos em Rn . Nesse caso, Rn seria um outro espaço
euclidiano com respeito a esse outro produto interno. Vejamos um exemplo.
8.2. ESPAÇOS VETORIAIS 533

Exemplo 8.26 Sejam x = (x1 , x2 ) e y = (y1 , y2 ) vetores de R2 e


definimos hx, yi1 pela expressão

hx, yi1 = 2x1 y1 + x2 y1 + x1 y2 + 2x2 y2 ,

a qual constitui um outro produto interno de R2 distinto do produto interno


canônico hx, yi = x1 y1 + x2 y2 visto no exemplo anterior.

Exemplo 8.27 Sejam os vetores


µ ¶ µ ¶
a b c d
x= e y= ,
−b a −d c

de R4 . O numéro real hx, yi = Re a Re c + Im a Im c + Re b Re d + Im b + Im d


satisfaz os axiomas de definição de produto interno.

Exemplo 8.28 No espaço vetorial C [a, b] das funções contínuas no in-


tervalo fechado [a, b] define-se hf , gi por
Z b
hf , gi = f (x) g (x) dx. (8.6)
a
Mostra-se que hf , gi assim definido satisfaz às quatro propriedades que de-
screve o produto interno [40]. A questão mais sutil prende-se ao fato de que
a integral de uma função não-negativa é sempre não negativa e que a integral
de uma função contínua não-negativa é zero se e somente se a função for
identicamente nula. Simbolicamente, isso significa que
Z b
hf , f i = f 2 (x) dx ≥ 0,
a
hf , f i = 0 se e somente se f = 0.

Exemplo 8.29 No espaço vetorial C [a, b] das funções contínuas no in-


tervalo fechado [a, b] define-se hf , gi1 por
Z b
hf , gi1 = w (x) f (x) g (x) dx, (8.7)
a
onde w ∈ C [a, b] satisfaz a condição w (x) > 0 para todo x ∈ [a, b]. A
função w é designada de função peso Procedendo analogamente ao exemplo
anterior é fácil comprovar que, de fato, hf , gi1 constitui um produto interno
em C [a, b]. No caso particular do vetor w ser identicamente igual a um,
534 CAPÍTULO 8. MÍNIMOS QUADRADOS

hf , gi1 se confunde com o produto interno usual hf , gi definido no exemplo


anterior.

Exemplo 8.30, Com base no Exemplo 4 seria natural definir hf , gi


no espaço vetorial CP [a, b], das funções contínuas por partes no intervalo
fechado [a, b], por
Z b
hf , gi = f (x) g (x) dx.
a
Infelizmente isso não seria possível, pois a condição hf , f i = 0 se, e so-
mente se f = 0 seria violada. De fato existem uma infinidade de funções
contínuas por partes não nulas que satisfazem. hf , f i = 0. Basta considerar
a função identicamente zero com um número finito de pontos em que ela
é diferente de zero. Do mesmo modo, duas funções contínuas por partes
idênticas, exceto em alguns pontos isolados, produziriam o mesmo valor de
hf , f i. Esses problemas seriam contornados se no lugar das função contínuas
por partes individuais fossem consideradas família de funções que se diferen-
ciam apenas em alguns pontos isolados. Nesse caso a função nula seria uma
classe de funções identicamente iguais a zero com exceção de alguns pontos
isolados de descontinuidades. Então, o espaço euclidiano CP [a, b] passaria
a ser um conjunto de classes de equivalência4 de funções com o produto
interno definido por (8.6).
Esses dois últimos exemplos são fundamentais no encadeamento dos as-
suntos a serem estudados nos próximos capítulos do livro.

Norma, Distância e Ortogonalidade


Nessa subseção vamos introduzir os conceitos de comprimento de um vetor
e distância entre vetores. Eles, como prometido, vão elucidar a questão de
convergência de série (8.2) e fundamentar o conceito de base para espaços
de dimensão infinita.
O comprimento ou norma de um vetor de um espaço euclidiano é o
número real não-negativo definido por
p
kxk = hx, xi.
Por exemplo, a norma do vetor x = (x1 , x2 , . . . xn ) do espaço euclidiano
Rn é
4
Classes de equivalência são muito comuns em matemática. O exemplo mais simples
é o dos números racionais (frações). Como sabemos, um número racional é um classe de
equivalência formada de pares (p, q) de números inteiros do tipo p/q, q 6= 0. Os pares
(14, 21) , (30, 45) e (2, 3) formam o mesmo número racional.
8.2. ESPAÇOS VETORIAIS 535

q
kxk = x21 + x22 + . . . + x2n , (8.8)
enquanto que a norma do vetor f em C [a, b] ou em CP [a, b] é
µZ b ¶ 12
2
kxk = f (x) dx . (8.9)
a

Lembramos, entretanto, que em CP [a, b] o vetor f é uma representante de


uma classe de equivalência de funções.
A norma do vetor µ ¶
a b
x=
−b a
de R4 , com base no produto interno definido no Exemplo 3 da seção 7.2.3,
é √
kxk = det x.
A partir da definição da norma podemos definir a distância entre dois
vetores x e y num espaço euclidiano como sendo o comprimento da diferença
entre os dois vetores
d (x, y) = kx − yk . (8.10)
Essa definição de distância é bastante razoável, pois ela coincide intuiti-
vamente com a noção de distância no plano.
Outra noção importante é a de ângulo entre dois vetores. Analogamente
aos vetores de um plano, o cosseno do ângulo entre dois vetores não-nulos
x e y pode ser definido assim

hx, yi
cos θ = . (8.11)
kxk kyk
Se, no entanto, um dos vetores é zero, convenciona-se que cosθ = 0.
Da geometria elementar sabemos que dois vetores geométricos são per-
pendiculares se, e somente se o ângulo θ entre eles é π/2 ou equivalentemebte
cos θ = 0. Da definição do cosseno entre dois vetores de um espaço euclidiano
8.11, vemos que o vetor zero é perpendicular a todos os demais vetores do
espaço e que, em geral, dois vetores são perpendiculares ou ortogonais se e
somente se hx, yi = 0.
Uma família de vetores x1 , x2 ,. . .,xi ,. . . de um espaço euclidiano é dito
um conjunto ortogonal se xi 6= 0 para todo i, e

hxi , xj i = 0,
536 CAPÍTULO 8. MÍNIMOS QUADRADOS

sempre que i 6= j. Se, além disso,

hxi , xi i = 1,
para todo i, então o conjunto é dito ortonornal.

Exemplo 8.31 Em R3 os vetores (1, 0, 0), (0, 3, 0) e (0, 0, −7) formam


um conjunto ortogonal, enquanto que os vetores da base canônica (1, 0, 0),
(0, 1, 0) e (0, 0, 1) formam um conjunto ortonormal.

Exemplo 8.32 Os vetores 1, x, x2 −1/3 são mutualmente ortogonais em


P3 , o espaço euclidiano dos polinômios de ordem três, cujo produto interno
é definido por
Z 1
hp, qi = p (x) q (x) dx.
−1

Exemplo 8.33 Em CP [−T /2, T /2] os vetores 1, cos (2πt/T ) , sin (2πt/T ),. . .,
cos (2nπt/T ), sin (2nπt/T ) são ortogonais. Isso decorre do fato que
Z T /2
cos (2nπt/T ) dt = 0, se n 6= 0,
−T /2
Z T /2
sin (2nπt/T ) dt = 0 para todo n,
−T /2
Z T /2 ½
0 se m 6= n,
cos (2mπt/T ) cos (2nπt/T ) dt =
−T /2 T /2 se m = n 6= 0
Z T /2
sin (mπt/T ) cos (nπt/T ) dt = 0 para todos n, m.
−T /2
Z T /2 ½
0 se m 6= n,
sin (mπt/T ) sin (nπt/T ) dt =
−T /2 T /2 se m = n 6= 0

Observando se, ainda, que


Z T /2
1dt = T ,
−T /2
√ p p
se conclui que os
pvetores 1/ T , cos (2πt/Tp ) / 2/T , sin (2πnt/T ) / 2/T ,. . .,
cos (2πnt/T ) / 2/T , sin (2πnt/T ) / 2/T √ são mutualmente p ortonormais..
p o conjunto infinito 1/ T , cos (2πkt/T ) / 2/T ,
Por indução,
sin (2πkt/T ) / 2/T , k = 1, 2, . . . é um conjunto ortonormal em CP [−T /2, T /2] .
8.2. ESPAÇOS VETORIAIS 537

Exemplo 8.34 Analogamente, os vetores ei2πkt/T /T com k = 0, ±1, ±2, . . .são


ortogonais em CP [−T, T ] com o produto interno expresso por
Z b
hf , gi = f (x) g (x) dx.
a

onde g é o conjugado de g.
£ ¤
Exemplo 8.35 Na seção 5.3 vimos que o conjunto Jν (γ νk x/a)/ a2 Jν+1
2 (γ k ) /2
em que k = 1, 2 . . . e γ νk o k-ésimo zero da função de Bessel de primeira
espécie de ordem ν é ortonormal em CP [0, a].

Exemplo 8.36 Na seção 5.6 verificamos que os polinômios de Legendre


Pn normalizados por 2/(2n+1) são mutualmente ortonormais em CP [−1, 1].
Um resultado de suma importância em álgebra linear é aquele que diz
que os vetores de qualquer conjunto ortogonal (ortonormal) num espaço
euclidiano são linearmente independentes [40].
Como conseqüência desse resultado podemos afirmar que n vetores ortog-
onais (ortonormais) de um espaço euclidiano de dimensão finita n formam
uma base. Ademais, dado um vetor qualquer do espaço é possível determinar
as componentes do vetor
Com efeito, seja x = α1 e1 + α2 e2 + . . . + αn en um vetor de um es-
paço euclidiano e {e1 , e2 , . . . , en } uma base ortogonal. Efetuando o produto
interno de x com o primeiro elemento da base, vem

hx, e1 i = α1 he1 , e1 i + α2 he2 , e1 i + . . . + αn hen , e1 i .


Como hek , e1 i = 0, k = 2, 3 . . . n, obtém-se

hx, e1 i
α1 = . (8.12)
he1 , e1 i
Procedendo-se da mesma maneira com os outros elementos da base, re-
sulta

hx, ek i
αj = k = 2, 3 . . . n, (8.13)
hek , ek i
e assim determina-se todas as demais componentes do vetor.
Se a base for ortonormal, ou seja hek , ek i = 1, k = 2, 3 . . . n, as compo-
nentes do vetor x se reduzem a hx, ek i e por conseqüência o vetor x, pode
ser escrito, em termo de suas componentes, da seguinte maneira
538 CAPÍTULO 8. MÍNIMOS QUADRADOS

n
X
x = hx, e1 i e1 + hx, e2 i e2 + . . . + hx, en i en = hx, ek i ek .
k=1

Estamos agora preparados para definir o que seja uma base em um espaço
euclidiano de dimensão infinita.
Definição: Um conjunto ortonormal e1 , e2 , . . . ek . . . é uma base de um
espaço euclidiano V se, e somente se, todo vetor de V puder ser escrito sob
a forma

X
x= hx, ek i ek (8.14)
k=1

Nessa definição, os produtos internos hx, ek i são chamados de coorde-


nadas ou coeficientes de Fourier generalizados de x com respeito à base dada
e a própria série denomina-se desenvolvimento de x em série de Fourier gen-
eralizada e dizemos que a série converge em média para x.
Convergência em média significa que dada uma seqüência {xk } de vetores
de um espaço euclidiano de dimensão infinita, ela converge para o vetor x
de acordo com
lim kxk − xk = 0.
k→∞

No caso particular importantíssimo do espaço CP [a, b], convergência em


média significa.
µZ b ¶ 12
2
lim kxk − xk = lim [fk (x) − f (x)] dx =0
k→∞ k→∞ a

Em Análise, convergência em média é bem diferente de convergência


pontual. Na convergência pontual uma seqüência de funções {fk (x)} con-
verge para a função f pontualmente, isto é, em todos os pontos do intervalo,
enquanto na convergência em média a seqüência pode até divergir em todos
os pontos mas em média ela converge [40]. © ª
No exemplo da Figura (7.2), a seqüência fk (x) = xk converge em
média para a função f (x) = 0 no intervalo [−1, 1], mas não converge pon-
tualmente. De fato no ponto x = 1, a seqüência converge para 1, enquanto
no ponto x = −1, ela diverge (ora 1, ora −1).

In[1]:= xn = Table[x^n, {n, 25}];


Plot[Evaluate[xn], {x, -1, 1},
8.2. ESPAÇOS VETORIAIS 539

x^n
1
0.75
0.5 x

0.25 x2
x4
x
-1 -0.5 0.5 1
-0.25

x3 -0.5
-0.75
-1

Figura 8.2:

PlotRange -> {-1, 1},


AxesLabel -> {’’x’’, ’’x^n’’},
Epilog -> {Text[’’x’’, {0.5, 0.55}],
Text[’’x’’, {0.5, 0.3}],
Text[’’2’’, {0.53, 0.34}],
Text[’’x’’, {-0.75, -0.54}],
Text[’’3’’, {-0.72, -0.5}],
Text[’’x’’, {-0.55, 0.15}],
Text[’’4’’, {-0.52, 0.19}]}];

A partir da definição de uma base em espaços euclidianos de dimensão


infinita pode-se demonstrar o seguinte teorema [40].
Teorema Um conjunto ortogonal e1 , e2 , . . . ek . . . .é uma base de um
espaço euclidiano V se, e somente se, seu conjunto ortonormal associado
e1 / ke1 k , e2 / ke2 k , , . . . ek / kek k , . . .for uma base. Nesse caso, o desenvolvi-
mento em série de um vetor em termo dos vetores da base é

X hx, ek i
x= ek (8.15)
kek k
k=1

em que os númeos reais


hx, ek i
(8.16)
kek k
são os coeficientes de Fourier generalizados do vetor x com relação à base
e1 , e2 , . . . ek . . ..
540 CAPÍTULO 8. MÍNIMOS QUADRADOS

E x d

y
W

Figura 8.3:

Os desenvolvimentos em série de Fourier, de Fourier-Bessel e de Legen-


dre estudados no quarto capítulo correspondem a meras aplicações desse
teorema.
Explorando um pouco mais a estrutura geométrica dos espaços euclid-
ianos vamos agora tratar sucintamente de um tópico fundamental e de
suma importância para a se resolver numericamente problemas de contorno
em eletromagnetismo. Veremos, por exemplo, que a solução de um prob-
lema de contorno, embora existindo formalmente, é no mais das vezes in-
acessível em espaços de dimensão infinita de funções Contorna-se essa situ-
ação substituindo-se a solução pretendida por uma função aproximada con-
tida num espaço de dimensão finita, cujo acesso seja mais fácil. Dito isto,
vamos agora analisar a questão da projeção de um vetor arbitrário de um
espaço euclidiano num subespaço de dimensão finita, a qual servirá de base
para os algoritmos numéricos que serão desenvolvidos a seguir.

8.2.4 Projeções perpendiculares


Seja E um espaço euclidiano e W um subespaço de dimensão finita de E. Um
vetor d de E é dito ortogonal a W se, e somente se, ele for ortogonal a cada
um dos vetores da base de W. É fácil demonstrar que um vetor x qualquer
de E pode ser decomposto em x = y + d, onde y é um vetor de W e d ∈
E um vetor perpendicular a W. O vetor y é único e é chamado de projeção
perpendicular de x em W [40]. A figura XXX ilustra esquematicamente a
decomposição de x em y e d
O vetor d pode ser utilizado para medir a distância de x a W. Assim,
podemos descrever a projeção perpendicular y = x − d de x sobre W como
o ponto de W que está mais próximo de x, no sentido de se x é outro vetor
qualquer de W, então kx−xk > kdk.
8.2. ESPAÇOS VETORIAIS 541

8.2.5 Algoritmo dos Mínimos Quadrados


A título de motivação vamos iniciar com um problema simples da geometria
elementar. Sabemos que por três pontos não colineares pode-se traçar um
circunferência passando sobre os três pontos. Com efeito, a equação da
circunferência
(x − x0 )2 + (y − y0 )2 = r2 ,
pode ser reescrita da seguinte maneira

ax + by + c = −x2 − y2 , (8.17)

onde

a = −2x0 ,
b = −2y0 ,
c = −r2 + x20 + y02 . (8.18)

Substituindo os três pontos não colineares em (8.17) chega-se a um sis-


tema de três equações lineares cujas incógnitas são a, b e c. Resolvido o
sistema, a posição do centro da circunferência e o seu raio são calculados
por 8.17.
Suponhamos, agora, que os três pontos com os quais se deseja traçar
uma determinada circunferência sejam coletados experimentalmente com
um certo grau de incerteza. Para cada grupo de três pontos ter-se-ia uma
circunferência diferente Qual das circunferências seria a mais próxima da
circunferência desejada, supondo que esta exista? Como devemos, então,
proceder para escolher uma circunferência que seja mais próxima possível
da circunferência desejada? Primeiro, devemos usar todos os pontos observa-
dos e em seguida estabelecer um critério que permita determinar qual, entre
todas as circunferências possíveis, aquela que é mais próxima da circunfer-
ência em questão. O algoritmo dos mínimos quadrados que corresponde em
minimizar a soma dos quadrados dos erros entra os pontos observados e os
pontos sobre a circunferência desejada faz exatamente isto.
O problema da circunferência acima formulado, embora muito simples,
contém a essência do algoritmo dos mínimos quadrados. Qual seja, calcular
estimativas para um conjunto de parâmetros (no caso da circunferência, as
coordenadas do centro e o raio), geralmente inacessíveis, a partir de uma
coleção de dados observados, comumente inexatos, relacionados linearmente
aos parâmetros a serem determinados; de modo que a soma dos quadrados
dos desvios entre os pontos estimados e os observados seja mínima possível.
542 CAPÍTULO 8. MÍNIMOS QUADRADOS

Naturalmente, o número de observações deve ser igual ou maior ao número


de parâmetros a serem determinados. Embora muito simples, o algoritmo
dos mínimos quadrados é bastante eficaz.
O método dos mínimos quadráticos pode ser facilmente generalizado
para a obtenção de soluções numéricas aproximadas de problemas de con-
torno em que soluções exatas são geralmente inacessíveis. Tal generalização
é simplificada quando feita na linguagem dos espaços euclidianos. Isto justi-
fica a nossa preocupação em fazer esta revisão sucinta de álgebra linear neste
capítulo. prende-se exatamente ao foi especificamente voltado para esse ob-
jetivo, uma vez que o algoritmo dos mínimos quadrados ou um seu variante
será empregado largamente na busca de soluções numéricas aproximadas de
problemas de contorno em eletromagnetismo. Dito isto, o algoritmo dos
mínimos quadrados pode ser traduzido nos seguintes termos.

Teorema da Projeção. Dado um espaço eeclidiano E, seja W um


subespaço de E dimensão n gerado pelos vetores linearmente independentes
φ1 , φ2 , . . . , φn . Seja x um ponto qualquer de E. A estimativa xn ∈ W de x
por mínimo quadrado é dada por

xn = α1 φ1 + α2 φ2 + . . . + αn φn , (8.19)

em que (α1 , α2 , . . . , αn ) é a solução única do sistema de equações lineares


n
X ­ ®
φi , φj αj = hx, φi i , 1 ≤ i ≤ n. (8.20)
j=1

Prova 1. Consideremos x = α1 φ1 +α2 φ2 +. . .+αn φn um ponto arbitrário


de W e seja
° °2
° Xn °
° °
g (α1 , α2 , . . . , αn ) = kx−xk = °
2
°x− αj φj °
° .
° j=1 °

Então, g é uma função real contínua de n variáveis α1 , α2 , . . . , αn reais.


Ademais, como xn é o único vetor entre todos os vetores de W que minimiza
kx−xk2 e como os φi são linearmente independentes,

g (α1 , α2 , . . . , αn ) = min g (α1 , α2 , . . . , αn ) ,

entre todas n-uplas de números reais (α1 , α2 , . . . , αn ). Seja α = (α1 , α2 , . . . , αn ),


segue, então, que
∂g ∂ kx−xk2
(α) = (α) = 0.
∂αi ∂αi
8.2. ESPAÇOS VETORIAIS 543

Mas, * +
n
X n
X
kx−xk2 = x− αj φj , x− αj φj ,
j=1 j=1

ou mais especificamente, usando-se as propriedades do produto interno,


n
X n
2 2 ­ ® X ­ ®
kx−xk = kxk − 2 αj x, φj + αi αj φi , φj .
j=1 i,j=1

Portanto, para cada i, 1 ≤ i ≤ n, tem-se

X ­ n
∂g ®
(α) = −2 hx, φi i + 2 αj φi , φj
∂αi
j=1

resultando em
n
X ­ ®
φi , φj αj = hx, φi i .
j=1

Como os vetores φi são linearmente independentes,


­ ® esse sistema de equações
lineares tem solução única e a matriz φi , φj , 1 ≤ i, j ≤ n, é não singular.
Fica assim provado o teorema.
Uma demostração mais simples e que justifica o título do teorema pode
ser feita usando-se a linguagem da álgebra linear. Vejamos,
Prova -2. Sejam o vetor d a componente de x perpendicular a W e
xn = x − d a projeção de x em W.
Como
xn = x − d =α1 φ1 + α2 φ2 + . . . + αn φn ,
a condição de d ser ortogonal a cada um dos vetores φi da base, nos leva ao
sistema de equações lineares

hφ1 , φ1 i α1 + hφ1 , φ2 i α2 + . . . + hφ1 , φn i αn = hφ1 , xi


hφ2 , φ1 i α1 + hφ2 , φ2 i α2 + . . . + hφ2 , φn i αn = hφ2 , xi
..
.
hφn , φ1 i α1 + hφn , φ2 i α2 + . . . + hφn , φn i αn = hφn , xi
­ ®
nas incógnitas α1 , α2 , . . . , αn . A matriz não singular φi , φj , 1 ≤ i, j ≤ n é
chamada de matriz de Gramm

.
544 CAPÍTULO 8. MÍNIMOS QUADRADOS

Corolário. Dadas m obsevações x = (x1 , x2,... xm ) e n < m parâmetros


p = (p1 , p2,... pn ) relacionados linearmente por Ap = x, a estimativa pn de
p por mínimos quadrados é fornecida por

AT Apn = AT x (8.21)

em que AT é a matriz transposta de A.


Prova 2.As colunas da matriz A formam uma base {φ1 , φ2 . . . φn } do
subespaço Rn do espaço euclidiano Rm . É imadiato que AT A é a ma-
triz de Gramm formada pelos produtos internos dos elementos da base
{φ1 , φ2 . . . φn } de acordo com o lado esquerdo de (8.20) e o vetor AT x con-
forme o lado direito da mesma equação.
Retornando agora ao problema da circunferência, suponhamos que se-
jam dados os seguintes seis pares de coordenadas (0, 0), (4.0, 0), (0, 4.0),
(5.0, 6.0), (1.5, 5.8) e (5.7, 2.2), pelos quais desejamos ajustar uma circunfer-
ência no sentido dos mínimos quadrado.
Substituindo os seis pares na equação (8.17) forma-se o sistema de equações
lineares,

0a + 0b + c = 0,
4a + 0b + c = −16,
0a + 4b + c = −16,
5a + 6b + c = −61,
1.5a + 5, 8b + c = −35.89,
5.7a + 2.2b + c = −37.33. (8.22)

Esse sistema contém mais equações do que incógnitas, isto é, ele é su-
perdeterminado. Assim, vamos usar o algoritmo dos mínimos quadrados
para encontrar estimativas α, β e γ para os parâmetros a, b e c respectiva-
mente.
Dito isto, podemos reescrever o sistema (8.22) da seguinte maneira,

xn = αφ1 + βφ2 + γφ3 ,

onde φ1 = (0, 4, 0, 5, 1.5, 5.7), φ2 = (0, 0, 4, 6, 5.8, 2.2) e φ3 = (1, 1, 1, 1, 1, 1)


são os vetores formados pelas colunas do lado esquerdo de (8.22). Eles são
vetores linearmente independentes de R6 e formam uma base de um sube-
spaço de dimensão três. De acordo com o algoritmo dos mínimos quadra-
dos o vetor xn = αφ1 + βφ2 + γφ3 é a projeção perpendicular do vetor
x = (0, −16, −16, −61, −35.89, −37.33) formado pelo lado direito do sistema
8.2. ESPAÇOS VETORIAIS 545

(8.22). Calculando e substituindo os produtos internos no sistema (8.20),


obtemos,

75.74α + 51.24β + 16.2γ = −635.616


51.24α + 90.48β + 18.0γ = −720.288
16.2α + 18.0β + 6.0γ = −166.220. (8.23)

Finalmente, resolvendo esse sistema encontramos α = −5.36903, β = −5.68678


e γ = 3.85339. As coordenadas do centro da circunferência e o raio são da-
dos por (8.18). Portanto, (x0 , y0 ) = (2.68451, 2.44339) e r = 3.39203 são as
coordenadas do centro e o raio da circunferência que melhor se ajusta aos
seis pontos dados no sentido dos mínimos quadrado.
O trabalho de computar os produtos internos que formam o sistema de
equações (8.20) e o de solucionar o sistema de equações lineares é facilitado
quando se usa Mathematica, principalmente se o número de observações for
muito grande. Com efeito, o programa abaixo mostra como isso pode ser
implementado,

In[1]:= p = {{0, 0}, {4.0, 0}, {0, 4.0}, {5.0, 6.0},


{1.5, 5.8}, {5.7, 2.2}};
tp = Transpose[p];
{e1, e2} = tp;
e3 = Table[1, {i, Length[p]}];
grammM = {{e1.e1, e1.e2, e1.e3}, {e2.e1, e2.e2, e2.e3},
{e3.e1, e3.e2, e3.e3}};
x = Apply[Plus, -tp^2];
{a, b, c} = LinearSolve[grammM, {e1.x, e2.x, e3.x}];
{x0 = -a/2, y0 = -b/2, raio = Sqrt[x0^2 + y0^2 - c]}
Out[1]= {2.68451, 2.84339, 3.38203}

A circunferência que melhor se ajusta aos seis pontos dados no sentido


dos mínimos quadrados é ilustrada na figura a seguir,

In[2]:= Show[ParametricPlot[
{raio Cos[t] + x0, raio Sin[t] + y0},{t, 0, 2 Pi},
AspectRatio -> Automatic,
PlotRange -> {{-1, 7}, {-1, 7}},
AxesLabel -> {’’x’’, ’’y’’},
DisplayFunction -> Identity],
ListPlot[p, PlotStyle -> PointSize[0.03],
546 CAPÍTULO 8. MÍNIMOS QUADRADOS

y
7

x
-1 1 2 3 4 5 6 7

-1

Figura 8.4:

DisplayFunction -> Identity],


DisplayFunction -> $DisplayFunction];

Obviamente, aplicando-se o Corolário do Teorema das projeções chega-se


ao mesmo resultado como atesta o código a seguir.

In[2]:= p = {{0, 0}, {4.0, 0}, {0, 4.0}, {5.0, 6.0},


{1.5, 5.8}, {5.7, 2.2}};
matA = Table[Append[p[[i]], 1], {i, Length[p]}];
x = Apply[Plus, -Transpose[p]^2];
matAtA = Transpose[matA].matA;
{a, b, c} = LinearSolve[matAtA, Transpose[matA].x];
{x0 = -a/2, y0 = -b/2, raio = Sqrt[x0^2 + y0^2 - c]}
Out[1]= {2.68451, 2.84339, 3.38203}

8.2.6 Técnica de minimização de Wiener-Hopf


Na seção do 2.8 do capítulo dois foi visto que a convolução numérica de
duas seqüências (w0 , w1 , w2 . . . wm ) e (g0 , g1 , g2 . . . gn ) é a seqüência (h0 , h1 , h2 . . . hm+n )
computada por
m+n
X
hj = gj−i wi , j = 0, 1, 2 . . . m + n, (8.24)
i=0
8.2. ESPAÇOS VETORIAIS 547

em que gj−i = 0 se j − i < 0 ou j − i > n.


Na mesma seção vimos que a decovolução, ou seja o cálculo do filtro wi
a partir das seqüências de entrada gi e saída hi é dada o quociente dos dois
polinômios associados às seqüências gi e hi . O mesmo resultado pode ser
obtido pelo Corolário do Teorema da Projeção. Com efeito, reescrevendo a
fórmula (8.24) na forma matricial Gw = h ou mais explicitamente
⎛ ⎞ ⎛ ⎞
g0 0 0 ··· 0 h0
⎜ g1 g0 0 ··· 0 ⎟ ⎜ h1 ⎟
⎜ ⎟ ⎜ ⎟
⎜ g2 g1 g0 ··· 0 ⎟
⎜ ⎟⎛ ⎞ ⎜
⎜ h2 ⎟

⎜ .. ⎟ w0 ⎜ ⎟
⎜ .g2 g1 ··· 0 ⎟ h3
⎜ ⎟⎜ w1 ⎟ ⎜ ⎟
⎜ .... .. .. ⎟⎜ ⎟ ⎜ h4 ⎟
⎜ . . . ··· . ⎟⎜ ⎟ ⎜ ⎟
⎜ ⎟⎜ w2 ⎟ ⎜ .. ⎟
⎜ gm−1 gm−2 gm−3 ··· g0 ⎟⎜ .. ⎟ ⎜ . ⎟
⎜ ⎟⎜ . ⎟=⎜ ⎟
⎜ gm gm−1 gm−2 ··· g1 ⎟⎜ ⎟ ⎜ hm ⎟
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ .. ⎟⎜ wn−2 ⎟ ⎜ .. ⎟
⎜ 0 gm gm−1 ··· . ⎟⎝ wn−1 ⎠ ⎜
⎜ . ⎟

⎜ ⎟ ⎜ hm+n−3 ⎟
⎜ 0 0 gm ··· gm−3 ⎟ wn ⎜ ⎟
⎜ ⎟ ⎜ hm+n−2 ⎟
⎜ 0 0 0 ··· gm−2 ⎟ ⎜ ⎟
⎜ ⎟ ⎝ hm+n−1 ⎠
⎝ 0 0 0 ··· gm−1 ⎠
0 0 0 ··· gm hm+n

e aplicancando o Corolário do Teorama da Projeção resulta


⎛ ⎞⎛ ⎞ ⎛ ⎞
r1 r2 r3 · · · rn−1 rn w0 d0
⎜ r2 r r2 · · · rn−2 rn−1 ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 1 ⎟ ⎜ w1 ⎟ ⎜ d1 ⎟
⎜ r3 r2 r1 · · · rn−3 rn−2 ⎟ ⎜ w2 ⎟
⎟ ⎜ ⎜ d2 ⎟
⎜ ⎟ ⎜ ⎟
⎜ .. .. .. .. .. .. ⎟ ⎜ .. ⎟ = ⎜ .. ⎟
⎜ . . . . . . ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟⎜ . ⎟ ⎜ . ⎟
⎜ rn−2 rn−3 rn−4 · · · rn r1 ⎟ ⎜ wn−2 ⎟
⎟ ⎜ ⎜ dn−2 ⎟
⎜ ⎟ ⎜ ⎟
⎝ rn−1 rn−2 rn−3 · · · r1 r2 ⎠ ⎝ wn−1 ⎠ ⎝ dn−1 ⎠
rn rn−1 rn−2 · · · r2 r1 wn dn
(8.25)
sendo [rij ] = GT G e di = GT h. Note que a matriz [rij ] possui apenas n
elementos distintos..Matrizes com essa estrutura são chamadas de matriz de
Toeplitz. Esta técnica de cálculo de filtros digitais e conhecida como técnica
de minimização de Wiener-Hopf [36].
Resolvendo o sistem linear (8.25) obtém-se o filtro ou seja a deconvolução
entre as seqüências de entrada e saída.
A codificação na linguagem Mathematica

In[2]:= toepliz[n_, g_, h_] := Module[{},


548 CAPÍTULO 8. MÍNIMOS QUADRADOS

f = Table[0, {n}];
f[[1]] = PadRight[g, Length[g] + n - 1];
Do[f[[i]] = RotateRight[f[[i - 1]]], {i, 2, n}];
ff = Table[f[[1]].f[[i]], {i, n}];
grammM = Table[0, {i, n}, {j, n}];
Do[Do[
grammM[[i, j]] = ff[[j - i + 1]];
grammM[[j, i]] = grammM[[i, j]], {j, i, n}], {i, n}];
d = Table[f[[i]].h, {i, n}];]

A título de ilustração vamos repetir o Exemplo 2.98.

Exemplo 8.37: Dadas as seqüências de entrada (1, 8, −2, 5, 4) e de


saída (6, 41, −65, 68, −17, −13, 12), determinar o filtro.

.In[2]:= {m, n} = {5, 3};


g = {1, 8, -2, 5, 4};
h = {6, 41, -65, 68, -17, -13, 12};
toepliz[n, g, h]
w = LinearSolve[grammM, d]
.Out[2]:= {6, -7, 3}

Exemplo 8.38: Dadas a seqüência de entrada


−sn
gn = e−2sn e−e , n = 0, 1, 2, 3 . . . 49

e a seqüência de saída
¡ ¢ ¡ ¢3
hn = 2e−2pn 3 − e−2pn / 1 + e−2pn , n = 0, 1, 2, 3 . . . 68

em que
sn = ln 0.01 + 0.46880599n
e
pn = sn − 4.61438099.
satisfazendo (8.24), calcular o filtro wn , n = 0, 1, 2 . . . 18, pela técnica de
minimização de Wiener-Hopf..
Como no exemplo anterior, o primeiro passo é construir a matriz Toeplitz.
Mas antes é preciso os valores numéricos das seqüências gn e hn . Isto é feito
com os códigos abaixo

In[2]:= g = Table[sn = Log[0.01] + 0.46880599 n;


8.2. ESPAÇOS VETORIAIS 549

expsn = Exp[-sn];
expsn^2 Exp[-expsn], {n, 0, 49}];
h = Table[pn = Log[0.01] - 4.61438099 + 0.46880599 n;
exppn = Exp[pn]^2;
2 exppn (3 - exppn )/(1 + exppn )^3, {n, 0, 67}];

De posse das seqüências numérica gn e hn , para se calcular o filtro


wn basta acionar o programa toplitz[expr]resolver o sistema de equações.
Portanto,

In[2]:= toepliz[19, g, h]
w = LinearSolve[grammM, d]
Out[2]:= {0.000122903, 0.0000153859, 0.000351468, 0.000842316,
0.00168714, 0.0055245, 0.0118159, 0.0336638, 0.0785758,
0.200715, 0.43771, 0.810527, 0.455154,-1.76824,0.951516,
-0.274542, 0.0683672, -0.0166309, 0.00287612}
Uma das aplicações mais importante do filtro que acabamos de calcular
é na avaliação numérica da transformada seno
Z ∞
f (x) = fb(kx ) sin kx xdkx .
0

De fato, fazendo-se kx x = y, esta integral torna-se


Z
1 ∞b
f (x) = f (y/x) sin ydy,
x 0
e após substituir x por ep e y por es a integral se transforma numa convolução
Z
1 ∞ b³ −(p−s) ´
f (x) = f e sin (es ) es ds,
x −∞
cuja versão discreta se exprime da seguinte maneira

1 X b³ −[ln x−(s0 +n∆s)] ´


N−1
f (x) = f e wn ,
x
n=0

em que s0 = −4.61438099 e ∆s = 0.46880599 e wn são os coeficientes do


filtro de N = 19 pontos supra citado.
A tradução desta fórmula em linguagem Mathematica se resume em

In[2]:= sinTrans19[kfun_, xs_]:= Module[{i, g},


s = Table[Exp[-4.61438099 + 0.46880599 n], {n, 0, 18}];
550 CAPÍTULO 8. MÍNIMOS QUADRADOS

w = {0.000122902672844, 0.000015385916686,
0.000351467883517, 0.000842315821590,
0.001687139470392, 0.005524496064518,
0.011815947701293, 0.033663760509023,
0.078575848297852, 0.200715064354590,
0.437709952407059, 0.810527355159963,
0.455153510230750, -1.768242579810762,
0.951516049629524, -0.274542303754665,
0.068367188550033, -0.016630911939534,
0.002827410835328};
conv = 0;
Do[
g = s[[i]]/xs;
conv = conv + kfun[g] w[[i]],
{i, 19}]]

Exemplo 8.38 Para ilustrar como este programa funciona vamos avaliar
numericamente a integral
Z ∞
4kx
sin kx xdkx
0 1 + 4kx2

e comparar graficamente o valor absoluto do erro relativo entre os valores


exato e aproximado5 , sabendo-se que o valor exato da integral é dado por
π −x/2
e .
2

Portanto,

In[2]:= << Graphics‘Graphics‘

In[2]:= funIn[kx_] := 4 kx/(1 + 4 kx^2)


funOut[x_] := Pi/2 Exp[-x/2]
LogLogPlot[sinTrans19[funIn, x];
Abs[(conv/x - funOut[x])/funOut[x]], {x, .05, 10.},
PlotRange -> {{.05, 10}, {10^-6, 1}}];
5
O erro relativo é determinado pela diferença entre o valor exato e o valor aproximado
dividida pelo valor exato.
8.2. ESPAÇOS VETORIAIS 551

0.01

0.0001

1. ´ 10 - 6

1. ´ 10 - 8

0.1 0.2 0.5 1 2 5 10

Figura 8.5:

Exemplo 8.39 Desta feita consideremos a integral

Z ∞
sin (1/4kx ) sin kx xdkx ,
0

cujo valor exato é dado por

π ¡√ ¢ √
J1 x /2 x.
2

O gráfico do erro relativo encontra-se ilustrado na Figura xxx.

In[2]:= funIn[kx_] := Sin[1/(4kx)]

funOut[x_] := Pi/2 BesselJ[1, Sqrt[x]]/(2 Sqrt[x])


LogLogPlot[sinTrans19[funIn, x];
Abs[(conv/x - funOut[x])/funOut[x]], {x, .05, 10.},
PlotRange -> {{.05, 10}, {10^-6, 1}}];
552 CAPÍTULO 8. MÍNIMOS QUADRADOS

0.1

0.01

0.001

0.0001

0.00001

1. ´ 10 - 6
0.1 0.2 0.5 1 2 5 10

Figura 8.6:

Naturalmente, não se pode afirmar que esta técnica funciona igualmente


bem para qualquer tipo de transformada seno. Claro que não. Mas, para
alguns tipos de transformadas seno comuns em geofísica ela é extremamente
eficaz.

Exemplo 8.40: Dadas a seqüência de entrada


−sn
gn = e−2sn e−e , n = 0, 1, 2, 3 . . . 49

e a seqüência de saída
¡ ¢ ¡ ¢3
hn = 2e−pn 1 − 3e−2pn / 1 + e−2pn , n = 0, 1, 2, 3 . . . 68

em que
sn = ln 0.001 + 0.48n
e
pn = sn − 6.0.
satisfazendo (8.24), calcular o filtro wn , n = 0, 1, 2 . . . 18, pela técnica de
minimização de Wiener-Hopf..
Como no exemplo anterior, o primeiro passo é construir a matriz Toeplitz.
Mas antes é preciso os valores numéricos das seqüências gn e hn . Isto é feito
com os códigos abaixo

In[2]:= g = Table[sn = Log[0.001] + 0.48 n;


expsn = Exp[-sn];
expsn^2 Exp[-expsn], {n, 0, 49}];
8.2. ESPAÇOS VETORIAIS 553

h = Table[pn = Log[0.001] - 6. + 0.48 n;


exppn = Exp[pn];
2 exppn (1 - 3 exppn^2)/(1 + exppn^2)^3, {n, 0, 67}];

De posse das seqüências numérica gn e hn , para se calcular o filtro


wn basta acionar o programa toplitz[expr]resolver o sistema de equações.
Portanto,

In[2]:= toepliz[19, g, h]
w = LinearSolve[grammM, d]
Out[2]:= {0.00612466, -0.00702725, 0.0137508, -0.00523338, 0.0169891, 0.00571415,
0.0275067, 0.0282107, 0.0614688, 0.0797096, 0.149697, 0.188832,
0.294491,
0.135993, -0.392742, -1.63696, 1.37142, -0.390445, 0.0523505}

Uma das aplicações mais importante do filtro que acabamos de calcular


é na avaliação numérica da transformada seno
Z ∞
f (x) = fb(kx ) cos kx xdkx .
0

De fato, fazendo-se kx x = y, esta integral torna-se


Z
1 ∞b
f (x) = f (y/x) cos ydy,
x 0
e após substituir x por ep e y por es a integral se transforma numa convolução
Z
1 ∞ b³ −(p−s) ´
f (x) = f e cos (es ) es ds,
x −∞

cuja versão discreta se exprime da seguinte maneira

1 X b³ −[ln x−(s0 +n∆s)] ´


N−1
f (x) = f e wn ,
x n=0

em que s0 = −6.0 e ∆s = 0.48 e wn são os coeficientes do filtro de N = 19


pontos supra citado.
A tradução desta fórmula em linguagem Mathematica se resume em

In[2]:= sinTrans19[kfun_, xs_]:= Module[{i, g},


s = Table[Exp[-4.61438099 + 0.46880599 n], {n, 0, 18}];
w = {0.006124655080495, -0.007027253869074,
554 CAPÍTULO 8. MÍNIMOS QUADRADOS

0.013750794139757, -0.005233384134847,
0.016989100234466, 0.005714153748705,
0.027506651846972, 0.028210676704202,
0.06146881903935, 0.079709612795005,
0.14969650530124, 0.188832233754121,
0.294490836806041, 0.13599301365803,
-0.39274173001427, -1.6369585742209,
1.371422221036944, -0.3904445935540
0.052350502262016};
conv = 0;
Do[
g = s[[i]]/xs;
conv = conv + kfun[g] w[[i]],
{i, 19}]]

Exemplo 8.41 Para ilustrar como este programa funciona vamos avaliar
numericamente a integral
Z ∞ ³ p ´
J0 a kx cos (kx x) dkx
0

e comparar graficamente o valor absoluto do erro relativo entre os valores


exato e aproximado6 , sabendo-se que o valor exato da integral é dado por
£ ¤
sin a2 /(4x) /x

Portanto,

In[2]:= << Graphics‘Graphics‘

In[2]:= a=1;
Clear[kx, x]f
funIn[kx_] := BesselJ[0, a Sqr[kx]]
funOut[x_] := Sin[a^2/(4 x)]/x
LogLogPlot[Abs[(cosTrans19[funIn, x]; conv/x - funOut[x])/funOut[x]],
{x, ..1, 10.},
PlotRange -> {{.1, 10}, {10^-6, 10}}];
6
O erro relativo é determinado pela diferença entre o valor exato e o valor aproximado
dividida pelo valor exato.
8.2. ESPAÇOS VETORIAIS 555

0.01

0.0001

-6
× 10 0.2 0.5 1 2 5 10

Figura 8.7:

Naturalmente, não se pode afirmar que esta técnica funciona igualmente


bem para qualquer tipo de transformada co-seno. Claro que não. Mas, para
alguns tipos de transformadas co-seno comuns em geofísica ela é extrema-
mente eficaz.

8.2.7 Operadores Simétricos e Positivos Definidos


Na seção XXX apresentemos os operadores lineares em espaços vetoriais.
Agora nos espaços euclidianos, vamos nos restringir aos operadores simétri-
cos e positivos definidos..
Seja E um espaço euclidiano. Um operador linear L : E → E é dito
simétrico se, e somente se
hLx, yi = hx, Lyi para todos x e y de E,
O operador L é dito positivo definido se, e somente se
hLx, xi > 0, para todo x 6= 0.
Vejamos alguns exemplos de operadores simétricos e positivos definidos.

Exemplo 8.42 Seja o operador A : Rn → Rn definido pela matriz


n
P× n, (aij ), 1 ≤ i, j ≤ n. Consideremos, o produto interno usual hx, yi =
n n
j=1 xj yj do R . O operador A é simétrico se, e somente se (aij ) = (aji )
para todos 1 ≤ i, j ≤ n. Com efeito,
hAx, yi = hy, Axi = yT Ax,
hx, Ayi = xT Ay = yT AT x,
hAx, yi = hx, Ayi = A = AT .
556 CAPÍTULO 8. MÍNIMOS QUADRADOS

O operador A é positivo definido se (xj )T (aij ) (xi ) > 0 para todo x 6= 0.


De fato,

hAx, xi = hx, Axi = xT Ax >0 para todo x 6= 0,

Exemplo 8.43 Seja Y = C [0, 1] com o produto interno usual


Z 1
hf , gi = f (x) g (x) dx.
0

Consideremos o operador linear


d2 f
(Lf ) (x) = −
dx2
© ª
e seja X = u (x) ∈ C 2 [0, 1] : u (0) = u (1) = 0 . Então X é um subespaço
euclidiano de Y e Lf ∈ Y para todo f ∈ X . Para mostrar que o operador L
é simétrico, iniciemos com
Z 1
hLf , gi = − f 00 (x) g (x) dx. (8.26)
0

Integrando por partes duas vezes e lembrando-se que f (0) = f (1) = g (0) =
g (1) = 0, visto que f , g ∈ X , obtemos
Z 1
¯1
0
hLf , gi = − f (x) g (x) 0 + ¯ f 0 (x) g 0 (x) dx
0
Z 1
¯1
= f (x) g 0 (x)¯0 − f (x) g 00 (x) dx = hf , Lgi
0

Para comprovar que L é positivo definido basta observar, após integrar por
partes (8.26) e usar f (0) = f (1) = 0, que
Z 1
£ 0 ¤2
hLf , f i = f (x) dx = 0
0

implica em f 0 (x) ≡ 0 visto que f 0 (x) é contínua. Logo f (x) = k, k uma


constante. Como f (0) = 0, k = 0. Portanto f (x) ≡ 0. Então, hLf , f i > 0,
a menos que f ≡ 0, logo L é positivo definido.
© ª
Exemplo 8.44 Sejam Y = C [0, 1] e X = u (x) ∈ C 2 [0, 1] : u (0) = u (1) = 0
com o produto interno
Z 1
hu, vi = u (x) v (x) dx.
0
8.2. ESPAÇOS VETORIAIS 557

Consideremos o operador linear


(Lu) (x) = −u00 (x) + p (x) u (x) ,
sendo p (x) ≥ 0 em [0, 1] .
O operador L é positivo definido e simétrico. Pois bem, iniciando com
Z 1
£ 00 ¤
hLu, ui = −u (x) + p (x) u (x) u (x) dx
0

e integrando por partes, obtemos


Z 1 Z
¯1 1£ ¤2
− u (x) u (x) dx = − u (x) u (x)¯0 +
00 0
u0 (x) dx
0 0
Z 1
£ 0 0
¤ £ 0 ¤2
= − u (1) u (1) − u (0) u (0) + u (x) dx
0
Z 1
£ 0 ¤2
= u (x) dx,
0

visto que u (x) ∈ X e portanto u (1) = u (0) = 0. Com os mesmos argumentos


de continuidade de funções usados no exemplo anterior conclui-se que
Z 1 Z 1
2 £ 0 ¤2
hLu, ui = p (x) [u (x)] dx + u (x) dx > 0,
0 0

a menos que u (x) ≡ 0. Portanto L é positivo definido. Para provar que L é


simétrico em X , simplesmente façamos uma integração por partes mais uma
vez. Assim, se u (x) e v (x) pertencem a X , então
Z 1
£ 00 ¤
hLu, vi = −u (x) + p (x) u (x) v (x) dx
0
Z 1 Z 1
¯1
= −u0 (x) v (x)¯0 + u0 (x) v0 (x) dx + p (x) u (x) v (x) dx
0 0
Z 1 Z 1
¯1
0 ¯
= u (x) v (x) 0 − 00
u (x) v (x) dx + p (x) u (x) v (x) dx
0 0
Z 1
£ ¤
= u (x) −v 00 (x) + p (x) v (x) dx = hLu, vi
0

Portanto L é um operador de X em Y simétrico e positivo definido.

Exemplo 8.45 Seja ∆ o operador Laplaciano definido por


∂2u ∂2u
−∆u = +
∂x2 ∂y 2
558 CAPÍTULO 8. MÍNIMOS QUADRADOS

numa região fechada e limitada Ω ⊂ R2 , sujeito à condição de u (s) = 0,


com s ∈ ∂Ω, ©sendo ∂Ω a fronteira de Ω. ª
Seja X = u (x, y) ∈ C 2,2 (Ω) , u (s) = 0, s ∈ ∂Ω munido do produto in-
terno Z
hu, vi = u (x, y) v (x, y) dxdy.

Nessas condições, o operador ∆ é simétrico e positivo definido. Para
provar essa asserção consideremos
Z µ 2 ¶
∂ u ∂2u
h∆u, vi = − 2
+ 2 v (x, y) dxdy
Ω ∂x ∂y
Z ∙ µ ¶ µ ¶¸
∂ ∂u ∂ ∂u
= − + v (x, y) dxdy.
Ω ∂x ∂x ∂y ∂y
Agora, usando-se as identidades
µ ¶ µ ¶
∂ ∂u ∂u ∂v ∂ ∂u
v = +v ,
∂x ∂x ∂x ∂x ∂x ∂x
µ ¶ µ ¶
∂ ∂u ∂u ∂v ∂ ∂u
v = +v (8.27)
∂y ∂y ∂y ∂y ∂y ∂y
juntamente com o teorema de Green
Z µ ¶ Z
∂Q ∂P
− dxdy = P dx + Qdy,
Ω ∂x ∂y Ω

podemos escrever
Z µ ¶ Z ∙ µ ¶ µ ¶¸
∂u ∂v ∂u ∂v ∂ ∂u ∂ ∂u
h∆u, vi = + dxdy − v + v dxdy
Ω ∂x ∂x ∂y ∂y Ω ∂x ∂x ∂y ∂y
Z µ ¶ Z
∂u ∂v ∂u ∂v ∂u ∂u
= + dxdy + v dx − v dy,
Ω ∂x ∂x ∂y ∂y ∂Ω ∂y ∂x
onde fizemos as indentificações P = −v∂u/∂y e Q = v∂u/∂x. Como v ∈ X ,
segue que v (s) = 0 na fronteira ∂Ω e então a integral de linha se anula,
resultando portanto,
Z µ ¶
∂u ∂v ∂u ∂v
h∆u, vi = + dxdy.
Ω ∂x ∂x ∂y ∂y
Procedendo de forma análoga com h∆v, ui tem-se
Z µ ¶
∂v ∂u ∂v ∂u
h∆v, ui = + dxdy.
Ω ∂x ∂x ∂y ∂y
8.2. ESPAÇOS VETORIAIS 559

Fica assim provado que

h∆u, vi = h∆v, ui ,

ou seja, ∆ é um operador simétrico.


Da expressão
Z "µ ¶2 µ ¶2 #
∂u ∂u
h∆u, ui = + dxdy
Ω ∂x ∂y

conclui-se rapidamente que ∆ é um operador positivo definido.


Observe que as identidades (8.27) juntamente com o teorema de Green
desempenham aqui o mesmo papel que as integrações por partes desempen-
haram nos Exemplos 7.42 e 7.43. Trata-se de uma etapa importantíssima,
pois ela permite a separação da integral em duas partes: uma correspondente
ao interior do domínio e a outra ligada à fronteira do domínio. Esse expedi-
ente facilita a incorporação das condições de fronteira como ficou patentiado
nos três últimos exemplos. Mais importante ainda é que ele será usado nos
problemas de contorno a serem estudados mais adiante.
O nosso interesse nos operadores simétricos e positivos definidos prende-
se ao fato de que eles proporcionam a criação de novos espaços euclidianos
a partir de outros preexistentes. Os benefícios dessa estratégia é que esses
novos espaços constituem o ambiente natural para se resolver numericamente
problemas de contorno cuja soluções exatas são praticamente impossíveis de
serem obtidas por outros meios. O teorema que garante a construção desses
novos espaços euclidianos tem o seguinte anunciado [?],.

Teorema 8.1 Um operador linear L : X → Y simétrico e positivo


definido dá origem a um segundo produto interno h , iL , em X ⊂ Y ,
definido por
hx, yiL = hLx, yi ,
sendo h , i o produto interno original de Y.

Seguem alguns exemplos importantes de aplicações desse teorema.

Exemplo 8.46 Sejam E = Rn , com o produto interno usual,.e A = (aij )


uma matriz n×n real simétrica e positiva definida. Consideremos o operador
linear A : Rn → Rn , então a função

hx, yiA = hAx, yi ,


560 CAPÍTULO 8. MÍNIMOS QUADRADOS

para todo x e y em Rn forma um novo produto interno em .Rn . Note que


o espaço euclidiano E1 = Rn com esse novo produto interno e o espaço E
original são dois espaços euclidianos distintos, embora ambos sejam Rn ..
Um exemplo específico é dado pela transformação linear
µ ¶
2 1
A= .
1 2

A matiz A é simétrica e positiva definida. Então,

hx, yiA = h(2x1 + x2 , x1 + 2x2 ) , (y1 , y2 )i


= 2x1 y1 + x2 y1 + x1 y2 + 2x2 y2

forma um novo produto interno de R2 , distinto do produto interno usual


hx, yi = x1 y1 + x2 y2 .
© ª
Exemplo 8.47 Sejam E = C [0, 1] e X = f (x) ∈ C 2 [0, 1] : f (0) = f (1) = 0
com o produto interno
Z 1
hu, vi = u (x) v (x) dx.
0

Consideremos o operador linear do Exemplo 7.42

d2 u (x)
(Lu) (x) = − .
dx2
De acordo com o Teorema 8.1,
Z 1
hLu, vi = hu, viL = u0 (x) v 0 (x) dx.
0

forma um segundo produto interno em X .


© ª
Exemplo 8.48 Sejam Y = C [0, 1] e X = f (x) ∈ C 2 [0, 1] : f (0) = f (1) = 0
com o produto interno
Z 1
hu, vi = u (x) v (x) dx.
0

Consideremos o operador linear do Exemplo 7.43

(Lu) (x) = −u00 (x) + p (x) u (x) ,


8.2. ESPAÇOS VETORIAIS 561

sendo p (x) ≥ 0 em [0, 1] .


Aplicando o Teorema 7.1,
Z 1£ ¤
hLu, vi = hu, viL = u0 (x) v 0 (x) + p (x) u (x) v (x) dx.
0

forma-se um segundo produto interno em X .


© ª
Exemplo 8.49 Seja X = u (x, y) ∈ C 2,2 (Ω) , u (s) = 0, s ∈ ∂Ω , em
que Ω é uma região fechada e limitada de R2 , um subespaço de Y = C [0, 1]
com produto interno
Z
hu, vi = u (x, y) v (x, y) dx.

Consideremos o operador linear do Exemplo 7.44

∂ 2u ∂2u
−∆u = + .
∂x2 ∂y 2
De acordo com o Teorema 8.1,
Z µ ¶
∂u ∂v ∂u ∂v
hu, vi∆ = h∆u, vi = + dxdy
Ω ∂x ∂x ∂y ∂y
forma um segundo produto interno em X .
Com esses exemplos chegamos ao fim desta incursão em álgebra linear. É
oportuno lembrar que o que foi visto são apenas pequenas pinceladas sobre
o assunto, embora suficientes para o nosso propósito aqui. Iniciamos com os
espaços vetoriais genéricos. Neles, destacamos dois conceitos fundamentais:
base de um espaço vetorial de dimensão finita e operadores lineares. Se nosso
interesse fosse apenas em espaços vetoriais de dimensão finita pararíamos aí..
Mas não é o caso, estamos interessados nos espaços de dimensão infinita,
particularmente nos espaços de funções. Mais especificamente, na projeção
de um vetor de um espaço de dimensão infinita sobre um subespaço de di-
mensão finita. Os axiomas algébricos que caracterizam os espaços vetoriais
não são suficientes para lidar com questões geométricas, como ortogonali-
dade, projeções etc. Com este propósito definimos o produto interno de dois
vetores e introduzido os espaços euclidianos. Nestes, a partir do produto
interno, introduzimos os conceitos de norma de um vetor, de ortogonali-
dade, de convergência em média e de projeções em subespaços de dimensão
finita, dando origem ao algoritmo dos mínimos quadrados.na forma de um
teorema chamado Teorema da Projeção. A técnica de Wiener-Hopf para
562 CAPÍTULO 8. MÍNIMOS QUADRADOS

estimativa de filtros digitais foi vista como uma das aplicações deste teo-
rema. Finalmente, discorremos sobre os operadores simétricos e positivos
definidos e a partir deles introduzimos novos produtos internos e daí novos
espaços euclidianos que juntamente com o Teorema da Projeção constituem
os alicerces dos métodos numéricos aplicados a problemas de contorno em
eletromagnetismo, tais como elementos finitos, equações integrais e método
dos momentos.

Você também pode gostar