Cálculo Numérico

Sum ario
I Sistemas Lineares
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
9 9 9 10 12 13 15 15 17 21 21 23 24 25 25 28 30 31 31 34 35 37 39 39 42 47
1 Exemplos de aplica c oes de sistemas lineares 1.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . 1.2 Provetas . . . . . . . . . . . . . . . . . . . . . . . 1.3 Petr oleo . . . . . . . . . . . . . . . . . . . . . . . 1.4 Cores . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Interpola c ao polinomial . . . . . . . . . . . . . . 1.6 Outros problemas de determina c ao de polin omios 1.7 Splines . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Problemas de contorno . . . . . . . . . . . . . . . 2 Entendendo os sistemas lineares 2.1 Sistemas lineares e interse c oes de hiperplanos 2.2 Transforma c oes lineares . . . . . . . . . . . . 2.3 Nota c ao e interpreta c ao . . . . . . . . . . . . 2.4 Invers ao de matrizes . . . . . . . . . . . . . . 2.5 Explorando a linearidade . . . . . . . . . . . 2.6 Exist encia e unicidade de solu c oes . . . . . . 2.7 Injetividade, sobrejetividade... glup! . . . . . 2.8 O determinante . . . . . . . . . . . . . . . . . 2.8.1 Dimens ao 2 . . . . . . . . . . . . . . . 2.8.2 Dimens ao 3 . . . . . . . . . . . . . . . 2.8.3 Dimens ao n . . . . . . . . . . . . . . . 2.9 Quadro comparativo . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
3 O M etodo de Escalonamento 3.1 O m etodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Algarismos signicativos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 O determinante no M etodo de Escalonamento . . . . . . . . . . . . . . . 1
2 3.4 3.5 A desvantagem da Regra de Cramer . . . . . . . . . Sistemas mal-condicionados e renamento de solu c ao 3.5.1 Sistemas mal-condicionados . . . . . . . . . . 3.5.2 Matrizes de Hilbert . . . . . . . . . . . . . . . 3.5.3 Renamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
SUMARIO . . . . . . . . . . . . . . . 48 50 50 51 52 57 57 58 61 61
4 M etodos iterativos 4.1 O M etodo de Jacobi . . . 4.2 Crit erio das Linhas . . . . 4.3 Crit erio de parada . . . . 4.4 O M etodo de Gauss-Seidel
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
II
Ajuste de Fun c oes

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
69 69 70 71 71 72 73 74 75 75 81 81 82 83 85 87 87 88 88 91 93 93 95
5 Ajuste de fun c oes 5.1 O problema do ajuste . . . . . . 5.2 Os m nimos quadrados . . . . . . 5.3 Par ametros . . . . . . . . . . . . 5.3.1 Densidade . . . . . . . . . 5.3.2 Caten aria . . . . . . . . . 5.3.3 Naftalinas e fun c oes ans 5.3.4 Decaimento exponencial . 5.3.5 Leis de pot encia e fractais 5.3.6 Gaussiana . . . . . . . . .
6 Fun c oes lineares nos par ametros 6.1 Depend encia linear dos par ametros . . . . . . . . 6.2 Cont nuo vs. discreto . . . . . . . . . . . . . . . . 6.3 Um par ametro . . . . . . . . . . . . . . . . . . . 6.4 Dois par ametros . . . . . . . . . . . . . . . . . . 6.5 Ajuste de qualquer fun c ao linear nos par ametros 6.6 O caso cont nuo . . . . . . . . . . . . . . . . . . . 6.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . 6.7.1 Dinam ometro . . . . . . . . . . . . . . . . 6.7.2 Cosseno aproximado por um polin omio .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
7 Levando a s erio o produto escalar 7.1 Produto escalar e dist ancia . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Exist encia e unicidade de solu c oes no ajuste linear . . . . . . . . . . . .
SUMARIO 7.3 7.4 O caso cont nuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Outros produtos escalares: pesos . . . . . . . . . . . . . . . . . . . . . .
3 97 98 101 101 103 105 106 109
8 Fam lias ortogonais 8.1 Deni c oes e exemplos . . . . . . . . . . . . . . . . 8.2 Calculando polin omios ortogonais por recorr encia . 8.3 Um exemplo de aplica c ao de polin omios ortogonais 8.4 Exemplo de an alise harm onica . . . . . . . . . . . 8.5 Uso de fun c oes tabeladas por mudan ca de vari avel
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
III
Equa c oes e Zeros de Fun c oes
111
113 113 114 114 117 120 121 125 125 126 127 128 130 135 137 138 141 142 145 147 149 151 153
9 Zeros de fun c oes e o M etodo da Dicotomia 9.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . 9.2 Raiz c ubica de 10 . . . . . . . . . . . . . . . . . . . 9.3 P ara-quedista ou bolinha em queda dentro d agua 9.4 O cilindro deitado . . . . . . . . . . . . . . . . . . 9.5 Caten aria . . . . . . . . . . . . . . . . . . . . . . . 9.6 M etodo da Dicotomia . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
10 M etodos iterativos 10.1 Plano geral . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Pontos xos . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Fun c oes auxiliares candidatas . . . . . . . . . . . . . . 10.4 Visualizando itera c oes . . . . . . . . . . . . . . . . . . 10.5 Iterando perto de pontos xos . . . . . . . . . . . . . . 10.6 Teorema do Valor M edio e velocidade de converg encia 10.6.1 O caso (x ) = 0: converg encia quadr atica . . 10.7 Calculando zeros de fun c oes - a escolha de . . . . . 10.8 A escolha de x0 . . . . . . . . . . . . . . . . . . . . . . 10.9 Um crit erio de parada . . . . . . . . . . . . . . . . . . 11 O M etodo de Newton 11.1 Quando o M etodo de Newton funciona? . . . 11.1.1 Retirando a hip otese f (x ) = 0 . . . . 11.2 M etodo de Newton em dimens oes mais altas . 11.2.1 Determina c ao da forma de uma corda
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
SUMARIO
IV
Interpola c ao Polinomial
155
157
12 Estimativa do erro nas interpola c oes
13 T ecnicas de interpola c ao 163 13.1 Polin omios de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 13.2 Forma de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 13.2.1 Exemplo do uso da forma de Newton . . . . . . . . . . . . . . . . 167
Integra c ao de Fun c oes
171
173 173 174 176 179 180 185 186
14 Import ancia da integra c ao num erica 14.1 Introdu c ao . . . . . . . . . . . . . . . . . . 14.2 C alculo de areas . . . . . . . . . . . . . . 14.3 Comprimento de curvas e gr acos . . . . . 14.4 Dist ancia percorrida e tempo decorrido . . 14.5 Per odo do p endulo e as integrais el pticas 14.6 C alculo de e de logaritmos . . . . . . . 14.7 A gaussiana . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
15 M etodos de integra c ao num erica 187 15.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 15.2 O M etodo dos Trap ezios . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 15.3 O M etodo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 16 Estimativa do erro nos m etodos de integra c ao 193 16.1 F ormulas de erro e compara c ao dos m etodos . . . . . . . . . . . . . . . . 193 16.2 Aplica c ao das f ormulas de erro . . . . . . . . . . . . . . . . . . . . . . . 195 17 Obten c ao das f ormulas de erro 17.1 Primeira Abordagem - M etodo dos Trap ezios 17.2 Primeira Abordagem - M etodo de Simpson . 17.3 Segunda Abordagem - M etodo dos Trap ezios 17.4 Segunda Abordagem - M etodo de Simpson . . 17.5 Terceira Abordagem - M etodo dos Trap ezios . 17.6 Terceira Abordagem - M etodo de Simpson . . 201 202 203 204 205 206 206
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
SUMARIO
VI
Equa c oes Diferenciais
209
211 211 213 214 214 214 215 216 217 218 220 220 221 223 227 227 228 230 233 235 240 243 243 244 246 247 249 250 252 257 258 260 261 262
18 Breve introdu c ao ` as equa c oes diferenciais 18.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 18.2 Solu c ao de equa c oes aut onomas e separ aveis . . . . . . . . 18.3 Alguns exemplos . . . . . . . . . . . . . . . . . . . . . . . 18.3.1 Naftalinas . . . . . . . . . . . . . . . . . . . . . . . 18.3.2 Crescimento populacional a taxas constantes . . . 18.3.3 P ara-quedista . . . . . . . . . . . . . . . . . . . . . 18.3.4 Crescimento populacional com restri c oes de espa co 18.3.5 Caten aria . . . . . . . . . . . . . . . . . . . . . . . 18.3.6 Escoamento de um copo furado . . . . . . . . . . . 18.3.7 Dada do M etodo de Newton, quem e f? . . . . . 18.3.8 Transfer encia de calor . . . . . . . . . . . . . . . . 18.4 Entendimento qualitativo de equa c oes aut onomas . . . . . 18.5 Equa c oes diferenciais com mais vari aveis . . . . . . . . . . 19 Solu c ao num erica de equa c oes diferenciais 19.1 Equa c oes separ aveis . . . . . . . . . . . . . . . . . 19.2 Discretiza c ao . . . . . . . . . . . . . . . . . . . . . 19.3 O M etodo de Euler . . . . . . . . . . . . . . . . . . 19.4 Indo para segunda ordem . . . . . . . . . . . . . . 19.5 Runge-Kutta . . . . . . . . . . . . . . . . . . . . . 19.6 Runge-Kutta em sistemas de equa c oes aut onomas . A Revis ao de C alculo A.1 Derivadas . . . . . . . . . . . . . . . . . . . . . . . A.2 Primitivas . . . . . . . . . . . . . . . . . . . . . . . A.3 Integral . . . . . . . . . . . . . . . . . . . . . . . . A.4 A integral indenida . . . . . . . . . . . . . . . . . A.5 O Teorema Fundamental do C alculo . . . . . . . . A.6 A praticidade do Teorema Fundamental do C alculo A.7 O logaritmo . . . . . . . . . . . . . . . . . . . . . . A.8 O Teorema do Valor M edio . . . . . . . . . . . . . A.9 A Regra da Cadeia . . . . . . . . . . . . . . . . . . A.10 Regras do produto e do quociente . . . . . . . . . . A.11 Truques de primitiviza c ao: integra c ao por partes . A.12 Truques de primitiviza c ao: substitui c ao . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
6 B F ormula de Taylor B.1 Introdu c ao . . . . . . . . . . . . . . . B.1.1 Polin omios de grau zero . . . B.1.2 Aproxima c ao da fun c ao nula B.1.3 Aproxima c ao de grau 1 . . . B.2 Polin omio e F ormula de Taylor . . .
SUMARIO 265 265 266 266 267 268
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Parte I
Sistemas Lineares
Cap tulo 1
Exemplos de aplica c oes de sistemas lineares

1.1 Introdu c ao
Um sistema linear e um conjunto de m equa c oes, com n inc ognitas x1 , x2 , . . ., xn , da seguinte forma: a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . am1 x1 + am2 x2 + . . . + amn xn = bm Os n umeros aij s ao os coecientes do sistema linear, e s ao fornecidos no problema. Os bi s s ao chamados de termos independentes. Aqui estudaremos apenas os sistemas lineares que tenham tantas equa c oes quanto inc ognitas, isto e, m = n. Trataremos neste Cap tulo de alguns exemplos onde se aplicam sistemas lineares, no Cap tulo 2 entenderemos um pouco da teoria envolvida (por exemplo, a rela c ao entre o determinante dos coecientes do sistema e a exist encia e unicidade de solu c oes), no Cap tulo 3 falaremos de sua solu c ao pelo M etodo de Escalonamento e no Cap tulo 4, nalmente, exporemos dois m etodos iterativos de resolu c ao dos sistemas lineares (que, infelizmente, s o funcionam em certos casos).
1.2
Provetas
Considere o seguinte problema. Quatro tipos de materiais particulados est ao distribu dos por quatro provetas, e em cada proveta os materiais s ao dispostos em camadas, n ao misturadas, de modo que seja poss vel medir facilmente o volume de cada material em 9
10
CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES
cada uma delas. Dado que possamos medir a massa total de cada proveta, e que saibamos a massa da proveta vazia, queremos calcular a densidade de cada um dos materiais. Para colocar o problema em termos matem aticos, chamemos os materiais de A, B , C e D, e suas densidades respectivas de D D D D A , B , C e D . Essas s ao as inc ognitas do problema, n umeros que queremos desC C C C cobrir. B Entre os dados dispon veis para resolv e-lo B B est ao a massa conjunta dos quatro materiB A A ais em cada uma das provetas (numeradas A A de 1 a 4), que chamaremos de m1 , m2 , m3 1 2 3 4 e m4 , j a descontada a tara das provetas. Al em disso, temos o volume de cada um dos materiais em cada uma das provetas. Chamaremos de v1A , v1B , v1C e v1D o volume dos materiais A, B , C e D na Proveta 1, v2A , v2B , v2C e v2D o volume dos materiais A, B , C e D na Proveta 2, e assim por diante. Como a densidade e a raz ao entre massa e volume, a massa do material A na Proveta 1 e v1A A . Estendendo esse racioc nio para os demais materiais, obtemos que a massa total m1 contida na Proveta 1 e

v1A A + v1B B + v1C C + v1D D . Considerando as quatro provetas, obteremos quatro equa c oes: v1A A + v1B v2A A + v2B v3A A + v3B v4A A + v4B B B B B + v1C + v2C + v3C + v4C C C C C + v1D D + v2D D + v3D D + v4D D = m1 = m2 = m3 = m4
Trata-se de um sistema linear de quatro equa c oes e quatro inc ognitas. Uma poss vel aplica c ao em Geologia seria a seguinte. Uma sonda faz o papel das provetas, e uma coluna de material e retirada, contendo materiais diferentes dispostos em camadas (pode ser at e uma sonda coletando material gelado). A sonda permitiria medir a dimens ao de cada camada, mas n ao poder amos desmanchar a coluna para medir a densidade de cada material isoladamente, sob o risco de alterar a compacta c ao.
1.3
Petr oleo
Outro problema para Ge ologos e ans. Em tr es po cos de petr oleo, situados em regi oes distintas, o material coletado tem diferentes concentra c oes de duas subst ancias A e B .
1.3. PETROLEO
11
Uma central recebe o petr oleo dos tr es po cos, mas antes do reno precisa obter uma mistura com uma concentra c ao escolhida das subst ancias A e B . A pergunta e: em cada litro de petr oleo que ser a gerado para o reno, quanto petr oleo de cada po co se deve colocar? Mais uma vez equacionemos o problema: chamaremos de c1A a concentra c ao de A no petr oleo do Po co 1, c1B a concentra c ao de B no petr oleo do Po co 1, e assim por diante. Essa informa c ao e conhecida previamente. As concentra c oes que queremos obter s ao chamadas de cA e cB . As inc ognitas s ao as quantidades relativas de petr oleo de cada po co que colocaremos na mistura nal, que chamaremos de q1 , q2 e q3 . Elas s ao medidas em litros, e devem ser tais que q1 + q2 + q3 = 1 . Al em disso, a concentra c ao do material A ap os a mistura dos tr es ser a dada por c1A q1 + c2A q2 + c3A q3 . Pensando o mesmo sobre o material B , camos com tr es equa c oes lineares e tr es inc ognitas: c1A q1 + c2A q2 + c3A q3 = cA c1B q1 + c2B q2 + c3B q3 = cB q1 + q2 + q3 = 1 Aqui e importante salientar que o problema n ao teria uma solu c ao satisfat oria para qualquer escolha de cA e cB . Por exemplo, se a concentra c ao cA desejada na mistura for superior ` as concentra c oes de A em cada um dos po cos, n ao h a como obter a mistura satisfatoriamente. Mesmo assim poderia haver uma solu c ao matem atica para a equa c ao, na qual provavelmente uma das inc ognitas q1 , q2 ou q3 teria que ser negativa! Portanto no problema real devemos adicionar a exig encia de que os valores q1 , q2 e q3 encontrados n ao sejam negativos. O conjunto de valores de cA e cB para os quais cB haveria uma solu c ao para esse problema pode (c1A ,c1B ) ser representado da seguinte forma. Queremos um par de concentra c oes (cA , cB ) tal que possiveis (cA ,cB ) existam q1 , q2 e q3 satisfazendo as equa c oes acima. Esse conjunto de possibilidades est a representado no plano cartesiano na gura ao (c3A ,c3B ) lado, e e denominado envolt oria convexa dos (c2A ,c2B ) pontos (c1A , c1B ), (c2A , c2B ) e (c3A , c3B ). Ele e o menor conjunto convexo que cont em os cA pontos citados.
12
1.4
Cores
Um exemplo muito semelhante pode ser obtido trabalhando-se com combina c oes de cores. A maior parte das cores conhecidas podem ser formadas pela combina c ao de tr es cores: vermelho (R), verde (G) e azul (B), as letras correspondendo ` a nomenclatura em ingl es red-green-blue, que chamaremos de cores puras. Isto signica que as cores poB dem ser representadas por tr es n umeros n ao-negativos, cada um indicando a quantidade de cada uma das tr es cores, e esses n umeros s ao geometricamente vistos pela posi c ao que representam no primeiro octante formado G pelos tr es eixos coordenados no R espa co tridimensional. No entanto h a um bocado de informa c ao redundante nessa representa c ao, uma vez que o ponto (1, 1, 1) deve resultar na mesma cor que (3, 3, 3), a u nica diferen ca sendo a quantidade de material produzido.
B
azul (0,0,1)
Se pensarmos que os n umeros xR , xG , xB denotam a quantidade de litros de cada cor pura e sempre quisermos produzir exatamente 1 litro de mistura, ent ao e necess ario que xR + xG + xB = 1 .
(1,0,0)
(0,1,0)
G
vermelho verde
A equa c ao acima restringe o espa co de cores poss veis a ` intersec c ao do plano xR + xG + xB = 1 com o primeiro octante, que e o tri angulo mostrado na gura ao lado.
Cada ponto Q desse tri angulo e obtido como combina c ao convexa de (1, 0, 0), (0, 1, 0) e (0, 0, 1), isto e, Q = (qR , qG , qB ) = qR (1, 0, 0) + qG (0, 1, 0) + qB (0, 0, 1) , com a condi c ao de que qR + qG + qB = 1. Chamaremos de T esse tri angulo. Suponha agora que produzimos quatro cores distintas Q(1) , Q(2) , Q(3) e Q(4) , sendo que (i) (i) (i) Q(i) = (qR , qG , qB )
POLINOMIAL 1.5. INTERPOLAC AO para cada i = 1, 2, 3, 4. Elas s ao representadas por pontos no tri angulo T . O conjunto de todas as combina c oes poss veis dessas quatro cores (formando um litro) e o menor conjunto convexo em T que cont em essas quatro cores, como ilustra a gura ao lado. Se Q e uma tal cor, ent ao Q = x1 Q(1) + x2 Q(2) + x3 Q(3) + x4 Q(4) , com x1 + x2 + x3 + x4 = 1.
R
Q (4)
13
Q (2) Q
(1)
Q (3)
1 1 Por exemplo, suponha que a cor cinza, dada por Q = ( 1 3 , 3 , 3 ), esteja contida nesse menor conjunto convexo, e gostar amos de determinar as quantidades x1 , x2 , x3 e x4 das cores Q(1) , Q(2) , Q(3) e Q(4) que produzam 1 litro da cor cinza Q. Isso nos d a quatro equa c oes lineares nas inc ognitas x1 , x2 , x3 e x4 :
qR x1 (1) qG x1 (1) qB x1 x1
(1)
+ qR x2 (2) + qG x2 (2) + qB x2 + x2
(2)
+ qR x3 (3) + qG x3 (3) + qB x3 + x3
(3)
+ qR x4 (4) + qG x4 (4) + qB x4 + x4
(4)
= 1 3 = 1 3 = 1 3 = 1
1.5
Interpola c ao polinomial
Imagine que queiramos passar um polin omio quadr atico (isto e, uma par abola) pelos pontos (x1 , y1 ), (x2 , y2 ) e (x3 , y3 ), desde que x1 , x2 e x3 sejam todos diferentes entre si.
p(x) y1 x2 x1 y2 x3 y3
Um polin omio quadr atico e escrito, na sua forma geral, como p(x) = ax2 + bx + c . Como neste problema nosso objetivo e determinar o polin omio quadr atico, as inc ognitas s ao os tr es coecientes a, b e c. Para encontrar as inc ognitas dispomos de tr es equa c oes,
14
pois o gr aco do polin omio deve passar pelos tr es pontos dados: p(x1 ) = y1 , p(x2 ) = y2 e p(x3 ) = y3 . Explicitando as equa c oes, camos com ax2 1 + bx1 + c = y1 ax2 2 + bx2 + c = y2 ax2 3 + bx3 + c = y3 e reescrevendo-as evidenciamos o car ater de sistema linear do problema: x2 1 a + x1 b + c = y1 x2 2 a + x2 b + c = y2 x2 3 a + x3 b + c = y3 Nem e preciso dizer que o mesmo tipo de problema se generaliza para um n umero qualquer n de pontos. Sejam os pares (x1 , y1 ), . . . , (xn , yn ), com os xi s distintos dois a dois. Queremos achar um polin omio p(x) cujo gr aco passe pelos pontos dados, isto e: p(x1 ) = y1 , p(x2 ) = y2 , . . . , p(xn ) = yn .
yn y y x1 x2 y2
n-1 1
xn-1
xn
Se procurarmos por um polin omio de grau k teremos k + 1 coecientes a determinar. Como temos que satisfazer n equa c oes, isso sugere que xemos k = n 1. Assim, temos o sistema de n equa c oes, onde os coecientes s ao as n inc ognitas:
n1 a0 + x1 a1 + x2 an1 1 a2 + . . . + x1 n1 a0 + x2 a1 + x2 a + . . . + x an1 2 2 2 . . . . . . . . . . . . . . . 2 n 1 a0 + xn a1 + xn a2 + . . . + xn an1
= y1 = y2 . = . . = yn
Podemos nos perguntar se sempre existe solu c ao para esse sistema, e se ela eu nica. A resposta e sim (desde que os xi s sejam distintos entre si, mas veremos a justicativa mais adiante, na Se c ao 2.7. Exerc cio. Ache o u nico polin omio de grau 3 passando pelos pontos (1, 0), (0, 1), (3, 1) e (4, 0).
DE POLINOMIOS 1.6. OUTROS PROBLEMAS DE DETERMINAC AO
15
1.6
Outros problemas de determina c ao de polin omios
Outro problema de interpola c ao polinomial que pode ser reduzido a um sistema linear ocorre quando s ao impostas condi c oes nas derivadas do polin omio, em determinados pontos. A id eia ca mais clara a partir do seguinte exemplo. Problema: achar um polin omio tal que p(1) = 1, p(3) = 0, p (1) = 0 e p (3) = 0. Isto e, xa-se o valor e a derivada de p em dois pontos, o que d a 4 equa c oes. Com um polin omio de grau 3, ca-se com 4 inc ognitas. Explicitamente, se p(x) = a0 + a1 x + a2 x2 + a3 x3 , ent ao as 4 equa c oes se transformam em a0 a1 a0 + 3a1 a1 a1 + a2 + 9a2 2a2 + 6a2 a3 + 27a3 + 3a3 + 27a3 = = = = 1 0 0 0
Tamb em pode-se impor alguma condi c ao de integral denida para o polin omio. Por 2 exemplo, se p(x) = ax + bx + c e polin omio de grau 2 e sabemos que
2
p(x)dx = 3 ,
1
isso nos d a uma equa c ao linear, pois

2 1
p(x)dx = a =
x2 x3 2 |1 + b |2 + cx|2 1 3 2 1 7 3 a+ b+c. 3 2
1.7
Splines
H a tamb em o problema de spline. Dados pontos (x0 , y0 ), . . . , (xn , yn ) (a numera c ao come ca de zero, desta vez) como na gura abaixo com n = 5, achar uma fun c ao que seja: 1. um polin omio c ubico em cada intervalo [xk1 , xk ], com k = 1, . . . , n; 2. igual aos valores especicados yk nos pontos xk ; 3. duas vezes diferenci avel e com derivada segunda cont nua, inclusive nos pontos extremos dos intervalos (em particular, a fun c ao tamb em deve ser diferenci avel); 4. com derivada zero nos extremos (ou com valores especicados da derivada nos extremos).
16
x0
x1
x2
x3
x4
x5
Os pontos x0 , . . . , xn s ao chamados de n odulos. Nesse problema temos que achar n polin omios c ubicos (um para cada intervalo), e s ao portanto 4n inc ognitas (quatro coecientes de cada polin omio). Ser a que temos 4n equa c oes tamb em? Vejamos. Chamaremos de p1 (x), . . . , pn (x) os polin omios, sendo que o polin omio pk (x) corresponde ao intervalo [xk1 , xk ]. Temos que impor os valores extremos p1 (x0 ) = y0 , pn (xn ) = yn (no desenho, y0 e yn s ao iguais a zero). J a temos duas equa c oes. Al em disso, devemos impor a segunda condi c ao especicada acima, nos demais n odulos (mais 2n2 equa c oes): p1 (x1 ) = y1 e p2 (x1 ) = y1 , . . . , pn1 (xn1 ) = yn1 e pn (xn1 ) = yn1 . At e agora totalizamos 2n equa c oes. Temos ainda que impor as derivadas nos extremos (zero neste caso): p1 (x0 ) = 0 , pn (xn ) = 0 , e tamb em a continuidade da derivada em cada n odulo: p1 (x1 ) = p2 (x1 ) , . . . , pn1 (xn1 ) = pn (xn1 ) , perfazendo mais n + 1 equa c oes. Finalmente, temos que impor tamb em a continuidade da segunda derivada nos n odulos, com mais n 1 equa c oes: p1 (x1 ) = p2 (x1 ) , . . . , pn1 (xn1 ) = pn (xn1 ) . Ao todo s ao 4n equa c oes! poss E vel mostrar que o sistema da resultante sempre tem u nica solu c ao. Exerc cio. Monte o sistema linear relativo ao spline dos pontos da gura, com os seguintes dados:
1.8. PROBLEMAS DE CONTORNO k 0 1 2 3 4 5 xk -3.0 -1.4 0.0 1.5 2.5 4.0 yk 0.0 0.7 2.0 2.5 1.0 0.0
17
Exerc cio. Fa ca um spline c ubico com os pontos (1, 0), (0, 1) e (1, 0), com derivada zero nos extremos.
1.8
Problemas de contorno
O problema do equil brio termost atico (ou tamb em do eletrost atico) e outro exemplo de redu c ao a um sistema linear. Suponha uma situa c ao como a mostrada na gura ao lado, com tr es fontes de calor: 1. O entorno do quadrado, a temperatura Ta ` 2. O quadrado inclinado, ` a temperatura Tb 3. A barra, ` a temperatura Tc A quest ao e: como se distribuir a a temperatura, no equil brio, em fun c ao da posi c ao (x, y )? O mesmo problema pode ser formulado com um potencial eletrost atico V (x, y ), ao inv es da temperatura, se nas regi oes mostradas x assemos valores Va , Vb e Vc . Na verdade, os valores Ta , Tb , Tc nem precisariam ser xos: poderiam variar conforme a posi c ao. Esse problema e modelado pela equa c ao de Laplace 2T 2T + =0, x2 y 2
Tb
Ta
(x,y) T(x,y)
Tc
18
signicando que devemos procurar uma fun c ao cont nua T (x, y ) cujo valor sobre as fontes seja aquele pr e-determinado e tal que fora delas satisfa ca essa equa c ao. Para obter uma solu c ao num erica, discretizamos o plano (x, y ) com uma rede quadrada, como mostra a gura ao lado. Em seguida, numeramos os v ertices da malha cujas temperaturas n ao est ao xadas, em qualquer ordem (por exemplo, adotamos da esquerda para a direita, e de cima para baixo).
Tb
Ta
Tc
Na posi c ao i queremos determinar a temperatura Ti , no equil brio. Se forem N v ertices, ser ao N inc ognitas T1 , T2 , . . . , TN a determinar. A equa c ao de Laplace, quando discretizada, se traduz no fato de que a temperatura de equil brio na posi c ao i tem que ser igual ` a m edia da temperatura nos quatro vizinhos imediatos (na vertical e horizontal). Para cada v ertice, isso se traduzir a numa equa c ao (linear), e a reuni ao de todas essas equa c oes formar a um sistema linear de N equa c oes e N inc ognitas. Vejamos um exemplo, com uma grade de poucos v ertices. O desenho da gura ao lado mostra uma grade 9 8. Chamaremos de N o n umero de linhas (no exemplo, N = 9) e M o n umero de colunas (no exemplo, M = 8). Na grade xamos Ta nas posi c oes (4, 4), (5, 3), (5, 4), (5, 5) e (6, 4) (embora a posi c ao interna (5, 4) n ao v a servir para nada), e Tb nas posi c oes (1, s) e (9, s), para s = 1, . . . , 8, e (r, 1), (r, 8), para r = 1, . . . , 9. Veja que estamos usando r para indexar as linhas e s para indexar as colunas.
s
1

2

3

4

5

6

7
E
2

DE
Tb
B C B C B C @ A @ A
3

4
!
@ A
Ta
? ! > >? ! > > " # < = < " # < = < " # < = <
5 6
$ % $ %
: ;
: ;
7
$ % '
: ;
8
&' & )
89
+ . . 0 0 2 2 4 4 6 6
9
() (
*+ -
, -
, /. /. 10 10 32 32 54 54 6 76
* -
, -
, / / 1 1 3 3 5 5 7
A discretiza c ao da equa c ao de Laplace signica que, nos v ertices em que a temperatura n ao foi xada, o valor da temperatura ser a dado pela m edia dos valores dos quatro
1.8. PROBLEMAS DE CONTORNO
19
v ertices mais pr oximos. Numeraremos esses v ertices da seguinte forma: da esquerda para a direita e de cima para baixo (como na leitura de um texto em portugu es), e para o v ertice i queremos saber a temperatura de equil brio Ti . Assim, para o primeiro v ertice, teremos 1 T1 = (Tb + Tb + T2 + T7 ) , 4 pois o vizinho de cima e o vizinho ` a esquerda t em valor xo Tb e os vizinhos ` a direita e embaixo s ao as inc ognitas T2 e T7 . Rearranjando a equa c ao temos 4T1 T2 T7 = 2Tb . Na gura, vemos que h a 37 v ertices livres, portanto 37 inc ognitas T1 , T2 , . . . , T37 a serem determinadas. Por em cada v ertice livre produz uma equa c ao, donde resulta um sistema linear com 37 equa c oes e 37 inc ognitas.
20
Cap tulo 2
Entendendo os sistemas lineares

2.1 Sistemas lineares e interse c oes de hiperplanos
Pode-se melhorar bastante a compreens ao dos sistemas lineares se os interpretarmos sob o ponto de vista geom etrico. Considere o sistema 5x + 2y = 3 , x + y = 1
em que procuramos x e y que simultaneamente satisfa cam as equa c oes dadas. Podemos olhar para uma equa c ao de cada vez, examinando o conjunto dos pares (x, y ) que satisfazem a primeira e depois o conjunto dos (x, y ) que satisfazem a segunda. O que estamos procurando e a intersec c ao desses dois conjuntos, isto e, os pontos do plano que satisfazem as duas equa c oes ao mesmo tempo. A equa c ao 5x + 2y = 3 determina uma reta. Observe que essa reta e 3 o gr aco da fun c ao y (x) = 2 5 x 2 , 5 que tem inclina c ao 2 e cruza o eixo das ordenadas em 3 2 . A outra equa c ao determina outra reta, gr aco da fun c ao y (x) = 1 + x, que tem inclina c ao 1 e cruza a ordenada em 1. 21
3 2
5x+2y=3
22
CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES
y=1+x
3 2 1
5x+2y=3
Na gura ao lado desenhamos as duas retas, e constatamos que elas devem se cruzar num u nico ponto. Esse ponto, por estar simultaneamente nas duas retas, satisfaz as duas equa c oes. Portanto ele e a solu c ao procurada do sistema linear.
Por essa interpreta c ao entende-se porque alguns sistemas podem n ao ter solu c ao. Isso acontece se as retas forem paralelas mas n ao coincidentes, como no sistema abaixo: 2x + 2y = 0 . x + y = 1
y=1+x y=x
1
As retas s ao os gr acos das fun c oes y = 1 + x e y = x, como mostra a gura ao lado. Outra coisa que pode acontecer e a exist encia de uma innidade de solu c oes. Basta que as duas equa c oes determinem a mesma reta, como neste exemplo: 2x + 2y = 2 . x + y = 1 Nem sempre a equa c ao de uma reta determina o gr aco de uma fun c ao y (x). Esse ser a sempre o caso quando o coeciente que multiplica y for igual a zero. Por exemplo, a equa c ao 2x = 3 representa uma reta vertical, pois e o conjunto de todos os (x, y ) tais que x = 3 2.
x= 3 ou 2x=3 2
3/2
E no caso de 3 equa c oes a 3 inc ognitas? Bom, nesse caso cada uma das equa c oes determina um plano, e as solu c oes s ao todos os pontos de intersec c ao dos tr es planos. Como no caso de 2 inc ognitas, pode haver uma solu c ao, nenhuma ou uma innidade delas. Num sistema de n equa c oes a n inc ognitas devemos imaginar que cada equa c ao determina um hiperplano de dimens ao n 1 no espa co de dimens ao n. Infelizmente n ao podemos visualizar nada disso, mas isso n ao nos impede de teorizar sobre o assunto.
2.2. TRANSFORMAC OES LINEARES
23
2.2
Transforma c oes lineares
Outra maneira bastante importante de se entender os sistemas lineares e atrav es do conceito de transforma c oes lineares, e dele nos ocuparemos at e o nal do Cap tulo. Tomemos novamente o exemplo 5x + 2y = 3 . x + y = 1 Essa equa c ao pode ser escrita na nota c ao matricial 5 2 1 1 x y = 3 1 .
Para compactar ainda mais a nota c ao, chamaremos de A a matriz, u o vetor (matriz coluna) de coordenadas x e y e b o vetor (matriz coluna) de coordenadas 3 e 1, e escreveremos Au = b . Essa forma de escrever sugere que pensemos A como uma fun c ao (ou transforma c ao, ou ainda aplica c ao) que toma um vetor qualquer u e transforma num outro vetor Au. 1 , ent ao Por exemplo, se u = 2 Au = como mostra a gura abaixo. 5 2 1 1 1 2 = 1 4 ,
u=(1,2)
Au=(1,4)
Num sistema linear o que temos e o problema inverso: dado o vetor b (a coluna de x termos independentes ` a direita), qual e o vetor u = tal que Au = b? y f E acil ver que essa id eia funciona da mesma forma em dimens oes mais altas. Se o sistema linear tem n equa c oes e n inc ognitas ent ao os coecientes formam uma matriz A
24
que pode ser usada como uma aplica c ao (ou transforma c ao, ou fun c ao) levando vetorescoluna x1 . u= . . xn em vetores Au. Apesar de n ao ser nossa preocupa c ao aqui, na verdade nem e preciso que o n umero de inc ognitas iguale o n umero de equa c oes para termos esse tipo de interpreta c ao. Pois o sistema linear a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . am1 x1 + am2 x2 + . . . + amn xn = bm que tem m equa c oes e n inc ognitas, pode ser escrito na forma matricial a11 . . . a1n x1 b1 . . . . .. . . . . . . . = . . . am1 . . . amn xn bm Agora a matriz dos coecientes, que tem m linhas e n colunas, leva, por multiplica c ao, vetores-coluna de tamanho n em vetores-coluna de tamanho n (ou seja, e uma aplica c ao n m de R em R ).
2.3
Nota c ao e interpreta c ao
Vale a pena neste ponto fazermos alguns coment arios a respeito da nota c ao, o que evitar a confus oes mais tarde. Como vimos, a matriz A dos coecientes, que e n n, pode ser vista tamb em como uma aplica c ao, mas n ao faremos distin c ao na nota c ao. Como matriz, A multiplica um vetor-coluna de tamanho n e o resultado e um outro vetor-coluna de tamanho n. Em nota c ao compacta temos Au = b. Como aplica c ao, A toma um vetor u de Rn e transforma em outro vetor b de Rn . A rigor dever amos escrever A(u) = b, mas n ao o faremos. Por raz oes de praticidade (e tamb em est eticas, por que n ao?) usaremos os par enteses somente quando for preciso deixar claro que A se aplica a toda uma express ao, por exemplo, A(u + v ), ao inv es de Au + v , que poderia dar a impress ao de que aplicamos A em u e depois somamos v , quando na verdade primeiro somamos u com v e depois aplicamos A. Portanto n ao faremos distin c ao clara entre a matriz A e a aplica c ao A, pois usaremos a mesma nota c ao nos dois casos. Para abusar mais um pouquinho, escreveremos muitas
DE MATRIZES 2.4. INVERSAO
25
vezes os vetores como n-upla, ao inv es de vetores-coluna, com as coordenadas separadas por v rgulas, como por exemplo na frase tome u = (x1 , . . . , xn ) e b = Au..., cando claro que se quisermos calcular b devemos dispor o vetor u em coluna e multiplicar por A, ` a esquerda.
2.4
Invers ao de matrizes
Antes de prosseguir, observamos que a nota c ao matricial nos propicia relacionar conceitos aparentemente distantes. Por exemplo, o problema de inverter uma matriz quadrada A de tamanho n e equivalente a resolver n sistemas lineares. A inversa de A e denida como a matriz U tal que AU = Id, onde Id e a matriz identidade, que tem 1 ao longo da diagonal principal e 0 no restante. A propriedade fundamental da matriz identidade e que Id A = A e A Id = A, funcionando de forma an aloga ao n umero 1 na multiplica c ao usual entre n umeros reais. A diferen ca principal entre a multiplica c ao de n umeros reais e a multiplica c ao de matrizes e que a segunda n ao e comutativa: h a (muitos) exemplos onde A U n ao e igual a U A (tente vericar com matrizes 2 por 2, escolhidas ao acaso). Suponha que tenhamos A = {aij }nn e queiramos achar U = {uij }nn tal que A U = Id. Explicitamente, queremos resolver a11 a12 . . . a1n u11 u12 . . . u1n 1 0 ... 0 a21 a22 . . . a2n u21 u22 . . . u2n 1 ... 0 0 . . . = . . . . . . . . . . ... ... ... ... . . ... . ... . . . 0 0 ... 1 an1 an2 . . . ann un1 un2 . . . unn f E acil ver que temos a n equa c oes do tipo Au = b, onde u e b s ao colunas de U e Id na mesma posi ca o. Por exemplo, para essa equa c ao ser satisfeita deve valer a11 a12 . . . a1n u11 1 a21 a22 . . . a2n u12 0 . . = . , . .. . . . . ... . . . . . an1 an2 . . . ann que corresponde ` a primeira coluna. un1 0
2.5
Explorando a linearidade
A propriedade mais importante da fun c ao que leva vetores u em Au e a linearidade. A linearidade signica que, para quaisquer vetores u1 e u2 tem-se A(u1 + u2 ) = Au1 + Au2 ,
26
e que, para qualquer vetor u e qualquer n umero real , A(u) = Au . Observe que isso e equivalente a dizer que para quaisquer vetores u1 e u2 e n umeros e vale A(u1 + u2 ) = Au1 + Au2 . Fica como exerc cio para o leitor demonstrar a linearidade (em dimens ao 2), supondo que A= a b c d
e uma matriz da forma mais geral poss vel! N ao e dif cil, tente!, e depois procure mostrar no caso geral, para matrizes n n. Para entendermos o signicado geom etrico da linearidade, vejamos primeiro o que e a soma de vetores e sua multiplica c ao por um n umero (comumente chamado de escalar). A multiplica c ao de um vetor (x, y ) por um escalar e o vetor (x, y ), isto e, cada coordenada e multiplicada por . Isto signica que os dois vetores s ao colineares, mas o tamanho do novo vetor e || vezes o tamanho do vetor original. Al em disso, se for um n umero negativo, o sentido do novo vetor ser a oposto ao do vetor original (ver gura abaixo). Dizer ent ao que A(u) = Au signica dizer: tomar a imagem de um vetor u multiplicado por e o mesmo que tomar a imagem de u e depois multiplicar por . Isto mostra que, se conhecermos Au ent ao saberemos quem e A(u) para qualquer !! A soma de dois vetores e vista geometricamente pela Lei dos Paralelogramos. Se u1 = (x1 , y1 ) e u2 = (x2 , y2 ) ent ao u1 + u2 = (x1 + x2 , y1 + y2 ) , como mostrado na gura abaixo.
u ( > 1 )
u1+ u2 y 2
u y 1
u ( < 0)
x1
x2
2.5. EXPLORANDO A LINEARIDADE
27
Dizer que A(u1 + u2 ) = Au1 + Au2 signica: obter a soma por meio da Lei do Paralelogramo e depois aplicar a transforma c ao A e o mesmo que aplicar a transforma c ao a cada um dos vetores e depois somar pela Lei do Paralelogramo. Vejamos a principal conseq u encia da linearidade. Para isso, chamemos a aten c ao para dois vetores especiais do plano: e1 = (1, 0) e e2 = (0, 1). Eles s ao chamados de vetores can onicos. Sua import ancia reside no fato de que se u = (x, y ) e um vetor qualquer ent ao u = (x, y ) = (x, 0) + (0, y ) = x(1, 0) + y (0, 1) = xe1 + ye2 . Dizemos que u e uma combina c ao linear de e1 e e2 (isto e, a soma de dois vetores, um colinear a e1 e o outro colinear a e2 ). Usando a linearidade, temos ent ao Au = A(xe1 + ye2 ) = xAe1 + yAe2 . Isto signica que se soubermos Ae1 e Ae2 ent ao saberemos automaticamente Au, para qualquer vetor u!! Em outras palavras, a a c ao da aplica c ao linear A ca completamente determinada pelo seu resultado em e1 e e2 ! Por exemplo, na gura abaixo mostramos como calcular Au, se u = (1.5, 2), se Ae1 e Ae2 forem como ilustrado.
Au Ae1 Ae2
e2 e1
1.5
Isso sugere que o sistema de coordenadas cartesiano original e transferido para um outro sistema de coordenadas, medido a partir de combina c oes lineares de Ae1 e Ae2 . Fica refor cado assim o car ater geom etrico dos sistemas lineares. Pois se dermos b no lado direito do desenho, temos um m etodo para achar u tal que Au = b (vide gura abaixo). Basta medir as coordenadas de b no sistema de coordenadas das combina c oes de Ae1 e Ae2 , e depois procurar no sistema cartesiano tradicional, ` a esquerda, o vetor que tem essas coordenadas!
28
e2 u e1 Ae2 b b=Au
Ae1
Vale aqui uma observa c ao bastante pertinente: os vetores Ae1 e Ae2 s ao as colunas f da matriz A. E acil ver a raz ao: Ae1 = a b c d 1 0 = a c , Ae2 = a b c d 0 1 = b d .
Tudo ocorre de forma semelhante em dimens ao qualquer n. A soma de vetores tamb em e obtida pela soma das coordenadas dos vetores. Tamb em como em dimens ao 2, a aplica c ao que leva vetores u em vetores Au e linear. Os vetores can onicos s ao e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . ., en = (0, 0, . . . , 0, 1). Qualquer vetor pode ser escrito como combina c ao linear dos vetores can onicos, pois u = (x1 , x2 , . . . , xn ) = x1 e1 + x2 e2 + . . . + xn en . Isto implica que saber Ae1 , . . . , Aen permite calcular automaticamente qualquer Au.
2.6
Exist encia e unicidade de solu c oes

Ae2=(4,6)
Voltando a pensar em dimens ao 2, observe que esse esquema geom etrico para achar u tal que Au = b caria prejudicado se por alguma raz ao Ae1 e Ae2 fossem vetores colineares. Isso aconteceria se os vetorescoluna da matriz A fossem colineares, como por exemplo na matriz 2 4 . 3 6 Neste caso, teremos Ae1 e Ae2 como na gura ao lado.
Ae1=(2,3)
2.6. EXISTENCIA E UNICIDADE DE SOLUC OES
29
O desastre ocorre se tivermos um vetor b que n ao seja colinear a eles e quisermos achar u tal que Au = b. E f acil ver porque n ao vai existir esse vetor: todo vetor u = (x, y ) se escreve como combina c ao linear u = xe1 + ye2 , logo Au = xAe1 + yAe2 . S o que se Ae1 e Ae2 forem colineares ent ao Au tamb em ser a colinear a eles. Em resumo, para qualquer escolha de u, o vetor imagem Au estar a sempre sobre a mesma reta, na mesma dire c ao de Ae1 e Ae2 (a aplica c ao A leva todo o R2 sobre uma reta, uma aplica c ao longe de ser injetiva!). Portanto e imposs vel que exista Au = b se b n ao for colinear com esses dois vetores! o caso em Esse tipo de problema ocorre justamente nos sistemas indeterminados. E que o sistema n ao tem solu c ao. Por outro lado, se b for colinear a Ae1 e Ae2 ent ao haver a innitas solu c oes, isto e, innitas escolhas de u tais que Au = b. Para mostrar isso, escrevemos Ae2 = Ae1 (j a que eles s ao colineares, e supondo que Ae1 seja n aonulo), e Au = xAe1 + yAe2 = xAe1 + yAe1 = (x + y )Ae1 . Ao mesmo tempo, com a hip otese de que b seja colinear a Ae1 temos b = Ae1 . Ent ao Au = b desde que x + y = , o que determina uma reta de possibilidades de x e y . Pensando em geral, em dimens ao n, o problema de se achar u tal que Au = b ter a solu c ao garantida sempre que possamos achar n umeros x1 , . . . , xn tais que b = x1 Ae1 + . . . + xn Aen , isto e, sempre que {Ae1 , . . . , Aen } formar uma base, pois ent ao pela linearidade, b = A(x1 e1 + . . . + xn en ) = Au , se chamarmos u = (x1 , . . . , xn ). Pode-se demonstrar que {Ae1 , . . . , Aen } n ao forma uma base se e somente se um dos vetores Aei for combina c ao linear dos demais. Sempre que {Ae1 , . . . , Aen } (lembre-se, s ao as colunas da matriz A) n ao formar uma base, teremos duas situa c oes poss veis para a equa c ao Au = b, dependendo de b: se b n ao for combina c ao linear de {Ae1 , . . . , Aen } ent ao a equa c ao n ao ter a solu c ao; e se b for combina c ao linear de {Ae1 , . . . , Aen } ent ao haver a uma innidade de solu c oes da equa c ao (tente mostrar isso!). J a se {Ae1 , . . . , Aen } formar uma base ent ao b se escreve de forma u nica como b = x1 Ae1 + . . . + xn Aen , implicando que existe uma u nica solu c ao para Au = b, a saber u = (x1 , . . . , xn ).
30
2.7
Injetividade, sobrejetividade... glup!
Valem aqui alguns coment arios complementares sobre a discuss ao te orica que estamos levando. Acabamos de ver que a matriz de coecientes A nos deixa duas op c oes: 1) para todo b, Au = b tem solu c ao (portanto a aplica c ao A e sobrejetiva) e essa solu c ao eu nica (donde Au = Av implica u = v , isto e, a aplica c ao A e tamb em injetiva); 2) existe b tal que Au = b n ao tem solu c ao (logo A n ao e sobrejetiva) e existe b tal que Au = b tem v arias solu c oes (logo A n ao e injetiva). Ou seja, das duas uma: ou A e bijetiva ou n ao e nem sobrejetiva nem injetiva. Uma caracter stica t pica de uma aplica c ao linear A e que se A n ao for injetiva ent ao h a um vetor w n ao-nulo (de fato, uma innidade deles) tal que Aw = 0. Pois se A n ao e injetiva ent ao existem u e v , com u = v , tais que Au = Av . Logo Au Av = 0, e pela linearidade A(u v ) = 0 . Chame w = u v . Esse vetor e n ao-nulo porque u = v , e assim demonstramos nossa armativa. Para ilustrar, apliquemos essas id eias ao problema de interpola c ao polinomial da Se c ao 1.5. L a quer amos passar o gr aco de um polin omio p(x) de grau n 1 por n pontos xados (com abscissas distintas). Isto e, dados (x1 , y1 ), . . . , (xn , yn ) quer amos n 1 achar p(x) = a0 + a1 x + . . . + an1 x tal que p(x1 ) = y1 , . . . , p(xn ) = yn , e isso nos levou imediatamente a um sistema linear onde as inc ognitas s ao os n coecientes do polin omio: n1 1 x1 x2 a0 y1 1 . . . x1 1 x2 x2 . . . xn1 a1 y2 2 2 . . = . . . . . . . . . . . . . . . . . . . .
n1 1 xn x2 n . . . xn
an1
yn
Queremos mostrar que essa equa c ao sempre tem solu c ao e essa solu c ao e u nica. Como vimos acima, isso acontece se e somente se a matriz A dos coecientes for uma aplica c ao injetiva. Suponha por contradi c ao que essa matriz A n ao fosse injetiva. Ent ao existiria um conjunto de coecientes w = (a0 , a1 , . . . , an1 ) n ao-nulo (isto e, pelo menos um dos coecientes diferente de zero) tal que Aw = 0. Ou seja, ter amos um polin omio q (x) de grau n 1 (no m aximo), n ao-nulo, tal que q (x1 ) = 0, . . . , q (xn ) = 0, isto e, com n ra zes distintas. Mas polin omios n ao-nulos de grau n 1 t em no m aximo n 1 ra zes (prove usando seus conhecimentos de c alculo!), portanto chegamos a uma contradi c ao, o que mostra que A obrigatoriamente tem que ser injetiva!
2.8. O DETERMINANTE
31
2.8
O determinante
O determinante da matriz A dos coecientes de um sistema linear serve como instrumento para saber se {Ae1 , . . . , Aen } e uma base, indicando se o sistema tem ou n ao u nica solu c ao. De fato, esta Se c ao tem a pretens ao de convencer o leitor de que det A = 0 se e somente se {Ae1 , . . . , Aen } e uma base. A id eia e explicar o que e o determinante de uma forma intuitiva e geom etrica, mas o leitor pode encontrar abordagens diferentes em outros livros. preciso salientar que o determinante ser E a inicialmente denido para um conjunto de n vetores (em Rn ) e depois deniremos det A = det(Ae1 , . . . , Aen ) . Come caremos a discuss ao em dimens ao 2, e depois comentaremos sua generaliza c ao para dimens ao qualquer.
2.8.1
Dimens ao 2
O determinante d a, de certa forma, uma medida do quanto dois vetores est ao perto de ser colineares. Deniremos o determinante de um par ordenado de vetores (u1 , u2 ), denotando-o por det(u1 , u2 ) , como sendo a area do paralelogramo determinado por esses dois vetores, com um sinal. Sendo assim, dois vetores ser ao colineares entre si se e somente se seu determinante for nulo. O determinante de uma matriz A 2 2 e denido como sendo o determinante do par (Ae1 , Ae2 ): det A det(Ae1 , Ae2 ) . Desse modo, ca evidente que o determinante de A e diferente de zero se e somente se o sistema Au = b admitir u nica solu c ao (n ao importando quais sejam os termos independentes, isto e, o vetor b da equa c ao). Lembrando tamb em que Ae1 e Ae2 s ao as colunas da matriz A, segue que det A = 0 se e somente se suas colunas forem colineares. Para que a deni c ao que completa, precisamos estabelecer melhor o que e o paralelogramo determinado pelos dois vetores e denir de maneira inequ voca o sinal do determinante. Al em disso, precisamos saber calcular o determinante, e o leitor ver a que a deni c ao dada aqui coincide com aquela que ele provavelmente j a conhece. Chamaremos de P (u1 , u2 ) o paralelogramo determinado por u1 e u2 . Ele e denido como sendo o conjunto P (u1 , u2 ) = {su1 + tu2 ; 0 s 1 , 0 t 1} .
32
Isso porque, se 0 s, su1 e um vetor com o mesmo sentido que u1 , e se s 1, su1 e um vetor de tamanho menor ou igual ao tamanho de u1 . O mesmo ocorre com tu2 , para 0 t 1. O paralelogramo e constitu do ent ao de todas as somas de vetores desse tipo. O sinal de det(u1 , u2 ) e denido assim, se u1 e u2 n ao s ao colineares: se (u1 , u2 ) pode ser suavemente alterado at e que coincida com o par de vetores can onicos (e1 , e2 ) (na ordem correspondente, isto e, u1 e alterado at e coincidir com e1 , e u2 com e2 ), de forma que os vetores nunca se tornem colineares ao longo do processo, ent ao o sinal e positivo. Caso contr ario e negativo. Veja dois exemplos com sinais diferentes na gura abaixo. O da esquerda e o positivo.
u2 u1 u1
u2
Da resulta que det(e1 , e2 ) = +1 (sinal positivo e area igual a 1) e que det(e2 , e1 ) = 1. Al em disso, mais geralmente, det(u1 , u2 ) = det(u2 , u1 ), ou seja, se trocarmos a ordem dos vetores ent ao o sinal do determinante ser a trocado. Uma propriedade importante do determinante e a linearidade com respeito a cada um dos vetores. Ou seja, precisamos mostrar que det(u, v ) = det(u, v ) e que det(u1 + u2 , v ) = det(u1 , v ) + det(u2 , v ) . Observe que se isso for verdade, ent ao enunciados semelhantes s ao v alidos para o segundo vetor do par. Por exemplo, det(u, v ) = det(v, u) = det(v, u) = det(u, v ) . Para mostrar as duas propriedades de linearidade recorremos a princ pios geom etricos. Veja nas guras abaixo o que acontece em cada caso. No segundo caso, o princ pio de Cavalieri garante que a area de P (u1 , v ) mais a area de P (u2 , v ) e igual ` a area de P (u1 + u2 , v ) (aten c ao, a gura e no plano, n ao se trata de desenho em perspectiva!).
2.8. O DETERMINANTE
33
P(u1+ u ,v) 2 v
u
v u P( u,v) P(u1 ,v) u1 u1+ u2 u2 P(u2 ,v)
P(u,v)
Esse argumento convence facilmente no caso em que det(u1 , v ) e det(u2 , v ) tenham o mesmo sinal. Se esse n ao for o caso, ent ao sugere-se provar que det(u1 , v ) = det((u1 + u2 ) + (u2 ), v ) = det(u1 + u2 , v ) + det(u2 , v ) , pois e f acil ver que det(u2 , v ) = det(u2 , v ). Com essas propriedades todas garantimos o c alculo de qualquer determinante. Para ver isso, escrevemos u1 = (x1 , y1 ), u2 = (x2 , y2 ), mas lembramos a outra forma de escrever esses vetores, como combina c ao linear de e1 e e2 : u1 = x1 e1 + y1 e2 e u2 = x2 e1 + y2 e2 . Ent ao det(u1 , u2 ) = det(x1 e1 + y1 e2 , x2 e1 + y2 e2 ) = x1 det(e1 , x2 e1 + y2 e2 ) + y1 det(e2 , x2 e1 + y2 e2 ) , aplicando a linearidade no primeiro vetor do par. Aplicando novamente a linearidade no segundo vetor do par, temos det(u1 , u2 ) = x1 (x2 det(e1 , e1 ) + y2 det(e1 , e2 )) + y1 (x2 det(e2 , e1 ) + y2 det(e2 , e2 )) . Como det(e1 , e1 ) = det(e2 , e2 ) = 0, det(e1 , e2 ) = +1 e det(e2 , e1 ) = 1, ent ao det(u1 , u2 ) = x1 y2 x2 y1 . Numa matriz a b c d os vetores coluna s ao u1 = (a, c) e u2 = (b, d), de forma que det A = ad bc . Bom, essa e a f ormula usual do determinante que aprendemos desde o Col egio!! Vale a pena lembrar as propriedades essenciais do determinante que permitem calcul a-lo para qualquer par de vetores:
34
CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES 1. det(e1 , e2 ) = 1 (normaliza c ao); 2. det(u, v ) = det(v, u) (altern ancia); 3. det(u + v, w) = det(u, w) + det(v, w) (linearidade).
2.8.2
Dimens ao 3
Em dimens ao 3, podemos denir o paralelep pedo P (u1 , u2 , u3 ), onde u1 , u2 , u3 s ao vetores de R3 como o conjunto P (u1 , u2 , u3 ) = {ru1 + su2 + tu3 ; 0 r, s, t 1} (n ao e dif cil ver o que seria um paralelep pedo em dimens ao mais alta, generalizando essa deni c ao). O determinante det(u1 , u2 , u3 ) ser a o volume desse paralelep pedo, com um sinal que devemos convencionar. De qualquer forma, um determinante nulo corresponde a um conjunto de tr es vetores em que um deles e combina c ao linear dos outros, pois da n ao resulta um paralelep pedo com volume. O sinal do determinante e convencionado de maneira an aloga ao que zemos em dimens ao 2. Se {u1 , u2 , u3 } e uma base (ou seja, nenhum e combina c ao linear dos outros), o sinal de det(u1 , u2 , u3 ) ser a positivo se a trinca ordenada (u1 , u2 , u3 ) puder ser suavemente deformada at e (e1 , e2 , e3 ) sem que nunca deixe de formar uma base. Essa deni c ao e pouco pr atica: como calcular det A = det(Ae1 , Ae2 , Ae3 )? Mais uma vez, e conveniente demonstrar as propriedades b asicas do determinante e us a-las para os c alculos. As propriedades b asicas s ao (tente se convencer voc e mesmo por que elas valem): 1. det(e1 , e2 , e3 ) = +1; 2. det(u1 , u2 , u3 ) = det(u3 , u1 , u2 ) = det(u2 , u3 , u1 ) = det(u3 , u2 , u1 ) = det(u1 , u3 , u2 ) = det(u2 , u1 , u3 ); 3. det(u + v, u2 , u3 ) = det(u, u2 , u3 ) + det(v, u2 , u3 ) . Na segunda propriedade, note que qualquer troca entre vetores muda o sinal do determinante. A troca pode ocorrer com qualquer par de posi c oes: primeira com segunda, segunda com terceira e primeira com terceira. Isso implica em particular que sempre que houver vetores repetidos na trinca ent ao o determinante e nulo, pois, por exemplo, det(u, u, v ) = det(u, u, v ) , logo det(u, u, v ) = 0.
2.8. O DETERMINANTE Podemos usar essas regras para calcular o determinante da matriz 3 3 a11 a12 a13 A = a21 a22 a23 , a31 a32 a33
35
que e o determinante de seus vetores-coluna, na ordem em que se apresentam. Temos, pela linearidade (propriedade 3), det A = det ((a11 , a21 , a31 ), (a12 , a22 , a32 ), (a13 , a23 , a33 )) = det(a11 e1 + a21 e2 + a31 e3 , a12 e1 + a22 e2 + a32 e3 , a13 e1 + a23 e2 + a33 e3 ) = a11 a12 a13 det(e1 , e1 , e1 ) + . . . + a31 a32 a33 det(e3 , e3 , e3 ) . Dos 27 termos s ao n ao nulos apenas os determinantes det(ei , ej , ek ) tais que i, j, k s ao todos distintos. Logo det A = a11 a22 a33 det(e1 , e2 , e3 ) + a11 a32 a23 det(e1 , e3 , e2 ) +a21 a12 a33 det(e2 , e1 , e3 ) + a21 a32 a13 det(e2 , e3 , e1 ) +a31 a12 a23 det(e3 , e1 , e2 ) + a31 a22 a13 det e3 , e2 , e1 . Todos os determinantes restantes s ao iguais a +1 ou 1. J a sabemos que det(e1 , e2 , e3 ) = +1, logo det(e1 , e3 , e2 ) = 1. Isso implica det(e3 , e1 , e2 ) = +1 e det(e3 , e2 , e1 ) = 1. Que por sua vez implica det(e2 , e3 , e1 ) = +1 e det(e2 , e1 , e3 ) = 1. Ent ao det A = a11 (a22 a33 a32 a23 ) + a21 (a32 a13 a12 a33 ) + a31 (a12 a23 a22 a13 ) . Esse e o conhecido determinante de uma matriz 3 3!!
2.8.3
Dimens ao n
Em dimens ao n existe o conceito de volume - comumente conhecido como hipervolume. No entanto, vimos que as propriedades de normaliza c ao, altern ancia e linearidade bastam para denir inequivocamente o valor do determinante de uma n-upla de vetores. Assim, denimos det(u1 , . . . , un ) atrav es de suas propriedades: 1. Normaliza c ao: det(e1 , . . . , en ) = 1; 2. Altern ancia: para todo par i, j entre 1 e n, vale det(u1 , . . . , ui , . . . , uj , . . . , un ) = det(u1 , . . . , uj , . . . , ui , . . . , un ) 3. Linearidade: det(u + v, u2 , . . . , un ) = det(u, u2 , . . . , un ) + det(v, u2 , . . . , un ).
36
Decorre dessas regras que o determinante de uma matriz A = {aij }nn e det A =
(i1 ,...,in )
ai1 1 ai2 2 . . . ain n det(ei1 , ei2 , . . . , ein ) .
J a det(ei1 , ei2 , . . . , ein ) e: nulo, se ocorre algum n umero repetido na lista (i1 , . . . , in ); +1, se (i1 , . . . , in ) pode ser levado em (1, 2, . . . , n) por um n umero par de trocas de posi c oes; e 1 se ((i1 , . . . , in ) pode ser levado em (1, 2, . . . , n) por um n umero mpar de trocas de posi c oes ( e necess ario observar que se (i1 , . . . , in ) pode ser levado em (1, . . . , n) por um n umero par de trocas de posi c oes ent ao n ao h a como fazer o mesmo com um n umero mpar, e vice-versa). Sem falarmos em hipervolume, vericamos tamb em das tr es propriedades que se um dos vetores for combina c ao linear dos demais ent ao o determinante e nulo. Isso porque det(2 u2 + . . . + n un , u2 , . . . , un ) = = 2 det(u2 , u2 , . . . , un ) + . . . + n det(un , u2 , . . . , un ) = 0 , pois vetores repetidos levam a determinante nulo, por causa da regra de altern ancia. A implica c ao contr aria n ao e t ao obvia, a partir das tr es propriedades: mostrar que se o determinante e nulo ent ao um dos vetores e combina c ao linear dos outros. Provaremos a arma c ao equivalente: se os vetores u1 , . . . , un formam uma base ent ao det(u1 , . . . , un ) e n ao-nulo. Primeiro relacionamos det(u1 , . . . , un ) com o determinante de uma matriz, denimos A como sendo a matriz tal que Ae1 = u1 , . . . , Aen = un , isto e, tal que suas colunas sejam os vetores u1 , . . . , un . Ent ao det A = det(u1 , . . . , un ). O que queremos mostrar e que det A = 0 e a hip otese que temos e que os vetores Ae1 , . . . , Aen formam uma base. Pela observa c ao acima, basta provarmos que A tem uma inversa. Em seguida, observamos que A tem uma inversa. Para entender por que, basta ver que para todo b Rn e poss vel encontrar u Rn tal que Au = b (j a vimos que para aplica c oes lineares a sobrejetividade implica automaticamente na bijetividade). Ora, como {Ae1 , . . . , Aen } e base ent ao existem n umeros x1 , . . . , xn tais que b = x1 Ae1 + . . . + xn Aen . Logo b = A(x1 e1 + . . . + xn en ) , e encontramos u = (x1 , . . . , xn ). A inversa de A e denotada por A1 , portanto u = A1 b. Na Se c ao3.3 vamos mostrar que se A tem inversa ent ao det A = 0, o que completa a demonstra c ao. Para isso, usaremos o pr oprio m etodo de resolu c ao dos sistemas lineares, o M etodo de Escalonamento, do qual iremos falar no pr oximo Cap tulo.
2.9. QUADRO COMPARATIVO
37
No entanto, podemos seguir outro argumento, baseado na seguinte f ormula: se A e B s ao matrizes quadradas de tamanho n ent ao det(AB ) = det A det B . Esta f ormula pode ser deduzida das propriedades do determinante, mas n ao o faremos aqui. Ao inv es disso, daremos uma intui c ao geom etrica de sua veracidade, logo abaixo. A aplica c ao da f ormula se faz assim: como A tem inversa A1 , escrevemos AA1 = Id. Isto porque se aplicarmos A1 a um vetor e depois aplicarmos A voltaremos ao vetor original. Ou seja, AA1 u = u para qualquer u e AA1 s o pode ser a identidade. Pela f ormula do determinante, temos det(AA1 ) = det A det A1 = det Id = 1 , portanto det A n ao pode ser nulo. J a para entender a intui c ao geom etrica da f ormula det(AB ) = det(A) det(B ), de forma n ao rigorosa, lembremos que det A representa o volume com sinal de P (Ae1 , . . . , Aen ) (o leitor pode pensar em dimens ao 3). O paralelep pedo P (Ae1 , . . . , Aen ) e a imagem pela transforma c ao A do paralelep pedo P (e1 , . . . , en ), de volume unit ario. Da linearidade decorre que todo paralelep pedo formado por m ultiplos dos vetores can onicos, quando transformado por A, tem seu volume multiplicado por det A. Da decorre (intuitivamente, mas n ao t ao facilmente do ponto de vista matem atico) que o volume de qualquer conjunto e multiplicado por det A pela transforma c ao A. A intui c ao pode ser assim expressa: o conjunto e aproximado por pequenos paralelep pedos disjuntos, cujo volume total est a pr oximo do volume total do conjunto, e quanto menores forem esses paralelep pedos melhor ser a a aproxima c ao. Ao transformarmos o conjunto pela aplica c ao A, podemos imaginar tamb em a transforma c ao desses pequenos paralelep pedos, que ter a seu volume multiplicado por det A. Portanto, se aplicarmos B e depois A, o volume dos conjuntos ser a multiplicado por det B e depois por det A. Este e o sentido da f ormula!
2.9
Quadro comparativo
Para resumir tudo o que dissemos at e agora sobre a exist encia e a unicidade de solu c oes de um sistema linear, fa camos um quadro comparativo que ilustra as u nicas duas alternativas que podem ocorrer para a matriz de coecientes A, quando se quer resolver um sistema linear Au = b. Alternativa 1. 1. Para qualquer b, sempre existe u nica solu c ao para Au = b
38
CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES 2. A e bijetiva, como transforma c ao linear 3. Au = 0 implica u = 0 4. As colunas de A s ao linearmente independentes 5. As linhas de A s ao linearmente independentes 6. det A = 0
Alternativa 2. 1. Ou b e tal que Au = b n ao tem solu c ao ou b e tal que Au = b tem innitas solu c oes, e sempre existem exemplos dos dois casos 2. A n ao e nem injetiva nem sobrejetiva 3. Existe u = 0 tal que Au = 0 4. As colunas de A s ao linearmente dependentes 5. As linhas de A s ao linearmente dependentes 6. det A = 0
Cap tulo 3
O M etodo de Escalonamento
3.1 O m etodo
Nesta Se c ao discutiremos um m etodo de resolu c ao de sistemas lineares, chamado M etodo do Escalonamento. O m etodo se baseia, em primeiro lugar, no fato de que um sistema triangularizado como abaixo tem f acil solu c ao: a11 x1 + a12 x2 + a13 x3 + . . . + a1n xn a22 x2 + a23 x3 + . . . + a2n xn a33 x3 + . . . + a3n xn = b1 = b2 = b3 . . .
ann xn = bn Na verdade, e tanto necess ario quanto suciente que todos os coecientes na diagonal sejam n ao-nulos para que se explicite a solu c ao de forma unica (se um dos termos da diagonal for nulo ent ao haver a vari aveis livres e uma innidade de solu c oes). A solu c ao, nesse caso, se obt em a partir da u ltima equa c ao. Primeiro, isola-se xn : xn = A pen ultima equa c ao e an1,n1 xn1 + an1,n xn = bn1 , ent ao xn1 = 1 an1,n1 (bn1 an1,n xn ) . 1 bn . ann
Como xn j a foi determinado, da equa c ao acima determina-se tamb em xn1 . E assim por diante, at e se conseguir o valor de x1 . 39
40
CAP ITULO 3. O METODO DE ESCALONAMENTO
Um sistema triangularizado torna-se ent ao o objetivo do m etodo. Para ser mais preciso, pretende-se obter um sistema linear triangularizado equivalente ao original. Aqui entenderemos que dois sistemas lineares s ao equivalentes se eles possuem exatamente as mesmas solu c oes, ou seja: se um conjunto de n umeros x1 , . . . , xn e solu c ao de um sistema ent ao automaticamente ser a solu c ao do outro. Pode-se trocar um sistema linear por outro equivalente atrav es do seguinte processo. Escolhem-se duas linhas, a linha i e a linha j , e no lugar da linha j coloca-se uma linha que seja combina c ao linear da linha i com a linha j , exceto que essa combina c ao linear n ao pode ser somente a linha i (sen ao a informa c ao sobre a linha j desaparece, o que pode tornar o sistema indeterminado). Mais precisamente, o sistema linear a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . an1 x1 + an2 x2 + . . . + ann xn = bn passa a ter, no lugar da linha j , a seguinte linha: (aj 1 + ai1 )x1 + . . . + (ajn + ain )xn = bj + bi , evidente onde = 0, para que a linha j n ao seja meramente substitu da pela linha i. E que qualquer solu c ao do sistema linear original ser a solu c ao do sistema linear alterado. Ser a que vale o inverso? De fato, sim. Se os n umeros x1 , . . . , xn formam uma solu c ao do sistema alterado, ent ao j a garantimos que esses n umeros satisfazem todas as equa c oes do sistema original, exceto possivelmente a equa c ao j . Acontece que subtraindo da linha alterada a linha i multiplicada por vemos que a linha j e automaticamente satisfeita, contanto que = 0. O essencial nesse truque e que podemos controlar e de forma que a linha substituta tenha um zero em certa posi c ao. Por exemplo, suponha que na linha i o termo aik (k - esima coluna) seja diferente de zero. Com isso, podemos substituir a linha j por uma linha em que na k - esima coluna o coeciente seja nulo. Basta colocar a linha 1 (linha j ) Assim, o k - esimo coeciente ser a ajk ajk aik = 0 . aik ajk (linha i) . aik
Usando judiciosamente essa opera c ao podemos ir substituindo as linhas, uma por uma, at e chegar a um sistema triangularizado equivalente ao original. Antes de explicar
3.1. O METODO
41
o procedimento, no entanto, convencionemos uma forma mais f acil de escrever o sistema linear: a forma matricial. Nessa forma de escrever, s o colocamos o que realmente interessa no sistema linear: os coecientes. Numa matriz de n linhas e n + 1 colunas colocamos todos eles, deixando a u ltima coluna para os termos independentes (e em geral separando essa coluna das demais para n ao haver confus ao): a11 a12 . . . a1n | b1 a21 a22 . . . a2n | b2 . . . . . . . . . . . . . . . an1 an2 . . . ann | bn Uma observa c ao importante que devemos fazer neste ponto da exposi c ao e que a ordem das linhas n ao importa na montagem da equa c ao, pois as linhas s ao as equa c oes, e todas as equa c oes devem ser satisfeitas ao mesmo tempo. J a a ordem das colunas e importante, pois a primeira coluna representa a inc ognita x1 , a segunda representa a inc ognita x2 , etc. Se quisermos trocar a ordem das colunas, teremos antes que renumerar as inc ognitas! O procedimento de escalonamento funciona assim. Primeiramente vericamos se a11 = 0. Se n ao for, procuramos alguma linha cujo primeiro coeciente seja diferente de zero e a trocamos de posi c ao com a primeira. Se n ao houver nenhuma linha cujo primeiro coeciente seja n ao-nulo ent ao x1 n ao entra no sistema linear e pode ser, a princ pio, qualquer. Al em disso, percebe-se que de fato o sistema linear envolve apenas n 1 inc ognitas em n equa c oes, havendo grande chance de n ao ter solu c ao. De qualquer forma, se isso acontecer n ao haver a nada a ser feito nessa primeira etapa e poderemos passar imediatamente ` a etapa seguinte. O objetivo da primeira etapa e usar o fato de que a11 = 0 para trocar uma a uma as linhas de 2 a n por linhas cujo primeiro coeciente seja nulo, usando o truque descrito acima. Ou seja, a j - esima linha (j = 2, . . . , n) ser a substitu da pela linha (linha j) aj 1 (linha 1) . a11
O sistema linear car a ent ao da seguinte forma: a11 a12 . . . a1n 0 a22 . . . a2n . . . . . . . . . . . . 0
| b1 | b2 , . . .
an2 . . . ann | bn
onde e preciso lembrar que, por causa das opera c oes com linhas, os coecientes n ao s ao os mesmos do sistema linear original!.
42
Nessa primeira etapa descrita, o n umero a11 e chamado de piv o. Em cada etapa haver a um piv o, como veremos adiante. Vimos que o piv o tem que ser necessariamente diferente de zero, o que pode ser conseguido atrav es de uma troca de linhas. De fato, e poss vel at e escolher o piv o, dentre os v arios n umeros da primeira coluna que sejam diferentes de zero. Na maioria das situa c oes em que se resolve um sistema linear por este m etodo, atrav es de calculadora ou computador, e mais vantajoso, sob o ponto de vista dos erros de c alculo (veja discuss ao mais adiante) originados de arredondamentos, escolher o piv o como sendo o maior dos n umeros dispon veis na coluna. Aqui entendese por maior n umero aquele que tem o maior valor absoluto dentro da coluna. Esse procedimento e chamado de condensa c ao pivotal. Na segunda etapa, vericamos se a22 = 0. Se n ao for, procuramos entre as linhas abaixo da segunda alguma cujo segundo coeciente seja n ao-nulo. Se n ao houver, passamos diretamente para a terceira etapa. Se houver, trocamos a linha encontrada com a segunda linha. Observe que a primeira linha n ao ser a mais alterada, nem trocada de posi c ao com outras. Aqui o piv o ser a o n umero diferente de zero da segunda coluna, escolhido entre a segunda linha e a u ltima. Mais uma vez, pode-se adotar a condensa c ao pivotal, tomando como piv o o maior em valor absoluto. Se ap os a troca tivermos a22 = 0, podemos usar nosso truque para zerar todos os segundos coecientes desde a linha 3 at e a u ltima linha. Trocaremos cada linha j = 3, . . . , n pela linha aj 2 (linha 2) , (linha j) a22 e caremos com um sistema linear da forma a11 a12 a13 . . . a1n 0 a22 a23 . . . a2n 0 0 a33 . . . a3n . . . . . . . . . . . . . . . 0 0 an3 . . . ann | b1 | b2 | b3 , . . . | bn
lembrando mais uma vez que os coecientes s ao diferentes em rela c ao ` a etapa anterior, exceto os da primeira linha, que cam inalterados. f E acil ver que em n 1 etapas teremos um sistema linear triangularizado que, como j a observamos acima, pode ser facilmente resolvido.
3.2
Algarismos signicativos
Em geral recorremos a um computador, ou no m nimo usamos uma calculadora, quando se trata de resolver sistemas lineares razoavelmente grandes. Por exemplo, dicilmente nos aventurar amos na resolu c ao ` a m ao do problema de contorno da Se c ao 1.8, que
3.2. ALGARISMOS SIGNIFICATIVOS
43
resulta num sistema linear de 37 inc ognitas. E isso e pouco: imagine uma grade bem mais na! A solu c ao de um sistema linear pelo M etodo do Escalonamento e exata, na medida em que o resultado nal pode ser expresso em termos de fra c oes envolvendo os coecientes do sistema linear original. No entanto, calculadoras e computadores n ao trabalham dessa forma. Num computador ou numa calculadora cient ca os n umeros s ao representados em ponto utuante, baseados na nota c ao decimal (internamente pode ser em outra base, mas o que nos aparece e, em geral, a nota c ao decimal). Na nota c ao de ponto utuante, um n umero tem um expoente e uma mantissa. Se x e um n umero real, seu expoente ser a o n umero inteiro n tal que 10n1 x < 10n .
x e a k - esima casa A mantissa de x, de ordem k , e a representa c ao decimal de 10 n at decimal, com arredondamento. Em geral as calculadoras usam k > 6, e computadores mais modernos podem usar valores bem mais altos. Por exemplo, quando pe co para minha calculadora o valor de 50000 ela me responde
223.6067977 Observe que x = 50000 e tal que 102 x < 103 , portanto o expoente e n = 3 nesse exemplo. Ent ao x 0.2236067977 103 . A mantissa de x de ordem 10 e o n umero 0.2236067977 As m aquinas trabalham com um tamanho xo para a mantissa: na calculadora que eu usei, esse tamanho e 10. A ordem k da mantissa que escolhemos para operar com um n umero e tamb em chamada de n umero de algarismos signicativos. Antes de discorrermos sobre como fazer opera c oes aritm eticas com n umeros nessa representa c ao (a chamada aritm etica de ponto utuante), vejamos como se d a o processo de arredondamento. Suponha que um n umero x se escreva da seguinte forma, na nota c ao decimal: x = Np Np1 . . . N1 N0 .N1 N2 N3 . . . , onde Np , . . . , N0 , N1 , N2 , . . . s ao os algarismos da nota c ao, de fato n umeros entre 0 e ` direita a seq 9, j a que se trata de representa ca o na base 10. A u encia dos Ni s pode ser
44
innita (e inclusive h a n umeros que podem ser escritos de duas formas diferentes, por exemplo 0.999 . . . = 1.000 . . .). Assumiremos que ela seja sempre innita, pois mesmo que n ao seja podemos torn a-la completando a seq u encia com zeros. Essa nota c ao representa uma s erie, isto e, uma soma de innitos termos: x = Np 10p + Np1 10p1 + . . . + N1 101 + N0 100 + N1 101 + N2 102 + . . . Mesmo sem estarmos familiarizados com s eries, podemos entender o n umero x da seguinte forma: x est a entre Np 10p e (Np + 1) 10p , mas tamb em est a entre Np 10p + Np1 10p1 e Np 10p + (Np1 + 1) 10p1 , e assim por diante. Se quisermos arredondar na k - esima casa decimal depois da v rgula, observamos primeiramente que x e maior ou igual a Np 10p + . . . + N1 101 + N0 + N1 101 + . . . + Nk 10k e menor do que Np 10p + . . . + N1 101 + N0 + N1 101 + . . . + (Nk + 1) 10k , e, para simplicar a nota c ao, deniremos X = Np 10p + . . . + N1 101 + N0 + N1 101 + . . . + Nk+1 10k+1 , de forma que X + Nk 10k x < X + (Nk + 1) 10k . Para obter o arredondamento de x na k - esima casa decimal, que denotaremos por x , precisamos saber se x est a mais pr oximo de X + Nk 10k ou de X + (Nk + 1) 10k . Isso e determinado pelo algarismo seguinte na expans ao decimal de x, isto e, Nk1 . Podemos seguir a regra: se Nk1 = 0, 1, 2, 3, 4, ent ao x = X + Nk 10k ; j a se k Nk1 = 5, 6, 7, 8, 9 ent ao x = X + (Nk + 1) 10 . No segundo caso e preciso tomar cuidado ao se voltar para a nota c ao decimal. Se 0 Nk 8, ent ao x = Np . . . N0 .N1 . . . Nk+1 (Nk + 1) . Se, no entanto, Nk = 9, teremos Nk + 1 = 10. Isso faz com que no lugar de Nk + 1 coloquemos um zero e somemos 1 ao algarismo precedente, Nk+1 . Mas se Nk+1 for tamb em igual a 9, ent ao trocamos esse n umero por um zero e somamos 1 ao precedente, at e isso n ao mais acontecer. Por exemplo, o arredondamento de 1.5769996 para a sexta casa decimal e 1.577000. Agora voltemos ` a quest ao das opera c oes aritm eticas. No mundo das m aquinas, elas devem ser feitas sempre respeitando um certo n umero pr e-xado de algarismos signicativos. Para entender bem, nada melhor do que alguns exemplos.
3.2. ALGARISMOS SIGNIFICATIVOS
45
Digamos que se queira efetuar a opera c ao 2.236 + 12.448, com 4 algarismos signicativos. O primeiro n umero j a est a escrito com 4 algarismos signicativos, pois 2.236 = 0.2236 101 , mas o seguinte n ao, pois 12.448 = 0.12448 102 . Ent ao arredondamos o segundo para que que com 4 algarismos signicativos, resultando 0.1245 102 , ou 12.45, e fazemos a soma: 12.45 + 2.236 = 14.686. A soma, no entanto, tem 5 algarismos signicativos, logo somos obrigados a arredondar o resultado: 14.69. Observe que ter amos obtido um n umero ligeiramente diferente se n ao houv essemos arredondado 12.448 para 12.45, pois 2.236 + 12.448 = 14.684 que, arredondado, ca 14.68. f E acil ver que haver a um ac umulo de erro se um grande n umero de opera c oes aritm eticas for efetuado em cadeia. Vejamos um exemplo de subtra c ao: queremos subtrair 0.122 de 943 com 3 algarismos signicativos. Isso d a 943, ap os arredondamento. Da pode-se ver que em alguns casos a ordem das opera c oes de adi c ao e subtra c ao pode ser importante. Por exemplo, (943 0.122) 0.405 = 943 0.405 = 943 , mas 943 (0.122 + 0.405) = 943 0.527 = 942 . preciso tomar bastante cuidado com subtra E c oes e somas de n umeros com expoentes d spares, principalmente se essas opera c oes forem feitas em grande n umero. Sen ao corremos o risco de subtrair 9430 vezes o n umero 0.1 de 943 e continuar com 943, ao inv es de obter zero!! Tamb em deve-se tomar cuidado com a subtra c ao de n umeros muito parecidos, cuja diferen ca se encontre al em dos d gitos signicativos, pois pode-se obter um zero onde deveria haver um n umero simplesmente muito pequeno! Como regra geral, cada opera c ao deve ser feita (se poss vel com mais algarismos do que os signicativos, o dobro em geral) e o resultado da opera c ao arredondado. O mesmo vale para as opera c oes de multiplica c ao e divis ao. Por exemplo, 5.35/7.22, com 3 algarismos signicativos, d a 0.741 (conra!). Para ilustrar, fa camos o escalonamento e a resolu c ao de um sistema linear de ordem 3, usando 3 algarismos signicativos. Este exemplo servir a para ilustrar como, em linhas gerais, se d a a resolu c ao de um sistema por um programa de computador. Evidentemente um bom programa (h a alguns j a prontos para uso) tratar a de minimizar o quanto for poss vel os erros de arredondamento causados pelo n umero limitado de algarismos signicativos. Aqui, ao contr ario, tentaremos levar ao p e da letra a regra de arredondar ap os cada opera c ao. A regra s o n ao ser a muito clara sobre a ordem de seguidas adi c oes ou multiplica c oes: neste caso, faremos o arredondamento ap os todas as adi c oes (ou multiplica c oes). Ap os o exemplo, sugerimos ao leitor, como exerc cio, que implemente no computador, usando alguma linguagem (C, Pascal, Fortran, Basic, etc), um programa que resolva
46
CAP ITULO 3. O METODO DE ESCALONAMENTO (que a ordem seja apenas limitada por problemas
sistemas lineares de qualquer ordem de falta de mem oria, por exemplo). Considere o sistema 3 1 2
1 2 | 1 1 0 | 2 , 2 1 | 1
9 13 que tem apenas coecientes inteiros. Ele tem solu c ao exata (x1 , x2 , x3 ) = ( 2 , 2 , 3), que pode ser obtida por escalonamento tamb em, sem arredondamento (mantendo fra c oes). N ao h a arredondamentos a fazer, no princ pio, porque todos os coecientes s ao inteiros. O 3 da primeira coluna serve como piv o, pois e maior do que os demais coecientes da mesma coluna. A primeira etapa consiste em subtrair da segunda e da terceira linha m ultiplos convenientes da primeira para que s o reste o 3 como coeciente n ao nulo. 1 Para a segunda linha, o m ultiplo tem que ser 3 = 0.333, enquanto que para a terceira 2 linha ele tem que ser 3 = 0.667. Chamaremos esses m ultiplos de multiplicadores. O leitor pode achar estranho que 1 0.333 3 = 1 0.999 = 0.001, o que faz com que de fato o primeiro coeciente da segunda linha n ao se anule. Isso ser a ignorado na hora de se fazer o escalonamento. Observe que a escolha do multiplicador como 0.334 n ao ajudaria a resolver o problema. A u nica solu c ao seria n ao arredondar o multiplicador antes de fazer a conta, mas nem sempre e isso o que acontece num programa. Dessa primeira etapa sai o sistema
3 1 2 | 1 0 0.667 0.666 | 2.33 . 0 1.33 2.33 | 1.67 Olhando para a segunda coluna, nota-se que a terceira linha deve servir como piv o, pois 1.33 e maior do que 0.667. Ent ao faz-se a troca da segunda linha com a terceira, cando 3 1 2 | 1 0 1.33 2.33 | 1.67 . 0 0.667 0.666 | 2.33 Para a terceira linha, usa-se o multiplicador 0.667 = 0.502 , 1.33 e da temos 3 1 2 | 1 0 1.33 2.33 | 1.67 . 0 0 0.504 | 1.49
3.3. O DETERMINANTE NO METODO DE ESCALONAMENTO Portanto
47
1.49 = 2.96 , 0.504 1.67 + 2.33 2.96 1.67 + 6.90 8.57 x2 = = = = 6.44 1.33 1.33 1.33 x3 = x1 = 13.4 1 6.44 2 2.96 = = 4.47 . 3 3
1 Observe que n ao e preciso, quando se for dividir por 3, calcular 3 , arredondar e depois multiplicar pelo numerador. A divis ao e considerada uma opera c ao elementar. Comparando com a solu c ao exata, podemos ver que o maior erro absoluto foi de 0.06. Mais adiante, na Subse c ao 3.5.3, veremos como melhorar o c alculo, usando o renamento de solu c oes.
Exerc cio. Fa ca as contas intermedi arias do exemplo acima. Resolva o sistema do exemplo acima usando apenas 2 algarismos signicativos. Exerc cio. Implemente a resolu c ao por escalonamento no computador. Exerc cio. Resolva o sistema linear 7.01 2.52 | 10.1 0.031 0.789 | 2.6 com 3 algarismos signicativos.
3.3
O determinante no M etodo de Escalonamento
Observemos em primeiro lugar que as propriedades do determinante de uma n-upla de vetores (u1 , . . . , un ) de Rn (normaliza c ao, altern ancia e linearidade) podem ser formuladas diretamente para uma matriz A: 1) det(Id) = 1; 2) a troca de duas colunas faz mudar o sinal do determinante; e 3) se uma coluna se escreve como combina c ao u + v , ent ao o determinante e a soma de vezes o determinante da mesma matriz com a coluna u + v trocada por u com vezes o determinante da mesma matriz com a coluna u + v trocada por v . Por exemplo, suponha que queiramos calcular det(u1 , u2 , . . . , uj + ui , . . . , un ) , que, em termos matriciais, signica somar um m ultiplo da i- esima coluna ` a j - esima coluna. Pelas propriedades do determinante, det(u1 , u2 , . . . , uj + ui , . . . , un ) = det(u1 , u2 , . . . , uj , . . . , un ) ,
48
logo o determinante n ao se altera quando somamos a uma coluna um m ultiplo de uma outra. Em seguida, ressaltamos que as mesmas propriedades s ao v alidas com linhas ao inv es de colunas. Isso porque n ao e dif cil mostrar que a transposta de A, denotada por AT , que e a matriz A onde se trocam colunas por linhas, tem o mesmo determinante que A. Logo as propriedades de det A em rela c ao a suas linhas s ao as mesmas que T det A = det A em rela c ao a suas colunas. Portanto todas as opera c oes realizadas no M etodo de Escalonamento n ao alteram o determinante da matriz de coecientes, exceto as trocas de linhas, feitas por conta da condensa c ao pivotal, pois cada troca de linha muda o sinal do determinante. Por outro lado, o resultado nal do escalonamento e uma matriz triangular, cujo determinante e dado pelo produto dos coecientes da diagonal. Ent ao o determinante do sistema ser a zero se e somente se ap os o escalonamento houver um termo nulo na diagonal, e nesse caso o sistema ser a imposs vel ou indeterminado. Isto completa o argumento da Subse c ao 2.8.3, onde quer amos provar que se A tem inversa ent ao det A = 0. Pois se A tem inversa, segue que o sistema tem u nica solu c ao e todos os termos da diagonal s ao n ao-nulos, e por conseguinte o determinante do sistema tamb em e n ao-nulo.
3.4
A desvantagem da Regra de Cramer
A Regra de Cramer e uma f ormula bastante pr atica de se resolver Au = b, usando a no c ao de determinante. Suponha que det A = 0. Nesse caso, existe u nica solu c ao u = (x1 , . . . , xn ) para Au = b, mas quais s ao os valores de x1 , . . . , xn ? Note que se trocarmos a i- esima coluna pelo vetor b e calcularmos o determinante da matriz resultante teremos det(. . . , Aei1 , b, Aei+1 , . . .) = det(. . . , Aei1 , x1 Ae1 + . . . + xn Aen , Aei+1 , . . .) , pois b = Au = x1 Ae1 + . . . + xn Aen , pela linearidade de A. Pela linearidade do determinante, podemos separ a-lo na soma de n determinantes, onde em cada um deles teremos na i- esima posi c ao um dos vetores xj Aej . No entanto, apenas o determinante com xi Aei ser a n ao-nulo: det(. . . , Aei1 , b, Aei+1 , . . .) = det(. . . , Aei1 , xi Aei , Aei+1 , . . .) . Mais uma vez pela linearidade, podemos tirar o escalar xi , que car a multiplicado pelo pr oprio determinante da matriz A: det(. . . , Aei1 , b, Aei+1 , . . .) = xi det A .
3.4. A DESVANTAGEM DA REGRA DE CRAMER Logo xi = det(. . . , Aei1 , b, Aei+1 , . . .) , det A
49
que e a Regra de Cramer. A desvantagem da Regra de Cramer e que o n umero de opera c oes necess arias para se chegar ` a solu c ao e em geral muito maior do que no M etodo de Escalonamento. Essa compara c ao e feita assim: calcula-se o n umero de opera c oes aritm eticas necess arias em cada m etodo em fun c ao do tamanho n do sistema linear. Ent ao v e-se que num m etodo esse n umero cresce muito mais rapidamente com n do que no outro. Para facilitar a compara c ao, ignoraremos as instru c oes de controle de uxo que seriam necess arias caso os m etodos fossem implementados num computador. Um n umero de opera c oes aritm eticas muito grande e desvantajoso por duas raz oes: aumenta o tempo de computa c ao e aumenta a propaga c ao dos erros de arredondamento. O n umero de produtos de n termos que aparecem no c alculo de um determinante e n! (mostre isso), ou seja, s ao n! opera c oes de adi c ao. Para obter cada produto s ao n 1 multiplica c oes, totalizando n!(n 1) opera c oes de multiplica c ao. Para calcular as n inc ognitas, a Regra de Cramer pede n + 1 determinantes, logo s ao n!(n + 1) adi c oes e n!(n 1)(n + 1) multiplica c oes, mais as n divis oes ao nal de tudo. E quanto ao M etodo de Escalonamento, quantas opera c oes aritm eticas ser ao necess arias? Em vez de darmos a resposta sugere-se ao leitor fazer por ele mesmo, como indicado no seguinte exerc cio. Exerc cio. Mostre que o n umero de adi c oes/subtra c oes, multiplica c oes e divis oes necess arias para se completar o M etodo de Escalonamento num sistema linear de n equa c oes 3 e n inc ognitas n ao passa de 2n , para cada uma delas. Se quisermos comparar o n umero de opera c oes totais, vemos que na Regra de Cramer s ao necess arias mais do que n! opera c oes. Exerc cio. Mostre que, quando n e grande ent ao n! e muito maior do que 2n3 . De fato, a raz ao 6n 3 n! vai a zero quando n vai a innito. Se voc e mostrou isso com sucesso, ver a ent ao que seu argumento serve para mostrar que, qualquer que seja a pot encia p, a raz ao np n! sempre vai a zero. Verique! Na verdade, devemos tomar um certo cuidado com a maneira pela qual zemos a compara c ao entre os dois m etodos. Se estivermos pensando em tempo de computa c ao,
50
precisamos saber quanto a m aquina gasta para fazer cada uma das opera c oes. A divis ao certamente gasta mais tempo do que as outras opera c oes, e o M etodo de Cramer apresenta menos divis oes (apenas n) do que o M etodo de Escalonamento (cada multiplicador e calculado atrav es de uma divis ao). J a na contabilidade das outras opera c oes o M etodo de Cramer perde do M etodo de Escalonamento, por causa do exerc cio acima. Exerc cio. Suponha que uma divis ao nunca demore mais do que T vezes uma multiplica c ao, onde T e uma constante qualquer maior do que zero, e a multiplica c ao tome o mesmo tempo que a adi c ao e a subtra c ao. Decida qual dos m etodos e mais vantajoso, sob o ponto de vista de tempo de computa c ao para complet a-lo.
3.5
3.5.1
Sistemas mal-condicionados e renamento de solu c ao

Sistemas mal-condicionados
Na teoria, se um sistema linear Au = b satisfaz det A = 0, ent ao existe uma e s o uma solu c ao u. Na pr atica, por em, quando resolvemos o sistema via computador, erros podem se acumular e a solu c ao se afastar da solu c ao verdadeira. Isso pode ser parcialmente sanado pela Condensa c ao Pivotal, descrita no Cap tulo 3, e pelo M etodo de Renamento, do qual daremos uma id eia abaixo. O principal problema vem do fato de que muitas vezes os coecientes do sistema e os termos independentes s ao retirados de medidas f sicas ou de modelos aproximados. Para alguns sistemas, a solu c ao pode depender sensivelmente de seus coecientes, a ponto de pequenas incertezas em seus valores provocarem grandes altera c oes na solu c ao nal. Esses sistemas s ao chamados de mal-condicionados. Para exemplicar, consideremos o sistema 2 2 x + y = 1 99x + 100y = 99.5 ,
que tem solu c ao u nica e exata x = 0.5, y = 0.5. Agora considere o sistema x + y = 1 99.4x + 99.9y = 99.2 ,
com altera c oes de n ao mais do que 0.5% nos coecientes originais (o que e bastante razo avel para uma medida experimental). Sua solu c ao u nica e exata e x = 1.4, y = 0.4, radicalmente diferente da anterior. Para entender porque isso acontece, experimente o leitor, para cada um dos dois sistemas, desenhar as retas que correspondem a cada uma das equa c oes. Nota-se que o problema e devido ao fato de que as retas correspondentes a cada equa c ao s ao quase
3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO
51
paralelas, o que faz com que o ponto de intersec c ao das duas seja muito sens vel a pequenas mudan cas nos coecientes. A id eia vale em dimens oes mais altas, se pensarmos em hiperplanos quase paralelos, no lugar de retas. Podemos tamb em pensar nos vetores-coluna de A (ou nos vetoreslinha): se Ae1 , Ae2 , . . . , Aen forem quase linearmente dependentes, ent ao o sistema ser a mal-condicionado. Uma maneira de se medir o condicionamento da matriz seria calculando seu determinante (embora muitas vezes s o possamos conhec e-lo depois de escalonar a matriz). O determinante e o hipervolume (com sinal) do hiperparalelep pedo formado pelos vetorescoluna Ae1 , Ae2 , . . . , Aen . Se esses vetores forem quase linearmente dependentes, ent ao o hiperparalelep pedo ser a achatado, e portanto ter a volume pequeno. O argumento s o falha no sentido de que o volume n ao depende somente do grau de achatamento do hiperparalelep pedo, mas tamb em do comprimento de cada vetor. Ent ao uma medida mais con avel seria tomar o hipervolume do hiperparalelep pedo formado pela normaliza c ao desses vetores, isto e, pelos vetores vi = Aei . Aei
Esse n umero estar a entre 0 e 1, e quando estiver perto de zero signica que a matriz e mal-condicionada. Em resumo, o n umero de condicionamento pode ser achado assim: (i) substitua cada i coluna Aei da matriz pelo vetor vi = Ae Aei , lembrando que a norma (euclideana) u
2 1/2 ; (ii) calcule o valor de um vetor u = (x1 , . . . , xn ) e dada por u = (x2 1 + . . . + xn ) absoluto do determinante da nova matriz; (iii) observe se o n umero obtido est a pr oximo de zero ou de um: se estiver perto de zero ent ao a matriz A e mal-condicionada. H a outras medidas do condicionamento de uma matriz, assim como h a f ormulas que relacionam o erro cometido no M etodo de Escalonamento com essas medidas e com o n umero de algarismos signicativos utilizados nas contas. Isso tudo no entanto foge ao escopo dessas notas. Al em do mais, medidas de condicionamento s ao dicilmente aplic aveis na pr atica, pois s ao t ao (ou mais) dif ceis de serem obtidas quanto a pr opria solu c ao do sistema linear.
3.5.2
Matrizes de Hilbert
o problema do mau condicionamento, suge-
Para que o leitor se familiarize melhor com rimos que acompanhe o seguinte Exemplo. Considere o sistema 1 x2 x1 + 2 1 1 x + 1 3 x2 2 1 1 3 x1 + 4 x2
+ + +
1 3 x3 1 4 x3 1 5 x3
= 1 = 1 = 1
52
Resolvendo o sistema por escalonamento (sem troca de linhas, pois n ao s ao necess arias para a condensa c ao pivotal), e fazendo contas com fra c oes exatas, obtemos a solu c ao exata (x1 , x2 , x3 ) = (3, 24, 30). Se, por outro lado, usarmos dois algarismos signicativos ( 1 3 = 0.33, por exemplo) e seguirmos exatamente o mesmo procedimento, obteremos (0.9, 11, 17). Com tr es algarismos signicativos, chegaremos em (2.64, 21.8, 27.8), resultado mais pr oximo mas ainda estranhamente longe da solu c ao exata. Matrizes do tipo 1 1 1 1 2 3 n 1 1 1 1 n+1 3 4 2 . . . . . . . . . . . . . . . . 1 1 1 1 n n+1 n+2 2n1 s ao chamadas de matrizes de Hilbert, e aparecem naturalmente no problema do ajuste polinomial, como veremos mais adiante (vide Subse c ao 6.7.2).
3.5.3
Renamento
Uma das maneiras de sanar o problema de se encontrar uma solu c ao ruim, causada pelo mau condicionamento do sistema, e fazer o renamento, que consiste em obter uma solu c ao u de Au = b, mesmo que n ao correta (por causa dos erros de arredondamento), e depois melhor a-la. Para melhorar u , denimos a diferen ca w = u u para a solu c ao verdadeira u, e tentamos calcular w. Como u = u + w, ent ao b = Au = A( u + w) , logo Aw = b Au . Ou seja, a diferen ca w entre u e u e a solu c ao de um sistema linear, onde os termos independentes s ao dados por b Au e os coecientes s ao os mesmos do sistema linear original (o que facilita as coisas do ponto de vista de programa c ao). O m etodo pode ser implementado assim: calcula-se a primeira solu c ao aproximada (0) (0) (0) u . Calcula-se ent ao w = u u resolvendo-se o sistema Aw(0) = b Au(0) . Se a solu c ao desse sistema n ao contivesse erros, ent ao u = u(0) + w(0) seria a solu c ao (0) (0) correta. Como erros s ao inevit aveis, u + w pode n ao ser a solu c ao exata, e ser a (1) (1) (1) chamada de u . Calcula-se ent ao w = u u , resolvendo-se Aw(1) = b Au(1) ,
53
e em seguida dene-se u(2) = u(1) + w(1) . E assim por diante. Vejamos um exemplo ilustrativo. Na Se c ao 3.2, usamos 3 algarismos signicativos para resolver 3 1 2 | 1 1 1 0 | 2 . 2 2 1 | 1 Os passos do escalonamento ali usados s ao importantes para n ao se repetir as mesmas contas a cada etapa do renamento. A solu c ao obtida pode ser considerada uma primeira aproxima c ao, chamada de u(0) : 4.47 u(0) = 6.44 . 2.96 Calculamos ent ao Au(0) , que e o teste usual para ver se u(0) e realmente solu c ao. Obtemos 1.04 Au(0) = 1.97 , 1 sempre usando 3 algarismos signicativos, e ent ao tiramos a diferen ca 0.04 b Au(0) = 0.03 . 0 Agora queremos obter w do sistema Aw = b Au(0) , para chegar ` a etapa seguinte, com u(1) = u(0) + w. Ou seja, temos que resolver o sistema 3 1 2 | 0.04 1 1 0 | 0.03 . 3 2 1 | 0 Se procedermos ao escalonamento, seguiremos exatamente os mesmos passos feitos na Se c ao 3.2. Ent ao n ao precisamos fazer tudo de novo no lado esquerdo, somente no vetor de termos independentes do lado direito. As transforma c oes do lado direito s ao 0.04 0.04 0.04 0.04 (iii) (ii) (i) 0.03 0.0167 0.0267 0.0267 , 0.0301 0.0167 0.0267 0
54
onde em (i) subtra mos da segunda linha 0.333 vezes a primeira linha e da terceira linha subtra mos 0.667 vezes a primeira linha, em (ii) trocamos as posi c oes da segunda e da terceira linhas e em (iii) subtra mos da terceira linha 0.502 vezes a segunda linha. O sistema escalonado ca 3 1 2 | 0.04 0 1.33 2.33 | 0.0267 , 0 0 0.504 | 0.0301 e da chegamos a w = (w1 , w2 , w3 ) = (0.0543, 0.0842, 0.0597). Somando com u(0) obtemos u(1) = (4.52, 6.52, 3.02), com erro absoluto m aximo de 0.02. (1) Para conferir, notamos que Au = (1.04, 2, 0.94), nada muito melhor do que Au(0) . De fato, mesmo com a possibilidade de renamento, a solu c ao de partida j a era bastante razo avel. Vale a pena o leitor fazer mais algumas etapas, e conferir os seguintes valores: 4.44 4.53 u(2) = 6.44 , u(3) = 6.53 . 2.96 3.02 Com a limita c ao do n umero de algarismos signicativos, n ao e certeza que o renamento levar a` a melhor aproxima c ao da solu c ao correta. Melhores resultados s ao obtidos se, no c alculo de b Au(i) , for usada precis ao dupla (isto e, o dobro de algarismos signicativos), uma vez que b e Au(i) s ao vetores cujas coordenadas t em valores muito pr oximos. Obviamente os benef cios da precis ao dupla podem ser usados nos computadores e calculadoras modernos, quando se escrevem v arias opera c oes concatenadas na mesma linha e o arredondamento para precis ao simples s o e feito no nal. Isto diminui sensivelmente o ac umulo de erros. preciso tamb E em colocar um crit erio de parada, principalmente no caso de se fazer a implementa c ao no computador. O crit erio pode ser feito nas solu c oes u(i) ou nos ( i ) ( i ) ( i +1) testes Au . Por exemplo, se u = (u1 , u2 , . . . , un ) e u = ( u1 , u 2 , . . . , u n ), pode-se comparar o quanto as coordenadas variam, relativamente, da etapa i para a etapa i + 1, olhando para os n umeros |u1 u 1 | |un u n | , ... , , ... , |u1 | |un | e pedindo que eles sejam menores do que um certo valor (por exemplo, 0.05, signicando 5% de varia c ao). O problema e quando o denominador e igual a zero. Pode-se convencionar que: (i) se uj = 0 e u j = 0 ent ao a varia c ao e zero; (ii) se uj = 0 e u j = 0, ent ao a varia c ao e igual a 1 (o que, em geral, far a com que o processo continue). Exerc cio. Melhorar o programa que implementa o M etodo de Escalonamento com condensa c ao pivotal, acrescentando o renamento, com algum crit erio de parada. Para
55
fazer o renamento, o programa deve utilizar o hist orico do escalonamento, isto e, os multiplicadores e as trocas de linha (para que n ao se repita tudo a cada etapa). Exerc cio. Tome o sistema discutido na Subse c ao 3.5.2 e sua solu c ao obtida com 2 (0) algarismos signicativos, chamando-a de u . Obtenha o renamento u(1) , calculando b Au(0) com dupla precis ao. Exerc cio. Considere o sistema 1/2 1/3 1/4 | 1 1/3 1/4 1/5 | 0 . 1/4 1/5 1/6 | 1 1. Ache sua solu c ao exata. 2. Resolva-o com dois algarismos signicativos. 3. Agora fa ca a seguinte experi encia: escreva o mesmo sistema, arredondando para dois algarismos signicativos, mas a partir da ache sua solu c ao usando o m aximo de algarismos signicativos que sua calculadora permite. Compare com a solu c ao exata. Isto mostra que o renamento tamb em e limitado pelo arredondamento inicial que, num sistema mal-condicionado, pode alterar drasticamente a solu c ao.
56
Cap tulo 4
M etodos iterativos
4.1 O M etodo de Jacobi
O M etodo de Jacobi e um procedimento iterativo para a resolu c ao de sistemas lineares. Tem a vantagem de ser mais simples de se implementar no computador do que o M etodo de Escalonamento, e est a menos sujeito ao ac umulo de erros de arredondamento. Seu grande defeito, no entanto, e n ao funcionar em todos os casos. Suponha um sistema linear nas inc ognitas x1 , ..., xn da seguinte forma: a11 x1 a21 x1 . . . + a12 x2 + a22 x2 . . . + a13 x3 + . . . + a1n xn = b1 + ... + . . . + a2n xn = b2 . . . . . . . . . . . . + ... + . . . + ann xn = bn
an1 x1 + an2 x2
Suponha tamb em que todos os termos aii sejam diferentes de zero (i = 1, . . . , n). Se n ao for o caso, isso ` as vezes pode ser resolvido com uma troca na ordem das equa c oes. Ent ao a solu c ao desse sistema satisfaz 1 [b1 a12 x2 a13 x3 . . . a1n xn ] a11 1 x2 = [b2 a21 x1 a23 x3 . . . a2n xn ] a22 . . . . . . 1 xn = [bn an1 x1 an2 x2 . . . an,n1 xn1 ] ann x1 = Em outras palavras, se (x1 , . . . , xn ) for solu c ao do sistema e esses valores forem colocados no lado direito das equa c oes, ent ao resultar ao no lado esquerdo os mesmos valores x1 , . . . , xn . 57
58
CAP ITULO 4. METODOS ITERATIVOS

(0) (0)
O M etodo de Jacobi consiste em chutar valores x1 , . . . , xn , colocar esses valores (1) (1) no lado direito das equa c oes, obter da x1 , . . . , xn , em seguida colocar esses novos (2) (2) valores nas equa c oes e obter x1 , . . . , xn , etc. Ent ao 1 (k ) (k ) k) b1 a12 x2 a13 x3 . . . a1n x( n a11 1 (k ) (k ) (k+1) k) b2 a21 x1 a23 x3 . . . a2n x( x2 = n a22 . . . . . . 1 (k ) (k ) (k ) k+1) x( = bn an1 x1 an2 x2 . . . an,n1 xn1 n ann x1
(k+1)
Espera-se que para todo i = 1, . . . , n a seq u encia {xi }k convirja para o valor verdadeiro xi . Como dissemos, no entanto, nem sempre ocorre essa converg encia. Ser a que e poss vel saber de antem ao se o m etodo vai ou n ao vai funcionar? Daremos um crit erio, chamado de Crit erio das Linhas que, se for satisfeito, implica na converg encia do M etodo. Infelizmente, da n ao poderemos concluir a armativa inversa. Isto e, e falso dizer n ao satisfaz o Crit erio das Linhas ent ao n ao converge. Pode haver sistemas em que o M etodo de Jacobi funcione por em n ao satisfa ca o Crit erio das Linhas.
(k )
4.2
Crit erio das Linhas

n
O Crit erio das Linhas pede que |aij | < |aii | j=1 j=i para todo i = 1, . . . , n. Em palavras: o valor absoluto do termo diagonal na linha i e maior do que a soma dos valores absolutos de todos os outros termos na mesma linha. importante observar que o Crit E erio das Linhas pode deixar de ser satisfeito se houver troca na ordem das equa c oes, e vice-versa: uma troca cuidadosa pode fazer com que o sistema passe a satisfazer o Crit erio. Teorema. Se o sistema linear satisfaz o Crit erio das Linhas ent ao o M etodo de Jacobi converge. Sugerimos o seguinte exerc cio, antes de passarmos ` a demonstra c ao desse Teorema.
4.2. CRITERIO DAS LINHAS
59
Exerc cio. Mostre que os sistemas lineares gerados por problemas de contorno (Se c ao 1.8) em geral n ao satisfazem o Crit erio das Linhas. Mesmo assim, monte um programa de computador que resolva o problema, baseado no M etodo de Jacobi. O que acontece? Para provar o Teorema, precisamos mostrar (usando o Crit erio das Linhas) que (k ) (k ) (k ) (0) (0) (0) as seq u encias x1 , x2 ,...,xn , formadas a partir dos chutes iniciais x1 , x2 ,...,xn , convergem para os valores procurados x1 , . . . , xn . Ent ao precisamos mostrar que
k) |x1 x1 | 0 , |x2 x2 | 0 , . . . , |x( n xn | 0 , (k ) k (k ) k k
ou, introduzindo uma nota c ao mais compacta, de forma que

k) (k ) = max{|x1 x1 |, . . . , |x( n xn |} 0 . (k ) k
De fato, iremos mostrar que (k ) decai geometricamente, isto e, existem um < 1 e uma constante c > 0 tal que (k ) ck , e isso provar a nossa arma c ao. J a para conseguir essa desigualdade, provaremos que para todo k 1 vale (k ) (k 1) . Ent ao teremos (1) (0) (2) (1) 2 (0) . . . . . . (k ) k (0) , ou seja, a constante c pode ser o pr oprio (0), que e a maior diferen ca entre o valor inicial e a solu c ao verdadeira. Por sua vez, provar que (k ) (k 1) remete a provar que, para todo i = 1, . . . , n, vale |xi
(k ) (k1)
xi | (k 1) = max |xi
i=1,...,n
xi | .
Faremos a demonstra c ao completa para i = 1, mas car a claro que o argumento valer a para todo i = 1, . . . , n, desde que escolhamos adequadamente. Precisamos escrever (k ) xi xi , lembrando que x1 =
(k )
1 (k1) (k1) k1) b1 a12 x2 a13 x3 . . . a1n x( n a11
60 e, como os x1 , . . . , xn formam uma solu c ao, x1 = Ent ao x1 x1 =

(k )
1 (b1 a12 x2 a13 x3 . . . a1n xn ) . a11
1 (k1) (k1) (k1) a12 (x2 x2 ) + a13 (x3 x3 ) + . . . + a1n (xn xn ) a11
Tomando o valor absoluto (o m odulo) e lembrando que o m odulo da soma e menor ou igual ` a soma dos m odulos, temos |x1 x1 | 1 (k1) (k1) k1) |a12 | |x2 x2 | + |a13 | |x3 x3 | + . . . + |a1n | |xn x( | n |a11 | Note, no entanto, que por deni c ao |xj xj portanto |x1 x1 | Agora denimos a constante 1 = |a12 | + |a13 | + . . . + |a1n | , |a11 |
(k ) (k1) (k )
| max |xi xi
i=1,...,n
(k1)
| (k 1) ,
|a12 | + |a13 | + . . . + |a1n | (k 1) . |a11 |
que deve ser menor do que 1, pelo Crit erio das Linhas. Ent ao |x1 x1 | 1 (k 1) . Para as outras linhas todo o procedimento e an alogo, e sempre resultar a |xi para todo i = 1, . . . , n, onde 1 i = |aii |
n (k ) (k )
xi | i (k 1) ,
|aij | . j=1 j=i
4.3. CRITERIO DE PARADA
61
O Crit erio das Linhas garante que i < 1, para todo i = 1, . . . , n. Se denirmos agora = max i ,
i=1,...,n
ent ao |xi logo (k ) (k 1) , como quer amos demonstrar!

(k )
xi | (k 1) ,
4.3
Crit erio de parada
Ao implementar o M etodo de Jacobi no computador e preciso fornecer ao computador um crit erio de parada para o programa. Isso e feito xando-se uma precis ao relativa p, que far a o programa parar (no passo k ) se |xi
(k+1)
xi | p|xi | ,
(k )
(k )
(k )
para todo i = 1, . . . , n. Ou seja, se |xi | = 0, ent ao a varia c ao relativa de um passo para outro (k+1) (k ) |xi xi | |xi | tem que ser menor ou igual a p. E se xi = 0 ent ao xi tamb em deve ser zero. E preciso ter, no entanto, bastante cuidado com a escolha de p, pois muitas vezes a velocidade de converg encia do m etodo e muito lenta. Mesmo longe da solu c ao, a varia c ao relativa das solu c oes aproximadas pode ser muito pequena.
(k ) (k+1) (k )
4.4
O M etodo de Gauss-Seidel
O M etodo de Jacobi poderia ser aplicado nos problemas de contorno da Se c ao 1.8, mas somente pelo Crit erio das Linhas n ao seria poss vel armar que haveria converg encia, pois os v ertices livres produzem equa c oes onde o elemento da diagonal e exatamente igual ` a soma dos demais termos, o que signica, na nota c ao da Se c ao anterior, que i = 1, para alguns valores de i. Experimentos num ericos evidenciam que de fato h a converg encia do M etodo de Jacobi nesses casos, embora ela seja muito lenta, principalmente se o n umero de v ertices da grade for muito grande. Embora a converg encia possa ser demonstrada matematicamente, com crit erios menos exigentes que o Crit erio das Linhas, discutiremos nesta
62
Se c ao uma varia c ao do M etodo de Jacobi, chamada de M etodo de Gauss-Seidel. Sua ec acia car a demonstrada a partir de uma hip otese mais fraca que o Crit erio das Linhas, chamada de Crit erio de Sassenfeld. N ao ser a dif cil mostrar que os problemas de contorno citados satisfazem esse crit erio, desde que se tenha um m nimo de cuidado na numera c ao dos v ertices livres. (k+1) (k+1) (k ) No M etodo de Jacobi, calcula-se o vetor (x1 , . . . , xn ) a partir do vetor (x1 , (k ) . . ., xn ) da seguinte forma: (k+1) (k ) a12 a13 a 1n 0 x1 x1 b1 /a11 a11 a11 a11 (k+1) a21 a23 a 2n ( k ) 0 a22 x2 x2 b2 /a22 a22 a22 = . . . . . . . . , . . . . . . . . . . . . . . . . an1 an2 an3 (k+1) (k ) bn /ann 0 xn xn ann ann ann ou, de forma sucinta, u(k+1) = w Bu(k) . Em cada etapa, as coordenadas x1 , . . ., xn de u(k+1) s ao obtidas todas de uma (k ) (k ) ( k ) vez s o, a partir das coordenadas x1 , . . ., xn de u . J a no M etodo de Gauss-Seidel as coordenadas atualizadas s ao imediatamente usadas na atualiza c ao das demais. Explicitamente, temos x1 1 a11 1 (k+1) x2 = a22 1 (k+1) x3 = a33 . . . . . . 1 (k+1) xn = ann
(k+1) (k+1) (k+1)
k) b1 a12 x2 a13 x3 . . . a1n x( n
(k )
(k )
b2 a21 x1 b3 a31 x1
(k+1)
k) a23 x3 . . . a2n x( n
(k )
(k+1)
a32 x3
(k+1)
k) . . . a3n x( n
bn an1 x1
(k+1)
an2 x2
(k+1)
. . . an,n1 xn1
(k+1)
Para introduzir o Crit erio de Sassenfeld e discutir a converg encia, e melhor ilustrarmos com um sistema com 4 equa c oes. Depois enunciaremos o Crit erio para sistemas com um n umero qualquer de equa c oes, e car a claro que os argumentos se generalizam. Com isso, evitaremos o excesso de elipses (os tr es pontinhos), e o crit erio emergir a de modo natural. Assim como na Se c ao anterior, queremos avaliar a diferen ca entre a aproxima c ao obtida na etapa k e a solu c ao original, e mostrar que essa diferen ca se reduz a cada etapa. Para medir essa diferen ca, tomamos (k ) = max |xi
i=1,...,n (k )
xk | ,
4.4. O METODO DE GAUSS-SEIDEL
63
onde x1 , . . . , xn representa a solu c ao verdadeira. Mais uma vez, nosso objetivo e mostrar que existe < 1 tal que (k + 1) (k ) , e para isso precisaremos mostrar que |xi
(k+1)
xi | (k )
para todo i = 1, . . . , n. Num sistema de 4 equa c oes e 4 inc ognitas temos x1 x2

(k+1)
x1 = x1 = x1 = x1 =
(k+1)
x3 x4
(k+1)
(k+1)
1 a11 1 a22 1 a33 1 a44
a12 (x2 x2 ) + a13 (x3 x3 ) + a14 (x4 x4 ) a21 (x1 x1 a31 (x1 x1 a41 (x1 x1
(k+1)
(k )
(k )
(k )
) + a23 (x3 x3 ) + a24 (x4 x4 ) ) + a32 (x2 x2 ) + a42 (x2 x2

(k+1)
(k )
(k )
(k+1)
) + a34 (x4 x4 ) ) + a43 (x3 x3

(k+1)
(k )
(k+1)
(k+1)
Da primeira equa c ao, sai |x1

(k+1)
x1 |
|a12 | |a13 | |a14 | (k ) (k ) (k ) |x2 x2 | + |x3 x3 | + |x4 x4 | , |a11 | |a11 | |a11 |
Como |xi xi | (k ), para todo i = 1, 2, 3, 4, ent ao |x1 Denimos 1 = para car com |x1
(k+1) (k+1)
(k )
x1 |
|a12 | + |a13 | + |a14 | (k ) . |a11 |
|a12 | + |a13 | + |a14 | , |a11 | x1 | 1 (k ) .
Agora levamos em conta essa u ltima inequa c ao para mostrar que |x2
(k+1)
x2 |
1 |a21 | + |a23 | + |a24 | (k ) 2 (k ) . |a22 |
Continuando, obtemos |x3

(k+1)
x3 |
1 |a31 | + 2 |a32 | + |a34 | (k ) 3 (k ) |a33 |
64 e |x4
(k+1)
x4 |
1 |a41 | + 2 |a42 | + 3 |a43 | (k ) 4 (k ) . |a44 |
Em conclus ao, mostramos que |xi logo (k + 1) ( max i )k .

i=1,2,3,4 (k+1)
xi | i (k ) ,
Se cada um dos n umeros 1 , 2 , 3 e 4 for menor do que 1, ent ao teremos (k + 1) (k ), com < 1. Para um sistema linear de n equa c oes e n inc ognitas, o Crit erio de Sassenfeld pode ser enunciado de forma indutiva, da seguinte maneira. Primeiro, 1 = |a12 | + |a13 | + . . . + |a1n | , |a11 |
como no Crit erio das Linhas. Os demais coecientes s ao denidos indutivamente. Suponha que j a tenham sido denidos 1 , 2 , . . ., i1 , para i 2. Ent ao i se dene como 1 |ai1 | + . . . + i1 |ai,i1 | + |ai,i+1 | + . . . + |ain | i = , |aii | isto e, no numerador os i s aparecem multiplicando os coecientes da linha i ` a esquerda da diagonal, enquanto que os coecientes ` a direita da diagonal s ao multiplicados por 1. O coeciente da diagonal aparece no denominador (como no Crit erio das Linhas) e n ao aparece no numerador. Exerc cio. Mostre que os problemas de contorno da Se c ao 1.8 satisfazem o Crit erio de Sassenfeld. Exerc cio. Obtenha a solu c ao com 3 algarismos signicativos do sistema linear 4x1 + 2x2 + x3 = 11 x1 + 2x2 = 3 2x1 + x2 + 4x3 = 16 usando o M etodo de Jacobi e o M etodo de Gauss-Seidel. Compare a velocidade de converg encia nos dois m etodos.
4.4. O METODO DE GAUSS-SEIDEL
65
1 2 5 x w 7
3 y z 1 3 0
Exerc cio. Considere a tabela acima. Use o M etodo de Gauss-Seidel para achar x, y, z, w tais que cada casinha que contenha uma inc ognita seja a m edia das quatro adjacentes (considerando apenas verticais e horizontais). Fa ca 4 itera c oes, partindo de (x0 , y0 , z0 , w0 ) = (0, 0, 0, 0), e arredondando para 2 algarismos signicativos ap os cada etapa.
66
Parte II
Ajuste de Fun c oes
67
Cap tulo 5
Ajuste de fun c oes

5.1 O problema do ajuste
y
Em medidas experimentais, freq uentemente nos deparamos com uma tabela de dados (xi , yi ), i = 1, . . . , N , que representamos visualmente por meio de um gr aco. Em geral, esperamos que haja uma rela c ao entre a vari avel y e a vari avel x, que seria expressa por uma fun c ao: y = f (x).
yi xi
Muitas vezes n ao dispomos de um modelo que explique a depend encia de y em rela c ao a x, de forma que n ao podemos deduzir essa fun c ao apenas de teoria. De fato, o experimento pode se dar justamente como uma forma de investigar essa rela c ao, para criar um embasamento da teoria sobre dados reais. Mesmo que o experimento n ao culmine num modelo te orico, e sempre desej avel ter um modelo preditor, quer dizer, e interessante saber prever, pelo menos de forma aproximada, em que resultar a a medida de y se soubermos x. Por exemplo, suponha que queiramos usar um el astico como dinam ometro. Para isso, xamos uma das extremidades do el astico e na outra extremidade penduramos o objeto do qual desejamos conhecer o peso. Quanto mais pesado for o objeto, mais o el astico se distender a, isso e obvio, mas n os gostar amos de obter, a partir da distens ao do el astico, um valor num erico para seu peso. Neste exemplo, x e a distens ao do el astico e y o peso do objeto (ou poderia ser o contr ario, se desej assemos prever a distens ao que o el astico teria para um determinado peso). 69
70
CAP ITULO 5. AJUSTE DE FUNC OES
Para ter uma f ormula a ser usada no dinam ometro precisamos conhecer muito bem como se comporta nosso el astico. Para isso, fazemos v arias medidas do montante da distens ao em fun c ao do peso do objeto, o que nos dar a uma cole c ao de dados (xi , yi ), i = 1, . . . , N . O que n os queremos agora e encontrar uma fun c ao y = f (x) que se desej aproxime o melhor poss vel desses dados, mas como? E avel tamb em que a f ormula de f n ao seja muito complicada, pois isso facilitaria mais tarde sua utiliza c ao como preditor. claro que o problema, colocado dessa forma, parece muito complicado. No entanto, E podemos restringir bastante o universo das fun c oes candidatas, e dentro desse conjunto menor de fun c oes procurar aquela que melhor se adapte a nossos pontos. Al em disso, e preciso estabelecer um crit erio comparativo do que seja a qualidade de uma aproxima c ao. Isto e, como decidir se uma fun c ao se adequa mais aos dados do que outra?
5.2
Os m nimos quadrados
Precisamos de uma medida num erica para avaliar a qualidade de uma aproxima c ao. Isto e, temos uma cole c ao de dados (xi , yi ), i = 1, . . . , N , e queremos avaliar o quanto uma determinada fun c ao f difere desses dados, associando a f um n umero Q(f ). Esse n umero deve ser sempre n ao-negativo, e deve ser usado de forma comparativa: se Q(f1 ) for menor do que Q(f2 ) ent ao f1 e uma aproxima c ao aos dados melhor do que f2 . Evidentemente h a um certo grau de arbitrariedade no m etodo que escolhemos para determinar Q. Aqui adotaremos o mais comum deles, que pode ser justicado por raz oes estat sticas fora do alcance destas notas, e e conhecido como qui-quadrado (sem pesos, na Se c ao 7.4 abordamos o qui-quadrado com pesos): a dist ancia de f (x) aos dados experimentais e denida como sendo y f
N
Q(f ) =
i=1
(f (xi ) yi )2 .
f(xi ) yi xi
Em palavras, temos que avaliar, para cada xi , a diferen ca entre o dado yi e o valor de f em xi , elevar essa diferen ca ao quadrado e depois somar os resultados obtidos para cada xi .
Exerc cio. Dados os pontos (2.8, 1.6), (1.6, 0.6), (3.0, 2.4), (4.5, 4.0), (6.0, 5.7) e as fun c oes ans f1 (x) = 0.8 + 0.86x e f2 (x) = 1.0 + 1.32x, qual das duas fun c oes se ajusta melhor aos dados, usando o crit erio do qui-quadrado? Desenhe as retas e os pontos em papel milimetrado antes de fazer as contas, e procure adivinhar o resultado
5.3. PARAMETROS por antecipa c ao.
71
5.3
Par ametros
Precisamos resolver tamb em a quest ao do conjunto de fun c oes aonde vamos procurar aquela que minimiza o qui-quadrado. Veja que o problema em alguns casos perde o sentido se n ao zermos isso. De fato, para qualquer conjunto de dados (xi , yi ), i = 1, . . . , N , onde os xi s nunca se repitam, sempre podemos achar um polin omio de grau N 1 tal que p(xi ) = yi , para todo i = 1, . . . , N , como vimos nas Se c oes 1.5 e 2.7. Com isso, Q(p) e zero e n ao h a como encontrar uma fun c ao melhor do que essa. O bom senso, no entanto, levar a a concluir que isso n ao vale a pena. Duas raz oes concretas podem ser dadas imediatamente: se a quantidade de dados for muito grande, ser a necess ario achar um polin omio de grau bastante grande para interpolar esses dados. Haver a a diculdade de se achar o polin omio e depois a diculdade de se utiliz a-lo. Menos objetiva do que essa raz ao e o fato bastante comum em experi encias de que sabemos muitas vezes de antem ao que tipo de fun c ao estamos procurando. Para ilustrar, vejamos alguns exemplos.
5.3.1
Densidade
Suponha que queiramos determinar a densidade de um certo material. O procedimento e claro, se dispusermos dos instrumentos adequados. Basta medir o volume de uma certa quantidade de material, sua massa e proceder ` a raz ao massa por volume. Se estivermos um pouco mais preocupados com a precis ao do resultado, faremos mais medidas e, evidentemente, tiraremos a m edia dos resultados. Se, no entanto, essas medidas forem tomadas com volumes diferentes, conv em fazer um gr aco Massa (m) vs. Volume (V). Veremos que podemos tamb em tirar um valor para a densidade a partir desse gr aco. Chamando de 0 a densidade do material, temos que m = f (V ) = 0 V , o que em portugu es pode ser assim entendido: a massa do material depende apenas de seu volume, e essa depend encia e explicitamente dada por 0 V , onde 0 e uma constante xa chamada densidade. Se admitirmos que isso e verdade podemos tentar, a partir do gr aco, achar o valor de 0 . Para achar o valor de 0 que melhor se adapta aos dados experimentais recorremos ao qui-quadrado. Olhamos (num sentido abstrato) para todas as poss veis fun c oes f (V ) = V , cujos gr acos s ao retas de inclina c ao , passando pela origem. Observe que cada fun c ao f e uma fun c ao de uma vari avel (V ), mas que depende do n umero , que e chamado de par ametro. Para cada fun c ao f podemos medir o qui-quadrado Q(f ), e depois procurar o par ametro para o qual Q(f ) e m nimo. Como varia ao longo da reta real, a fun c ao
72
Q(f ) e uma fun c ao de uma vari avel, que denotaremos simplesmente por Q(). Note agora que , que era par ametro para f (V ), agora e a pr opria vari avel de Q() = Q(f )! Podemos visualizar Q() atrav es de um gr aco. Se houver um m nimo, ele pode ser encontrado com exaQ() tid ao procurando-se 0 tal que Q (0 ) = 0 . (Por em aten c ao: Q () = 0 n ao implica necessariamente que seja m nimo, poderia se tratar de um m aximo, ou um ponto de inex ao com derivada zero. Somento o inverso e v alido: se for m nimo, ent ao Q () = 0.)
5.3.2
Caten aria
Quando suspendemos uma corrente em dois pontos de sustenta c ao, n ao necessariamente horizontalmente alinhados, ela assume um determinado formato (entre os dois pontos de sustenta c ao), dado pela fun c ao caten aria: 1 f (x) = (cosh(cx) 1) , c onde cosh e a fun c ao conhecida como cosseno hiperb olico, e e dada por ex + ex . 2 Observe que a fun c ao foi dada de tal forma que para x = 0 ela vale 0, ou seja, a origem das coordenadas e imposta como sendo o ponto de m nimo da corrente (uma justicativa para essa fun c ao ser a dada na Subse c ao 18.3.5). Na express ao de f tamb em aparece uma constante c, que e um n umero. Esse n umero n ao e conhecido a priori, pois depende de v arias coisas, a come car pela posi c ao dos pontos de sustenta c ao. O n umero c e outro t pico exemplo de um par ametro. Se usarmos sempre a mesma corrente ele pode ser modicado atrav es da mudan ca dos pontos de sustenta c ao, e e razoavelmente dif cil saber que valor ele vai assumir ao pendurarmos a corrente. No entanto, j a que se trata de uma medida experimental, poder amos medir a posi c ao da corrente em alguns pontos, convencionando x para a horizontal e y para a vertical, obtendo assim um conjunto de dados (xi , yi ), i = 1, . . . , N . Conv em, al em disso, determinar a posi c ao exata do m nimo, que ser a o ponto (x, y ) = (0, 0). Agora sabemos que cosh x =
5.3. PARAMETROS
73
a corrente assume a forma de uma fun c ao f como acima, mas nos resta saber com que valor de c isso acontece. Como proceder? Para explicitar a exist encia de um par ametro, que obviamente faz parte da deni c ao da fun c ao, adota-se a nota c ao 1 fc (x) = (cosh(cx) 1) . c Para cada fun c ao fc podemos medir o qui-quadrado Q(fc ), e depois procurar o par ametro c para o qual Q(fc ) e m nimo. Como c varia ao longo da reta real, a fun c ao c Q(fc ) e uma fun c ao de uma vari avel, que denotaremos simplesmente por Q(c).
5.3.3
Naftalinas e fun c oes ans
Uma bolinha de naftalina perde seu material, por sublima c ao, a uma taxa proporcional a sua superf cie. Como evolui o raio da naftalina em fun c ao do tempo? Se V (t) e o volume da bolinha, ent ao a hip otese implica que (t) = 4r(t)2 , V isto e, a taxa de perda de volume e proporcional ` a area da superf cie da bolinha. Por outro lado 4 V (r) = r3 , 3 de forma que 4 V (t) = V (r(t)) = r(t)3 3 e (t) = 4r(t)2 r V (t) . Juntando as duas equa c oes em V (t) e cancelando r(t)2 , camos com r (t) = , logo r(t) e uma fun c ao de derivada constante negativa, ou seja, e uma fun c ao am. Portanto r(t) = r0 t , onde r0 = r(0). Num experimento, supondo que o racioc nio acima se conrme, teremos uma s erie de dados (ti , ri ) que se dispor ao aproximadamente sobre uma reta. Cada reta n ao vertical do plano e gr aco de r(t) = a + bt, e gostar amos de achar o par (a, b) que melhor aproxime os dados experimentais, isto e, que produza o menor qui-quadrado poss vel. Desta feita, o qui-quadrado e uma fun c ao de duas vari aveis, pois para cada par (a, b) teremos uma fun c ao diferente a + bt e um qui-quadrado Q(a, b). Ao contr ario dos problemas da densidade e da caten aria, aqui aparece uma fun c ao que envolve dois par ametros.
74
5.3.4
Decaimento exponencial
Um material cont em um is otopo radioativo, e emite radia c ao, que pode ser detectada por um contador geiger. A emiss ao de radia c ao e proporcional ` a quantidade de is otopo, e e oriunda de seu decaimento. Veremos mais adiante (Subse c ao 18.3.2) que a quantidade do is otopo decresce (na maioria dos casos) exponencialmente. Ou seja, a radia c ao emitida por unidade de tempo R(t) obedece ` a lei R(t) = R0 et , onde t e o tempo (a vari avel) e R0 , s ao dois par ametros. A constante R0 e a quantidade de radia c ao emitida por unidade de tempo no instante t = 0 e > 0 representa a taxa de decaimento: quanto maior for mais r apido ele ser a. A meia-vida do is otopo e o tempo T necess ario para que sua quantidade caia pela metade. Admitindo a proporcionalidade entre a radia c ao emitida e a quantidade do is otopo, T e tal que R0 R(T ) = , 2 isto e, R0 = R0 eT , 2 equa c ao que resolvida nos d a log 2 T = . O conceito de meia-vida e muito usado para data c ao de f osseis, atrav es da determina c ao da quantidade de carbono-14, em rela c ao ao is otopo mais abundante carbono12: quanto menor for a quantidade de carbono-14, mais antigo e o material. A fun c ao a dois par ametros R(t) recai no caso am quando tiramos o logaritmo: log R(t) = log R0 t , ou seja, L(t) log R(t) e uma fun c ao am, onde e sua derivada. Os pap eis mono-log, vendidos em algumas papelarias, s ao uma maneira de se plotar o logaritmo dos dados da ordenada, log R(t), em fun c ao dos dados da abscissa, t, sem fazer contas. Isto n ao vale quando o decaimento exponencial e assint otico a um valor diferente de zero, em fun c oes do tipo f (t) = b + cet . N ao adianta tirar o logaritmo, pois o logaritmo de uma soma n ao pode ser desmembrado. Esse tipo de fun c ao tem tr es par ametros, e pode ocorrer, por exemplo, no decaimento de temperatura de um corpo em contato com um reservat orio mais frio, mas cuja temperatura n ao e necessariamente zero.
5.3. PARAMETROS
75
5.3.5
Leis de pot encia e fractais
Para fun c oes f (x) = cx , que t em dois par ametros, recomenda-se tamb em tirar o logaritmo: log f (x) = log c + log x . Desta vez, log f (x) e uma fun c ao am de log x, e o papel recomendado para se plotar os dados, em busca de uma reta, e o o log-log. Esse tipo de fun c ao aparece ligado ao conceito de fractal. Para exemplicar, tome a linha do litoral, fotografada num mapa de sat elite, e suponha que a foto do sat elite tenha boa resolu c ao, para que se possa fazer uma an alise razoavelmente detalhada. Escolha um tamanho l e divida o mapa em quadrados de tamanho l. Para facilitarmos o argumento suporemos que o mapa e quadrado e escolheremos apenas valores de l que sejam iguais ` a lateral do mapa dividida por um n umero inteiro, de forma que s o haja uma maneira de se dividir o mapa em quadrados. Em seguida contamos o n umero N (l) de quadrados que intersectam a linha do litoral. Tomamos valores de l cada vez menores, e para cada l contamos N (l). A experi encia tem mostrado que, dentro dos limites inerentes ao experimento, N (l) e proporcional a ld , onde d e a chamada dimens ao fractal daquele peda co de litoral. O nome fractal vem do fato de que d pode ser um n umero fracion ario (n ao inteiro), e o inesperado vem do fato de que se o litoral fosse uma reta ent ao d seria igual a 1! Ocorre que em geral d e maior do que 1... Exerc cio. Munido de bons mapas, fa ca o experimento acima sugerido, e coloque os dados N (l) versus l em papel log-log. Se realmente N (l) = cld ent ao voc e ver a uma reta de inclina c ao negativa, e a dimens ao fractal d ser a o valor absoluto dessa inclina c ao. Preste aten c ao em desconsiderar valores de l muito grandes ou muito pequenos, onde fatalmente n ao se ver a uma reta.
5.3.6
Gaussiana
Suponha que v arias medidas foram feitas de um mesmo fen omeno, por exemplo, o tempo de queda de um objeto que e solto, a partir do repouso, sempre da mesma altura. S ao feitas n medidas T1 , . . . , Tn , e dessas medidas constr oi-se um histograma. Para fazer o histograma, escolhe-se um intervalo t e divide-se a reta dos tempos em intervalos de tamanho t.
76
Esses intervalos podem ser numerados: I1 , . . . , IN , mas para a nunj mera c ao ser nita e preciso n ao incluir aqueles que est ao longe dos tempos medidos. Para cada intervalo Ij conta-se o n umero de medidas Ti que incidem em Ij , chamando esse n umero de nj . O histograma e I1 I2 Ij IN desenhado construindo-se barras de t base Ij e altura igual a nj . Nesse problema e em v arios outros, a tend encia do histograma e adotar o formato aproximado de um sino. O valor mais prov avel do que deve ser o tempo de queda (que servir a por exemplo para se estimar a acelera c ao da gravidade) se situa pr oximo dos intervalos que apresentam maiores valores de nj , isto e, no cume do sino. Se o experimento n ao tiver erros sistem aticos, o formato de sino ser a tanto melhor aproximado quanto mais medidas forem feitas e quanto menor forem os intervalos. E claro que a diminui c ao dos intervalos e o aumento do n umero de medidas devem ser feitos de forma acoplada, mas isso j a e outra hist oria... O leitor mais atento pode estar pensando que ao mudarmos o n umero n de experimentos ou o tamanho do intervalo b asico t n ao poderemos comparar um histograma claro que se aumentarmos o n com outro. E umero n ent ao em m edia os nj s devem aumentar, o que dar a histogramas radicalmente diferentes quando n = 500 ou n = 5000, por exemplo, mantidos iguais os ts. Por outro lado, se mantivermos n mas, digamos, diminuirmos pela metade o tamanho dos intervalos, isso far a com que em m edia os nj s caiam pela metade. Assim, seria interessante ter um histograma que n ao dependesse demais de n e t, e permitisse comparar histogramas do mesmo fen omeno constru dos de formas diferentes. Para isso, em vez de colocarmos as barras ` a altura nj , fazemos um reescalonamento da ordenada, colocando as barras ` a altura nj . n t Com isso, a soma total da area das barras ser a igual a 1, pois cada barra ter a area t e a soma da area de todas as barras ser a
N j =1
nj nj = n t n
nj 1 = n n
nj =
j =1
1 n=1. n
5.3. PARAMETROS
77
Al em disso, o histograma passa a ter a seguinte fun c ao utilit aria. Se quisermos saber a propor c ao de eventos Ti que caiu num determinado conjunto de Ij s, basta medir a area total das barras sobre esses intervalos. Esse n umero ser a um n umero entre 0 e 1 (que multiplicado por 100 dar a a porcentagem de eventos ocorridos nos intervalos considerados). ` medida em que se dimui t e se aumenta n, o formato do histograma se aproxima A cada vez mais de um formato de sino, agora xo. Esse formato de sino e tipicamente descrito pela fun c ao Gaussiana 1 (t )2 f (t) = exp{ }. 2 2 2 Observe que essa fun c ao depende de dois par ametros, e , ent ao seria mais correto denot a-la por f, (t) . O fator que multiplica a exponencial est a colocado para normalizar a fun c ao, isto e, fazer com que a area debaixo de seu gr aco seja sempre igual a 1, n ao importando os valores de e . Para entender melhor essa fun c ao, observe que ela e uma varia c ao de h(t) = exp{t2 } = e
t2
1 h(t) = et 0
2
A fun c ao h(t) tem um m aximo em t = 0 e h(0) = 1, e decresce ` a direita e ` a esquerda (simetricamente), indo a zero quando t vai a + ou . Se agora tomarmos h (t) = exp{(t )2 }, a fun c ao valer a 1 e atingir a o m aximo em t = , e decrescer a` a direita e esquerda de . Ent ao o par ametro tem o papel de deslocar o sino para a direita ou para a esquerda, conforme for positivo ou negativo, e seu valor sempre representa a posi c ao do cume.
h (t)
t
Por outro lado, se considerarmos h (t) = exp{ t2 } = exp{ 2 2 t 2

2
t } = h( ) 2
78
ent ao teremos o seguinte efeito: se 2 > 1, ent ao o valor de h (t) ser a o valor de h t em 2 , que e menor do que t. Isso far a com que a curva decres ca mais lentamente, alargando o sino. Se, ao contr ario, 2 < 1, a curva decrescer a mais rapidamente.
2 <1
2 >1
h h h(t)=h( t )
2
h
t t
0
h(t)=h( t )
2
Em resumo, combinando os dois par ametros, indica a posi c ao horizontal do cume, enquanto que indica o qu ao agudo e o pico. A altura do pico e dada pelo fator de 1 normaliza c ao , escolhido de forma que a integral de f seja igual a 1. 2 Finalmente, estando de posse de um histograma, e admitindo as considera c oes acima, queremos saber qual e o melhor par de par ametros (, ) que aproxima o formato delineado pelas barras. Para isso, podemos tratar as barras como pontos, tomando t1 , . . . , tN como os pontos centrais dos intervalos I1 , . . . , IN , e y1 , . . . , yN a altura das respectivas barras. Com esses dados, podemos sempre estimar o qui-quadrado Q(f, ), procurando o par (, ) que o minimize. A fun c ao f, encontrada serve como um preditor do experimento. Se quisermos saber em m edia qual e a propor c ao de medidas que ocorrer a entre ta e tb , bastar a encontrar a area do histograma entre ta e tb , que e aproximadamente o mesmo que calcular a integral
tb
f, (t)dt .
ta
Pode-se mostrar (isso tamb em j a e outra hist oria...) que os melhores par ametros e s ao a m edia e o desvio-padr ao da cole c ao de dados t1 , . . . , tn . Ou seja, 1 = n e 2 = 1 n
n n
ti ,
i=1
(ti )2 .
i=1
5.3. PARAMETROS
79
Isso resolve o problema de se achar o menor qui-quadrado, mas raros s ao os casos em que a solu c ao e t ao expl cita!
80
Cap tulo 6
Fun c oes lineares nos par ametros

6.1 Depend encia linear dos par ametros
Estaremos particularmente interessados nos casos em que a depend encia da fun c ao nos par ametros e linear. Colocando de forma geral, isso signica que, se a fun c ao tiver k par ametros a1 , a2 , . . . , ak , ent ao f = fa1 ,...,ak se escreve como f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) . Por exemplo, na fun c ao ax + bsenx identicamos a1 = a, a2 = b, g1 (x) = x e g2 (x) = senx. Ou sen ao na fun c ao am a + bx identicamos a1 = a, a2 = b, g1 (x) = 1 (isto e, a fun c ao identicamente igual a 1) e g2 (x) = x. Mesmo uma fun c ao linear ax tem apenas um par ametro: a1 = a e g1 (x) = x. preciso n E ao confundir entre fun c ao linear nos par ametros e fun c ao linear. Uma fun c ao linear de uma vari avel e sempre da forma ax, e reservamos o termo fun c ao am para fun c oes da forma a+bx. J a uma fun c ao linear nos par ametros n ao e necessariamente linear em x, basta ver os exemplos que demos acima. Analisemos, sob essa otica, com que tipos de problemas nos deparamos nos exemplos do Cap tulo anterior. No exemplo do c alculo da densidade temos uma fun c ao do tipo f (x) = ax, que e 1 linear no par ametro a e na vari avel x. A fun c ao da caten aria f (x) = c (cosh(cx) 1) e um exemplo de fun c ao com apenas 1 par ametro que por em n ao e linear nesse par ametro. 81
82
CAP ITULO 6. FUNC OES LINEARES NOS PARAMETROS
As fun c oes ans das naftalinas s ao lineares nos par ametros. J a o decaimento exponencial bx f (x) = ae n ao e, mas o problema pode ser transformado num problema de fun c ao am (e portanto linear nos par ametros), pois log f (x) = log a bx . J a f (x) = c + tem tr es par ametros e n ao e linear em b: se b fosse xado (n ao considerado como par ametro), ent ao sim ter amos a linearidade. A lei de pot encia f (x) = axb tamb em n ao e linear no par ametro b, mas pode ser transformada num problema linear atrav es do logaritmo. Finalmente, a fun c ao Gaussiana n ao e linear nos par ametros m edia e desviopadr ao, mas estes podem ser encontrados, para se ajustarem aos dados experimentais, da maneira tradicional. Trataremos a partir de agora apenas do ajuste de fun c oes lineares nos par ametros. V arios casos onde a depend encia no par ametro e n ao linear podem ser adaptados, mas sem d uvida deve-se pensar caso a caso. Destacam-se entre os ajustes lineares os ajustes por polin omios f (x) = a0 + a1 x + a2 x2 + . . . + ak xk e os ajustes por fun c oes trigonom etricas f (x) = a0 + a1 cos(x) + a2 cos(2x) + . . . + ak cos(kx)+ +b1 sen(x) + b2 sen(2x) + . . . + bk sen(lx) . aebx
6.2
Cont nuo vs. discreto
Vale a pena aqui introduzir um problema de ajuste ligeiramente modicado em rela c ao ao que vimos discutindo at e agora. Suponha que conhecemos determinada fun c ao y (x) num intervalo xo [c, d] e gostar amos de aproxim a-la o melhor poss vel por alguma fun c ao do tipo f (x) = a1 g1 (x) + . . . + ak gk (x) . Observe que antes t nhamos um conjunto de dados (xi , yi ), com i variando de 1 at e N . Agora nossa informa c ao se d a num conjunto innito de pontos: sabemos todos os (x, y (x)), com x variando no intervalo [c, d], porque conhecemos a fun c ao y (x). Mais uma vez precisamos de um crit erio para quanticar a proximidade entre f e os dados, ou seja, entre f e y . O correspondente qui-quadrado, neste caso, e dado por
d
Q(f ) =
c
(f (x) y (x))2 dx .
e o objetivo e procurar o conjunto de par ametros (a1 , a2 , . . . , ak ) que minimize Q(f ). Este conceito pode ser u til quando y (x) tem uma express ao conhecida mas muito complicada, e a substitu mos por uma express ao polinomial ou trigonom etrica f (x).
6.3. UM PARAMETRO
83
6.3
Um par ametro
y
Para introduzirmos o assunto gradualmente, conv em come car pelas situa c oes mais simples. Suponha que temos N dados (x1 , y1 ), (x2 , y2 ), . . ., (xN , yN ) como na gura ao lado e que queiramos ajustar uma fun c ao linear f (x) = ax a esses pontos. Isto signica que queremos achar o valor de a que melhor aproxima os pontos dados. Na gura, a reta pontilhada indica mais ou menos o que esperamos do nosso ajuste.
x
x1 x2 x3 x4 x5 x6
Em vez de tratarmos esse caso em particular, faremos uma discuss ao um pouco mais geral. Isto e, suponha que tenhamos dados como acima e queiramos ajustar uma fun c ao fa (x) = ag (x), com um par ametro e linear nesse u nico par ametro. O caso da fun c ao linear e apenas um caso particular, correspondente ` a fun c ao g (x) = x. Para cada a, podemos calcular o qui-quadrado Q(fa ), que denotaremos simplesmente por Q(a). Explicitamente
N N
Q(a) =
i=1
(fa (xi ) yi )2 =
i=1
(ag (xi ) yi )2 .
A fun c ao Q(a) deve ser assim entendida: para cada a calculamos o erro Q(a) cometido entre a fun c ao fa (x) = ag (x) e os dados yi . Nossa tarefa ser a procurar o valor a0 tal que Q(a0 ) seja m nimo. Notemos que para cada i vale
2 (ag (xi ) yi )2 = g (xi )2 a2 2g (xi )yi a + yi ,
isto e, cada termo da soma que dene Q(a) e um polin omio quadr atico na vari avel a. Como a soma de polin omios quadr aticos e um polin omio quadr atico, ent ao Q(a) tamb em e um polin omio quadr atico na vari avel a. Isto pode ser visto diretamente se desenvolvermos a soma que dene Q(a):
N N N
Q(a) =
i=1
g (xi )2
a2 2
i=1
g (xi )yi
a+
i=1
2 yi .
O gr aco de Q(a) e, portanto, uma par abola. A concavidade e para cima, pois o termo que multiplica a2 e certamente positivo, por ser uma soma de quadrados.
84
Em conclus ao, achar o m nimo da fun c ao Q(a) se resume a achar o m nimo de uma par abola. Conhecendo o c alculo diferencial, sabemos que podemos procurar o ponto de m nimo d da par abola pelo ponto que anula a derivada, ou seja, procuramos a solu c ao de da Q(a) = 0. Ent ao calcularemos a derivada de Q(a), mas n ao pela express ao acima, e sim pela express ao original, que se prestar a mais a generaliza c oes quando tivermos mais par ametros. Temos N d Q(a) = (ag (xi ) yi )2 , da a
i=1
se lembrarmos que a derivada da soma e a soma das derivadas. Al em disso, pela Regra da Cadeia, a derivada de algo ao quadrado e duas vezes esse algo vezes a derivada do algo, temos que N d Q(a) = 2g (xi )(ag (xi ) yi ) , da
i=1
lembrando que a derivada e em rela c ao ao par ametro a!!!! O fator 2 pode ser posto em evid encia no somat orio, de forma que quando igualarmos a derivada de Q(a) a zero ele desaparece. Ent ao queremos resolver
N
ag (xi )2 g (xi )yi = 0 .

i=1
Rearranjando,
N N
a
i=1
g (xi ) =
i=1
g (xi )yi ,
donde sai facilmente o valor de a: a=

N i=1 g (xi )yi N 2 i=1 g (xi )
Esse e o a0 que est avamos procurando! No caso de uma reta, a fun c ao g (x) e igual a x, e portanto a0 e dado por a0 =
N i=1 xi yi N 2 i=1 xi
Exerc cio. Invente um conjunto de dados que estejam pr oximos de uma reta passando pela origem (N = 6, por exemplo), e depois ajuste uma fun c ao ax. Num papel milimetrado, coloque os dados e depois esboce a reta obtida.
6.4. DOIS PARAMETROS
85
6.4
Dois par ametros
Suponha que queiramos ajustar uma reta aos dados experimentais, mas n ao necessariamente uma reta que passe pelo zero. Para isso, precisamos ajustar uma fun c ao na forma f (x) = a + bx, isto e, uma fun c ao am. Esse problema se insere no caso geral de ajuste de uma fun c ao com dois par ametros, que de forma geral pode ser escrita como fa1 ,a2 (x) = a1 g1 (x) + a2 g2 (x) . Raciocinando como na Se c ao anterior, queremos minimizar a fun c ao erro
N
Q(fa1 ,a2 ) =
i=1
(fa1 ,a2 (xi ) yi )2 .
Agora, por em, a fun c ao erro depende de dois par ametros, a1 e a2 , por causa da forma de f , e a denotaremos por Q(a1 , a2 ):
N
Q(a1 , a2 ) =
i=1
(a1 g1 (xi ) + a2 g2 (xi ) yi )2 .
Precisamos de 3 dimens oes para tra car um gr aco da fun c ao Q. No ponto de m nimo de Q necessariamente todas as derivadas parciais se anulam. No presente caso, elas s ao duas: em rela c ao a a1 e em rela c ao a a2 . Observe que n ao necessariamente (a princ pio, sem um exame mais aprofundado) vale o inverso, isto e, se as derivadas parciais se anularem ent ao n ao obrigatoriamente se trata de um ponto de m nimo. Portanto o par de par ametros procurado deve satisfazer duas exig encias simult aneas: Q Q (a1 , a2 ) = 0 e (a1 , a2 ) = 0 . a1 a2 Se acharmos um ponto que satisfa ca essas duas exig encias teremos um candidato a ponto de m nimo de Q(a1 , a2 ). Adiante, no Cap tulo 7, discutiremos melhor at e que ponto podemos conar que a solu c ao desse problema seja realmente o m nimo procurado. As duas equa c oes podem ser escritas explicitamente, e ap os elabora c ao as deixaremos em uma forma conveniente. Temos
N i=1 N i=1
(a1 g1 (xi ) + a2 g2 (xi ) yi )2 = 0 a1 (a1 g1 (xi ) + a2 g2 (xi ) yi )2 = 0 a2
86
Usando a Regra da Cadeia, fazemos as derivadas parciais, obtendo

N
2g1 (xi )(a1 g1 (xi ) + a2 g2 (xi ) yi ) = 0

i=1 N
2g2 (xi )(a1 g1 (xi ) + a2 g2 (xi ) yi ) = 0

i=1
Os somat orios podem ainda ser decompostos:

N N N
2a1
i=1 N
g1 (xi )2 + 2a2
i=1 N
g1 (xi )g2 (xi ) 2

i=1 N
g1 (xi )yi = 0
2a1
i=1
g2 (xi )g1 (xi ) + 2a2

i=1
g2 (xi )g2 (xi ) 2

i=1
g2 (xi )yi = 0
Rearranjando de forma adequada ca evidente que reca mos num sistema linear de duas equa c oes nas inc ognitas a1 e a2 :
N i=1 g1 (xi )g1 (xi ) N i=1 g2 (xi )g1 (xi )
a1 + a1 +
N i=1 g1 (xi )g2 (xi ) N i=1 g2 (xi )g2 (xi )
a2 = a2 =
N i=1 g1 (xi )yi N i=1 g2 (xi )yi
Todos os coecientes do sistema linear s ao tirados dos dados do problema, sendo que somente os termos independentes usam os yi s. Aqui vale a pena introduzir uma nota c ao simplicadora, que tornar a muito mais f acil a aplica c ao do acima exposto em problemas pr aticos. Denotaremos por gl , gm a soma
N
gl (xi )gm (xi )

i=1
e por gl , y a soma
N
gl (xi )yi .
i=1
Com essa nomenclatura, reescrevemos o sistema linear: g1 , g1 a1 + g2 , g1 a1 + g1 , g2 a2 = g2 , g2 a2 = g1 , y g2 , y ,
que o torna muito mais simples de memorizar! Exerc cio. Construa um conjunto de dados e ajuste uma reta, n ao necessariamente passando pela origem, usando o exposto nesta Se c ao.
LINEAR NOS PARAMETROS 6.5. AJUSTE DE QUALQUER FUNC AO
87
6.5
Ajuste de qualquer fun c ao linear nos par ametros
As id eias das Se c oes anteriores podem ser usadas em qualquer situa c ao que se queira ajustar uma fun c ao que dependa linearmente dos par ametros, dada por f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , onde k e o n umero de par ametros. A fun c ao Q, que d a o erro do ajuste, depende agora dos k par ametros a1 , . . ., ak :
N
Q(a1 , a2 , . . . , ak ) =
i=1
(a1 g1 (xi ) + a2 g2 (xi ) + . . . + ak gk (xi ) yi )2 .
Se o m nimo de Q ocorre em (a1 , a2 , . . . , ak ) ent ao Q (a1 , a2 , . . . , ak ) = 0 , al para todo l entre 1 e k , simultaneamente. Isso nos d a k equa c oes, lineares nos par ametros (sugere-se ao leitor fazer as passagens). Abaixo, mostramos as k equa c oes, usando a nota c ao introduzida ao nal da Se c ao anterior: g1 , g1 a1 + g2 , g1 a1 + . . . gk , g1 a1 + g1 , g2 a2 + . . . + g2 , g2 a2 + . . . + . . . ... gk , g2 a2 + . . . + g1 , gk ak = g2 , gk ak = . . . = gk , gk ak = g1 , y g2 , y . . . gk , y
Logo adiante veremos a raz ao de se utilizar essa nota c ao para os somat orios, id entica a utilizada para o produto escalar de dois vetores. Aqui entendemos como vetores os ` conjuntos de dados da abscissa x = (x1 , . . . , xN ), da ordenada y = (y1 , . . . , yN ), e os valores das fun c oes gl avaliados em cada um desses pontos: gl = (gl (x1 ), . . . , gl (xN )). Assim a nota c ao faz sentido!
6.6
O caso cont nuo
No caso cont nuo, tudo se passa de maneira an aloga. Suponha que temos uma fun c ao y (x) denida no intervalo [c, d], e gostar amos de procurar uma fun c ao da forma f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , que se aproxime dela o melhor poss vel. O erro do ajuste tamb em e uma fun c ao dos k par ametros, mas desta vez e calculado por meio de uma integral, ao inv es de uma soma:
d
Q(a1 , a2 , . . . , ak ) =
c
(a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) y (x))2 dx .
88
u E til comparar com o caso discreto. A soma ao longo do ndice i foi substitu da pela integral na vari avel x, dentro do intervalo [c, d]. Ao mesmo tempo, os yi deram lugar aos valores da fun c ao y (x). Mais uma vez, o ponto de m nimo de Q deve, necessariamente, anular todas as k derivadas parciais de Q, o que nos d a um crit erio de busca para esse m nimo, se resolvermos as k equa c oes resultantes. Para cada l = 1, . . . , k obtemos a equa c ao 0= Q (a1 , a2 , . . . , ak ) = al al
d c
(a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) y (x))2 dx .
Como a vari avel de integra ca o x e diferente da vari avel de diferencia c ao al , podemos intercambiar a ordem das opera c oes, obtendo
d
0=
c
2gl (x) (a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) y (x)) dx ,
e, depois de uma simples manipula c ao da equa c ao, chegando a gl , g1 a1 + gl , g2 a2 + . . . + gl , gk ak = gl , y , onde gl , gm =

c d
gl (x)gm (x)dx
d
e gl , y =
c
gl (x)y (x)dx .
Juntando-se as k equa c oes resulta um sistema linear id entico ` aquele obtido no caso discreto, exceto pelo fato de que os produtos escalares s ao calculados por uma integral, ao inv es de uma soma.
6.7
Exemplos
Para que n ao que tudo muito abstrato, fa camos dois exemplos nesta Se c ao, um para o caso discreto e um para o caso cont nuo.
6.7.1
Dinam ometro
Suponha que precisemos usar um el astico como dinam ometro, para pesar objetos. O el astico e forte, e ag uenta v arios quilos. Queremos calibrar o el astico para que a medida do peso possa ser inferida pela distens ao que ele provoca no el astico, que pode ser facilmente medida por uma r egua.
6.7. EXEMPLOS
89
Para tanto, penduramos o el astico no teto, por uma ponta, e na outra atrelamos um balde, cujo peso n ao e suciente para distender o el astico (melhor ainda, serve para colocar o el astico muito pr oximo ` a posi c ao de repouso, e esticado). Com uma jarra, colocamos agua no balde, e a cada litro colocado (x) medimos a distens ao y do el astico. Os dados encontrados est ao na tabela abaixo. i 0 1 2 3 4 5 6 7 8 9 10 11 xi (kg) 0 1 2 3 4 5 6 7 8 9 10 11 yi (cm) 0.0 1.0 5.5 13.0 23.5 34.5 42.0 47.0 50.5 53.0 54.5 55.5
Os dados da tabela s ao ct cios, mas qualitativamente se assemelham bastante a experi encias reais. Nota-se que a resposta do el astico e menor para pesos pequenos e grandes, e atinge seu m aximo aproximadamente entre 3 e 5 quilos. Discutiremos o ajuste da fun c ao y (x) (distens ao em fun c ao do peso), embora na apresenta c ao do problema est vessemos interessados na fun c ao inversa x(y ), que d a o peso em fun c ao da distens ao. Se o leitor zer um gr aco dos dados da tabela, ver a que a fun c ao peso em fun c ao da distens ao parece ser singular em 0 (tem uma derivada innita), e esse tipo de fun c ao se presta muito mal ao tipo de ajuste que faremos, baseado em polin omios. O problema desaparece se olharmos para y (x), pois esta fun c ao parece ter derivada zero em x = 0. Se pensarmos em ajustar y (x) por um polin omio, temos primeiramente que escolher seu grau. Claramente o grau desse polin omio deve ser maior do que 2, pois retas e par abolas n ao t em pontos de inex ao, como aparenta ser o caso. Polin omios c ubicos podem ter o formato desejado, mas talvez convenha ter um pouco mais de liberdade no ajuste usando polin omios de quarto grau. Para ajustar um polin omio de quarto grau temos que resolver um problema a 5 par ametros. Isso recair a num sistema linear de 5 equa c oes e 5 inc ognitas, e nesse caso conv em ter implementado um programa de computador para resolv e-lo. Como queremos apenas exemplicar as coisas, restringiremo-nos a um certo conjunto dos polin omios
90
de quarto grau, que reduzir a nosso problema a apenas 3 par ametros, embora o mais recomend avel seja seguir a primeira solu c ao. Observe que se f (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 ent ao f (0) = c0 . Como n os j a sabemos que f (0) = 0, pois a nenhum peso corresponde nenhuma distens ao, ent ao j a podemos supor que c0 = 0. Al em disso, o gr aco d a a forte sensa c ao de que f (0) = 0, e como f (0) = c1 , ter amos c1 tamb em igual a zero. Desta forma, procuraremos o menor qui-quadrado entre a fam lia f (x) = a1 x2 + a2 x3 + a3 x4 , linear em seus tr es par ametros. Para uniformizar a nota c ao com a parte te orica, temos g1 (x) = x2 , g2 (x) = x3 e g3 (x) = x4 . Agora temos que calcular os produtos escalares gl , gm , com l e m variando entre 1 e 3. Como essas fun c oes s ao pot encias de x, nossa tarefa ca razoavelmente facilitada, porque v arios dos produtos escalares ser ao iguais. Por exemplo,
11 11 4 x2 i xi == i=0 i=0
g1 , g3 = e igual a
x6 i ,
11
g2 , g2 =
i=0
3 x3 i xi .
O sistema linear ca x4 i x5 i x6 i x5 i x6 i x7 i x6 i | x7 i | x8 i | yi x2 i . yi x3 i 4 yi xi
Calculando os coecientes e resolvendo, obtemos a1 = 2.5040, a2 = 0.28427 e a3 = 0.0088925. Se o leitor tentar resolver o sistema por conta pr opria ver a que ele e extremamente mal-condicionado. A solu c ao apresentada foi obtida com 10 algarismos signicativos, e arredondada somente ao nal para 5 algarismos signicativos. Recomenda-se vericar se a fun c ao obtida f (x) = 2.5040x2 0.28427x3 + 0.0088925x4 e compat vel com os dados (pelo menos visualmente), e isso pode ser feito atrav es de seu esbo co no gr aco, junto com os dados experimentais. Este teste sempre vale a pena em problemas de ajuste, para saber se n ao houve algum erro de conta. Outro teste de compatibilidade m nimo e observar que a1 teria que ser realmente positivo, pois a concavidade do gr aco e para cima em x = 0, e que a2 teria que ser negativo, para poder criar o ponto de inex ao na regi ao x > 0.
6.7. EXEMPLOS
91
6.7.2
Cosseno aproximado por um polin omio
Para exemplicar um ajuste linear cont nuo, tomemos a fun c ao y (x) = cos x no intervalo [ 2 , 2 ]. Gostar amos de aproxim a-la tamb em por um polin omio, desta vez de grau 2. Antes de resolver o problema, vale a pena investigar o que achamos que ser a o resultado. Se f (x) = a1 + a2 x + a3 x2 e o polin omio procurado, quanto devem ser, aproximadamente, os valores dos coecientes? Como o cosseno vale 1 em x = 0, e uma fun c ao par, tem concavidade para baixo e ao imaginamos um polin omio quadr atico com caracter sticas se anula em 2 e + 2 , ent semelhantes. Ele teria que ter a1 = 1 (para valer 1 em x = 0) e a2 = 0 (por ser par abola centrada na origem). Al em disso, a3 teria que ser negativo. Para que o polin omio se anule em e preciso que 2 2 1 + a3 =0, 2 logo a3 deve estar pr oximo de 0.4. Veremos se nossos palpites se conrmam. Temos que calcular os produtos escalares, que agora s ao integrais. Por exemplo, g1 (x), g1 (x) =
2
1 1dx = .
Algumas integrais s ao nulas, pois o intervalo de integra c ao e sim etrico e os integrandos o caso de g1 , g2 e g2 , g3 , por exemplo. Precisamos calcular s ao fun c oes mpares. E
2
x2 dx =
3 , 12
x4 dx =
5 , 80
e do lado dos termos independentes

2
cos x = 2 ,
a integral de x cos x e nula, por ser mpar, e resta calcular

2
x2 cos x ,
2 duas vezes, dando 1 2 4.
usando a t ecnica de Integra c ao por Partes O sistema linear ca igual a 3 0 12 3 0 0 12 3 5 0 80 12
| | |
2 0 . 1 2 2 4
92
Da segunda equa c ao conclui-se imediatamente que a2 = 0, o que reduz o sistema linear a duas equa c oes e duas inc ognitas. Resolvendo o sistema, obt em-se a1 = 0.98016 e a3 = 0.41777, valores bem pr oximos das estimativas iniciais. O m etodo que apresentamos, apesar de simples, tem problemas quando implemen comum que os sistemas lineares a serem resolvidos sejam muito tado numericamente. E mal condicionados. Por exemplo, no caso do ajuste de uma fun c ao y (x) denida no intervalo [0, 1] por um polin omio f (x) = a0 + a1 x + . . . + ak xk , temos gl (x) = xl1 , com l = 0, . . . , k , e
1
gl , gm =
0
xl+m dx =
1 . l+m+1
Isto implica que a matriz dos coecientes do sistema linear e uma matriz de Hilbert, que e um conhecido exemplo de matriz mal condicionada, como discutimos na Subse c ao 3.5.2. No Cap tulo 8 discutiremos outra forma de se fazer ajustes, que s ao especialmente u teis para ajustes polinomiais e trigonom etricos. Antes, por em, discorreremos um pouco mais abstratamente sobre o m etodo dos m nimos quadrados, investigando, por exemplo, quest oes como a unicidade, embora o Cap tulo 8 possa ser compreendido sem o aux lio do Cap tulo 7. Exerc cio. Ajuste f (x) = a(arctan x)2 aos seguintes dados xi yi por m nimos quadrados. Exerc cio. Ajuste f (x) = a + b(x 1)2 por m nimos quadrados ` a fun c ao y (x) = x3 3x, no intervalo [0, 2]. 0.0 0.0 1.0 0.25 2.0 1.00 3.0 1.50 4.0 1.65
Cap tulo 7
Levando a s erio o produto escalar

7.1 Produto escalar e dist ancia
Vale a pena aqui uma pequena digress ao, que nos levar a a uma compreens ao melhor do problema do ajuste de fun c oes lineares nos par ametros e nos permitir a, al em disso, dispor de outras maneiras de realizar o ajuste. Primeiramente, como de praxe, concentremo-nos no problema de ajuste discreto onde, dados os pontos (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ), queremos achar o conjunto de par ametros (a1 , . . . , ak ) que minimize o qui-quadrado de f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , para um certo conjunto de fun c oes previamente xadas g1 (x), . . . , gk (x). Para entendermos o problema de forma geom etrica, consideremos o espa co RN das N -uplas u = (u1 , . . . , uN ), isto e, o espa co de vetores N -dimensional. Assim, os valores da ordenada nos pontos dados podem ser representados por um vetor de RN : y = (y1 , y2 , . . . , yN ) . Al em disso, cada uma das fun c oes gl (x), l = 1, . . . , k gera um vetor de RN , cujas coordenadas s ao os valores da fun c ao nos pontos x1 , . . . , xN : gl = (gl (x1 ), gl (x2 ), . . . , gl (xN )) . O produto escalar ou produto interno em RN e a fun c ao que associa a cada par de vetores u = (u1 , . . . , uN ) e v = (v1 , . . . , vN ) o n umero real u, v = u1 v1 + u2 v2 + . . . + uN vN . Sendo assim, ca evidente que a deni c ao que demos de gl , gm corresponde exatamente ao produto escalar dos vetores gl e gm , e gl , y e o produto escalar dos vetores gl e y . 93
94
CAP ITULO 7. LEVANDO A SERIO O PRODUTO ESCALAR
O produto escalar fornece automaticamente uma no c ao de tamanho de vetores (ou norma de vetores, no jarg ao matem atico) e, em conseq u encia, de dist ancia no espa co RN . Em R2 , o tamanho u de um vetor u = (u1 , u2 ) e dado pelo Teorema de Pit agoras: 2 acil ver com o Teorema de Pit u = u2 agoras que em R3 a norma de um 1 + u2 . E f 2 2 vetor u = (u1 , u2 , u3 ) e dada por u = u2 c ao em RN e 1 + u2 + u3 . A generaliza natural. A norma de u = (u1 , . . . , uN ) e dada por u =
2 2 u2 1 + u2 + . . . + uN ,
express ao que pode ser escrita em termos do produto escalar: u = u, u .
A no c ao de norma d a origem ` a id eia de dist ancia em RN . Olhando agora u e v como pontos, a dist ancia entre eles e a norma do vetor u v (ou v u, tanto faz). Denotaremos essa dist ancia por d(u, v ) e, explicitamente, ela vale
N
d(u, v ) =
u v, u v =
i=1
(ui vi )2 .
Podemos ainda relacionar o qui-quadrado com isso tudo. O qui-quadrado de uma fun c ao f (para esses dados), denotado por Q(f ), e dado por
N
Q(f ) =
i=1
(f (xi ) yi )2 .
Se chamarmos de f o vetor (f (x1 ), f (x2 ), . . . , f (xN )), ent ao Q(f ) = f y, f y = d(f, y )2 . Portanto, minimizar o qui-quadrado e um problema de minimizar a dist ancia ao vetor y no espa c o RN . Quando limitamos f (x) a ser uma combina c ao linear das fun c oes g1 (x), . . . , gk (x) estamos, automaticamente, limitando o vetor f a ser uma combina c ao linear dos vetores g1 , . . . , gk . Isso implica que vamos procurar f que minimiza a dist ancia ao vetor y apenas entre os vetores que s ao uma combina c ao linear dos vetores g1 , . . . , gk . Mas o que e o conjunto dos vetores que s ao combina c ao linear dos vetores g1 , . . . , gk ? Esse tipo de conjunto e chamado de subespa co vetorial (de RN ). Um subespa co vetorial e um conjunto com a seguinte propriedade: qualquer combina c ao linear de vetores do conjunto e tamb em um vetor do conjunto. Por exemplo, em R3 um subespa co vetorial
7.2. EXISTENCIA E UNICIDADE DE SOLUC OES NO AJUSTE LINEAR
95
s o pode ser de um dos seguintes tipos: a origem (dimens ao zero), isto e, o conjunto formado apenas pelo ponto (0, 0, 0); uma reta que passa pela origem (dimens ao 1); um plano que passa pela origem (dimens ao 2); ou todo o R3 (dimens ao 3). Note que todo subespa co cont em a origem, pois se u pertence ao subespa co ent ao u u = 0 tamb em N pertence. Em R tamb em existem subespa cos de todas as dimens oes variando desde zero at e N. Pois bem, o problema do ajuste se reduz agora a achar, dentro do subespa co formado ancia a um certo pelas combina c oes lineares de g1 , . . . , gl , o ponto que minimiza a dist ponto y . Disso trataremos na pr oxima Se c ao.
7.2
Exist encia e unicidade de solu c oes no ajuste linear
Nesta Se c ao discutiremos a possibilidade de solu c ao para o problema do ajuste linear, no caso discreto. Deixaremos o caso cont nuo para a pr oxima Se c ao. Lembraremos alguns fatos de Geometria Anal tica e Algebra Linear, sem demonstr a-los todos. Os que faltarem podem ser encontrados em textos cl assicos, voltados especicamente para esse assunto. Seja G um subespa co de RN . Denimos o subespa co G dos vetores de RN ortogonais a todo vetor de G, lembrando que u e v s ao ortogonais se u, v = 0. Fica para o leitor mostrar que G e um subespa co. O primeiro fato para o qual chamaremos a aten c ao e o seguinte: qualquer y RN pode ser escrito como soma de um vetor de G com um vetor de G . Para mostrar isso, tome uma base ortonormal {w1 , . . . , wr } de G (a exist encia dessa base e um dos fatos que cam de lado nessa exposi c ao, mas o leitor pode encontrar nos livros de Algebra Linear no t opico Ortogonaliza c ao de Gram-Schimdt). O que caracteriza esse conjunto como base ortonormal e o fato de ser base (todo vetor de G pode ser escrito como combina c ao linear dos vetores desse conjunto) e wi , wj ser igual a zero se i = j e igual a 1 se i = j . Agora tome o vetor
r
u=
i=1
y, wi wi .
O vetor u e uma soma de m ultiplos dos wi s (de fato, e a soma da proje c ao de y sobre as dire c oes dadas pelos wi s), portanto e um vetor de G. Por outro lado, vamos mostrar que y u e um vetor de G . Com isso, teremos y = (y u) + u , mostrando que y pode ser escrito como soma de um vetor de G (o vetor y u) com um vetor de G (o vetor u).
96
Mostrar que y u G e mostrar que y u e ortogonal a qualquer vetor de G. Um vetor qualquer g de G pode ser escrito como combina c ao linear dos vetores da base:
r
g=
i=1
i wi .
Para mostrar que y u, g = 0 basta substituir a express ao de u e a express ao de g , em termos dos vetores da base, e levar em conta que a base e ortonormal. Fica como exerc cio!!! A segunda observa c ao e que a decomposi c ao de um vetor y em uma soma de dois vetores, um de G e outro de G eu nica. Em outras palavras, se y = u + v = u +v , com u, u G e v, v G , ent ao u = u ev=v . Para mostrar isso, vamos apenas nos utilizar do fato de que o u nico vetor que pertence a ambos os subespa cos e a origem (pois se u pertence a ambos os subespa cos, ent ao u e ortogonal a ele mesmo, ou seja, u, u = 0; s o que u, u = u 2 , e o u nico vetor que tem norma zero e o vetor nulo). Se y = u + v ey=u +v ent ao 0 = y y = (u u ) + (v v ) , isto e, u u=vv . Do lado esquerdo da igualdade temos um vetor de G e do lado direito da igualdade temos um vetor de G , e eles s ao iguais. Logo eles t em que ser ambos nulos, e a arma c ao segue. O vetor u = r e a componente de y no subespa co G, tamb em chamada i=1 y, wi wi de proje c ao de y em G. A terceira observa c ao que temos a fazer e que o vetor u e o ( unico) elemento de G ` a menor dist ancia de y . Para ver a raz ao, tome um outro vetor qualquer g G. A dist ancia de g a y e a raiz quadrada de g y, g y , que mostraremos ser maior do que a dist ancia de u a y , que e a raiz quadrada de u y, u y . Para comparar as duas dist ancias, escrevemos g y, g y = g u + u y, g u + u y = g u, g u +2 g u, u y + u y, u y , mas como g u G e u y G , segue que g u, u y = 0. Al em disso, g u, g u e positivo, logo g y, g y > u y, u y , onde a desigualdade estrita conrma a unicidade. Finalmente lembremos que, no problema do ajuste, o subespa co vetorial em quest ao e o conjunto de todas as combina c oes lineares dos vetores g1 , . . . , gk . Nesse subespa co, existe um u nico elemento que minimiza a dist ancia ao ponto y , como conclu mos acima. Ser a que da podemos concluir que sempre existe um u nico conjunto de par ametros (a1 , . . . , ak ) tal que f = a1 g1 + . . . + ak gk minimiza a dist ancia a y ?
7.3. O CASO CONT INUO
97
A resposta e n ao, nem sempre!! Embora s o haja um elemento u do subespa co que minimize a dist ancia, pode haver diversas maneiras de se escrever esse elemento como combina c ao linear dos vetores g1 , . . . , gk . Para que haja apenas uma maneira de se escrever u e preciso que os vetores g1 , . . . , gk sejam linearmente independentes, isto e, que nenhum deles possa ser escrito como combina c ao linear dos outros. Por exemplo, suponha que o n umero N de pontos dados seja menor do que o n umero k de fun c oes do ajuste. N ao h a como ter k > N vetores linearmente independentes em RN , portanto certamente n ao ser au nica a solu c ao para o problema de ajuste. Outro exemplo, suponha que g1 (x) = 1, g2 (x) = x, g3 (x) = x2 , . . ., gk (x) = xk1 , e N k . Ser a que a solu c ao do problema de ajuste eu nica? A resposta e sim, mas o leitor est a convidado a justic a-la inspirando-se no que est a escrito na Se c ao 2.7.
7.3
O caso cont nuo
No caso cont nuo n ao temos um espa co de dimens ao nita (RN ) para trabalhar. Que espa co utilizamos? Ser a que as id eias das se c oes anteriores tamb em se aplicam? Veremos que sim, quase sem modica c oes! No lugar de RN consideramos um espa co de fun c oes, que podemos particularizar (para n ao dicultar as coisas). Suponha que y (x) seja uma fun c ao cont nua denida no intervalo [c, d]. Ent ao consideramos o conjunto E de todas as fun c oes cont nuas denidas nesse intervalo. Em E est ao denidas a adi c ao e a multiplica c ao por n umeros reais: se h1 e h2 s ao fun c oes de E, ent ao dene-se a fun c ao h = h1 + h2 como sendo aquela que leva x em h(x) = h1 (x) + h2 (x), e se e um n umero real, dene-se a fun c ao h = h1 como sendo aquela que leva x em h(x) = h1 (x). O conjunto E e um espa co vetorial porque essas opera c oes sempre resultam em elementos de E. A origem ou elemento nulo de E e a fun c ao identicamente nula em [c, d], e assim por diante. O espa co vetorial E n ao tem dimens ao nita porque n ao podemos escolher um n umero nito de elementos h1 , . . . , hn que gere E, isto e, tal que qualquer elemento de E possa ser escrito como combina c ao linear desses elementos. No entanto, dado o conjunto de fun c oes g1 , . . . , gk (aquelas com as quais queremos fazer o ajuste), o conjunto de todas as suas combina c oes lineares e um subespa co vetorial de dimens ao nita de E (que chamaremos de G). Podemos tamb em denir um produto interno, ou produto escalar em E. Se h e f s ao fun c oes de E, ent ao
d
h, f =
c
h(x)f (x)dx ,
que foi a deni c ao que usamos previamente, como nota c ao. Observe o leitor que nas considera c oes que zemos nas Se c oes anteriores, s o nos utilizamos das propriedades do produto interno, a saber:
98
CAP ITULO 7. LEVANDO A SERIO O PRODUTO ESCALAR 1. Simetria: u, v = v, u ; 2. Linearidade: u + v, w = u, w + v, w ; 3. Positividade: se u = 0, u, u > 0.
Essas propriedades podem ser usadas para denir o produto interno, como zemos com o determinante no Cap tulo 2. N ao e dif cil mostrar que a deni c ao acima de h, f no espa co E e a de um produto interno, e da seguem as conseq u encias que adv em diretamente dessas propriedades. O subespa co G tem dimens ao nita, logo tem uma base ortonormal, e da podemos mostrar que todo elemento y E pode ser decomposto de forma u nica como uma soma de duas fun c oes: y =f + , onde f G e G . A fun c ao f e a proje c ao de y em G, e minimiza a dist ancia de y aos pontos de G, sendo portanto uma solu c ao do problema de ajuste.
7.4
Outros produtos escalares: pesos
Pensando novamente no caso discreto (mas com conseq u encias igualmente v alidas no caso cont nuo), notamos que o c alculo do qui-quadrado pressup oe uniformidade dos dados (xi , yi ), isto e, cada dado entra com igual peso na f ormula
N
Q(f ) =
i=1
(f (xi ) yi )2 .
No entanto, e comum sabermos, em geral em medidas experimentais, que certos dados s ao mais con aveis do que outros. A atribui c ao de um peso a cada dado se daria da seguinte forma: para cada i escolhemos um certo pi > 0, que entra no c omputo do qui-quadrado da seguinte maneira:
N
Q(f ) =
i=1
pi (f (xi ) yi )2 .
Assim, quanto mais alto for wi maior ser a a contribui c ao do dado (xi , yi ) para o quiquadrado. Por conseguinte, ao procurarmos minimizar o qui-quadrado teremos que obter menores diferen cas f (xi ) yi para os valores de i tais que pi seja mais alto. Isso far a com que a fun c ao f (x) ajustada aproxime melhor esses pontos (xi , yi ) em detrimento de outros que tenham menor peso.
7.4. OUTROS PRODUTOS ESCALARES: PESOS Em medidas experimentais, em geral, o peso e dado pelo inverso da vari ancia pi = 1 2 , i
99
uma estimativa do erro que deve ser obtida de forma independente. Quando todos os dados t em estimativas de erro iguais, ent ao o m etodo de m nimos quadrados se reduz aquele que hav ` amos visto anteriormente. No caso cont nuo o peso e uma fun c ao p(x) denida no intervalo [c, d] da fun c ao dada y (x), e o qui-quadrado e dado pela express ao
d
Q(f ) =
c
p(x)(f (x) y (x))2 dx .
Se o qui-quadrado adotado tem pesos, temos que reformular a deni c ao do produto escalar entre dois vetores u = (u1 , . . . , uN ) e v = (v1 , . . . , vN ) para
N
u, v =
i=1
pi ui vi ,
e no caso cont nuo, se u(x) e v (x) s ao fun c oes do intervalo [c, d], para
d
u, v =
c
p(x)u(x)v (x)dx .
Esses produtos escalares satisfazem as propriedades que se esperam dos produtos escalares: simetria, linearidade e positividade. Toda a argumenta c ao feita anteriormente se segue de forma id entica, e o menor qui-quadrado entre a fam lia de fun c oes a k par ametros f (x) = a1 g1 (x) + . . . + ak gk (x) ser a para a k -upla (a1 , . . . , ak ) que satisfaz o sistema linear g1 , g1 a1 + g2 , g1 a1 + . . . gk , g1 a1 + g1 , g2 a2 + . . . + g2 , g2 a2 + . . . + . . . ... gk , g2 a2 + . . . + g1 , gk ak = g2 , gk ak = . . . = gk , gk ak = g1 , y g2 , y . . . gk , y
onde os produtos escalares foram modicados para incluir os pesos.
100
Cap tulo 8
Fam lias ortogonais

8.1 Deni c oes e exemplos
g1 , g1 a1 + g2 , g1 a1 + . . . gk , g1 a1 + g1 , g2 a2 + . . . + g2 , g2 a2 + . . . + . . . ... gk , g2 a2 + . . . + g1 , gk ak = g2 , gk ak = . . . = gk , gk ak = g1 , y g2 , y . . . gk , y
Podemos observar que a resolu c ao do sistema linear
seria enormemente facilitada se as fun c oes g1 , . . . , gk satiszessem a propriedade de que os produtos escalares mistos sejam nulos, isto e, gl , gm = 0 , se l = m. Isto e o mesmo que dizer que as fun c oes g1 , . . . , gk s ao todas ortogonais entre si ou, de modo similar, que a fam lia de fun c oes {g1 , . . . , gk } e ortogonal. Neste caso, ter amos gl , y , al = gl , gl e portanto k y, gl f= gl . gl , gl
l=1
Melhor ainda seria se a fam lia {g1 , . . . , gk } fosse ortonormal, isto e, gl , gl = 1 para todo l = 1, . . . , k , pois a f ormula caria
k
f=
l=1
y, gl gl . 101
102
CAP ITULO 8. FAM ILIAS ORTOGONAIS
O leitor que acompanhou atentamente o Cap tulo 7 perceber a que esta nada mais e que a f ormula da proje c ao de y no subespa co G das combina c oes lineares de g1 , . . . , gk . Vejamos a partir de agora um exemplo de como podemos fazer um ajuste de m nimos quadrados sem recorrer a um sistema linear, usando, ao inv es, o conceito de ortogonalidade. O exemplo e de um ajuste cont nuo, mas as id eias de apllicam no caso discreto. Como primeiro exemplo, xemos o intervalo [0, 1] como dom nio para as fun c oes de E (isto e, c = 0 e d = 1). Se tomarmos as fun c oes g1 (x) = 1, g2 (x) = x, g3 (x) = x2 , k 1 . . ., gk (x) = x , o subespa co G de suas combina c oes lineares consiste de todos os polin omios de grau at e k 1. N ao e dif cil mostrar que essas fun c oes s ao linearmente independentes, formando portanto uma base de G. No entanto, elas n ao s ao ortogonais entre si (e tampouco t em norma igual a 1). Para ver isso, basta tomar um dos produtos internos: 1 1 1 g1 , g2 = g1 (x)g2 (x)dx = xdx = = 0 . 2 0 0 E ent ao como construir uma base ortonormal (ou ortogonal) de G? Faremos isso inspirados no processo de Ortogonaliza c ao de Gram-Schimdt. S o para n ao confundir, denominaremos os vetores dessa nova base de f1 , . . . , fk . Imporemos primeiramente que o primeiro vetor da base seja a fun c ao constante igual a 1: f1 (x) 1. A segunda fun c ao ser a um polin omio de grau 1: f2 (x) = a + bx, mas podemos supor que b = 1, se multiplicarmos por uma constante (multiplica c oes por constantes s o mudam a norma, mas n ao inuenciam na ortogonalidade). Al em disso, queremos que ele seja ortogonal ao primeiro, ou seja, queremos que
1 1
f1 , f2 =
0
f1 (x)f2 (x)dx =
0
(a + x)dx = 0 .
Isso nos obriga a ter a = 1 2 , logo 1 f2 (x) = + x . 2 A terceira fun c ao ser a um polin omio de grau 2, cujo coeciente de ordem mais alta tamb em ser a igual a 1: f3 (x) = a + bx + x2 (a e b diferentes dos anteriores, aqui usados somente como par ametros auxiliares). Esta fun c ao deve ser ortogonal ` as duas previamente criadas, isto e, f1 , f3 = 0 , f2 , f3 = 0 . Da primeira equa c ao sai
1
(a + bx + x2 )dx = 0 ,
0
8.2. CALCULANDO POLINOMIOS ORTOGONAIS POR RECORRENCIA e da segunda sai

1 0
103
1 ( + x)(a + bx + x2 )dx = 0 . 2
As duas equa c oes reunidas formam um sistema linear nas inc ognitas a e b, e resolvendo-o ca determinada a fun c ao f3 . O processo continua do mesmo jeito, at e se chegar ` a k - esima fun c ao. Observe que n ao nos livramos totalmente dos sistemas lineares para acharmos a base ortogonal, mas nosso trabalho car a enormemente facilitado se algu em j a tiver feito isso por n os. Existem tabelas de polin omios ortogonais prontas para serem usadas! Cada fam lia leva em conta a deni c ao do produto escalar utilizado que, em nosso caso, depende somente do intervalo de integra c ao (e do peso, se for o caso). Veremos logo adiante como usar tabelas de fun c oes ortogonais. Exerc cio. Considere (x1 , x2 , x3 , x4 ) = (0.0, 0.2, 0.7, 1.3) e o produto escalar
4
f, g =
i=1
f (xi )g (xi ) .
Ache p(x) = x2 + ax + b que seja ortogonal a q (x) = x, em rela c ao a esse produto escalar. Exerc cio. Mostre que as fun c oes senx e cos x s ao ortogonais no intervalo [0, 2 ] (admitindo-se o produto escalar com peso uniforme).
8.2
Calculando polin omios ortogonais por recorr encia
Na Se c ao anterior vimos que podemos recorrer a polin omios ortogonais para facilitar a resolu c ao do problema de ajuste. No entanto,a obten c ao dos polin omios ortogonais recai na resolu c ao de v arios sistemas lineares, tarefa que pode ser t ao ou mais trabalhosa do que se n ao us assemos esses polin omios. A boa not cia, por em, e que h a uma maneira mais f acil de se calcular os polin omios ortogonais, atrav es de uma rela c ao de recorr encia. Essa rela c ao de recorr encia funciona tanto no caso discreto (com qualquer conjunto de pontos x1 , . . . , xN ) como no caso cont nuo (com qualquer intervalo de integra c ao), com ou sem pesos, ou seja, com qualquer dos produtos internos que descrevemos. Procede-se assim: xa-se f0 (x) 1 e calcula-se o primeiro polin omio f1 (x) = x + a, da mesma forma que zemos previamente. O valor de a ir a depender do produto interno, e e escolhido de maneira que f0 , f1 = 0. Agora suponha que o processo continua, como descrito na Se c ao anterior, obtendo-se polin omios f2 , f3 , f4 , etc, de graus 2, 3, 4, etc, exigindo-se apenas que o coeciente de mais alto grau seja sempre igual a 1.
104
co formado por todos os polin omios Em cada etapa, {f0 , f1 , . . . , fk } gera o subespa de grau k (mostre isso como exerc cio, com um argumento indutivo). Observe que come camos a numerar nossos polin omios a partir de zero, pois assim seu ndice assim corresponder a exatamente a seu grau, facilitando os argumentos. O ponto central e a seguinte arma c ao, que permitir a calcular fk (x), para k 2, somente com os polin omios fk1 e fk2 : para todo k 2, vale xfk1 (x) fk (x) = ak fk1 (x) + bk fk2 (x) , onde ak e bk s ao coecientes apropriados. Note que para k = 2 ela e verdadeira porque xf1 (x) f2 (x) e um polin omio de grau 1 (o termo x2 cancela, pois os coecientes de mais alto grau s ao sempre iguais a 1). Logo esse polin omio pode ser escrito como combina c ao linear de f0 e f1 , isto e xf1 (x) f2 (x) = a2 f1 (x) + b2 f0 (x) . Para k 3 o racioc nio e parecido, mas h a uma pequena diculdade a resolver. O polin omio xfk1 (x) fk (x) tem grau k 1, pois o termo xk se cancela. Segue que ele pode ser escrito como a parte dessa combina c ao linear dos vetores fk1 , fk2 , . . ., f1 , f0 . Chamaremos de f combina c ao linear que corresponde ` a combina c ao de polin omios fj com j k 3. Ent ao (x) . xfk1 (x) fk (x) = ak fk1 (x) + bk fk2 (x) + f A nossa arma c ao estar a demonstrada se provarmos que f e identicamente nulo. Como f e um polin omio de grau no m aximo k 3, basta mostrarmos que , fj = 0 f na express para todo j k 3. Isolando f ao acima, usamos o fato de que, se j k 3, ent ao fk , fj = 0, fk1 , fj = 0 e fk2 , fj = 0, restando apenas mostrar que xfk1 (x), fj (x) = 0 . A entra o pulo do gato, pois se observarmos as deni c oes dos produtos internos, veremos que xfk1 (x), fj (x) = fk1 (x), xfj (x) . Como xfj (x) tem grau j + 1, e j + 1 e menor do que k 1, ent ao xfj (x) pode ser escrito como combina c ao linear de f0 , f1 , . . ., fk2 , e o produto interno resulta nulo.
DE POLINOMIOS 8.3. UM EXEMPLO DE APLICAC AO ORTOGONAIS
105
Talvez fosse mais did atico apresentar o uso da arma c ao antes de sua demonstra c ao. Optamos pelo contr ario porque a arma c ao n ao parece ser muito obvia. Ela d a uma f ormula para fk (x) em fun c ao dos dois polin omios anteriores: fk (x) = (x ak )fk1 (x) bk fk2 (x) , sendo apenas necess ario calcular ak e bk . Para isso, fazemos o produto interno da equa c ao por fk1 (a m de obter ak ) e por fk2 (a m de obter bk ). Ou seja, de xfk1 , fk1 fk , fk1 = ak fk1 , fk1 + bk fk2 , fk1 resulta ak = e de xfk1 , fk2 fk , fk2 = ak fk1 , fk2 + bk fk2 , fk2 resulta bk = xfk1 , fk2 . fk2 , fk2 xfk1 , fk1 , fk1 , fk1
Exerc cio. Obtenha os quatro primeiros polin omios ortogonais usando o m etodo acima descrito, para o produto interno
1
f, g =
1
f (x)g (x)dx .
8.3
Um exemplo de aplica c ao de polin omios ortogonais
Gostar amos de aproximar a fun c ao y (x) = senx (em radianos) no intervalo [1, 1] por um polin omio c ubico. Fazendo o exerc cio do nal da Se c ao anterior, constatamos que qualquer polin omio c ubico pode ser gerado por combina c ao linear dos polin omios ortogonais f0 (x) = 1 , f1 (x) = x , f2 (x) = x2 1 3 , f3 (x) = x3 x . 3 5
Estamos procurando o melhor conjunto de par ametros que ajuste f = a0 f0 + a1 f1 + a2 f2 + a3 f3 ,
106
e como vimos anteriormente, f e dada pela proje c ao de y no espa co G das combina c oes lineares desses polin omios. Como eles s ao ortogonais, f e facilmente calcul avel, isto e, cada um dos coecientes al , l = 0, 1, 2, 3 e dado por al = y, fl . fl , fl
Os denominadores s ao as normas ao quadrado. Temos f0 , f0 = 2 , f1 , f1 = 2 8 8 , f2 , f2 = , f3 , f3 = . 3 45 175
Exerc cio. Termine o exemplo. Calcule os produtos y, fl , onde ser a preciso integrar xl senx (sugest ao: integra c ao por partes). Tente n ao errar nas contas. Obtenha os coecientes e explicite a fun c ao f como um polin omio c ubico. Desenhe um gr aco do polin omio obtido e compare com a fun c ao h(x) = senx. Exerc cio. Ajuste, por m nimos quadrados, um polin omio de primeiro grau ` a fun c ao h(x) = senx no intervalo [0, 1], usando polin omios ortogonais. Exerc cio. Ajuste um polin omio quadr atico ` a fun c ao ex em [1, 1] usando polin omios ortogonais.
8.4
Exemplo de an alise harm onica
Al em dos polin omios ortogonais, e muito importante tamb em a seguinte fam lia de fun c oes trigonom etricas, denidas no intervalo [0, 2 ], que e a cole c ao de todas as fun c oes do tipo
k
a0 +
l=1
(al cos lx + bl senlx) .
Todas as fun c oes 1, cos x, cos 2x, cos 3x, . . ., senx, sen2x, sen3x, etc, s ao ortogonais entre si (prove!). Portanto, se quisermos ajustar y por uma fun c ao desse tipo, teremos a0 = e bl = 1
0
1 2
y (x)dx , al =
0 2
y (x) cos(lx)dx
0
y (x)sen(lx)dx ,
para todo l = 1, 2, 3, . . . , k . O fator 21 a norma ao quadrado da em a0 corresponde ` 1 fun c ao 1, e os fatores nos demais termos correspondem ` a norma ao quadrado de cada uma das fun c oes restantes (prove tamb em isto!).
8.4. EXEMPLO DE ANALISE HARMONICA
107
Esse tipo de ajuste e chamado de an alise harm onica. O problema e que em geral a fun c ao a ser ajustada n ao se encontra denida no intervalo [0, 2 ], e mesmo assim gostar amos de aproxim a-la por fun c oes trigonom etricas. Mas a , se o intervalo for escrito como [c, d], basta usar as fun c oes 1 , sen(2l xc xc ) , cos(2l ) , l = 1, 2, . . . dc dc
Para exemplicar, faremos a an alise harm onica de y (x) = x(1 x) (uma par abola) no intervalo [0, 1]. Teremos que usar as fun c oes 1, sen(2lx), cos(2lx), l = 1, 2, . . ., que s ao ortogonais entre si. 1 Primeiro calculamos as normas ao quadrado. Temos a mais f acil, 0 1 1dx = 1. Al em disso
1
sen2 (2lx)dx =
0
1 2l
2l
sen2 udu =
0
l 2l
sen2 udu ,
0
e analogamente
1 2
cos2 (2lx)dx = 2l2

0 2 2 0
cos2 u . = 1 2, = 1 6.
As integrais 0 sen2 udu e 0 cos2 udu s ao iguais a (prove, usando que cos 2u 2 2 1 2sen u = 2 cos u 1), portanto todas as normas ao quadrado s ao iguais a excetuando-se a primeira fun c ao, que tem norma 1. Agora temos que calcular os produtos internos dessas fun c oes com a fun c ao y (x) x(1 x) = x x2 . Com a primeira fun c ao e a pr opria integral de x(1 x), que vale Ent ao 1 1 0 1 x(1 x)dx a0 = = . 1 6 1 1dx
0
Depois observamos que os bl s s ao todos nulos. Isso porque a fun c ao x(1 x) e par em rela c ao a x = 1 , e as fun c o es sen(2 lx ) s a o mpares em rela c a o ao mesmo ponto, donde 2 1 o produto das duas e mpar em rela c ao a x = 2 . Como o intervalo [0, 1] e sim etrico em 1 torno de x = 2 , ent ao
1
x(1 x)sen(2lx)dx = 0 ,
0
para todo l 1. S o nos resta obter al =

1 0 x(1
x) cos(2lx)dx
1 2
108 Com u = 2lx obtemos al = 2 (2l)2

2l
u cos udu
0
2 (2l)3
2l
u2 cos udu .
0
A primeira integral e nula, porque u cos u pode ser escrito como (u l) cos u + l cos u. O primeiro termo da soma e uma fun c ao mpar em rela c ao a x = l, que e o ponto intermedi ario do intervalo, e portanto sua integral e nula. E a integral de cos u em qualquer per odo completo tamb em e nula. Quanto ` a segunda integral, integramos por partes duas vezes e achamos a primitiva 2 u senu + 2u cos u 2senu de u2 cos u. Usando a primitiva, chegamos em al = 1 2 l2 .
Assim podemos fazer o ajuste de x(1 x) usando quantas fun c oes trigonom etricas quisermos. Se formos at e l = k , teremos f (x) = 1 1 2 6
k l=1
1 cos(2lx) l2
(o leitor est a convidado a fazer um gr aco de x(1 x) e um gr aco de f (x) para l = 2 e comparar visualmente o resultado). Est a fora do escopo deste livro demonstrar isto, mas se tomarmos k indo para innito a fun c ao de ajuste f (x) estar a cada vez mais perto da fun c ao ajustada y (x) = x(1 x). Em particular, f (0) estar a cada vez mais perto de y (0), que e igual a zero. Portanto 1 1 lim 2 k 6 Escrito de outra forma,
k k k l=1
1 =0. l2
lim
l=1
1 2 = . 2 l 6
O limite da soma e denotado como se a soma fosse innita

l=1
1 lim l2 k
k i=1
1 . l2
Assim, podemos obter uma f ormula para :
6
l=1
1 . l2
8.5. USO DE FUNC OES TABELADAS POR MUDANC A DE VARIAVEL
109
Exerc cio. Fa ca um pequeno programa de computador para ver se a f ormula acima est a correta. O computador ser a necess ario porque a converg encia para o limite e bastante lenta, e um valor de k muito grande e necess ario para se conseguir uma boa aproxima c ao de .
8.5
Uso de fun c oes tabeladas por mudan ca de vari avel
Freq uentemente conhecemos uma fam lia de polin omios ortogonais (por exemplo, usando uma tabela), ou mesmo a fam lia de fun c oes trigonom etricas acima mencionada, mas a fun c ao h(x) da qual queremos fazer o ajuste est a denida em um intervalo diferente. Ser a que ainda assim podemos aproveitar a informa c ao dispon vel? A resposta e sim, e a maneira e simples: recorremos a uma mudan ca de vari aveis am. Assumiremos que temos uma fam lia de fun c oes ortogonais f0 , f1 , . . . tabelada no ]. intervalo [c, d], e gostar amos de ter uma fam lia de fun c oes ortogonais no intervalo [ c, d Em primeiro lugar, constru mos uma fun c ao am L que leve o intervalo [ c, d] no intervalo [c, d], sobrejetivamente. Isso pode ser feito explicitamente: L(x) = c + dc (x c ) . c d
Sua inversa tamb em pode ser calculada de forma expl cita: L1 (x) = c + c d (x c) . dc
Para facilitar a nota c ao, chamaremos de o coeciente linear de L: = dc c d
Armamos que a fam lia f 0 , f1 , . . . dada por f l (x) = fl (L(x)) ]. Para isso, s e ortogonal com respeito ao produto interno usual do intervalo [ c, d o precisamos mostrar que
d c
f l (x)fk (x)dx = 0 ,
para l = k , usando a informa c ao de que, nesse caso,

d
fl (x)fk (x)dx = 0 .
c
110 Entretanto
c
f l (x)fk (x)dx =
c
fl (L(x))fk (L(x))dx
e, fazendo a mudan ca de vari aveis u = L(x) (com du = L (x)dx = dx), obtemos

) L(d L( c)
1 1 fl (u)fk (u) du =
fl (u)fk (u)du = 0 .
c
Observe que consideramos apenas o caso cont nuo, com peso uniforme. Outras situa c oes podem ser consideradas, tomando-se os devidos cuidados, mas n ao discutiremos receitas gerais aqui. Perceba tamb em que no exemplo de an alise harm onica da Se c ao passada n os zemos isso, pois originalmente hav amos apresentado fun c oes trigonom etricas ortogonais entre si no intervalo [0, 2 ], mas no exemplo zemos a an alise harm onica adaptada para o intervalo [0, 1]. Al em do mais, olhando para o que zemos, no caso de as fun c oes f 0 , f1 , . . . serem polin omios ent ao as fun c oes f0 , f1 , . . . tamb em ser ao polin omios, respectivamente de mesmo grau. Vejamos um exemplo, para ilustrar. Na Se c ao 8.3 obtivemos os polin omios ortogonais 1 f0 (x) = 1, f1 (x) = x, f2 (x) = x2 3 , f3 (x) = x3 3 x , relativamente ao produto interno 5 usual no intervalo [1, 1], por em gostar amos de fazer um ajuste polinomial no intervalo [1, 2]. Ent ao procedemos como descrito acima. Achamos primeiro a fun c ao am L que leve o intervalo [1, 2] no intervalo [1, 1], dada por L(x) = 1 + 2(x 1) = 2x 3 (procure sua pr opria maneira de ach a-la!). Os polin omios procurados s ao dados por f = f L . Portanto l l f 1 (x) f 2 (x) f3 (x) f 4 (x) = = = = f1 (L(x)) = 1 f2 (L(x)) = L(x) = 3 + 2x 1 f3 (L(x)) = L(x)2 3 = 4x2 12x + 26 3 3 f4 (L(x)) = L(x)3 5 L(x) = 8x3 36x2 + 54x 6 5x
126 5
Parte III
Equa c oes e Zeros de Fun c oes
111
Cap tulo 9
Zeros de fun c oes e o M etodo da Dicotomia

9.1 Introdu c ao
Considere o seguinte problema: dada uma fun c ao real f , achar suas ra zes, isto e, os valores de x para os quais f (x) = 0, como ilustra a gura abaixo (os pontos pretos indicam as ra zes da fun c ao representada no desenho).
Pode a princ pio parecer um problema espec co, mas ele aparece toda vez que tivermos uma equa c ao a ser resolvida. Uma equa c ao nada mais e do que uma express ao f1 (x) = f2 (x) , onde procuramos o(s) valor(es) de x que a satisfa ca(m). Ora, mas isso e o mesmo que achar as ra zes da fun c ao f (x) = f1 (x) f2 (x). Al em disso, o problema se relaciona com a invers ao de fun c oes. Por exemplo, temos uma fun c ao g (x) conhecida, mas gostar amos de determinar g 1 em certos pontos. 1 Lembrando que g (y ) e denido como sendo o valor x tal que g (x) = y temos que, para 113
114
CAP ITULO 9. ZEROS DE FUNC OES E O METODO DA DICOTOMIA
um dado y , resolver a equa c ao g (x) = y e determinar x = g 1 (y ). Resolver a equa c ao g (x) = y e o mesmo que achar um zero da fun c ao f (x) = g (x) y . Nas pr oximas Se c oes veremos alguns exemplos que ilustram o problema.
9.2
Raiz c ubica de 10
Suponha que queiramos achar um n umero x positivo tal que x 3 = 10. Esse n umero eo 3 que denominamos a raiz c ubica de 10, ou 10. Gracamente, encontramos x pela intersec c ao 3 y=x3 de {y = x } com {y = 10}, como mostra a 10 gura ao lado. Observe tamb em que o problema y=10 e equivalente a resolver a equa c ao x3 10 = 0 , ou seja, estamos procurando a raiz de f (x) = x3 10.
x
9.3
P ara-quedista ou bolinha em queda dentro d agua
Imagine um p ara-quedista que abre seu p ara-quedas no instante t = 0, da altura h0 . Ou, alternativamente, uma bolinha que parte do repouso ` a altura h0 dentro de um tubo cheio d agua, e cai sob a for ca da gravidade. Levando em conta que a queda n ao e completamente livre, isto e, o meio oferece resist encia ao movimento, quanto tempo levar a a queda do p ara-quedista ou da bolinha?
h0 h0
A diferen ca b asica entre os dois problemas e a velocidade inicial. No caso do p araquedista, ela e bastante alta, e o p ara-quedas tender a a amortec e-la at e atingir uma
9.3. PARA-QUEDISTA OU BOLINHA EM QUEDA DENTRO DAGUA
115
velocidade compat vel com a possibilidade do corpo humano suportar o choque com o solo. No caso da bolinha, a velocidade inicial e zero e cresce com o tempo. Empiricamente, constata-se que o meio oferece resist encia ao movimento com uma for ca tanto maior quanto maior for a velocidade. Num gr aco, ter amos algo como mostrado na gura ao lado. Isso implica que h a um valor de fora de velocidade v para o qual a for ca de resist encia resistencia e exatamente igual ` a for ca da gravidade. Se o mg corpo em queda est a a essa velocidade, a for ca da gravidade e a resist encia do meio se anulam entre si, e a resultante das for cas e zero. Isso implica que o corpo n ao ser a acelerado (nem dev* velocidade sacelerado), e portanto permanecer a constantemente em movimento ` a velocidade v . Por outro lado, se a velocidade inicialmente e maior do que v , ent ao a for ca de resist encia ser a maior do que a for ca de gravidade, o que far a com que o corpo reduza sua velocidade. Tudo sugere que os gr acos Velocidade vs. Tempo tenham o seguinte aspecto, dependendo da rela c ao entre v0 e v , onde v0 e a velocidade inicial do corpo.
v v0 = v* t
v0 v*
v v* v0 t
Sob a hip otese de que a for ca de resist encia do ar e proporcional ` a velocidade do corpo, em valor absoluto, e poss vel mostrar que a evolu c ao da velocidade em fun c ao do tempo e dada por v (t) v = (v0 v )e v t , onde g e a constante de gravidade ` a superf cie terrestre (vide Se c ao 18.3.3 para uma justicativa). Como interpretar essa f ormula? Ora, note que se denirmos v (t) = v (t) v , isto e, a diferen ca entre a velocidade do corpo e a velocidade de equil brio, a f ormula apenas g diz que v no instante t e igual a v no instante t = 0 multiplicado por e v t . Isso est a de acordo com as guras que hav amos desenhado.
g
116
Sabendo agora como evolui a velocidade do corpo em fun c ao do tempo, como podemos deduzir a evolu c ao da altura h(t)? Primeiro precisamos xar coerentemente as coordenadas. Temos considerado velocidades positivas para corpos em queda, logo temos que medir a altura, com a coordenada h, de cima para baixo. Por conveni encia, xaremos o zero de h como sendo ` a altura h0 , de forma que o solo ser a atingido no instante T tal que h(T ) = h0 .
h= h0 h
v v0 v* 0 h(t)
Ent ao
t
O espa co percorrido e dado pela integral da velocidade no intervalo de tempo considerado. Assim,
t
h(t) h(0) =
0
v (s)ds ,
onde h(0) = 0, pela maneira como xamos a coordenada. No gr aco de velocidades, isso corresponde a achar a area sob a curva v (t). A vari avel s e usada como auxiliar, para diferir do extremo de integra c ao.
h(t) =
0 t
(v + [v (0) v ]e v s )ds v ds + [v (0) v ]

0 T
=
0
e v s ds
g v = v t + [v (0) v ]( )(e v t 1) . g
Logo h(t) =
g v v [v (0) v ] + v t [v (0) v ]e v t . g g
Agora, se quisermos achar T tal que h(T ) = h0 , teremos que resolver a equa c ao h0 =
g v v [v (0) v ] + v T [v (0) v ]e v T . g g
9.4. O CILINDRO DEITADO Chamando v [v (0) v ] h0 g B = v v C = [v (0) v ] g v D = g A =
117
ent ao estamos procurando a raiz da fun c ao f (t) = A + Bt CeDt . Gracamente, essa raiz e dada pela proje c ao na abscissa do encontro entre a reta A + Bt com a fun c ao CeDt , vide ao lado.
A+Bt
CeDt T t
9.4
O cilindro deitado
Considere um cilindro colocado horizontalmente sobre um plano, paralelo ao solo, como na gura ao lado. O cilindro tem uma abertura, na parte superior, para a coloca c ao de agua (para dramatizar o exemplo, imagine um cont einer de petr oleo, gigante, com esse formato e nessa posi c ao). O problema e: como determinar uma escala com marca c oes que indiquem o volume de agua dentro do cilindro (e n ao simplesmente a altura do n vel da agua)? Para ver a rela c ao entre essa quest ao e o problema de achar o zero de uma fun c ao, quantiquemos um pouco mais o problema. Seja l o comprimento do cilindro e r o raio
118
de uma se c ao transversal, perpendicular ao seu eixo. O volume total do cilindro e dado por v = l r2 ,
pois r2 e a area da base e l a altura do cilindro, embora ele esteja deitado.
L A(h)
rcos() h
Se ele estiver cheio at e a altura h ent ao o volume de agua ali contido ser a l vezes a area preenchida pela agua numa se c ao transversal qualquer, que chamaremos de A(h). Note que h varia entre 0 e 2r, e que 2 A(0) = 0, A(2r) = r2 e A(r) = 1 2 r . Mas e os outros valores de h? Como achar a fun c ao A(h)?
Aqui podemos fazer um pouco de geometria: supomos que h < r (o racioc nio ser a completamente an alogo para h > r) e consideramos o angulo formado entre a vertical e a linha L. A rela c ao entre h e e simples: r cos + h = r, ou seja, h = r(1 cos ). Lembremos agora que a area de um setor de angulo pode ser achada por regra de tr es, lembrando que para = 2 a area e r2 :
1 = 2 r2 = a() = r2 . a() 2
Como mostra a gura, a area que queremos calcular e menor do que a area de dois setores de angulo (perfazendo r2 ), e o excedente ea area de dois tri angulos-ret angulos. A area excedente e o produto d1 d2 , onde d1 = r cos e d2 = r sin . Logo
A(h) = r2 r2 sin cos = r2 (
1 sin 2) , 2
9.4. O CILINDRO DEITADO
119
=
lembrando que depende de h pela rela c ao h = r(1 cos ). Essa conta sugere que talvez seja mais f acil fazer a escala ao longo do contorno do cilindro, parametrizado pelo angulo , como se fossem as marcas de um rel ogio (pode-se fazer uma escala vertical, mas as contas car ao mais complicadas).
3l 2l
=0
1l
f E acil ver que a mesma f ormula vale quando h > r (verique!). Resumindo, o volume v () depende de pela f ormula v () = lr2 ( 1 sin 2) , 2
onde varia entre 0 e . O gr aco de v () (de fato, o gr aco de v = v ()/lr2 ) est a esbo cado na gura abaixo.
v v = lr 2
v () v =
1 2
1 sen(2 v = 2 )
0
1 2
v Na gura, colocamos na vertical a vari avel v = lr aco que 2 , de forma que o gr independente do raio r e do comprimento l do cilindro. As linhas pontilhadas indicam ( ) as duas fun c oes ( e 1 c ao v () = vlr 2 . 2 sin 2 ) que somadas produzem a fun
120
CAP ITULO 9. ZEROS DE FUNC OES E O METODO DA DICOTOMIA A fun c ao v () tem derivada nula em = 0 (e por simetria em = ), pois v () = 1 1 2 cos 2 2
e v (0) = 1 cos(0) = 0 . Suponha agora que o volume total do cilindro seja da ordem de 10 litros e que correspondente a um volume de queremos marcar, no contorno do cilindro, o valor de para o qual v ( ) = 3 agua de 3 litros. Isso corresponde, no gr aco, a achar o valor de (se o volume for medido em litros). Esse e o problema de achar a raiz da fun c ao v () 3. O mesmo procedimento pode ser adotado para se calcular as marquinhas correspondentes a outros valores do volume, de forma que toda a escala possa ser constru da.
9.5
Caten aria
Mais uma vez, suponhamos uma corrente pendurada em dois pontos de sustenta c ao. Seu formato, como j a dissemos, e o do gr aco da fun c ao f (x) = 1 (cosh(cx) 1) , c
desde que a origem do plano cartesiano coincida com o ponto de m nimo da curva. Na Subse c ao 5.3.2 propusemos uma maneira de achar o par ametro c experimentalmente, atrav es de um ajuste de fun c oes, no caso n ao linear. Aqui veremos que, a partir da posi c ao de um u nico ponto da corrente (excetuando o ponto de m nimo), podemos achar o par ametro c. Para tanto, reduziremos o problema a achar o zero de uma fun c ao cuja vari avel e o par ametro c. Suponha que a corrente passa por um certo ponto (x0 , y0 ) = (0, 0). Isso signica que y0 = f (x0 ) = Ent ao cosh(cx0 ) cy0 1 = 0 , isto e, o par ametro c e, necessariamente, um zero da fun c ao F (c) = cosh(cx0 ) cy0 1 . Gracamente, podemos pensar tamb em que c e o cruzamento do gr aco de cosh(cx0 ) com o gr aco da fun c ao am 1 + cy0 . Da convexidade do cosseno hiperb olico segue que 1 (cosh(cx0 ) 1) . c
9.6. METODO DA DICOTOMIA
121
h a apenas dois pontos onde as fun c oes coincidem, e um deles e c = 0. Como c n ao pode ser zero (pois aparece no denominador, na express ao da fun c ao f ), ent ao c ca completamente determinado uma vez dado (x0 , y0 ). Para calcular c explicitamente, no entanto, e necess ario algum m etodo num erico.
9.6
M etodo da Dicotomia
Nesta Se c ao apresentaremos o M etodo da Dicotomia, que e um m etodo intuitivo de se achar a raiz de uma fun c ao. M etodos mais sosticados ser ao estudados nos pr oximos Cap tulos. O primeiro passo e isolar a raiz x dentro de um intervalo onde a fun c ao seja mon otona: ou crescente ou decrescente. Sejam a0 e b0 os extremos desse intervalo. Observamos ent ao que a fun c ao assume valores com sinais opostos nesses extremos, isto e,
f
f (a0 ) f (b0 ) < 0 .
a0
x* b0 No desenho ao lado, f (a0 ) < 0 e f (b0 ) > 0. Seria ao contr ario se no desenho a fun c ao fosse decrescente. Esse primeiro passo depende muito do conhecimento pr evio que se tem a respeito da fun c ao. Em seguida passamos a cercar a raiz com intervalos, cada intervalo com um tamanho igual ` a metade do tamanho do intervalo anterior. Para ilustrar o m etodo, usemos a fun c ao f (x) = x3 20. Observe que achar x tal que f (x ) = 0 e o mesmo que achar a raiz c ubica de 20.
1. Escolhemos a0 = 2, pois 23 20 < 0 e b0 = 3, pois 33 20 > 0. 2. Escolhemos o ponto m edio do intervalo, ao qual chamaremos provisoriamente de c0 : a0 + b0 c0 = . 2 Neste caso, c0 = 2.5. 3. Testamos o valor de f em c0 : f (c0 ) = f (2.5) = 2.53 20 = 4.375 < 0 . Conclu mos que x est a` a direita de c0 , o que nos faz denir o novo intervalo [a1 , b1 ] = [c0 , b0 ] .
122
4. Repetimos o procedimento 2), agora com o intervalo [a1 , b1 ], ou seja, calculamos o ponto m edio a1 + b1 c1 = = 2.75 . 2 5. Avaliamos f em c1 : f (c1 ) = f (2.75) = 2.753 20 = 0.796875 > 0 . Conclu mos que x est a` a esquerda de c1 , o que nos faz denir o novo intervalo [a2 , b2 ] = [a1 , c1 ] . Prosseguindo, colocamos os dados numa tabela, indo at e a d ecima etapa:
3 n an bn cn rn en rn 0 2 3 2.5 2.5 0.5 15.6 1 2.5 3 2.75 2.75 0.25 20.8 2 2.5 2.75 2.625 2.63 0.13 18.2 3 2.625 2.75 2.6875 2.69 0.07 19.5 4 2.6875 2.75 2.71875 2.72 0.04 20.12 5 2.6875 2.71875 2.703125 2.703 0.016 19.75 6 2.703125 2.71875 2.7109375 2.711 0.008 19.93 7 2.7109375 2.71875 2.71484375 2.715 0.005 20.013 8 2.7109375 2.71484375 2.712890625 2.7129 0.0020 19.966 9 2.712890625 2.71484375 2.713867188 2.7139 0.0011 19.989 10 2.713867188 2.71484375 2.714355469 2.7144 0.0006 19.9996
Na tabela, calculamos os extremos e centros dos intervalos usando todas as casas decimais dispon veis na calculadora. No entanto em cada etapa s o sabemos com certeza que a raiz est a entre an e bn , portanto o erro em assumi-la com o valor de cn e bn an . 2 Os valores de rn s ao arredondamentos de cn at e uma certa casa decimal, com um erro en garantindo que a raiz esteja entre rn en e rn + en . O crit erio para a determina c ao de rn e en foi o seguinte. Primeiro determinou-se o erro 1 ( b a ), com todas as casas decimais poss veis. De posse desse valor, escolheu-se n 2 n o n umero de algarismos signicativos para expressar en , 1 ou 2. O crit erio dessa escolha baseou-se num certo grau de razoabilidade, de forma que: (i) o primeiro ou os dois primeiros algarismos signicativos de en sejam uma dentre as possibilidades 10, 11, 12,
9.6. METODO DA DICOTOMIA
123
13, 14, 15, . . ., 24, 25, 3, 4, 5, 6, 7, 8 e 9; (ii) tomando rn como o arredondamento de cn na casa decimal correspondente ` au ltima casa decimal de en , o intervalo [rn en , rn + en ] contenha o intervalo [an , bn ]; (iii) en seja o menor poss vel. 1 Por exemplo, para n = 4 temos 2 (b4 a4 ) = 0.03125, ent ao tomamos e4 = 0.04 (n ao podemos usar 0.03, sen ao a condi c ao (ii) pode n ao ser satisfeita). Em seguida preciso a arredondamos c4 = 2.71875 na segunda casa decimal, obtendo r4 = 2.72. E testar a condi c ao (iii): 2.72 0.04 = 2.68 < a4 e 2.72 + 0.04 = 2.76 > b4 , tudo bem. Se essa condi c ao n ao fosse satisfeita, en teria que ser ligeiramente aumentado, respeitando (i), (ii) e (iii) ao mesmo tempo.
124
Cap tulo 10
M etodos iterativos
10.1 Plano geral
Neste Cap tulo discutiremos a determina c ao de zeros de fun c oes por meio de m etodos iterativos. Os m etodos iterativos (n ao s ao interativos, aten c ao!) s ao realizados da seguinte maneira. 1. Dada a fun c ao f da qual se procura uma raiz x , fabrica-se uma fun c ao auxiliar (quais caracter sticas ela deve ter e como ach a-la, veremos aos poucos). 2. Arrisca-se um palpite inicial x0 , e a partir desse palpite constr oi-se uma seq u encia de valores x0 , x1 , x2 , . . ., onde o valor xk+1 depende do valor xk pela rela c ao xk+1 = (xk ) . 3. Se a escolha de e de x0 for feita com algum crit erio, espera-se que a seq u encia {xk }k convirja para x , como mostra esquematicamente a gura abaixo. 4. Com algum crit erio de parada, em fun c ao da precis ao que se deseja na resposta, toma-se um dos xk s como aproxima c ao de x .
x*

x1
x2 x3
x0
125
126
10.2
Pontos xos
A primeira observa c ao pertinente a respeito do plano geral tra cado acima e sobre o tipo de ponto que deve ser x , em rela c ao ` a aplica c ao (em rela c ao ` a fun c ao f j a sabemos: x e uma raiz de f ). Supondo que, no m nimo, seja uma fun c ao cont nua, notamos que, se xk tende a x , ent ao (xk ) deve tender a (x ) ( e a deni c ao de fun c ao cont nua, pense nisso!). Por outro lado tem-se que (xk ) = xk+1 , ent ao a seq u encia (xk ) e a pr opria seq u encia dos xk , adiantada no ndice k de uma unidade. Como (xk ) tende a (x ), ent ao xk tende a (x ). Ora, mas se xk tende ao mesmo tempo para x e para (x ), a conclus ao e que x e (x ) t em que ser iguais! Para resumir, uma condi c ao necess aria para que o plano geral de achar a raiz x de f por itera c ao de uma fun c ao funcione e que, no m nimo, valha (x ) = x . Esta condi c ao, no entanto, n ao e suciente para que o plano d e certo, como veremos mais adiante. Todo ponto x para o qual se tenha (x) = x e chamado de ponto xo da fun c ao . O que acabamos de concluir e que a fun c ao auxiliar deve ter a raiz x de f como ponto xo. Um ponto xo da fun c ao e localizado pelo cruzamento do gr aco de y = (x) com o gr aco de y = x, a diagonal, ao contr ario das ra zes de f , que s ao localizadas pelo cruzamento do gr aco de f com a abscissa (y = 0). Na gura abaixo, por exemplo, a fun c ao esbo cada tem 2 pontos xos (suas quatro ra zes n ao nos interessam).
Exerc cio. Determine os pontos xos (se houver) de (x) = x2 x + 0.5. Esboce o gr aco de . Construa a seq u encia de iterados xk+1 = (xk ) a partir de x0 = 0. A
10.3. FUNC OES AUXILIARES CANDIDATAS
127
seq u encia converge? Se converge, converge para algum ponto xo? Fa ca o mesmo para x0 = 2, e depois para x0 = 1.5. Exerc cios de itera c ao cam bem mais f aceis com uma boa calculadora cient ca. Algumas vezes e preciso iterar bastante, por isso conv em reduzir ao m aximo o n umero de opera c oes na m aquina em cada etapa. Em algumas calculadoras, existe uma vari avel ` de mem oria que guarda a resposta do u ltimo c alculo. As vezes essa vari avel pode ser colocada na f ormula completa. Por exemplo, em algumas calculadoras CASIO essa vari avel chama-se Ans. Procede-se assim, para x0 = 1.5 e (x) = x2 x + 0.5: (i) escreve-se 1.5 e aperta-se EXE, fazendo com que 1.5 seja armazenado em Ans; (ii) escreve-se Ans2 Ans + 0.5, aperta-se EXE e aparece a resposta 1.25, que e o x1 (e esta resposta e armazenada em Ans, substituindo o valor anterior); (iii) apertando EXE novamente a calculadora far a a mesma conta, s o que a partir do novo valor de Ans, que e o x1 , assim aparecer a o valor de x2 ; (iv) a partir da e s o ir apertando EXE que v ao aparecendo os xk s, em seq u encia. Se a calculadora n ao dispuser desses recursos, mesmo assim ela deve ter maneiras de armazenar valores em mem oria. Guarde o resultado xk na mem oria e procure us a-la na hora de calcular xk+1 . Calculadoras que permitem colocar a f ormula inteira antes de fazer a conta s ao as melhores para isso. H a tamb em, e claro, a possibilidade de se fazer um pequeno programa em computador para realizar essas contas. Qualquer linguagem que lide facilmente com n umeros reais serve para isso. Exerc cio. Tome (x) = 3.1x(1 x) e x0 = 0.3. O que acontece com a seq u encia de iterados? Exerc cio. Tome (x) = 4x(1 x) e x0 = 0.3. O que acontece com a seq u encia de iterados?
10.3
Fun c oes auxiliares candidatas
natural nos questionarmos se podemos achar uma fun E c ao tal que (x ) = x se n ao conhecemos exatamente x , anal estamos desenvolvendo um m etodo cuja nalidade u ltima e justamente achar x ! Acontece que por um pequeno truque isto e perfeitamente poss vel, e de maneira surpreendentemente simples! Para come car, tome a fun c ao f (x) e adicione a ela a fun c ao identidade, isto e, dena (x) = x + f (x) . Note que se x for uma raiz de f ent ao (x ) = x + f (x ) = x ,
128
isto e, x e um ponto xo de . Inversamente, se x for um ponto xo de ent ao x ser a tamb em uma raiz de f . Em conclus ao, se for denida dessa maneira ent ao as ra zes de f coincidir ao exatamente com os pontos xos de ! O mesmo acontecer a se denirmos (x) = x + f (x) , onde e um n umero real qualquer, ou mesmo (x) = x + (x)f (x) , onde (x) e uma fun c ao (cont nua) qualquer. Como n ao devemos nunca dispensar um desenho, em tudo o que fazemos na matem atica, vejamos como podemos esbo car (x) = x + f (x) diretamente a partir do esbo co do gr aco da fun c ao f . Se for positivo, ao multiplicarmos a fun c ao f por estaremos encolhendo (se < 1) ou dilatando (se > 1) o gr aco na dire c ao vertical. Nas ra zes, como a fun c ao vale zero, o efeito e nulo. Se for negativo o gr aco ser a, al em disso, reetido em torno da abscissa. Depois dessa multiplica c ao temos apenas que somar o gr aco resultante ` a diagonal. Na gura ao lado esbo camos o processo com igual a 1 2.
(x) = x
1 2
f(x)
f(x)
1 2
f(x)
Exerc cio. Considere f (x) = sen(x) (n ao se esque ca, x em radianos!). Esboce o gr aco de (x) = x + f (x). Esboce tamb em o gr aco de (x) = x 1 f ( x ) . Itere e a partir 2 da condi c ao inicial x = 1 e compare os resultados.
10.4
Visualizando itera c oes
importante se ter no E c ao visual do processo de itera c ao de uma fun c ao , e para isso veremos como fazer itera c oes usando apenas o esbo co da fun c ao. Obviamente haver a um ac umulo de erro quando zermos itera c oes sucessivas, mas os desenhos nos ajudar ao
10.4. VISUALIZANDO ITERAC OES
129
a melhor compreender os diversos tipos de comportamentos presentes nos m etodos iterativos. A primeira coisa que devemos fazer e desenhar o gr aco da fun c ao, e em seguida a diagonal, que nos auxiliar a. Depois escolhemos uma condi c ao inicial x0 ( e apenas um ponto da abscissa), e o objetivo e encontrar a posi c ao, na abscissa, de x1 = (x0 ). Movendo-nos verticalmente, encontraremos o gr aco de , na posi c ao (x0 , (x0 )). Como (x0 ) = x1 , este e o ponto (x0 , x1 ), ou seja, j a encontramos x1 , mas ele e a segunda coordenada do ponto encontrado. Nosso objetivo, no entanto, e encontrar o ponto da abscissa (x1 , 0).
(x)
(x1 , 0)
(x0 , 0)
(x1 , x1)
(x0 , x1)
Ent ao movemo-nos horizontalmente, isto e, mantendo xa a segunda coordenada, a partir de (x0 , x1 ) at e encontrar a diagonal. Na diagonal, os valores da primeira e da segunda coordenada s ao iguais; como a segunda foi mantida sempre igual a x1 , ent ao esse ponto ser a (x1 , x1 ), e com um movimento vertical determinamos x1 sobre a abscissa. Para a determina c ao de x2 o procedimento e an alogo: movimento vertical at e encontrar o gr aco, depois movimento horizontal at e encontrar a diagonal e nalmente movimento vertical at e encontrar a abscissa. E assim por diante! Observe que podemos poupar um pouco de trabalho quando fazemos uma s erie de itera c oes sucessivas. De x0 vamos verticalmente at e o gr aco (` a altura x1 ), depois horizontalmente at e a diagonal (` a posi c ao horizontal x1 ). Depois, de acordo com o que foi descrito acima, ir amos verticalmente at e a abscissa (` a altura zero) e ent ao verticalmente at e o gr aco (` a altura x2 = (x1 )). Ora, a composi c ao de dois movimentos verticais ainda e um movimento vertical, que poderia ser feito de uma vez s o. Ou seja, logo ap os nos movermos horizontalmente at e a diagonal, encontrando (x1 , x1 ), podemos nos mover verticalmente at e o gr aco, encontrando (x1 , x2 ). Em seguida continuamos, indo horizontalmente at e a diagonal, no ponto (x2 , x2 ), e depois verticalmente at e o gr aco, no ponto (x2 , x3 ), e assim por diante. Coletando as primeiras coordenadas de cada ponto de encontro com o gr aco, teremos a seq u encia de iterados a partir de x0 . Veja na gura abaixo uma ilustra c ao desse procedimento.
130
(x)
x4 x3 x1 x2 x0
Exerc cio. Fa ca um esbo co de = 2x(1 x) e itere a partir das seguintes condi c oes iniciais: (i)x0 = 0.5; (ii) x0 = 0.0; (iii) x0 = 0.25; (iv) x0 = 0.5; (v) x0 = 0.75; (vi) x0 = 1.0; (vii) x0 = 1.25. O que acontece com cada seq u encia de iterados? Converge, n ao converge? D a para inferir o que acontecer a com o restante das condi c oes iniciais? Exerc cio. Como se explica um ponto xo no procedimento acima? Exerc cio. Se a regra fosse verticalmente at e a diagonal e horizontalmente at e o gr aco, o procedimento estaria bem denido? A regra seria clara? Exerc cio. Uma pr e-imagem de um ponto y pela fun c ao e um ponto x tal que (x) = y . Muitas vezes um ponto tem mais do que uma pr e-imagem. Usando um gr aco de , invente um m etodo r apido para achar todas as pr e-imagens de um ponto dado (suponha que o ponto dado foi indicado sobre a abscissa).
10.5
Iterando perto de pontos xos
Vejamos agora, atrav es de esbo cos, o que acontece com a seq u encia de iterados quando a condi c ao inicial est a pr oxima de um ponto xo. A pergunta a ser respondida e: ser a que ela converge para esse ponto xo? A resposta e de suma import ancia, uma vez que nosso objetivo e encontrar o ponto xo por aproxima c oes sucessivas. Sem isso, n ao teremos condi c ao de preencher o terceiro item do nosso plano geral, tra cado no come co do Cap tulo. Para come car, adotaremos como hip otese que o ponto xo x seja isolado, isto e, que numa vizinhan ca (pequena) de x n ao exista nenhum outro ponto xo. Isto tamb em signica que perto de x o gr aco de s o toca a diagonal no pr oprio x .
10.5. ITERANDO PERTO DE PONTOS FIXOS Na gura ao lado mostramos os ingredientes b asicos de que necessitaremos: o gr aco de , pr oximo a x , a diagonal e o que chamaremos de diagonal secund aria em x , que e a reta de inclina c ao 1 passando por (x , x ). Para simplicar, assumiremos que tamb em a diagonal secund aria s o seja intersectada pelo gr aco de no ponto (x , x ). Essas hip oteses n ao s ao demasiadamente restritivas: e raro encontrar um caso em que elas n ao sejam respeitadas.
131
x*
x*
Assim, podemos imaginar diversas possibilidades para o gr aco de , de acordo com a posi c ao em rela c ao ao cone duplo formado pela diagonal e pela diagonal secund aria, como mostra a gura abaixo. Nos diagramas, hachuramos o que queremos convencionar como a parte interna do cone, entre as duas diagonais.
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(l)
132
Nos casos (d), (e), (f ) e (g) o gr aco de tangencia a diagonal em x . Isto tem um signicado, se for uma fun c ao diferenci avel: (x ) = 1, pois basta lembrar que a derivada e a inclina c ao da reta tangente ao gr aco. Nos casos (h), (i), (j) e (l) o gr aco de tangencia a diagonal secund aria em x , ou seja, (x ) = 1. No caso (a), a tangente ao gr aco de em x e uma reta de inclina c ao menor do que 1 (pois e menor do que a inclina c ao da diagonal) e maior do que 1 (ou seja, menos negativa do que a inclina c ao da diagonal secund aria). Portanto 1 < (x ) < +1 no caso (a). No caso (b) temos (x ) < 1 e no caso (c) temos (x ) > +1 . Em resumo, podemos considerar 3 possibilidades, de acordo com o m odulo de (x ): (i) | (x )| < 1, caso (a); (ii) | (x )| > 1, casos (b) e (c); (iii) | (x )| = 1, casos (d) a (l). Uma esp ecie de rec proca tamb em e v alida: sempre que | (x )| for menor do que 1 o gr aco de na vizinhan ca de x assumir a o aspecto de (a), e sempre que | (x )| for maior do que 1 ele assumir a o aspecto de (b) ou (c), de acordo com o sinal. No entanto, se | (x )| for igual a 1, haver a todas as possibilidades mostradas de (d) at e (l). Nosso objetivo e fazer uma an alise da converg encia das seq u encias x0 , x1 = (x0 ), x2 = (x1 ), . . . para o ponto xo x , quando x0 e escolhido perto de x , por em restringiremos nossa argumenta c ao apenas aos casos (a), (b) e (c). A raz ao e que, primeiramente, alguns dos outros casos podem ser facilmente analisados de forma semelhante (e outros n ao t ao facilmente), como mostram os exerc cios propostos abaixo. Al em disso, cada caso apresentar a um comportamento distinto: pode haver converg encia ou n ao, e em alguns casos a resposta depende at e de saber se x0 est a` a esquerda ou ` a direita de x ! No caso (a) note que, se xk estiver pr oximo a x ent ao (xk ) estar a dentro do cone, isto e, xk x < (xk ) x < x xk , (xk < x ) ou xk x > (xk ) x > x xk , (xk > x ) pois y = x + (x x ) e y = x (x x ) s ao as diagonais principal e secund aria passando por x . Isto e o mesmo que |(xk ) x | < |xk x | ,
10.5. ITERANDO PERTO DE PONTOS FIXOS
133
a mais perto de x do que est a xk . O mesmo valer a de xk+1 ou seja, xk+1 = (xk ) est para xk+2 , de modo que os iterados xk , xk+1 , . . . se aproximar ao cada vez mais de x (veja exerc cio abaixo para tornar mais rigoroso este argumento). Outra maneira (mais intuitiva) de se chegar ` a mesma conclus ao e esbo cando a evolu c ao dos iterados no desenho, como mostra a gura abaixo, em duas situa c oes: (x ) > 0 e (x ) < 0. Observe pela gura que quando (x ) < 0 os iterados xk , xk+1 , . . . se alternam ` a direita e ` a esquerda de x , quando est ao sucientemente pr oximos de x .
x* x*
x* xk xk+1 xk+2 xk+3 xk xk+2 x* xk+3 xk+1
Nos casos (b) e (c) ocorre o oposto: tem-se |xk+1 x | > |xk x | , o que impossibilita a aproxima c ao a x e, em verdade, afasta os iterados de x . Isto pode ser visto na gura abaixo.
x*
x*
x* xk+3 xk+2 xk+1 xk xk+2
x* xk xk+1 xk+3
134
Quando o ponto xo e tal que a seq u encia de iterados iniciada em sua proximidade converge para ele, dizemos que o ponto xo e atrator. Se, ao contr ario, os iterados se afastam, mesmo que xk esteja arbitrariamente pr oximo de x , ent ao dizemos que o ponto xo e repulsor. Da argumenta c ao acima, conclu mos que se | (x )| < 1 ent ao x e um ponto xo atrator, enquanto que se | (x )| > 1 ent ao x e um ponto xo repulsor. Se | (x )| = 1 n ao e poss vel prever o comportamento dos iterados, a n ao ser que se tenha outras informa c oes sobre , em geral ligadas a derivadas de ordem mais alta. Veja mais sobre isso nos exerc cios abaixo. Exerc cio. Esboce a fun c ao (x) = e4 x e determine seus pontos xos, dizendo quem e atrator e quem e repulsor apenas atrav es do desenho do gr aco. Exerc cio. Considere a equa c ao ex = x 1. Investigue se (x) = ex + 1 pode ser u til para achar a solu c ao. Ache-a. Exerc cio. Este exerc cio e um conjunto de observa c oes dirigidas a respeito dos casos n ao discutidos, onde a derivada de no ponto xo tem m odulo 1. O leitor deve tentar se convencer ao m aximo de cada uma delas, usando desenhos, principalmente. O exerc cio ajudar a a xar melhor a teoria discutida nesta Se c ao. 1. Nos casos (e) e (i) o ponto xo e atrator. 2. Nos casos (g) e (l) o ponto xo e repulsor. 3. Nos casos (e), (i), (g) e (l) a segunda derivada de e nula. A terceira derivada n ao pode ser negativa em (i) e em (g), e n ao pode ser positiva em (e) e (l). 4. A segunda derivada n ao pode ser negativa em (d) e (h), e n ao pode ser positiva em (f) e (j). 5. No caso (d), o ponto xo e atrator pelo lado esquerdo e repulsor pelo lado direito. J a em (f) ele e atrator pelo lado direito e repulsor pelo esquerdo. 6. Os casos (h) e (j) s ao os mais delicados. H a altern ancia de lado na itera c ao, pois a derivada e negativa. Olhando para o caso (h), h a aproxima c ao para o ponto xo a cada vez que se passa pelo lado direito e afastamento a cada vez que se passa pelo lado esquerdo, e n ao e claro a priori qual vai prevalecer (no caso (j) ocorre o oposto). Tente fazer desenhos caprichados criando casos onde h a atra c ao e outros onde h a repuls ao, sempre no caso (h), e depois tente o mesmo para o caso (j). Exerc cio. Este exerc cio e opcional, para aqueles que gostam de um pouco mais de rigor nos argumentos. Observamos que no caso (a) ocorre |xk+1 x | < |xk x |, o que implicaria que a seq u encia |xk x | vai a zero (equivalente a dizer que xk tende a
x
10.6. TEOREMA DO VALOR MEDIO E VELOCIDADE DE CONVERGENCIA 135 x ). Isso no entanto n ao tem que ser necessariamente verdade, quer dizer, nem toda seq u encia em que cada termo e menor do que seu predecessor vai a zero. Por exemplo, 1 a seq u encia 1 + k , que tende a 1 e e decrescente. No entanto, se usarmos as hip oteses estabelecidas de in cio, isso ser a verdade. Para isso, verique as seguintes observa c oes: 1. Se a seq u encia for mon otona, isto e, car s o do lado direito ou s o do lado esquerdo, e se |xk x | n ao for a zero, ent ao a seq u encia tem que convergir para um outro ponto x que n ao e x . 2. Pelo que vimos na Se c ao 10.2, o ponto x teria que ser um outro ponto xo de x , mas n os j a t nhamos isolado uma vizinhan ca de x sem nenhum outro ponto xo. Ent ao esta situa c ao n ao pode ocorrer. 3. J a se a seq u encia n ao for mon otona, pode acontecer tamb em de que |xk x | tenda para um valor maior do que zero, e xk que alternando de lado, tendendo para dois pontos simetricamente posicionados em torno de x . Mostre que nesses pontos o gr aco de tocaria a diagonal secund aria, contradizendo tamb em as hip oteses.
10.6
Teorema do Valor M edio e velocidade de converg encia
A Se c ao anterior pode ser resumida na seguinte arma c ao: se x e ponto xo e se | (x )| < 1 ent ao x e atrator, e se | (x )| > 1 ent ao x e repulsor. Vamos demonstrar essa arma c ao de maneira mais simples, sem usar o desenho, usando o Teorema do Valor M edio. A demonstra c ao tamb em nos ajudar a a saber qual e a velocidade de converg encia no caso de o ponto xo ser atrator. A u nica hip otese adicional ser a que a derivada de e uma fun c ao cont nua, hip otese que se verica na maioria dos casos. Chamemos de a derivada de em x . Como a derivada de e uma fun c ao cont nua, ela deve assumir valores pr oximos de perto de x . Em outras palavras, podemos isolar uma vizinhan ca de x , de prefer encia sim etrica, de tal forma que para qualquer x escolhido dentro dessa vizinhan ca ter-se- a | (x) | muito pequeno. Suponha agora que e um n umero de m odulo menor do que 1 ( e o caso em que queremos mostrar que x e um atrator). Ent ao, podemos encontrar uma vizinhan ca de x em que | (x) | seja t ao pequena que tamb em | (x)| seja menor do que 1, ou mesmo menor do que um certo tamb em menor do que 1, para todo x na vizinhan ca. Nosso interesse e comparar |xk+1 x | com |xk x |. Como xk+1 = (xk ) e x = (x ) ent ao queremos comparar |(xk ) (x )| com |xk x |. Ora, isso tem toda a
136 cara de Teorema do Valor M edio, pois
(xk ) (x ) = (ck )(xk x ) , para algum n umero ck entre xk e x . Se xk estiver na vizinhan ca acima referida, ent ao ck tamb em estar a, e teremos | (ck )| menor do que . Logo |(xk ) (x )| |xk x | . Ent ao a cada itera c ao a dist ancia de xk a x e multiplicada por um n umero menor do que , o que caracteriza uma converg encia (ao menos) geom etrica (lembre-se de uma P.G. de raz ao menor do que 1). O importante de se escolher uma vizinhan ca sim etrica em torno do ponto xo e que isso garante que o ponto xk+1 cair a ainda dentro da mesma vizinhan ca, e o argumento poder a ser repetido ad innitum. Logo adiante (na Subse c ao 10.8) falaremos um pouco mais sobre este assunto. Observe tamb em que a mesma igualdade do Teorema do Valor M edio mostra que, ` a medida que os iterados se aproximam do ponto xo, a raz ao entre |xk+1 x | e |xk x | se aproxima de | | = | (x )|. Pois como (ck ) = xk+1 x , xk x
e ck , estando espremido entre x e xk , tamb em se aproxima de x , ent ao (ck ) se aproxima de (x ), por causa da continuidade da derivada. Exerc cio. Observe que se | (x )| > 1 ent ao o Teorema do Valor M edio implica que n ao pode haver converg encia para o ponto xo. Exerc cio. Tome a fun c ao (x) = e4 x. Iterando a partir de x0 = 0, ache seu ponto xo x mais ` a esquerda, mas guarde os iterados. Calcule (x ) e compare com as raz oes xk+1 x . xk x Exerc cio. Este exerc cio e para transformar a informa c ao sobre a velocidade de converg encia em informa c ao sobre o tempo de converg encia. O exerc cio fornecer a apenas uma resposta aproximada, baseada em suposi c oes que nem sempre s ao satisfeitas. Suponha que a dist ancia da condi c ao inicial x0 ao ponto xo x seja da ordem de D. Suponha tamb em que a condi c ao inicial esteja numa vizinhan ca do ponto xo onde a fun c ao e aproximadamente linear, com inclina c ao dada pela derivada de no ponto xo, o que signica que a taxa geom etrica de aproxima c ao e mais ou menos constante. Calcule o
x
10.6. TEOREMA DO VALOR MEDIO E VELOCIDADE DE CONVERGENCIA 137 ancia p de n umero de itera c oes k necess arias para que xk esteja mais perto do que a dist x . poss Exerc cio. E vel existir uma fun c ao cont nua que tenha apenas dois pontos xos, ambos atratores? Justique sua resposta.
10.6.1
O caso (x ) = 0: converg encia quadr atica
No caso em que (x ) = 0 a raz ao entre |xk+1 x | e |xk x | se aproxima de zero, o que signica que a taxa de converg encia e melhor do que qualquer raz ao geom etrica. Podemos ir mais al em no Teorema do Valor M edio, aplicando-o novamente desta feita na derivada de , e obter uma informa c ao mais precisa sobre a taxa de converg encia. Para aplicar o Teorema do Valor M edio na derivada de assumiremos que seja duas vezes diferenci avel. Depois acrescentaremos a hip otese de que essa segunda derivada tamb em seja cont nua. Retomando a desigualdade obtida no Teorema do Valor M edio, temos xk+1 x = (ck )(xk x ) . Mas se (x ) = 0 ent ao podemos usar o Teorema do Valor M edio. Existe dk entre ck e x tal que (ck ) = (ck ) (x ) = (dk )(ck x ) . Portanto |xk+1 x | = | (dk )| |ck x | |xk x | . Como ck est a entre xk e x , ent ao |ck x | |xk x |; al em disso, supondo que seja cont nua, os valores de (dk ) estar ao muito pr oximos de (x ), e portanto estar ao limitados por uma constante C , em m odulo. Ent ao, se xk estiver nessa vizinhan ca, ter-se- a |xk+1 x | C |xk x |2 , que motiva a denir o regime de converg encia com o nome de converg encia quadr atica. Um ponto xo com derivada nula e tamb em chamado de super-atrator, por causa da rapidez com que se d a a converg encia. Exerc cio.Chame de a0 a dist ancia de x0 ao super-atrator x , e de ak a dist ancia de xk a x . Suponha que em todos os iterados vale a estimativa de converg encia quadr atica, com constante C . Mostre que k 1 ak (Ca0 )2 , C e que para se aproximar xk de x da dist ancia p s ao necess arias ln Cp 1 ln ln 2 ln Ca0
138
itera c oes. Compare com a converg encia geom etrica.

1 Exerc cio. Itere (x) = x + senx e (x) = x + 2 senx, a partir da condi c ao inicial x0 = 1, e compare as velocidades de converg encia, ` a luz do que foi exposto acima.
10.7
Calculando zeros de fun c oes - a escolha de
Podemos neste momento retornar ao plano geral tra cado no come co do Cap tulo para achar uma raiz x de uma fun c ao f , pois j a temos todos os ingredientes para isso: uma maneira de se construir fun c oes que tenham x como ponto xo, por exemplo, escrevendo (x) = x + f (x); e crit erios para saber se o ponto xo x e atrator ou n ao. Nosso objetivo e explorar a escolha de na express ao (x) = x + f (x) de modo que a raiz procurada x seja um atrator e o plano geral funcione. De acordo com o que dissemos, e preciso que a derivada (x ) tenha m odulo menor do que 1. A derivada de sabemos calcular, em fun c ao da derivada da f : (x) = 1 + f (x) , Observe que se f (x ) for igual a zero ent ao (x ) ser a igual a 1, e a n ao poderemos saber se h a converg encia ou n ao. Na verdade podemos saber sim, se desenharmos o gr aco de . Por exemplo, tome a fun c ao f (x) = (x 1)2 , que tem raiz x = 1. Essa raiz e ponto xo de (x) = x + 0.1f (x) = 2 f(x) = x + 0.1(x1) x + 0.1(x 1)2 , como mostra a gura ao lado. Sabemos que se iniciarmos a itera c ao com 1 x0 perto e ` a esquerda de 1, ent ao a seq u encia convergir a para o ponto xo. Ocorre no entanto que nos casos onde a derivada e 1, mesmo havendo converg encia ela se d a de forma muito lenta, que n ao chega nem a ser geom etrica. Mais adiante veremos como superar este problema. Consideremos ent ao o caso f (x ) = 0. Ora, pedir que | (x )| seja menor do que 1 e o mesmo que pedir que 1 < 1 + f (x ) < +1 .
10.7. CALCULANDO ZEROS DE FUNC OES - A ESCOLHA DE Ou seja deve estar entre 0 e f
2 ( x ) .
139
Exerc cio.Verique o intervalo de escolhas poss veis de para se calcular a raiz x = de f (x) = senx usando a fun c ao de itera c ao (x) = x + senx. Conra a resposta usando desenhos. Notemos agora que, apesar de haver todo um intervalo de poss veis escolhas de , h a uma escolha preferencial, que faz com que a derivada de no ponto xo seja nula e s ele seja super-atrator. E o escolher de modo que 1 + f (x ) seja igual a zero, isto e, = 1 . f (x )
Essa escolha de garantiria converg encia r apida, mas o leitor atento pode perguntar: como escolher em fun c ao de f (x ) se para saber f (x ) precisamos conhecer x , que e justamente o que estamos procurando? A pergunta faz todo sentido pois, apesar de estar claro em teoria que valor de e necess ario para o m etodo funcionar, n ao e claro na pr atica como proceder, uma vez que n ao dispomos do valor de f (x ). H a duas respostas para esta quest ao, cuja eci encia vai depender do tipo de problema que se quer resolver. Uma das respostas ser a o M etodo de Newton, do qual falaremos no pr oximo Cap tulo. Em vez de usarmos a fun c ao f (x) (x) = x , f (x ) a qual n ao podemos determinar por n ao conhecermos x , usamos (x) = x f (x) . f (x)
Se x estiver pr oximo de x ent ao f (x) estar a pr oximo de f (x ), e jogar a um papel semelhante. Em cada itera c ao, o fator que multiplica f (x), em vez de xo e igual a f (1 e vari avel e igual a f 1 c ao e do tipo x ) , (x) . Observe que essa fun (x) = x + (x)f (x) , introduzida previamente, com o u nico problema que (x) = f 1 ao e cont nua onde (x) n a derivada se anula. Voltaremos ao assunto adiante. A outra resposta n ao e t ao f acil de dar, e em linhas gerais consiste no seguinte procedimento. Lembrando que nosso objetivo e achar tal que 1 < 1 + f (x ) < +1, suponha que consigamos isolar a raiz da fun c ao num intervalo [a, b] e mostrar que, dentro desse intervalo, sua derivada f (x) satisfaz 1 < 1 + f (x) < +1 para todo x
140
no intervalo. Ora, se satisfaz para todo x [a, b] em particular satisfaz para x , e ent ao estaremos prontos para usar esse valor de . Ent ao tudo o que queremos e que 2 < f (x) < 0 , x [a, b] . Em primeiro lugar, temos que escolher [a, b] de forma que sua derivada n ao se anule: ou e sempre negativa ou e sempre positiva. Se a derivada f (x) for negativa, mas muito alta em valor absoluto, basta escolher positivo e pequeno. J a se a derivada f (x) for positiva e alta em valor absoluto, basta multiplicar por negativo e pequeno. Exerc cio. Considere a equa c ao f (x) = ex cos x = 0. O objetivo do exerc cio e trabalhar com uma fun ca o (x) = x + f (x) para achar a menor raiz positiva de f , admitindo o fato de que essa raiz, que chamaremos de x , seja a u nica localizada ao parece f acil de se mostrar, mas se quiser tente!). estritamente entre 0 e 2 (isso n 1. Mostre que f (1) < 0 e f ( a no intervalo 2 ) > 0, o que indica que a raiz procurada est [a, b] = [1, 2 ]. 2. Estime valores m e M tais que m f (x) M para todo x [1, a preciso investigar em detalhe o comportamento das 2 ] (ser 2 x derivadas de e e cos x no intervalo considerado). 3. Use o item anterior para escolher de modo que 1 < (x) < 1, para todo x [1, 2 ]. 4. Determine qual extremo est a mais pr oximo de x : x = 1 ou x = 2? 5. Use esse extremo como condi c ao inicial e itere, para determinar a raiz com precis ao 4 de 10 . Exerc cio. Compare as fun c oes de itera c ao 1 , 2 , 3 e 4 dadas abaixo, no que diz respeito ` a ec acia de se obter a solu c ao da equa c ao cos x = x2 (considerando-se condi c oes iniciais apropriadas). Ache a solu c ao, com o maior n umero de casas decimais poss veis. 1 (x) = cos x 2x2 , 2 (x) = cos x + x2 , 1 xsenx + cos x + x2 3 (x) = x + (cos x x2 ) , 4 (x) = . 8 senx + 2x
2
10.8. A ESCOLHA DE X0
141
10.8
A escolha de x0
Observe que para saber o qu ao pr oximo da raiz o ponto inicial x0 pode ser escolhido, podemos adotar o seguinte procedimento. Em primeiro lugar, usar o M etodo da Dicotomia para cercar um intervalo pequeno [a, b] que contenha a raiz, e depois eventualmente encolher mais ainda o intervalo para que a derivada de f n ao se anule, como comentado na Se c ao anterior. Isso permitir a escolher e construir para fazer as itera c oes. Essas considera c oes servir ao tamb em para o M etodo de Newton, do qual falaremos no pr oximo Cap tulo. O importante e conseguir o intervalo [a, b] de forma a isolar a raiz e obter que | (x)| < 1 em todo o intervalo. Isso far a com que |xk+1 x | |xk x | , se xk estiver em [a, b] (conclus ao que pode ser obtida mesmo sem conhecermos x ). Observe que o problema n ao termina neste ponto. Uma vez escolhido x0 dentro do intervalo [a, b], com a condi c ao sobre a derivada satisfeita, ent ao teremos certeza que x1 estar a mais pr oximo da raiz x do que x0 . Isso n ao garante, no entanto, que x1 esteja dentro do intervalo [a, b], e se isso n ao x0 x* x acontecer, n ao poderemos mais saber se x2 1 se aproximar a de x mais do que x1 (vide a b gura ao lado). Uma solu c ao para esse obst aculo e tomar x0 como sendo o extremo do intervalo [a, b] que esteja mais pr oximo da raiz x . Por exemplo, suponha que b seja esse extremo, isto e, |b x | < |a x | . Tomando x0 = b, teremos |x1 x | < |b x |, logo x1 [a, b]. O mesmo acontecer a com os termos seguintes da seq u encia, pois todos eles estar ao a uma dist ancia da raiz menor do que a dist ancia de b a essa raiz. S o que esse racioc nio s o funcionar a na pr atica se soubermos determinar qual extremo do intervalo [a, b] est a mais pr oximo da raiz. O truque e o seguinte: olhamos para o ponto m edio do intervalo e chamamos esse ponto de x0 (pelo menos provisoriamente: o chute inicial x0 ser a de fato o extremo do intervalo que estamos tentando determinar). Calculando x1 , sabemos que a dist ancia de x1 ` a raiz x ser a menor do que a dist ancia de x0 a x . Ent ao basta ver se x1 cai ` a direita ou ` a esquerda de x0 .
142
Se x1 > x0 ent ao conclu mos que x > x0 (logo o extremo direito do intervalo est a x* x 1 mais pr oximo da raiz), pois se x estivesse x 1 > x0 a esquerda de x0 e x1 ` ` a direita, ent ao a b x0 = a+b ter amos |x1 x | > |x0 x |, absurdo, 2 pois em [a, b] a dist ancia ` a raiz deve diminuir! Note que o argumento funciona mesmo que x1 caia fora do intervalo [a, b]. x x* 1 Se x1 < x0 ent ao conclu mos que x < x0 . x x < 1 0 a O argumento e o mesmo que no caso anb x0 = a+b terior. 2 Se porventura x1 = x0 , ent ao x0 e a raiz (prove!), e ambos os extremos est ao a igual dist ancia dela.
10.9
Um crit erio de parada
Existem v arios crit erios de parada, isto e, regras para se considerar um determinado iterado xk como a aproxima c ao desejada para a raiz procurada x . Os crit erios de parada s ao importantes primeiramente por raz ao de coer encia (imagine uma extensa lista de ra zes sendo calculadas numericamente, e preciso uniformizar a maneira de encontr a-las), e em segundo lugar para automatizar os procedimentos. Alguns crit erios de parada, como aquele que vamos ver aqui, fornecem tamb em a margem de erro da aproxima c ao. O crit erio do qual falaremos aqui funciona quando, no entorno da raiz, a fun c ao e mon otona, isto e, se x1 < x < x2 ent ao os valores de f (x1 ) e f (x2 ) t em sinais opostos, ou seja, f (x1 )f (x2 ) < 0 . Suponha que queiramos determinar uma aproxima c ao de x com precis ao p. Isto signica que gostar amos de encontrar um valor x tal que a verdadeira raiz x esteja no intervalo [ x p, x + p] (a interpreta c ao do que signica exatamente a precis ao p varia de acordo com o gosto do fregu es, esta e a que adotaremos neste livro). Como estamos supondo que f e mon otona, isso s o acontecer a se f assumir sinais opostos em x p e x + p. Bom, ent ao nada mais temos a fazer do que iterar a fun c ao auxiliar , obtendo valores x0 , x1 , . . . , xk , . . ., e para cada iterado xk calcular f (xk p)f (xk + p) . Se esse produto for negativo, ent ao podemos considerar xk como sendo a aproxima c ao desejada.
10.9. UM CRITERIO DE PARADA
143
claro que devemos prestar um pouco de aten E c ao para o n umero de casas decimais que usamos nas contas, e se xarmos xk talvez queiramos arredondar para uma casa decimal compat vel com a precis ao desejada. Isso pode ser feito com bom senso, mas se tivermos que automatizar para um programa de computador conv em tomar certos cuidados. Para exemplicar, seja f (x) = ex x+1 = 0, que tem u nica raiz (veja isto esbo cando o gr aco!). Usaremos (x) = ex + 1 como fun c ao auxiliar, para achar a raiz x com precis ao p = 102 . Partindo de x0 = 0, obtemos os iterados. Temos que usar no m nimo um n umero de casas decimais compat vel com a precis ao desejada, por exemplo 4 parece ser razo avel. Neste caso, faremos as contas com todas os algarismos signicativos da calculadora, e cada etapa arredondaremos para a quarta casa decimal, a m de minimizar os erros. Ent ao x1 = 2, x2 = 1.1353, x3 = 1.3213, x4 = 1.2668, x5 = 1.2817, x6 = 1.2776, x7 = 1.2787. Como f (1.27) > 0 e f (1.29) < 0 ent ao podemos considerar a aproxima c ao x = 1.28. Observe que pelo crit erio de parada j a poder amos parar em x5 , no entanto ao arredondarmos para 1.28 conv em fazer o teste novamente. Os iterados x6 e x7 foram a rigor desnecess arios.
144
Cap tulo 11
O M etodo de Newton
Como j a mencionado no Cap tulo anterior, o M etodo de Newton consiste em fazer a itera c ao f (xk ) xk+1 = xk , f (xk ) a partir de uma condi c ao inicial bem escolhida x0 , e assim obter aproxima c oes sucessivas de alguma raiz x de f .
A maneira de achar x1 em fun c ao de x0 , e igualmente depois de achar xk+1 em fun c ao de xk , tem uma forte inspira c ao geom etrica: olhamos para a reta tangente ao gr aco de f no ponto (xk , f (xk )) e denimos xk+1 como sendo o ponto de encontro dessa reta com a abscissa.
f(x0 ) f x* x 1 x0
Vejamos como a f ormula acima se relaciona com esta id eia geom etrica. Para isso, notamos que a inclina c ao da reta tangente ao gr aco de f no ponto (xk , f (xk )) e dada pela derivada f (xk ). A u nica reta com inclina c ao f (xk ) que passa por (xk , f (xk )) e dada por y = f (xk ) + f (xk )(x xk ) . O ponto xk+1 e denido como o valor de x para o qual y = 0, isto e 0 = f (xk ) + f (xk )(xk+1 xk ) , 145
146 ou
CAP ITULO 11. O METODO DE NEWTON
f (xk ) , f (xk ) desde que f (xk ) = 0 (hip otese que assumiremos gratuitamente, para facilitar os argumentos). A t tulo de exemplo apliquemos o m etodo no exemplo f (x) = x3 20, para compararmos com o M etodo da Dicotomia. Para f (x) = x3 20 temos f (x) = 3x2 , ent ao a f ormula de itera c ao ca xk+1 = xk xk+1 = xk que neste caso pode ser simplicada para xk+1 = 2x3 k + 20 . 3x2 k x3 k 20 , 3x2 k
Em primeiro lugar chutamos o valor de x0 , por exemplo x0 = 3, e obtemos x1 : x1 = 2 33 + 20 74 = = 2.7407407 . 3 32 27
claro que a u E ltima igualdade n ao e de fato uma igualdade, pois um arredondamento foi efetuado. Neste exemplo, usaremos 7 casas decimais depois da v rgula. A partir de x1 calculamos x2 , e assim por diante. Os resultados se encontram na tabela abaixo. n xn x3 n 0 3 27 1 2.7407407 20.6 2 2.7146696 20.0056 3 2.7144176 19.9999996 4 2.7144176 19.9999996 Surpreendente! Em poucos iterados chega-se a um valor com precis ao de muitas casas decimais! Podemos testar a precis ao desse valor usando o mesmo princ pio do M etodo da Dicotomia. Por exemplo, queremos saber se essa resposta tem precis ao de 0.0000001. Ent ao vericamos se os n umeros f (2.7144175) e f (2.7144177) t em sinais opostos. Ora, f (2.7144175) = 2.71441753 20 = 0.0000026 < 0 e f (2.7144177) = 2.71441773 20 = 0.0000018 > 0 , donde conclu mos que 3 20 = 2.7144176 0.0000001 .
11.1. QUANDO O METODO DE NEWTON FUNCIONA?
147
11.1
Quando o M etodo de Newton funciona?
Ser a que o M etodo de Newton sempre funciona? Ser a que qualquer chute inicial levar a a uma seq u encia x1 , x2 , x3 , x4 , . . . , xk , . . . convergindo ` a raiz x procurada? Se formulada a pergunta desse jeito, a resposta e n ao! Vejamos dois argumentos bastante simplistas para justicar o porqu e. O primeiro: imagine uma fun c ao com duas ra zes, f (x) = x2 4, por exemplo. Para qualquer escolha de x0 , a seq u encia x1 , x2 , x3 , x4 , . . . , xn , . . . s o poder a convergir para uma das ra zes! A outra fatalmente ser a esquecida, e isso pode acontecer quando menos esperarmos!
O segundo: mesmo que s o haja uma raiz x e que x0 esteja razoavelmente perto dela, a seq u encia x1 , x2 , x3 , x4 , . . . , xn , . . . pode se afastar! Veja um exemplo na gura ao lado.
f x* x0 x 1
No entanto, quase sempre podemos garantir que se x0 for escolhida sucientemente pr oxima de x ent ao a seq u encia x1 , x2 , x3 , x4 , . . . , xn , . . . convergir a para x . O quase sempre se refere ` as hip oteses que devemos exigir que a fun c ao f satisfa ca. Por exemplo, pediremos sempre que f seja uma fun c ao diferenci avel, com derivada cont nua. Mais ainda, devemos examinar como f se comporta perto da raiz (infelizmente, nem sempre isso e poss vel sem se conhecer a raiz!!). Na hip otese de que f (x ) = 0 e que a condi c ao inicial x0 seja escolhida sucientemente perto da raiz ent ao a converg encia ser a bastante r apida, mais r apida do que qualquer seq u encia geom etrica. De fato, a converg encia e (no m nimo) quadr atica, se usarmos os resultados deduzidos no Cap tulo anterior: basta mostrar que a derivada da f ( x) fun c ao de itera c ao (x) = x f (x) , calculada na raiz x , vale zero. Ora, usando as regras usuais de deriva c ao, obtemos (x) = f (x)f (x) , f (x)2
e como f (x ) = 0, segue que (x ) = 0. No caso f (x ) = 0 n ao podemos aplicar o racioc nio diretamente, porque teremos uma divis ao zero sobre zero. Esse caso ser a analisado na pr oxima Subse c ao. Antes disso, vale a pena fazer alguns exerc cios. Exerc cio. Use o M etodo de Newton para resolver as seguintes equa c oes:
148 1. 2 + 3x = ex 2. x5 + 3x2 x + 1 = 0 3. cos x + 0.5x = 0
4. 0.3x4 + 0.2x3 + x2 + 0.1x + 0.5 = 0 5. 0.3x4 x3 x2 2x + 2 = 0 Aten c ao: alta probabilidade de pegadinhas.
f
Exerc cio. Considere a fun c ao cujo gr aco est a mostrado na gura acima, ` a esquerda. 1. (1.0) Descreva, justicando (pode usar desenhos nas justicativas!), o que acontece com a seq u encia x0 , x1 = (x0 ), . . . , xk = k (x0 ), . . . para cada uma das cinco possibilidades: (i) x0 = 0.0; (ii) x0 = 1.0; (iii) x0 = 1.5; (iv) x0 = 2.2; (v) x0 = 2.7. 2. (1.5) A fun c ao pode ser a fun c ao de itera c ao de M etodo de Newton aplicado ` a fun c ao f acima, ` a direita? D e duas justicativas essencialmente diferentes para sua resposta. Exerc cio. Esboce uma fun c ao que tenha ra zes a e b (com a < b), mas para o qual exista uma condi c ao inicial x0 entre a e b tal que o M etodo de Newton produza um resultado divergente (apesar de o M etodo estar bem denido para x0 e todos os seus iterados posteriores). Justique sua resposta da melhor forma que puder. Exerc cio. Encontre numericamente o valor de x tal que ex = x, com precis ao p = 10 7 .
2
11.1. QUANDO O METODO DE NEWTON FUNCIONA? Exerc cio. Considere a caten aria dada por g (x) = 1 (cosh(cx) 1) . c
149
Repare que g (0) = 0, isto e, a curva passa por (x, y ) = (0, 0). Se a curva tamb em passa por (x, y ) = (1, 1), qual e o valor de c? Exerc cio. Considere f (x) = x5 , que tem u nica raiz x = 0. Se o M etodo de Newton for aplicado a partir da condi c ao inicial x0 = 1, qual ser a o menor valor de k para o qual xk < 1020 ? Exerc cio. Considere a fun c ao f da gura abaixo. Se usarmos o M etodo de Newton para essa fun c ao, teremos que considerar iterados de (x) = x f (x) . f (x)
Esboce o gr aco de , com base na intui c ao geom etrica sobre o M etodo de Newton. N ao esque ca de desenhar: abscissa, ordenada, diagonal e os pontos a, b e c.
11.1.1
Retirando a hip otese f (x ) = 0
A hip otese de que a derivada de f seja diferente de zero na raiz x n ao e necess aria para se mostrar converg encia, e pode ser substitu da por uma hip otese bem mais fraca, desde que o chute inicial x0 esteja sucientemente pr oximo de x . Antes de deduzir resultados gerais, vejamos o que acontece com alguns exemplos. Consideremos f (x) = ax2 , que tem raiz em x = 0, mas a derivada de f na raiz e nula. Montando a fun c ao de itera c ao do M etodo de Newton obtemos (x) = x f (x) ax2 =x , f (x) 2ax
150
que a princ pio n ao estaria denida em x = 0. No entanto, as itera c oes s ao tomadas fora do zero, onde est a bem denida. Al em disso, a express ao pode ser simplicada de modo a esconder o problema: x (x) = . 2 Agora a derivada de no zero de f e igual a 1 u encia de iterados 2 , que signica que a seq ir a convergir para a raiz zero ` a raz ao geom etrica de 1 . 2 Se considerarmos f (x) = axn , ent ao teremos (x) = (1 1 )x , n
1 e portanto 1 n ser a a raz ao da converg encia geom etrica. Aparentemente, essas considera c oes levam a crer que quando f (x ) = 0 o M etodo de Newton ainda funciona, mas a velocidade de converg encia passa a ser mais lenta (de quadr atica passa a ser apenas geom etrica). At e que ponto isso pode ser generalizado? A melhor maneira de compreender o que se passa e por meio de polin omios de Taylor (vide o Ap endice B para uma revis ao sobre o assunto). Para facilitar os argumentos, suporemos que a fun c ao f pode ser diferenciada innitamente. A expans ao de f em torno de x e assim escrita:
f (x) = f (x ) + f (x )(x x ) +
f (x ) f (n) (x ) (x x )2 + . . . + (x x )n + o((x x )n ) , 2 n!
onde o((x x )n ) indica a presen ca de termos de ordem mais alta do que (x x )n , ou em outras palavras, denota a presen ca de um resto que vai a zero mais rapidamente do n que (x x ) quando x tende a x . Como x e a raiz de f , e estamos supondo que f tem derivada nula em x , os dois primeiros termos ser ao nulos, necessariamente. J a a derivada segunda pode ou n ao ser nula. Para a maioria das situa c oes, haver a um primeiro termo n ao nulo, de ordem m, que pode ser 2 ou mais. Assim, podemos escrever f como f (x) = ou ainda, f (x) = f (m) (x ) m! o((x x )m ) (x x )m 1 + (m) m! f (x ) (x x )m . f (m) (x ) (x x )m + o((x x )m ) , m!
Como o((x x )m ) tem ordem mais alta do que (x x )m , o quociente dos dois vai a zero, e assim podemos escrever f (x) = f (m) (x ) (x x )m (1 + r1 (x)) , m!
11.2. METODO DE NEWTON EM DIMENSOES MAIS ALTAS
151
onde r1 (x) vai a zero quando x tende a x . Da mesma forma, a fun c ao f (x) pode ser expressa na sua f ormula de Taylor. Desta vez, o primeiro termo n ao nulo ser a de ordem m 1, e teremos f (x) = m f (m) (x ) (x x )m1 (1 + r2 (x)) , m!
onde r2 (x) vai a zero quando x tende a x . Posto tudo isso, podemos montar a fun c ao de itera c ao , usando essas express oes no lugar de f (x) e f (x): 1 1 + r1 (x) (x) = x (x x ) . m 1 + r2 (x) Subtraindo x dos dois lados, e colocando (x x ) em evid encia no lado direito da equa c ao, obtemos 1 1 + r1 (x) (x) x = (x x ) 1 . m 1 + r2 (x) S o que o quociente envolvendo r1 e r2 tende a 1, ent ao (x) x x x
1 tende a 1 m . Esta e a raz ao assint otica de converg encia geom etrica do M etodo de Newton, que s o depende da ordem m da fun c ao f em x .
11.2
M etodo de Newton em dimens oes mais altas
Suponha que F : Rn Rn seja uma fun c ao diferenci avel e estejamos procurando um ponto x tal que F (x ) = 0. Esse e o an alogo multidimensional do problema que vimos discutindo at e agora. Se ao leitor o problema parece muito abstrato, observe que F leva (x1 , . . . , xn ) num elemento de Rn , que pode ser explicitado por cada uma de suas componentes, isto e, F (x1 , x2 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fn (x1 , . . . , xn )) . Ent ao achar um zero de F e achar uma solu c ao para o sistema de equa c oes f1 (x1 , . . . , xn ) = 0 f2 (x1 , . . . , xn ) = 0 . . . fn (x1 , . . . , xn ) = 0
152
que n ao e necessariamente linear. Para generalizar, devemos examinar com cuidado a motiva c ao do m etodo em dimens ao 1. Para denir x(k+1) em fun c ao de x(k) , passamos uma reta por x(k) com a mesma inclina c ao que a derivada de f em x(k) (usaremos essa forma de indexar para n ao confundir com o ndice que indica as coordenadas de x, quando x Rn ). Isto eo mesmo que aproximar f pela sua expans ao em Taylor de ordem 1: f (x) = f (x(k) ) + f (x(k) )(x x(k) ) + R1 (x) , mas ignorando R1 . O ponto x(k) era denido pelo encontro dessa reta com o zero, ou seja 0 = f (x(k) ) + f (x(k) )(x(k+1) x(k) ) , e a f ormula do M etodo de Newton foi obtida isolando-se x(k+1) nessa equa c ao. A expans ao em Taylor e igualmente v alida em dimens ao mais alta. Para primeira ordem, por exemplo, podemos escrever F (x) = F (x(k) ) + DF (x(k) )(x x(k) ) + R1 (x) , onde x Rn , R1 e uma fun c ao de Rn em Rn (assim como F ) e DF (x) e a matriz jacobiana no ponto x, isto e f f1 f1 1 . . . x2 xn 1 x f2 f2 f2 . . . x x2 xn 1 , DF (x) = . . . . . . . . . . . .
fn x1 fn x2
...
fn xn
sendo que por economia de espa co ca impl cito que cada uma das derivadas parciais e calculada no ponto x. Portanto, o termo DF (x(k) )(x x(k) ) e a multiplica c ao de uma matriz por um vetor (coluna), que resulta em outro vetor. O resto R1 tem a propriedade de que lim
xx(k)
R1 (x) =0, x x(k)
tomando-se o cuidado de tomar a norma no denominador, porque anal n ao faz sentido dividir por vetores. Para denir x(k+1) , ignoramos R1 e igualamos a aproxima c ao de primeira ordem a zero: 0 = F (x(k) ) + DF (x(k) )(x(k+1) x(k) ) , ou seja, DF (x(k) )x(k+1) = DF (x(k) )x(k) F (x(k) ) .
11.2. METODO DE NEWTON EM DIMENSOES MAIS ALTAS
153
Observe que essa equa c ao e um sistema linear, onde x(k+1) e a inc ognita, a matriz de ( k ) coecientes e a matriz jacobiana DF (x ) e o vetor de termos independentes e dado por DF (x(k) )x(k) F (x(k) ). Assim como a solu c ao de um sistema linear e um encontro de hiperplanos em Rn , a solu c ao de um sistema n ao-linear e um encontro de hipersuperf cies em Rn . Para n = 2, os hiperplanos s ao retas e as hipersuperf cies s ao curvas. Sugere-se fazer o seguinte exerc cio para xar id eias. Exerc cio. Achar numericamente a intersec c ao das curvas dadas por x2 +y 2 1 = 0 (um 4 2 c rculo!) e 1 egia baseada 2 x +3(1 cos y ) 1 = 0. Bom, pelo menos organize uma estrat no M etodo de Newton. Quanto ao chute inicial, isso e um problema, principalmente porque pode haver mais do que uma intersec c ao entre as curvas.
11.2.1
Determina c ao da forma de uma corda
Uma aplica c ao interessante do M etodo de Newton em dimens ao 3 ocorre na determina c ao do formato de uma corda a partir das coordenadas de dois pontos (podem ser os pontos de sustenta c ao, por exemplo) e do comprimento da corda entre os dois pontos. A implementa c ao desta id eia deve ser feita com o aux lio do computador, pela quantidade de c alculos a serem feitos, mas mesmo assim deve-se prestar bastante aten c ao para o chute da condi c ao inicial, que pode freq uentemente levar o m etodo a divergir. Como vimos na Subse c ao 5.3.2, uma corda ou corrente pendurada assume o formato do gr aco da fun c ao 1 cosh(cx) , c conhecida como caten aria. No entanto, assume-se a que a origem das coordenadas esteja uma unidade abaixo do ponto mais baixo da corda. De modo geral, se quisermos deslocar a corda na vertical, precisamos acrescentar um par ametro h, que ser a somado ` a express ao acima, e se quisermos deslocar a corda horizontalmente em a unidades ent ao devemos trocar x por x a, de modo que 1 f (x) = cosh(c(x a)) + h c e a maneira mais geral de se representar o formato da corda. Se nosso modelo pretende ser consistente, deveria prever exatamente a forma da corda, desde que informemos dois pontos de sustenta c ao e o comprimento total da corda entre os dois pontos. Ou seja, com essas tr es informa c oes deveria ser poss vel determinar c, a e h, e portanto f . Sejam (x0 , y0 ) e (x1 , y1 ) os pontos de sustenta c ao. Ent ao y0 = 1 cosh(c(x0 a)) + h c
154 e
1 cosh(c(x1 a)) + h . c O comprimento da corda entre os pontos de sustenta c ao ser a chamado de l. Portanto y1 =
x1
l=
x0
1 + f (x)2 dx
(ver Se c ao 14.3 adiante, para uma justicativa desta f ormula). Como f (x) = sinh(c(x a)) , e 1 + sinh2 t = cosh2 t , logo l=
x0 x1
cosh(c(x a))dx =
1 {sinh(c(x1 a)) sinh(c(x0 a))} . c e tr es inc ognitas: 0 0 0
Com isso, obtivemos um sistema n ao-linear de tr es equa c oes c(y0 h) cosh(c(x0 a)) = c(y1 h) cosh(c(x1 a)) = lc + sinh(c(x0 a)) sinh(c(x1 a)) =
O sistema pode ser resolvido numericamente pelo M etodo de Newton.
Parte IV
Interpola c ao Polinomial
155
Cap tulo 12
Estimativa do erro nas interpola c oes

Voltemos ` a quest ao (abordada nas Se c oes 1.5 e 2.7) da interpola c ao de um polin omio de grau k a k + 1 pontos dados (t0 , z0 ), (t1 , z1 ), . . ., (tk , zk ), que ser a importante na Parte seguinte do livro, onde falaremos de integra c ao de fun c oes. Nesta Parte do livro, usaremos t como vari avel (no lugar de x), valores z (no lugar de y ) e pontos indexados de 0 a k (no lugar de n). Tudo isso justamente para n ao fazermos confus ao na Parte V, quando usaremos alguns conceitos aqui expostos. Imagine que utilizemos a interpola c ao polinomial como uma maneira de aproximar uma fun c ao. Mais precisamente, seja f : [tL , tR ] R uma fun c ao (cuja regularidade s o especicaremos adiante) e uma parti c ao de seu dom nio tL = t0 < t1 < t2 < . . . < tk1 < tk = tR , n ao necessariamente a intervalos regulares. Assumiremos sempre que tL < tR e que k 1. Aos k + 1 pontos (t0 , f (t0 )), (t1 , f (t1 )), . . ., (tk , f (tk )) podemos interpolar um polin omio p(t) de grau k , que eu nico. A pergunta e: quanto se perde ao se trocar f (t) pelo polin omio interpolador p(t)? Ou seja, qu ao grande e a diferen ca f (t) p(t), para cada ponto t do intervalo [tL , tR ]? Vejamos primeiro como deve ser a fun c ao diferen ca F (t) f (t) p(t). Para k = 1 a parti c ao tem que ser tL = t0 < t1 = tR , e o polin omio interpolador e a fun c ao am cujo gr aco passa por (t0 , f (t0 )) e (t1 , f (t1 )). Como p(t0 ) = f (t0 ) e p(t1 ) = f (t1 ), ent ao F se anula em t0 e t1 . Veja na gura abaixo, esquematicamente, como devem ser f e p (` a esquerda) e F (` a direita). 157
158
CAP ITULO 12. ESTIMATIVA DO ERRO NAS INTERPOLAC OES
p
t0
t0
t1
t1
Pelas mesmas raz oes, para valores quaisquer de k , a fun c ao F se anula em todos os pontos t0 , t1 , . . ., tk da parti c ao. Ela pode at e se anular em outros pontos, mas n ao e necess ario que isto ocorra. Veja na gura abaixo uma situa c ao com k = 2, onde p tem que ser um polin omio quadr atico.
p F

t0
t1
t2
t0
t1
t2
Se p e f n ao diferem nos pontos da parti c ao, quanto ser a a diferen ca para os demais valores de t? Para responder, tentaremos denir uma fun c ao (n ao-negativa) S (t) tal que S (t) F (t) S (t) (ou |F (t)| S (t)) para todo t [tL , tR ], sabendo de antem ao que S (t) pode se anular em t0 , t1 , . . . , tk .
159 A forma de S e S , em linha pontilhada, seria algo assim (para k = 4):
t0
t4 t1 t2
t3
claro que S deveria ser do tipo mais simples poss E vel. Uma tentativa e olhar para um polin omio n ao-nulo q (t) de grau k + 1 que se anule nos pontos t0 , . . . , tk e tomar S (t) = c|q (t)|, onde c e uma constante positiva. O polin omio q (t) = (t t0 )(t t1 ) . . . (t tk ) , por exemplo, satisfaz a condi c ao pedida. O que faremos agora e mostrar que uma tal estimativa e poss vel, e al em do mais apresentar um valor de c, que possa ser calculado a partir de algum conhecimento sobre a fun c ao f . De fato, mostraremos um resultado mais forte, que implicar a automaticamente o que queremos. Provaremos que, para cada t [tL , tR ] existe um outro ponto s = st (st indica a depend encia de s em rela c ao a t) tal que F (t) = F (k+1) (s) q (t) , (k + 1)!
onde F (k+1) (s) indica a derivada (k + 1)- esima de F em s. Como conseq u encia dessa arma c ao, teremos que |F (t)| F (k+1) (s) s[tL ,tR ] (k + 1)! max |q (t)| .
Al em disso, n ao devemos esquecer que F (t) = f (t) p(t), onde p(t) e polin omio de grau k . Como a derivada (k + 1)- esima de um polin omio de grau k e zero, ent ao F (k+1) = f (k+1) ,
160 logo
|F (t)| e podemos tomar
f (k+1) (s) s[tL ,tR ] (k + 1)! max f (k+1) (s) . s[tL ,tR ] (k + 1)!
|q (t)| ,
c = max
claro que esta resposta s E o e poss vel se f for uma fun c ao pelo menos (k + 1) vezes o que ocorre com a maioria das fun diferenci avel. E c oes com que nos deparamos na pr atica, mas pode haver exce c oes. Finalmente s o nos falta provar a arma c ao, que diz que para cada t em [tL , tR ] existe um s neste mesmo intervalo tal que (k + 1)!F (t) = F (k+1) (s)q (t) . A arma c ao e trivialmente v alida se t for um dos pontos t0 , t1 , . . . , tk , pois F e q se anulam nesses pontos, e os dois lados da equa c ao cam iguais a zero. Resta-nos assim provar a arma c ao quando t n ao e nenhum desses pontos. Em primeiro lugar, fazemos a constata c ao esperta de que (k + 1)! e a (k + 1)- esima k +1 derivada de q , pois o polin omio q tem grau (k + 1) e o coeciente de t e igual a 1. Ent ao nos bastar a demonstrar que existe s = st tal que q (k+1) (s)F (t) F (k+1) (s)q (t) = 0 . Para isso denimos a fun c ao G(s) = q (s)F (t) F (s)q (t) , lembrando que t est a xo, neste racioc nio. Desta maneira, queremos apenas mostrar ( k +1) que existe s onde G se anula. Acontece que G e uma fun c ao que se anula em todos os pontos t0 , t1 , . . . , tk , pois tanto q como F se anulam nesses pontos, mas G tamb em se anula em s = t, pois G(t) = q (t)F (t) F (t)q (t) = 0 . Como estamos interessados no caso em que t n ao e nenhum dos pontos t0 , t1 , . . . , tk , ent ao G se anula em pelo menos k + 2 pontos distintos. Pelo Teorema do Valor M edio, entre cada par consecutivo de pontos onde G se anula h a um ponto onde a derivada de G se anula. Portanto G se anula, obrigatoriamente, em pelo menos k + 1 pontos. Pelo mesmo racioc nio, G se anula em pelo menos k pontos. Continuando indutivamente, ( temos que G k) se anula em 2 pontos e, nalmente, que G(k+1) se anula em 1 ponto, como quer amos demonstrar.
161 Tendo em vista que os resultados deste Cap tulo ser ao usados no Cap tulo 17, resumimos a estimativa obtida (com a nota c ao j a exposta): |f (t) p(t)| c|q (t)| , onde f (k+1) (s) s[tL ,tR ] (k + 1)!
c = max e
q (t) = (t t0 )(t t1 ) . . . (t tk ) .
162
Cap tulo 13
T ecnicas de interpola c ao
Neste Cap tulo apresentaremos duas t ecnicas de interpola c ao que servem como alternativas ao m etodo j a descrito na Se c ao 1.5 de redu c ao a um sistema linear.
13.1
Polin omios de Lagrange

(t t1 )(t t2 ) (t tk ) ,
Considere o polin omio que tem grau k e se anula em t1 , . . . , tk . Al em disso, em t0 ele vale (t0 t1 )(t0 t2 ) (t0 tk ), e portanto o polin omio L0 (t) = (t t1 )(t t2 ) (t tk ) (t0 t1 )(t0 t2 ) (t0 tk )
vale 1 em t0 e zero nos demais pontos t1 , . . . , tk . Analogamente, podemos denir, para cada ti , um polin omio Li (t) de grau k que vale 1 em ti e zero nos demais pontos. Agora observe que a soma de polin omios de grau k e um polin omio de grau k , logo c0 L0 (t) + c1 L1 (t) + . . . + ck Lk (t) e um polin omio de grau k , que vale c0 em t0 , c1 em t1 , ..., ck em tk . Portanto, se quisermos achar um polin omio de grau k que valha z0 , . . . , zk nos pontos t0 , . . . , tk basta tomar os ci s iguais aos zi s: p(t) = z0 L0 (t) + z1 L1 (t) + . . . + zk Lk (t) . Essa e uma maneira de achar o polin omio interpolador sem resolver nenhum sistema linear! Os polin omios Li s ao conhecidos como polin omios de Lagrange. 163
164
CAP ITULO 13. TECNICAS DE INTERPOLAC AO
13.2
Forma de Newton
J a vimos duas maneiras de fazer uma interpola c ao polinomial: atrav es de um sistema linear, onde as inc ognitas s ao os coecientes do polin omio que se quer determinar, e cada ponto da interpola c ao gera uma equa c ao; e atrav es de uma combina c ao linear dos polin omios de Lagrange. Nesta Se c ao veremos outra forma de interpolar, chamada forma de Newton. Ela leva certa vantagem em um aspecto: e mais f acil acrescentar um ponto ` a interpola c ao, sem ter que desmanchar (ou revisar) as contas feitas anteriormente. Para obter esse novo m etodo, teremos que investigar um pouco mais alguns aspectos subjacentes ` a interpola c ao. Seja (t0 , z0 ), (t1 , z1 ), . . . , (tk , zk ) o conjunto de pontos que se deseja interpolar. A u nica exig encia, como de h abito, e que os ti s sejam dois a dois distintos, mas n ao h a necessidade que sua enumera c ao respeite a ordem em que eles se disp oem sobre a reta, e os zi s podem ser experimentais ou provenientes de uma fun c ao (zi = f (ti )), tanto faz. Olharemos para as interpola c oes parciais, que envolvem apenas certos subconjuntos dos pontos acima. Mais precisamente, sejam i e j tais que 0 i j k e seja pi j (t) o polin omio interpolador dos pontos (ti , zi ), . . . , (tj , zj ). Assim, o polin omio interpolador i e o polin omio interpolador de um ponto procurado e p(t) = p0 k (t), enquanto que pi (t) i s o (portanto pi (t) zi , isto e, tem grau zero e e identicamente igual a zi ). Lembremos i (t) que o grau (m aximo) de pi ( t ) e j i , pois p e o polin omio interpolador de j i + 1 j j pontos. Chamaremos de ordem de pi umero j i +1, que nada mais e do que o n umero j (t) ao n de pontos que ele interpola. Em seguida podemos observar que um polin omio de ordem l > 1 se relaciona de forma mais ou menos simples com algum polin omio de ordem inferior. Por exemplo, i i com i < j tome pi ao abrange j (t) e pj 1 (t), que diferem entre si pelo fato de que pj 1 (t) n tj em sua interpola c ao. Nos pontos ti , . . . , tj 1 eles coincidem, pois assumem os mesmos i valores zi , . . . , zj 1 , respectivamente. Portanto a diferen c a pi e um polin omio j (t) pj 1 (t) de grau no m aximo j i, que se anula nos pontos ti , . . . , tj 1 , ou seja,
i pi j (t) pj 1 (t) = c(t ti )(t ti+1 ) . . . (t tj 1 ) .
(13.1)
A constante c depende dos pares (ti , zi ), . . . , (tj , zj ) (pois estes determinam pi j (t) e i pj 1 (t)), e ser a denotada por (ti , ti+1 , . . . , tj ) , assumindo-se implicitamente que os zi s est ao automaticamente associados aos ti s. Podemos alternativamente suprimir o primeiro ponto da lista, e da mesma forma teremos i+1 (t ti+1 ) . . . (t tj ) , (13.2) pi j (t) pj (t) = c
13.2. FORMA DE NEWTON onde c e denotada por (ti , . . . , tj ) .
165
A vantagem de se determinar os s (ou s) e clara, pois da sairia o polin omio interpolador, por indu c ao. Ter amos
0 p0 k (t) = pk1 (t) + (t0 , t1 , . . . , tk )(t t0 )(t t1 ) . . . (t tk1 ) ,
mas tamb em
0 p0 k1 (t) = pk2 (t) + (t0 , . . . , tk1 )(t t0 ) . . . (t tk2 ) ,
e assim por diante, de forma que

0 p0 k (t) = p0 (t) + (t0 , t1 )(t t0 )+
+ (t0 , t1 , t2 )(t t0 )(t t1 ) + . . . + (t0 , . . . , tk )(t t0 ) . . . (t tk1 ) . Como p0 0 (t) z0 , convencionaremos que (t0 ) = z0 (e (ti ) = zi , para todo i = 0, . . . , k ), para que a nota c ao que uniforme. Se proced essemos inversamente na ordem dos pontos, chegar amos em p0 k (t) = (tk ) + (tk1 , tk )(t tk )+ +(tk2 , tk1 , tk )(t tk1 )(t tk ) + . . . + (t0 , . . . , tk )(t t1 ) . . . (t tk ) , estipulando-se que (ti ) = zi , i = 0, . . . , k . Os s (e analogamente os s) s ao chamados de diferen cas divididas, porque podem ser deduzidos da Equa c ao 13.1, colocando-se t = tj . Assim
i pi j (tj ) pj 1 (tj ) (ti , . . . , tj ) = , (tj ti ) . . . (tj tj 1 ) i onde conhecemos pi j (tj ) = zj , mas pj 1 (tj ) depende de se conhecer previamente o poi lin omio pj 1 (t). Isso possibilita achar os s indutivamente, mas e um caminho trabalhoso. Nosso objetivo e buscar um meio mais f acil de determinar s e s, embora n ao possamos nos livrar de alguma indu c ao. Partiremos de uma pequena observa c ao sobre os polin omios de ordem 1 e 2 (um e dois pontos), e depois enunciaremos um resultado geral que servir a a nossos prop ositos. N ao h a muito o que dizer em ordem 1: a interpola c ao de um ponto e um polin omio de grau zero, portanto pi i (t) = zi = (ti ) = (ti ) ,
por deni c ao.
166
J a a interpola c ao de dois pontos ti e ti+1 (0 i k 1) e um polin omio de grau 1, cujo gr aco e uma reta. Temos pi i+1 (t) = zi + (ti , ti+1 )(t ti ) , que pode ser obtido da Equa c ao 13.1 diretamente. Mas (ti , ti+1 ) e tamb em a inclina c ao da reta que passa por (ti , zi ) e (ti+1 , zi+1 ), logo (ti , ti+1 ) = Analogamente, pi i+1 (t) = zi+1 + (ti , ti+1 )(t ti+1 ) , donde (ti , ti+1 ) = (ti , ti+1 ), pois (ti , ti+1 ) e a inclina c ao da mesma reta! Assim mostramos que s e s coincidem at e ordem 2 e relacionamos s de ordem 2 com s de ordem 1. Vejamos como generalizar nossas observa c oes para qualquer ordem. Mostraremos o seguinte enunciado: para todo par i, j tal que 0 i j , temos (ti , . . . , tj ) = (xi , . . . , xj ), e se i < j temos (ti , . . . , tj ) = (ti+1 , . . . , tj ) (ti , . . . , tj 1 ) . tj ti (13.3) (ti+1 ) (ti ) zi+1 zi = . ti+1 ti ti+1 ti
O enunciado j a foi demonstrado acima em ordens 1 e 2, isto e, sempre que j i+1 2. +1 i Sejam agora i e j tais que j i + 1 3 e considere os polin omios pi j (t) e pj 1 (t) que interpolam j i pontos, e portanto t em grau (m aximo) j i 1. Como eles coincidem em ti+1 , . . . , tj 1 , ent ao
+1 i pi j (t) pj 1 (t) = a(t ti+1 ) . . . (t tj 1 ) .
(13.4)
Acharemos o valor de a de tr es maneiras diferentes, o que fornecer a as igualdades que queremos demonstrar. (i) Tomamos t = tj na Equa c ao 13.4. Ent ao
+1 i a(tj ti+1 ) . . . (tj tj 1 ) = pi j (tj ) pj 1 (tj ) . +1 +1 Como pi c ao, pi em e o valor de j (t) inclui tj em sua interpola j (tj ) = zj , mas zj tamb i pj (tj ), logo o lado direito e igual a i pi j (tj ) pj 1 (tj ) = (ti , . . . , tj )(tj ti )(tj ti+1 ) . . . (tj tj 1 ) .
Da segue que a = (tj ti ) (ti , . . . , tj ) .
13.2. FORMA DE NEWTON (ii) Tomamos t = ti na Equa c ao 13.4. Ent ao

+1 i a(ti ti+1 ) . . . (ti tj 1 ) = pi j (ti ) pj 1 (ti ) .
167
O lado direito e igual a

+1 i pi j (ti ) pj (ti ) = (ti , . . . , tj )(ti ti+1 ) . . . (ti tj ) ,
logo a = (tj ti )(ti , . . . , tj ) , o que mostra que (ti , . . . , tj ) = (ti , . . . , tj ). (iii) Depois que vimos que s e s coincidem, usamos a mesma Equa c ao 13.4, manipulandoa de outra forma, para estabelecer a rela c ao dos s com seus correspondentes de ordem inferior. Observe que
+1 i+1 i+1 i+1 i i pi j (t) pj 1 (t) = pj (t) pj 1 (t) + pj 1 (t) pj 1 (t) ,
que, pela deni c ao de s e s, e igual a (ti+1 , . . . , tj )(t ti+1 ) . . . (t tj 1 ) (ti , . . . , tj 1 )(t ti+1 ) . . . (t tj 1 ) . Como (ti , . . . , tj 1 ) = (ti , . . . , tj 1 ), segue que
+1 i pi j (t) pj 1 (t) = [ (ti+1 , . . . , tj ) (ti , . . . , tj 1 )] (t ti+1 ) . . . (t tj 1 ) .
Ent ao a = (ti+1 , . . . , tj ) (ti , . . . , tj 1 ) . Como j a sabemos que a = (tj ti ) (ti , . . . , tj ), conclu mos a Equa c ao 13.3.
13.2.1
Exemplo do uso da forma de Newton
A Equa c ao 13.3 permite que calculemos os s em fun c ao de seus correspondentes de ordem inferior. Isso e poss vel porque conhecemos os s de ordem 1, que s ao os zi s. A
168
seguinte tabela mostra como podemos esquematizar as informa c oes. t0 t1 t2 . . . . . . . . . (t0 ) (t0 , t1 ) (t1 ) (t1 , t2 ) (t2 ) . . . . . . . . . . . . . . . . . . (tk1 , tk2 ) tk1 (tk1 ) (tk1 , tk ) tk (tk ) Cada (ti , . . . , tj ) pode ser obtido da diferen ca entre os dois elementos adjacentes da coluna imediatamente ` a esquerda (o de baixo menos o de cima), dividida pela diferen ca tj ti , onde ti e tj s ao encontrados como as extremidades da base da pir amide (deitada) da qual (ti , . . . , tj ) e o cume. 1 1 , 2 ), Por exemplo, se quisermos achar o polin omio interpolador dos pontos (0, 1), ( 2 3 ( 2 , 1), (2, 0), acabaremos por montar a seguinte tabela (conra!): 0
1 2 3 2
(t0 , t1 , t2 ) . . . . . . . . . (tk2 , tk1 , tk )
. . . . . . . . .
(t0 , . . . , tk1 ) (t0 , . . . , tk ) (t1 , . . . , tk )
tk2 (tk2 )
1 1
1 2
3 2 2
1 3
7 3
4 3
1 0
Da tabela, tiramos o polin omio interpolador procurado: 1 1 4 1 3 p(t) = 1 + (1) (x 0) + ( )(x 0)(x ) + (x 0)(x )(x ) . 3 2 3 2 2 Juntando termos de mesmo grau, camos com 1 4 p(t) = 1 + t 3t2 + t3 . 6 3
3 Para vericar que deu certo, testamos os valores p(0), p( 1 2 ), p( 2 ) e p(2) e vemos que 1 batem com 1, 2 , 1 e 0.
13.2. FORMA DE NEWTON
169
H a outras formas de se tirar o mesmo polin omio da tabela. Por exemplo, pegando os s de baixo: 3 4 3 1 7 p(t) = 0 + 2(t 2) + (t 2)(t ) + (t 2)(t )(t ) . 3 2 3 2 2 Ou sen ao em zigue-zague: p(t) = (t2 )+ (t1 , t2 )(tt2 )+ (t0 , t1 , t2 )(tt2 )(tt1 )+ (t0 , t1 , t2 , t3 )(tt2 )(tt1 )(tt0 ) , que e igual a 3 3 1 3 1 4 3 1 1 (t ) (t )(t ) + (t )(t )(t 0) . 2 2 3 2 2 3 2 2 O zigue-zague pode servir para se escolher os melhores coecientes, facilitando a tarefa de juntar termos de mesmo grau logo depois, mas n ao e aconselh avel por ser mais sujeito a erros.
170
Parte V
Integra c ao de Fun c oes
171
Cap tulo 14
Import ancia da integra c ao num erica

14.1 Introdu c ao
No pr oximo Cap tulo falaremos de m etodos num ericos para o c alculo de integrais denidas, mas antes devemos atentar para a raz ao de sua utilidade. O C alculo ensina que, para se obter
b
f (x)dx ,
a
basta achar uma primitiva, isto e, uma fun c ao F (x) tal que F (x) = f (x), de forma que
b
f (x)dx = F (b) F (a)

a
(vide Ap endice A). Uma fun ca o f e, em geral, dada por uma f ormula, que nada mais e do que a combina c ao nita, via somas, multiplica c oes, divis oes e composi c oes de fun c oes elementares. As fun c oes elementares s ao as usuais: pot encias de x (negativas e positivas), fun c oes trigonom etricas e suas inversas, logaritmo e exponencial. Entretanto, no mundo abstrato de todas as fun c oes poss veis, essas fun c oes formam apenas uma min uscula parte. Em outras palavras, a grande maioria das fun c oes n ao tem uma f ormula que as represente, embora nas aplica c oes do mundo real os modelos freq uentemente conduzam a fun c oes descritas por meio de f ormulas. Mesmo se nos restringirmos apenas ` as fun c oes dadas por f ormulas, acabaremos por nos deparar com um fato matem atico: nem todas elas admitem uma primitiva que tamb em seja escrita como combina c ao (nita) de fun c oes elementares! 173
174
NUMERICA CAP ITULO 14. IMPORTANCIA DA INTEGRAC AO
claro que existe o recurso de se escrever a primitiva F como uma combina E c ao innita de fun c oes elementares, por exemplo atrav es de uma s erie de pot encias
F (x) =
k=0
ck xk .
Isto e poss vel (em muitos casos de forma at e razoavelmente f acil), mas com dois inconvenientes: primeiro, quando formos avaliar F (a) e F (b) atrav es da s erie (ou da f ormula innita) pode ser necess aria uma quantidade t ao grande de termos (ou opera c oes) que inviabilize ou torne muito lento o c alculo. Al em disso, nem sempre s eries de pot encia convergem para todos os valores de x, o que exigiria uma an alise criteriosa do alcance dessa converg encia, em cada caso. De outra parte, e preciso tamb em dispor de instrumentos para estimar integrais a partir de dados experimentais. As aplica c oes mais obvias se encontram no c alculo de comprimentos, areas, volumes, massa, centro de massa, dist ancia percorrida, tempo decorrido, etc. No que segue, discutiremos algum exemplos onde a integra c ao num erica se faz necess aria: ora por se tratar de medida experimental ora porque n ao h a primitiva elementar da fun c ao que se quer integrar.
14.2
C alculo de areas
Gostar amos de um m etodo sistem atico para estimar a area de guras planas como a mostrada ao lado (poderia ser uma ilha, por exemplo). Para isso, vamos nos basear no Princ pio de Cavalieri, que diz: dados dois conjuntos A e B , se houver uma linha L tal que toda perpendicular a L cruze A e B em intervalos de tamanhos iguais, ent ao A e B t em a mesma area. Por exemplo, os tri angulos da gura abaixo (` a esquerda) t em areas iguais, pois cada reta R horizontal, ` a altura y , cruza os tri angulos em segmentos de tamanho igual a l(y ). Para entender porque l(y ) e igual para os dois tri angulos, observe que em ambos l(y ) varia como uma fun c ao am (linearmente), em y = 0 tem-se l(0) = b (os tri angulos t em bases de igual tamanho) e em y = h tem-se l(h) = 0 (os tri angulos t em alturas iguais). Portanto a fun c ao l(y ) tem o aspecto mostrado ` a direita, na gura. Isso explica porque todos os tri angulos com base e altura iguais t em a mesma area, 1 que pode ser obtida de um deles, por exemplo o da direita. Essa area vale 2 bh, e o
14.2. CALCULO DE AREAS
175
leitor pode observar que essa tamb em ea area sob o gr aco de l(y ) (observa c ao que ser a importante logo adiante).
y h b l(y) y 0 b b h
O Princ pio de Cavalieri tem uma formula c ao an aloga para volumes. Dois s olidos S e T ter ao mesmo volume se houver uma linha L tal que todo plano perpendicular a L cruze S e T em regi oes de areas iguais. Para o leitor que ainda n ao acreditou nesse princ pio, imagine uma pilha de cartas com um arame passando no meio, e ent ao incline e retor ca o arame, de forma que a pilha que desalinhada. As duas pilhas continuam tendo a mesma altura, a area de cada corte e a mesma, e o volume (que e a soma dos volumes innitesimais das cartas) se mant em. O que podemos fazer com uma gura plana em geral e criar uma segunda gura com mesma area apoiada no eixo horizontal. Na pr atica, temos que fazer isso para um n umero discreto de cortes verticais: medimos o comprimento do corte e transferimos esse valor para a segunda gura. Assim, a segunda gura e um esbo co do gr aco Comprimento do corte vs. Posi c ao do corte, mais precisamente e a regi ao compreendida entre esse gr aco e a linha horizontal. Quando o corte ocorrer em dois intervalos separados a altura do gr aco ser a igual ` a soma dos comprimentos das duas intersec c oes.
x0 x1 ......
x6

......
x11
y

Ao nal, teremos uma seq u encia de pontos x0 , x1 , . . . , xn , que fornecem a posi c ao de cada corte, e valores correspondentes y0 , y1 , . . . , yn , que s ao os respectivos comprimentos de cada corte. Esses dados e que ser ao usados para se fazer a integra c ao.
176
O curioso e que o mesmo tipo de coleta de dados ser a feito para a integra c ao de uma fun c ao f (x) dada por uma f ormula. Se a integra c ao se der no intervalo [a, b], ent ao deve-se dividir o intervalo com uma parti c ao a = x0 < x1 < x2 < . . . < xn = b e tomar os valores da fun c ao nos extremos dos intervalos da parti c ao: y0 = f (x0 ) , y1 = f (x1 ) , . . . , yn = f (xn ) (que podem at e ser negativos). A partir desses dados, a maneira de se proceder ser aa mesma, tanto no caso experimental como no caso te orico. A u nica diferen ca e que no caso te orico n os teremos, na maioria dos casos, uma maneira de delimitar o erro cometido na integra c ao. O volume de um lago ou de uma montanha tamb em e pass vel de ser estimado usando esse tipo de dados. Pode-se fazer isso em duas etapas. Primeiramente, escolhese uma dire c ao (x, por exemplo) onde se posicionar ao, perpendicularmente, as retas dos cortes. Para cada corte do lago, posicionado em xi , estima-se sua area A(xi ), usando dados (yi , zi ). Depois estima-se a integral da fun c ao area do corte, usando-se os dados (xi , A(xi )), que resulta no volume.
14.3
Comprimento de curvas e gr acos
Considere o seguinte problema: calcular o comprimento do gr aco da fun c ao f entre a e b. Se a fun c ao f for diferenci avel, esse problema remete a uma integral. Para entender melhor, tentemos aproximar a curva por pequenos segmentos de reta e seu comprimento pela soma dos tamanhos desses segmentos. Como sempre, dividimos o intervalo [a, b] com uma parti c ao a = x0 < x1 < . . . < xn = b e em cada intervalo [xi , xi+1 ] (i = 0, . . . , n 1) aproximamos a fun c ao pelo segmento de reta que une os pontos (xi , f (xi )) e (xi+1 , f (xi+1 )). Pelo Teorema de Pit agoras, esse segmento tem tamanho igual a (xi+1 xi )2 + (f (xi+1 ) f (xi ))2 . Para simplicar um pouco, podemos supor que todos os intervalos tenham o mesmo tamanho x. Al em disso, aproximamos a diferen ca f (xi+1 ) f (xi ) por f (xi )x, de forma que somando para todos os segmentos obtenhamos, aproximadamente,
n1
x 1 + f (xi )2 .
i=0
Fazendo x ir a zero estaremos, por um lado, fazendo com que a soma dos comprimentos dos segmentos esteja cada vez mais pr oxima do comprimento verdadeiro da curva e, por
14.3. COMPRIMENTO DE CURVAS E GRAFICOS
177
outro lado, fazendo com que a aproxima c ao pela derivada seja cada vez mais dedigna. No limite, teremos um n umero que e ao mesmo tempo o comprimento da curva e tamb em a integral
b
1 + f (x)2 dx .
a
O gr aco de f entre a e b e um caso particular de curva no plano. Cada ponto dessa curva pode ser obtido tomando-se t no intervalo [a, b] e ent ao o ponto (t, f (t)). Podemos imaginar esse processo como uma fun c ao com dom nio [a, b] e contradom nio R2 , que leva t em (t, f (t)). Na verdade, podemos generalizar para situa c oes que n ao correspondam a gr acos de fun c oes. Por exemplo, tome a fun c ao (t) = (cos t, sent) , com t variando no intervalo [0, 2 ]. Para cada t, o ponto (t) e um ponto do c rculo unit ario, correspondente a um giro de angulo t. Uma elipse e a imagem da fun c ao (t) = ( cos t, sent) , com t variando em [0, 2 ]. Basta ver que se (x, y ) pertence ` a curva ent ao (x, y ) = ( cos t, sent), para algum t, logo x2 y2 + =1. 2 2 Uma curva (t) e expressa com duas fun c oes, uma para cada coordenada: (t) = (x(t), y (t)). Se quisermos calcular o comprimento total da curva (com t variando no intervalo [a, b]), podemos proceder com uma id eia semelhante ` a exposta acima para calcular o comprimento do gr aco de uma fun c ao. Dividimos o intervalo [a, b] com uma parti c ao a = t0 < t1 < . . . < tn = b (com intervalos iguais de tamanho t) e aproximamos o comprimento da curva pela soma
n1
(ti+1 ) (ti ) .
i=0
Cada termo da soma e a dist ancia entre dois pontos consecutivos (ti ) e (ti+1 ). Esta dist ancia e dada explicitamente por (x(ti+1 ) x(ti ))2 + (y (ti+1 ) y (ti ))2 , pelo Teorema de Pit agoras. Se cada uma das fun c oes coordenadas for diferenci avel, a dist ancia ser a aproximadamente igual a t x (ti )2 + y (ti )2 ,
178 ou
t (x (ti ), y (ti ) . O vetor (t) = (x (ti ), y (ti )) e o vetor derivada da curva (t). Somando o comprimento dos segmentos e fazendo o limite quando t vai a zero, conclu mos que o comprimento da curva e dado pela integral
b
(t) dt .
a
Por exemplo, no caso do c rculo unit ario, (t) = (cos t, sent) e (t) = (sent, cos t), logo (t) = 1. Portanto o comprimento do c rculo e
2 2
(t) dt =
0 0
dt = 2 ,
como era de se esperar! No caso da elipse, seu per metro l depende de a e b, que s ao os tamanhos dos semieixos. Estamos sempre supondo que a e b s ao positivos, e iremos tamb em assumir que a < b, isto e, que o semi-eixo maior da elipse est a na vertical. Tomando (t) = (a cos t, bsent), temos (t) = (asent, b cos t), de forma que o per metro p da elipse e dado por
2
p=
0
a2 sen2 t + b2 cos2 t dt .
Por raz oes de simetria, podemos integrar somente de 0 a 2 e multiplicar por quatro. Al em disso podemos substituir cos2 por 1 sen2 , e colocar b em evid encia na integral: p = 4b
0
2
1 2 sen2 tdt ,
onde 2 e denido como sendo 1
a2 , b2
um n umero positivo e menor do que 1 (ele vale 1 quando a elipse e um c rculo, e 0 quando a elipse degenera num segmento de reta vertical). A integral 1 2 sen2 tdt e conhecida como integral el ptica do primeiro tipo, e n ao admite uma express ao via combina c ao nita de fun c oes elementares. Em outras palavras, n ao h a uma f ormula fechada para o per metro da elipse.
14.4. DISTANCIA PERCORRIDA E TEMPO DECORRIDO
179
14.4
Dist ancia percorrida e tempo decorrido
A F sica est a repleta de conceitos denidos por meio de integra c ao. Faremos aqui uma pequena discuss ao sobre movimentos unidimensionais, isto e, movimentos num espa co cuja posi c ao possa ser determinada por apenas uma coordenada. Pode ser o movimento de uma part cula numa reta, um carro numa estrada, um p endulo simples, etc. O caso do p endulo ser a discutido com detalhes na pr oxima Se c ao. O movimento unidimensional de um corpo pode ser descrito por uma fun c ao x(t), onde x(t) indica a posi c ao em cada instante de tempo t. No caso de um p endulo, sua posi c ao e indicada por um angulo (t) (para ser mais preciso, sua posi c ao e circular), medido a partir da posi c ao vertical mais baixa. A velocidade do corpo v (t) e a derivada da fun c ao x(t): v (t) = x (t) , e a acelera c ao e a derivada de v (t). No caso em que a posi c ao e descrita por um angulo, falamos em velocidade angular, denotada por (t): (t) = (t) . Conhecendo a posi c ao inicial x0 (no instante t = 0) e a maneira como evolui a velocidade em fun c ao do tempo, podemos recuperar a fun c ao posi c ao:
t
x(t) = x0 +
0
v ( )d ,
equa c ao que nada mais e do que o Teorema Fundamental do C alculo. Fisicamente, podemos pensar que no instante , a velocidade e v ( ) e, sendo cont nua, assume valores pr oximos a v ( ) em instantes pr oximos a . Tomando um intervalo de tempo pr oximo a , teremos que a dist ancia percorrida ser a aproximadamente igual a v ( ) . Da divis ao em pedacinhos de tamanho do intervalo de tempo onde percurso e acompanhado, a dist ancia percorrida e a integral de v ( ), o que justica a f ormula de forma emp rica. Da mesma forma, em coordenadas angulares, temos
t
(t) = 0 +
0
( )d .
Ocorre entretanto que, em muitas aplica c oes f sicas, conhecemos a velocidade em fun c ao da posi c ao, e n ao do tempo. O p endulo ser a um exemplo disso. N ao vamos discorrer a respeito de outros exemplos, mas imagine o leitor que seja esse o caso. E suponha que agora o problema e outro: da posi c ao inicial x0 at e a posi c ao nal x, em cada ponto sabe-se que a velocidade assume o valor v ( ) (mas nunca se anula). Quanto tempo durou o percurso?
180
A exig encia de que a velocidade n ao se anule no percurso pode ser justicada assim: se o corpo p ara numa posi c ao , e depois recobra seu movimento, n ao h a como saber quanto tempo ele cou parado, logo n ao h a como obter uma resposta u nica para a pergunta. Eventualmente poderemos considerar que a velocidade se anule instantaneamente, principalmente se se tratar de = x0 ou = x. Como no caso anterior, podemos dividir o espa co percorrido em pequenos intervalos de tamanho . Em cada intervalo, a velocidade e aproximadamente constante, por exemplo, pr oxima ao valor v ( ) do extremo do intervalo. O tempo dispendido nesse pequeno trecho de percurso e aproximadamente igual a . v ( ) Portanto somando esses tempos e fazendo ir a zero, teremos que o tempo decorrido ser a x 1 T = d . x0 v ( ) No caso angular, temos
T =
0
1 d , ( )
onde agora representa a vari avel angular de posi c ao. Esta f ormula ser a aplicada na pr oxima Se c ao para se calcular o per odo do p endulo simples.
14.5
Per odo do p endulo e as integrais el pticas
Consideremos um p endulo simples sem atrito. Mostraremos que a Lei de Conserva c ao da Energia implica que a velocidade depende somente da posi c ao do p endulo. 2 A energia cin etica do p endulo e dada por 1 2 mv , onde v representa sua velocidade linear. Se o comprimento da haste for igual a l, essa velocidade e igual a l , onde ea velocidade angular. Por outro lado, a energia potencial e igual a mgh, onde h e a altura do p endulo em rela c ao ao solo. A bem da verdade a energia potencial e uma grandeza relativa, o que quer dizer que podemos somar uma constante a essa energia e nada se alterar a. Ou ainda, quer dizer que podemos supor que o solo est a na altura que quisermos, inclusive acima do p endulo!! Aqui assumiremos que o solo est a na altura do ponto mais baixo do p endulo, de forma que a h se relaciona com a coordenada angular por h = l l cos .
14.5. PER IODO DO PENDULO E AS INTEGRAIS EL IPTICAS
181
A energia total e a soma da energia cin etica com a energia potencial, e essa energia e constante: 1 2 2 ml + mgl(1 cos ) = E . 2 Mas quanto vale essa constante E ? Observe que a constante E tem a ver com a amplitude 0 do movimento: quanto maior for a amplitude, maior ser a essa energia. Para n ao car d uvidas, 0 representa o angulo m aximo que o p endulo alcan ca a partir da posi c ao vertical mais baixa, logo o maior valor que pode assumir, em tese, e (estamos evitando considerar o movimento em que a posi c ao = e atravessada). Quando o p endulo atinge o angulo m aximo (0 ou 0 , tanto faz), h a uma revers ao do movimento, e a velocidade angular instantaneamente se anula. Nesse caso, a energia cin etica e nula, e toda a energia se concentra na energia potencial. Em outras palavras, a energia total E e igual ` a energia potencial no angulo m aximo 0 . Substituindo na equa c ao acima, obtemos 2 = 2g [(1 cos 0 ) (1 cos )] . l
A express ao entre colchetes pode ser simplicada para cos cos 0 , por em mais tarde voltaremos a deix a-la dessa forma por raz oes t ecnicas. Notemos que essa equa c ao tem duas solu c oes, uma positiva e uma negativa. De toda forma, ela evidencia a depend encia da velocidade angular em rela c ao ` a posi c ao: xada a amplitude 0 do movimento, para cada posi c ao (entre 0 e 0 ), a velocidade angular s o pode assumir dois valores, um negativo e um positivo, e ambos de igual m odulo. Um dos valores representa o movimento de ida do p endulo e o outro de volta. Para obter o per odo do p endulo, podemos calcular o tempo decorrido para se ir de 0 at e 0 , no movimento de ida (velocidade angular positiva). De fato, pela simetria
182
do movimento, basta analisar o percurso de = 0 at e = 0 , percorrido em um quarto do per odo. Levando em conta as considera c oes da Se c ao anterior, teremos T = 4 logo T =4 l 2g
0 0 0
1 d , ()
1 d . cos cos 0
Vale apenas examinarmos com mais aten c ao essa integral, tentando esbo car o integrando. Primeiro desenhamos a fun c ao cos , marcando a altura de cos 0 (que pode ser negativo, se 0 > ). A partir da esbo camos a fun c ao cos cos 0 , no intervalo 2 [0, 0 ], que e o que nos interessa. Essa fun c ao tem derivada n ao nula em 0 , a n ao ser que 0 = , mas esse caso n ao ser a considerado.
cos cos 0
(cos cos 0 )
1/2
(cos cos 0 )
1/2
mos a raiz dessa fun c ao, e observamos que a inclina c ao da fun c ao Em seguida, extra cos cos 0 vai a innito quando vai a 0 . Como a fun c ao original tinha cara de 1 c(0 ) (perto de 0 ), quando tiramos a raiz ela ca com cara de c(0 ) 2 (basta em arma c oes mais precisas podem ser comparar com os gr acos y = cx e y = cx, por obtidas usando F ormula de Taylor, vide Ap endice B). 1 1 Acontece que o integrando e (cos cos 0 ) 2 , que tem cara de c(0 ) 2 perto uma fun de 0 . E c ao divergente em 0 (vai a innito), e e natural que nos questionemos sobre a converg encia da integral. Fisicamente sabemos que a integral tem que convergir, pois o p endulo alcan ca o angulo de amplitude m axima em tempo nito. Mas e matematicamente? 1 emp E rico por em extremamente v alido pensar na integrabilidade da fun c ao x 2 entre 0 e 1. Neste caso, a diverg encia ocorre em x = 0. Essa integral existe, pois se tomarmos a integral
1 a
x1/2 dx = 2x1/2
1 a
= 2(1 a1/2 ) ,
14.5. PER IODO DO PENDULO E AS INTEGRAIS EL IPTICAS
183
teremos que ela tende a 2 quando a tende a zero, e portanto converge. De fato, a integral de qualquer fun c ao x , com 0 < < 1 existe em (0, 1), pelas mesmas raz oes. Fica para o leitor vericar que o mesmo n ao ocorre com 1! Apesar de n ao haver problema quanto ` a converg encia da integral que fornece o per odo do p endulo, veremos no pr oximo Cap tulo que nossos m etodos se prestar ao mais a fun c oes que sejam cont nuas no intervalo de integra c ao, inclusive nos extremos. O pulo do gato neste caso e que uma mudan ca de coordenadas (muito) esperta pode transformar a integral acima numa outra cujo integrando seja uma fun c ao cont nua dentro de um intervalo, isto e, sem pontos de diverg encia. Fa camos ent ao essa mudan ca de coordenadas, que a bem da verdade ser a uma seq u encia de duas substitui c oes. A primeira substitui c ao ser a inofensiva. Faremos = 0 (logo d = d ), e caremos 0 com uma integral no intervalo (0, 1) (independentemente de 0 ): T =4 l 0 2g
1 0
1 cos(0 ) cos 0
d .
Em seguida lembramos de como estava escrito o radicando, para obtermos cos(0 ) cos 0 = (1 cos 0 ) (1 cos(0 )) =
1
1 cos 0 1
1 cos(0 ) , 1 cos 0
e j a tiramos o fator (1 cos 0 ) 2 para fora da integral. S o para n ao nos perdermos nas contas, o conjunto de termos que multiplica a integral e 4 Observe que a fra c ao 1 cos(0 ) 1 cos 0 varia monotamente de 0 a 1 quando varia de 0 a 1. Fazemos ent ao a substitui c ao sen2 = 1 cos(0 ) , 1 cos 0 l 0 . 2g 1 cos 0
d onde varia entre 0 e teremos uma integral de 0 a 2 . Da 2 de cos , mas precisamos colocar tudo em fun c ao de . Diferenciando os dois lados da equa c ao acima e dividindo por cos , obtemos d 0 2send = sen(0 ) , 1 cos 0 cos
184 logo
2(1 cos 0 ) sen d = d . cos 0 sen(0 ) Note que ainda temos um termo dependendo de . Da equa c ao onde introduzimos a substitui c ao, podemos isolar cos(0 ): cos(0 ) = 1 (1 cos 0 )sen2 , logo sen(0 ) = ou, simplicando, sen(0 ) = J a que
1cos 0 2
1 [1 (1 cos 0 )sen2 ]2
1 cos 0 sen
1 cos 0 sen2 . 2
e sempre um n umero n ao negativo, denominamos 2 = 1 cos 0 , 2

2
e juntando tudo obtemos (depois de v arios cancelamentos) T =4 l g 1 1 2 sen2 d .
Se 0 < ent ao 2 < 1 e o denominador do integrando nunca se anula. Portanto este integrando e cont nuo no intervalo [0, e 2 ]. No caso em que 0 = o integrando divergente em 2 e a pr opria integral e divergente (o leitor e convidado a comparar com sua intui c ao f sica). De fato, quanto mais 0 se aproxima de maior se torna T , em outras palavras, o per odo do movimento vai a innito quando a amplitude se aproxima de . Por outro lado, quando a amplitude se aproxima de 0 signica que 2 se aproxima de 0, e o integrando se aproxima da fun c ao constante igual a 1. Isso implica que o per odo se aproxima do conhecido valor l . 2 g A integral 1 1 2 sen2 d ,
com 0 < 2 < 1, e conhecida como integral el ptica do segundo tipo e n ao pode ser expressa por meio de combina c oes nitas de fun c oes elementares. Portanto n ao h a uma f ormula fechada para o per odo do p endulo em fun c ao da amplitude do movimento.
14.6. CALCULO DE E DE LOGARITMOS
185
14.6
C alculo de e de logaritmos
A integra c ao num erica se presta tamb em para calcular constantes matem aticas, por exemplo o n umero , que e denido como sendo a area do c rculo unit ario. Como para o c rculo unit ario se tem x2 + y 2 = 1, ent ao y = 1 x2 , ou seja,
1
=2
1
1 x2 dx .
Aqui e poss vel at e achar uma primitiva para o integrando, mas o problema e que essa primitiva acabar a sendo expressa em termos de . Pode-se mostrar teoricamente que o lado direito e igual ao esquerdo, obtendo-se uma bela equa c ao = !!!! O valor num erico de s o poder a ser obtido, no entanto, se zermos a integra c ao precisa da fun c ao no integrando. Outra maneira de se obter via integra ca o e usando o fato de que (arctan x) = Como arctan(0) = 0, ent ao
x
1 . 1 + x2
arctan x =
0
1 dt . 1 + t2
A nos aproveitamos do fato de que arctan 1 = 4 , de forma a podermos expressar como uma integral 1 1 =4 dt . 2 0 1+t Lembremos tamb em que o logaritmo e denido atrav es de uma integra c ao. Como
x
ln x
1
1 dt t
(vide Ap endice A), ent ao para cada x o valor num erico de ln x ser a obtido como uma area debaixo do gr aco de uma fun c ao. A constante e e denida como sendo o ( unico) n umero que satisfaz a equa c ao ln x = 1 . Ele pode ser obtido, por exemplo, resolvendo-se essa equa c ao pelo M etodo de Newton. S o que, para sermos honestos, temos que aplicar o M etodo de Newton calculando todos os logaritmos atrav es da integra c ao num erica (vide Exerc cio na Se c ao 16.2).
186
14.7
A gaussiana
Como vimos na Subse c ao 5.3.6, a distribui c ao de probabilidade mais comum na natureza e dada pela fun c ao (t )2 1 }. P, (x) = exp{ 2 2 2 Para sabermos a probabilidade de ocorrer um evento dentro do intervalo [a, b] precisamos calcular a integral
b
P, (t)dt .
a
um pouco chato calcular integrais com essas constantes, mas atrav E es de uma 2 mudan ca de coordenadas podemos reduzir o problema a calcular integrais de ex . Por exemplo, tomemos u = t (du = dt). Ent ao
b a
1 P, (t)dt = 2
b a
e 22 du .
u 2
u2
Em seguida, fazemos outra mudan ca de coordenadas x = 1 2

b 2
(dx =
du ). 2
Obtemos
2
2
a 2
ex dx ,
a 2 b . 2
isto e, uma integral de ex no intervalo [A, B ], onde A =

2
eB=
Acontece que ex e uma daquelas fun c oes que n ao t em f ormula para sua primitiva, e a partir da s o se prossegue com estimativas num ericas. Em probabilidade, como e muito freq uente o uso dessa integral, adotam-se tabelas com precis ao limitada mas razo avel, que servem para a maioria dos prop ositos. Essas tabelas podem ser facilmente montadas com os m etodos de integra c ao do pr oximo Cap tulo.
Cap tulo 15
M etodos de integra c ao num erica

15.1 Introdu c ao
Queremos resolver o seguinte problema: dada uma fun c ao f : [a, b] R, achar a integral de f nesse intervalo, denotada por
b
f (x)dx .
a
Aqui trataremos de dois m etodos de integra c ao de fun c oes, a saber, o M etodo dos Trap ezios e o M etodo de Simpson.
15.2
O M etodo dos Trap ezios
A primeira coisa a fazer e dividir o intervalo [a, b] em n intervalos (n ao necessariamente de tamanhos iguais). Isto e, xar x0 = a (extremo esquerdo do intervalo) e xn = b (extremo direito do intervalo), e escolher pontos x1 , . . . , xn1 entre a e b de modo que valha a = x0 < x1 < x2 < x3 < . . . < xn1 < xn = b . Em seguida, deve-se estimar a area (com sinal) entre cada par de pontos sucessivos. Por exemplo, entre xi e xi+1 : podemos aproximar essa area tomando o ret angulo cuja base e o intervalo [xi , xi+1 ] e cuja altura seja a m edia entre f (xi ) e f (xi+1 ). Esse ret angulo ter a area de f (xi ) + f (xi+1 ) (xi+1 xi ) . 2 Finalmente, somam-se as estimativas de cada ret angulo, obtendo-se a area (aproximada) total. 187
188
NUMERICA CAP ITULO 15. METODOS DE INTEGRAC AO
Algumas observa c oes s ao pertinentes. Para come car, por que o M etodo dos Trap ezios assim se chama? Anal, nenhum trap ezio apareceu para justicar o nome...! Observe que em vez de termos pego o ret angulo com altura m edia (f (xi ) + f (xi+1 ))/2 poder amos ao inv es ter pego o trap ezio cujos v ertices s ao (xi , 0), (xi+1 , 0), (xi+1 , f (xi+1 )) e (xi , f (xi )). A area f(x i+1) desse trap ezio pode ser calculada da seguinte forma: completamos f(x ) i a altura com um trap ezio de mesmas propor c oes, formando um ret angulo de altura f (xi ) + f (xi+1 ) e base xi+1 xi . A area desse ret angulo e o dobro da area do trap ezio, donde essa u ltima deve valer f (xi ) + f (xi+1 ) xi xi+1 (xi+1 xi ) , 2 ou seja, o mesmo valor que t nhamos obtido de outra forma! N ao e preciso que o espa camento entre os pontos seja sempre igual, mas se for facilita bastante. Suponha que a dist ancia entre eles seja igual a h, isto e, x1 x0 = x2 x1 = x3 x2 = . . . = xn xn1 = h . Ent ao o trap ezio com base [xi , xi+1 ] tem area h (f (xi ) + f (xi+1 )) . 2 Para todos os trap ezios aparece a multiplica c ao por h 2 , portanto podemos deixar essa multiplica c ao por u ltimo (o que e o mesmo que colocar em evid encia esse fator). Ent ao a area total dos trap ezios ser a h (f (x0 ) + f (x1 ) + f (x1 ) + f (x2 ) + f (x2 ) + f (x3 ) + . . . 2 . . . + f (xn2 ) + f (xn1 ) + f (xn1 ) + f (xn )) . Excetuando o primeiro e o u ltimo termo, todos os outros aparecem duas vezes na soma. Ent ao a area total ser a h {f (x0 ) + 2f (x1 ) + 2f (x2 ) + . . . + 2f (xn1 ) + f (xn )} . 2 Isso facilita bastante na hora de se fazer as contas!! Outra pergunta: que erro estamos cometendo ao fazer a aproxima c ao da area por trap ezios? Veremos mais adiante como calcular esse erro. Por enquanto camos com a percep c ao (correta) de que nosso resultado ser a tanto mais preciso quanto menor for o tamanho dos intervalinhos da divis ao. Nem sempre por em nos interessa calcular a integral de fun c oes exatamente conhecidas, pois muitas vezes estamos diante de uma
15.2. O METODO DOS TRAPEZIOS
189
fun c ao obtida atrav es de dados experimentais. Ou sen ao queremos simplesmente estimar a area de uma regi ao, e colhemos os dados de forma semelhante ao que foi feito acima: para cada xi , medimos o valor yi da fun c ao. Todo o procedimento ser a o mesmo. A u nica coisa e que n ao poderemos controlar a precis ao da estimativa, por falta de mais informa c oes sobre a fun c ao e devido ao erro inerente aos dados experimentais. Para exemplicar o uso do M etodo dos Trap ezios, ilustremos com um exemplo cujo 1 , segue que resultado e bem conhecido. Sabendo que a derivada da fun c ao arctan e 1+ x2
1 0
1 dx = arctan(1) arctan(0) = , 2 1+x 4
pelo Teorema Fundamental do C alculo. Logo a estimativa dessa integral levar a a uma estimativa do valor de . Como ainda n ao falamos em estimativa de erro para o M etodo, nossa escolha em rela c ao ao tamanho dos intervalos da parti c ao e ao n umero de algarismos signicativos ser a arbitr aria. Mais adiante veremos como fazer escolhas mais conscientes. Dividiremos o intervalo [0, 1] em 10 intervalos iguais, ou seja, faremos h = 0.1. Ent ao 0.1 {f (0) + 2f (0.1) + 2f (0.2) + . . . + 2f (0.9) + f (1)} , 4 2
1 onde f (x) = 1+ e a fun c ao do integrando. Os dados para realizar essa soma (com 5 x2 algarismos signicativos) s ao:
i 0 1 2 3 4 5 6 7 8 9 10 Ent ao
xi 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
f (xi ) 1.0000 0.99010 0.96514 0.91743 0.86207 0.80000 0.73529 0.67114 0.60976 0.55249 0.50000
f (0) + 2f (0.1) + 2f (0.2) + . . . + 2f (0.9) + f (1) 15.700 , logo 0.1 15.700 = 3.1400 , 2 valor ` a dist ancia de aproximadamente 1.6 103 do valor verdadeiro. 4
190
15.3
O M etodo de Simpson
Se notarmos bem, no M etodo dos Trap ezios o que n os zemos foi aproximar a fun c ao f , em cada intervalo, por uma reta coincidente com a fun c ao nos extremos. O M etodo de Simpson e um melhoramento dessa estrat egia, pois considera polin omios quadr aticos como forma de aproximar a fun c ao. Vejamos como ele funciona. Como no M etodo dos Trap ezios, a primeira coisa a fazer e dividir o intervalo de integra c ao em intervalinhos, s o que agora em um n umero par de intervalos. Ou seja, denominar x0 = a, x2n = b e escolher pontos intermedi arios a = x0 < x1 < x2 < . . . < x2n2 < x2n1 < x2n = b . Depois para cada i = 0, . . . , n 1 considerar os tr es pontos x2i , x2i+1 , x2i+2 e os valores respectivos da fun c ao avaliada nesses tr es pontos: f (x2i ), f (x2i+1 ), f (x2i+2 ). Para simplicar a nota c ao, chamar esses valores de y2i , y2i+1 , y2i+2 . Em seguida encontrar o u nico polin omio quadr atico (isto e, de grau 2) pi (x) tal que pi (x2i ) = y2i , pi (x2i+1 ) = y2i+1 , pi (x2i+2 ) = y2i+2 , e usar esse polin omio pi (x) como aproxima c ao para a fun c ao no intervalo [x2i , x2i+2 ] (o polin omio pode ser achado com qualquer um dos m etodos descritos na Se c ao 1.5 ou no Cap tulo 13). Assim a integral
x2i+2
f (x)dx
x 2i
e aproximada pela integral
x2i+2
pi (x)dx .
x 2i
Finalmente, h a que se somar as aproxima c oes obtidas em cada intervalo para se obter a aproxima c ao de
b
f (x)dx .
a
Vejamos como ca o caso em que todos os intervalos da parti c ao t em o mesmo tamanho h. Resultar a da uma f ormula bastante elegante para a aproxima c ao da integral (parecida com a f ormula de integra c ao pelo M etodo dos Trap ezios), conhecida como f ormula de Simpson. Em primeiro lugar, temos que desenvolver em detalhe o passo do procedimento que consiste em achar o polin omio interpolador pelos tr es pontos (x2i , y2i ), (x2i+1 , y2i+1 ) e (x2i+2 , y2i+2 ). Como n ao estamos interessados no polin omio em si mas sim na sua integral denida no intervalo [x2i , x2i+2 ], ser a mais simples trabalharmos no intervalo
15.3. O METODO DE SIMPSON
191
[h, h], interpolando os pontos (h, y2i ), (0, y2i+1 ) e (h, y2i+2 ) (ca ao leitor detalhista a tarefa de mostrar por que isso pode ser realmente feito). O polin omio interpolador p(x) = pi (x) pode ser calculado como no Cap tulo 13, com o aux lio dos polin omios de Lagrange: p(x) = y2i isto e, p(x) = Da que
h
(x + h)(x h) (x + h)x x(x h) + y2i+1 + y2i+2 , (h)(2h) h(h) (2h)(h)
1 {x(x h)y2i 2(x + h)(x h)y2i+1 + x(x + h)y2i+2 } . 2h2
p(x)dx =
h
1 2h2
y 2i
h
x(x h)dx 2y2i+1

h
(x + h)(x h)dx + y2i+2

h
x(x + h)dx
Fazemos ent ao uma a uma cada uma das tr es integrais:

h h
x(x h)dx =
h
(x2 hx)dx =
h h 2 x
3 h 2 = h3 . 3 Semelhantemente,
h
h x3
==
h3 (h)3 3 3
h2 (h)2 2 2
(x + h)(x h)dx =
h
4 x2 h2 dx = h3 3 h
2 (x + h)xdx = h3 . 3 h Com esses valores, voltamos ` a integral de p(x):

h
p(x)dx =
h
h (y2i + 4y2i+1 + y2i+2 ) . 3
Observe como, ` a semelhan ca do M etodo dos Trap ezios, essa f ormula facilita o c omputo geral da aproxima c ao, mesmo com uma subdivis ao em muitos intervalos. Se, como
192
acima, tivermos a parti c ao do intervalo [a, b] em 2n intervalos, todos com tamanho h, ent ao a soma de todas as aproxima c oes ser a h {(y0 + 4y1 + y2 ) + (y2 + 4y3 + y4 ) + . . . + (y2n2 + 4y2n1 + y2n )} , 3 que e igual a h {y0 + 4y1 + 2y2 + 4y3 + 2y4 + . . . + 2y2n2 + 4y2n1 + y2n } . 3 Para exemplicar e comparar com o M etodo dos Trap ezios, calculemos a mesma 1 1 integral 0 1+ dx usando a mesma divis a o de intervalinhos (neste caso e poss vel porque 2 x o n umero de intervalos e par). Usaremos 9 algarismos signicativos. Obtemos 2(y2 + y4 + y6 + y8 ) = 6.33731529 e 4(y1 + y3 + y5 + y7 + y9 ) = 15.7246294 , de modo que
1 0
1 0.1 dx (1.0000 + 6.33731529 + 15.7246294 + 0.50000) , 2 1+x 3

1
ou seja, =4
0
1 dx 3.14159263 , 1 + x2
valor que difere de por menos do que 3 108 , resultado bem melhor do que o obtido no M etodo dos Trap ezios.
Cap tulo 16
Estimativa do erro nos m etodos de integra c ao

16.1 F ormulas de erro e compara c ao dos m etodos
Aparentemente o M etodo de Simpson se revela melhor do que o M etodo dos Trap ezios. Para vericar melhor essa arma c ao, olhemos para a seguinte tabela, que mostra os c alculos feitos para se obter com os dois m etodos para os valores de h iguais a 1 4, 1 1 1 , e . Os c a lculos foram feitos com o software Maple, usando-se 20 algarismos 8 16 32 signicativos. A primeira coluna indica o n umero de intervalos da parti c ao e a coluna seguinte o tamanho de cada intervalo da parti c ao. Na terceira e na quinta os valores de T (h) e S (h), multiplicados por quatro (para comparar com ). Usaremos T (h) 1 1 para denotar a estimativa da integral 0 1+ dx com o M etodo dos Trap ezios e S (h) a x2 estimativa da mesma integral com o M etodo de Simpson. Na quarta e na sexta est ao as diferen cas, em valor absoluto, entre os n umeros obtidos e o valor = 3.1415926535897932385 , fornecido pelo Maple com 20 algarismos signicativos. n h 4T (h) |4T (h) | 4S (h) |4S (h) | 4 1/4 3.131 0.011 3.141569 2.4 105 8 1/8 3.1390 0.0026 3.14159250 1.5 107 16 1/16 3.14094 0.00065 3.1415926512 2.4 109 32 1/32 3.14143 0.00016 3.141592653552 3.7 1011 Na tabela podemos observar que o M etodo de Simpson n ao s o e mais eciente (compare na primeira linha, por exemplo), mas a cada vez que h e diminu do a sua ec acia e 193
194 CAP ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRAC AO proporcionalmente maior do que a do M etodo dos Trap ezios. A cada vez que h e reduzido por 2, o erro no M etodo dos Trap ezios diminui aproximadamente 4 vezes, enquanto que no M etodo de Simpson, neste exemplo, a redu c ao e de pelo menos 64 vezes!! Devotaremos o restante deste Cap tulo ` a discuss ao da ec acia dos dois m etodos. Gostar amos de ter, por exemplo, uma estimativa m axima para o erro cometido na integra c ao de uma fun c ao f : [a, b] R, dado o tamanho h dos intervalos da parti c ao. Essa estimativa ser a chamada de ET , no caso do M etodo dos Trap ezios, e ES , no caso do M etodo de Simpson. Tanto ET como ES depender ao de f , do tamanho total b a do intervalo de integra c ao e de h. No entanto, assumiremos f e o intervalo [a, b] como xos, de forma que freq uentemente exprimiremos apenas a depend encia em rela c ao a h, dessas estimativas: ET = ET (h) e ES = ES (h). O signicado de ET (h) (e similarmente de ES (h)) e o seguinte. Se calcularmos T (h), ent ao saberemos, com absoluta certeza, que o valor correto da integral est a entre claro que essa interpreta T (h) ET (h) e T (h) + ET (h). E c ao n ao leva em conta os erros de arredondamento cometidos nos c alculos, devidos ` a limita c ao no n umero de algarismos signicativos. Por outro lado, o conhecimento pr evio do erro inerente ao processo permite avaliar com quantos algarismos signicativos deve ser feita a integra c ao. Al em disso e importante salientar que ET (h) (e similarmente ES (h)) n ao mede a real diferen ca entre o valor obtido T (h) e o valor verdadeiro. Essa diferen ca e, com certeza, apenas menor do que ET (h). Por exemplo, na determina c ao de que zemos acima, o c alculo de ET (h) e ES (h), de acordo com as f ormulas que discutiremos abaixo, leva a valores muito maiores do que a real diferen ca entre os valores de T (h) e S (h) e o valor verdadeiro. Pode-se dizer ent ao que a previs ao de erro foi bastante pessimista. Em outros casos, por em, ela pode acabar sendo realista, e isso vai depender muito da fun c ao integranda. Na Se c ao seguinte nos preocuparemos em calcular ET (h) e ES (h). Usaremos tr es abordagens diferentes para o problema, obtendo ao nal resultados similares, e adotaremos, na pr atica, aquelas que julgaremos ser as melhores estimativas. Os resultados est ao expostos na tabela abaixo. 1a | |b a|h2 | |b a|h3 2a
1 2 12 max |f | |b a|h 1 ( iv ) | |b a|h4 180 max |f
3a
5 2 12 max |f | |b a|h 1 ( iv ) | |b a|h4 45 max |f
ET (h) ES (h)
1 12 max |f 1 24 max |f
Para entendermos melhor o signicado desta tabela, percebemos primeiro que todas as f ormulas s ao do tipo Ch , com igual a 2, 3 ou 4. Nas constantes, est a presente o m aximo valor absoluto de certas derivadas de f , m aximo que deve ser avaliado dentro do intervalo [a, b]. Quem ser a menor, C2 h2 , C3 h3 ou C4 h4 ? Ou colocando em n umeros, a t tulo de exemplo, quem e menor, 1000h4 ou 0.2h2 ?
DAS FORMULAS 16.2. APLICAC AO DE ERRO
195
Evidentemente n ao h a resposta a essa pergunta, pois se h = 0.5, por exemplo, ent ao 4 2 1000h = 62.5, que e (bem) maior do que 0.2h = 0.05, mas por outro lado se h = 0.01 ent ao 1000h4 = 105 , menor do que 0.2h2 = 2 105 . Na verdade, mesmo que 1000h4 seja maior do que 0.2h2 , para certos valores de h, isso nunca vai acontecer se h for sucientemente pequeno, pois 1000h4 = 5000h2 0 0.2h2 quando h tende a zero. O limite indica mais ainda do que isso: a raz ao entre 1000h4 e 0.2h2 e tanto menor quanto menor for h. Se, por exemplo, quisermos que 1000h4 seja 100 vezes menor do que 0.2h2 , ent ao basta tomar h menor do que 0.0014 (truncamento de 5000001/2 ). Nesta linha de racioc nio, quando h tende a ser pequeno, as melhores estimativas tendem a ser aquelas que t em mais alta pot encia de h. S ao melhores nesse sentido, portanto, as estimativas do M etodo de Simpson, e dentre elas a segunda, pois, dentre as duas com h4 , e aquela com menor constante multiplicativa: ES (h) = 1 max |f (iv) | |b a|h4 . 180
As tr es estimativas para o M etodo dos Trap ezios s ao da mesma ordem (h2 ), sendo a terceira um pouco pior do que as outras duas, por apresentar constante multiplicativa maior. Ent ao 1 ET (h) = max |f | |b a|h2 . 12 Essas duas estimativas s ao as que iremos adotar nas aplica c oes pr aticas.
16.2
Aplica c ao das f ormulas de erro

2
Nesta Se c ao aplicaremos as f ormulas de erro no c alculo de ln 2 =

1
1 dx . x
Suponha que queiramos calcular ln 2 com precis ao de 5 105 , ou seja queremos que 5 o valor correto esteja a menos de 5 10 do valor estimado. Usaremos as f ormulas de erro para determinar em quanto devemos xar h para obter estimativas com essa precis ao. Examinemos primeiramente o M etodo dos Trap ezios. Sua f ormula de erro envolve |b a|, que e igual a 1, e o maior valor absoluto da derivada segunda de f nesse intervalo. 1 1 2 Ora, como f (x) = x , ent ao f (x) = x e uma fun c ao positiva 2 e f (x) = x3 . Logo f (x)
196 CAP ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRAC AO e decrescente no intervalo considerado, atingindo seu m aximo necessariamente em x = 1. O valor desse m aximo e f (1) = 2. Assim sendo, a f ormula de erro ca ET (h) = h2 . 6
Essa f ormula representa o erro m aximo da estimativa. Portanto, se quisermos garantir que o erro da estimativa seja menor do que 5 105 , basta garantir que ET (h) seja menor do que esse valor, isto e, gostar amos de escolher h de tal forma que h2 < 5 105 . 6 Isto e o mesmo que pedir h< 30 105 = 0.01732 . . .
At e agora, a conclus ao e que qualquer valor de h menor do que 0.01732 . . . servir a para obter a estimativa com a precis ao desejada, usando-se o M etodo dos Trap ezios. Acontece que h tamb em deve ser tal que o comprimento total do intervalo seja um m ultiplo inteiro de h. Ou seja, devemos ter ba =n. h Como b a = 1 e h < 0.01732 . . . ent ao n= ba 1 1 = > = 57.7 . . . , h h 0.01732 . . .
implicando que n deve ser maior ou igual a 58. Ent ao precisamos dividir o intervalo [1, 2] em no m nimo 58 intervalinhos para conseguir a estimativa desejada, com a precis ao requerida! E o M etodo de Simpson, ser a que e mais vantajoso neste exemplo? Ser a que com menos intervalos na parti c ao conseguiremos garantir a mesma precis ao? Agora temos que nos concentrar na f ormula de ES (h), que depende do m aximo valor absoluto da 2 6 (iv ) (x) = 24 . quarta derivada, entre 1 e 2. Como f (x) = x 3 , temos f (x) = x4 e f x5 Essa fun c ao e positiva e decrescente em [1, 2] de forma que seu m aximo e atingido em x=1e e igual a 24. Ent ao ES (h) = 24 4 2 h = h4 . 180 15
Como queremos ES (h) < 5 105 , basta tomar h tal que 2 4 h < 5 105 , 15
DAS FORMULAS 16.2. APLICAC AO DE ERRO isto e, h< 15 5 105 2

1 4
197
= 0.139 . . . .
Ent ao o n umero n de intervalos da parti c ao ser a maior do que 1 = 7.18 . . . 0.139 . . . Aqui deve-se prestar uma aten c ao a mais: no M etodo de Simpson o n umero de intervalos deve ser par. Portanto n = 8 j a e uma boa escolha! Como o M etodo de Simpson se revela consideravelmente menos trabalhoso para se obter, garantidamente, a precis ao desejada, fa camos os c alculos correspondentes. Mas antes teremos que determinar o n umero de algarismos signicativos ou de casas decimais envolvidos. Na verdade, como se trata de delimitar um erro absoluto, e melhor considerar xo o n umero de casas decimais. Observe que o erro em cada arredondamento de f (xi ) e de, no m aximo, 0.5 10N , onde N e o n umero de casas decimais utilizadas. Usando N casas decimais, a soma f (x0 ) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + 2f (x4 ) + 4f (x5 ) + 2f (x6 ) + 4f (x7 ) + f (x8 ) acumular a no m aximo 20 vezes esse valor (20 e a soma dos coecientes dos f (xi )s). O erro acumulado ser a, no m aximo, 10 10N , ou seja, da ordem da casa decimal anterior. 1 e igual a 24 , de forma que Acontece que depois essa soma ser a multiplicada por h 3 , que o erro m aximo por arredondamento no valor nal car a menor do que 0.5 10N (por exemplo, se usarmos 5 casas decimais o arredondamento provocar a erro de no m aximo 5 0.5 10 ). Pela f ormula de Simpson, a ado c ao de n = 8 nos leva a um erro m aximo 2 15 1 8
4
ES (h) =
3.26 105 ,
de forma que um erro adicional de 105 por arredondamento n ao nos tirar a da margem previamente delimitada de 5 105 . O que nos faz concluir que o uso de 5 casas decimais e suciente para os c alculos. Ent ao vamos a eles! A tabela abaixo mostra os valores de f nos pontos da parti c ao, arredondados para 5 casas decimais.
198 CAP ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRAC AO
i 0 1 2 3 4 5 6 7 8 Obtemos
xi 1.000 1.125 1.250 1.375 1.500 1.625 1.750 1.875 2.000
f (xi ) 1.00000 0.88889 0.80000 0.72727 0.66667 0.61538 0.57143 0.53333 0.50000
1 1 S( ) = 16.63568 = 0.69315 , 8 24 que difere do valor verdadeiro por menos do que 105 , dentro, portanto e com folga, da precis ao pedida. Exerc cio. A integral
2 1
ex dx x
e maior ou menor do que 3? Justique sua resposta e d e uma estimativa para a integral. Exerc cio. Investigue, de maneira geral, como deve se dar a escolha do n umero de casas decimais dos c alculos do M etodo dos Trap ezios e do M etodo de Simpson, baseado no que foi feito no exemplo acima, e levando em conta a precis ao que se quer atingir no resultado nal. Proponha uma receita para essa escolha. Exerc cio. Determine uma f ormula para S ( h c ao de T (h) e T ( h 2 ) em fun 2 ). Exerc cio. Procure integrar numericamente fun c oes cujas primitivas sejam conhecidas, de forma a comparar os resultados obtidos com os valores exatos. Examine a 2 integra c ao num erica da fun c ao Gaussiana ex , largamente utilizada em Probabilidade e Estat stica. Exerc cio. Considere a fun c ao ln x = 1 1 cio e ver que o t dt. O objetivo deste exerc n umero e pode ser obtido atrav es da solu c ao num erica da equa c ao ln x = 1, usando o M etodo de Newton e calculando logaritmos somente atrav es da deni c ao. 1. Determine a fun c ao de itera c ao do M etodo de Newton, que resolve esta equa c ao numericamente. 2. Determine o erro m aximo de se calcular ln x, para 1 x 3, usando o M etodo de Simpson com 8 intervalos.
x
DAS FORMULAS 16.2. APLICAC AO DE ERRO
199
3. Tome x0 = 3 e calcule x1 = (x0 ) (use 4 casas decimais para os valores de 1 t, e 8 intervalos para a integra c ao). 4. Calcule x2 = (x1 ), com 4 casas decimais e 8 intervalos. 5. Discuta uma estrat egia que voc e adotaria para mostrar que e est a, com certeza, no intervalo [2.716, 2.720]. Exerc cio. Usando o m etodo de m nimos quadrados, aproxime ex por um polin omio de grau 4 no intervalo [1, 1]. Para isso, use a fam lia de polin omios ortogonais (nesse 3 3 x, g (x) = x4 6 x2 + 3 , intervalo) g0 (x) = 1, g1 (x) = x, g2 (x) = x2 1 , g ( x ) = x 3 4 3 5 7 35 2 8 8 sabendo que < g0 , g0 >= 2, < g1 , g1 >= 3 , < g2 , g2 >= 45 , < g3 , g3 >= 175 , < 128 g4 , g4 >= 11025 . Observe que ser a preciso calcular a integral gaussiana. Outras integrais ou ser ao nulas (porque o integrando e mpar) ou podem ser reduzidas, por sucessivas integra c oes por partes, a ` integral gaussiana. Estime os valores num ericos usando uma aproxima c ao para essa integral. Exerc cio. Considere a equa c ao f (x) =
x t2 dt 0 e
2
1 = 0.
1. Dena a fun c ao de itera c ao do M etodo de Newton para resolver a equa c ao. 2. Com x0 = 1, obtenha x1 = (x0 ).
200 CAP ITULO 16. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRAC AO
Cap tulo 17
Obten c ao das f ormulas de erro

Como dissemos no Cap tulo anterior, dedicaremos este Cap tulo para a obten c ao das f ormulas de erro mencionadas. Seguiremos tr es abordagens, com a nalidade de propor diferentes vis oes de como se pode estimar a integral da diferen ca entre a fun c ao verdadeira e o polin omio interpolador que a substitui. O leitor reconhecer a que a primeira abordagem e a continua c ao natural das estimativas do erro de interpola c ao obtidas no Cap tulo 12. Todas as f ormulas de erro mencionadas pressup oem que os intervalos da parti c ao sejam de igual tamanho. Poder amos, evidentemente, determinar f ormulas mais gerais que levassem em conta um espa camento irregular, mas sem d uvida isso seria um pouco menos interessante. As id eias da primeira abordagem, por exemplo, podem ser seguidas no caso geral, se isso for da necessidade do leitor, mas deve-se atentar para o fato de que as f ormulas de erro n ao ser ao t ao boas quanto as outras. Em todas as abordagens, a f ormula de erro e obtida primeiro para uma unidade b asica. No M etodo dos Trap ezios, a unidade b asica e um intervalo [xi , xi+1 ], de tamanho h. Para cada intervalo obt em-se uma f ormula eT (h), e como o n umero de intervalos e igual a n ent ao ET (h) = neT (h) . Acontece que n tamb em e o tamanho total do intervalo de integra c ao dividido por h, de forma que |b a| ET (h) = eT (h) . h Por exemplo, na primeira e na segunda abordagens obteremos 1 eT (h) = max |f |h3 , 12 logo |b a| ET (h) = max |f |h2 . 12 201
202
DAS FORMULAS CAP ITULO 17. OBTENC AO DE ERRO
Observe que tamb em h a uma perda em rela c ao ` a constante multiplicativa, pois na f ormula de eT (h) o m aximo valor absoluto da segunda derivada e obtido dentro da unidade b asica, enquanto que na f ormula de ET (h) trata-se do m aximo ao longo de todo o intervalo de integra c ao. J a no M etodo de Simpson, a unidade b asica e um intervalo da forma [x2i , x2i+2 ], que tem tamanho 2h. Em cada intervalo desses troca-se f por um polin omio quadr atico e examina-se a diferen ca produzida na integra c ao. A f ormula de erro para a unidade ser a |ba| denotada por eS (h). Como s ao n unidades b asicas e 2n = h , resulta que ES (h) = neS (h) = |b a| eS (h) . 2h
As f ormulas de erro das unidades b asicas (de acordo com a abordagem) est ao contidas na tabela abaixo. 1a 1 3 12 max |f | h 1 4 12 max |f | h 2a 1 3 12 max |f | h 1 ( iv ) | h5 90 max |f 3a 5 3 12 max |f | h 2 ( iv ) | h5 45 max |f
eT (h) eS (h)
Finalmente, vale notar que, via uma mudan ca de coordenadas, os intervalos [xi , xi+1 ] do M etodo dos Trap ezios podem ser tomados como sendo [0, h], e as unidades [x2i , x2i+2 ] do M etodo de Simpson podem ser tomados como sendo [h, h]. No M etodo dos Trap ezios, denimos p(x) como o polin omio interpolador de grau 1 por (0, f (0)) e (h, f (h)), e procuramos limitar a diferen ca
h
(h) =
0
(f (x) p(x)) dx ,
em valor absoluto, por eT (h). No M etodo de Simpson, denimos p(x) como sendo o polin omio quadr atico por (h, f (h)), (0, f (0)) e (h, f (h)), e procuramos limitar a diferen ca
h
(h) =
h
(f (x) p(x)) dx ,
em valor absoluto, por eS (h).
17.1
Primeira Abordagem - M etodo dos Trap ezios
1 Mostraremos que |(h)| 12 max |f | h3 (vide tabela acima). De acordo com o exposto no Cap tulo 12, a diferen ca
f (x) p(x)
17.2. PRIMEIRA ABORDAGEM - METODO DE SIMPSON pode ser limitada, em [0, h], da seguinte forma: cx(h x) f (x) p(x) cx(h x) , onde c= Ent ao, pela deni c ao de (h), temos
h
203
1 max |f | . 2! [0,h]
|(h)| c
0
x(h x)dx = c
h3 , 6
e segue o que quer amos demonstrar.
17.2
Primeira Abordagem - M etodo de Simpson
1 Mostraremos que |(h)| 12 max |f | h4 . De acordo com o Cap tulo 12, |f (x) p(x)| c|q (x)| , onde q (x) = (x + h)x(h x) 1 e c = 3! max[h,h] |f | . Ent ao h
|(h)| c
h
|q (x)|dx .
Como q e fun c ao mpar, |q | e fun c ao par, de forma que

h
|(h)| 2c
0
|q (x)|dx .
Al em disso, em [0, h] a fun c ao q e positiva, e portanto s o precisamos obter a integral

h
(x + h)x(h x)dx =
0
h4 . 4
Logo c |(h)| h4 , 2 de onde segue o que quer amos demonstrar.
204
17.3
Segunda Abordagem - M etodo dos Trap ezios
1 Iremos mostrar que |(h)| 12 max |f | h3 . h Queremos avaliar o erro de se aproximar a integral 0 f (x)dx pela area do trap ezio h avel e estimaremos o erro (h) 2 (f (0) + f (h)). Para isso, consideraremos h como vari em fun c ao dessa vari avel. Temos h
(h) =
0
f (x)dx
h (f (0) + f (h)) . 2
Se P for uma primitiva de f (isto e, P (x) = f (x)), ent ao (h) = P (h) P (0) h (f (0) + f (h)) . 2
Observamos ent ao que (0) = 0, o que era de se esperar, pois nenhum erro e cometido se h e nulo. Se pudermos limitar a derivada de (h) ent ao limitaremos seu crescimento, em fun c ao do tamanho de h. Temos (h) = P (h) Como P = f , ent ao 1 h (f (h) f (0)) f (h) . 2 2 Notamos tamb em que (0) = 0, o que nos sugere derivar ainda mais uma vez, para delimitar o crescimento de : (h) = h (h) = f (h) . 2 Ent ao | (h)| C onde C = max |f | .
[0,h]
1 h (f (0) + f (h)) f (h) . 2 2
h , 2
Com o crescimento controlado de , voltamos a integrar:

h h
(h) = (0) +
0
(t)dt =
0 h
(t)dt .
Logo
h
| (h)|
0
| (t)|dt C
0
t h2 dt = C . 2 4
17.4. SEGUNDA ABORDAGEM - METODO DE SIMPSON Integrando mais uma vez, |(h)| C
0 h 2 t
205
dt = (max |f |)
h3 . 12
Como quer amos demonstrar!
17.4
Segunda Abordagem - M etodo de Simpson

1 90
Queremos mostrar que |(h)| Temos que avaliar

h
max |f (iv) | h5 .
(h) =
h
f (x)dx
h (f (h) + 4f (0) + f (h)) . 3
Os passos s ao semelhantes ` aqueles do M etodo dos Trap ezios, mas agora temos que derivar e integrar uma vez a mais. Derivando tr es vezes chegamos a (h) = h f (h) f (h) , 3
com (0) = (0) = (0) = 0. Pelo Teorema do Valor M edio, existe = (h) no intervalo [h, +h] tal que f (h) f (h) = f (iv) ( ) 2h . Portanto, se C = max |f (iv) |
[h,h]
ent ao | (h)| C e, por integra c oes sucessivas, | (h)| C | (h)| C |(h)| C 2h3 , 9 h4 , 18 h5 . 90 2h2 , 3
206
17.5
Terceira Abordagem - M etodo dos Trap ezios
5 Obteremos |(h)| 12 max |f | h3 . Nesta abordagem do c alculo de erro, levamos em conta a expans ao em Taylor da fun c ao f (vide Ap endice B. O m etodo e um pouco mais intuitivo que os anteriores, mas produz resultados um pouco piores (n ao na ordem de h, mas nas constantes multiplicativas). Como na Segunda Abordagem, olhamos para h
(h) =
0
f (x)dx
h [f (h) + f (0)] . 2
A fun c ao f se escreve como f (x) = f (0) + f (0)x + R(x) , onde |R(x)| max |f | J a que f (0)h =
h 0 f
x2 . 2
(0)dx, temos
h
(h) =
0 h
f (x) f (0)dx + f (0)xdx

0
h [f (0) f (h)] 2
h
h [f (0) f (h)] + 2
R(x)dx
0
= f (0)
h h2 h [f (h) f (0)] + R(x)dx 2 2 0 h h2 h = f (0) f (0)h + R(h) + R(x)dx 2 2 0 h h = R(h) + R(x)dx . 2 0
Usando a estimativa em |R(x)|, conclu mos que |(h)| max |f | 5h3 . 12
17.6
Terceira Abordagem - M etodo de Simpson

2 45
Iremos mostrar que (h)
max |f (iv) | h5 .
17.6. TERCEIRA ABORDAGEM - METODO DE SIMPSON
207
Em primeiro lugar, observaremos que o M etodo de Simpson, aplicado em pares de intervalos iguais, e exato para polin omios c ubicos. Sem perda de generalidade, suponha que queiramos integrar g (x) = ax3 + bx2 + cx + d em [h, h]. O M etodo de Simpson nos d a a aproxima c ao h (g (h) + 4g (0) + g (h)) . 3 Mas g (h) + g (h) = 2bh2 + 2d . Al em disso, g (0) = d, logo h bh2 (g (h) + 4g (0) + g (h)) = 2h( + d) . 3 3 Por outro lado, vemos que esse e exatamente o valor da integral, pois
h
(ax3 + bx2 + cx + d)dx = a

h
x4 h x3 x2 h |h + b |h + c | + dxh h . 4 3 h 2 h
O primeiro e o terceiro termos s ao nulos, logo a integral vale 2b h3 + 2dh , 3
que e o mesmo valor dado pelo M etodo de Simpson. Agora consideremos uma fun c ao f sucientemente diferenci avel. Ela pode ser escrita como seu polin omio de Taylor de ordem 3 mais um resto R(x): f (x) = f (0) + f (0)x + onde f (0) 2 f (0) 3 x + x + R(x) , 2 3!
R(x) 0 x3 quando x 0. Chamaremos de p3 o polin omio de Taylor, de forma que f (x) p3 (x) = R(x) . Adiante teremos uma f ormula mais expl cita para esse resto, que permitir a qualicar as constantes envolvidas.
208

h h f (x)dx,
Queremos avaliar o erro cometido pelo M etodo de Simpson para integrar isto e, olharemos para a diferen ca
h
(h) =
h
f (x)dx
h (f (h) + 4f (0) + f (h)) . 3
Sabendo que o M etodo de Simpson e exato para grau tr es, temos

h
p3 (x)dx =
h
h (p3 (h) + 4p3 (0) + p3 (h)) , 3
logo, lembrando que p3 (0) = f (0) e que f (x) p3 (x) = R(x),

h
(h) =
h
R(x)dx
h (R(h) + R(h)) . 3
Usaremos a seguinte estimativa para o resto: |R(x)| max |f (iv) |

[0,x]
x4 , 4! 2h 5 5! 2h5 . 45
de forma que
h
R(x)dx max |f (iv) |

h [h,h]
e |(h)| max |f (iv) |

[h,h]
2h5 2h 5 + 5! 3 4!
= max |f (iv) |
[h,h]
Parte VI
Equa c oes Diferenciais
209
Cap tulo 18
Breve introdu c ao ` as equa c oes diferenciais

18.1 Introdu c ao
Uma equa c ao diferencial de uma vari avel real e uma equa c ao em que a inc ognita e uma fun c ao real x : [a, b] R. Esta equa c ao coloca em rela c ao a fun c ao e sua derivada. O tipo mais simples de equa c ao diferencial e o problema de achar uma primitiva de uma dada fun c ao. Por exemplo, x (t) = f (t) , t [a, b] , signica que a derivada da fun c ao x(t) e igual a f (t) para todo t entre a e b. Em outras palavras, a fun c ao x(t) e uma primitiva da fun c ao f (t). Na nota c ao de Leibniz, escrevemos x(t) = f (t)dt + C , indicando que todas as primitivas de f diferem por uma constante. Mais precisamente, se F1 e F2 s ao primitivas de f ent ao existe uma constante C , que depende e claro de F1 e F2 , tal que F1 (t) F2 (t) = C para todo t I . Uma primitiva em particular pode ser dada pela integral indenida
t
F (t) =
t0
f (s)ds ,
para um determinado t0 [a, b]. Neste caso, F (t0 ) = 0. Se adicionarmos ` a equa c ao diferencial x (t) = f (t) a exig encia de que x(t0 ) = x0 , ent ao ca determinada a u nica primitiva que e solu c ao desse problema:
t
x(t) = x0 +
t0
f (s)ds .
211
212
AS ` EQUAC CAP ITULO 18. BREVE INTRODUC AO OES DIFERENCIAIS
Essa exig encia extra e conhecida como um problema de valor inicial. Em geral as equa c oes diferenciais n ao se resumem t ao simplesmente a um problema de integra c ao. Por exemplo, a derivada de x(t) pode depender de x(t), como na seguinte equa c ao: x (t) = x(t) , t R . f E acil vericar que x(t) = et e solu c ao. Ela n ao eau nica, pois x(t) = cet tamb em e solu c ao da equa c ao diferencial para todo c R. No entanto, se impusermos o problema de valor inicial x(t0 ) = x0 e supusermos x(t) = cet , ent ao a constante c ca univocamente determinada por x0 = x(t0 ) = cet0 , donde x(t) = x0 ett0 . Ao contr ario do exemplo anterior, n ao e claro ainda neste ponto que x(t) seja a u nica solu c ao da equa c ao diferencial x (t) = x(t) satisfazendo o problema de valor inicial x(t0 ) = x0 , pois a princ pio poderia haver uma solu c ao que n ao fosse da forma x(t) = cet . De fato veremos que esse n ao e o caso, pelo menos para essa equa c ao (vide Subse c ao 18.3.2). De modo geral, uma equa c ao diferencial e colocada assim: a derivada de x(t) depende de t e de x(t), isto e, x (t) = f (t, x(t)) , onde f aqui denota uma fun c ao de duas vari aveis (n ao nos preocuparemos por enquanto com o dom nio da fun c ao f ). Na nota c ao compacta escreve-se x = f (t, x) , cando impl cito o argumento das fun c oes x e x . Por exemplo, x = t2 sen(tx) signica 2 x (t) = t sen(tx(t)). As fun c oes x(t) que vericam x (t) = f (t, x(t)) s ao chamadas solu c oes da equa c ao diferencial. Al em disso, como nos dois exemplos acima, pode-se colocar o problema de valor inicial x(t0 ) = x0 . O problema de achar x(t) tal que x = f (t, x) x(t0 ) = x0 e comumente conhecido como problema de Cauchy. Dizemos que uma equa c ao diferencial e aut onoma quando f s o depende de x, isto e f (t, x) = X (x) (na medida do poss vel usaremos a letra f para as equa c oes n ao aut onomas e X para as aut onomas, por quest oes de tradi c ao).
DE EQUAC 18.2. SOLUC AO OES AUTONOMAS E SEPARAVEIS
213
Pensando no caso aut onomo, suponha que j a conhe camos uma solu c ao para o problema de Cauchy x = X (x), x(0) = x0 . Seja x (t) essa solu c ao, isto ex (t) = X ( x(t)) ex (0) = x0 . Ent ao e f acil ver que x(t) = x (t t0 ) e solu c ao do problema de Cauchy x = X (x), x(t0 ) = x0 . Em outras palavras, no caso de equa c oes aut onomas basta estudar o problema de Cauchy com t0 = 0. Al em das equa c oes aut onomas, temos tamb em as equa c oes separ aveis, onde f (t, x) e o produto de uma fun c ao que s o depende de t por uma fun c ao que s o depende de x: f (t, x) = g (t)X (x) . Veremos adiante que equa c oes aut onomas e separ aveis s ao facilmente sol uveis, a menos de integra c oes e invers oes, isto e, podemos escrever suas solu c oes em termos de inversas de primitivas de fun c oes elementares, mas eventualmente essas solu c oes n ao podem ser obtidas explicitamente.
18.2
Solu c ao de equa c oes aut onomas e separ aveis
Em primeiro lugar observamos que, de algum modo, equa c oes aut onomas representam um caso particular das equa c oes separ aveis. Pois uma equa c ao aut onoma x = X (x) tamb em se escreve como x = g (t)X (x), se tomarmos g (t) 1. Para discutir as solu c oes de x = g (t)X (x), observamos primeiramente que se X (x ) = 0 ent ao x(t) x e solu c ao, pois x (t) 0 e g (t)X (x(t)) = g (t)X (x ) 0. Um ponto x dessa forma e chamado de singularidade da equa c ao. Est a fora do escopo destas notas, mas com condi c oes razo aveis sobre g e X (por exemplo, g cont nua e X diferenci avel e com derivada cont nua), pode-se mostrar que se x(t) = x para algum instante t ent ao x(t) x . Em outras palavras, n ao h a como uma solu c ao x(t) chegar e sair de uma singularidade. Na verdade, sob essas mesmas hip oteses e poss vel mostrar que duas solu c oes quaisquer x(t) e x (t) ou s ao id enticas (x(t) = x (t), para todo t) ou nunca se cruzam (x(t) = x (t), para todo t). Fora das singularidades, podemos encontrar a solu c ao da seguinte maneira. Primeiro escrevemos a equa c ao com a vari avel t explicitada: x (t) = g (t)X (x(t)) . O instante inicial e t0 , e gostar amos de saber x(t) se x(t0 ) = x0 (problema de Cauchy). Como estamos supondo que x(t) n ao passa por singularidade, ent ao X (x(t)) n ao se anula, e podemos dividir os dois lados da equa c ao por X (x(t)), e integrar de t0 a t:
t t0
1 x (s)ds = X (x(s))
g (s)ds .
t0
214
No lado esquerdo fazemos a substitui c ao u = x(s), de forma que du = x (s)ds. Ent ao

x(t) x0
1 du = X (u)
g (s)ds .
t0
A partir da podemos, em teoria, encontrar x(t), mas sua express ao expl cita depender a de podermos cumprir certas etapas. Por exemplo, se acharmos uma primitiva F 1 para X e uma primitiva G para g , ent ao a equa c ao car a F (x(t)) = F (x0 ) + G(t) G(t0 ) . Se, al em disso, conseguirmos achar a inversa de F (pelo menos numa regi ao delimitada 1 entre duas singularidades isso em tese e poss vel, pois F = X n ao troca de sinal, mas achar uma express ao expl cita e outra coisa!), teremos x(t) = F 1 (F (x0 ) + G(t) G(t0 )) .
18.3
Alguns exemplos
Nesta Se c ao examinaremos alguns exemplos de equa c oes diferenciais que surgem da modelagem de problemas do mundo real, e discutiremos sua solu c ao.
18.3.1
Naftalinas
Na Subse c ao 5.3.3 abordamos a perda de material de uma bolinha de naftalina em fun c ao do tempo, e chegamos ` a conclus ao de que seu raio r(t) obedece ` a equa c ao r (t) = , onde e uma constante positiva. Podemos dizer que a equa c ao e aut onoma, mas e muito mais do que isso. Ela diz que r(t) e uma fun c ao de derivada constante negativa, ou seja, e uma fun c ao am. Portanto r(t) = r0 t , onde r0 = r(0). Este caso n ao passa de uma simples primitiviza c ao.
18.3.2
Crescimento populacional a taxas constantes
Se tomarmos t como sendo o tempo, e x(t) como sendo a popula c ao de determinada esp ecie no instante t, podemos, por aproxima c ao, supor que x(t) varia continuamente (hip otese razo avel se a popula c ao e grande). A taxa de varia c ao da popula c ao e medida
18.3. ALGUNS EXEMPLOS
215
percentualmente, isto e, mede-se o incremento (ou decrescimento) x(t + h) x(t), do instante t para o instante t + h, e divide-se pela popula c ao que havia no instante t: x(t + h) x(t) . x(t) Mesmo assim, esse valor e muito dependente do tempo h decorrido entre os dois instantes, sendo muito mais razo avel, portanto, dividir tudo por h. Fazendo depois o limite quando h tende a zero, camos com x (t) (t) = , x(t) onde (t) indica a taxa de crescimento instant aneo no instante t. A hip otese Malthusiana de crescimento e que (t) seja constante, isto e, (t) , o que leva ` a equa c ao x (t) = x(t) . Podemos deduzir a solu c ao, sem apelar para chutes. A u nica singularidade da equa c ao e x = 0, e queremos achar as solu c oes que n ao passam pelo zero. Ent ao
x(t) x0
1 du = (t t0 ) , u
portanto log x(t) = log x0 + (t t0 ) e, exponenciando os dois lados, x(t) = x0 e(tt0 ) . Um modelo como este se presta tamb em ` a modelagem do decaimento radioativo, onde a taxa de decaimento de uma amostra de um is otopo e proporcional ` a quantidade desse mesmo is otopo.
18.3.3
P ara-quedista
Al em do crescimento populacional e do decaimento radioativo, equa c oes do tipo x = x explicam o comportamento da velocidade do p ara-quedista. Se v (t) e velocidade do p ara-quedista (supondo positiva se estiver indo de cima para baixo), ent ao v (t) e a acelera c ao, e pela Segunda Lei de Newton vale mv (t) = mg v (t) ,
216
onde o termo v (t) corresponde ` a for ca de resist encia exercida em sentido contr ario ao do movimento e de intensidade proporcional ` a velocidade. Isso d a uma equa c ao aut onoma em v (t). A velocidade de equil brio v e denida como sendo aquela para a qual a resultante mg de for cas e nula, portanto v = . Se denirmos w(t) = v (t) v (ou seja, a diferen ca entre a velocidade e a velocidade de equil brio, em cada instante), teremos mw (t) = mv (t) = mg v (t) = v v (t) = w(t) . Como
m g v ,
ent ao w(t) = w0 e v t ,
g
se w0 = w(0). A equa c ao tamb em poderia ser resolvida diretamente, pela integra c ao

v (t) v0
m dv = t , mg v
seguindo o m etodo sugerido para equa c oes aut onomas e separ aveis.
18.3.4
Crescimento populacional com restri c oes de espa co
Um modelo ligeiramente mais realista do que o proposto na Subse c ao 18.3.2 levaria em conta a limita c ao de espa co e alimento que uma popula c ao enfrenta quando se torna muito grande. Esse modelo preveria que: (i) se a popula c ao for muito grande, a taxa de crescimento (t) deveria ser negativa, e tanto mais negativa quanto maior for a popula c ao; (ii) se a popula c ao for muito pequena, a taxa de crescimento deveria ser positiva, e tanto mais positiva quanto menor for a popula c ao (respeitando e claro a velocidade de reprodu c ao m axima da esp ecie). Nesse modelo, portanto, (t) dependeria exclusivamente da popula c ao, sendo mais justo escrever (t) = h(x(t)) . A fun c ao h(x) assumiria um valor positivo em x = 0, correspondente a uma taxa de crescimento ideal da popula c ao, sem limita c ao f sica alguma. Essa taxa decresceria continuamente com o aumento de x, ao ponto de se tornar negativa para x grande. Por exemplo, h(x) = a bx, com a e b positivos, satisfaz a essas exig encias. Neste caso, ter amos a equa c ao diferencial x (t) = x(t) (a bx(t)) ou, em nota c ao compacta, x = x(a bx) . Poder amos resolver explicitamente esta equa ca o, mas achamos que ela se presta muito mais a um exame qualitativo, do qual iremos falar na pr oxima Se c ao.
217
18.3.5
Caten aria
J a falamos mais de uma vez sobre a caten aria, mas em nenhum momento justicamos porque uma corda (ou corrente) pendurada por dois pontos assume o formato de um cosseno hiperb olico. A dedu c ao mais razo avel passa por uma equa c ao diferencial. Vejamos. Em primeiro lugar, chamaremos de t a coordenada horizontal e de x a coordenada vertical no plano da corda, para manter a nota c ao que usamos at e este ponto da exposi c ao. E comum o emprego de y e x para essas vari aveis, de forma que a equa c ao diferencial se escreva como y = f (x, y ), mas n ao o faremos para evitar confus ao. A origem das coordenadas ser a colocada sobre o ponto de m nimo da corda.

Como estamos modelando uma corda parada, temos um equil brio de for cas sobre a corda, que podemos investigar. As for cas existem realmente, porque h a o peso da corda agindo verticalmente e as for cas de tens ao para contrabalan car. Faremos a an alise desse equil brio de for cas sobre um segmento da corda, entre o ponto (0, 0) e um ponto arbitr ario (t, x(t)) da corda, onde x(t) indica a fun c ao cujo gr aco coincide com seu formato. Para se obter a for ca peso agindo sobre esse peda co, e preciso calcular seu comprimento e multiplicar pela densidade linear da corda (que suporemos constante e igual a um certo n umero ). O comprimento l(t) do gr aco de x(t) entre 0 e t e dado pela integral
t
l(t) =
0
1 + x (s)2 ds .
As for cas de tens ao agem no segmento tangencialmente ` a corda. Estando j a equilibradas localmente no interior do segmento, restam as for cas nos extremos. Em (0, 0) e uma for ca horizontal, de intensidade f0 desconhecida. Em (t, x(t)) e uma for ca de intensidade f (t) desconhecida, inclinada com angulo = (t) cuja tangente e igual a x (t). Do equil brio de for cas horizontal obt em-se f0 = f (t) cos e do equil brio vertical gl(t) = f (t)sen .
218
Dividindo a segunda equa c ao pela primeira camos com tan = g l(t) . f0
J a sabemos que tan = x (t) e que l(t) e dado por uma integral. Derivando ambos os lados obtemos x (t) = c 1 + x (t)2 , onde c = g e uma equa c ao aut onoma onde a fun c ao inc ognita e x (t). f0 . Essa E f acil ver que x (t) = senh(ct) e solu c ao. Pois derivando mais uma vez obteremos x (t) = c cosh(ct) e, por outro lado, 1 + senh2 (ct) = cosh2 (ct) = cosh(ct) .
Al em disso, x (t) = senh(ct) verica x (0) = 0, isto e, a inclina c ao da corda e zero no ponto de m nimo. Agora basta integrar x (t) para obter x(t). Como x(0) = 0 ent ao x(t) = 1 (cosh(ct) 1) . c
18.3.6
Escoamento de um copo furado
Neste exemplo, imagine um copo cheio d agua, com um buraco no fundo, por onde a agua escoa. Suponha que no instante t = 0 a altura do n vel da agua seja igual a h0 . Como evolui com o tempo o n vel h da agua? Em quanto tempo o copo se esvaziar a completamente? Se o copo tem um formato diferente, por exemplo, seu raio aumenta ou diminui conforme a altura, como se comporta a fun c ao h(t)? Com algum grau de empirismo, e poss vel modelar o problema atrav es de uma equa c ao diferencial. O dado emp rico refere-se ` a taxa de sa da de agua pelo buraco, medida em volume por unidade de tempo. Espera-se primeiramente que ela seja proporcional ` a area do buraco (a qual chamaremos de a0 ), mas n ao, a princ pio, da sua forma. Tamb em n ao se espera, em primeira aproxima c ao, que ela dependa do formato do copo. Por outro lado, ela deve ser proporcional ` a velocidade da agua que sai do buraco. Essa sua velocidade, por sua vez, dependeria da altura h, como agua ca sse dessa altura, se a coluna de alcan cando uma velocidade da ordem de h (lembre-se que para um corpo em queda livre, a partir do repouso, a velocidade e proporcional ` a raiz da dist ancia j a percorrida). Ent ao a taxa de varia c ao do volume do copo seria V (t) = ca0 h(t) .
219
Por outro lado, o decrescimento do volume implica no decrescimento do n vel da agua h. Observe, no entanto, que quanto maior for a area da se c ao transversal ao copo na altura h menor ser a o decrescimento do n vel, para uma mesma perda de volume. Ou pensando inversamente, se o copo for muito no ` a altura h ent ao o n vel cair a mais rapidamente. Para quanticar isso, notemos que o volume de agua e completamente determinado pelo n vel h atrav es da fun c ao
h
V (h) =
0
A(u)du ,
onde A(h) e a fun c ao que d aa area da se c ao correspondente ` a altura h. Pelo Teorema Fundamental do C alculo, V (h) = A(h) . A fun c ao V (t) resulta ent ao da fun c ao h(t) pela rela c ao V (t) V (h(t)) . Logo, pela Regra da Cadeia, V (t) = V (h(t))h (t) = A(h(t))h (t) . Juntando com a equa c ao emp rica acima, temos A(h(t))h (t) = ca0 h(t) ,
que e uma equa c ao diferencial aut onoma, se a escrevermos na forma tradicional: h h = ca0 . A(h) O exemplo mais simples e o copo reto, quer dizer, cujas se c oes horizontais t em todas a mesma area A. Neste caso, a equa c ao se reduz a h (t) = Tomando t0 = 0 e h(0) = h0 , temos
h(t) h0
ca0 A
h(t) .
1 dh = t , h
onde =
ca0 A .
O lado esquerdo pode ser integrado: 2( h(t) h0 ) = t ,
220
e h(t) pode ser isolado: h(t) = h0 t 2

2
Portanto h(t) e uma fun c ao quadr atica em t, que vale h0 em t = 0, e se anula no seu 2 h0 ponto de m nimo, t = .
18.3.7
Dada do M etodo de Newton, quem e f?
Um problema te orico que pode ser resolvido com o aux lio de equa c oes diferenciais separ aveis e o de achar a fun c ao f que, no M etodo de Newton, gera uma dada fun c ao de itera c ao . Em outras palavras, dada a fun c ao e sabendo-se que (x) = x f (x) , f (x)
achar f . Manipulando, obtemos a equa c ao separ avel f (x) = 1 f (x) , x (x)
onde x faz o papel de t e f o papel de x. A equa c ao s o est a denida fora dos pontos xos de , mas uma an alise criteriosa mostra que as solu c oes muitas vezes se estendem continuamente a esses pontos ( e um bom exerc cio!).
18.3.8
Transfer encia de calor
Um corpo est a em contato com um grande reservat orio, cuja temperatura e uma fun c ao do tempo T (t). Seja x(t) a temperatura do corpo no instante t. A cada instante, a varia c ao da temperatura do corpo e proporcional ` a diferen ca entre sua temperatura e a temperatura do reservat orio. Equacionando: x (t) = (T (t) x(t)) , onde e uma constante positiva. Aqui n ao se trata mais de uma equa c ao aut onoma, pois se escrevermos x = f (t, x) ent ao f (t, x) = (T (t) x) . Esta equa c ao tampouco e separ avel, mas ainda assim e simples o suciente para ser sol uvel. Ela se enquadra no conjunto das equa c oes do tipo x = a(t)x + b(t) ,
18.4. ENTENDIMENTO QUALITATIVO DE EQUAC OES AUTONOMAS
221
cuja solu c ao discutiremos abaixo. O caso em que b(t) = 0 e um caso particular de equa c ao separ avel, que tem solu c ao
t
x(t) = x0 exp{
t0
a(s)ds}
se x0 = x(t0 ). Para o problema am x = a(t)x + b(t), x(t0 ) = x0 , com solu c ao x(t), usamos um truque: examinamos a derivada de y (t) = x(t)e y (t) = x (t)e
t t0
t t0
a(s)ds
. Obtemos
t t0
a(s)ds
x(t)a(t)e
a(s)ds
por em substituindo x (t) por a(t)x(t) + b(t), camos com y (t) = b(t)e e portanto
t
t t0
a(s)ds
y (t) = y (t0 ) +
t0
b(r)e
r t0
a(s)ds
dr .
Como y (t0 ) = x0 , obtemos a solu c ao x(t) = e

t t0
a(s)ds
x0 +
t0
b(r)e
r t0
a(s)ds
dr
A unicidade e garantida pela unicidade da integra c ao de y com a condi c ao y (t0 ) = x0 .
18.4
Entendimento qualitativo de equa c oes aut onomas
At e agora n ao discutimos nada sobre a representa c ao gr aca das solu c oes de uma equa c ao diferencial, mas naturalmente o mais obvio e desenharmos o gr aco da solu c ao x(t). O que veremos nesta Se c ao e que e muito f acil desenharmos o esbo co de algumas solu c oes (variando a condi c ao inicial) de equa c oes aut onomas, sem resolv e-las! Para come car, vimos que se x e uma singularidade da equa c ao aut onoma x = X (x), ent ao x(t) x e solu c ao. Num diagrama em que coloquemos t na abscissa e x na ordenada, esse tipo de solu c ao e uma linha reta horizontal ` a altura de x . Portanto as primeiras solu c oes que podemos identicar na equa c ao s ao essas solu c oes constantes, cada uma correspondendo a um zero da fun c ao X . Em cada intervalo entre duas singularidades e nos intervalos entre a u ltima singularidade e o innito, o sinal de X n ao muda, pois se mudasse haveria uma outra
222
singularidade no intervalo, pelo Teorema de Bolzano. Seja I um intervalo desses, e suponha que x(t) est a em I . Como X (x(t)) = x (t), ent ao o sinal de x (t) e o mesmo que o sinal de X (x(t)), e esse sinal e sempre o mesmo enquanto x(t) estiver em I . Como as solu c oes n ao cruzam as singularidades (isto e garantido por um Teorema, se X for deriv avel e com derivada cont nua), uma solu c ao x(t) est a sempre connada a um mesmo intervalo, o que implica que o sinal de x (t) e sempre o mesmo, para todo t. O que e o mesmo que dizer que x(t) ou e crescente ou e decrescente, e uma ou outra op c ao ser a determinada pelo sinal de X no intervalo onde est a connada a solu c ao. Na gura abaixo, por exemplo, ilustramos esquematicamente uma fun c ao (arbitr aria) X (x), com quatro singularidades x1 , x2 , x3 e x4 . A fun c ao e negativa ` a esquerda de x 1 . e entre x3 e x4 , e positiva ` a direita de x4 e nos intervalos entre x1 e x2 e entre x e x 2 3
X(x)
x x* 1 x* 2
x

x* 3
x* 4
O diagrama abaixo ilustra algumas solu c oes (uma para cada intervalo).
x* 4

x* 3

x* 2 t x* 1
As solu c oes s ao assint oticas, para t indo a mais ou menos innito, ` as singularidades (de fato, em equa c oes aut onomas, as solu c oes n ao podem ser assint oticas a pontos que n ao sejam singularidades). Uma maneira mais compacta de se representar qualitativamente o comportamento das solu c oes dessa equa c ao diferencial e usando um diagrama onde s o entra a reta dos xs, como mostra a gura abaixo. As setas entre as singularidades indicam para que lado as solu c oes naquele intervalo tendem quando t tende a innito.
18.5. EQUAC OES DIFERENCIAIS COM MAIS VARIAVEIS

223
x* 1
x* 2
x* 3
x* 4
Assim ca f acil, por exemplo, entender a equa c ao de crescimento populacional x = x(a bx) . Como essa equa c ao s o faz sentido para x 0, nos restringiremos a essa regi ao. Nessa regi ao, a fun c ao X (x) = x(a bx) tem duas singularidades: x1 = 0 e x2 = a b . Isso signica que a popula c ao nula e a popula c ao igual a x s a o solu c o es de equil brio. 2 Entre as duas, X (x) e positiva e ` a direita de x c ao X (x) e negativa. Isso 2 a fun signica que se a popula c ao inicial est a abaixo da popula c ao de equil brio ent ao tender a a aumentar assintoticamente at e o equil brio x . E se come c ar acima decrescer a 2 assintoticamente at e o mesmo equil brio.
18.5
Equa c oes diferenciais com mais vari aveis
Existem tamb em os chamados sistemas de equa c oes diferenciais (de primeira ordem), que envolvem simultaneamente duas ou mais fun c oes e suas respectivas primeiras derivadas. Por exemplo, x = 3x2 y + 3 . y = sin x + yx3 Neste caso, achar uma solu c ao para o sistema signica encontrar duas fun c oes x(t) e y (t) que simultaneamente veriquem x (t) = 3x(t)2 y (t) + 3 y (t) = sin x(t) + y (t)x(t)3 .
Esse tipo de problema parece ser bastante arido ` a primeira vista, mas se torna mais atraente se o interpretarmos do ponto de vista geom etrico. Podemos olhar as fun c oes x(t) e y (t) como as coordenadas de uma curva : t (x(t), y (t)) no plano xy . A derivada da curva , dada por (t) = (x (t), y (t)), representa o vetor tangente ` a curva. O sistema de equa c oes diferenciais diz ent ao que, em cada instante t, o vetor tangente ` a curva (t) dado por (t) = (x (t), y (t)) tem que ser exatamente igual ao vetor (3x(t)2 y (t) + 3, sin x(t) + y (t)x(t)3 ).
y
. (t) x (t)=(x(t),y(t))
224
Perceba que esse sistema de equa c oes diferenciais j a xa, para cada ponto (x, y ), qual ser a o vetor tangente de uma solu c ao que por ali passar em algum instante: (3x2 3 y + 3, sin x + yx ). Essa fun c ao que associa para cada ponto um vetor (que deve ser sempre tangente ` as solu c oes do sistema) e chamada de campo de vetores. Uma maneira de esbo car um campo de vetores e mostrando os vetores correspondentes a alguns pontos do plano (x, y ).
Para um sistema de equa c oes diferenciais como esse tamb em podemos estabelecer o problema de Cauchy: dado um ponto (x0 , y0 ) e um instante t0 achar uma solu c ao (t) tal que (t0 ) = (x0 , y0 ). Modelos de crescimento populacional envolvendo mais do que uma esp ecie s ao um t pico exemplo de sistemas de equa c oes diferenciais. Cada vari avel do sistema representa a popula c ao de uma esp ecie. Por exemplo, se x(t) for a popula c ao de tartarugas e y (t) for a popula c ao de jacar es, podemos tecer as seguintes considera c oes. Em primeiro lugar, a popula c ao de tartarugas n ao precisa dos jacar es para sobreviver, mas tem suas limita c oes de espa co e alimento usuais. Como na Subse c ao 18.3.4, a taxa de crescimento proporcional da popula c ao e uma fun c ao parecida com A Bx(t), mas deve-se descontar um termo tanto maior quanto maior for a popula c ao de jacar es, por exemplo Cy (t). Ent ao ter amos x (t) = A Bx(t) Cy (t) . x(t) Por outro lado, supondo que os jacar es precisem se alimentar das tartarugas para sobreviverem, sua taxa de crescimento proporcional na aus encia de tartarugas e negativa, e ser a mais negativa ainda se sua popula c ao for muito grande, tamb em por problemas relativos ` a limita c ao do espa co. Por outro lado, quanto maior for a popula c ao de tartarugas, mais facilidade a popula c ao ter a para crescer. Dessas considera c oes, e razo avel supor que y (t) = D Ey (t) + F x(t) . y (t)
18.5. EQUAC OES DIFERENCIAIS COM MAIS VARIAVEIS Juntando tudo, camos com o sistema x = (A Bx Cy )x y = (D Ey + F x)y .
225
claro que todo esse racioc E nio e hipot etico, pois carece de dados reais. No entanto, cada situa c ao onde duas ou mais esp ecies se inuenciam mutuamente, seja numa rela c ao predador-presa seja numa rela c ao de competi c ao pelo mesmo alimento ou espa co, esse tipo de modelagem pode ser feito. Outra classe de exemplos relevante vem das equa c oes diferenciais de segunda ordem (isto e, que envolvem a segunda derivada), por exemplo, qualquer equa c ao do tipo x = (x, x ). Com um pequeno truque podemos transformar essa equa c ao num sistema de duas equa c oes de primeira ordem. Basta denir uma segunda vari avel (na verdade, uma segunda fun c ao do tempo) v (t) = x (t), de forma que x (t) = v (t). Ent ao camos com as duas equa c oes x = v , v = (x, v ) onde a primeira equa c ao vem simplesmente da deni c ao de v . Por exemplo, tomemos a equa c ao do p endulo = g sen . l (t), camos com Chamando (t) = = = g l sen .
226
Cap tulo 19
Solu c ao num erica de equa c oes diferenciais

Neste Cap tulo estudaremos algumas maneiras de se resolver numericamente uma equa c ao diferencial do tipo x = f (t, x), e veremos no nal como generalizar as id eias para dimens oes mais altas.
19.1
Equa c oes separ aveis
Para come car, veremos nesta Se c ao que j a dispomos dos m etodos necess arios para resolvermos as equa c oes separ aveis. Os m etodos propostos posteriormente ser ao, entretanto, muito mais gerais e, inclusive, mais pr aticos. Como vimos no Cap tulo anterior, se x = g (t)X (x) for a equa c ao, F for uma primitiva 1 de X e G for uma primitiva de g , ent ao x(t) = F 1 (F (x0 ) + G(t) G(t0 )) . Acontece que nem sempre e poss vel obter integrais expl citas, e aqui temos que resolver duas. Resolvendo ou n ao, uma delas ainda ter a que ser invertida, o que tamb em e dif cil ou imposs vel, na maioria dos casos. Todos esses problemas poderiam ser solucionados numericamente. A primitiva de g pode ser denida como
t
G(t) =
t0
g (s)ds ,
1 X
de forma que G(t0 ) = 0 e, da mesma forma, a primitiva de como x 1 F (x) = du , x0 X (u) 227
se dene naturalmente
228
NUMERICA CAP ITULO 19. SOLUC AO DE EQUAC OES DIFERENCIAIS
resultando em F (x0 ) = 0, e portanto x(t) = F 1 (G(t)) . As duas primitivas podem ser obtidas nos pontos que se quiser, usando os m etodos de integra c ao num erica discutidos na Parte V. J a ao problema de invers ao da fun c ao F pode-se aplicar o M etodo de Newton. Para sermos mais precisos, imagine que queiramos calcular x(t) num determinado instante t, e todas as opera c oes mencionadas acima tenham que ser feitas numericamente. Em primeiro lugar, calculamos G(t) usando integra c ao num erica (com a melhor precis ao poss vel, e claro), e depois teremos que achar x(t) tal que F (x(t)) = G(t) , tomando-se os cuidados necess arios para que seja buscada a solu c ao que nos interessa. Ou seja, x(t) e solu c ao da equa c ao f (x) = F (x) G(t) = 0 . Como F (x) =
1 X (x) ,
a fun c ao de itera c ao para o M etodo de Newton ca (x) = x X (x) (F (x) G(t)) .
Com um palpite inicial x0 temos que iterar a fun c ao , de forma a obter x1 , x2 , etc, at e chegar pr oximo ` a raiz com a precis ao desejada. Ent ao
xk
xk+1 = xk X (xk ) G(t) +

x0
1 du X (u)
isto e, em cada etapa da itera c ao e preciso estimar F (xk ) usando algum m etodo de integra c ao num erica. O erro pode, em tese, ser controlado, usando-se estimativas de erro das duas integra c oes e tamb em do M etodo de Newton. Se o procedimento acima for implementado no computador e x(t) for calculado para v arios valores de t, em seq u encia, o melhor palpite para a condi c ao inicial x0 do M etodo de Newton e o valor de x(t) obtido na etapa anterior, pois a fun c ao x(t) e cont nua.
19.2
Discretiza c ao
O fundamento da solu c ao num erica de equa c oes diferenciais x = f (t, x) e a discretiza c ao da vari avel t. Se [a, b] e o intervalo onde gostar amos de achar a solu c ao x(t) ent ao dividimos esse intervalo com uma parti c ao regular a = t0 < t1 < t2 < . . . < tn1 < tn = b ,
19.2. DISCRETIZAC AO
229
onde a diferen ca entre pontos sucessivos e igual a h (o chamado passo). Determinar numericamente a fun c ao x(t) signica achar, com precis ao sucientemente boa, os valores x0 = x(t0 ), x1 = x(t1 ), . . ., xn = x(tn ). Em suma, a solu c ao num erica de uma equa c ao diferencial peca, inevitavelmente, pela imprecis ao em t, pois os valores de x(t) s ao calculados somente para uma quantidade nita de valores de t, e pela imprecis ao na determina c ao de x(t), sendo que ambas podem ser minimizadas, segundo os m etodos propostos abaixo, pela redu c ao do passo h. Ao mesmo tempo esta e, para muitos prop ositos, a melhor alternativa dispon vel, visto que a maioria das equa c oes diferenciais n ao admite solu c ao expl cita, em termos de fun c oes elementares. Em todos os m etodos, obteremos a solu c ao num erica por recorr encia. A condi c ao inicial x0 = x(t0 ) e dada (sen ao n ao h a sentido no problema, uma vez que existe uma innidade de solu c oes da mesma equa c ao), e a partir dela obter-se- ao, em sucess ao, os valores de x1 , x2 , etc. Como tk+1 = tk + h (para k = 0, . . . , n 1), a estimativa de xk+1 = x(tk+1 ) pode ser obtida a partir da estimativa de xk = x(tk ) por meio de uma expans ao em Taylor. Para simplicar a nota c ao, denotaremos tk por t, a partir de agora, e xk por x(t), ou ` as vezes simplesmente por x. Ent ao x(t + h) = x(t) + x (t)h + 1 (m) 1 x (t)h2 + . . . + x (t)hm + o(hm ) , 2! m!
onde o(hm ) denota o resto da expans ao, que vai a zero quando h tende a zero mesmo se m claro que a fun dividido por h (tipicamente, termos de ordem m + 1 ou mais). E c ao precisa ser diferenci avel at e ordem m para valer essa express ao, mas em geral esse eo caso. A express ao signica que, quanto menor for h, melhor o polin omio em h (sem o resto) aproximar a x(t + h). Al em disso, geralmente mas nem sempre, quanto maior for m melhor ser a a aproxima c ao e, principalmente, mais efetiva se tornar a a redu c ao de h como instrumento para melhorar a precis ao de x(t + h) atrav es do polin omio. As derivadas de x(t) se relacionam com as derivadas de f atrav es da equa c ao diferencial, s o que f e uma fun c ao de duas vari aveis, t e x. Por exemplo, da pr opria equa c ao temos a igualdade x (t) = f (t, x(t)). Quanto ` a segunda derivada temos d f f f (t, x(t)) = (t, x(t)) + x (t) (t, x(t)) , dt t x pela Regra da Cadeia aplicada a fun c oes de duas vari aveis, e portanto x (t) = f f (t, x(t)) + f (t, x(t)) (t, x(t)) . t t Aqui vale, antes de prosseguirmos, simplicar a nota c ao. Na maioria dos casos, as derivadas de x ser ao calculadas em t, e todas as derivadas parciais de f , de qualquer x (t) =
230
ordem, em (t, x(t)). Assim, s o indicaremos explicitamente o ponto onde est ao sendo calculadas as fun c oes e suas derivadas se esses pontos n ao forem t e x(t). Nessa nota c ao, teremos f f x = +f . t x Para simplicarmos mais ainda, denotaremos as derivadas parciais de f com um sub ndice. Por exemplo, 2f . ftx = tx Na hip otese de que f seja uma fun c ao de classe C 2 (jarg ao matem atico para dizer que f tem derivadas parciais at e segunda ordem, e cont nuas), ent ao um teorema (o Teorema de Schwarz) garante que a ordem das derivadas parciais pode ser trocada, de forma que podemos trocar ftx por fxt , ou ainda fttx por fxtt ou ftxt . Segue dessas considera c oes que a express ao de x(t + h) pode ser escrita, at e a ordem desejada, inteiramente em fun c ao de f e de suas derivadas parciais. Neste Cap tulo, iremos tecer considera c oes somente at e ordem 4, mesmo assim precisaremos da express ao de x e x . Para obter x temos que derivar em rela c ao a t a express ao de x , lembrando sempre que cada derivada parcial de f tamb em depende de (t, x(t)), e que a regra da Cadeia deve ser usada. Ent ao, como x = ft + f fx , obtemos x = ftt + f ftx + (ft + f fx )fx + f (fxt + f fxx ) e, reagrupando os termos, x = ft fx + f (fx )2 + ftt + 2f ftx + f 2 fxx ,
2 denota (f )2 e n onde fx ao a derivada em rela c ao a x de f composta com si mesma. x Sugere-se fortemente ao leitor que verique essa conta, e em seguida que verique que
2 3 = ft fx + f fx +
+fx ftt + 3ft ftx + 5f fx ftx + 3f ft fxx + 4f 2 fx fxx + fttt + 3f fttx + 3f 2 ftxx + f 3 fxxx . Ao leitor assustado com o tamanho das express oes recomenda-se paci encia: ao nal, todos os algoritmos que derivar ao desta linha de racioc nio ser ao extremamente simples! Veremos nas pr oximas Se c oes de que maneira podemos implementar as id eias ora expostas, e suas poss veis varia c oes.
19.3
O M etodo de Euler
O M etodo de Euler consiste em tomar a aproxima c ao de primeira ordem de x(t + h): x(t + h) = x(t) + x (t)h + o(h) .
19.3. O METODO DE EULER
231
O resto o(h) indica que o erro em tomar essa aproxima c ao ser a, em geral, da ordem de 2 h ou mais. Como x = f , o M etodo sugere que, na pr atica, obtenhamos xk+1 = x(tk+1 ) = x(tk + h) como xk+1 = xk + f (tk , xk )h . A itera c ao a partir de x0 acumular a um erro da ordem de h2 em cada etapa, podendo a acumular ao nal um erro de nh2 . Como n = b ao o erro acumulado ser a da ordem h , ent de (b a)h. A t tulo de ilustra c ao, vejamos um exemplo cuja solu c ao exata e conhecida. Tomemos a equa c ao separ avel x = 3t2 x, no intervalo [0, 1], com x(0) = 2. Para achar a solu c ao expl cita, temos que isolar x(t) em
x(t) 2
1 du = u
3s2 ds ,
0
isto e, log x(t) log 2 = t3 . Ent ao x(t) = 2et . Compararemos essa solu c ao exata com a solu c ao obtida pelo M etodo de Euler com passo h = 0.1. Antes de apresentar o resultado, calculemos os primeiros valores xk com cuidado, para xarmos melhor o entendimento do m etodo. Temos x1 = x0 + f (t0 , x0 )h , com t0 = 0, x0 = 2 e f (t, x) = 3t2 x. Portanto x1 = x0 = 2. Depois, temos x2 = x1 + f (t1 , x1 )h = x1 3t2 1 x1 h , de forma que substituindo os valores conseguimos x2 = 2 3 0.12 2 0.1 = 2 6 103 = 1.994 . O resultado est a na tabela abaixo, arredondados para 3 casas decimais depois de obtido cada xk .
3
232
k 0 1 2 3 4 5 6 7 8 9 10
tk 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
xk 2.000 2.000 1.994 1.970 1.917 1.825 1.688 1.506 1.285 1.038 0.786
2etk 2.000 1.998 1.984 1.947 1.876 1.765 1.611 1.419 1.199 0.965 0.736
O maior erro cometido em rela c ao ` a solu c ao verdadeira ocorreu em tk = 0.7 (1.506 1.419 = 0.087), mas n ao chegou a 0.1, o tamanho do passo. E preciso tomar cuidado com a avalia c ao do erro, pois sabemos apenas que ele pode ser da ordem de h, mas isso signica apenas que ele e menor do que uma constante vezes h. Essa constante pode ser muito grande, de forma que a informa c ao n ao e suciente para estimar o erro. No entanto, ela diz que, se reduzirmos h ent ao o erro m aximo se reduzir a proporcionalmente.
Por exemplo, vejamos o que resulta da mesma equa c ao com passo igual a 0.05, com quatro casas decimais. k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 tk 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 xk 2.0000 2.0000 1.9993 1.9963 1.9896 1.9777 1.9592 1.9326 1.8971 1.8516 1.7954 1.7281 1.6497 1.5606 1.4617 1.3543 1.2400 1.1210 0.9995 0.8781 0.7592 2etk 2.0000 1.9998 1.9980 1.9933 1.9841 1.9690 1.9467 1.9161 1.8760 1.8258 1.7650 1.6935 1.6115 1.5197 1.4193 1.3116 1.1986 1.0822 0.9648 0.8485 0.7358
3
19.4. INDO PARA SEGUNDA ORDEM
233
A maior diferen ca em rela c ao ao valor verdadeiro n ao passou de 0.043, em tk = 0.75, que e metade da discrep ancia obtida com passo igual a 0.1. Exerc cio. Considere a equa c ao diferencial x = x2 sent, com a condi c ao inicial x(0) = 1. Obtenha uma discretiza c ao/aproxima c ao da solu c ao usando o M etodo de Euler de primeira ordem, no intervalo [0, 0.6], com passo h = 0.1.
19.4
Indo para segunda ordem
Para que a redu c ao de h seja mais eciente e preciso fazer com que a ordem de grandeza do erro dependa de h elevado a uma pot encia mais alta. Para isso, e preciso ir al em da aproxima c ao de primeira ordem em x(t + h). Consideremos, por exemplo, a aproxima c ao de segunda ordem: 1 x(t + h) x + x h + x h2 , 2 onde x = f e x = ft + f fx . Ent ao, ainda no exemplo x = 3t2 x, temos f (t, x) = 3t2 x, ft (t, x) = 6tx e fx (t, x) = 3t2 . Substituindo essas express oes, com a nota c ao x(t + h) = xk+1 , x = xk , t = tk , obtemos a rela c ao de recorr encia 3 xk+1 = xk + 3tk xk h tk h + t3 h 2 k .
O erro m aximo cometido em cada itera c ao e da ordem de h3 , portanto o erro m aximo 2 acumulado ao longo de todo o intervalo e da ordem de (b a)h . Isso signica que a redu c ao do passo pela metade provoca redu c ao no erro da ordem de quatro vezes. Exerc cio. Use a rela c ao de recorr encia acima com passo 0.1, a partir da mesma condi c ao inicial x(0) = 2 e compare com os resultados obtidos anteriormente. Apesar da vantagem em rela c ao ` a precis ao, ao passar para segunda ordem acabamos por nos envolver com uma fun c ao de itera c ao muito mais complicada, apesar de a express ao de f (t, x) ser muito simples. V arios fatores contribuem para isso: as express oes das derivadas parciais de f e a combina c ao da f ormula, que envolve v arios termos. Indo para ordem ainda mais alta essas complica c oes aumentam bastante e exigem, da parte do programador, o c alculo de todas as derivadas parciais envolvidas e a montagem das f ormulas. O que faremos no restante desta Se c ao e explorar uma observa c ao a respeito da expans ao de x(t + h) at e segunda ordem, que nos permitir a implementar um m etodo computacionalmente mais simples. Na Se c ao seguinte veremos como esse m etodo pode ser generalizado inclusive para ordens mais altas, sem expressivo acr escimo da complexidade algor tmica, embora a dedu c ao do algoritmo propriamente dito possa car cada
234
vez mais complicada. Essa abordagem e conhecida como M etodo de Runge-Kutta de integra c ao das equa c oes diferenciais. Estamos interessados na diferen ca x(t + h) x(t), dada por 1 x(t + h) x(t) = hf + h2 (ft + f fx ) + o(h2 ) , 2 que escreveremos assim: 1 x(t + h) x(t) = h f + (hft + hf fx ) + o(h2 ) . 2 Ent ao reparamos que o termo hft + hf fx tem certa semelhan ca com a expans ao da fun c ao de duas vari aveis f (t, x) at e primeira ordem: f (t + t, x + x) = f (t, x) + ft (t, x)t + fx (t, x)x + o(t, t) , onde o(t, x) denota um termo (o resto) muito menor do que a norma de (t, x), isto t2 + x2 . Muito e, muito menor do que menor signica que esse termo, quando 2 2 dividido por t + x , vai a zero, se t2 + x2 vai a zero. Logo, se tomarmos t = h e x = hf ent ao teremos f (t + h, x + hf ) f (t, x) = hft (t, x) + hf (t, x)fx (t, x) + o(h) , pois t2 + x2 = h 1 + f 2 . Na nota c ao compacta que propusemos, temos hft + hf fx = f (t + h, x + hf ) f + o(h) . Portanto x(t + h) x(t) = h f + 1 (f (t + h, x + hf ) f ) + o(h2 ) 2
(a soma de dois termos o(h2 ) e um termo o(h2 )). Ou seja, x(t + h) x(t) = h (f (t, x) + f (t + h, x + hf )) . 2
Vejamos como isso se d a na pr atica, ao passarmos de xk para xk+1 . Pensando em termos de algoritmo, temos que calcular 1 = f (tk , xk ) e, tomando esse valor de 1 , calcular 2 = f (tk + h, xk + h1 ) . Assim xk+1 = xk + h (1 + 2 ) . 2
19.5. RUNGE-KUTTA
235
A vantagem desse m etodo e que n ao precisamos calcular derivadas parciais de f , e o algoritmo ca consideravelmente mais simples. Apenas calculamos 1 (que e o valor de f no ponto (tk , xk )), e depois usamos 1 para calcular outro valor de f , desta feita no ponto (tk + h, xk + h1 ). O acr escimo em xk para se chegar a xk+1 ser a a m edia desses dois valores, multiplicada pelo passo h. Na tabela abaixo fazemos esse algoritmo, com o problema x = 3t2 x, x(0) = 2, no intervalo [0, 1]. Usando o passo h = 0.1, a coluna 1 signica 1 = 3t2 k xk e a coluna 2 signica 2 = 3t2 k+1 (xk + h1 ) , pois tk + h = tk+1 . k 0 1 2 3 4 5 6 7 8 9 10 tk 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 2etk 2.0000 1.9980 1.9841 1.9467 1.8760 1.7650 1.6115 1.4193 1.1986 0.96478 0.73576
3
xk 1 2.0000 0 1.9970 0.059910 1.9821 0.23785 1.9438 0.52483 1.8722 0.89866 1.7604 1.3203 1.6065 1.7350 1.4144 2.0792 1.1946 2.2936 0.96264 2.3392 0.73637
h 2 2 (1 + 2 ) .060000 0.0030000 0.23892 0.014942 0.52875 0.038330 0.90783 0.071633 1.3368 0.11177 1.7586 0.15395 2.1065 0.19208 2.3164 0.21978 2.3455 0.23196 2.1862 0.22627
Observamos que a diferen ca para o valor correto foi de, no m aximo, 0.005.
19.5
Runge-Kutta
O m etodo de Runge-Kutta e uma generaliza c ao do algoritmo que desenvolvemos em segunda ordem, para que n ao seja preciso calcular derivadas parciais de f , e vale para qualquer ordem m. Pensando na passagem de xk para xk+1 a id eia e escrever x(t + h) x(t) = h(1 1 + 2 2 + . . . + m m ) ,
236 onde
1 = f (tk , xk ) , 2 = f (tk + a1 h, xk + b1 1 h) , 3 = f (tk + a2 h, xk + b2 2 h) , . . . . . . . . . m = f (tk + am1 h, xk + bm1 m1 h) . Ou seja, dentro de cada etapa k e preciso fazer uma recorr encia de tamanho m, onde cada i (i 2) e calculado em fun c ao de i1 , partindo de 1 = f (tk , xk ). Na Se c ao anterior, t nhamos m = 2, 1 = 2 = 1 2 e a1 = b1 = 1. Agora consideraremos o caso m = 3, e tentaremos determinar as constantes 1 , 2 e 3 , assim como a1 , b1 , a2 e b2 . Ao nal, veremos que existe uma certa liberdade na escolha dessas constantes. A maneira de se organizar para uma tarefa dessas e a seguinte. Desenvolveremos os dois lados da equa c ao x(t + h) x(t) = 1 1 + 2 2 + 3 3 h at e ordem 2 em h (seria ordem 3, mas estamos dividindo tudo por h), e obteremos v arios termos envolvendo derivadas parciais de f . Como ocorre com polin omios, e preciso haver igualdade termo a termo. Cada uma dessas igualdades ser a uma equa c ao onde as inc ognitas s ao as constantes procuradas, e o problema car a reduzido ` a resolu c ao desse sistema (n ao linear) de equa c oes. O lado esquerdo da equa c ao e mais conhecido: x(t + h) x(t) 1 1 = x + x h + x h2 + o(h2 ) , h 2 6 onde as express oes de x , x e x j a foram deduzidas na Se c ao 19.2. Introduzindo essas express oes, camos com 1 1 1 1 1 1 1 2 f + hft + hf fx + h2 ft fx + h2 f fx + h2 ftt + h2 f ftx + h2 f 2 fxx . 2 2 6 6 6 3 6 Os termos est ao separados um a um, propositalmente, porque isso tornar a mais f acil a compara c ao com o outro lado da equa c ao. Com rela c ao ao outro lado, e preciso calcular 1 , 2 e 3 , at e ordem h2 . J a sabemos que 1 = f . E sabendo i calculamos i+1 por i+1 = f (t + ai h, x + bi i h) .
19.5. RUNGE-KUTTA Expandindo f at e segunda ordem, obtemos i+1 = f (t + ai h, x + bi i h) =
237
1 1 = f + (ai h)ft + (bi i h)fx + (ai h)2 ftt + (ai h)(bi i h)ftx + (bi i h)2 fxx + o(h2 ) . 2 2 Por outro lado, i j a foi calculado de maneira semelhante, e sua express ao deveria ser substitu da na express ao de i+1 . No caso m = 3, temos 1 = f , portanto 2 = f (t + a1 h, x + b1 hf ) = 1 1 = f + a1 hft + b1 hf fx + a2 h2 ftt + a1 b1 h2 f ftx + b2 h2 f 2 fxx + o(h2 ) . 2 1 2 1 J a a express ao de 3 e mais complicada, pois devemos substituir a express ao de 2 em cada lugar onde aparece. Por sorte, podemos desprezar os termos que tenha ordem mais alta do que h2 . Por exemplo, b2 h2 fx = b2 h(f + a1 hft + b1 hf fx )fx + o(h2 ) , uma vez que os termos com h2 , quando multiplicados por h, cam h3 , isto e, s ao termos 2 o(h ). H a outros dois termos a expandir: a2 b2 h2 2 ftx = a2 b2 h2 f ftx + o(h2 ) e 1 2 2 2 1 b h fxx = b2 h2 f 2 fxx + o(h2 ) . 2 2 2 2 2 Ent ao
2 3 = f + (a2 hft ) + (b2 hf fx + a1 b2 h2 ft fx + b1 b2 h2 fx )+ 1 2 2 1 + a2 h ftt + a2 b2 h2 f ftx + b2 h2 f 2 fxx + o(h2 ) . 2 2 2
Finalmente, podemos reunir 1 1 + 2 2 + 3 x3 , e conseguiremos uma soma com os seguintes termos: (1 + 2 + 3 )f , (2 a1 + 3 a2 )hft , (2 b1 + 3 b2 )hf fx , 3 a1 b2 h2 ft fx , 2 , 1 ( a2 + a2 )h2 f , ( a b + a b )h2 f f 2 2 2 2 3 b1 b2 h2 f fx 3 2 tt 2 1 1 3 2 2 tx e (2 b1 + 3 b2 )h f fxx . 2 2 1 Da compara c ao termo a termo com a expans ao de x(t + h) x(t) , h
238
que corresponde ao lado esquerdo da equa c ao, obtemos as seguintes equa c oes: f: hft : hf fx : h2 ft fx :
2 h2 f fx :
h2 ftt : h2 f ftx : h2 f 2 fxx :
1 1 2 1 2 1 6 1 6 1 6 1 3 1 6
= 1 + 2 + 3 = 2 a1 + 3 a2 = 2 b1 + 3 b2 = 3 a1 b2 = 3 b1 b2 = 1 2 (2 a2 1 + 3 a2 ) 2 1 2 (2 b2 1 + 3 b2 ) 2
(19.1) (19.2) (19.3) (19.4) (19.5) (19.6) (19.7) (19.8)
= 2 a1 b1 + 3 a2 b2 =
A primeira equa c ao e a u nica que envolve 1 , assim 1 car a determinado assim que 2 e 3 forem determinados. Da quarta e da quinta equa c oes tiramos imediatamente que a1 = b1 . Levando isso em conta na sexta e na s etima equa c oes resulta que tamb em a2 = b2 . Com isso, as tr es u ltimas equa c oes se tornam id enticas, a quarta e a quinta tamb em, e a segunda e a terceira idem. Em resumo, camos com tr es equa c oes nas quatro inc ognitas a1 , a2 , 2 e 3 : 1 2 1 6 1 3 = 2 a1 + 3 a2 = 3 a1 a2
2 = 2 a2 1 + 3 a2
Havendo uma inc ognita a mais do que o n umero de equa c oes, abre-se a possibilidade para a exist encia de uma innidade de solu c oes. Podemos escolher um valor para a2 , por exemplo, mas algumas escolhas podem tornar o sistema imposs vel. No entanto, saberemos como escolher se tratarmos a2 como uma constante, em vez de uma inc ognita. 1 Da segunda equa c ao 2 a2 = 6a colocada na primeira obtemos 1 2 a1 + Multiplicando por a1 resulta 2 a2 1 = 1 1 = . 6a1 2 a1 1 , 2 6
19.5. RUNGE-KUTTA que junto com a segunda pode ser substitu da na terceira equa c ao, levando a 3a2 1 3a1 + a2 = 0 , depois de mais uma multiplica c ao por a1 e simplica c oes. Ent ao a1 = 3 9 12a2 . 6
239
1 Se tomarmos a2 = 3 4 teremos necessariamente que a1 = 2 . Com esses valores, obtemos 4 2 2 3 = 9 , 2 = 9 e 1 = 9 . A conclus ao e que o M etodo de Runge-Kutta pode ser aplicado com
x(t + h) x(t) =
h (21 + 32 + 43 ) + o(h3 ) , 9
1 3 3 onde 1 = f (t, x), 2 = f (t + 2 h, x + 1 2 1 h) e 3 = f (t + 4 h, x + 4 2 h).
Exerc cio. Use o algoritmo de Runge-Kutta de ordem 3 deduzido acima na equa c ao diferencial separ avel x = 3t2 x, x(0) = 2. Aumente o n umero de algarismos signicativos. De prefer encia, crie um programa de computador para testar os algoritmos.
1 Exerc cio. Na Se c ao anterior, obtivemos m = 2, 1 = 2 = 2 e a1 = b1 = 1 para o M etodo de Runge-Kutta de ordem 2. No entanto, como vimos em ordem 3, pode haver outras maneiras de implement a-lo, pois as equa c oes que determinam a escolha dos i s, ai s e bi s t em mais do que uma solu c ao. Baseando-se no racioc nio feito em ordem 3, ache todas as poss veis implementa c oes do M etodo de Runge-Kutta em ordem 2.
Exerc cio. Considere a equa c ao x = ex t, com a condi c ao inicial x(0) = 1. Obtenha uma discretiza c ao/aproxima c ao da solu c ao em [0, 0.5], usando o M etodo de Runge-Kutta de segunda ordem. Exerc cio. Considere a mesma equa c ao e a mesma condi c ao inicial do Exerc cio anterior. Aproveite o fato de ser uma equa c ao separ avel para obter x(0.5) usando o M etodo de Newton e o M etodo de Simpson combinados. Para o M etodo de Newton, use condi c ao inicial igual a 1 e calcule 3 iterados posteriores. Para o M etodo de Simpson use n = 4. Discuta o erro envolvido ao se resolver a equa c ao dessa maneira, da melhor forma que voc e puder. Compare com o resultado da quest ao anterior. Exerc cio. O algoritmo de Runge-Kutta de ordem 4 pode ser deduzido de forma an aloga. Para isso e preciso fazer as contas com muito cuidado. Tente partir da suposi c ao de que x(t + h) x(t) = h(1 + 2 + 3 + 4 ) + o(h4 ) ,
240 onde
1 = f (t, x) , 2 = f (t + bh, x + b1 h) , 3 = f (t + ch, x + c2 h) , 4 = f (t + dh, x + d3 h) ,

2 2 e mostre que essas constantes podem assumir os seguintes valores: = 1 6, = 6, = 6, 1 1 =1 6 , b = 2 , c = 2 e d = 1.
Exerc cio. Implemente o M etodo de Runge-Kutta de ordem 4 no computador.
19.6
Runge-Kutta em sistemas de equa c oes aut onomas
A resolu c ao num erica de um sistema de equa c oes aut onomas e muito semelhante ao que j a zemos antes. Desenvolveremos o M etodo de Runge-Kutta de ordem 2 para um sistema de duas equa c oes, e o leitor ver a que o M etodo pode ser aplicado a qualquer tipo de sistema de equa c oes diferenciais, aut onomas ou n ao, em qualquer ordem, tudo dependendo de se deduzir o algoritmo convenientemente. H a atualmente muitos programas de computador com os algoritmos j a implementados, bastando ao usu ario somente digitar as equa c oes. Outros algoritmos mais nos s ao tamb em usados, para minimizar ainda mais os erros, principalmente quando se trata de integrar a equa c ao diferencial recomend em grandes intervalos de tempo. E avel, no entanto, saber minimamente como eles funcionam. Suponha que queiramos integrar o sistema de equa c oes diferenciais x y At e segunda ordem, temos
2 x(t + h) x(t) = hx + h 2 x + o(h ) 2 2 y (t + h) y (t) = hy + h 2 y + o(h )
2
= f (x, y ) = g (x, y )
Como x = f e y = g , ent ao x = x fx + y fy = f fx + gfy e y = x gx + y gy = f gx + ggy .
19.6. RUNGE-KUTTA EM SISTEMAS DE EQUAC OES AUTONOMAS Ent ao
241
2 x(t + h) x(t) = h f + 1 2 (hf fx + hgfy ) + o(h ) 1 2 y (t + h) y (t) = h g + 2 (hf gx + hggy ) + o(h )
Mas hf fx + hgfy = f (x + f h, y + gh) f (x, y ) + o(h) e hf gx + hggy = g (x + f h, y + gh) f (x, y ) + o(h) . Portanto x(t + h) x(t) = y (t + h) y (t) =
h 2 h 2
(f (x, y ) + f (x + f h, y + gh)) + o(h2 ) (g (x, y ) + g (x + f h, y + gh)) + o(h2 )
Exerc cio. Considere o sistema de equa c oes diferenciais x = x2 + y 1 y = 1+ x Se x(0) = 0.5 e y (0) = 0.2, estime t > 0 necess ario para que a solu c ao (x(t), y (t)) cruze o eixo y , usando o M etodo de Euler de primeira ordem com passo 0.1. Exerc cio. Deduzir o M etodo de Runge-Kutta de ordem 4 para sistemas aut onomos de duas equa c oes. Exerc cio. Usar os M etodos de Runge-Kutta para integrar os sistemas de equa c oes diferenciais da Se ca o 18.5.
242
Ap endice A
Revis ao de C alculo
Este Ap endice e uma revis ao breve e informal dos principais conceitos de C alculo de uma vari avel.
A.1
Derivadas
Considere uma fun c ao real f (x). A inclina c ao do gr aco de f no ponto (x, f (x)) e dada pelo limite do quociente f (x + h) f (x) h quando h tende a zero (pela direita ou pela esquerda). Esse limite e denotado por
f(x+h) f(x+h)-f(x) f(x) x h x+h
f (x) , e a fun c ao f (x), que d a a inclina c ao do gr aco para cada x, e chamada derivada da fun c ao f . Por exemplo, se f (x) = x2 , o gr aco de f e uma par abola, e a derivada, para cada x, e o limite de f (x + h) f (x) (x + h)2 x2 = = 2x + h . h h Evidentemente, quando h tende a zero, o limite e igual a 2x, e portanto f (x) = 2x se f (x) = x2 . 243
244
DE CALCULO APENDICE A. REVISAO
Algumas derivadas usuais. A fun c ao constante f (x) = c tem derivada nula em todo ponto: f (x) = 0 (pudera, o gr aco de uma fun c ao constante e uma reta horizontal). A derivada de uma fun c ao am f (x) = ax + b e uma fun c ao constante: f (x) = a, pois a inclina c ao do gr aco (que e uma reta) e sempre dada pelo coeciente a. Pode-se n mostrar tamb em que se f (x) = x , com n inteiro (negativo ou positivo) por em diferente de zero, ent ao f (x) = nxn1 . Por exemplo, se f (x) = x, ent ao f (x) = 1 x0 = 1, ou se 1 1 ent ao f (x) = x2 = x f (x) = x1 = x 2. Temos tamb em as derivadas de fun c oes trigonom etricas. Se f (x) = sin x ent ao f (x) = cos x, e se f (x) = cos x ent ao f (x) = sin x. Para obter essas derivadas e preciso mostrar antes que sin x lim =1, x0 x resultado que pode ser obtido de forma geom etrica. Poder amos discorrer um pouco mais sobre derivadas, falando de outras fun c oes e de regras de deriva c ao de fun c oes mais complicadas. Deixaremos por em essa discuss ao para logo adiante. S o faremos antes uma observa c ao que certamente j a nos ampliar a bastante o leque de fun c oes que sabemos derivar. Digamos que uma fun c ao h(x) se escreva como combina c ao linear de duas outras fun c oes f (x) e g (x), isto e, h(x) = af (x) + bg (x) . Ent ao a derivada de h e a combina c ao linear das derivadas: h (x) = af (x) + bg (x) .
Em particular, a derivada da fun c ao f (x) + C e igual ` a derivada da fun c ao f (x), pois a derivada da fun c ao constante e zero (veja na gura ao lado duas fun c oes que diferem apenas pela adi c ao de uma constante).
f(x)+C
C
f(x)
C
A.2
Primitivas
Podemos agora colocar o seguinte problema: dada uma fun c ao g (x), achar uma fun c ao um problema inverso ao de achar a f (x) cuja derivada f (x) seja igual a g (x). E
A.2. PRIMITIVAS
245
derivada. Qualquer fun c ao f (x) cuja derivada seja igual a g (x) ser a chamada de uma primitiva de g (x). Por exemplo, queremos achar uma primitiva de g (x) = x2 . Ora, sabemos que a 1 3 derivada de x3 e 3x2 (pela Se c ao anterior), portanto f (x) = 3 x e uma primitiva de 1 2 g (x) = x (o fator de 3 e necess ario para se cancelar o expoente que cai ao se derivar). Esse problema levanta duas quest oes: primeiro, ser a que sempre existe uma primitiva para a fun c ao g ? E se existe, ser a que eu nica? Vejamos primeiro que n ao h a chance de s o haver uma primitiva para cada fun c ao. Por exemplo, suponha que encontramos uma primitiva f (x) para g (x), isto e, f (x) = g (x). Agora consideramos uma outra fun c ao F (x) = f (x) + C . Pelo que vimos na Se c ao anterior, F (x) = f (x) = g (x) . Em outras palavras, se encontrarmos uma primitiva f (x) ent ao todas as fun c oes do tipo f (x) + C ser ao tamb em primitivas, para qualquer valor de C . A pergunta natural que viria em seguida seria: e al em dessas, ser a que h a outras primitivas? A resposta e n ao. Suponha que f1 (x) e f2 (x) sejam duas primitivas da mesma fun c ao g (x), isto e, f1 (x) = g (x) = f2 (x) . Agora considere a fun c ao F (x) = f1 (x) f2 (x) que para cada valor de x d a a diferen ca entre os valores das duas fun c oes. Ent ao F (x) = f1 (x) f2 (x) = g (x) g (x) = 0 , para qualquer x. Ent ao a fun c ao diferen ca tem inclina c ao zero, ou seja, e uma fun c ao constante (se o dom nio tiver s o um peda co): F (x) = C . De onde conclu mos que f1 (x) = f2 (x) + C !! Colocando em palavras, acabamos de demonstrar que se duas fun c oes s ao primitivas da mesma fun c ao ent ao elas necessariamente diferem por uma constante. Isso tem conseq u encias pr aticas importantes: se encontrarmos uma primitiva ent ao automaticamente conheceremos todas as outras! Voltaremos ao assunto ap os a Se c ao seguinte.
246
A.3
Integral
Considere uma fun c ao f (x) denida no intervalo [a, b], n ao-negativa, como mostra a gura ao lado. A area da regi ao acima da abscissa e abaixo do gr aco da fun c ao e chamada de integral de f no intervalo [a, b], e recebe a nota c ao
b
f (x)dx .
a
A1
f A3
A integral tamb em pode ser denida para fun c oes que assumem valores negativos. Nesse caso, n ao podemos interpretar a integral como area, a n ao ser que usemos a id eia de area com sinal, isto e, a area e contada positivamente quando a fun c ao e positiva e negativamente quando a fun c ao e negativa. Assim, na gura ao lado temos
b
a A2
b
a
f (x)dx = A1 A2 + A3 ,
onde A1 , A2 e A3 s ao as areas das regi oes sombreadas. Tamb em devemos convencionar o signicado do s mbolo acima da integral quando a n ao e menor ou igual a b. A conven c ao e a seguinte: se a > b ent ao
b a
f (x)dx
a b
f (x)dx .
Em palavras, fazer a integra c ao do extremo direito para o esquerdo resulta no mesmo que fazer da esquerda para a direita, s o que com o sinal oposto. Com essa regra, obtemos a seguinte propriedade, para qualquer trinca de n umeros a, b, c, n ao importando sua ordem:
b c c
f (x)dx +
a b
f (x)dx =
a
f (x)dx .
Isso parece obvio no caso em que a < b < c, mas conra a validade da f ormula em outros casos!
A.4. A INTEGRAL INDEFINIDA
247
A.4
A integral indenida
Na Se c ao anterior, falamos da integral de uma fun c ao entre dois extremos xos. Se resolvermos mudar um dos extremos, obteremos um resultado diferente para a integral, mesmo que a fun c ao n ao se altere. Isso sugere que um dos extremos do intervalo de integra c ao possa ser considerado uma vari avel, do qual depende o valor da integral da fun c ao. Por exemplo, considere a fun c ao linear g (x) = x, e xe 0 como um dos extremos de integra c ao. Quanto vale
w
g(x)=x
g (x)dx ?
0
Ora, se w 0, a integral e a area do tri angulo-ret angulo esbo cado na gura ao 2 lado: w 2 .
0 0
2
x w
Se w < 0, a integral e tamb em, em valor absoluto, igual a w 2 , mas qual seria o sinal? Primeiro vemos que a area deve ser contada negativamente, pois ` a esquerda do zero g (x) e negativa. Por outro lado, se w < 0 ent ao a integral est a sendo percorrida da direita para a esquerda, o que acarreta uma segunda mudan ca de sinal. Isso implica 2 que tamb em no caso w < 0 a integral vale w mos que 2 . Conclu
w
xdx =
0
w2 , 2
para qualquer w. Agora podemos criar uma fun c ao que a cada w associe a integral de g de 0 a w, e chamaremos de f essa fun c ao:
w
f (w)
0
g (x)dx .
No exemplo, g (x) = x, e portanto

w
f (w) =
0
xdx =
w2 . 2
Essa fun c ao f e chamada de uma integral indenida de g . Ela e apenas uma e n ao a integral indenida porque o extremo xo de integra c ao foi escolhido arbitrariamente.
248
g(x)=x
Por exemplo, considere outra integral in, onde o extremo xo de intedenida f gra c ao seja 1 e n ao 0: (w) f
1 w
f(w) x
0
xdx .
(w)? Quanto vale f
Observe que, pela regra de integra c ao das triplas a, b, c, podemos escrever

1 w w
xdx +
0 1
xdx =
0
xdx .
O primeiro termo do lado esquerdo vale 1 em disso, o segundo termo do lado esquerdo 2 . Al da equa c ao e a fun c ao f (w), e o lado direito da equa c ao e f (w). Ent ao (w) + 1 , f (w) = f 2 e as duas fun c oes diferem por uma constante. Ali as esse fato e bastante geral, e suas raz oes saltam ` a vista imediatamente desse exemplo: as integrais indenidas de uma fun c ao, assim como suas primitivas, diferem umas das outras por uma constante. E ser a que h a alguma rela c ao entre as primitivas e as integrais indenidas? Responderemos a essa pergunta na pr oxima Se c ao. Antes de prosseguir, fa camos uma observa c ao a respeito da nota c ao. Sempre falamos de fun c oes dependentes da vari avel x, mas agora apareceram fun c oes que dependem da vari avel w! Ora, esses nomes, x e w, s ao apenas nomes, que ` a fun c ao n ao interessam. w2 x2 Assim, se f (w) = 2 e queremos avaliar f (x) ent ao teremos f (x) = 2 . O que interessa e que essa fun c ao em particular toma um n umero qualquer em seu dom nio, eleva-o ao quadrado e divide o resultado por dois. Tanto faz se indicamos esse processo por 2 x2 f (w) = w 2 ou por f (x) = 2 ! Entendido isso, pode-se perguntar ent ao porque n ao denimos de uma vez
x
f (x) =
0
xdx ?
Por que n ao usar de uma vez a vari avel x como extremo de integra c ao? Trata-se a de um cuidado que tomamos para n ao misturar as coisas. A vari avel indicada dentro da
A.5. O TEOREMA FUNDAMENTAL DO CALCULO
249
integra c ao muda enquanto os extremos est ao xos. Para cada x, temos que percorrer o intervalo [0, x] para calcular a integral. E mais justo, portanto, usar um outro nome para indicar esse processo, evitando assim confus oes. Seria prefer vel ent ao escrever
x
f (x) =
0
tdt ,
ou f (x) =
0
udu ,
usando, enm, qualquer letra que n ao seja aquela utilizada nos extremos da integra c ao.
A.5
O Teorema Fundamental do C alculo
Nas se c oes anteriores vimos o que s ao primitivas e integrais indenidas de uma fun c ao g . Uma primitiva de g e qualquer fun c ao f cuja derivada e igual a g , e uma integral indenida e qualquer fun c ao da forma
x
f (x) =
a
g (t)dt .
O Teorema Fundamental do C alculo diz exatamente que as integrais indenidas de g s ao tamb em primitivas de g . Argumentaremos em favor do Teorema, sem excesso de tecnicalidades. O importante e entender por que ele e verdadeiro. Considere a integral indenida de g , dada por
x
f (x) =
a
g (t)dt .
Para mostrarmos que essa fun c ao e uma primitiva de g basta mostrar que f (x) = g (x). Lembramos ent ao de como denimos a derivada f (x): e o limite da express ao f (x + h) f (x) h quando h tende a zero. Ou seja, e o limite de 1 h
x+ h x
g (t)dt
a a
g (t)dt
250 Lembrando que

x+ h x x+ h
x+h
g (t)dt =
a a
g (t)dt +
x
g (t)dt ,
g(t)dt
o limite que pretendemos examinar se torna 1 x+ h g (t)dt . h x
g a x x+h
Agora olhemos bem para essa express ao, e observemos a gura. A integral e feita no intervalo [x, x + h] (de largura h, evidentemente), e a fun c ao ali tem altura de aproximadamente g (x), se h for bastante pequeno. Portanto a integral est a pr oxima do valor h g (x). Lembrando que ainda temos que dividir por h, ent ao toda a express ao ca quase igual a g (x), e levando ao limite ser a exatamente igual a g (x). Interpretando geometricamente, signica que a inclina c ao de f em x ser a tanto maior quanto maior for o valor g (x). Pois f (x + h) ser a f (x) mais a integral de g entre x e x + h, que vale aproximadamente h g (x), ou seja f (x + h) f (x) + h g (x) . Donde f (x + h) f (x) g (x) . h
2
No exemplo da Se c ao anterior, vimos que f (x) = x e uma integral indenida de 2 g (x) = x. Pelo Teorema Fundamental do C alculo, f (x) deve ser tamb em uma primitiva. 1 De fato, f (x) = 2 2x = x.
A.6
A praticidade do Teorema Fundamental do C alculo
Veremos agora que o Teorema Fundamental do C alculo opera um verdadeiro milagre. Ele torna o c alculo de areas e integrais uma tarefa muito mais f acil do que poder amos imaginar! Suponha que queiramos calcular a integral de uma fun c ao g no intervalo [a, b]:
b
g (t)dt .
a
Poder amos olhar essa integral da seguinte forma. Chamamos de F a integral indenida de g com extremo xo de integra c ao igual a a:
x
F (x) =
a
g (t)dt .
A.6. A PRATICIDADE DO TEOREMA FUNDAMENTAL DO CALCULO
251
Isso faz com que a integral que queremos calcular seja o valor de F em b, isto e, F (b). Observe tamb em que F (a) = 0. Por outro lado, F e uma primitiva de g , de acordo com o Teorema Fundamental do C alculo. Suponha que por alguma raz ao j a conhe camos alguma primitiva f (x) de g (x). Isso pode parecer estranho, mas e algo muito comum quando sabemos derivar 4 uma grande quantidade de fun c oes. Por exemplo, se g (x) = x3 , sabemos que f (x) = x 4 e uma primitiva de g , porque sabemos a regra de deriva c ao das pot encias. Como F (x) e f (x) s ao ambas primitivas de g , ent ao elas diferem por uma constante, digamos C : f (x) F (x) = C , para todo x no intervalo [a, b]. Se escolhermos x = a ou x = b a equa c ao continua v alida: f (a) F (a) = C = f (b) F (b) , de onde tiramos que F (b) F (a) = f (b) f (a) . Mas F (b) = F (b) F (a) era exatamente a integral que quer amos calcular! Resumindo: para qualquer f (x) primitiva de g (x) temos
b
g (t)dt = f (b) f (a) .

a
O c alculo da integral torna-se uma simples tarefa de subtra c ao, desde que j a conhe camos uma primitiva da fun c ao!! Por exemplo, qual ea area sob o gr aco da fun c ao g (x) = x3 para x variando no x4 e uma primitiva de g (x), ent ao intervalo [1, 2]? Ora, como f (x) = 4
2
t3 dt = f (2) f (1) =
1
24 14 15 = . 4 4 4
F acil, n ao?! Existe uma nota c ao que facilita a vida quando calculamos integrais na pr atica. Escrevemos f (t)|b a = f (b) f (a) . Assim, com essa nota c ao, t4 . 4 1 1 Outra nota c ao bastante utilizada se aproveita do fato de que primitivas e integrais indenidas s ao a mesma coisa. Ent ao, quando queremos dizer que f (x) e primitiva de g (x) escrevemos t3 dt = g (x)dx = f (x) + C ,
2 2
252
sem indicar extremos de integra c ao. A constante somada e simb olica e apenas indica que a express ao dada em f (x) n ao e a u nica primitiva de g , e as demais podem ser obtidas somando-se uma constante a ela. Essa nota c ao e conhecida como nota c ao de Leibniz. Por exemplo,
sin x = cos x + C .
A.7
O logaritmo
Uma das fun c oes mais importantes denidas a partir de uma integral indenida e o logaritmo natural. A abordagem que seguiremos aqui para falar de logaritmos, exponenciais, etc, n ao e das mais usuais, por em talvez seja mais f acil at e do que aquela que estamos acostumados a ver desde os tempos do col egio. Ao nal nada do que j a sab amos anteriormente ser a derrubado. Pelo contr ario, iremos chegar a nossas certezas atrav es de uma argumenta c ao l ogica.
1 Considere a fun c ao g (x) = x , cujo gr aco est a desenhado ao lado. Essa fun c ao diverge em x = 0 e n ao est a denida nesse ponto. Restringiremo-nos de in cio ` a parte positiva do dom nio e deniremos, para x > 0, o logaritmo natural de x como sendo a integral de g de 1 at e x: x
1 g(x)= x
1 1 ln x x
ln x
1
1 dt . t
Observe no desenho que, para x > 1 essa fun c ao e positiva e representa a area sob o gr aco de g no intervalo [1, x]. Para x < 1, no entanto, a integral corre em sentido contr ario, logo vale o negativo da area sob o gr aco. Al em disso, evidentemente, ln 1 = 0.
A.7. O LOGARITMO
253
ln x
Lembremos sempre que essa fun c ao, por ser uma 1 1 primitiva de x tem derivada exatamente igual a x : (ln x) =
x
1 . x
O gr aco de ln x est a esbo cado ao lado. Quando x tende a zero a fun c ao tende a e quando x tende a innito a fun c ao tamb em tende a innito. Esses fatos podem ser demonstrados levando-se em conta os coment arios abaixo.
A propriedade mais marcante que conhecemos e que o logaritmo do produto e a soma dos logaritmos, isto e,
ln xy = ln x + ln y .
Essa propriedade pode ser deduzida da deni c ao que demos. Pois isso e o mesmo que provar que
xy 1
1 dt = t
x 1
1 dt + t
y 1
1 dt . t
Para tanto, separamos a integral do lado esquerdo em dois peda cos:
xy 1
1 dt = t
x 1
1 dt + t
xy x
1 dt . t
S o falta vericar que
xy 1 x t dt
e igual a
y 1 1 t dt.
254
DE CALCULO APENDICE A. REVISAO A integral 1 1 ea area da regi ao A na gura ao t dt lado, dada por A = {(t, s) ; 1 t y , 0 s 1/t} , e a outra integral, dada por
xy 1 x t dt y
A 1 1/ y 1 B 1/x 1/xy x xy y
e a area da regi ao B ,
B = {(t, s) ; x t xy , 0 s 1/t} . Mostremos a seguinte arma c ao: (t, s) e um ponto 1 de A se e somente se (xt, x s) e um ponto de B . Assim, B e obtido de A pela multiplica c ao por x 1 na horizontal e por x na vertical. Em termos de area, as duas multiplica c oes se cancelam, e a area de B tem que ser igual ` a area de A.
J a a arma c ao e mostrada assim: (t, s) A se e somente se 1 t y e 0 s 1 t, 1 1 1 que ocorre se e somente se x xt xy e 0 x s xt , ou seja, (xt, x s) B . Da f ormula ln xy = ln x + ln y decorre, por exemplo, que ln xn = n ln x, se n 0 e inteiro. Para ver isso, primeiro vericamos que se n = 0 ent ao xn = x0 = 1 e 0 ln x = ln 1 = 0 = 0 ln x. Se n = 1 a f ormula tamb em est a trivialmente correta. Se n 2 basta fazer a recurs ao ln xn = ln x xn1 = ln x + ln xn1 = ln x + ln x xn2 = 2 ln x + ln xn2 = . . . = ... = n ln x . Al em disso, como ln 1 = ln x
1 x 1 = ln x + ln x ent ao
ln
1 = ln x . x
Assim podemos dizer que ln xn = n ln x, e que a f ormula tamb em vale para os inteiros negativos. Tendo ent ao a deni c ao do logaritmo natural, podemos denir outros logaritmos. Se b e positivo e b = 1, chamaremos de logaritmo de x na base b ao n umero logb x ln x . ln b
A.7. O LOGARITMO
255
Essa deni c ao pode parecer estranha. Anal, a deni c ao a que estamos acostumados diz assim: o n umero r = logb x e aquele tal que br = x . Mas essa propriedade pode ser demonstrada (em vez de denida). Pois se n e um n umero inteiro e bn = x ent ao ln x ln bn n ln b = = =n. ln b ln b ln b
logb x =
E quanto a pot encias com n umeros n ao inteiros? A princ pio n ao sabemos o que isso signica, mas podemos adiante deni-las inspirados no que vimos acima. Antes, por em, observemos que o logaritmo natural e um logaritmo em alguma base. Suponha que achemos um n umero e tal que ln e = 1. Ent ao ln x = ln x ln x = = loge x . 1 ln e
1 x 1 e
ln x
Esse n umero e existe e e chamado de n umero de Euler. Ele vale, at e a nona casa decimal depois da v rgula, 2.718281828 . . .
Outra deni c ao que prov em do logaritmo natural e a da fun c ao exponencial. A fun c ao exponencial e a inversa da fun c ao logaritmo natural e e denotada por exp(x). Geometricamente, se quisermos achar exp(x), temos que
desenhar o gr aco do logaritmo natural
localizar x na ordenada (e n ao na abscissa!)
procurar exp(x) como o u nico ponto da abscissa tal que (exp(x), x) esteja sobre o gr aco (ver gura abaixo, ` a esquerda).
256
ln x
exp(x) 1 x x
1 exp(x)
Ent ao o gr aco da exponencial assume o aspecto da gura acima, ` a direita. Enquanto o dom nio do logaritmo natural e o conjunto dos n umeros positivos e sua imagem o conjunto de todos os n umeros reais, com a exponencial ocorre o inverso: ela est a denida para todos os n umeros reais, mas s o assume valores positivos. Lembremos tamb em que a deni c ao geom etrica dada acima signica que exp(ln x) = x, para todo x > 0, e que ln(exp(x)) = x, para todo x. A exponencial tem a seguinte propriedade: a exponencial da soma e o produto das exponenciais. Matematicamente, exp(x + y ) = exp(x) exp(y ) . Isso ocorre pois, por um lado x + y = ln exp(x + y ) , e por outro x + y = ln exp(x) + ln exp(y ) = ln(exp(x) exp(y )) , de onde segue a igualdade. Agora, inspirados no fato de que para n umeros inteiros n e b > 0 vale bn = exp(ln bn ) = exp(n ln b) , deniremos a opera c ao de potencia c ao br , com b > 0 e r qualquer: br exp(r ln b) .
A.8. O TEOREMA DO VALOR MEDIO
257
f E acil ver que br bs = br+s , que decorre da propriedade da exponencial que acabamos de demonstrar. Da temos que, por exemplo, b 2 b 2 = b 2 + 2 = b1 = b . ou seja, 1 b2 = b . 1 Isso explica por que denotamos b n n b. Finalmente, e interessante notar que, com essa deni c ao, ex = exp(x ln e) = exp(x) , isto e, a exponencial e a potencia c ao do n umero de Euler e!
1 1 1 1
A.8
O Teorema do Valor M edio
Cientes do fato de que o c alculo de integrais depende de nossa capacidade de achar primitivas, o que por sua vez depende de nossos conhecimentos sobre deriva c ao de fun c oes, voltemos ao estudo das derivadas! Nesta curta Se c ao, enunciaremos o Teorema do Valor M edio. Depois, nas demais se c oes, obteremos regras de deriva c ao e delas conseguiremos tamb em m etodos de primitiviza c ao. Imagine uma fun c ao denida num intervalo [a, b], cujo gr aco e mostrado na gura ao lado. Agora f(b) trace uma reta L ligando os pontos (a, f (a)) e (b, f (b)) (indicada na gura por uma linha tracejada). A inclina c ao dessa reta e dada por
f(a)
f (b) f (a) . ba
O Teorema do Valor M edio diz que existe (pelo menos) um ponto c no intervalo [a, b] tal que a reta tangente a (c, f (c)) e paralela ` a reta L. Como a inclina c ao dessa reta tangente e dada por f (c), ent ao o Teorema do Valor M edio diz que existe c [a, b] tal que f (b) f (a) f (c) = , ba ou tal que f (c)(b a) = f (b) f (a) .
258
O Teorema do Valor M edio tamb em tem sua vers ao em termos de integrais. Seja g uma fun c ao cont nua no intervalo [a, b], e seja f sua primitiva. Ent ao existe c em [a, b] tal que
b
g (t)dt = f (b) f (a) = f (c)(b a) = g (c)(b a) .

a
Ou seja, a integral pode ser trocada pela integral da fun c ao constante g (c), que vale g (c)(b a).
A.9
A Regra da Cadeia
Freq uentemente nos deparamos com fun c oes compostas, e queremos achar suas derivadas. Por exemplo, f (x) = sin(x2 ) e uma fun c ao composta, resultante de se aplicar a fun c ao seno ap os se elevar o n umero ao quadrado. Usaremos o desenho abaixo para representar essa composi c ao:
u(x)= x 2
v(x)=sen x
x2
sen(x2)
f(x)=sen(x2)
De acordo com a gura, f (x) = v (u(x)) . A Regra da Cadeia nos d a uma forma de calcular a derivada de f desde que saibamos derivar as fun c oes que a comp oem. A motiva c ao que daremos de sua veracidade ser a baseada na hip otese de que as derivadas de u e v s ao fun c oes que variam continuamente. Para calcularmos a derivada de f lembremos que devemos examinar o quociente f (x + h) f (x) h e calcular seu limite quando h tende a zero.
A.9. A REGRA DA CADEIA
259
u
c(h) x x+h d(h) u(x) u(x+h)
v
f(x) f(x+h)
f
Agora notemos que f (x) = v (u(x)) e f (x + h) = v (u(x + h)). Pelo Teorema do Valor M edio, existe um ponto d = d(h) (sim, ele depende de h, mas ` as vezes escreveremos apenas d) entre u(x) e u(x + h) (acompanhe na gura) tal que f (x + h) f (x) = v (u(x + h)) v (u(x)) = v (d) (u(x + h) u(x)) . Al em disso, novamente por causa do Teorema do Valor M edio, existe c = c(h) entre x e x + h tal que u(x + h) u(x) = u (c) (x + h x) = u (c) h . Juntando as duas equa c oes, obtemos f (x + h) f (x) = v (d) u (c) . h Acontece que quando h tende a zero o ponto c(h) tende a x (pois est a entre x e x + h), e o ponto d(h) tende a u(x). Como assumimos que as derivadas s ao cont nuas, ent ao u (c) tende a u (x) e v (d) tende a v (u(x)). Assim temos a Regra da Cadeia: se f (x) = v (u(x)) ent ao f (x) = v (u(x)) u (x) . muito comum a Regra da Cadeia ser aplicada quando a primeira fun E c ao e linear. Por exemplo, se f (x) = cos(2x) (u(x) = 2x, v (x) = cos(x)), ent ao f (x) = v (u(x)) u (x) = sin(2x) 2 = 2 sin(2x) . Outra aplica c ao ocorre com fun c oes inversas. Se u(x) e v (x) s ao inversas uma da outra, ent ao u(v (x)) = x para todo x no dom nio de v e v (u(x)) = x
260
para todo x no dom nio de u. Isso ocorre por exemplo com as fun c oes ln x e ex . Derivando dos dois lados de qualquer uma das equa c oes, usando a Regra da Cadeia, temos u (v (x)) v (x) = 1 , v (u(x)) u (x) = 1 .
1 Vejamos como isso ca se u(x) = ex e v (x) = ln x. J a sabemos que v (x) = x (pela pr opria deni c ao do logaritmo!). Usaremos a segunda express ao para calcular a derivada de u(x) = ex . Temos 1 1 u (x) = = 1 = u(x) . v (u(x)) u ( x)
Conclus ao: a derivada de ex e ex !! Agora tamb em podemos derivar f (x) = bx . Como bx = ex ln b , ent ao f (x) = (ln b) ex ln b , pela Regra da Cadeia, isto e, f (x) = (ln b)bx .
A.10
Regras do produto e do quociente
Quando f (x) = u(x)v (x), quanto vale f (x)? Precisamos calcular o limite 1 1 {f (x + h) f (x)} = {u(x + h)v (x + h) u(x)v (x)} . h h De maneira esperta, subtra mos e somamos u(x + h)v (x), sem alterar o valor da express ao: 1 {u(x + h)v (x + h) u(x + h)v (x) + u(x + h)v (x) u(x)v (x)} , h e depois a arrumamos de forma conveniente: u(x + h) u(x + h) u(x) v (x + h) v (x) + v (x) . h h
Quando h tende a zero, essa express ao tende a u(x)v (x) + u (x)v (x) . Conclus ao: (u(x)v (x)) = u (x)v (x) + u(x)v (x) ,
INTEGRAC POR PARTES A.11. TRUQUES DE PRIMITIVIZAC AO: AO que e a conhecida Regra do Produto. Por exemplo, (x2 e2x ) = 2xe2x + x2 2e2x = 2x(1 + x)e2x .
261
A Regra do Produto tamb em pode ser usada para calcular a derivada de um quociente u(x) f (x) = , v (x) s desde que v (x) = 0. E o pensar que f (x) tamb em e um produto: f (x) = u(x) v (x) = u(x) 1 v (x) = u (x)v (x) + u(x) 1 v (x) .
S o que precisamos saber calcular a derivada de v(1 camos m ao da Regra x) ! Para isso lan 1 1 1 1 da Cadeia: v(x) e a fun c ao x aplicada ap os a fun c ao v (x). Como a derivada de x e , x2 ent ao 1 1 = v (x) . v (x) v (x)2 Logo u(x) v (x) = u (x) v (x) + u(x) . v (x) v (x)2
Colocando sob o mesmo denominador, u(x) v (x) = u (x)v (x) u(x)v (x) . v (x)2
Essa express ao tamb em e conhecida como Regra do Quociente. Sugere-se ao leitor testar seus conhecimentos de t ecnicas de deriva c ao com as fun c oes trigonom etricas, j a sabendo as derivadas de seno e cosseno. Por exemplo, a fun c ao tangente, que e seno sobre cosseno, pode ser derivada com a Regra do Quociente. Obter as derivadas das fun c oes secante, cossecante e cotangente. Obter as derivadas das inversas das fun c oes trigonom etricas, arcsin, arctan, etc. Em todos os casos procurar desenhar o gr aco dessas fun c oes e interpretar as express oes obtidas!!
A.11
Truques de primitiviza c ao: integra c ao por partes
Se rearranjarmos a express ao da Regra do Produto, teremos u(x)v (x) = (u(x)v (x)) u (x)v (x) .
262
Havendo a igualdade, os dois lados da equa c ao ter ao as mesmas primitivas (que diferem no m aximo por uma constante): u(x)v (x)dx = Como (u(x)v (x)) dx u (x)v (x)dx + C .
(u(x)v (x)) dx = u(x)v (x) + C ent ao u(x)v (x)dx = u(x)v (x) u (x)v (x)dx + C .
Essa e a conhecida f ormula de Integra c ao por Partes! Por exemplo, queremos achar uma primitiva de xex . Se chamarmos u(x) = x e v (x) = ex ent ao u (x) = 1 e v (x) = ex (na verdade ex + C , mas isso n ao far a diferen ca, conra!!). Ent ao xex dx = xex 1ex dx + C = xex ex + C = ex (x 1) + C .
Para conferir, basta derivar a primitiva obtida: (ex (x 1)) = ex (x 1) + ex = xex . H a que se tomar cuidado para n ao se escolher u de forma errada. Se cham assemos 2 , e ent u(x) = ex e v (x) = x ter amos u (x) = ex e v (x) = 1 x a o 2 1 ex xdx = x2 ex 2 1 2 x x e dx , 2
o que n ao melhora nossa situa c ao, pois agora precisamos achar a primitiva de x2 ex !
A.12
Truques de primitiviza c ao: substitui c ao
Se da Regra do Produto decorre a Integra c ao por Partes, da Regra da Cadeia segue a t ecnica de Substitui c ao. A Regra da Cadeia diz que f (g (x)) = f (g (x))f (x) . Em termos de primitivas, temos f (g (x))f (x)dx = f (g (x)) dx + C = f (g (x)) + C .
SUBSTITUIC A.12. TRUQUES DE PRIMITIVIZAC AO: AO Por exemplo, podemos nos deparar com h(g (x))g (x)dx . Se acharmos f tal que f (x) = h(x) (isto e, uma primitiva de h) ent ao h(g (x))g (x)dx = f (g (x))g (x)dx = f (g (x)) + C .
263
Embora ao leitor n ao pare ca acrescentar nada nesse caso, esse processo pode ser automatizado da seguinte forma: 1. Denir nova vari avel u = g (x), com du = g (x)dx. 2. Substituir na integral a nova vari avel: h(u)du.
3. Resolver o novo problema, que e o mesmo que achar uma primitiva de h: h(u)du = f (u) + C . 4. Retornar o valor de u = g (x), obtendo f (g (x)) + C . Por exemplo, queremos calcular Ficamos com x 1 + x2 dx. Fazemos u = x2 , donde du = 2xdx. 1 1 + udu . 2
S o precisamos saber uma primitiva de (1 + u)1/2 . Mas esta e f acil: tentemos 2 (1 + u)3/2 . 3 Substituindo u = x2 na resposta, obtemos 1 x 1 + x2 dx = (1 + x2 )3/2 + C . 3 Em algumas situa c oes n ao e evidente a substitui c ao a ser feita. Seja H (x)dx a primitiva a calcular. Chame u = g (x), escolha que e apenas uma tentativa e depende do feeling em rela c ao ao problema. Se for poss vel inverter a fun c ao g ent ao teremos 1 x = g (u). Agora du = g (x)dx, isto e, du = g (g 1 (u))dx ,
264 logo dx = du g
(g 1 (u))
= (g 1 ) (u)du .
Ent ao a substitui c ao pela nova vari avel leva a H (g 1 (u)) (g 1 ) (u)du . Eventualmente e mais f acil calcular a primitiva de H (g 1 (u)) (g 1 ) (u) do que a primitiva de H (x). Se F (u) for a tal primitiva, ent ao basta substituir u = g (x) para obter a primitiva desejada de H : H (x)dx = F (g (x)) + C . 2 Vejamos um exemplo. Queremos determinar x x +21dx. Podemos fazer a substitui c ao u = x + 1. Ent ao invertemos e obtemos x = u 1, com dx = 2udu. Em seguida fazemos a substitui c ao na integral, obtendo 2(u2 1)2 u2 du . Essa primitiva e f acil de achar, pois trata-se de um polin omio: basta integrar termo a termo, para obter 2 4 2 u3 ( u2 + u4 ) + C . 3 5 7 Substituindo novamente u por (x + 1)1/2 , chegamos ` a primitiva procurada: 2 (x + 1)3/2 7 8 4 x + x2 15 5 +C .
Ap endice B
F ormula de Taylor
B.1 Introdu c ao
Na Parte II deste livro e abordada a quest ao da aproxima c ao de uma fun c ao por polin omios: dado um n umero inteiro n maior ou igual a zero, qual e o melhor polin omio, entre aqueles de grau menor ou igual a n, a aproximar uma certa fun c ao cont nua f denida no intervalo [a, b]? Ali a quest ao s o pode ser respondida se antes se denir um crit erio (relativo) de proximidade. Isto e, uma maneira de dizer o quanto um polin omio est a distante de f , que permita decidir, entre dois dados polin omios, qual e aquele que est a mais perto de f . O crit erio adotado e o do qui-quadrado: se p e o polin omio ent ao mede-se
b
Q(p) =
a
(f (x) p(x))2 dx ,
que e sempre um n umero maior ou igual a zero. Esse crit erio leva em conta a proximidade de f e p em todo o intervalo [a, b]. De nada adianta que p seja exatamente igual a f em certa parte do intervalo se em outra a diferen ca se torna enorme, fazendo aumentar o valor da integral. Neste Ap endice estamos interessados em outro ponto de vista para se denir a melhor aproxima c ao polinomial de f . Agora n ao estamos preocupados em aproximar f num dado intervalo xo, mas sim na vizinhan ca de um ponto. Fixado um ponto w, n ao nos interessar a o que acontece com a fun c ao longe do ponto w. Tentemos precisar melhor os conceitos. Seja f uma fun c ao, para come car cont nua, e w um ponto onde ela esteja denida. Sejam p e q dois polin omios. Diremos que p aproxima f em w melhor do que q se p(x) f (x) <1 q (x) f (x) 265
266
APENDICE B. FORMULA DE TAYLOR
quando x est a sucientemente perto de w. Ou seja, se tomarmos x sucientemente pr oximo de w ent ao a diferen ca |p(x) f (x)| ca menor do que a diferen ca |q (x) f (x)|. Obviamente a fra c ao s o e tomada quando o denominador for n ao nulo. Em geral, teremos que essa fra c ao vai a zero, o que pode ser expresso da seguinte maneira: p(x) f (x) lim =0. xw q (x) f (x) Podemos ver alguns exemplos simples, para aos poucos chegarmos a enunciados mais gerais.
B.1.1
Polin omios de grau zero
Por exemplo, suponha que f seja uma fun c ao (cont nua) que assume o valor A em w. E suponha que p e q sejam polin omios de grau zero, isto e, s ao polin omios constantes: p(x) = a0 e p(x) = b0 , para todo x, com a0 = b0 . Para sabermos qual dos polin omios aproxima melhor a fun c ao f em w, temos que olhar para o quociente p(x) f (x) a0 f (x) = q (x) f (x) b0 f (x) Como f (x) tende a A ` a medida que x tende a w, podemos ver quais s ao as possibilidades. Primeiro, se tanto a0 quanto b0 forem diferentes de A, ent ao o quociente tende a a0 A , b0 A que ser a menor do que 1 se a0 estiver mais pr oximo de A do que b0 . Neste caso, como esse e o valor limite, quando x estiver bem pr oximo de w o quociente ser a tamb em menor do que 1, e ent ao p aproximar a melhor do que q em w. Se for o contr ario, isto e, b0 mais perto de A do que a0 ent ao ser a q que aproximar a melhor. Se a0 = A ent ao teremos que a diferen ca a0 f (x) tende a zero quando x tende a w, enquanto b0 f (x) tende a b0 a0 . Neste caso a fra c ao ir a a zero. Conclui-se portanto que o melhor polin omio de grau zero que aproxima f em w e p(x) = f (w) = A.
B.1.2
Aproxima c ao da fun c ao nula
Vale a pena entender tamb em o que se passa com a fun c ao f (x) 0, a fun c ao nula, tomando, para facilitar, o ponto w = 0. Pela Subse c ao anterior, o melhor polin omio de grau zero que aproxima f em w e p(x) 0. Tamb em p(x) 0 = 0 + 0 x e o melhor polin omio de grau 1 a aproximar f , de fato, para qualquer n e o melhor polin omio de grau n. Fica para o leitor se divertir em demonstrar (ou vericar) isso.
B.1. INTRODUC AO
267
B.1.3
Aproxima c ao de grau 1
Vejamos como melhor aproximar uma fun c ao f em w por um polin omio de grau 1, supondo que ela seja deriv avel. Em primeiro lugar, e f acil ver que o polin omio p(x) deve ter, como termo de grau zero, o valor de f em w, pela mesma raz ao com que o melhor polin omio de grau zero tinha que ser igual a f (w). Ent ao p(x) = f (w) + (x w) (lembrando que polin omios de grau 1 t em retas como gr aco, e esta e uma maneira de se escrever a reta que passa por (w, f (w)) e tem inclina c ao ), ou seja, precisamos apenas procurar o valor de . Como f e deriv avel, ent ao existe o limite f (w) = lim Isto e o mesmo que dizer que a diferen ca f (w) f (x) f (w) xw f (x) f (w) . xw xw
tende a zero quando x tende a w. Armamos que p(x) = f (w) + f (w)(x w) e o melhor polin omio de grau 1 que aproxima f em w, em detrimento de outros polin omios q (x) = f (w) + (x w), com = f (w). Basta olharmos para a fra c ao f (x) p(x) f (x) f (w) f (w)(x w) = . f (x) q (x) f (x) f (w) (x w) Colocando x w em evid encia no numerador e no denominador, camos com
f ( x) f ( w ) f (w) x w f ( x) f ( w ) x w
Quando x tende a w, o numerador tende a zero, pelas considera c oes acima, enquanto que o denominador tende a f (w) , que e diferente de zero. Portanto a fra c ao toda vai a zero, mostrando o que hav amos armado. Conclui-se ent ao que a melhor aproxima c ao de grau 1 de f em w corresponde ` a ( unica) reta que passa por w e tem inclina c ao f (w).
268
APENDICE B. FORMULA DE TAYLOR
B.2
Polin omio e F ormula de Taylor
Au ltima arma c ao da Se c ao anterior e mais ou menos intuitiva. Ela diz que a melhor reta que aproxima um gr aco em dado ponto e a reta tangente ao gr aco nesse ponto. Outra maneira de se ler essa conclus ao e a seguinte. O polin omio p(x) de grau 1 que melhor aproxima f em w e aquele tal que p(w) = f (w) e p (w) = f (w). Esta segunda maneira de pensar se presta facilmente a generaliza c oes. De fato, podese mostrar (e o faremos logo abaixo) que o polin omio de grau n que melhor aproxima f em w e aquele ( unico) tal que p(w) = f (w) , p (w) = f (w) , p (w) = f (w) , . . . , p(n) (w) = f (n) (w) , ou seja, cujas derivadas at e ordem n coincidem com as derivadas de f em w. E claro que ao fazermos tal arma c ao estamos automaticamente supondo que f pode ser diferenciada n vezes em w! Para facilitar as coisas iremos supor que a fun c ao f e tantas vezes diferenci avel quanto queiramos, e al em do mais todas as suas derivadas de qualquer ordem s ao fun c oes cont nuas. Esse e, de fato, o caso da maioria das fun c oes com que iremos nos deparar em aplica c oes (obviamente h a exce c oes, e nesses casos h a que se tomar os devidos cuidados). O leitor pode facilmente vericar, usando as regras de deriva c ao, que o polin omio pn (x) = f (w) + f (w)(x w) + f (w) f (n) (w) (x w)2 + . . . + (x w)n 2 n!
satisfaz as exig encias acima. Este e o chamado polin omio de Taylor de ordem n de f em w. Antes de examinarmos a veracidade da generaliza c ao feita acima, podemos tamb em nos perguntar em que grau e boa a aproxima c ao por polin omios, em w, da fun c ao f . Mais especicamente, podemos investigar a diferen ca f (x) pn (x) quando x se aproxima de w. De fato, responderemos todas as indaga c oes de uma s o vez. Comecemos examinando a diferen ca entre f (x) e a aproxima c ao de primeira ordem p1 (x) = f (w) + f (w)(x w). Chamemos de R1 (x) (R de resto) essa diferen ca. Ent ao R1 (x) = f (x) f (w) f (w)(x w) . A id eia e reescrever essa express ao de forma que possamos avaliar o tamanho de R1 (x). Pelo Teorema Fundamental do C alculo, temos
x
R1 (x) =
w
f (t)dt f (w)(x w)
B.2. POLINOMIO E FORMULA DE TAYLOR e, nesta nova express ao, podemos reconhecer a integra c ao por partes
x
269
R1 (x) =
w
(x t)f (t)dt .
Podemos agora estimar R1 (x), usando o Teorema do Valor M edio, em sua vers ao integral. Ou seja, existe entre w e x, que depende de x, tal que R1 (x) = (x w)(x )f ( ) . Portanto temos |R1 (x)| = |x | |f ( )| . |x w|
Quando x tende a w a diferen ca |x | tende a zero, uma vez que est a entre w e x. Al em disso, como estamos supondo que todas as derivadas de f sejam cont nuas, f ( ) tende a f (w). Logo |R1 (x)| lim =0. xw |x w | Conclui-se ent ao que o resto n ao s o tende a zero quando x tende a w como tende a zero mais rapidamente do que a diferen ca x w. A segunda etapa e ver o que acontece com ordens mais altas. Vejamos o que acontece ao passarmos para ordem 2. Como p2 (x) = p1 (x) + temos R2 (x) = f (x) p2 (x) = f (x) p1 (x) Mas f (x) p1 (x) = R1 (x), de forma que
x
f (w) (x w)2 , 2 f (w) (x w)2 . 2
R2 (x) =
w
(x t)f (t)dt
f (w) (x w)2 , 2
express ao esta que sai da integra c ao por partes de R2 (x) = 1 2

x
(x t)2 f (t)dt .
w
Usando novamente o Teorema do Valor M edio para a integral, conseguimos mostrar que |R2 (x)| =0. xw |x w |2 lim
270
APENDICE B. FORMULA DE TAYLOR Prosseguindo indutivamente (ca para o leitor se certicar disto), conclui-se que f (x) = pn (x) + Rn (x) ,
conhecida como f ormula de Taylor de ordem n para f em w, onde Rn (x) = 1 n!

x
(x t)n f (n+1) (t)dt .

w
A fun c ao Rn tem a propriedade de que lim |Rn (x)| =0. |x w|n
xw
Se delimitarmos um intervalo onde a (n + 1)- esima derivada de f seja cont nua, seu ( n +1) m odulo ter a um m aximo nesse intervalo, que denotaremos por max |f |. Como o m odulo da integral e menor ou igual ` a integral do m odulo (em um intervalo orientado positivamente), temos |Rn (x)| e |Rn (x)| max |f (n+1) | n! 1 n!
x
|x t|n |f (n+1) (t)|dt

w x
|x t|n dt .
w
Fazendo um gr aco de |x t|n entre w e x, e prevendo as possibilidades de que x < w e w < x, o leitor pode vericar facilmente que
x |x w |
|x t|n dt =
w 0
un du =
|x w|n+1 . n+1
Ent ao |Rn (x)| max |f (n+1) | |x w|n+1 . (n + 1)!
Podemos agora entender a raz ao pela qual o polin omio de Taylor pn e a melhor aproxima c ao de grau n de f em w. Primeiro notamos que Rn (x) =0 xw (x w )m lim para qualquer m menor ou igual a n (tiramos os m odulos para facilitar as coisas, uma vez que o limite de uma express ao e zero se e somente se o limite do m odulo da mesma
B.2. POLINOMIO E FORMULA DE TAYLOR
271
express ao e zero). Basta multiplicar o numerador e o denominador por (x w)nm , cando com Rn (x) (x w)nm , (x w)n que vai a zero porque e um produto de dois termos que v ao a zero. Suponhamos agora outro polin omio q de grau (no m aximo) n. Como q e pn n ao s ao iguais, a diferen ca entre eles e um polin omio de grau no m aximo n, que podemos escrever como am (x w)m + am+1 (x w)m+1 + . . . + an (x w)n . O n umero m e o grau correspondente ao primeiro coeciente n ao-nulo do polin omio (quando escrito nessa forma), e pode ser qualquer inteiro entre 0 e n. Ent ao pn (x) q (x) = (x w)m (am + Q(x)) , onde Q(x) = am+1 (x w) + am+2 (x w)2 + . . . + an (x w)nm , polin omio que vai a zero quando x tende a w. Finalmente comparamos a proximidade de pn e q com f , para mostrar que pn est a mais pr oximo de f em w do que q . Temos f (x) pn (x) Rn (x) = , f (x) q (x) Rn (x) + pn (x) q (x) lembrando da pr opria deni c ao de Rn . A partir das considera c oes acima, essa fra c ao pode ser escrita como Rn (x) , R n ( x) (x w)m (am + Q(x) + (x ) m w ) de onde nota-se que ela deve ir a zero quando x tende a w.

Cálculo Numérico

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Cálculo Numérico

Enviado por

Direitos autorais:

Formatos disponíveis

Sum ario

Ajuste de Fun c oes

3 97 98 101 101 103 105 106 109

Equa c oes e Zeros de Fun c oes

12 Estimativa do erro nas interpola c oes

Integra c ao de Fun c oes

Equa c oes Diferenciais

SUMARIO 265 265 266 266 267 268

Exemplos de aplica c oes de sistemas lineares

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

DE POLINOMIOS 1.6. OUTROS PROBLEMAS DE DETERMINAC AO

Outros problemas de determina c ao de polin omios

isso nos d a uma equa c ao linear, pois

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

1.8. PROBLEMAS DE CONTORNO

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

Entendendo os sistemas lineares

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

2.2. TRANSFORMAC OES LINEARES

Transforma c oes lineares

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

DE MATRIZES 2.4. INVERSAO

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

2.5. EXPLORANDO A LINEARIDADE

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

Exist encia e unicidade de solu c oes

2.6. EXISTENCIA E UNICIDADE DE SOLUC OES

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

Injetividade, sobrejetividade... glup!

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

v u P( u,v) P(u1 ,v) u1 u1+ u2 u2 P(u2 ,v)

CAP ITULO 2. ENTENDENDO OS SISTEMAS LINEARES

ai1 1 ai2 2 . . . ain n det(ei1 , ei2 , . . . , ein ) .

2.9. QUADRO COMPARATIVO

CAP ITULO 3. O METODO DE ESCALONAMENTO

CAP ITULO 3. O METODO DE ESCALONAMENTO

3.2. ALGARISMOS SIGNIFICATIVOS

CAP ITULO 3. O METODO DE ESCALONAMENTO

3.2. ALGARISMOS SIGNIFICATIVOS

3.3. O DETERMINANTE NO METODO DE ESCALONAMENTO Portanto

O determinante no M etodo de Escalonamento

CAP ITULO 3. O METODO DE ESCALONAMENTO

A desvantagem da Regra de Cramer

3.4. A DESVANTAGEM DA REGRA DE CRAMER Logo xi = det(. . . , Aei1 , b, Aei+1 , . . .) , det A

CAP ITULO 3. O METODO DE ESCALONAMENTO

Sistemas mal-condicionados e renamento de solu c ao

3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO

CAP ITULO 3. O METODO DE ESCALONAMENTO

3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO

CAP ITULO 3. O METODO DE ESCALONAMENTO

3.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO

CAP ITULO 3. O METODO DE ESCALONAMENTO

CAP ITULO 4. METODOS ITERATIVOS

Crit erio das Linhas

4.2. CRITERIO DAS LINHAS

ou, introduzindo uma nota c ao mais compacta, de forma que

1 (k1) (k1) k1) b1 a12 x2 a13 x3 . . . a1n x( n a11

60 e, como os x1 , . . . , xn formam uma solu c ao, x1 = Ent ao x1 x1 =

CAP ITULO 4. METODOS ITERATIVOS

1 (b1 a12 x2 a13 x3 . . . a1n xn ) . a11

|a12 | + |a13 | + . . . + |a1n | (k 1) . |a11 |