Calculo Numerico

C alculo Num erico Fundamentos e Aplica c oes
Claudio Hirofume Asano Eduardo Colli Departamento de Matem atica Aplicada IME-USP 9 de dezembro de 2009
Sum ario
I Sistemas Lineares
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
11 11 11 12 13 15 16 17 18 21 21 24 29 30 31 31 32 33 37 37 38 40 41
1 Exemplos de aplica c oes de sistemas lineares 1.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . 1.2 Provetas . . . . . . . . . . . . . . . . . . . . . . . 1.3 Petr oleo . . . . . . . . . . . . . . . . . . . . . . . 1.4 Cores . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Interpola c ao polinomial . . . . . . . . . . . . . . 1.6 Outros problemas de determina c ao de polin omios 1.7 Splines . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Problemas de contorno . . . . . . . . . . . . . . .
2 O M etodo de Escalonamento 2.1 O m etodo . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Algarismos signicativos . . . . . . . . . . . . . . . . 2.3 O determinante no M etodo de Escalonamento . . . . 2.4 A desvantagem da Regra de Cramer . . . . . . . . . 2.5 Sistemas mal-condicionados e renamento de solu c ao 2.5.1 Sistemas mal-condicionados . . . . . . . . . . 2.5.2 Matrizes de Hilbert . . . . . . . . . . . . . . . 2.5.3 Renamento . . . . . . . . . . . . . . . . . . 3 M etodos iterativos 3.1 O M etodo de Jacobi . . . 3.2 Crit erio das Linhas . . . . 3.3 Crit erio de parada . . . . 3.4 O M etodo de Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
II
Ajuste de Fun c oes
47
49 49 50 50
4 Ajuste de fun c oes 4.1 O problema do ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Os m nimos quadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Par ametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4 4.3.1 4.3.2 4.3.3 4.3.4 4.3.5 4.3.6 Densidade . . . . . . . . . Caten aria . . . . . . . . . Naftalinas e fun c oes ans Decaimento exponencial . Leis de pot encia e fractais Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
SUMARIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 52 52 53 54 55 59 59 60 61 62 64 65 66 66 68 71 71 73 74 75 77 77 79 81 81 84
5 Fun c oes lineares nos par ametros 5.1 Depend encia linear dos par ametros . . . . . . . . 5.2 Cont nuo vs. discreto . . . . . . . . . . . . . . . . 5.3 Um par ametro . . . . . . . . . . . . . . . . . . . 5.4 Dois par ametros . . . . . . . . . . . . . . . . . . 5.5 Ajuste de qualquer fun c ao linear nos par ametros 5.6 O caso cont nuo . . . . . . . . . . . . . . . . . . . 5.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . 5.7.1 Dinam ometro . . . . . . . . . . . . . . . . 5.7.2 Cosseno aproximado por um polin omio . 6 Levando a s erio o produto escalar 6.1 Produto escalar e dist ancia . . . . . 6.2 Exist encia e unicidade de solu c oes no 6.3 O caso cont nuo . . . . . . . . . . . . 6.4 Outros produtos escalares: pesos . . . . . . ajuste . . . . . . . .
. . . . linear . . . . . . . .
7 Fam lias ortogonais 7.1 Deni c oes e exemplos . . . . . . . . . . . . . . . . . . . . . . . 7.2 Calculando polin omios ortogonais por recorr encia . . . . . . . . 7.3 Um exemplo de aplica c ao de polin omios ortogonais . . . . . . . 7.4 Exemplo de an alise harm onica . . . . . . . . . . . . . . . . . . 7.5 Mudan ca de vari aveis: como usar tabelas de fun c oes ortogonais
III
Equa c oes e Zeros de Fun c oes

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
89 89 90 90 93 95 96
8 Zeros de fun c oes e o M etodo da Dicotomia 8.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . 8.2 Raiz c ubica de 10 . . . . . . . . . . . . . . . . . . . 8.3 P ara-quedista ou bolinha em queda dentro d agua 8.4 O cilindro deitado . . . . . . . . . . . . . . . . . . 8.5 Caten aria . . . . . . . . . . . . . . . . . . . . . . . 8.6 M etodo da Dicotomia . . . . . . . . . . . . . . . .
9 M etodos iterativos 99 9.1 Plano geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 9.2 Pontos xos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 9.3 Fun c oes auxiliares candidatas . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
SUMARIO 9.4 9.5 9.6 9.7 9.8 9.9 Visualizando itera c oes . . . . . . . . . . . . . . . . . . Iterando perto de pontos xos . . . . . . . . . . . . . . Teorema do Valor M edio e velocidade de converg encia 9.6.1 O caso (x ) = 0: converg encia quadr atica . . Calculando zeros de fun c oes - a escolha de . . . . . A escolha de x0 . . . . . . . . . . . . . . . . . . . . . . Um crit erio de parada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 102 104 109 110 111 113 115 117 118 121 123 124
10 O M etodo de Newton 10.1 Quando o M etodo de Newton funciona? . . . 10.1.1 Retirando a hip otese f (x ) = 0 . . . . 10.2 M etodo de Newton em dimens oes mais altas . 10.2.1 Determina c ao da forma de uma corda
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
IV
Interpola c ao Polinomial
127
129
11 Estimativa do erro nas interpola c oes
12 T ecnicas de interpola c ao 133 12.1 Polin omios de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 12.2 Forma de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 12.2.1 Exemplo do uso da forma de Newton . . . . . . . . . . . . . . . . . . . 137
Integra c ao de Fun c oes

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
139
141 141 142 144 146 147 151 152
13 Import ancia da integra c ao num erica 13.1 Introdu c ao . . . . . . . . . . . . . . . . . . 13.2 C alculo de areas . . . . . . . . . . . . . . 13.3 Comprimento de curvas e gr acos . . . . . 13.4 Dist ancia percorrida e tempo decorrido . . 13.5 Per odo do p endulo e as integrais el pticas 13.6 C alculo de e de logaritmos . . . . . . . 13.7 A gaussiana . . . . . . . . . . . . . . . . .
14 M etodos de integra c ao num erica 155 14.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 14.2 O M etodo dos Trap ezios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 14.3 O M etodo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 15 Estimativa do erro nos m etodos de integra c ao 161 15.1 F ormulas de erro e compara c ao dos m etodos . . . . . . . . . . . . . . . . . . . 161 15.2 Aplica c ao das f ormulas de erro . . . . . . . . . . . . . . . . . . . . . . . . . . 163
6 16 Obten c ao das f ormulas de erro 16.1 Primeira Abordagem - M etodo dos Trap ezios 16.2 Primeira Abordagem - M etodo de Simpson . 16.3 Segunda Abordagem - M etodo dos Trap ezios 16.4 Segunda Abordagem - M etodo de Simpson . . 16.5 Terceira Abordagem - M etodo dos Trap ezios . 16.6 Terceira Abordagem - M etodo de Simpson . .
SUMARIO 167 168 169 169 170 171 172
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
VI
Equa c oes Diferenciais

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
175
177 177 179 180 180 180 181 181 182 183 185 185 186 187 191 191 192 194 196 198 202 205 205 206 208 208 209 212 213 214 214 216 218
17 Breve introdu c ao ` as equa c oes diferenciais 17.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.2 Solu c ao de equa c oes aut onomas e separ aveis . . . . . . . . 17.3 Alguns exemplos . . . . . . . . . . . . . . . . . . . . . . . 17.3.1 Naftalinas . . . . . . . . . . . . . . . . . . . . . . . 17.3.2 Crescimento populacional a taxas constantes . . . 17.3.3 P ara-quedista . . . . . . . . . . . . . . . . . . . . . 17.3.4 Crescimento populacional com restri c oes de espa co 17.3.5 Caten aria . . . . . . . . . . . . . . . . . . . . . . . 17.3.6 Escoamento de um copo furado . . . . . . . . . . . 17.3.7 Dada do M etodo de Newton, quem e f? . . . . . 17.3.8 Transfer encia de calor . . . . . . . . . . . . . . . . 17.4 Entendimento qualitativo de equa c oes aut onomas . . . . . 17.5 Equa c oes diferenciais com mais vari aveis . . . . . . . . . . 18 Solu c ao num erica de equa c oes diferenciais 18.1 Equa c oes separ aveis . . . . . . . . . . . . . . . . . 18.2 Discretiza c ao . . . . . . . . . . . . . . . . . . . . . 18.3 O M etodo de Euler . . . . . . . . . . . . . . . . . . 18.4 Indo para segunda ordem . . . . . . . . . . . . . . 18.5 Runge-Kutta . . . . . . . . . . . . . . . . . . . . . 18.6 Runge-Kutta em sistemas de equa c oes aut onomas . A Entendendo os sistemas lineares A.1 Sistemas lineares e interse c oes de hiperplanos A.2 Transforma c oes lineares . . . . . . . . . . . . A.3 Nota c ao e interpreta c ao . . . . . . . . . . . . A.4 Invers ao de matrizes . . . . . . . . . . . . . . A.5 Explorando a linearidade . . . . . . . . . . . A.6 Exist encia e unicidade de solu c oes . . . . . . A.7 Injetividade, sobrejetividade... glup! . . . . . A.8 O determinante . . . . . . . . . . . . . . . . . A.8.1 Dimens ao 2 . . . . . . . . . . . . . . . A.8.2 Dimens ao 3 . . . . . . . . . . . . . . . A.8.3 Dimens ao n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
SUMARIO
A.9 Quadro comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 B Revis ao de C alculo B.1 Derivadas . . . . . . . . . . . . . . . . . . . . . . . B.2 Primitivas . . . . . . . . . . . . . . . . . . . . . . . B.3 Integral . . . . . . . . . . . . . . . . . . . . . . . . B.4 A integral indenida . . . . . . . . . . . . . . . . . B.5 O Teorema Fundamental do C alculo . . . . . . . . B.6 A praticidade do Teorema Fundamental do C alculo B.7 O logaritmo . . . . . . . . . . . . . . . . . . . . . . B.8 O Teorema do Valor M edio . . . . . . . . . . . . . B.9 A Regra da Cadeia . . . . . . . . . . . . . . . . . . B.10 Regras do produto e do quociente . . . . . . . . . . B.11 Truques de primitiviza c ao: integra c ao por partes . B.12 Truques de primitiviza c ao: substitui c ao . . . . . . C F ormula de Taylor C.1 Introdu c ao . . . . . . . . . . . . . . . C.1.1 Polin omios de grau zero . . . C.1.2 Aproxima c ao da fun c ao nula C.1.3 Aproxima c ao de grau 1 . . . C.2 Polin omio e F ormula de Taylor . . . D Respostas de exerc cios selecionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 221 222 223 224 226 228 229 233 234 236 237 237 241 241 242 242 242 243 247
8 q
SUMARIO
Parte I
Sistemas Lineares
Cap tulo 1
Exemplos de aplica c oes de sistemas lineares

1.1 Introdu c ao
Um sistema linear e um conjunto de m equa c oes, com n inc ognitas x1 , x2 , . . ., xn , da seguinte forma: a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . am1 x1 + am2 x2 + . . . + amn xn = bm Os n umeros aij s ao os coecientes do sistema linear, e s ao fornecidos no problema. Os bi s s ao chamados de termos independentes. Aqui estudaremos apenas os sistemas lineares que tenham tantas equa c oes quanto inc ognitas, isto e, m = n. Trataremos neste Cap tulo de alguns exemplos onde se aplicam sistemas lineares, no Ap endice A discutimos um pouco da teoria envolvida (por exemplo, a rela c ao entre o determinante dos coecientes do sistema e a exist encia e unicidade de solu c oes), no Cap tulo 2 falaremos de sua solu c ao pelo M etodo de Escalonamento e no Cap tulo 3, nalmente, exporemos dois m etodos iterativos de resolu c ao dos sistemas lineares (que, infelizmente, s o funcionam em certos casos).
1.2
Provetas
Considere o seguinte problema. Quatro tipos de materiais particulados est ao distribu dos por quatro provetas, e em cada proveta os materiais s ao dispostos em camadas, n ao misturadas, de modo que seja poss vel medir facilmente o volume de cada material em cada uma delas. Dado que possamos medir a massa total de cada proveta, e que saibamos a massa da proveta vazia, queremos calcular a densidade de cada um dos materiais. 11
12
CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES
Para colocar o problema em termos matem aticos, chamemos os materiais de A, B , C e D, e suas densidades respectivas de A , B , C e D . Essas s ao as inc ognitas do problema, n umeros que queremos descobrir. Entre os dados dispon veis para resolv e-lo est ao a massa conjunta dos quatro materiais em cada uma das provetas (numeradas de 1 a 4), que chamaremos de m1 , m2 , m3 e m4 , j a descontada a tara das provetas.
11 00 00 11 00 11 00 11 D 00 11 00 11 00 11 00 11 00 11 00 11 C 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 B 00 11 00 11 00 11 00 11 00 11 00 11 00 11 A 00 11 00 11 00 11
11 00 00 11 00 11 00 11 00 11 00 11 D 00 11 00 11 00 11 00 11 00 11 00 11 00 11 C 00 11 00 11 00 11 00 11 00 11 00 11 00 11 B 00 11 00 11 00 11 00 11 00 11 00 11 00 11 A 00 11 00 11 00 11 00 11 00 11
11 00 00 11 00 11 00 11 D 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 C 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 B 00 11 00 11 00 11 00 11 A 00 11 00 11
11 00 00 11 00 11 00 11 00 11 00 11 D 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 C 00 11 00 11 00 11 00 11 00 11 00 11 B 00 11 00 11 00 11 00 11 00 11 00 11 00 11 A 00 11 00 11 00 11
Al em disso, temos o volume de cada um dos materiais em cada uma das provetas. Chamaremos de v1A , v1B , v1C e v1D o volume dos materiais A, B , C e D na Proveta 1, v2A , v2B , v2C e v2D o volume dos materiais A, B , C e D na Proveta 2, e assim por diante. Como a densidade e a raz ao entre massa e volume, a massa do material A na Proveta 1 e v1A A . Estendendo esse racioc nio para os demais materiais, obtemos que a massa total m1 contida na Proveta 1 e v1A A + v1B B + v1C C + v1D D . Considerando as quatro provetas, obteremos quatro equa c oes: v1A A + v1B v2A A + v2B v3A A + v3B v4A A + v4B B B B B + v1C + v2C + v3C + v4C C C C C + v1D D + v2D D + v3D D + v4D D = m1 = m2 = m3 = m4
Trata-se de um sistema linear de quatro equa c oes e quatro inc ognitas. Uma poss vel aplica c ao em Geologia seria a seguinte. Uma sonda faz o papel das provetas, e uma coluna de material e retirada, contendo materiais diferentes dispostos em camadas (pode ser at e uma sonda coletando material gelado). A sonda permitiria medir a dimens ao de cada camada, mas n ao poder amos desmanchar a coluna para medir a densidade de cada material isoladamente, sob o risco de alterar a compacta c ao.
1.3
Petr oleo
Outro problema para Ge ologos e ans. Em tr es po cos de petr oleo, situados em regi oes distintas, o material coletado tem diferentes concentra c oes de duas subst ancias A e B . Uma central recebe o petr oleo dos tr es po cos, mas antes do reno precisa obter uma mistura com uma concentra c ao escolhida das subst ancias A e B . A pergunta e: em cada litro de petr oleo que ser a gerado para o reno, quanto petr oleo de cada po co se deve colocar? Mais uma vez equacionemos o problema: chamaremos de c1A a concentra c ao de A no petr oleo do Po co 1, c1B a concentra c ao de B no petr oleo do Po co 1, e assim por diante. Essa informa c ao e conhecida previamente. As concentra c oes que queremos obter s ao chamadas de cA e cB . As inc ognitas s ao as quantidades relativas de petr oleo de cada po co que colocaremos
1.4. CORES
13
na mistura nal, que chamaremos de q1 , q2 e q3 . Elas s ao medidas em litros, e devem ser tais que q1 + q2 + q3 = 1 . Al em disso, a concentra c ao do material A ap os a mistura dos tr es ser a dada por c1A q1 + c2A q2 + c3A q3 . Pensando o mesmo sobre o material B , camos com tr es equa c oes lineares e tr es inc ognitas: c1A q1 c1B q1 q1 + c2A q2 + c2B q2 + q2 + c3A q3 + c3B q3 + q3 = cA = cB = 1
Aqui e importante salientar que o problema n ao teria uma solu c ao satisfat oria para qualquer escolha de cA e cB . Por exemplo, se a concentra c ao cA desejada na mistura for superior ` as concentra c oes de A em cada um dos po cos, n ao h a como obter a mistura satisfatoriamente. Mesmo assim poderia haver uma solu c ao matem atica para a equa c ao, na qual provavelmente uma das inc ognitas q1 , q2 ou q3 teria que ser negativa! Portanto no problema real devemos adicionar a exig encia de que os valores q1 , q2 e q3 encontrados n ao sejam negativos. O conjunto de valores de cA e cB para os quais haveria uma solu c ao para esse problema pode ser representado da seguinte forma. Queremos um par de concentra c oes (cA , cB ) tal que existam q1 , q2 e q3 satisfazendo as equa c oes acima. Esse conjunto de possibilidades est a representado no plano cartesiano na gura ao lado, e e denominado envolt oria convexa dos pontos (c1A , c1B ), (c2A , c2B ) e (c3A , c3B ). Ele e o menor conjunto convexo que cont em os pontos citados.
cB
(c1A ,c1B )
possiveis
(cA ,cB )
(c3A ,c3B ) (c2A ,c2B )
cA
1.4
Cores
Um exemplo muito semelhante pode ser obtido trabalhando-se com combina c oes de cores. A maior parte das cores conhecidas podem ser formadas pela combina c ao de tr es cores: vermelho (R), verde (G) e azul (B), as letras correspondendo ` a nomenclatura em ingl es red-green-blue, que chamaremos de cores puras.
14
Isto signica que as cores podem ser representadas por tr es n umeros n ao-negativos, cada um indicando a quantidade de cada uma das tr es cores, e esses n umeros s ao geometricamente vistos pela posi c ao que representam no primeiro octante formado pelos tr es eixos coordenados no espa co tridimensional.
G R
No entanto h a um bocado de informa c ao redundante nessa representa c ao, uma vez que o ponto (1, 1, 1) deve resultar na mesma cor que (3, 3, 3), a u nica diferen ca sendo a quantidade de material produzido.
B
azul (0,0,1)
Se pensarmos que os n umeros xR , xG , xB denotam a quantidade de litros de cada cor pura e sempre quisermos produzir exatamente 1 litro de mistura, ent ao e necess ario que xR + xG + xB = 1 .
(0,1,0)
(1,0,0)
G
vermelho verde
A equa c ao acima restringe o espa co de cores poss veis ` a intersec c ao do plano xR + xG + xB = 1 com o primeiro octante, que e o tri angulo mostrado na gura ao lado.
Cada ponto Q desse tri angulo e obtido como combina c ao convexa de (1, 0, 0), (0, 1, 0) e (0, 0, 1), isto e, Q = (qR , qG , qB ) = qR (1, 0, 0) + qG (0, 1, 0) + qB (0, 0, 1) , com a condi c ao de que qR + qG + qB = 1. Chamaremos de T esse tri angulo. Suponha agora que produzimos quatro cores distintas Q(1) , Q(2) , Q(3) e Q(4) , sendo que Q(i) = (qR , qG , qB ) para cada i = 1, 2, 3, 4. Elas s ao representadas por pontos no tri angulo T .
(i) (i) (i)
POLINOMIAL 1.5. INTERPOLAC AO
15
O conjunto de todas as combina c oes poss veis dessas quatro cores (formando um litro) e o menor conjunto convexo em T que cont em essas quatro cores, como ilustra a gura ao lado. Se Q e uma tal cor, ent ao Q = x1 Q(1) + x2 Q(2) + x3 Q(3) + x4 Q(4) , com x1 + x2 + x3 + x4 = 1.
Q (2) Q
(1)
Q (4)
Q (3)
1 1 1 Por exemplo, suponha que a cor cinza, dada por Q = ( 3 , 3 , 3 ), esteja contida nesse menor conjunto convexo, e gostar amos de determinar as quantidades x1 , x2 , x3 e x4 das cores Q(1) , Q(2) , Q(3) e Q(4) que produzam 1 litro da cor cinza Q. Isso nos d a quatro equa c oes lineares nas inc ognitas x1 , x2 , x3 e x4 :
qR x1 (1) qG x1 (1) qB x1 x1
(1)
+ qR x2 (2) + qG x2 (2) + qB x2 + x2
(2)
+ qR x3 (3) + qG x3 (3) + qB x3 + x3
(3)
+ qR x4 (4) + qG x4 (4) + qB x4 + x4
(4)
= = = =
1 3 1 3 1 3
1.5
Interpola c ao polinomial
Imagine que queiramos passar um polin omio quadr atico (isto e, uma par abola) pelos pontos (x1 , y1 ), (x2 , y2 ) e (x3 , y3 ), desde que x1 , x2 e x3 sejam todos diferentes entre si.
p(x) y1 x2 x1 y2 x3 y3
Um polin omio quadr atico e escrito, na sua forma geral, como p(x) = ax2 + bx + c . Como neste problema nosso objetivo e determinar o polin omio quadr atico, as inc ognitas s ao os tr es coecientes a, b e c. Para encontrar as inc ognitas dispomos de tr es equa c oes, pois o gr aco do polin omio deve passar pelos tr es pontos dados: p(x1 ) = y1 , p(x2 ) = y2 e p(x3 ) = y3 . Explicitando as equa c oes, camos com ax2 1 + bx1 + c = y1 ax2 2 + bx2 + c = y2 ax2 3 + bx3 + c = y3
16
e reescrevendo-as evidenciamos o car ater de sistema linear do problema: x2 1 a + x1 b + c = y1 x2 2 a + x2 b + c = y2 x2 3 a + x3 b + c = y3 Nem e preciso dizer que o mesmo tipo de problema se generaliza para um n umero qualquer n de pontos. Sejam os pares (x1 , y1 ), . . . , (xn , yn ), com os xi s distintos dois a dois. Queremos achar um polin omio p(x) cujo gr aco passe pelos pontos dados, isto e: p(x1 ) = y1 , p(x2 ) = y2 , . . . , p(xn ) = yn .
yn y y n1 x1 x2 y2 xn1 xn
1
Se procurarmos por um polin omio de grau k teremos k + 1 coecientes a determinar. Como temos que satisfazer n equa c oes, isso sugere que xemos k = n 1. Assim, temos o sistema de n equa c oes, onde os coecientes s ao as n inc ognitas: a0 a0 . . . a0 + + x1 a1 x2 a1 . . . + + x2 1 a2 x2 2 a2 . . . + ... + ... . . . + ...
n1 + x1 an1 n1 + x2 an1 . . . n1 an1 + xn
= =
+ xn a1
+ x2 n a2
= = yn
y1 y2 . . .
Podemos nos perguntar se sempre existe solu c ao para esse sistema, e se ela eu nica. A resposta e sim (desde que os xi s sejam distintos entre si, mas veremos a justicativa mais adiante, na Se c ao A.7. Exerc cio 1.1 Ache o u nico polin omio de grau 3 passando pelos pontos (1, 0), (0, 1), (3, 1) e (4, 0). Exerc cio 1.2 Encontre o polin omio interpolador para os pontos (1, 5), (0, 1), (3, 19) e (4, 45).
1.6
Outros problemas de determina c ao de polin omios
Outro problema de interpola c ao polinomial que pode ser reduzido a um sistema linear ocorre quando s ao impostas condi c oes nas derivadas do polin omio, em determinados pontos. A id eia ca mais clara a partir do seguinte exemplo.
1.7. SPLINES
17
Problema: achar um polin omio tal que p(1) = 1, p(3) = 0, p (1) = 0 e p (3) = 0. Isto e, xa-se o valor e a derivada de p em dois pontos, o que d a 4 equa c oes. Com um polin omio de grau 3, ca-se com 4 inc ognitas. Explicitamente, se p(x) = a0 + a1 x + a2 x2 + a3 x3 , ent ao as 4 equa c oes se transformam em a0 a0 + a1 3a1 a1 a1 + a2 + 9a2 2a2 + 6a2 + + + a3 27a3 3a3 27a3 = = = = 1 0 0 0
Tamb em pode-se impor alguma condi c ao de integral denida para o polin omio. Por exemplo, se p(x) = ax2 + bx + c e polin omio de grau 2 e sabemos que
2
p(x)dx = 3 ,
1
isso nos d a uma equa c ao linear, pois

2
p(x)dx
1
= a =
x3 3
2 1
+b
x2 2
2 1
+ cx
2 1
7 3 a+ b+c. 3 2
1.7
Splines
H a tamb em o problema de spline. Dados pontos (x0 , y0 ), . . . , (xn , yn ) (a numera c ao come ca de zero, desta vez) como na gura abaixo com n = 5, achar uma fun c ao que seja: 1. um polin omio c ubico em cada intervalo [xk1 , xk ], com k = 1, . . . , n; 2. igual aos valores especicados yk nos pontos xk ; 3. duas vezes diferenci avel e com derivada segunda cont nua, inclusive nos pontos extremos dos intervalos (em particular, a fun c ao tamb em deve ser diferenci avel); 4. com derivada zero nos extremos (ou com valores especicados da derivada nos extremos).
x0
x1
x2
x3
x4
x5
18
Nesse problema temos que achar n polin omios c ubicos (um para cada intervalo), e s ao portanto 4n inc ognitas (quatro coecientes de cada polin omio). Ser a que temos 4n equa c oes tamb em? Vejamos. Chamaremos de p1 (x), . . . , pn (x) os polin omios, sendo que o polin omio pk (x) corresponde ao intervalo [xk1 , xk ]. Temos que impor os valores extremos p1 (x0 ) = y0 , pn (xn ) = yn (no desenho, y0 e yn s ao iguais a zero). J a temos duas equa c oes. Al em disso, devemos impor a segunda condi c ao especicada acima, nos demais n odulos (mais 2n 2 equa c oes): p1 (x1 ) = y1 e p2 (x1 ) = y1 , . . . , pn1 (xn1 ) = yn1 e pn (xn1 ) = yn1 . At e agora totalizamos 2n equa c oes. Temos ainda que impor as derivadas nos extremos (zero neste caso): p 1 (x0 ) = 0 , pn (xn ) = 0 , e tamb em a continuidade da derivada em cada n odulo:
p 1 (x1 ) = p2 (x1 ) , . . . , pn1 (xn1 ) = pn (xn1 ) ,
perfazendo mais n + 1 equa c oes. Finalmente, temos que impor tamb em a continuidade da segunda derivada nos n odulos, com mais n 1 equa c oes:
p 1 (x1 ) = p2 (x1 ) , . . . , pn1 (xn1 ) = pn (xn1 ) .
Ao todo s ao 4n equa c oes! poss E vel mostrar que o sistema da resultante sempre tem u nica solu c ao. Exerc cio 1.3 Monte o sistema linear relativo ao spline dos pontos da gura, com os seguintes dados: k 0 1 2 3 4 5 xk 3.0 1.4 0.0 1.5 2.5 4.0 yk 0.0 0.7 2.0 2.5 1.0 0.0
Exerc cio 1.4 Fa ca um spline c ubico com os pontos (1, 0), (0, 1) e (1, 0), com derivada zero nos extremos.
1.8
Problemas de contorno
O problema do equil brio termost atico (ou tamb em do eletrost atico) e outro exemplo de redu c ao a um sistema linear.
1.8. PROBLEMAS DE CONTORNO
19
Suponha uma situa c ao como a mostrada na gura ao lado, com tr es fontes de calor: 1. O entorno do quadrado, ` a temperatura Ta 2. O quadrado inclinado, ` a temperatura Tb 3. A barra, ` a temperatura Tc A quest ao e: como se distribuir a a temperatura, no equil brio, em fun c ao da posi c ao (x, y )?
Tb
Ta
(x,y) T(x,y)
Tc
O mesmo problema pode ser formulado com um potencial eletrost atico V (x, y ), ao inv es da temperatura, se nas regi oes mostradas x assemos valores Va , Vb e Vc . Na verdade, os valores Ta , Tb , Tc nem precisariam ser xos: poderiam variar conforme a posi c ao. Esse problema e modelado pela equa c ao de Laplace 2T 2T + =0, x2 y 2 signicando que devemos procurar uma fun c ao cont nua T (x, y ) cujo valor sobre as fontes seja aquele pr e-determinado e tal que fora delas satisfa ca essa equa c ao.
Tb
Ta
Tc
Para obter uma solu c ao num erica, discretizamos o plano (x, y ) com uma rede quadrada, como mostra a gura ao lado. Em seguida, numeramos os v ertices da malha cujas temperaturas n ao est ao xadas, em qualquer ordem (por exemplo, adotamos da esquerda para a direita, e de cima para baixo).
Na posi c ao i queremos determinar a temperatura Ti , no equil brio. Se forem N v ertices, ser ao N inc ognitas T1 , T2 , . . . , TN a determinar. A equa c ao de Laplace, quando discretizada, se traduz no fato de que a temperatura de equil brio na posi c ao i tem que ser igual ` a m edia
20
da temperatura nos quatro vizinhos imediatos (na vertical e horizontal). Para cada v ertice, isso se traduzir a numa equa c ao (linear), e a reuni ao de todas essas equa c oes formar a um sistema linear de N equa c oes e N inc ognitas. A solu c ao do sistema assim obtido ser a uma aproxima c ao da distribui c ao de temperatura.
1111111111111111111111111111111111 0000000000000000000000000000000000
Vejamos um exemplo, com uma grade de poucos v ertices. O desenho da gura ao lado mostra uma grade 9 8. Chamaremos de N o n umero de linhas (no exemplo, N = 9) e M o n umero de colunas (no exemplo, M = 8). Na grade xamos Ta nas posi c oes (4, 4), (5, 3), (5, 4), (5, 5) e (6, 4) (embora a posi c ao interna (5, 4) n ao v a servir para nada), e Tb nas posi c oes (1, s) e (9, s), para s = 1, . . . , 8, e (r, 1), (r, 8), para r = 1, . . . , 9. Veja que estamos usando r para indexar as linhas e s para indexar as colunas.
0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1
1 1 2 3 4 5 6 7 8 9
1 0 1 0 1 0 1 0 0 1 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 0 1 1 0 0 1 0 1 1 0 0 1 0 1
2
1 0 1 0
3
1 0 1 0
4
11 00 11 00
5
11 00 11 00
6
1 0 1 0
7
1 0 1 0
8
1 0 1 0 1 0 1 0 0 1 1 0 0 1
Tb
00 11 11 00 00 11 00 11 11 00 00 11 11 00 00 11 11 00 00 11 00 11
Ta
0 1 1 0 0 1 1 0 1 0 1 0 0 1 1 0 0 1 0 1 1 0 0 1 0 1
00 11 11 00 00 11
1 0 0 1 0 1
1 0 0 1 0 1
11 00 00 11 00 11
11 00 00 11 00 11
1 0 0 1 0 1
1 0 0 1 0 1
1 0 0 1 0 1
A discretiza c ao da equa c ao de Laplace signica que, nos v ertices em que a temperatura n ao foi xada, o valor da temperatura ser a dado pela m edia dos valores dos quatro v ertices mais pr oximos. Numeraremos esses v ertices da seguinte forma: da esquerda para a direita e de cima para baixo (como na leitura de um texto em portugu es), e para o v ertice i queremos saber a temperatura de equil brio Ti . Assim, para o primeiro v ertice, teremos T1 = 1 (T b + T b + T 2 + T 7 ) , 4
pois o vizinho de cima e o vizinho ` a esquerda t em valor xo Tb e os vizinhos ` a direita e embaixo s ao as inc ognitas T2 e T7 . Rearranjando a equa c ao temos 4T1 T2 T7 = 2Tb . Na gura, vemos que h a 37 v ertices livres, portanto 37 inc ognitas T1 , T2 , . . . , T37 a serem determinadas. Por em cada v ertice livre produz uma equa c ao, donde resulta um sistema linear com 37 equa c oes e 37 inc ognitas.
T T Exerc cio 1.5 Discretizar e resolver a equa ca o x2 + y 2 = 0 no quadrado [0, 1] [0, 1] com 2 condi ca o de contorno dada por T (x, 0) = x e T (x, 1) = x2 1 para 0 x 1 e T (0, y ) = y 2 e T (1, y ) = 1 y 2 , para 0 y 1. Divida o intervalo [0, 1] em N = 3 subintervalos de mesmo comprimento. Compare sua solu ca o com a solu ca o exata T (x, y ) = x2 y 2 .
2 2
Exerc cio 1.6 Fa ca o mesmo exerc cio com a fun ca o T (x, y ) = xy .
Cap tulo 2
O M etodo de Escalonamento
2.1 O m etodo
Nesta Se c ao discutiremos um m etodo de resolu c ao de sistemas lineares, chamado M etodo do Escalonamento ou M etodo de Elimina c ao de Gauss. O m etodo se baseia, em primeiro lugar, no fato de que um sistema triangularizado como abaixo tem f acil solu c ao: a11 x1 + a12 x2 a22 x2 + a13 x3 + a23 x3 a33 x3 + ... + ... + ... + + + a1n xn a2n xn a3n xn ann xn = = = . . . b1 b2 b3
= bn
Na verdade, e tanto necess ario quanto suciente que todos os coecientes na diagonal sejam n ao-nulos para que se explicite a solu c ao de forma u nica (se um dos termos da diagonal for nulo ent ao haver a vari aveis livres e uma innidade de solu c oes). A solu c ao, nesse caso, se obt em a partir da u ltima equa c ao. Primeiro, isola-se xn : xn = A pen ultima equa c ao e an1,n1 xn1 + an1,n xn = bn1 , ent ao xn1 = 1 an1,n1 (bn1 an1,n xn ) . 1 bn . ann
Como xn j a foi determinado, da equa c ao acima determina-se tamb em xn1 . E assim por diante, at e se conseguir o valor de x1 . Um sistema triangularizado torna-se ent ao o objetivo do m etodo. Para ser mais preciso, pretende-se obter um sistema linear triangularizado equivalente ao original. Aqui entenderemos que dois sistemas lineares s ao equivalentes se eles possuem exatamente as mesmas solu c oes, ou seja: se um conjunto de n umeros x1 , . . . , xn e solu c ao de um sistema ent ao automaticamente ser a solu c ao do outro. 21
22
CAP ITULO 2. O METODO DE ESCALONAMENTO
Pode-se trocar um sistema linear por outro equivalente atrav es do seguinte processo. Escolhem-se duas linhas, a linha i e a linha j , e no lugar da linha j coloca-se uma linha que seja combina c ao linear da linha i com a linha j , exceto que essa combina c ao linear n ao pode ser somente a linha i (sen ao a informa c ao sobre a linha j desaparece, o que pode tornar o sistema indeterminado). Mais precisamente, o sistema linear a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 . . . an1 x1 + an2 x2 + . . . + ann xn = bn passa a ter, no lugar da linha j , a seguinte linha: (aj 1 + ai1 )x1 + . . . + (ajn + ain )xn = bj + bi , evidente que onde = 0, para que a linha j n ao seja meramente substitu da pela linha i. E qualquer solu c ao do sistema linear original ser a solu c ao do sistema linear alterado. Ser a que vale o inverso? De fato, sim. Se os n umeros x1 , . . . , xn formam uma solu c ao do sistema alterado, ent ao j a garantimos que esses n umeros satisfazem todas as equa c oes do sistema original, exceto possivelmente a equa c ao j . Acontece que subtraindo da linha alterada a linha i multiplicada por vemos que a linha j e automaticamente satisfeita, contanto que = 0. O essencial nesse truque e que podemos controlar e de forma que a linha substituta tenha um zero em certa posi c ao. Por exemplo, suponha que na linha i o termo aik (k - esima coluna) seja diferente de zero. Com isso, podemos substituir a linha j por uma linha em que na k - esima coluna o coeciente seja nulo. Basta colocar a linha 1 (linha j ) Assim, o k - esimo coeciente ser a ajk ajk aik = 0 . aik ajk (linha i) . aik
Usando judiciosamente essa opera c ao podemos ir substituindo as linhas, uma por uma, at e chegar a um sistema triangularizado equivalente ao original. Antes de explicar o procedimento, no entanto, convencionemos uma forma mais f acil de escrever o sistema linear: a forma matricial. Nessa forma de escrever, s o colocamos o que realmente interessa no sistema linear: os coecientes. Numa matriz de n linhas e n + 1 colunas colocamos todos eles, deixando a u ltima coluna para os termos independentes (e em geral separando essa coluna das demais para n ao haver confus ao): a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 . . . . . . . . . . . . . . . an1 an2 . . . ann bn
2.1. O METODO
23
Uma observa c ao importante que devemos fazer neste ponto da exposi c ao e que a ordem das linhas n ao importa na montagem da equa c ao, pois as linhas s ao as equa c oes, e todas as equa c oes devem ser satisfeitas ao mesmo tempo. J a a ordem das colunas e importante, pois a primeira coluna representa os coecientes da inc ognita x1 , a segunda representa os coecientes da inc ognita x2 , etc. Se quisermos trocar a ordem das colunas, teremos antes que renumerar as inc ognitas! O procedimento de escalonamento funciona assim. Primeiramente vericamos se a11 = 0. Se n ao for, procuramos alguma linha cujo primeiro coeciente seja diferente de zero e a trocamos de posi c ao com a primeira. Se n ao houver nenhuma linha cujo primeiro coeciente seja n ao-nulo ent ao x1 n ao entra no sistema linear e pode ser, a princ pio, qualquer. Al em disso, percebe-se que de fato o sistema linear envolve apenas n 1 inc ognitas em n equa c oes, havendo grande chance de n ao ter solu c ao. De qualquer forma, se isso acontecer n ao haver a nada a ser feito nessa primeira etapa e poderemos passar imediatamente ` a etapa seguinte. O objetivo da primeira etapa e usar o fato de que a11 = 0 para trocar uma a uma as linhas de 2 a n por linhas cujo primeiro coeciente seja nulo, usando o truque descrito acima. Ou seja, a j - esima linha (j = 2, . . . , n) ser a substitu da pela linha (linha j) aj 1 (linha 1) . a11
O sistema linear car a ent ao da seguinte forma: a11 a12 . . . a1n 0 a22 . . . a2n . . . . . . . . . . . . 0 an2 . . . ann
b1 b2 . . . bn
onde e preciso lembrar que, por causa das opera c oes com linhas, os coecientes n ao s ao os mesmos do sistema linear original! Nessa primeira etapa descrita, o n umero a11 e chamado de piv o. Em cada etapa haver a um piv o, como veremos adiante. Vimos que o piv o tem que ser necessariamente diferente de zero, o que pode ser conseguido atrav es de uma troca de linhas. De fato, e poss vel at e escolher o piv o, dentre os v arios n umeros da primeira coluna que sejam diferentes de zero. Na maioria das situa c oes em que se resolve um sistema linear por este m etodo, atrav es de calculadora ou computador, e mais vantajoso, sob o ponto de vista dos erros de c alculo originados de arredondamentos (veja discuss ao mais adiante), escolher o piv o como sendo o maior dos n umeros dispon veis na coluna. Aqui entende-se por maior n umero aquele que tem o maior valor absoluto dentro da coluna. Esse procedimento e chamado de condensa ca o pivotal. Na segunda etapa, vericamos se a22 = 0. Se n ao for, procuramos entre as linhas abaixo da segunda alguma cujo segundo coeciente seja n ao-nulo. Se n ao houver, passamos diretamente para a terceira etapa. Se houver, trocamos a linha encontrada com a segunda linha. Observe que a primeira linha n ao ser a mais alterada, nem trocada de posi c ao com outras. Aqui o piv o ser a o n umero diferente de zero da segunda coluna, escolhido entre a segunda linha e a u ltima. Mais uma vez, pode-se adotar a condensa c ao pivotal, tomando como piv o o maior em valor absoluto.
24
Se ap os a troca tivermos a22 = 0, podemos usar nosso truque para zerar todos os segundos coecientes desde a linha 3 at eau ltima linha. Trocaremos cada linha j = 3, . . . , n pela linha (linha j) aj 2 (linha 2) , a22
e caremos com um sistema linear da forma a11 a12 a13 0 a22 a23 0 0 a33 . . . . . . . . . 0 0 an3
... ... ... . . . ...
a1n a2n a3n . . . ann
b1 b2 b3 . . . bn
lembrando mais uma vez que os coecientes s ao diferentes em rela c ao ` a etapa anterior, exceto os da primeira linha, que cam inalterados. f E acil ver que em n 1 etapas teremos um sistema linear triangularizado que, como j a observamos acima, pode ser facilmente resolvido.
2.2
Algarismos signicativos
x e a k - esima casa decimal, A mantissa de x, de ordem k , e a representa c ao decimal de 10 n at com arredondamento. Em geral as calculadoras usam k > 6, e computadores mais modernos podem usar co para minha calculadora o valores bem mais altos. Por exemplo, quando pe valor de 50000 ela me responde 223.6067977 e tal que Observe que x = 50000
Em geral recorremos a um computador, ou no m nimo usamos uma calculadora, quando se trata de resolver sistemas lineares razoavelmente grandes. Por exemplo, dicilmente nos aventurar amos na resolu c ao ` a m ao do problema de contorno da Se c ao 1.8, que resulta num sistema linear de 37 inc ognitas. E isso e pouco: imagine uma grade bem mais na! A solu c ao de um sistema linear pelo M etodo do Escalonamento e exata, na medida em que o resultado nal pode ser expresso em termos de fra c oes envolvendo os coecientes do sistema linear original. No entanto, calculadoras e computadores n ao trabalham dessa forma. Num computador ou numa calculadora cient ca os n umeros s ao representados em ponto utuante, baseados na nota c ao decimal (internamente pode ser em outra base, mas o que nos aparece e, em geral, a nota c ao decimal). Na nota c ao de ponto utuante, um n umero tem um expoente e uma mantissa. Se x e um n umero real, seu expoente ser a o n umero inteiro n tal que 10n1 x < 10n .
102 x < 103 , portanto o expoente e n = 3 nesse exemplo. Ent ao x 0.2236067977 103 .
2.2. ALGARISMOS SIGNIFICATIVOS A mantissa de x de ordem 10 e o n umero 0.2236067977
25
As m aquinas trabalham com um tamanho xo para a mantissa: na calculadora que eu usei, esse tamanho e 10. A ordem k da mantissa que escolhemos para operar com um n umero e tamb em chamada de n umero de algarismos signicativos. Antes de discorrermos sobre como fazer opera c oes aritm eticas com n umeros nessa representa c ao (a chamada aritm etica de ponto utuante), vejamos como se d a o processo de arredondamento. Suponha que um n umero x se escreva da seguinte forma, na nota c ao decimal: x = Np Np1 . . . N1 N0 .N1 N2 N3 . . . , onde Np , . . . , N0 , N1 , N2 , . . . s ao os algarismos da nota c ao, de fato n umeros entre 0 e 9, j a ` direita a seq que se trata de representa c ao na base 10. A u encia dos Ni s pode ser innita (e inclusive h a n umeros que podem ser escritos de duas formas diferentes, por exemplo 0.999 . . . = 1.000 . . .). Assumiremos que ela seja sempre innita, pois mesmo que n ao seja podemos torn a-la completando a seq u encia com zeros. Essa nota c ao representa uma s erie innita, isto e, uma soma de innitos termos: x = Np 10p + Np1 10p1 + . . . + N1 101 + N0 100 + N1 101 + N2 102 + . . . Mesmo sem estarmos familiarizados com s eries, podemos entender o n umero x da seguinte forma: x est a entre Np 10p e (Np + 1) 10p , mas tamb em est a entre Np 10p + Np1 10p1 e Np 10p + (Np1 + 1) 10p1 , e assim por diante. Se quisermos arredondar na k - esima casa decimal depois da v rgula, observamos primeiramente que x e maior ou igual a Np 10p + . . . + N1 101 + N0 + N1 101 + . . . + Nk 10k e menor do que Np 10p + . . . + N1 101 + N0 + N1 101 + . . . + (Nk + 1) 10k , e, para simplicar a nota c ao, deniremos X = Np 10p + . . . + N1 101 + N0 + N1 101 + . . . + Nk+1 10k+1 , de forma que X + Nk 10k x < X + (Nk + 1) 10k . Para obter o arredondamento de x na k - esima casa decimal, que denotaremos por x , precisamos saber se x est a mais pr oximo de X + Nk 10k ou de X + (Nk + 1) 10k . Isso e determinado pelo algarismo seguinte na expans ao decimal de x, isto e, Nk1 . Podemos seguir a regra: se Nk1 = 0, 1, 2, 3, 4, ent ao x = X + Nk 10k ; j a se Nk1 = 5, 6, 7, 8, 9 ent ao x = X + (Nk + 1) 10k . No segundo caso e preciso tomar cuidado ao se voltar para a nota c ao decimal. Se 0 Nk 8, ent ao x = Np . . . N0 .N1 . . . Nk+1 (Nk + 1) .
26
Se, no entanto, Nk = 9, teremos Nk + 1 = 10. Isso faz com que no lugar de Nk + 1 coloquemos um zero e somemos 1 ao algarismo precedente, Nk+1 . Mas se Nk+1 for tamb em igual a 9, ent ao trocamos esse n umero por um zero e somamos 1 ao precedente, at e isso n ao mais acontecer. Por exemplo, o arredondamento de 1.5769996 para a sexta casa decimal e 1.577000. Agora voltemos ` a quest ao das opera c oes aritm eticas. No mundo das m aquinas, elas devem ser feitas sempre respeitando um certo n umero pr e-xado de algarismos signicativos. Para entender bem, nada melhor do que alguns exemplos. Digamos que se queira efetuar a opera c ao 2.236 + 12.448, com 4 algarismos signicativos. O primeiro n umero j a est a escrito com 4 algarismos signicativos, pois 2.236 = 0.2236 101 , mas o seguinte n ao, pois 12.448 = 0.12448 102 . Ent ao arredondamos o segundo para que que com 4 algarismos signicativos, resultando 0.1245 102 , ou 12.45, e fazemos a soma: 12.45 + 2.236 = 14.686. A soma, no entanto, tem 5 algarismos signicativos, logo somos obrigados a arredondar o resultado: 14.69. Observe que ter amos obtido um n umero ligeiramente diferente se n ao houv essemos arredondado 12.448 para 12.45, pois 2.236 + 12.448 = 14.684 que, arredondado, ca 14.68. f E acil ver que haver a um ac umulo de erro se um grande n umero de opera c oes aritm eticas for efetuado em cadeia. Vejamos um exemplo de subtra c ao: queremos subtrair 0.122 de 943 com 3 algarismos signicativos. Isso d a 943, ap os arredondamento. Da pode-se ver que em alguns casos a ordem das opera c oes de adi c ao e subtra c ao pode ser importante. Por exemplo, (943 0.122) 0.405 = 943 0.405 = 943 , mas preciso tomar bastante cuidado com subtra E c oes e somas de n umeros com expoentes d spares, principalmente se essas opera c oes forem feitas em grande n umero. Sen ao corremos o risco de subtrair 9430 vezes o n umero 0.1 de 943 e continuar com 943, ao inv es de obter zero!! Tamb em deve-se tomar cuidado com a subtra c ao de n umeros muito parecidos, cuja diferen ca se encontre al em dos d gitos signicativos, pois pode-se obter um zero onde deveria haver um n umero simplesmente muito pequeno! Como regra geral, cada opera c ao deve ser feita (se poss vel com mais algarismos do que os signicativos, o dobro em geral) e o resultado da opera c ao arredondado. O mesmo vale para as opera c oes de multiplica c ao e divis ao. Por exemplo, 5.35/7.22, com 3 algarismos signicativos, d a 0.741 (conra!). Para ilustrar, fa camos o escalonamento e a resolu c ao de um sistema linear de ordem 3, usando 3 algarismos signicativos. Este exemplo servir a para ilustrar como, em linhas gerais, se d a a resolu c ao de um sistema por um programa de computador. Evidentemente um bom programa (h a alguns j a prontos para uso) tratar a de minimizar o quanto for poss vel os erros de arredondamento causados pelo n umero limitado de algarismos signicativos. Aqui, ao contr ario, tentaremos levar ao p e da letra a regra de arredondar ap os cada opera c ao. A regra s o n ao ser a muito clara sobre a ordem de seguidas adi c oes ou multiplica c oes: neste caso, faremos o arredondamento ap os todas as adi c oes (ou multiplica c oes). Ap os o exemplo, sugerimos ao leitor, como exerc cio, que implemente no computador, usando alguma linguagem (C, Pascal, Fortran, Basic, etc), um programa que resolva sistemas 943 (0.122 + 0.405) = 943 0.527 = 942 .
2.2. ALGARISMOS SIGNIFICATIVOS
27
13 que tem apenas coecientes inteiros. Ele tem solu c ao exata (x1 , x2 , x3 ) = ( 9 2 , 2 , 3), que pode ser obtida por escalonamento tamb em, sem arredondamento (mantendo fra c oes). N ao h a arredondamentos a fazer, no princ pio, porque todos os coecientes s ao inteiros com 1 algarismo signicativo. O 3 da primeira coluna serve como piv o, pois e maior do que os demais coecientes da mesma coluna. A primeira etapa consiste em subtrair da segunda e da terceira linha m ultiplos convenientes da primeira para que s o reste o 3 como coeciente 1 n ao nulo. Para a segunda linha, o m ultiplo tem que ser 3 = 0.333, enquanto que para a terceira linha ele tem que ser 2 ultiplos de multiplicadores. 3 = 0.667. Chamaremos esses m O leitor pode achar estranho que 1 0.333 3 = 1 0.999 = 0.001, o que faz com que de fato o primeiro coeciente da segunda linha n ao se anule. Isso ser a ignorado na hora de se fazer o escalonamento. Observe que a escolha do multiplicador como 0.334 n ao ajudaria a resolver o problema. A u nica solu c ao seria n ao arredondar o multiplicador antes de fazer a conta, mas nem sempre e isso o que acontece num programa. Dessa primeira etapa sai o sistema 1 3 1 2 0 0.667 0.666 2.33 , 0 1.33 2.33 1.67
lineares de qualquer ordem (que a ordem seja apenas limitada por problemas de falta de mem oria, por exemplo). Considere o sistema 1 3 1 2 , 1 1 0 2 2 2 1 1
1 ao permutamos com vetor de permuta c ao de linhas p = 2 , indicando que nesta etapa n 3 conveniente armazenar os multiplicadores no lugar onde os zeros da as linhas do sistema. E elimina c ao apareceram: 3 1 2 1 0.333 0.667 0.666 2.33 . 1.33 2.33 1.67 0.667
Repare que os multiplicadores da primeira etapa tamb em foram trocados, acompanhando as linhas em que atuaram. Para a terceira linha, usa-se o multiplicador 0.667 = 0.502 , 1.33
Olhando para a segunda coluna, nota-se que a terceira linha deve servir como piv o, pois 1.33 e maior do que 0.667. Ent ao faz-se a troca da segunda linha com a terceira, cando 3 1 2 1 0.667 1.33 2.33 1.67 . 0.333 0.667 0.666 2.33
28 e da temos
1 2 2.33 1.67 . 0.504 1.49 1 com vetor nal de permuta c ao de linhas p = 3 . Portanto 2 3 0.667 0.333 1 1.33 0.502 x3 =
1 6.44 2 2.96 13.4 = = 4.47 . 3 3 Observe que n ao e preciso, quando se for dividir por 3, calcular 1 3 , arredondar e depois multiplicar pelo numerador. A divis ao e considerada uma opera c ao elementar. Comparando com a solu c ao exata, podemos ver que o maior erro absoluto foi de 0.06. Mais adiante, na Subse c ao 2.5.3, veremos como melhorar o c alculo, usando o renamento de solu c oes. x1 = Exerc cio 2.1 Fa ca as contas intermedi arias do exemplo acima. Resolva o sistema do exemplo acima usando apenas 2 algarismos signicativos. Exerc cio 2.2 Implemente a resolu ca o por escalonamento no computador. Exerc cio 2.3 Resolva o sistema linear 7.01 0.031 com 3 algarismos signicativos. Exerc cio 2.4 Considere o circuito el etrico da gura abaixo, no qual R1 = 6, R2 = 4, R3 = 4, R4 = 1, U1 = 19V , U2 = 6V e U3 = 2V . Utilizando a Lei de Kircho (a soma das diferen cas de potenciais em qualquer loop de um circuito e igual a zero) e a Lei de Ohm (a diferen ca de potencial, V , resultante em um resistor de resist encia R, devido a ` passagem de corrente el etrica I , e V = RI ), obtenha um sistema linear cujas vari aveis s ao os valores das correntes I1 , I2 e I3 . Utilize o m etodo de Gauss para resolver o sistema obtido considerando aritm etica de ponto utuante com dois algarismos signicativos. 2.52 0.789 10.1 2.6
1.49 = 2.96 , 0.504 1.67 + 2.33 2.96 1.67 + 6.90 8.57 x2 = = = = 6.44 1.33 1.33 1.33
I1 19V U1
R1 6 4
R4 I3 U2
R3 4 2V
I2 U3
R2 6V
2.3. O DETERMINANTE NO METODO DE ESCALONAMENTO Exerc cio 2.5 Dado o sistema linear Ax = b onde 4.3 4.2 1.1 0.70 A = 0.90 2.4 0.70 3.4 0.10
29
resolva-o pelo M etodo de Elimina ca o de Gauss com condensa ca o pivotal, utilizando aritm etica de ponto utuante e 2 algarismos signicativos. N ao esque ca de arredondar ap os cada opera ca o aritm etica.
3.4 b = 2.1 3.3
2.3
O determinante no M etodo de Escalonamento
Observemos em primeiro lugar que as propriedades do determinante1 de uma n-upla de vetores (u1 , . . . , un ) de Rn (normaliza c ao, altern ancia e linearidade) podem ser formuladas diretamente para uma matriz A: 1) det(Id) = 1; 2) a troca de duas colunas faz mudar o sinal do determinante; e 3) se uma coluna se escreve como combina c ao u + v , ent ao o determinante e a soma de vezes o determinante da mesma matriz com a coluna u + v trocada por u com vezes o determinante da mesma matriz com a coluna u + v trocada por v . Por exemplo, suponha que queiramos calcular det(u1 , u2 , . . . , uj + ui , . . . , un ) , que, em termos matriciais, signica somar um m ultiplo da i- esima coluna ` a j - esima coluna. Pelas propriedades do determinante, det(u1 , u2 , . . . , uj + ui , . . . , un ) = det(u1 , u2 , . . . , uj , . . . , un ) , logo o determinante n ao se altera quando somamos a uma coluna um m ultiplo de uma outra. Em seguida, ressaltamos que as mesmas propriedades s ao v alidas com linhas ao inv es de colunas. Isso porque n ao e dif cil mostrar que a transposta de A, denotada por AT , que e a matriz A onde se trocam colunas por linhas, tem o mesmo determinante que A. Logo as propriedades de det A em rela c ao a suas linhas s ao as mesmas que det AT = det A em rela c ao a suas colunas. Portanto todas as opera co es realizadas no M etodo de Escalonamento n ao alteram o determinante da matriz de coecientes, exceto as trocas de linhas, feitas por conta da condensa c ao pivotal, pois cada troca de linha muda o sinal do determinante. Por outro lado, o resultado nal do escalonamento e uma matriz triangular, cujo determinante e dado pelo produto dos coecientes da diagonal. Ent ao o determinante do sistema ser a zero se e somente se ap os o escalonamento houver um termo nulo na diagonal, e nesse caso o sistema ser a imposs vel ou indeterminado. Isto completa o argumento da Subse c ao A.8.3, onde quer amos provar que se A tem inversa ent ao det A = 0. Pois se A tem inversa, segue que o sistema tem u nica solu c ao e todos os termos da diagonal s ao n ao-nulos, e por conseguinte o determinante do sistema tamb em e n ao-nulo.
1 Veja
A.8
30
2.4
A desvantagem da Regra de Cramer
A Regra de Cramer e uma f ormula bastante pr atica de se resolver Au = b, usando a no c ao de determinante. Suponha que det A = 0. Nesse caso, existe u nica solu c ao u = (x1 , . . . , xn ) para Au = b, mas quais s ao os valores de x1 , . . . , xn ? Note que se trocarmos a i- esima coluna pelo vetor b e calcularmos o determinante da matriz resultante teremos det(. . . , Aei1 , b, Aei+1 , . . .) = det(. . . , Aei1 , x1 Ae1 + . . . + xn Aen , Aei+1 , . . .) , pois b = Au = x1 Ae1 + . . . + xn Aen , pela linearidade de A. Pela linearidade do determinante, podemos separ a-lo na soma de n determinantes, onde em cada um deles teremos na i- esima posi c ao um dos vetores xj Aej . No entanto, apenas o determinante com xi Aei ser a n ao-nulo: det(. . . , Aei1 , b, Aei+1 , . . .) = det(. . . , Aei1 , xi Aei , Aei+1 , . . .) . Mais uma vez pela linearidade, podemos tirar o escalar xi , que car a multiplicado pelo pr oprio determinante da matriz A: det(. . . , Aei1 , b, Aei+1 , . . .) = xi det A . Logo xi = det(. . . , Aei1 , b, Aei+1 , . . .) , det A
que e a Regra de Cramer. A desvantagem da Regra de Cramer e que o n umero de opera c oes necess arias para se chegar ` a solu c ao e em geral muito maior do que no M etodo de Escalonamento. Essa compara c ao e feita assim: calcula-se o n umero de opera c oes aritm eticas necess arias em cada m etodo em fun c ao do tamanho n do sistema linear. Ent ao v e-se que num m etodo esse n umero cresce muito mais rapidamente com n do que no outro. Para facilitar a compara c ao, ignoraremos as instru c oes de controle de uxo que seriam necess arias caso os m etodos fossem implementados num computador. Um n umero de opera c oes aritm eticas muito grande e desvantajoso por duas raz oes: aumenta o tempo de computa c ao e aumenta a propaga c ao dos erros de arredondamento. O n umero de produtos de n termos que aparecem no c alculo de um determinante e n! (mostre isso), ou seja, s ao n! opera c oes de adi c ao. Para obter cada produto s ao n 1 multiplica c oes, totalizando n!(n1) opera c oes de multiplica c ao. Para calcular as n inc ognitas, a Regra de Cramer pede n + 1 determinantes, logo s ao n!(n + 1) adi c oes e n!(n 1)(n + 1) multiplica c oes, mais as n divis oes ao nal de tudo. E quanto ao M etodo de Escalonamento, quantas opera c oes aritm eticas ser ao necess arias? Em vez de darmos a resposta sugere-se ao leitor fazer por ele mesmo, como indicado no seguinte exerc cio. Exerc cio 2.6 Mostre que o n umero de adi co es/subtra co es, multiplica co es e divis oes necess arias para se completar o M etodo de Escalonamento num sistema linear de n equa co es e n inc ognitas n ao passa de 2n3 , para cada uma delas.
2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO
31
Se quisermos comparar o n umero de opera c oes totais, vemos que na Regra de Cramer s ao necess arias mais do que n! opera c oes. Exerc cio 2.7 Mostre que, quando n e grande ent ao n! e muito maior do que 2n3 . De fato, a raz ao 2n3 n! vai a zero quando n vai a innito. Se voc e mostrou isso com sucesso, ver a ent ao que seu argumento serve para mostrar que, qualquer que seja a pot encia p, a raz ao np n! sempre vai a zero. Verique! Na verdade, devemos tomar um certo cuidado com a maneira pela qual zemos a compara c ao entre os dois m etodos. Se estivermos pensando em tempo de computa c ao, precisamos saber quanto a m aquina gasta para fazer cada uma das opera c oes. A divis ao certamente gasta mais tempo do que as outras opera c oes, e o M etodo de Cramer apresenta menos divis oes (apenas n) do que o M etodo de Escalonamento (cada multiplicador e calculado atrav es de uma divis ao). J a na contabilidade das outras opera c oes o M etodo de Cramer perde do M etodo de Escalonamento, por causa do exerc cio acima. Exerc cio 2.8 Suponha que uma divis ao nunca demore mais do que T vezes uma multiplica ca o, onde T e uma constante qualquer maior do que zero, e a multiplica ca o tome o mesmo tempo que a adi ca o e a subtra ca o. Decida qual dos m etodos e mais vantajoso, sob o ponto de vista de tempo de computa ca o para complet a-lo.
2.5
2.5.1
Sistemas mal-condicionados e renamento de solu c ao

Sistemas mal-condicionados
Na teoria, se um sistema linear Au = b satisfaz det A = 0, ent ao existe uma e s o uma solu c ao u. Na pr atica, por em, quando resolvemos o sistema via computador, erros podem se acumular e a solu c ao se afastar da solu c ao verdadeira. Isso pode ser parcialmente sanado pela Condensa c ao Pivotal, descrita no Cap tulo 2, e pelo M etodo de Renamento, do qual daremos uma id eia abaixo. O principal problema vem do fato de que muitas vezes os coecientes do sistema e os termos independentes s ao retirados de medidas f sicas ou de modelos aproximados. Para alguns sistemas, a solu c ao pode depender sensivelmente de seus coecientes, a ponto de pequenas incertezas em seus valores provocarem grandes altera c oes na solu c ao nal. Esses sistemas s ao chamados de mal-condicionados. Para exemplicar, consideremos o sistema 2 2 x + 99x + x 99.4x + + y 100y y 99.9y = = 1 99.5 ,
que tem solu c ao u nica e exata x = 0.5, y = 0.5. Agora considere o sistema = 1 = 99.2 ,
32
com altera c oes de n ao mais do que 0.5% nos coecientes originais (o que e bastante razo avel para uma medida experimental). Sua solu c ao u nica e exata e x = 1.4, y = 0.4, radicalmente diferente da anterior. Para entender porque isso acontece, experimente o leitor, para cada um dos dois sistemas, desenhar as retas que correspondem a cada uma das equa c oes. Nota-se que o problema e devido ao fato de que as retas correspondentes a cada equa c ao s ao quase paralelas, o que faz com que o ponto de intersec c ao das duas seja muito sens vel a pequenas mudan cas nos coecientes. A id eia vale em dimens oes mais altas, se pensarmos em hiperplanos quase paralelos, no lugar de retas. Podemos tamb em pensar nos vetores-coluna de A (ou nos vetores-linha): se Ae1 , Ae2 , . . . , Aen forem quase linearmente dependentes, ent ao o sistema ser a malcondicionado. Uma maneira de se medir o condicionamento da matriz seria calculando seu determinante (embora muitas vezes s o possamos conhec e-lo depois de escalonar a matriz). O determinante e o hipervolume (com sinal) do hiperparalelep pedo formado pelos vetorescoluna Ae1 , Ae2 , . . . , Aen . Se esses vetores forem quase linearmente dependentes, ent ao o hiperparalelep pedo ser a achatado, e portanto ter a volume pequeno. O argumento s o falha no sentido de que o volume n ao depende somente do grau de achatamento do hiperparalelep pedo, mas tamb em do comprimento de cada vetor. Ent ao uma medida mais con avel seria tomar o hipervolume do hiperparalelep pedo formado pela normaliza c ao desses vetores, isto e, pelos vetores Aei . vi = Aei Esse n umero estar a entre 0 e 1, e quando estiver perto de zero signica que a matriz e mal-condicionada. Em resumo, o n umero de condicionamento pode ser achado assim: (i) substitua cada i coluna Aei da matriz pelo vetor vi = Ae Aei , lembrando que a norma (euclideana) u de um
2 1/ 2 vetor u = (x1 , . . . , xn ) e dada por u = (x2 ; (ii) calcule o valor absoluto do 1 + . . . + xn ) determinante da nova matriz; (iii) observe se o n umero obtido est a pr oximo de zero ou de um: se estiver perto de zero ent ao a matriz A e mal-condicionada. H a outras medidas do condicionamento de uma matriz, assim como h a f ormulas que relacionam o erro cometido no M etodo de Escalonamento com essas medidas e com o n umero de algarismos signicativos utilizados nas contas. Isso tudo no entanto foge ao escopo dessas notas. Al em do mais, medidas de condicionamento s ao dicilmente aplic aveis na pr atica, pois s ao t ao (ou mais) dif ceis de serem obtidas quanto a pr opria solu c ao do sistema linear.
2.5.2
Matrizes de Hilbert
problema do mau condicionamento, sugerimos
Para que o leitor se familiarize melhor com o que acompanhe o seguinte Exemplo. Considere o sistema 1 x2 x1 + 2 1 1 x + 1 3 x2 2 1 1 x + 1 3 4 x2
+ + +
1 3 x3 1 4 x3 1 5 x3
= = =
1 1 1
33
Resolvendo o sistema por escalonamento (sem troca de linhas, pois n ao s ao necess arias para a condensa c ao pivotal), e fazendo contas com fra c oes exatas, obtemos a solu c ao exata (x1 , x2 , x3 ) = (3, 24, 30). Se, por outro lado, usarmos dois algarismos signicativos ( 1 3 = 0.33, por exemplo) e seguirmos exatamente o mesmo procedimento, obteremos (0.9, 11, 17). Com tr es algarismos signicativos, chegaremos em (2.64, 21.8, 27.8), resultado mais pr oximo mas ainda estranhamente longe da solu c ao exata. Matrizes do tipo 1 1 1 1 2 3 n 1 1 1 1 n+1 3 4 2 . . . . . . . . . . . . . . . . 1 1 1 2n1 n n+1 n+2 1
s ao chamadas de matrizes de Hilbert, e aparecem naturalmente no problema do ajuste polinomial, como veremos mais adiante (vide Subse c ao 5.7.2).
2.5.3
Renamento
Uma das maneiras de sanar o problema de se encontrar uma solu c ao ruim, causada pelo mau condicionamento do sistema, e fazer o renamento, que consiste em obter uma solu c ao u de Au = b, mesmo que n ao correta (por causa dos erros de arredondamento), e depois melhor a-la. Para melhorar u , denimos a diferen ca w = u u para a solu c ao verdadeira u, e tentamos calcular w. Como u = u + w, ent ao b = Au = A( u + w) , logo Aw = b Au . Ou seja, a diferen ca w entre u e u e a solu c ao de um sistema linear, onde os termos independentes s ao dados pelo res duo r = b Au e os coecientes s ao os mesmos do sistema linear original (o que facilita as coisas do ponto de vista de programa c ao). Para funcionar, o c alculo de r deveria ser exato, mas sabemos que isso n ao e poss vel, em geral. Calculamos r usando o dobro de algarismos signicativos usados no escalonamento original. O m etodo pode ser implementado assim: calcula-se a primeira solu c ao aproximada u(0) . Calcula-se ent ao w(0) = u u(0) resolvendo-se o sistema Aw(0) = b Au(0) , onde o lado direito e computado em precis ao dupla. Se a solu c ao desse sistema n ao contivesse erros, ent ao u = u(0) + w(0) seria a solu c ao correta. Como erros s ao inevit aveis, u(0) + w(0) pode n ao ser a solu c ao exata, e ser a chamada de u(1) . Calcula-se ent ao w(1) = u u(1) , resolvendo-se Aw(1) = b Au(1) , e em seguida dene-se u(2) = u(1) + w(1) . E assim por diante.
34
CAP ITULO 2. O METODO DE ESCALONAMENTO Na Se c ao 2.2, usamos 3 algarismos signicativos para 1 1 2 . 2 1 0 2 1 1
Calculamos ent ao Au(0) , que e o teste usual para ver se u(0) e realmente solu c ao. Usamos 6 algarismos signicativos e obtemos 1.05000 1.97000 , Au(0) = 0.980000 e ent ao tiramos a diferen ca 0.050000 0.0300000 . 0.0200000
Os passos do escalonamento ali usados s ao importantes para n ao se repetir as mesmas contas a cada etapa do renamento. A solu c ao obtida pode ser considerada uma primeira aproxima c ao, chamada de u(0) : 4.47 u(0) = 6.44 . 2.96
Vejamos um exemplo ilustrativo. resolver 3 1 2
que arredondada de volta para 3 algarismos signicativos se torna 0.0500 0.0300 . r = b Au(0) = 0.0200
r = b Au(0) =
Agora queremos obter w do sistema Aw = b Au(0) , para chegar ` a etapa seguinte, com u(1) = u(0) + w. Ou seja, temos que resolver o sistema 0.05 3 1 2 1 1 0 0.03 . 3 2 1 0.02
Se procedermos ao escalonamento, seguiremos quase exatamente os mesmos passos feitos na Se c ao 2.2. Ent ao n ao precisamos fazer tudo de novo no lado esquerdo, somente no vetor de termos independentes do lado direito. As transforma c oes do lado direito s ao 0.05 0.05 0.05 0.05 (i) (ii) (iii) 0.03 0.02 0.0134 0.0134 , 0.02 0.03 0.0133 0.0200
35
e da chegamos a w = (w1 , w2 , w3 ) = (0.0296, 0.0595, 0.0397). Somando com u(0) obtemos (1) u = (4.5, 6.5, 3), com erro absoluto m aximo de 0. Com a limita c ao do n umero de algarismos signicativos, n ao e certeza que o renamento levar a` a melhor aproxima c ao da solu c ao correta. preciso tamb E em colocar um crit erio de parada, principalmente no caso de se fazer a implementa c ao no computador. O crit erio pode ser feito nas solu c oes u(i) ou nos testes Au(i) . Por exemplo, se u(i) = (u1 , u2 , . . . , un ) e u(i+1) = ( u1 , u 2 , . . . , u n ), pode-se comparar o quanto as coordenadas variam, relativamente, da etapa i para a etapa i +1, olhando para os n umeros |un u n | |u1 u 1 | , ... , , ... , |u1 | |un | e pedindo que eles sejam menores do que um certo valor (por exemplo, 0.05, signicando 5% de varia c ao). O problema e quando o denominador e igual a zero. Pode-se convencionar que: (i) se uj = 0 e u j = 0 ent ao a varia c ao e zero; (ii) se uj = 0 e u j = 0, ent ao a varia c ao e igual a 1 (o que, em geral, far a com que o processo continue). Exerc cio 2.9 Melhorar o programa que implementa o M etodo de Escalonamento com condensa ca o pivotal, acrescentando o renamento, com algum crit erio de parada. Para fazer o renamento, o programa deve utilizar o hist orico do escalonamento, isto e, os multiplicadores e as trocas de linha (para que n ao se repita tudo a cada etapa). Exerc cio 2.10 Tome o sistema discutido na Subse ca o 2.5.2 e sua solu ca o obtida com 2 algarismos signicativos, chamando-a de u(0) . Obtenha o renamento u(1) , calculando b Au(0) com dupla precis ao. Exerc cio 2.11 Considere o sistema 1/2 1/3 1/4 1/3 1/4 1/5 1/4 1/5 1/6 1 0 . 1
onde em (i) zemos todas as permuta c oes da linhas (ii) subtra mos da segunda linha 0.667 vezes a primeira linha e da terceira linha subtra mos 0.333 vezes a primeira linha e em (iii) subtra mos da terceira linha 0.502 vezes a segunda linha. Ao fazer todas as permuta c oes em primeiro lugar, a posi c ao dos multiplicadores, que tamb em haviam sido permutados, car ao na posi c ao correta. O sistema escalonado ca 0.05 3 1 2 0.667 1.33 2.33 0.0134 , 0.333 0.502 0.504 0.0200
(a) Ache sua solu ca o exata.
(b) Resolva-o com dois algarismos signicativos. (c) Agora fa ca a seguinte experi encia: escreva o mesmo sistema, arredondando para dois algarismos signicativos, mas a partir da ache sua solu ca o usando o m aximo de algarismos signicativos que sua calculadora permite. Compare com a solu ca o exata. Isto mostra que o renamento tamb em e limitado pelo arredondamento inicial que, num sistema mal-condicionado, pode alterar drasticamente a solu c ao.
36
Exerc cio 2.12 Dado o sistema linear Ax = b onde 3.2 5.0 4.0 2.9 2.7 A = 3.0 1.5 0.40 1.1
Execute uma etapa de renamento.
ap os resolv e-lo utilizando o M etodo de Elimina ca o de Gauss com condensa ca o pivotal e aritm etica de ponto utuante com 2 algarismos signicativos, obtivemos 4.4 1 3.2 5.0 4.0 = 0.47 2.0 3.0 x(0) = 7.5 . p= 3 A 5.6 2 0.94 0.90 1.6
2.5 b = 4.4 3.5
Cap tulo 3
M etodos iterativos
3.1 O M etodo de Jacobi
O M etodo de Jacobi e um procedimento iterativo para a resolu c ao de sistemas lineares. Tem a vantagem de ser mais simples de se implementar no computador do que o M etodo de Escalonamento, e est a menos sujeito ao ac umulo de erros de arredondamento. Seu grande defeito, no entanto, e n ao funcionar em todos os casos. Suponha um sistema linear nas inc ognitas x1 , ..., xn da seguinte forma: a11 x1 a21 x1 . . . an1 x1 + + a12 x2 a22 x2 . . . + + a13 x3 a23 x3 . . . + ... + ... . . . + ... + + a1n xn a2n xn . . . = = b1 b2 . . .
+ an2 x2
+ an3 x3
+ ann xn
= bn
Suponha tamb em que todos os termos aii sejam diferentes de zero (i = 1, . . . , n). Se n ao for o caso, isso ` as vezes pode ser resolvido com uma troca na ordem das equa c oes. Ent ao a solu c ao desse sistema satisfaz x1 x2 . . . xn 1 [b1 a12 x2 a13 x3 . . . a1n xn ] a11 1 [b2 a21 x1 a23 x3 . . . a2n xn ] = a22 . . . 1 = [bn an1 x1 an2 x2 . . . an,n1 xn1 ] ann =
Em outras palavras, se (x1 , . . . , xn ) for solu c ao do sistema e esses valores forem colocados no lado direito das equa c oes, ent ao resultar ao no lado esquerdo os mesmos valores x1 , . . . , xn . (0) (0) O M etodo de Jacobi consiste em chutar valores x1 , . . . , xn , colocar esses valores no (1) (1) lado direito das equa c oes, obter da x1 , . . . , xn , em seguida colocar esses novos valores nas 37
38 equa c oes e obter x1 , . . . , xn , etc. Ent ao

(2) (2)
CAP ITULO 3. METODOS ITERATIVOS
1 (k ) (k ) k) b1 a12 x2 a13 x3 . . . a1n x( n a11 1 (k+1) (k ) (k ) k) x2 = b2 a21 x1 a23 x3 . . . a2n x( n a22 . . . . . . 1 (k ) (k ) (k ) (k+1) xn = bn an1 x1 an2 x2 . . . an,n1 xn1 ann x1
(k+1)
Espera-se que para todo i = 1, . . . , n a seq u encia {xi }k convirja para o valor verdadeiro xi . Como dissemos, no entanto, nem sempre ocorre essa converg encia. Ser a que e poss vel saber de antem ao se o m etodo vai ou n ao vai funcionar? Daremos um crit erio, chamado de Crit erio das Linhas que, se for satisfeito, implica na converg encia do M etodo. Infelizmente, da n ao poderemos concluir a armativa inversa. Isto e, e falso dizer n ao satisfaz o Crit erio das Linhas ent ao n ao converge. Pode haver sistemas em que o M etodo de Jacobi funcione por em n ao satisfa ca o Crit erio das Linhas.
(k )
3.2
Crit erio das Linhas

n
O Crit erio das Linhas pede que
j=1 j=i
|aij | < |aii |
para todo i = 1, . . . , n. Em palavras: o valor absoluto do termo diagonal na linha i e maior do que a soma dos valores absolutos de todos os outros termos na mesma linha, ou seja, a diagonal da matriz do sistema linear e dominante. importante observar que o Crit E erio das Linhas pode deixar de ser satisfeito se houver troca na ordem das equa c oes, e vice-versa: uma troca cuidadosa pode fazer com que o sistema passe a satisfazer o Crit erio. Teorema. Se o sistema linear satisfaz o Crit erio das Linhas ent ao o M etodo de Jacobi converge. Sugerimos o seguinte exerc cio, antes de passarmos ` a demonstra c ao desse Teorema. Exerc cio 3.1 Mostre que os sistemas lineares gerados por problemas de contorno (Se ca o 1.8) em geral n ao satisfazem o Crit erio das Linhas. Mesmo assim, monte um programa de computador que resolva o problema, baseado no M etodo de Jacobi. O que acontece? Para provar o Teorema, precisamos mostrar (usando o Crit erio das Linhas) que as seq u encias (k ) (k ) (k ) (0) (0) (0) x1 , x2 ,...,xn , formadas a partir dos chutes iniciais x1 , x2 ,...,xn , convergem para os valores procurados x1 , . . . , xn . Ent ao precisamos mostrar que
(k ) |x1 x1 | 0 , |x2 x2 | 0 , . . . , |xn xn | 0 , (k ) k (k ) k k
3.2. CRITERIO DAS LINHAS ou, introduzindo uma nota c ao mais compacta, de forma que
k) (k ) = max (x(k) , x) = max{|x1 x1 |, . . . , |x( n xn |} 0 . (k ) k
39
De fato, iremos mostrar que (k ) decai geometricamente, isto e, existem um < 1 e uma constante c > 0 tal que (k ) ck , e isso provar a nossa arma c ao. J a para conseguir essa desigualdade, provaremos que para todo k 1 vale (k ) (k 1) . Ent ao teremos (1) (2) . . . (k ) (1) 2 (0) . . . k (0) , (0)
remete a provar que, para todo i = 1, . . . , n, vale |xi

(k )
ou seja, a constante c pode ser o pr oprio (0), que e a maior diferen ca entre o valor inicial e a solu c ao verdadeira. Por sua vez, provar que (k ) (k 1) xi | (k 1) = max |xi
i=1,...,n (k1)
xi | .
Faremos a demonstra c ao completa para i = 1, mas car a claro que o argumento valer a para (k ) todo i = 1, . . . , n, desde que escolhamos adequadamente. Precisamos escrever xi xi , lembrando que x1 =
(k )
1 (k1) (k1) k1) b1 a12 x2 a13 x3 . . . a1n x( n a11 1 (b1 a12 x2 a13 x3 . . . a1n xn ) . a11
e, como os x1 , . . . , xn formam uma solu c ao, x1 = Ent ao x1 x1 =

(k )
1 (k1) (k1) k1) a12 (x2 x2 ) + a13 (x3 x3 ) + . . . + a1n (xn x( ) n a11
Tomando o valor absoluto (o m odulo) e lembrando que o m odulo da soma e menor ou igual a soma dos m ` odulos, temos |x1 x1 | 1 (k1) (k1) k1) |a12 | |x2 x2 | + |a13 | |x3 x3 | + . . . + |a1n | |xn x( | n |a11 |
(k )
40 Note, no entanto, que por deni c ao |xj xj portanto |x1 x1 | Agora denimos a constante 1 =
(k ) (k1)
| max |xi xi
i=1,...,n
(k1)
| (k 1) ,
|a12 | + |a13 | + . . . + |a1n | (k 1) . |a11 | |a12 | + |a13 | + . . . + |a1n | , |a11 |
que deve ser menor do que 1, pelo Crit erio das Linhas. Ent ao |x1 x1 | 1 (k 1) . Para as outras linhas todo o procedimento e an alogo, e sempre resultar a |xi para todo i = 1, . . . , n, onde i = 1 |aii |
n (k ) (k )
xi | i (k 1) ,
j=1 j=i
|aij | .
O Crit erio das Linhas garante que i < 1, para todo i = 1, . . . , n. Se denirmos agora = max i ,
i=1,...,n
ent ao |xi logo (k ) (k 1) , como quer amos demonstrar!

(k )
xi | (k 1) ,
3.3
Crit erio de parada

i=1,...,n
Da desigualdade (k ) (k 1), podemos deduzir uma express ao que relaciona (k ) com (k1) (k ) (k1) (k ) max (x , x ) = max |xi xi | que corresponde ` a varia c ao m axima entre x(k1) e x(k) .
3.4. O METODO DE GAUSS-SEIDEL De fato, de (k ) (k 1) segue que

i=1,...,n
41
max |xi
(k )
xi | max |xi
i=1,...,n i=1,...,n
(k1) (k1)
xi | xi
(k )
= max |xi max

i=1,...,n i=1,...,n
+ xi
(k )
xi |
(k )
|xi
(k1)
xi | + |xi
(k )
(k )
xi |
(k )
max |xi Assim

i=1,...,n
(k1)
xi | + max |xi
i=1,...,n (k1) (k )
xi |
(1 ) max |xi e nalmente

i=1,...,n
(k )
xi | max |xi
i=1,...,n
xi |
max |xi
(k )
xi |
que com nossa nota c ao compacta se torna (k )
(k1) (k ) max |x xi | 1 i=1,...,n i
max (x(k1) , x(k) ) 1
Um crit erio de parada para o M etodo de Jacobi consiste em calcular o lado direito da desigualdade acima e parar quando esta for menor que a precis ao desejada. Outro crit erio de parada e aquele em que somente calculamos a itera c ao seguinte caso a varia c ao relativa seja maior que uma quantidade p pr e-xada, isto e, se |xi
(k+1)
xi | p|xi |
(k )
(k )
para algum i = 1, . . ., n. Entretanto este segundo crit erio n ao garante que a dist ancia entre x(k) e x seja menor que p. Muitas vezes a velocidade de converg encia do m etodo e muito lenta e mesmo longe da solu c ao, a varia c ao relativa das solu c oes aproximadas pode ser muito pequena.
3.4
O M etodo de Gauss-Seidel
O M etodo de Jacobi poderia ser aplicado nos problemas de contorno da Se c ao 1.8, mas somente pelo Crit erio das Linhas n ao seria poss vel armar que haveria converg encia, pois os v ertices livres produzem equa c oes onde o elemento da diagonal e exatamente igual ` a soma dos demais termos, o que signica, na nota c ao da Se c ao anterior, que i = 1, para alguns valores de i. Experimentos num ericos evidenciam que de fato h a converg encia do M etodo de Jacobi nesses casos, embora ela seja muito lenta, principalmente se o n umero de v ertices da grade for muito grande. Embora a converg encia possa ser demonstrada matematicamente, com crit erios menos exigentes que o Crit erio das Linhas, discutiremos nesta Se c ao uma varia c ao do M etodo de Jacobi, chamada de M etodo de Gauss-Seidel. Sua ec acia car a demonstrada a partir de uma hip otese mais fraca que o Crit erio das Linhas, chamada de Crit erio de
42
ou, de forma sucinta,
Sassenfeld. N ao ser a dif cil mostrar que os problemas de contorno citados satisfazem esse crit erio, desde que se tenha um m nimo de cuidado na numera c ao dos v ertices livres. (k+1) (k+1) (k ) No M etodo de Jacobi, calcula-se o vetor (x1 , . . . , xn ) a partir do vetor (x1 , . . ., (k ) xn ) da seguinte forma: (k ) (k+1) a12 a13 a1n 0 x1 x1 b1 /a11 a11 a11 a11 (k+1) a23 a2n (k ) a21 0 b2 /a22 x2 x2 a22 a22 a22 = . . . . . . . . , . . . . . . . . . . . . . . . . an1 an2 an3 (k ) (k+1) bn /ann 0 xn xn ann ann ann u(k+1) = w Bu(k) .
(k+1)
Em cada etapa, as coordenadas x1 , . . ., xn de u(k+1) s ao obtidas todas de uma vez (k ) (k ) (k ) s o, a partir das coordenadas x1 , . . ., xn de u . J a no M etodo de Gauss-Seidel as coordenadas atualizadas s ao imediatamente usadas na atualiza c ao das demais. Explicitamente, temos x1 x2
(k+1)
(k+1)
(k+1)
x3
(k+1)
. . .
k+1) x( n
1 a11 1 = a22 1 = a33 . . . 1 = ann =
k) b1 a12 x2 a13 x3 a1n x( n
(k )
(k )
b2 a21 x1 b3 a31 x1
(k+1)
(k ) a23 x3 a2n xn
(k )
(k+1)
a32 x3
(k+1)
k) a3n x( n
bn an1 x1
(k+1)
an2 x2
(k+1)
an,n1 xn1
(k+1)
Para introduzir o Crit erio de Sassenfeld e discutir a converg encia, e melhor ilustrarmos com um sistema com 4 equa c oes. Depois enunciaremos o Crit erio para sistemas com um n umero qualquer de equa c oes, e car a claro que os argumentos se generalizam. Com isso, evitaremos o excesso de elipses (os tr es pontinhos), e o crit erio emergir a de modo natural. Assim como na Se c ao anterior, queremos avaliar a diferen ca entre a aproxima c ao obtida na etapa k e a solu c ao original, e mostrar que essa diferen ca se reduz a cada etapa. Para medir essa diferen ca, tomamos (k ) = max |xi
i=1,...,n (k )
xi | ,
onde x1 , . . . , xn representa a solu c ao verdadeira. Mais uma vez, nosso objetivo e mostrar que existe < 1 tal que (k + 1) (k ) , e para isso precisaremos mostrar que |xi
(k+1)
xi | (k )
3.4. O METODO DE GAUSS-SEIDEL para todo i = 1, . . . , n. Num sistema de 4 equa c oes e 4 inc ognitas temos x1 x2
(k+1)
43
x1 x2 x3 x4
= = = =
(k+1)
x3
(k+1)
x4
(k+1)
1 a11 1 a22 1 a33 1 a44
a12 (x2 x2 ) + a13 (x3 x3 ) + a14 (x4 x4 ) a21 (x1 x1 a31 (x1 x1 a41 (x1 x1
(k+1)
(k )
(k )
(k )
) + a23 (x3 x3 ) + a24 (x4 x4 ) ) + a32 (x2 x2 ) + a42 (x2 x2

(k+1)
(k )
(k )
(k+1)
) + a34 (x4 x4 ) ) + a43 (x3 x3

(k+1)
(k )
(k+1)
(k+1)
Da primeira equa c ao, sai |x1

(k+1)
x1 |
|a13 | |a14 | |a12 | (k ) (k ) (k ) |x2 x2 | + |x3 x3 | + |x4 x4 | , |a11 | |a11 | |a11 |
Como |xi xi | (k ), para todo i = 1, 2, 3, 4, ent ao |x1 Denimos 1 = para car com |x1
(k+1)
(k )
x1 |
|a12 | + |a13 | + |a14 | (k ) . |a11 |
|a12 | + |a13 | + |a14 | , |a11 | x1 | 1 (k ) .
(k+1)
Agora levamos em conta essa u ltima inequa c ao para mostrar que |x2
(k+1)
x2 |
1 |a21 | + |a23 | + |a24 | (k ) 2 (k ) . |a22 | 1 |a31 | + 2 |a32 | + |a34 | (k ) 3 (k ) |a33 |
Continuando, obtemos |x3 e |x4

(k+1) (k+1)
x3 |
x4 |
Em conclus ao, mostramos que
1 |a41 | + 2 |a42 | + 3 |a43 | (k ) 4 (k ) . |a44 | |xi

(k+1)
xi | i (k ) ,
logo (k + 1) ( max i )(k ) .

i=1,2,3,4
44
Se cada um dos n umeros 1 , 2 , 3 e 4 for menor do que 1, ent ao teremos (k +1) (k ), com < 1. Para um sistema linear de n equa c oes e n inc ognitas, o Crit erio de Sassenfeld pode ser enunciado de forma indutiva, da seguinte maneira. Primeiro, 1 = |a12 | + |a13 | + . . . + |a1n | , |a11 |
como no Crit erio das Linhas. Os demais coecientes s ao denidos indutivamente. Suponha que j a tenham sido denidos 1 , 2 , . . ., i1 , para i 2. Ent ao i se dene como i = 1 |ai1 | + . . . + i1 |ai,i1 | + |ai,i+1 | + . . . + |ain | , |aii |
isto e, no numerador os i s aparecem multiplicando os coecientes da linha i ` a esquerda da diagonal, enquanto que os coecientes ` a direita da diagonal s ao multiplicados por 1. O coeciente da diagonal aparece no denominador (como no Crit erio das Linhas) e n ao aparece no numerador. Analogamente ao M etodo de Jacobi, o M etodo de Gauss-Seidel tamb em tem a desigualdade (k ) max (x(k1) , x(k) ) 1 desde que = max i seja estritamente menor que 1.
i=1,...,n
Exerc cio 3.2 Tente mostrar o Crit erio de Sassenfeld n n. Exerc cio 3.3 Mostre que os problemas de contorno da Se ca o 1.8 satisfazem o Crit erio de Sassenfeld Exerc cio 3.4 Obtenha a solu ca o com 3 algarismos signicativos do sistema linear 4x1 x1 2x1 + 2x2 + 2x2 + x2 + x3 = 11 = 3 = 16
+ 4x3
usando o M etodo de Jacobi e o M etodo de Gauss-Seidel. Compare a velocidade de converg encia nos dois m etodos.
1 2 5 x w 7
3 y z 1 3 0
Exerc cio 3.5 Considere a tabela acima. Use o M etodo de Gauss-Seidel para achar x, y, z, w tais que cada casinha que contenha uma inc ognita seja a m edia das quatro adjacentes (considerando apenas verticais e horizontais). Fa ca 4 itera co es, partindo de (x0 , y0 , z0 , w0 ) =
3.4. O METODO DE GAUSS-SEIDEL
45
(0, 0, 0, 0), e arredondando para 2 algarismos signicativos ap os cada etapa. (Veja a Se ca o 1.8 na p agina 18.) Exerc cio 3.6 Considere o sistema linear Ax = b, onde 4 1 4 3 8 e b = 3 A = 5 3 3 6 2 3
(a) A matriz A satisfaz o Crit erio das Linhas para alguma permuta ca o de linhas? (b) A matriz A tem alguma permuta ca o das linhas a qual satisfaz o Crit erio de Sassenfeld? Qual? Justique. (c) Escreva as equa co es de recorr encia do m etodo de Gauss-Seidel e calcule uma itera ca o a partir de x(0) = (1, 0, 0). (d) Sabendo-se que a solu ca o exata est a em [3, 4] [1, 5] [2, 2], quantas itera co es s ao necess arias para que o erro seja menor que 102 ? Exerc cio 3.7 Considere os sistemas lineares 1z = 2 4x + 1y + 2x 5y + 1z = 3 (1) e 1x + 1y + 1.5z = 4
(2)
Observe que o sistema (2) foi obtido do sistema (1) substituindo-se a primeira equa ca o de (1) pela soma desta com a u ltima equa ca o de (1). Portanto eles s ao equivalentes. Queremos encontrar a solu ca o do sistema (1) (ou (2)) usando o M etodo de Gauss-Seidel, partindo de um certo chute inicial xado (x0 , y0 , z0 ), de forma a obter a melhor precis ao poss vel na vig esima itera ca o. A qual dos dois sistemas devemos aplicar o M etodo de Gauss-Seidel segundo esse objetivo? Justique.
5x + 2y 2x 5y 1x + 1y
+ 2.5z + 1z + 1.5z
= 6 = 3 = 4
46
Parte II
Ajuste de Fun c oes
47
Cap tulo 4
Ajuste de fun c oes

4.1 O problema do ajuste
y
Em medidas experimentais, freq uentemente nos deparamos com uma tabela de dados (xi , yi ), i = 1, . . . , N , que representamos visualmente por meio de um gr aco. Em geral, esperamos que haja uma rela c ao entre a vari avel y e a vari avel x, que seria expressa por uma fun c ao: y = f (x).
yi xi
Muitas vezes n ao dispomos de um modelo que explique a depend encia de y em rela c ao a x, de forma que n ao podemos deduzir essa fun c ao apenas de teoria. De fato, o experimento pode se dar justamente como uma forma de investigar essa rela c ao, para criar um embasamento da teoria sobre dados reais. Mesmo que o experimento n ao culmine num modelo te orico, e sempre desej avel ter um modelo preditor, quer dizer, e interessante saber prever, pelo menos de forma aproximada, em que resultar a a medida de y se soubermos x. Por exemplo, suponha que queiramos usar um el astico como dinam ometro. Para isso, xamos uma das extremidades do el astico e na outra extremidade penduramos o objeto do qual desejamos conhecer o peso. Quanto mais pesado for o objeto, mais o el astico se distender a, isso e obvio, mas n os gostar amos de obter, a partir da distens ao do el astico, um valor num erico para seu peso. Neste exemplo, x e a distens ao do el astico e y o peso do objeto (ou poderia ser o contr ario, se desej assemos prever a distens ao que o el astico teria para um determinado peso). Para ter uma f ormula a ser usada no dinam ometro precisamos conhecer muito bem como se comporta nosso el astico. Para isso, fazemos v arias medidas do montante da distens ao em fun c ao do peso do objeto, o que nos dar a uma cole c ao de dados (xi , yi ), i = 1, . . . , N . O que n os queremos agora e encontrar uma fun c ao y = f (x) que se aproxime o melhor poss vel 49
50
CAP ITULO 4. AJUSTE DE FUNC OES
desej desses dados. Mas como? E avel tamb em que a f ormula de f n ao seja muito complicada, pois isso facilitaria mais tarde sua utiliza c ao como preditor. claro que o problema, colocado dessa forma, parece muito complicado. No entanto, E podemos restringir bastante o universo das fun c oes candidatas, e dentro desse conjunto menor de fun c oes procurar aquela que melhor se adapte a nossos pontos. Al em disso, e preciso estabelecer um crit erio comparativo do que seja a qualidade de uma aproxima c ao. Isto e, como decidir se uma fun c ao se adequa mais aos dados do que outra?
4.2
Os m nimos quadrados
Precisamos de uma medida num erica para avaliar a qualidade de uma aproxima c ao. Isto e, temos uma cole c ao de dados (xi , yi ), i = 1, . . . , N , e queremos avaliar o quanto uma determinada fun c ao f difere desses dados, associando a f um n umero Q(f ). Esse n umero deve ser sempre n ao-negativo, e deve ser usado de forma comparativa: se Q(f1 ) for menor do que Q(f2 ) ent ao f1 e uma aproxima c ao aos dados melhor do que f2 . Evidentemente h a um certo grau de arbitrariedade no m etodo que escolhemos para determinar Q. Aqui adotaremos o mais comum deles, que pode ser justicado por raz oes estat sticas fora do alcance destas notas, e e conhecido como qui-quadrado (sem pesos, na Se c ao 6.4 abordamos o qui-quadrado com pesos): a dist ancia de f (x) aos dados experimentais e denida como sendo
N
Q(f ) =
i=1
(f (xi ) yi )2 .
f(xi ) yi xi
Em palavras, temos que avaliar, para cada xi , a diferen ca entre o dado yi e o valor de f em xi , elevar essa diferen ca ao quadrado e depois somar os resultados obtidos para cada xi .
Exerc cio 4.1 Dados os pontos (2.8, 1.6), (1.6, 0.6), (3.0, 2.4), (4.5, 4.0), (6.0, 5.7) e as fun co es ans f1 (x) = 0.8 + 0.86x e f2 (x) = 1.0 + 1.32x, qual das duas fun co es se ajusta melhor aos dados, usando o crit erio do qui-quadrado? Desenhe as retas e os pontos em papel milimetrado antes de fazer as contas, e procure adivinhar o resultado por antecipa ca o.
4.3
Par ametros
Precisamos resolver tamb em a quest ao do conjunto de fun c oes aonde vamos procurar aquela que minimiza o qui-quadrado. Veja que o problema em alguns casos perde o sentido se n ao zermos isso. De fato, para qualquer conjunto de dados (xi , yi ), i = 1, . . . , N , onde os xi s nunca se repitam, sempre podemos achar um polin omio de grau N 1 tal que p(xi ) = yi , para todo i = 1, . . . , N , como vimos nas Se c oes 1.5 e A.7. Com isso, Q(p) e zero e n ao h a como encontrar uma fun c ao melhor do que essa. O bom senso, no entanto, levar a a concluir que isso n ao vale a pena. Duas raz oes concretas podem ser dadas imediatamente: se a quantidade de dados for muito grande, ser a necess ario
4.3. PARAMETROS
51
achar um polin omio de grau bastante grande para interpolar esses dados. Haver a a diculdade de se achar o polin omio e depois a diculdade de se utiliz a-lo. Menos objetiva do que essa raz ao e o fato bastante comum em experi encias de que sabemos muitas vezes de antem ao que tipo de fun c ao estamos procurando. Para ilustrar, vejamos alguns exemplos.
4.3.1
Densidade
Suponha que queiramos determinar a densidade de um certo material. O procedimento e claro, se dispusermos dos instrumentos adequados. Basta medir o volume de uma certa quantidade de material, sua massa e proceder ` a raz ao massa por volume. Se estivermos um pouco mais preocupados com a precis ao do resultado, faremos mais medidas e, evidentemente, tiraremos a m edia dos resultados. Se, no entanto, essas medidas forem tomadas com volumes diferentes, conv em fazer um gr aco Massa (m) vs. Volume (V). Veremos que podemos tamb em tirar um valor para a densidade a partir desse gr aco. Chamando de 0 a densidade do material, temos que m = f (V ) = 0 V , o que em portugu es pode ser assim entendido: a massa do material depende apenas de seu volume, e essa depend encia e explicitamente dada por 0 V , onde 0 e uma constante xa chamada densidade. Se admitirmos que isso e verdade podemos tentar, a partir do gr aco, achar o valor de 0 . Para achar o valor de 0 que melhor se adapta aos dados experimentais recorremos ao qui-quadrado. Olhamos (num sentido abstrato) para todas as poss veis fun c oes f (V ) = V , cujos gr acos s ao retas de inclina c ao , passando pela origem. Observe que cada fun c ao f e uma fun c ao de uma vari avel (V ), mas que depende do n umero , que e chamado de par ametro. Para cada fun c ao f podemos medir o qui-quadrado Q(f ), e depois procurar o par ametro para o qual Q(f ) e m nimo. Como varia ao longo da reta real, a fun c ao Q(f ) e uma fun c ao de uma vari avel, que denotaremos simplesmente por Q(). Note agora que , que era par ametro para f (V ), agora e a pr opria vari avel de Q() = Q(f )! Podemos visualizar Q() atrav es de um gr aco. Se houver um m nimo, ele pode ser encontrado com exatid ao procurando-se 0 tal que Q (0 ) = 0 . (Por em aten c ao: Q () = 0 n ao implica necessariamente que seja m nimo, poderia se tratar de um m aximo, ou um ponto de inex ao com derivada zero. Somento o inverso e v alido: se for m nimo, ent ao Q () = 0.)
Q()
52
4.3.2
Caten aria
Quando suspendemos uma corrente em dois pontos de sustenta c ao, n ao necessariamente horizontalmente alinhados, ela assume um determinado formato (entre os dois pontos de sustenta c ao), dado pela fun c ao caten aria: f (x) = 1 (cosh(cx) 1) , c
onde cosh e a fun c ao conhecida como cosseno hiperb olico, e e dada por cosh x = ex + ex . 2
Observe que a fun c ao foi dada de tal forma que para x = 0 ela vale 0, ou seja, a origem das coordenadas e imposta como sendo o ponto de m nimo da corrente (uma justicativa para essa fun c ao ser a dada na Subse c ao 17.3.5). Na express ao de f tamb em aparece uma constante c, que e um n umero. Esse n umero n ao e conhecido a priori, pois depende de v arias coisas, a come car pela posi c ao dos pontos de sustenta c ao. O n umero c e outro t pico exemplo de um par ametro. Se usarmos sempre a mesma corrente ele pode ser modicado atrav es da mudan ca dos pontos de sustenta c ao, e e razoavelmente dif cil saber que valor ele vai assumir ao pendurarmos a corrente. No entanto, j a que se trata de uma medida experimental, poder amos medir a posi c ao da corrente em alguns pontos, convencionando x para a horizontal e y para a vertical, obtendo assim um conjunto de dados (xi , yi ), i = 1, . . . , N . Conv em, al em disso, determinar a posi c ao exata do m nimo, que ser a o ponto (x, y ) = (0, 0). Agora sabemos que a corrente assume a forma de uma fun c ao f como acima, mas nos resta saber com que valor de c isso acontece. Como proceder? Para explicitar a exist encia de um par ametro, que obviamente faz parte da deni c ao da fun c ao, adota-se a nota c ao 1 fc (x) = (cosh(cx) 1) . c Para cada fun c ao fc podemos medir o qui-quadrado Q(fc ), e depois procurar o par ametro c para o qual Q(fc ) e m nimo. Como c varia ao longo da reta real, a fun c ao c Q(fc ) e uma fun c ao de uma vari avel, que denotaremos simplesmente por Q(c).
4.3.3
Naftalinas e fun c oes ans
Uma bolinha de naftalina perde seu material, por sublima c ao, a uma taxa proporcional a sua superf cie. Como evolui o raio da naftalina em fun c ao do tempo? Se V (t) e o volume da bolinha, ent ao a hip otese implica que (t) = 4r(t)2 , V
4.3. PARAMETROS
53
isto e, a taxa de perda de volume e proporcional ` a area da superf cie da bolinha. Por outro lado 4 V (r) = r3 , 3 de forma que 4 V (t) = V (r(t)) = r(t)3 3 e (t) = 4r(t)2 r V (t) . (t) e cancelando r(t)2 , camos com Juntando as duas equa c oes em V r (t) = , logo r(t) e uma fun c ao de derivada constante negativa, ou seja, e uma fun c ao am. Portanto r(t) = r0 t , onde r0 = r(0). Num experimento, supondo que o racioc nio acima se conrme, teremos uma s erie de dados (ti , ri ) que se dispor ao aproximadamente sobre uma reta. Cada reta n ao vertical do plano e gr aco de r(t) = a + bt, e gostar amos de achar o par (a, b) que melhor aproxime os dados experimentais, isto e, que produza o menor qui-quadrado poss vel. Desta feita, o qui-quadrado e uma fun c ao de duas vari aveis, pois para cada par (a, b) teremos uma fun c ao diferente a + bt e um qui-quadrado Q(a, b). Ao contr ario dos problemas da densidade e da caten aria, aqui aparece uma fun c ao que envolve dois par ametros.
4.3.4
Decaimento exponencial
Um material cont em um is otopo radioativo, e emite radia c ao, que pode ser detectada por um contador geiger. A emiss ao de radia c ao e proporcional ` a quantidade de is otopo, e e oriunda de seu decaimento. Veremos mais adiante (Subse c ao 17.3.2) que a quantidade do is otopo decresce (na maioria dos casos) exponencialmente. Ou seja, a radia c ao emitida por unidade de tempo R(t) obedece ` a lei R(t) = R0 et , onde t e o tempo (a vari avel) e R0 , s ao dois par ametros. A constante R0 e a quantidade de radia c ao emitida por unidade de tempo no instante t = 0 e > 0 representa a taxa de decaimento: quanto maior for mais r apido ele ser a. A meia-vida do is otopo e o tempo T necess ario para que sua quantidade caia pela metade. Admitindo a proporcionalidade entre a radia c ao emitida e a quantidade do is otopo, T e tal que R0 , R(T ) = 2 isto e, R0 = R0 eT , 2
54 equa c ao que resolvida nos d a
log 2 . O conceito de meia-vida e muito usado para data c ao de f osseis, atrav es da determina c ao da quantidade de carbono-14, em rela c ao ao is otopo mais abundante carbono-12: quanto menor for a quantidade de carbono-14, mais antigo e o material. A fun c ao a dois par ametros R(t) recai no caso am quando tiramos o logaritmo: T = log R(t) = log R0 t , ou seja, L(t) log R(t) e uma fun c ao am, onde e sua derivada. Os pap eis mono-log, vendidos em algumas papelarias, s ao uma maneira de se plotar o logaritmo dos dados da ordenada, log R(t), em fun c ao dos dados da abscissa, t, sem fazer contas. Isto n ao vale quando o decaimento exponencial e assint otico a um valor diferente de zero, em fun c oes do tipo f (t) = b + cet . N ao adianta tirar o logaritmo, pois o logaritmo de uma soma n ao pode ser desmembrado. Esse tipo de fun c ao tem tr es par ametros, e pode ocorrer, por exemplo, no decaimento de temperatura de um corpo em contato com um reservat orio mais frio, mas cuja temperatura n ao e necessariamente zero. Uma outra observa c ao importante e que o problema de aproxima c ao de dados por uma exponencial R(t) R0 et n ao e equivalente ` a aproxima c ao mono-log. Em geral a solu c ao do problema linearizado log R(t) log R0 t e usado como ponto de partida para encontrar outra aproxima c ao com erro quadr atico (ou qui-quadrado) menor.
4.3.5
Leis de pot encia e fractais
Para fun c oes f (x) = cx , que t em dois par ametros, recomenda-se tamb em tirar o logaritmo: log f (x) = log c + log x . Desta vez, log f (x) e uma fun c ao am de log x, e o papel recomendado para se plotar os dados, em busca de uma reta, e o o log-log. Esse tipo de fun c ao aparece ligado ao conceito de fractal. Para exemplicar, tome a linha do litoral, fotografada num mapa de sat elite, e suponha que a foto do sat elite tenha boa resolu c ao, para que se possa fazer uma an alise razoavelmente detalhada. Escolha um tamanho l e divida o mapa em quadrados de tamanho l. Para facilitarmos o argumento suporemos que o mapa e quadrado e escolheremos apenas valores de l que sejam iguais ` a lateral do mapa dividida por um n umero inteiro, de forma que s o haja uma maneira de se dividir o mapa em quadrados. Em seguida contamos o n umero N (l) de quadrados que intersectam a linha do litoral.
4.3. PARAMETROS
55
Tomamos valores de l cada vez menores, e para cada l contamos N (l). A experi encia tem mostrado que, dentro dos limites inerentes ao experimento, N (l) e proporcional a ld , onde d e a chamada dimens ao fractal daquele peda co de litoral. O nome fractal vem do fato de que d pode ser um n umero fracion ario (n ao inteiro), e o inesperado vem do fato de que se o litoral fosse uma reta ent ao d seria igual a 1! Ocorre que em geral d e maior do que 1... Exerc cio 4.2 Munido de bons mapas, fa ca o experimento acima sugerido, e coloque os dados N (l) versus l em papel log-log. Se realmente N (l) = cld ent ao voc e ver a uma reta de inclina ca o negativa, e a dimens ao fractal d ser a o valor absoluto dessa inclina ca o. Preste aten ca o em desconsiderar valores de l muito grandes ou muito pequenos, onde fatalmente n ao se ver a uma reta.
4.3.6
Gaussiana
Suponha que v arias medidas foram feitas de um mesmo fen omeno, por exemplo, o tempo de queda de um objeto que e solto, a partir do repouso, sempre da mesma altura. S ao feitas n medidas T1 , . . . , Tn , e dessas medidas constr oi-se um histograma. Para fazer o histograma, escolhe-se um intervalo t e divide-se a reta dos tempos em intervalos de tamanho t. Esses intervalos podem ser numerados: I1 , . . . , IN , mas para a numera c ao ser nita e preciso n ao incluir aqueles que est ao longe dos tempos medidos. Para cada intervalo Ij conta-se o n umero de medidas Ti que incidem em Ij , chamando esse n umero de nj . O histograma e desenhado construindo-se barras de base Ij e altura igual a nj .
nj
I1 I2
Ij
IN
Nesse problema e em v arios outros, a tend encia do histograma e adotar o formato aproximado de um sino. O valor mais prov avel do que deve ser o tempo de queda (que servir a por exemplo para se estimar a acelera c ao da gravidade) se situa pr oximo dos intervalos que apresentam maiores valores de nj , isto e, no cume do sino. Se o experimento n ao tiver erros sistem aticos, o formato de sino ser a tanto melhor apro claro que ximado quanto mais medidas forem feitas e quanto menor forem os intervalos. E a diminui c ao dos intervalos e o aumento do n umero de medidas devem ser feitos de forma acoplada, mas isso j a e outra hist oria... O leitor mais atento pode estar pensando que ao mudarmos o n umero n de experimentos ou o tamanho do intervalo b asico t n ao poderemos comparar um histograma com outro. E claro que se aumentarmos o n umero n ent ao em m edia os nj s devem aumentar, o que dar a histogramas radicalmente diferentes quando n = 500 ou n = 5000, por exemplo, mantidos iguais os ts. Por outro lado, se mantivermos n mas, digamos, diminuirmos pela metade o tamanho dos intervalos, isso far a com que em m edia os nj s caiam pela metade. Assim, seria interessante ter um histograma que n ao dependesse demais de n e t, e permitisse comparar histogramas do mesmo fen omeno constru dos de formas diferentes. Para isso, em vez de colocarmos as barras ` a altura nj , fazemos um reescalonamento da
56 ordenada, colocando as barras ` a altura nj . nt
Com isso, a soma total da area das barras ser a igual a 1, pois cada barra ter a area nj nj = nt n
t e a soma da area de todas as barras ser a
N j =1
1 nj = n n
nj =
j =1
1 n=1. n
Al em disso, o histograma passa a ter a seguinte fun c ao utilit aria. Se quisermos saber a propor c ao de eventos Ti que caiu num determinado conjunto de Ij s, basta medir a area total das barras sobre esses intervalos. Esse n umero ser a um n umero entre 0 e 1 (que multiplicado por 100 dar a a porcentagem de eventos ocorridos nos intervalos considerados). ` medida em que se dimui t e se aumenta n, o formato do histograma se aproxima cada A vez mais de um formato de sino, agora xo. Esse formato de sino e tipicamente descrito pela fun ca o Gaussiana 1 (t )2 exp{ }. 2 2 2
f (t) =
Observe que essa fun c ao depende de dois par ametros, e , ent ao seria mais correto denot a-la por
f, (t) .
O fator que multiplica a exponencial est a colocado para normalizar a fun c ao, isto e, fazer com que a area debaixo de seu gr aco seja sempre igual a 1, n ao importando os valores de e .
4.3. PARAMETROS
57
Para entender melhor essa fun c ao, observe que ela e uma varia c ao de h(t) = exp{t2 } = et . A fun c ao h(t) tem um m aximo em t = 0 e h(0) = 1, e decresce ` a direita e ` a esquerda (simetricamente), indo a zero quando t vai a + ou . Se agora tomarmos h (t) = exp{(t )2 }, a fun c ao valer a 1 e atingir a o m aximo em t = , e decrescer a ` a direita e esquerda de . Ent ao o par ametro tem o papel de deslocar o sino para a direita ou para a esquerda, conforme for positivo ou negativo, e seu valor sempre representa a posi c ao do cume.
2
1 h(t) = et 0
2
h (t)
2
0
Por outro lado, se considerarmos
t2 t t } = h( ) } = exp{ 2 2 2 2 ao o valor de h (t) ser a o valor de h em t , ent ao teremos o seguinte efeito: se 2 > 1, ent 2 que e menor do que t . Isso far a com que a curva decres c a mais lentamente, alargando o sino. Se, ao contr ario, 2 < 1, a curva decrescer a mais rapidamente. h (t) = exp{
2 <1
2 >1
h h h(t)=h( t )
2
h
t t
0
h(t)=h( t )
2
Em resumo, combinando os dois par ametros, indica a posi c ao horizontal do cume, enquanto que indica o qu ao agudo e o pico. A altura do pico e dada pelo fator de
58
1 , escolhido de forma que a integral de f seja igual a 1. normaliza c ao 2 Finalmente, estando de posse de um histograma, e admitindo as considera c oes acima, queremos saber qual e o melhor par de par ametros (, ) que aproxima o formato delineado pelas barras. Para isso, podemos tratar as barras como pontos, tomando t1 , . . . , tN como os pontos centrais dos intervalos I1 , . . . , IN , e y1 , . . . , yN a altura das respectivas barras. Com esses dados, podemos sempre estimar o qui-quadrado Q(f, ), procurando o par (, ) que o minimize. A fun c ao f, encontrada serve como um preditor do experimento. Se quisermos saber em m edia qual e a propor c ao de medidas que ocorrer a entre ta e tb , bastar a encontrar a area do histograma entre ta e tb , que e aproximadamente o mesmo que calcular a integral tb
f, (t)dt .
ta
Pode-se mostrar (isso tamb em j a e outra hist oria...) que os melhores par ametros e s ao a m edia e o desvio-padr ao da cole c ao de dados t1 , . . . , tn . Ou seja, = e 2 = 1 n 1 n
n i=1 n
ti ,
i=1
(ti )2 .
Isso resolve o problema de se achar o menor qui-quadrado, mas raros s ao os casos em que a solu c ao e t ao expl cita!
Cap tulo 5
Fun c oes lineares nos par ametros

5.1 Depend encia linear dos par ametros
Estaremos particularmente interessados nos casos em que a depend encia da fun c ao nos par ametros e linear. Colocando de forma geral, isso signica que, se a fun c ao tiver k par ametros a1 , a2 , . . . , ak , ent ao f = fa1 ,...,ak se escreve como f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) . Por exemplo, na fun c ao ax + b sen x identicamos a1 = a, a2 = b, g1 (x) = x e g2 (x) = sen x. Ou sen ao na fun c ao am a + bx identicamos a1 = a, a2 = b, g1 (x) = 1 (isto e, a fun c ao identicamente igual a 1) e g2 (x) = x. Mesmo uma fun c ao linear ax tem apenas um par ametro: a1 = a e g1 (x) = x. preciso n E ao confundir entre fun c ao linear nos par ametros e fun c ao linear. Uma fun c ao linear de uma vari avel e sempre da forma ax, e reservamos o termo fun ca o am para fun c oes da forma a + bx. J a uma fun c ao linear nos par ametros n ao e necessariamente linear em x, basta ver os exemplos que demos acima. Analisemos, sob essa otica, com que tipos de problemas nos deparamos nos exemplos do Cap tulo anterior. No exemplo do c alculo da densidade temos uma fun c ao do tipo f (x) = ax, que e linear no par ametro a e na vari avel x. A fun c ao da caten aria f (x) = 1 e um exemplo c (cosh(cx) 1) de fun c ao com apenas 1 par ametro que por em n ao e linear nesse par ametro. As fun c oes ans das naftalinas s ao lineares nos par ametros. J a o decaimento exponencial f (x) = aebx n ao e, mas o problema pode ser transformado num problema de fun c ao am (e portanto linear nos par ametros), pois log f (x) = log a bx . 59
60
CAP ITULO 5. FUNC OES LINEARES NOS PARAMETROS
J a f (x) = c + aebx tem tr es par ametros e n ao e linear em b: se b fosse xado (n ao considerado como par ametro), ent ao sim ter amos a linearidade. A lei de pot encia f (x) = axb tamb em n ao e linear no par ametro b, mas pode ser transformada num problema linear atrav es do logaritmo. Finalmente, a fun c ao Gaussiana n ao e linear nos par ametros m edia e desvio-padr ao, mas estes podem ser encontrados, para se ajustarem aos dados experimentais, da maneira tradicional. Trataremos a partir de agora apenas do ajuste de fun c oes lineares nos par ametros. V arios casos onde a depend encia no par ametro e n ao linear podem ser adaptados, mas sem d uvida deve-se pensar caso a caso. Destacam-se entre os ajustes lineares os ajustes por polin omios f (x) = a0 + a1 x + a2 x2 + . . . + ak xk e os ajustes por fun co es trigonom etricas f (x) = a0 + a1 cos(x) + a2 cos(2x) + . . . + ak cos(kx)+ +b1 sen(x) + b2 sen(2x) + . . . + bk sen(lx) .
5.2
Cont nuo vs. discreto
Vale a pena aqui introduzir um problema de ajuste ligeiramente modicado em rela c ao ao que vimos discutindo at e agora. Suponha que conhecemos determinada fun c ao y (x) num intervalo xo [c, d] e gostar amos de aproxim a-la o melhor poss vel por alguma fun c ao do tipo f (x) = a1 g1 (x) + . . . + ak gk (x) . Observe que antes t nhamos um conjunto de dados (xi , yi ), com i variando de 1 at e N . Agora nossa informa c ao se d a num conjunto innito de pontos: sabemos todos os (x, y (x)), com x variando no intervalo [c, d], porque conhecemos a fun c ao y (x). Mais uma vez precisamos de um crit erio para quanticar a proximidade entre f e os dados, ou seja, entre f e y . O correspondente qui-quadrado, neste caso, e dado por
d
Q(f ) =
c
(f (x) y (x))2 dx .
e o objetivo e procurar o conjunto de par ametros (a1 , a2 , . . . , ak ) que minimize Q(f ). Este conceito pode ser u til quando y (x) tem uma express ao conhecida mas muito complicada, e a substitu mos por uma express ao polinomial ou trigonom etrica f (x).
5.3. UM PARAMETRO
61
5.3
Um par ametro
y
Para introduzirmos o assunto gradualmente, conv em come car pelas situa c oes mais simples. Suponha que temos N dados (x1 , y1 ), (x2 , y2 ), . . ., (xN , yN ) como na gura ao lado e que queiramos ajustar uma fun c ao linear f (x) = ax a esses pontos. Isto signica que queremos achar o valor de a que melhor aproxima os pontos dados. Na gura, a reta pontilhada indica mais ou menos o que esperamos do nosso ajuste.
x
x1 x2 x3 x4 x5 x6
Em vez de tratarmos esse caso em particular, faremos uma discuss ao um pouco mais geral. Isto e, suponha que tenhamos dados como acima e queiramos ajustar uma fun ca o fa (x) = ag (x), com um par ametro e linear nesse u nico par ametro. O caso da fun c ao linear e apenas um caso particular, correspondente ` a fun c ao g (x) = x. Para cada a, podemos calcular o qui-quadrado Q(fa ), que denotaremos simplesmente por Q(a). Explicitamente
N N
Q(a) =
i=1
(fa (xi ) yi )2 =
i=1
(ag (xi ) yi )2 .
A fun c ao Q(a) deve ser assim entendida: para cada a calculamos o erro Q(a) cometido entre a fun c ao fa (x) = ag (x) e os dados yi . Nossa tarefa ser a procurar o valor a0 tal que Q(a0 ) seja m nimo. Notemos que para cada i vale
2 (ag (xi ) yi )2 = g (xi )2 a2 2g (xi )yi a + yi ,
isto e, cada termo da soma que dene Q(a) e um polin omio quadr atico na vari avel a. Como a soma de polin omios quadr aticos e um polin omio quadr atico, ent ao Q(a) tamb em e um polin omio quadr atico na vari avel a. Isto pode ser visto diretamente se desenvolvermos a soma que dene Q(a):
N N N
Q(a) =
i=1
g (xi )2
a2 2
g (xi )yi
i=1
a+
i=1
2 yi .
O gr aco de Q(a) e, portanto, uma par abola. A concavidade e para cima, pois o termo que multiplica a2 e certamente positivo, por ser uma soma de quadrados. Em conclus ao, achar o m nimo da fun c ao Q(a) se resume a achar o m nimo de uma par abola.
62
Conhecendo o c alculo diferencial, sabemos que podemos procurar o ponto de m nimo da d Q(a) = 0. par abola pelo ponto que anula a derivada, ou seja, procuramos a solu c ao de da Ent ao calcularemos a derivada de Q(a), mas n ao pela express ao acima, e sim pela express ao original, que se prestar a mais a generaliza c oes quando tivermos mais par ametros. Temos N d Q(a) = (ag (xi ) yi )2 , da a i=1 se lembrarmos que a derivada da soma e a soma das derivadas. Al em disso, pela Regra da Cadeia, a derivada de algo ao quadrado e duas vezes esse algo vezes a derivada do algo, temos que d Q(a) = da
N i=1
2g (xi )(ag (xi ) yi ) ,
lembrando que a derivada e em rela c ao ao par ametro a!!!! O fator 2 pode ser posto em evid encia no somat orio, de forma que quando igualarmos a derivada de Q(a) a zero ele desaparece. Ent ao queremos resolver
N i=1
ag (xi )2 g (xi )yi = 0 .
Rearranjando,
N N
a donde sai facilmente o valor de a:
g (xi )2 =
i=1 i=1
g (xi )yi ,
a=
N i=1 g (xi )yi N 2 i=1 g (xi )
Esse e o a0 que est avamos procurando! No caso de uma reta, a fun c ao g (x) e igual a x, e portanto a0 e dado por a0 =
N i=1 xi yi N 2 i=1 xi
Exerc cio 5.1 Invente um conjunto de dados que estejam pr oximos de uma reta passando pela origem (N = 6, por exemplo), e depois ajuste uma fun ca o ax. Num papel milimetrado, coloque os dados e depois esboce a reta obtida.
5.4
Dois par ametros
Suponha que queiramos ajustar uma reta aos dados experimentais, mas n ao necessariamente uma reta que passe pelo zero. Para isso, precisamos ajustar uma fun c ao na forma f (x) =
5.4. DOIS PARAMETROS
63
a + bx, isto e, uma fun c ao am. Esse problema se insere no caso geral de ajuste de uma fun c ao com dois par ametros, que de forma geral pode ser escrita como fa1 ,a2 (x) = a1 g1 (x) + a2 g2 (x) . Raciocinando como na Se c ao anterior, queremos minimizar a fun c ao erro
N
Q(fa1 ,a2 ) =
i=1
(fa1 ,a2 (xi ) yi )2 .
Agora, por em, a fun c ao erro depende de dois par ametros, a1 e a2 , por causa da forma de f , e a denotaremos por Q(a1 , a2 ):
N
Q(a1 , a2 ) =
i=1
(a1 g1 (xi ) + a2 g2 (xi ) yi )2 .
Precisamos de 3 dimens oes para tra car um gr aco da fun c ao Q. No ponto de m nimo de Q necessariamente todas as derivadas parciais se anulam. No presente caso, elas s ao duas: em rela c ao a a1 e em rela c ao a a2 . Observe que n ao necessariamente (a princ pio, sem um exame mais aprofundado) vale o inverso, isto e, se as derivadas parciais se anularem ent ao n ao obrigatoriamente se trata de um ponto de m nimo. Portanto o par de par ametros procurado deve satisfazer duas exig encias simult aneas: Q Q (a1 , a2 ) = 0 e (a1 , a2 ) = 0 . a1 a2 Se acharmos um ponto que satisfa ca essas duas exig encias teremos um candidato a ponto de m nimo de Q(a1 , a2 ). Adiante, no Cap tulo 6, discutiremos melhor at e que ponto podemos conar que a solu c ao desse problema seja realmente o m nimo procurado. As duas equa c oes podem ser escritas explicitamente, e ap os elabora c ao as deixaremos em uma forma conveniente. Temos
N i=1 N i=1
(a1 g1 (xi ) + a2 g2 (xi ) yi )2 = 0 a1 (a1 g1 (xi ) + a2 g2 (xi ) yi )2 = 0 a2
Usando a Regra da Cadeia, fazemos as derivadas parciais, obtendo

N i=1 N i=1
2g1 (xi )(a1 g1 (xi ) + a2 g2 (xi ) yi ) = 2g2 (xi )(a1 g1 (xi ) + a2 g2 (xi ) yi ) =
64
Os somat orios podem ainda ser decompostos:

N N N
2a1
i=1 N
g1 (xi )2 + 2a2
i=1 N
g1 (xi )g2 (xi ) 2 g2 (xi )g2 (xi ) 2
g1 (xi )yi
i=1 N
2a1
i=1
g2 (xi )g1 (xi ) + 2a2

i=1
g2 (xi )yi
i=1
Rearranjando de forma adequada ca evidente que reca mos num sistema linear de duas equa c oes nas inc ognitas a1 e a2 :
N i=1 g1 (xi )g1 (xi ) N i=1 g2 (xi )g1 (xi )
a1 a1
+ +
N i=1 g1 (xi )g2 (xi ) N i=1 g2 (xi )g2 (xi )
a2 a2
= =
N i=1 g1 (xi )yi N i=1 g2 (xi )yi
Todos os coecientes do sistema linear s ao tirados dos dados do problema, sendo que somente os termos independentes usam os yi s. Aqui vale a pena introduzir uma nota c ao simplicadora, que tornar a muito mais f acil a aplica c ao do acima exposto em problemas pr aticos. Denotaremos por gl , gm a soma
N
gl (xi )gm (xi )

i=1
e por gl , y a soma
N
gl (xi )yi .
i=1
Com essa nomenclatura, reescrevemos o sistema linear: g1 , g1 a1 g2 , g1 a1 + + g1 , g2 a2 g2 , g2 a2 = = g1 , y g2 , y ,
que o torna muito mais simples de memorizar! Exerc cio 5.2 Construa um conjunto de dados e ajuste uma reta, n ao necessariamente passando pela origem, usando o exposto nesta Se ca o.
5.5
Ajuste de qualquer fun c ao linear nos par ametros
As id eias das Se c oes anteriores podem ser usadas em qualquer situa c ao que se queira ajustar uma fun c ao que dependa linearmente dos par ametros, dada por f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , onde k e o n umero de par ametros. A fun c ao Q, que d a o erro do ajuste, depende agora dos k par ametros a1 , . . ., ak :
N
Q(a1 , a2 , . . . , ak ) =
i=1
(a1 g1 (xi ) + a2 g2 (xi ) + . . . + ak gk (xi ) yi )2 .
5.6. O CASO CONT INUO Se o m nimo de Q ocorre em (a1 , a2 , . . . , ak ) ent ao Q (a1 , a2 , . . . , ak ) = 0 , al
65
para todo l entre 1 e k , simultaneamente. Isso nos d a k equa c oes, lineares nos par ametros (sugere-se ao leitor fazer as passagens). Abaixo, mostramos as k equa c oes, usando a nota c ao introduzida ao nal da Se c ao anterior: g1 , g1 a1 g2 , g1 a1 . . . gk , g1 a1 + + + g1 , g2 a2 g2 , g2 a2 . . . gk , g2 a2 + ... + ... ... + ... + + + g1 , gk ak g2 , gk ak . . . gk , gk ak = = = = g1 , y g2 , y . . . gk , y
Logo adiante veremos a raz ao de se utilizar essa nota c ao para os somat orios, id entica ` a utilizada para o produto escalar de dois vetores. Aqui entendemos como vetores os conjuntos de dados da abscissa x = (x1 , . . . , xN ), da ordenada y = (y1 , . . . , yN ), e os valores das fun c oes gl avaliados em cada um desses pontos: gl = (gl (x1 ), . . . , gl (xN )). Assim a nota c ao faz sentido!
5.6
O caso cont nuo
No caso cont nuo, tudo se passa de maneira an aloga. Suponha que temos uma fun c ao y (x) denida no intervalo [c, d], e gostar amos de procurar uma fun c ao da forma f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , que se aproxime dela o melhor poss vel. O erro do ajuste tamb em e uma fun c ao dos k par ametros, mas desta vez e calculado por meio de uma integral, ao inv es de uma soma:
d
Q(a1 , a2 , . . . , ak ) =
c
(a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) y (x)) dx .
u E til comparar com o caso discreto. A soma ao longo do ndice i foi substitu da pela integral na vari avel x, dentro do intervalo [c, d]. Ao mesmo tempo, os yi deram lugar aos valores da fun c ao y (x). Mais uma vez, o ponto de m nimo de Q deve, necessariamente, anular todas as k derivadas parciais de Q, o que nos d a um crit erio de busca para esse m nimo, se resolvermos as k equa c oes resultantes. Para cada l = 1, . . . , k obtemos a equa c ao 0= Q (a1 , a2 , . . . , ak ) = al al
d c
(a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) y (x)) dx .
Como a vari avel de integra c ao x e diferente da vari avel de diferencia c ao al , podemos intercambiar a ordem das opera c oes, obtendo
d
0=
c
2gl (x) (a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) y (x)) dx ,
66
e, depois de uma simples manipula c ao da equa c ao, chegando a gl , g1 a1 + gl , g2 a2 + . . . + gl , gk ak = gl , y , onde gl , gm =

c d
gl (x)gm (x)dx
d
e gl , y =
c
gl (x)y (x)dx .
Juntando-se as k equa c oes resulta um sistema linear id entico ` aquele obtido no caso discreto, exceto pelo fato de que os produtos escalares s ao calculados por uma integral, ao inv es de uma soma.
5.7
Exemplos
Para que n ao que tudo muito abstrato, fa camos dois exemplos nesta Se c ao, um para o caso discreto e um para o caso cont nuo.
5.7.1
Dinam ometro
Suponha que precisemos usar um el astico como dinam ometro, para pesar objetos. O el astico e forte, e ag uenta v arios quilos. Queremos calibrar o el astico para que a medida do peso possa ser inferida pela distens ao que ele provoca no el astico, que pode ser facilmente medida por uma r egua. Para tanto, penduramos o el astico no teto, por uma ponta, e na outra atrelamos um balde, cujo peso n ao e suciente para distender o el astico (melhor ainda, serve para colocar o el astico muito pr oximo ` a posi c ao de repouso, e esticado). Com uma jarra, colocamos agua no balde, e a cada litro colocado (x) medimos a distens ao y do el astico. Os dados encontrados est ao na tabela abaixo. i 0 1 2 3 4 5 6 7 8 9 10 11 xi (kg) 0 1 2 3 4 5 6 7 8 9 10 11 yi (cm) 0.0 1.0 5.5 13.0 23.5 34.5 42.0 47.0 50.5 53.0 54.5 55.5
5.7. EXEMPLOS
67
Os dados da tabela s ao ct cios, mas qualitativamente se assemelham bastante a experi encias reais. Nota-se que a resposta do el astico e menor para pesos pequenos e grandes, e atinge seu m aximo aproximadamente entre 3 e 5 quilos. Discutiremos o ajuste da fun c ao y (x) (distens ao em fun c ao do peso), embora na apresenta c ao do problema est vessemos interessados na fun c ao inversa x(y ), que d a o peso em fun c ao da distens ao. Se o leitor zer um gr aco dos dados da tabela, ver a que a fun c ao peso em fun c ao da distens ao parece ser singular em 0 (tem uma derivada innita), e esse tipo de fun c ao se presta muito mal ao tipo de ajuste que faremos, baseado em polin omios. O problema desaparece se olharmos para y (x), pois esta fun c ao parece ter derivada zero em x = 0. Se pensarmos em ajustar y (x) por um polin omio, temos primeiramente que escolher seu grau. Claramente o grau desse polin omio deve ser maior do que 2, pois retas e par abolas n ao t em pontos de inex ao, como aparenta ser o caso. Polin omios c ubicos podem ter o formato desejado, mas talvez convenha ter um pouco mais de liberdade no ajuste usando polin omios de quarto grau. Para ajustar um polin omio de quarto grau temos que resolver um problema a 5 par ametros. Isso recair a num sistema linear de 5 equa c oes e 5 inc ognitas, e nesse caso conv em ter implementado um programa de computador para resolv e-lo. Como queremos apenas exemplicar as coisas, restringiremo-nos a um certo conjunto dos polin omios de quarto grau, que reduzir a nosso problema a apenas 3 par ametros, embora o mais recomend avel seja seguir a primeira solu c ao. Observe que se f (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 ent ao f (0) = c0 . Como n os j a sabemos que f (0) = 0, pois a nenhum peso corresponde nenhuma distens ao, ent ao j a podemos supor que c0 = 0. Al em disso, o gr aco d a a forte sensa c ao de que f (0) = 0, e como f (0) = c1 , ter amos c1 tamb em igual a zero. Desta forma, procuraremos o menor qui-quadrado entre a fam lia f (x) = a1 x2 + a2 x3 + a3 x4 , linear em seus tr es par ametros. Para uniformizar a nota c ao com a parte te orica, temos g1 (x) = x2 , g2 (x) = x3 e g3 (x) = x4 . Agora temos que calcular os produtos escalares gl , gm , com l e m variando entre 1 e 3. Como essas fun c oes s ao pot encias de x, nossa tarefa ca razoavelmente facilitada, porque v arios dos produtos escalares ser ao iguais. Por exemplo,
11 11 4 x2 i xi == i=0 i=0
g1 , g3 = e igual a
x6 i ,
11
g2 , g2 =
i=0
3 x3 i xi .
O sistema linear ca x4 i x5 i x6 i x5 i x6 i x7 i x6 i x7 i x8 i | | | yi x2 i . yi x3 i 4 yi xi
68
Calculando os coecientes e resolvendo, obtemos a1 = 2.5040, a2 = 0.28427 e a3 = 0.0088925. Se o leitor tentar resolver o sistema por conta pr opria ver a que ele e extremamente mal-condicionado. A solu c ao apresentada foi obtida com 10 algarismos signicativos, e arredondada somente ao nal para 5 algarismos signicativos. Recomenda-se vericar se a fun c ao obtida f (x) = 2.5040x2 0.28427x3 + 0.0088925x4 e compat vel com os dados (pelo menos visualmente), e isso pode ser feito atrav es de seu esbo co no gr aco, junto com os dados experimentais. Este teste sempre vale a pena em problemas de ajuste, para saber se n ao houve algum erro de conta. Outro teste de compatibilidade m nimo e observar que a1 teria que ser realmente positivo, pois a concavidade do gr aco e para cima em x = 0, e que a2 teria que ser negativo, para poder criar o ponto de inex ao na regi ao x > 0.
5.7.2
Cosseno aproximado por um polin omio
Para exemplicar um ajuste linear cont nuo, tomemos a fun c ao y (x) = cos x no intervalo [ , ]. Gostar amos de aproxim a -la tamb e m por um polin o mio, desta vez de grau 2. 2 2 Antes de resolver o problema, vale a pena investigar o que achamos que ser a o resultado. Se f (x) = a1 + a2 x + a3 x2 e o polin omio procurado, quanto devem ser, aproximadamente, os valores dos coecientes? Como o cosseno vale 1 em x = 0, e uma fun c ao par, tem concavidade para baixo e se anula e + , ent a o imaginamos um polin o mio quadr atico com caracter sticas semelhantes. em 2 2 Ele teria que ter a1 = 1 (para valer 1 em x = 0) e a2 = 0 (por ser par abola centrada na origem). Al em disso, a3 teria que ser negativo. Para que o polin omio se anule em e preciso 2 que 2 =0, 1 + a3 2 logo a3 deve estar pr oximo de 0.4. Veremos se nossos palpites se conrmam. Temos que calcular os produtos escalares, que agora s ao integrais. Por exemplo, g1 (x), g1 (x) =
2
1 1dx = .
Algumas integrais s ao nulas, pois o intervalo de integra c ao e sim etrico e os integrandos s ao o caso de g1 , g2 e g2 , g3 , por exemplo. Precisamos calcular fun c oes mpares. E
2
x2 dx =
3 , 12
x4 dx =
5 , 80
e do lado dos termos independentes

2
cos x = 2 ,
5.7. EXEMPLOS a integral de x cos x e nula, por ser mpar, e resta calcular
2
69
x2 cos x ,
2 1 2 usando a t ecnica de Integra c ao por Partes duas vezes, dando 2 4. O sistema linear ca igual a 3 | 2 0 12 3 0 | 0 . 0 12 5 3 1 2 0 80 | 2 4 12
Da segunda equa c ao conclui-se imediatamente que a2 = 0, o que reduz o sistema linear a duas equa c oes e duas inc ognitas. Resolvendo o sistema, obt em-se a1 = 0.98016 e a3 = 0.41777, valores bem pr oximos das estimativas iniciais. O m etodo que apresentamos, apesar de simples, tem problemas quando implementado comum que os sistemas lineares a serem resolvidos sejam muito mal numericamente. E condicionados. Por exemplo, no caso do ajuste de uma fun c ao y (x) denida no intervalo [0, 1] por um polin omio f (x) = a0 + a1 x + . . . + ak xk , temos gl (x) = xl1 , com l = 0, . . . , k, e
1
gl , gm =
0
xl+m dx =
1 . l+m+1
Isto implica que a matriz dos coecientes do sistema linear e uma matriz de Hilbert, que e um conhecido exemplo de matriz mal condicionada, como discutimos na Subse c ao 2.5.2. No Cap tulo 7 discutiremos outra forma de se fazer ajustes, que s ao especialmente u teis para ajustes polinomiais e trigonom etricos. Antes, por em, discorreremos um pouco mais abstratamente sobre o m etodo dos m nimos quadrados, investigando, por exemplo, quest oes como a unicidade, embora o Cap tulo 7 possa ser compreendido sem o aux lio do Cap tulo 6. Exerc cio 5.3 Ajuste f (x) = a(arctan x)2 aos seguintes dados xi yi por m nimos quadrados. Exerc cio 5.4 Ajuste f (x) = a + b(x 1)2 por m nimos quadrados a ` fun ca o y (x) = x3 3x, no intervalo [0, 2]. 0.0 0.0 1.0 0.25 2.0 1.00 3.0 1.50 4.0 1.65
70
Cap tulo 6
Levando a s erio o produto escalar

6.1 Produto escalar e dist ancia
Vale a pena aqui uma pequena digress ao, que nos levar a a uma compreens ao melhor do problema do ajuste de fun c oes lineares nos par ametros e nos permitir a, al em disso, dispor de outras maneiras de realizar o ajuste. Primeiramente, como de praxe, concentremo-nos no problema de ajuste discreto onde, dados os pontos (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ), queremos achar o conjunto de par ametros (a1 , . . . , ak ) que minimize o qui-quadrado de f (x) = a1 g1 (x) + a2 g2 (x) + . . . + ak gk (x) , para um certo conjunto de fun c oes previamente xadas g1 (x), . . . , gk (x). Para entendermos o problema de forma geom etrica, consideremos o espa co RN das N uplas u = (u1 , . . . , uN ), isto e, o espa co de vetores N -dimensional. Assim, os valores da ordenada nos pontos dados podem ser representados por um vetor de RN : y = (y1 , y2 , . . . , yN ) . Al em disso, cada uma das fun c oes gl (x), l = 1, . . . , k gera um vetor de RN , cujas coordenadas s ao os valores da fun c ao nos pontos x1 , . . . , xN : gl = (gl (x1 ), gl (x2 ), . . . , gl (xN )) . O produto escalar ou produto interno em RN e a fun c ao que associa a cada par de vetores u = (u1 , . . . , uN ) e v = (v1 , . . . , vN ) o n umero real u, v = u1 v1 + u2 v2 + . . . + uN vN . Sendo assim, ca evidente que a deni c ao que demos de gl , gm corresponde exatamente ao produto escalar dos vetores gl e gm , e gl , y e o produto escalar dos vetores gl e y . 71
72
CAP ITULO 6. LEVANDO A SERIO O PRODUTO ESCALAR
O produto escalar fornece automaticamente uma no c ao de tamanho de vetores (ou norma de vetores, no jarg ao matem atico) e, em conseq u encia, de dist ancia no espa co RN . Em R2 , o 2 tamanho u de um vetor u = (u1 , u2 ) e dado pelo Teorema de Pit agoras: u = u2 1 + u2 . E 3 f acil ver com o Teorema de Pit agoras que em R a norma de um vetor u = (u1 , u2 , u3 ) e dada N 2 + u2 . A generaliza por u = u2 c a o em R e natural. A norma de u = ( u , . . . , uN ) + u 1 3 2 1 e dada por u =
2 2 u2 1 + u2 + . . . + uN ,
express ao que pode ser escrita em termos do produto escalar: u = u, u .
A no c ao de norma d a origem a ` id eia de dist ancia em RN . Olhando agora u e v como pontos, a dist ancia entre eles e a norma do vetor u v (ou v u, tanto faz). Denotaremos essa dist ancia por d(u, v ) e, explicitamente, ela vale
N
d(u, v ) =
u v, u v =
i=1
(ui vi )2 .
Podemos ainda relacionar o qui-quadrado com isso tudo. O qui-quadrado de uma fun c ao f (para esses dados), denotado por Q(f ), e dado por
N
Q(f ) =
i=1
(f (xi ) yi )2 .
Se chamarmos de f o vetor (f (x1 ), f (x2 ), . . . , f (xN )), ent ao Q(f ) = f y, f y = d(f, y )2 . Portanto, minimizar o qui-quadrado e um problema de minimizar a dist ancia ao vetor y no espa co RN . Quando limitamos f (x) a ser uma combina c ao linear das fun c oes g1 (x), . . . , gk (x) estamos, automaticamente, limitando o vetor f a ser uma combina c ao linear dos vetores g1 , . . . , gk . Isso implica que vamos procurar f que minimiza a dist ancia ao vetor y apenas entre os vetores que s ao uma combina c ao linear dos vetores g1 , . . . , gk . Mas o que e o conjunto dos vetores que s ao combina c ao linear dos vetores g1 , . . . , gk ? Esse tipo de conjunto e chamado de subespa co vetorial (de RN ). Um subespa co vetorial e um conjunto com a seguinte propriedade: qualquer combina c ao linear de vetores do conjunto e tamb em um vetor do conjunto. Por exemplo, em R3 um subespa co vetorial s o pode ser de um dos seguintes tipos: a origem (dimens ao zero), isto e, o conjunto formado apenas pelo ponto (0, 0, 0); uma reta que passa pela origem (dimens ao 1); um plano que passa pela origem (dimens ao 2); ou todo o R3 (dimens ao 3). Note que todo subespa co cont em a origem, pois se u pertence ao subespa co ent ao u u = 0 tamb em pertence. Em RN tamb em existem subespa cos de todas as dimens oes variando desde zero at e N. Pois bem, o problema do ajuste se reduz agora a achar, dentro do subespa co formado pelas combina c oes lineares de g1 , . . . , gl , o ponto que minimiza a dist ancia a um certo ponto y . Disso trataremos na pr oxima Se c ao.
6.2. EXISTENCIA E UNICIDADE DE SOLUC OES NO AJUSTE LINEAR
73
6.2
Exist encia e unicidade de solu c oes no ajuste linear
Nesta Se c ao discutiremos a possibilidade de solu c ao para o problema do ajuste linear, no caso discreto. Deixaremos o caso cont nuo para a pr oxima Se c ao. Lembraremos alguns fatos de Geometria Anal tica e Algebra Linear, sem demonstr a-los todos. Os que faltarem podem ser encontrados em textos cl assicos, voltados especicamente para esse assunto. Seja G um subespa co de RN . Denimos o subespa co G dos vetores de RN ortogonais a todo vetor de G, lembrando que u e v s ao ortogonais se u, v = 0. Fica para o leitor mostrar que G e um subespa co. O primeiro fato para o qual chamaremos a aten c ao e o seguinte: qualquer y RN pode ser escrito como soma de um vetor de G com um vetor de G . Para mostrar isso, tome uma base ortonormal {w1 , . . . , wr } de G (a exist encia dessa base e um dos fatos que cam de lado nessa exposi c ao, mas o leitor pode encontrar nos livros de Algebra Linear no t opico Ortogonaliza c ao de Gram-Schimdt). O que caracteriza esse conjunto como base ortonormal e o fato de ser base (todo vetor de G pode ser escrito como combina c ao linear dos vetores desse conjunto) e wi , wj ser igual a zero se i = j e igual a 1 se i = j . Agora tome o vetor
r
u=
i=1
y, wi wi .
O vetor u e uma soma de m ultiplos dos wi s (de fato, e a soma da proje c ao de y sobre as dire c oes dadas pelos wi s), portanto e um vetor de G. Por outro lado, vamos mostrar que yu e um vetor de G . Com isso, teremos y = (y u) + u , mostrando que y pode ser escrito como soma de um vetor de G (o vetor y u) com um vetor de G (o vetor u). Mostrar que y u G e mostrar que y u e ortogonal a qualquer vetor de G. Um vetor qualquer g de G pode ser escrito como combina c ao linear dos vetores da base:
r
g=
i=1
i wi .
Para mostrar que y u, g = 0 basta substituir a express ao de u e a express ao de g , em termos dos vetores da base, e levar em conta que a base e ortonormal. Fica como exerc cio!!! A segunda observa c ao e que a decomposi ca o de um vetor y em uma soma de dois vetores, um de G e outro de G eu nica. Em outras palavras, se y = u + v = u +v , com u, u Ge v, v G , ent ao u = u ev=v . Para mostrar isso, vamos apenas nos utilizar do fato de que ou nico vetor que pertence a ambos os subespa cos e a origem (pois se u pertence a ambos os subespa cos, ent ao u e ortogonal a ele mesmo, ou seja, u, u = 0; s o que u, u = u 2 , e o u nico vetor que tem norma zero e o vetor nulo). Se y = u + v e y = u +v ent ao 0 = y y = (u u ) + (v v ) , isto e, u u=vv .
74
Do lado esquerdo da igualdade temos um vetor de G e do lado direito da igualdade temos um vetor de G , e eles s ao iguais. Logo eles t em que ser ambos nulos, e a arma c ao segue. r O vetor u = i=1 y, wi wi e a componente de y no subespa co G, tamb em chamada de proje ca o de y em G. A terceira observa c ao que temos a fazer e que o vetor u e o ( unico) elemento de G a ` menor dist ancia de y . Para ver a raz ao, tome um outro vetor qualquer g G. A dist ancia de g a y e a raiz quadrada de g y, g y , que mostraremos ser maior do que a dist ancia de u a y , que e a raiz quadrada de u y, u y . Para comparar as duas dist ancias, escrevemos g y, g y = g u + u y, g u + u y = g u, g u + 2 g u, u y + u y, u y , mas como g u G e u y G , segue que g u, u y = 0. Al em disso, g u, g u e positivo, logo g y, g y > u y, u y ,
onde a desigualdade estrita conrma a unicidade. Finalmente lembremos que, no problema do ajuste, o subespa co vetorial em quest ao eo conjunto de todas as combina c oes lineares dos vetores g1 , . . . , gk . Nesse subespa co, existe um u nico elemento que minimiza a dist ancia ao ponto y , como conclu mos acima. Ser a que da podemos concluir que sempre existe um u nico conjunto de par ametros (a1 , . . . , ak ) tal que f = a1 g1 + . . . + ak gk minimiza a dist ancia a y ? A resposta e n ao, nem sempre!! Embora s o haja um elemento u do subespa co que minimize a dist ancia, pode haver diversas maneiras de se escrever esse elemento como combina c ao linear dos vetores g1 , . . . , gk . Para que haja apenas uma maneira de se escrever u e preciso que os vetores g1 , . . . , gk sejam linearmente independentes, isto e, que nenhum deles possa ser escrito como combina c ao linear dos outros. Por exemplo, suponha que o n umero N de pontos dados seja menor do que o n umero k de fun c oes do ajuste. N ao h a como ter k > N vetores linearmente independentes em RN , portanto certamente n ao ser au nica a solu c ao para o problema de ajuste. Outro exemplo, suponha que g1 (x) = 1, g2 (x) = x, g3 (x) = x2 , . . ., gk (x) = xk1 , e N k . Ser a que a solu c ao do problema de ajuste eu nica? A resposta e sim, mas o leitor est a convidado a justic a-la inspirando-se no que est a escrito na Se c ao A.7.
6.3
O caso cont nuo
No caso cont nuo n ao temos um espa co de dimens ao nita (RN ) para trabalhar. Que espa co utilizamos? Ser a que as id eias das se c oes anteriores tamb em se aplicam? Veremos que sim, quase sem modica c oes! No lugar de RN consideramos um espa co de fun c oes, que podemos particularizar (para n ao dicultar as coisas). Suponha que y (x) seja uma fun c ao cont nua denida no intervalo [c, d]. Ent ao consideramos o conjunto E de todas as fun c oes cont nuas denidas nesse intervalo. Em E est ao denidas a adi ca o e a multiplica ca o por n umeros reais: se h1 e h2 s ao fun c oes de E, ent ao dene-se a fun c ao h = h1 + h2 como sendo aquela que leva x em h(x) = h1 (x) + h2 (x), e se e um n umero real, dene-se a fun c ao h = h1 como sendo aquela que leva x em h(x) = h1 (x). O conjunto E e um espa co vetorial porque essas opera c oes sempre resultam em elementos de E. A origem ou elemento nulo de E e a fun c ao identicamente nula em [c, d], e assim por diante.
6.4. OUTROS PRODUTOS ESCALARES: PESOS
75
O espa co vetorial E n ao tem dimens ao nita porque n ao podemos escolher um n umero nito de elementos h1 , . . . , hn que gere E, isto e, tal que qualquer elemento de E possa ser escrito como combina c ao linear desses elementos. No entanto, dado o conjunto de fun c oes g1 , . . . , gk (aquelas com as quais queremos fazer o ajuste), o conjunto de todas as suas combina c oes lineares e um subespa co vetorial de dimens ao nita de E (que chamaremos de G). Podemos tamb em denir um produto interno, ou produto escalar em E. Se h e f s ao fun c oes de E, ent ao
d
h, f =
c
h(x)f (x)dx ,
que foi a deni c ao que usamos previamente, como nota c ao. Observe o leitor que nas considera c oes que zemos nas Se c oes anteriores, s o nos utilizamos das propriedades do produto interno, a saber: 1. Simetria: u, v = v, u ; 2. Linearidade: u + v, w = u, w + v, w ; 3. Positividade: se u = 0, u, u > 0. Essas propriedades podem ser usadas para denir o produto interno, como zemos com o determinante no Cap tulo A. N ao e dif cil mostrar que a deni c ao acima de h, f no espa co E e a de um produto interno, e da seguem as conseq u encias que adv em diretamente dessas propriedades. O subespa co G tem dimens ao nita, logo tem uma base ortonormal, e da podemos mostrar que todo elemento y E pode ser decomposto de forma u nica como uma soma de duas fun c oes: y =f + , onde f G e G . A fun c ao f e a proje c ao de y em G, e minimiza a dist ancia de y aos pontos de G, sendo portanto uma solu c ao do problema de ajuste.
6.4
Outros produtos escalares: pesos
Pensando novamente no caso discreto (mas com conseq u encias igualmente v alidas no caso cont nuo), notamos que o c alculo do qui-quadrado pressup oe uniformidade dos dados (xi , yi ), isto e, cada dado entra com igual peso na f ormula
N
Q(f ) =
i=1
(f (xi ) yi )2 .
No entanto, e comum sabermos, em geral em medidas experimentais, que certos dados s ao mais con aveis do que outros. A atribui c ao de um peso a cada dado se daria da seguinte forma: para cada i escolhemos um certo pi > 0, que entra no c omputo do qui-quadrado da seguinte maneira:
N
Q(f ) =
i=1
pi (f (xi ) yi )2 .
76
Assim, quanto mais alto for wi maior ser a a contribui c ao do dado (xi , yi ) para o qui-quadrado. Por conseguinte, ao procurarmos minimizar o qui-quadrado teremos que obter menores diferen cas f (xi ) yi para os valores de i tais que pi seja mais alto. Isso far a com que a fun c ao f (x) ajustada aproxime melhor esses pontos (xi , yi ) em detrimento de outros que tenham menor peso. Em medidas experimentais, em geral, o peso e dado pelo inverso da vari ancia pi = 1 2 , i
uma estimativa do erro que deve ser obtida de forma independente. Quando todos os dados t em estimativas de erro iguais, ent ao o m etodo de m nimos quadrados se reduz ` aquele que hav amos visto anteriormente. No caso cont nuo o peso e uma fun c ao p(x) denida no intervalo [c, d] da fun c ao dada y (x), e o qui-quadrado e dado pela express ao
d
Q(f ) =
c
p(x)(f (x) y (x))2 dx .
Se o qui-quadrado adotado tem pesos, temos que reformular a deni c ao do produto escalar entre dois vetores u = (u1 , . . . , uN ) e v = (v1 , . . . , vN ) para
N
u, v =
i=1
p i u i vi ,
e no caso cont nuo, se u(x) e v (x) s ao fun c oes do intervalo [c, d], para
d
u, v =
c
p(x)u(x)v (x)dx .
Esses produtos escalares satisfazem as propriedades que se esperam dos produtos escalares: simetria, linearidade e positividade. Toda a argumenta c ao feita anteriormente se segue de forma id entica, e o menor qui-quadrado entre a fam lia de fun c oes a k par ametros f (x) = a1 g1 (x) + . . . + ak gk (x) ser a para a k -upla (a1 , . . . , ak ) que satisfaz o sistema linear g1 , g1 a1 g2 , g1 a1 . . . gk , g1 a1 + + + g1 , g2 a2 g2 , g2 a2 . . . gk , g2 a2 + ... + ... ... + ... + + + g1 , gk ak g2 , gk ak . . . gk , gk ak = = = = g1 , y g2 , y . . . gk , y
onde os produtos escalares foram modicados para incluir os pesos.
Cap tulo 7
Fam lias ortogonais

7.1 Deni c oes e exemplos
g1 , g1 a1 g2 , g1 a1 . . . gk , g1 a1 + + + g1 , g2 a2 g2 , g2 a2 . . . gk , g2 a2 + ... + ... ... + ... + + + g1 , gk ak g2 , gk ak . . . gk , gk ak = = = = g1 , y g2 , y . . . gk , y
Podemos observar que a resolu c ao do sistema linear
seria enormemente facilitada se as fun c oes g1 , . . . , gk satiszessem a propriedade de que os produtos escalares mistos sejam nulos, isto e, gl , gm = 0 , se l = m. Isto e o mesmo que dizer que as fun c oes g1 , . . . , gk s ao todas ortogonais entre si ou, de modo similar, que a fam lia de fun c oes {g1 , . . . , gk } e ortogonal. Neste caso, ter amos gl , y al = , gl , gl e portanto
k
f=
l=1
y, gl gl . gl , gl
Melhor ainda seria se a fam lia {g1 , . . . , gk } fosse ortonormal, isto e, gl , gl = 1 para todo l = 1, . . . , k, pois a f ormula caria
k
f=
l=1
y, gl gl .
O leitor que acompanhou atentamente o Cap tulo 6 perceber a que esta nada mais e que a f ormula da proje c ao de y no subespa co G das combina c oes lineares de g1 , . . . , gk . 77
78
CAP ITULO 7. FAM ILIAS ORTOGONAIS
Vejamos a partir de agora um exemplo de como podemos fazer um ajuste de m nimos quadrados sem recorrer a um sistema linear, usando, ao inv es, o conceito de ortogonalidade. O exemplo e de um ajuste cont nuo, mas as id eias de apllicam no caso discreto. Como primeiro exemplo, xemos o intervalo [0, 1] como dom nio para as fun c oes de E (isto e, c = 0 e d = 1). Se tomarmos as fun c oes g1 (x) = 1, g2 (x) = x, g3 (x) = x2 , . . ., gk (x) = xk1 , o subespa co G de suas combina c oes lineares consiste de todos os polin omios de grau at e k 1. N ao e dif cil mostrar que essas fun c oes s ao linearmente independentes, formando portanto uma base de G. No entanto, elas n ao s ao ortogonais entre si (e tampouco t em norma igual a 1). Para ver isso, basta tomar um dos produtos internos:
1 1
g1 , g2 =
0
g1 (x)g2 (x)dx =
0
xdx =
1 =0. 2
E ent ao como construir uma base ortonormal (ou ortogonal) de G? Faremos isso inspirados no processo de Ortogonaliza c ao de Gram-Schimdt. S o para n ao confundir, denominaremos os vetores dessa nova base de f1 , . . . , fk . Imporemos primeiramente que o primeiro vetor da base seja a fun c ao constante igual a 1: f1 (x) 1. A segunda fun c ao ser a um polin omio de grau 1: f2 (x) = a + bx, mas podemos supor que b = 1, se multiplicarmos por uma constante (multiplica c oes por constantes s o mudam a norma, mas n ao inuenciam na ortogonalidade). Al em disso, queremos que ele seja ortogonal ao primeiro, ou seja, queremos que
1 1
f1 , f2 =
0
f1 (x)f2 (x)dx =
0
(a + x)dx = 0 .
Isso nos obriga a ter a = 1 2 , logo 1 f2 (x) = + x . 2 A terceira fun c ao ser a um polin omio de grau 2, cujo coeciente de ordem mais alta tamb em ser a igual a 1: f3 (x) = a + bx + x2 (a e b diferentes dos anteriores, aqui usados somente como par ametros auxiliares). Esta fun c ao deve ser ortogonal ` as duas previamente criadas, isto e, f1 , f3 = 0 , f2 , f3 = 0 . Da primeira equa c ao sai
0 1
(a + bx + x2 )dx = 0 , e da segunda sai

0 1
1 ( + x)(a + bx + x2 )dx = 0 . 2
As duas equa c oes reunidas formam um sistema linear nas inc ognitas a e b, e resolvendo-o ca determinada a fun c ao f3 . O processo continua do mesmo jeito, at e se chegar ` a k - esima fun c ao. Observe que n ao nos livramos totalmente dos sistemas lineares para acharmos a base ortogonal, mas nosso trabalho car a enormemente facilitado se algu em j a tiver feito isso por n os. Existem tabelas de polin omios ortogonais prontas para serem usadas! Cada fam lia leva em conta a deni c ao
7.2. CALCULANDO POLINOMIOS ORTOGONAIS POR RECORRENCIA
79
do produto escalar utilizado que, em nosso caso, depende somente do intervalo de integra c ao (e do peso, se for o caso). Veremos logo adiante como usar tabelas de fun c oes ortogonais. Exerc cio 7.1 Considere (x1 , x2 , x3 , x4 ) = (0.0, 0.2, 0.7, 1.3) e o produto escalar
4
f, g =
i=1
f (xi )g (xi ) .
Ache p(x) = x2 + ax + b que seja ortogonal a q (x) = x, em rela ca o a esse produto escalar. Exerc cio 7.2 Mostre que as fun co es sen x e cos x s ao ortogonais no intervalo [0, 2 ] (admitindo-se o produto escalar com peso uniforme).
7.2
Calculando polin omios ortogonais por recorr encia
Na Se c ao anterior vimos que podemos recorrer a polin omios ortogonais para facilitar a resolu c ao do problema de ajuste. No entanto,a obten c ao dos polin omios ortogonais recai na resolu c ao de v arios sistemas lineares, tarefa que pode ser t ao ou mais trabalhosa do que se n ao us assemos esses polin omios. A boa not cia, por em, e que h a uma maneira mais f acil de se calcular os polin omios ortogonais, atrav es de uma rela c ao de recorr encia. Essa rela c ao de recorr encia funciona tanto no caso discreto (com qualquer conjunto de pontos x1 , . . . , xN ) como no caso cont nuo (com qualquer intervalo de integra c ao), com ou sem pesos, ou seja, com qualquer dos produtos internos que descrevemos. Procede-se assim: xa-se f0 (x) 1 e calcula-se o primeiro polin omio f1 (x) = x + a, da mesma forma que zemos previamente. O valor de a ir a depender do produto interno, e e escolhido de maneira que f0 , f1 = 0. Agora suponha que o processo continua, como descrito na Se c ao anterior, obtendo-se polin omios f2 , f3 , f4 , etc, de graus 2, 3, 4, etc, exigindo-se apenas que o coeciente de mais alto grau seja sempre igual a 1. Em cada etapa, {f0 , f1 , . . . , fk } gera o subespa co formado por todos os polin omios de grau k (mostre isso como exerc cio, com um argumento indutivo). Observe que come camos a numerar nossos polin omios a partir de zero, pois assim seu ndice assim corresponder a exatamente a seu grau, facilitando os argumentos. O ponto central e a seguinte arma c ao, que permitir a calcular fk (x), para k 2, somente com os polin omios fk1 e fk2 : para todo k 2, vale xfk1 (x) fk (x) = ak fk1 (x) + bk fk2 (x) , onde ak e bk s ao coecientes apropriados. Note que para k = 2 ela e verdadeira porque xf1 (x) f2 (x) e um polin omio de grau 1 (o termo x2 cancela, pois os coecientes de mais alto grau s ao sempre iguais a 1). Logo esse polin omio pode ser escrito como combina c ao linear de f0 e f1 , isto e xf1 (x) f2 (x) = a2 f1 (x) + b2 f0 (x) .
80
Para k 3 o racioc nio e parecido, mas h a uma pequena diculdade a resolver. O polin omio xfk1 (x) fk (x) tem grau k 1, pois o termo xk se cancela. Segue que ele pode ser escrito como combina c ao a parte dessa combina linear dos vetores fk1 , fk2 , . . ., f1 , f0 . Chamaremos de f c ao linear que corresponde ` a combina c ao de polin omios fj com j k 3. Ent ao
(x) . xfk1 (x) fk (x) = ak fk1 (x) + bk fk2 (x) + f A nossa arma c ao estar a demonstrada se provarmos que f e identicamente nulo. Como f e um polin omio de grau no m aximo k 3, basta mostrarmos que , fj = 0 f
na express para todo j k 3. Isolando f ao acima, usamos o fato de que, se j k 3, ent ao fk , fj = 0, fk1 , fj = 0 e fk2 , fj = 0, restando apenas mostrar que xfk1 (x), fj (x) = 0 . A entra o pulo do gato, pois se observarmos as deni c oes dos produtos internos, veremos que xfk1 (x), fj (x) = fk1 (x), xfj (x) .
Como xfj (x) tem grau j + 1, e j + 1 e menor do que k 1, ent ao xfj (x) pode ser escrito como combina c ao linear de f0 , f1 , . . ., fk2 , e o produto interno resulta nulo. Talvez fosse mais did atico apresentar o uso da arma c ao antes de sua demonstra c ao. Optamos pelo contr ario porque a arma c ao n ao parece ser muito obvia. Ela d a uma f ormula para fk (x) em fun c ao dos dois polin omios anteriores: fk (x) = (x ak )fk1 (x) bk fk2 (x) , sendo apenas necess ario calcular ak e bk . Para isso, fazemos o produto interno da equa c ao por fk1 (a m de obter ak ) e por fk2 (a m de obter bk ). Ou seja, de xfk1 , fk1 fk , fk1 = ak fk1 , fk1 + bk fk2 , fk1 resulta ak = e de resulta xfk1 , fk1 , fk1 , fk1
xfk1 , fk2 fk , fk2 = ak fk1 , fk2 + bk fk2 , fk2 bk = xfk1 , fk2 . fk2 , fk2
Exerc cio 7.3 Obtenha os quatro primeiros polin omios ortogonais usando o m etodo acima descrito, para o produto interno
1
f, g =
1
f (x)g (x)dx .
DE POLINOMIOS 7.3. UM EXEMPLO DE APLICAC AO ORTOGONAIS
81
7.3
Um exemplo de aplica c ao de polin omios ortogonais
Gostar amos de aproximar a fun c ao y (x) = sen x (em radianos) no intervalo [1, 1] por um polin omio c ubico. Fazendo o exerc cio do nal da Se c ao anterior, constatamos que qualquer polin omio c ubico pode ser gerado por combina c ao linear dos polin omios ortogonais f0 (x) = 1 , f1 (x) = x , f2 (x) = x2 3 1 , f3 (x) = x3 x . 3 5
Estamos procurando o melhor conjunto de par ametros que ajuste f = a0 f0 + a1 f1 + a2 f2 + a3 f3 , e como vimos anteriormente, f e dada pela proje c ao de y no espa co G das combina c oes lineares desses polin omios. Como eles s ao ortogonais, f e facilmente calcul avel, isto e, cada um dos coecientes al , l = 0, 1, 2, 3 e dado por al = y, fl . fl , fl
Os denominadores s ao as normas ao quadrado. Temos f0 , f0 = 2 , f1 , f1 = 8 8 2 , f2 , f2 = , f3 , f3 = . 3 45 175
Exerc cio 7.4 Termine o exemplo. Calcule os produtos y, fl , onde ser a preciso integrar xl sen x (sugest ao: integra ca o por partes). Tente n ao errar nas contas. Obtenha os coecientes e explicite a fun ca o f como um polin omio c ubico. Desenhe um gr aco do polin omio obtido e compare com a fun ca o h(x) = sen x. Exerc cio 7.5 Ajuste, por m nimos quadrados, um polin omio de primeiro grau a ` fun ca o h(x) = sen x no intervalo [0, 1], usando polin omios ortogonais. Exerc cio 7.6 Ajuste um polin omio quadr atico a ` fun ca o ex em [1, 1] usando polin omios ortogonais.
7.4
Exemplo de an alise harm onica
Al em dos polin omios ortogonais, e muito importante tamb em a seguinte fam lia de fun c oes trigonom etricas, denidas no intervalo [0, 2 ] (ou mesmo no intervalo [, ]), que e a cole c ao de todas as fun c oes do tipo
k
a0 +
l=1
(al cos lx + bl sen lx) .
Todas as fun c oes 1, cos x, cos 2x, cos 3x, . . ., sen x, sen 2x, sen 3x, etc, s ao ortogonais entre si (prove!). Portanto, se quisermos ajustar y por uma fun c ao desse tipo, teremos a0 = 1 2
2
y (x) dx , al =
0
y (x) cos(lx) dx
0
82 e bl =
y (x) sen(lx) dx ,
0
para todo l = 1, 2, 3, . . . , k. O fator 21 a norma ao quadrado da fun c ao em a0 corresponde ` 1 1, e os fatores nos demais termos correspondem ` a norma ao quadrado de cada uma das fun c oes restantes (prove tamb em isto!). Esse tipo de ajuste e chamado de an alise harm onica. O problema e que em geral a fun c ao a ser ajustada n ao se encontra denida no intervalo [0, 2 ], e mesmo assim gostar amos de aproxim a-la por fun c oes trigonom etricas. Mas a , se o intervalo for escrito como [c, d], basta usar as fun c oes 1 , sen 2l xc dc , cos 2l xc dc , l = 1, 2, . . .
Para exemplicar, faremos a an alise harm onica de y (x) = x(1 x) (uma par abola) no intervalo [0, 1]. Teremos que usar as fun c oes 1, sen(2lx), cos(2lx), l = 1, 2, . . ., que s ao ortogonais entre si. 1 Primeiro calculamos as normas ao quadrado. Temos a mais f acil, 0 1 1dx = 1. Al em disso
1
sen2 (2lx) dx =
0
1 2l
1
2l
sen2 u du =
0
l 2l 1 2
sen2 u du =
0
1 2
sen2 u du ,
0
e analogamente
0 2
cos2 (2lx) dx =
2
cos2 u du .
0
As integrais 0 sen2 u du e 0 cos2 u du s ao iguais a (prove, usando que cos 2u = 1 2 sen2 u = 2 cos2 u 1), portanto todas as normas ao quadrado s ao iguais a 1 2 , excetuando-se a primeira fun c ao, que tem norma 1. Agora temos que calcular os produtos internos dessas fun c oes com a fun c ao y (x) = x(1 1 x) = x x2 . Com a primeira fun c ao e a pr opria integral de x(1 x), que vale 6 . Ent ao a0 =
1 0
1 x(1 x) dx
1 0
1 1 dx
1 . 6
Depois observamos que os bl s s ao todos nulos. Isso porque a fun c ao x(1 x) e par em 1 , e as fun c oes sen(2lx) s ao mpares em rela c ao ao mesmo ponto, donde o rela c ao a x = 2 produto das duas e mpar em rela c ao a x = 1 e sim etrico em torno 2 . Como o intervalo [0, 1] 1 ao de x = 2 , ent
1 0
x(1 x) sen(2lx) dx = 0 ,
para todo l 1. S o nos resta obter al =
1 0
x(1 x) cos(2lx) dx
1 2
7.4. EXEMPLO DE ANALISE HARMONICA Com u = 2lx obtemos al = 2 (2l)2

2l 0
83
u cos u du
2 (2l)3
2l
u2 cos u du .
0
A primeira integral e nula, porque u cos u pode ser escrito como (u l) cos u + l cos u. O primeiro termo da soma e uma fun c ao mpar em rela c ao a x = l, que e o ponto intermedi ario do intervalo, e portanto sua integral e nula. E a integral de cos u em qualquer per odo completo tamb em e nula. Quanto ` a segunda integral, integramos por partes duas vezes e achamos a primitiva u2 sen u + 2u cos u 2 sen u da fun c ao u2 cos u. Usando a primitiva, chegamos em 1 . 2 l2 Assim podemos fazer o ajuste de x(1 x) usando quantas fun c oes trigonom etricas quisermos. Se formos at e l = k , teremos al = f (x) = 1 1 6 2
k
l=1
1 cos(2lx) l2
(o leitor est a convidado a fazer um gr aco de x(1 x) e um gr aco de f (x) para l = 2 e comparar visualmente o resultado). Est a fora do escopo deste livro demonstrar isto, mas se tomarmos k indo para innito a fun c ao de ajuste f (x) estar a cada vez mais perto da fun c ao ajustada y (x) = x(1 x) no intervalo [0, 1]. Em particular, f (0) estar a cada vez mais perto de y (0), que e igual a zero. Portanto k 1 1 1 =0. lim 2 k 6 l2
l=1
Escrito de outra forma,

k k
lim
l=1
1 2 = . l2 6
k
O limite da soma e denotado como se a soma fosse innita

l=1
1 1 lim . 2 k l2 l i=1
Assim, podemos obter uma f ormula para : = 6

l=1
1 . l2
Exerc cio 7.7 Prove que a fam lia {1, cos(lx), sen(lx)} e ortogonal em qualquer intervalo l=1 de comprimento 2 . Exerc cio 7.8 Fa ca um pequeno programa de computador para ver se a f ormula acima est a correta. O computador ser a necess ario porque a converg encia para o limite e bastante lenta, e um valor de k muito grande e necess ario para se conseguir uma boa aproxima ca o de .
84
7.5
Mudan ca de vari aveis: como usar tabelas de fun c oes ortogonais
Freq uentemente conhecemos uma fam lia de polin omios ortogonais (por exemplo, usando uma tabela), ou mesmo a fam lia de fun c oes trigonom etricas acima mencionada, mas a fun c ao h(x) da qual queremos fazer o ajuste est a denida em um intervalo diferente. Ser a que ainda assim podemos aproveitar a informa c ao dispon vel? A resposta e sim, e a maneira e simples: recorremos a uma mudan ca de vari aveis am. Assumiremos que temos uma fam lia de fun c oes ortogonais f0 , f1 , f2 , . . . no intervalo [c, d], ]. e gostar amos de ter uma fam lia de fun c oes ortogonais no intervalo [ c, d ] no intervalo Em primeiro lugar, constru mos uma fun c ao am L que leve o intervalo [ c, d [c, d], sobrejetivamente. Isso pode ser feito explicitamente: y = L(x) = c + dc (x c ) . c d c d (y c) . dc
Sua inversa tamb em pode ser calculada de forma expl cita: x = L1 (y ) = c +
Para facilitar a nota c ao, chamaremos de o coeciente linear de L: = dc c d
Armamos que a fam lia f 0 , f1 , f2 , . . . dada por f l (x) = fl (L(x)) ]. Para isso, s e ortogonal com respeito ao produto interno usual do intervalo [ c, d o precisamos mostrar que
d c
f l (x)fk (x)dx = 0 ,
para l = k , usando a informa c ao de que, nesse caso,

d
fl (y )fk (y )dy = 0 .
c
Entretanto
c
f l (x)fk (x)dx =
c
fl (L(x))fk (L(x))dx
e, fazendo a mudan ca de vari aveis y = L(x) (com dy = L (x) dx = dx), obtemos

) L(d L( c)
1 1 fl (y )fk (y ) dy =
fl (y )fk (y ) dy = 0 .
c
7.5. MUDANC A DE VARIAVEIS: COMO USAR TABELAS DE FUNC OES ORTOGONAIS85 Observe que consideramos apenas o caso cont nuo, com peso uniforme. Outras situa c oes podem ser consideradas, tomando-se os devidos cuidados, mas n ao discutiremos receitas gerais aqui. Perceba tamb em que no exemplo de an alise harm onica da Se c ao passada n os zemos isso, pois originalmente hav amos apresentado fun c oes trigonom etricas ortogonais entre si no intervalo [0, 2 ], mas no exemplo zemos a an alise harm onica adaptada para o intervalo [0, 1]. Al em do mais, olhando para o que zemos, no caso de as fun c oes f 0 , f1 , . . . serem polin omios ent ao as fun c oes f0 , f1 , . . . tamb em ser ao polin omios, respectivamente de mesmo grau. Vejamos um exemplo, para ilustrar. Na Se c ao 7.3 obtivemos os polin omios ortogonais 1 , f3 (x) = x3 3 x , relativamente ao produto interno f0 (x) = 1, f1 (x) = x, f2 (x) = x2 3 5 usual no intervalo [1, 1], por em gostar amos de fazer um ajuste polinomial no intervalo [1, 2]. Ent ao procedemos como descrito acima. Achamos primeiro a fun c ao am L que leve o intervalo [1, 2] no intervalo [1, 1], dada por L(x) = 1 + 2(x 1) = 2x 3 (procure sua pr opria maneira de ach a-la!). Os polin omios procurados s ao dados por f l = fl L. Portanto f 1 (x) f2 (x) f 3 (x) f 4 (x) = = = = f1 (L(x)) = 1 f2 (L(x)) = L(x) = 3 + 2x 1 f3 (L(x)) = L(x)2 3 = 4x2 12x + 26 3 6 3 3 x f4 (L(x)) = L(x) 5 L(x) = 8x3 36x2 + 54x 5
126 5
86
Parte III
Equa c oes e Zeros de Fun c oes
87
Cap tulo 8
Zeros de fun c oes e o M etodo da Dicotomia

8.1 Introdu c ao
Considere o seguinte problema: dada uma fun ca o real f , achar suas ra zes, isto e, os valores de x para os quais f (x) = 0, como ilustra a gura abaixo (os pontos pretos indicam as ra zes da fun c ao representada no desenho).
Pode a princ pio parecer um problema espec co, mas ele aparece toda vez que tivermos uma equa ca o a ser resolvida. Uma equa c ao nada mais e do que uma express ao f1 (x) = f2 (x) , onde procuramos o(s) valor(es) de x que a satisfa ca(m). Ora, mas isso e o mesmo que achar as ra zes da fun c ao f (x) = f1 (x) f2 (x). Al em disso, o problema se relaciona com a invers ao de fun co es. Por exemplo, temos uma fun c ao g (x) conhecida, mas gostar amos de determinar g 1 em certos pontos. Lembrando que g 1 (y ) e denido como sendo o valor x tal que g (x) = y temos que, para um dado y , resolver a equa c ao g (x) = y e determinar x = g 1 (y ). Resolver a equa c ao g (x) = y e o mesmo que achar um zero da fun c ao f (x) = g (x) y . Nas pr oximas Se c oes veremos alguns exemplos que ilustram o problema. 89
90
CAP ITULO 8. ZEROS DE FUNC OES E O METODO DA DICOTOMIA
8.2
Raiz c ubica de 10
Suponha que queiramos achar um n umero x positivo tal que x 3 = 10. Esse n umero e o que 3 denominamos a raiz c ubica de 10, ou 10. Gracamente, encontramos x pela intersec c ao de {y = x3 } com {y = 10}, como mostra a gura ao lado. Observe tamb em que o problema e equivalente a resolver a equa c ao x3 10 = 0 , ou seja, estamos procurando a raiz de f (x) = x3 10. y = x3 10 y = 10 x
8.3
P ara-quedista ou bolinha em queda dentro d agua
Imagine um p ara-quedista que abre seu p ara-quedas no instante t = 0, da altura h0 . Ou, alternativamente, uma bolinha que parte do repouso ` a altura h0 dentro de um tubo cheio d agua, e cai sob a for ca da gravidade. Levando em conta que a queda n ao e completamente livre, isto e, o meio oferece resist encia ao movimento, quanto tempo levar a a queda do p araquedista ou da bolinha?
h0 h h 0
0
A diferen ca b asica entre os dois problemas e a velocidade inicial. No caso do p araquedista, ela e bastante alta, e o p ara-quedas tender a a amortec e-la at e atingir uma velocidade compat vel com a possibilidade do corpo humano suportar o choque com o solo. No caso da bolinha, a velocidade inicial e zero e cresce com o tempo. Empiricamente, constata-se que o meio oferece resist encia ao movimento com uma for ca tanto maior quanto maior for a velocidade.
8.3. PARA-QUEDISTA OU BOLINHA EM QUEDA DENTRO DAGUA Num gr aco, ter amos algo como mostrado na gura ao lado. Isso implica que h a um valor de velocidade v para o qual a for ca de resist encia e exatamente igual ` a for ca da gravidade. Se o corpo em queda est a a essa velocidade, a for ca da gravidade e a resist encia do meio se anulam entre si, e a resultante das for cas e zero. Isso implica que o corpo n ao ser a acelerado (nem desacelerado), e portanto permanecer a constantemente em movimento ` a velocidade v . for ca de resist encia
91
mg
velocidade
Por outro lado, se a velocidade inicialmente e maior do que v , ent ao a for ca de resist encia ser a maior do que a for ca de gravidade, o que far a com que o corpo reduza sua velocidade. Tudo sugere que os gr acos Velocidade vs. Tempo tenham o seguinte aspecto, dependendo da rela c ao entre v0 e v , onde v0 e a velocidade inicial do corpo.
v v0 v0 = v v
v0 t t t
Sob a hip otese de que a for ca de resist encia do ar e proporcional ` a velocidade do corpo, em valor absoluto, e poss vel mostrar que a evolu c ao da velocidade em fun ca o do tempo e dada por v (t) v = (v0 v )e v t , onde g e a constante de gravidade ` a superf cie terrestre (vide Se c ao 17.3.3 para uma justicativa). Como interpretar essa f ormula? Ora, note que se denirmos v (t) = v (t) v , isto e, a diferen ca entre a velocidade do corpo e a velocidade de equil brio, a f ormula apenas diz que g v no instante t e igual a v no instante t = 0 multiplicado por e v t . Isso est a de acordo com as guras que hav amos desenhado.
g
92
0 Sabendo agora como evolui a velocidade do corpo em fun c ao do tempo, como podemos deduzir a evolu c ao da altura h(t)? Primeiro precisamos xar coerentemente as coordenadas. Temos considerado velocidades positivas para corpos em queda, logo temos que medir a altura, com a coordenada h, de cima para baixo. Por conveni encia, xaremos o zero de h como sendo ` a altura h0 , de forma que o solo ser a atingido no instante T tal que h(T ) = h0 .
h = h0
h v v0 O espa co percorrido e dado pela integral da velocidade no intervalo de tempo considerado. Assim,
t
h(t) h(0) =
v (s)ds ,
0
0 h(t) Ent ao
onde h(0) = 0, pela maneira como xamos a coordenada. No gr aco de velocidades, isso corresponde a achar a area sob a curva v (t). A vari avel s e usada como auxiliar, para diferir do extremo de integra c ao.
h(t) =
0 t
(v + [v (0) v ]e v s )ds
t
=
0
v ds + [v (0) v ]
e v s ds
0
g v = v t + [v (0) v ]( )(e v t 1) . g
Logo h(t) =
g v v [v (0) v ] + v t [v (0) v ]e v t . g g
Agora, se quisermos achar T tal que h(T ) = h0 , teremos que resolver a equa c ao h0 =
g v v [v (0) v ] + v T [v (0) v ]e v T . g g
8.4. O CILINDRO DEITADO Chamando A = B C D v [v (0) v ] h0 g = v v [v (0) v ] = g v = g A + Bt ent ao estamos procurando a raiz da fun c ao f (t) = A + Bt CeDt . Gracamente, essa raiz e dada pela proje c ao na abscissa do encontro entre a reta A + Bt com a fun c ao CeDt , vide ao lado. T
93
CeDt t
8.4
O cilindro deitado
Considere um cilindro colocado horizontalmente sobre um plano, paralelo ao solo, como na gura ao lado. O cilindro tem uma abertura, na parte superior, para a coloca c ao de agua (para dramatizar o exemplo, imagine um cont einer de petr oleo, gigante, com esse formato e nessa posi c ao). O problema e: como determinar uma escala com marca c oes que indiquem o volume de agua dentro do cilindro (e n ao simplesmente a altura do n vel da agua)?
Para ver a rela c ao entre essa quest ao e o problema de achar o zero de uma fun c ao, quantiquemos um pouco mais o problema. Seja l o comprimento do cilindro e r o raio de uma se c ao transversal, perpendicular ao seu eixo. O volume total do cilindro e dado por v = l r2 , pois r2 e a area da base e l a altura do cilindro, embora ele esteja deitado.
94
r cos() h
Se ele estiver cheio at e a altura h ent ao o volume de gua ali contido ser a a l vezes a area preenchida pela agua numa se c ao transversal qualquer, que chamaremos de A(h). Note que h varia entre 0 e 2r, e que 2 A(0) = 0, A(2r) = r2 e A(r) = 1 2 r . Mas e os outros valores de h? Como achar a fun c ao A(h)?
A(h) Aqui podemos fazer um pouco de geometria: supomos que h < r (o racioc nio ser a completamente an alogo para h > r) e consideramos o angulo formado entre a vertical e a linha L. A rela c ao entre h e e simples: r cos + h = r, ou seja, h = r(1 cos ). Lembremos agora que a area de um setor de angulo pode ser achada por regra de tr es, lembrando que para = 2 a area e r2 : = 2 1 r2 = a() = r2 . a() 2
Como mostra a gura, a area que queremos calcular e menor do que a area de dois setores de angulo (perfazendo r2 ), e o excedente ea area de dois tri angulos-ret angulos. A area excedente e o produto d1 d2 , onde d1 = r cos e d2 = r sin . Logo A(h) = r2 r2 sin cos = r2 ( 1 sin 2) , 2 =
lembrando que depende de h pela rela c ao h = r(1 cos ). Essa conta sugere que talvez seja mais f acil fazer a escala ao longo do contorno do cilindro, parametrizado pelo angulo , como se fossem as marcas de um rel ogio (pode-se fazer uma escala vertical, mas as contas car ao mais complicadas). 1l
3l 2l
=0 f E acil ver que a mesma f ormula vale quando h > r (verique!). Resumindo, o volume v () depende de pela f ormula v () = lr2 ( 1 sin 2) , 2
onde varia entre 0 e . O gr aco de v () (de fato, o gr aco de v = v ()/lr2 ) est a esbo cado na gura abaixo.
8.5. CATENARIA v =
v lr 2
95
v () v =
1 sen(2) 2 1 2
0
1 2
v Na gura, colocamos na vertical a vari avel v = lr aco que inde2 , de forma que o gr pendente do raio r e do comprimento l do cilindro. As linhas pontilhadas indicam as duas ( ) c ao v () = vlr fun c oes ( e 1 2 . 2 sin 2 ) que somadas produzem a fun A fun c ao v () tem derivada nula em = 0 (e por simetria em = ), pois
v () = 1 e
1 2 cos 2 2
v (0) = 1 cos(0) = 0 . Suponha agora que o volume total do cilindro seja da ordem de 10 litros e que queremos correspondente a um volume de marcar, no contorno do cilindro, o valor de agua de 3 para o qual v ( ) = 3 (se o volume litros. Isso corresponde, no gr aco, a achar o valor de for medido em litros). Esse e o problema de achar a raiz da fun c ao v () 3. O mesmo procedimento pode ser adotado para se calcular as marquinhas correspondentes a outros valores do volume, de forma que toda a escala possa ser constru da.
8.5
Caten aria
Mais uma vez, suponhamos uma corrente pendurada em dois pontos de sustenta c ao. Seu formato, como j a dissemos, e o do gr aco da fun c ao f (x) = 1 (cosh(cx) 1) , c
96
desde que a origem do plano cartesiano coincida com o ponto de m nimo da curva. Na Subse c ao 4.3.2 propusemos uma maneira de achar o par ametro c experimentalmente, atrav es de um ajuste de fun c oes, no caso n ao linear. Aqui veremos que, a partir da posi c ao de um u nico ponto da corrente (excetuando o ponto de m nimo), podemos achar o par ametro c. Para tanto, reduziremos o problema a achar o zero de uma fun c ao cuja vari avel e o par ametro c. Suponha que a corrente passa por um certo ponto (x0 , y0 ) = (0, 0). Isso signica que y0 = f (x0 ) = Ent ao cosh(cx0 ) cy0 1 = 0 , isto e, o par ametro c e, necessariamente, um zero da fun c ao F (c) = cosh(cx0 ) cy0 1 . Gracamente, podemos pensar tamb em que c e o cruzamento do gr aco de cosh(cx0 ) com o gr aco da fun c ao am 1 + cy0 . Da convexidade do cosseno hiperb olico segue que h a apenas dois pontos onde as fun c oes coincidem, e um deles e c = 0. Como c n ao pode ser zero (pois aparece no denominador, na express ao da fun c ao f ), ent ao c ca completamente determinado uma vez dado (x0 , y0 ). Para calcular c explicitamente, no entanto, e necess ario algum m etodo num erico. Observa c ao: Uma fun c ao f e convexa se f ((1 )x1 + x2 ) (1 )f (x1 ) + f (x2 ), para todo 0 1. f (x1 ) x1 x x2 1 (cosh(cx0 ) 1) . c
f (x2 )
8.6
M etodo da Dicotomia
Nesta Se c ao apresentaremos o M etodo da Dicotomia, que e um m etodo intuitivo de se achar a raiz de uma fun c ao. M etodos mais sosticados ser ao estudados nos pr oximos Cap tulos. O primeiro passo e isolar a raiz x dentro de um intervalo onde a fun c ao seja mon otona: ou crescente ou decrescente. Sejam a0 e b0 os extremos desse intervalo. Observamos ent ao que a fun c ao assume valores com sinais opostos nesses extremos, isto e, f f (a0 ) f (b0 ) < 0 . a0 x b0 No desenho ao lado, f (a0 ) < 0 e f (b0 ) > 0. Seria ao contr ario se no desenho a fun c ao fosse decrescente. Esse primeiro passo depende muito do conhecimento pr evio que se tem a respeito da fun c ao.
8.6. METODO DA DICOTOMIA
97
Em seguida passamos a cercar a raiz com intervalos, cada intervalo com um tamanho igual ` a metade do tamanho do intervalo anterior. Para ilustrar o m etodo, usemos a fun c ao f (x) = x3 20. Observe que achar x tal que f (x ) = 0 e o mesmo que achar a raiz c ubica de 20. 1. Escolhemos a0 = 2, pois 23 20 < 0 e b0 = 3, pois 33 20 > 0. 2. Escolhemos o ponto m edio do intervalo, ao qual chamaremos provisoriamente de c0 : c0 = Neste caso, c0 = 2.5. 3. Testamos o valor de f em c0 : f (c0 ) = f (2.5) = 2.53 20 = 4.375 < 0 . Conclu mos que x est a` a direita de c0 , o que nos faz denir o novo intervalo [a1 , b1 ] = [c0 , b0 ] . 4. Repetimos o procedimento 2), agora com o intervalo [a1 , b1 ], ou seja, calculamos o ponto m edio a1 + b1 c1 = = 2.75 . 2 5. Avaliamos f em c1 : f (c1 ) = f (2.75) = 2.753 20 = 0.796875 > 0 . Conclu mos que x est a` a esquerda de c1 , o que nos faz denir o novo intervalo [a2 , b2 ] = [a1 , c1 ] . Prosseguindo, colocamos os dados numa tabela, indo at e a d ecima etapa: n 0 1 2 3 4 5 6 7 8 9 10 an 2 2.5 2.5 2.625 2.6875 2.6875 2.703125 2.7109375 2.7109375 2.712890625 2.713867188 bn 3 3 2.75 2.75 2.75 2.71875 2.71875 2.71875 2.71484375 2.71484375 2.71484375 cn 2.5 2.75 2.625 2.6875 2.71875 2.703125 2.7109375 2.71484375 2.712890625 2.713867188 2.714355469 rn en 2.5 0.5 2.75 0.25 2.63 0.13 2.69 0.07 2.72 0.04 2.703 0.016 2.711 0.008 2.715 0.005 2.7129 0.0020 2.7139 0.0011 2.7144 0.0006
3 rn 15.6 20.8 18.2 19.5 20.12 19.75 19.93 20.013 19.966 19.989 19.9996
a0 + b0 . 2
98
Na tabela, calculamos os extremos e centros dos intervalos usando todas as casas decimais dispon veis na calculadora. No entanto em cada etapa s o sabemos com certeza que a raiz est a entre an e bn , portanto o erro em assumi-la com o valor de cn e bn an . 2 Os valores de rn s ao arredondamentos de cn at e uma certa casa decimal, com um erro en garantindo que a raiz esteja entre rn en e rn + en . O crit erio para a determina c ao de rn e en foi o seguinte. Primeiro determinou-se o erro 1 ( b a ), com todas as casas decimais poss veis. De posse desse valor, escolheu-se o n umero n n 2 de algarismos signicativos para expressar en , 1 ou 2. O crit erio dessa escolha baseou-se num certo grau de razoabilidade, de forma que: (i) o primeiro ou os dois primeiros algarismos signicativos de en sejam uma dentre as possibilidades 10, 11, 12, 13, 14, 15, . . ., 24, 25, 3, 4, 5, 6, 7, 8 e 9; (ii) tomando rn como o arredondamento de cn na casa decimal correspondente au ` ltima casa decimal de en , o intervalo [rn en , rn + en ] contenha o intervalo [an , bn ]; (iii) en seja o menor poss vel. Por exemplo, para n = 4 temos 1 ao tomamos e4 = 0.04 (n ao 2 (b4 a4 ) = 0.03125, ent podemos usar 0.03, sen ao a condi c ao (ii) pode n ao ser satisfeita). Em seguida arredondamos preciso a c4 = 2.71875 na segunda casa decimal, obtendo r4 = 2.72. E testar a condi c ao (iii): 2.72 0.04 = 2.68 < a4 e 2.72 + 0.04 = 2.76 > b4 , tudo bem. Se essa condi c ao n ao fosse satisfeita, en teria que ser ligeiramente aumentado, respeitando (i), (ii) e (iii) ao mesmo tempo.
Cap tulo 9
M etodos iterativos
9.1 Plano geral
Neste Cap tulo discutiremos a determina c ao de zeros de fun c oes por meio de m etodos iterativos. Os m etodos iterativos (n ao s ao interativos, aten c ao!) s ao realizados da seguinte maneira. 1. Dada a fun c ao f da qual se procura uma raiz x , fabrica-se uma fun c ao auxiliar (quais caracter sticas ela deve ter e como ach a-la, veremos aos poucos). 2. Arrisca-se um palpite inicial x0 , e a partir desse palpite constr oi-se uma seq u encia de valores x0 , x1 , x2 , . . ., onde o valor xk+1 depende do valor xk pela rela c ao xk+1 = (xk ) . 3. Se a escolha de e de x0 for feita com algum crit erio, espera-se que a seq u encia {xk }k convirja para x , como mostra esquematicamente a gura abaixo. 4. Com algum crit erio de parada, em fun c ao da precis ao que se deseja na resposta, toma-se um dos xk s como aproxima c ao de x .
f
1 0 0 1
x* x1
0 0 1 x2 x3 1
1 0 0 1
1 0 0 1
1 0 0 1
x0
99
100
9.2
Pontos xos
A primeira observa c ao pertinente a respeito do plano geral tra cado acima e sobre o tipo de ponto que deve ser x , em rela c ao ` a aplica c ao (em rela c ao ` a fun c ao f j a sabemos: x e uma raiz de f ). Supondo que, no m nimo, seja uma fun c ao cont nua, notamos que, se xk tende a x , ent ao (xk ) deve tender a (x ) ( e a deni c ao de fun c ao cont nua, pense nisso!). Por outro lado tem-se que (xk ) = xk+1 , ent ao a seq u encia (xk ) e a pr opria seq u encia dos xk , adiantada no ndice k de uma unidade. Como (xk ) tende a (x ), ent ao xk tende a (x ). Ora, mas se xk tende ao mesmo tempo para x e para (x ), a conclus ao e que x e (x ) t em que ser iguais! Para resumir, uma condi c ao necess aria para que o plano geral de achar a raiz x de f por itera c ao de uma fun c ao funcione e que, no m nimo, valha (x ) = x . Esta condi c ao, no entanto, n ao e suciente para que o plano d e certo, como veremos mais adiante. Todo ponto x para o qual se tenha (x) = x e chamado de ponto xo da fun c ao . O que acabamos de concluir e que a fun ca o auxiliar deve ter a raiz x de f como ponto xo. Um ponto xo da fun c ao e localizado pelo cruzamento do gr aco de y = (x) com o gr aco de y = x, a diagonal, ao contr ario das ra zes de f , que s ao localizadas pelo cruzamento do gr aco de f com a abscissa (y = 0). Na gura abaixo, por exemplo, a fun c ao esbo cada tem 2 pontos xos (suas quatro ra zes n ao nos interessam).
1 0 0 1 1 0 0 1
Exerc cio 9.1 Determine os pontos xos (se houver) de (x) = x2 x + 0.5. Esboce o gr aco de . Construa a seq u encia de iterados xk+1 = (xk ) a partir de x0 = 0. A seq u encia converge? Se converge, converge para algum ponto xo? Fa ca o mesmo para x0 = 2, e depois para x0 = 1.5. Exerc cios de itera c ao cam bem mais f aceis com uma boa calculadora cient ca. Algumas vezes e preciso iterar bastante, por isso conv em reduzir ao m aximo o n umero de opera c oes na m aquina em cada etapa. Em algumas calculadoras, existe uma vari avel de mem oria que ` vezes essa vari guarda a resposta do u ltimo c alculo. As avel pode ser colocada na f ormula
9.3. FUNC OES AUXILIARES CANDIDATAS
101
completa. Por exemplo, em algumas calculadoras CASIO essa vari avel chama-se Ans. Procede-se assim, para x0 = 1.5 e (x) = x2 x + 0.5: (i) escreve-se 1.5 e aperta-se EXE, fazendo com que 1.5 seja armazenado em Ans; (ii) escreve-se Ans2 Ans + 0.5, apertase EXE e aparece a resposta 1.25, que e o x1 (e esta resposta e armazenada em Ans, substituindo o valor anterior); (iii) apertando EXE novamente a calculadora far a a mesma conta, s o que a partir do novo valor de Ans, que e o x1 , assim aparecer a o valor de x2 ; (iv) a partir da e s o ir apertando EXE que v ao aparecendo os xk s, em seq u encia. Se a calculadora n ao dispuser desses recursos, mesmo assim ela deve ter maneiras de armazenar valores em mem oria. Guarde o resultado xk na mem oria e procure us a-la na hora de calcular xk+1 . Calculadoras que permitem colocar a f ormula inteira antes de fazer a conta s ao as melhores para isso. H a tamb em, e claro, a possibilidade de se fazer um pequeno programa em computador para realizar essas contas. Qualquer linguagem que lide facilmente com n umeros reais serve para isso. Exerc cio 9.2 Tome (x) = 3.1x(1 x) e x0 = 0.3. O que acontece com a seq u encia de iterados? Exerc cio 9.3 Tome (x) = 4x(1 x) e x0 = 0.3. O que acontece com a seq u encia de iterados?
9.3
Fun c oes auxiliares candidatas
natural nos questionarmos se podemos achar uma fun E c ao tal que (x ) = x se n ao conhecemos exatamente x , anal estamos desenvolvendo um m etodo cuja nalidade u ltima e justamente achar x ! Acontece que por um pequeno truque isto e perfeitamente poss vel, e de maneira surpreendentemente simples! Para come car, tome a fun c ao f (x) e adicione a ela a fun c ao identidade, isto e, dena (x) = x + f (x) . Note que se x for uma raiz de f ent ao (x ) = x + f (x ) = x , isto e, x e um ponto xo de . Inversamente, se x for um ponto xo de ent ao x ser a tamb em uma raiz de f . Em conclus ao, se for denida dessa maneira ent ao as ra zes de f coincidir ao exatamente com os pontos xos de ! O mesmo acontecer a se denirmos (x) = x + f (x) , onde e um n umero real qualquer, ou mesmo (x) = x + (x)f (x) , onde (x) e uma fun c ao (cont nua) qualquer.
102
Como n ao devemos nunca dispensar um desenho, em tudo o que fazemos na matem atica, vejamos como podemos esbo car (x) = x + f (x) diretamente a partir do esbo co do gr aco da fun c ao f . Se for positivo, ao multiplicarmos a fun c ao f por estaremos encolhendo (se < 1) ou dilatando (se > 1) o gr aco na dire c ao vertical. Nas ra zes, como a fun c ao vale zero, o efeito e nulo. Se for negativo o gr aco ser a, al em disso, reetido em torno da abscissa. Depois dessa multiplica c ao temos apenas que somar o gr aco resultante a diagonal. Na gura ao lado esbo ` camos o processo com igual a 1 2.
(x) = x
1 2
f(x)
f(x)
1 2
f(x)
Exerc cio 9.4 Considere f (x) = sen(x) (n ao se esque ca, x em radianos!). Esboce o gr aco 1 de (x) = x + f (x). Esboce tamb em o gr aco de (x) = x 2 f (x). Itere e a partir da condi ca o inicial x = 1 e compare os resultados.
9.4
Visualizando itera c oes
importante se ter no E c ao visual do processo de itera c ao de uma fun c ao , e para isso veremos como fazer itera c oes usando apenas o esbo co da fun c ao. Obviamente haver a um ac umulo de erro quando zermos itera c oes sucessivas, mas os desenhos nos ajudar ao a melhor compreender os diversos tipos de comportamentos presentes nos m etodos iterativos.
9.4. VISUALIZANDO ITERAC OES
103
A primeira coisa que devemos fazer e desenhar o gr aco da fun c ao, e em seguida a diagonal, que nos auxiliar a. Depois escolhemos uma condi c ao inicial x0 ( e apenas um ponto da abscissa), e o objetivo e encontrar a posi c ao, na abscissa, de x1 = (x0 ). Movendo-nos verticalmente, encontraremos o gr aco de , na posi c ao (x0 , (x0 )). Como (x0 ) = x1 , este e o ponto (x0 , x1 ), ou seja, j a encontramos x1 , mas ele e a segunda coordenada do ponto encontrado. Nosso objetivo, no entanto, e encontrar o ponto da abscissa (x1 , 0).
(x)
(x1 , 0)
(x0 , 0)
(x1 , x1)
(x0 , x1)
Ent ao movemo-nos horizontalmente, isto e, mantendo xa a segunda coordenada, a partir de (x0 , x1 ) at e encontrar a diagonal. Na diagonal, os valores da primeira e da segunda coordenada s ao iguais; como a segunda foi mantida sempre igual a x1 , ent ao esse ponto ser a (x1 , x1 ), e com um movimento vertical determinamos x1 sobre a abscissa.
Para a determina c ao de x2 o procedimento e an alogo: movimento vertical at e encontrar o gr aco, depois movimento horizontal at e encontrar a diagonal e nalmente movimento vertical at e encontrar a abscissa. E assim por diante!
Observe que podemos poupar um pouco de trabalho quando fazemos uma s erie de itera c oes sucessivas. De x0 vamos verticalmente at e o gr aco (` a altura x1 ), depois horizontalmente at e a diagonal (` a posi c ao horizontal x1 ). Depois, de acordo com o que foi descrito acima, ir amos verticalmente at e a abscissa (` a altura zero) e ent ao verticalmente at e o gr aco (` a altura x2 = (x1 )). Ora, a composi c ao de dois movimentos verticais ainda e um movimento vertical, que poderia ser feito de uma vez s o. Ou seja, logo ap os nos movermos horizontalmente at e a diagonal, encontrando (x1 , x1 ), podemos nos mover verticalmente at e o gr aco, encontrando (x1 , x2 ). Em seguida continuamos, indo horizontalmente at e a diagonal, no ponto (x2 , x2 ), e depois verticalmente at e o gr aco, no ponto (x2 , x3 ), e assim por diante. Coletando as primeiras coordenadas de cada ponto de encontro com o gr aco, teremos a seq u encia de iterados a partir de x0 . Veja na gura abaixo uma ilustra c ao desse procedimento.
104
(x)
x4 x3 x1 x2 x0
Exerc cio 9.5 Fa ca um esbo co de = 2x(1 x) e itere a partir das seguintes condi co es iniciais: (i)x0 = 0.5; (ii) x0 = 0.0; (iii) x0 = 0.25; (iv) x0 = 0.5; (v) x0 = 0.75; (vi) x0 = 1.0; (vii) x0 = 1.25. O que acontece com cada seq u encia de iterados? Converge, n ao converge? D a para inferir o que acontecer a com o restante das condi co es iniciais? Exerc cio 9.6 Como se explica um ponto xo no procedimento acima? Exerc cio 9.7 Se a regra fosse verticalmente at e a diagonal e horizontalmente at e o gr aco, o procedimento estaria bem denido? A regra seria clara? Exerc cio 9.8 Uma pr e-imagem de um ponto y pela fun ca o e um ponto x tal que (x) = y . Muitas vezes um ponto tem mais do que uma pr e-imagem. Usando um gr aco de , invente um m etodo r apido para achar todas as pr e-imagens de um ponto dado (suponha que o ponto dado foi indicado sobre a abscissa).
9.5
Iterando perto de pontos xos
Vejamos agora, atrav es de esbo cos, o que acontece com a seq u encia de iterados quando a condi c ao inicial est a pr oxima de um ponto xo. A pergunta a ser respondida e: ser a que ela converge para esse ponto xo? A resposta e de suma import ancia, uma vez que nosso objetivo e encontrar o ponto xo por aproxima c oes sucessivas. Sem isso, n ao teremos condi c ao de preencher o terceiro item do nosso plano geral, tra cado no come co do Cap tulo. Para come car, adotaremos como hip otese que o ponto xo x seja isolado, isto e, que numa vizinhan ca (pequena) de x n ao exista nenhum outro ponto xo. Isto tamb em signica que perto de x o gr aco de s o toca a diagonal no pr oprio x .
9.5. ITERANDO PERTO DE PONTOS FIXOS
105
Na gura ao lado mostramos os ingredientes b asicos de que necessitaremos: o gr aco de , pr oximo a x , a diagonal e o que chamaremos de diagonal secund aria em x , que e a reta de inclina c ao 1 passando por (x , x ). Para simplicar, assumiremos que tamb em a diagonal secund aria s o seja intersectada pelo gr aco de no ponto (x , x ). Essas hip oteses n ao s ao demasiadamente restritivas: e raro encontrar um caso em que elas n ao sejam respeitadas.
x*
x*
Assim, podemos imaginar diversas possibilidades para o gr aco de , de acordo com a posi c ao em rela c ao ao cone duplo formado pela diagonal e pela diagonal secund aria, como mostra a gura abaixo. Nos diagramas, hachuramos o que queremos convencionar como a parte interna do cone, entre as duas diagonais.
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
(l)
Nos casos (d), (e), (f ) e (g) o gr aco de tangencia a diagonal em x . Isto tem um
106
signicado, se for uma fun c ao diferenci avel: (x ) = 1, pois basta lembrar que a derivada e a inclina c ao da reta tangente ao gr aco. Nos casos (h), (i), (j) e (l) o gr aco de tangencia a diagonal secund aria em x , ou seja, (x ) = 1. No caso (a), a tangente ao gr aco de em x e uma reta de inclina c ao menor do que 1 (pois e menor do que a inclina c ao da diagonal) e maior do que 1 (ou seja, menos negativa do que a inclina c ao da diagonal secund aria). Portanto 1 < (x ) < +1 no caso (a). No caso (b) temos (x ) < 1 e no caso (c) temos (x ) > +1 . Em resumo, podemos considerar 3 possibilidades, de acordo com o m odulo de (x ): (i) | (x )| < 1, caso (a); (ii) | (x )| > 1, casos (b) e (c); (iii) | (x )| = 1, casos (d) a (l). Uma esp ecie de rec proca tamb em e v alida: sempre que | (x )| for menor do que 1 o gr aco de na vizinhan ca de x assumir a o aspecto de (a), e sempre que | (x )| for maior do que 1 ele assumir a o aspecto de (b) ou (c), de acordo com o sinal. No entanto, se | (x )| for igual a 1, haver a todas as possibilidades mostradas de (d) at e (l). Nosso objetivo e fazer uma an alise da converg encia das seq u encias x0 , x1 = (x0 ), x2 = (x1 ), . . . para o ponto xo x , quando x0 e escolhido perto de x , por em restringiremos nossa argumenta c ao apenas aos casos (a), (b) e (c). A raz ao e que, primeiramente, alguns dos outros casos podem ser facilmente analisados de forma semelhante (e outros n ao t ao facilmente), como mostram os exerc cios propostos abaixo. Al em disso, cada caso apresentar a um comportamento distinto: pode haver converg encia ou n ao, e em alguns casos a resposta depende at e de saber se x0 est a` a esquerda ou ` a direita de x ! No caso (a) note que, se xk estiver pr oximo a x ent ao (xk ) estar a dentro do cone, isto e, xk x < (xk ) x < x xk , (xk < x )
ou xk x > (xk ) x > x xk , (xk > x ) pois y = x + (x x ) e y = x (x x ) s ao as diagonais principal e secund aria passando por x . Isto e o mesmo que |(xk ) x | < |xk x | , ou seja, xk+1 = (xk ) est a mais perto de x do que est a xk . O mesmo valer a de xk+1 para xk+2 , de modo que os iterados xk , xk+1 , . . . se aproximar ao cada vez mais de x (veja exerc cio abaixo para tornar mais rigoroso este argumento). Outra maneira (mais intuitiva) de se chegar ` a mesma conclus ao e esbo cando a evolu c ao dos iterados no desenho, como mostra a gura abaixo, em duas situa c oes: (x ) > 0 e (x ) < 0. Observe pela gura que quando (x ) < 0 os iterados xk , xk+1 , . . . se alternam a direita e ` ` a esquerda de x , quando est ao sucientemente pr oximos de x .
9.5. ITERANDO PERTO DE PONTOS FIXOS
107
x* x*
x* xk xk+1 xk+2 xk+3 xk xk+2 x* xk+3 xk+1
Nos casos (b) e (c) ocorre o oposto: tem-se |xk+1 x | > |xk x | , o que impossibilita a aproxima c ao a x e, em verdade, afasta os iterados de x . Isto pode ser visto na gura abaixo.
x*
x*
x* xk+3 xk+2 xk+1 xk xk+2
x* xk xk+1 xk+3
Quando o ponto xo e tal que a seq u encia de iterados iniciada em sua proximidade converge para ele, dizemos que o ponto xo e atrator. Se, ao contr ario, os iterados se afastam, mesmo que xk esteja arbitrariamente pr oximo de x , ent ao dizemos que o ponto xo e repulsor. Da argumenta c ao acima, conclu mos que se | (x )| < 1 ent ao x e um ponto xo atrator, enquanto que se | (x )| > 1 ent ao x e um ponto xo repulsor. Se | (x )| = 1 n ao e poss vel prever o comportamento dos iterados, a n ao ser que se tenha outras informa c oes sobre , em geral ligadas a derivadas de ordem mais alta. Veja mais sobre isso nos exerc cios abaixo. Exerc cio 9.9 Esboce a fun ca o (x) = e4 x e determine seus pontos xos, dizendo quem e atrator e quem e repulsor apenas atrav es do desenho do gr aco.
x
108
Exerc cio 9.10 Considere a equa ca o ex = x 1. Investigue se (x) = ex + 1 pode ser u til para achar a solu ca o. Ache-a. Exerc cio 9.11 Este exerc cio e um conjunto de observa co es dirigidas a respeito dos casos n ao discutidos, onde a derivada de no ponto xo tem m odulo 1. O leitor deve tentar se convencer ao m aximo de cada uma delas, usando desenhos, principalmente. O exerc cio ajudar a a xar melhor a teoria discutida nesta Se ca o. 1. Nos casos (e) e (i) o ponto xo e atrator. 2. Nos casos (g) e (l) o ponto xo e repulsor. 3. Nos casos (e), (i), (g) e (l) a segunda derivada de e nula. A terceira derivada n ao pode ser negativa em (i) e em (g), e n ao pode ser positiva em (e) e (l). 4. A segunda derivada n ao pode ser negativa em (d) e (h), e n ao pode ser positiva em (f) e (j). 5. No caso (d), o ponto xo e atrator pelo lado esquerdo e repulsor pelo lado direito. J a em (f) ele e atrator pelo lado direito e repulsor pelo esquerdo. 6. Os casos (h) e (j) s ao os mais delicados. H a altern ancia de lado na itera ca o, pois a derivada e negativa. Olhando para o caso (h), h a aproxima ca o para o ponto xo a cada vez que se passa pelo lado direito e afastamento a cada vez que se passa pelo lado esquerdo, e n ao e claro a priori qual vai prevalecer (no caso (j) ocorre o oposto). Tente fazer desenhos caprichados criando casos onde h a atra ca o e outros onde h a repuls ao, sempre no caso (h), e depois tente o mesmo para o caso (j). Exerc cio 9.12 Este exerc cio e opcional, para aqueles que gostam de um pouco mais de rigor nos argumentos. Observamos que no caso (a) ocorre |xk+1 x | < |xk x |, o que implicaria que a seq u encia |xk x | vai a zero (equivalente a dizer que xk tende a x ). Isso no entanto n ao tem que ser necessariamente verdade, quer dizer, nem toda seq u encia em que 1 , que cada termo e menor do que seu predecessor vai a zero. Por exemplo, a seq u encia 1 + k tende a 1 e e decrescente. No entanto, se usarmos as hip oteses estabelecidas de in cio, isso ser a verdade. Para isso, verique as seguintes observa co es: 1. Se a seq u encia for mon otona, isto e, car s o do lado direito ou s o do lado esquerdo, e se |xk x | n ao for a zero, ent ao a seq u encia tem que convergir para um outro ponto x que n ao e x . 2. Pelo que vimos na Se ca o 9.2, o ponto x teria que ser um outro ponto xo de x , mas n os j a t nhamos isolado uma vizinhan ca de x sem nenhum outro ponto xo. Ent ao esta situa ca o n ao pode ocorrer. 3. J a se a seq u encia n ao for mon otona, pode acontecer tamb em de que |xk x | tenda para um valor maior do que zero, e xk que alternando de lado, tendendo para dois pontos simetricamente posicionados em torno de x . Mostre que nesses pontos o gr aco de tocaria a diagonal secund aria, contradizendo tamb em as hip oteses.
9.6. TEOREMA DO VALOR MEDIO E VELOCIDADE DE CONVERGENCIA
109
9.6
Teorema do Valor M edio e velocidade de converg encia
A Se c ao anterior pode ser resumida na seguinte arma c ao: se x e ponto xo e se | (x )| < 1 ent ao x e atrator, e se | (x )| > 1 ent ao x e repulsor. Vamos demonstrar essa arma c ao de maneira mais simples, sem usar o desenho, usando o Teorema do Valor M edio. A demonstra c ao tamb em nos ajudar a a saber qual e a velocidade de converg encia no caso de o ponto xo ser atrator. A u nica hip otese adicional ser a que a derivada de e uma fun c ao cont nua, hip otese que se verica na maioria dos casos. Chamemos de a derivada de em x . Como a derivada de e uma fun c ao cont nua, ela deve assumir valores pr oximos de perto de x . Em outras palavras, podemos isolar uma vizinhan ca de x , de prefer encia sim etrica, de tal forma que para qualquer x escolhido dentro dessa vizinhan ca ter-se- a | (x) | muito pequeno. Suponha agora que e um n umero de m odulo menor do que 1 ( e o caso em que queremos mostrar que x e um atrator). Ent ao, podemos encontrar uma vizinhan ca de x em que | (x) | seja t ao pequena que tamb em | (x)| seja menor do que 1, ou mesmo menor do que um certo tamb em menor do que 1, para todo x na vizinhan ca. Nosso interesse e comparar |xk+1 x | com |xk x |. Como xk+1 = (xk ) e x = (x ) ent ao queremos comparar |(xk ) (x )| com |xk x |. Ora, isso tem toda a cara de Teorema do Valor M edio, pois (xk ) (x ) = (ck )(xk x ) , para algum n umero ck entre xk e x . Se xk estiver na vizinhan ca acima referida, ent ao ck tamb em estar a, e teremos | (ck )| menor do que . Logo |(xk ) (x )| |xk x | . Ent ao a cada itera c ao a dist ancia de xk a x e multiplicada por um n umero menor do que , o que caracteriza uma converg encia (ao menos) geom etrica (lembre-se de uma P.G. de raz ao menor do que 1). O importante de se escolher uma vizinhan ca sim etrica em torno do ponto xo e que isso garante que o ponto xk+1 cair a ainda dentro da mesma vizinhan ca, e o argumento poder a ser repetido ad innitum. Logo adiante (na Subse c ao 9.8) falaremos um pouco mais sobre este assunto. Observe tamb em que a mesma igualdade do Teorema do Valor M edio mostra que, ` a medida que os iterados se aproximam do ponto xo, a raz ao entre |xk+1 x | e |xk x | se aproxima de | | = | (x )|. Pois como (ck ) = xk+1 x , xk x
e ck , estando espremido entre x e xk , tamb em se aproxima de x , ent ao (ck ) se aproxima de (x ), por causa da continuidade da derivada. Exerc cio 9.13 Observe que se | (x )| > 1 ent ao o Teorema do Valor M edio implica que n ao pode haver converg encia para o ponto xo.
110
x
Exerc cio 9.14 Tome a fun ca o (x) = e4 x. Iterando a partir de x0 = 0, ache seu ponto xo x mais a ` esquerda, mas guarde os iterados. Calcule (x ) e compare com as raz oes xk+1 x . xk x Exerc cio 9.15 Este exerc cio e para transformar a informa ca o sobre a velocidade de converg encia em informa ca o sobre o tempo de converg encia. O exerc cio fornecer a apenas uma resposta aproximada, baseada em suposi co es que nem sempre s ao satisfeitas. Suponha que a dist ancia da condi ca o inicial x0 ao ponto xo x seja da ordem de D. Suponha tamb em que a condi ca o inicial esteja numa vizinhan ca do ponto xo onde a fun ca o e aproximadamente linear, com inclina ca o dada pela derivada de no ponto xo, o que signica que a taxa geom etrica de aproxima ca o e mais ou menos constante. Calcule o n umero de itera co es k necess arias para que xk esteja mais perto do que a dist ancia p de x . poss Exerc cio 9.16 E vel existir uma fun ca o cont nua que tenha apenas dois pontos xos, ambos atratores? Justique sua resposta.
9.6.1
O caso (x ) = 0: converg encia quadr atica
No caso em que (x ) = 0 a raz ao entre |xk+1 x | e |xk x | se aproxima de zero, o que signica que a taxa de converg encia e melhor do que qualquer raz ao geom etrica. Podemos ir mais al em no Teorema do Valor M edio, aplicando-o novamente desta feita na derivada de , e obter uma informa c ao mais precisa sobre a taxa de converg encia. Para aplicar o Teorema do Valor M edio na derivada de assumiremos que seja duas vezes diferenci avel. Depois acrescentaremos a hip otese de que essa segunda derivada tamb em seja cont nua. Retomando a desigualdade obtida no Teorema do Valor M edio, temos xk+1 x = (ck )(xk x ) . Mas se (x ) = 0 ent ao podemos usar o Teorema do Valor M edio. Existe dk entre ck e x tal que (ck ) = (ck ) (x ) = (dk )(ck x ) . Portanto |xk+1 x | = | (dk )| |ck x | |xk x | . Como ck est a entre xk e x , ent ao |ck x | |xk x |; al em disso, supondo que seja cont nua, os valores de (dk ) estar ao muito pr oximos de (x ), e portanto estar ao limitados por uma constante C , em m odulo. Ent ao, se xk estiver nessa vizinhan ca, ter-se- a |xk+1 x | C |xk x |2 , que motiva a denir o regime de converg encia com o nome de converg encia quadr atica. Um ponto xo com derivada nula e tamb em chamado de super-atrator, por causa da rapidez com que se d a a converg encia.
9.7. CALCULANDO ZEROS DE FUNC OES - A ESCOLHA DE
111
Exerc cio 9.17 Chame de a0 a dist ancia de x0 ao super-atrator x , e de ak a dist ancia de xk a x . Suponha que em todos os iterados vale a estimativa de converg encia quadr atica, com constante C . Mostre que 1 2k ak (Ca0 ) , C e que para se aproximar xk de x da dist ancia p s ao necess arias 1 ln Cp ln ln 2 ln Ca0 itera co es. Compare com a converg encia geom etrica. Exerc cio 9.18 Itere (x) = x + sen x e (x) = x + 1 ca o inicial 2 sen x, a partir da condi x0 = 1, e compare as velocidades de converg encia, a ` luz do que foi exposto acima.
9.7
Calculando zeros de fun c oes - a escolha de
Podemos neste momento retornar ao plano geral tra cado no come co do Cap tulo para achar uma raiz x de uma fun c ao f , pois j a temos todos os ingredientes para isso: uma maneira de se construir fun c oes que tenham x como ponto xo, por exemplo, escrevendo (x) = x + f (x); e crit erios para saber se o ponto xo x e atrator ou n ao. Nosso objetivo e explorar a escolha de na express ao (x) = x + f (x) de modo que a raiz procurada x seja um atrator e o plano geral funcione. De acordo com o que dissemos, e preciso que a derivada (x ) tenha m odulo menor do que 1. A derivada de sabemos calcular, em fun c ao da derivada da f : (x) = 1 + f (x) , Observe que se f (x ) for igual a zero ent ao (x ) ser a igual a 1, e a n ao poderemos saber se h a converg encia ou n ao. Na verdade podemos saber sim, se desenharmos o gr aco de . Por exemplo, tome a fun c ao f (x) = (x 1)2 , que tem raiz x = 1. Essa raiz e ponto xo de (x) = x + 0.1f (x) = x + 0.1(x 1)2 , como mostra a gura ao lado. Sabemos que se iniciarmos a itera c ao com x0 perto e a ` esquerda de 1, ent ao a seq u encia convergir a para o ponto xo.
2 f(x) = x + 0.1(x1)
Ocorre no entanto que nos casos onde a derivada e 1, mesmo havendo converg encia ela se d a de forma muito lenta, que n ao chega nem a ser geom etrica. Mais adiante veremos como superar este problema.
112
Consideremos ent ao o caso f (x ) = 0. Ora, pedir que | (x )| seja menor do que 1 eo mesmo que pedir que 1 < 1 + f (x ) < +1 . Ou seja deve estar entre 0 e f (2 x ) . Exerc cio 9.19 Verique o intervalo de escolhas poss veis de para se calcular a raiz x = de f (x) = sen x usando a fun ca o de itera ca o (x) = x + sen x. Conra a resposta usando desenhos. Notemos agora que, apesar de haver todo um intervalo de poss veis escolhas de , h a uma escolha preferencial, que faz com que a derivada de no ponto xo seja nula e ele seja s super-atrator. E o escolher de modo que 1 + f (x ) seja igual a zero, isto e, = 1 f (x ) .
Essa escolha de garantiria converg encia r apida, mas o leitor atento pode perguntar: como escolher em fun ca o de f (x ) se para saber f (x ) precisamos conhecer x , que e justamente o que estamos procurando? A pergunta faz todo sentido pois, apesar de estar claro em teoria que valor de e necess ario para o m etodo funcionar, n ao e claro na pr atica como proceder, uma vez que n ao dispomos do valor de f (x ). H a duas respostas para esta quest ao, cuja eci encia vai depender do tipo de problema que se quer resolver. Uma das respostas ser a o M etodo de Newton, do qual falaremos no pr oximo Cap tulo. Em vez de usarmos a fun c ao f (x) (x) = x , f (x ) a qual n ao podemos determinar por n ao conhecermos x , usamos (x) = x f (x) . f (x)
Se x estiver pr oximo de x ent ao f (x) estar a pr oximo de f (x ), e jogar a um papel semelhante. Em cada itera c ao, o fator que multiplica f (x), em vez de xo e igual a f (1 e x ) , 1 vari avel e igual a f (x) . Observe que essa fun c ao e do tipo (x) = x + (x)f (x) , introduzida previamente, com o u nico problema que (x) = f 1 ao e cont nua onde a (x) n derivada se anula. Voltaremos ao assunto adiante. A outra resposta n ao e t ao f acil de dar, e em linhas gerais consiste no seguinte procedimento. Lembrando que nosso objetivo e achar tal que 1 < 1+ f (x ) < +1, suponha que consigamos isolar a raiz da fun c ao num intervalo [a, b] e mostrar que, dentro desse intervalo, sua derivada f (x) satisfaz 1 < 1 + f (x) < +1 para todo x no intervalo. Ora, se satisfaz para todo x [a, b] em particular satisfaz para x , e ent ao estaremos prontos para usar esse valor de .
9.8. A ESCOLHA DE X0 Ent ao tudo o que queremos e que 2 < f (x) < 0 , x [a, b] .
113
Em primeiro lugar, temos que escolher [a, b] de forma que sua derivada n ao se anule: ou e sempre negativa ou e sempre positiva. Se a derivada f (x) for negativa, mas muito alta em valor absoluto, basta escolher positivo e pequeno. J a se a derivada f (x) for positiva e alta em valor absoluto, basta multiplicar por negativo e pequeno. Exerc cio 9.20 Considere a equa ca o f (x) = ex cos x = 0. O objetivo do exerc cio e trabalhar com uma fun ca o (x) = x + f (x) para achar a menor raiz positiva de f , admitindo o fato de que essa raiz, que chamaremos de x , seja a u nica localizada estritamente entre 0 (isso n a o parece f a cil de se mostrar, mas se quiser tente!). e 2 1. Mostre que f (1) < 0 e f ( a no intervalo 2 ) > 0, o que indica que a raiz procurada est [a, b] = [1, 2 ]. 2. Estime valores m e M tais que m f (x) M para todo x [1, a preciso investigar em detalhe o comportamento das derivadas 2 ] (ser x2 de e e cos x no intervalo considerado). 3. Use o item anterior para escolher de modo que 1 < (x) < 1, para todo x [1, 2 ]. 4. Determine qual extremo est a mais pr oximo de x : x = 1 ou x =
2?
2
5. Use esse extremo como condi ca o inicial e itere, para determinar a raiz com precis ao de 104 . Exerc cio 9.21 Compare as fun co es de itera ca o 1 , 2 , 3 e 4 dadas abaixo, no que diz respeito a ` ec acia de se obter a solu ca o da equa ca o cos x = x2 (considerando-se condi co es iniciais apropriadas). Ache a solu ca o, com o maior n umero de casas decimais poss veis. 1 (x) = cos x 2x2 , 2 (x) = cos x + x2 , x sen x + cos x + x2 1 . 3 (x) = x + (cos x x2 ) , 4 (x) = 8 sen x + 2x
9.8
A escolha de x0
Observe que para saber o qu ao pr oximo da raiz o ponto inicial x0 pode ser escolhido, podemos adotar o seguinte procedimento. Em primeiro lugar, usar o M etodo da Dicotomia para cercar um intervalo pequeno [a, b] que contenha a raiz, e depois eventualmente encolher mais ainda o intervalo para que a derivada de f n ao se anule, como comentado na Se c ao anterior. Isso permitir a escolher e construir para fazer as itera c oes.
114
Essas considera c oes servir ao tamb em para o M etodo de Newton, do qual falaremos no pr oximo Cap tulo. O importante e conseguir o intervalo [a, b] de forma a isolar a raiz e obter que | (x)| < 1 em todo o intervalo. Isso far a com que |xk+1 x | |xk x | , se xk estiver em [a, b] (conclus ao que pode ser obtida mesmo sem conhecermos x ). Observe que o problema n ao termina neste ponto. Uma vez escolhido x0 dentro do intervalo [a, b], com a condi c ao sobre a derivada satisfeita, ent ao teremos certeza que x1 estar a mais pr oximo da raiz x do que x0 . Isso n ao garante, no entanto, que x1 esteja dentro do intervalo [a, b], e se isso n ao acontex0 x* x cer, n ao poderemos mais saber se x2 se apro1 ximar a de x mais do que x1 (vide gura ao a lado). b Uma solu c ao para esse obst aculo e tomar x0 como sendo o extremo do intervalo [a, b] que esteja mais pr oximo da raiz x . Por exemplo, suponha que b seja esse extremo, isto e, |b x | < |a x | . Tomando x0 = b, teremos |x1 x | < |b x |, logo x1 [a, b]. O mesmo acontecer a com os termos seguintes da seq u encia, pois todos eles estar ao a uma dist ancia da raiz menor do que a dist ancia de b a essa raiz. S o que esse racioc nio s o funcionar a na pr atica se soubermos determinar qual extremo do intervalo [a, b] est a mais pr oximo da raiz. O truque e o seguinte: olhamos para o ponto m edio do intervalo e chamamos esse ponto de x0 (pelo menos provisoriamente: o chute inicial x0 ser a de fato o extremo do intervalo que estamos tentando determinar). Calculando x1 , sabemos que a dist ancia de x1 ` a raiz x ser a menor do que a dist ancia de x0 a x . Ent ao basta ver se x1 cai ` a direita ou ` a esquerda de x0 . Se x1 > x0 ent ao conclu mos que x > x0 (logo o extremo direito do intervalo est a mais 1 > x0 pr oximo da raiz), pois se x estivesse ` a es- x querda de x0 e x1 ` a direita, ent ao ter amos |x1 x | > |x0 x |, absurdo, pois em [a, b] a dist ancia ` a raiz deve diminuir! Note que o argumento funciona mesmo que x1 caia fora do intervalo [a, b]. Se x1 < x0 ent ao conclu mos que x < x0 . O argumento e o mesmo que no x 1 < x0 caso anterior.
x* a x0 = a+b 2
x 1 b
x 1 a
x* x0 = a+b 2 b
Se porventura x1 = x0 , ent ao x0 e a raiz (prove!), e ambos os extremos est ao a igual dist ancia dela.
9.9. UM CRITERIO DE PARADA
115
9.9
Um crit erio de parada
Existem v arios crit erios de parada, isto e, regras para se considerar um determinado iterado xk como a aproxima c ao desejada para a raiz procurada x . Os crit erios de parada s ao importantes primeiramente por raz ao de coer encia (imagine uma extensa lista de ra zes sendo calculadas numericamente, e preciso uniformizar a maneira de encontr a-las), e em segundo lugar para automatizar os procedimentos. Alguns crit erios de parada, como aquele que vamos ver aqui, fornecem tamb em a margem de erro da aproxima c ao. O crit erio do qual falaremos aqui funciona quando, no entorno da raiz, a fun c ao e mon otona, isto e, se x1 < x < x2 ent ao os valores de f (x1 ) e f (x2 ) t em sinais opostos, ou seja, f (x1 )f (x2 ) < 0 . Suponha que queiramos determinar uma aproxima c ao de x com precis ao p. Isto signica que gostar amos de encontrar um valor x tal que a verdadeira raiz x esteja no intervalo [ x p, x + p] (a interpreta c ao do que signica exatamente a precis ao p varia de acordo com o gosto do fregu es, esta e a que adotaremos neste livro). Como estamos supondo que f e mon otona, isso s o acontecer a se f assumir sinais opostos em x p e x + p. Bom, ent ao nada mais temos a fazer do que iterar a fun c ao auxiliar , obtendo valores x0 , x1 , . . . , xk , . . ., e para cada iterado xk calcular f (xk p)f (xk + p) . Se esse produto for negativo, ent ao podemos considerar xk como sendo a aproxima c ao desejada. claro que devemos prestar um pouco de aten E c ao para o n umero de casas decimais que usamos nas contas, e se xarmos xk talvez queiramos arredondar para uma casa decimal compat vel com a precis ao desejada. Isso pode ser feito com bom senso, mas se tivermos que automatizar para um programa de computador conv em tomar certos cuidados. Para exemplicar, seja f (x) = ex x + 1 = 0, que tem u nica raiz (veja isto esbo cando o gr aco!). Usaremos (x) = ex + 1 como fun c ao auxiliar, para achar a raiz x com precis ao p = 102 . Partindo de x0 = 0, obtemos os iterados. Temos que usar no m nimo um n umero de casas decimais compat vel com a precis ao desejada, por exemplo 4 parece ser razo avel. Neste caso, faremos as contas com todas os algarismos signicativos da calculadora, e cada etapa arredondaremos para a quarta casa decimal, a m de minimizar os erros. Ent ao x1 = 2, x2 = 1.1353, x3 = 1.3213, x4 = 1.2668, x5 = 1.2817, x6 = 1.2776, x7 = 1.2787. Como f (1.27) > 0 e f (1.29) < 0 ent ao podemos considerar a aproxima c ao x = 1.28. Observe que pelo crit erio de parada j a poder amos parar em x5 , no entanto ao arredondarmos para 1.28 conv em fazer o teste novamente. Os iterados x6 e x7 foram a rigor desnecess arios.
116
Cap tulo 10
O M etodo de Newton
Como j a mencionado no Cap tulo anterior, o M etodo de Newton consiste em fazer a itera c ao xk+1 = xk f (xk ) , f (xk )
a partir de uma condi c ao inicial bem escolhida x0 , e assim obter aproxima c oes sucessivas de alguma raiz x de f .
A maneira de achar x1 em fun c ao de x0 , e igualmente depois de achar xk+1 em fun c ao de xk , tem uma forte inspira c ao geom etrica: olhamos para a reta tangente ao gr aco de f no ponto (xk , f (xk )) e denimos xk+1 como sendo o ponto de encontro dessa reta com a abscissa.
f( xk )
f x*
xk xk+1
Vejamos como a f ormula acima se relaciona com esta id eia geom etrica. Para isso, notamos que a inclina c ao da reta tangente ao gr aco de f no ponto (xk , f (xk )) e dada pela derivada f (xk ). A u nica reta com inclina c ao f (xk ) que passa por (xk , f (xk )) e dada por y = f (xk ) + f (xk )(x xk ) . O ponto xk+1 e denido como o valor de x para o qual y = 0, isto e 0 = f (xk ) + f (xk )(xk+1 xk ) , ou xk+1 = xk 117 f (xk ) , f (xk )
118
CAP ITULO 10. O METODO DE NEWTON
desde que f (xk ) = 0 (hip otese que assumiremos gratuitamente, para facilitar os argumentos). A t tulo de exemplo apliquemos o m etodo no exemplo f (x) = x3 20, para compararmos com o M etodo da Dicotomia. Para f (x) = x3 20 temos f (x) = 3x2 , ent ao a f ormula de itera c ao ca xk+1 = xk que neste caso pode ser simplicada para xk+1 = 2x3 k + 20 . 3x2 k x3 k 20 , 3x2 k
Em primeiro lugar chutamos o valor de x0 , por exemplo x0 = 3, e obtemos x1 : x1 = 74 2 33 + 20 = = 2.7407407 . 3 32 27
claro que a u E ltima igualdade n ao e de fato uma igualdade, pois um arredondamento foi efetuado. Neste exemplo, usaremos 7 casas decimais depois da v rgula. A partir de x1 calculamos x2 , e assim por diante. Os resultados se encontram na tabela abaixo. n xn x3 n 0 3 27 1 2.7407407 20.6 2 2.7146696 20.0056 3 2.7144176 19.9999996 4 2.7144176 19.9999996 Surpreendente! Em poucos iterados chega-se a um valor com precis ao de muitas casas decimais! Podemos testar a precis ao desse valor usando o mesmo princ pio do M etodo da Dicotomia. Por exemplo, queremos saber se essa resposta tem precis ao de 0.0000001. Ent ao vericamos se os n umeros f (2.7144175) e f (2.7144177) t em sinais opostos. Ora, f (2.7144175) = 2.71441753 20 = 0.0000026 < 0 e f (2.7144177) = 2.71441773 20 = 0.0000018 > 0 , donde conclu mos que 3 20 = 2.7144176 0.0000001 .
10.1
Quando o M etodo de Newton funciona?
Ser a que o M etodo de Newton sempre funciona? Ser a que qualquer chute inicial levar a a uma seq u encia x1 , x2 , x3 , x4 , . . . , xk , . . . convergindo ` a raiz x procurada?
10.1. QUANDO O METODO DE NEWTON FUNCIONA?
119
Se formulada a pergunta desse jeito, a resposta e n ao! Vejamos dois argumentos bastante simplistas para justicar o porqu e. O primeiro: imagine uma fun c ao com duas ra zes, f (x) = x2 4, por exemplo. Para qualquer escolha de x0 , a seq u encia x1 , x2 , x3 , x4 , . . . , xn , . . . s o poder a convergir para uma das ra zes! A outra fatalmente ser a esquecida, e isso pode acontecer quando menos esperarmos!
O segundo: mesmo que s o haja uma raiz x e que x0 esteja razoavelmente perto dela, a seq u encia x1 , x2 , x3 , x4 , . . . , xn , . . . pode se afastar! Veja um exemplo na gura ao lado.
f x* x0 x 1
No entanto, quase sempre podemos garantir que se x0 for escolhida sucientemente pr oxima de x ent ao a seq u encia x1 , x2 , x3 , x4 , . . . , xn , . . . convergir a para x . O quase sempre se refere ` as hip oteses que devemos exigir que a fun c ao f satisfa ca. Por exemplo, pediremos sempre que f seja uma fun c ao diferenci avel, com derivada cont nua. Mais ainda, devemos examinar como f se comporta perto da raiz (infelizmente, nem sempre isso e poss vel sem se conhecer a raiz!!). Na hip otese de que f (x ) = 0 e que a condi c ao inicial x0 seja escolhida sucientemente perto da raiz ent ao a converg encia ser a bastante r apida, mais r apida do que qualquer seq u encia geom etrica. De fato, a converg encia e (no m nimo) quadr atica, se usarmos os resultados deduzidos no Cap tulo anterior: basta mostrar que a derivada da fun c ao de itera c ao f (x) (x) = x f (x) , calculada na raiz x , vale zero. Ora, usando as regras usuais de deriva c ao, obtemos (x) = f (x)f (x) , f (x)2
e como f (x ) = 0, segue que (x ) = 0. No caso f (x ) = 0 n ao podemos aplicar o racioc nio diretamente, porque teremos uma divis ao zero sobre zero. Esse caso ser a analisado na pr oxima Subse c ao. Antes disso, vale a pena fazer alguns exerc cios. Exerc cio 10.1 Use o M etodo de Newton para resolver as seguintes equa co es: 1. 2 + 3x = ex 2. x5 + 3x2 x + 1 = 0 3. cos x + 0.5x = 0 4. 0.3x4 + 0.2x3 + x2 + 0.1x + 0.5 = 0 5. 0.3x4 x3 x2 2x + 2 = 0
120 Aten ca o: alta probabilidade de pegadinhas.
f
Exerc cio 10.2 Considere a fun ca o cujo gr aco est a mostrado na gura acima, a ` esquerda. 1. Descreva, justicando (pode usar desenhos nas justicativas!), o que acontece com a seq u encia x0 , x1 = (x0 ), . . . , xk = k (x0 ), . . . para cada uma das cinco possibilidades: (i) x0 = 0.0; (ii) x0 = 1.0; (iii) x0 = 1.5; (iv) x0 = 2.2; (v) x0 = 2.7. 2. A fun ca o pode ser a fun ca o de itera ca o de M etodo de Newton aplicado a ` fun ca o f acima, a ` direita? D e duas justicativas essencialmente diferentes para sua resposta. Exerc cio 10.3 Esboce uma fun ca o que tenha ra zes a e b (com a < b), mas para o qual exista uma condi ca o inicial x0 entre a e b tal que o M etodo de Newton produza um resultado divergente (apesar de o M etodo estar bem denido para x0 e todos os seus iterados posteriores). Justique sua resposta da melhor forma que puder. ao Exerc cio 10.4 Encontre numericamente o valor de x tal que ex = x, com precis 7 p = 10 . Exerc cio 10.5 Considere a caten aria dada por g (x) = 1 (cosh(cx) 1) . c
2
Repare que g (0) = 0, isto e, a curva passa por (x, y ) = (0, 0). Se a curva tamb em passa por (x, y ) = (1, 1), qual e o valor de c? Exerc cio 10.6 Considere f (x) = x5 , que tem u nica raiz x = 0. Se o M etodo de Newton for aplicado a partir da condi ca o inicial x0 = 1, qual ser a o menor valor de k para o qual xk < 1020 ? Exerc cio 10.7 Considere a fun ca o f da gura abaixo. Se usarmos o M etodo de Newton para essa fun ca o, teremos que considerar iterados de (x) = x f (x) . f (x)
10.1. QUANDO O METODO DE NEWTON FUNCIONA?
121
Esboce o gr aco de , com base na intui ca o geom etrica sobre o M etodo de Newton. N ao esque ca de desenhar: abscissa, ordenada, diagonal e os pontos a, b e c.
10.1.1
Retirando a hip otese f (x ) = 0
A hip otese de que a derivada de f seja diferente de zero na raiz x n ao e necess aria para se mostrar converg encia, e pode ser substitu da por uma hip otese bem mais fraca, desde que o chute inicial x0 esteja sucientemente pr oximo de x . Antes de deduzir resultados gerais, vejamos o que acontece com alguns exemplos. Consideremos f (x) = ax2 , que tem raiz em x = 0, mas a derivada de f na raiz e nula. Montando a fun c ao de itera c ao do M etodo de Newton obtemos (x) = x ax2 f (x) =x , f (x) 2ax
que a princ pio n ao estaria denida em x = 0. No entanto, as itera c oes s ao tomadas fora do zero, onde est a bem denida. Al em disso, a express ao pode ser simplicada de modo a esconder o problema: x (x) = . 2
1 Agora a derivada de no zero de f e igual a 2 , que signica que a seq u encia de iterados ir a 1 convergir para a raiz zero ` a raz ao geom etrica de 2 . Se considerarmos f (x) = axn , ent ao teremos
(x) = (1
1 )x , n
1 e portanto 1 n ser a a raz ao da converg encia geom etrica. Aparentemente, essas considera c oes levam a crer que quando f (x ) = 0 o M etodo de Newton ainda funciona, mas a velocidade de converg encia passa a ser mais lenta (de quadr atica passa a ser apenas geom etrica). At e que ponto isso pode ser generalizado? A melhor maneira de compreender o que se passa e por meio de polin omios de Taylor (vide o Ap endice C para uma revis ao sobre o assunto). Para facilitar os argumentos, suporemos
122
que a fun c ao f pode ser diferenciada innitamente. A expans ao de f em torno de x e assim escrita: f (x) = f (x ) + f (x )(x x ) + f (n) (x ) f (x ) (x x )2 + . . . + (x x )n + o((x x )n ) , 2 n!
onde o((x x )n ) indica a presen ca de termos de ordem mais alta do que (x x )n , ou em outras palavras, denota a presen ca de um resto que vai a zero mais rapidamente do que (x x )n quando x tende a x . Como x e a raiz de f , e estamos supondo que f tem derivada nula em x , os dois primeiros termos ser ao nulos, necessariamente. J a a derivada segunda pode ou n ao ser nula. Para a maioria das situa c oes, haver a um primeiro termo n ao nulo, de ordem m, que pode ser 2 ou mais. Assim, podemos escrever f como f (x) = ou ainda, f (x) = m! o((x x )m ) f (m) (x ) (x x )m 1 + (m) m! f (x ) (x x )m . f (m) (x ) (x x )m + o((x x )m ) , m!
Como o((x x )m ) tem ordem mais alta do que (x x )m , o quociente dos dois vai a zero, e assim podemos escrever f (x) = f (m) (x ) (x x )m (1 + r1 (x)) , m!
onde r1 (x) vai a zero quando x tende a x . Da mesma forma, a fun c ao f (x) pode ser expressa na sua f ormula de Taylor. Desta vez, o primeiro termo n ao nulo ser a de ordem m 1, e teremos f (x) = m f (m) (x ) (x x )m1 (1 + r2 (x)) , m!
onde r2 (x) vai a zero quando x tende a x . Posto tudo isso, podemos montar a fun c ao de itera c ao , usando essas express oes no lugar de f (x) e f (x): 1 1 + r1 (x) (x) = x (x x ) . m 1 + r2 (x) Subtraindo x dos dois lados, e colocando (x x ) em evid encia no lado direito da equa c ao, obtemos 1 1 + r1 (x) (x) x = (x x ) 1 . m 1 + r2 (x) S o que o quociente envolvendo r1 e r2 tende a 1, ent ao (x) x x x
1 . Esta e a raz ao assint otica de converg encia geom etrica do M etodo de Newton, tende a 1 m que s o depende da ordem m da fun c ao f em x .
10.2. METODO DE NEWTON EM DIMENSOES MAIS ALTAS
123
10.2
M etodo de Newton em dimens oes mais altas
Suponha que F : Rn Rn seja uma fun c ao diferenci avel e estejamos procurando um ponto x tal que F (x ) = 0. Esse e o an alogo multidimensional do problema que vimos discutindo at e agora. Se ao leitor o problema parece muito abstrato, observe que F leva (x1 , . . . , xn ) num elemento de Rn , que pode ser explicitado por cada uma de suas componentes, isto e, F (x1 , x2 , . . . , xn ) = (f1 (x1 , . . . , xn ), . . . , fn (x1 , . . . , xn )) . Ent ao achar um zero de F e achar uma solu c ao para o sistema de equa c oes f1 (x1 , . . . , xn ) = 0 f2 (x1 , . . . , xn ) = 0 . . . fn (x1 , . . . , xn ) = 0 que n ao e necessariamente linear. Para generalizar, devemos examinar com cuidado a motiva c ao do m etodo em dimens ao 1. Para denir x(k+1) em fun c ao de x(k) , passamos uma reta por x(k) com a mesma inclina c ao que a derivada de f em x(k) (usaremos essa forma de indexar para n ao confundir com o ndice que indica as coordenadas de x, quando x Rn ). Isto e o mesmo que aproximar f pela sua expans ao em Taylor de ordem 1: f (x) = f (x(k) ) + f (x(k) )(x x(k) ) + R1 (x) , mas ignorando R1 . O ponto x(k) era denido pelo encontro dessa reta com o zero, ou seja 0 = f (x(k) ) + f (x(k) )(x(k+1) x(k) ) , e a f ormula do M etodo de Newton foi obtida isolando-se x(k+1) nessa equa c ao. A expans ao em Taylor e igualmente v alida em dimens ao mais alta. Para primeira ordem, por exemplo, podemos escrever F (x) = F (x(k) ) + DF (x(k) )(x x(k) ) + R1 (x) , onde x Rn , R1 e uma fun c ao de Rn em Rn (assim como F ) e DF (x) e a matriz jacobiana no ponto x, isto e f f1 f1 1 . . . x x1 x2 n f2 f2 f2 x1 x2 . . . xn , DF (x) = . . . . . . . . . . . . fn fn fn . . . xn x1 x2
sendo que por economia de espa co ca impl cito que cada uma das derivadas parciais e calculada no ponto x. Portanto, o termo DF (x(k) )(x x(k) ) e a multiplica c ao de uma matriz por um vetor (coluna), que resulta em outro vetor.
124 O resto R1 tem a propriedade de que lim
xx(k)
R1 (x) =0, x x(k)
tomando-se o cuidado de tomar a norma no denominador, porque anal n ao faz sentido dividir por vetores. Para denir x(k+1) , ignoramos R1 e igualamos a aproxima c ao de primeira ordem a zero: 0 = F (x(k) ) + DF (x(k) )(x(k+1) x(k) ) , ou seja, Observe que essa equa c ao e um sistema linear, onde x(k+1) e a inc ognita, a matriz de coecientes e a matriz jacobiana DF (x(k) ) e o vetor de termos independentes e dado por DF (x(k) )x(k) F (x(k) ). Assim como a solu c ao de um sistema linear e um encontro de hiperplanos em Rn , a solu c ao de um sistema n ao-linear e um encontro de hipersuperf cies em Rn . Para n = 2, os hiperplanos s ao retas e as hipersuperf cies s ao curvas. Sugere-se fazer o seguinte exerc cio para xar id eias. Exerc cio 10.8 Achar numericamente a intersec ca o das curvas dadas por x2 + y 2 1 = 0 1 4 2 egia baseada (um c rculo!) e 2 x +3(1 cos y ) 1 = 0. Bom, pelo menos organize uma estrat no M etodo de Newton. Quanto ao chute inicial, isso e um problema, principalmente porque pode haver mais do que uma intersec ca o entre as curvas. DF (x(k) )x(k+1) = DF (x(k) )x(k) F (x(k) ) .
10.2.1
Determina c ao da forma de uma corda
Uma aplica c ao interessante do M etodo de Newton em dimens ao 3 ocorre na determina c ao do formato de uma corda a partir das coordenadas de dois pontos (podem ser os pontos de sustenta c ao, por exemplo) e do comprimento da corda entre os dois pontos. A implementa c ao desta id eia deve ser feita com o aux lio do computador, pela quantidade de c alculos a serem feitos, mas mesmo assim deve-se prestar bastante aten c ao para o chute da condi c ao inicial, que pode freq uentemente levar o m etodo a divergir. Como vimos na Subse c ao 4.3.2, uma corda ou corrente pendurada assume o formato do gr aco da fun c ao 1 cosh(cx) , c conhecida como caten aria. No entanto, assume-se a que a origem das coordenadas esteja uma unidade abaixo do ponto mais baixo da corda. De modo geral, se quisermos deslocar a corda na vertical, precisamos acrescentar um par ametro h, que ser a somado ` a express ao acima, e se quisermos deslocar a corda horizontalmente em a unidades ent ao devemos trocar x por x a, de modo que 1 f (x) = cosh(c(x a)) + h c e a maneira mais geral de se representar o formato da corda.
10.2. METODO DE NEWTON EM DIMENSOES MAIS ALTAS
125
Se nosso modelo pretende ser consistente, deveria prever exatamente a forma da corda, desde que informemos dois pontos de sustenta c ao e o comprimento total da corda entre os dois pontos. Ou seja, com essas tr es informa c oes deveria ser poss vel determinar c, a e h, e portanto f . Sejam (x0 , y0 ) e (x1 , y1 ) os pontos de sustenta c ao. Ent ao y0 = e 1 cosh(c(x0 a)) + h c
1 cosh(c(x1 a)) + h . c O comprimento da corda entre os pontos de sustenta c ao ser a chamado de l. Portanto y1 =
x1
l=
x0
1 + f (x)2 dx
(ver Se c ao 13.3 adiante, para uma justicativa desta f ormula). Como f (x) = sinh(c(x a)) , e logo l=
x0
1 + sinh2 t = cosh2 t ,
x1
cosh(c(x a))dx =
1 {sinh(c(x1 a)) sinh(c(x0 a))} . c
O sistema pode ser resolvido numericamente pelo M etodo de Newton.
Com isso, obtivemos um sistema n ao-linear de tr es equa c oes e tr es inc ognitas: c(y0 h) cosh(c(x0 a)) = 0 c(y1 h) cosh(c(x1 a)) = 0 lc + sinh(c(x0 a)) sinh(c(x1 a)) = 0
126
Parte IV
Interpola c ao Polinomial
127
Cap tulo 11
Estimativa do erro nas interpola c oes

Voltemos ` a quest ao (abordada nas Se c oes 1.5 e A.7) da interpola c ao de um polin omio de grau k a k + 1 pontos dados (t0 , z0 ), (t1 , z1 ), . . ., (tk , zk ), que ser a importante na Parte seguinte do livro, onde falaremos de integra c ao de fun c oes. Nesta Parte do livro, usaremos t como vari avel (no lugar de x), valores z (no lugar de y ) e pontos indexados de 0 a k (no lugar de n). Tudo isso justamente para n ao fazermos confus ao na Parte V, quando usaremos alguns conceitos aqui expostos. Imagine que utilizemos a interpola c ao polinomial como uma maneira de aproximar uma fun c ao. Mais precisamente, seja f : [tL , tR ] R uma fun c ao (cuja regularidade s o especicaremos adiante) e uma parti c ao de seu dom nio
tL = t0 < t1 < t2 < . . . < tk1 < tk = tR , n ao necessariamente a intervalos regulares. Assumiremos sempre que tL < tR e que k 1. Aos k + 1 pontos (t0 , f (t0 )), (t1 , f (t1 )), . . ., (tk , f (tk )) podemos interpolar um polin omio p(t) de grau k , que eu nico. A pergunta e: quanto se perde ao se trocar f (t) pelo polin omio interpolador p(t)? Ou seja, qu ao grande e a diferen ca f (t) p(t), para cada ponto t do intervalo [tL , tR ]? Vejamos primeiro como deve ser a fun c ao diferen ca F (t) f (t) p(t). Para k = 1 a parti c ao tem que ser tL = t0 < t1 = tR , e o polin omio interpolador e a fun c ao am cujo gr aco passa por (t0 , f (t0 )) e (t1 , f (t1 )). Como p(t0 ) = f (t0 ) e p(t1 ) = f (t1 ), ent ao F se anula em t0 e t1 . Veja na gura abaixo, esquematicamente, como devem ser f e p (` a esquerda) e F (` a direita). 129
130
CAP ITULO 11. ESTIMATIVA DO ERRO NAS INTERPOLAC OES
p
t0
t0
t1
t1
Pelas mesmas raz oes, para valores quaisquer de k , a fun c ao F se anula em todos os pontos t0 , t1 , . . ., tk da parti c ao. Ela pode at e se anular em outros pontos, mas n ao e necess ario que isto ocorra. Veja na gura abaixo uma situa c ao com k = 2, onde p tem que ser um polin omio quadr atico.
1 0 0 1
f
1 0 0 1
1 0 0 1
p F
1 0 0 1 11 00 00 11 1 0 0 1
t0
t1
t2
t0
t1
t2
Se p e f n ao diferem nos pontos da parti c ao, quanto ser a a diferen ca para os demais valores de t? Para responder, tentaremos denir uma fun c ao (n ao-negativa) S (t) tal que S (t) F (t) S (t) (ou |F (t)| S (t)) para todo t [tL , tR ], sabendo de antem ao que S (t) pode se anular em t0 , t1 , . . . , tk . A forma de S e S , em linha pontilhada, seria algo assim (para k = 4):
131
S
1 0 0 1 1 0 0 1 1 0 0 1
F S
1 0 0 1
11 00 00 11
t0
t4
t1
t2
t3
claro que S deveria ser do tipo mais simples poss E vel. Uma tentativa e olhar para um polin omio n ao-nulo q (t) de grau k +1 que se anule nos pontos t0 , . . . , tk e tomar S (t) = c|q (t)|, onde c e uma constante positiva. O polin omio q (t) = (t t0 )(t t1 ) . . . (t tk ) , por exemplo, satisfaz a condi c ao pedida. O que faremos agora e mostrar que uma tal estimativa e poss vel, e al em do mais apresentar um valor de c, que possa ser calculado a partir de algum conhecimento sobre a fun c ao f. De fato, mostraremos um resultado mais forte, que implicar a automaticamente o que queremos. Provaremos que, para cada t [tL , tR ] existe um outro ponto s = st (st indica a depend encia de s em rela c ao a t) tal que F (t) = F (k+1) (s) q (t) , (k + 1)!
onde F (k+1) (s) indica a derivada (k + 1)- esima de F em s. Como conseq u encia dessa arma c ao, teremos que |F (t)| F (k+1) (s) s[tL ,tR ] (k + 1)! max |q (t)| .
Al em disso, n ao devemos esquecer que F (t) = f (t) p(t), onde p(t) e polin omio de grau k . Como a derivada (k + 1)- esima de um polin omio de grau k e zero, ent ao F (k+1) = f (k+1) , logo |F (t)| e podemos tomar c= f (k+1) (s) . s[tL ,tR ] (k + 1)! max f (k+1) (s) s[tL ,tR ] (k + 1)! max |q (t)| ,
132
CAP ITULO 11. ESTIMATIVA DO ERRO NAS INTERPOLAC OES
claro que esta resposta s E o e poss vel se f for uma fun c ao pelo menos (k + 1) vezes dife o que ocorre com a maioria das fun renci avel. E c oes com que nos deparamos na pr atica, mas pode haver exce c oes. Finalmente s o nos falta provar a arma c ao, que diz que para cada t em [tL , tR ] existe um s neste mesmo intervalo tal que (k + 1)!F (t) = F (k+1) (s)q (t) . A arma c ao e trivialmente v alida se t for um dos pontos t0 , t1 , . . . , tk , pois F e q se anulam nesses pontos, e os dois lados da equa c ao cam iguais a zero. Resta-nos assim provar a arma c ao quando t n ao e nenhum desses pontos. Em primeiro lugar, fazemos a constata c ao esperta de que (k +1)! e a (k +1)- esima derivada de q , pois o polin omio q tem grau (k +1) e o coeciente de tk+1 e igual a 1. Ent ao nos bastar a demonstrar que existe s = st tal que q (k+1) (s)F (t) F (k+1) (s)q (t) = 0 . Para isso denimos a fun c ao G(s) = q (s)F (t) F (s)q (t) , lembrando que t est a xo, neste racioc nio. Desta maneira, queremos apenas mostrar que existe s onde G(k+1) se anula. Acontece que G e uma fun c ao que se anula em todos os pontos t0 , t1 , . . . , tk , pois tanto q como F se anulam nesses pontos, mas G tamb em se anula em s = t, pois G(t) = q (t)F (t) F (t)q (t) = 0 . Como estamos interessados no caso em que t n ao e nenhum dos pontos t0 , t1 , . . . , tk , ent ao G se anula em pelo menos k + 2 pontos distintos. Pelo Teorema do Valor M edio, entre cada par consecutivo de pontos onde G se anula h a um ponto onde a derivada de G se anula. Portanto G se anula, obrigatoriamente, em pelo menos k + 1 pontos. Pelo mesmo racioc nio, G se (k ) anula em pelo menos k pontos. Continuando indutivamente, temos que G se anula em 2 pontos e, nalmente, que G(k+1) se anula em 1 ponto, como quer amos demonstrar. Tendo em vista que os resultados deste Cap tulo ser ao usados no Cap tulo 16, resumimos a estimativa obtida (com a nota c ao j a exposta): |f (t) p(t)| c|q (t)| , onde c= e f (k+1) (s) s[tL ,tR ] (k + 1)! max
q (t) = (t t0 )(t t1 ) . . . (t tk ) .
Cap tulo 12
T ecnicas de interpola c ao
Neste Cap tulo apresentaremos duas t ecnicas de interpola c ao que servem como alternativas ao m etodo j a descrito na Se c ao 1.5 de redu c ao a um sistema linear.
12.1
Polin omios de Lagrange

(t t1 )(t t2 ) (t tk ) ,
Considere o polin omio que tem grau k e se anula em t1 , . . . , tk . Al em disso, em t0 ele vale (t0 t1 )(t0 t2 ) (t0 tk ), e portanto o polin omio L0 (t) = (t t1 )(t t2 ) (t tk ) (t0 t1 )(t0 t2 ) (t0 tk )
vale 1 em t0 e zero nos demais pontos t1 , . . . , tk . Analogamente, podemos denir, para cada ti , um polin omio Li (t) de grau k que vale 1 em ti e zero nos demais pontos. Agora observe que a soma de polin omios de grau k e um polin omio de grau k , logo c0 L0 (t) + c1 L1 (t) + . . . + ck Lk (t) e um polin omio de grau k , que vale c0 em t0 , c1 em t1 , ..., ck em tk . Portanto, se quisermos achar um polin omio de grau k que valha z0 , . . . , zk nos pontos t0 , . . . , tk basta tomar os ci s iguais aos zi s: p(t) = z0 L0 (t) + z1 L1 (t) + . . . + zk Lk (t) . Essa e uma maneira de achar o polin omio interpolador sem resolver nenhum sistema linear! Os polin omios Li s ao conhecidos como polin omios de Lagrange.
12.2
Forma de Newton
J a vimos duas maneiras de fazer uma interpola c ao polinomial: atrav es de um sistema linear, onde as inc ognitas s ao os coecientes do polin omio que se quer determinar, e cada ponto 133
134
CAP ITULO 12. TECNICAS DE INTERPOLAC AO
da interpola c ao gera uma equa c ao; e atrav es de uma combina c ao linear dos polin omios de Lagrange. Nesta Se c ao veremos outra forma de interpolar, chamada forma de Newton. Ela leva certa vantagem em um aspecto: e mais f acil acrescentar um ponto ` a interpola c ao, sem ter que desmanchar (ou revisar) as contas feitas anteriormente. Para obter esse novo m etodo, teremos que investigar um pouco mais alguns aspectos subjacentes ` a interpola c ao. Seja (t0 , z0 ), (t1 , z1 ), . . . , (tk , zk ) o conjunto de pontos que se deseja interpolar. A u nica exig encia, como de h abito, e que os ti s sejam dois a dois distintos, mas n ao h a necessidade que sua enumera c ao respeite a ordem em que eles se disp oem sobre a reta, e os zi s podem ser experimentais ou provenientes de uma fun c ao (zi = f (ti )), tanto faz. Olharemos para as interpola c oes parciais, que envolvem apenas certos subconjuntos dos pontos acima. Mais precisamente, sejam i e j tais que 0 i j k e seja pi omio j (t) o polin interpolador dos pontos (ti , zi ), . . . , (tj , zj ). Assim, o polin omio interpolador procurado e i i p(t) = p0 ( t ), enquanto que p ( t ) e o polin o mio interpolador de um ponto s o (portanto p ( t ) i i k zi , isto e, tem grau zero e e identicamente igual a zi ). Lembremos que o grau (m aximo) de pi e j i, pois pi e o polin omio interpolador de j i + 1 pontos. j (t) j (t) umero j i + 1, que nada mais e do que o n umero Chamaremos de ordem de pi j (t) ao n de pontos que ele interpola. Em seguida podemos observar que um polin omio de ordem l > 1 se relaciona de forma mais ou menos simples com algum polin omio de ordem inferior. Por exemplo, com i < i i j tome pi ao abrange tj em j (t) e pj 1 (t), que diferem entre si pelo fato de que pj 1 (t) n sua interpola c ao. Nos pontos ti , . . . , tj 1 eles coincidem, pois assumem os mesmos valores i zi , . . . , zj 1 , respectivamente. Portanto a diferen ca pi e um polin omio de grau j (t) pj 1 (t) no m aximo j i, que se anula nos pontos ti , . . . , tj 1 , ou seja,
i pi j (t) pj 1 (t) = c(t ti )(t ti+1 ) . . . (t tj 1 ) .
(12.1)
i A constante c depende dos pares (ti , zi ), . . . , (tj , zj ) (pois estes determinam pi j (t) e pj 1 (t)), e ser a denotada por (ti , ti+1 , . . . , tj ) ,
assumindo-se implicitamente que os zi s est ao automaticamente associados aos ti s. Podemos alternativamente suprimir o primeiro ponto da lista, e da mesma forma teremos
i+1 pi (t ti+1 ) . . . (t tj ) , j (t) pj (t) = c
(12.2)
onde c e denotada por (ti , . . . , tj ) . A vantagem de se determinar os s (ou s) e clara, pois da sairia o polin omio interpolador, por indu c ao. Ter amos
0 p0 k (t) = pk1 (t) + (t0 , t1 , . . . , tk )(t t0 )(t t1 ) . . . (t tk1 ) ,
mas tamb em
0 p0 k1 (t) = pk2 (t) + (t0 , . . . , tk1 )(t t0 ) . . . (t tk2 ) ,
12.2. FORMA DE NEWTON e assim por diante, de forma que

0 p0 k (t) = p0 (t) + (t0 , t1 )(t t0 )+
135
+ (t0 , t1 , t2 )(t t0 )(t t1 ) + . . . + (t0 , . . . , tk )(t t0 ) . . . (t tk1 ) .
Como p0 0 (t) z0 , convencionaremos que (t0 ) = z0 (e (ti ) = zi , para todo i = 0, . . . , k ), para que a nota c ao que uniforme. Se proced essemos inversamente na ordem dos pontos, chegar amos em p0 k (t) = (tk ) + (tk1 , tk )(t tk )+
+(tk2 , tk1 , tk )(t tk1 )(t tk ) + . . . + (t0 , . . . , tk )(t t1 ) . . . (t tk ) ,
estipulando-se que (ti ) = zi , i = 0, . . . , k. Os s (e analogamente os s) s ao chamados de diferen cas divididas, porque podem ser deduzidos da Equa c ao 12.1, colocando-se t = tj . Assim (ti , . . . , tj ) =
i pi j (tj ) pj 1 (tj ) , (tj ti ) . . . (tj tj 1 )
i onde conhecemos pi omio j (tj ) = zj , mas pj 1 (tj ) depende de se conhecer previamente o polin i e um caminho trabalhoso. Nosso pj 1 (t). Isso possibilita achar os s indutivamente, mas objetivo e buscar um meio mais f acil de determinar s e s, embora n ao possamos nos livrar de alguma indu c ao. Partiremos de uma pequena observa c ao sobre os polin omios de ordem 1 e 2 (um e dois pontos), e depois enunciaremos um resultado geral que servir a a nossos prop ositos. N ao h a muito o que dizer em ordem 1: a interpola c ao de um ponto e um polin omio de grau zero, portanto pi i (t) = zi = (ti ) = (ti ) ,
por deni c ao. J a a interpola c ao de dois pontos ti e ti+1 (0 i k 1) e um polin omio de grau 1, cujo gr aco e uma reta. Temos pi i+1 (t) = zi + (ti , ti+1 )(t ti ) , que pode ser obtido da Equa c ao 12.1 diretamente. Mas (ti , ti+1 ) e tamb em a inclina c ao da reta que passa por (ti , zi ) e (ti+1 , zi+1 ), logo (ti , ti+1 ) = Analogamente, pi i+1 (t) = zi+1 + (ti , ti+1 )(t ti+1 ) , donde (ti , ti+1 ) = (ti , ti+1 ), pois (ti , ti+1 ) e a inclina c ao da mesma reta! Assim mostramos que s e s coincidem at e ordem 2 e relacionamos s de ordem 2 com s de ordem 1. Vejamos como generalizar nossas observa c oes para qualquer ordem. zi+1 zi (ti+1 ) (ti ) = . ti+1 ti ti+1 ti
136
Mostraremos o seguinte enunciado: para todo par i, j tal que 0 i j , temos (ti , . . . , tj ) = (xi , . . . , xj ), e se i < j temos (ti , . . . , tj ) = (ti+1 , . . . , tj ) (ti , . . . , tj 1 ) . tj ti (12.3)
O enunciado j a foi demonstrado acima em ordens 1 e 2, isto e, sempre que j i + 1 2. +1 i Sejam agora i e j tais que j i + 1 3 e considere os polin omios pi j (t) e pj 1 (t) que interpolam j i pontos, e portanto t em grau (m aximo) j i 1. Como eles coincidem em ti+1 , . . . , tj 1 , ent ao
+1 i pi j (t) pj 1 (t) = a(t ti+1 ) . . . (t tj 1 ) .
(12.4)
Acharemos o valor de a de tr es maneiras diferentes, o que fornecer a as igualdades que queremos demonstrar. (i) Tomamos t = tj na Equa c ao 12.4. Ent ao
+1 i a(tj ti+1 ) . . . (tj tj 1 ) = pi j (tj ) pj 1 (tj ) . +1 +1 em e o valor de pi c ao, pi Como pi j (tj ), j (tj ) = zj , mas zj tamb j (t) inclui tj em sua interpola logo o lado direito e igual a i pi j (tj ) pj 1 (tj ) = (ti , . . . , tj )(tj ti )(tj ti+1 ) . . . (tj tj 1 ) .
Da segue que a = (tj ti ) (ti , . . . , tj ) . (ii) Tomamos t = ti na Equa c ao 12.4. Ent ao

+1 i a(ti ti+1 ) . . . (ti tj 1 ) = pi j (ti ) pj 1 (ti ) .
O lado direito e igual a

+1 i pi j (ti ) pj (ti ) = (ti , . . . , tj )(ti ti+1 ) . . . (ti tj ) ,
logo o que mostra que (ti , . . . , tj ) = (ti , . . . , tj ). (iii) Depois que vimos que s e s coincidem, usamos a mesma Equa c ao 12.4, manipulando-a de outra forma, para estabelecer a rela c ao dos s com seus correspondentes de ordem inferior. Observe que
+1 i+1 i+1 i+1 i i pi j (t) pj 1 (t) = pj (t) pj 1 (t) + pj 1 (t) pj 1 (t) ,
a = (tj ti )(ti , . . . , tj ) ,
que, pela deni c ao de s e s, e igual a (ti+1 , . . . , tj )(t ti+1 ) . . . (t tj 1 ) (ti , . . . , tj 1 )(t ti+1 ) . . . (t tj 1 ) . Como (ti , . . . , tj 1 ) = (ti , . . . , tj 1 ), segue que Ent ao Como j a sabemos que a = (tj ti ) (ti , . . . , tj ), conclu mos a Equa c ao 12.3. a = (ti+1 , . . . , tj ) (ti , . . . , tj 1 ) .
+1 i pi j (t) pj 1 (t) = [ (ti+1 , . . . , tj ) (ti , . . . , tj 1 )] (t ti+1 ) . . . (t tj 1 ) .
12.2. FORMA DE NEWTON
137
12.2.1
Exemplo do uso da forma de Newton
A Equa c ao 12.3 permite que calculemos os s em fun c ao de seus correspondentes de ordem inferior. Isso e poss vel porque conhecemos os s de ordem 1, que s ao os zi s. A seguinte tabela mostra como podemos esquematizar as informa c oes. t0 t1 t2 . . . . . . . . . t k 2 t k 1 tk (t0 ) (t0 , t1 ) (t1 ) (t1 , t2 ) (t2 ) . . . . . . . . . (tk2 ) (tk1 ) (tk ) . . . . . . . . . (tk1 , tk2 ) (tk1 , tk ) . . . . . . . . . . . . . . . . . . (tk2 , tk1 , tk ) (t0 , . . . , tk1 ) (t0 , . . . , tk ) (t1 , . . . , tk ) (t0 , t1 , t2 )
Cada (ti , . . . , tj ) pode ser obtido da diferen ca entre os dois elementos adjacentes da coluna imediatamente ` a esquerda (o de baixo menos o de cima), dividida pela diferen ca tj ti , onde ti e tj s ao encontrados como as extremidades da base da pir amide (deitada) da qual (ti , . . . , tj ) e o cume. 1 Por exemplo, se quisermos achar o polin omio interpolador dos pontos (0, 1), ( 1 2 , 2 ), 3 ( 2 , 1), (2, 0), acabaremos por montar a seguinte tabela (conra!): 0
1 2 3 2
1
1 2
1 3 2 2
1 3
7 3
1 0
4 3
Da tabela, tiramos o polin omio interpolador procurado: 1 4 1 3 1 p(t) = 1 + (1) (x 0) + ( )(x 0)(x ) + (x 0)(x )(x ) . 3 2 3 2 2 Juntando termos de mesmo grau, camos com 4 1 p(t) = 1 + t 3t2 + t3 . 6 3
3 Para vericar que deu certo, testamos os valores p(0), p( 1 2 ), p( 2 ) e p(2) e vemos que batem com 1, 1 , 1 e 0. 2
138
H a outras formas de se tirar o mesmo polin omio da tabela. Por exemplo, pegando os s de baixo: 3 4 3 1 7 p(t) = 0 + 2(t 2) + (t 2)(t ) + (t 2)(t )(t ) . 3 2 3 2 2 Ou sen ao em zigue-zague: p(t) = (t2 )+ (t1 , t2 )(t t2 )+ (t0 , t1 , t2 )(t t2 )(t t1 )+ (t0 , t1 , t2 , t3 )(t t2 )(t t1 )(t t0 ) , que e igual a 3 1 3 1 4 3 1 3 1 (t ) (t )(t ) + (t )(t )(t 0) . 2 2 3 2 2 3 2 2 O zigue-zague pode servir para se escolher os melhores coecientes, facilitando a tarefa de juntar termos de mesmo grau logo depois, mas n ao e aconselh avel por ser mais sujeito a erros.
Parte V
Integra c ao de Fun c oes
139
Cap tulo 13
Import ancia da integra c ao num erica

13.1 Introdu c ao
No pr oximo Cap tulo falaremos de m etodos num ericos para o c alculo de integrais denidas, mas antes devemos atentar para a raz ao de sua utilidade. O C alculo ensina que, para se obter
b
f (x)dx ,
a
basta achar uma primitiva, isto e, uma fun c ao F (x) tal que F (x) = f (x), de forma que
b a
f (x)dx = F (b) F (a)
(vide Ap endice B). Uma fun c ao f e, em geral, dada por uma f ormula, que nada mais e do que a combina c ao nita, via somas, multiplica c oes, divis oes e composi c oes de fun c oes elementares. As fun c oes elementares s ao as usuais: pot encias de x (negativas e positivas), fun c oes trigonom etricas e suas inversas, logaritmo e exponencial. Entretanto, no mundo abstrato de todas as fun c oes poss veis, essas fun c oes formam apenas uma min uscula parte. Em outras palavras, a grande maioria das fun c oes n ao tem uma f ormula que as represente, embora nas aplica c oes do mundo real os modelos freq uentemente conduzam a fun c oes descritas por meio de f ormulas. Mesmo se nos restringirmos apenas ` as fun c oes dadas por f ormulas, acabaremos por nos deparar com um fato matem atico: nem todas elas admitem uma primitiva que tamb em seja escrita como combina ca o (nita) de fun co es elementares! claro que existe o recurso de se escrever a primitiva F como uma combina E c ao innita de fun c oes elementares, por exemplo atrav es de uma s erie de pot encias F (x) =
k=0
ck xk .
141
142
NUMERICA CAP ITULO 13. IMPORTANCIA DA INTEGRAC AO
Isto e poss vel (em muitos casos de forma at e razoavelmente f acil), mas com dois inconvenientes: primeiro, quando formos avaliar F (a) e F (b) atrav es da s erie (ou da f ormula innita) pode ser necess aria uma quantidade t ao grande de termos (ou opera c oes) que inviabilize ou torne muito lento o c alculo. Al em disso, nem sempre s eries de pot encia convergem para todos os valores de x, o que exigiria uma an alise criteriosa do alcance dessa converg encia, em cada caso. De outra parte, e preciso tamb em dispor de instrumentos para estimar integrais a partir de dados experimentais. As aplica c oes mais obvias se encontram no c alculo de comprimentos, areas, volumes, massa, centro de massa, dist ancia percorrida, tempo decorrido, etc. No que segue, discutiremos algum exemplos onde a integra c ao num erica se faz necess aria: ora por se tratar de medida experimental ora porque n ao h a primitiva elementar da fun c ao que se quer integrar.
13.2
C alculo de areas
Gostar amos de um m etodo sistem atico para estimar a area de guras planas como a mostrada ao lado (poderia ser uma ilha, por exemplo). Para isso, vamos nos basear no Princ pio de Cavalieri, que diz: dados dois conjuntos A e B , se houver uma linha L tal que toda perpendicular a L cruze A e B em intervalos de tamanhos iguais, ent ao A e B t em a mesma a rea. Por exemplo, os tri angulos da gura abaixo (` a esquerda) t em areas iguais, pois cada reta R horizontal, ` a altura y , cruza os tri angulos em segmentos de tamanho igual a l(y ). Para entender porque l(y ) e igual para os dois tri angulos, observe que em ambos l(y ) varia como uma fun c ao am (linearmente), em y = 0 tem-se l(0) = b (os tri angulos t em bases de igual tamanho) e em y = h tem-se l(h) = 0 (os tri angulos t em alturas iguais). Portanto a fun c ao l(y ) tem o aspecto mostrado ` a direita, na gura. Isso explica porque todos os tri angulos com base e altura iguais t em a mesma area, que pode ser obtida de um deles, por exemplo o da direita. Essa area vale 1 2 bh, e o leitor pode observar que essa tamb em ea area sob o gr aco de l(y ) (observa c ao que ser a importante logo adiante).
13.2. CALCULO DE AREAS
143
y h b l(y) y 0 b b h
O Princ pio de Cavalieri tem uma formula c ao an aloga para volumes. Dois s olidos S e T ter ao mesmo volume se houver uma linha L tal que todo plano perpendicular a L cruze S e T em regi oes de areas iguais. Para o leitor que ainda n ao acreditou nesse princ pio, imagine uma pilha de cartas com um arame passando no meio, e ent ao incline e retor ca o arame, de forma que a pilha que desalinhada. As duas pilhas continuam tendo a mesma altura, a area de cada corte e a mesma, e o volume (que e a soma dos volumes innitesimais das cartas) se mant em.
O que podemos fazer com uma gura plana em geral e criar uma segunda gura com mesma area apoiada no eixo horizontal. Na pr atica, temos que fazer isso para um n umero discreto de cortes verticais: medimos o comprimento do corte e transferimos esse valor para a segunda gura. Assim, a segunda gura e um esbo co do gr aco Comprimento do corte vs. Posi c ao do corte, mais precisamente ea regi ao compreendida entre esse gr aco e a linha horizontal. Quando o corte ocorrer em dois intervalos separados a altura do gr aco ser a igual ` a soma dos comprimentos das duas intersec c oes.
x0 x1 ......
x6
......
x11
y
1 0 0 1 0 1 0 1 1 0 0 1 1 0 0 1 0 1 1 0 1 0 1 1 0 0 0 0 0 1 0 1 1 1 1 0 0 1 0 1
1 0 0 1 1 0 0 1
Ao nal, teremos uma seq u encia de pontos x0 , x1 , . . . , xn , que fornecem a posi c ao de cada corte, e valores correspondentes y0 , y1 , . . . , yn , que s ao os respectivos comprimentos de cada corte. Esses dados e que ser ao usados para se fazer a integra c ao. O curioso e que o mesmo tipo de coleta de dados ser a feito para a integra c ao de uma fun c ao f (x) dada por uma f ormula. Se a integra c ao se der no intervalo [a, b], ent ao deve-se dividir o intervalo com uma parti c ao a = x0 < x1 < x2 < . . . < xn = b e tomar os valores da fun c ao nos extremos dos intervalos da parti c ao: y0 = f (x0 ) , y1 = f (x1 ) , . . . , yn = f (xn )
144
(que podem at e ser negativos). A partir desses dados, a maneira de se proceder ser a a mesma, tanto no caso experimental como no caso te orico. A u nica diferen ca e que no caso te orico n os teremos, na maioria dos casos, uma maneira de delimitar o erro cometido na integra c ao. O volume de um lago ou de uma montanha tamb em e pass vel de ser estimado usando esse tipo de dados. Pode-se fazer isso em duas etapas. Primeiramente, escolhe-se uma dire c ao (x, por exemplo) onde se posicionar ao, perpendicularmente, as retas dos cortes. Para cada corte do lago, posicionado em xi , estima-se sua area A(xi ), usando dados (yi , zi ). Depois estima-se a integral da fun c ao area do corte, usando-se os dados (xi , A(xi )), que resulta no volume.
13.3
Comprimento de curvas e gr acos
Considere o seguinte problema: calcular o comprimento do gr aco da fun ca o f entre a e b. Se a fun c ao f for diferenci avel, esse problema remete a uma integral. Para entender melhor, tentemos aproximar a curva por pequenos segmentos de reta e seu comprimento pela soma dos tamanhos desses segmentos. Como sempre, dividimos o intervalo [a, b] com uma parti c ao a = x0 < x1 < . . . < xn = b e em cada intervalo [xi , xi+1 ] (i = 0, . . . , n 1) aproximamos a fun c ao pelo segmento de reta que une os pontos (xi , f (xi )) e (xi+1 , f (xi+1 )). Pelo Teorema de Pit agoras, esse segmento tem tamanho igual a (xi+1 xi )2 + (f (xi+1 ) f (xi ))2 . Para simplicar um pouco, podemos supor que todos os intervalos tenham o mesmo tamanho x. Al em disso, aproximamos a diferen ca f (xi+1 ) f (xi ) por f (xi )x, de forma que somando para todos os segmentos obtenhamos, aproximadamente,
n1 i=0
x 1 + f (xi )2 .
Fazendo x ir a zero estaremos, por um lado, fazendo com que a soma dos comprimentos dos segmentos esteja cada vez mais pr oxima do comprimento verdadeiro da curva e, por outro lado, fazendo com que a aproxima c ao pela derivada seja cada vez mais dedigna. No limite, teremos um n umero que e ao mesmo tempo o comprimento da curva e tamb em a integral
b
1 + f (x)2 dx .
a
O gr aco de f entre a e b e um caso particular de curva no plano. Cada ponto dessa curva pode ser obtido tomando-se t no intervalo [a, b] e ent ao o ponto (t, f (t)). Podemos imaginar esse processo como uma fun c ao com dom nio [a, b] e contradom nio R2 , que leva t em (t, f (t)). Na verdade, podemos generalizar para situa c oes que n ao correspondam a gr acos de fun c oes. Por exemplo, tome a fun c ao (t) = (cos t, sen t) , com t variando no intervalo [0, 2 ]. Para cada t, o ponto (t) e um ponto do c rculo unit ario, correspondente a um giro de angulo t. Uma elipse e a imagem da fun c ao (t) = ( cos t, sen t) ,
13.3. COMPRIMENTO DE CURVAS E GRAFICOS
145
com t variando em [0, 2 ]. Basta ver que se (x, y ) pertence ` a curva ent ao (x, y ) = ( cos t, sen t), para algum t, logo y2 x2 + =1. 2 2 Uma curva (t) e expressa com duas fun c oes, uma para cada coordenada: (t) = (x(t), y (t)). Se quisermos calcular o comprimento total da curva (com t variando no intervalo [a, b]), podemos proceder com uma id eia semelhante ` a exposta acima para calcular o comprimento do gr aco de uma fun c ao. Dividimos o intervalo [a, b] com uma parti c ao a = t0 < t1 < . . . < tn = b (com intervalos iguais de tamanho t) e aproximamos o comprimento da curva pela soma
n1 i=0
(ti+1 ) (ti ) .
Cada termo da soma e a dist ancia entre dois pontos consecutivos (ti ) e (ti+1 ). Esta dist ancia e dada explicitamente por (x(ti+1 ) x(ti ))2 + (y (ti+1 ) y (ti ))2 , pelo Teorema de Pit agoras. Se cada uma das fun c oes coordenadas for diferenci avel, a dist ancia ser a aproximadamente igual a t x (ti )2 + y (ti )2 , ou t (x (ti ), y (ti ) . O vetor (t) = (x (ti ), y (ti )) e o vetor derivada da curva (t). Somando o comprimento dos segmentos e fazendo o limite quando t vai a zero, conclu mos que o comprimento da curva e dado pela integral
b
(t) dt .
a
Por exemplo, no caso do c rculo unit ario, (t) = (cos t, sen t) e (t) = ( sen t, cos t), logo (t) = 1. Portanto o comprimento do c rculo e
2 2
(t) dt =
0 0
dt = 2 ,
como era de se esperar! No caso da elipse, seu per metro l depende de a e b, que s ao os tamanhos dos semi-eixos. Estamos sempre supondo que a e b s ao positivos, e iremos tamb em assumir que a < b, isto e, que o semi-eixo maior da elipse est a na vertical. Tomando (t) = (a cos t, b sen t), temos (t) = (a sen t, b cos t), de forma que o per metro p da elipse e dado por
2
p=
0
a2 sen2 t + b2 cos2 t dt .
146
em Por raz oes de simetria, podemos integrar somente de 0 a 2 e multiplicar por quatro. Al disso podemos substituir cos2 por 1 sen2 , e colocar b em evid encia na integral: p = 4b
0
2
1 2 sen2 tdt ,
onde 2 e denido como sendo
a2 , b2 um n umero positivo e menor do que 1 (ele vale 1 quando a elipse e um c rculo, e 0 quando a elipse degenera num segmento de reta vertical). A integral 1 1 2 sen2 tdt
e conhecida como integral el ptica do primeiro tipo, e n ao admite uma express ao via combina c ao nita de fun c oes elementares. Em outras palavras, n ao h a uma f ormula fechada para o per metro da elipse.
13.4
Dist ancia percorrida e tempo decorrido
A F sica est a repleta de conceitos denidos por meio de integra c ao. Faremos aqui uma pequena discuss ao sobre movimentos unidimensionais, isto e, movimentos num espa co cuja posi c ao possa ser determinada por apenas uma coordenada. Pode ser o movimento de uma part cula numa reta, um carro numa estrada, um p endulo simples, etc. O caso do p endulo ser a discutido com detalhes na pr oxima Se c ao. O movimento unidimensional de um corpo pode ser descrito por uma fun c ao x(t), onde x(t) indica a posi c ao em cada instante de tempo t. No caso de um p endulo, sua posi c ao e indicada por um angulo (t) (para ser mais preciso, sua posi c ao e circular), medido a partir da posi c ao vertical mais baixa. A velocidade do corpo v (t) e a derivada da fun c ao x(t): v (t) = x (t) , e a acelera c ao e a derivada de v (t). No caso em que a posi c ao e descrita por um angulo, falamos em velocidade angular, denotada por (t): (t) = (t) . Conhecendo a posi c ao inicial x0 (no instante t = 0) e a maneira como evolui a velocidade em fun c ao do tempo, podemos recuperar a fun c ao posi c ao:
t
x(t) = x0 +
0
v ( )d ,
equa c ao que nada mais e do que o Teorema Fundamental do C alculo. Fisicamente, podemos pensar que no instante , a velocidade e v ( ) e, sendo cont nua, assume valores pr oximos a v ( ) em instantes pr oximos a . Tomando um intervalo de tempo pr oximo a , teremos
13.5. PER IODO DO PENDULO E AS INTEGRAIS EL IPTICAS
147
que a dist ancia percorrida ser a aproximadamente igual a v ( ) . Da divis ao em pedacinhos de tamanho do intervalo de tempo onde percurso e acompanhado, a dist ancia percorrida e a integral de v ( ), o que justica a f ormula de forma emp rica. Da mesma forma, em coordenadas angulares, temos
t
(t) = 0 +
0
( )d .
Ocorre entretanto que, em muitas aplica c oes f sicas, conhecemos a velocidade em fun ca o da posi ca o, e n ao do tempo. O p endulo ser a um exemplo disso. N ao vamos discorrer a respeito de outros exemplos, mas imagine o leitor que seja esse o caso. E suponha que agora o problema e outro: da posi c ao inicial x0 at e a posi c ao nal x, em cada ponto sabe-se que a velocidade assume o valor v ( ) (mas nunca se anula). Quanto tempo durou o percurso? A exig encia de que a velocidade n ao se anule no percurso pode ser justicada assim: se o corpo p ara numa posi c ao , e depois recobra seu movimento, n ao h a como saber quanto tempo ele cou parado, logo n ao h a como obter uma resposta u nica para a pergunta. Eventualmente poderemos considerar que a velocidade se anule instantaneamente, principalmente se se tratar de = x0 ou = x. Como no caso anterior, podemos dividir o espa co percorrido em pequenos intervalos de tamanho . Em cada intervalo, a velocidade e aproximadamente constante, por exemplo, pr oxima ao valor v ( ) do extremo do intervalo. O tempo dispendido nesse pequeno trecho de percurso e aproximadamente igual a . v ( ) Portanto somando esses tempos e fazendo ir a zero, teremos que o tempo decorrido ser a
x
T =
x0
1 d . v ( ) 1 d , ( )
No caso angular, temos
T =
0
onde agora representa a vari avel angular de posi c ao. Esta f ormula ser a aplicada na pr oxima Se c ao para se calcular o per odo do p endulo simples.
13.5
Per odo do p endulo e as integrais el pticas
Consideremos um p endulo simples sem atrito. Mostraremos que a Lei de Conserva c ao da Energia implica que a velocidade depende somente da posi c ao do p endulo. 2 A energia cin etica do p endulo e dada por 1 2 mv , onde v representa sua velocidade linear. Se o comprimento da haste for igual a l, essa velocidade e igual a l , onde e a velocidade angular. Por outro lado, a energia potencial e igual a mgh, onde h e a altura do p endulo em rela c ao ao solo. A bem da verdade a energia potencial e uma grandeza relativa, o que quer dizer que
148
podemos somar uma constante a essa energia e nada se alterar a. Ou ainda, quer dizer que podemos supor que o solo est a na altura que quisermos, inclusive acima do p endulo!! Aqui assumiremos que o solo est a na altura do ponto mais baixo do p endulo, de forma que a h se relaciona com a coordenada angular por h = l l cos .
1 0
l
11 00 00 11 00 11
A energia total e a soma da energia cin etica com a energia potencial, e essa energia e constante: 1 2 2 ml + mgl(1 cos ) = E . 2 Mas quanto vale essa constante E ? Observe que a constante E tem a ver com a amplitude 0 do movimento: quanto maior for a amplitude, maior ser a essa energia. Para n ao car d uvidas, 0 representa o angulo m aximo que o p endulo alcan ca a partir da posi c ao vertical mais baixa, logo o maior valor que pode assumir, em tese, e (estamos evitando considerar o movimento em que a posi c ao = e atravessada). Quando o p endulo atinge o angulo m aximo (0 ou 0 , tanto faz), h a uma revers ao do movimento, e a velocidade angular instantaneamente se anula. Nesse caso, a energia cin etica e nula, e toda a energia se concentra na energia potencial. Em outras palavras, a energia total E e igual a ` energia potencial no angulo m aximo 0 . Substituindo na equa c ao acima, obtemos 2 = 2g [(1 cos 0 ) (1 cos )] . l
A express ao entre colchetes pode ser simplicada para cos cos 0 , por em mais tarde voltaremos a deix a-la dessa forma por raz oes t ecnicas. Notemos que essa equa c ao tem duas solu c oes, uma positiva e uma negativa. De toda forma, ela evidencia a depend encia da velocidade angular em rela c ao ` a posi c ao: xada a amplitude 0 do movimento, para cada posi c ao (entre 0 e 0 ), a velocidade angular s o pode assumir dois valores, um negativo e um positivo, e ambos de igual m odulo. Um dos valores representa o movimento de ida do p endulo e o outro de volta. Para obter o per odo do p endulo, podemos calcular o tempo decorrido para se ir de 0 at e 0 , no movimento de ida (velocidade angular positiva). De fato, pela simetria do
13.5. PER IODO DO PENDULO E AS INTEGRAIS EL IPTICAS
149
movimento, basta analisar o percurso de = 0 at e = 0 , percorrido em um quarto do per odo. Levando em conta as considera c oes da Se c ao anterior, teremos T = 4 logo T =4 l 2g
0 0 0 0
1 d , ()
1 d . cos cos 0
Vale apenas examinarmos com mais aten c ao essa integral, tentando esbo car o integrando. Primeiro desenhamos a fun c ao cos , marcando a altura de cos 0 (que pode ser negativo, se esbo camos a fun c ao cos cos 0 , no intervalo [0, 0 ], que e o que nos 0 > 2 ). A partir da interessa. Essa fun c ao tem derivada n ao nula em 0 , a n ao ser que 0 = , mas esse caso n ao ser a considerado.
cos cos 0
(cos cos 0 )
1/2
(cos cos 0 )
1/2
mos a raiz dessa fun c ao, e observamos que a inclina c ao da fun c ao Em seguida, extra cos cos 0 vai a innito quando vai a 0 . Como a fun c ao original tinha cara de 1 c(0 ) (perto de 0 ), quando tiramos a raiz ela ca com cara de c(0 ) 2 (basta em arma c oes mais precisas podem ser comparar com os gr acos y = cx e y = cx, por obtidas usando F ormula de Taylor, vide Ap endice C). 1 1 Acontece que o integrando e (cos cos 0 ) 2 , que tem cara de c(0 ) 2 perto de uma fun 0 . E c ao divergente em 0 (vai a innito), e e natural que nos questionemos sobre a converg encia da integral. Fisicamente sabemos que a integral tem que convergir, pois o p endulo alcan ca o angulo de amplitude m axima em tempo nito. Mas e matematicamente? 1 emp E rico por em extremamente v alido pensar na integrabilidade da fun c ao x 2 entre 0 e 1. Neste caso, a diverg encia ocorre em x = 0. Essa integral existe, pois se tomarmos a integral
1
x1/2 dx = 2x1/2
a
1 a
= 2(1 a1/2 ) ,
teremos que ela tende a 2 quando a tende a zero, e portanto converge. De fato, a integral de qualquer fun c ao x , com 0 < < 1 existe em (0, 1), pelas mesmas raz oes. Fica para o leitor vericar que o mesmo n ao ocorre com 1! Apesar de n ao haver problema quanto ` a converg encia da integral que fornece o per odo do p endulo, veremos no pr oximo Cap tulo que nossos m etodos se prestar ao mais a fun c oes
150
que sejam cont nuas no intervalo de integra c ao, inclusive nos extremos. O pulo do gato neste caso e que uma mudan ca de coordenadas (muito) esperta pode transformar a integral acima numa outra cujo integrando seja uma fun c ao cont nua dentro de um intervalo, isto e, sem pontos de diverg encia. Fa camos ent ao essa mudan ca de coordenadas, que a bem da verdade ser a uma seq u encia de duas substitui c oes. A primeira substitui c ao ser a inofensiva. Faremos = 0 (logo d = d 0 ), e caremos com uma integral no intervalo (0, 1) (independentemente de 0 ): T =4 l 0 2g
1 0
1 cos(0 ) cos 0
d .
Em seguida lembramos de como estava escrito o radicando, para obtermos cos(0 ) cos 0 = (1 cos 0 ) (1 cos(0 )) =
1
1 cos 0
1 cos(0 ) , 1 cos 0
e j a tiramos o fator (1 cos 0 ) 2 para fora da integral. S o para n ao nos perdermos nas contas, o conjunto de termos que multiplica a integral e 4 Observe que a fra c ao 1 cos(0 ) 1 cos 0 l 0 . 2g 1 cos 0
varia monotamente de 0 a 1 quando varia de 0 a 1. Fazemos ent ao a substitui c ao sen2 = 1 cos(0 ) , 1 cos 0
d onde varia entre 0 e teremos uma integral de 0 a 2 . Da 2 de cos , mas precisamos colocar tudo em fun c ao de . Diferenciando os dois lados da equa c ao acima e dividindo por cos , obtemos d 0 sen(0 ) , 2 sen d = 1 cos 0 cos
logo
d 2(1 cos 0 ) sen = d . cos 0 sen(0 ) Note que ainda temos um termo dependendo de . Da equa c ao onde introduzimos a substitui c ao, podemos isolar cos(0 ): cos(0 ) = 1 (1 cos 0 ) sen2 , logo sen(0 ) = 1 [1 (1 cos 0 ) sen2 ]2
13.6. CALCULO DE E DE LOGARITMOS ou, simplicando, sen(0 ) = J a que

1cos 0 2
151
2 1 cos 0 sen
1 cos 0 sen2 . 2
e sempre um n umero n ao negativo, denominamos 2 = 1 cos 0 , 2
e juntando tudo obtemos (depois de v arios cancelamentos) T =4 l g

2
1 1 2 sen2
d .
Se 0 < ent ao 2 < 1 e o denominador do integrando nunca se anula. Portanto este integrando e cont nuo no intervalo [0, e divergente 2 ]. No caso em que 0 = o integrando em 2 e a pr opria integral e divergente (o leitor e convidado a comparar com sua intui c ao f sica). De fato, quanto mais 0 se aproxima de maior se torna T , em outras palavras, o per odo do movimento vai a innito quando a amplitude se aproxima de . Por outro lado, quando a amplitude se aproxima de 0 signica que 2 se aproxima de 0, e o integrando se aproxima da fun c ao constante igual a 1. Isso implica que o per odo se aproxima do conhecido valor l . 2 g A integral 1 1 2 sen2
d ,
com 0 < 2 < 1, e conhecida como integral el ptica do primeiro tipo e n ao pode ser expressa por meio de combina c oes nitas de fun c oes elementares. Portanto n ao h a uma f ormula fechada para o per odo do p endulo em fun ca o da amplitude do movimento.
13.6
C alculo de e de logaritmos
A integra c ao num erica se presta tamb em para calcular constantes matem aticas, por exemplo o n umero , que e denido como sendo a area do c rculo unit ario. Como para o c rculo unit ario se tem x2 + y 2 = 1, ent ao y = 1 x2 , ou seja,
1
=2
1
1 x2 dx .
Aqui e poss vel at e achar uma primitiva para o integrando, mas o problema e que essa primitiva acabar a sendo expressa em termos de . Pode-se mostrar teoricamente que o lado direito e igual ao esquerdo, obtendo-se uma bela equa c ao = !!!! O valor num erico de s o poder a ser obtido, no entanto, se zermos a integra c ao precisa da fun c ao no integrando.
152
NUMERICA CAP ITULO 13. IMPORTANCIA DA INTEGRAC AO Outra maneira de se obter via integra c ao e usando o fato de que (arctan x) = 1 . 1 + x2 1 dt . 1 + t2
4,
Como arctan(0) = 0, ent ao

x
arctan x =
0
A nos aproveitamos do fato de que arctan 1 = uma integral

1
de forma a podermos expressar como
=4
0
1 dt . 1 + t2
Lembremos tamb em que o logaritmo e denido atrav es de uma integra c ao. Como
x
ln x
1 dt t
(vide Ap endice B), ent ao para cada x o valor num erico de ln x ser a obtido como uma area debaixo do gr aco de uma fun c ao. A constante e e denida como sendo o ( unico) n umero que satisfaz a equa c ao ln x = 1 . Ele pode ser obtido, por exemplo, resolvendo-se essa equa c ao pelo M etodo de Newton. S o que, para sermos honestos, temos que aplicar o M etodo de Newton calculando todos os logaritmos atrav es da integra c ao num erica (vide Exerc cio na Se c ao 15.2).
13.7
A gaussiana
Como vimos na Subse c ao 4.3.6, a distribui c ao de probabilidade mais comum na natureza e dada pela fun c ao 1 (t )2 P, (x) = exp{ }. 2 2 2 Para sabermos a probabilidade de ocorrer um evento dentro do intervalo [a, b] precisamos calcular a integral
b
P, (t)dt .
a
um pouco chato calcular integrais com essas constantes, mas atrav E es de uma mudan ca 2 de coordenadas podemos reduzir o problema a calcular integrais de ex . Por exemplo, tomemos u = t (du = dt). Ent ao
b
P, (t)dt =
a
1 2
b a
e 22 du .
u2
13.7. A GAUSSIANA Em seguida, fazemos outra mudan ca de coordenadas x = 1 2

b 2
153
u 2
(dx =
du ). 2
Obtemos
2
2
ex dx ,
a 2
a 2
isto e, uma integral de ex no intervalo [A, B ], onde A =

2
eB=
b . 2
Acontece que ex e uma daquelas fun c oes que n ao t em f ormula para sua primitiva, e a partir da s o se prossegue com estimativas num ericas. Em probabilidade, como e muito freq uente o uso dessa integral, adotam-se tabelas com precis ao limitada mas razo avel, que servem para a maioria dos prop ositos. Essas tabelas podem ser facilmente montadas com os m etodos de integra c ao do pr oximo Cap tulo.
154
Cap tulo 14
M etodos de integra c ao num erica

14.1 Introdu c ao
Queremos resolver o seguinte problema: dada uma fun ca o f : [a, b] R, achar a integral de f nesse intervalo, denotada por
b
f (x)dx .
a
Aqui trataremos de dois m etodos de integra c ao de fun c oes, a saber, o M etodo dos Trap ezios e o M etodo de Simpson.
14.2
O M etodo dos Trap ezios
A primeira coisa a fazer e dividir o intervalo [a, b] em n intervalos (n ao necessariamente de tamanhos iguais). Isto e, xar x0 = a (extremo esquerdo do intervalo) e xn = b (extremo direito do intervalo), e escolher pontos x1 , . . . , xn1 entre a e b de modo que valha a = x0 < x1 < x2 < x3 < . . . < xn1 < xn = b . Em seguida, deve-se estimar a area (com sinal) entre cada par de pontos sucessivos. Por exemplo, entre xi e xi+1 : podemos aproximar essa area tomando o ret angulo cuja base eo intervalo [xi , xi+1 ] e cuja altura seja a m edia entre f (xi ) e f (xi+1 ). Esse ret angulo ter a area de f (xi ) + f (xi+1 ) (xi+1 xi ) . 2 Finalmente, somam-se as estimativas de cada ret angulo, obtendo-se a area (aproximada) total. Algumas observa c oes s ao pertinentes. Para come car, por que o M etodo dos Trap ezios assim se chama? Anal, nenhum trap ezio apareceu para justicar o nome...! 155
156
NUMERICA CAP ITULO 14. METODOS DE INTEGRAC AO
Observe que em vez de termos pego o ret angulo com altura m edia (f (xi ) + f (xi+1 ))/2 poder amos ao inv es ter pego o trap ezio cujos v ertices s ao (xi , 0), (xi+1 , 0), (xi+1 , f (xi+1 )) e (xi , f (xi )). A area desse trap ezio pode ser calculada da seguinte forma: completamos a altura com um trap ezio de mesmas propor c oes, formando um ret angulo de altura f (xi ) + f (xi+1 ) e base xi+1 xi . A area desse ret angulo e o dobro da area do trap ezio, donde essa u ltima deve valer f (xi ) + f (xi+1 ) (xi+1 xi ) , 2
f(x i+1) f(x i)
xi
xi+1
ou seja, o mesmo valor que t nhamos obtido de outra forma! N ao e preciso que o espa camento entre os pontos seja sempre igual, mas se for facilita bastante. Suponha que a dist ancia entre eles seja igual a h, isto e, x1 x0 = x2 x1 = x3 x2 = . . . = xn xn1 = h . Ent ao o trap ezio com base [xi , xi+1 ] tem area h (f (xi ) + f (xi+1 )) . 2 Para todos os trap ezios aparece a multiplica c ao por h 2 , portanto podemos deixar essa multiplica c ao por u ltimo (o que e o mesmo que colocar em evid encia esse fator). Ent ao a area total dos trap ezios ser a h (f (x0 ) + f (x1 ) + f (x1 ) + f (x2 ) + f (x2 ) + f (x3 ) + . . . 2 . . . + f (xn2 ) + f (xn1 ) + f (xn1 ) + f (xn )) . Excetuando o primeiro e o u ltimo termo, todos os outros aparecem duas vezes na soma. Ent ao a area total ser a h {f (x0 ) + 2f (x1 ) + 2f (x2 ) + . . . + 2f (xn1 ) + f (xn )} . 2 Isso facilita bastante na hora de se fazer as contas!! Outra pergunta: que erro estamos cometendo ao fazer a aproxima c ao da area por trap ezios? Veremos mais adiante como calcular esse erro. Por enquanto camos com a percep c ao (correta) de que nosso resultado ser a tanto mais preciso quanto menor for o tamanho dos intervalinhos da divis ao. Nem sempre por em nos interessa calcular a integral de fun c oes exatamente conhecidas, pois muitas vezes estamos diante de uma fun c ao obtida atrav es de dados experimentais. Ou sen ao queremos simplesmente estimar a area de uma regi ao, e colhemos os dados de forma semelhante ao que foi feito acima: para cada xi , medimos o valor yi da fun c ao. Todo o procedimento ser a o mesmo. A u nica coisa e que n ao poderemos controlar a precis ao da estimativa, por falta de mais informa c oes sobre a fun c ao e devido ao erro inerente aos dados experimentais. Para exemplicar o uso do M etodo dos Trap ezios, ilustremos com um exemplo cujo re1 sultado e bem conhecido. Sabendo que a derivada da fun c ao arctan e 1+ x2 , segue que
1 0
1 dx = arctan(1) arctan(0) = , 1 + x2 4
14.3. O METODO DE SIMPSON
157
pelo Teorema Fundamental do C alculo. Logo a estimativa dessa integral levar a a uma estimativa do valor de . Como ainda n ao falamos em estimativa de erro para o M etodo, nossa escolha em rela c ao ao tamanho dos intervalos da parti c ao e ao n umero de algarismos signicativos ser a arbitr aria. Mais adiante veremos como fazer escolhas mais conscientes. Dividiremos o intervalo [0, 1] em 10 intervalos iguais, ou seja, faremos h = 0.1. Ent ao 0.1 {f (0) + 2f (0.1) + 2f (0.2) + . . . + 2f (0.9) + f (1)} , 4 2
1 onde f (x) = 1+ e a fun c ao do integrando. Os dados para realizar essa soma (com 5 x2 algarismos signicativos) s ao:
i 0 1 2 3 4 5 6 7 8 9 10 Ent ao
xi 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
f (xi ) 1.0000 0.99010 0.96514 0.91743 0.86207 0.80000 0.73529 0.67114 0.60976 0.55249 0.50000
f (0) + 2f (0.1) + 2f (0.2) + . . . + 2f (0.9) + f (1) 15.700 , logo 4 0.1 15.700 = 3.1400 , 2
valor ` a dist ancia de aproximadamente 1.6 103 do valor verdadeiro.
14.3
O M etodo de Simpson
Se notarmos bem, no M etodo dos Trap ezios o que n os zemos foi aproximar a fun ca o f , em cada intervalo, por uma reta coincidente com a fun c ao nos extremos. O M etodo de Simpson e um melhoramento dessa estrat egia, pois considera polin omios quadr aticos como forma de aproximar a fun c ao. Vejamos como ele funciona. Como no M etodo dos Trap ezios, a primeira coisa a fazer e dividir o intervalo de integra c ao em intervalinhos, s o que agora em um n umero par de intervalos. Ou seja, denominar x0 = a, x2n = b e escolher pontos intermedi arios a = x0 < x1 < x2 < . . . < x2n2 < x2n1 < x2n = b .
158
Depois para cada i = 0, . . . , n 1 considerar os tr es pontos x2i , x2i+1 , x2i+2 e os valores respectivos da fun c ao avaliada nesses tr es pontos: f (x2i ), f (x2i+1 ), f (x2i+2 ). Para simplicar a nota c ao, chamar esses valores de y2i , y2i+1 , y2i+2 . Em seguida encontrar o u nico polin omio quadr atico (isto e, de grau 2) pi (x) tal que pi (x2i ) = y2i , pi (x2i+1 ) = y2i+1 , pi (x2i+2 ) = y2i+2 , e usar esse polin omio pi (x) como aproxima c ao para a fun c ao no intervalo [x2i , x2i+2 ] (o polin omio pode ser achado com qualquer um dos m etodos descritos na Se c ao 1.5 ou no Cap tulo 12). Assim a integral
x2i+2
f (x)dx
x2i
e aproximada pela integral
x2i+2
pi (x)dx .
x2i
Finalmente, h a que se somar as aproxima c oes obtidas em cada intervalo para se obter a aproxima c ao de
b
f (x)dx .
a
Vejamos como ca o caso em que todos os intervalos da parti c ao t em o mesmo tamanho h. Resultar a da uma f ormula bastante elegante para a aproxima c ao da integral (parecida com a f ormula de integra c ao pelo M etodo dos Trap ezios), conhecida como f ormula de Simpson. Em primeiro lugar, temos que desenvolver em detalhe o passo do procedimento que consiste em achar o polin omio interpolador pelos tr es pontos (x2i , y2i ), (x2i+1 , y2i+1 ) e (x2i+2 , y2i+2 ). Como n ao estamos interessados no polin omio em si mas sim na sua integral denida no intervalo [x2i , x2i+2 ], ser a mais simples trabalharmos no intervalo [h, h], interpolando os pontos (h, y2i ), (0, y2i+1 ) e (h, y2i+2 ) (ca ao leitor detalhista a tarefa de mostrar por que isso pode ser realmente feito). O polin omio interpolador p(x) = pi (x) pode ser calculado como no Cap tulo 12, com o aux lio dos polin omios de Lagrange: p(x) = y2i isto e, p(x) = Da que
h
(x + h)(x h) (x + h)x x(x h) + y2i+1 + y2i+2 , (h)(2h) h(h) (2h)(h)
1 {x(x h)y2i 2(x + h)(x h)y2i+1 + x(x + h)y2i+2 } . 2h2
p(x)dx =
h
1 2h2
y 2i
h
x(x h)dx 2y2i+1
(x + h)(x h)dx + y2i+2
x(x + h)dx
h
14.3. O METODO DE SIMPSON Fazemos ent ao uma a uma cada uma das tr es integrais:
h h h
159
x(x h)dx =
h
x x3 h 3 h 2 2 = h3 . 3 Semelhantemente, =
h h
h 2 h h
(x2 hx)dx = == h3 (h)3 3 3 h h2 (h)2 2 2 =
(x + h)(x h)dx =
h
4 x2 h2 dx = h3 3 h 2 3 h . 3
(x + h)xdx = Com esses valores, voltamos ` a integral de p(x):

h h
p(x)dx =
h
h (y2i + 4y2i+1 + y2i+2 ) . 3
Observe como, ` a semelhan ca do M etodo dos Trap ezios, essa f ormula facilita o c omputo geral da aproxima c ao, mesmo com uma subdivis ao em muitos intervalos. Se, como acima, tivermos a parti c ao do intervalo [a, b] em 2n intervalos, todos com tamanho h, ent ao a soma de todas as aproxima c oes ser a h {(y0 + 4y1 + y2 ) + (y2 + 4y3 + y4 ) + . . . + (y2n2 + 4y2n1 + y2n )} , 3 que e igual a h {y0 + 4y1 + 2y2 + 4y3 + 2y4 + . . . + 2y2n2 + 4y2n1 + y2n } . 3 Para exemplicar e comparar com o M etodo dos Trap ezios, calculemos a mesma integral 1 1 dx usando a mesma divis a o de intervalinhos (neste caso e poss vel porque o n umero 0 1+x2 de intervalos e par). Usaremos 9 algarismos signicativos. Obtemos 2(y2 + y4 + y6 + y8 ) = 6.33731529 e 4(y1 + y3 + y5 + y7 + y9 ) = 15.7246294 , de modo que
1 0
1 0.1 dx (1.0000 + 6.33731529 + 15.7246294 + 0.50000) , 1 + x2 3

1
ou seja, =4
1 dx 3.14159263 , 1 + x2 0 valor que difere de por menos do que 3 108 , resultado bem melhor do que o obtido no M etodo dos Trap ezios.
160
Cap tulo 15
Estimativa do erro nos m etodos de integra c ao

15.1 F ormulas de erro e compara c ao dos m etodos
Aparentemente o M etodo de Simpson se revela melhor do que o M etodo dos Trap ezios. Para vericar melhor essa arma c ao, olhemos para a seguinte tabela, que mostra os c alculos feitos 1 1 1 alculos para se obter com os dois m etodos para os valores de h iguais a 1 4 , 8 , 16 e 32 . Os c foram feitos com o software Maple, usando-se 20 algarismos signicativos. A primeira coluna indica o n umero de intervalos da parti c ao e a coluna seguinte o tamanho de cada intervalo da parti c ao. Na terceira e na quinta os valores de T (h) e S (h), multiplicados por quatro (para 1 1 comparar com ). Usaremos T (h) para denotar a estimativa da integral 0 1+ x2 dx com o M etodo dos Trap ezios e S (h) a estimativa da mesma integral com o M etodo de Simpson. Na quarta e na sexta est ao as diferen cas, em valor absoluto, entre os n umeros obtidos e o valor = 3.1415926535897932385 , fornecido pelo Maple com 20 algarismos signicativos. n 4 8 16 32 h 1/4 1/8 1/16 1/32 4T (h) 3.131 3.1390 3.14094 3.14143 |4T (h) | 0.011 0.0026 0.00065 0.00016 4S (h) 3.141569 3.14159250 3.1415926512 3.141592653552 |4S (h) | 2.4 105 1.5 107 2.4 109 3.7 1011
Na tabela podemos observar que o M etodo de Simpson n ao s o e mais eciente (compare na primeira linha, por exemplo), mas a cada vez que h e diminu do a sua ec acia e proporcionalmente maior do que a do M etodo dos Trap ezios. A cada vez que h e reduzido por 2, o erro no M etodo dos Trap ezios diminui aproximadamente 4 vezes, enquanto que no M etodo de Simpson, neste exemplo, a redu c ao e de pelo menos 64 vezes!! Devotaremos o restante deste Cap tulo ` a discuss ao da ec acia dos dois m etodos. Gostar amos de ter, por exemplo, uma estimativa m axima para o erro cometido na integra c ao de 161
162
CAP ITULO 15. ESTIMATIVA DO ERRO NOS METODOS DE INTEGRAC AO
uma fun c ao f : [a, b] R, dado o tamanho h dos intervalos da parti c ao. Essa estimativa ser a chamada de ET , no caso do M etodo dos Trap ezios, e ES , no caso do M etodo de Simpson. Tanto ET como ES depender ao de f , do tamanho total b a do intervalo de integra c ao e de h. No entanto, assumiremos f e o intervalo [a, b] como xos, de forma que freq uentemente exprimiremos apenas a depend encia em rela c ao a h, dessas estimativas: ET = ET (h) e ES = ES (h). O signicado de ET (h) (e similarmente de ES (h)) e o seguinte. Se calcularmos T (h), ent ao saberemos, com absoluta certeza, que o valor correto da integral est a entre T (h) ET (h) e claro que essa interpreta T (h) + ET (h). E c ao n ao leva em conta os erros de arredondamento cometidos nos c alculos, devidos ` a limita c ao no n umero de algarismos signicativos. Por outro lado, o conhecimento pr evio do erro inerente ao processo permite avaliar com quantos algarismos signicativos deve ser feita a integra c ao. Al em disso e importante salientar que ET (h) (e similarmente ES (h)) n ao mede a real diferen ca entre o valor obtido T (h) e o valor verdadeiro. Essa diferen ca e, com certeza, apenas menor do que ET (h). Por exemplo, na determina c ao de que zemos acima, o c alculo de ET (h) e ES (h), de acordo com as f ormulas que discutiremos abaixo, leva a valores muito maiores do que a real diferen ca entre os valores de T (h) e S (h) e o valor verdadeiro. Pode-se dizer ent ao que a previs ao de erro foi bastante pessimista. Em outros casos, por em, ela pode acabar sendo realista, e isso vai depender muito da fun c ao integranda. Na Se c ao seguinte nos preocuparemos em calcular ET (h) e ES (h). Usaremos tr es abordagens diferentes para o problema, obtendo ao nal resultados similares, e adotaremos, na pr atica, aquelas que julgaremos ser as melhores estimativas. Os resultados est ao expostos na tabela abaixo. 1a ET (h) ES (h)
1 2 12 max |f | |b a|h 1 3 24 max |f | |b a|h
2a
1 2 12 max |f | |b a|h 1 (iv ) | |b a|h4 180 max |f
3a
5 2 12 max |f | |b a|h 1 (iv ) | |b a|h4 45 max |f
Para entendermos melhor o signicado desta tabela, percebemos primeiro que todas as f ormulas s ao do tipo Ch , com igual a 2, 3 ou 4. Nas constantes, est a presente o m aximo valor absoluto de certas derivadas de f , m aximo que deve ser avaliado dentro do intervalo [a, b]. Quem ser a menor, C2 h2 , C3 h3 ou C4 h4 ? Ou colocando em n umeros, a t tulo de exemplo, quem e menor, 1000h4 ou 0.2h2 ? Evidentemente n ao h a resposta a essa pergunta, pois se h = 0.5, por exemplo, ent ao 1000h4 = 62.5, que e (bem) maior do que 0.2h2 = 0.05, mas por outro lado se h = 0.01 ent ao 1000h4 = 105 , menor do que 0.2h2 = 2 105 . Na verdade, mesmo que 1000h4 seja maior do que 0.2h2 , para certos valores de h, isso nunca vai acontecer se h for sucientemente pequeno, pois 1000h4 = 5000h2 0 0.2h2 quando h tende a zero. O limite indica mais ainda do que isso: a raz ao entre 1000h4 e 0.2h2 e tanto menor quanto menor for h. Se, por exemplo, quisermos que 1000h4 seja 100 vezes menor do que 0.2h2 , ent ao basta tomar h menor do que 0.0014 (truncamento de 5000001/2 ).
DAS FORMULAS 15.2. APLICAC AO DE ERRO
163
Nesta linha de racioc nio, quando h tende a ser pequeno, as melhores estimativas tendem a ser aquelas que t em mais alta pot encia de h. S ao melhores nesse sentido, portanto, as estimativas do M etodo de Simpson, e dentre elas a segunda, pois, dentre as duas com h4 , e aquela com menor constante multiplicativa: ES (h) = 1 max |f (iv) | |b a|h4 . 180
As tr es estimativas para o M etodo dos Trap ezios s ao da mesma ordem (h2 ), sendo a terceira um pouco pior do que as outras duas, por apresentar constante multiplicativa maior. Ent ao ET (h) = 1 max |f | |b a|h2 . 12
Essas duas estimativas s ao as que iremos adotar nas aplica c oes pr aticas.
15.2
Aplica c ao das f ormulas de erro

2
Nesta Se c ao aplicaremos as f ormulas de erro no c alculo de ln 2 =

1
1 dx . x
Suponha que queiramos calcular ln 2 com precis ao de 5 105 , ou seja queremos que o valor 5 correto esteja a menos de 5 10 do valor estimado. Usaremos as f ormulas de erro para determinar em quanto devemos xar h para obter estimativas com essa precis ao. Examinemos primeiramente o M etodo dos Trap ezios. Sua f ormula de erro envolve |b a|, que e igual a 1, e o maior valor absoluto da derivada segunda de f nesse intervalo. Ora, como 1 1 2 f (x) = x , ent ao f (x) = x e uma fun c ao positiva e decrescente 2 e f (x) = x3 . Logo f (x) no intervalo considerado, atingindo seu m aximo necessariamente em x = 1. O valor desse m aximo e f (1) = 2. Assim sendo, a f ormula de erro ca ET (h) = h2 . 6
Essa f ormula representa o erro m aximo da estimativa. Portanto, se quisermos garantir que o erro da estimativa seja menor do que 5 105 , basta garantir que ET (h) seja menor do que esse valor, isto e, gostar amos de escolher h de tal forma que h2 < 5 105 . 6 Isto e o mesmo que pedir h< At e agora, a conclus ao e que qualquer valor de h menor do que 0.01732 . . . servir a para obter a estimativa com a precis ao desejada, usando-se o M etodo dos Trap ezios. Acontece que h tamb em deve ser tal que o comprimento total do intervalo seja um m ultiplo inteiro de h. Ou seja, devemos ter ba =n. h 30 105 = 0.01732 . . .
164
Como b a = 1 e h < 0.01732 . . . ent ao n= 1 1 ba = > = 57.7 . . . , h h 0.01732 . . .
implicando que n deve ser maior ou igual a 58. Ent ao precisamos dividir o intervalo [1, 2] em no m nimo 58 intervalinhos para conseguir a estimativa desejada, com a precis ao requerida! E o M etodo de Simpson, ser a que e mais vantajoso neste exemplo? Ser a que com menos intervalos na parti c ao conseguiremos garantir a mesma precis ao? Agora temos que nos concentrar na f ormula de ES (h), que depende do m aximo valor absoluto da quarta derivada, 6 24 2 (iv ) (x) = x (x) = x c ao e positiva entre 1 e 2. Como f (x) = x 3 , temos f 4 e f 5 . Essa fun e decrescente em [1, 2] de forma que seu m aximo e atingido em x = 1 e e igual a 24. Ent ao ES (h) = 24 4 2 4 h = h . 180 15
Como queremos ES (h) < 5 105 , basta tomar h tal que 2 4 h < 5 105 , 15 isto e, h< 15 5 105 2
1 4
= 0.139 . . . .
Ent ao o n umero n de intervalos da parti c ao ser a maior do que 1 = 7.18 . . . 0.139 . . . Aqui deve-se prestar uma aten c ao a mais: no M etodo de Simpson o n umero de intervalos deve ser par. Portanto n = 8 j a e uma boa escolha! Como o M etodo de Simpson se revela consideravelmente menos trabalhoso para se obter, garantidamente, a precis ao desejada, fa camos os c alculos correspondentes. Mas antes teremos que determinar o n umero de algarismos signicativos ou de casas decimais envolvidos. Na verdade, como se trata de delimitar um erro absoluto, e melhor considerar xo o n umero de casas decimais. Observe que o erro em cada arredondamento de f (xi ) e de, no m aximo, 0.5 10N , onde N e o n umero de casas decimais utilizadas. Usando N casas decimais, a soma f (x0 ) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + 2f (x4 ) + 4f (x5 ) + 2f (x6 ) + 4f (x7 ) + f (x8 ) acumular a no m aximo 20 vezes esse valor (20 e a soma dos coecientes dos f (xi )s). O erro acumulado ser a, no m aximo, 10 10N , ou seja, da ordem da casa decimal anterior. Acontece 1 e igual a 24 , de forma que o erro m aximo que depois essa soma ser a multiplicada por h 3 , que por arredondamento no valor nal car a menor do que 0.5 10N (por exemplo, se usarmos 5 casas decimais o arredondamento provocar a erro de no m aximo 0.5 105 ). Pela f ormula de Simpson, a ado c ao de n = 8 nos leva a um erro m aximo ES (h) = 2 15 1 8
4
3.26 105 ,
DAS FORMULAS 15.2. APLICAC AO DE ERRO
165
de forma que um erro adicional de 105 por arredondamento n ao nos tirar a da margem previamente delimitada de 5 105 . O que nos faz concluir que o uso de 5 casas decimais e suciente para os c alculos. Ent ao vamos a eles! A tabela abaixo mostra os valores de f nos pontos da parti c ao, arredondados para 5 casas decimais. i 0 1 2 3 4 5 6 7 8 Obtemos xi 1.000 1.125 1.250 1.375 1.500 1.625 1.750 1.875 2.000 f (xi ) 1.00000 0.88889 0.80000 0.72727 0.66667 0.61538 0.57143 0.53333 0.50000
1 1 S( ) = 16.63568 = 0.69315 , 8 24
que difere do valor verdadeiro por menos do que 105 , dentro, portanto e com folga, da precis ao pedida. Exerc cio 15.1 A integral
2 1
ex dx x
e maior ou menor do que 3? Justique sua resposta e d e uma estimativa para a integral. Exerc cio 15.2 Investigue, de maneira geral, como deve se dar a escolha do n umero de casas decimais dos c alculos do M etodo dos Trap ezios e do M etodo de Simpson, baseado no que foi feito no exemplo acima, e levando em conta a precis ao que se quer atingir no resultado nal. Proponha uma receita para essa escolha. ca o de T (h) e T ( h Exerc cio 15.3 Determine uma f ormula para S ( h 2 ) em fun 2 ). Exerc cio 15.4 Procure integrar numericamente fun co es cujas primitivas sejam conhecidas, de forma a comparar os resultados obtidos com os valores exatos. Examine a integra ca o 2 num erica da fun ca o Gaussiana ex , largamente utilizada em Probabilidade e Estat stica. Exerc cio 15.5 Considere a fun ca o ln x = 1 1 cio e ver que o t dt. O objetivo deste exerc n umero e pode ser obtido atrav es da solu ca o num erica da equa ca o ln x = 1, usando o M etodo de Newton e calculando logaritmos somente atrav es da deni ca o. 1. Determine a fun ca o de itera ca o do M etodo de Newton, que resolve esta equa ca o numericamente. 2. Determine o erro m aximo de se calcular ln x, para 1 x 3, usando o M etodo de Simpson com 8 intervalos.
x
166

1 t,
3. Tome x0 = 3 e calcule x1 = (x0 ) (use 4 casas decimais para os valores de intervalos para a integra ca o). 4. Calcule x2 = (x1 ), com 4 casas decimais e 8 intervalos.
e 8
5. Discuta uma estrat egia que voc e adotaria para mostrar que e est a, com certeza, no intervalo [2.716, 2.720]. Exerc cio 15.6 Usando o m etodo de m nimos quadrados, aproxime ex por um polin omio de grau 4 no intervalo [1, 1]. Para isso, use a fam lia de polin omios ortogonais (nesse 3 6 2 3 3 4 intervalo) g0 (x) = 1, g1 (x) = x, g2 (x) = x2 1 3 , g3 (x) = x 5 x, g4 (x) = x 7 x + 35 , 2 8 8 sabendo que < g0 , g0 >= 2, < g1 , g1 >= 3 , < g2 , g2 >= 45 , < g3 , g3 >= 175 , < g4 , g4 >= 128 a preciso calcular a integral gaussiana. Outras integrais ou ser ao 11025 . Observe que ser nulas (porque o integrando e mpar) ou podem ser reduzidas, por sucessivas integra co es por partes, a ` integral gaussiana. Estime os valores num ericos usando uma aproxima ca o para essa integral. Exerc cio 15.7 Considere a equa ca o f (x) =
x t2 e dt 0
2
1 = 0.
1. Dena a fun ca o de itera ca o do M etodo de Newton para resolver a equa ca o. 2. Com x0 = 1, obtenha x1 = (x0 ).
Cap tulo 16
Obten c ao das f ormulas de erro

Como dissemos no Cap tulo anterior, dedicaremos este Cap tulo para a obten c ao das f ormulas de erro mencionadas. Seguiremos tr es abordagens, com a nalidade de propor diferentes vis oes de como se pode estimar a integral da diferen ca entre a fun c ao verdadeira e o polin omio interpolador que a substitui. O leitor reconhecer a que a primeira abordagem e a continua c ao natural das estimativas do erro de interpola c ao obtidas no Cap tulo 11. Todas as f ormulas de erro mencionadas pressup oem que os intervalos da parti c ao sejam de igual tamanho. Poder amos, evidentemente, determinar f ormulas mais gerais que levassem em conta um espa camento irregular, mas sem d uvida isso seria um pouco menos interessante. As id eias da primeira abordagem, por exemplo, podem ser seguidas no caso geral, se isso for da necessidade do leitor, mas deve-se atentar para o fato de que as f ormulas de erro n ao ser ao t ao boas quanto as outras. Em todas as abordagens, a f ormula de erro e obtida primeiro para uma unidade b asica. No M etodo dos Trap ezios, a unidade b asica e um intervalo [xi , xi+1 ], de tamanho h. Para cada intervalo obt em-se uma f ormula eT (h), e como o n umero de intervalos e igual a n ent ao ET (h) = neT (h) . Acontece que n tamb em e o tamanho total do intervalo de integra c ao dividido por h, de forma que |b a| ET (h) = eT (h) . h Por exemplo, na primeira e na segunda abordagens obteremos eT (h) = logo |b a| max |f |h2 . 12 Observe que tamb em h a uma perda em rela c ao ` a constante multiplicativa, pois na f ormula de eT (h) o m aximo valor absoluto da segunda derivada e obtido dentro da unidade b asica, enquanto que na f ormula de ET (h) trata-se do m aximo ao longo de todo o intervalo de integra c ao. ET (h) = 167 1 max |f |h3 , 12
168
DAS FORMULAS CAP ITULO 16. OBTENC AO DE ERRO
J a no M etodo de Simpson, a unidade b asica e um intervalo da forma [x2i , x2i+2 ], que tem tamanho 2h. Em cada intervalo desses troca-se f por um polin omio quadr atico e examina-se a diferen ca produzida na integra c ao. A f ormula de erro para a unidade ser a denotada por a| , resulta que eS (h). Como s ao n unidades b asicas e 2n = |b h |b a| eS (h) . 2h As f ormulas de erro das unidades b asicas (de acordo com a abordagem) est ao contidas na tabela abaixo. ES (h) = neS (h) = 1a eT (h) eS (h)
1 3 12 max |f | h 1 4 12 max |f | h
2a
1 3 12 max |f | h 1 (iv ) | h5 90 max |f
3a
5 3 12 max |f | h 2 (iv ) | h5 45 max |f
Finalmente, vale notar que, via uma mudan ca de coordenadas, os intervalos [xi , xi+1 ] do M etodo dos Trap ezios podem ser tomados como sendo [0, h], e as unidades [x2i , x2i+2 ] do M etodo de Simpson podem ser tomados como sendo [h, h]. No M etodo dos Trap ezios, denimos p(x) como o polin omio interpolador de grau 1 por (0, f (0)) e (h, f (h)), e procuramos limitar a diferen ca
h
(h) =
0
(f (x) p(x)) dx ,
em valor absoluto, por eT (h). No M etodo de Simpson, denimos p(x) como sendo o polin omio quadr atico por (h, f (h)), (0, f (0)) e (h, f (h)), e procuramos limitar a diferen ca
h
(h) =
h
(f (x) p(x)) dx ,
em valor absoluto, por eS (h).
16.1
Primeira Abordagem - M etodo dos Trap ezios
1 Mostraremos que |(h)| 12 max |f | h3 (vide tabela acima). De acordo com o exposto no Cap tulo 11, a diferen ca
pode ser limitada, em [0, h], da seguinte forma: onde
f (x) p(x)
cx(h x) f (x) p(x) cx(h x) , c= 1 max |f | . 2! [0,h]

h
Ent ao, pela deni c ao de (h), temos |(h)| c e segue o que quer amos demonstrar. x(h x)dx = c h3 , 6
16.2. PRIMEIRA ABORDAGEM - METODO DE SIMPSON
169
16.2
Primeira Abordagem - M etodo de Simpson
1 max |f | h4 . Mostraremos que |(h)| 12 De acordo com o Cap tulo 11, |f (x) p(x)| c|q (x)| , onde q (x) = (x + h)x(h x) e 1 c = 3! max[h,h] |f | . Ent ao h
|(h)| c
|q (x)|dx .
Como q e fun c ao mpar, |q | e fun c ao par, de forma que

h
|(h)| 2c
|q (x)|dx .
Al em disso, em [0, h] a fun c ao q e positiva, e portanto s o precisamos obter a integral

h 0
(x + h)x(h x)dx = |(h)| c 4 h , 2
h4 . 4
Logo de onde segue o que quer amos demonstrar.
16.3
Segunda Abordagem - M etodo dos Trap ezios
1 max |f | h3 . Iremos mostrar que |(h)| 12 h Queremos avaliar o erro de se aproximar a integral 0 f (x)dx pela area do trap ezio h ( f (0) + f ( h )). Para isso, consideraremos h como vari a vel e estimaremos o erro ( h ) em 2 fun c ao dessa vari avel. Temos h
(h) =
0
f (x)dx
h (f (0) + f (h)) . 2
Se P for uma primitiva de f (isto e, P (x) = f (x)), ent ao (h) = P (h) P (0) h (f (0) + f (h)) . 2
Observamos ent ao que (0) = 0, o que era de se esperar, pois nenhum erro e cometido se h e nulo. Se pudermos limitar a derivada de (h) ent ao limitaremos seu crescimento, em fun c ao do tamanho de h. Temos (h) = P (h) Como P = f , ent ao (h) = 1 h (f (0) + f (h)) f (h) . 2 2
h 1 (f (h) f (0)) f (h) . 2 2
170
Notamos tamb em que (0) = 0, o que nos sugere derivar ainda mais uma vez, para delimitar o crescimento de : h (h) = f (h) . 2 Ent ao h | (h)| C , 2 onde C = max |f | .
[0,h]
Com o crescimento controlado de , voltamos a integrar:

h h
(h) = (0) +
0
(t)dt =
0 h
(t)dt .
Logo
h
| (h)| Integrando mais uma vez,
| (t)|dt C
h 2
t h2 dt = C . 2 4
|(h)| C Como quer amos demonstrar!
h3 t dt = (max |f |) . 4 12
16.4
Segunda Abordagem - M etodo de Simpson

1 90
Queremos mostrar que |(h)| Temos que avaliar

h
max |f (iv) | h5 . h (f (h) + 4f (0) + f (h)) . 3
(h) =
h
f (x)dx
Os passos s ao semelhantes ` aqueles do M etodo dos Trap ezios, mas agora temos que derivar e integrar uma vez a mais. Derivando tr es vezes chegamos a h (h) = (f (h) f (h)) , 3 com (0) = (0) = (0) = 0. Pelo Teorema do Valor M edio, existe = (h) no intervalo [h, +h] tal que f (h) f (h) = f (iv) ( ) 2h . Portanto, se C = max |f (iv) |
[h,h]
ent ao | (h)| C
2h2 , 3
16.5. TERCEIRA ABORDAGEM - METODO DOS TRAPEZIOS e, por integra c oes sucessivas, | (h)| C | (h)| C |(h)| C 2h3 , 9 h4 , 18 h5 . 90
171
16.5
Terceira Abordagem - M etodo dos Trap ezios
5 max |f | h3 . Obteremos |(h)| 12 Nesta abordagem do c alculo de erro, levamos em conta a expans ao em Taylor da fun c ao f (vide Ap endice C. O m etodo e um pouco mais intuitivo que os anteriores, mas produz resultados um pouco piores (n ao na ordem de h, mas nas constantes multiplicativas). Como na Segunda Abordagem, olhamos para h
(h) =
0
f (x)dx
h [f (h) + f (0)] . 2
A fun c ao f se escreve como f (x) = f (0) + f (0)x + R(x) , onde |R(x)| max |f | J a que f (0)h =
h 0
x2 . 2
f (0)dx, temos
h
(h)
=
0 h
f (x) f (0)dx + f (0)xdx
h [f (0) f (h)] 2
h
=
0
h [f (0) f (h)] + 2
h 0 h
R(x)dx
0
= f (0) = f (0)
h2 h [f (h) f (0)] + 2 2
R(x)dx R(x)dx
0
h2 h [f (0)h + R(h)] + 2 2
h
h = R(h) + 2
R(x)dx .
0
Usando a estimativa em |R(x)|, conclu mos que |(h)| max |f | 5h3 . 12
172
16.6
Terceira Abordagem - M etodo de Simpson
2 max |f (iv) | h5 . Iremos mostrar que (h) 45 Em primeiro lugar, observaremos que o M etodo de Simpson, aplicado em pares de intervalos iguais, e exato para polin omios c ubicos. Sem perda de generalidade, suponha que queiramos integrar
g (x) = ax3 + bx2 + cx + d em [h, h]. O M etodo de Simpson nos d a a aproxima c ao h (g (h) + 4g (0) + g (h)) . 3 Mas Al em disso, g (0) = d, logo g (h) + g (h) = 2bh2 + 2d .
h bh2 (g (h) + 4g (0) + g (h)) = 2h( + d) . 3 3 Por outro lado, vemos que esse e exatamente o valor da integral, pois
h
(ax3 + bx2 + cx + d)dx = a

h
x3 x2 h x4 h |h + b |h | + dxh h + c h . 4 3 2 h
O primeiro e o terceiro termos s ao nulos, logo a integral vale 2b h3 + 2dh , 3
que e o mesmo valor dado pelo M etodo de Simpson. Agora consideremos uma fun c ao f sucientemente diferenci avel. Ela pode ser escrita como seu polin omio de Taylor de ordem 3 mais um resto R(x): f (x) = f (0) + f (0)x + onde f (0) 2 f (0) 3 x + x + R(x) , 2 3!
R(x) 0 x3 quando x 0. Chamaremos de p3 o polin omio de Taylor, de forma que f (x) p3 (x) = R(x) .
Adiante teremos uma f ormula mais expl cita para esse resto, que permitir a qualicar as constantes envolvidas. h Queremos avaliar o erro cometido pelo M etodo de Simpson para integrar h f (x)dx, isto e, olharemos para a diferen ca
h
(h) =
h
f (x)dx
h (f (h) + 4f (0) + f (h)) . 3
16.6. TERCEIRA ABORDAGEM - METODO DE SIMPSON Sabendo que o M etodo de Simpson e exato para grau tr es, temos
h
173
p3 (x)dx =
h
h (p3 (h) + 4p3 (0) + p3 (h)) , 3
logo, lembrando que p3 (0) = f (0) e que f (x) p3 (x) = R(x),

h
(h) =
h
R(x)dx
h (R(h) + R(h)) . 3
Usaremos a seguinte estimativa para o resto: |R(x)| max |f (iv) |

[0,x]
x4 , 4! 2h5 5! 2h5 . 45
de forma que
h h
R(x)dx max |f (iv) |

[h,h]
e |(h)| max |f (iv) |

[h,h]
2h5 2h5 + 5! 3 4!
= max |f (iv) |
[h,h]
174
Parte VI
Equa c oes Diferenciais
175
Cap tulo 17
Breve introdu c ao ` as equa c oes diferenciais

17.1 Introdu c ao
Uma equa c ao diferencial de uma vari avel real e uma equa c ao em que a inc ognita e uma fun c ao real x : [a, b] R. Esta equa c ao coloca em rela c ao a fun c ao e sua derivada. O tipo mais simples de equa c ao diferencial e o problema de achar uma primitiva de uma dada fun c ao. Por exemplo, x (t) = f (t) , t [a, b] , signica que a derivada da fun c ao x(t) e igual a f (t) para todo t entre a e b. Em outras palavras, a fun c ao x(t) e uma primitiva da fun c ao f (t). Na nota c ao de Leibniz, escrevemos x(t) = f (t)dt + C ,
indicando que todas as primitivas de f diferem por uma constante. Mais precisamente, se F1 e F2 s ao primitivas de f ent ao existe uma constante C , que depende e claro de F1 e F2 , tal que F1 (t) F2 (t) = C para todo t I . Uma primitiva em particular pode ser dada pela integral indenida
t
F (t) =
t0
f (s)ds ,
para um determinado t0 [a, b]. Neste caso, F (t0 ) = 0. Se adicionarmos ` a equa c ao diferencial x (t) = f (t) a exig encia de que x(t0 ) = x0 , ent ao ca determinada a u nica primitiva que e solu c ao desse problema:
t
x(t) = x0 +
t0
f (s)ds .
Essa exig encia extra e conhecida como um problema de valor inicial. 177
178
AS ` EQUAC CAP ITULO 17. BREVE INTRODUC AO OES DIFERENCIAIS
Em geral as equa c oes diferenciais n ao se resumem t ao simplesmente a um problema de integra c ao. Por exemplo, a derivada de x(t) pode depender de x(t), como na seguinte equa c ao: x (t) = x(t) , t R . f E acil vericar que x(t) = et e solu c ao. Ela n ao e a u nica, pois x(t) = cet tamb em e solu c ao da equa c ao diferencial para todo c R. No entanto, se impusermos o problema de valor inicial x(t0 ) = x0 e supusermos x(t) = cet , ent ao a constante c ca univocamente determinada por x0 = x(t0 ) = cet0 , donde x(t) = x0 ett0 . Ao contr ario do exemplo anterior, n ao e claro ainda neste ponto que x(t) seja a u nica solu c ao da equa c ao diferencial x (t) = x(t) satisfazendo o problema de valor inicial x(t0 ) = x0 , pois a princ pio poderia haver uma solu c ao que n ao fosse da forma x(t) = cet . De fato veremos que esse n ao e o caso, pelo menos para essa equa c ao (vide Subse c ao 17.3.2). De modo geral, uma equa c ao diferencial e colocada assim: a derivada de x(t) depende de t e de x(t), isto e, x (t) = f (t, x(t)) , onde f aqui denota uma fun c ao de duas vari aveis (n ao nos preocuparemos por enquanto com o dom nio da fun c ao f ). Na nota c ao compacta escreve-se x = f (t, x) , cando impl cito o argumento das fun c oes x e x . Por exemplo, x = t2 sen(tx) signica 2 x (t) = t sen(tx(t)). As fun c oes x(t) que vericam x (t) = f (t, x(t)) s ao chamadas solu co es da equa c ao diferencial. Al em disso, como nos dois exemplos acima, pode-se colocar o problema de valor inicial x(t0 ) = x0 . O problema de achar x(t) tal que x = f (t, x) x(t0 ) = x0 e comumente conhecido como problema de Cauchy. Dizemos que uma equa c ao diferencial e aut onoma quando f s o depende de x, isto e f (t, x) = X (x) (na medida do poss vel usaremos a letra f para as equa c oes n ao aut onomas e X para as aut onomas, por quest oes de tradi c ao). Pensando no caso aut onomo, suponha que j a conhe camos uma solu c ao para o problema de Cauchy x = X (x), x(0) = x0 . Seja x (t) essa solu c ao, isto ex (t) = X ( x(t)) e x (0) = x0 . Ent ao e f acil ver que x(t) = x (t t0 ) e solu c ao do problema de Cauchy x = X (x), x(t0 ) = x0 . Em outras palavras, no caso de equa c oes aut onomas basta estudar o problema de Cauchy com t0 = 0. Al em das equa c oes aut onomas, temos tamb em as equa c oes separ aveis, onde f (t, x) e o produto de uma fun c ao que s o depende de t por uma fun c ao que s o depende de x: f (t, x) = g (t)X (x) .
DE EQUAC 17.2. SOLUC AO OES AUTONOMAS E SEPARAVEIS
179
Veremos adiante que equa c oes aut onomas e separ aveis s ao facilmente sol uveis, a menos de integra c oes e invers oes, isto e, podemos escrever suas solu c oes em termos de inversas de primitivas de fun c oes elementares, mas eventualmente essas solu c oes n ao podem ser obtidas explicitamente.
17.2
Solu c ao de equa c oes aut onomas e separ aveis
Em primeiro lugar observamos que, de algum modo, equa c oes aut onomas representam um caso particular das equa c oes separ aveis. Pois uma equa c ao aut onoma x = X (x) tamb em se escreve como x = g (t)X (x), se tomarmos g (t) 1. Para discutir as solu c oes de x = g (t)X (x), observamos primeiramente que se X (x ) = 0 ent ao x(t) x e solu c ao, pois x (t) 0 e g (t)X (x(t)) = g (t)X (x ) 0. Um ponto x dessa forma e chamado de singularidade da equa c ao. Est a fora do escopo destas notas, mas com condi c oes razo aveis sobre g e X (por exemplo, g cont nua e X diferenci avel e com derivada cont nua), pode-se mostrar que se x(t) = x para algum instante t ent ao x(t) x . Em outras palavras, n ao h a como uma solu c ao x(t) chegar e sair de uma singularidade. Na verdade, sob essas mesmas hip oteses e poss vel mostrar que duas solu c oes quaisquer x(t) e x (t) ou s ao id enticas (x(t) = x (t), para todo t) ou nunca se cruzam (x(t) = x (t), para todo t). Fora das singularidades, podemos encontrar a solu c ao da seguinte maneira. Primeiro escrevemos a equa c ao com a vari avel t explicitada: x (t) = g (t)X (x(t)) . O instante inicial e t0 , e gostar amos de saber x(t) se x(t0 ) = x0 (problema de Cauchy). Como estamos supondo que x(t) n ao passa por singularidade, ent ao X (x(t)) n ao se anula, e podemos dividir os dois lados da equa c ao por X (x(t)), e integrar de t0 a t:
t t0
1 x (s)ds = X (x(s))
g (s)ds .
t0
No lado esquerdo fazemos a substitui c ao u = x(s), de forma que du = x (s)ds. Ent ao

x(t) x0
1 du = X (u)
g (s)ds .
t0
A partir da podemos, em teoria, encontrar x(t), mas sua express ao expl cita depender a 1 e de podermos cumprir certas etapas. Por exemplo, se acharmos uma primitiva F para X uma primitiva G para g , ent ao a equa c ao car a F (x(t)) = F (x0 ) + G(t) G(t0 ) . Se, al em disso, conseguirmos achar a inversa de F (pelo menos numa regi ao delimitada entre 1 duas singularidades isso em tese e poss vel, pois F = X n ao troca de sinal, mas achar uma express ao expl cita e outra coisa!), teremos x(t) = F 1 (F (x0 ) + G(t) G(t0 )) .
180
17.3
Alguns exemplos
Nesta Se c ao examinaremos alguns exemplos de equa c oes diferenciais que surgem da modelagem de problemas do mundo real, e discutiremos sua solu c ao.
17.3.1
Naftalinas
Na Subse c ao 4.3.3 abordamos a perda de material de uma bolinha de naftalina em fun c ao do tempo, e chegamos ` a conclus ao de que seu raio r(t) obedece ` a equa c ao r (t) = , onde e uma constante positiva. Podemos dizer que a equa c ao e aut onoma, mas e muito mais do que isso. Ela diz que r(t) e uma fun c ao de derivada constante negativa, ou seja, e uma fun c ao am. Portanto r(t) = r0 t , onde r0 = r(0). Este caso n ao passa de uma simples primitiviza c ao.
17.3.2
Crescimento populacional a taxas constantes
Se tomarmos t como sendo o tempo, e x(t) como sendo a popula c ao de determinada esp ecie no instante t, podemos, por aproxima c ao, supor que x(t) varia continuamente (hip otese razo avel se a popula c ao e grande). A taxa de varia c ao da popula c ao e medida percentualmente, isto e, mede-se o incremento (ou decrescimento) x(t + h) x(t), do instante t para o instante t + h, e divide-se pela popula c ao que havia no instante t: x(t + h) x(t) . x(t) Mesmo assim, esse valor e muito dependente do tempo h decorrido entre os dois instantes, sendo muito mais razo avel, portanto, dividir tudo por h. Fazendo depois o limite quando h tende a zero, camos com x (t) , (t) = x(t) onde (t) indica a taxa de crescimento instant aneo no instante t. A hip otese Malthusiana de crescimento e que (t) seja constante, isto e, (t) , o que leva ` a equa c ao x (t) = x(t) . Podemos deduzir a solu c ao, sem apelar para chutes. A u nica singularidade da equa ca o e x = 0, e queremos achar as solu c oes que n ao passam pelo zero. Ent ao
x(t) x0
1 du = (t t0 ) , u
portanto log x(t) = log x0 + (t t0 )
17.3. ALGUNS EXEMPLOS e, exponenciando os dois lados, x(t) = x0 e(tt0 ) .
181
Um modelo como este se presta tamb em ` a modelagem do decaimento radioativo, onde a taxa de decaimento de uma amostra de um is otopo e proporcional ` a quantidade desse mesmo is otopo.
17.3.3
P ara-quedista
Al em do crescimento populacional e do decaimento radioativo, equa c oes do tipo x = x explicam o comportamento da velocidade do p ara-quedista. Se v (t) e velocidade do p araquedista (supondo positiva se estiver indo de cima para baixo), ent ao v (t) e a acelera c ao, e pela Segunda Lei de Newton vale mv (t) = mg v (t) , onde o termo v (t) corresponde ` a for ca de resist encia exercida em sentido contr ario ao do movimento e de intensidade proporcional ` a velocidade. Isso d a uma equa c ao aut onoma em v (t). A velocidade de equil brio v e denida como sendo aquela para a qual a resultante de . Se denirmos w(t) = v (t) v (ou seja, a diferen ca entre a for cas e nula, portanto v = mg velocidade e a velocidade de equil brio, em cada instante), teremos mw (t) = mv (t) = mg v (t) = v v (t) = w(t) . Como
m
g v ,
ent ao w(t) = w0 e v t ,
g
se w0 = w(0). A equa c ao tamb em poderia ser resolvida diretamente, pela integra c ao

v (t) v0
m dv = t , mg v
seguindo o m etodo sugerido para equa c oes aut onomas e separ aveis.
17.3.4
Crescimento populacional com restri c oes de espa co
Um modelo ligeiramente mais realista do que o proposto na Subse c ao 17.3.2 levaria em conta a limita c ao de espa co e alimento que uma popula c ao enfrenta quando se torna muito grande. Esse modelo preveria que: (i) se a popula c ao for muito grande, a taxa de crescimento (t) deveria ser negativa, e tanto mais negativa quanto maior for a popula c ao; (ii) se a popula c ao for muito pequena, a taxa de crescimento deveria ser positiva, e tanto mais positiva quanto menor for a popula c ao (respeitando e claro a velocidade de reprodu c ao m axima da esp ecie). Nesse modelo, portanto, (t) dependeria exclusivamente da popula c ao, sendo mais justo escrever (t) = h(x(t)) .
182
A fun c ao h(x) assumiria um valor positivo em x = 0, correspondente a uma taxa de crescimento ideal da popula c ao, sem limita c ao f sica alguma. Essa taxa decresceria continuamente com o aumento de x, ao ponto de se tornar negativa para x grande. Por exemplo, h(x) = a bx, com a e b positivos, satisfaz a essas exig encias. Neste caso, ter amos a equa c ao diferencial x (t) = x(t) (a bx(t)) ou, em nota c ao compacta, x = x(a bx) . Poder amos resolver explicitamente esta equa c ao, mas achamos que ela se presta muito mais a um exame qualitativo, do qual iremos falar na pr oxima Se c ao.
17.3.5
Caten aria
J a falamos mais de uma vez sobre a caten aria, mas em nenhum momento justicamos porque uma corda (ou corrente) pendurada por dois pontos assume o formato de um cosseno hiperb olico. A dedu c ao mais razo avel passa por uma equa c ao diferencial. Vejamos. Em primeiro lugar, chamaremos de t a coordenada horizontal e de x a coordenada vertical no plano da corda, para manter a nota c ao que usamos at e este ponto da exposi c ao. comum o emprego de y e x para essas vari E aveis, de forma que a equa c ao diferencial se escreva como y = f (x, y ), mas n ao o faremos para evitar confus ao. A origem das coordenadas ser a colocada sobre o ponto de m nimo da corda.
11 00 00 11 00 11
x
11 00 00 11 00 11
Como estamos modelando uma corda parada, temos um equil brio de for cas sobre a corda, que podemos investigar. As for cas existem realmente, porque h a o peso da corda agindo verticalmente e as for cas de tens ao para contrabalan car. Faremos a an alise desse equil brio de for cas sobre um segmento da corda, entre o ponto (0, 0) e um ponto arbitr ario (t, x(t)) da corda, onde x(t) indica a fun c ao cujo gr aco coincide com seu formato. Para se obter a for ca peso agindo sobre esse peda co, e preciso calcular seu comprimento e multiplicar pela densidade linear da corda (que suporemos constante e igual a um certo n umero ). O comprimento l(t) do gr aco de x(t) entre 0 e t e dado pela integral
t
l(t) =
0
1 + x (s)2 ds .
As for cas de tens ao agem no segmento tangencialmente ` a corda. Estando j a equilibradas localmente no interior do segmento, restam as for cas nos extremos. Em (0, 0) e uma for ca horizontal, de intensidade f0 desconhecida. Em (t, x(t)) e uma for ca de intensidade f (t) desconhecida, inclinada com angulo = (t) cuja tangente e igual a x (t).
17.3. ALGUNS EXEMPLOS Do equil brio de for cas horizontal obt em-se f0 = f (t) cos e do equil brio vertical gl(t) = f (t) sen . Dividindo a segunda equa c ao pela primeira camos com tan = g l(t) . f0
183
J a sabemos que tan = x (t) e que l(t) e dado por uma integral. Derivando ambos os lados obtemos x (t) = c 1 + x (t)2 , e uma equa c ao aut onoma onde a fun c ao inc ognita e x (t). onde c = g f0 . Essa f E acil ver que x (t) = senh(ct) e solu c ao. Pois derivando mais uma vez obteremos x (t) = c cosh(ct) e, por outro lado, 1 + senh2 (ct) = cosh2 (ct) = cosh(ct) .
Al em disso, x (t) = senh(ct) verica x (0) = 0, isto e, a inclina c ao da corda e zero no ponto de m nimo. Agora basta integrar x (t) para obter x(t). Como x(0) = 0 ent ao x(t) = 1 (cosh(ct) 1) . c
17.3.6
Escoamento de um copo furado
Neste exemplo, imagine um copo cheio d agua, com um buraco no fundo, por onde a agua escoa. Suponha que no instante t = 0 a altura do n vel da agua seja igual a h0 . Como evolui com o tempo o n vel h da agua? Em quanto tempo o copo se esvaziar a completamente? Se o copo tem um formato diferente, por exemplo, seu raio aumenta ou diminui conforme a altura, como se comporta a fun c ao h(t)? Com algum grau de empirismo, e poss vel modelar o problema atrav es de uma equa c ao diferencial. O dado emp rico refere-se ` a taxa de sa da de agua pelo buraco, medida em volume por unidade de tempo. Espera-se primeiramente que ela seja proporcional ` a area do buraco (a qual chamaremos de a0 ), mas n ao, a princ pio, da sua forma. Tamb em n ao se espera, em primeira aproxima c ao, que ela dependa do formato do copo. Por outro lado, ela deve ser proporcional ` a velocidade da agua que sai do buraco. Essa sua velocidade, por sua vez, dependeria da altura agua ca sse dessa altura, alcan cando uma h, como se a coluna de velocidade da ordem de h (lembre-se que para um corpo em queda livre, a partir do repouso, a velocidade e proporcional ` a raiz da dist ancia j a percorrida). Ent ao a taxa de varia c ao do volume do copo seria V (t) = ca0 h(t) .
184
Por outro lado, o decrescimento do volume implica no decrescimento do n vel da agua h. Observe, no entanto, que quanto maior for a area da se c ao transversal ao copo na altura h menor ser a o decrescimento do n vel, para uma mesma perda de volume. Ou pensando inversamente, se o copo for muito no ` a altura h ent ao o n vel cair a mais rapidamente. Para quanticar isso, notemos que o volume de agua e completamente determinado pelo n vel h atrav es da fun c ao
h
V (h) =
0
A(u)du ,
onde A(h) e a fun c ao que d a a a rea da se c ao correspondente ` a altura h. Pelo Teorema Fundamental do C alculo, V (h) = A(h) . A fun c ao V (t) resulta ent ao da fun c ao h(t) pela rela c ao V (t) V (h(t)) . Logo, pela Regra da Cadeia, V (t) = V (h(t))h (t) = A(h(t))h (t) . Juntando com a equa c ao emp rica acima, temos A(h(t))h (t) = ca0 h(t) ,
que e uma equa c ao diferencial aut onoma, se a escrevermos na forma tradicional: h h = ca0 . A(h) O exemplo mais simples e o copo reto, quer dizer, cujas se c oes horizontais t em todas a mesma area A. Neste caso, a equa c ao se reduz a h (t) = Tomando t0 = 0 e h(0) = h0 , temos
h(t) h0
ca0 A
h(t) .
1 dh = t , h
onde =
ca0 A .
O lado esquerdo pode ser integrado: 2( h(t) h0 ) = t , h0 t 2

2
e h(t) pode ser isolado: h(t) = .
Portanto h(t) e uma fun c ao quadr atica em t, que vale h0 em t = 0, e se anula no seu ponto de m nimo, t = 2 h0 .
17.3. ALGUNS EXEMPLOS
185
17.3.7
Dada do M etodo de Newton, quem e f?
Um problema te orico que pode ser resolvido com o aux lio de equa c oes diferenciais separ aveis e o de achar a fun c ao f que, no M etodo de Newton, gera uma dada fun c ao de itera c ao . Em outras palavras, dada a fun c ao e sabendo-se que (x) = x f (x) , f (x)
achar f . Manipulando, obtemos a equa c ao separ avel f (x) = 1 f (x) , x (x)
onde x faz o papel de t e f o papel de x. A equa c ao s o est a denida fora dos pontos xos de , mas uma an alise criteriosa mostra que as solu c oes muitas vezes se estendem continuamente a esses pontos ( e um bom exerc cio!).
17.3.8
Transfer encia de calor
Um corpo est a em contato com um grande reservat orio, cuja temperatura e uma fun c ao do tempo T (t). Seja x(t) a temperatura do corpo no instante t. A cada instante, a varia c ao da temperatura do corpo e proporcional ` a diferen ca entre sua temperatura e a temperatura do reservat orio. Equacionando: x (t) = (T (t) x(t)) , onde e uma constante positiva. Aqui n ao se trata mais de uma equa c ao aut onoma, pois se escrevermos x = f (t, x) ent ao f (t, x) = (T (t) x) . Esta equa c ao tampouco e separ avel, mas ainda assim e simples o suciente para ser sol uvel. Ela se enquadra no conjunto das equa c oes do tipo x = a(t)x + b(t) , cuja solu c ao discutiremos abaixo. O caso em que b(t) = 0 e um caso particular de equa c ao separ avel, que tem solu c ao
t
x(t) = x0 exp{
t0
a(s)ds}
se x0 = x(t0 ). Para o problema am x = a(t)x + b(t), x(t0 ) = x0 , com solu c ao x(t), usamos um truque: R tt a(s)ds . Obtemos examinamos a derivada de y (t) = x(t)e 0 y (t) = x (t)e
Rt
t0
a(s)ds
x(t)a(t)e
Rt a(s)ds
Rt
t0
a(s)ds
por em substituindo x (t) por a(t)x(t) + b(t), camos com y (t) = b(t)e
t0
186 e portanto
y (t) = y (t0 ) +
t0
b(r)e
Rr
t0
a(s)ds
dr .
Como y (t0 ) = x0 , obtemos a solu c ao x(t) = e

Rt
t0
a(s)ds
x0 +
t0
b(r)e
Rr
t0
a(s)ds
dr
A unicidade e garantida pela unicidade da integra c ao de y com a condi c ao y (t0 ) = x0 .
17.4
Entendimento qualitativo de equa c oes aut onomas
At e agora n ao discutimos nada sobre a representa c ao gr aca das solu c oes de uma equa c ao diferencial, mas naturalmente o mais obvio e desenharmos o gr aco da solu c ao x(t). O que veremos nesta Se c ao e que e muito f acil desenharmos o esbo co de algumas solu c oes (variando a condi c ao inicial) de equa c oes aut onomas, sem resolv e-las! Para come car, vimos que se x e uma singularidade da equa c ao aut onoma x = X (x), ent ao x(t) x e solu c ao. Num diagrama em que coloquemos t na abscissa e x na ordenada, esse tipo de solu c ao e uma linha reta horizontal ` a altura de x . Portanto as primeiras solu c oes que podemos identicar na equa c ao s ao essas solu c oes constantes, cada uma correspondendo a um zero da fun c ao X . Em cada intervalo entre duas singularidades e nos intervalos entre a u ltima singularidade e o innito, o sinal de X n ao muda, pois se mudasse haveria uma outra singularidade no intervalo, pelo Teorema de Bolzano. Seja I um intervalo desses, e suponha que x(t) est a em I . Como X (x(t)) = x (t), ent ao o sinal de x (t) e o mesmo que o sinal de X (x(t)), e esse sinal e sempre o mesmo enquanto x(t) estiver em I . Como as solu c oes n ao cruzam as singularidades (isto e garantido por um Teorema, se X for deriv avel e com derivada cont nua), uma solu c ao x(t) est a sempre connada a um mesmo intervalo, o que implica que o sinal de x (t) e sempre o mesmo, para todo t. O que e o mesmo que dizer que x(t) ou e crescente ou e decrescente, e uma ou outra op c ao ser a determinada pelo sinal de X no intervalo onde est a connada a solu c ao. Na gura abaixo, por exemplo, ilustramos esquematicamente uma fun c ao (arbitr aria) X (x), com quatro singularidades x , x , x e x . A fun c a o e negativa ` a esquerda de x 1 2 3 4 1 e a direita de x4 e nos intervalos entre x1 e x2 e entre x2 e x3 . entre x3 e x4 , e positiva `
X(x)
1 0 0 1
1 0 0 1
1 0 0 1
1 0 0 1
x* 1
x* 2
x* 3
x* 4
O diagrama abaixo ilustra algumas solu c oes (uma para cada intervalo).
17.5. EQUAC OES DIFERENCIAIS COM MAIS VARIAVEIS
187
x
1 0 0 1
x* 4 x* 3 x* 2 t x* 1
1 0 1 0
11 00 00 11
1 0 0 1
As solu c oes s ao assint oticas, para t indo a mais ou menos innito, ` as singularidades (de fato, em equa c oes aut onomas, as solu c oes n ao podem ser assint oticas a pontos que n ao sejam singularidades). Uma maneira mais compacta de se representar qualitativamente o comportamento das solu c oes dessa equa c ao diferencial e usando um diagrama onde s o entra a reta dos xs, como mostra a gura abaixo. As setas entre as singularidades indicam para que lado as solu c oes naquele intervalo tendem quando t tende a innito.
x* 1
1 0 0 1
x* 2
1 0 1 0
x* 3
1 0 0 1
x* 4
1 0 0 1
Assim ca f acil, por exemplo, entender a equa c ao de crescimento populacional x = x(a bx) . Como essa equa c ao s o faz sentido para x 0, nos restringiremos a essa regi ao. Nessa regi ao, a . Isso signica que a = = 0 e x a fun c ao X (x) = x(a bx) tem duas singularidades: x 2 1 b popula c ao nula e a popula c ao igual a x s a o solu c o es de equil brio. 2 Entre as duas, X (x) e positiva e ` a direita de x c ao X (x) e negativa. Isso signica 2 a fun que se a popula c ao inicial est a abaixo da popula c ao de equil brio ent ao tender a a aumentar assintoticamente at e o equil brio x . E se come c ar acima decrescer a assintoticamente at eo 2 mesmo equil brio.
17.5
Equa c oes diferenciais com mais vari aveis
Existem tamb em os chamados sistemas de equa co es diferenciais (de primeira ordem), que envolvem simultaneamente duas ou mais fun c oes e suas respectivas primeiras derivadas. Por exemplo, x = 3x2 y + 3 . y = sin x + yx3 Neste caso, achar uma solu c ao para o sistema signica encontrar duas fun c oes x(t) e y (t) que simultaneamente veriquem x (t) y (t) = = 3x(t)2 y (t) + 3 sin x(t) + y (t)x(t)3 .
188
Esse tipo de problema parece ser bastante arido ` a primeira vista, mas se torna mais atraente se o interpretarmos do ponto de vista geom etrico.
y
Podemos olhar as fun c oes x(t) e y (t) como as coordenadas de uma curva : t (x(t), y (t)) no plano xy . A derivada da curva , dada por (t) = (x (t), y (t)), representa o vetor tangente ` a curva. O sistema de equa c oes diferenciais diz ent ao que, em cada instante t, o vetor tangente ` a curva (t) dado por (t) = (x (t), y (t)) tem que ser exatamente igual ao vetor (3x(t)2 y (t) + 3, sin x(t) + y (t)x(t)3 ).
. (t) x (t)=(x(t),y(t))
Perceba que esse sistema de equa c oes diferenciais j a xa, para cada ponto (x, y ), qual ser a o vetor tangente de uma solu c ao que por ali passar em algum instante: (3x2 y +3, sin x+yx3 ). Essa fun c ao que associa para cada ponto um vetor (que deve ser sempre tangente ` as solu c oes do sistema) e chamada de campo de vetores. Uma maneira de esbo car um campo de vetores e mostrando os vetores correspondentes a alguns pontos do plano (x, y ).
Para um sistema de equa c oes diferenciais como esse tamb em podemos estabelecer o problema de Cauchy: dado um ponto (x0 , y0 ) e um instante t0 achar uma solu c ao (t) tal que (t0 ) = (x0 , y0 ). Modelos de crescimento populacional envolvendo mais do que uma esp ecie s ao um t pico exemplo de sistemas de equa c oes diferenciais. Cada vari avel do sistema representa a popula c ao de uma esp ecie. Por exemplo, se x(t) for a popula c ao de tartarugas e y (t) for a popula c ao de jacar es, podemos tecer as seguintes considera c oes. Em primeiro lugar, a popula c ao de tartarugas n ao precisa dos jacar es para sobreviver, mas tem suas limita c oes de espa co e alimento usuais. Como na Subse c ao 17.3.4, a taxa de crescimento proporcional da popula c ao e uma fun c ao parecida com A Bx(t), mas deve-se descontar um termo tanto maior quanto maior for a popula c ao de jacar es, por exemplo Cy (t). Ent ao ter amos x (t) = A Bx(t) Cy (t) . x(t)
17.5. EQUAC OES DIFERENCIAIS COM MAIS VARIAVEIS
189
Por outro lado, supondo que os jacar es precisem se alimentar das tartarugas para sobreviverem, sua taxa de crescimento proporcional na aus encia de tartarugas e negativa, e ser a mais negativa ainda se sua popula c ao for muito grande, tamb em por problemas relativos a limita ` c ao do espa co. Por outro lado, quanto maior for a popula c ao de tartarugas, mais facilidade a popula c ao ter a para crescer. Dessas considera c oes, e razo avel supor que y (t) = D Ey (t) + F x(t) . y (t) Juntando tudo, camos com o sistema x = y = (A Bx Cy )x (D Ey + F x)y .
claro que todo esse racioc E nio e hipot etico, pois carece de dados reais. No entanto, cada situa c ao onde duas ou mais esp ecies se inuenciam mutuamente, seja numa rela c ao predador-presa seja numa rela c ao de competi c ao pelo mesmo alimento ou espa co, esse tipo de modelagem pode ser feito. Outra classe de exemplos relevante vem das equa c oes diferenciais de segunda ordem (isto e, que envolvem a segunda derivada), por exemplo, qualquer equa c ao do tipo x = (x, x ). Com um pequeno truque podemos transformar essa equa c ao num sistema de duas equa c oes de primeira ordem. Basta denir uma segunda vari avel (na verdade, uma segunda fun c ao do tempo) v (t) = x (t), de forma que x (t) = v (t). Ent ao camos com as duas equa c oes x = v v = (x, v ) ,
onde a primeira equa c ao vem simplesmente da deni c ao de v . Por exemplo, tomemos a equa c ao do p endulo = g sen . l (t), camos com Chamando (t) = = = g l sen .
190
Cap tulo 18
Solu c ao num erica de equa c oes diferenciais

Neste Cap tulo estudaremos algumas maneiras de se resolver numericamente uma equa c ao diferencial do tipo x = f (t, x), e veremos no nal como generalizar as id eias para dimens oes mais altas.
18.1
Equa c oes separ aveis
Para come car, veremos nesta Se c ao que j a dispomos dos m etodos necess arios para resolvermos as equa c oes separ aveis. Os m etodos propostos posteriormente ser ao, entretanto, muito mais gerais e, inclusive, mais pr aticos. Como vimos no Cap tulo anterior, se x = g (t)X (x) for a equa c ao, F for uma primitiva 1 e G for uma primitiva de g , ent ao de X x(t) = F 1 (F (x0 ) + G(t) G(t0 )) . Acontece que nem sempre e poss vel obter integrais expl citas, e aqui temos que resolver duas. Resolvendo ou n ao, uma delas ainda ter a que ser invertida, o que tamb em e dif cil ou imposs vel, na maioria dos casos. Todos esses problemas poderiam ser solucionados numericamente. A primitiva de g pode ser denida como
t
G(t) =
t0
g (s)ds ,
1 X
de forma que G(t0 ) = 0 e, da mesma forma, a primitiva de

x
se dene naturalmente como
F (x) =
x0
1 du , X (u)
resultando em F (x0 ) = 0, e portanto x(t) = F 1 (G(t)) . 191
192
NUMERICA CAP ITULO 18. SOLUC AO DE EQUAC OES DIFERENCIAIS
As duas primitivas podem ser obtidas nos pontos que se quiser, usando os m etodos de integra c ao num erica discutidos na Parte V. J a ao problema de invers ao da fun ca o F pode-se aplicar o M etodo de Newton. Para sermos mais precisos, imagine que queiramos calcular x(t) num determinado instante t, e todas as opera c oes mencionadas acima tenham que ser feitas numericamente. Em primeiro lugar, calculamos G(t) usando integra c ao num erica (com a melhor precis ao poss vel, e claro), e depois teremos que achar x(t) tal que F (x(t)) = G(t) , tomando-se os cuidados necess arios para que seja buscada a solu c ao que nos interessa. Ou seja, x(t) e solu c ao da equa c ao f (x) = F (x) G(t) = 0 . Como F (x) =
1 X (x) ,
a fun c ao de itera c ao para o M etodo de Newton ca (x) = x X (x) (F (x) G(t)) .
Com um palpite inicial x0 temos que iterar a fun c ao , de forma a obter x1 , x2 , etc, at e chegar pr oximo ` a raiz com a precis ao desejada. Ent ao
xk
xk+1 = xk X (xk ) G(t) +
x0
1 du X (u)
isto e, em cada etapa da itera c ao e preciso estimar F (xk ) usando algum m etodo de integra c ao num erica. O erro pode, em tese, ser controlado, usando-se estimativas de erro das duas integra c oes e tamb em do M etodo de Newton. Se o procedimento acima for implementado no computador e x(t) for calculado para v arios valores de t, em seq u encia, o melhor palpite para a condi c ao inicial x0 do M etodo de Newton e o valor de x(t) obtido na etapa anterior, pois a fun c ao x(t) e cont nua.
18.2
Discretiza c ao
O fundamento da solu c ao num erica de equa c oes diferenciais x = f (t, x) e a discretiza ca o da vari avel t. Se [a, b] e o intervalo onde gostar amos de achar a solu c ao x(t) ent ao dividimos esse intervalo com uma parti c ao regular a = t0 < t1 < t2 < . . . < tn1 < tn = b , onde a diferen ca entre pontos sucessivos e igual a h (o chamado passo). Determinar numericamente a fun c ao x(t) signica achar, com precis ao sucientemente boa, os valores x0 = x(t0 ), x1 = x(t1 ), . . ., xn = x(tn ). Em suma, a solu c ao num erica de uma equa c ao diferencial peca, inevitavelmente, pela imprecis ao em t, pois os valores de x(t) s ao calculados somente para uma quantidade nita de valores de t, e pela imprecis ao na determina c ao de x(t), sendo que ambas podem ser minimizadas, segundo os m etodos propostos abaixo, pela redu c ao do passo h. Ao mesmo
18.2. DISCRETIZAC AO
193
tempo esta e, para muitos prop ositos, a melhor alternativa dispon vel, visto que a maioria das equa c oes diferenciais n ao admite solu c ao expl cita, em termos de fun c oes elementares. Em todos os m etodos, obteremos a solu c ao num erica por recorr encia. A condi c ao inicial x0 = x(t0 ) e dada (sen ao n ao h a sentido no problema, uma vez que existe uma innidade de solu c oes da mesma equa c ao), e a partir dela obter-se- ao, em sucess ao, os valores de x1 , x2 , etc. Como tk+1 = tk + h (para k = 0, . . . , n 1), a estimativa de xk+1 = x(tk+1 ) pode ser obtida a partir da estimativa de xk = x(tk ) por meio de uma expans ao em Taylor. Para simplicar a nota c ao, denotaremos tk por t, a partir de agora, e xk por x(t), ou ` as vezes simplesmente por x. Ent ao x(t + h) = x(t) + x (t)h + 1 ( m) 1 x (t)h2 + . . . + x (t)hm + o(hm ) , 2! m!
onde o(hm ) denota o resto da expans ao, que vai a zero quando h tende a zero mesmo se claro que a fun dividido por hm (tipicamente, termos de ordem m + 1 ou mais). E c ao precisa ser diferenci avel at e ordem m para valer essa express ao, mas em geral esse e o caso. A express ao signica que, quanto menor for h, melhor o polin omio em h (sem o resto) aproximar a x(t+h). Al em disso, geralmente mas nem sempre, quanto maior for m melhor ser a a aproxima c ao e, principalmente, mais efetiva se tornar a a redu c ao de h como instrumento para melhorar a precis ao de x(t + h) atrav es do polin omio. As derivadas de x(t) se relacionam com as derivadas de f atrav es da equa c ao diferencial, s o que f e uma fun c ao de duas vari aveis, t e x. Por exemplo, da pr opria equa c ao temos a igualdade x (t) = f (t, x(t)). Quanto ` a segunda derivada temos x (t) = d f f f (t, x(t)) = (t, x(t)) + x (t) (t, x(t)) , dt t x
pela Regra da Cadeia aplicada a fun c oes de duas vari aveis, e portanto x (t) = f f (t, x(t)) + f (t, x(t)) (t, x(t)) . t t
Aqui vale, antes de prosseguirmos, simplicar a nota c ao. Na maioria dos casos, as derivadas de x ser ao calculadas em t, e todas as derivadas parciais de f , de qualquer ordem, em (t, x(t)). Assim, s o indicaremos explicitamente o ponto onde est ao sendo calculadas as fun c oes e suas derivadas se esses pontos n ao forem t e x(t). Nessa nota c ao, teremos x = f f +f . t x
Para simplicarmos mais ainda, denotaremos as derivadas parciais de f com um sub ndice. Por exemplo, 2f ftx = . tx Na hip otese de que f seja uma fun c ao de classe C 2 (jarg ao matem atico para dizer que f tem derivadas parciais at e segunda ordem, e cont nuas), ent ao um teorema (o Teorema de Schwarz) garante que a ordem das derivadas parciais pode ser trocada, de forma que podemos trocar ftx por fxt , ou ainda fttx por fxtt ou ftxt .
194
Segue dessas considera c oes que a express ao de x(t + h) pode ser escrita, at e a ordem desejada, inteiramente em fun c ao de f e de suas derivadas parciais. Neste Cap tulo, iremos tecer considera c oes somente at e ordem 4, mesmo assim precisaremos da express ao de x e x . Para obter x temos que derivar em rela c ao a t a express ao de x , lembrando sempre que cada derivada parcial de f tamb em depende de (t, x(t)), e que a regra da Cadeia deve ser usada. Ent ao, como x = ft + f fx , obtemos x = ftt + f ftx + (ft + f fx )fx + f (fxt + f fxx ) e, reagrupando os termos, x = ft fx + f (fx )2 + ftt + 2f ftx + f 2 fxx ,
2 denota (fx )2 e n ao a derivada em rela c ao a x de f composta com si mesma. Sugere-se onde fx fortemente ao leitor que verique essa conta, e em seguida que verique que 2 3 x = ft fx + f fx +
+fx ftt + 3ft ftx + 5f fx ftx + 3f ft fxx + 4f 2 fx fxx + fttt + 3f fttx + 3f 2 ftxx + f 3 fxxx . Ao leitor assustado com o tamanho das express oes recomenda-se paci encia: ao nal, todos os algoritmos que derivar ao desta linha de racioc nio ser ao extremamente simples! Veremos nas pr oximas Se c oes de que maneira podemos implementar as id eias ora expostas, e suas poss veis varia c oes.
18.3
O M etodo de Euler
x(t + h) = x(t) + x (t)h + o(h) .
O M etodo de Euler consiste em tomar a aproxima c ao de primeira ordem de x(t + h):
O resto o(h) indica que o erro em tomar essa aproxima c ao ser a, em geral, da ordem de h2 ou mais. Como x = f , o M etodo sugere que, na pr atica, obtenhamos xk+1 = x(tk+1 ) = x(tk + h) como xk+1 = xk + f (tk , xk )h . A itera c ao a partir de x0 acumular a um erro da ordem de h2 em cada etapa, podendo a 2 ao o erro acumulado ser a da ordem de acumular ao nal um erro de nh . Como n = b h , ent (b a)h. A t tulo de ilustra c ao, vejamos um exemplo cuja solu c ao exata e conhecida. Tomemos a equa c ao separ avel x = 3t2 x, no intervalo [0, 1], com x(0) = 2. Para achar a solu c ao expl cita, temos que isolar x(t) em
x(t) 2
1 du = u
3s2 ds ,
0
isto e, log x(t) log 2 = t3 .
18.3. O METODO DE EULER Ent ao x(t) = 2et .

3
195
Compararemos essa solu c ao exata com a solu c ao obtida pelo M etodo de Euler com passo h = 0.1. Antes de apresentar o resultado, calculemos os primeiros valores xk com cuidado, para xarmos melhor o entendimento do m etodo. Temos
x1 = x0 + f (t0 , x0 )h ,
com t0 = 0, x0 = 2 e f (t, x) = 3t2 x. Portanto x1 = x0 = 2. Depois, temos x2 = x1 + f (t1 , x1 )h = x1 3t2 1 x1 h , de forma que substituindo os valores conseguimos
x2 = 2 3 0.12 2 0.1 = 2 6 103 = 1.994 . O resultado est a na tabela abaixo, arredondados para 3 casas decimais depois de obtido cada xk . k 0 1 2 3 4 5 6 7 8 9 10 tk 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 xk 2.000 2.000 1.994 1.970 1.917 1.825 1.688 1.506 1.285 1.038 0.786 2etk 2.000 1.998 1.984 1.947 1.876 1.765 1.611 1.419 1.199 0.965 0.736
3
O maior erro cometido em rela c ao ` a solu c ao verdadeira ocorreu em tk = 0.7 (1.506 1.419 = 0.087), mas n ao che preciso tomar cuidado gou a 0.1, o tamanho do passo. E com a avalia c ao do erro, pois sabemos apenas que ele pode ser da ordem de h, mas isso signica apenas que ele e menor do que uma constante vezes h. Essa constante pode ser muito grande, de forma que a informa c ao n ao e suciente para estimar o erro. No entanto, ela diz que, se reduzirmos h ent ao o erro m aximo se reduzir a proporcionalmente.
Por exemplo, vejamos o que resulta da mesma equa c ao com passo igual a 0.05, com quatro casas decimais.
196
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
tk 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00
xk 2.0000 2.0000 1.9993 1.9963 1.9896 1.9777 1.9592 1.9326 1.8971 1.8516 1.7954 1.7281 1.6497 1.5606 1.4617 1.3543 1.2400 1.1210 0.9995 0.8781 0.7592
2etk 2.0000 1.9998 1.9980 1.9933 1.9841 1.9690 1.9467 1.9161 1.8760 1.8258 1.7650 1.6935 1.6115 1.5197 1.4193 1.3116 1.1986 1.0822 0.9648 0.8485 0.7358
A maior diferen ca em rela c ao ao valor verdadeiro n ao passou de 0.043, em tk = 0.75, que e metade da discrep ancia obtida com passo igual a 0.1. Exerc cio 18.1 Considere a equa ca o diferencial x = x2 sent, com a condi ca o inicial x(0) = 1. Obtenha uma discretiza ca o/aproxima ca o da solu ca o usando o M etodo de Euler de primeira ordem, no intervalo [0, 0.6], com passo h = 0.1.
18.4
Indo para segunda ordem
Para que a redu c ao de h seja mais eciente e preciso fazer com que a ordem de grandeza do erro dependa de h elevado a uma pot encia mais alta. Para isso, e preciso ir al em da aproxima c ao de primeira ordem em x(t + h). Consideremos, por exemplo, a aproxima c ao de segunda ordem: 1 x(t + h) x + x h + x h2 , 2 onde x = f e x = ft + f fx . Ent ao, ainda no exemplo x = 3t2 x, temos f (t, x) = 3t2 x, ft (t, x) = 6tx e fx (t, x) = 2 3t . Substituindo essas express oes, com a nota c ao x(t + h) = xk+1 , x = xk , t = tk , obtemos a rela c ao de recorr encia 3 h xk+1 = xk + 3tk xk h tk h + t3 2 k .
18.4. INDO PARA SEGUNDA ORDEM
197
O erro m aximo cometido em cada itera c ao e da ordem de h3 , portanto o erro m aximo acumulado ao longo de todo o intervalo e da ordem de (b a)h2 . Isso signica que a redu c ao do passo pela metade provoca redu c ao no erro da ordem de quatro vezes. Exerc cio 18.2 Use a rela ca o de recorr encia acima com passo 0.1, a partir da mesma condi ca o inicial x(0) = 2 e compare com os resultados obtidos anteriormente. Apesar da vantagem em rela c ao ` a precis ao, ao passar para segunda ordem acabamos por nos envolver com uma fun c ao de itera c ao muito mais complicada, apesar de a express ao de f (t, x) ser muito simples. V arios fatores contribuem para isso: as express oes das derivadas parciais de f e a combina c ao da f ormula, que envolve v arios termos. Indo para ordem ainda mais alta essas complica c oes aumentam bastante e exigem, da parte do programador, o c alculo de todas as derivadas parciais envolvidas e a montagem das f ormulas. O que faremos no restante desta Se c ao e explorar uma observa c ao a respeito da expans ao de x(t + h) at e segunda ordem, que nos permitir a implementar um m etodo computacionalmente mais simples. Na Se c ao seguinte veremos como esse m etodo pode ser generalizado inclusive para ordens mais altas, sem expressivo acr escimo da complexidade algor tmica, embora a dedu c ao do algoritmo propriamente dito possa car cada vez mais complicada. Essa abordagem e conhecida como M etodo de Runge-Kutta de integra c ao das equa c oes diferenciais. Estamos interessados na diferen ca x(t + h) x(t), dada por 1 x(t + h) x(t) = hf + h2 (ft + f fx ) + o(h2 ) , 2 que escreveremos assim: 1 x(t + h) x(t) = h f + (hft + hf fx ) + o(h2 ) . 2 Ent ao reparamos que o termo hft + hf fx tem certa semelhan ca com a expans ao da fun c ao de duas vari aveis f (t, x) at e primeira ordem: f (t + t, x + x) = f (t, x) + ft (t, x)t + fx (t, x)x + o(t, t) , onde o(t, x) denota e, um termo (o resto) muito menor do que a norma de (t, x), isto 2 + x2 . Muito menor signica que esse termo, quando dividido t muito menor do que por t2 + x2 , vai a zero, se t2 + x2 vai a zero. Logo, se tomarmos t = h e x = hf ent ao teremos f (t + h, x + hf ) f (t, x) = hft (t, x) + hf (t, x)fx (t, x) + o(h) , c ao compacta que propusemos, temos pois t2 + x2 = h 1 + f 2 . Na nota hft + hf fx = f (t + h, x + hf ) f + o(h) . Portanto x(t + h) x(t) = h f + 1 (f (t + h, x + hf ) f ) + o(h2 ) 2
(a soma de dois termos o(h2 ) e um termo o(h2 )). Ou seja, x(t + h) x(t) = h (f (t, x) + f (t + h, x + hf )) . 2
198
Vejamos como isso se d a na pr atica, ao passarmos de xk para xk+1 . Pensando em termos de algoritmo, temos que calcular 1 = f (tk , xk ) e, tomando esse valor de 1 , calcular 2 = f (tk + h, xk + h1 ) . Assim xk+1 = xk + h (1 + 2 ) . 2
A vantagem desse m etodo e que n ao precisamos calcular derivadas parciais de f , e o algoritmo ca consideravelmente mais simples. Apenas calculamos 1 (que e o valor de f no ponto (tk , xk )), e depois usamos 1 para calcular outro valor de f , desta feita no ponto (tk + h, xk + h1 ). O acr escimo em xk para se chegar a xk+1 ser a a m edia desses dois valores, multiplicada pelo passo h. Na tabela abaixo fazemos esse algoritmo, com o problema x = 3t2 x, x(0) = 2, no intervalo [0, 1]. Usando o passo h = 0.1, a coluna 1 signica 1 = 3t2 k xk e a coluna 2 signica 2 = 3t2 k+1 (xk + h1 ) , pois tk + h = tk+1 . k 0 1 2 3 4 5 6 7 8 9 10 tk 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 2etk 2.0000 1.9980 1.9841 1.9467 1.8760 1.7650 1.6115 1.4193 1.1986 0.96478 0.73576
3
xk 2.0000 1.9970 1.9821 1.9438 1.8722 1.7604 1.6065 1.4144 1.1946 0.96264 0.73637
1 0 0.059910 0.23785 0.52483 0.89866 1.3203 1.7350 2.0792 2.2936 2.3392
2 .060000 0.23892 0.52875 0.90783 1.3368 1.7586 2.1065 2.3164 2.3455 2.1862
+ 2 ) 0.0030000 0.014942 0.038330 0.071633 0.11177 0.15395 0.19208 0.21978 0.23196 0.22627
h 2 (1
Observamos que a diferen ca para o valor correto foi de, no m aximo, 0.005.
18.5
Runge-Kutta
O m etodo de Runge-Kutta e uma generaliza c ao do algoritmo que desenvolvemos em segunda ordem, para que n ao seja preciso calcular derivadas parciais de f , e vale para qualquer ordem m. Pensando na passagem de xk para xk+1 a id eia e escrever x(t + h) x(t) = h(1 1 + 2 2 + . . . + m m ) ,
18.5. RUNGE-KUTTA onde 1 2 3 . . . m = f (tk , xk ) , = = . . . f (tk + a1 h, xk + b1 1 h) , f (tk + a2 h, xk + b2 2 h) , . . .
199
= f (tk + am1 h, xk + bm1 m1 h) .
Ou seja, dentro de cada etapa k e preciso fazer uma recorr encia de tamanho m, onde cada i (i 2) e calculado em fun c ao de i1 , partindo de 1 = f (tk , xk ). Na Se c ao anterior, t nhamos m = 2, 1 = 2 = 1 2 e a1 = b1 = 1. Agora consideraremos o caso m = 3, e tentaremos determinar as constantes 1 , 2 e 3 , assim como a1 , b1 , a2 e b2 . Ao nal, veremos que existe uma certa liberdade na escolha dessas constantes. A maneira de se organizar para uma tarefa dessas e a seguinte. Desenvolveremos os dois lados da equa c ao x(t + h) x(t) = 1 1 + 2 2 + 3 3 h at e ordem 2 em h (seria ordem 3, mas estamos dividindo tudo por h), e obteremos v arios termos envolvendo derivadas parciais de f . Como ocorre com polin omios, e preciso haver igualdade termo a termo. Cada uma dessas igualdades ser a uma equa c ao onde as inc ognitas s ao as constantes procuradas, e o problema car a reduzido ` a resolu c ao desse sistema (n ao linear) de equa c oes. O lado esquerdo da equa c ao e mais conhecido: 1 1 x(t + h) x(t) = x + x h + x h2 + o(h2 ) , h 2 6 onde as express oes de x , x e x j a foram deduzidas na Se c ao 18.2. Introduzindo essas express oes, camos com 1 1 1 1 1 1 1 2 f + hft + hf fx + h2 ft fx + h2 f fx + h2 ftt + h2 f ftx + h2 f 2 fxx . 2 2 6 6 6 3 6 Os termos est ao separados um a um, propositalmente, porque isso tornar a mais f acil a compara c ao com o outro lado da equa c ao. Com rela c ao ao outro lado, e preciso calcular 1 , 2 e 3 , at e ordem h2 . J a sabemos que 1 = f . E sabendo i calculamos i+1 por i+1 = f (t + ai h, x + bi i h) . Expandindo f at e segunda ordem, obtemos i+1 = f (t + ai h, x + bi i h) = 1 1 = f + (ai h)ft + (bi i h)fx + (ai h)2 ftt + (ai h)(bi i h)ftx + (bi i h)2 fxx + o(h2 ) . 2 2 Por outro lado, i j a foi calculado de maneira semelhante, e sua express ao deveria ser substitu da na express ao de i+1 .
200
NUMERICA CAP ITULO 18. SOLUC AO DE EQUAC OES DIFERENCIAIS No caso m = 3, temos 1 = f , portanto 2 = f (t + a1 h, x + b1 hf ) = 1 1 h2 ftt + a1 b1 h2 f ftx + b2 h2 f 2 fxx + o(h2 ) . = f + a1 hft + b1 hf fx + a2 2 1 2 1
J a a express ao de 3 e mais complicada, pois devemos substituir a express ao de 2 em cada lugar onde aparece. Por sorte, podemos desprezar os termos que tenha ordem mais alta do que h2 . Por exemplo, b2 h2 fx = b2 h(f + a1 hft + b1 hf fx )fx + o(h2 ) , uma vez que os termos com h2 , quando multiplicados por h, cam h3 , isto e, s ao termos o(h2 ). H a outros dois termos a expandir: a2 b2 h2 2 ftx = a2 b2 h2 f ftx + o(h2 ) e Ent ao
2 3 = f + (a2 hft ) + (b2 hf fx + a1 b2 h2 ft fx + b1 b2 h2 fx )+ 1 2 2 1 + a2 h ftt + a2 b2 h2 f ftx + b2 h2 f 2 fxx + o(h2 ) . 2 2 2
1 1 2 2 2 b h 2 fxx = b2 h2 f 2 fxx + o(h2 ) . 2 2 2 2
Finalmente, podemos reunir 1 1 + 2 2 + 3 x3 , e conseguiremos uma soma com os seguin2 tes termos: (1 + 2 + 3 )f , (2 a1 + 3 a2 )hft , (2 b1 + 3 b2 )hf fx , 3 a1 b2 h2 ft fx , 3 b1 b2 h2 f fx , 1 2 2 2 2 2 2 2 2 2 (2 a1 + 3 a2 )h ftt , (2 a1 b1 + 3 a2 b2 )h f ftx e (2 b1 + 3 b2 )h f fxx . Da compara c ao termo a termo com a expans ao de x(t + h) x(t) , h que corresponde ao lado esquerdo da equa c ao, obtemos as seguintes equa c oes: f: hft : hf fx : h2 ft fx :
2 h2 f fx :
h2 ftt : h2 f ftx : h2 f 2 fxx :
1 1 2 1 2 1 6 1 6 1 6 1 3 1 6
= 1 + 2 + 3 = 2 a1 + 3 a2 = 2 b1 + 3 b2 = 3 a1 b2 = 3 b1 b2 = 1 2 (2 a2 1 + 3 a2 ) 2 1 2 (2 b2 1 + 3 b2 ) 2
(18.1) (18.2) (18.3) (18.4) (18.5) (18.6) (18.7) (18.8)
= 2 a1 b1 + 3 a2 b2 =
18.5. RUNGE-KUTTA
201
A primeira equa c ao eau nica que envolve 1 , assim 1 car a determinado assim que 2 e 3 forem determinados. Da quarta e da quinta equa c oes tiramos imediatamente que a1 = b1 . Levando isso em conta na sexta e na s etima equa c oes resulta que tamb em a2 = b2 . Com isso, as tr es u ltimas equa c oes se tornam id enticas, a quarta e a quinta tamb em, e a segunda e a terceira idem. Em resumo, camos com tr es equa c oes nas quatro inc ognitas a1 , a2 , 2 e 3 : 1 2 1 6 1 3 = 2 a1 + 3 a2 = 3 a1 a2
2 = 2 a2 1 + 3 a2
Havendo uma inc ognita a mais do que o n umero de equa c oes, abre-se a possibilidade para a exist encia de uma innidade de solu c oes. Podemos escolher um valor para a2 , por exemplo, mas algumas escolhas podem tornar o sistema imposs vel. No entanto, saberemos como escolher se tratarmos a2 como uma constante, em vez de uma inc ognita. Da segunda equa c ao 1 colocada na primeira obtemos 2 a2 = 6a 1 2 a1 + Multiplicando por a1 resulta 1 1 = . 6a1 2
1 a1 , 2 6 que junto com a segunda pode ser substitu da na terceira equa c ao, levando a 2 a2 1 = 3a2 1 3a1 + a2 = 0 ,
depois de mais uma multiplica c ao por a1 e simplica c oes. Ent ao 3 9 12a2 a1 = . 6

3 teremos necessariamente que a1 = 1 Se tomarmos a2 = 4 2 . Com esses valores, obtemos 4 2 2 3 = 9 , 2 = 9 e 1 = 9 . A conclus ao e que o M etodo de Runge-Kutta pode ser aplicado com
x(t + h) x(t) =
h (21 + 32 + 43 ) + o(h3 ) , 9
1 3 3 1 h, x + 2 1 h) e 3 = f (t + 4 h, x + 4 2 h). onde 1 = f (t, x), 2 = f (t + 2
Exerc cio 18.3 Use o algoritmo de Runge-Kutta de ordem 3 deduzido acima na equa ca o diferencial separ avel x = 3t2 x, x(0) = 2. Aumente o n umero de algarismos signicativos. De prefer encia, crie um programa de computador para testar os algoritmos.
1 e a1 = b1 = 1 para o Exerc cio 18.4 Na Se ca o anterior, obtivemos m = 2, 1 = 2 = 2 M etodo de Runge-Kutta de ordem 2. No entanto, como vimos em ordem 3, pode haver outras maneiras de implement a-lo, pois as equa co es que determinam a escolha dos i s, ai s e bi s
202
t em mais do que uma solu ca o. Baseando-se no racioc nio feito em ordem 3, ache todas as poss veis implementa co es do M etodo de Runge-Kutta em ordem 2. Exerc cio 18.5 Considere a equa ca o x = ex t, com a condi ca o inicial x(0) = 1. Obtenha uma discretiza ca o/aproxima ca o da solu ca o em [0, 0.5], usando o M etodo de Runge-Kutta de segunda ordem. Exerc cio 18.6 Considere a mesma equa ca o e a mesma condi ca o inicial do Exerc cio anterior. Aproveite o fato de ser uma equa ca o separ avel para obter x(0.5) usando o M etodo de Newton e o M etodo de Simpson combinados. Para o M etodo de Newton, use condi ca o inicial igual a 1 e calcule 3 iterados posteriores. Para o M etodo de Simpson use n = 4. Discuta o erro envolvido ao se resolver a equa ca o dessa maneira, da melhor forma que voc e puder. Compare com o resultado da quest ao anterior. Exerc cio 18.7 O algoritmo de Runge-Kutta de ordem 4 pode ser deduzido de forma an aloga. Para isso e preciso fazer as contas com muito cuidado. Tente partir da suposi ca o de que x(t + h) x(t) = h(1 + 2 + 3 + 4 ) + o(h4 ) , onde 1 2 3 4 = f (t, x) , = f (t + bh, x + b1 h) , = f (t + ch, x + c2 h) , = f (t + dh, x + d3 h) ,
1 6,
2
e mostre que essas constantes podem assumir os seguintes valores: = 1 1 =6 ,b= 2 ,c= 1 2 e d = 1.
2 6,
2 6,
Exerc cio 18.8 Implemente o M etodo de Runge-Kutta de ordem 4 no computador.
18.6
Runge-Kutta em sistemas de equa c oes aut onomas
A resolu c ao num erica de um sistema de equa c oes aut onomas e muito semelhante ao que j a zemos antes. Desenvolveremos o M etodo de Runge-Kutta de ordem 2 para um sistema de duas equa c oes, e o leitor ver a que o M etodo pode ser aplicado a qualquer tipo de sistema de equa c oes diferenciais, aut onomas ou n ao, em qualquer ordem, tudo dependendo de se deduzir o algoritmo convenientemente. H a atualmente muitos programas de computador com os algoritmos j a implementados, bastando ao usu ario somente digitar as equa c oes. Outros algoritmos mais nos s ao tamb em usados, para minimizar ainda mais os erros, principal mente quando se trata de integrar a equa c ao diferencial em grandes intervalos de tempo. E recomend avel, no entanto, saber minimamente como eles funcionam. Suponha que queiramos integrar o sistema de equa c oes diferenciais x y = f (x, y ) = g (x, y ) .
18.6. RUNGE-KUTTA EM SISTEMAS DE EQUAC OES AUTONOMAS At e segunda ordem, temos x + o(h2 ) x(t + h) x(t) = hx + h 2 2 h y (t + h) y (t) = hy + 2 y + o(h2 ) Como x = f e y = g , ent ao x = x fx + y fy = f fx + gfy e y = x gx + y gy = f gx + ggy . Ent ao
1 (hf fx + hgfy ) + o(h2 ) x(t + h) x(t) = h f + 2 1 y (t + h) y (t) = h g + 2 (hf gx + hggy ) + o(h2 )
2
203
Mas hf fx + hgfy = f (x + f h, y + gh) f (x, y ) + o(h) e hf gx + hggy = g (x + f h, y + gh) f (x, y ) + o(h) . Portanto x(t + h) x(t) = y (t + h) y (t) =
h 2 h 2
(f (x, y ) + f (x + f h, y + gh)) + o(h2 ) (g (x, y ) + g (x + f h, y + gh)) + o(h2 )
Exerc cio 18.9 Considere o sistema de equa co es diferenciais x = x2 + y 1 y = 1+ x Se x(0) = 0.5 e y (0) = 0.2, estime t > 0 necess ario para que a solu ca o (x(t), y (t)) cruze o eixo y , usando o M etodo de Euler de primeira ordem com passo 0.1. Exerc cio 18.10 Deduzir o M etodo de Runge-Kutta de ordem 4 para sistemas aut onomos de duas equa co es. Exerc cio 18.11 Usar os M etodos de Runge-Kutta para integrar os sistemas de equa co es diferenciais da Se ca o 17.5.
204
Ap endice A
Entendendo os sistemas lineares

A.1 Sistemas lineares e interse c oes de hiperplanos
em que procuramos x e y que simultaneamente satisfa cam as equa c oes dadas. Podemos olhar para uma equa c ao de cada vez, examinando o conjunto dos pares (x, y ) que satisfazem a primeira e depois o conjunto dos (x, y ) que satisfazem a segunda. O que estamos procurando e a intersec ca o desses dois conjuntos, isto e, os pontos do plano que satisfazem as duas equa c oes ao mesmo tempo. A equa c ao 5x + 2y = 3 determina uma reta. Observe que essa reta e o gr aco 3 5 x , que tem da fun c ao y (x) = 2 2 inclina c ao 5 e cruza o eixo das or2 3 denadas em 2 . A outra equa c ao determina outra reta, gr aco da fun c ao y (x) = 1 + x, que tem inclina c ao 1 e cruza a ordenada em 1.
Pode-se melhorar bastante a compreens ao dos sistemas lineares se os interpretarmos sob o ponto de vista geom etrico. Considere o sistema 5x + 2y = 3 , x + y = 1
3 2
5x+2y=3
y=1+x
3 2 1
5x+2y=3
Na gura ao lado desenhamos as duas retas, e constatamos que elas devem se cruzar num u nico ponto. Esse ponto, por estar simultaneamente nas duas retas, satisfaz as duas equa c oes. Portanto ele e a solu c ao procurada do sistema linear.
205
206
APENDICE A. ENTENDENDO OS SISTEMAS LINEARES
Por essa interpreta c ao entende-se porque alguns sistemas podem n ao ter solu c ao. Isso acontece se as retas forem paralelas mas n ao coincidentes, como no sistema abaixo: 2x + 2y = 0 x + y = 1 .
y=1+x y=x
1
As retas s ao os gr acos das fun c oes y = 1+ x e y = x, como mostra a gura ao lado. Outra coisa que pode acontecer e a exist encia de uma innidade de solu c oes. Basta que as duas equa c oes determinem a mesma reta, como neste exemplo: 2x + 2y = 2 x + y = 1 .
Nem sempre a equa c ao de uma reta determina o gr aco de uma fun c ao y (x). Esse ser a sempre o caso quando o coeciente que multiplica y for igual a zero. Por exemplo, a equa c ao 2x = 3 representa uma reta vertical, pois eo conjunto de todos os (x, y ) tais que x = 3 2.
x= 3 ou 2x=3 2
3/2
E no caso de 3 equa c oes a 3 inc ognitas? Bem, nesse caso cada uma das equa c oes determina um plano, e as solu c oes s ao todos os pontos de intersec c ao dos tr es planos. Como no caso de 2 inc ognitas, pode haver uma solu c ao, nenhuma ou uma innidade delas. Num sistema de n equa c oes a n inc ognitas devemos imaginar que cada equa c ao determina um hiperplano de dimens ao n 1 no espa co de dimens ao n. Infelizmente n ao podemos visualizar nada disso, mas isso n ao nos impede de teorizar sobre o assunto.
A.2
Transforma c oes lineares
Outra maneira bastante importante de se entender os sistemas lineares e atrav es do conceito de transforma co es lineares, e dele nos ocuparemos at e o nal do Cap tulo. Tomemos novamente o exemplo 5x + 2y = 3 x + y = 1 Essa equa c ao pode ser escrita na nota c ao matricial 5 1 2 1 x y = 3 1 . .
A.2. TRANSFORMAC OES LINEARES
207
Para compactar ainda mais a nota c ao, chamaremos de A a matriz, u o vetor (matriz coluna) de coordenadas x e y e b o vetor (matriz coluna) de coordenadas 3 e 1, e escreveremos Au = b . Essa forma de escrever sugere que pensemos A como uma fun ca o (ou transforma ca o, ou ainda aplica ca o) que toma um vetor qualquer u e transforma num outro vetor Au. 1 Por exemplo, se u = , ent ao 2 Au = como mostra a gura abaixo. 5 1 2 1 1 2 = 1 4 ,
u=(1,2)
Au=(1,4)
Num sistema linear o que temos e o problema inverso: dado o vetor b (a coluna de termos x independentes ` a direita), qual e o vetor u = tal que Au = b? y f E acil ver que essa id eia funciona da mesma forma em dimens oes mais altas. Se o sistema linear tem n equa c oes e n inc ognitas ent ao os coecientes formam uma matriz A que pode ser usada como uma aplica c ao (ou transforma c ao, ou fun c ao) levando vetores-coluna x1 . u= . . xn em vetores Au. Apesar de n ao ser nossa preocupa c ao aqui, na verdade nem e preciso que o n umero de inc ognitas iguale o n umero de equa c oes para termos esse tipo de interpreta c ao. Pois o sistema linear a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 , . . . am1 x1 + am2 x2 + . . . + amn xn = bm que tem m equa c oes e n inc ognitas, pode ser escrito na forma matricial b1 x1 a11 . . . a1n . . . . .. . . . . . . = . . . . am1 ... amn xn bm
208
Agora a matriz dos coecientes, que tem m linhas e n colunas, leva, por multiplica c ao, vetores-coluna de tamanho n em vetores-coluna de tamanho m (ou seja, e uma aplica c ao de Rn em Rm ).
A.3
Nota c ao e interpreta c ao
Vale a pena neste ponto fazermos alguns coment arios a respeito da nota c ao, o que evitar a confus oes mais tarde. Como vimos, a matriz A dos coecientes, que e n n, pode ser vista tamb em como uma aplica c ao, mas n ao faremos distin c ao na nota c ao. Como matriz, A multiplica um vetor-coluna de tamanho n e o resultado e um outro vetor-coluna de tamanho n. Em nota c ao compacta temos Au = b. Como aplica c ao, A toma um vetor u de Rn e n transforma em outro vetor b de R . A rigor dever amos escrever A(u) = b, mas n ao o faremos. Por raz oes de praticidade (e tamb em est eticas, por que n ao?) usaremos os par enteses somente quando for preciso deixar claro que A se aplica a toda uma express ao, por exemplo, A(u + v ), ao inv es de Au + v , que poderia dar a impress ao de que aplicamos A em u e depois somamos v , quando na verdade primeiro somamos u com v e depois aplicamos A. Portanto n ao faremos distin c ao clara entre a matriz A e a aplica c ao A, pois usaremos a mesma nota c ao nos dois casos. Para abusar mais um pouquinho, escreveremos muitas vezes os vetores como n-upla, ao inv es de vetores-coluna, com as coordenadas separadas por v rgulas, como por exemplo na frase tome u = (x1 , . . . , xn ) e b = Au..., cando claro que se quisermos calcular b devemos dispor o vetor u em coluna e multiplicar por A, ` a esquerda.
A.4
Invers ao de matrizes
f E acil ver que temos a n equa c oes do tipo Au = b, onde u e b s ao colunas de U e Id na
Antes de prosseguir, observamos que a nota c ao matricial nos propicia relacionar conceitos aparentemente distantes. Por exemplo, o problema de inverter uma matriz quadrada A de tamanho n e equivalente a resolver n sistemas lineares n n. A inversa de A e denida como a matriz U tal que AU = Id, onde Id e a matriz identidade, que tem 1 ao longo da diagonal principal e 0 no restante. A propriedade fundamental da matriz identidade e que Id A = A e A Id = A, funcionando de forma an aloga ao n umero 1 na multiplica c ao usual entre n umeros reais. A diferen ca principal entre a multiplica c ao de n umeros reais e a multiplica c ao de matrizes e que a segunda n ao e comutativa: h a (muitos) exemplos onde A U n ao e igual a U A (tente vericar com matrizes 2 por 2, escolhidas ao acaso). Suponha que tenhamos A = {aij }nn e queiramos achar U = {uij }nn tal que A U = Id. Explicitamente, queremos resolver u11 u12 . . . u1n a11 a12 . . . a1n 1 0 ... 0 a21 a22 . . . a2n u21 u22 . . . u2n 1 ... 0 0 . = . . . . . . . . . . . . ... ... ... ... . . ... . ... . . . 0 0 ... 1 un1 un2 . . . unn an1 an2 . . . ann
A.5. EXPLORANDO A LINEARIDADE mesma posi c ao. Por exemplo, a11 a21 . . . an1 para essa equa c ao ser satisfeita deve valer 1 u11 a12 . . . a1n a22 . . . a2n u12 0 = . , . . .. . . ... . . . . . an2 ... ann un1 0
209
que corresponde ` a primeira coluna.
A.5
Explorando a linearidade
A propriedade mais importante da fun c ao que leva vetores u em Au e a linearidade. A linearidade signica que, para quaisquer vetores u1 e u2 tem-se A(u1 + u2 ) = Au1 + Au2 , e que, para qualquer vetor u e qualquer n umero real , A(u) = Au . Observe que isso e equivalente a dizer que para quaisquer vetores u1 e u2 e n umeros e vale A(u1 + u2 ) = Au1 + Au2 . Fica como exerc cio para o leitor demonstrar a linearidade (em dimens ao 2), supondo que A= a b c d
e uma matriz da forma mais geral poss vel! N ao e dif cil, tente!, e depois procure mostrar no caso geral, para matrizes n n. Para entendermos o signicado geom etrico da linearidade, vejamos primeiro o que e a soma de vetores e sua multiplica c ao por um n umero (comumente chamado de escalar). A multiplica c ao de um vetor (x, y ) por um escalar e o vetor (x, y ), isto e, cada coordenada e multiplicada por . Isto signica que os dois vetores s ao colineares, mas o tamanho do novo vetor e || vezes o tamanho do vetor original. Al em disso, se for um n umero negativo, o sentido do novo vetor ser a oposto ao do vetor original (ver gura abaixo). Dizer ent ao que A(u) = Au signica dizer: tomar a imagem de um vetor u multiplicado por e o mesmo que tomar a imagem de u e depois multiplicar por . Isto mostra que, se conhecermos Au ent ao saberemos quem e A(u) para qualquer !! A soma de dois vetores e vista geometricamente pela Lei dos Paralelogramos. Se u1 = (x1 , y1 ) e u2 = (x2 , y2 ) ent ao u1 + u2 = (x1 + x2 , y1 + y2 ) , como mostrado na gura abaixo.
210
u ( > 1 )
u1+ u2 y 2
u y 1
u ( < 0)
x1
x2
Dizer que A(u1 + u2 ) = Au1 + Au2 signica: obter a soma por meio da Lei do Paralelogramo e depois aplicar a transforma c ao A e o mesmo que aplicar a transforma c ao a cada um dos vetores e depois somar pela Lei do Paralelogramo. Vejamos a principal conseq u encia da linearidade. Para isso, chamemos a aten c ao para dois vetores especiais do plano: e1 = (1, 0) e e2 = (0, 1). Eles s ao chamados de vetores can onicos. Sua import ancia reside no fato de que se u = (x, y ) e um vetor qualquer ent ao u = (x, y ) = (x, 0) + (0, y ) = x(1, 0) + y (0, 1) = xe1 + ye2 . Dizemos que u e uma combina ca o linear de e1 e e2 (isto e, a soma de dois vetores, um colinear a e1 e o outro colinear a e2 ). Usando a linearidade, temos ent ao Au = A(xe1 + ye2 ) = xAe1 + yAe2 . Isto signica que se soubermos Ae1 e Ae2 ent ao saberemos automaticamente Au, para qualquer vetor u!! Em outras palavras, a a c ao da aplica c ao linear A ca completamente determinada pelo seu resultado em e1 e e2 ! Por exemplo, na gura abaixo mostramos como calcular Au, se u = (1.5, 2), se Ae1 e Ae2 forem como ilustrado.
Au Ae1 Ae2
e2 e1
1.5
A.5. EXPLORANDO A LINEARIDADE
211
Isso sugere que o sistema de coordenadas cartesiano original e transferido para um outro sistema de coordenadas, medido a partir de combina c oes lineares de Ae1 e Ae2 . Fica refor cado assim o car ater geom etrico dos sistemas lineares. Pois se dermos b no lado direito do desenho, temos um m etodo para achar u tal que Au = b (vide gura abaixo). Basta medir as coordenadas de b no sistema de coordenadas das combina c oes de Ae1 e Ae2 , e depois procurar no sistema cartesiano tradicional, ` a esquerda, o vetor que tem essas coordenadas!
e2 u e1 Ae2 b b=Au
Ae1
Vale aqui uma observa c ao bastante pertinente: os vetores Ae1 e Ae2 s ao as colunas da f matriz A. E acil ver a raz ao: a b c d 1 0 a c a b c d 0 1 b d
Ae1 =
, Ae2 =
Tudo ocorre de forma semelhante em dimens ao qualquer n. A soma de vetores tamb em e obtida pela soma das coordenadas dos vetores. Tamb em como em dimens ao 2, a aplica c ao que leva vetores u em vetores Au e linear. Os vetores can onicos s ao e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . ., en = (0, 0, . . . , 0, 1). Qualquer vetor pode ser escrito como combina c ao linear dos vetores can onicos, pois
u = (x1 , x2 , . . . , xn ) = x1 e1 + x2 e2 + . . . + xn en . Isto implica que saber Ae1 , . . . , Aen permite calcular automaticamente qualquer Au.
212
A.6
Exist encia e unicidade de solu c oes

Ae2=(4,6)
Voltando a pensar em dimens ao 2, observe que esse esquema geom etrico para achar u tal que Au = b caria prejudicado se por alguma raz ao Ae1 e Ae2 fossem vetores colineares. Isso aconteceria se os vetores-coluna da matriz A fossem colineares, como por exemplo na matriz 2 3 4 6 .
Ae1=(2,3)
Neste caso, teremos Ae1 e Ae2 como na gura ao lado. O desastre ocorre se tivermos um vetor b que n ao seja colinear a eles e quisermos achar u f tal que Au = b. E acil ver porque n ao vai existir esse vetor: todo vetor u = (x, y ) se escreve como combina c ao linear u = xe1 + ye2 , logo Au = xAe1 + yAe2 . S o que se Ae1 e Ae2 forem colineares ent ao Au tamb em ser a colinear a eles. Em resumo, para qualquer escolha de u, o vetor imagem Au estar a sempre sobre a mesma reta, na mesma dire c ao de Ae1 e Ae2 (a aplica c ao A leva todo o R2 sobre uma reta, uma aplica c ao longe de ser injetiva!). Portanto e imposs vel que exista Au = b se b n ao for colinear com esses dois vetores! o caso em que o Esse tipo de problema ocorre justamente nos sistemas indeterminados. E sistema n ao tem solu c ao. Por outro lado, se b for colinear a Ae1 e Ae2 ent ao haver a innitas solu c oes, isto e, innitas escolhas de u tais que Au = b. Para mostrar isso, escrevemos Ae2 = Ae1 (j a que eles s ao colineares, e supondo que Ae1 seja n ao-nulo), e Au = xAe1 + yAe2 = xAe1 + yAe1 = (x + y )Ae1 . Ao mesmo tempo, com a hip otese de que b seja colinear a Ae1 temos b = Ae1 . Ent ao Au = b desde que x + y = , o que determina uma reta de possibilidades de x e y . Pensando em geral, em dimens ao n, o problema de se achar u tal que Au = b ter a solu c ao garantida sempre que possamos achar n umeros x1 , . . . , xn tais que b = x1 Ae1 + . . . + xn Aen , isto e, sempre que {Ae1 , . . . , Aen } formar uma base, pois ent ao pela linearidade, b = A(x1 e1 + . . . + xn en ) = Au , se chamarmos u = (x1 , . . . , xn ). Pode-se demonstrar que {Ae1 , . . . , Aen } n ao forma uma base se e somente se um dos vetores Aei for combina c ao linear dos demais. Sempre que {Ae1 , . . . , Aen } (lembre-se, s ao as colunas da matriz A) n ao formar uma base, teremos duas situa c oes poss veis para a equa c ao
A.7. INJETIVIDADE, SOBREJETIVIDADE... GLUP!
213
Au = b, dependendo de b: se b n ao for combina c ao linear de {Ae1 , . . . , Aen } ent ao a equa c ao n ao ter a solu c ao; e se b for combina c ao linear de {Ae1 , . . . , Aen } ent ao haver a uma innidade de solu c oes da equa c ao (tente mostrar isso!). J a se {Ae1 , . . . , Aen } formar uma base ent ao b se escreve de forma u nica como b = x1 Ae1 + . . . + xn Aen , implicando que existe uma u nica solu c ao para Au = b, a saber u = (x1 , . . . , xn ).
A.7
Injetividade, sobrejetividade... glup!
Valem aqui alguns coment arios complementares sobre a discuss ao te orica que estamos levando. Acabamos de ver que a matriz de coecientes A nos deixa duas op c oes: 1) para todo b, Au = b tem solu c ao (portanto a aplica c ao A e sobrejetiva) e essa solu c ao eu nica (donde Au = Av implica u = v , isto e, a aplica c ao A e tamb em injetiva); 2) existe b tal que Au = b n ao tem solu c ao (logo A n ao e sobrejetiva) e existe b tal que Au = b tem v arias solu c oes (logo A n ao e injetiva). Ou seja, das duas uma: ou A e bijetiva ou n ao e nem sobrejetiva nem injetiva. Uma caracter stica t pica de uma aplica c ao linear A e que se A n ao for injetiva ent ao h a um vetor w n ao-nulo (de fato, uma innidade deles) tal que Aw = 0. Pois se A n ao e injetiva ent ao existem u e v , com u = v , tais que Au = Av . Logo Au Av = 0, e pela linearidade A(u v ) = 0 . Chame w = u v . Esse vetor e n ao-nulo porque u = v , e assim demonstramos nossa armativa. Para ilustrar, apliquemos essas id eias ao problema de interpola c ao polinomial da Se c ao 1.5. L a quer amos passar o gr aco de um polin omio p(x) de grau n 1 por n pontos xados (com abscissas distintas). Isto e, dados (x1 , y1 ), . . . , (xn , yn ) quer amos achar p(x) = a0 + a1 x + . . . + an1 xn1 tal que p(x1 ) = y1 , . . . , p(xn ) = yn , e isso nos levou imediatamente a um sistema linear onde as inc ognitas s ao os n coecientes do polin omio: n1 . . . x1 1 x1 x2 a0 y1 1 n1 1 x2 x2 . . . x2 2 a1 y2 = . . . . . . . . . . . . . . . . . . . . . . 2 n1 an1 yn 1 xn xn . . . xn
Queremos mostrar que essa equa c ao sempre tem solu c ao e essa solu c ao eu nica. Como vimos acima, isso acontece se e somente se a matriz A dos coecientes for uma aplica c ao injetiva. Suponha por contradi c ao que essa matriz A n ao fosse injetiva. Ent ao existiria um conjunto de coecientes w = (a0 , a1 , . . . , an1 ) n ao-nulo (isto e, pelo menos um dos coecientes diferente de zero) tal que Aw = 0. Ou seja, ter amos um polin omio q (x) de grau n 1 (no m aximo), n ao-nulo, tal que q (x1 ) = 0, . . . , q (xn ) = 0, isto e, com n ra zes distintas. Mas polin omios n ao-nulos de grau n 1 t em no m aximo n 1 ra zes (prove usando seus conhecimentos de c alculo!), portanto chegamos a uma contradi c ao, o que mostra que A obrigatoriamente tem que ser injetiva!
214
Exerc cio 1.1 Explique por que se A for injetiva ent ao existe uma e somente uma solu ca o para a equa ca o Au = b.
A.8
O determinante
O determinante da matriz A dos coecientes de um sistema linear serve como instrumento para saber se {Ae1 , . . . , Aen } e uma base, indicando se o sistema tem ou n ao u nica solu c ao. De fato, esta Se c ao tem a pretens ao de convencer o leitor de que det A = 0 se e somente se {Ae1 , . . . , Aen } e uma base. A id eia e explicar o que e o determinante de uma forma intuitiva e geom etrica, mas o leitor pode encontrar abordagens diferentes em outros livros. preciso salientar que o determinante ser E a inicialmente denido para um conjunto de n vetores (em Rn ) e depois deniremos det A = det(Ae1 , . . . , Aen ) . Come caremos a discuss ao em dimens ao 2, e depois comentaremos sua generaliza c ao para dimens ao qualquer.
A.8.1
Dimens ao 2
O determinante d a, de certa forma, uma medida do quanto dois vetores est ao perto de ser colineares. Deniremos o determinante de um par ordenado de vetores (u1 , u2 ), denotando-o por det(u1 , u2 ) , como sendo a a rea do paralelogramo determinado por esses dois vetores, com um sinal. Sendo assim, dois vetores ser ao colineares entre si se e somente se seu determinante for nulo. O determinante de uma matriz A 2 2 e denido como sendo o determinante do par (Ae1 , Ae2 ): det A det(Ae1 , Ae2 ) .
Isso porque, se 0 s, su1 e um vetor com o mesmo sentido que u1 , e se s 1, su1 e um vetor de tamanho menor ou igual ao tamanho de u1 . O mesmo ocorre com tu2 , para 0 t 1. O paralelogramo e constitu do ent ao de todas as somas de vetores desse tipo. O sinal de det(u1 , u2 ) e denido assim, se u1 e u2 n ao s ao colineares: se (u1 , u2 ) pode ser suavemente alterado at e que coincida com o par de vetores can onicos (e1 , e2 ) (na ordem
Desse modo, ca evidente que o determinante de A e diferente de zero se e somente se o sistema Au = b admitir u nica solu c ao (n ao importando quais sejam os termos independentes, isto e, o vetor b da equa c ao). Lembrando tamb em que Ae1 e Ae2 s ao as colunas da matriz A, segue que det A = 0 se e somente se suas colunas forem colineares. Para que a deni c ao que completa, precisamos estabelecer melhor o que e o paralelogramo determinado pelos dois vetores e denir de maneira inequ voca o sinal do determinante. Al em disso, precisamos saber calcular o determinante, e o leitor ver a que a deni c ao dada aqui coincide com aquela que ele provavelmente j a conhece. Chamaremos de P (u1 , u2 ) o paralelogramo determinado por u1 e u2 . Ele e denido como sendo o conjunto P (u1 , u2 ) = {su1 + tu2 ; 0 s 1 , 0 t 1} .
A.8. O DETERMINANTE
215
correspondente, isto e, u1 e alterado at e coincidir com e1 , e u2 com e2 ), de forma que os vetores nunca se tornem colineares ao longo do processo, ent ao o sinal e positivo. Caso contr ario e negativo. Veja dois exemplos com sinais diferentes na gura abaixo. O da esquerda e o positivo.
u2 u1 u1
u2
Da resulta que det(e1 , e2 ) = +1 (sinal positivo e area igual a 1) e que det(e2 , e1 ) = 1. Al em disso, mais geralmente, det(u1 , u2 ) = det(u2 , u1 ), ou seja, se trocarmos a ordem dos vetores ent ao o sinal do determinante ser a trocado. Uma propriedade importante do determinante e a linearidade com respeito a cada um dos vetores. Ou seja, precisamos mostrar que det(u, v ) = det(u, v ) e que det(u1 + u2 , v ) = det(u1 , v ) + det(u2 , v ) . Observe que se isso for verdade, ent ao enunciados semelhantes s ao v alidos para o segundo vetor do par. Por exemplo, det(u, v ) = det(v, u) = det(v, u) = det(u, v ) . Para mostrar as duas propriedades de linearidade recorremos a princ pios geom etricos. Veja nas guras abaixo o que acontece em cada caso. No segundo caso, o princ pio de Cavalieri garante que a area de P (u1 , v ) mais a area de P (u2 , v ) e igual ` a area de P (u1 + u2 , v ) (aten c ao, a gura e no plano, n ao se trata de desenho em perspectiva!).
P(u1+ u ,v) 2 v v
u
u P(u,v)
P( u,v) P(u ,v) 1 u1
u1+ u2 u2 P(u ,v) 2
216
Esse argumento convence facilmente no caso em que det(u1 , v ) e det(u2 , v ) tenham o mesmo sinal. Se esse n ao for o caso, ent ao sugere-se provar que det(u1 , v ) = det((u1 + u2 ) + (u2 ), v ) = det(u1 + u2 , v ) + det(u2 , v ) , pois e f acil ver que det(u2 , v ) = det(u2 , v ). Com essas propriedades todas garantimos o c alculo de qualquer determinante. Para ver isso, escrevemos u1 = (x1 , y1 ), u2 = (x2 , y2 ), mas lembramos a outra forma de escrever esses vetores, como combina c ao linear de e1 e e2 : u1 = x1 e1 + y1 e2 e u2 = x2 e1 + y2 e2 . Ent ao det(u1 , u2 ) = det(x1 e1 + y1 e2 , x2 e1 + y2 e2 ) = x1 det(e1 , x2 e1 + y2 e2 ) + y1 det(e2 , x2 e1 + y2 e2 ) ,
aplicando a linearidade no primeiro vetor do par. Aplicando novamente a linearidade no segundo vetor do par, temos det(u1 , u2 ) = x1 (x2 det(e1 , e1 ) + y2 det(e1 , e2 )) + y1 (x2 det(e2 , e1 ) + y2 det(e2 , e2 )) . Como det(e1 , e1 ) = det(e2 , e2 ) = 0, det(e1 , e2 ) = +1 e det(e2 , e1 ) = 1, ent ao det(u1 , u2 ) = x1 y2 x2 y1 . Numa matriz a b c d
os vetores coluna s ao u1 = (a, c) e u2 = (b, d), de forma que det A = ad bc . Bom, essa e a f ormula usual do determinante que aprendemos desde o Col egio!! Vale a pena lembrar as propriedades essenciais do determinante que permitem calcul a-lo para qualquer par de vetores: 1. det(e1 , e2 ) = 1 (normaliza c ao); 2. det(u, v ) = det(v, u) (altern ancia); 3. det(u + v, w) = det(u, w) + det(v, w) (linearidade).
A.8.2
Dimens ao 3
Em dimens ao 3, podemos denir o paralelep pedo P (u1 , u2 , u3 ), onde u1 , u2 , u3 s ao vetores de R3 como o conjunto P (u1 , u2 , u3 ) = {ru1 + su2 + tu3 ; 0 r, s, t 1} (n ao e dif cil ver o que seria um paralelep pedo em dimens ao mais alta, generalizando essa deni c ao). O determinante det(u1 , u2 , u3 ) ser a o volume desse paralelep pedo, com um sinal que devemos convencionar.
A.8. O DETERMINANTE
217
De qualquer forma, um determinante nulo corresponde a um conjunto de tr es vetores em que um deles e combina c ao linear dos outros, pois da n ao resulta um paralelep pedo com volume. O sinal do determinante e convencionado de maneira an aloga ao que zemos em dimens ao 2. Se {u1 , u2 , u3 } e uma base (ou seja, nenhum e combina c ao linear dos outros), o sinal de det(u1 , u2 , u3 ) ser a positivo se a trinca ordenada (u1 , u2 , u3 ) puder ser suavemente deformada at e (e1 , e2 , e3 ) sem que nunca deixe de formar uma base. Essa deni c ao e pouco pr atica: como calcular det A = det(Ae1 , Ae2 , Ae3 )? Mais uma vez, e conveniente demonstrar as propriedades b asicas do determinante e us a-las para os c alculos. As propriedades b asicas s ao (tente se convencer voc e mesmo por que elas valem): 1. det(e1 , e2 , e3 ) = +1; 2. det(u1 , u2 , u3 ) = det(u3 , u1 , u2 ) = det(u2 , u3 , u1 ) = det(u3 , u2 , u1 ) = det(u1 , u3 , u2 ) = det(u2 , u1 , u3 ); 3. det(u + v, u2 , u3 ) = det(u, u2 , u3 ) + det(v, u2 , u3 ) . Na segunda propriedade, note que qualquer troca entre vetores muda o sinal do determinante. A troca pode ocorrer com qualquer par de posi c oes: primeira com segunda, segunda com terceira e primeira com terceira. Isso implica em particular que sempre que houver vetores repetidos na trinca ent ao o determinante e nulo, pois, por exemplo, det(u, u, v ) = det(u, u, v ) , logo det(u, u, v ) = 0. Podemos usar essas regras para calcular o determinante da matriz 3 3 a11 a12 a13 A = a21 a22 a23 , a31 a32 a33 det A = =
que e o determinante de seus vetores-coluna, na ordem em que se apresentam. Temos, pela linearidade (propriedade 3), det ((a11 , a21 , a31 ), (a12 , a22 , a32 ), (a13 , a23 , a33 )) det(a11 e1 + a21 e2 + a31 e3 , a12 e1 + a22 e2 + a32 e3 , a13 e1 + a23 e2 + a33 e3 )
= a11 a12 a13 det(e1 , e1 , e1 ) + . . . + a31 a32 a33 det(e3 , e3 , e3 ) . Dos 27 termos s ao n ao nulos apenas os determinantes det(ei , ej , ek ) tais que i, j, k s ao todos distintos. Logo det A = a11 a22 a33 det(e1 , e2 , e3 ) + a11 a32 a23 det(e1 , e3 , e2 ) +a21 a12 a33 det(e2 , e1 , e3 ) + a21 a32 a13 det(e2 , e3 , e1 ) +a31 a12 a23 det(e3 , e1 , e2 ) + a31 a22 a13 det e3 , e2 , e1 . Todos os determinantes restantes s ao iguais a +1 ou 1. J a sabemos que det(e1 , e2 , e3 ) = +1, logo det(e1 , e3 , e2 ) = 1. Isso implica det(e3 , e1 , e2 ) = +1 e det(e3 , e2 , e1 ) = 1. Que por sua vez implica det(e2 , e3 , e1 ) = +1 e det(e2 , e1 , e3 ) = 1. Ent ao det A = a11 (a22 a33 a32 a23 ) + a21 (a32 a13 a12 a33 ) + a31 (a12 a23 a22 a13 ) . Esse e o conhecido determinante de uma matriz 3 3!!
218
A.8.3
Dimens ao n
Em dimens ao n existe o conceito de volume - comumente conhecido como hipervolume. No entanto, vimos que as propriedades de normaliza c ao, altern ancia e linearidade bastam para denir inequivocamente o valor do determinante de uma n-upla de vetores. Assim, denimos det(u1 , . . . , un ) atrav es de suas propriedades: 1. Normaliza c ao: det(e1 , . . . , en ) = 1; 2. Altern ancia: para todo par i, j entre 1 e n, vale det(u1 , . . . , ui , . . . , uj , . . . , un ) = det(u1 , . . . , uj , . . . , ui , . . . , un ) 3. Multi-linearidade: det(u + v, u2 , . . . , un ) = det(u, u2 , . . . , un )+ det(v, u2 , . . . , un ). Decorre dessas regras que o determinante de uma matriz A = {aij }nn e det A =
(i1 ,...,in )
ai1 1 ai2 2 . . . ain n det(ei1 , ei2 , . . . , ein ) .
e: nulo, se ocorre algum n umero repetido na lista (i1 , . . . , in ); +1, se J a det(ei1 , ei2 , . . . , ein ) (i1 , . . . , in ) pode ser levado em (1, 2, . . . , n) por um n umero par de trocas de posi c oes; e 1 se ((i1 , . . . , in ) pode ser levado em (1, 2, . . . , n) por um n umero mpar de trocas de posi c oes ( e necess ario observar que se (i1 , . . . , in ) pode ser levado em (1, . . . , n) por um n umero par de trocas de posi c oes ent ao n ao h a como fazer o mesmo com um n umero mpar, e vice-versa). Sem falarmos em hipervolume, vericamos tamb em das tr es propriedades que se um dos vetores for combina c ao linear dos demais ent ao o determinante e nulo. Isso porque det(2 u2 + . . . + n un , u2 , . . . , un ) = = 2 det(u2 , u2 , . . . , un ) + . . . + n det(un , u2 , . . . , un ) = 0 , pois vetores repetidos levam a determinante nulo, por causa da regra de altern ancia. A implica c ao contr aria n ao e t ao obvia, a partir das tr es propriedades: mostrar que se o determinante e nulo ent ao um dos vetores e combina c ao linear dos outros. Provaremos a arma c ao equivalente: se os vetores u1 , . . . , un formam uma base ent ao det(u1 , . . . , un ) e n ao-nulo. Primeiro relacionamos det(u1 , . . . , un ) com o determinante de uma matriz: denimos A como sendo a matriz tal que Ae1 = u1 , . . . , Aen = un , isto e, tal que suas colunas sejam os vetores u1 , . . . , un . Ent ao det A = det(u1 , . . . , un ). O que queremos mostrar e que det A = 0 e a hip otese que temos e que os vetores Ae1 , . . . , Aen formam uma base. Primeiro observamos que A tem uma inversa. Para entender por que, basta ver que para todo b Rn e poss vel encontrar u Rn tal que Au = b (j a vimos que para aplica c oes lineares a sobrejetividade implica automaticamente na bijetividade). Ora, como {Ae1 , . . . , Aen } e base ent ao existem n umeros x1 , . . . , xn tais que b = x1 Ae1 + . . . + xn Aen . Logo b = A(x1 e1 + . . . + xn en ) ,
A.9. QUADRO COMPARATIVO
219
e encontramos u = (x1 , . . . , xn ). A inversa de A e denotada por A1 , portanto u = A1 b. Na Se c ao 2.3 vamos mostrar que se A tem inversa ent ao det A = 0, o que completa a demonstra c ao. Para isso, usaremos o pr oprio m etodo de resolu c ao dos sistemas lineares, o M etodo de Escalonamento, do qual iremos falar no pr oximo Cap tulo. No entanto, podemos seguir outro argumento, baseado na seguinte f ormula: se A e B s ao matrizes quadradas de tamanho n ent ao det(AB ) = det A det B . Esta f ormula pode ser deduzida das propriedades do determinante, mas n ao o faremos aqui. Ao inv es disso, daremos uma intui c ao geom etrica de sua veracidade, logo abaixo. A aplica c ao da f ormula se faz assim: como A tem inversa A1 , escrevemos AA1 = Id. Isto porque se aplicarmos A1 a um vetor e depois aplicarmos A voltaremos ao vetor original. Ou seja, AA1 u = u para qualquer u e AA1 s o pode ser a identidade. Pela f ormula do determinante, temos det(AA1 ) = det A det A1 = det Id = 1 , portanto det A n ao pode ser nulo. J a para entender a intui c ao geom etrica da f ormula det(AB ) = det(A) det(B ), de forma n ao rigorosa, lembremos que det A representa o volume com sinal de P (Ae1 , . . . , Aen ) (o leitor pode pensar em dimens ao 3). O paralelep pedo P (Ae1 , . . . , Aen ) e a imagem pela transforma c ao A do paralelep pedo P (e1 , . . . , en ), de volume unit ario. Da linearidade decorre que todo paralelep pedo formado por m ultiplos dos vetores can onicos, quando transformado por A, tem seu volume multiplicado por det A. Da decorre (intuitivamente, mas n ao t ao facilmente do ponto de vista matem atico) que o volume de qualquer conjunto e multiplicado por det A pela transforma c ao A. A intui c ao pode ser assim expressa: o conjunto e aproximado por pequenos paralelep pedos disjuntos, cujo volume total est a pr oximo do volume total do conjunto, e quanto menores forem esses paralelep pedos melhor ser a a aproxima c ao. Ao transformarmos o conjunto pela aplica c ao A, podemos imaginar tamb em a transforma c ao desses pequenos paralelep pedos, que ter a seu volume multiplicado por det A. Portanto, se aplicarmos B e depois A, o volume dos conjuntos ser a multiplicado por det B e depois por det A. Este e o sentido da f ormula!
A.9
Quadro comparativo
Para resumir tudo o que dissemos at e agora sobre a exist encia e a unicidade de solu c oes de um sistema linear, fa camos um quadro comparativo que ilustra as u nicas duas alternativas que podem ocorrer para a matriz de coecientes A, quando se quer resolver um sistema linear Au = b. Alternativa 1. 1. Para qualquer b, sempre existe u nica solu c ao para Au = b
220
2. A e bijetiva, como transforma c ao linear 3. Au = 0 implica u = 0 4. As colunas de A s ao linearmente independentes 5. As linhas de A s ao linearmente independentes 6. det A = 0 Alternativa 2. 1. Ou b e tal que Au = b n ao tem solu c ao ou b e tal que Au = b tem innitas solu c oes, e sempre existem exemplos dos dois casos 2. A n ao e nem injetiva nem sobrejetiva 3. Existe u = 0 tal que Au = 0 4. As colunas de A s ao linearmente dependentes 5. As linhas de A s ao linearmente dependentes 6. det A = 0
Ap endice B
Revis ao de C alculo
Este Ap endice e uma revis ao breve e informal dos principais conceitos de C alculo de uma vari avel.
B.1
Derivadas
Considere uma fun c ao real f (x). A inclina c ao do gr aco de f no ponto (x, f (x)) e dada pelo limite do quociente f (x + h) f (x) h quando h tende a zero (pela direita ou pela esquerda). Esse limite e denotado por f (x) ,
f(x+h) f(x+h)f(x) f(x) x h x+h
e a fun c ao f (x), que d a a inclina c ao do gr aco para cada x, e chamada derivada da fun c ao f. Por exemplo, se f (x) = x2 , o gr aco de f e uma par abola, e a derivada, para cada x, eo limite de f (x + h) f (x) (x + h)2 x2 = = 2x + h . h h Evidentemente, quando h tende a zero, o limite e igual a 2x, e portanto f (x) = 2x se 2 f (x) = x . Algumas derivadas usuais. A fun c ao constante f (x) = c tem derivada nula em todo ponto: f (x) = 0 (pudera, o gr aco de uma fun c ao constante e uma reta horizontal). A derivada de uma fun c ao am f (x) = ax + b e uma fun c ao constante: f (x) = a, pois a inclina c ao do gr aco (que e uma reta) e sempre dada pelo coeciente a. Pode-se mostrar 221
222
DE CALCULO APENDICE B. REVISAO
tamb em que se f (x) = xn , com n inteiro (negativo ou positivo) por em diferente de zero, ent ao 1 f (x) = nxn1 . Por exemplo, se f (x) = x, ent ao f (x) = 1 x0 = 1, ou se f (x) = x1 = x 1 2 ent ao f (x) = x = x2 . Temos tamb em as derivadas de fun c oes trigonom etricas. Se f (x) = sin x ent ao f (x) = cos x, e se f (x) = cos x ent ao f (x) = sin x. Para obter essas derivadas e preciso mostrar antes que sin x lim =1, x0 x resultado que pode ser obtido de forma geom etrica. Poder amos discorrer um pouco mais sobre derivadas, falando de outras fun c oes e de regras de deriva c ao de fun c oes mais complicadas. Deixaremos por em essa discuss ao para logo adiante. S o faremos antes uma observa c ao que certamente j a nos ampliar a bastante o leque de fun c oes que sabemos derivar. Digamos que uma fun c ao h(x) se escreva como combina ca o linear de duas outras fun c oes f (x) e g (x), isto e, h(x) = af (x) + bg (x) . Ent ao a derivada de h e a combina c ao linear das derivadas: h (x) = af (x) + bg (x) .
Em particular, a derivada da fun c ao f (x) + C e igual ` a derivada da fun c ao f (x), pois a derivada da fun c ao constante e zero (veja na gura ao lado duas fun c oes que diferem apenas pela adi c ao de uma constante).
f(x)+C
C
f(x)
C
B.2
Primitivas
Podemos agora colocar o seguinte problema: dada uma fun ca o g (x), achar uma fun ca o f (x) um problema inverso ao de achar a derivada. cuja derivada f (x) seja igual a g (x). E Qualquer fun c ao f (x) cuja derivada seja igual a g (x) ser a chamada de uma primitiva de g (x). Por exemplo, queremos achar uma primitiva de g (x) = x2 . Ora, sabemos que a derivada 3 e uma primitiva de g (x) = x2 (o fator de x3 e 3x2 (pela Se c ao anterior), portanto f (x) = 1 3x 1 de 3 e necess ario para se cancelar o expoente que cai ao se derivar). Esse problema levanta duas quest oes: primeiro, ser a que sempre existe uma primitiva para a fun c ao g ? E se existe, ser a que eu nica? Vejamos primeiro que n ao h a chance de s o haver uma primitiva para cada fun c ao. Por exemplo, suponha que encontramos uma primitiva f (x) para g (x), isto e, f (x) = g (x). Agora
B.3. INTEGRAL consideramos uma outra fun c ao F (x) = f (x) + C . Pelo que vimos na Se c ao anterior, F (x) = f (x) = g (x) .
223
Em outras palavras, se encontrarmos uma primitiva f (x) ent ao todas as fun c oes do tipo f (x) + C ser ao tamb em primitivas, para qualquer valor de C . A pergunta natural que viria em seguida seria: e al em dessas, ser a que h a outras primitivas? A resposta e n ao. Suponha que f1 (x) e f2 (x) sejam duas primitivas da mesma fun c ao g (x), isto e,
f1 (x) = g (x) = f2 (x) .
Agora considere a fun c ao F (x) = f1 (x) f2 (x) que para cada valor de x d a a diferen ca entre os valores das duas fun c oes. Ent ao
F (x) = f1 (x) f2 (x) = g (x) g (x) = 0 ,
para qualquer x. Ent ao a fun c ao diferen ca tem inclina c ao zero, ou seja, e uma fun c ao constante (se o dom nio tiver s o um peda co): F (x) = C . De onde conclu mos que f1 (x) = f2 (x) + C !! Colocando em palavras, acabamos de demonstrar que se duas fun c oes s ao primitivas da mesma fun c ao ent ao elas necessariamente diferem por uma constante. Isso tem conseq u encias pr aticas importantes: se encontrarmos uma primitiva ent ao automaticamente conheceremos todas as outras! Voltaremos ao assunto ap os a Se c ao seguinte.
B.3
Integral
Considere uma fun c ao f (x) denida no intervalo [a, b], n ao-negativa, como mostra a gura ao lado. A area da regi ao acima da abscissa e abaixo do gr aco da fun c ao e chamada de integral de f no intervalo [a, b], e recebe a nota c ao
b
f (x)dx .
a
224
DE CALCULO APENDICE B. REVISAO A integral tamb em pode ser denida para fun c oes que assumem valores negativos. Nesse caso, n ao podemos interpretar a integral como area, a n ao ser que usemos a id eia de area com sinal, isto e, a area e contada positivamente quando a fun c ao e positiva e negativamente quando a fun c ao e negativa. Assim, na gura ao lado temos
b
A1
f A3
a A2
f (x)dx = A1 A2 + A3 ,
onde A1 , A2 e A3 s ao as areas das regi oes sombreadas. Tamb em devemos convencionar o signicado do s mbolo acima da integral quando a n ao e menor ou igual a b. A conven c ao e a seguinte: se a > b ent ao
b a a
f (x)dx
f (x)dx .
b
Em palavras, fazer a integra c ao do extremo direito para o esquerdo resulta no mesmo que fazer da esquerda para a direita, s o que com o sinal oposto. Com essa regra, obtemos a seguinte propriedade, para qualquer trinca de n umeros a, b, c, n ao importando sua ordem:
b c c
f (x)dx +
a b
f (x)dx =
a
f (x)dx .
Isso parece obvio no caso em que a < b < c, mas conra a validade da f ormula em outros casos!
B.4
A integral indenida
Na Se c ao anterior, falamos da integral de uma fun c ao entre dois extremos xos. Se resolvermos mudar um dos extremos, obteremos um resultado diferente para a integral, mesmo que a fun c ao n ao se altere. Isso sugere que um dos extremos do intervalo de integra c ao possa ser considerado uma vari avel, do qual depende o valor da integral da fun c ao.
B.4. A INTEGRAL INDEFINIDA
225
Por exemplo, considere a fun c ao linear g (x) = x, e xe 0 como um dos extremos de integra c ao. Quanto vale
w
g(x)=x
g (x)dx ?
0
Ora, se w 0, a integral ea area do tri angulo2 ret angulo esbo cado na gura ao lado: w 2 .
0 0
2
x w
Se w < 0, a integral e tamb em, em valor absoluto, igual a w 2 , mas qual seria o sinal? Primeiro vemos que a area deve ser contada negativamente, pois ` a esquerda do zero g (x) e negativa. Por outro lado, se w < 0 ent ao a integral est a sendo percorrida da direita para a esquerda, o que acarreta uma segunda mudan ca de sinal. Isso implica que tamb em no caso w2 w < 0 a integral vale 2 . Conclu mos que
w
xdx =
0
w2 , 2
para qualquer w. Agora podemos criar uma fun c ao que a cada w associe a integral de g de 0 a w, e chamaremos de f essa fun c ao:
w
f (w) No exemplo, g (x) = x, e portanto
g (x)dx .
0 w
f (w) =
0
xdx =
w2 . 2
Essa fun c ao f e chamada de uma integral indenida de g . Ela e apenas uma e n ao a integral indenida porque o extremo xo de integra c ao foi escolhido arbitrariamente.
g(x)=x
Por exemplo, considere outra integral inde, onde o extremo xo de integra nida f c ao seja 1 e n ao 0: (w) f (w)? Quanto vale f
w
f(w) x
0
xdx .
1
226
DE CALCULO APENDICE B. REVISAO Observe que, pela regra de integra c ao das triplas a, b, c, podemos escrever
1 w w
xdx +
0 1
xdx =
0
xdx .
1 O primeiro termo do lado esquerdo vale 2 . Al em disso, o segundo termo do lado esquerdo da equa c ao e a fun c ao f (w), e o lado direito da equa c ao e f (w). Ent ao
(w) + 1 , f (w) = f 2 e as duas fun c oes diferem por uma constante. Ali as esse fato e bastante geral, e suas raz oes saltam ` a vista imediatamente desse exemplo: as integrais indenidas de uma fun c ao, assim como suas primitivas, diferem umas das outras por uma constante. E ser a que h a alguma rela c ao entre as primitivas e as integrais indenidas? Responderemos a essa pergunta na pr oxima Se c ao. Antes de prosseguir, fa camos uma observa c ao a respeito da nota c ao. Sempre falamos de fun c oes dependentes da vari avel x, mas agora apareceram fun c oes que dependem da vari avel w! Ora, esses nomes, x e w, s ao apenas nomes, que ` a fun c ao n ao interessam. Assim, se 2 2 ao teremos f (x) = x e que essa f (w) = w 2 e queremos avaliar f (x) ent 2 . O que interessa fun c ao em particular toma um n umero qualquer em seu dom nio, eleva-o ao quadrado e divide 2 x2 o resultado por dois. Tanto faz se indicamos esse processo por f (w) = w 2 ou por f (x) = 2 ! Entendido isso, pode-se perguntar ent ao porque n ao denimos de uma vez
x
f (x) =
0
xdx ?
Por que n ao usar de uma vez a vari avel x como extremo de integra c ao? Trata-se a de um cuidado que tomamos para n ao misturar as coisas. A vari avel indicada dentro da integra c ao muda enquanto os extremos est ao xos. Para cada x, temos que percorrer o intervalo [0, x] mais justo, portanto, usar um outro nome para indicar esse para calcular a integral. E processo, evitando assim confus oes. Seria prefer vel ent ao escrever
x
f (x) =
0
tdt ,
x
ou f (x) =
0
udu ,
usando, enm, qualquer letra que n ao seja aquela utilizada nos extremos da integra c ao.
B.5
O Teorema Fundamental do C alculo
Nas se c oes anteriores vimos o que s ao primitivas e integrais indenidas de uma fun c ao g . Uma primitiva de g e qualquer fun c ao f cuja derivada e igual a g , e uma integral indenida e qualquer fun c ao da forma
x
f (x) =
a
g (t)dt .
B.5. O TEOREMA FUNDAMENTAL DO CALCULO
227
O Teorema Fundamental do C alculo diz exatamente que as integrais indenidas de g s ao tamb em primitivas de g . Argumentaremos em favor do Teorema, sem excesso de tecnicalidades. O importante e entender por que ele e verdadeiro. Considere a integral indenida de g , dada por
x
f (x) =
a
g (t)dt .
Para mostrarmos que essa fun c ao e uma primitiva de g basta mostrar que f (x) = g (x). Lembramos ent ao de como denimos a derivada f (x): e o limite da express ao f (x + h) f (x) h quando h tende a zero. Ou seja, e o limite de 1 h Lembrando que
x+h x x+h x+h a x
g (t)dt
g (t)dt
a
x+h
g (t)dt =
a a
g (t)dt +
x
g (t)dt ,
g(t)dt
o limite que pretendemos examinar se torna 1 h

x+h
g a x x+h
g (t)dt .
x
Agora olhemos bem para essa express ao, e observemos a gura. A integral e feita no intervalo [x, x + h] (de largura h, evidentemente), e a fun c ao ali tem altura de aproximadamente g (x), se h for bastante pequeno. Portanto a integral est a pr oxima do valor h g (x). Lembrando que ainda temos que dividir por h, ent ao toda a express ao ca quase igual a g (x), e levando ao limite ser a exatamente igual a g (x). Interpretando geometricamente, signica que a inclina c ao de f em x ser a tanto maior quanto maior for o valor g (x). Pois f (x + h) ser a f (x) mais a integral de g entre x e x + h, que vale aproximadamente h g (x), ou seja f (x + h) f (x) + h g (x) . Donde f (x + h) f (x) g (x) . h
2
e uma integral indenida de g (x) = x. No exemplo da Se c ao anterior, vimos que f (x) = x 2 Pelo Teorema Fundamental do C alculo, f (x) deve ser tamb em uma primitiva. De fato, f (x) = 1 2 x = x . 2
228
B.6
A praticidade do Teorema Fundamental do C alculo
Veremos agora que o Teorema Fundamental do C alculo opera um verdadeiro milagre. Ele torna o c alculo de areas e integrais uma tarefa muito mais f acil do que poder amos imaginar! Suponha que queiramos calcular a integral de uma fun c ao g no intervalo [a, b]:
b
g (t)dt .
a
Poder amos olhar essa integral da seguinte forma. Chamamos de F a integral indenida de g com extremo xo de integra c ao igual a a:
x
F (x) =
a
g (t)dt .
Isso faz com que a integral que queremos calcular seja o valor de F em b, isto e, F (b). Observe tamb em que F (a) = 0. Por outro lado, F e uma primitiva de g , de acordo com o Teorema Fundamental do C alculo. Suponha que por alguma raz ao j a conhe camos alguma primitiva f (x) de g (x). Isso pode parecer estranho, mas e algo muito comum quando sabemos derivar uma grande 4 e uma primitiva quantidade de fun c oes. Por exemplo, se g (x) = x3 , sabemos que f (x) = x 4 de g , porque sabemos a regra de deriva c ao das pot encias. Como F (x) e f (x) s ao ambas primitivas de g , ent ao elas diferem por uma constante, digamos C : f (x) F (x) = C , para todo x no intervalo [a, b]. Se escolhermos x = a ou x = b a equa c ao continua v alida: f (a) F (a) = C = f (b) F (b) , de onde tiramos que F (b) F (a) = f (b) f (a) . Mas F (b) = F (b) F (a) era exatamente a integral que quer amos calcular! Resumindo: para qualquer f (x) primitiva de g (x) temos
b a
g (t)dt = f (b) f (a) .
O c alculo da integral torna-se uma simples tarefa de subtra c ao, desde que j a conhe camos uma primitiva da fun c ao!! Por exemplo, qual ea area sob o gr aco da fun c ao g (x) = x3 para x variando no intervalo x4 e uma primitiva de g (x), ent ao [1, 2]? Ora, como f (x) = 4
2 1
t3 dt = f (2) f (1) =
24 14 15 = . 4 4 4
F acil, n ao?!
B.7. O LOGARITMO
229
Existe uma nota c ao que facilita a vida quando calculamos integrais na pr atica. Escrevemos b f (t)|a = f (b) f (a) . Assim, com essa nota c ao,
2
t3 dt =
1
t4 4
.
1
Outra nota c ao bastante utilizada se aproveita do fato de que primitivas e integrais indenidas s ao a mesma coisa. Ent ao, quando queremos dizer que f (x) e primitiva de g (x) escrevemos g (x)dx = f (x) + C , sem indicar extremos de integra c ao. A constante somada e simb olica e apenas indica que a express ao dada em f (x) n ao e a u nica primitiva de g , e as demais podem ser obtidas somando-se uma constante a ela. Essa nota c ao e conhecida como nota ca o de Leibniz. Por exemplo, sin x = cos x + C .
B.7
O logaritmo
Uma das fun c oes mais importantes denidas a partir de uma integral indenida e o logaritmo natural. A abordagem que seguiremos aqui para falar de logaritmos, exponenciais, etc, n ao e das mais usuais, por em talvez seja mais f acil at e do que aquela que estamos acostumados a ver desde os tempos do col egio. Ao nal nada do que j a sab amos anteriormente ser a derrubado. Pelo contr ario, iremos chegar a nossas certezas atrav es de uma argumenta c ao l ogica.
1 , cujo gr aco Considere a fun c ao g (x) = x est a desenhado ao lado. Essa fun c ao diverge em x = 0 e n ao est a denida nesse ponto. Restringiremo-nos de in cio ` a parte positiva do dom nio e deniremos, para x > 0, o logaritmo natural de x como sendo a integral de g de 1 at e x: x
1 g(x)= x
1 1 ln x x
ln x
1 dt . t
Observe no desenho que, para x > 1 essa fun c ao e positiva e representa a area sob o gr aco de g no intervalo [1, x]. Para x < 1, no entanto, a integral corre em sentido contr ario, logo vale o negativo da area sob o gr aco. Al em disso, evidentemente, ln 1 = 0.
230
ln x
Lembremos sempre que essa fun c ao, por ser uma primi1 1 tiva de x tem derivada exatamente igual a x : (ln x) = 1 . x
x 1
O gr aco de ln x est a esbo cado ao lado. Quando x tende a zero a fun c ao tende a e quando x tende a innito a fun c ao tamb em tende a innito. Esses fatos podem ser demonstrados levando-se em conta os coment arios abaixo.
A propriedade mais marcante que conhecemos e que o logaritmo do produto e a soma dos logaritmos, isto e, ln xy = ln x + ln y . Essa propriedade pode ser deduzida da deni c ao que demos. Pois isso e o mesmo que provar que xy x y 1 1 1 dt = dt + dt . t t 1 1 1 t Para tanto, separamos a integral do lado esquerdo em dois peda cos:
xy 1 x 1 xy x
1 dt = t
1 dt + t
1 dt . t
S o falta vericar que
xy 1 dt x t
e igual a
y 1 dt. 1 t y 1 dt 1 t
A 1 1/ y 1 B 1/x 1/xy x xy y
A integral dada por
ea area da regi ao A na gura ao lado,
A = {(t, s) ; 1 t y , 0 s 1/t} , e a outra integral, por

xy 1 dt x t
ea area da regi ao B , dada
B = {(t, s) ; x t xy , 0 s 1/t} . Mostremos a seguinte arma c ao: (t, s) e um ponto de A 1 se e somente se (xt, x s) e um ponto de B . Assim, B e obtido de A pela multiplica c ao por x na horizontal e por 1 area, as duas multiplica c oes x na vertical. Em termos de se cancelam, e a area de B tem que ser igual ` a area de A.
B.7. O LOGARITMO
231
J a a arma c ao e mostrada assim: (t, s) A se e somente se 1 t y e 0 s 1 t , que 1 1 1 ocorre se e somente se x xt xy e 0 x s xt , ou seja, (xt, x s) B . Da f ormula ln xy = ln x + ln y decorre, por exemplo, que ln xn = n ln x, se n 0 e inteiro. Para ver isso, primeiro vericamos que se n = 0 ent ao xn = x0 = 1 e ln x0 = ln 1 = 0 = 0 ln x. Se n = 1 a f ormula tamb em est a trivialmente correta. Se n 2 basta fazer a recurs ao ln xn = ln x xn1 = ln x + ln xn1 = ln x + ln x xn2 = 2 ln x + ln xn2 = . . . = ... = n ln x . Al em disso, como ln 1 = ln x
1 x 1 = ln x + ln x ent ao
ln
1 = ln x . x
Assim podemos dizer que ln xn = n ln x, e que a f ormula tamb em vale para os inteiros negativos. Tendo ent ao a deni c ao do logaritmo natural, podemos denir outros logaritmos. Se b e positivo e b = 1, chamaremos de logaritmo de x na base b ao n umero logb x ln x . ln b
Essa deni c ao pode parecer estranha. Anal, a deni c ao a que estamos acostumados diz assim: o n umero r = logb x e aquele tal que br = x . Mas essa propriedade pode ser demonstrada (em vez de denida). Pois se n e um n umero inteiro e bn = x ent ao ln bn n ln b ln x = = =n. logb x = ln b ln b ln b E quanto a pot encias com n umeros n ao inteiros? A princ pio n ao sabemos o que isso signica, mas podemos adiante deni-las inspirados no que vimos acima. Antes, por em, observemos que o logaritmo natural e um logaritmo em alguma base. Suponha que achemos um n umero e tal que ln e = 1. Ent ao ln x = ln x ln x = = loge x . 1 ln e
1 x 1 e
ln x
Esse n umero e existe e e chamado de n umero de Euler. Ele vale, at e a nona casa decimal depois da v rgula, 2.718281828 . . .
232
Outra deni c ao que prov em do logaritmo natural e a da fun ca o exponencial. A fun c ao exponencial e a inversa da fun c ao logaritmo natural e e denotada por exp(x). Geometricamente, se quisermos achar exp(x), temos que desenhar o gr aco do logaritmo natural localizar x na ordenada (e n ao na abscissa!) procurar exp(x) como o u nico ponto da abscissa tal que (exp(x), x) esteja sobre o gr aco (ver gura abaixo, ` a esquerda).
ln x
exp(x) 1 x x
1 exp(x)
Ent ao o gr aco da exponencial assume o aspecto da gura acima, ` a direita. Enquanto o dom nio do logaritmo natural e o conjunto dos n umeros positivos e sua imagem o conjunto de todos os n umeros reais, com a exponencial ocorre o inverso: ela est a denida para todos os n umeros reais, mas s o assume valores positivos. Lembremos tamb em que a deni c ao geom etrica dada acima signica que exp(ln x) = x, para todo x > 0, e que ln(exp(x)) = x, para todo x. A exponencial tem a seguinte propriedade: a exponencial da soma e o produto das exponenciais. Matematicamente, exp(x + y ) = exp(x) exp(y ) . Isso ocorre pois, por um lado x + y = ln exp(x + y ) , e por outro x + y = ln exp(x) + ln exp(y ) = ln(exp(x) exp(y )) , de onde segue a igualdade. Agora, inspirados no fato de que para n umeros inteiros n e b > 0 vale bn = exp(ln bn ) = exp(n ln b) ,
B.8. O TEOREMA DO VALOR MEDIO deniremos a opera c ao de potencia ca o br , com b > 0 e r qualquer:
233
f E acil ver que br bs = br+s , que decorre da propriedade da exponencial que acabamos de demonstrar. Da temos que, por exemplo, b 2 b 2 = b 2 + 2 = b1 = b . ou seja,
1 n 1 1 1 1
br exp(r ln b) .
b. n Isso explica por que denotamos b b. Finalmente, e interessante notar que, com essa deni c ao, b2 = ex = exp(x ln e) = exp(x) , isto e, a exponencial e a potencia c ao do n umero de Euler e!
B.8
O Teorema do Valor M edio
Cientes do fato de que o c alculo de integrais depende de nossa capacidade de achar primitivas, o que por sua vez depende de nossos conhecimentos sobre deriva c ao de fun c oes, voltemos ao estudo das derivadas! Nesta curta Se c ao, enunciaremos o Teorema do Valor M edio. Depois, nas demais se c oes, obteremos regras de deriva c ao e delas conseguiremos tamb em m etodos de primitiviza c ao. Imagine uma fun c ao denida num intervalo [a, b], cujo gr aco e mostrado na gura ao lado. Agora trace uma reta L ligando os pontos (a, f (a)) e (b, f (b)) (indicada na gura por uma linha tracejada). A inclina c ao dessa reta e dada por f (b) f (a) . ba
f(b)
f(a) c b
O Teorema do Valor M edio diz que existe (pelo menos) um ponto c no intervalo [a, b] tal que a reta tangente a (c, f (c)) e paralela a ` reta L. Como a inclina c ao dessa reta tangente e dada por f (c), ent ao o Teorema do Valor M edio diz que existe c [a, b] tal que f (c) = ou tal que f (b) f (a) , ba
O Teorema do Valor M edio tamb em tem sua vers ao em termos de integrais. Seja g uma fun c ao cont nua no intervalo [a, b], e seja f sua primitiva. Ent ao existe c em [a, b] tal que
b a
f (c)(b a) = f (b) f (a) .
g (t)dt = f (b) f (a) = f (c)(b a) = g (c)(b a) .
Ou seja, a integral pode ser trocada pela integral da fun c ao constante g (c), que vale g (c)(ba).
234
B.9
A Regra da Cadeia
Freq uentemente nos deparamos com fun c oes compostas, e queremos achar suas derivadas. Por exemplo, f (x) = sin(x2 ) e uma fun c ao composta, resultante de se aplicar a fun c ao seno ap os se elevar o n umero ao quadrado. Usaremos o desenho abaixo para representar essa composi c ao:
u(x)= x 2
v(x)=sen x
x2
sen(x2)
f(x)=sen(x2)
De acordo com a gura, f (x) = v (u(x)) . A Regra da Cadeia nos d a uma forma de calcular a derivada de f desde que saibamos derivar as fun c oes que a comp oem. A motiva c ao que daremos de sua veracidade ser a baseada na hip otese de que as derivadas de u e v s ao fun c oes que variam continuamente. Para calcularmos a derivada de f lembremos que devemos examinar o quociente f (x + h) f (x) h e calcular seu limite quando h tende a zero.
u
c(h) x x+h d(h) u(x) u(x+h)
v
f(x) f(x+h)
f
Agora notemos que f (x) = v (u(x)) e f (x + h) = v (u(x + h)). Pelo Teorema do Valor M edio, existe um ponto d = d(h) (sim, ele depende de h, mas ` as vezes escreveremos apenas d) entre u(x) e u(x + h) (acompanhe na gura) tal que f (x + h) f (x) = v (u(x + h)) v (u(x)) = v (d) (u(x + h) u(x)) .
B.9. A REGRA DA CADEIA
235
Al em disso, novamente por causa do Teorema do Valor M edio, existe c = c(h) entre x e x + h tal que u(x + h) u(x) = u (c) (x + h x) = u (c) h . Juntando as duas equa c oes, obtemos f (x + h) f (x) = v (d) u (c) . h Acontece que quando h tende a zero o ponto c(h) tende a x (pois est a entre x e x + h), e o ponto d(h) tende a u(x). Como assumimos que as derivadas s ao cont nuas, ent ao u (c) tende a u (x) e v (d) tende a v (u(x)). Assim temos a Regra da Cadeia: se f (x) = v (u(x)) ent ao f (x) = v (u(x)) u (x) . muito comum a Regra da Cadeia ser aplicada quando a primeira fun E c ao e linear. Por exemplo, se f (x) = cos(2x) (u(x) = 2x, v (x) = cos(x)), ent ao f (x) = v (u(x)) u (x) = sin(2x) 2 = 2 sin(2x) . Outra aplica c ao ocorre com fun c oes inversas. Se u(x) e v (x) s ao inversas uma da outra, ent ao u(v (x)) = x para todo x no dom nio de v e v (u(x)) = x para todo x no dom nio de u. Isso ocorre por exemplo com as fun c oes ln x e ex . Derivando dos dois lados de qualquer uma das equa c oes, usando a Regra da Cadeia, temos u (v (x)) v (x) = 1 , v (u(x)) u (x) = 1 .
1 (pela Vejamos como isso ca se u(x) = ex e v (x) = ln x. J a sabemos que v (x) = x pr opria deni c ao do logaritmo!). Usaremos a segunda express ao para calcular a derivada de u(x) = ex . Temos 1 1 = 1 = u(x) . u (x) = v (u(x)) u(x)
Conclus ao: a derivada de ex e ex !! Agora tamb em podemos derivar f (x) = bx . Como bx = ex ln b , ent ao f (x) = (ln b) ex ln b , pela Regra da Cadeia, isto e, f (x) = (ln b)bx .
236
B.10
Regras do produto e do quociente

1 1 {f (x + h) f (x)} = {u(x + h)v (x + h) u(x)v (x)} . h h
Quando f (x) = u(x)v (x), quanto vale f (x)? Precisamos calcular o limite
De maneira esperta, subtra mos e somamos u(x + h)v (x), sem alterar o valor da express ao: 1 {u(x + h)v (x + h) u(x + h)v (x) + u(x + h)v (x) u(x)v (x)} , h e depois a arrumamos de forma conveniente: u(x + h) v (x + h) v (x) u(x + h) u(x) + v (x) . h h
Quando h tende a zero, essa express ao tende a u(x)v (x) + u (x)v (x) . Conclus ao: (u(x)v (x)) = u (x)v (x) + u(x)v (x) , que e a conhecida Regra do Produto. Por exemplo, (x2 e2x ) = 2xe2x + x2 2e2x = 2x(1 + x)e2x . A Regra do Produto tamb em pode ser usada para calcular a derivada de um quociente f (x) = u(x) , v (x)
s desde que v (x) = 0. E o pensar que f (x) tamb em e um produto: f (x) = u(x) v (x)
u(x)
1 v (x)
= u (x)v (x) + u(x)
1 v (x)
S o que precisamos saber calcular a derivada de v(1 camos m ao da Regra da x) ! Para isso lan 1 1 1 1 e a fun c ao x aplicada ap os a fun c ao v (x). Como a derivada de x e ao Cadeia: v(x) x2 , ent 1 v (x) Logo u(x) v (x)

= v (x)
1 . v (x)2
u (x) v (x) . + u(x) v (x) v (x)2
Colocando sob o mesmo denominador, u(x) v (x)
u (x)v (x) u(x)v (x) . v (x)2
INTEGRAC POR PARTES B.11. TRUQUES DE PRIMITIVIZAC AO: AO
237
Essa express ao tamb em e conhecida como Regra do Quociente. Sugere-se ao leitor testar seus conhecimentos de t ecnicas de deriva c ao com as fun c oes trigonom etricas, j a sabendo as derivadas de seno e cosseno. Por exemplo, a fun c ao tangente, que e seno sobre cosseno, pode ser derivada com a Regra do Quociente. Obter as derivadas das fun c oes secante, cossecante e cotangente. Obter as derivadas das inversas das fun c oes trigonom etricas, arcsin, arctan, etc. Em todos os casos procurar desenhar o gr aco dessas fun c oes e interpretar as express oes obtidas!!
B.11
Truques de primitiviza c ao: integra c ao por partes

u(x)v (x) = (u(x)v (x)) u (x)v (x) .
Se rearranjarmos a express ao da Regra do Produto, teremos
Havendo a igualdade, os dois lados da equa c ao ter ao as mesmas primitivas (que diferem no m aximo por uma constante): u(x)v (x)dx = Como
(u(x)v (x)) dx
u (x)v (x)dx + C .
(u(x)v (x)) dx = u(x)v (x) + C ent ao u(x)v (x)dx = u(x)v (x) u (x)v (x)dx + C .
Essa e a conhecida f ormula de Integra c ao por Partes! Por exemplo, queremos achar uma primitiva de xex . Se chamarmos u(x) = x e v (x) = ex ent ao u (x) = 1 e v (x) = ex (na verdade ex + C , mas isso n ao far a diferen ca, conra!!). Ent ao xex dx = xex 1ex dx + C = xex ex + C = ex (x 1) + C .
Para conferir, basta derivar a primitiva obtida: (ex (x 1)) = ex (x 1) + ex = xex . H a que se tomar cuidado para n ao se escolher u de forma errada. Se cham assemos 2 x , e ent a o u(x) = ex e v (x) = x ter amos u (x) = ex e v (x) = 1 2 ex xdx = 1 2 x x e 2 1 2 x x e dx , 2
o que n ao melhora nossa situa c ao, pois agora precisamos achar a primitiva de x2 ex !
B.12
Truques de primitiviza c ao: substitui c ao
Se da Regra do Produto decorre a Integra c ao por Partes, da Regra da Cadeia segue a t ecnica de Substitui c ao. A Regra da Cadeia diz que f (g (x)) = f (g (x))f (x) .
238 Em termos de primitivas, temos f (g (x))f (x)dx =
f (g (x)) dx + C = f (g (x)) + C .
Por exemplo, podemos nos deparar com h(g (x))g (x)dx . Se acharmos f tal que f (x) = h(x) (isto e, uma primitiva de h) ent ao h(g (x))g (x)dx = f (g (x))g (x)dx = f (g (x)) + C .
Embora ao leitor n ao pare ca acrescentar nada nesse caso, esse processo pode ser automatizado da seguinte forma: 1. Denir nova vari avel u = g (x), com du = g (x)dx. 2. Substituir na integral a nova vari avel: h(u)du.
3. Resolver o novo problema, que e o mesmo que achar uma primitiva de h: h(u)du = f (u) + C . 4. Retornar o valor de u = g (x), obtendo f (g (x)) + C . Por exemplo, queremos calcular Ficamos com x 1 + x2 dx. Fazemos u = x2 , donde du = 2xdx. 1 1 + udu . 2
S o precisamos saber uma primitiva de (1 + u)1/2 . Mas esta e f acil: tentemos 2 (1 + u)3/2 . 3 Substituindo u = x2 na resposta, obtemos x 1 + x2 dx = 1 (1 + x2 )3/2 + C . 3
Em algumas situa c oes n ao e evidente a substitui c ao a ser feita. Seja H (x)dx a primitiva a calcular. Chame u = g (x), escolha que e apenas uma tentativa e depende do feeling em rela c ao ao problema. Se for poss vel inverter a fun c ao g ent ao teremos x = g 1 (u). Agora du = g (x)dx, isto e, du = g (g 1 (u))dx ,
SUBSTITUIC B.12. TRUQUES DE PRIMITIVIZAC AO: AO logo dx =
239
du g (g 1 (u))
= (g 1 ) (u)du .
Ent ao a substitui c ao pela nova vari avel leva a H (g 1 (u)) (g 1 ) (u)du . Eventualmente e mais f acil calcular a primitiva de H (g 1 (u)) (g 1 ) (u) do que a primitiva de H (x). Se F (u) for a tal primitiva, ent ao basta substituir u = g (x) para obter a primitiva desejada de H : H (x)dx = F (g (x)) + C . c ao Vejamos um exemplo. Queremos determinar x2 x + 1dx. Podemos fazer a substitui ao invertemos e obtemos x = u2 1, com dx = 2udu. Em seguida fazemos u = x + 1. Ent a substitui c ao na integral, obtendo 2(u2 1)2 u2 du . Essa primitiva e f acil de achar, pois trata-se de um polin omio: basta integrar termo a termo, para obter 2 2 4 u3 ( u2 + u4 ) + C . 3 5 7 Substituindo novamente u por (x + 1)1/2 , chegamos ` a primitiva procurada: 2 (x + 1)3/2 7 8 4 x + x2 15 5 +C .
240
Ap endice C
F ormula de Taylor
C.1 Introdu c ao
Na Parte II deste livro e abordada a quest ao da aproxima c ao de uma fun c ao por polin omios: dado um n umero inteiro n maior ou igual a zero, qual e o melhor polin omio, entre aqueles de grau menor ou igual a n, a aproximar uma certa fun c ao cont nua f denida no intervalo [a, b]? Ali a quest ao s o pode ser respondida se antes se denir um crit erio (relativo) de proximidade. Isto e, uma maneira de dizer o quanto um polin omio est a distante de f , que permita decidir, entre dois dados polin omios, qual e aquele que est a mais perto de f . O crit erio adotado e o do qui-quadrado: se p e o polin omio ent ao mede-se
b
Q(p) =
a
(f (x) p(x))2 dx ,
que e sempre um n umero maior ou igual a zero. Esse crit erio leva em conta a proximidade de f e p em todo o intervalo [a, b]. De nada adianta que p seja exatamente igual a f em certa parte do intervalo se em outra a diferen ca se torna enorme, fazendo aumentar o valor da integral. Neste Ap endice estamos interessados em outro ponto de vista para se denir a melhor aproxima c ao polinomial de f . Agora n ao estamos preocupados em aproximar f num dado intervalo xo, mas sim na vizinhan ca de um ponto. Fixado um ponto w, n ao nos interessar a o que acontece com a fun c ao longe do ponto w. Tentemos precisar melhor os conceitos. Seja f uma fun c ao, para come car cont nua, e w um ponto onde ela esteja denida. Sejam p e q dois polin omios. Diremos que p aproxima f em w melhor do que q se p(x) f (x) <1 q (x) f (x) quando x est a sucientemente perto de w. Ou seja, se tomarmos x sucientemente pr oximo de w ent ao a diferen ca |p(x) f (x)| ca menor do que a diferen ca |q (x) f (x)|. Obviamente a fra c ao s o e tomada quando o denominador for n ao nulo. 241
242
APENDICE C. FORMULA DE TAYLOR Em geral, teremos que essa fra c ao vai a zero, o que pode ser expresso da seguinte maneira:
xw
lim
p(x) f (x) =0. q (x) f (x)
Podemos ver alguns exemplos simples, para aos poucos chegarmos a enunciados mais gerais.
C.1.1
Polin omios de grau zero
Por exemplo, suponha que f seja uma fun c ao (cont nua) que assume o valor A em w. E suponha que p e q sejam polin omios de grau zero, isto e, s ao polin omios constantes: p(x) = a0 e p(x) = b0 , para todo x, com a0 = b0 . Para sabermos qual dos polin omios aproxima melhor a fun c ao f em w, temos que olhar para o quociente p(x) f (x) a0 f (x) = q (x) f (x) b0 f (x) Como f (x) tende a A ` a medida que x tende a w, podemos ver quais s ao as possibilidades. Primeiro, se tanto a0 quanto b0 forem diferentes de A, ent ao o quociente tende a a0 A , b0 A que ser a menor do que 1 se a0 estiver mais pr oximo de A do que b0 . Neste caso, como esse e o valor limite, quando x estiver bem pr oximo de w o quociente ser a tamb em menor do que 1, e ent ao p aproximar a melhor do que q em w. Se for o contr ario, isto e, b0 mais perto de A do que a0 ent ao ser a q que aproximar a melhor. Se a0 = A ent ao teremos que a diferen ca a0 f (x) tende a zero quando x tende a w, enquanto b0 f (x) tende a b0 a0 . Neste caso a fra c ao ir a a zero. Conclui-se portanto que o melhor polin omio de grau zero que aproxima f em w e p(x) = f (w) = A.
C.1.2
Aproxima c ao da fun c ao nula
Vale a pena entender tamb em o que se passa com a fun c ao f (x) 0, a fun ca o nula, tomando, para facilitar, o ponto w = 0. Pela Subse c ao anterior, o melhor polin omio de grau zero que aproxima f em w e p(x) 0. Tamb em p(x) 0 = 0 + 0 x e o melhor polin omio de grau 1 a aproximar f , de fato, para qualquer n e o melhor polin omio de grau n. Fica para o leitor se divertir em demonstrar (ou vericar) isso.
C.1.3
Aproxima c ao de grau 1
Vejamos como melhor aproximar uma fun c ao f em w por um polin omio de grau 1, supondo que ela seja deriv avel. Em primeiro lugar, e f acil ver que o polin omio p(x) deve ter, como termo de grau zero, o valor de f em w, pela mesma raz ao com que o melhor polin omio de grau zero tinha que ser igual a f (w). Ent ao p(x) = f (w) + (x w)
C.2. POLINOMIO E FORMULA DE TAYLOR
243
(lembrando que polin omios de grau 1 t em retas como gr aco, e esta e uma maneira de se escrever a reta que passa por (w, f (w)) e tem inclina c ao ), ou seja, precisamos apenas procurar o valor de . Como f e deriv avel, ent ao existe o limite f (w) = lim Isto e o mesmo que dizer que a diferen ca f (w) f (x) f (w) xw f (x) f (w) . xw
xw
tende a zero quando x tende a w. Armamos que p(x) = f (w) + f (w)(x w) e o melhor polin omio de grau 1 que aproxima f em w, em detrimento de outros polin omios q (x) = f (w) + (x w), com = f (w). Basta olharmos para a fra c ao f (x) p(x) f (x) f (w) f (w)(x w) = . f (x) q (x) f (x) f (w) (x w) Colocando x w em evid encia no numerador e no denominador, camos com
f (x)f (w) f (w) xw f (x)f (w) xw
Quando x tende a w, o numerador tende a zero, pelas considera c oes acima, enquanto que o denominador tende a f (w) , que e diferente de zero. Portanto a fra c ao toda vai a zero, mostrando o que hav amos armado. Conclui-se ent ao que a melhor aproxima c ao de grau 1 de f em w corresponde ` a ( unica) reta que passa por w e tem inclina c ao f (w).
C.2
Polin omio e F ormula de Taylor
Au ltima arma c ao da Se c ao anterior e mais ou menos intuitiva. Ela diz que a melhor reta que aproxima um gr aco em dado ponto e a reta tangente ao gr aco nesse ponto. Outra maneira de se ler essa conclus ao e a seguinte. O polin omio p(x) de grau 1 que melhor aproxima f em w e aquele tal que p(w) = f (w) e p (w) = f (w). Esta segunda maneira de pensar se presta facilmente a generaliza c oes. De fato, pode-se mostrar (e o faremos logo abaixo) que o polin omio de grau n que melhor aproxima f em w e aquele ( unico) tal que p(w) = f (w) , p (w) = f (w) , p (w) = f (w) , . . . , p(n) (w) = f (n) (w) , ou seja, cujas derivadas at e ordem n coincidem com as derivadas de f em w. claro que ao fazermos tal arma E c ao estamos automaticamente supondo que f pode ser diferenciada n vezes em w! Para facilitar as coisas iremos supor que a fun c ao f e tantas vezes
244
APENDICE C. FORMULA DE TAYLOR
diferenci avel quanto queiramos, e al em do mais todas as suas derivadas de qualquer ordem s ao fun c oes cont nuas. Esse e, de fato, o caso da maioria das fun c oes com que iremos nos deparar em aplica c oes (obviamente h a exce c oes, e nesses casos h a que se tomar os devidos cuidados). O leitor pode facilmente vericar, usando as regras de deriva c ao, que o polin omio pn (x) = f (w) + f (w)(x w) + f (n) (w) f (w) (x w)2 + . . . + (x w)n 2 n!
satisfaz as exig encias acima. Este e o chamado polin omio de Taylor de ordem n de f em w. Antes de examinarmos a veracidade da generaliza c ao feita acima, podemos tamb em nos perguntar em que grau e boa a aproxima c ao por polin omios, em w, da fun c ao f . Mais especicamente, podemos investigar a diferen ca f (x) pn (x) quando x se aproxima de w. De fato, responderemos todas as indaga c oes de uma s o vez. Comecemos examinando a diferen ca entre f (x) e a aproxima c ao de primeira ordem p1 (x) = f (w) + f (w)(x w). Chamemos de R1 (x) (R de resto) essa diferen ca. Ent ao R1 (x) = f (x) f (w) f (w)(x w) . A id eia e reescrever essa express ao de forma que possamos avaliar o tamanho de R1 (x). Pelo Teorema Fundamental do C alculo, temos
x
R1 (x) =
w
f (t)dt f (w)(x w)
x
e, nesta nova express ao, podemos reconhecer a integra c ao por partes R1 (x) =
w
(x t)f (t)dt .
Podemos agora estimar R1 (x), usando o Teorema do Valor M edio, em sua vers ao integral. Ou seja, existe entre w e x, que depende de x, tal que R1 (x) = (x w)(x )f ( ) . Portanto temos |R1 (x)| = |x | |f ( )| . |x w|
Conclui-se ent ao que o resto n ao s o tende a zero quando x tende a w como tende a zero mais rapidamente do que a diferen ca x w. A segunda etapa e ver o que acontece com ordens mais altas. Vejamos o que acontece ao passarmos para ordem 2. Como p2 (x) = p1 (x) + f (w) (x w)2 , 2
Quando x tende a w a diferen ca |x | tende a zero, uma vez que est a entre w e x. Al em disso, como estamos supondo que todas as derivadas de f sejam cont nuas, f ( ) tende a f (w). Logo |R1 (x)| lim =0. xw |x w |
C.2. POLINOMIO E FORMULA DE TAYLOR temos R2 (x) = f (x) p2 (x) = f (x) p1 (x) Mas f (x) p1 (x) = R1 (x), de forma que
x
245
f (w) (x w)2 . 2
R2 (x) =
w
(x t)f (t)dt
f (w) (x w)2 , 2
express ao esta que sai da integra c ao por partes de R2 (x) = 1 2

x w
(x t)2 f (t)dt .
Usando novamente o Teorema do Valor M edio para a integral, conseguimos mostrar que
xw
lim
|R2 (x)| =0. |x w|2
Prosseguindo indutivamente (ca para o leitor se certicar disto), conclui-se que f (x) = pn (x) + Rn (x) , conhecida como f ormula de Taylor de ordem n para f em w, onde Rn (x) = 1 n!
x w
(x t)n f (n+1) (t)dt .
A fun c ao Rn tem a propriedade de que

xw
lim
|Rn (x)| =0. |x w|n
Se delimitarmos um intervalo onde a (n + 1)- esima derivada de f seja cont nua, seu m odulo ter a um m aximo nesse intervalo, que denotaremos por max |f (n+1) |. Como o m odulo da integral e menor ou igual ` a integral do m odulo (em um intervalo orientado positivamente), temos x 1 |Rn (x)| |x t|n |f (n+1) (t)|dt n! w e x max |f (n+1) | |x t|n dt . |Rn (x)| n! w Fazendo um gr aco de |x t|n entre w e x, e prevendo as possibilidades de que x < w e w < x, o leitor pode vericar facilmente que
x w
|x t|n dt =
|xw| 0
un du =
|x w|n+1 . n+1
Ent ao |Rn (x)|
max |f (n+1) | |x w|n+1 . (n + 1)!
246
APENDICE C. FORMULA DE TAYLOR
Podemos agora entender a raz ao pela qual o polin omio de Taylor pn e a melhor aproxima c ao de grau n de f em w. Primeiro notamos que lim Rn (x) =0 (x w)m
xw
para qualquer m menor ou igual a n (tiramos os m odulos para facilitar as coisas, uma vez que o limite de uma express ao e zero se e somente se o limite do m odulo da mesma express ao e zero). Basta multiplicar o numerador e o denominador por (x w)nm , cando com Rn (x) (x w)nm , (x w)n que vai a zero porque e um produto de dois termos que v ao a zero. Suponhamos agora outro polin omio q de grau (no m aximo) n. Como q e pn n ao s ao iguais, a diferen ca entre eles e um polin omio de grau no m aximo n, que podemos escrever como am (x w)m + am+1 (x w)m+1 + . . . + an (x w)n . O n umero m e o grau correspondente ao primeiro coeciente n ao-nulo do polin omio (quando escrito nessa forma), e pode ser qualquer inteiro entre 0 e n. Ent ao pn (x) q (x) = (x w)m (am + Q(x)) , onde Q(x) = am+1 (x w) + am+2 (x w)2 + . . . + an (x w)nm , polin omio que vai a zero quando x tende a w. Finalmente comparamos a proximidade de pn e q com f , para mostrar que pn est a mais pr oximo de f em w do que q . Temos Rn (x) f (x) pn (x) = , f (x) q (x) Rn (x) + pn (x) q (x) lembrando da pr opria deni c ao de Rn . A partir das considera c oes acima, essa fra c ao pode ser escrita como Rn (x) , Rn (x) (x w)m (am + Q(x) + (x w ) m ) de onde nota-se que ela deve ir a zero quando x tende a w.
Ap endice D
Respostas de exerc cios selecionados

1.1 O polin omio interpolador e p(x) calculados pelo sistema linear 1 1 1 0 1 3 1 4 cuja solu c ao e a0 = 1, a1 = 1.2 p(x) = x3 2x2 + 3x + 1 2.3 x1 = 0.258 e x2 = 3.29 2.4 No loop ` a esquerda temos 19 + 6I1 + I3 + 6 + 4I1 = 0 e no loop ` a direita temos 4I2 + 2 I 6 = 0. Com a equa c a o I = I + I , obtemos o sistema linear AI = b onde 3 1 2 3 13 10 0 1 4 1 e b = 4 Depois do escalonamento com 2 algarismos A = 0 0 1 1 1 10 0 1.0 = 0 4.0 1.0 com vetor de permuta c oes signicativos, obtemos A 0 . 10 0 . 25 1 . 4 1 13 p= 2 e b = 4.0 . A resposta nal e I1 = 1.3A, I2 = 1.1A e I3 = 0.21A. 3 0.30 4.3 = 0.16 2.5 A 0.21 4.2 4.1 0.80 1 1.1 3.4 0.080 , p = 3 , b = 2.8 0.53 2 5.0 247 3.7 , x = 0.51 9.4
1 12 ,
= a0 + a1 x + a2 x2 + a3 x3 onde os coecientes s ao a0 1 1 a1 0 0 9 27 a2 a3 16 64 0 1 = 1 0
3 1 a2 = 4 e a3 = 6 .
248 2.12 r(0) =
APENDICE D. RESPOSTAS DE EXERC ICIOS SELECIONADOS
1.5 2.2 r (0) = 0.94
1.5 0.23 0.59
c(0)
3.4 1.0 = 0.65 x(1) = 6.9 5.2 0.37
3.6 (a) A matriz n ao satisfaz o Crit erio das Linhas para qualquer permuta c ao de linhas. 3 169 23 5 , 2 = 23 (b) Com a permuta c ao p = 1 , temos 1 = 6 24 , 3 = 192 e M = 24 < 1. 2 0.50000 0.87500 . (c) x(1) = 0.35938 (d) O erro inicial e estimado por 5 e n 147.

Calculo Numerico

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Calculo Numerico

Enviado por

Direitos autorais:

Formatos disponíveis

C alculo Num erico Fundamentos e Aplica c oes

Ajuste de Fun c oes

Equa c oes e Zeros de Fun c oes

11 Estimativa do erro nas interpola c oes

Integra c ao de Fun c oes

SUMARIO 167 168 169 169 170 171 172

Equa c oes Diferenciais

Exemplos de aplica c oes de sistemas lineares

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

(c3A ,c3B ) (c2A ,c2B )

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

POLINOMIAL 1.5. INTERPOLAC AO

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

Outros problemas de determina c ao de polin omios

isso nos d a uma equa c ao linear, pois

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

1.8. PROBLEMAS DE CONTORNO

CAP ITULO 1. EXEMPLOS DE APLICAC OES DE SISTEMAS LINEARES

Exerc cio 1.6 Fa ca o mesmo exerc cio com a fun ca o T (x, y ) = xy .

CAP ITULO 2. O METODO DE ESCALONAMENTO

CAP ITULO 2. O METODO DE ESCALONAMENTO

... ... ... . . . ...

a1n a2n a3n . . . ann

2.2. ALGARISMOS SIGNIFICATIVOS A mantissa de x de ordem 10 e o n umero 0.2236067977

CAP ITULO 2. O METODO DE ESCALONAMENTO

2.2. ALGARISMOS SIGNIFICATIVOS

CAP ITULO 2. O METODO DE ESCALONAMENTO

3.4 b = 2.1 3.3

O determinante no M etodo de Escalonamento

CAP ITULO 2. O METODO DE ESCALONAMENTO

A desvantagem da Regra de Cramer

2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO

Sistemas mal-condicionados e renamento de solu c ao

CAP ITULO 2. O METODO DE ESCALONAMENTO

2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO

CAP ITULO 2. O METODO DE ESCALONAMENTO Na Se c ao 2.2, usamos 3 algarismos signicativos para 1 1 2 . 2 1 0 2 1 1

Vejamos um exemplo ilustrativo. resolver 3 1 2

2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUC AO

(a) Ache sua solu ca o exata.

CAP ITULO 2. O METODO DE ESCALONAMENTO

Execute uma etapa de renamento.

2.5 b = 4.4 3.5

38 equa c oes e obter x1 , . . . , xn , etc. Ent ao

CAP ITULO 3. METODOS ITERATIVOS

Crit erio das Linhas

O Crit erio das Linhas pede que

|aij | < |aii |

remete a provar que, para todo i = 1, . . . , n, vale |xi

e, como os x1 , . . . , xn formam uma solu c ao, x1 = Ent ao x1 x1 =

CAP ITULO 3. METODOS ITERATIVOS

|a12 | + |a13 | + . . . + |a1n | (k 1) . |a11 | |a12 | + |a13 | + . . . + |a1n | , |a11 |

ent ao |xi logo (k ) (k 1) , como quer amos demonstrar!

Crit erio de parada

3.4. O METODO DE GAUSS-SEIDEL De fato, de (k ) (k 1) segue que

= max |xi max

max |xi Assim

(1 ) max |xi e nalmente

que com nossa nota c ao compacta se torna (k )

(k1) (k ) max |x xi | 1 i=1,...,n i

max (x(k1) , x(k) ) 1

CAP ITULO 3. METODOS ITERATIVOS

ou, de forma sucinta,

1 a11 1 = a22 1 = a33 . . . 1 = ann =