Você está na página 1de 81

Isabel Alexandra Costa Pinho do Esprito Santo

Modelao e Estimao de Parmetros

UNIVERSIDADE DO MINHO Novembro de 2001

Modelao e Estimao de Parmetros


por

Isabel Alexandra Costa Pinho do Esprito Santo

Componente de Sntese a apresentar nas Provas de Aptido Pedaggica e Capacidade Cientca

Ramo da Engenharia de Produo e Sistemas rea de Optimizao No Linear UNIVERSIDADE DO MINHO Novembro de 2001

Dedico este trabalho ao meu lho e ao meu marido.

The strong division between the arts and the sciences is mainly a feature of the twentieth century. (M. Hargreaves)

Contedo
Agradecimentos 1 Introduo 1.1 Objectivos e plano de trabalho . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Estrutura do relatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Modelao matemtica 2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 O modelo . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 O modelador . . . . . . . . . . . . . . . . . . . . . . . 2.4 Modelos matemticos . . . . . . . . . . . . . . . . . . . 2.4.1 Modelos determinsticos e estocsticos . . . . . 2.4.2 Modelos discretos e contnuos . . . . . . . . . . 2.4.3 Modelos lineares e no lineares . . . . . . . . . 2.4.4 Modelos diferenciais e integrais . . . . . . . . . 2.5 O processo de modelao . . . . . . . . . . . . . . . . . 2.5.1 Identicao do problema . . . . . . . . . . . . 2.5.2 Formulao . . . . . . . . . . . . . . . . . . . . 2.5.3 Simplicao . . . . . . . . . . . . . . . . . . . 2.5.4 Anlise . . . . . . . . . . . . . . . . . . . . . . . 2.5.5 Computao . . . . . . . . . . . . . . . . . . . . 2.5.6 Validao . . . . . . . . . . . . . . . . . . . . . 2.5.7 O ciclo de vida de um modelo . . . . . . . . . . 2.5.8 Optimizao . . . . . . . . . . . . . . . . . . . . 2.6 Realidade econmica . . . . . . . . . . . . . . . . . . . 2.7 Tcnicas de determinao de parmetros de um modelo 2.8 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii 1 1 1 3 3 4 5 5 6 6 7 8 9 10 12 12 13 13 14 16 16 17 18 19

3 Mnimos quadrados lineares 20 3.1 Denio do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3.2 Modelo normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 i

CONTEDO 3.2.1 Modelo polinomial. Polinmios ortogonais . . . . . 3.2.2 Modelo no polinomial . . . . . . . . . . . . . . . . 3.3 Modelo ortogonal . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Aplicaes . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Decomposio dos valores singulares . . . . . . . . 3.3.4 Formulao do problema unidimensional . . . . . . 3.3.5 Soluo do problema unidimensional . . . . . . . . 3.3.6 Problema multidimensional . . . . . . . . . . . . . 3.4 Comparao algbrica entre os modelos normal e ortogonal 3.4.1 Relao entre as solues . . . . . . . . . . . . . . . 3.4.2 Sensibilidade da soluo a pequenas perturbaes . 3.5 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Mnimos quadrados no lineares 4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Mtodo de Newton . . . . . . . . . . . . . . . . . . . . 4.3 Mtodo de Gauss-Newton . . . . . . . . . . . . . . . . 4.4 Mtodo de Gauss-Newton com procura unidimensional 4.5 Mtodo de Levenberg-Marquardt . . . . . . . . . . . . 4.6 Mtodos quasi-Newton estruturados . . . . . . . . . . . 4.7 Mtodos quasi-Newton factorizados . . . . . . . . . . . 4.8 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Exemplos de modelos matemticos 5.1 Introduo . . . . . . . . . . . . . . . . 5.2 Modelos de comunidades biolgicas . . 5.3 Modelos de propagao de poluio . . 5.3.1 Propagao de poluio no ar . 5.3.2 Propagao de poluio na gua 5.4 Modelos em fsica . . . . . . . . . . . . 5.5 Modelos em qumica . . . . . . . . . . 5.6 Modelos em msica . . . . . . . . . . . 5.7 Modelos em economia . . . . . . . . . 5.8 Sntese . . . . . . . . . . . . . . . . . . 6 Concluses Bibliograa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ii 24 27 27 27 28 28 31 32 32 34 34 35 37 38 38 39 42 45 46 48 52 56 57 57 58 60 60 63 66 67 69 69 70 72 73

Agradecimentos
A todos quantos de forma directa ou indirecta ajudaram realizao deste trabalho, o meu sincero apreo. Desejo expressar, em primeiro lugar, um profundo e sentido agradecimento Doutora Edite, quer pela sua reconhecida e indiscutvel competncia orientadora, quer pela amizade que, apesar da escassez de tempo disponvel, consegue dispensar. Agradeo ainda a todos os meus colegas de trabalho pela amizade, no podendo deixar de destacar o Ismael, pela constante disponibilidade, e sem o qual a escrita destas provas teria sido, sem dvida, muito mais complicada. Ao Accio, um muito obrigada pelo prossionalismo, dedicao, companheirismo e boa disposio constantes. Um agradecimento muito especial para a Teresa (Doutora Teresa!), que j no posso incluir s na categoria dos colegas. Muito obrigada por tudo, amiga. A toda a minha famlia, agradeo por todo o apoio incondicional, em particular minha irm e minha sobrinha. Aos meus pais, agradeo toda uma vida. Ao meu marido, o Paulo, para alm do ombro querido em todas as horas, agradeo ainda as sugestes na parte pedaggica do trabalho. Ao Fernando, o maior agradecimento de todos por ter sido, ainda dentro da minha barriga, o supremo incentivo concluso deste trabalho.

iii

Captulo 1 Introduo
1.1 Objectivos e plano de trabalho

Este relatrio constitui a componente de sntese a apresentar em Provas de Aptido Pedaggica e Capacidade Cientca, ao abrigo do Decreto - Lei no 19/80 de 16 de Julho, artigos 53o a 60o . Pretende-se com este trabalho fazer um apanhado geral sobre modelao matemtica, em particular sobre a formulao de modelos e estimao de parmetros, dando-se especial nfase tcnica dos mnimos quadrados. Com estes objectivos estipulou-se um plano de trabalho que visou inicialmente um levantamento sobre modelao matemtica, destacando-se a funo dos modelos, o papel dos modeladores, os tipos de modelos matemticos, o processo de modelao propriamente dito, a realidade econmica adjacente a este processo e, por m, uma pequena abordagem s tcnicas de determinao de parmetros. De seguida, analisou-se pormenorizadamente a estimao de parmetros atravs da tcnica dos mnimos quadrados. Foram estudados os problemas de mnimos quadrados lineares nas suas vertentes normal e ortogonal e tambm os mnimos quadrados no lineares. Para todas as tcnicas abordadas foram apresentados algoritmos para resoluo dos problemas numricos adjacentes. Por m, apresentaram-se alguns exemplos ilustrativos do muito que existe sobre modelos matemticos, nos mais diversos campos da cincia e engenharia.

1.2

Estrutura do relatrio

O presente relatrio est dividido em cinco captulos. O captulo dois trata da modelao matemtica. Inclui uma descrio do que um modelo, o papel do modelador, os vrios tipos de modelos matemticos, uma descrio

CAPTULO 1. INTRODUO

pormenorizada do processo de modelao, a realidade econmica de todo o processo subjacente modelao e uma primeira abordagem s tcnicas de estimao de parmetros. Nos captulos trs e quatro faz-se uma exposio da tcnica dos mnimos quadrados. No captulo trs descrevem-se os mnimos quadrados lineares nas suas componentes normal (modelos polinomial com polinmios ortogonais e no polinomial) e ortogonal. No quarto captulo apresentam-se os mtodos numricos para a resoluo de problemas de mnimos quadrados no lineares, nomeadamente os mtodos de Newton, GaussNewton, Gauss-Newton com procura unidimensional, Levenberg-Marquardt, quasi-Newton estruturados e quasi-Newton factorizados. Por m, so apresentados no quinto captulo alguns modelos aplicados s cincias e engenharias, que podem ser resolvidos pelas tcnicas descritas anteriormente. D-se especial destaque a modelos de comunidades biolgicas, propagao de poluio, fsica, qumica e economia. Por acarretar uma extenso demasiada a este relatrio, alguns modelos, apesar de interessantes, so apenas referidos. Em todos os captulos feita, na ltima seco, uma breve sntese.

Captulo 2 Modelao matemtica


Para este captulo foram consultadas as referncias [3], [4], [7], [8], [10], [11], [12], [15], [18] e [21].

2.1

Introduo

Desde os tempos mais remotos que o Homem pretende entender o universo do qual faz parte. Esta curiosidade, juntamente com a necessidade de controlar tudo o que o rodeia, sempre foram as caractersticas humanas mais evidentes e constantes ao longo dos tempos. A necessidade de criar modelos que permitam explicitar a extenso e percepo dos conhecimentos, explicar fenmenos e predizer comportamentos, levaram a uma necessidade crescente de construir modelos que permitissem ao Homem compreender o ambiente que o rodeia. medida que vo surgindo diculdades e decincias nos modelos, vo aparecendo outros modelos melhorados ou totalmente modicados. Um exemplo claro deste procedimento a concepo do prprio universo, cujos modelos propostos ao longo dos sculos por clebres cientistas foram mudados e redesenhados vezes sem conta. O uso da matemtica para testar ideias e fazer predies sobre o mundo real detm um longo recorde nas cincias fsicas, a tal ponto que se tornou a linguagem base das fsicas e suas aplicaes em engenharia. O modelo matemtico , sem dvida, o modelo mais verstil e barato que um engenheiro pode usar, uma vez que diferentes variaes nas caractersticas e entradas de um sistema podem ser analisadas sem nada ser construdo. Sempre que se parte para a elaborao de um novo modelo ou para a modicao de um j existente, consideram-se certos pressupostos e simplicaes, de tal modo que os modelos raramente so exactos. Torna-se ento necessrio estar permanentemente a fazer um balano entre a simplicidade, factor de extrema importncia quando se pretende entender determinado fenmeno, e a correco, que deve ser adequada por forma a que o modelo no se afaste demasiado da realidade. Um bom modelo leva a um melhor entendimento de uma determinada situao, mas 3

CAPTULO 2. MODELAO MATEMTICA

nunca se pode esquecer que este deve ser robusto, no contendo situaes fora dos limites da sua denio ou assentando em pressupostos que possam levar a resultados inconsistentes. Deve ainda ser preditor, isto , ser capaz de antecipar resultados que podem subsequentemente ser vericados atravs de observaes experimentais. Casos h em que essa experimentao se torna inconveniente, quer por ser dispendiosa, perigosa ou mesmo impossvel, revestindo-se o modelo matemtico de extrema importncia, uma vez que se torna o nico meio de avaliar os resultados de escolhas alternativas. A este processo chama-se simulao. O uso de modelos matemticos, quer qualitativos, quer quantitativos, espalhou-se a um nmero crescente de disciplinas, que utilizam na sua essncia as tcnicas e ideias matemticas. Tudo leva a crer que o desenvolvimento dos modelos continuar, como reconhecimento de que se trata de uma via eciente e econmica de entender, analisar e projectar sistemas, o que tem sido coadjuvado pelo poder do desenvolvimento dos computadores cada vez mais baratos e rpidos. A matemtica torna-se, por isso, cada vez mais poderosa devido beleza das abstraces que levam concentrao no essencial, permitindo olhar para fenmenos inicialmente muito complexos de forma simples e acessvel. A modelao matemtica e computacional tem particular importncia entre os mtodos de modelao. As suas vantagens, quando comparada com a experimentao real, so o baixo custo, a fcil modicao do modelo, a possibilidade de realizao de experincias mltiplas com parmetros modicados, e tem em conta a histria da evoluo do sistema em estudo, que importante para a modelao de processos irreversveis.

2.2

O modelo

Um modelo uma representao de um processo. Em geral, um modelo matemtico denido por um conjunto de equaes, que envolve um certo nmero de variveis. Podem distinguir-se basicamente dois tipos de modelo matemtico: o contnuo, em que as variveis variam continuamente no espao e no tempo; e o descontnuo em que, pelo contrrio, as variveis variam descontinuamente. A modelao tanto pode ser considerada uma arte como uma cincia. A deciso mais importante de um modelador a escolha do modelo. Das muitas possibilidades, provenientes do tipo de aplicao em particular, muito poucos conseguem de forma til iluminar o processo envolvido, e os modelos teis no so necessariamente os de interesse matemtico mais intrnseco. Assim, apesar de um conhecimento das matemticas ser essencial para modelar, raro que a qualidade, isto , a utilidade de um modelo, dependa unicamente da ingenuidade matemtica adjacente sua anlise. Obviamente, para um modelador, o processo no estar completo com a apresentao dos resultados matemticos. luz das inevitveis inconvenincias da modelao, a interpretao de resultados uma componente crucial do processo, e estudos mais aprofundados so quase sempre aconselhados. D-se muitas vezes o caso em que as vises qualitativas permitidas pela modelao so

CAPTULO 2. MODELAO MATEMTICA

mais importantes que quaisquer resultados obtidos. A ideia no produzir o modelo mais descritivo e compreensivo, mas sim produzir o modelo mais simples possvel que incorpore os pressupostos do fenmeno em anlise. O problema muito mais profundo e interessante. De facto, se se ignorarem alguns efeitos em certos modelos, as predies podem resultar, ou seja, um modelo aparentemente menos correcto pode funcionar melhor. Uma parte essencial da modelao trata, assim, de direccionar a anlise para aspectos relevantes ao contexto e omitir outros que levam, muitas vezes, a resultados absurdos. A preciso requerida normalmente por investigaes puramente matemticas desadequada modelao.

2.3

O modelador

Um bom modelador consegue reconhecer a aplicao de ideias em todas as disciplinas. Raramente se d o caso de um modelador, que confrontado com um problema, se proclame um especialista para o qual uma aproximao standard funcione. Em problemas provenientes de aplicaes industriais, por exemplo, os engenheiros inevitavelmente exploram de forma criativa formas de lidar com a situao de interesse, e estas falham mesmo antes do modelador entrar em cena. quase uma vantagem no ser inuenciado pela sabedoria convencional. No entanto, o modelador no comea a sua tarefa em tais circunstncias. parte o conhecimento matemtico (alguns procedimentos so susceptveis de produzir resultados teis), o modelador pode trazer conhecimentos de outros contextos. H princpios gerais (matemticos e fsicos) que so observados em certas situaes e em diversas reas. O treino de um modelador envolve um reconhecimento de padres e princpios.

2.4

Modelos matemticos

Para um leigo a matemtica aparenta ser uma ferramenta sem limites. Esta impresso errada surge essencialmente devido sua abordagem em cursos tradicionais, que se conna a sistemas simples (quase sempre lineares), para os quais existem disponveis resultados completos. O mundo real, pelo contrrio, complexo e no linear. No existem tcnicas genricas disponveis para tais sistemas e tcnicas numricas puras so de uso limitado para explicar os processos subjacentes. Actualmente, duas tendncias podem ser apontadas na modelao matemtica aplicada. A primeira constri modelos to simples quanto possvel e adapta-os aos dados iniciais sem uma observao mais profunda do processo em causa. Assim, os modelos lineares tm sido cada vez mais usados. Esta tcnica bastante popular em numerosas reas de modelao, pois tem dado bons resultados em muitos casos. A segunda tendncia consiste em elaborar modelos matemticos que reectem uma

CAPTULO 2. MODELAO MATEMTICA

estrutura interna dos sistemas em estudo de forma completa, tendo em conta alguns pormenores delicados. Isto leva, de um modo geral, a problemas matemticos complicadssimos. A sua elaborao reecte uma lgica interna do desenvolvimento cientco: o desenvolvimento da matemtica pura e aplicada no seria possvel se novos modelos no fossem criados. A modelao surge como um desao para o qual as receitas podem no funcionar. Uma aproximao emprica e inventiva (baseada no entendimento intuitivo do processo envolvido) , muitas vezes, necessria. Apesar de tais aproximaes no serem to universais na prtica como seria de esperar, acontece frequentemente que as que se tornam teis para uma determinada aplicao podem ser modicadas para abordar outras. Assim, h uma base de conhecimentos que pode ser manuseada. No entanto, esta informao no normalmente discutida a um nvel de licenciatura. Mesmo em matemtica pura ou aplicada, os diferentes temas levam a conar em tcnicas diferentes. A tcnica que soluciona uma questo em particular, acerca de um modelo matemtico bem denido, depende da questo que est a ser concretamente colocada. A matemtica no pode, deste modo, ser tratada fora do contexto do modelo.

2.4.1

Modelos determinsticos e estocsticos

Sempre que se est em presena de sistemas complexos, de grandes dimenses e incerteza de interrelaes inerentes ao prprio sistema, os modelos mais usados para os descrever so os determinsticos, em desfavor dos estocsticos (probabilsticos). Isto deve-se, provavelmente, complexidade injusticada da descrio matemtica proveniente de factores estocsticos, sem que se tenha vericado uma anlise mais pormenorizada essncia do prprio processo. Os modelos probabilsticos tornam-se muito teis para a anlise de processos em que seja possvel o acesso a dados repetitivos, uma vez que requerem uma grande amostra inicial de dados para a modelao, mas a implementao de processos evolutivos quase sempre nica e acompanhada pela escassez de dados. No pode ser ignorada uma anlise compreensiva, inclusiv estatstica, de toda a informao disponvel sobre tais processos.

2.4.2

Modelos discretos e contnuos

Dependendo da tcnica de descrio do processo, os modelos matemticos so subdivididos em contnuos e discretos (isto , operam respectivamente com variveis discretas e contnuas). Os diferentes tipos de dados distinguem estes problemas. Assim, os modelos discretos operam com vectores do tipo x = (x1 , x2 , . . . , xn )T , enquanto os modelos contnuos operam com funes x (t) de uma varivel independente t

CAPTULO 2. MODELAO MATEMTICA

(vector ou escalar). Por exemplo, em modelos dinmicos uma das variveis independentes usualmente o tempo t denido num certo intervalo, t [t0 , T ] . Modelos discretos Uma forma genrica dos modelos discretos Fj (x1 , x2 , . . . , xn ) = 0, j = 1, . . . , m, em que Fj (.) representa, em geral, funes no lineares de n variveis escalares. Modelos contnuos Uma forma geral de um modelo contnuo (x) = 0, (2.2) (2.1)

em que (.) um funcional da funo x(.). O funcional um operador que coloca um valor real de IR para cada funo x(.) de um certo espao funcional . Alguns exemplos conhecidos de espaos funcionais so: C [a, b] - o espao de todas as funes contnuas denidas no intervalo [a, b]; C 1 [a, b] - o espao de todas as funes com primeiras derivadas contnuas denidas no intervalo [a, b]; L [a, b] - o espao de todas as funes denidas e quase sempre limitadas no intervalo [a, b]; e outros. Como regra, um modelo anlogo discreto pode ser construdo a partir de um modelo contnuo conhecido, e vice-versa. Para um grande nmero de modelos, os seus anlogos discretos so conhecidos e usados frequentemente. A escolha entre um e outro depende das capacidades do modelo em reectir peculiaridades do problema e processos em investigao, assim como as preferncias do modelador.

2.4.3

Modelos lineares e no lineares

A escolha entre modelos lineares e no lineares depende do comportamento do processo em estudo ou do rigor da aproximao pretendido. Por vezes o processo no linear mas torna-se conveniente descrev-lo atravs de um modelo linear devido sua maior simplicidade.

CAPTULO 2. MODELAO MATEMTICA Modelos lineares discretos Um modelo linear discreto o seguinte sistema de equaes lineares:
n X j=1

aij xj = bi , i = 1, . . . , m,

(2.3)

onde x = (x1 , x2 , . . . , xn )T , b = (b1 , b2 , . . . , bm )T e A = [aij ] uma matriz de dimenso m n. O modelo (2.3) um objecto matemtico conveniente e completamente investigado e se m = n e o determinante de A for diferente de zero, a equao (2.3) tem soluo nica que pode ser encontrada recorrendo a algoritmos muito rpidos. Modelos no-lineares discretos Pelo contrrio, uma teoria geral sobre equaes no-lineares discretas no existe, e a resoluo de um sistema de equaes no-lineares com a forma (2.1) implica, na maior parte dos casos, o uso de tcnicas numricas complicadas. A soluo pode, alm disso, no ser nica ou nem sequer existir. Modelos lineares contnuos Um modelo linear contnuo do tipo (2.2) com um funcional linear (.), isto , que preserve as operaes lineares de adio e multiplicao por um escalar para todos os elementos x, y do espao funcional : (x + y) = (x) + (y) , (x) = (x) para IR. Modelos no-lineares contnuos Nos modelos no-lineares contnuos, o funcional (.) no-linear.

2.4.4

Modelos diferenciais e integrais

Dependendo do tipo de funcional (.), os modelos contnuos (2.2) distinguem-se entre modelos diferenciais e integrais. Os modelos integrais so mais genricos. Os diferenciais so mais simples e mais ecientes em estudos analticos e numricos, sendo por isso mais comuns. A regra geral de seleco a de que se um processo pode ser descrito ecientemente por um modelo diferencial, com a devida correco, no faz sentido construir e usar um modelo integral.

CAPTULO 2. MODELAO MATEMTICA Modelos integrais

Se nos limitarmos ao caso de um modelo linear com uma varivel independente t, sabe-se que, de um modo geral, qualquer funcional linear (x) relativamente funo x (t) , t [t0 , T ], pode ser descrito pelo seguinte integral (x) = Z
T

K ( ) x ( ) d ,

t0

em que K (t) uma funo dada. A analogia entre modelos integrais contnuos e os seus anlogos discretos muito til no melhor entendimento e interpretao de um modelo. No entanto, a teoria dos modelos lineares contnuos muito complexa quando comparada com os modelos lineares discretos. Modelos diferenciais Os modelos diferenciais so representados por uma relao funcional entre uma funo e algumas das suas derivadas. Tais modelos foram desenvolvidos inicialmente com o objectivo de descrever apenas processos dinmicos, isto , processos que se desenvolvem num determinado instante t. Descrevem uma classe especial de processos (no-espaciais, sem consequncias no futuro, dinmicos) em que a dinmica do desenvolvimento futuro depende apenas do estado actual do processo. Tais modelos parecem ser sucientemente satisfatrios para muitos processos fsicos, mecnicos e econmicos pois as perturbaes iniciais so rapidamente anuladas nos processos reais e so excludas de um modelo processual.

2.5

O processo de modelao

A modelao nem sempre um assunto fcil de abordar, porque os matemticos, que desenvolvem aplicaes na fsica e nas engenharias, raramente encontram textos de apoio que falem do assunto de forma sistemtica. Nem poderia ser de outra forma, j que a modelao se aprende essencialmente na prtica, no havendo regras bem determinadas. Um entendimento sobre a forma correcta de um modelo s pode ser alcanado a partir de uma familiaridade adquirida com um conjunto razovel de exemplos. O procedimento para construir um bom modelo pode entender-se como uma losoa, quase uma arte, uma vez que no existe uma frmula que o permita produzir. Normalmente, a necessidade de proceder elaborao de um modelo matemtico surge, numa primeira instncia, do interesse em descrever, ou melhor ainda, de explicar um determinado fenmeno, o que conseguido atravs de observaes. Por vezes, aps grande esforo, chega-se a um mecanismo hipottico que pode explicar o fenmeno. O seu objectivo passa a ser, ento, formular uma descrio do mecanismo em termos quantitativos, e a anlise

CAPTULO 2. MODELAO MATEMTICA

10

do modelo resultante leva a resultados, que podem ser testados luz de observaes. Se o modelo for realmente bom permitir tambm entrar no campo das predies. de capital importncia nunca olvidar o facto de um modelo ser idealizado, logo de aplicabilidade limitada, devendo ser refreada a nsia, por vezes existente, de simplicar em demasia. Tendo isto sempre presente, o ideal partir de um modelo de base o mais simples possvel, mas que assente em pressupostos verdadeiros, e aos poucos ir complicando. Torna-se evidente que assim, mesmo para um modelo complicado, a sua anlise estar facilitada pelo facto de se ter tratado previamente uma verso mais simples. Por tudo o exposto anteriormente, facilmente se constata que na esmagadora maioria dos casos se torna necessrio assumir o que no dado. Assim, o modelo no mais que um conjunto de pressupostos a partir dos quais a matemtica permite deduzir concluses, que podem ser ou no comparadas com o fenmeno real que o modelo abstracto tenta explicar. O grau de correspondncia entre as duas realidades determina uma medida do grau de adequao do modelo. No se pretende com isto dizer que uma fraca correspondncia deste tipo signica um erro na matemtica, antes um indicador de que os pressupostos so, partida, de validade duvidosa. Neste caso, o que deve ser alterado so os prprios pressupostos e recomea-se todo o processo a partir da. Tratando-se de uma tentativa de captar de forma abstracta o mundo real, o sucesso de um matemtico ao elaborar um modelo depende no s do seu conhecimento emprico como da sua habilidade matemtica. Evidentemente, no se possuindo este conhecimento partida, nem o tempo para o adquirir, no signica que se vai desistir. A soluo muito simples e consiste em pesquisar literatura cientca, uma vez que muito provvel que j algum anteriormente se tenha debruado sobre o mesmo assunto ou assuntos ans. muito mais prtico construir sobre um modelo j existente, que servir como base, do que comear do nada. Salvaguarda-se o perigo de aceitar com demasiada facilidade a palavra impressa, sem um esprito crtico, quer em relao aos pressupostos admitidos pelo prprio como verdadeiros, quer em relao queles assumidos por outros antes dele. Na Figura 2.1 encontram-se, de forma muito resumida, os passos essenciais de um processo de modelao e na Figura 2.2 o processo de simulao mais em pormenor.

2.5.1

Identicao do problema

A modelao matemtica comea com a identicao de um problema. H algo que no se entende, um fenmeno interessante que requer explicao, e tenta-se identicar o mecanismo plausvel para a situao em causa. Para formular o modelo so necessrias leis (frequentemente de conservao) e relaes constitutivas entre variveis, que podem ser baseadas em razes experimentais ou empricas.

CAPTULO 2. MODELAO MATEMTICA

11

Assunto

Modelo

Simulao

Figura 2.1: Processo de simulao (adaptado de Cogan et al. [4]).

Objectivos da simulao Evidncias experimentais Modelo & manipulao matemtica Manipulao do algoritmo

Simulao Avaliao & interpretao

Figura 2.2: Sequncia tpica de simulao (adaptado de Cogan et al. [4]).

CAPTULO 2. MODELAO MATEMTICA

12

2.5.2

Formulao

A abstraco uma fase importante para identicar as estruturas de um modelo matemtico. Em geral, um engenheiro inicialmente confrontado com um determinado assunto ou objectivo. A sua especicao formal pode no ser de todo trivial. Neste ponto surge a necessidade de uma descrio fsica clara do problema, juntamente com a indicao objectiva de todas as variveis envolvidas. Um ou mais modelos so desenvolvidos de acordo com o esquema da Figura 2.1. Estes so ento integrados e testados num ambiente de simulao. O desenvolvimento do ciclo equivalente mostrado na Figura 2.2. Uma vez identicado o problema e o mecanismo proposto, necessrio formul-lo matematicamente. Na maior parte das vezes, a maior diculdade surge na escolha da complexidade adequada. O objectivo construir rapidamente um modelo simples, sem esquecer a incluso de todos os processos relevantes. Diferentes modeladores vo diferir em opinio do que importante ou no, surgindo sempre vrias respostas para um mesmo problema. A formulao envolve equaes e condies de fronteira e, se o problema uma representao sensvel da realidade fsica, esta est, de um modo geral, bem equacionada. Analistas matemticos tm como programa o estabelecimento de um modelo bem formulado, tendo sempre presente que tais resultados ajudam a desenhar e validar procedimentos adequados para solues numricas.

2.5.3

Simplicao

A simplicao consiste num processo atravs do qual um modelo modicado, o que na maior parte das vezes se consegue desprezando pequenos termos. A soluo do modelo proposto diferente de acordo com os antecedentes cientcos do modelador. Frequentemente, e este o caso de engenheiros e cientistas que desenvolvem aplicaes, o modelo numrico e a sua soluo tambm numrica. Surgem com isto dois nveis de diculdade. A computao numrica directa pode falhar devido a uma deciente formulao ou instabilidade das equaes. Pode ainda acontecer que a computao limite a viso do modelo se as questes no forem colocadas adequadamente. Isto pode ainda ser agravado por um pr-tratamento deciente das equaes. A ttulo de exemplo, torna-se perfeitamente intil resolver um problema sem este ter sido previamente adimensionado. A presena de parmetros adimensionais pode servir de indicador, face sua grandeza, de perturbaes ou instabilidade. De facto, esta inconvenincia numrica pode facilitar o uso de mtodos de perturbao, que podem ser usados para se ter uma melhor viso das solues, facilitando a sua anlise. A segunda diculdade reside na habilidade de usar computadores de grande porte para resolver os problemas directamente. Nesta situao, o procedimento correcto consiste em analisar o problema para valores extremos e usar os resultados numricos como um teste

CAPTULO 2. MODELAO MATEMTICA

13

para predies. A modelao matemtica bem sucedida necessita de combinar diferentes aproximaes, mais do que elevar qualquer problema ou fenmeno a uma ascendncia confusa. Resumindo, a primeira coisa a fazer com um modelo adimension-lo. De seguida possvel identicar, de forma racional, o quanto os diferentes termos so pequenos ou grandes. No primeiro caso podem em algumas circunstncias ser ignorados. Conduz-se assim o processo a um modelo simplicado do problema original, mas no signicativamente menos correcto. Nunca se deve deixar de ter em mente qual a questo fundamental. Se se procura uma viso terica, mais do que uma simulao quantitativa, simplicar em demasia poder tornar-se prejudicial.

2.5.4

Anlise

Aps um processo de simplicao como o que foi descrito anteriormente, podem surgir as denominadas perturbaes singulares. Em particular, muitas vezes possvel transformar um modelo complicado num outro mais simples, separando-o nos seus constituintes bsicos, os quais podem, por exemplo, operar em escalas de tempo e espao diferentes. Uma dissecao analtica deste tipo leva a um entendimento global que no est disponvel de imediato atravs da computao numrica directa. Alm disso permite uma metodologia de simplicao da computao.

2.5.5

Computao

A modelao computacional completa as formas tradicionais de modelao atravs de caractersticas que excedem as capacidades humanas. Possibilita contagens de forma rpida e lgica de enormes quantidades de variveis da evoluo do sistema, tendo como base de dados iniciais a concepo conhecida da sua estrutura, as condies de fronteira e as leis de evoluo. Assim, a capacidade do computador para lidar com uma grande quantidade de clculos torna-o uma ferramenta ideal para manusear dados que requerem pouca interpretao. Os modelos computacionais devem ser usados como meios adicionais de suporte de deciso, mais do que como a substituio de todos os tipos de modelo. Em particular, so usados em sistemas interactivos homem-computador. O papel da modelao computacional, como ferramenta modeladora e cientca muitas vezes sobrevalorizado. Esta atitude pode ser reectida no chamado princpio contraintuitivo, que diz que o comportamento do sistema complexo contraditrio intuio humana e pode apenas ser descrito adequadamente por meio de modelos formalizados. Este princpio promove uma absoluta falha dos computadores e leva a simplicaes injusticadas de modelos mentais (modelos ideais do futuro que emergem do crebro humano) sob a inuncia de modelos computacionais. O objectivo do modelador, ou do cientista, entender processos, de tal forma que as predies possam ser conveis. No contexto

CAPTULO 2. MODELAO MATEMTICA

14

industrial, por exemplo, o objectivo , muitas vezes, o de aumentar a taxa de operao de um determinado processo, ou o de perceber porque surgiram diculdades inesperadas. O output numrico de um processo de clculo, ainda que bem denido, no de grande ajuda a este respeito; necessrio conhecer como os vrios componentes do problema interagem para produzir a sada. Em suma, os modelos computacionais desempenham o papel auxiliar de ferramenta preditora e os seus resultados dependem inicialmente de modelos mentais. Esta a razo porque a anlise importante, e porque menos de 1% da compreenso cientca pode ser atribuda ao processo computacional. Uma vez entendido o processo, o computador entra em cena. Existem outras razes mais subtis para no se recorrer imediatamente a tcnicas numricas e que esto relacionadas com a necessidade de ltrar detalhes no essenciais de um modelo. Mais vezes do que seria de esperar, erros aparentemente incuos no modelo matemtico podem adulterar a resposta. Torna-se, por isso, necessrio processar as equaes para chegar a um modelo matemtico adequado a propsitos computacionais. Para isso o entendimento que provm da anlise essencial. Deste ponto de vista, os pacotes algbricos representam um avano maior para o modelador, permitindo-lhe produzir resultados analticos em situaes que no seriam viveis com clculos manuais. Ao analisar um modelo, segue-se uma sequncia de clculos similares. Questes relacionadas com a natureza e existncia das solues estacionrias, com a sua estabilidade ou instabilidade, necessitam de computao para serem resolvidas. De facto, a certo ponto necessrio obter resultados numricos. A anlise destes resultados pode ser uma tarefa complementar, nomeadamente para obter resultados em regies onde a anlise impossvel. Podem tambm ser validatrios, isto , fornecem uma conrmao independente dos resultados analticos. Por vezes, os cientistas pensam na anlise como a conrmao de resultados numricos. Na realidade no bem assim. A maior parte das vezes necessrio projectar experincias numricas para complementar os resultados analticos. Aproximaes directas mas impensadas levam, muitas vezes, a contradies aparentes, quando uma computao realizada de forma mais cuidadosa removeria este problema. Em casos cujo progresso analtico seja possvel, o problema eventual a ser resolvido numericamente , de um modo geral, relativamente simples. Por vezes ainda mais simples resolver numericamente o problema original que o modelo simplicado. Muitos ambientes de simulao encontram-se actualmente disponveis em pacotes de software genricos (Maple, Mathematica, Matlab, Stripes, Pafec), reduzindo signicativamente os clculos manuais e aumentando incrivelmente a computabilidade.

2.5.6

Validao

Idealmente, um modelo matemtico acaba no retorno sua origem: verica-se o quanto o modelo e a sua anlise explicam o fenmeno no qual se est interessado. A curva prevista ajusta-se aos dados experimentais? A curva de estabilidade prevista est de acordo com

CAPTULO 2. MODELAO MATEMTICA

15

os valores determinados experimentalmente? A arte da modelao matemtica reside na sua prpria consistncia. uma cincia inexacta cuja justicao deriva do facto de que pressupostos aparentemente arbitrrios funcionam. Em ltima instncia, esta a justicao para um modelo: ajuda a perceber observaes experimentais. No existe o modelo nico ou o modelo correcto; h, no entanto, bons e maus modelos. A habilidade de modelar reside na capacidade de distingui-los.
Nascimento Recolha inicial de dados

Construo do modelo

Desenvolvimento

Aperfeioamento do modelo Comparao com dados experimentais

NO

SIM Maturidade Uso do modelo como ferramenta para simulao

SIM

Comparao com a realidade

Aperfeioamento da teoria

Decadncia

NO

Figura 2.3: Ciclo de vida de um modelo (adaptado de Cogan et al. [4]).

CAPTULO 2. MODELAO MATEMTICA

16

2.5.7

O ciclo de vida de um modelo

O aspecto preditor de um modelo requer, quase invariavelmente, a translao desse modelo para uma formulao matemtica. Um modelo do tipo das leis de movimento de Newton tende a progredir atravs de uma srie de fases frequentemente descritas em termos da vida humana. Em suma, para construir um modelo dever-se- assumir ou partir de pressupostos j existentes. Com a ajuda da matemtica tirar-se-o concluses, que devem ser analisadas com sentido crtico (se possvel comparar com experincias reais) e se as concluses no so de todo as esperadas, recomear-se- o processo at o modelo representar o que se pretende, ou seja, explicar as observaes do mundo real. A Figura 2.3 mostra esquematicamente a construo de um modelo, desde o seu nascimento at sua decadncia, caso no corresponda ao que se pretende simular. Um bom modelo um espelho eciente da realidade. O matemtico empenhar-se- em assumir uma srie de pressupostos que simplicam a descrio do fenmeno fsico com um mnimo de distoro. Infelizmente, este procedimento limita sempre a aplicabilidade do modelo.

2.5.8

Optimizao

Os mtodos de optimizao tm um papel fundamental na modelao, uma vez que um modelo usualmente no desenvolvido com um m por si s, ou seja, o modelo formulado de modo a determinar valores de parmetros livres que produzam uma medida ptima de optimalidade - por exemplo, a estrutura mais estvel ou o melhor desempenho nos dados observados. A relao entre a formulao de um modelo e a optimizao associada pode tomar vrias formas. Em muitos casos, virtualmente todo o esforo do desenvolvimento de uma formulao levado a cabo atravs da construo de um modelo que reicta o mundo real, to prximo quanto possvel. Apenas aps a forma do modelo estar essencialmente completa, se estuda o mtodo de encontrar valores ptimos para os parmetros. No entanto, a seleco do algoritmo sem considerar as propriedades do modelo leva frequentemente a falhas desnecessrias ou inecincia grosseira. Por outro lado, no se deve simplicar em demasia ou distorcer a formulao, apenas porque se pretende resolver o problema de optimizao de forma mais simples. Tem havido uma tendncia, particularmente na rea da grande dimenso, para modelar at processos acentuadamente no lineares como programas lineares, uma vez que at h bem pouco tempo no estavam disponveis mtodos no lineares para problemas de grande escala. O esforo para remover no linearidades leva frequentemente a um grande aumento da dimenso do problema, e afecta tambm signicativamente a natureza da soluo ptima. Por exemplo, uma soluo de um problema de programao linear (se for nica) sempre um vrtice da regio admissvel, mas a soluo de um problema de programao no linear no .

CAPTULO 2. MODELAO MATEMTICA

17

Um modelo a ser optimizado deve ser desenvolvido encontrando um equilbrio razovel entre os temas de correco melhorada do modelo, o que implica usualmente complexidade adicionada na formulao, e o aumento da facilidade de optimizao. Isto pode ser conseguido invocando um procedimento de optimizao com verses sucessivamente mais complicadas do modelo, numa forma de renamento passo a passo. Os efeitos de cada renamento podem assim ser monitorizados e as diculdades fundamentais podem ser descobertas muito mais rapidamente do que se nenhum tipo de optimizao fosse aplicado at o modelo estar completo. Isto especialmente importante quando se lida com modelos que contm muitos sub-sistemas interconectados, cada um deles requerendo clculos exaustivos. Problemas prticos de optimizao tm indicado que, mesmo com o melhor software disponvel, a optimizao eciente de um modelo pode ser criticamente dependente de certas propriedades da formulao. Isto frequente quando o formulador do modelo tem que tomar numerosas decises arbitrrias que, apesar de no afectarem a correco do modelo, so cruciais para o quanto o modelo converge para a soluo atravs de um algoritmo de optimizao. Quem desenvolve um modelo deve ter presente que em estgios iniciais deve considerar-se a necessidade ltima de resolver um problema de optimizao, j que pouco provvel que o software de optimizao contenha uma rotina genrica que possa ser usada sem impunidade.

2.6

Realidade econmica

Outras complicaes no mbito do mundo real inuenciam o trabalho do modelador. Um modelo que requer dados dispendiosos ou indisponveis, por exigncia de uma soluo excessiva e desnecessariamente correcta, torna-se dispendioso tendo em ateno a razo tempo/ dinheiro. Apesar de se poder esperar um resultado til, tendo isto em vista, pode estabelecer-se para um determinado resultado que este de pouco uso fora do leque de parmetros de interesse especco. No raro que parmetros simples, a serem determinados experimentalmente, possam ser introduzidos para evitar complicaes no essenciais ao mecanismo de interesse. O objectivo ltimo de muitos investigadores controlar um processo sob condies operativas. Nem todos os factores acima referidos so aplicados a uma determinada situao, mas no raro, um grande nmero deles aplica-se. Qualquer matemtico que deseje tornar-se modelador, deve aprender a lidar e coordenar todos estes factores.

CAPTULO 2. MODELAO MATEMTICA

18

2.7

Tcnicas de determinao de parmetros de um modelo

A estimao de parmetros tem um papel essencial em muitos campos das cincias naturais, engenharias e outras disciplinas, como j foi referido. A ideia estimar parmetros de um modelo matemtico que descrevam situaes da vida real. Um grande nmero de modelos matemticos contm equaes diferenciais. Assim, juntamente com a estimao de parmetros tm que se resolver, a maior parte das vezes numericamente, a equao ou sistema de equaes diferenciais em causa. O modelo matemtico que fornecido pelo modelador deve pertencer a uma das seguintes categorias: equaes diferenciais ordinrias com valores iniciais, equaes diferenciais algbricas, equaes diferenciais unidimensionais com derivadas parciais dependentes do tempo, equaes diferenciais unidimensionais com derivadas parciais algbricas. Grande parte das vezes, o modelo matemtico contm dados adicionais de modo a ser possvel aplic-lo a uma gama alargada de casos. Podem dar-se os seguintes exemplos: denido mais que um critrio de ajuste, isto , mais do que um conjunto de dados pode ser aplicado a determinado modelo. O critrio de ajuste pode incluir funes arbitrrias que dependem dos parmetros a ser estimados, da soluo do sistema dinmico e da varivel tempo. Pode ser introduzido um parmetro independente do modelo, chamado concentrao. O modelo possui restries de igualdade ou desigualdade arbitrrias, assim como limites inferior e superior a serem estimados. As restries podem depender ainda da soluo da equao dinmica a um dado tempo e concentrao. Os modelos dinmicos contm pontos de mudana em que a integrao iniciada, por exemplo, para funes de entrada descontnuas ou alteraes no modelo. As equaes diferenciais parciais podem conter equaes algbricas, por exemplo, para resolver sistemas de ordem superior. Os valores iniciais tm que ser calculados simultaneamente de forma a serem coerentes. Algumas equaes diferenciais so denidas pelas funes de uxo, de forma a facilitar a sua introduo no modelo. Em alguns casos, as equaes hiperblicas tm que ser resolvidas atravs de tcnicas especiais de discretizao. Uma forma rpida e emprica de estimar parmetros olhar para o grco resultante dos pontos experimentais e tentar encaixar visualmente uma linha, se possvel recta, aos

CAPTULO 2. MODELAO MATEMTICA

19

mesmos. No entanto, a maior parte das vezes a linha obtida no linear, o que complica o processo de estimao. Uma das tcnicas mais usadas consiste em minimizar a distncia entre alguns dados experimentais conhecidos e os dados tericos calculados atravs do modelo. Assim, mesmo os dados que no possam ser medidos directamente podem ser estimados por esta tcnica, denominada mnimos quadrados. Para aplic-la, e conforme o modelo em causa, pode usar-se um grande nmero de mtodos numricos. Os mais importantes vo ser expostos nos captulos 3 e 4.

2.8

Sntese

A modelao tem tido um papel essencial ao longo da histria, em particular, os modelos matemticos cuja existncia essencial s cincias e engenharias. possvel, atravs destes modelos, estudar fenmenos e predizer comportamentos de sistemas a baixo custo, permitindo a anlise de um grande nmero de dados, o que seria, muitas vezes, difcil, dispendioso ou at impossvel. Tendo em conta a diversidade do universo matemtico, existe uma grande variedade de modelos, sendo que o processo de modelao vai, em grande parte, depender do tipo de modelo que se escolheu. No entanto, para um mesmo fenmeno podem existir vrias propostas de abordagem, uma vez que a modelao no uma cincia exacta, pelo contrrio, muitas vezes assemelha-se mais a uma arte. ainda necessrio, depois de proposto, analisado e validado o modelo, escolher a tcnica matemtica mais adequada para a estimao de parmetros, jogando aqui os mnimos quadrados um papel essencial.

Captulo 3 Mnimos quadrados lineares


3.1 Denio do problema

O problema da estimao de parmetros num modelo linear surge numa grande variedade de disciplinas cientcas, tais como o processamento de sinais, controlo automtico, teoria de sistemas, engenharia em geral, estatstica, fsica, economia, biologia, medicina, entre outras. O modelo descrito por uma equao linear do tipo 1 x1 + + n xn = (3.1)

onde 1 , . . . , n e denotam as variveis e x = [x1 , . . . , xn ]T o vector dos parmetros que caracteriza o sistema especial a tratar. Um problema bsico da matemtica consiste em determinar os parmetros desconhecidos a partir de um conjunto de m medies das variveis, que para vericarem o modelo (3.1) originam o aparecimento de um sistema de equaes lineares sobredeterminado (m > n) Ax = b (3.2)

onde a linha i da matriz A IRmn e o elemento i do vector b IRm de observaes contm, respectivamente, as i-simas medies das variveis 1 , . . . , n e . As medies das variveis i , i = 1, . . . , n denem os dados do problema e as da varivel caracterizam as observaes. Sempre que se pretende modelar um conjunto de dados afectados de erros ou rudos, no faz sentido obrigar a funo-modelo a passar por esses pontos. Assim, ser prefervel que a funo-modelo seja simples e reicta, de uma maneira geral, o comportamento dos dados. Na aproximao clssica dos mnimos quadrados, denida aqui como modelo normal, as medies das variveis i , i = 1, . . . , n (lado esquerdo da equao (3.2)) assumem-se livres de erros, ou seja, os erros esto connados ao lado direito da equao, isto , ao vector b das observaes. No entanto, em certos casos no razovel assumir tal situao. 20

CAPTULO 3. MNIMOS QUADRADOS LINEARES

21

Erros de amostragem, erros humanos, erros de modelao e erros causados pela realizao de experincias podem implicar incorreces na matriz dos dados, A. A aproximao, neste caso, dene o modelo ortogonal dos mnimos quadrados, e que adequado ao caso em que existem erros em ambos os lados da equao (3.2). Este modelo permite ajustar as medies (aT , bi ), i = 1, . . . , m, onde aT denota a i-sima linha de A. i i Tome-se, como exemplo, um modelo com apenas um parmetro para ajustar x = . (3.3)

Uma estimativa para o parmetro x ser encontrada atravs das m medies das variveis e : ai = a0 + ai i bi = b0 + bi , i = 1, . . . , m i (3.4)

resolvendo (3.2) com A = [a1 , . . . , am ]T e b = [b1 , . . . , bm ]T . ai e bi representam os erros adicionados aos verdadeiros valores a0 e b0 , respectivamente das variveis e . i i Se for observado exactamente, isto , ai = 0, os erros ocorrem apenas nas medies de , ou seja, no vector b. Sendo assim, apropriado o uso do modelo normal dos mnimos quadrados para resolver (3.2). Este mtodo perturba o vector b das observaes com um resduo mnimo r, de tal modo que b r pode ser predicto por Ax, o que pode ser conseguido minimizando o somatrio dos quadrados das diferenas entre os valores observados e previstos. A Figura 3.1 ilustra esta situao.

Figura 3.1: Interpretao geomtrica da estimao x = de um parmetro com erros nas medies de (modelo normal) (adaptado de Huel et al. [13]). Se puder ser medido sem erros, o uso deste modelo mais uma vez apropriado, uma vez que se pode reescrever (3.3) como = x (3.5)

CAPTULO 3. MNIMOS QUADRADOS LINEARES

22

e connar todos os erros medio de , contido no lado esquerdo da equao (3.2), considerando bx1 A. A melhor estimativa de x conseguida, neste caso, minimizando o somatrio dos quadrados das diferenas entre os valores medidos ai e os valores previstos bi . Veja-se a Figura 3.2. x

Figura 3.2: Interpretao geomtrica da estimao x = de um parmetro com erros nas medies de (modelo normal) (adaptado de Huel et al. [13]).

Figura 3.3: Interpretao geomtrica da estimao x = de um parmetro com erros em ambas as medies de e (modelo ortogonal) (adaptado de Huel et al. [13]). No entanto, em muitos dos problemas de fsica, engenharia e biologia, ambas as variveis e , so afectadas de erros, isto , ai 6= 0 e bi 6= 0. Se os erros forem estocasticamente independentes e identicamente distribudos, com mdia zero e varincia

CAPTULO 3. MNIMOS QUADRADOS LINEARES

23

comum 2 , a melhor estimativa para x obtida minimizando o somatrio dos quadrados das distncias entre os pontos observados linha do modelo [13]. Veja-se a Figura 3.3.

3.2

Modelo normal

Designamos o modelo que vai aproximar o conjunto de dados por M (x, 1 , . . . , n ) . Denio 3.1 O produto escalar de duas funes f (x) e g (x) denido por hf (x) , g (x)i =
m X i=1

w (xi ) f (xi ) g (xi ) ,

(3.6)

se as funes f e g forem denidas para um conjunto discreto de pontos x1 , x2 , ..., xm . A funo w (x) denomina-se funo peso e sempre positiva. No caso do problema linear dos mnimos quadrados, pretende-se minimizar o produto escalar do resduo, dado por r (x) = M (x, 1 , . . . , n ) , por ele prprio, ou seja, pretende-se, de acordo com a Denio 3.1, minimizar hr (x) , r (x)i n
xI R m X i=1 2 wi ri (x)

(3.7)

(3.8)

em que o modelo M (x, i , . . . , n ) linear em x1 , x2 , . . . , xn . So exemplos deste caso os modelos seguintes: modelo polinomial cbico, M (x, 1 , 2 , 3 , 4 ) = p3 (x, t) = x1 +x2 t+x3 t2 +x4 t3 , em que 1i = 1, 2i = ti , 3i = t2 , 4i = t3 , i = 1, . . . , m, n = 4 e x = [x1 , x2 , x3 , x4 ]T . i i modelo com funes trigonomtricas, M (x, 1 , 2 , 3 , 4 ) = x1 +x2 t+x3 sen (2t)+x4 cos (t), em que 1i = 1, 2i = ti , 3i = sen (2ti ) , 4i = cos(ti ), i = 1, . . . , m, n = 4 e x = [x1 , x2 , x3 , x4 ]T . Assim, de acordo com as equaes (3.2), pretende-se calcular
xI R

2 min (Ax b)2 n

(3.9)

CAPTULO 3. MNIMOS QUADRADOS LINEARES

24

em que uma matriz diagonal, = diag (w1 , w2 , . . . , wn ), denida positiva. Tendo em conta (3.8), ri (x) = (ai )T x bi , para cada i = 1, ..., m. Na explicao que se segue, considere-se a matriz dos pesos como a matriz identidade. Encontrar a soluo de (3.9), x , equivalente a determinar a combinao linear das colunas ai , ..., an de A que est mais prxima de b de acordo com a norma euclidiana. Esta interpretao leva a uma soluo simples do problema proposto. Assim, x satisfaz (ai )T (Ax b) = 0, i = 1, ..., n, ou de forma equivalente, AT (Ax b) = 0. Ax um ponto claramente nico e se as colunas de A forem linearmente independentes, o valor de x que leva ao ponto Ax tambm nico, assim como a soluo do sistema de equaes T A A x = AT b

(3.10)

que no-singular.

Teorema 3.1 Seja m > n > 0, A IRmn , b IRm . A soluo de min kAx bk2 2 xI n R T o conjunto de pontos x : A (Ax b) = 0 . Se as colunas de A so linearmente 1 T A b. independentes, x nico, AT A no-singular e x = AT A As equaes (3.10) so denominadas equaes normais.

3.2.1

Modelo polinomial. Polinmios ortogonais

Trata-se de um caso particular do modelo linear, em que a funo que se pretende ajustar aos dados um polinmio. Torna-se, por isso, bastante simples. A sua formulao a seguinte: r (x) = pn (x, t) (3.11)

em que o polinmio pn (x, t) P , com P o conjunto dos polinmios em t, denido por e x = [x1 , x2 , . . . , xn+1 ] . Os coecientes x1 , x2 , . . . , xn , xn+1 determinam a soluo de
xI n+1 R

pn (x, t) = x1 + x2 t + x3 t2 + + xn tn1 + xn+1 tn


T

(3.12)

min kr (x)k2 kpn (x, t) k2 . 2 2

O sistema linear de n + 1 equaes, que corresponde a (3.10) tem a seguinte forma: x1 m + x2


m X i=1

ti + + xn+1

m X i=1

tn = i

m X i=1

bi

CAPTULO 3. MNIMOS QUADRADOS LINEARES x1 x1


m X i=1

25 =
m X i=1 m X i=1 m X i=1

ti + x2 t2 i + x2

m X i=1

m X i=1 m X i=1

t2 1 t3 i

+ + xn+1 + + xn+1

m X i=1 m X i=1

tn+1 i tn+2 i

bi ti bi t2 i

x1

Este sistema, apesar de simples, mal condicionado, sendo a sua soluo muito sensvel a pequenas alteraes nos dados ou pequenos erros introduzidos pelos clculos. Este problema pode ser ultrapassado reformulando o modelo com a ajuda dos polinmios ortogonais [9]. Denio 3.2 Duas funes f (x) e g (x) dizem-se ortogonais se o seu produto escalar for nulo, isto , se hf (x) , g (x)i = 0. Denio 3.3 A sequncia P0 (x), P1 (x), . . . , Pn (x) forma uma sequncia de n +1 polinmios ortogonais se os polinmios Pi (x), i = 0, . . . , n forem ortogonais dois a dois e cada Pi (x) for um polinmio de grau exactamente igual a i. Os polinmios ortogonais gozam das seguintes propriedades: 1. Os polinmios ortogonais Pn (x) so tambm linearmente independentes. Assim, qualquer polinmio pn (x), de grau n, pode ser expresso na seguinte forma nica pn (x, t) = x1 P0 (t) + x2 P1 (t) + + xn+1 Pn (t) como uma combinao linear de uma sequncia de polinmios ortogonais. 2. Os polinmios ortogonais satisfazem a seguinte relao de recorrncia: Pi+1 (x) = Ai (x Bi )Pi (x) Ci Pn1 (x), para i = 0, 1, . . . , n 1 (3.14)

m X i=1

tn + x2 i

m X i=1

tn+1 + + xn+1 i

m X i=1

t2n = i

bi tn . i

(3.13)

sendo P0 (x) = 1 (P1 (x) = 0, por conveno) e os coecientes da relao, Ai , Bi e Ci , denidos por: Ai = 1, para todo o i, Bi = hxPi (x), Pi (x)i , para todo o i, hPi (x), Pi (x)i (3.15) (3.16)

C0 = 0 e Ci =

hPi (x), Pi (x)i , para i > 0. hPi1 (x), Pi1 (x)i

CAPTULO 3. MNIMOS QUADRADOS LINEARES

26

Pn (x) no s ortogonal a cada um dos polinmios P0 , P1 , . . . , Pn1 mas tambm a qualquer combinao linear deles e, portanto, a qualquer polinmio de grau mais baixo que n. Se for denida uma aproximao polinomial dos mnimos quadrados como uma combinao linear de polinmios ortogonais do conjunto Pn = {P0 (t) , P1 (t) , , Pn (t)} pn (x, t) = x1 P0 (t) + x2 P1 (t) + + xn Pn1 (t) + xn+1 Pn (t) , o sistema de equaes normais resultante bem condicionado e tem a forma x1
m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1 m X i=1

(3.17)

P0 (xi )P0 (xi ) + x2

P0 (xi )P1 (xi ) + + xn+1 P1 (xi )P1 (xi ) + + xn+1 P2 (xi )P1 (xi ) + + xn+1 Pn (xi )P1 (xi ) + + xn+1

P0 (xi )Pn (xi ) =

bi P0 (xi )

x1 x1

P1 (xi )P0 (xi ) + x2 P2 (xi )P0 (xi ) + x2

P1 (xi )Pn (xi ) = P2 (xi )Pn (xi ) =

bi P1 (xi ) bi P2 (xi )

x1

Pn (xi )P0 (xi ) + x2

Pn (xi )Pn (xi ) =

bi Pn (xi )

(3.18) Devido Denio 3.2, o sistema (3.18) reduz-se forma diagonal, com soluo facilmente obtida a partir de m P bi P0 (xi ) i=1 , x1 = P m 2 P0 (xi )
i=1

x2 =

i=1 m P

m P

bi P1 (xi ) P1 (xi )2

i=1 m P

bi Pn (xi ) . Pn (xi )2 (3.19)

xn+1 =

i=1 m P

i=1

CAPTULO 3. MNIMOS QUADRADOS LINEARES

27

3.2.2

Modelo no polinomial

em que M (x, t) M, com M = {1 (t), 2 (t), . . . , n (t)}. Pretende-se assim calcular os parmetros x = [x1 , x2 , . . . , xn ]T que melhor ajustam a funo M(x, t) aos dados do problema, no sentido dos mnimos quadrados. O vector resduo denido por r (x) = M (x, t) e os coecientes x1 , x2 , . . . , xn determinam a soluo de
xI R

Neste tipo de aproximao incluem-se todos os tipos de funes. So exemplos funes exponenciais, trigonomtricas, do tipo xk , entre outras. O formato da funo, no espao das funes lineares, ainda vlido, sendo a denio do conjunto das funes de base bvia M(x, t) = x1 1 (t) + x2 2 (t) + + xn n (t) (3.20)

(3.21)

min kr (x)k2 kM (x, t) k2 . 2 2 n

Supe-se que as funes i , i = 1, . . . , n, so linearmente independentes, o que equivalente a supor que a matriz dos coecientes do sistema no singular. Tambm se considera que os pontos ti , i = 1, . . . , m, onde so conhecidos os valores das observaes , so distintos. O sistema linear das n equaes normais, que corresponde ao modelo (3.10) tem a seguinte forma: x1
m X i=1 m X i=1

1 (ti ) + x2

m X i=1

1 (ti )2 (ti ) + + xn
m X i=1

m X i=1 m X i=1

1 (ti )n (ti ) =

m X i=1 m X i=1

bi 1 (ti )

x1

2 (ti )1 (ti ) + x2

2 (ti ) + + xn

2 (ti )n (ti ) =

bi 2 (ti )

x1

A soluo deste sistema o vector [x1 , x2 , . . . , xn ] que contm os coecientes do modelo (3.20) [6].

m X i=1

n (ti )1 (ti ) + x2

m X i=1

n (ti )2 (ti ) + + xn

m X i=1

n (ti ) =

m X i=1

bi n (ti )

(3.22)

3.3
3.3.1

Modelo ortogonal
Introduo

O modelo ortogonal tem recentemente sido designado por mnimos quadrados totais. No entanto, este mtodo de aproximao no novo e tem j uma longa histria na

CAPTULO 3. MNIMOS QUADRADOS LINEARES

28

literatura estatstica, onde o mtodo conhecido por regresso ortogonal ou regresso com erros nas variveis. Na verdade, a aproximao unidimensional (n = 1) tem origem no sculo XIX. Este mtodo tem sido descoberto e redescoberto numerosas vezes, muitas das quais de forma independente. H cerca de 20 anos a tcnica estendeu-se a problemas multidimensionais (n > 1).

3.3.2

Aplicaes

Os melhoramentos obtidos at agora nas aplicaes deste tipo de modelo conrmaram a sua utilidade, o que tem contribudo para a sua difuso e aplicao nos campos mais diversos. Podem distinguir-se partida duas situaes nas quais o modelo ortogonal mais til. 1. Modelos com erros apenas nas variveis. Estes modelos so caracterizados pelo facto de os valores verdadeiros das variveis observadas satisfazerem uma ou mais relaes lineares desconhecidas mas exactas, da forma (3.1). Se os erros nas observaes so variveis aleatrias independentes com mdia nula e varincia igual, o modelo ortogonal d melhores estimativas que o modelo normal. Esta situao pode ocorrer na prtica com muito mais frequncia do que muitas vezes se pensa. muito comum na agricultura, medicina, cincias econmicas, humanidades, negcios e muitas outras situaes de anlise de dados. Os modelos com erros apenas nas variveis so teis quando o objectivo primeiro a estimao de parmetros e no a predio. Se esta ltima situao for a mais desejada, o modelo normal deve ser usado. De igual modo, se os dados violarem signicativamente os pressupostos do modelo, a correco das estimativas do modelo ortogonal deteriora-se consideravelmente, e tambm aqui o modelo normal deve ser preferido. 2. Situaes de modelao nas quais i e de (3.1) devem ser tratadas simetricamente. Estas situaes ocorrem em medies cientcas e tcnicas quando o interesse recai exclusivamente sobre os parmetros do modelo, e no na predio de uma varivel atravs de outras variveis.

3.3.3

Decomposio dos valores singulares

A decomposio dos valores singulares de uma matriz de grande importncia terica e prtica, quer para o modelo dos mnimos quadrados lineares normal, quer para o modelo ortogonal. A histria deste tipo de decomposio de matrizes data de mais de um sculo, mas tem apenas recebido alguma ateno por razes conceptuais, numricas, algbricas e computacionais. Entende-se por decomposio dos valores singulares da matriz A, m n, com m > n, por A = U 0 0 V 0T (3.23)

CAPTULO 3. MNIMOS QUADRADOS LINEARES em que 0 0 0 0 U 0 = [U1 ; U2 ] , U1 = [u01 , . . . , u0n ] , U2 = u0n+1 , . . . , u0m , u0i IRm , U0T U0 = Im, 0 = diag (01 , . . . , 0n ) IRmn , 01 0n 0.
0 0 0 V 0 = [v1 , . . . , vn ] , vi IRn , V0T V0 = In ,

29

A decomposio dos valores singulares da matriz [A; B] , m (n + d) , com m > n, em AX = B, dada por (3.24) [A; B] = UV T em que U = [U1 ; U2 ] , U1 = [u1 , . . . , un ] , U2 = [un+1 , . . . , um ] , ui IRm , U T U = I m , V11 V12 }n V21 V22 }d = [v1 , . . . , vn+d ] , vi IRn+d , V T V = I n+d , V = |{z} |{z} n d 1 0 = diag ( 1 , . . . , n+t ) IRm(n+d) , t = min {m n, d } , = 0 2 2 = diag (n+1 , . . . , n+t ) IR(mn)d , Por uma questo de simplicidade de notao, dene-se i = 0 se m < i < n + d. 0i e i so os valores singulares de A e [A; B], respectivamente. Teorema 3.2 (Decomposio dos valores singulares). Se C IRmn , ento existem matrizes ortonormais U = [u1 , . . . , um ] IRmm e V = [v1 , . . . , vn ] IRnn tais que U T CV = = diag ( 1 , . . . , p ) , 1 p 0 e p = min {m, n} . Os valores i so os valores singulares de C. Os vectores u0i e ui so o i-simo vector 0 singular esquerda, e os vectores vi e vi so o i-simo vector singular direita, de A e [A; B], respectivamente. A decomposio dos valores singulares revela muito acerca da estrutura de uma matriz. Para a decomposio dos valores singulares dada pelo Teorema 3.2 e para r denido por 1 . . . r > r+1 = . . . = p = 0, (3.25) 1 n+t 0. 1 = diag (1 , . . . , n ) IRnn ,

CAPTULO 3. MNIMOS QUADRADOS LINEARES tem-se caracter stica(C) = r,

30

e se Ur = [u1 , . . . , ur ], r = diag( 1 , . . . , r ) e Vr = [v1 , . . . , vr ], ento a expanso da decomposio de valores singulares dada por C= Ur r VrT =
r X i=1 T i ui vi .

(3.26)

A equao (3.26) decompe a matriz C, de caracterstica r, num somatrio de matrizes de caracterstica unitria. As normas 2 e de Frobenius esto tambm relacionadas directamente com a decomposio de valores singulares: kCk2 F =
n m XX i=1 j=1

c2 = 2 + . . . + 2 , p = min {m, n} , ij 1 p kCyk2 = 1. kyk2

kCk2 =sup
y6=0

De (3.25) vem que

C T C = V T V T e CC T = U T U T . Assim, 2 , i = 1, . . . , p so valores prprios das matrizes simtricas e semi-denidas posii tivas C T C e CC T , e vi e ui so os correspondentes vectores prprios. Isto signica que a decomposio de valores singulares pode ser reduzida ao problema de valores prprios de matrizes simtricas. No entanto, esta no a forma numrica mais adequada de calcular valores singulares. Para ilustrar esta situao apresentado um exemplo de seguida. Exemplo 3.3 Considere-se o caso n = 2 e tome-se C = [c1 , c2 ], cT c2 = cos, e kc1 k2 = kc2 k2 = 1, 1 onde o ngulo formado pelos vectores c1 e c2 . A matriz 1 cos T C C= cos 1 tem valores prprios 1 = 2cos2 , 2 = 2sen2 , logo 2 2 1 = 2cos , 2 = 2sen . 2 2 Os vectores prprios de C T C, 1 v1 = 2 1 1 1 , v2 = 2 1 1

CAPTULO 3. MNIMOS QUADRADOS LINEARES

31

so os vectores singulares direita de C. Os vectores singulares esquerda podem ser determinados a partir de (3.24). Se << 1, ento 1 2 e 2 2 e obtm-se u1 1 1 (c1 + c2 ) , u2 (c1 c2 ) . 2

Se se assumir que menor do que a raiz quadrada da preciso da mquina calculadora, os valores calculados de cos em C T C so iguais a 1. Se isto acontecer, a matriz C T C passa a ser singular com valores prprios iguais a 2 e 0, e no possvel determinar o menor valor singular 2 . Isto mostra que pode ser perdida informao ao usar-se a matriz C T C nos clculos, a menos que se use preciso suciente.

3.3.4

Formulao do problema unidimensional

Como j foi referido anteriormente, para o problema de mnimos quadrados normal assume-se que s existem erros no vector b e que a matriz A conhecida exactamente. Muitas vezes no correcto partir-se deste princpio, uma vez que quer a amostragem, quer o processo de modelao, quer os erros nas medies, vo afectar a matriz A. Uma maneira de ter em conta os erros da matriz A denir o problema ortogonal da forma que a seguir se apresenta. Denio 3.4 (problema de mnimos quadrados ortogonal) Dado um sistema sobredeterminado de m equaes lineares Ax = b em n incgnitas x, o problema de mnimos quadrados ortogonal procura h i bb minimizar [A; b] A; b (3.27) bb F [A;b]IRm(n+1 ) b sujeito a b R A , b (3.28)

em que R(A) o subespao tal que v R(A) zIRn : v = Az. h i bb Uma vez encontrado o minimizante A; b , qualquer x que satisfaa b Ax = b b

h i b b chamado soluo do problema de mnimos quadrados ortogonal e A; b = [A; b] h i bb A; b chamado resduo do problema de mnimos quadrados ortogonal. A soluo deste problema denotada por x. b

CAPTULO 3. MNIMOS QUADRADOS LINEARES

32

3.3.5

Soluo do problema unidimensional

Entende-se por problema unidimensional aquele em que apenas um vector b considerado. Resolver um sistema de equaes lineares um problema bsico em muitos tipos de problemas. No entanto, se surge um sistema sobredeterminado ter-se- que recorrer a uma soluo aproximada, usando a tcnica dos mnimos quadrados, quer na sua verso normal, quer na sua verso ortogonal. A soluo do problema ortogonal pode ser obtida atravs da decomposio dos valores singulares da matriz [A; b]. Para isso, transforma-se o problema original Ax = b na forma T [A; b] xT ; 1 = 0. (3.29) Teorema 3.4 (expresso para a soluo bsica do modelo ortogonal dos mnimos quadrados). Seja (3.23) (respectivamente (3.24)) a decomposio de valores singulares de A (respectivamente de [A; b]). Se 0n > n+1 , ento x = (AT A 2 I)1 AT b b n+1

2 n+1 1 +

"

n X i=1

0T 2 # ui b = 02 =min kAx bk2 . 2 02 xI n R i 2 n+1

3.3.6

Problema multidimensional

O problema de mnimos quadrados ortogonal multidimensional no mais que uma generalizao do caso unidimensional em que se pretende resolver o sistema de equaes AX = B, onde B uma matriz de observaes m d. A denio deste problema apresentada de seguida. Denio 3.5 (problema de mnimos quadrados ortogonal multidimensional) Dado um sistema sobredeterminado de m equaes lineares AX = B, B IRmd , em nd incgnitas em X, o problema multidimensional de mnimos quadrados ortogonal procura h i bB b minimizar [A; B] A; (3.30) b b F [A;B]IRm(n+d) b b sujeito a R B R A . (3.31) h i b b Uma vez encontrado um minimizante A; B , qualquer X que satisfaa i h i h b b b b uma soluo de mnimos quadrados ortogonais e A; B = [A; B] A; B o correspondente resduo dos mnimos quadrados ortogonais. b b AX = B

CAPTULO 3. MNIMOS QUADRADOS LINEARES

33

A soluo dos mnimos quadrados ortogonais para o caso multidimensional denomib nada X. A resoluo deste problema perfeitamente anloga do caso unidimensional e a sua soluo nica, como se pode ver nos teoremas e corolrio seguintes. Teorema 3.5 (soluo do problema de mnimos quadrados ortogonal multidimensional) Suponha-se que a decomposio dos valores singulares de [A; B] dada por (3.24). Se n > n+1 e V22 no singular, ento h i T T b b A; B = U diag( 1 , . . . , n , 0, . . . , 0)V T = U1 1 V11 ; V21 ,

resolve o problema de mnimos quadrados ortogonal, caso multidimensional (3.30) e (3.31) e 1 b X = V12 V22 b b existe e soluo nica de AX = B. Corolrio 3.1 (expresso aproximada do caso multidimensional do problema de mnimos quadrados ortogonal) Seja a decomposio dos valores singulares de A (respectivamente de [A; B]) dada por (3.23) (respectivamente por (3.24)). Se 0n > n+1 = = n+d , ento 1 T b A B. X = AT A 2 I n+1

com a respectiva matriz do resduo h i h i T T b b b b A; B = [A; B] A; B = U2 2 V12 ; V22 ,

Teorema 3.6 (condio para a existncia e unicidade da soluo do problema de mnimos quadrados ortogonal) Seja a decomposio dos valores singulares de [A; B] dada por (3.24) e a decomposio dos valores singulares de A dada por (3.23), ento 01 > n+1 n > n+1 e V22 no singular. b Porm, se V22 for singular a soluo X no existe. Isto acontece se n+d 0n n+1 , como mostrado pelo lema seguinte.

Lema 3.1 (condio de existncia para os problemas de mnimos quadrados ortogonais) Seja a decomposio dos valores singulares de [A; B] dada por (3.24) e a decomposio dos valores singulares de A dada por (3.23). Ento V22 singular n+d 0n n+1 . Apresenta-se de seguida um algoritmo genrico, ou seja, resolve qualquer tipo de problema de mnimos quadrados ortogonais (unidimensional ou multidimensional) [13].

CAPTULO 3. MNIMOS QUADRADOS LINEARES

34

b Algoritmo 3.1 (clculo da soluo X de AX = B para qualquer caso de mnimos quadrados ortogonais) 1.a) Se m > 5 (n + d) , tornar [A; B] na forma triangular R. 3 1.b) Fazer a decomposio dos valores singulares (3.24) de [A; B] (ou R). 2 Determinao da caracterstica. b 3 Soluo X dos mnimos quadrados ortogonais. Calcular a matriz ortogonal Q tal que Y Z }n 0 }d e (d d) triangular superior. [vr+1 , . . . , vn+d ] Q = |{z} |{z} nr d

3.1 Se for no singular ento baixar a caracterstica r com a multiplicidade de r e voltar ao incio de 3. b 3.2 Seno resolver por eliminao directa: X = Z. 4 Fim.

3.4

Comparao algbrica entre os modelos normal e ortogonal

Existe um grande nmero de relaes algbricas entre os modelos de mnimos quadrados normal e ortogonal, nomeadamente entre as suas solues e os seus resduos. O modelo normal minimiza o somatrio dos resduos quadrados, enquanto o modelo ortogonal minimiza o somatrio ponderado dos resduos quadrados.

3.4.1

Relao entre as solues

Recorde-se que a soluo de um problema de mnimos quadrados AX = B a partir do modelo ortogonal dada por 1 T b X = AT A 2 In A B (3.32) n+1

sendo 0n > n+1 = = n+d (considerando a decomposio dos valores singulares de A e [A; B] respectivamente dadas por (3.23) e (3.24)), verica-se que n+1 determina as diferenas entre ambas as solues, o que pode ser visto no corolrio seguinte. Corolrio 3.2 (relao entre as solues do problema normal e do problema ortogonal) Seja a decomposio dos valores singulares de [A; B] dada por (3.24) e a decomposio dos valores singulares de A dada por (3.23), ento h 1 i 0 T 1 i 0 h T b X = I 2 X = I + 2 X, A A A A 2 I n+1 n+1 n+1

CAPTULO 3. MNIMOS QUADRADOS LINEARES sendo X 0 a soluo do modelo normal.

35

Se se assumir que A possui caracterstica completa (0n > 0), n+1 = 0 signica que o sistema AX = B compatvel, j que caracterstica([A; B]) =caracterstica(A) e R (B) R (A). Neste caso, ambas as solues coincidem. medida que n+1 se afasta de zero, o sistema torna-se cada vez mais incompatvel e a diferena entre as duas solues torna-se mais pronunciada. Pode-se assim armar que n+1 mede a diferena entre as duas solues, enquanto o grau de incompatibilidade do sistema AX = B mede o quo prximas esto as medies A, B do modelo normal em que s existem erros nas variveis.

3.4.2

Sensibilidade da soluo a pequenas perturbaes

Neste tipo de anlise de cabal importncia o nmero de condio da matriz A. A denio seguinte generaliza o nmero de condio de uma matriz quadrada no singular. Denio 3.6 (nmero de condio de Amn ) Seja A IRmn com caracterstica r e a sua decomposio dos valores singulares dada por (3.23). O nmero de condio de A 0 (A) = kAk2 A 2 = 1 , 0r (3.33)

em que A denota a pseudo-inversa da matriz A.

Matrizes com nmeros de condio pequenos so bem condicionadas. Da mesma forma, se tiverem um nmero de condio grande so provavelmente mal condicionadas. As matrizes ortogonais Q so bem condicionadas j que (Q) = 1. Em analogia com um sistema de equaes lineares quadrado, o nmero de condio (3.33) mede a sensibilidade da soluo a erros na matriz A e no vector b. Mostra ainda que pequenas perturbaes nos elementos de A podem provocar grandes alteraes na soluo x de Ax = b se as colunas de A forem quase linearmente dependentes, isto , 0n 0. Quando se estuda a sensibilidade em sistemas sobredeterminados, importante distinguir entre problemas de resduo nulo e problemas com resduo no nulo. A Figura 3.4 ajuda a claricar esta relao.

CAPTULO 3. MNIMOS QUADRADOS LINEARES

36

Figura 3.4: Ilustrao geomtrica do ngulo 0 entre b0 e R(A0 ), dado por sen(0 ) = kb0 A0 xk2 . (adaptado de Huel et al. [13]). kb0 k
2

Seja 0 o ngulo entre os dados no perturbados b0 e R(A0 ) de tal forma que sen (0 ) = kb0 A0 xk2 . kb0 k2 (3.34)

Num problema de resduo nulo b0 R(A0 ), ou seja, 0 zero. Por outras palavras, na ausncia de perturbaes nos dados existe uma relao linear, apesar de no observvel A0 x0 = b0 . O problema ortogonal aplica-se tipicamente a estes casos. A sensibilidade da soluo depende linearmente do nmero de condio e ambos os modelos, normal e ortogonal, so igualmente sensveis. Em problemas de resduo no nulo, b0 R(A0 ) e o ngulo 0 em (3.34) j no / zero. Isto signica que, apesar da ausncia de qualquer perturbao nos dados, no existe uma relao linear exacta A0 x0 = b0 . Como enunciado no Corolrio 3.3, o quadrado do nmero de condio que mede a sensibilidade dos problemas de resduo no nulo e que, alm disso, a soluo ortogonal pode ser mais sensvel que a normal. Este tipo de problemas surge, por exemplo, na estimao de parmetros ou predio de um modelo quando se pretende aproximar dados no lineares atravs de modelos lineares, ou predizer a resposta de sistemas por um modelo simplicado do mesmo sistema. Nestes casos deve ser escolhido o modelo normal, uma vez que a sensibilidade tem um papel primordial [13]. Corolrio 3.3 (limite superior do erro relativo na soluo do modelo normal) Considerese A0 x = b0 com soluo normal x00 e caracterstica(A0 ) = n. Seja a decomposio dos 0 valores singulares de A0 dada por (3.23) e = (A0 ) = 01 < 1. Dena-se F (x00 ) = n kAx00 k2 0 0 0 , sendo n F (x0 ) 1 . Alm disso, seja 0 o ngulo formado por b0 e R(A0 ). kx00 k2 0 Ento kx00 k2 = kb0 k2 cos(00 ) e kr0 k2 = kb0 ksen(0 ). Assim, para qualquer [A; b] que F (x0 ) satisfaa kAk2 kA0 k2 = 01 e kbk2 kb0 k2 , o erro relativo na soluo normal x0

CAPTULO 3. MNIMOS QUADRADOS LINEARES do sistema (A0 + A) x = b0 + b com x0 = x0 x00 , satisfaz 0 kx0 k2 1 F (x00 ) 1 01 1 1 F (x00 ) tan0 + . + 0 n 0n 1 2 0n 1 0n cos0 1 kx00 k2

37

3.5

Sntese

A tcnica dos mnimos quadrados lineares de extrema utilidade na estimao de parmetros, num grande nmero de modelos em problemas matemticos de cincias ou engenharia. Os mnimos quadrados lineares podem ser agrupados em dois tipos. O primeiro, denominado modelo normal, pressupe que apenas as variveis do modelo ou as observaes experimentais esto afectadas de erros, ou seja, possui-se informao exacta de um destes conjuntos de dados, o que perfeitamente aceitvel em muitos casos prticos. Dentro deste modelo podem ainda distinguir-se os casos polinomial (que recorre tcnica dos polinmios ortogonais, para tornar o modelo mais estvel) e no polinomial (em que as funes que aparecem no modelo no so polinmios). No caso em que os erros aparecem associados, quer s variveis, quer s observaes experimentais, recorre-se ao modelo ortogonal, que o segundo tipo de modelo dos mnimos quadrados lineares. Neste ltimo caso, minimiza-se o somatrio dos quadrados das distncias, que so medidas ortogonalmente entre o modelo e os dados experimentais. No caso anterior, as distncias so medidas na horizontal ou na vertical, conforme os erros apaream associados s variveis ou s observaes experimentais.

Captulo 4 Mnimos quadrados no lineares


4.1 Introduo
1 kr (x)k2 2 2

O problema de mnimos quadrados no linear consiste em resolver minimizar f (x) n


xI R

(4.1)

em que x = [x1 , x2 , . . . , xn ]T , m > n, e a funo residual r : IRn IRm , dada por r (x) = M (x, t) no linear nos parmetros x1 , x2 , . . . , xn por via da funo modelo M (x, t). So exemplos deste caso os modelos: M (x, t) = x1 (1 + ex2 t ) , com x = [x1 , x2 ]T e t IR; M (x, t) = M (x, t) = 1 + x1 t , com x = [x1 , x2 , x3 ]T e t IR; x1 x3 + x2 x1 x3 t1 , com x = [x1 , x2 , x3 ]T e t IR2 . (1 + x1 t1 + x2 t2 )

possvel distinguir trs tipos de problemas de mnimos quadrados no lineares: os de resduo nulo, os de pequeno resduo e os de grande resduo. Estas designaes tm a ver com o valor de r (x) no minimizante x . Assim, um problema para o qual r (x ) = 0 designado de resduo nulo, ou seja, o modelo M (x, t) em causa adapta-se exactamente aos dados . Por sua vez, um problema diz-se de grande resduo se r(x ) grande, em comparao com o valor prprio de menor mdulo de A(x )T A(x ) (nunca em comparao com o valor prprio de maior mdulo da mesma matriz), sendo A(x) a matriz que contm as primeiras derivadas de r(x) em ordem a x.

38

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

39

importante distinguir estes tipos de problemas, j que a ecincia do ajuste do modelo pretendido aos dados depende de uma boa escolha do mtodo a aplicar, que ser mais ou menos eciente de acordo com o problema em causa. O problema de mnimos quadrados no linear est relacionado de perto com o problema de resoluo de sistemas de equaes no lineares e um caso de optimizao em IRn . No entanto, os mtodos mais recomendados soluo deste tipo de problemas devem ter em conta a sua estrutura especial, no devendo, por isso, estes casos serem tratados como um problema de optimizao genrico. Os mtodos bsicos para a resoluo de problemas de mnimos quadrados no lineares requerem informao relativa s derivadas de r (x).

4.2

Mtodo de Newton

Assumindo que r (x) duas vezes continuamente diferencivel, a matriz das primeiras derivadas de r (x) designada por matriz do Jacobiano, A (x) IRmn , em que A (x)ij = ri (x) . xj A primeira derivada de f em ordem a x (ver (4.1)) f (x) =
m X i=1

ri (x) ri (x) = A (x)T r (x) ,

(4.2)

em que ri (x) IRn representa o vector que contm as primeiras derivadas de ri (x) em ordem aos parmetros. De igual modo, a segunda derivada f (x) =
2 m X i=1

ri (x) ri (x)T + ri (x) 2 ri (x) = (4.3)

= A (x)T A (x) + S (x) em que S (x) =


m X i=1

ri (x) 2 ri (x) ,

(4.4)

onde 2 ri (x) a matriz Hessiana das segundas derivadas de ri (x). Seja xk uma aproximao soluo de (4.1). Uma aproximao quadrtica a f (x), centrada em xk , de acordo com (4.2) e (4.3) Qk (x) = f (xk ) + f (xk )T (x xk ) + 1 (x xk )T 2 f (xk ) (x xk ) = 2

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES = 1 r (xk )T r (xk ) + r (xk )T A (xk ) (x xk ) + 2 1 + (x xk )T A (xk )T A (xk ) + S (xk ) (x xk ) . 2

40

Como f (x) foi aproximada por um modelo quadrtico, o ponto xk+1 de (4.5), no necessariamente a soluo de (4.1), mas antes uma aproximao. O processo deve ser repetido, usando agora um modelo quadrtico centrado em xk+1 . Este processo iterativo baseado na aproximao de f (x) por um modelo quadrtico, designado por mtodo de Newton. As equaes iterativas deste mtodo so xk+1 = xk + k , k = 0, 1, 2, . . . sendo k a direco de procura que satisfaz a equao T Ak Ak + Sk k = AT rk k (4.6)

Substituindo em (4.1) f (x) por Q (x) , o clculo dos pontos estacionrios de Q , Qk (x) = 0, origina a equao 1 T xk+1 = xk A (xk ) A (xk ) + S (xk ) A (xk )T r (xk ) . (4.5)

(4.7)

Por uma questo de simplicidade de notao, usmos Ak , Sk , k , rk para representar respectivamente A (xk ) , S (xk ) , xk e r (xk ). Este mtodo possui excelentes propriedades locais, j que a sua convergncia local quadrtica sob determinadas condies [5]. Teorema 4.1 Seja r : IRn IRm com f (x) = 1 r (x)T r (x) duas vezes continuamente 2 diferencivel num conjunto aberto convexo D IRn . Assuma-se que existem x n e IR 2 2 1 1 f (x )1 , > 0 tais que N(x , ) D e que f (x ) = 0, f (x ) existe com e 2 f (x ) contnua Lipschitz, com constante , em N(x , ). Ento existe um tal que para todo o x0 N(x , ) a sucesso x1 , x2 , . . . gerada por 1 T Ak rk , k = 0, 1, . . . xk+1 = xk AT Ak + Sk k bem denida, converge para x e obedece a kxk+1 x k kxk x k2 . (4.8)

O inconveniente deste mtodo reside no facto de ser preciso calcular as segundas derivadas de ri , presentes em S (x), que nem sempre so fceis de obter. Uma aproximao numrica conseguida atravs das diferenas nitas geralmente muito dispendiosa, logo
1

N (x , ) uma vizinhana de x de raio .

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

41

tambm inconveniente. Apesar de frequentemente usada na prtica, uma aproximao do tipo secante para 2 f (x) indesejvel, uma vez que a componente A (x)T A (x) de 2 f (x) est disponvel devido ao clculo analtico de f (x). Este tipo de mtodos, conhecidos na literatura por mtodos quasi-Newton, ser objecto de uma anlise mais detalhada na seco 4.6. Existem tambm algumas limitaes no mtodo de Newton. Como a convergncia local, uma aproximao inicial ao processo iterativo (4.6) e (4.7) deve estar muito perto da soluo, para garantir convergncia para um ponto estacionrio de f , o que nem sempre possvel. Alm disso, a matriz dos coecientes do sistema (4.7) s semi-denida positiva muito perto da soluo. Mais uma vez, fora da regio de convergncia o vector direco k , pode no apontar no sentido em que a funo f decresce, no havendo garantia de convergncia para o mnimo de f (x). Apesar destas limitaes, a experincia tem mostrado que o mtodo de Newton razoavelmente eciente e robusto. De qualquer forma existem, hoje em dia, tcnicas ecientes de ultrapassar os problemas referidos. Ao longo deste captulo sero identicadas e detalhadamente descritas essas tcnicas. De seguida apresenta-se o algoritmo do mtodo de Newton. Algoritmo 4.1 Mtodo de Newton 1k0 2 Enquanto convergncia=falso fazer 2.1 Calcular rk , Ak , Sk de acordo com: ri = ri (xk ) aij = ri (xk ) sij =
m X l=1

rl 2 rl (xk )

em que rk o vector com elementos ri (xk ) , Ak a matriz com elementos aij , e Sk a matriz com elementos sij . 2.2 Resolver o sistema de equaes T Ak Ak + Sk k = AT rk k 2.3 Calcular xk+1 atravs de: xk+1 = xk + k 2.4 k k + 1 3 Fim.

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

42

4.3

Mtodo de Gauss-Newton

Se a parte S da matriz das segundas derivadas de f for ignorada, as equaes iterativas cam com o seguinte aspecto: T (4.9) Ak Ak k = AT rk k com xk+1 = xk + k . Estas equaes correspondem aproximao de r (x) por um modelo linear. Seja Lk (x) uma aproximao linear a r (x), centrada em xk , Lk (x) = r (xk ) + A (xk ) (x xk ) . Assim, o problema (4.1) aproximado por minimizar n
xI R

1 kLk (x)k2 , 2 2

(4.10)

que exactamente a equao (4.9). Normalmente, (4.9) resolvido atravs da factorizao QR da matriz A (x) [5]. O mtodo iterativo obtido a partir da aplicao da equao (4.9) designa-se mtodo de Gauss-Newton. A direco de Gauss-Newton tem as seguintes propriedades muito importantes: 1. O vector k invariante a transformaes lineares da varivel independente x. 2. Se xk no for um ponto estacionrio, ento k uma direco de descida, ou seja, existe > 0 e sucientemente pequeno tal que f (xk + k ) < f (xk ) .

e assumindo que A (xk ) tem caracterstica completa ao longo das colunas, a soluo de (4.10) 1 xk+1 = xk A (xk )T A (xk ) A (xk )T r (xk ) , (4.11)

A primeira propriedade , evidentemente, desejvel. Se xk no for um ponto estacionrio de f , ento AT rk 6= 0, e a decomposio dos valores singulares de Ak , pode ser k usada para provar que k uma direco de descida. Denio 4.1 Uma direco k diz-se de descida relativamente funo f (x), no ponto xk , se f (xk )T k < 0.

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

43

Uma vez que a diferena entre o mtodo de Gauss-Newton e o mtodo de Newton se reduz matriz S (x), que consiste em ignorar as segundas derivadas de r (x), e sabendo que o mtodo de Newton tem convergncia quadrtica em determinadas condies, as propriedades e o sucesso do mtodo de Gauss-Newton dependem da importncia do termo S (x) em cada situao. Isto enunciado pelo Teorema 4.2 e Corolrio 4.1 [5]. Teorema 4.2 Seja r : IRn IRm e seja f (x) = 1 r (x)T r (x) uma funo duas vezes 2 continuamente diferencivel num conjunto aberto convexo D IRn . Assuma-se que A (x) contnua Lipschitz, com constante , em D, com kA (x)k2 para todo o x D, e existe um x D e , 0, tais que A (x )T r (x ) = 0, em que o menor valor prprio de A (x )T A (x ), e T (4.12) (A (x) A (x )) r (x ) kx x k2
2

para todo o x D. Se < , ento para qualquer c 1, , existe um > 0 de tal modo que para todo o x0 N (x , ) ,a sucesso gerada pelo mtodo de Gauss-Newton 1 T xk+1 = xk AT Ak Ak rk , k = 0, 1, . . . k

bem denida, converge para x , e obedece a kxk+1 x k2 e kxk+1 x k2

c c kxk x k2 + kxk x k2 2 2 c + kxk x k2 < kxk x k2 . 2

Corolrio 4.1 Sejam verdadeiras as hipteses do Teorema 4.2. Se r (x ) = 0, ento existe um > 0 tal que para todo o x0 N (x , ), a sucesso {xk } gerada pelo mtodo de Gauss-Newton bem denida e tem convergncia quadrtica para x . O que o Teorema 4.2 e Corolrio 4.1 dizem, na sua essncia, que se S (x ) = 0, o mtodo de Gauss-Newton tem, como o mtodo de Newton, convergncia quadrtica local, o que ocorre quando r (x) linear ou se est perante um problema de resduos nulos. Se S (x ) pequeno quando comparado com A (x )T A (x ), o mtodo de Gauss-Newton exibe convergncia linear local. Se, pelo contrrio, S (x ) muito grande, o mtodo de Gauss-Newton pode nem sequer convergir. A constante em (4.12) uma medida absoluta combinada da no linearidade e do tamanho residual do problema e desempenha um papel crucial na prova de convergncia. conveniente olhar para ela como representando kS (x )k2 , j que para x sucientemente prximo de x , (A (x) A (x ))T r (x ) S (x ) (x x ) . =

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

44

Se r (x) linear ou r (x ) = 0, imediato de (4.12) que = 0. A razo , que deve ser inferior a um para garantir convergncia, pode ser vista como uma medida relativa combinada da no-linearidade e tamanho residual do problema. Assim, o Teorema 4.2 tambm diz que a rapidez de convergncia do mtodo de Gauss-Newton decresce medida que a no-linearidade ou o tamanho residual relativos do problema aumentam. Se uma destas medidas for demasiado grande, o mtodo no converge. De seguida apresenta-se o algoritmo do mtodo de Gauss-Newton. Algoritmo 4.2 Mtodo de Gauss-Newton 1k0 2 Enquanto convergncia=falso fazer 2.1 Calcular r(k) , A(k) de acordo com: ri = ri (xk ) aij = ri (xk )

em que rk o vector com elementos ri (xk ) e A(k) a matriz com elementos aij . 2.2 Resolver o sistema de equaes T Ak Ak k = AT rk k 2.3 Calcular xk+1 atravs de: xk+1 = xk + k 2.4 k k + 1 3 Fim. O Quadro 1 mostra resumidamente as vantagens e desvantagens do mtodo de GaussNewton. Quadro 1 - Vantagens e desvantagens do mtodo de Gauss-Newton Vantagens 1. Tem convergncia quadrtica local em problemas de resduos nulos. 2. Tem convergncia linear local rpida em problemas com no linearidades muito fortes ou com resduos razoavelmente pequenos. 3. Resolve problemas de mnimos quadrados lineares numa iterao. Desvantagens 1. Tem convergncia linear local lenta em problemas razoavelmente no lineares ou com resduos moderadamente grandes.

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES 2. No converge localmente em problemas acentuadamente no lineares ou com grandes resduos. 3. No bem denido se A (xk ) no tiver caracterstica completa ao longo das colunas. 4. No tem necessariamente convergncia global.

45

Das quatro desvantagens enumeradas no Quadro 1, as duas ltimas so rapidamente ultrapassadas por tcnicas muito simples que originam dois dos mtodos mais importantes e mais conhecidos at hoje para resolver problemas de mnimos quadrados no lineares. No mtodo de Gauss-Newton a direco sempre de descida, se o mtodo for bem denido. No entanto, um dos problemas que pode surgir na aplicao do mtodo de Gauss-Newton que o passo muitas vezes errado, apesar de a direco ser correcta, ou seja, este mtodo d muitas vezes passos demasiado longos. A denio do passo (mais adequado) a dar ao longo da direco, k , que por si s vai resolver a limitao relacionada com a convergncia local, sugere a incluso de uma tcnica de globalizao no algoritmo. Esta globalizao pode ser feita atravs de uma procura unidimensional ou usando uma estratgia de regies de conana. Estes dois tipos de aproximao geram dois algoritmos muito utilizados na prtica e que so apresentados j de seguida.

4.4

Mtodo de Gauss-Newton com procura unidimensional

O algoritmo que implementa o mtodo de Gauss-Newton com procura unidimensional denido pelas equaes 1 A (xk )T r (xk ) k = A (xk )T A (xk ) e xk+1 = xk + k k , em que k o escalar que dene o comprimento do passo a realizar ao longo da direco k [1] e [19]. Quando Ak no tem caracterstica completa ao longo das colunas, k deve ser escolhida de acordo com k = A (xk )T r (xk ) .

Para garantir convergncia do mtodo de Gauss-Newton com procura unidimensional, o tamanho do passo deve ser escolhido cuidadosamente. A reduo vericada no valor da funo objectivo f (x), de uma iterao para a outra, deve ser signicativa, no mnimo uma fraco da reduo prevista num modelo linear, isto T f (xk ) f (xk + k k ) k A (xk )T r (xk ) k , (4.13)

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

46

tambm produz uma reduo signicativa em f , embora seja pouco prtico pela complexidade do algoritmo. A condio (4.14) dene uma tcnica de procura unidimensional exacta [19]. Apresenta-se de seguida o algoritmo para o mtodo de Gauss-Newton com procura unidimensional. Algoritmo 4.3 Mtodo de Gauss-Newton com procura unidimensional 1k0 2 Enquanto convergncia=falso fazer 2.1 Calcular r(k) , A(k) de acordo com: ri = ri (xk ) aij = ri (xk )

para > 0 [19]. Um dos algoritmos mais usados e conhecidos que produz redues signicativas no valor de f designado por critrio de Armijo. O valor de k escolhido como o primeiro elemento da sucesso {2j } , j = 0, 1, . . ., que verica a condio (4.13). O clculo de k de forma a minimizar o problema unidimensional (4.14) min f x(k) + (k)

em que rk o vector com elementos ri (xk ) e A(k) a matriz com elementos aij . 2.2 Resolver o sistema de equaes T Ak Ak k = AT rk k 2.3 Escolher o passo k atravs de um algoritmo adequado. 2.4 Calcular xk+1 atravs de: xk+1 = xk + k k 2.3 k k + 1 3 Fim.

4.5

Mtodo de Levenberg-Marquardt

O mtodo que a seguir se descreve tem como base o mtodo de Gauss-Newton e serve para resolver o problema causado pelo facto da matriz AT Ak , do sistema do mtodo de Gaussk Newton (4.9) ser singular. Alm disso, esta modicao do mtodo de Gauss-Newton

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

47

tambm torna o algoritmo resultante global. Esta tcnica, tambm designada por regio de conana, consiste em determinar o passo mais adequado por forma a 2 minimizar rk + AT 2 k n
I R

Pode-se mostrar que a soluo de (4.15) o vector k obtido da resoluo do sistema T Ak Ak + k I k = AT rk (4.16) k 1 T Ak rk e k > 0 nos restantes casos [5]. A frmula onde k = 0 se AT Ak k
2

sujeito a kk2 .

(4.15)

(4.16) foi sugerida por Levenberg em 1944 e Marquardt em 1963 e dene o mtodo de Levenberg-Marquardt. As propriedades de convergncia deste mtodo so similares s do mtodo de Gauss-Newton e so estabelecidas pelo seguinte teorema [5]:

Teorema 4.3 Sejam satisfeitas as condies do Teorema 4.2 e seja a sucesso {k } de nmeros reais no negativos limitada por d > 0. Se < ento para qualquer c (1, ( + d) / ( + d)) , existe um > 0 tal que para todo o x0 N (x , ) , a sucesso gerada pelo mtodo de Levenberg-Marquardt 1 T xk+1 = xk AT Ak + k I Ak rk k bem denida e obedece a kxk+1 x k2 e c ( + d) c kxk x k2 + kxk x k2 2 ( + d) 2 ( + d)

O Teorema 4.3 sugere que o algoritmo de Levenberg-Marquardt pode ter convergncia local lenta em problemas de grandes resduos ou acentuadamente no lineares. No entanto, as variadas implementaes que tm surgido deste algoritmo provaram que bem sucedido na maior parte dos problemas de mnimos quadrados no lineares [5], [16] e [19]. Existem factores que tornam este mtodo prefervel ao mtodo de Gauss-Newton com procura unidimensional em certos problemas. Um deles est relacionado com o facto do mtodo de Levenberg-Marquardt ser bem denido, mesmo quando Ak no tem caracterstica completa ao longo das colunas. Alm disso, quando o passo Gauss-Newton demasiado longo, o passo Levenberg-Marquardt est prximo da direco de descida mxima, AT rk , que quase sempre superior ao passo do mtodo de Gauss-Newton com k procura unidimensional. Apresenta-se de seguida o algoritmo para o mtodo de Levenberg-Marquardt.

c ( + d) + ( + d) kxk x k2 < kxk x k2 . kxk+1 x k2 2 ( + d) Se r (x ) = 0 e k = O AT rk 2 , ento {xk } exibe convergncia quadrtica para x . k

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES Algoritmo 4.4 Mtodo de Levenberg-Marquardt 1k0 2 Definir 0 3 Enquanto convergncia=falso fazer 3.1 Calcular r(k) , A(k) de acordo com: ri = ri (xk ) aij = ri (xk ) 3.2 Resolver o sistema de equaes T Ak Ak + k I k = AT rk k 3.3 Calcular xk+1 atravs de: xk+1 = xk + k 3.4 Actualizar k 3.5 k k + 1 4 Fim.

48

4.6

Mtodos quasi-Newton estruturados

Os mtodos de Gauss-Newton e de Levenberg-Marquardt baseiam-se no pressuposto de que AT Ak uma boa aproximao a (4.3), isto , o termo Sk pode ser desprezado. Este k pressuposto no vlido nos problemas de grande resduo, nos quais kr(x )k grande, o que leva a que o termo S(x) seja sempre signicativo na Hessiana de (4.1). Assim, deve ser tomado algum cuidado neste tipo de problemas. Nos problemas genricos de optimizao, a direco de procura dos mtodos quasiNewton, k , dada por Bk k = fk onde Bk a k-sima aproximao matriz Hessiana de f . A matriz Bk actualizada de tal modo que a nova matriz Bk+1 satisfaa a condio secante Bk+1 sk = yk , onde sk = xk+1 xk , yk = fk+1 fk . (4.17)

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

49

Uma aplicao directa dos mtodos quasi-Newton ao problema de mnimos quadrados no lineares no desejvel, uma vez que estes mtodos aproximam toda a matriz Hessiana. Se o resduo optimizado for demasiado grande, no existem vantagens em explorar a natureza particular dos mnimos quadrados na funo objectivo. Assumindo que apenas as primeiras derivadas de r(x) se encontram disponveis, uma estratgia possvel para resolver problemas de mnimos quadrados de grandes resduos incluir uma aproximao quasi-Newton Hk ao termo desconhecido das segundas derivadas S(x). Assim, a aplicao de uma aproximao deste tipo torna-se mais complicada que num problema de optimizao sem restries vulgar, uma vez que no caso dos mnimos quadrados uma parte da Hessiana no ponto xk+1 j conhecida analiticamente, uma vez que os algoritmos de mnimos quadrados no lineares calculam A(x) analtica ou numericamente e, por isso, a parte A(x)T A(x) da matriz Hessiana de f j conhecida. Sendo assim, s necessrio aproximar a segunda parte da matriz Hessiana de f , S(x). Seja a matriz Hk a k-sima aproximao a S(xk ), sendo actualizada de tal modo que a nova matriz Hk+1 deva satisfazer uma das condies secante Hk+1 sk = uk , uk = yk AT Ak+1 sk k+1 ou Hk+1 sk = vk , vk = (Ak+1 Ak )T rk+1 . A direco de procura com uma aproximao quasi-Newton a Sk dada por (AT Ak + Hk )k = AT rk . k k A condio imposta para a aproximao actualizada Hk+1 (AT Ak+1 + Hk+1 )sk = yk , k+1 onde sk = xk+1 xk e yk = AT rk+1 AT rk . k+1 k (4.21) Repare-se que Hk+1 depende no s de Ak+1 , mas tambm da aproximao anterior, Hk . Os mtodos deste tipo so usualmente conhecidos por mtodos quasi-Newton estruturados [10] e [20]. Existem vrias escolhas possveis para actualizar Hk , que podem ser seleccionadas por forma a serem: 1. matrizes de caracterstica um, 2. matrizes de caracterstica dois, 3. matrizes de norma mnima. (4.20) (4.19) (4.18)

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES Apresentam-se de seguida algumas dessas frmulas de actualizao. 1. Frmula de actualizao de Broyden e Dennis (BD): Hk+1 = Hk + com uk = yk AT Ak+1 sk . k+1 2. Frmula de actualizao de Bartholomew-Biggs (Biggs): Hk+1 = k Hk + com (vk k Hk sk )(vk k Hk sk )T , (vk k Hk sk )T sk
T rk+1 rk k = T , rk rk

50

(uk Hk sk )sT + sk (uk Hk sk )T (uk Hk sk )T sk T k sk sk , sT sk (sT sk )2 k k

(4.22)

(4.23)

e vk = (Ak+1 Ak )T rk+1 . 3. Frmula de actualizao de Dennis, Gay e Welsch (DGW):


T sT (vk k Hk sk ) (vk k Hk sk )yk + yk (vk k Hk sk )T T yk yk , k 2 sT yk (sT yk ) k k (4.24) em que k um escalar dado por T sk vk k = min T s Hk sk , 1 . k

Hk+1 = k Hk +

4. Frmula de Broyden, Fletcher, Goldfarb e Shanno (BFGS): Hk+1 = Hk onde Wk = AT Ak+1 + Hk . k+1 1 sT Wk sk k Wk sk sT Wk + k

1 T yk yk , T yk sk

(4.25)

Esta frmula para actualizar Hk de caracterstica dois [20]. Quando Hk+1 satisfaz (4.25), a matriz combinada AT Ak+1 + Hk+1 denida positiva k+1 se AT Ak+1 +Hk tambm o for. Esta propriedade muito til assimptoticamente quando k+1 AT Ak aproximadamente igual a AT Ak+1 . No entanto, AT Ak + Hk pode ser indenida k k+1 k para pontos longe da soluo, ou quando se cometem erros de arredondamento ao longo do

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

51

processo de actualizao. Assim, torna-se necessrio tomar alguns cuidados para garantir que no haja overow na actualizao de Hk , que o deslocamento ao longo da direco de procura no seja muito longo, devido quase ortogonalidade da direco de procura com o gradiente, e garantir que a direco de procura seja de descida. Estes problemas podem ser ultrapassados com a introduo da tcnica do recomeo. Esta tcnica consiste em introduzir de n em n (ou de n + 1 em n + 1) iteraes a matriz identidade para actualizar a matriz Hk . Na prtica, esta soluo no tem apresentado resultados satisfatrios. Pode ser demonstrada convergncia superlinear para algumas actualizaes quasiNewton no caso dos mnimos quadrados. Porm, importante notar que as propriedades da matriz denida-positiva herdada e a tcnica do recomeo no se aplicam no caso dos mnimos quadrados, uma vez que se est a aproximar apenas uma parte da Hessiana. A diculdade de coadunar informao exacta e aproximada relativamente curvatura, pode explicar porque algoritmos baseados em aproximaes quasi-Newton de S(x) geralmente no convergem to rapidamente como os seus homlogos para minimizao sem restries generalizada. Apresenta-se de seguida o algoritmo para um mtodo quasiNewton estruturado. Algoritmo 4.5 Mtodo quasi-Newton estruturado 1k0 2 Definir H0 3 Enquanto convergncia=falso fazer 3.1 Calcular r(k) , A(k) de acordo com: ri = ri (xk ) aij = ri (xk ) 3.2 Resolver o sistema de equaes (AT Ak + Hk )k = AT rk k k 3.3 Escolher o passo k atravs de um algoritmo adequado. 3.4 Calcular xk+1 atravs de: xk+1 = xk + k k 3.5 Construir Hk+1 usando uma frmula de actualizao para Hk . 3.6 k k + 1 4 Fim.

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

52

Entre as actualizaes genricas quasi-Newton, vrias so as que possuem a propriedade hereditria da aproximao matriz Hessiana de f ser denida positiva, por exemplo, a frmula BFGS j apresentada. Esta propriedade garante que a direco de procura k de descida. No entanto, uma vez que nas aproximaes quasi-Newton para mnimos quadrados s se actualiza uma parte da matriz Hessiana (mtodos quasi-Newton estruturados), nem sempre evidente que a frmula de actualizao de Hk garanta que AT Ak + Hk seja denida positiva. Para ultrapassar esta diculdade, vrias estratgias k tm sido propostas, sendo de seguida apresentada uma delas - os mtodos quasi-Newton factorizados.

4.7

Mtodos quasi-Newton factorizados

Uma forma de manter a aproximao matriz Hessiana dada em (4.20) denida positiva utilizando os mtodos quasi-Newton factorizados. Para calcular a direco de procura, resolve-se o sistema de equaes (Lk + Ak )T (Lk + Ak ) k = Ak rk (4.26)

em que Lk uma matriz de correco m n matriz do Jacobiano, de tal forma que LT Lk + LT Ak + AT Lk a k-sima aproximao segunda parte da matriz Hessiana de f . k k k J que a matriz dos coecientes expressa na sua forma factorizada, a direco de procura garantidamente de descida para f . Actualizaes de Lk que funcionem bem, tornam a implementao de algoritmos de procura unidimensional mais simples e vantajosa quando comparada com os algoritmos mais complexos baseados em regies de conana. Para actualizar a matriz Lk , a condio secante (4.18) ou (4.19) para Hk+1 pode ser reduzida seguinte condio para Lk+1 [20]: (Lk+1 + Ak+1 )T (Lk+1 + Ak+1 ) sk = zk em que zk = yk ou zk = vk + AT Ak+1 sk , k+1 e os vectores sk , yk e vk so dados por (4.17) e (4.19), respectivamente. Para sk e zk no nulos, o sistema (4.27) consistente se e s se LT h = zk AT h e Lk+1 sk = h Ak+1 sk k+1 k+1 (4.30) (4.29) (4.28) (4.27)

para um determinado vector h, m-dimensional. As equaes matriciais (4.30) tm uma soluo comum Lk+1 se e s se cada equao tiver separadamente uma soluo e hT h = sT zk . Assim, o objectivo encontrar uma k matriz rectangular Lk+1 que satisfaa as equaes (4.30), assumindo sT zk > 0. k

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

53

J que as equaes (4.30) por si s no determinam a matriz soluo Lk+1 , usa-se a tcnica de variao mnima segundo Dennis e Schnabel [5]. 1. Actualizao factorizada do tipo BFGS. A actualizao de Lk de caracterstica um dada por s T T # sk Bk sk (Lk + Ak+1 ) sk # Lk+1 = Lk + Bk sk , zk T T # sk zk sk Bk sk sendo
# Bk = (Lk + Ak+1 )T (Lk + Ak+1 ) .

(4.31)

(4.32) (4.33) (4.34)

Considerando Bk+1 = (Lk+1 + Ak+1 )T (Lk+1 + Ak+1 ) vem a frmula


# Bk+1 = Bk # # Bk sk sT Bk zk z T k + T k, # sk zk sT Bk sk k

anloga actualizao BFGS para problemas de optimizao genricos. A diferena essencial entre elas reside no facto de a estrutura especial da matriz Hessiana estar # includa em zk e Bk . 2. Actualizao factorizada do tipo DFP. A actualizao de Lk de caracterstica um dada por s ! T 1 sT zk # 1 zk # k Bk zk zk sk . (4.35) Lk+1 = Lk + (Lk + Ak+1 ) Bk T zk sT zk k A frmula anloga actualizao DFP para problemas de optimizao genricos ! # # T T B # sk zk + zk sT Bk sT Bk sk zk zk # k Bk+1 = Bk + 1 + k T . (4.36) k sk zk sT zk sT zk k k Os mtodos quasi-Newton factorizados, nomeadamente as verses BFGS e DFP anteriormente apresentadas, exibem convergncia superlinear, de acordo com o que enunciado nos seguintes teoremas [20]. Seja D o subespao de IRn que contm o ponto mnimo x . (P1) Suponha-se que existem as constantes positivas 1 , 2 e p tais que 2 f (u) 2 f (x ) 1 ku x kp , para qualquer u em D, (4.37)

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES e

54

(P2) Suponha-se ainda que 2 f simtrica e denida positiva em x . Usando os pressupostos anteriores vem f (u1 ) f (u2 ) 2 f (x ) (u1 u2 ) 1 max (ku1 x k , ku2 x k)p ku1 u2 k , (4.39) para quaisquer u1 e u2 em D, e A (u) 2 ku x kp + kA (x )k , para qualquer u em D. (4.40)

kA (u1 ) A (u2 )k 2 ku1 u2 kp , para qualquer u1 e u2 em D.

(4.38)

Teorema 4.4 Sejam vlidos os pressupostos (P1) e (P2). Seja a matriz Lk actualizada segundo a frmula do tipo DFP (4.35), onde zk dado por (4.28) ou (4.29). Seja a sucesso {xk } gerada por 1 xk+1 = xk (Lk + Ak )T (Lk + Ak ) AT rk . k
F,M

(4.41)

kxk+1 x k t kxk x k , k 1. o 1 n T T , Alm disso, (Lk + Ak ) (Lk + Ak ) , (Lk + Ak ) (Lk + Ak ) o n 1 T T so uniformemente (Lk + Ak+1 ) (Lk + Ak+1 ) e (Lk + Ak+1 ) (Lk + Ak+1 ) limitadas. Teorema 4.5 Suponha-se que todas as condies do Teorema 4.4 so vlidas. Ento a sucesso {xk } gerada por (4.41) converge q-superlinearmente para x , isto ,
k

Ento, para qualquer t (0, 1), existem contantes positivas (t) e (t) tais que se T 2 kx0 x k (t) e (L0 + A0 ) (L0 + A0 ) f (x ) (t), a sucesso {xk } gerada por (4.41) bem denida e converge q-linearmente para x com

lim

kxk+1 x k = 0. kxk x k

Teorema 4.6 Sejam vlidos os pressupostos (P1) e (P2). Seja a matriz Lk actualizada segundo a frmula do tipo BFGS (4.31), onde zk dado por (4.28) ou (4.29). Seja a sucesso {xk } gerada por xk+1 1 T = xk (Lk + Ak ) (Lk + Ak ) AT rk . k (4.42)

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

55

kxk+1 x k t kxk x k , k 1. o 1 n T (Lk + Ak )T (Lk + Ak ) , Alm disso, (Lk + Ak ) (Lk + Ak ) , o n 1 T T so uniformemente (Lk + Ak+1 ) (Lk + Ak+1 ) e (Lk + Ak+1 ) (Lk + Ak+1 ) limitadas. Teorema 4.7 Suponha-se que todas as condies do Teorema 4.6 so vlidas. Ento a sucesso {xk } gerada por (4.42) converge q-superlinearmente para x . Apresenta-se de seguida o algoritmo dos mtodos quasi-Newton factorizados. Algoritmo 4.6 Mtodo quasi-Newton factorizado 1k0 1 Definir L0 3 Enquanto convergncia=falso fazer 3.1 Calcular r(k) , A(k) de acordo com: ri = ri (xk ) aij = ri (xk ) 3.2 Resolver o sistema de equaes (Lk + Ak )T (Lk + Ak ) k = AT rk k 3.3 Escolher o passo k atravs de um algoritmo adequado. 3.4 Calcular xk+1 atravs de: xk+1 = xk + k k 3.5 Construir Lk+1 usando uma frmula de actualizao para Lk . 3.6 k k + 1 4 Fim.

Ento, para qualquer t (0, 1), existem contantes positivas (t) e (t) tais que se 1 T 2 1 kx0 x k (t) e (L0 + A0 ) (L0 + A0 ) f (x ) (t), a sucesso {xk } gerada por (4.42) bem denida e converge q-linearmente para x com
F,M

CAPTULO 4. MNIMOS QUADRADOS NO LINEARES

56

4.8

Sntese

Em muitos casos prticos, em especial quando se pretende um modelo mais rigoroso, podem aparecer modelos no lineares nos parmetros. Surge ento a tcnica dos mnimos quadrados no lineares. Os mnimos quadrados no lineares baseiam-se em mtodos iterativos, dos quais se destaca o mtodo de Newton por servir de base a todos os outros. Uma vez que este mtodo recorre ao clculo de segundas derivadas, o que se pode tornar muito difcil, dispendioso ou mesmo impossvel de todo (dependendo da complexidade do modelo), tm sido desenvolvidos novos mtodos que no necessitam desses clculos. Destacam-se os mtodos de Gauss-Newton, Gauss-Newton com procura unidimensional, Levenberg-Marquardt, quasi-Newton estruturados e quasi-Newton factorizados. Estes mtodos, quando bem aplicados e dependendo da situao em concreto, podem dar resultados excelentes, muito prximos dos obtidos pelo mtodo de Newton.

Captulo 5 Exemplos de modelos matemticos


5.1 Introduo

Um modelo uma formulao que imita um fenmeno do mundo real, de forma a ser possvel fazer previses, e pode ser utilizado nos mais diversos campos. Os modelos mais simples que surgem so os verbais ou grcos, ou seja, informais. No entanto, numa abordagem mais rigorosa torna-se necessrio recorrer a modelos estatsticos e matemticos, isto , formais. As operaes dos modelos em computador permitem manipular parmetros de forma a prever resultados provveis. Os modelos tornam-se, assim, teis como resumos da situao que est a ser modelada, permitindo deste modo delimitar aspectos que carecem de dados novos ou melhores. Isto permite a introduo de alteraes em modelos que no funcionam e do uma ideia errada do mundo real. A partir do momento que se consegue uma boa simulao, as oportunidades de experimentao so praticamente ilimitadas, uma vez que possvel introduzir toda a espcie de factores e perturbaes e ter ideia do comportamento do sistema. Ao contrrio do que se possa imaginar, quando se tenta modelar uma natureza complexa, a maior parte das vezes suciente a informao sobre um pequeno nmero de variveis, j que estas podem constituir uma base slida para construir modelos ecazes. Trata-se apenas de escolher as variveis que sejam os factores-chave que dominam e controlam com frequncia uma larga percentagem da aco. Em suma, no se pretende que um modelo, independentemente da rea em estudo, seja uma cpia exacta do mundo real, mas sim uma simplicao que revele os processos chave do fenmeno em causa, de forma a ser possvel perceber e prever novas situaes dentro do universo em estudo [17]. De seguida sero abordados alguns modelos, nomeadamente a sua motivao e formulao.

57

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

58

5.2

Modelos de comunidades biolgicas

Os modelos matemticos de comunidades de animais e plantas tm sido desenvolvidos em detalhe, quer analiticamente, quer em simulaes computacionais. Os meios matemticos disponveis so vrios, alguns deles bastante complexos. Podem referir-se, a ttulo de exemplo, as equaes diferenciais, a integrao e a optimizao, como alguns dos mais usados. Assim, numa grande parte dos casos, a diculdade reside em escolher o modelo e justicar a escolha, tendo em ateno os objectivos da modelao e complexidade da simulao. Modelo de Malthus Este modelo foi a primeira tentativa de descrever matematicamente uma populao. A equao diferencial que o representa a seguinte: dN (t) = lN (t) dN (t) , dt em que N(t) o tamanho da populao (nmero de indivduos num instante t), l uma constante que representa o coeciente da taxa de natalidade e d o coeciente da taxa de mortalidade. Esta equao diferencial pode ser substituda por outra mais simples: dN (t) = N (t) dt em que = l d o coeciente de crescimento intrnseco da populao. A soluo analtica da equao (5.1) muito simples, N(t) = N(t0 )et , no entanto trata-se de um modelo bastante limitado. Isto , no leva em linha de conta os limites de recursos alimentares, assim como parte do princpio que no existe competio. Num sistema real no razovel partir destas simplicaes, uma vez que quando t , N(t) tende para um determinado valor k que dene a capacidade ambiental. Esta no , nem mais nem menos que o tamanho limite da populao em determinadas condies, que pode ser atingido na ausncia de outras populaes [12]. Modelo de Verhulst-Pearl Este modelo descrito pela seguinte equao diferencial: N (t) dN (t) = N (t) 1 , dt k (5.1)

(5.2)

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

59

N(t) representa a resistividade do meio para o aumento da em que o multiplicador 1 k populao. Este modelo muito simples descreve uma lei de crescimento sucientemente real para numerosas populaes de microrganismos, de plantas, de animais e at mesmo humanas [12]. Modelo de Volterra com efeitos hereditrios Este modelo descreve um processo de auto-intoxicao de populaes de uma s espcie pelos produtos expelidos pelo seu prprio metabolismo. O modelo representado pela equao integro-diferencial Z t dN (t) N (t) = N (t) 1 f (t ) V ( ) d , (5.3) dt k 0 respeitante ao tamanho da populao N(t). Trata-se de uma modicao do modelo de Verhulst-Pearl ao qual se adiciona um termo de atraso integral (hereditrio) que representa a diminuio da taxa de crescimento devida a efeitos catablicos. O integrando f (t ) deste termo chamado funo hereditria, que determina a histria do processo no instante , na dinmica da populao, de acordo com a histria da diferena t do tempo actual t. Se for introduzido um ponto de atraso no modelo de Verhulst-Pearl, chega-se seguinte equao diferencial: dN (t) N (t T ) = N (t) 1 . (5.4) dt k Para determinados valores do parmetro de atraso T > 0, a soluo da equao (5.4) oscila em torno de um valor da capacidade ambiental, k. Este modelo considera apenas um instante passado em que a distncia do tempo actual t T . Um caso caracterstico em que este modelo pode ser aplicado em organismos com uma nica reproduo sazonal [12]. Modelo de Lotka-Volterra Este sem dvida o modelo mais conhecido e mais usado em ecologia, j que cobre a maior parte dos tipos de relaes entre espcies que vivem no mesmo ecossistema. descrito pelo seguinte sistema de equaes diferenciais no-lineares: dN1 (t) = N1 (t) (1 + 1 N2 (t)) dt (5.5) dN2 (t) = N2 (t) (2 + 2 N1 (t)) , dt

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

60

em que Ni (t) a quantidade da i-sima espcie, i so os coecientes das taxas de natalidade/ mortalidade, i so os coecientes da interaco entre as espcies, i = 1, 2. De acordo com os sinais de i e i , o modelo (5.5) representa a descrio mais simples dos diferentes tipos de ligao possveis em comunidades de duas espcies. Os tipos de ligao possveis so: 1 > 0, 2 > 0, 1 < 0 e 2 < 0. Competio. A interaco negativa para ambas as espcies. 1 > 0, 2 < 0, 1 < 0 e 2 > 0. Presa-predador ou Parasita-hospedeiro. A interaco negativa para a espcie 1 e positiva para a espcie 2. 1 > 0, 2 > 0, 1 > 0 e 2 > 0. Simbiose. A interaco positiva para ambas as espcies. 1 > 0, 2 > 0, 1 < 0 e 2 = 0. Amensalismo. A interaco negativa para a espcie 1 e neutra para a espcie 2. 1 > 0, 2 > 0, 1 > 0 e 2 = 0. Comensalismo. A interaco positiva para a espcie 1 e neutra para a espcie 2. Estes tipos de interaco possuem comportamentos qualitativos diferentes cujo grau de complexidade pode variar bastante. O modelo de Lotka-Volterra (5.5) que surgiu inicialmente em ecologia tambm usado actualmente para descrever muitos outros processos. So exemplo disso reaces qumicas de oxidao, conexes oponentes em problemas militares e propagao de inovaes devidas a mudanas tecnolgicas [12].

5.3
5.3.1

Modelos de propagao de poluio


Propagao de poluio no ar

Modelar a atmosfera uma tarefa muito complicada, uma vez que formada e inuenciada por um grande nmero de factores, quer naturais, quer antropognicos. Estes factores so de natureza utuante, sujeitos a mudanas perfeitamente aleatrias, tanto mais acentuadas quanto se aumentar o raio de aco da modelao, que pode ir de alguns centmetros a centenas de quilmetros. Entende-se por poluio a introduo no meio ambiente de substncias fsicas, qumicas, biolgicas ou outras que so estranhas e prejudiciais ao ambiente. So conhecidas hoje centenas destas substncias, sendo as mais comuns o dixido de carbono, o monxido de carbono, o dixido de enxofre, o dixido de azoto e a amnia.

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

61

O nvel de contaminao do ar depende da presena de poluentes mais ou menos perigosos na atmosfera. A importncia destes poluentes depende da quantidade e perigosidade com que so lanados na atmosfera, bem como das condies metereolgicas, que vo afectar os seus processos de formao, difuso1 e disperso2 . Considere-se o processo de propagao de poluentes no espao. Seja r um ponto no espao tridimensional IR3 de coordenadas x1 , x2 , x3 e t o tempo. Considerem-se as seguintes funes: v (r, t) = v (x1 , x2 , x3 , t) = (v1 , v2 , v3 ) - velocidade do ar, g (r, t) = g (x1 , x2 , x3 , t) - concentrao especca (por unidade de volume) do poluente no ponto r IR3 num determinado instante de tempo t. Suponha-se que no existe difuso na atmosfera. Ento a concentrao do poluente num elemento de volume constante no instante de tempo t: dg = 0. dt A derivada da funo composta g (x1 , x2 , x3 , t) em ordem a t dada por: dx1 dx2 dx3 dg g g g g = + + + . dt t x1 dt x2 dt x3 dt Pela denio de velocidade do ar, considerando que v1 = partir de (5.6), obtm-se
dx1 , v2 dt

(5.6)

dx2 dt

e v3 =

dx3 dt

ea

g g g g + v1 + v2 + v3 = 0. t x1 x2 x3 Em camadas baixas da atmosfera a divergncia3 nula, ou seja: div(v) = 0

(5.7)

que est relacionada com a equao de continuidade, que pode ser escrita na seguinte forma: v1 v2 v3 + + = 0. (5.8) x1 x2 x3
A difuso o processo fundamental de penetrao de molculas de uma substncia no seio de outra, quando se encontram em contacto, devido aos movimentos das molculas. Esta difuso leva a um equilbrio espontneo da concentrao de substncias no espao. 2 Um sistema dispersivo um conjunto de pequenas partculas de uma substncia (fase dispersvel) distribudas num meio homogneo (meio dispersante). Por exemplo, nevoeiro, fumo ou p so sistemas dispersivos cujo meio dispersante a atmosfera. 3 A divergncia da velocidade v de um uido mvel incompressvel num determinado ponto r div(v) = v1 v2 v3 x1 + x2 + x3 . A condio div(v) > 0 signica a presena de uma fonte de uido no ponto r. Da mesma forma, se div(v) < 0, o ponto r absorve o poluente.
1

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

62

Pela aplicao da equao (5.8) frmula (5.7), obtm-se o seguinte modelo de transporte de poluentes: g + div(v)g = 0. (5.9) t Se uma parte do poluente precipitar ou se decompuser, em vez de (5.6) ter-se- g = g t e o modelo toma a forma: g + div(v)g + g = 0, (5.10) t em que > 0 a taxa especca da diminuio da concentrao do poluente. Se existir uma fonte de poluente no ponto r0 , ento o modelo toma a forma g + div(v)g + g = f, (5.11) t em que a funo f d uma medida da intensidade do poluente na fonte. Para o ponto da fonte com uma intensidade constante Q, vem que f = Q (r r0 )4 . No caso de existirem n fontes de poluente ri com intensidades Qi (t), i = 1, . . . , n, a funo intensidade passa a ser f=
n X j=1

Qi (r ri ) .

At aqui no se levou em conta o processo de difuso quando o poluente dissolve no ar devido turbulncia existente na atmosfera, o que bastante inverosmel em condies reais. Assim, um modelo de transporte de poluentes com difuso ser dado por g g g + g + f, (5.12) + div(v)g + g = t x3 x3
em que = x2 + x2 o operador de Laplace bidimensional, > 0 e > 0 so os 1 2 coecientes de difuso horizontal e vertical. Para resolver a equao diferencial parcial (5.8), so necessrias condies iniciais
2 2

g (r, t0 ) = g0 (r) em t = t0 ,

(5.13)

assim como condies de fronteira que determinam a natureza do contacto do ar com a superfcie terrestre. As condies de fronteira mais simples e mais usadas so g0 = gS em S,

g g = ag em x3 = 0, = 0 em x3 = H, x3 x3

(5.14)

R (r r0 ) denominada funo delta e denida pela igualdade C (r) (r r0 ) dr = (r0 ) , r0 C, , em que C um determinado domnio do espao. Por outras palavras, a funo 0, r0 C, / delta toma o valor no ponto r0 e toma o valor 0 em qualquer outro ponto, de tal forma que o integral desta funo sempre 1.

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

63

em que S a rea lateral de um cilindro, H a sua altura e a uma constante. Estas condies sugerem sedimentao dos poluentes na superfcie da terra, que no existe tranferncia de poluentes atravs da base horizontal superior do cilindro e dada a concentrao gS no limite vertical do cilindro. Os modelos de processos reais que ocorrem na atmosfera so, na maior parte das vezes, muito mais complexos que os descritos acima. A sua maior ou menor complexidade vai depender dos objectivos que se pretendem atingir com tais modelos, nomeadamente o carcter de interconexo com a superfcie terrestre, a disperso estrutural de poluentes, propriedades fsicas, qumicas e estrutura dos poluentes, fontes principais de poluentes, tecnologias disponveis de tratamento de poluentes e estado metereolgico da atmosfera [12].

5.3.2

Propagao de poluio na gua

Os modelos bsicos de propagao de poluentes na gua so similares aos usados para o ar, apresentados na seco anterior. Mtodos para predio de migrao de poluentes em rios, lagos ou gua armazenada em tanques ou piscinas so baseados na descrio matemtica da hidrodinmica, hidrulica e processos sico-qumicos que controlam a tranferncia de poluentes nestes meios aquticos. Os lagos e os tanques de armazenamento de gua diferem bastante dos rios com corrente, em termos de tempo de permanncia de poluentes (que substancialmente superior nos primeiros), inuncia dos ventos e existncia de ondulao. A turbulncia tambm um factor muito importante, particularmente no caso de reservatrios profundos, assim como processos de eroso e sedimentao no processo de interaco entre a gua e a superfcie com que esta est em contacto. Em termos genricos, um modelo de distribuio de poluio em gua deve ter em conta os processos hidrofsicos, como sejam o vento e corrente da gua, distribuio e transformao dos ventos, correntes uviais geradas por ondas, dinmicas de estraticao da gua, caractersticas de tranferncia e turbulncia, transporte de matria inerte suspensa, transporte de matria inerte dissolvida, sedimentao e lavagem do leito (perturbao dos inertes). Considerando os factores acima enunciados, podem determinar-se os mecanismos de intensidade da tranferncia e acumulao de poluio em reservatrios. Sendo assim, um modelo de propagao de poluio na gua deve conter um modelo de transferncia de poluentes dissolvidos, um modelo de tranferncia de poluentes em suspenso, um modelo de tranferncia de poluentes no leito envolvidos em processos de eroso e sedimentao, um modelo de acumulao nos sedimentos do leito, modelos de transformao de poluentes em processos qumicos e biolgicos. Como dados de entrada, nomeadamente condies iniciais e de fronteira, os modelos usam as condies hidrolgicas do reservatrio, dados morfolgicos (perl do leito), condies metereolgicas, posio e intensidade de fontes de poluentes.

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

64

Existe um conjunto de modelos que foi desenvolvido com vista a descrever tais processos, e estes diferem uns dos outros quanto ao intervalo de tempo em que so vlidos, assim como da mdia dimensional dos fenmenos em estudo, tais como vo ser usados no modelo matemtico. Alguns desses modelos vo ser apresentados de seguida. Modelo de adsoro A concentrao C S de um poluente na fase slida est relacionada com a sua concentrao C em soluo pela seguinte equao: dC S (t) = C C S (t) dt (5.15)

em que o coeciente de transporte de massa no uido e C S (t) o coeciente de adsoro que descreve a intensidade da dissoluo de poluentes em gua. S usada a funo linear C S (t) = CK(t) , em que Kd o coeciente de distribuio de d equilbrio no sistema suspenso-gua. Tendo em conta esta descrio do processo de adsoro, inuncia das caractersticas fsico-qumicas da gua e da suspenso na capacidade de adsoro podem ser consideradas funes correspondentes para Kd . Modelo de sedimentao Os modelos de processos hidrulicos de sedimentao e depsitos no leito descrevem dinmicas do uxo de sedimentao gS e do uxo de depsito de elevaes no leito g b . O modelo mais simples tem a forma k (S S ) para S > S k (S S ) para S < S S b g = , g = , 0 para S < S 0 para S > S em que g S e gb so os uxos de sedimentao e depsito, respectivamente, S a concentrao das partculas suspensas, S a sua concentrao de equilbrio e k um coeciente dado. A dinmica da massa M b (t) da camada dinmica de depsitos sujeitos inuncia das partculas suspensas descrita pela seguinte equao [12]: dM b (t) = gS gb . dt Modelo tridimensional Considere-se um processo de propagao de poluio num domnio tridimensional de gua, com as coordenadas x1 , x2 , x3 . O modelo matemtico correspondente aparenta ser demasiado genrico. No entanto, uma excelente base terica para outros modelos simplicados deduzidos a partir deste. (5.16)

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

65

A equao de transporte para uma determinada concentrao C (x1 , x2 , x3 , t) de um poluente na fase lquida, tendo em conta o fenmeno de adsoro (5.15) tem a forma C X ( i C) X Ai xi = + 12 Kd C C S t xi xi i=1 i=1
3 3 C

(5.17)

em que i so as componentes da velocidade do uxo de gua, Ai os coecientes de difuso, 12 a intensidade constante de trocas de adsoro no sistema gua-suspenso. Esta equao uma generalizao da equao de difuso (5.7). As condies de fronteira usadas normalmente para resolver esta equao tm a forma na superfcie livre da gua x3 = : A3 no leito x3 = z0 : C = 3 C, x3 (5.18)

A13

em que z0 a cota do leito, a cota da superfcie de gua livre denida por um modelo de dinmicas de gua, o coeciente de porosidade do leito, D a mdia de tamanhos das partculas, 13 a intensidade constante de trocas de adsoro no sistema gua-slidos depositados, C b a concentrao de poluentes nos depsitos do leito e A13 o coeciente de difuso entre a gua e os slidos depositados. Este modelo tridimensional d a descrio mais exaustiva do processo. No entanto, na prtica, este modelo torna-se muito complicado devido, quer diculdade de recolha de dados sucientes, quer devido complexidade matemtica que surge na sua resoluo. Por esta razo, este modelo raramente utilizado na prtica, usando-se em sua substituio modelos simplicados, que do normalmente excelentes resultados. Em muitos problemas prticos pode admitir-se um modelo bidimensional plano, desde que haja uma mutabilidade vertical de poluentes desprezvel. Quando se descreve um fenmeno cuja escala de espao excede as centenas de metros, suciente ter em conta a mdia das caractersticas da corrente da gua em determinada profundidade sem conhecimento detalhado da distribuio vertical de poluentes na gua. Se, por sua vez, se pretende um estudo de acumulao de poluentes em locais de mudana de profundidade, basta descrever a distribuio vertical da concentrao de poluentes e usar um modelo bidimensional vertical. Para um caso ainda mais simples, ou seja, quando se pretende apenas descrever a dinmica de alguns parmetros da corrente numa seco vertical ou horizontal, usa-se um modelo unidimensional do leito ou um modelo unidimensional vertical, respectivamente.

C = (1 ) D13 Kd C C b , x3

(5.19)

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

66

Finalmente, o caso mais simples de todos o do modelo de dimenso zero, ou seja, quando se assume que a concentrao de poluente constante num determinado volume. Tais modelos descrevem a dinmica de concentrao de poluentes em reservatrios e so descritos por equaes diferenciais ordinrias. Assume-se que a concentrao de poluentes sada do reservatrio igual existente no interior do mesmo, ou a uma mdia desta. Existem ainda modelos que descrevem a migrao de poluentes em guas subterrneas ou em solos, que so consideravelmente mais complicados que os descritos acima. As equaes de propagao de poluentes em guas subterrneas incluem as guas que diluem em zonas arejadas, em lenis pressurizados ou no, assim como a migrao de um determinado poluente devido s trocas entre a gua e o solo circundante. No caso dos solos preciso no esquecer que este constitudo por uma estrutura porosa, sendo que esta pode estar saturada quando os poros esto completamente cheios, ou no. Neste ltimo caso os efeitos capilares e superciais podem levar a um aumento de presso pelo aparecimento de vapres. A acrescentar a tudo isto, h o facto da entrada de guas provenientes de rios e da atmosfera, assim como poluentes provenientes de fertilizantes minerais, poluentes agrcolas ou industriais, desorestao e destruio dos solos, entre outros factores [12].

5.4

Modelos em fsica

Lei de Newton do movimento para projcteis lanados de avies Trata-se de um dos modelos mais conhecidos em fsica, e para o ilustrar, considere-se o lanamento livre de um projctil a partir de um avio (Figura 5.1).

Figura 5.1: Modelo do lanamento de um projctil a partir de um avio (adaptado de Cogan et al. [4]).

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

67

As equaes newtonianas simples para o movimento em vcuo relacionam a velocidade inicial u com a distncia percorrida S ou a velocidade instantnea v com o instante de tempo t e a acelerao devida gravidade g: v = u + gt, 1 S = ut + gt2 , 2 2 2 v = u + 2gS. (5.20) (5.21) (5.22)

Estas equaes do bons resultados a baixas altitudes, onde os factores friccionais so de importncia limitada. A altitudes superiores o modelo ir complicar-se, uma vez que se torna necessrio adicionar contribuies devidas viscosidade do ar, o uxo laminar volta do projctil, movimento giroscpico e possveis foras de Corilis. A menos que se faam algumas simplicaes a este modelo, que em termos fsicos bastante rigoroso, ser quase impossvel resolver as equaes resultantes. Durante a segunda Grande Guerra, o desenvolvimento dos computadores permitiu calcular de forma bastante correcta as trajectrias da artilharia de longo alcance [4]. Movimento harmnico simples do pndulo O cientista alemo Christiaan Huygens desenvolveu o relgio de pndulo que revolucionou a medio do tempo. Juntamente com outros cientistas, realizou experincias para determinar o efeito da massa e comprimento de um pndulo no seu movimento. Estas observaes levaram a uma equao diferencial de segunda ordem, para o caso em que o ngulo instantneo em relao vertical mantido pequeno: d2 = 2 , dt2 (5.23)

em que o ngulo em relao vertical e = 2f , onde f a frequncia. Foi demonstrado pelas vrias experincias que a frequncia proporcional ao inverso da raiz quadrada do comprimento e independente da massa do pndulo. Evidentemente, um estudo mais exaustivo da mecnica do pndulo no pode limitar-se apenas a valores de pequenos, incluindo assim os efeitos da resistncia do ar e de frico. Isto levar, como natural, a um modelo matematicamente muito mais complicado [4].

5.5

Modelos em qumica

Processos qumicos com produo de calor Uma reaco qumica um processo no qual uma ou mais substncias, os reagentes, se combinam ou separam para formar uma ou mais novas substncias, os produtos. Existe

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

68

neste processo conservao de massa, no entanto, o mesmo no acontece com a energia [15]. Tome-se como exemplo a reaco exotrmica5 entre carbono e oxignio (combusto): C + O2 CO2 . possvel demonstrar a partir de dados experimentais que a taxa de consumo de carbono ou oxignio, ou a taxa de produo de dixido de carbono proporcional ao produto das duas concentraes d [O2 ] d [CO2 ] d [C] = = = kf [C] [O2 ] . dt dt dt (5.24)

A constante de proporcionalidade chamada constante de reaco directa. O processo descrito por (5.24) de segunda ordem, uma vez que o somatrio das potncias das concentraes dois. Apesar de ser gerada uma quatidade considervel de calor, o processo no espontneo. Os reagentes devem ser aquecidos de forma a ultrapassar uma barreira inicial. Esta barreira chamada energia de activao. Na Figura 5.2 pode vericar-se que, juntamente com a formao de calor, produz-se energia efectivamente libertada durante a reaco.

Figura 5.2: Representao das alteraes de energia durante uma reaco qumica (adaptado de Cogan et al. [4]). O modelo descrito em (5.24) no contm nenhum termo referente temperatura. No entanto sabido que a velocidade de reaco duplica aproximadamente a cada aumento de 10o C na temperatura. A temperatura encontra-se subentendida na constante de reaco, e a relao entre estas duas grandezas dada por kf = kf0 e
5
Eact kT

(5.25)

Uma reaco exotrmica aquela em que libertado calor.

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

69

em que k a constante de Boltzman e T a temperatura absoluta. A quantidade Eact a energia de activao para a reaco. Uma vez que o nvel de energia dos produtos se encontra abaixo do dos reagentes, a formao de calor gerada pelo processo. Do ponto de vista de um engenheiro qumico, um processo exotrmico acarreta riscos considerveis em termos de segurana mas tambm vantagens econmicas. Se o calor gerado (Hf ) no for removido de forma eciente, a temperatura da reaco aumenta, aumentando o calor gerado, podendo levar a uma exploso. Por outro lado, se o calor puder ser removido ecientemente, pode ser possvel us-lo para outros ns, reduzindo-se assim os custos energticos. Isto pode ser conseguido atravs do uso de um permutador de calor, onde se cruzam a mistura reactiva e o uido refrigerador, separados por uma na membrana metlica [4].

5.6

Modelos em msica

Modelos de gerao de sons musicais Uma vibrao simples de uma corda pode ser descrita usando a expresso do movimento harmnico simples. O deslocamento da corda y(t) em relao sua posio de repouso dado pela equao d2 y(t) = 2 y(t) (5.26) 2 dt em que = 2f , sendo f a frequncia. No entanto, a realidade no assim to simples, de outro modo seria impossvel distinguir entre os vrios instrumentos. sabido hoje em dia que qualquer sinal sonoro constitudo por um espectro de frequncias. Os cientstas do sculo XIX, na ausncia de osciloscpios, usaram uma srie de ressonadores para determinar a magnitude relativa destes harmnicos, e tornou-se bvio que as componentes da frequncia numa corda vibrante podem ser representada por uma srie de Fourier [4]: a0 f (x) = + [an cos (nx) + bn sen(nx)] , (5.27) 2 R R R em que a0 = f (x)dx, an = f (x)cos (nx) dx e bn = f (x)sen (nx) dx. Por exemplo, o efeito de um arco nas cordas de um violino pode ser representado por uma onda no intervalo [, ] dada por cos (2x) sen(2x) f (x) = 2 sen (x) + . 2 2

5.7

Modelos em economia

Os modelos em microeconomia so muito importantes para um grande nmero de processos. Estes modelos podem ajudar a explicar os fenmenos microeconmicos, assim como

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

70

melhorar o desempenho de um determinado processo. Apesar destes modelos serem, de um modo geral, melhorados por renamentos sucessivos, podem aparecer algumas insucincias como: Equaes dinmicas demasiado simples, para permitirem um clculo analtico; Dados econmicos e do processo inexactos ou diculdades em aceder ou usar estes dados para clculos numricos; Denio no muito clara da poltica dos negcios ou diferentes abordagens possveis ao processo de gesto. Para ponto de partida deste modelo considere-se dX(t) = (1 ) P D, dt (5.28)

dY (t) = I (X (t) + Y (t)) (1 ) P + D, (5.29) dt dJ = ert D, (5.30) dt com P = pF L k Y (t) (X (t) + Y (t)) e F = (X (t) + Y (t))k Ll . A varivel independente t [t0 , tf ], em que t0 e tf so xados. As variveis de estado X, Y e J representam, respectivamente, o capital de equidade, o capital de crdito e a acumulao de dividendos. Com uma sada F , o lucro P a diferena entre as vendas pF e os custos de mo-de-obra L, do capital de emprstimo k Y e da depreciao (X + Y ). representa a taxa de juro e r o interesse no capital de equidade. O objectivo deste processo maximizar o ndice de desempenho J (tf ) que depende das funes de controlo D, I e L, que representam, respectivamente, dividendos, investimento e nmero de funcionrios. Vericam-se ainda as restries 0 Y X (limite do emprstimo), 0 D, 0 I Imx a e 0 L, para todo o t [t0 , tf ]. Este modelo pode eventualmente ser renado para resolver situaes mais especcas. Como evidente, neste caso a abordagem matemtica ir complicar-se [2].

5.8

Sntese

Os modelos apresentados neste captulo constituem uma amostra reduzida dos muitos que se podem encontrar j formulados e grande parte resolvidos para determinadas situaes. A seleco dos modelos apresentados foi feita de modo a mostrar a diversidade de campos em que eles podem aparecer. Pretendem ainda dar uma ideia de como se pode formular um determinado modelo a partir da observao e estudo dos fenmenos em causa.

CAPTULO 5. EXEMPLOS DE MODELOS MATEMTICOS

71

Muitos modelos podem ainda ser alterados de forma a se adaptarem a situaes novas que se pretendam estudar, servindo como ponto de partida, o que muitas vezes se torna vantajoso quando comparado com um processo que parta do zero. Apesar de muitas vezes um modelo primeira vista no ter nada a ver com o fenmeno que se pretende modelar, a base de modelao pode ser praticamente a mesma, o que poupa bastante trabalho. A ttulo de exemplo e curiosidade, podem ser encontrados os mais variados , como sejam modelos para o controlo de trfego [7] e [15], crescimento de populaes [15], taxas de mortalidade e natalidade [15], nmero de rosas a comprar no dia de S. Valentim [15], funcionamento de restaurantes de fast-food [15], extraco de petrleo [15], sons de um orgo de tubos [15], local onde um insecto deve pr os ovos [15], metereolgicos [8], corte de vidros para as luzes de stop de um carro [14], aquecimento de superfcies [7], efeito de estufa [7], difuso de um substrato num tecido cutneo metabolicamente activo [21], entre muitos outros.

Captulo 6 Concluses
Com este trabalho de sntese, sobre estratgias de modelao e estimao de parmetros em modelos matemticos, pretende-se mostrar a importncia deste domnio na descrio e compreenso da realidade que nos rodeia. Os modelos matemticos podem surgir nas mais variadas formas. Em particular, podem denir, nuns casos, funes lineares e noutros, funes no lineares. Podem ainda ser caracterizados como discretos ou contnuos e podem tambm ser determinsticos ou estocsticos, consoante as variveis e/ou parmetros estejam totalmente denidos ou envolvam elementos de incerteza ou sejam ainda variveis aleatrias descritas por funes de distribuio conhecidas. Alm do papel preponderante do modelador, so tambm descritas as etapas a seguir num processo de modelao matemtica. Como a grande maioria dos modelos matemticos depende de certos parmetros, no totalmente determinados pelas caractersticas fsicas e outras dos processos, faz-se referncia tcnica dos mnimos quadrados como estratgia de estimao desses parmetros. Na estimao de parmetros em modelos lineares, deve optar-se pela tcnica dos mnimos quadrados que dene uma regresso normal, se existirem erros de observao ou experimentao nos dados do problema ou na varivel resposta. No entanto, se tanto os dados como a varivel resposta estiverem afectados de erros, a tcnica dos mnimos quadrados deve ser implementada com base numa regresso ortogonal. Nos modelos mais complicados que denem funes no lineares nos parmetros, a implementao da tcnica dos mnimos quadrados origina processos iterativos. Destes, os mais conhecidos so o mtodo de Newton, o mtodo de Gauss-Newton e o de LevenbergMarquardt. Nestes casos, tambm possvel implementar estratgias quasi-Newton, que entram em linha de conta com a estrutura especial dos problemas de mnimos quadrados. Finalmente, e para mostrar a utilidade do estudo efectuado, apresentam-se alguns exemplos de modelos matemticos desenvolvidos com o objectivo de estudar o comportamento de comunidades biolgicas e a propagao de poluentes. So ainda referidos alguns modelos que surgem em reas to variadas como a fsica, qumica, msica e economia, demonstrando a diversidade de campos de aplicabilidade da modelao matemtica. 72

Bibliograa
[1] A. Bjrck, Numerical methods for least squares problems, SIAM, 1996. [2] M. H. Breitner, O. Koslik, O. V. Stryk, e H. J. Pech, Iterative design of economic models via simulation, optimization and modeling, Proceedings of the 1. Mathmod Vienna, 1994. [3] T. A. Ciriani e R. C. Leachman, Optimization in industry, vol. 2, John Wiley & Sons, Ltd, 1994. [4] D. de Cogan e A. de Cogan, Applied numerical modelling for engineers, Oxford University Press, 1997. [5] J. E. Dennis e R. B. Schnabel, Numerical methods for unconstrained optimization and nonlinear equations, Prentice-Hall, Inc., 1983. [6] E. M. G. P. Fernandes, Computao numrica, segunda edio, Universidade do Minho, Braga, 1998. [7] N. D. Fowkes e J. J. Mahony, An introduction to mathematical modelling, John Wiley & Sons Ltd, 1996. [8] A. C. Fowler, Mathematical models in the applied sciences, Cambridge University Press, 1998. [9] L. Fox e D. F. Meyers, Computing methods for scientists and engineers, Claredon Press, 1968. [10] P. E. Gill, W. Murray, e M. H. Wright, Practical optimization, Academic Press, 1981. [11] M. Hargreaves, Engineering systems - modelling and control, Addison Wesley Longman Ltd, 1996. [12] N. Hritonenko e Y. Yatsenko, Mathematical modeling in economics, ecology and the environment, Kluwer Academic Publishers, 1999.

73

BIBLIOGRAFIA [13] S. V. Huel e J. Vandewalle, The total least squares problem, SIAM, 1991.

74

[14] M. S. Klamkin, Die cutting for a fresnel lens, Mathematical Modelling 1 (1980), 6370. [15] M. Mesterton-Gibbons, A concrete approach to mathematical modelling, John Willey & Sons, Inc., 1995. [16] J. J. Mor, The levenberg-marquardt algorithm: Implementation and theory, Numerical Analysis 630 (1977), 105116. [17] E. P. Odum, Fundamentos de ecologia, Fundao Calouste Gulbenkian, 1971. [18] K. Schittkowski, Parameter estimation in one-dimensional time dependent partial dierential equations, Optimization Methods and Software 7 (1997), 165210. [19] M. A. Wolfe, Numerical methods for unconstrained optimization, Van Nostrand Reinhold Company Ltd., 1978. [20] H. Yabe e T. Takahashi, Factorized quasi-newton methods for nonlinear least squares problems, Mathematical Programming 51 (1991), no. 1, 75100. [21] X.-Q. Yang, A. I. Mees, M. Fisher, e L. Jennings (Eds.), Progress in optimization, Kluwer Academic Publishers, 2000.

Você também pode gostar