Introdução As EDP Estocásticas

XIII Congresso Anual da Sociedade Portuguesa de Estat stica Ericeira, 28 de Setembro a 1 de Outubro de 2005
o a ` s Equa es Introdu ca co Diferenciais sticas e Estoca es Aplica co

Carlos A. Braumann
Agosto 2005
Edi c oes SPE
ii
FICHA TECNICA:
T tulo: Uma Introdu c ao ` as Equa c oes Diferenciais Estoc asticas e Aplica c oes Autor: Carlos A. Braumann Editora: Sociedade Portuguesa de Estat stica Produ c ao gr aca e Impress ao: Instituto Nacional de Estat stica Tiragem: 400 exemplares ISBN: 972-8890-06-0 Dep osito legal: no 229951/05
iii
` Manuela A ` mem A oria dos meus Pais
iv
Agradecimentos
Agradecemos ` as seguintes entidades pelo valioso apoio concedido ` a realiza c ao do XIII Congresso Anual da Sociedade Portuguesa de Estat stica: Associa c ao Nacional de Farm acias Banco Portugu es de Investimento British Council C amara Municipal de Mafra Centro de Estat stica e Aplica c oes da Universidade de Lisboa Departamento de Estat stica e Investiga c ao Operacional (FCUL) ELIS - Europe Linge Service Faculdade de Ci encias da Universidade de Lisboa Funda c ao Calouste Gulbenkian Funda c ao para a Ci encia e a Tecnologia Hotel VilaGal e Ericeira Instituto Nacional de Estat stica Junta de Freguesia da Ericeira Livraria Escolar Editora PSE - Produtos e Servi cos de Estat stica, Lda. SAS Portugal, SASINST Software, Lda. SPRUCE - Statistics in Public Resources, Utilities and Care of the Environment Tapada Nacional de Mafra Timberlake Consultores
vi
Pref acio
O presente texto foi preparado para servir de base ao minicurso integrado no XIII Congresso Anual da Sociedade Portuguesa de Estat stica. no entanto, substancialmente mais extenso que o minicurso, visando E, proporcionar aos seus frequentadores a possibilidade de posteriormente suplementarem esse curso com desenvolvimentos que nele n ao cabiam. Pode tamb em ser usado como manual de um primeiro curso regular sobre equa c oes diferenciais estoc asticas. Como o t tulo indica, trata-se de apresentar de forma sucinta as equa c oes diferenciais estoc asticas, ilustrando os conceitos com algumas aplica c oes relevantes. bem sabido que as equa E c oes diferenciais estoc asticas t em aplica c oes em praticamente todos os ramos da Ci encia e da Tecnologia para o estudo de fen omenos din amicos descritos por equa c oes diferenciais que sejam perturbados por utua c oes aleat orias. Demos mais enfase ` as aplica c oes biol ogicas e nanceiras, as primeiras por terem sido objecto de v arios trabalhos de investiga c ao do autor e as segundas pela sua crescente import ancia e por serem um poderoso motor para o desenvolvimento da pr opria teoria. Foi nosso objectivo apresentar um curso em l ngua portuguesa que permitisse divulgar mais facilmente uma area de grande import ancia te orica e aplicada ainda pouco estudada no nosso Pa s. Procur amos, sem quebra de rigor, ligar a teoria ` as aplica c oes precisamente porque se trata de uma poderosa ferramenta de modela c ao matem atica que importava n ao s o compreender como ver em ac c ao. H a sempre duas op c oes para um texto desta natureza. Uma e de partir de uma descri c ao com a m axima generalidade, particularizada volta e meia para efeitos de exemplica c ao. Outra, que adoptamos e que nos parece mais aconselh avel num tema que tem algumas diculdades intr nsecas, e a de trabalhar no contexto mais simples poss vel, que permita n ao obscurecer o essencial com complica c oes t ecnicas ou de nota c ao. Assim, o nosso tratamento estudar a o caso de equa c oes diferenciais estoc asticas em que o processo perturbador e um processo de Wiener. Ali as, tratamentos mais gerais em contexto de processos perturbadores tipo martingala cont nua podem reduzir-se ao tratamento aqui feito, pelo que, nesse contexto, o presente tratamento n ao perde generalidade. Tamb em trabalharemos em dimens ao um para evitar a complica c ao de nota c oes matriciais, embora indiquemos como proceder a generaliza ` c ao ao caso multidimensional (sistemas de equa c oes diferenciais estoc asticas) uma vez apreendidas as principais ideias no contexto vii
viii unidimensional. Tratando-se de uma introdu c ao com espa co limitado, haver a muitos t opicos que n ao poder ao ser tratados e outros que s o ser ao aorados. Um caso t pico, apesar da sua primordial import ancia nas aplica c oes, e o do tratamento estat stico das observa c oes (estima c ao param etrica e n ao-param etrica, escolha de modelos, testes de hip oteses, previs ao). A diculdade do tema em contextos n ao triviais n ao nos deixa outra alternativa, j a que este estudo s o poderia ser posterior ao da apreens ao da teoria b asica das equa c oes diferenciais estoc asticas. Como sempre, a estat stica inferencial pressup oe a teoria probabil stica. Daremos mais enfase ` a compreens ao, que queremos rigorosa, dos conceitos e resultados e ` a sua aplica c ao do que propriamente ` a sua dedu c ao. N ao deixaremos, por em, de apresentar as principais demonstrac oes, ainda que, nos casos mais complexos ou que exijam mais tempo e espa co, apenas em esbo co e remetendo os desenvolvimentos para literatura mais especializada. Procuramos assim minimizar os conhecimentos pr evios exigidos ao leitor, sem sacricar o rigor matem atico. Os pressupostos s ao apenas os de uma boa forma c ao b asica em probabilidades e, de prefer encia, tamb em em estat stica, ao n vel do que e comum em qualquer bom curso superior de v arias areas cient cas que usam a Matem atica como instrumento privilegiado de trabalho. O leitor que tenha alguns conhecimentos b asicos de processos estoc asticos e de teoria da medida e integra c ao estar a muito mais ` a vontade, mas procuraremos suprir alguma falha de forma c ao nestas areas do leitor proveniente das areas de aplica c ao apresentando no texto os conceitos essenciais que sejam necess arios a uma compreens ao rigorosa do tema aqui em estudo; o Cap tulo 2 cont em os conceitos principais (outros ser ao apresentados a medida que sejam necess ` arios) e pode ser dispensado pelo leitor mais preparado ou numa primeira leitura. Em certos casos, as demonstra c oes de alguns resultados exigem conhecimentos mais avan cados, mas o leitor com menor forma c ao de base pode simplesmente saltar por cima delas. O texto cont em alguns (poucos por limita c oes de espa co e tempo) exerc cios, incluindo algumas demonstra c oes relativamente simples que deixamos ao cuidado do leitor. Ou ltimo Cap tulo faz um resumo do que e mais importante com o objectivo de permitir ao leitor um vis ao informal de s ntese nal em que se procura dar mais relevo ` a intui c ao do que ao rigor matem atico. Mas pode tamb em ser lido em primeiro lugar pelo leitor mais apressado que queira ter apenas uma primeira ideia intuitiva da mat eria. Dada a forte limita c ao temporal em que decorreu a elabora c ao deste livro, n ao foi poss vel o trabalho de revis ao cuidada e de aperfei coamento t ecnico e did actico que seria desej avel, facto de que pedimos desculpa ao leitor.
ix Este trabalho decorreu no CIMA-UE (Centro de Investiga c ao em Matem atica e Aplica c oes da Universidade de Evora), centro nanciado pela FCT (Funda c ao para a Ci encia e a Tecnologia) no ambito do fundo FEDER. Aqui se regista o agradecimento ` a entidade nanciadora. Resta-nos nalmente agradecer reconhecidos o convite da Comiss ao Organizadora do Congresso, que assim nos proporciona a oportunidade de uma maior divulga c ao desta relevante a rea do conhecimento. Esperemos que o leitor possa tamb em beneciar. Universidade de Evora, Agosto de 2005 Carlos A. Braumann
xi
Indice
Pref acio 1 Introdu c ao 2 Revis ao de probabilidades e processos estoc asticos 2.1 Breve revis ao de conceitos probabil sticos . . . . . . . 2.2 Esperan cas matem aticas e probabilidades condicionais 2.3 Breve revis ao de processos estoc asticos . . . . . . . . . 2.4 Breve revis ao de processos estacion arios . . . . . . . . 2.5 Filtra c oes, martingalas e tempos de Markov . . . . . . 2.6 Processos de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii 1 7 7 12 13 18 18 21
3 Uma introdu c ao informal ` as equa c oes diferenciais estoc asticas 25 4 O processo de Wiener 4.1 Deni c ao . . . . . . . . . . . . . . . . . 4.2 Principais propriedades . . . . . . . . . 4.3 Algumas propriedades anal ticas . . . . 4.4 Tempos de primeira passagem . . . . . . 4.5 Processos de Wiener multidimensionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 31 32 35 37 39
5 Processos de difus ao 41 5.1 Deni c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.2 Equa c oes de Kolmogorov . . . . . . . . . . . . . . . . . . 43 5.3 Caso multidimensional . . . . . . . . . . . . . . . . . . . . 48 6 Integrais estoc asticos 6.1 Deni c ao informal dos integrais de It o e Stratonovich . . 6.2 Constru c ao do integral de It o . . . . . . . . . . . . . . . . 6.3 Exist encia de sucess oes aproximadoras de fun c oes em escada 51 51 55 63
xii 6.4 6.5 6.6 6.7 6.8 Estudo do integral como fun c ao do tegra c ao . . . . . . . . . . . . . . . Extens oes do integral de It o . . . . Teorema e f ormula de It o . . . . . Os c alculos de It o e Stratonovich . O caso multidimensional . . . . . . limite superior de in. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65 68 72 76 79
7 Equa c oes diferenciais estoc asticas 83 7.1 Teorema de exist encia e unicidade e principais propriedades da solu c ao de uma equa c ao diferencial estoc astica . . . . . 83 7.2 Esbo co da demonstra c ao do teorema de exist encia e unicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 7.3 Observa c oes e extens oes ao teorema de exist encia e unicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 8 Estudo do modelo de Black-Scholes 99 8.1 Estudo pelo c alculo de It o . . . . . . . . . . . . . . . . . . 99 8.2 Estudo pelo c alculo de Stratonovich . . . . . . . . . . . . 105 9 A quest ao dos c alculos de It o e de Stratonovich 107 9.1 Controv ersia . . . . . . . . . . . . . . . . . . . . . . . . . 107 9.2 Resolu c ao da controv ersia . . . . . . . . . . . . . . . . . . 108 10 Estudo de alguns funcionais 111 10.1 F ormula de Dynkin . . . . . . . . . . . . . . . . . . . . . . 111 10.2 F ormula de Feynman-Kac . . . . . . . . . . . . . . . . . . 114 11 Introdu c ao ao estudo das difus oes de It o unidimensionais117 11.1 O processo de Ornstein-Uhlenbeck . . . . . . . . . . . . . 117 11.2 Tempo de sa da de um intervalo . . . . . . . . . . . . . . . 120 11.3 Comportamento nas fronteiras de difus oes de It o e densidades estacion arias . . . . . . . . . . . . . . . . . . . . . . 126 11.4 Um exemplo de aplica c ao em crescimento populacional . . 130 12 Teorema de Girsanov 137 12.1 Introdu c ao atrav es de um exemplo . . . . . . . . . . . . . 137 12.2 Teorema de Girsanov . . . . . . . . . . . . . . . . . . . . . 143 13 Op c oes e f ormula de Black-Scholes 149 13.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . 149 13.2 F ormula de Black-Scholes e estrat egia hedging . . . . . . 153 13.3 Um exemplo num erico . . . . . . . . . . . . . . . . . . . . 158 13.4 Obten c ao da f ormula de Black-Scholes via teorema de Girsanov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
xiii 13.5 O modelo binomial . . . . . . . . . . . . . . . . . . . . . . 164 13.6 Op c oes europeias de venda . . . . . . . . . . . . . . . . . 167 13.7 Outros modelos e op c oes . . . . . . . . . . . . . . . . . . . 168 14 S ntese Refer encias Indice Remissivo 173 181 185
xiv
Cap tulo 1
Introdu c ao
As equa co es diferenciais estoc asticas (EDE) s ao basicamente equa c oes diferenciais com um termo estoc astico adicional. O termo determin stico, que e comum ` as equa c oes diferenciais ordin arias, descreve o comportamento din amico m edio do fen omeno em estudo e o termo estoc astico descreve o ru do, ou seja as perturba c oes aleat orias que inuenciam esse fen omeno. Como muitos fen omenos naturais podem ser descritos por equa c oes diferenciais, as EDE t em importantes aplica c oes em praticamente todos os ramos da Ci encia e da Tecnologia para descrever esses fen omenos sempre que haja perturba c oes aleat orias relevantes que os afectem. A primeira EDE surgiu na literatura, tanto quanto sei, em 1930. Trata-se do modelo de Ornstein-Uhlenbeck ([58]) para o movimento browniano, que e o movimento irregular de uma part cula suspensa num u do; a designa c ao prov em de ter sido o bot anico Brown, no s eculo XIX, que observou esse fen omeno ao microsc opio. S o, por em, em meados do s eculo XX, e que uma teoria matem atica rigorosa foi desenvolvida por It o (ver [36]). As aplica c oes percorrem areas como a F sica, a Astronomia, a Electr onica, as Telecomunica c oes, a Qu mica, a Sismologia, a Astron autica, a Oceanograa, a F sica da Atmosfera, a Biologia, a Economia, as Finan cas, etc. Permitem estudar fen omenos como, por exemplo, a dispers ao de um poluente na agua ou no ar, o efeito dos ru dos na transmiss ao de sinais em telecomunica c oes, a traject oria de um sat elite articial, a localiza c ao de um navio, o ru do t ermico num circuito el ectrico, a din amica de uma reac c ao qu mica, a din amica de uma ou v arias popula c oes de seres vivos quando o ambiente sofre perturba c oes aleat orias que afectam as suas taxas de crescimento, a determina c ao da pol tica optima de pescas de uma popula c ao de peixes em ambiente com perturba c oes 1
Cap tulo 1 - Introdu c ao
aleat orias, a varia c ao das taxas de juro, a utua c ao das taxas de c ambio, a varia c ao da cota c ao de uma ac c ao na bolsa, o valor de uma op c ao de compra ou de venda, a imuniza c ao de riscos de carteiras de investimento ou de planos de poupan ca reforma, etc. Os fen omenos biol ogicos (e particularmente a din amica de popula c oes de seres vivos) e nanceiros t em frequentemente tend encias vincadas mas tamb em componentes imprevis veis devidas ` a complexidade e variabilidade das condi c oes do ambiente ou do mercado. S ao, por isso, particularmente prop cios ao uso de modelos baseados em EDE para o seu estudo. Iremos dar, nos exemplos de aplica c ao, maior relevo a estas aplica c oes. No que se refere ao estudo de din amica de popula c oes, por ser uma a rea em que tenho desenvolvido trabalho de investiga c ao. No que se refere ` as aplica c oes nanceiras, por ser uma das areas mais activas de investiga c ao com grande desenvolvimento nos u ltimos 35 anos (vejam-se os trabalhos pioneiros [6], [49], [50]) e em que as necessidades provocadas pelas aplica c oes mais t em contribu do para o desenvolvimento da pr opria teoria numa das mais fecundas interac c oes entre teoria e aplica c ao. Merton e Scholes receberam o Pr emio Nobel da Economia em 1997 pelo seu trabalho em matem atica nanceira, particularmente no que se refere ` a valoriza c ao das op c oes, que se baseou no c alculo estoc astico que aqui vamos apresentar de forma introdut oria. Dado o car acter introdut orio desta apresenta c ao, introduziremos as EDE no contexto mais simples poss vel, evitando obscurecer as ideias principais com quest oes t ecnicas ou nota c ao pesada e encaminhando o leitor para literatura mais especializada quando apropriado. Assim, iremos estudar apenas equa c oes diferenciais estoc asticas quando o ru do perturbador e um ru do branco em tempo cont nuo, cujo integral (o ru do acumulado) e o bem conhecido processo de Wiener. O processo de Wiener, rigorosamente estudado por Wiener e L evy a partir de 1920, e tamb em conhecido nalguma literatura por movimento browniano pelo facto de ter sido usado por Einstein em 1905 como primeiro modelo do movimento browniano de uma part cula. N os pessoalmente n ao gostamos de usar esta designa ca o, j a que o movimento browniano de uma part cula pode ser descrito por outros modelos mais realistas, como o modelo de Ornstein-Uhlenbeck acima referido. A inven c ao do processo de Wiener e frequentemente atribu da a Einstein por se pensar que ter a sido o primeiro a t e-lo utilizado (ainda que sem estar ent ao baptizado como processo de Wiener). No entanto, Bachelier em 1900 (ver [4]) j a o tinha usado como modelo (n ao muito adequado) para as cota c oes de ac c oes na Bolsa de Paris. O uso de ru do branco em tempo cont nuo pode ser justicado como uma aproxima c ao adequada de ru dos perturbadores mais complexos. Teremos como principal preocupa c ao o estudo das equa c oes dife-
Introdu c ao ` as EDE e aplica c oes
renciais estoc asticas unidimensionais, mas apresentaremos as indica c oes necess arias para o tratamento do caso multidimensional. Claro que, se queremos estudar simultaneamente v arias vari aveis (como, por exemplo, a cota c ao de v arios activos nanceiros na bolsa ou o tamanho de v arias popula c oes interactuantes), precisamos de equa c oes multidimensionais (isto e, sistemas de equa c oes diferenciais estoc asticas), mas n ao queremos complicar a apresenta c ao inicial dos conceitos com a nota c ao matricial que o caso multidimensional envolve. O Cap tulo 2 apresenta uma revis ao dos principais conceitos e propriedades relativos a processos estoc asticos, particularmente os processos de Markov, aproveitando-se para rever as no c oes de medida e probabilidade essenciais ao seu estudo. N ao ser ao apresentadas demonstra c oes. O Cap tulo 3 apresenta um exemplo de equa c ao diferencial estoc astica que pode ser utilizada para estudar o crescimento de uma popula c ao de seres vivos crescendo num ambiente com recursos abundantes mas sujeito a perturba c oes aleat orias que afectam a taxa de crescimento da popula c ao. O mesmo modelo e conhecido por modelo de Black-Scholes e foi utilizado por estes na modela c ao da cota c ao de uma ac c ao numa bolsa de valores. Este exemplo serve para apresentar ao leitor o processo de Wiener (que alguns leitores j a conhecer ao) e as equa c oes diferenciais estoc asticas de uma forma informal. O Cap tulo 4 faz um estudo dos aspectos mais relevantes do processo de Wiener. No Cap tulo 5 faz-se uma breve revis ao dos processos de difus ao, que s ao de certa forma generaliza c oes do processo de Wiener e que v ao desempenhar um papel fundamental no estudo das equa co es diferenciais estoc asticas. Mostrar-se- a mais tarde que, sob certas condi c oes de regularidade, h a uma equival encia entre processos de difus ao e solu c oes de equa c oes diferenciais estoc asticas. Dada uma condi c ao inicial e uma equa c ao diferencial estoc atica, temos um problema de Cauchy que e equivalente a uma equa c ao integral estoc astica. De certa forma, quer em ambiente determin stico, quer em ambiente estoc astico, um problema de Cauchy n ao e mais que uma equa c ao integral disfar cada, pois e esta que normalmente e o fulcro do tratamento te orico. No mundo estoc astico, e a vers ao integral da EDE que faz verdadeiramente sentido j a que as derivadas aqui, como veremos, n ao existem no sentido corrente, mas apenas como processos estoc asticos generalizados. Assim, para que estas equa c oes integrais estoc asticas ganhem sentido, e preciso denir e estudar os integrais estoc asticos. Esse e o objecto do Cap tulo 6. Infelizmente a cl assica deni c ao de integral de Riemann-Stieltjes, agora naturalmente ao longo das traject orias, e inaplic avel porque o processo integrador (o processo de Wiener) e quase certamente de varia c ao ilimitada. Diferentes escolhas de pontos interm edios nas somas de Riemann-Stieltjes conduzem a resultados diferentes.
Cap tulo 1 - Introdu c ao
H a, pois, v arias deni c oes poss veis de integrais estoc asticos. A deni c ao de It o e a que tem melhores propriedades probabil sticas e e por isso a mais habitualmente adoptada, como ali as faremos aqui. N ao satisfaz, por em, as regras usuais de c alculo diferencial e integral, pelo que apresentaremos o teorema de It o, que nos d a a regra chave desse novo c alculo estoc astico. Mas n ao deixaremos de falar de deni c oes alternativas de integral, particularmente do integral de Stratonovich, que, n ao tendo as boas propriedades probabil sticas do integral de It o, satisfaz, por em, as regras usuais de c alculo. Discutiremos a utiliza c ao de um e outro c alculo e apresentaremos uma f ormula de convers ao entre eles, que nos ser a muito u til. A generaliza c ao do integral a v arias dimens oes e tamb em apresentada. No Cap tulo 7 trataremos ent ao do problema de Cauchy para equa c oes diferenciais estoc asticas, que e equivalente ` a correspondente equa c ao integral estoc astica. Usaremos o c alculo de It o. Apresentaremos o teorema mais comum sobre a exist encia e unicidade de solu c ao, bem como sobre as principais propriedades desta, particularmente a de, sob certas condi c oes de regularidade, ser um processo de difus ao. Apresentaremos outros resultados de exist encia e unicidade exigindo hip oteses mais fracas. A generaliza c ao ao caso multidimensional (sistemas de EDE) ser a ent ao apresentada. No Cap tulo 8 examinaremos o caso particular do modelo de BlackScholes, obtendo a solu c ao expl cita e estudando as suas propriedades. Como as solu c oes pelos c alculos de It o e Stratonovich s ao distintas (mesmo em aspectos qualitativos), discutiremos a controv ersia que tem existido na literatura sobre qual o c alculo, de It o ou de Stratonovich, mais apropriado nas aplica c oes. Este exemplo serve tamb em de pretexto, no Cap tulo 9, para vericar que anal a controv ersia sobre qual o c alculo mais adequado a utilizar n ao tem sentido e se deve a uma confus ao sem antica. Referem-se ainda resultados do autor que generalizam esta constata c ao a uma classe bastante geral de EDE. As equa c oes diferenciais estoc asticas aut onomas, em que os coecientes dos termos determin stico e estoc astico s ao fun c oes do estado do processo mas n ao do tempo, s ao particularmente importantes nas aplica c oes e, sob certas condi c oes de regularidade, s ao processos de difus ao homog eneos, tamb em conhecidos por difus oes de It o. No Cap tulo 10 falaremos das f ormulas de Dynkin e de FeynmanKac e da rela c ao entre solu c oes de certas equa c oes ` as derivadas parciais e esperan cas matem aticas de certos funcionais de solu c oes de equa c oes diferenciais estoc asticas aut onomas. No Capitulo 11 estudaremos as difus oes de It o unidimensionais (solu c oes de equa c oes diferenciais estoc asticas aut onomas unidimensionais) quanto a aspectos como tempos de primeira passagem, classica c ao
de fronteiras, exist encia de densidades estacion arias. Apresentaremos tamb em alguns exemplos de aplica c ao, come cando com o processo de Ornstein-Uhlenbeck, solu c ao da primeira EDE surgida na literatura, que ser a usado como pretexto para o estudo das difus oes de It o, categoria a que pertencem a maioria dos modelos usados nas aplica c oes. No Cap tulo 12 apresentaremos o problema da mudan ca de medida de probabilidade como forma de alterar a tend encia (termo determin stico) da EDE, atrav es do teorema de Girsanov. No Cap tulo 13 usaremos duas formas alternativas de obter a f ormula de Black-Scholes, que resolve o problema da determina c ao do valor de uma op c ao europeia de compra na hip otese de n ao arbitragem dos mercados. Uma delas recorre ao teorema de Girsanov. Falaremos tamb em de generaliza c oes deste resultado. No Cap tulo 14 apresentamos um resumo do que e mais importante com o objectivo de permitir ao leitor um vis ao informal de s ntese nal em que se procura dar mais relevo ` a intui c ao do que ao rigor matem atico. Mas pode tamb em ser lido em primeiro lugar pelo leitor mais apressado que queira ter apenas uma primeira ideia intuitiva da mat eria.
Cap tulo 2
Revis ao de probabilidades e processos estoc asticos

2.1 Breve revis ao de conceitos probabil sticos
Considere um espa co de probabilidade (, F , P ), onde (, F ) e um espa co mensur avel e P uma probabilidade nele denida. Habitualmente, o universo, conjunto universal ou espa co amostral representa o conjunto (suposto n ao-vazio) de todos os poss veis resultados de uma experi encia ou fen omeno aleat orio. Por exemplo, se lan carmos dois dados, um vermelho e um preto, = {(1, 1), (1, 2), ..., (6, 6)} e um conjunto de 36 elementos, cada um deles representando o poss vel resultado de um lan camento; assim, o elemento (3, 4) representa o resultado tr es pintas no dado vermelho e quatro pintas no dado preto. F e uma a lgebra - 1 , isto e uma classe n ao-vazia de subconjuntos de fechada para a complementa c ao (se A F , ent ao o complemento Ac := A F ) e para uni oes cont aveis 2 (se An F , n = 1, 2, ..., ent ao n An F ). Os conjuntos A F s ao chamados acontecimentos ou conjuntos mensur aveis. A probabilidade P e uma fun c ao de F em [0, 1], normada (P () = 1) e aditiva- (se An F , n = 1, 2, .., e uma colec c ao cont avel de conjuntos disjuntos dois a dois, ent ao P ( n An ) = n P (An )). No exemplo dos dois dados, supostos
1 H a quem prera dizer - algebra, imitando a norma inglesa de o adjectivo preceder o substantivo. 2 Usamos o termo cont avel como sin onimo de nito ou innito numer avel.
Cap tulo 2 - Revis ao
honestos, temos P (A) = N/36, onde N e o n umero de elementos de A; por exemplo, se A = {(4, 6), (5, 5), (6, 4), (5, 6), (6, 5)} (acontecimento soma de 10 or 11 pintas nos dois dados), temos P (A) = 5/36. Se estivermos a estudar, por exemplo, a evolu c ao da cota c ao de uma ac c ao, ela e inuenciado pelo cen ario do mercado que se tiver realizado. Por cen ario do mercado podemos entender uma descri c ao multifactorial que inclui a evolu c ao ao longo do tempo (passado, presente e futuro) de tudo o que possa afectar a cota c ao da ac c ao e que pode incluir as vendas da empresa cotada, as cota c oes de outras ac c oes, o comportamento de vari aveis econ omicas a n vel nacional e internacional, a situa c ao pol tica, os conitos armados, etc., etc. Poder a ent ao tomar-se para o conjunto de todos os poss veis cen arios de mercado. Felizmente, n ao e habitualmente necess ario trabalhar com um espa co t ao complexo pois o que de facto interessa e o comportamento da cota c ao da ac c ao resultante dos poss veis cen arios do mercado, e esse comportamente vive num espa co assim mais simples e manej avel (e tamb em mais f acil de probabilizar). E leg tima a vis ao simplicada de adoptar esse espa co mais simples como o espa co dos cen arios do mercado, uma vez que essa simplica c ao produz exactamente os mesmos resultados. A mesma quest ao se p oe quando, por exemplo, se estuda a evolu c ao do tamanho de uma popula c ao de seres vivos, a qual e inuenciada pelo estado da natureza (o equivalente ao cen ario do mercado), que inclui aspectos como a evolu c ao temporal do clima, do habitat, de outras popula c oes que interajam com a popula c ao em estudo, etc. Tamb em aqui se pode adoptar uma vis ao simplicada. O cen ario do mercado ou o estado da natureza que realmente ocorre e um elemento de escolhido ao acaso de acordo com a lei de probabilidade P . F ea algebra- dos subconjuntos de (acontecimentos) para os quais a probabilidade P est a denida. A probabilidade P faz corresponder a cada acontecimento (conjunto de cen arios de mercado ou de estados da natureza) A F a sua probabilidade P (A), que e a probabilidade de o cen ario do mercado ou estado da natureza que efectivamente ocorre pertencer ao conjunto A. Podemos, supor, sem perda de generalidade, que o espa co de probabilidade (, F , P ) e completo, isto e, dado qualquer conjunto N F tal que P (N ) = 0, todos os subconjuntos Z de N tamb em pertencem a F . Com efeito, se o espa co n ao for completo, podemos sempre complet a-lo alargando F de forma a incluir todos os conjuntos da forma A Z com A F e estendendo a probabilidade P ` a algebra- alargada pondo P (A Z ) = P (A). Recorda-se que uma vari avel aleat oria (v.a.) ou fun ca o mensur avel F (abreviadamente fun ca o mensur avel ) X denida no espa co mensur avel (, F ) e uma fun c ao de em R tal que, seja qual for o conjunto de Borel B B , a sua imagem inversa X 1 (B ) = [X B ] := { : X ( ) B }
pertence a F . Esta propriedade e essencial para mais tarde podermos denir a distribui c ao de probabilidade de X para uma probabilidade P denida em (, F ). Por algebra- de Borel B entende-se a algebra- gerada pelos conjuntos abertos de R, ou seja a menor algebra- que inclui tais conjuntos. Ela e tamb em a algebra- gerada pelos intervalos (ou mesmo pelos intervalos da forma ] , x] com x R). No exemplo dos dois dados, se Z e a v.a. que representa a soma do n umero de pintas dos dois dados, vem, para = (6, 5), Z ( ) = 11 (habitualmente simplicase a nota c ao omitindo a depend encia de e escrevendo simplesmente Z = 11). Tomando como representando o acaso, podemos dizer que uma v.a. e uma fun c ao real do acaso. A cota c ao de fecho de uma ac c ao amanh a, a taxa de c ambio do d olar daqui a 90 dias, a altura de uma pessoa escolhida ao acaso, o tamanho de uma popula c ao daqui a um ano s ao exemplos de vari aveis aleat orias. Dado o espa co de probabilidade (, F , P ) e uma v.a. X (no espa co mensur avel (, F )), a sua fun ca o de distribui ca o (f.d.), que caracteriza completamente a sua distribui c ao de probabilidade, ser a aqui representada por FX . Recorda-se que a fun c ao de distribui c ao de X e denida para x R por FX (x) := P [X (, x]] = P [X x]. 3 Note-se que a classe (X ) formada pelas imagens inversas por X dos conjuntos de Borel e uma sub- algebra- de F , a que se chama a lgebra - gerada por X ; ela cont em toda a informa c ao que e pertinente para a determina c ao do comportamento de X . No exemplo dos dois dados, Z e um exemplo de v.a. discreta. Uma v.a. X e discreta se existir um conjunto cont avel S = {x1 , x2 , ...} tal que P [X S ] = 1; representaremos por pX (k ) = P [X = xk ] (k = 1, 2, ...) a sua fun ca o massa de probabilidade (f.m.p.), vericando-se que FX (x) = p xk x X (k ). Uma v.a. X diz-se absolutamente cont nua (vulgarmente, e n ao muito correctamente, abrevia-se para v.a. cont nua) se existir uma fun c ao n ao-negativa integr avel fX (x), chamada fun ca o densidade de probabilix e absolutamente condade (f.d.p.), tal que FX (x) = fX (y )dy . Se X at t nua, ent ao a sua f.d. FX (x) e uma fun c ao cont nua. E e uma fun c ao diferenci avel em quase toda a parte, isto e, o conjunto excepcional N de n umeros reais onde a fun c ao n ao e diferenci avel e um conjunto negligenci avel. 4 Tem-se fX (x) = dFX (x)/dx (se N = , podemos atribuir
3 Note-se que, se P e uma probabilidade em (, F ), a probabilidade PX (B ) = P [X B ] := P (X 1 (B )) est a bem denida para todos os conjuntos de Borel B e temos um novo espa co de probabilidade (R, B, PX ). No exemplo dos dois dados, PZ ({10, 11}) = P [Z {10, 11}] = P [Z = 10 ou Z = 11] = P (Z 1 ({10, 11})) = P ({(4, 6), (5, 5), (6, 4), (5, 6), (6, 5)}) = 5/36. Note-se que tamb em P [Z (9.5, 11.2)] = P ({(4, 6), (5, 5), (6, 4), (5, 6), (6, 5)}) = 5/36. 4 Por conjunto negligenci avel entende-se um conjunto com medida de Lebesgue
10
arbitrariamente os valores da derivada nos pontos x N de forma a que a f.d.p. que denida, embora n ao univocamente, para todo o x R). Uma v.a. normal ou gaussiana X com m edia e vari ancia 2 > 0 e uma )2 1 ; v.a. absolutamente cont nua com f.d.p. fX (x) = 22 exp (x2 2
tem-se E[X ] = e V AR[X ] := E (X E[X ])2 = 2 . Note-se que h a v.a. que n ao s ao nem discretas nem absolutamente cont nuas. Duas v.a. X e Y no mesmo espa co de probabilidade dizem-se equivalentes ou quase iguais ou iguais com probabilidade um se P [X = Y ] = 1. Como elas s o diferem num conjunto (irrelevante para os nossos ns) de probabilidade nula e t em, portanto, a mesma f.d. e as mesmas propriedades probabil sticas, adoptaremos frequentemente a pr atica habitual e, abusando da linguagem, escreveremos simplesmente X = Y , querendo contudo signicar X = Y com probabilidade 1. Esta forma habitual de identicar v.a. equivalentes e uma maneira informal de dizer que vamos trabalhar com as classes de equival encia de vari aveis aleat orias em vez das pr oprias v.a. e que identicamos uma classe de equival encia por qualquer das suas representantes (por representante entendemos uma v.a. pertencente ` a classe). 5 Se zermos isso, podemos p denir, para p 1, o espa co L (, F , P ), abreviadamente Lp , das vari aveis aleat orias X (na realidade, e o espa co das suas classes de equival encia) tais que E[|X |p ] = |X |p dP < +. Recorda-se que, se |Y ( )|dP < , dizemos que E[Y ] = Y ( )dP + + = ydPY = ydFY (y ) e a esperan ca matem atica, valor esperado, valor m edio ou m edia da v.a. Y . Quando Y e absolutamente cont nua + com f.d.p. fY , resulta E[Y ] = yfY (y )dy . Quando Y e v.a. discreta com a tomos yk (k = 1, 2, ...), resulta E[Y ] = k yk P [Y = yk ]. Estas s ao consequ encias das propriedades do integral (no sentido de Lebesgue). O integral dene-se: Para fun c oes simples Y ( ) = i=1 ci IAi ( ) (onde os conjuntos Ai n s ao disjuntos dois a dois com i=1 Ai = , IAi s ao as suas fun c oes indicatrizes e ci s ao n umeros reais) por Y dP = n i=1 ci P (Ai ). Note-se que a fun ca o indicatriz 6 IA de um conjunto A F e uma
(extens ao da medida de comprimento) nula. 5 Conv em lembrar que as v.a. s ao fun co es do acaso e, portanto, uma propriedade relativa a vari aveis aleat orias pode ser verdadeira para certos valores de e falsa para outros. Quando o conjunto de valores de para os quais a propriedade e verdadeira tem probabilidade um, dizemos que a propriedade se verica com probabilidade um ou quase certamente (q.c.). Portanto, X = Y com probabilidade 1 (ou X = Y q.c.) signica que P [X = Y ] = 1 e n ao exclui que possam existir valores excepcionais de para os quais X ( ) = Y ( ) (claro que o conjunto N de tais valores excepcionais ter a probabilidade zero de ocorrer, isto e, P (N ) = 0). 6 A fun ca o indicatriz (tamb em chamada fun c ao caracter stica ) IA de um conjunto
n
Introdu c ao ` as EDE e aplica c oes fun c ao simples e facilmente se reconhece que E[IA ] = P (A).
11
Para v.a. n ao-negativas Y por Y dP = limn Yn dP , onde Yn e qualquer sucess ao n ao-decrescente de fun c oes simples n aonegativas convergente para Y com probabilidade um. Para v.a. Y arbitr arias por Y dP = Y + dP Y dP , onde + Y ( ) = Y ( )I[Y 0] ( ) e Y ( ) = Y ( )I[Y <0] ( ). Um espa co L p e um espa co de Banach para a norma-Lp denida por X p = (E[|X |p ])1/p . Para p = 2 e mesmo um espa co de Hilbert real com produto interno X, Y = E[XY ]. O conceito de v.a pode ser generalizado a v arias dimens oes. Uma v.a. n-dimensional ou vector aleat orio X = [X1 , X2 , ..., Xn ]T (T signica transposto, isto e, usualmente consideramos vectores coluna) e simplesmente um vector de n vari aveis aleat orias denidas no mesmo espa co mensur avel. Podemos denir a sua fun c ao de distribui c ao FX (x) = FX1 ,X2 ,...,Xn (x1 , x2 , ..., xn ) := P [X1 x1 , X2 x2 , ..., Xn xn ] para x = [x1 , x2 , ..., xn ]T Rn , tamb em chamada f.d. conjunta das v.a. X1 , X2 , ..., Xn . Podemos denir a esperan ca matem atica de um vector aleat orio (ou mesmo de uma matriz aleat oria) como sendo o vector (matriz) das esperan cas matem aticas das suas coordenadas. Se existir um conjunto cont avel S Rn tal que P [X S ] = 1, dizemos que o vector aleat orio X e discreto. Se existir uma f.d.p. fX (x) tal que FX (x) = x1 x2 xn f (y , y , ..., yn )dyn ...dy2 dy1 , ent ao X diz-se ... X1 ,X2 ,...,Xn 1 2
X1 ,X2 ,...,Xn 1 2 n absolutamente cont nuo, caso em que fX (x) = x1 x2 ...xn (denida com poss vel excep c ao de pontos de um conjunto negligenci avel, isto e, cuja medida de Lebesgue n-dimensional e nula). Por exemplo, um vector aleat orio normal ou gaussiano X com vector m edio e matriz de vari ancia-covari ancia C (matriz cujos elementos cij = E [(Xi E[Xi ]) (Xj E[Xj ])] s ao as covari ancias dos pares de vari aveis ou, no caso dos elementos diagonais, as vari ancias) e, supondo C matriz denida positiva, um vector aleat orio absolutamente cont nuo com f.d.p. T 1 fX (x) = (2 )n/2 det(C1 )exp 1 ( x ) C ( x ) . 2 Os conceitos de espa cos e normas Lp podem ser generalizados a vectores aleat orios n-dimensionais X interpretando |X| como a norma euclideana; no caso p = 2, o conceito de produto interno pode ser generalizado usando X, Y = E[XT Y].
nF
(x ,x ,...,x )
A dene-se por IA ( ) = 1 se A e IA ( ) = 0 se / A.
12
2.2
Esperan cas matem aticas e probabilidades condicionais
Esta sec c ao pode ser dispensada pelo leitor menos preocupado com o rigor matem atico desde que tenha uma ideia informal das esperan cas matem aticas e probabilidades condicionais. Dada uma v.a. X L1 e uma sub- algebra- H F , existe uma v.a. Y = E[X |H], chamada a esperan ca matem atica condicional de X dada H, a qual e mensur avel-H e tal que H XdP = H Y dP para todo o H H. Isto e, Y e uma v.a. mensur avel-H que tem as mesmas m edias que X sobre os conjuntos de H. O teorema de Radon-Nikodym assegura a exist encia e a unicidade quase certa (q.c.), isto e, podem existir v arias v.a. satisfazendo as condi c oes referidas mas, dadas duas quaisquer dessas v.a., elas s ao iguais com probabilidade um. No exemplo dos dois dados, o valor esperado de X =soma do n umero 1 = de pintas dos dois dados e um n umero real E[X ] = X ( ) 36 12 xP [ X = x ] = 7. Suponhamos que s o t nhamos informa c a o sox=2 bre se o n umero de pintas no dado vermelho era par ou mpar; esta informa c ao e dada pela sub- algebra- H = {C, C c , , }, onde C = {(2, 1), (2, 2), ..., (2, 6), (4, 1), (4, 2), ..., (4, 6), (6, 1), (6, 2), ..., (6, 6)} e o acontecimento n umero par de pintas no dado vermelho. Ent ao tem-se 1 edio de X ( ) no E[X |H]( ) = P (1 C X ( ) 36 = 145/18 (valor m C) conjunto C ) para qualquer C (n ao conseguimos distinguir entre os 1 diferentes de C ) e E[X |H]( ) = P (1 C c X ( ) 36 = 107/18 (valor Cc) c c m edio de X ( ) no conjunto C ) para qualquer C . Note-se que E[X |H] e uma v.a. (depende de ) e, portanto, podemos calcular a sua esperan ca matem atica. Da deni c ao de esperan ca condicional e obvio que E[E[X |H]] = E[X ]. Citamos mais algumas propriedades importantes das esperan cas matem aticas condicionais, onde se sup oe que as v.a. envolvidas est ao em L1 e que as algebras- G e H est ao contidas em F : X mensur avel-H E[X |H] = X X mensur avel-H E[XY |H] = X E[Y |H] G H E[E[X |H]|G ] = E[E[X |G ]|H] = E[X |G ]. Para A F , podemos denir a probabilidade condicional P (A|H) := E[IA |H]. Este conceito e uma extens ao do conceito cl assico P (A|C ) = P (A C )/P (C ) denido para A F e C F tal que P (C ) > 0. De facto, pondo H = {C, C c , , }, P (A|C ) n ao e mais que o valor comum de E[IA |H]( ) para qualquer dos C . Quando H = (Y ) ea algebra- gerada por uma v.a. Y , denimos
13
E[X |Y ] := E[X |H] e P [X B |Y ] := P (X 1 (B )|H) para conjuntos de Borel B . Estas quantidades s ao v.a., isto e, dependem do acaso ; de facto, elas dependem essencialmente do valor de Y ( ). Portanto, para y R, podemos denir E[X |Y = y ] como o valor (q.c. u nico) de E[X |Y ] quando Y = y . Semelhantemente, pode denir-se P [X B |Y = y ].
2.3
Breve revis ao de processos estoc asticos
Um processo estoc astico no espa co de probabilidade (, F , P ) e simplesmente uma colec c ao indexada {Xt }tI de vari aveis aleat orias. No nosso caso, t ser a interpretado como tempo e o conjunto de ndices I ser a usualmente um intervalo de tempo da forma [0, +), (, +) ou [a, b] (processos estoc asticos em tempo cont nuo). Noutras situa c oes, I pode ser o conjunto dos inteiros ou dos inteiros n ao-negativos (processos estoc asticos em tempo discreto), um intervado de Rd (processos espaciais) ou qualquer conjunto conveniente. Como cada vari avel aleat oria Xt = Xt ( ) e fun c ao do acaso , um processo estoc astico pode ser considerado uma fun c ao de duas vari aveis, t I e , isto e uma fun c ao do tempo e do acaso; como no caso das vari aveis aleat orias, e h abito abreviar a nota c ao e escrever simplesmente Xt em vez de Xt ( ), mas, apesar de o acaso n ao aparecer explicitamente, n ao devemos esquecer que o valor do processo estoc astico depende dele. Esta fun c ao de t e n ao e uma fun c ao arbitr aria pois est a sujeita ` a restri c ao de ser, para cada t xo, uma fun c ao mensur avel de , isto e, uma v.a. Se xarmos o acaso , obtemos uma fun c ao apenas do tempo, a que se chama uma traject oria 7 do processo estoc astico. Um processo estoc astico pode, portanto, ser tamb em interpretado como uma colec c ao de traject orias, uma para cada estado do acaso . A cota c ao Xt (abreviatura de Xt ( )) de uma ac c ao no instante t para t I = [0, +) e um exemplo de processo estoc astico. Naturalmente, diferentes cen arios do mercado resultar ao em cota c oes diferentes. Para um t I xo, Xt e uma v.a. e, portanto, uma fun c ao de que associa a cada cen ario do mercado a correspondente cota c ao Xt ( ) da ac c ao no instante t. Para um cen ario do mercado xo, a traject oria Xt ( ) e uma fun c ao do tempo t que associa a cada instante t I a correspondente cota c ao da ac c ao debaixo desse cen ario. Quando observamos a varia c ao da cota c ao da ac c ao ao longo do tempo e desenhamos o respectivo gr aco, estamos de facto a desenhar uma traject oria, a correspondente ao cen ario do mercado que o acaso ditou que fosse o cen ario efectivamente ocorrido.
7 Em
ingl es usa-se trajectory ou sample path.
14
8,4
8,2
Y(t)=ln (cotao)
7,8
7,6
7,4
7,2 0 1 2 3 4 5 6 7
t (anos)
Figura 2.1: Traject oria observada do processo estoc astico Y (t), cota c ao
em escala logar tmica das ac c oes do banco BCP entre 8 de Abril de 1991 (t = 0) e 30 de Junho de 1997. Corresponde ao (cen ario do mercado) que efectivamente ocorreu.
8,4
8,2
Y(t)=ln (cotao)
7,8
7,6
7,4
7,2 0 1 2 3 4 5 6 7
t (anos)
geom etrico com par ametros R = r 2 /2 = 0, 084/ano e = 0, 193/ ano (ver Cap tulo 8) simuladas pelo m etodo de Monte Carlo. Este processo foi usado como modelo do processo estoc astico Y (t), cota c ao em escala logar tmica das ac c oes do BCP no per odo 8 de Abril de 1991 (t = 0) e 30 de Junho de 1997. Se o modelo for correcto, estas traject orias correspondem a outros dois cen arios do mercado escolhidos aleatoriamente.
Figura 2.2: Duas traject orias do processo estoc astico movimento browniano
15
Por vezes e mais conveniente usar a nota c ao alternativa X (t, ) (abreviadamente X (t)) em vez de Xt ( ) (abreviadamente Xt ). Salvo men c ao em contr ario, n ao faremos distin c ao entre as duas nota c oes. Usualmente chama-se espa co de estados ao contradom nio da fun c ao X (t, ) se bem que, por vezes e por raz oes de comodidade, se chame espa co de estados a um conjunto que contenha esse contradom nio e que seja mais conveniente para trabalhar. As distribui co es de dimens ao nita de um processo estoc astico {Xt }tI s ao as fun c oes de distribui c ao conjuntas Ft1 ,t2 ,...,tn (x1 , x2 , ..., xn ) := P [Xt1 x1 , Xt2 x2 , ..., Xtn xn ]. A fam lia de todas as distribui c oes de dimens ao nita (isto e, denidas para todo o n = 1, 2, ... e todos os t1 , t2 , ...tn I ) determina as propriedades probabil sticas do process estoc astico (mas n ao necessariamente todas as suas propriedades). Esta fam lia obviamente satisfaz, para todo o n = 1, 2, ..., todos os t1 , t2 , ...tn I e todos os x1 , x2 , ..., xn R, as seguintes propriedades: 1. Ft(1) ,t(2) ,...,t(n) (x(1) , x(2) , ..., x(n) ) = Ft1 ,t2 ,...,tn (x1 , x2 , ..., xn ) para todas as permuta c oes em {1, 2, ..., n} (propriedade de simetria, isto e, n ao e importante a ordem das vari aveis aleat orias). 2. Para k = 1, ..., n 1, Ft1 ,t2 ,...,tk ,tk+1 ,...,tn (x1 , x2 , ..., xk , +, ..., +) = Ft1 ,t2 ,...,tk (x1 , x2 , ..., xk ) (propriedade de compatibilidade ). O teorema da extens ao de Kolmogorov diz que, dada uma fam lia de fun c oes de distribui c ao Ft1 ,t2 ,...,tn (de dom nio Rn ), denida para todo o n = 1, 2, ... e todos os t1 , t2 , ..., tn I e satisfazendo as propriedades de simetria e compatibilidade, existe pelo menos um espa co de probabilidade e um processo estoc astico nesse espa co para o qual a fam lia das distribui c oes nitas e a fam lia dada. 8 De facto, seria poss vel construir v arios espa cos de probabilidade e processos estoc asticos neles denidos satisfazendo a propriedade desejada.
8 A demonstra ca o e construtiva. O espa co amostral usado foi o conjunto RI das fun co es reais = () denidas em I . Consideremos nesse espa co a classe dos conjuntos cil ndricos da forma A = { RI : (t1 , t2 , ..., tn ) B } (n = 1, 2, ...) cujas bases B sejam intervalos de Rn (produtos cartesianos de n intervalos reais). A a lgebra- BI gerada por esta classe e conhecida por a lgebra- de Borel em RI . Uma I I probabilidade no espa co mensur avel (R , B ) ca univocamente caracterizada se conhecermos as probabilidades dos conjuntos cil ndricos acima referidos. Kolmogorov utilizou a probabilidade denida por P (B ) = B dFt1 ,t2 ,...,tn . Nesse espa co de probabilidade (RI , BI , P ) considerou ent ao o processo estoc astico Xt ( ) = (t) e mostrou (como n ao e dif cl de vericar) que a sua fam lia de distribui co es nita e a fam lia dada. Repare-se que o que se fez foi utilizar as traject orias do processo estoc astico como sendo os acontecimentos elementares .
16
Dois processos estoc asticos {Xt }tI e {Yt }tI no mesmo espa co de probabilidade dizem-se equivalentes (tamb em se diz que cada um deles e uma vers ao do outro) se, para cada t I , se tiver Xt = Yt com probabilidade 1. Processos equivalentes t em as mesmas fun c oes de distribui c ao nitas e, portanto, as mesmas propriedades probabil sticas, mas podem ter diferentes propriedades anal ticas, como veremos a seguir. No que se segue desta sec c ao, iremos supor que I e um intervalo da forma [a, b] ou (, b] ou [a, +) ou (, +). Pode suceder que, dados dois processos estoc asticos equivalentes, uma vers ao tenha todas as traject orias cont nuas e a outra tenha todas as traject orias o que acontece se, para = [0, 1], I = [0, 1], F = descont nuas. E B[0,1] (onde B[0,1] ea algebra- de Borel do intervalo [0, 1], que e gerada pelos conjuntos abertos de [0, 1]) e P a distribui ca o uniforme em [0, 1] (a probabilidade de cada intervalo e o seu comprimento), considerarmos os processos estoc asticos Xt ( ) = 0 1 se = t se = t,
(cujas traject orias s ao obviamente todas descont nuas) e Yt ( ) 0 (cujas traject orias s ao obviamente todas cont nuas). N ao e dif cil constatar que os dois processos s ao equivalentes pois, para qualquer t [0, 1], se tem P [Xt = Yt ] = P ({ : Xt ( ) = Yt ( )}) = P ([0, 1] {t}) = P ([0, t[+]t, 1]) = t + (1 t) = 1. A raz ao porque n ao s ao ambos processos cont nuos reside no facto de os conjuntos excepcionais Nt dos valores de para os quais Xt ( ) = Yt ( ) (conjuntos que t em probabilidade zero) poderem variar com t. Com efeito, o conjunto N = orias dos dois procestI Nt dos valores de para os quais as traject sos diferem (em pelo menos um instante), sendo uni ao n ao-numer avel de conjuntos com probabilidade zero, poder a j a n ao ter probabilidade zero (a propriedade aditiva- das probabilidades s o garante probabilidade zero para uni oes numer aveis de conjuntos com probabilidade zero); se isso suceder, embora se tenha P [Xt = Yt ] = 1 para cada t, vem P [Xt = Yt para todos os t I ] < 1. Um conceito mais forte que o de processos equivalentes e o de processos com traject orias id enticas (com probabilidade um), ou seja P [Xt = Yt para todo o t I ] = 1, caso em que P (N ) = 0. Quando os dois processos s ao ambos cont nuos, os dois conceitos coincidem. Por processo cont nuo entende-se um processo cujas traject orias s ao cont nuas com probabilidade um (dito de outra forma, o conjunto das traject orias descont nuas tem probabilidade zero). Para evitar o problema surgido no exemplo acima, h a vantagem em trabalhar apenas com processos separ aveis, o que n ao se traduz em qualquer perda de generalidade do ponto de vista probabil stico visto todo o processo
17
estoc astico admitir uma vers ao separ avel. Basicamente, um processo separ avel e um processo que ca, para efeitos de continuidade, caracterizado pelos seus valores num conjunto numer avel denso em I 9 , o que elimina o problema acima referido, j a que podemos trabalhar com uni oes numer aveis de conjuntos excepcionais. Assim, se um de dois processos separ aveis equivalentes e cont nuo, o outro tamb em o ser a. O crit erio de Kolmogorov diz que, se existem constantes positivas C , e tais que E[|Xt Xs | ] C |t s|1+ para todo o s, t I , ent ao existe uma vers ao separ avel de Xt que e cont nua. Isso n ao signica que o pr oprio processo Xt seja cont nuo, como mostra o exemplo acima em que o processo Xt satisfaz o crit erio de Kolmogorov e n ao e cont nuo. Tem, por em, uma vers ao separ avel cont nua Yt . Daqui por diante, convencionamos que trabalharemos sempre com vers oes separ aveis dos processos estoc asticos. Com esta conven c ao, um processo que satisfa ca o crit erio de Kolmogorov e cont nuo. Um processo cont nuo e tamb em um processo mensur avel. Para um processo X (t, ) ser mensur avel n ao basta que seja mensur avel com respeito a cada uma das vari aveis t e , e preciso que, como fun c ao conjunta das duas vari aveis, seja mensur avel. Isto e, considerando o espa co mensur avel produto 10 (I , BI F ), a imagem inversa (conjunta) {(t, ) I : X (t, ) B } de qualquer conjunto de Borel B B pertence ` a algebra- BI F . Podemos indiferentemente denir um processo estoc astico n-dimensional {Xt }tI como uma colec c ao indexada de vectores aleat orios ndimensionais ou como um vector n-dimensional cujos elementos s ao processos estoc asticos com o mesmo conjunto de ndices denidos no mesmo espa co de probabilidade.
9 Mais precisamente, diz-se que um processo {X } e separ avel se existir um t t I conjunto numer avel J denso em I tal que, para todo o subintervalo aberto (a, b) I e todo o subconjunto fechado A R, se verique que a diferen ca entre os conjuntos
{ : Xt ( ) A para todo o t (a, b) J } (que pertence a F ) e est a contida num conjunto de probabilidade nula. Se convencionarmos trabalhar num espa co de probabilidade completo e o processo for separ avel, ent ao ambos os conjuntos s ao mensur aveis (pertencem a F ) e a sua diferen ca e mensur avel e tem mesmo probabilidade nula. No exemplo acima, Xt n ao e separ avel mas Yt e uma vers ao separ avel de X (t). 10 B F e a a lgebra- gerada pelos conjuntos da forma G A com G BI (a I a lgebra- de Borel no intervalo I ) e A F . { : Xt ( ) A para todo o t (a, b)} (que pode n ao pertencer a F )
18
2.4
Breve revis ao de processos estacion arios
Um processo estoc astico diz-se estritamente estacion ario se as suas distribui c oes de dimens ao nita forem invariantes para transla c oes no tempo, isto e, Ft1 ,t2 ,...,tn (x1 , x2 , ..., xn ) = Ft1 +,t2 +,...,tn+ (x1 , x2 , ..., xn ) para qualquer n = 1, 2, ..., quaisquer x1 , x2 , ..., xn R, quaisquer t1 , t2 , ..., tn I e qualquer R tal que t1 + , t2 + , ..., tn + I . Caso Xt L2 para todo o t I e seja estritamente estacion ario, ent ao vem E[Xt ] = m = constante e COV [Xs , Xt ] = C (t s) (C e chamada fun ca o de auto-covari ancia ), o que constitui a deni c ao de processo estacion ario em sentido lato, tamb em chamado estacion ario de segunda ordem ou simplesmente estacion ario. Contudo, um processo estoc astico estacion ario em sentido lato pode n ao ser estritamente estacion ario. Nos processos gaussianos, ou seja os processos com distribui c oes de dimens ao nita gaussianas, pelo facto de estas serem completamente caracterizadas pelos momentos de primeira e segunda ordem, verica-se a coincid encia dos dois conceitos de estacionaridade. Um processo estacion ario em sentido lato que seja cont nuo em m edia quadr atica (isto e, cont nuo com respeito ` a norma L2 ) tem fun ca o de distribui ca o espectral F () (a qual indica como est ao distribu das as frequ encias das oscila c oes harm onicas de Xt ) e a fun c ao de auto-covari ancia + e dada por C (t) = exp(it)dF (). Se F tiver uma densidade f , a densidade espectral, e C for integr avel, ent ao a densidade e a transfor+ mada de Fourier da auto-covari ancia, f () = 21 exp ( it)C (t)dt.
2.5
Filtra c oes, martingalas e tempos de Markov
Consideremos um intervalo de tempo I = [0, d] com 0 d + (quando d = +, interpretamos I = [0, +)). A suposi c ao de que o intervalo come ca em 0 foi feita apenas por comodidade mas n ao e obrigat oria. Considere um espa co de probabilidade (, F , P ) e um processo estoc astico {Xt }tI nesse espa co. Seja {Ft }tI uma fam lia de sub- algebras- de F tais que Fs Ft quando s t; uma tal fam lia frequente escolher a ltra chama-se uma ltra ca o. E ca o natural Ft = (Xs ; 0 s t), constitu da pelas algebras- geradas pelo processo at e ao instante t (contendo a informa c ao do passado e do presente do processo Xt ). Por vezes, por em, podem ser necess arias outras escolhas caso necessitemos que a ltra c ao contenha informa c ao adicional, como, por exemplo, a informa c ao contida na condi c ao inicial de uma equa c ao diferencial estoc astica.
19
No caso da ltra c ao natural, em vez de E[Xt |Fs ] pode tamb em escreverse E[Xt |Xu , 0 u s]. Quando for claro qual e a ltra c ao com que se trabalha, e costume abreviar e falar de martingala em vez de martingalaFt . Tamb em e costume dizer simplesmente martingala quando n ao se indica qualquer ltra c ao, caso em que se subentende que se trabalha com a ltra c ao natural. O conceito de martingala est a ligado ao conceito de jogo equilibrado. De facto, se Xs s ao os seus ganhos acumulados no instante presente s e se o jogo e equilibrado, ent ao, dada a informa c ao dispon vel at e ao instante presente s, espera manter num instante futuro t os seus ganhos presentes. Se substituirmos = por (respectivamente por ) em (2.1), temos uma supermartingala (respectivamente uma submartingala ). Aqui s o nos interessam processos em tempo cont nuo. Por em, todos estes conceitos (ltra c ao, ltra c ao natural, martingala, supermartingala e submartingala) para processos em tempo discreto t em deni c oes em tudo an alogas, com excep c ao do facto de o conjunto de ndices ser da forma I = {0, 1, 2, ..., d} com 0 d + (quando d = +, interpretamos I = N). Se Xt e uma martingala [supermartingala, submartingala], ent ao E[Xt ] e uma fun c ao constante [n ao-crescente, n ao-decrescente] de t. Se Xt Lp para p 1 e uma martingala, ent ao, para intervalos nitos [a, b] I e para c > 0, resultam as desigualdades maximais das martingalas : |Xb |p P sup |Xt | c (2.2) cp t[a,b]
11 Isso garante que as imagens inversas de conjuntos de Borel pelas v.a. X est ao t em Ft e n ao apenas em F .
Dizemos que o processo estoc astico {Xt }tI est a adaptado a ` ltra ca o {Ft }tI se, para cada t I , Xt for mensur avel-Ft. 11 Claro que um processo estoc astico {Xt }tI est a sempre adaptado ` a sua ltra c ao natural ou qualquer outra ltra c ao cujas algebras- contenham, para cada t I , as correspondentes algebras- (Xs ; 0 s t) da ltra c ao natural. Dado um espa co de probabilidade (, F , P ), um processo estoc astico {Xt }tI e uma ltra c ao {Ft }tI nesse espa co, dizemos que o processo estoc astico e uma martingala -Ft se o processo estiver adaptado ` a ltra c ao, se Xt for integr avel (E[|Xt |] < +, ou seja Xt L1 ) para todo o t I e se E[Xt |Fs ] = Xs q.c. para qualquer s t. (2.1)
20 e, se p > 1, E
t[a,b] p
sup |Xt |p
p p1
E [|Xb |p ] .
(2.3)
Vamos agora denir o conceito de tempo de Markov ou tempo de paragem em contexto de tempo cont nuo (trabalhando com o conjunto de ndices I = [0, +)), fazendo no entanto notar que igual conceito se pode denir de forma an aloga no contexto de tempo discreto (usando o conjunto de ndices I = N0 = {0, 1, 2, ...}). Consideremos um espa co de probabilidade (, F , P ), seja I = [0, +) e consideremos uma ltra c ao {Ft }tI denida naquele espa co. Seja T uma v.a. estendida (tamb em := R + {+} cujas dita impr opria), isto e uma aplica c ao de em R imagens inversas de borelianos de R sejam conjuntos de F . Os referidos gerada pelos intervalos de R borelianos formam a algebra- de Borel B (que s ao os intervalos de R mas permitindo agora intervalos fechados em +). Suporemos que T toma valores em [0, +], isto e, o seu contradom nio est a contido nesse intervalo. Dizemos que T e um tempo de Markov -Ft ou tempo de paragem -Ft se, dado qualquer instante t xo, o acontecimento [T t] = { : T ( ) t} Ft . Frequentemente, usase como ltra c ao a ltra c ao natural de um processo estoc astico {Xt }tI denido no espa co de probabilidade referido. Nesse caso, a deni c ao de tempo de Markov T garante que, para determinar a sua fun c ao de distribui c ao FT (t) = P [T t] no instante t, s o precisamos da informa c ao contida no processo estoc astico at e esse instante (isto e, n ao precisamos de adivinhar informa c ao futura). Por vezes h a necessidade de incorporar informa c ao adicional n ao contida no processo estoc astico, caso em que se usam ltra c oes n ao-naturais mas em rela ca o ` as quais o processo esteja adaptado. Note-se que FT pode ser uma fun ca o de distribui ca o impr opria, isto e, pode suceder que FT (+) := limt+ FT (t) < 1. Isso sucede se e s o se P [T = +] > 0 e vem FT (+) + P [T = +] = 1. Quando for claro qual a ltra c ao com que se trabalha, e costume abreviar e falar simplesmente em tempo de Markov sem indicar qual a tamb ltra c ao. E em o que se faz quando se trabalha com um processo estoc astico e a sua ltra c ao natural. Se T e um tempo de Markov-Ft, pode ser u til denir uma algebra- FT que desempenha para T um papel an alogo ao papel que Ft desempenha para t. Para isso considera-se a menor algebra- F+ que cont em todas as algebra- Ft para t 0 e dene-se FT como a algebra- formada por todos os conjuntos A F+ tais que A [T t] Ft . O exemplo mais t pico dos tempos de Markov s ao os tempos de primeira passagem Ta de um processo estoc astico Xt por um limiar a R
21
X(t)
a t Ta
Figura 2.3: Tempo de primeira passagem Ta = Ta ( ) para uma traject oria

de um processo estoc astico X (t) pelo limiar a.
(ver uma ilustra c ao na Figura 2.3), que e por deni c ao Ta = inf {t 0 : Xt = a}. Recorda-se que, por conven c ao, esse nmo e igual a + quando o conjunto a que se aplica e vazio. Logo Ta ( ) = + quando n ao existe nenhum t 0 tal que Xt ( ) = a, ou seja quando a traject oria do processo Xt nunca passa por a. Reconhece-se que Ta e um tempo de Markov (para a ltra c ao natural do processo estoc astico) pois para saber se o acontecimento [Ta t] ocorreu ou n ao ocorreu s o precisamos de conhecer a traject oria de Xt at e ao instante t. O mesmo j a n ao e verdade se estivermos a falar do tempo de u ltima passagem por a, que n ao e claramente um tempo de Markov.
2.6
Processos de Markov
Em palavras correntes, um processo de Markov e um processo estoc astico em que, conhecido o seu valor presente, os valores futuros s ao independentes dos valores passados. Por outras palavras, quando algu em conhece exactamente o valor presente do processo, conhecer ou n ao como e que o processo evoluiu no passado para chegar a esse valor presente e irrelevante para o c alculo de probabilidades de acontecimentos futuros.
22
A palavra exactamente e essencial, j a que o conhecimento impreciso ou aproximado sobre o valor presente n ao garante a independ encia referida. Como na Sec c ao 2.5, consideramos um intervalo de tempo I = [0, d] com 0 d + 12 , um espa co de probabilidade (, F , P ) e um processo estoc astico {Xt }tI denido nesse espa co. O processo e um processo de Markov em tempo cont nuo 13 se, para quaisquer s, t I , s t e qualquer conjunto de Borel B B , tivermos 14 P [Xt B |Xu , 0 u s] = P [Xt B |Xs ]. (2.4) Note-se que P [Xt B |Xu , 0 u s] = P [Xt B |Fs ], onde Fs ea algebra- gerada pelas v.a. Xu , 0 u s. A propriedade referida, tamb em conhecida por propriedade de Markov, e equivalente a P [Xt B |Xt1 = x1 , ..., Xtn1 = xn1 , Xtn = xn ] = P [Xt B |Xtn = xn ] (2.5) para qualquer n = 1, 2, ..., quaisquer t1 ... tn1 tn t, quaisquer x1 , ..., xn1 , xn R e qualquer conjunto de Borel B . De facto, nem sequer precisamos de vericar a propriedade para todos os conjuntos de Borel, mas apenas para os conjuntos de uma classe geradora de B , como por exemplo a classe dos intervalos (, x]. Assim, a propriedade de Markov e equivalente ` a seguinte igualdade entre fun c oes de distribui c ao condicionais: FXt |Xt1 =x1 ,...,Xtn1 =xn1 ,Xtn =xn (x) = FXt |Xtn =xn (x) (2.6)
Consideremos conjuntos de Borel B, B1 , ...Bn e seja x R. Podemos denir as probabilidades (incondicionais) Pt (B ) := P [Xt B ] (distribui c ao no instante t) e Pt1 ,...,tn (B1 , ..., Bn ) := P [Xt1 B1 , ..., Xtn Bn ] (distribui c ao conjunta nos instantes t1 , ..., tn ). Podemos tamb em denir
12 O intervalo pode come car noutro instante t0 mas, por simplicidade, suporemos que come ca em 0. 13 Aqui s o nos interessam processos de Markov em tempo cont nuo. Por em, a deni ca o de processo de Markov em tempo discreto e em tudo an aloga, com excep ca o do facto de o conjunto de ndices ser da forma I = {0, 1, 2, ..., d} com 0 d +. 14 Embora n ao explicitamente referido, a igualdade de probabilidades condicionais e apenas quase certa, isto e, verica-se com probabilidade um. Continuaremos daqui por diante a omitir essa refer encia expl cita.
para qualquer x R. Um outra propriedade equivalente ` a propriedade de Markov e a de se ter, para qualquer v.a. Y mensur avel-Fd e integr avel e para s, t I , s t, E[Y |Xu , 0 u s] = E[Y |Xs ]. (2.7)
23
as probabilidades de transi ca o P (t, B |s, x) := P [Xt B |Xs = x] para s t. Claro que P (s, B |s, x) = IB (x) (= 1 se x B , = 0 se x / B ). Usando o teorema das probabilidades totais e uma das formas da propriedade de Markov, obtemos, para s u t e 0 < t1 < t2 < ... < tn1 < tn , Pt (B ) =
R
P (t, B |s, z )Ps (dz )
(2.8)
e Pt1 ,...,tn (B1 , ..., Bn ) = R B1 ... Bn1 P (tn , Bn |tn1 , xn1 ) P (tn1 , dxn1 |tn2 , xn2 )...P (t1 , dx1 |0, x0 )P0 (dx0 ). (2.9)
Assim, conhecidas a distribui c ao de probabilidade P0 de X0 e as probabilidades de transi c ao, podemos obter as distribui c oes de dimens ao nita do processo, que completamente o caracterizam do ponto de vista probabil stico. Tamb em podemos facilmente obter as equa co es de ChapmanKolmogorov P (t, B |s, x) = P (t, B |u, z )P (u, dz |s, x) (s < u < t). (2.10)
No caso de existir uma densidade de transi ca o p(t, y |s, x) := fXt |Xs =x (y ) c oes de Chapman-Kolmogorov tomam a forma = y FXt |Xs =x (y ), as equa p(t, y |s, x) =
R
p(t, y |u, z )p(u, z |s, x)dz
(s < u < t).
(2.11)
Um processo de Markov homog eneo (no tempo) e um processo de Markov cujas probabilidades de transi c ao s ao estacion arias, isto e, P (t + , B |s + , x) = P (t, B |s, x), caso em que s ao apenas fun c ao de x, B e t s, podendo escrever-se P (t s, B |x) := P (t, B |s, x). Se existir densidade de transi c ao, podemos importante n escrever p(t s, y |x) := p(t, y |s, x). E ao confundir um processo de Markov homog eneo com um processo de Markov estacion ario; o u ltimo tem fun c oes de distribui c ao nitas estacion arias, o primeiro apenas tem probabilidades de transi c ao estacion arias. Note-se que, para um processo de Markov homog eneo com I = [0, d], a propriedade de Markov (2.4) pode escrever-se na forma P [Xs+t B |Fs ] = P [Xt B |X0 ] para quaisquer t 0 com s, s + t I e conjunto de Borel B (pois
24
P [Xs+t B |Xs ] = P [Xt B |X0 ]). Aqui Fs ea algebra- gerada pelas v.a. X (u) (0 u s). A propriedade equivale a E[h(Xs+t )|Fs ] = E[h(Xt )|X0 ] para fun c oes h mensur aveis-Borel limitadas. Um processo de Markov homog eneo {Xt }t0 diz-se um processo de Markov forte (ou que satisfaz a propriedade de Markov forte ) se, para quaisquer t 0 e conjunto de Borel B , se tiver P [XS +t B |FS ] = P [Xt B |X0 ] (2.12) para todos os tempos de Markov S (com respeito ` a ltra c ao natural do processo). Esta propriedade e equivalente a ter-se E[h(XS +t )|FS ] = E[h(Xt )|X0 ] (2.13)
para fun c oes h mensur aveis-Borel limitadas. Os conceitos desta sec c ao podem facilmente generalizar-se a processos estoc asticos n-dimensionais. Basta substituir R por Rn e considerar agora conjuntos de Borel em Rn .
Cap tulo 3
Uma introdu c ao informal ` as equa c oes diferenciais estoc asticas

Seja X = X (t) o tamanho de uma popula c ao de seres vivos no instante t 0 e seja X (0) = x0 o seu tamanho inicial. Suponhamos que n ao h a limita c oes (alimentares ou territoriais) ao crescimento. A din amica da popula c ao pode ser descrita pelo modelo malthusiano dX = rX, dt (3.1)
que diz simplesmente que a taxa instant anea de crescimento da popula c ao e proporcional ao tamanho da popula c ao. A taxa (instant anea) 1 dX de crescimento per capita X e a constante de proporcionalidade r. dt A solu c ao para este modelo de tipo multiplicativo e a lei malthusiana (crescimento exponencial) X (t) = x0 exp(rt). (3.2)
O mesmo modelo pode aplicar-se se X (t) representar o valor de uma obriga c ao com taxa (instant anea) de rendimento r xa, ou o capital de um dep osito banc ario com taxa (instant anea) de juro r xa ou o valor de um bem ou recurso quando a taxa (instant anea) de ina c ao r e constante. A equa c ao diferencial ordin aria (EDO) (3.1), que podemos tamb em escrever na forma dX = (rdt)X , pode obter-se como o limite quando t 0 do modelo em tempo discreto (equa c ao ` as diferen cas) 25
26
Cap tulo 3 - Uma introdu c ao informal ` as EDE
X (t + t) X (t) = (rt)X (t), onde rt e aproximadamente, para t pequeno, a taxa de crescimento/rendimento/juro no intervalo (t, t + t). Contudo, o ambiente tem utua c oes aleat orias que afectam a taxa de crescimento da popula c ao. Os mercados tamb em utuam e essas utua c oes certamente afectam as taxas de crescimento dos pre cos dos bens no consumidor e as taxas de rendimento dos produtos nanceiros. Assim, se X (t) e, por exemplo, a cota c ao de uma ac c ao, n ao esperamos que a sua taxa de rendimento seja constante, antes que utue aleatoriamente. Seja B (t) (ou Bt como nota c ao alternativa) o efeito acumulado entre os instantes 0 e t das utua c oes do ambiente/mercado na taxa de crescimento/rendimento. Obviamente, B (t) depende do acaso (estado da natureza/cen ario do mercado), onde varia em (conjunto dos estados/cen arios poss veis) e temos uma estrutura de espa co de probabilidade (, F , P ) que nos d a a probabilidade de ocorr encia dos diversos conjuntos (mensur aveis) de estados/cen arios. Dev amos escrever B (t, ) mas adoptamos a conven c ao usual, que permite simplicar a nota c ao, de n ao explicitar a refer encia ` a depend encia de . Trata-se, pois, de um processo estoc astico. Claro que B (0) = 0 e que a taxa de crescimento/rendimento num pequeno intervalo de tempo (t, t + t) e aproximadamente rt + B (t), onde B (t) = B (t + t) B (t) e o incremento do processo B (t) no intervalo (t, t + t). Obtemos, assim, como modelo aproximado, a equa ca o a `s diferen cas estoc astica X (t + t) X (t) = (rt + B (t))X (t). No limite quando t 0, obtemos dX = (rdt + dB (t))X ou dX = rXdt + XdB (t). (3.3) Como B (t) e um processo estoc astico, esta e uma equa ca o diferencial estoc astica, conhecida como o modelo de Black-Scholes para a cota c ao de uma ac c ao. A sua solu c ao X (t) tamb em depende do acaso (estado do ambiente/cen ario do mercado) e e, portanto, um processo estoc astico X (t, ). O termo rXdt descreve a tend encia m edia do comportamento din amico desta vari avel [r e assim uma taxa (instant anea) m edia de crescimento/rendimento] e o termo XdB (t) descreve as perturba c oes aleat orias em volta desta tend encia. Quais as caracter sticas que devemos exigir do processo estoc astico B (t) para que se obtenha um modelo razo avel do seu comportamento? Supondo que h a muitas fontes de utua c oes aleat orias do ambiente/mercado afectando as taxas de crescimento/rendimento, esperamos, pelo teorema do limite central, que o seu efeito acumulado B (t) sobre tais taxas tenha aproximadamente uma distribui c ao gaussiana. Podemos ent ao supor que o incremento B (t) no intervalo (t, t + t) e uma v.a. gaussiana com m edia zero (se a m edia n ao fosse nula, pod amos absorv e-
27
la no par ametro r de modo a que a interpreta c ao deste par ametro como taxa m edia fa ca sentido). Por outro lado, dados dois intervalos n ao sobrepostos, e razo avel supor que as fontes das varia c oes aleat orias num dos intervalos (que afectam o incremento de B nesse intervalo) s ao aproximadamente independentes das fontes das varia c oes aleat orias no outro intervalo. Assim, podemos supor com razo avel aproxima c ao que os incrementos de B em intervalos n ao-sobrepostos s ao vari aveis aleat orias independentes. Quanto ` a vari ancia do incremento B (t), ela deve ser a soma das vari ancias das muitas fontes de utua c oes aleat orias que ocorrem no intervalo de tempo (t, t + t) (supondo que h a independ encia dessas fontes, pelo menos com razo avel aproxima c ao). Como o n umero destas fontes deve ser aproximadamente proporcional ` a dura c ao t do intervalo, o mesmo deve suceder ` a vari ancia do incremento. Assim, podemos supor que a vari ancia de B (t) e 2 t, onde e um par ametro que mede a intensidade das utua c oes aleat orias e que e conhecido na literatura nanceira por volatilidade. Se pusermos W (t) = B (t)/ , ent ao W (t) N (0, t) (distribui c ao normal com m edia zero e vari ancia t). Os incrementos s ao estacion arios (n ao dependem do intervalo de tempo espec co mas apenas da sua dura ca o t). Um processo estoc astico com as propriedades acima mencionadas para W (t) e chamado processo de Wiener padr ao (ou standard) e ser a estudado no Cap tulo 4. Tamb em e conhecido por movimento browniano porque foi o modelo usado por Einstein no seu ano de ouro de 1905 para descrever o movimento browniano de uma part cula suspensa num u do. Mais exactamente, se o movimento ocorre numa superf cie plana, ele e descrito por (x0 + W1 (t), y0 + W2 (t)), onde (x0 , y0 ) e a posi c ao inicial da part cula, W1 (t) e W2 (t) s ao dois processos de Wiener padr ao independentes entre si e e um coeciente (a 2 chama-se coeciente de difus ao). A generaliza c ao a movimentos tridimensionais e obvia. Claro que em 1905 ainda o processo W (t) n ao era conhecido. O movimento browniano foi inicialmente observado pelo bot anico Brown em 1827 quando constatou ao microsc opio o movimento extremamente irregular de uma part cula de p olen suspensa numa superf cie l quida. Einstein atribui o fen omeno aos choques da part cula com as mol eculas do u do que est ao em constante movimento. Olhando para a projec c ao da posi c ao da part cula num dos eixos coordenados, obtemos (` a parte um par ametro de localiza c ao inicial da part cula) um processo de Wiener. Isso pode ser justicado pelo facto de, em cada pequeno intervalo de tempo t, a part cula sofrer in umeros choques, cujo efeito acumulado sobre a posi c ao da part cula e a soma de muitas v.a. independentes, esperando-se uma distribui c ao aproximadamente normal; al em disso, a independ encia dos incrementos e a vari ancia proporcional ao intervalo de tempo explicam-
28

3
w2(t)
0 -3 -2 -1 -1 0 1 2 3
-2
-3
w1(t)
Figura 3.1: Simula c ao, usando o modelo de Einstein com x0 = y0 = 0 e =

1, isto e (W1 (t, ), W2 (t, )), do movimento browniano para t a variar entre 0 e 10 e xo escolhido aleatoriamente. O tempo foi discretizado em passos de 0.01 unidades e os pontos (W1 (0.01k), W2 (0.01k)) (k = 0, 1, 2, ..., 1000) unidos por segmentos de recta.
se de forma semelhante ` a acima descrita para crescimento de popula c oes ou cota c ao de ac c oes. O coeciente de difus ao depende naturalmente da temperatura (quanto maior ela for, maior ser a a agita c ao das mol eculas do u do e o n umero de choques por unidade de tempo com a part cula suspensa), da massa da part cula, da viscosidade do u do e tamb em do n umero de Avogadro. Einstein, atrav es de princ pios f sicos, determinou a express ao dessa depend encia funcional. Para mais pormenores pode ver-se [28]. Numa experi encia em que sejam controlados e conhecidos os valores da temperatura, massa da part cula e viscosidade, estimando 2 (o que pode ser feito com grande precis ao) atrav es da vari ancia amostral dos incrementos da posi c ao da part cula em pequenos intervalos t, facilmente se pode determinar o n umero de Avogadro com grande aproxima c ao. Pessoalmente, n ao gosto de chamar a W (t) movimento browniano porque, embora o modelo de Einstein (que coincide em cada eixo, ` a parte constantes de localiza c ao e escala, com W (t)) descreva razoavelmente este movimento, foram posteriormente desenvolvidos outros modelos mais realistas. Embora fosse habitual atribuir a paternidadedo processo de Wiener a Einstein, o desenvolvimento das aplica c oes nanceiras das equa c oes
29
diferenciais estoc asticas chamou a aten c ao para o trabalho de Bachelier em 1900 ([4]), que usou precisamente o modelo x0 + W (t) para descrever a cota c ao de ac c oes na bolsa de Paris. A n ao ser talvez a curto prazo, trata-se de um modelo pouco realista, que prev e um valor esperado constante para a cota c ao (pois a m edia de W (t) e nula). Podemos preferir escrever (3.3) na forma dX = rXdt + XdWt ou dX = rX + X(t), dt (3.4)
com (t) = (t, ) = dW (t)/dt. Sucede, por em, que as traject orias de W (t), embora q.c. cont nuas, s ao extremamente irregulares (serviram precisamente para descrever o movimento browniano de part culas) e, como veremos no Cap tulo 4, s ao q.c. n ao-diferenci aveis. Ou seja, a derivada dW (t)/dt n ao existe no sentido corrente, mas apenas no sentido das fun c oes generalizadas. Assim, (t), chamado ru do branco padr ao, n ao e um processo estoc astico mas um processo estoc astico generalizado (as suas traject orias s ao fun c oes generalizadas do tempo). Como W (t) tem incrementos independentes estacion arios, (t) e um processo estacion ario cujos valores em dois instantes diferentes (por mais pr oximos que estejam um do outro) s ao independentes. Para processos em tempo discreto, a independ encia em instantes diferentes n ao causa qualquer diculdade porque esses instantes n ao podem estar arbitrariamente pr oximos e e bem conhecido do estudo das s eries temporais (ou sucess oes cronol ogicas) o ru do branco gaussiano em tempo discreto, que e simplesmente uma sucess ao de v.a. gaussianas independentes identicamente distribu das. Por em, em tempo cont nuo a independ encia em instantes diferentes exige o uso de processos estoc asticos generalizados. Assim, (t) e um processo estoc astico generalizado gaussiano com fun c ao de auto-covari ancia C (t) = 0 para todo o t = 0. Curiosamente, W (t)/t tem vari ancia 1/t + quando t 0 e, portanto, C (0) = V AR[(t)] = +. Logo, C (t) = (t) e a fun ca o delta de Dirac, que e uma fun c ao generalizada caracterizada por (x) = 0 para x = 0, (x) = + para x = 0 e + e uma fun c ao constante (x)dx = 1. A sua transformada de Fourier e, portanto, (t) tem fun c ao densidade espectral constante (todas as frequ encias t em igual intensidade, um comportamento que faz lembrar a luz de esperar que os ru branca). E dos naturais (t) sejam coloridos, isto e, tenham alguma auto-correla c ao para instantes pr oximos e, portanto, tenham uma densidade espectral n ao constante e uma fun c ao de autocovari ancia C (t) que seja uma fun c ao propriamente dita com um pico na origem. Se este pico for agu cado, ela poder a ser razoavelmente aproximada por uma fun c ao delta de Dirac e o ru do colorido correspondente
30
ser aproximado por um ru do branco. Ao contr ario do ru do branco, o integral de um tal ru do colorido n ao ser a um processo de Wiener mas (t) com incrementos ligeiramente dependentes e com um processo W traject orias mais suaves. Contudo, o processo de Wiener ou o ru do branco s ao matematicamente muito melhor trat aveis e constituem frequentemente uma boa aproxima c ao, raz oes pelas quais os iremos utilizar como modelos. A equa c ao (3.4) pode ser escrita na forma dX = (r + X(t))X, dt (3.5)
que tem a interessante interpreta c ao de ser o modelo (3.1) com a taxa (instant anea) de crescimento/rendimento r perturbada por ru do branco induzido pelo ambiente/mercado. Usualmente, os livros de texto evitam referir-se ao ru do branco e preferem usar a nota c ao dX = rXdt + XdW .
Cap tulo 4
O processo de Wiener
4.1 Deni c ao
O processo de Wiener desempenha um papel essencial nas equa c oes diferenciais estoc asticas que iremos estudar. Ele traduz o efeito acumulado das perturba c oes aleat orias que afectam a din amica do fen omeno em estudo, ou seja, e o integral do ru do perturbador que se sup oe ser um ru do branco em tempo cont nuo. Como referimos no Cap tulo 3, Bachelier usou o processo de Wiener em 1900 para modelar a cota c ao de uma ac c ao na bolsa e Einstein usou-o em 1905 para modelar o movimento browniano de uma part cula suspensa num u do. S o, por em, a partir de 1920 e que ele foi rigorosamente estudado por Wiener e por L evy. Vamos examinar aqui as suas principais propriedades. Antes de mais, notaremos o processo de Wiener padr ao indiferentemente por Wt (abreviatura de Wt ( )) ou W (t) (abreviatura de W (t, )). Comecemos pela sua deni c ao formal. Deni c ao. Dado um espa co de probabilidade (, F , P ), um processo estoc astico {Wt }t[0,+) denido nesse espa co diz-se um processo de Wiener padr ao (ou movimento browniano) se satiszer as seguintes propriedades: W (0) = 0 q.c. Os incrementos W (t) W (s) (s < t) t em distribui ca o normal com m edia 0 e vari ancia t s. Os incrementos W (ti ) W (si ) (i = 1, ..., n) em intervalos de tempo 31
32
Cap tulo 4 - O processo de Wiener (si , ti ] (i = 1, 2, ..., n) n ao-sobrepostos s ao v.a. independentes (diz-se simplesmente que tem incrementos independentes).
1
Observa c ao. Um processo da forma a + W (t), com a e constantes, diz-se um processo de Wiener. Por vezes, por em, para abreviar a linguagem, diremos simplesmente processo de Wiener querendo-nos referir ao processo de Wiener padr ao. Observa c ao. Como a distribui ca o dos incrementos do processo de Wiener num intervalo de tempo s o depende do comprimento do intervalo, conclu mos que tem incrementos estacion arios. Mas o pr oprio processo de Wiener n ao e estacion ario; basta reparar que a vari ancia V AR[W (t)] = V AR[W (t) W (0)] = t 0 = t n ao e constante. Tamb em os incrementos do processo de Wiener s ao independentes, mas os valores do pr oprio processo em instantes distintos n ao s ao independentes (a Propriedade 2 abaixo mostra-o claramente).
4.2
Principais propriedades
Estudemos agora as principais propriedades do processo de Wiener W (t). Propriedades: 1. O processo de Wiener tem uma vers ao separ avel cont nua (isto e, com trajact orias q.c. cont nuas). Suporemos, daqui por diante, que trabalhamos sempre com uma tal vers ao. Por isso, alguns autores incluem logo a continuidade das traject orias na deni ca o. Este resultado decorre da aplica c ao do crit erio de Kolmogorov tendo em conta que, pelas propriedades da distribui c ao normal, se tem E[|Wt Ws |4 ] = 3|t s|2 .
1 A independ encia e um importante conceito probabil stico. Num espa co de probabilidade (,F ,P ), os acontecimentos A1 ,A2 ,...,An F dizem-se independentes se P (A1 A2 ... An) = P (A1 )P (A2 )...P (An ). Se A e B s ao independentes, ent ao P (A|B ) = P (A). Dadas a lgebras- F1 , F2 , ..., Fn contidas em F , elas dizemse independentes se os acontecimentos A1 , A2 , ..., An forem independentes para todas as escolhas poss veis de n e de A1 F1 , A2 F2 , ..., An Fn . As v.a. X1 , X2 , ..., Xn dizem-se independentes se as a lgebras- (X1 ), (X2 ), ..., (Xn ) por elas geradas forem independentes; isto equivale a ` propriedade de a f.d. conjunta das v.a. ser igual ao produto das f.d. individuais. Se X1 , X2 , ..., Xn forem v.a. independentes e forem integr aveis (isto e, com esperan ca matem atica), vem E[X1 X2 ...Xn ] = E[X1 ]E[X2 ]...E[Xn] e E[Xi |Xj ] = E[Xi ] para i = j . Tamb em se pode denir independ encia para uma colec ca o innita de acontecimentos, a lgebras- ou vari aveis aleat orias; considera-se que h a independ encia quando toda a subcolec ca o nita for independente.
33
2. W (t) tem distribui ca o normal com m edia 0 e vari ancia t, o que representamos por Wt N (0, t). Basta notar que W (t) e igual ao incremento W (t) W (0). 3. A covari ancia entre W (s) e W (t) e COV [W (s), W (t)] E[W (s)W (t)] = min(s, t). =
O caso s = t decorre da propriedade 2. Para s < t, vem E[W (s)W (t)] = E[W 2 (s)]+E[(W (t)W (s))(W (s)W (0))] e basta ver que E[W 2 (s)] = s e que, como os intervalos (0, s] e (s, t] s ao n ao-sobrepostos, a independ encia dos incrementos d a E[(W (t) W (s))(W (s) W (0))] = E[W (t) W (s)]E[W (s) W (0)] = 0 0 = 0. O caso s > t e semelhante. 4. W (t) e um processo gaussiano e, para 0 < t1 < ... < tn , a f.d.p. conjunta ft1 ,...,tn (x1 , ..., xn ) de W (t1 ), ..., W (tn ) e dada por ft1 ,...,tn (x1 , ..., xn ) =
n i=1
1 2 (ti ti1 )
xi xi1 ) exp (2( ti ti1 )
, (4.1)
onde se p os t0 = 0 e x0 = 0. Os incrementos W (t1 ) W (0), W (t2 ) W (t1 ), ..., W (tn ) W (tn1 ) s ao independentes, pelo que a f.d.p. conjunta e o produto das densidades gaussianas de cada um (com m edia 0 e vari ancia igual ao comprimento do correspondente intervalo de tempo). Essa densidade conjunta d a o produto do lado direito da express ao supra. Basta agora notar que a transforma c ao que passa dos incrementos referidos para as vari aveis W (t1 ), W (t2 ), ..., W (tn ) tem jacobiano igual a um. 5. W (t) e um processo de Markov homog eneo com densidades de transi ca o p(, y |x) = (2 )1/2 exp (y x)2 2 ( > 0). (4.2)
Isto e, a distribui ca o condicional de W (s + ) dado que W (s) = x e normal de m edia x e vari ancia : W (s + )|(W (s) = x) N (x, ). (4.3)
Devido ` a independ encia dos incrementos, v e-se que a m edia condicional e E[Ws+ |Ws = x] = E[Ws+ Ws |Ws W0 = x] + E[Ws |Ws = x] = E[Ws+ Ws ] + x = 0 + x = x e a vari ancia
34
Cap tulo 4 - O processo de Wiener condicional e V AR[Ws+ |Ws = x] = E[(Ws+ x)2 |Ws = x] = E[(Ws+ Ws )2 |Ws W0 = x] = E[(Ws+ Ws )2 ] = (s + s) = . O facto desta distribui c ao s o depender da dura c ao do intervalo de tempo garante a homogeneidade. Falta vericar se o processo e de Markov, para o que basta mostrar a propriedade (2.6). Ora, usando a independ encia dos incrementos, vem FWt |Wt1 =x1 ,...,Wtn1 =xn1 ,Wtn =xn (x) = P [Wt x|Wt1 = x1 , Wt2 = x2 , ..., Wtn1 = xn1 , Wtn = xn ] = P [Wt Wtn x xn |Wt1 W0 = x1 , Wt2 Wt1 = x2 x1 , ..., Wtn1 Wtn2 = xn1 xn2 , Wtn Wtn1 = xn xn1 ] = P [Wt Wtn x xn ] = P [Wt Wtn x xn |Wtn W0 = xn ] = P [Wt x|Wtn W0 = xn ] = FWt |Wtn =xn (x). 6. W (t) e uma martingala, subentende-se que com respeito a ` ltra ca o natural {Ms }s0 , com Ms = (W (u) : 0 u s). Isto e, para s t, vem E[W (t)|Ms ] := E[W (t)|W (u), 0 u s] = W (s).
De (2.4), vem P [W (t) B |Ms ] = P [W (t) B |W (s)] para qualquer conjunto de Borel B . Logo E[W (t)|W (u), 0 u s] = E[W (t)|W (s)]. Basta agora atender a que, devido a (4.3), se tem, para qualquer x, E[W (t)|W (s) = x] = x.
Uma quest ao importante e a da exist encia de processos de Wiener, isto e, de processos que satisfa cam as propriedades da Deni c ao da Sec ca o 4.1, pois caso contr ario estar amos a estudar um objecto de conte udo vazio. A Propriedade 4 anterior dene as fun c oes de distribui c ao de dimens ao nita (que se obt em por integra c ao das f.d.p. obtidas nessa propriedade), as quais s ao efectivamente fun c oes de distribui c ao (gaussianas) e facilmente se verica satisfazerem as condi c oes de simetria e compatibilidade. O teorema da extens ao de Kolmogorov garante a exist encia de pelo menos um tal processo num certo espa co de probabilidade e d a-nos um m etodo construtivo de o obter. Uma outra forma de construir um processo de Wiener e considerar um passeio aleat orio, isto e um processo de Markov em tempo discreto (t = 0, t , 2t ,...) com espa co de estados discreto S = {..., 2x, x, 0, x, 2x, ...} (com t > 0 e x > 0) tal que, em cada passo, o processo se mova para um dos dois estados vizinhos (` a direita ou ` a esquerda) com igual probabilidade. Podemos pensar no movimento de uma part cula sujeita a colis oes. Pondo x = (t)1/2 e fazendo t 0, obtemos o processo de Wiener padr ao. Para obter W (t), basta usar x = (t)1/2 .
35
Pode provar-se (ver, por exemplo, [37]) que, dado um processo estoc astico X (t) (t 0) adaptado a uma ltra c ao Ft F , que tenha traject orias q.c. cont nuas, que verique X (0) = 0 q.c., que seja martingalaFt e tal que X 2 (t) t tamb em seja martingala-Ft, ent ao X (t) e um processo de Wiener. Esta propriedade e conhecida por caracteriza ca o de L evy.
Exerc cio: Demonstre que: a) Para s 0 xo, o processo Y (t) = W (s + t) W (s) (t 0) e tamb em um processo de Wiener padr ao. 2 e tamb em b) Para c > 0 constante, o processo Z (t) = 1 c W (c t) (t 0) um processo de Wiener padr ao. c) O processo H (t) = W 2 (t) t e uma martingala-Mt.
4.3
Algumas propriedades anal ticas
Apesar de as traject orias do processo de Wiener serem q.c. cont nuas, elas s ao q.c. n ao-diferenci aveis, como j a se referiu no Cap tulo 3. Elas s ao at e q.c. de varia ca o ilimitada em qualquer intervalo nito [a, b]. Para o reconhecer, decomponhamos o intervalo em 2n subintervalos de igual dura c ao n = (b a)/2n usando os pontos de decomposi c ao tn,k = a + kn (k = 0, 1, ..., 2n). Note-se que, quando n +, o 2n di ametro da decomposi c a o n 0 e k=1 n = b a < +. Seja n 2 2 Vn = k=1 (W (tn,k ) W (tn,k1 )) . Exerc cio: Com Vn,k = (W (tn,k ) W (tn,k1 ))2 n , mostre que E[Vn ] =
k n
= (b a)
k 2
V AR[Vn ] = E (
Vn,k )
=2
(tn,k tn,k1 ) 2(b a)n 0.
2 Note que ( k Vn,k ) = k Vn,k + 2 k j>k Vn,k Vn,j e que devido ` a independ encia dos incrementos do processo de Wiener, vem, para k = j , E[Vn,k Vn,j ] = E[Vn,k ]E[Vn,j ].
A propriedade referida no exerc cio anterior mostra que Vn converge em m edia quadr atica (isto e, com respeito a ` norma-L2) para b a. Como V AR [ V ] < + , isto implica (pode consultar qualquer bom livro n n de probabilidades) que Vn converge quase certamente (q.c., isto e, com probabilidade um) para b a, ou seja, P [Vn b a quando n +] = 1. Como Vn max |W (tn,k ) W (tn,k1 )|
k
|W (tn,k ) W (tn,k1 )|
36
Cap tulo 4 - O processo de Wiener
e como maxk |W (tn,k ) W (tn,k1 )| 0 q.c. (porque W (t) e q.c. cont nuo em [a, b] e, portanto, q.c. uniformemente cont nuo nesse intervalo fechado), resulta que k |W (tn,k ) W (tn,k1 )| + q.c., assim se concluindo pela varia c ao ilimitada q.c. das traject orias do processo de Wiener. Para dar a ideia de como se comportam as traject orias do processo de Wiener, a Figura 4.1 mostra uma simula c ao de duas traject orias de W (t) no intervalo de tempo [0, 10]. 2 Se ampli assemos com uma lente um pequeno peda co de uma traject oria, o seu aspecto pareceria t ao irregular como o que observa na gura para toda a traject oria. A traject oria n ao tem regi oes suaves, e toda formada por bicos. Como a traject oria e q.c. de varia c ao ilimitada, o comprimento de qualquer peda co da traject oria correspondente a um intervalo de tempo [a, b] ser a innito, por menor que seja [a, b]. Embora em qualquer instante t a traject oria tenha valor m edio 0, sabemos que a vari ancia est a a aumentar com o tempo e e interessante ver qual e o comportamento assint otico de W (t) quando t +. Vericase que W (t)/t 0 q.c. quando t +. Isso e uma consequ encia da lei forte dos grandes n umeros. 3 Uma ideia mais precisa do comportamento assint otico e dada pela lei do logaritmo iterado W (t) = 1 q.c. (4.4) lim sup t+ 2t ln ln t W (t) lim inf = 1 q.c. (4.5) t+ 2t ln ln t A demonstra c ao e complicada e pode ver-se, por exemplo, em [31]. Da lei do logaritmo iterado decorre que, dado > 0 arbitr ario, se tem q.c. (1 + ) 2t ln ln t W (t, ) (1 + ) 2t ln ln t
2 De facto, como n ao podemos simular para todos os valores de t, simul amos os valores de W (t) para t = 0, 0.01, 0.02, ..., 10 e unimos os pontos de coordenadas (t, W (t)) por segmentos de recta. Em vez de simular directamente os valores dos v arios W (0.01i) (i = 1, 2, ..., 1000) usando uma distribui ca o normal multivariada (cuja estrutura de correla co es e complicada), e prefer vel gerar os incrementos W(k) = W (0.01k ) W (0.01(k 1)) (k = 1, 2, ..., 1000), os quais s ao independentes entre si e t em distribui ca o N (0, 0.01), e adicion a-los sucessivamente para obter os W (0.01i) = i k=1 W(k) (i = 1, 2, ..., 1000). 3 No caso de t = n (n = 1, 2, ...), a demonstra ca o e simples. Basta notar que as v.a. W (n) W (n 1) N (0, 1) (n = 1, 2, ...) s ao independentes entre si e aplicar a lei forte dos grandes n umeros para reconhecer que a sua m edia W (n)/n 0 q.c. O caso geral, com valores de t + n ao necessariamente inteiros, pode demonstrar-se recorrendo a ` lei do logaritmo iterado de que falaremos em seguida e da qual e uma consequ encia trivial.

w(t)
3
37
0 0 1 2 3 4 5 6 7 8 9 10
-1
-2
-3
Figura 4.1: Duas traject orias simuladas (dois valores diferentes de ) do processo de Wiener padr ao no intervalo [0, 10]. para t sucientemente grande (isto e, existe um t0 ( ) tal que a propriedade vale para t t0 ( )). Isto d a-nos curvas majorantes e minorantes das traject orias para t grande. Exerc cio: Mostre que o processo X (t) := tW (1/t) se t > 0 0 se t = 0
e um processo de Wiener padr ao. Veremos no Cap tulo 5 que um processo de Wiener e um caso particular de um processo de difus ao.
4.4
Tempos de primeira passagem
O processo de Wiener, que vimos ser um processo de Matkov homog eneo, e mesmo um processo de Markov forte. Assim, dado um tempo de Markov S , como W (0) = 0, podemos obter o processo Y (u) := W (S + u) W (S ) (u 0) e, utilizando (2.12), reconhecer que ele tem a mesma distribui c ao que W (u) e tem a mesma distribui c ao dos incremen-
38
tos que o processo de Wiener original. Como e um processo gaussiano, os incrementos, sendo n ao-correlacionados, s ao indepedentes. Conclui-se que Y (u) e um processo de Wiener independente de FS , propriedade que j a tinhamos visto na Sec c ao 4.2 mas para s determin stico em vez de aleat orio. A demonstra c ao destas propriedades pode ver-se, por exemplo, em [34] ou em [37]. Daqui decorre que E[h(W (S + u))|FS ] = E[h(W (u))] (4.6)
para fun c oes h mensur aveis-Borel e limitadas e u 0. O facto de Y (u) ser processo de Wiener independente de FS pode traduzir-se, usando terminologia de It o e McKean, na ideia de que o processo de Wiener recome ca de fresco nos tempos de Markov isto e, mudando o sistema de eixos tempo/estado do gr aco das traject orias do processo de modo a que os novos eixos sejam paralelos aos anteriores mas tenham origem no ponto com as antigas coordenadas (S, W (TS )), obtemos as traject orias de Y (u). Consideremos o tempo de primeira passagem Ta = inf {t 0 : W (t) = a} de um processo de Wiener por um limiar constante a = 0 (o caso a = 0 e trivial). Trata-se de um tempo de Markov. Assim, para saber se o acontecimento [T t] ocorreu ou n ao, precisamos de conhecer apenas a traject oria do processo de Wiener at e ao instante t. Vamos determinar a distribui c ao de Ta , supondo a > 0, usando um argumento de simetria e a propriedade de Markov forte. Como as traject orias s ao cont nuas e W (0) = 0 < a, se Ta > t a traject oria no instante t tem de estar abaixo de a (caso contr ario, o processo teria passado por a antes do instante t e n ao viria Ta > t), pelo que P [W (t) a|Ta > t] = 0. Logo P [W (t) a] = P [W (t) a|Ta t]P [Ta t] + P [W (t) a|Ta > t]P [Ta > t] = P [W (t) a|Ta t]P [Ta t]. Sabemos que Y (u) = W (Ta + u) W (Ta) = W (Ta + u) a e um processo de Wiener. Logo P [W (t) a|Ta t] = P [Y (t Ta ) 0]; esta u ltima probabilidade s o pode ser igual a P [Y (t Ta ) 0] devido ` a simetria da distribui c ao do processo de Wiener, donde ambas terem de ser iguais a 1/2 (j a que a probabilidade da intersec c ao P [Y (t Ta) = 0] = 0). Daqui resulta que P [Ta t] = 2P [W (t) a] = 2(2t)1/2
+ a
exp
x2 2t
dx
39
e, fazendo uma mudan ca de vari avel no integral, obtemos a f.d. de Ta FTa (t) = 2(2 )1/2
+ a/ t
exp(y 2 /2)dy
(t > 0).
(4.7)
A f.d.p. de Ta obt em-se por deriva c ao: fTa (t) = |a|(2t3 )1/2 exp a2 2t (t > 0). (4.8)
Pusemos |a| para que a express ao tamb em seja v alida para a < 0, cando esse caso como exerc cio. Exerc cio: a) Apesar de Ta < + q.c. (isto e, P [Ta = +] = 0), o valor m edio de Ta e E [Ta ] = + (cometemos o pequeno abuso de linguagem de chamar esperan ca matem atica ao integral innito Ta dP desta v.a. n ao-integr avel). Mostre que esta arma c ao e corrrecta. b) Como W (t) tem traject orias q.c. cont nuas, existe q.c. o m aximo X (t) = max0ut W (u). Determine a f.d. de X (t).
Sugest ao: Pela continuidade das traject orias, h a uma rela c ao entre o acontecimento [X (t) a] e um acontecimento relativo a Ta .
c) Seja 0 < t1 < t2 . Mostre que a probabilidade de W (t) n ao tomar o valor 0 no intervalo de tempo (t1 , t2 ) e (2/ ) arcsin t1 /t2 (lei do arcoseno ). Sugest ao: Considere o acontecimento A que consiste em W (t) tomar o valor 0 pelo menos uma vez no intervalo de tempo (t1 , t2 ). Para determinar P (A), condicione relativamente a W (t1 ) = x e use o teorema das probabilidades totais. Note que P (A|W (t1 )= x) = P [T|x| t2 t1 ], que j a sabe calcular, e substitua. Depois e s o uma quest ao de fazer uma mudan ca de vari aveis apropriada no integral duplo que obt em.
4.5
Processos de Wiener multidimensionais
Podemos denir um processo de Wiener (padr ao) m-dimensional W(t) = [W1 (t), W2 (t), ..., Wm (t)]T . Trata-se apenas de um vector (coluna) de m processos de Wiener padr ao (unidimensionais) independentes entre si. Se a e um vector (coluna)
40
m-dimensional constante e C e uma matriz constante m m denida positiva, ent ao a + CW(t) tamb em se diz um processo de Wiener mdimensional, podendo agora haver correla c ao (e, portanto, depend encia) entre as suas coordenadas.
Cap tulo 5
Processos de difus ao
5.1 Deni c ao
H a v arias deni c oes n ao equivalentes do que se entende por processo de difus ao. Vamos usar uma deni c ao um pouco mais forte do que o habitual. Para simplicar, vamos apresentar a nota c ao abreviada Es,x [...] para as esperan cas matem aticas condicionais E[...|Xs = x], onde ... representa alguma v.a. e Xt e um processo estoc astico. Tamb em ocasionalmente usaremos nota c ao semelhante para abreviar probabilidades condicionais: Ps,x [...] em vez de P [...|Xs = x], onde ... ser a algum acontecimento. Usaremos indiferentemente as nota c oes Xt e X (t) para o mesmo processo estoc astico. Seja {Xt }t[0,d] um processo estoc astico num espa co de probabilidade (, F , P ). Dizemos que e um processo de difus ao se for um processo de Markov com traject orias q.c. cont nuas tal que Xt L2 (t [0, d]) e, para todo o x R e s [0, d), vier, com converg encias uniformes com respeito a s [0, d), 1 Ps,x [|Xs+ x| > ] = 0 para todo o > 0 0+ Xs+ x lim Es,x = a(s, x) 0+ lim
0+
(5.1) (5.2) (5.3)
lim Es,x
(Xs+ x)
= b(s, x).
Nota. A deni c ao mais vulgar e semelhante mas n ao exige nem a con41
42
Cap tulo 5 - Processos de difus ao
verg encia uniforme nem que Xt L2 (t [0, d]). Da n ao haver garantia que existam os momentos utilizados em (5.2) e (5.3), pelo que se substituem pelos momentos truncados (que existem sempre): 1 (Xs+ x) I|Xs+ x| = a(s, x), lim0+ Es,x
1 lim0+ Es,x (Xs+ x)2 I|Xs+ x| = b(s, x), Aqui I e a fun c ao indicatriz e > 0 e arbitr ario. A propriedade (5.1) n ao sofre altera c ao.
O momento innit esimal de primeira ordem a(s, x), chamado coeciente de tend encia (em ingl es, e tamb em conhecido por drift), e a velocidade m edia de X no instante s quando Xs = x. Tamb em se lhe pode chamar m edia innit esimal. Quanto ao momento innit esimal de segunda ordem b(s, x), chamado coeciente de difus ao, ele mede a intensidade das utua c oes e e a velocidade da vari ancia do processo X no instante s quando Xs = x. Tamb em se lhe pode chamar vari ancia innit esimal. De (5.2) e (5.3) vem, quando 0+, Es,x [Xs+ Xs] = a(s, x) + o() onde V ARs,x tem o signicado obvio. Logo, Xs+ Xs a(s, x) + b(s, x)Z , onde Z e uma v.a. com m edia zero e desvio padr ao , que pode ser aproximada por Ws+ Ws . Passando para diferenciais e pondo g (t, x) = b(t, x), obt em-se dXs = a(s, x)dt + g (s, x)dWs , que e a forma geral de uma equa c ao diferencial estoc astica (EDE); o modelo de Black-Scholes referido no Cap tulo 3 e apenas um exemplo em que a(s, x) = rx e g (s, x) = x. Assim, n ao haver a surpresa quando virmos mais tarde que, sob certas condi c oes, as solu c oes das equa c oes diferenciais estoc asticas s ao processos de difus ao. Como (5.1) pode ser escrita na forma P [|Xs + Xs | |Xs = x] = 1 o() quando t 0+, o seu signicado e o de dizer que s ao improv aveis grandes altera c oes do valor do processo num pequeno intervalo de tempo . Se a(t, x) e b(t, x) n ao dependerem de t, temos um processo de difus ao homog eneo. Exerc cio: a) Mostre que o processo de Wiener Wt e um processo de difus ao homog eneo com coeciente de tend encia nulo e coeciente de difus ao unit ario. V ARs,x [Xs+ Xs] = b(s, x) + o(),
43
b) Mostre que Xt = x0 + Wt , com x0 e constantes, que e um processo de Wiener (n ao-padr ao), e um processo de difus ao homog eneo com coeciente de tend encia nulo e coeciente de difus ao 2 . c) Mostre que Zt = x0 + t + Wt , com x0 , e constantes, chamado movimento browniano com tend encia (em ing es brownian motion with drift) e um processo de difus ao homog eneo com coeciente de tend encia e coeciente de difus ao 2 .
5.2
Equa c oes de Kolmogorov
Dado um processo de difus ao {Xt }t[0,d], podemos denir o operador de difus ao 1 2 + b(s, x) 2 . (5.4) D = a(s, x) x 2 x Suponhamos que a(s, x) e b(s, x) s ao fun c oes cont nuas. Seja h(x) uma fun c ao cont nua limitada e, para um t xo com t > s, dena-se u (s, x) = Es,x [h(Xt )]. (5.5) Se u for limitada e cont nua com primeiras e segundas derivadas parciais com respeito a x tamb em limitadas e cont nuas, ent ao u e diferenci avel em s e satisfaz a equa ca o de Kolmogorov regressiva (EKR) u + D u = 0 s com a condi c ao terminal lim u (s, x) = h(x).
st
(5.6)
(5.7)
Uma demonstra c ao rigorosa pode ver-se em [33]. Para isso, recorre-se a um desenvolvimento de Taylor de u em torno de (s, x) 1 . Em teoria, a
h(y)
1 Para dar uma ideia da t ecnica da demonstra ca o, suponhamos para facilitar a nota ca o que existe densidade de transi ca o. Vem u (s, x) = Es,x [h(Xt )] = h(y )p(t, y |s, x)dy . Usando as equa co es de Chapman-Kolmogorov para decompor R a transi ca o entre s e t nas transi co es entre s e s + (com > 0) e entre s + e t, temos u (s, x) = h(y ) p(t, y |s + , z )p(s + , z |s, x)dzdy . Fa camos agora um desenvolvimento de Taylor de primeira ordem em s e de segunda ordem em x, p 2 p p(t, y |s + , z ) = p(t, y |s, x) + p + (z x) x +1 (z x)2 x 2 + resto (as derivadas s 2 parciais s ao calculadas no ponto (s, x)), e substituamos na express ao anterior. Vem p u (s, x)= u (s, x) + h(y ) p dy + Es,x [Xs+x] h(y ) x dy + 1 E [(Xs+x)2 ] s 2 s,x
dy + resto. Dividindo membro a membro por e fazendo 0, vem, x2 desde que se prove que o termo correspondente ao resto tende para zero (e essa e a parte delicada), 0 =
u s
2 p
+ a(s, x) u + x
2 1 u b(s, x) 2 x2
= ( s + D )u . O caso
44
EKR permite determinar as probabilidades de transi c ao pois estas cam univocamente denidas se conhecermos u (s, x) = Es,x [h(Xt )] (solu c ao da EKR) para todas as fun c oes h num conjunto denso no espa co das fun co es cont nuas limitadas. Ou seja, para caracterizar probabilisticamente um processo de difus ao, precisamos apenas dos dois primeiros momentos innit esimais ( unicos que interv em na EKR). H a um m etodo mais f acil de obter as probabilidades de transi c ao no caso de existir densidade de transi c ao p(t, y |s, x) cont nua em s e com primeiras e segundas derivadas parciais relativamente a x tamb em cont nuas em s. De facto, nesse caso, a densidade de transi c ao pode obter-se directamente (para t xo com t > s e y xo) como solu c ao fundamental da EKR p + Dp = 0; (5.8) s por solu ca o fundamental entendemos a que satisfaz a condi c ao terminal lim p(t, y |s, x) = (x y ),
st
(5.9)
onde e a fun c ao delta de Dirac (ver Cap tulo 3). 2 Se tivermos um processo de difus ao homog eneo e usarmos a nota c ao p(, y |x) = p(t, y |t , x) (n ao depende de t), agora os coecientes de 1 2 tend encia e difus ao n ao dependem do tempo, D = a(x) x +2 b(x) x 2, e, como s = t implica s = , obtemos para EKR e para condi c ao terminal lim p(, y |x) = (x y ).
0
+ D p(, y |x) = 0
(5.10)
(5.11)
Neste caso homog eneo, vem tamb em (ver (5.5)) que u(, x) := u (t , x) = Et,x [h(Xt )] = E0,x [h(Xt(t ) )] = E0,x [h(X )]. Logo, de (5.6) e (5.7), resulta que u(, x) := E0,x [h(X )] (5.12)
< 0 tamb em pode ser tratado com alguns ajustamentos. A condi ca o terminal e consequ encia das propriedades de h e de se ter Es,x [h(Xs )] = h(x). 2 A demonstra ca o e semelhante a ` feita para (5.6), mas agora parte-se de p(t, y |s, x) = p(t, y |s + , z )p(s + , z |s, x)dz . A condi ca o terminal resulta de a distribui ca o de transi ca o entre o instante s e ele pr oprio ter toda a massa de probabilidade concentrada em x, pelo que a densidade de probabilidade de transi ca o entre s e s n ao e pr opria (n ao existe no sentido corrente).
Introdu c ao ` as EDE e aplica c oes satisfaz para 0 a EKR com a condi c ao terminal lim u(, x) = h(x).
0
45
u + Du = 0
(5.13)
(5.14)
Tamb em existe uma equa ca o de Kolmogorov progressiva (EKP) para a densidade de transi c ao p(t, y |s, x) no caso de ela existir e ter derivadas 2 (a(t,y )p) (t,y )p) parciais p e (b cont nuas. Para s xo tal que s < t e x t , y y 2 xo, a densidade de transi c ao e a solu c ao fundamental da EKP, tamb em chamada equa ca o de Fokker-Planck ou equa ca o de difus ao 3 : 1 2 p + (a(t, y )p) (b(t, y )p) = 0. t y 2 y 2 (5.15)
Por solu c ao fundamental entende-se a que satisfaz a condi c ao inicial lim p(t, y |s, x) = (x y ).
ts
(5.16)
Se existir a densidade de probabilidade n ao-condicional p(t, y ) = fXt (y ) (f.d.p. da distribui c ao de Xt ) e tiver derivadas parciais p t ,
(t,y )p) e (b cont nuas, ela tamb em satisfaz a EKP (5.15) mas y 2 com condi c ao inicial lim p(t, y ) = p(s, y ). (5.17) ts (a(t,y )p) y
2
Quando o processo de difus ao e homog eneo, se usarmos a nota c ao p(, y |x) = p(s + , y |s, x) (n ao depende de s), obtemos para EKP p(, y |x) 1 2 + (a(y )p(, y |x)) (b(y )p(, y |x)) = 0 y 2 y 2 (5.18)
3 A t ecnica de demonstra ca o e an aloga a ` da EKR (5.8) mas partindo de p(t, y |s, x) = p(t, y |t , z )p(t , z |s, x)dz , isto e, decompondo a transi ca o entre s e t nas transi co es entre s e t (com > 0) e entre t e t (olha-se para o que se passa na vizinhan cado presente t, ao contr ario do que se fazia na EKR que olhava para a vizinhan cado passado s). Depois faz-se um desenvolvimento de Taylor de p(t , z |s, x)dz .
46 e para condi c ao terminal
lim p(, y |x) = (x y ).

0
(5.19)
interessante ver se o processo de difus E ao homog eneo tem uma densidade invariante ou densidade de equil brio p(y ) que, como o nome indica, seja invariante em rela c ao ao tempo, isto e, tal que, se a f.d.p. de X0 for p(y ), ent ao ser a tamb em p(y ) a f.d.p. de Xt para todo o t I . Se (y ) = 0, ela ser a solu c ao existir, ela ter a de satisfazer (5.15) e, como p t da equa c ao diferencial ordin aria d 1 d2 (a(y )p(y )) (b(y )p(y )) = 0. dy 2 dy 2 (5.20)
Existindo distribui c ao invariante p(y ), mais interessante e ver o que se passa com a densidade (suposta existente) p(t, y ) = fXt (y ) de Xt quando a distribui c ao inicial de X0 e diferente da distribui c ao invariante. E particularmente interessante saber se, quando t +, a distribui c ao de Xt converge para a distribui c ao invariante. Se isso suceder, diremos que p(y ) = fX+ (y ) e a densidade estacion aria e podemos chamar X+ a uma v.a. cuja distribui c ao tenha essa f.d.p. Nesse caso Xt converge em distribui ca o para X+ , isto e, FXt (y ) FX+ (y ) (claro que y e a f.d. de X+ ). Quando existe densidade estaFX+ (y ) = p(z )dz cion aria, e habitual, dadas condi c oes de regularidade adequadas, que Xt seja um processo erg odico, o que signica basicamente que os momentos amostrais (m edias ao longo da traject oria de certas fun c oes de Xt ) convergem (quando o intervalo de tempo envolvido na m edia tende para +) para os correspondentes momentos de conjunto da distribui cao estacion aria (esperan cas matem aticas dessas fun c oes de X+ ). Isso facilita bastante pois evita estimar os momentos de conjunto atrav es da utiliza c ao de muitas traject orias calculando m edias para o conjunto das traject orias. Ora, e frequente em muitas aplica c oes n ao podermos repetir a experi encia e, portanto, dispormos apenas de uma traject oria. Por exemplo, as taxas de juro de curto prazo ou a evolu c ao do tamanho de uma popula c ao natural num certo per odo de tempo n ao podem ser repetidas para outros cen arios do mercado ou estados da natureza aleatoriamente escolhidos. S o dispomos de uma u nica traject oria. Se, por em, houver ergodicidade, os momentos amostrais ao longo dessa u nica traject oria permitem estimar os momentos de conjunto. Isso permite utilizar m etodos estat sticos em muitas aplica c oes em que o fen omeno din amico pode ser modelado por um processo de difus ao (como seja o caso de fen omenos modelados por equa c oes diferenciais estoc asticas satisfazendo
47
certas condi c oes de regularidade). No caso do processo de Wiener W (t), que e processo de difus ao homog eneo com coeciente de tend encia nulo e coeciente de difus ao unit ario, a EKR e a EKR para a densidade de transi c ao p(t, y |s) t em o mesmo aspecto 1 2 p(t, y |x) = (p(t, y |x)). (5.21) t 2 y 2 Utilizando a solu c ao fundamental desta equa c ao ` as derivadas parciais, conhecida por equa ca o do calor (d a a evolu c ao da intensidade do calor quando se propaga ao longo de um eixo), obtemos para densidade de transi c ao de W (t) p(t, y |x) = (2t)1/2 exp (y x)2 2t (5.22)
(note-se que a solu c ao e determinada a menos de uma constante multiplicativa, que se obt em atendendo a que se trata de uma densidade e, portanto, tem de vir R p(t, y |x)dy = 1). Este resultado mostra que, como j a sab amos por (4.3), W (t + s)|(W (s) = x) N (x, t). (5.23)
As equa c oes de Kolmogorov permitem reduzir o problema probabil stico da determina c ao das densidades de transi c ao de um processo de difus ao ao problema determin stico de resolu c ao de uma equa c ao ` as derivadas parciais. Como as solu c oes das equa c oes diferenciais estoc asticas s ao, sob certas condi c oes de regularidade, processos de difus ao, a caracteriza c ao probabil stica das suas solu c oes (as suas probabilidades de transi c ao) ca assim reduzida a um problema determin stico. Mas tamb em, inversamente, algumas quest oes relevantes sobre teoria das equa c oes ` as derivadas parciais de difus ao t em avan cado gra cas ao estudo por m etodos probabil sticos das propriedades dos processos de difus ao (ou solu c oes de equa c oes diferenciais estoc asticas) a elas associados. Dito isto, geralmente e dif cl obter solu c oes das equa c oes de Kolmogorov, mesmo que por m etodos num ericos, sendo por vezes prefer vel usar m etodos de simula c ao. O leitor pode fazer a experi encia de tentar obter atrav es da solu c ao fundamental da EKP a express ao das densidades de transi c ao do movimento browniano com tend encia Z (t) = x0 + t + W (t) (x0 , e constantes), que e um processo de difus ao homog eneo com coeciente de tend encia constante e coeciente de difus ao constante 2 . Neste caso relativamente feliz e poss vel, mas d a algum trabalho, encontrar a solu c ao expl cita. Porventura, se o leitor soubesse apenas o coeciente de tend encia e de difus ao e n ao soubesse
48
a rela c ao de Z (t) com o processo de Wiener, seria este o caminho que seria tentado a tomar, pelo menos nesta fase do estudo. Encontrando a solu ca o, verica que ela e a densidade de uma distribui c ao normal e que Z (t + s)|(Z (s) = x) N (x + t, 2 t). (5.24)
Mas certamente que chegar a a este resultado muito mais facilmente usando as propriedades do processo de Wiener, o que deixamos como exerc cio. Claro que, agora que conhece a solu c ao, n ao ser a dif cil mostrar que ela e a solu c ao fundamental da EKP. Em todo o caso, as equa c oes de Kolmogorov s ao um importante instrumento para o estudo te orico dos processos de difus ao e, portanto, das equa c oes diferenciais estoc asticas.
5.3
Caso multidimensional
O estudo pode ser estendido a processos de difus ao n-dimensionais X(t) = [X1 (t), ..., Xn (t)]T . Agora o coeciente de tend encia e um vector ndimensional a(s, x) cujas coordenadas s ao os coecientes de tend encia dos processos unidimensionais constituintes. O coeciente de difus ao e uma matriz b(s, x) de elementos bi,j (s, x) = lim Es,x
0+
(Xi (s + ) xi ) (Xj (s + ) xj ) .
O operador de difus ao e 1 + D= ai (s, x) x 2 i i=1 A EKP toma a forma p 1 + (ai (t, y)p) t i=1 yi 2
n n n n n n
bij (s, x)
i=1 j =1
2 . xi xj
i=1 j =1
2 (bij (t, y)p) = 0. yi yj
Suponhamos que s ao largadas na atmosfera part culas de um poluente. Devido aos choques com as mol eculas do ar, elas difundem-se, mas, se houver vento, h a, al em disso, um movimento tendencial na direc c ao do vento. Seja bij (s, x) a velocidade de altera c ao da covari ancia (da vari ancia se i = j ) entre os movimentos devidos ` a difus ao nas direc c oes de xi e xj no local x e no instante s. Seja a(s, x) o vector velocidade do vento no local x no instante s. Ent ao a posi c ao X(t) da part cula no instante t ser a um processo de difus ao a n = 3 dimens oes com coeciente de tend encia
49
a(s, x) e coeciente de difus ao b(s, x). Frequentemente, e razo avel supor que a matriz b(s, x) e o produto de uma fun c ao escalar (s, x) pela matriz identidade (isotropia da difus ao da part cula nas v arias direc c oes do espa co); admite-se que (s, x) possa depender do instante s e do local x pois as condi c oes de temperatura e outras que possam afectar a difus ao podem variar com o local e o tempo. Resolvendo uma das equa c oes de Kolmogorov podemos ober a f.d.p. p(t, y) de X(t), que ser a assim a f.d.p. no instante t para uma part cula ser encontrada no local y. Se for largado um n umero muito grande N de part culas, ent ao, no instante t, o n umero de part culas localizadas num pequeno volume V ` a volta do local y ser a aproximadamente p(t, y)N V . Problema an alogo ocorre com a forma como se espalha petr oleo derramado no oceano.
50
Cap tulo 6
Integrais estoc asticos

6.1 Deni c ao informal dos integrais de It o e Stratonovich
O modelo de Black-Scholes (3.4) e um caso particular de uma equa c ao diferencial estoc astica. Mas podemos pensar em situa c oes mas gerais. Neste livro vamos estudar equa co es diferenciais estoc asticas (EDE) num intervalo de tempo [0, d] (d > 0) da forma dX (t) = f (t, X (t))dt + g (t, X (t))dW (t) X (0) = X0 , (6.1)
onde f (s, x) e g (s, x) s ao fun c oes reais com dom nio [0, d] R e X0 e uma v.a. (condi c ao inicial) independente do processo de Wiener W (t). A condi c ao inicial pode, em particular, ser uma v.a. degenerada que assuma um valor real constante x0 com probabilidade um. Equa c oes deste tipo aparecem nos mais variados dom nios da Ci encia e da Tecnologia, sempre que queremos modelar um fen omeno com din amica descrita por uma equa c ao diferencial que seja perturbado por utua c oes aleat orias (desde que estas possam, ainda que aproximadamente, considerar-se cont nuas no tempo e com incrementos independentes). Como sucede tamb em com as equa c oes diferenciais ordin arias (EDO), o problema de Cauchy (6.1) n ao e mais que uma equa c ao integral disfar cada:
t t
X (t) = X0 +
0
f (s, X (s))ds +
0
g (s, X (s))dW (s).
(6.2)
Entende-se por solu ca o X (t) = X (t, ) de (6.1) um processo estoc astico 51
52
Cap tulo 6 - Integrais estoc asticos
que satisfa ca a equa ca o integral estoc astica (6.2), que n ao e mais que a forma integral da EDE. No caso das EDO, a equa c ao integral obt em-se por integra c ao membro a membro da EDO. Aqui, a deni c ao de solu c ao da EDE como sendo a solu c ao da sua forma integral e a mais natural, j a que as derivadas do processo de Wiener W (t) e, portanto, de X (t), n ao existem no sentido corrente do termo, apenas existem como processos estoc asticos generalizados. Esta deni c ao de solu c ao exige, contudo, que os integrais em (6.2) estejam bem denidos. Quanto ao primeiro integral 0 f (s, X (s, ))ds, podemos xar o acaso (cen ario do mercado, estado da natureza, ...) = 0 , caso em que se torna (supondo que f e uma fun c ao sucientemente bem comportada) t um integral de Riemann 0 F (s, 0 )ds com F (s, ) = f (s, X (s, )); o seu valor depender a do valor de = 0 e, portanto, o integral e uma v.a. (fun c ao mensur avel de ). Ser a que este truque resulta para o integral 0 g (s, X (s, ))dW (s, ), t usando agora integrais de Riemann-Stieltjes 0 G(s, 0 )dW (s, 0 ) com G(s, ) = g (s, X (s, ))? A reposta e negativa, pois estes alegados integrais de Riemann-Stieltjes (RS) n ao existem como tal. De facto, a deni c ao usual de integral RS como limite comum (quando o di ametro das decomposi c oes de [0, t] tende para zero) de todas as somas de Riemann-Stieltjes (somas RS) n ao funciona porque escolhas diferentes dos pontos interm edios da fun c ao integranda produzem limites diferentes. A raz ao reside no facto de a fun c ao integradora, o processo de Wiener W (t), ser q.c. de varia c ao ilimitada. Assim, faz falta uma deni c ao diferente do segundo integral de (6.2). Neste Cap tulo iremos denir integrais da forma abreviadamente
t t 0 t t
G(s, )dW (s, ),
G(s)dW (s),
0
para fun c oes bastante gerais G. Mas primeiro vamos mostrar ao leitor, com um exemplo, que a deni ca o de RS do integral n ao funciona aqui. Consideremos para isso o caso particular de G(s) = W (s) e tentemos determinar o integral t W (s)dW (s). 0 Se se aplicassem as regras usuais de c alculo, o leitor, notando que W (0) = 0, diria imediatamente que o integral seria igual a 1 2 W (t). 2
Introdu c ao ` as EDE e aplica c oes Ser a? Consideremos decomposi c oes 0 = tn,0 < tn,1 < ... < tn,n1 < tn,n = t (n = 1, 2, ...)
53
(6.3)
do intervalo de integra c ao [0, t] e suponhamos que os seus di ametros n = maxk=1,...,n (tn,k tn,k1 ) 0 quando n +. Para cada subintervalo [tn,k , tn,k1 ] da decomposi c ao, seja n,k um ponto situado nesse intervalo (chamemos-lhe ponto interm edio). As somas RS tomam a forma
n
k=1
W (n,k ) (W (tn,k ) W (tn,k1 )) .
(6.4)
Vamos ver quais os limites destas somas RS quando n +. As somas s ao v.a. e escolheremos limites em m edia quadr atica (limites m.q., que s ao limites na norma L2 ), representando tais limites por l.i.m.. Se escolhermos para pontos interm edios os pontos iniciais de cada sub-intervalo, n,k = tn,k1 , obtemos as somas RS
n
Sn =
k=1
W (tn,k1 ) (W (tn,k ) W (tn,k1 ))
(6.5)
e, no limite m.q., o integral n ao-antecipativo, chamado integral de It o:

t
I=
0
W (s)dW (s) = l.i.m. Sn .
(6.6)
Note que em (6.5) os valores da fun c ao integranda (que, quando trabalharmos com EDE, medem o impacto das utua c oes aleat orias no fen omeno por elas descrito) s ao independentes dos futuros incrementos W (tn,k ) W (tn,k1 ) do processo integrador de Wiener, os quais descrevem as perturba c oes aleat orias (por exemplo, as perturba c oes dos mercados nanceiros) no sub-intervalo de tempo (tn,k tn,k1 ]. Sendo independentes, n ao os antecipam, n ao os adivinham. Usar o integral de It o e uma forma de dizer que o comportamento presente do fen omeno n ao depende das futuras perturba coes aleat orias (aus encia de capacidades adivinhat orias). O integral de It o, contudo, n ao segue as regras usuais de c alculo. Com efeito, vem
t
I=
0
W (s)dW (s) =
1 W 2 (t) t . 2
(6.7)
54
Cap tulo 6 - Integrais estoc asticos Para mostrar que isso e verdade, precisamos de mostrar que E Sn 1 W 2 (t) t 2
n k=1 n k=1 2
0 W 2 (tn,k ) W 2 (tn,k1 ) e,
2
1 2 portanto, Sn 1 2 W (t) t = 2 n
quando n +. Note que W 2 (t) =
1 = 2 k=1 hn,k , com hn,k = (W (tn,k ) W (tn,k1 )) (tn,k tn,k1 ). Como os hn,k (k = 1, 2, ..., n) s ao independentes e E [hn,k ] = 0, obtemos
(W (tn,k ) W (tn,k1 ))2 t

2
4E
k
V AR [hn,k ] = 2
Sn
1 2
W 2 (t) t
= E (
2
hn,k )
= V AR [
hn,k ] =
k (tn,k tn,k1 )
2n t 0, conforme pretendido.
Se, por em, escolhermos como pontos interm edios de cada sub-intervalo [tn,k1 , tn,k ] os pontos terminais n,k = tn,k , obtemos as somas RS
n + Sn = k=1
W (tn,k ) (W (tn,k ) W (tn,k1 ))
(6.8)
e, no limite m.q., o integral (que e antecipativo)

+ I + = l.i.m. Sn =
1 W 2 (t) + t . 2
(6.9)
Este integral tamb em n ao segue as regras usuais de c alculo. Exerc cio: Demonstre (6.9). Obtenha tamb em os integrais I () correspondentes aos limites m.q. das somas RS quando se escolhem como pontos interm edios n,k = (1 )tn,k1 + tn,k para 0 1. Note que I = I (0) e que I + = I (1) . O ponto importante e que diferentes somas RS (correspondentes a diferentes escolhas dos pontos interm edios) produzem diferentes limites m.q. das somas RS e, portanto, n ao existe integral de RiemannStieltjes. Ser a que a situa c ao se mant em se trabalharmos com outro tipo de converg encia (como a converg encia em probabilidade ou a converg encia quase certa, por exemplo)? A resposta e negativa pois, como se sabe, se esses limites existissem teriam de coincidir com os limites m.q. e, portanto, tamb em variariam com a escolha dos pontos interm edios. H a, assim, uma innidade de variedades de integrais estoc asticos, das quais o integral de It o, apesar de n ao seguir as regras usuais de c alculo, e usualmente a preferida na literatura por causa da sua aus encia de capacidades adivinhat orias (o que parece mais adequado na mode-
55
la c ao de fen omenos naturais) e pelas boas propriedades probabil sticas que iremos estudar. Outra variedade de integral estoc astico que iremos considerar por parecer ser a mais adequada em certas circunst ancias e o integral de Stratonovich
+ 1 Sn + Sn = W 2 (t), 2 2 0 0 (6.10) o qual e antecipativo e n ao tem as boas propriedades probabil sticas do integral de It o, mas segue as regras usuais de c alculo. Aplica-se tamb em a uma classe mais restrita de fun c oes integrandas. Deixaremos o integral de Stratonovich para mais tarde, pois s o o vamos considerar para fun c oes integrandas que sejam solu c oes de equa c oes diferenciais estoc asticas, e vamos ocupar-nos do estudo do integral de It o. t t
(S )
W (s)dW (s) =
W (s) dW (s) = l.i.m.
Obtiv emos acima o integral de It o para uma fun c ao integranda especial W (t). O mesmo tipo de deni c ao e aplic avel para fun c oes integrandas arbitr arias G(s, ) desde que sejam n ao-antecipativas (isto e, em cada instante t, a fun c ao seja independente dos incrementos futuros do processo de Wiener) e sejam cont nuas em m edia quadr atica (cont nuas m.q.). Para este caso, podemos denir o integral de It o como
t n
I (G) =
0
G(s)dW (s) = l.i.m.

k=1
G(tn,k1 ) (W (tn,k ) W (tn,k1 )) .
(6.11) No entanto, h a necessidade de construir o integral de It o para uma classe mais ampla de fun c oes que podem n ao ser cont nuas m.q., generali o que faremos na Sec zando a deni c ao anterior. E c ao 6.2. O leitor menos interessado nas quest oes t ecnicas poder a contentar-se com a deni c ao de integral para fun c oes cont nuas m.q. e, na leitura da Sec c ao 6.2, limitar a aten c ao ` as principais conclus oes sobre as propriedades do integral.
6.2
Constru c ao do integral de It o
Consideremos um processo de Wiener padr ao W (t) = W (t, ) (t 0) num espa co de probabilidade (, F , P ) e seja Ms = (W (u), 0 u s) (s 0) a sua ltra c ao natural. O objectivo e o de denir o integral de It o num intervalo de tempo [0, t] (t 0). Dizemos que {As }s[0,t] e uma ltra ca o n ao-antecipativa se, para 0 s t, As Ms e As for independente dos incrementos futuros W (u) W (s) (u s) do processo de Wiener (o mesmo e dizer, independente da algebra- (W (u) W (s), u s)). Usualmente escolhe-se para {As }s[0,t] a
56
pr opria ltra c ao natural {Ms }s[0,t] , mas h a por vezes necessidade de incluir informa c ao adicional ` a do processo de Wiener (por exemplo, quando considerarmos a informa c ao da condi c ao inicial duma EDE) e da a raz ao de se poder escolher uma ltra c ao maior, desde que, tal como sucede na ltra c ao natural, n ao antecipemos os incrementos futuros do processo de Wiener. Seja a medida de Lebesgue no intervalo [0, t]. 1 Vamos agora denir a classe de fun c oes integrandas com que vamos trabalhar. Seja G(s, ) (usualmente abrevia-se a nota c ao para G(s)) um fun c ao de dom nio [0, t] com valores em R conjuntamente mensur avel com respeito a ambas as vari aveis (s, ) 2 . Obviamente, {G(s)}s[0,t] e um processo estoc astico. E costume cometer o abuso de linguagem de identicar duas fun c oes conjuntamente mensur aveis que sejam quase iguais com respeito ` a medida produto P (elas s ao quase iguais quando o conjunto dos pontos (s, ) para os quais as duas fun c oes diferem tem medida P nula). Esta identca c ao signica que, na realidade, vamos trabalhar com as classes de equival encia destas fun c oes com respeito ` a rela ca o de quase igualdade, mas que, para simplicar a linguagem, em vez de falarmos de uma determinada classe de equival encia, falamos de uma qualquer das fun c oes representantes da classe (isto e, pertencentes a classe). ` Assim, podemos denir o espa co L2 de fun c oes (rigorosamente dev amos falar de classes de equival encia de fun c oes) conjuntamente mensur aveis G tais que [0,t] |G(s, )|2 d( P ) < +; note-se que, pelo teorema de Fubini,
t 0
espa co L2 com respeito ` a E[|G(s)|2 ]ds medida produto P , e, portanto, e um espa co de Hilbert com norma -
t 2 [0,t] |G(s, )| d(P ) = 0 t e um = E 0 |G(s)|2 ds . Este
|G(s, )|2 dP ( ) ds =
1 Uma medida denida num espa co mensur avel (, F ) e uma fun ca o de F em [0, +] aditiva- tal que () = 0. (, A, ) diz-se um espa co de medida. Note-se que uma probabilidade e um caso particular de medida, que satisfaz a propriedade suplementar de ser normada. A medida de Lebesgue e uma extens ao do conceito de comprimento. A medida de Lebesgue em [0, t] pode ser denida para os conjuntos de Borel B B[0,t] de [0, t] (pode provar-se que existe uma e uma s o medida nestes conjuntos de Borel tal que a medida de qualquer intervalo contido em [0, t] e o seu comprimento). Temos ent ao o espa co de medida ([0, t], B[0,t] , ), que pode ser estendido por completa ca o a um espa co de medida ([0, t], M[0,t] , ). A completa ca o consiste em tomar para M[0,t] a classe dos conjuntos da forma B N (com B B[0,t] e N qualquer subconjunto de um conjunto de Borel de medida nula) e estender a medida a esses conjuntos pondo (B N ) = (B ). 2 Isto signica que a imagem inversa por G de qualquer conjunto de Borel pertence a `a lgebta- produto B[0,t] F .
Introdu c ao ` as EDE e aplica c oes L2 G

2 1/2
57
=
0
E[|G(s)|2 ]ds E[G1 (s)G2 (s)]ds .
(6.12)
e produto interno G1 , G2
t 0
Dizemos que uma fun c ao conjuntamente mensur avel G e uma fun ca o n ao-antecipativa -As se estiver adaptada a As , isto e, se, para todo o s [0, t] xo, G(s, .) for, como fun c ao de , mensur avel-As. No caso de ser claro qual e a ltra c ao As ou no caso de ser a ltra c ao natural do processo de Wiener, e costume abeviar para fun c ao n ao-antecipativa. Da deni c ao resulta que as fun c oes n ao-antecipativas s ao, em cada instante s, independentes dos incrementos futuros W (u) W (s) (u s) do processo de Wiener. Recordamos que, quando na Sec c ao 6.1 den amos t o integral de It o 0 W (t)dW (t) como limite m.q. das somas RS (6.5), o car acter n ao-antecipativo do integral, que era essencial, resultava de o valor W (tn,k1 ) da fun c ao integranda ser independente dos incrementos (futuros) W (tn,k ) W (tn,k1 ) do processo integrador. Se G for n ao-antecipativa, esta propriedade mant em-se quando substituirmos, em (6.5), W (tn,k1 ) por G(tn,k1 ) e est a aberto o caminho ` a deni c ao do t integral de It o 0 G(s)dW (s). A fam lia de fun c oes integrandas que iremos adoptar e precisamente a fam lia das fun c oes G (rigorosamente dev amos falar de classes de equival encia de fun c oes) conjuntamente mensur aveis do espa co L2 que sejam n ao-antecipativas-As. Vamos representar esta fam lia, que e um espa co de Hilbert, por H 2 [0, t]. Vamos seguir um caminho tradicional na constru c ao de um integral, que e o de o denir para fun c oes mais simples e depois generalizar por continuidade. Come caremos por denir o integral de It o para fun co es em escada (alguns tamb em lhe chamam fun c oes simples), que s ao fun c oes G H 2 [0, t] constantes (relativamente ` a vari avel tempo s mas n ao relativamente ` a vari avel acaso ) nos sub-intervalos de alguma decomposi c a o 0 = t0 < t1 < ... < tn = t do intervalo [0, t], isto e G(s, ) = G(tk1 , ) para 2 todo o s [tk1 , tk ) (k = 1, ..., n). Representemos por HE [0, t] o espa co destas fun c oes em escada, que e um subespa co vectorial de H 2 [0, t]. A deni c ao do integral de It o para tais fun c oes ea obvia:
t n
I (G) =
0
G(s)dW (s) :=
k=1
G(tk1 ) (W (tk ) W (tk1 )) .
(6.13)
Note-se que, como estas fun c oes em escada s ao constantes em cada sub-
58
intervalo, seria indiferente usar como ponto interm edio para o c alculo da fun c ao integranda o ponto inicial ou qualquer outro ponto do subintervalo, pelo que para estas fun c oes n ao h a distin ca o entre o integral de It o e os outros tipos de integral estoc astico.
t0=0
t1
t2
t3
t4=t
Figura 6.1: Exemplo de gr aco de uma fun c ao em escada G(s, ) com n = 4 para xo. Se mud assemos para outro valor de , a altura dos degraus mudaria mas os pontos t0 , t1 , t2 , t3 , t4 manter-se-iam. Nota: Note-se tamb em que o integral depende de , isto e, trata-se de uma v.a. Como o integral est a denido n ao propriamente para a fun c ao G (esse e o abuso de linguagem) mas para a classe de equival encia a que ela pertence, quando substitui a fun c ao G, que est a a representar a classe a que pertence, por outra fun c ao representante da mesma classe (isto e, por uma fun c ao quase igual a G), vai obter como integral outra v.a. Mas essa outra v.a. e q.c. igual ` a primeira, isto e, difere da primeira num conjunto de valores de com probabilidade nula. Por isso, consideramos o integral denido a menos de uma quase igualdade. Identicando, como e habitual, v.a. quase iguais, isto e, trabalhando com classes de equival encia de v.a., o integral ca univocamente denido. Neste sentido, rigorosamente, o integral e uma aplica c ao I que transforma uma classe de equival encia de fun c oes G numa classe de equival encia de v.a. I (G) e, como dissemos, nesse sentido e uma aplica c ao univocamente denida. Na pr atica, por em, n os abusamos da linguagem e falamos do integral de uma fun c ao G (que representa a sua classe de equival encia) como sendo
59
a v.a I (G) denida em (6.13) (v.a que representa a sua classe de equival encia). Mas, ao abusar da linguagem, temos de ter sempre presente que n ao devemos fazer distin c ao entre fun c oes G quase iguais nem entre v.a. quase iguais. Exerc cio: Mostre que a deni c ao anterior e consistente no sentido de, se aplicar (6.13) usando duas diferentes decomposi c oes de [0, t] onde assente a mesma fun c ao em escada, obt em o mesmo valor para o seu integral. Para isso conv em notar que a mesma fun c ao em escada pode tamb em assentar na decomposi c ao obtida por fus ao das duas decomposi c oes (a que tem como pontos de decomposi c ao os de ambas as decomposi c oes iniciais). Exerc cio: Mostre que o integral de fun c oes em escada e uma aplica ca o linear, isto e, dadas constantes reais 1 e 2 , vem I (1 G1 + 2 G2 ) = 1 I (G1 ) + 2 I (G2 ). (6.14)
Note que, fundindo as decomposi c oes onde assentam G1 e G2 , obt em uma decomposi c ao onde ambas assentam e onde assenta a sua combina c ao linear 1 G1 + 2 G2 .
2 Dada uma fun c ao em escada G HE [0, t], vem
E[I (G)] = 0.
(6.15)
De facto, basta olhar para (6.13) e atender a que a esperan ca matem atica de cada parcela da soma e, devido ` a independ encia entre G e os incrementos futuros do processo de Wiener, o produto das esperan cas matem aticas dos dois factores, uma das quais e obviamente nula. S o h a que ter um cuidado, que e o de garantir que E[G(tk1 )] existe e e nita, isto e, E[|G(tk1 )|] < +. De facto, por deni c ao, para qualquer fun c ao G H 2 [0, T ], seja ou n ao fun c ao em escada, tem-se t 2 2 0 E[|G| (s)]ds < +, o que implica que E[|G(s)| ] (e, portanto, tamb em E[|G(s)|]) e nito para quase todos os valores de s [0, t] (ou seja, o conjunto dos valores de s para os quais isso pode falhar tem medida de Lebesgue nula). No espa co de probabilidade (, F , P ), recordamos que design amos por L2 o espa co de Hilbert das v.a. X (rigorosamente, o espa co das suas classes de equival encia para a rela c ao de quase igualdade) com norma-L2 2 1/2 2 X 2 = (E[|X | ]) nita. Para uma fun ca o em escada G HE [0, t], o
60
integral I (G) pertence a L2 . De facto, tem-se que ( I (G) 2 )2 = E[(I (G))2 ] = V AR[I (G)] =
0 t
E[|G(s)|2 ]ds = ( G
2 )
(6.16) 2 e nita. Isto mostra que o integral I (.) e uma aplica c ao linear de HE [0, t] 2 em L que preserva a norma (e, portanto, e cont nua). Incidentemente, (6.16) diz-nos que a vari ancia do integral estoc astico e um vulgar integral (determin stico) de Riemann do momento de segunda ordem da fun c ao integranda. Usando o facto de G ser independente dos incrementos futuros do processo de Wiener e de este ter incrementos independentes, facilmente se reconhece que (6.16) e verdadeira; com efeito, E[(I (G))2 ] = k E G2 (tk1 ) E (W (tk ) W (tk1 ))2 + 2 k i<k E [G(ti1 )] E [G(tk1 ) (W (ti ) W (ti1 )) (W (tk ) W (tk1 ))] = t 2 2 k E G (tk1 ) (tk tk1 ) + 0 = 0 E[G (s)]ds. A parte cr tica da constru c ao do integral de It o para fun c oes G H 2 [0, t] consiste em mostrar que existe uma sucess ao aproximadora de 2 fun co es em escada Gn HE [0, t] (n = 1, 2, ...) convergente em norma L2 para G, isto e, tal que
t 0
E |Gn (s) G(s)|2 ds 0 quando n +.
(6.17)
Deixamos a demonstra c ao para a Sec c ao 6.3. O leitor menos interessado nos detalhes t ecnicos pode sem preju zo de maior saltar a Sec c ao 6.3. 2 Com este resultado, conclui-se que HE [0, t] e denso em H 2 [0, t]. A t c oes em escada sucess ao dos integrais I (Gn ) = 0 Gn (s)dW (s) das fun aproximadoras e uma sucess ao de Cauchy no espa co L2 . Com efeito, Gn e convergente e, portanto, uma sucess ao de Cauchy em H 2 [0, t]. Como a aplica c ao I (.) preserva a norma, I (Gn ) e uma sucess ao de Cauchy em L2 . Como L2 e completo, a sucess ao I (Gn ) converge na norma de L2 , isto e, converge em m edia quadr atica. Por deni c ao, o integral de It o de G,
t
I (G) =
0
G(s)dW (s) := l.i.m. I (Gn ),
(6.18)
e precisamente esse limite m.q. Exerc cio: Mostre que esta deni c ao do integral de It o de fun c oes G
Introdu c ao ` as EDE e aplica c oes H 2 [0, t] e consistente em dois sentidos:
61
a) N ao depende da sucess ao aproximadora de fun c oes em escada, isto e, dadas duas sucess oes aproximadoras Gn e G c oes em n de fun escada, vem l.i.m. I (Gn ) = l.i.m. I (G ) q.c. Sugest a o: Combine n as duas sucess oes numa sucess ao u nica com termos alternadamente de uma e de outra e use a unicidade do limite m.q. b) N ao se altera (a menos de uma quase igualdade) se substituirmos G por outra fun c ao quase igual G H 2 [0, t]. Isto e, I (G) = I (G ) q.c. Vemos, pois, que, rigorosamente, o integral transforma classes de equival encia de fun c oes G em classes de equival encia de v.a., como j a t nhamos referido no caso das fun c oes em escada. Exerc cio: Utilizando as propriedades an alogas j a demonstrada para fun c oes em escada, mostre que o integral de It o para fun c oes integrandas em H 2 [0, t] satisfaz as seguintes propriedades: uma aplica a) E c ao linear, isto e, dadas fun c oes G1 , G2 H 2 [0, t] e constantes reais 1 e 2 , vem I (1 G1 + 2 G2 ) = 1 I (G1 ) + 2 I (G2 ). b) Esperan ca matem atica nula: E[I (G)] = 0. c) Preserva c ao da norma: ( I (G) 2 )2 = E[(I (G))2 ] = V AR[I (G)] =
0 t
(6.19)
(6.20)
E[|G(s)|2 ]ds = ( G
2 2 )
(6.21)
Vimos acima que, para fun c oes em escada, o integral I (.) era uma 2 aplica c ao linear de HE [0, t] em L2 que preservava a norma e, portanto, era cont nua. Estendemos por continuidade a deni c ao do integral a fun c oes de H 2 [0, t]. Vimos que o integral de It o estendido a H 2 [0, t] continua a ser uma aplica c ao linear de H 2 [0, t] em L2 e que preserva a norma, pelo que o integral estendido permanece uma aplica ca o cont nua. Logo, dada uma sucess ao Gn (n = 1, 2, ...) de fun c oes de H 2 [0, t] convergente em norma-L2 para G H 2 [0, t], verica-se que I (Gn ) converge na norma L2 (isto e, converge m.q.) para I (G).
62
Tamb em se reconhece que o integral de It o I (G) e uma fun ca o mensur avel -At , pois isso e evidente para os integrais I (Gn ) de fun c oes em escada Gn convergentes para G e I (G) e o limite m.q. (que preserva a mensurabilidade) desses integrais. H a dois casos particulares especialmente interessantes. Um deles e o caso de uma fun ca o G H 2 [0, t] cont nua m.q. 3 Neste caso, pode escolher-se qualquer sucess ao de decomposi c oes 0 = tn,0 < tn,1 < ... < tn,n1 < tn,n = t (n = 1, 2, ...) de [0, t] com di ametros n = maxk=1,...,n (tn,k tn,k1 ) 0 e escadizar G, isto e, escolher como sucess ao de fun c oes em escada aproximadoras a denida por Gn (s) = G(tn,k1 ) para todo o s [tn,k1 , tn,k ). Veremos na Sec c ao 6.3 que esta sucess ao converge para G na norma L2 Usando a sucess ao aproximadora acima denida, a deni c ao (6.18) toma a forma
t n
I (G) =
0
G(s)dW (s) = l.i.m.

k=1
G(tn,k1 ) (W (tn,k ) W (tn,k1 )) .
(6.22) Esta e precisamente a deni c ao (6.11) dada no nal da Sec c ao 6.1 para fun co es n ao-antecipativas cont nuas m.q., que assim ca justicada e que nos d a uma express ao expl cita para o c alculo dos integrais destas fun co es. O outro caso particular interessante e o caso de uma fun ca o G determin stica (isto e, n ao dependente de ), caso em que podemos escolher para fun c oes Gn fun c oes determin sticas. E obvio, de (6.13), que I (Gn ) t tem distribui c ao normal com m edia nula e vari ancia 0 G2 n (s)ds (ver (6.16)). Logo o seu limite m.q. I (G) tem tamb em distribui c ao normal t 2 t G ( s ) ds , isto e ( s ) ds = com m edia nula e vari ancia lim 0 G2 n 0
t 0 t
G(s)dW (s) N
0,
0
G2 (s)ds
se G determin stica.
(6.23)
3 Signica isto que, para qualquer s [0, t], l.i.m. G(s ) = G(s) sempre que s s n n quando n +.
63
6.3
Exist encia de sucess oes aproximadoras de fun c oes em escada
Na Sec c ao 6.2 procedeu-se ` a constru c ao do integral de It o para fun c oes integrandas G H 2 [0, t]. Come cou-se por denir o integral para fun c oes 2 em escada G HE [0, t] e depois estendeu-se por continuidade a fun c oes 2 G H 2 [0, t]. Note-se que HE [0, t] e um subespa co do espa co de Hilbert 2 2 H [0, t] (com a norma L denida em (6.12)). Na extens ao do integral 2 foi crucial o facto de HE [0, t] ser denso em H 2 [0, t], isto e, de, dada uma fun c ao arbitr aria G H 2 [0, t], existir pelo menos uma sucess ao aproxi2 madora de fun c oes em escada Gn HE [0, t] (n = 1, 2, ...) convergente na norma L2 para G. A prova desse facto cou pendente. Apresentamos aqui a sua demonstra c ao (pode ver [3] ou [51], por exemplo, para demonstra c oes semelhantes). Consideremos ent ao uma fun c ao G H 2 [0, t]. Demonstra ca o para fun co es G cont nuas m.q. J a vimos na Sec c ao 6.2 como construir uma sucess ao aproximadora Gn . Como vimos, basta escolher qualquer sucess ao de decomposi c oes 0 = tn,0 < tn,1 < ... < tn,n1 < tn,n = t (n = 1, 2, ...) de [0, t] com di ametros n = maxk=1,...,n (tn,k tn,k1 ) 0 e escadizar G, isto e, escolher como sucess ao de fun c oes em escada aproximadoras a denida por Gn (s) = G(tn,k1 ) para todo o s [tn,k1 , tn,k ). Dado > 0 arbitr ario, como G e uniformemente cont nua m.q. no intervalo fechado [0, t], vem E[(G(t) G(s))2 ] < /t quando |t s| < , onde > 0 e sucientemente pequeno e n ao dependente de s. Podemos escolher um n sucientemente grande e n ao dependente de s de modo a que n < . Determinemos k tal que tn,k1 s < tn,k e escolhamos t = tn,k1 . Vem |t s| < e, portanto, E[(Gn (s) G(s))2 ] = E[(G(t) t G(s))2 ] < /t, donde 0 E[(Gn (s) G(s))2 ]ds < . Isso mostra que a sucess ao Gn acima referida converge para G na norma L2 . Demonstra ca o para fun co es G limitadas Seja |G| M , onde M e uma constante nita. Para facilitar a nota c ao, vamos trabalhar com a extens ao de G(s) ao intervalo de tempo (, +), que e igual a G(s) para s [0, t] e e igual a zero para s /[0, t], extens ao que continuamos a designar pela letra G e que e igualmente limitada por M . + Dena-se Hn (s) = 0 e G(s /n)d (note que n ao e uma fun c ao em escada). Claro que e conjuntamente mensur avel e e n ao-antecipativa (o seu valor no instante s s o depende dos valores de G no instante s
64

+ e d 0 2 +
ou instantes anteriores). Vem Hn (s) M E

t 0 2 Hn (s)ds
= M , pelo que
Para s [0, t], seja h 0. Vem Hn (s+h) = 0 e G(s+h /n)d = nh + e G(s /n)d, pelo que, atendendo ` a conhecida desigualnh e dade (a + b)2 2(a2 + b2 ), vem, quando h 0, (Hn (s + h) Hn (s)) = (enh 1) 2 (enh 1) 2M 2 2M
2 2 + G(s nh e
M t < + e, portanto, Hn H [0, t].
2nh
+ e G(s /n)d nh 2 + (enh 1) nh e d +
/n)d +
0 G(s nh e
+2
0 nh
0 e G(s /n)d nh 2
/n)d =
(e
nh
1) + (e
nh
1)
0.
Isto prova que as fun co es Hn s ao cont nuas em [0, t]. Pelo teorema da 2 converg encia dominada, vem E (Hn (s + h) Hn (s)) 0, pelo que
as fun co es Hn s ao cont nuas m.q. em [0, t]. Tamb em vem Hn (s) G(s) para quase todos os s [0, t] 4 . Logo, aplicando o teorema da converg encia dominada (para a medida t de Lebesgue de [0, t]), vem 0 (Hn (s) G(s))2 ds 0 q.c. Aplicando de novo o teorema da converg encia dominada (para a probabilidade P ) vem E Hn H [0, t] de fun co es cont nuas m.q. (e tamb em cont nuas) que converge para G na norma L2 . Como cada Hn e cont nua m.q., pode ser aproximada por uma sucess ao de fun c oes em escada Gn,m (m = 1, 2, ...). Dado n, seja Hk(n) o primeiro termo da sucess ao Hk (k = 1, 2, ...) que esteja na vizinhan ca1/2n+1 de G (para a norma L2 ), tendo-se ent ao Hk(n) G 2 < 1/2n+1 . Seja Gn := Gk(n),m(k(n)) o primeiro termo da suces ao Gk(n),m (m = 1, 2, ...) que esteja na vizinhan ca-1/2n+1 de Hk(n) , tendo-se ent ao
t 0 (Hn (s) 2
G(s))2 ds 0. Isto mostra que existe uma sucess ao
4 Como consequ encia do teorema de Lusin (ver [52], p. 56-57), como estamos a trabalhar com fun co es mensur aveis limitadas que s ao nulas fora do intervalo [0, t] (que tem medida de Lebesgue nita), dado um n umero natural k , existe uma fun ca o cont nua Jk (s) coincidente com G(s) excepto possivelmente num conjunto Nk com k < +, usando o lema de medida de Lebesgue inferior a 1/2k . Como k 1/2 Borel-Cantelli (adaptado para medidas nitas), conclu mos que e nula a medida de Lebesgue do conjunto dos s que est ao em innitos conjuntos Nk . Logo, para quase todo o s, Jk (s) = G(s) a partir de certa ordem. Se a fun ca o G fosse cont nua, seria o bvio que Hn (s) convergiria para G(s) para todo o s. Assim, s o podemos garantir a converg encia para quase todo o s.
65
Gk(n),m(k(n)) Hk(n) 2 < 1/2n+1 . Ent ao, como Gn G 2 < 1/2n , a sucess ao Gn (n = 1, 2, ...) e uma sucess ao de fun co es em escada que converge para G na norma L2 , o que prova o pretendido. Do facto de se ter E +, conclu mos at e que
t 2 0 (Gn (s) G(s)) ds t 2 0 (Gn (s) G(s)) ds
< 1/2n e de 0 q.c.
1/2n <
Demonstra ca o para fun co es G H 2 [0, t] arbitr arias Para cada n = 1, 2, ... seja se G(s, ) < n n G(s, ) se |G(s, )| n Fn (s, ) = n se G(s, ) > n.
S ao fun c oes limitadas de H 2 [0, t] e e obvio que |Fn (s) G(s)|2 0 e 2 2 2 que |Fn (s) G(s)| 2G (s) (onde G e integr avel P ). Aplicando o teorema da converg encia dominada duas vezes (com respeito ` a medida de t Lebesgue e com respeito a P ), obtemos E 0 (Fn (s) G(s))2 ds 0,
o que mostra que Fn converge na norma L2 para G. Cada Fn pode ser aproximada por uma sucess ao de fun c oes em escada. Ent ao, por racioc nio semelhante ao usado na parte nal do caso anterior, existe uma sucess ao de fun c oes em escada Gn que converge na norma L2 para 2 G, o que conclui a demonstra c ao de que HE [0, t] e denso em H 2 [0, t]. t 2 Vem at e que 0 (Gn (s) G(s)) ds 0 q.c.
6.4
Estudo do integral como fun c ao do limite superior de integra c ao
Seja G H 2 [0, d] e seja [a, b] [0, d]. Como G(s)I[a,b] (s) H 2 [0, d], pode-se denir o integral de It o em [a, b] por
b d
G(s)dW (s) :=
a 0
G(s)I[a,b] (s)dW (s).
(6.24)
Facilmente se reconhece que, para 0 a b c d, vem

c b c
G(s)dW (s) =
a a
G(s)dW (s) +
b
G(s)dW (s).
(6.25)
Para estudar o integral de It o como fun ca o do limite superior de
66
integra ca o t, vamos supor t a variar no intervalo [0, d]. Claro que, sendo G H 2 [0, d], tamb em se tem G H 2 [0, t] para t [0, d] (usando a mesma letra G para designar a restri c ao de G = G(s, ) a [0, t] ). Seja
t d
Z (t) =
0
G(s)dW (s) =
0
G(s)I[0,t] (s)dW (s).
(6.26)
Propriedade: Como Z (t) e mensur avel-At , o processo estoc astico {Z (t)}[0,d] est a adaptado a ` ltra ca o {At }t[0,d]. Al em disso, e uma martingala-At .
2 Para o demonstrar, consideremos uma sucess ao Gn HE [0, d] (n = (n) 1, 2, ...) de fun c oes em escada aproximadora de G. Sejam 0 = t0 < (n) (n) t1 < ... < tmn = d os pontos da decomposi c ao em cujos subintervalos (n) (n) [tk1 , tk ) (k = 1, ..., mn ) a fun c ao Gn (s) e constante (relativamente t a s). Vamos ver que cada Zn (t) = 0 Gn (s)dW (s) e uma martingala (abreviatura de martingala-At). De facto, dado s < t e sendo Nn = (n) (n) {k {1, 2, ..., mn} : s tk1 , tk t}, vem
E[Zn (t) |As ] = E

s 0 s 0
s 0
Gn (s)dW (s) + E
t s
Gn (s)dW (s) + Gn (s)dW (s)+ Gn (s)dW (s)+

k N n k N n
k N n (n)
(n) (n) Gn (tk1 )(W (tk ) (n) (n)
Gn (s)dW (s) |As = W (tk1 )) |As = |As = |As =

(n)
s 0
E E Gn (tk1 )(W (tk ) W (tk1 )) At(n) E Gn (tk1 )E W (tk ) W (tk1 ) At(n)

k N n (n) (n) (n)
k 1
s 0
Gn (s)dW (s) +
E [0 |As ] = Zn (s).
k 1
Daqui resulta, pela desigualdade de Schwarz m.q. para Z (s), que
e por Zn (s) convergir
E E[12 |As ]E[(Zn (t) Z (t))2 |As ] = E (Zn (t) Z (t))2 0.
E (E[Zn (t)|As ] E[Z (t)|As ])2 = E (E[Zn (t) Z (t)|As ])2
Logo E[Zn (t)|As ] = Zn (s) converge m.q. para E[Z (t)|As ]. Como o limite
5 A desigualdade de Schwarz diz que, para uma medida e fun co es f, g de quadrado integr avel, ( f gd)2 ( f d)2 ( gd)2 . Em particular, se e uma probabilidade P , vem (E[XY ])2 = E[X 2 ]E[Y 2 ].
67
m.q. e q.c. u nico, vem E[Z (t)|As ] = Z (s) q.c., provando-se assim que Z (t) e uma martingala-At. Ent ao, dados a, b [0, d] com a b, Z (t) Z (a) e, para t > a, uma martingala-At. Aplicando as desigualdades maximais das martingalas (2.2) e (2.3), vem P e E sup |Z (t) Z (a)|2 4E[|Z (b) Z (a)|2 ] = 4
b a
atb
sup |Z (t) Z (a)| c
1 1 E[|Z (b) Z (a)|2 ] = 2 2 c c
b a
E[G2 (s)]ds (6.27)
E[G2 (s)]ds. (6.28)
atb
Propriedade: O processo Z (t) tem uma vers ao cont nua (traject orias q.c. cont nuas) e supomos que trabalhamos sempre com uma tal vers ao. f Vamos demonstr a-lo. E acil ver de (6.13) que Zn (t) = 0 Gn (s)dW (s) e fun c ao q.c. cont nua de t em [0, d]. Como Zn (t) Zm (t) e martingala, de (2.2) vem P sup |Zn (t) Zm (t)| > 1 E |Zn (d) Zm (d)|2 . 2
t
0td
Quando n, m +, o lado direito tende para zero. Escolha-se = 1/2k . Escolha-se uma subsucess ao nk + tal que P Como P
0td k
sup |Znk+1 (t) Znk (t)| > 1/2k < 1/2k .

6
1/2k < +, o lema de Borel-Cantelli
implica
0td
sup |Znk+1 (t) Znk (t)| > 1/2k para innitos valores de k = 0.
Portanto, com probabilidade um, vem sup0td |Znk+1 (t) Znk (t)| 1/2k a partir de certa ordem. Isso implica que Znk (t) e q.c. uniforme-
6 O lema de Borel-Cantelli (ver qualquer bom livro de probabilidades) aplica-se a uma sucess ao An (n = 1, 2, ...) de acontecimentos e ao acontecimento A = { : An para innitos valores de n}. Se ao P (A) = 0. Se n P (An ) < +, ent ao P (A) = 1. n P (An ) = + e se os acontecimentos An forem independentes, ent
68
mente convergente no intervalo [0, d]. Designemos por J (t) o seu limite q.c. quando k +, que, sendo limite uniforme de fun c oes q.c. cont nuas, e uma fun c ao q.c. cont nua. Como Znk (t) converge m.q. para Z (t), vem Z (t) = J (t) q.c., o que prova o pretendido. Exerc cio: Mostre que Z (t) tem incrementos n ao-correlacionados (n ao confundir com independentes), isto e, para intervalos n ao-sobrepostos [s, t] e [u, v ] com 0 s t u v d, COV [Z (t) Z (s), Z (v ) Z (u)] = E [(Z (t) Z (s))(Z (v ) Z (u))] = t v E s G(z )dW (z ) u G(z )dW (z ) = 0. (6.29) Basta demonstrar para fun c oes em escada e transferir a propriedade para o caso geral por passagem ao limite m.q.
6.5
Extens oes do integral de It o
Esta sec c ao e dispens avel numa primeira leitura. O integral de It o pode ser generalizado ` a classe M 2 [0, t] das fun c oes conjuntamente mensur aveis n ao-antecipativas-As tais que
t 0
|G(s)|2 ds < + q.c.

t
(6.30)
Como esta condi c ao e mais fraca que a condi c ao 0 E |G(s)|2 ds < 2 2 +, vem M [0, t] H [0, t]. Para fun c oes em escada de M 2 [0, t], a deni c ao do integral de It o e igualmente dada por (6.13), mas agora nada garante que existam as esperan cas matem aticas de G, pelo que pode n ao estar denida nem a esperan ca matem atica nem a vari ancia do integral, situa c ao que permanece quando se denir o integral para fun c oes arbitr arias de M 2 [0, t]. Para denir o integral para uma fun c ao arbitr aria G M 2 [0, t], usase a mesma t ecnica de mostrar que ela pode ser aproximada por uma sucess ao aproximadora de fun c oes Gn M 2 [0, t] (n = 1, 2, ...) em escada. Agora a converg encia n ao e obviamente a denida por L2 , mas antes uma converg encia mais fraca denida por
t 0
(Gn (s) G(s))2 ds 0 q.c. quando n +.
(6.31)
A t ecnica para mostrar a exist encia desta sucess ao aproximadora e semelhante ` a usada na Sec c ao 6.3. Come ca-se por mostar que e ver-
69
dade para fun c oes G M 2 [0, t] que sejam cont nuas, usando o m etodo um exerc da escadiza c ao j a usado na Sec c ao 6.3. E cio simples, que deixamos ao cuidado do leitor adaptar a demonstra c ao a feita (substituindo a continuidade m.q. pela continuidade e retirando as esperan cas matem aticas). Estende-se em seguida a fun c oes G M 2 [0, t] limitadas, mostrando-se que uma tal fun c ao pode ser aproximada por uma sucess ao de fun c oes Hn M 2 [0, t] cont nuas. A demonstra c ao e semelhante a usada na Sec ` c ao 6.3, embora mais simples, cando ao cuidado do leitor fazer a adapta c ao daquela demonstra c ao. A extens ao a fun c oes G M 2 [0, t] arbitr arias usando uma sucess ao aproximadora de fun co es limitadas usa tamb em a mesma t ecnica da Sec c ao 6.3 (embora s o seja preciso usar o teorema da converg encia dominada uma vez e n ao duas). Como a aproxima c ao a G M 2 [0, t] por uma sucess ao aproximadora Gn de fun c oes em escada usa um modo de converg encia mais fraco, j a n ao t e poss vel mostrar que a sucess ao dos integrais I (Gn ) = 0 Gn (s)dW (s) converge em m edia quadr atica, mas vamos provar que converge em probabilidade. 7 Primeiro vamos demonstrar, seguindo [3], que, para uma fun c ao J M 2 [0, t] em escada, se tem, para todo o N > 0 e todo o > 0,
t
P
0
J (s)dW (s) >
N +P 2
J 2 (s)dW (s) > N

0
(6.32)
Seja 0 = t0 < t1 < ... < tn = t a decomposi c ao do intervalo [0, t] onde J assenta, isto e J (s, ) = J (tk1 , ) para todo o s [tk1 , tk ) (k = 1, ..., n). Para s [ti1 , ti ), dena JN (s) := J (s) 0 se se
ti 0 ti 0
J 2 (s)ds N J 2 (s)ds > N,

ti 0 2 JN (s)ds N . Logo
que e uma fun c ao em escada de M 2 [0, t] tal que JN

2 2 ti
=E
0
2 (s)ds N JN
7 Uma sucess ao de v.a. Xn (n = 1, 2, ...) converge em probabilidade para a v.a. X se, para > 0 arbitr ario, P [|Xn X | > ] 0 quando n +. Esta converg encia e mais fraca que a converg encia m.q., no sentido de que, sempre que se verica a converg encia m.q., tamb em se verica a converg encia em probabilidade mas o inverso pode falhar. Tamb em e mais fraca que a converg encia com probabilidade um ou quase certa.
70
2 e, portanto, JN HE [0, t]. Logo, pela propriedade de preserva c ao da t 2 2 norma, E[(I (JN )) ] = I (JN ) 2 N . Como J J sse J ( s ) ds > N 2 0 N , vem
P P
t 0
t 0 (J (s)
J 2 (s)ds > N = P sup0st |J (s) JN (s)| > 0 JN (s))dW (s) > 0 .
Ent ao, usando a desigualdade de Tchebyshev, P [|I (J )| > ] P [|I (JN )| > ] + P [|I (J ) I (JN )| > 0] t t E[(I (JN ))2 ]/ 2 + P 0 J 2 (s)ds > N N/ 2 + P 0 J 2 (s)ds > N , o que mostra que (6.32) e verdadeira. Demonstra ca o de que I (Gn ) converge em probabilidade quando n + Como 0 (Gn (s) G(s))2 ds 0 q.c., vem 0 (Gn (s) G(s))2 ds 0 t t em probabilidade, donde 0 (Gn (s)Gm (s))2 ds 2 0 (Gn (s)G(s))2 ds+ t 2 0(Gm (s) G(s))2 ds 0 em probabilidade quando n, m +. Seja > 0 arbitr ario. Aplicando (6.32) a Gn Gm , vem lim supn,m+ P [|I (Gn ) I (Gm )| > ] /2 + lim supn,m+ P
t 0 t t
|Gn (s) Gm (s)|2 > /2 + 0.
Como e arbitr ario, conclui-se que limn,m+ P [|I (Gn ) I (Gm )| > ] = 0 e, portanto, I (Gn ) e uma sucess ao de Cauchy em probabilidade, pelo que converge em probabilidade. Tem-se ent ao uma sucess ao de integrais I (Gn ) de fun c oes em escada que converge em probabilidade. O seu limite em probabilidade diz-se o integral de It o
t t
I (G) =
0
G(s)dW (s) =
0
G(s, )dW (s, )
da fun c ao G. Este limite e insens vel ` a escolha da sucess ao aproximante, o que deixamos como exerc cio para o leitor. Fica tamb em como exerc cio mostrar a linearidade do integral. O leitor pode facilmente provar que (6.32) permanece v alida para qualquer J M 2 [0, t], mesmo que n ao seja uma fun c ao em escada. A partir da , pode tamb em provar que, se Gn M 2 [0, t] (n = 1, 2, ...) e uma
71
sucess ao (mesmo que estas fun c oes n ao sejam em escada) convergente t para G M 2 [0, t] no sentido de 0 (Gn (s) G(s))2 ds 0 q.c., ent ao t t Gn (s)dW (s) converge em probabilidade para 0 G(s)dW (s). 0 As propriedades ( 6.20) e ( 6.21) n ao podem agora ser garantidas por poderem n ao existir os respectivos momentos. Pela mesma raz ao, tamb em n ao podemos garantir que o integral, como fun c ao do limite superior t de integra c ao, seja uma martingala. Claro que Z (t) = 0 G(s)dW (s) (t [0, d]), com G M 2 [0, t], est a adaptado ` a ltra c ao n ao-antecipativa At . Pode mesmo provar-se que as traject orias s ao q.c. cont nuas. Com efeito, para G M 2 [0, d], considerem-se fun c oes truncadas GN (t) := G(t) 0 se se
t 0 t 0
G2 (u)du N , G2 (u)du > N
que est ao em H 2 [0, d], e seja ZN (t) = 0 GN (t)dW (t). Logo, as fun c oes ZN (t) t em, como sabemos, traject orias q.c. cont nuas. Ora Z (t, ) = t ZN (t, ) para todo o t [0, d] e para AN := { : 0 G2 (s, )ds) N }. Escolhendo N sucientemente grande podemos tornar P (AN ) t ao pr oximo de 1 quanto se queira, pelo que o conjunto dos pontos para os quais Z (t, ) e cont nua tem probabilidade 1. Uma outra extens ao obvia s ao os integrais estoc asticos, tamb em chamados processos de It o, denidos para t [0, d] por
t t
X (t, ) = X0 ( ) +
0
F (s, )ds +
0
G(s, )dW (s, ),
(6.33)
onde: X0 e uma v.a. mensur avel-A0 e, portanto, independente do processo de Wiener. Pode, em particular, ser uma constante determin stica. F e um fun c ao conjuntamente mensur avel adaptada ` a ltra c ao As d e tal que 0 |F (s)|ds < + q.c. G M 2 [0, d]. O integral estoc astico pode ser escrito na forma diferencial (usa-se a habitual abreviatura de n ao indicar a depend encia de ) dX (t) = F (t)dt + G(t)dW (t). (6.34)
72
6.6
Teorema e f ormula de It o
Vimos na Sec c ao 6.1, atrav es de um exemplo, que os integrais de It o, e consequentemente os processos de It o (que podem ser escritos em forma diferencial ou integral), n ao satisfazem as regras usuais de c alculo. Por isso, necessitamos de um novo c alculo diferencial e integral, o c alculo de It o. Basta para isso darmos a regra de diferencia ca o de uma fun ca o composta ou regra da cadeia. Trata-se da conhecida f ormula de It o, veiculada pelo teorema de It o. Teorema de It o. Seja X (t) = X (t, ) (t [0, d]) um processo de It o dado por (6.33) ou (6.34), abreviadamente dX (t) = F (t)dt + G(t)dW (t). Seja Y (t) = h(t, X (t)), onde h(t, x) e uma fun ca o cont nua com derivada parcial cont nua com respeito a t e com segunda derivada parcial cont nua com respeito a x. Ent ao Y (t) = Y (t, ) e tamb em um processo de It o com condi ca o inicial Y0 = h(0, X0 ) dado na forma diferencial pela f ormula de It o dY (t) =
(t)) h(t,X (t)) + h(t,X F (t) t x h(t,X (t) G(t)dW (t). x
2 1 h(t,X (t)) 2 G (t) 2 x2
dt+ (6.35)
A forma integral ser a ent ao Y (t) = Y0 +

t h(s,X (s)) (s)) + h(s,X F (s) s x 0 t h(s,X (s) G(s)dW (s). x 0
2 1 h(t,X (s)) 2 G (s) 2 x2
ds+
(6.36) Uma boa mnem onica para obter (6.36) e usar um desenvolvimento de Taylor at ea ` primeira ordem em t e at ea ` segunda ordem em x dY (t) = h(t, X (t)) h(t, X (t)) 1 2 h(t, X (t)) dt + dX (t) + (dX (t))2 t x 2 x2
seguido da substitui ca o de dX (t) por F (t)dt + G(t)dW (t). Nesta substitui ca o, ao calcular (dX (t))2 , devemos usar as regras de multiplica ca o dt dW ou seja, (dX (t))2 = G2 (t)dt. Vamos agora apresentar um esbo co da demosnstra c ao do teorema de It o, a qual o leitor pode perfeitamente dispensar numa primeira leitura. dt 0 0 dW 0 dt
Introdu c ao ` as EDE e aplica c oes Esbo co da demonstra ca o do teorema de It o
73
Mais detalhes podem ser vistos, por exemplo, em [3] (que seguimos de perto) ou [51]. Sejam F e G satisfazendo as condi c oes para que o processo X (t) seja um processo de It o, designadamente serem cond juntamente mensur aveis e adaptadas ` a ltra c ao, 0 |F (s, )|ds < +
d
q.c. e 0 |G(s, )|2 ds < + q.c. Em rela c ao a G, sabemos, pela Sec c ao 6.5, que existe uma sucess ao de fun c oes em escada Gn (n = 1, 2, ...) com as mesmas propriedades que converge para G no sentido t t 2 0 (G(s) Gn (s)) ds 0 q.c. e tal que 0 Gn (s)dW (s) converge em t probabilidade para 0 G(s)dW (s). Tamb em n ao seria dif cil adaptar o racioc nio de modo a provar que existe uma sucess ao de fun c oes em escada Fn (n = 1, 2, ...) (com as mesmas propriedades de F ) que cont verge para F no sentido 0 |F (s) Fn (s)|ds 0 q.c. Daqui resulta t t imediatamente que 0 Fn (s)ds converge para 0 F (s)ds q.c. (e logo em probabilidade). Ent ao, se conseguirmos provar a f ormula de It o para fun c oes em escada, ela vale em geral, bastando fazer a passagem ao limite (em probabilidade) ao longo das sucess oes aproximadoras de fun c oes em escada. Como os limites em probabilidade s ao q.c. u nicos, a f ormula de It o verica-se q.c. Para fun c oes em escada, podemos partir o intervalo de integra c ao de acordo com a decomposi c ao em que assentam F e G (pode-se fazer uma comum a ambas as fun c oes) e provar a f ormula para cada um dos sub-intervalos, onde as fun c oes s ao constantes (com respeito ao tempo, n ao com respeito a ). Ent ao, basta demonstrar a f ormula de It o para fun c oes constantes num intervalo [a, b] [0, d]. Sejam ent ao F (s, ) F ( ) (uma v.a. que abreviamos para F ) e G(s, ) G( ) (uma v.a. que abreviamos para G) fun c oes constantes (relativamente ao tempo) em [a, b]. Nesse caso, para t [a, b], temos X (t) = X (a) + (t a)F + (W (t) W (a))G, com X (a), F e G mensur aveis-Aa, logo independentes dos incrementos W (t) W (a). Vem Y (t) = h(t, X (t)) = h(t, X (a) + (t a)F + (W (t) W (a))G) com condi c ao inicial Ya = h(a, X (a)). Para cada n natural, vamos considerar uma decomposi c ao a = tn,0 < tn,1 < ... < tn,n = b do intervalo [a, b] com di ametro n = max1kn (tn,k tn,k1 ) tal que n 0 quando n +. Vamos abreviar a nota c ao e escrever tk = tn,k , Xk = X (tn,k ), tk = tn,k tn,k1 , Xk = X (tn,k ) X (tn,k1 ) e
74
Wk = W (tn,k ) W (tn,k1 ). Vem

n
Y (t) Y (a) =
k=1
(h(tk , Xk ) h(tk1 , Xk1 ))
e, usando a f ormula de Taylor , vem h(tk , Xk ) h(tk1 , Xk1 ) = ht (tk1 + n,k tk , Xk1 )tk + 2 hx (tk1 , Xk1 )Xk + 1 2 hxx (tk1 , Xk1 + n,k Xk )(Xk ) , n,k < 1. onde ht = h/t, hx = /x, hxx = 2 /x2 e onde 0 < n,k , Isto deve-se ` a continuidade das derivadas parciais utilizadas. Como o intervalo e fechado, a continuidade e uniforme (no tempo) pelo que h a majorantes
1kn 1kn
max |ht (tk1 + n,k tk , Xk1 ) ht (tk1 , Xk1 )| n
n,k Xk ) hxx (tk1 , Xk1 ) n , max hxx (tk1 , Xk1 +
n,k por 0 s com n , n 0 q.c., pelo que os erros de substituir n,k e ao controlados por esses majorantes. Vem ent ao Y (t) Y (a) = k=1 (h(tk , Xk ) h(tk1 , Xk1 )) = n n k=1 ht (tk1 , Xk1 )tk + k=1 hx (tk1 , Xk1 )Xk + n 1 2 k=1 hxx (tk1 , Xk1 )(Xk ) + erro, 2
1 com |erro| n (ba)+ 2 n k=1 (Xk )2 convergente para zero em pron babilidade pois k=1 (Xk )2 converge em probabilidade para (b a)G2 (que e q.c. nito). n n
Falta ent ao apenas provar que

n
k=1
(Xk )2 (b a)G2 em probabilidade

n k=1 n
(6.37)
e que
k=1 hx (tk1 , Xk1 )(Xk )+ n 1 2 k=1 hxx (tk1 , Xk1 )(Xk ) 2
ht (tk1 , Xk1 )tk +
(6.38)
Introdu c ao ` as EDE e aplica c oes converge em probabildade para

b h (s, X (s))ds+ a t b b a hx (s, X (s))F ds + a 1 b 2 2 a hxx (s, X (s))G ds,
75
hx (s, X (s))GdW (s)+
(6.39)
havendo converg encia de cada linha de (6.38) para a linha correspondente de (6.39). O resultado para a primeira linha e evidente. A segunda linha tamb em e evidente se notarmos que Xk = F tk + GWk . A terceira linha vai dar mais trabalho. Note-se que
n 2 k=1 hxx (tk1 , Xk1 )(Xk ) = n 2 2 F k=1 hxx (tk1 , Xk1 )(tk ) + n 2F G k=1 hxx (tk1 , Xk1 )tk Wk + n G2 k=1 hxx (tk1 , Xk1 )(Wk )2 ;
os dois primeiros termos do lado direito da igualdade convergem em probabilidade para zero devido ` a continuidade de hxx e de W . Falta s o provar (repare que aqui G e constante) que
n b
k=1
hxx (tk1 , Xk1 )(Wk )2
hxx (s, X (s))ds

a
em probabilidade.
(6.40) De facto, a outra demonstra c ao que ainda faltava, a da validade de (6.37), aparece como caso particular desta quando h(s, x) 1. Seja Hnk := (Wk Wk1 ) (tk tk1 ) = (Wk )2 tk . Como k=1 hxx (tk1 , Xk1 )tk basta mostrar que
n n b a 2
hxx (s, X (s))ds em probabilidade,
Sn :=
k=1
hxx (tk1 , Xk1 )Hnk 0
em probabilidade.
(6.41)
Pode suceder que Sn n ao tenha momentos mas j a ter a momentos truncados para a truncatura
n (N ) Sn := k=1
hxx (tk1 , Xk1 )Hnk IN,k ( )
76 com N > 0 e IN,k ( ) := 1 0
se |X (tn,i , )| N para todos os i < k caso contr ario.
2 Como E[Hnk ] = 0, E[Hnk ] = 2(tk )2 e os Hnk (k = 1, 2, ..., n) s ao (N ) independentes, vem E[Sn ] = 0 e
E[(Sn )2 ] =
(N )
n k=1
E (hxx (tk1 , Xk1 )IN,k )

n 2 k=1 (tk )
2 E Hnk
2 maxatb,|x|N |hxx (t, x)|(
0
(N )
quando n 0. Para todo o N > 0 xo, vem Sn a convergir m.q. e, portanto, em probabilidade, para zero. O erro de truncatura (N ) e P [Sm = Sn ] = P [maxatb |X (t)| > N ]. Ora maxatb |X (t)| = maxatb |X (a) + (t a)F + (W (t) W (a))G| |X (a)| + (b a)|F | + (N ) |G| maxatb |W (t) W (a)| e uma v.a q.c. nita, pelo que P [Sn = Sn ] pode tornar-se t ao pequeno quanto se queira para N sucientemente (N ) (N ) grande. Como P [|Sn | > ] = P [|Sn | > ] +P [Sm = Sn ], reconhecemos que P [|Sn | > ] 0 e, portanto, Sn converge em probabilidade para zero como pretendido. Exerc cio: Determine d(tW (t)) e use o resultado para mostrar que t t sdW (s) = tW (t) 0 W (s)ds. 0 Exerc cio: Mostre que a equa c ao dY (t) = Y (t)dW (t) com Y (0) = 1 t para t 0. tem solu c ao Y (t) = exp W (t) 2
6.7
Os c alculos de It o e Stratonovich
Vamos dar um exemplo de aplica c ao do teorema de It o para efeitos de ilustra c ao das regras especiais de c alculo deste integral. Seja X (t) = W (t) e h(t, x) = x2 . Como X (0) = 0 e X (t) = t t W (t) = 0 0ds + 0 1dW (s), temos F (t, ) 0 e G(t, ) 1 e que X (t) e um processo de It o. Us amos o facto de a fun c ao integranda do segundo integral ser uma fun c ao em escada com um u nico degrau (onde toma o valor 1 para todo o ) correspondente ` a decomposi c ao t 0 = t0 < t1 = t do intervalo [0, t], pelo que 0 1dW (s) = 1(W (t1 ) W (t0 )) = W (t). Na forma diferencial vem dX (t) = 0dt + 1dW (t) = dW (t). Vem Y (t) = h(t, X (t)) = W 2 (t). Pela f ormula de It o, obtemos 2 2( (pode usar a mnem onica) dY (t) = 0dt + 2X (t)dX (t) + 1 2 dX (t)) = 2W (t)dW (t) + dt. Na form integral, atendendo a que Y (0) = 0, obtemos

t t t
77
Y (t) = 2 0 W (s)dW (s) + 0 dt = 2 0 W (s)dW (s) + t. Daqui vem o t 1 W 2 (t) t . resultado j a familiar (ver (6.7)) 0 W (s)dW (s) = 2 A diferen ca entre a f ormula de It o e a correspondente f ormula do c alculo usual e que nesta o termo do desenvolvimento de Taylor de segunda ordem em x e desprez avel. Na f ormula de It o, por em, este termo aparece. De facto, consideremos um pequeno intervalo de tempo (t, t + t) com t 0 e seja W = W (t + t) W (t). Vem E (W (t))2 = t, que n ao e desprez avel (n ao e de ordem o(t)) e sugere a regra (dW (t))2 = dt. Isto deve-se ` a irregulatidade das traject orias do processo de Wiener. Com efeito, se W (t) fosse aproximado por um processo diferenci avel 2 d W ( t ) (t), ter (t))2 = W amos (W t + o(t) = o(t), que seria
dt
desprez avel, aplicando-se as regrais usuais de c alculo. Esta e a raz ao porque o c alculo de Stratonovich, que verica as regras usuais de c alculo, e recomendado como o c alculo estoc astico adequado quando temos uma equa c ao diferencial aleat oria realista com ru do colorido (cujo integral, que aparece na forma integral da equa c ao, seja um processo diferenci avel) e a aproximamos, por raz oes de conveni encia matem atica, por uma EDE idealizada com ru do branco (cujo integral, que aparece na forma integral da equa c ao, e o processo de Wiener). De facto, sob condi c oes apropriadas (ver [3], [24], [35], [40], [60]), se conside n (t) de W (t) conrarmos aproxima c oes suaves (ou mesmo poligonais) W vergindo para W (t) quando n +, as solu c oes das equa c oes diferenci n (t)), que n ais aleat orias realistas (com W ao s ao processos de Markov, convergem para a solu c ao pelo c alculo de Stratonovich da EDE idealizada (com o processo de Wiener W (t)). O c alculo de Stratonovich n ao tem as boas propriedades probabil sticas do integral de It o (como mostra o exemplo da Sec c ao 6.1, em que falha a propriedade da martingala e a do integral ter m edia nula) e s o e aplic avel a uma classe muito mais restrita de fun c oes integrandas. Mas, como vimos, parece ser o mais apropriado quando se usa uma EDE (com ru do branco em tempo cont nuo) como aproxima ca o conveniente do comportamento din amico de um fen omeno ocorrendo em tempo cont nuo e perturbado por um ru do em tempo cont nuo ligeiramente colorido. J a o c alculo de It o parece ser apropriado quando se usa uma EDE (com ru do branco em tempo cont nuo (t)) como aproxima c ao conveniente do comportamento din amico de um fen omeno ocorrendo em tempo discreto e perturbado por um ru do branco discreto (t). De facto, como decorre da pr opria forma de constru c ao do integral, as solu c oes das equa c oes ` as diferen cas estoc asticas X (tk + t) X (tk ) = f (tk , X (tk ))t + g (tk , X (tk )) (tk )t (tk = k t com t > 0, k = 0, 1, 2, ...) convergem, debaixo de condi c oes adequadas, para as solu c oes
78
pelo c alculo de It o da EDE dX (t) = f (t, X (t))dt + g (t, X (t))dW (t) quando t 0. Como os c alculos de It o e Stratonovich d ao resultados diferentes, parece ser importante nas aplica c oes, mesmo admitindo que as condi c oes s ao apropriadas ao uso das aproxima c oes acima referidas, destrin car se o fen omeno din amico ocorre intrinsecamente em tempo discreto ou em tempo cont nuo, o que nem sempre e f acil. Iremos ver mais tarde, para uma ampla classe de modelos, que tamb em n ao e necess ario. Vamos agora falar do c alculo de Stratonovich num contexto mais geral que o do exemplo da Sec c ao 6.1. Vamos denir integrais estoc asticos de Stratonovich apenas para fun c oes G(s, ) em que a depend encia do acaso n ao seja arbitr aria mas feita atrav es da solu c ao de uma EDE. Para isso vamos trabalhar informalmente com EDE apesar de ainda n ao as termos estudado matematicamente. Por solu c ao segundo o c alculo de Stratonovich de uma EDE (S ) dXt = f (t, X (t))dt + g (t, X (t))dW (t), X (0) = X0 , (6.42)
queremos dizer uma solu c ao da correspondente equa c ao integral

t t
X (t) = X0 +
0
f (s, X (s))ds + (S )
0
g (s, X (s))dW (s)

t
(6.43)
quando se usa o integral de Stratonovich (S ) 0 g (s, X (s))dW (s). Tamb em dizemos que a EDE (6.42) e uma equa ca o diferencial estoc astica de Stratonovich. Usa-se o (S) para n ao confundir com o integral de It oe t o c alculo de It o. Tamb em se usa em alternativa escrever 0 g (s, X (s)) dW (s) e dX = f dt + g dW (t). Para denir o integral de Stratonovich t (S ) 0 g (s, X (s))dW (s), vamos exigir que G(s, ) = g (s, X (s, )) (onde X (s, ) e a solu c ao de (6.42)) seja cont nua m.q. para adoptar uma deni c ao semelhante ` a usada no exemplo da Sec c ao 6.1 e, claro, que a EDE (6.42) tenha solu c ao u nica (quest oes a estudar mais tarde). Denimos ent ao (S )
t 0
g (s, X (s))dW (s) =

n k=1
(W (tn,k ) W (tn,k1 )) , (6.44) onde 0 = tn,0 < tn,1 < ... < tn,n1 < tn,n = t (n = 1, 2, ...) s ao decomposi c oes do intervalo de integra c ao [0, t] cujos di ametros n = maxk=1,...,n (tn,k tn,k1 ) 0 quando n +. Note-se a diferen ca para o que resulta da deni c ao do integral de It o l.i.m. g tn,k1 ,
X (tn,k1 )+X (tn,k ) 2
t 0
g (s, X (s)) dW (s) =
Introdu c ao ` as EDE e aplica c oes em condi c oes semelhantes g (s, X (s))dW (s) = n l.i.m. k=1 g (tn,k1 , X (tn,k1 )) (W (tn,k ) W (tn,k1 )) , integral que aparece na forma integral da EDE de It o dXt = f (t, X (t))dt + g (t, X (t))dW (t), X (0) = X0 .
t 0
79
(6.45)
Comparando a express ao do integral de It o com a express ao (6.44) do integral de Stratonovich e usando um desenvolvimento de Taylor de primeira ordem em torno de x = X (tn,k1 ) e t ecnicas semelhantes ` as usadas na demonstra c ao do teorema de It o (embora sem algumas das complica c oes t ecnicas para a demonstra c ao das converg encias visto trabalharmos com converg encias m.q. em vez de converg encias em probabilidade), vem, para fun c oes g (t, x) cont nuas em t e com derivada parcial cont nua em x, que a EDE de Stratonovich (6.42) e equivalente (tem a mesma solu c ao) que a EDE de It o dt + g (t, X (t))dW (t) X (0) = X0 . (6.46) O leitor mais motivado poder a tentar a demonstra c ao, devida a [61] (ver tamb em [3]). Um trabalho relevante de Stratonovich e [54]. Esta rela c ao entre os c alculos de It o e Stratonovich (quando aplicada a EDE) pode ser usada em sentido oposto, mostrando que a solu c ao da EDE de It o (6.45) e equivalente ` a EDE de Stratonovich dX (t) = f (t, X (t)) + dt + g (t, X (t))dW (t) X (0) = X0 . (6.47) Esta rela c ao e muito u til porque podemos usar as regras usuais de c alculo, a que estamos mais habituados do que as regras do c alculo ce It o, para resolver a EDE de Stratonovich (6.47), j a que a solu c ao assim obtida e a solu c ao da EDE de It o (6.45). Das f ormulas de convers ao entre os dois c alculos, v e-se que eles coincidem quando g (t, x) n ao depende de x. (S )dX (t) = f (t, X (t))
1 g(t,X (t)) g (t, X (t)) 2 x 1 g(t,X (t)) g (t, X (t)) 2 x
6.8
O caso multidimensional
O integral de It o pode ser facilmente generalizado ao caso multidimensional. Nesse caso, trabalha-se com processos de Wiener padr a o m-
80
dimensionais W(s, ) = [W1 (s, ), W2 (s, ), ..., Wm (s, )]T como processos integradores e com fun co es integrandas G(s, ) = [Gij (s, )]i=1,...,n;j =1,...,m com valores matriciais -n m (isto e, com valores em Rnm ). Note-se que as coordenadas do processo de Wiener serem v.a. independentes n ao e restri c ao porque qualquer estrutura de correla c ao se obteria pr e-multiplicando W(s) por uma matriz, a qual pode ser absorvida em G(s). Vem para integral de It o multidimensional
t 0
que, como se v e, se obt em ` a custa dos integrais de It o unidimenisonais j a aqui denidos. Os resultados s ao tamb em semelhantes. As fam lias H 2 [0, t] e M 2 [0, t] para as fun c oes integrandas denem-se de forma semelhante ao caso unidimensional com a norma -L2 a ser denida da mesma forma que (6.12) mas substituindo nela |G|2 (s) (que era igual a G2 (s)) por |G|2 =
n i=1
G(s, )dW(s, ) =
m j =1 0
t 0
G1j dWj (s), ...,

j =1
Gnj dWj (s) ,
produto interno em H [0, t], deve usar-se

t
m j =1 2
G2 ij
= tra co(GGT ). Quanto ` a express ao do
G, H
=
0
E[tra co(G(s)HT (s))]ds .
Estamos agora habilitados a tratar sistemas de equa co es diferenciais estoc asticas ou equa co es diferenciais estoc asticas multidimensionais. Sejam dados um processo estoc astico n-dimensional X(s, ) = [X1 (s, ), X2 (s, ), ..., Xn (s, )]T , uma fun c ao com valores n-dimensionais f (s, x) = [f1 (s, x), f2 (s, x), ..., fn (s, x)]T denida para (s, x) [0, t] Rn e uma fun c ao com valores matriciais-n m g(s, x) = [gij (s, x)]i=1,...,n;j =1,...,m denida para (s, x) [0, t]Rn . Podemos agora considerar um sistema de equa co es diferenciais estoc asticas (omitimos, como e habitual, o para aliviar a nota c ao) dX(t) = f (t, X(t))dt + g(t, X(t))dW(t), X(0) = X0 ,
onde X0 e um vector aleat orio mensur avel-A0 (portanto, independente do processo de Wiener W(t)). O sistema de EDE e equivalente ao sistema de equa co es integrais
t t
X(t) = X0 +
0
f (s, X(s))ds +
0
g(s, X(s))dW(s).
81
Quanto aos processos de It o n-dimensionais X(t) (t [0, d]), eles tomam a forma diferencial dX(t, ) = F(t, )dt + G(t, )dW(t, ) ou a forma integral
t t
X(t, ) = X0 ( ) +
0
F(s, )ds +
0
G(s, )dW(s, ),
onde X0 e uma vector aleat orio n-dimensional mensur avel-A0 e, portanto, independente do processo de Wiener. Pode, em particular, ser uma constante n-dimensional determin stica. F e um fun c ao com valores n-dimensionais conjuntamente mend sur avel adaptada ` a ltra c ao As e tal que 0 |F(s)|ds < + q.c., n onde |F(s)|2 = i=1 (Fi (s))2 G M 2 [0, d] e uma fun c ao com valores matriciais-n m. Na vers ao multidimensional do teorema e f ormula de It o, agora h(t, x) = [h1 (t, x), ..., hk (t, x)]T e um vector coluna de dimens ao k de fun c oes reais cont nuas denidas em [0, d] Rn com derivadas parciais cont nuas de primeira ordem em t, de primeira ordem em xi (i = 1, ..., n) e de segunda ordem em xi e xj (i, j = 1, ..., n). Seja Y(t) = h(t, X(t)), onde X(t) e o processo de It o n-dimensional acabado de referir. Repreh o vector coluna de dimens ao k das derivadas parciais sentamos por t hr hr h 2 h t , por x a matriz k n das derivadas parciais xi , por xi xj o vector columa de dimens ao k das derivadas parciais a matriz n n cujas coordenadas s ao os vectores It o toma o aspecto dY(t) =
2 hr xi xj 2h xi xj . A
e por
2h x x
f ormula de
h h 1 2h dt + dX(t) + tra co GGT t x 2 x x
dt,
sendo as derivadas calculadas no ponto (t, X(t)). Exerc cio: Mostre que, se X1 (t) e X2 (t) s ao processos de It o, ent ao Y (t) = X1 (t)X2 (t) e um processo de It o e d(Y (t)) = X1 (t)dX2 (t) + X2 (t)dX1 (t)+dX1 (t)dX2 (t), usando mo c alculo de dX1 (t)dX2 (t) a tabela de multiplica c ao (dt)2 = 0, dtdWi = 0, (dWi )2 = dt, dWi dWj = 0 (i = j ).
82
Cap tulo 7
Equa c oes diferenciais estoc asticas

7.1 Teorema de exist encia e unicidade e principais propriedades da solu c ao de uma equa c ao diferencial estoc astica
Seja dado um espa co de probabilidade (, F , P ), um processo de Wiener padr ao W (t) nele denido e uma ltra c ao n ao-antecipativa (As )s[0,d] . Seja X0 uma v.a. mensur avel-A0 (logo independente do processo de Wiener); pode, em particular, ser uma constante determin stica. Tendo denido os integrais estoc asticos de It o no Cap tulo 6, a equa c ao integral estoc astica
t t
X (t, ) = X0 ( ) +
0
f (s, X (s, ))ds +

0
g (s, X (s, ))dW (s, ) (7.1)
tem agora um signicado para t [0, d], desde que as fun c oes F (s, ) = f (s, X (s, )) e G(s, ) = g (s, X (s, )) sejam conjuntamento mensur aveis t t n ao-antecipativas-As, 0 |F (s, )|ds < + q.c. e 0 |G(s, )|2 dW (s, ) < + q.c. (isto e, G M 2 [0, d]). S ao estas as propriedades de um processo de It o que utiliz amos na Sec c ao 6.5. Claro que f e g precisam de satisfazer certas condi c oes para que se possa garantir que F e G satisfazem essas propriedades. Atribu do agora um signicado ` a forma integral (7.1), a correspondente equa ca o diferencial estoc astica (de It o) dX (t, ) = f (t, X (t, ))dt + g (t, X (t, ))dW (t, ) X (0, ) = X0 ( ) (7.2)
83
84
Cap tulo 7 - Equa c oes diferenciais estoc asticas
Isso n ao signica que a EDE (7.2) tenha necessariamente solu c ao ou que, tendo solu c ao, a solu c ao seja u nica. Para isso, precisamos de exigir que as fun c oes f e g satisfa cam certas condi c oes. Como no caso das equa c oes diferenciais ordin arias, faz falta uma condi c ao de restri c ao ao crescimento destas fun c oes para evitar a explos ao da solu c ao (solu c ao a divergir para em tempo nito) e uma condi c ao de Lipschitz para garantir a unicidade. Designemos por E o conjunto das fun c oes reais conjuntamente mensur aveis-Borel 1 h(t, x) de dom nio [0, d] R satisfazendo, para algum K > 0 e para todo o t [0, d] e x, y R, as propriedades seguintes: |h(t, x) h(t, y )| K |x y | ( condi ca o de Lipschitz ) |h(t, x)| K 1 + |x|2
1/2
tem agora sentido para t [0, d].
( restri ca o ao crescimento ).
No que se segue vamos usar a conven c ao habitual de n ao explicitar a depend encia do acaso nas v.a e processos estoc asticos que utilizarmos, mas conv em termos sempre presentes que ela est a impl cita e, por isso, quer o processo de Wiener, quer a solu c ao das EDE, dependem de . Teorema (Exist encia e unicidade e algumas propriedades da solu c ao de uma EDE de It o) Seja X0 L2 (isto e, X0 tem vari ancia nita) uma v.a. mensur avelA0 (logo independente do processo de Wiener) e considere-se no intervalo de tempo [0, d] (d > 0) uma equa ca o diferencial estoc astica (subentendese de It o) dXt = f (t, X (t))dt + g (t, X (t))dW (t), ou a correspondente equa ca o integral estoc astica
t t
X (0) = X0 ,
(7.3)
X (t) = X0 +
0
f (s, X (s))ds +
0
g (s, X (s))dW (s)
(7.4)
(com o segundo integral interpretado como integral de It o). Suponhamos que f, g E . Ent ao: a) Existe um processo estoc astico X (t) = X (t, ) (t [0, d]) q.c. cont nuo que e solu ca o de (7.3), isto e, com probabilidade um, X (t) satisfaz (7.4) para todo o t [0, d].
1 Por fun co es conjuntamente mensur aveis-Borel em s e x, queremos dizer que s ao fun co es mensur aveis com respeito a ` a lgebra- produto das a lgebras- de Borel de [0, d] e de R.
85
b) A solu ca o e q.c. u nica (diremos simplesmente unica) no sentido de que, dadas duas solu co es q.c. cont nuas X (t) e X (t), se tem
0td
sup |X (t) X (t)| = 0
com probabilidade um. c) Tem-se E (X (t))2 1 + E (X0 )2 exp(K (K + 2)t) 1 E (X (t) X0 )2 2K 2 (d + 1) 1 + E (X0 )2 t exp(K (K + 2)t). (7.5) d) A solu ca o X (t) est a em H 2 [0, d] e e cont nua em m edia quadr atica. e) A solu ca o X (t) e um processo de Markov com distribui ca o inicial igual a ` distribui ca o de X0 e com probabilidades de transi ca o P (t, B |s, x) = P [Xs,x (t) B ] (s t). Denot amos por Xs,x (t) a solu ca o q.c. cont nua u nica de dX (t) = f (t, X (t))dt + g (t, X (t))dW (t) com condi ca o inicial X (s) = x, isto e, a solu ca o de
t t
X (t) = x +
s
f (u, X (u))du +
s
g (u, X (u))dW (u).
f ) Se f e g forem tamb em cont nuas em t, ent ao a solu ca o X (t) e um processo de difus ao com coeciente de tend encia a(s, x) = f (s, x) e coeciente de difus ao b(s, x) = |g (s, x)|2 . Nota: Admitindo condi c oes de regularidade sucientes para f e g , se consider assemos uma EDE de Stratonovich (S ) dXt = f (t, X (t))dt + g (t, X (t))dW (t), como ela e equivalente ` a EDE de It o dXt = f (t, X (t)) + 1 g (t, X (t)) g (t, X (t)) dt + g (t, X (t))dW (t), 2 x
a sua solu c ao ser a um processo de difus ao com coeciente de tend encia g(s,x) 1 b(s,x) a(s, x) = f (s, x) + 1 g ( s, x ) = f ( s, x ) + e coeciente de 2 x 4 x difus ao b(s, x) = |g (s, x)|2 .
86
7.2
Esbo co da demonstra c ao do teorema de exist encia e unicidade
Apresentamos o esbo co da demonstra c ao do teorema da Sec c ao 7.1, o qual pode ser dispensado numa primeira leitura. Para mais pormenores sobre sugerimos a consulta de [3], [51], [32], [53] ou [59] (obras tamb em u teis sobre outros aspectos das EDE). Demonstra ca o da unicidade Sejam X (t) e X (t) duas solu c oes q.c. cont nuas. Note-se que f (t, X (t)), g (t, X (t)), f (t, X (t)) e g (t, X (t)), sendo fun c oes mensur aveis-Borel de fun c oes n ao-antecipativas, tamb em s ao n ao-antecipativas. Poder amos trabalhar com E[|X (t)X (t)|2 ], mas, neste momento, ainda n ao prov amos que este momento existe, pelo que o iremos substituir pelo momento truncado E[|X (t) X (t)|2 IN (t)] com IN (t) = 1 se |X (u)| N e |X (u)| N para 0 u t e IN (t) = 0 caso contr ario. Note-se que IN (t) e n ao-antecipativa e IN (t) = IN (t)IN (s) para s t. Como X (t) e X (t) satisfazem (7.4), vem, atendendo a que (a + b)2 2a2 + 2b2 , E[|X (t) X (t)|2 IN (t)] = t E IN (t) 0 IN (s)(f (s, X (s)) f (s, X (s)))ds +
t 0 IN (s)(g (s, X (s))
g (s, X (s)))dW (s) f (s, X (s)))ds

2
+
2
2E 2E
t 0 IN (s)(f (s, X (s)) t I (s) (g (s, X (s)) 0 N
g (s, X (s)))dW (s)
Usando a desigualdade de Schwarz que, em particular, diz que t t ( (s)ds)2 0 12 ds 0 2 (s)ds , o facto de t d e a propriedade de preserva c ao da norma dos integrais estoc asticos (quando as fun c oes integrandas est ao, como e o caso aqui em virtude da truncatura, em H 2 [0, d]), vem
t 0
E[|X (t) X (t)|2 IN (t)] t 2d 0 E IN (s)(f (s, X (s)) f (s, X (s)))2 ds+ t 2 0 E IN (s)(g (s, X (s)) g (s, X (s)))2 ds.
Introdu c ao ` as EDE e aplica c oes Logo, com L = 2(d + 1)K 2 , vem, pela condi c ao de Lipschitz, E[|X (t) X (t)|2 IN (t)] L
t 0
87
E |X (s) X (s)|2 IN (s) ds.
(7.6)
Aplicando o lema de Bellman-Gronwall 2 , tamb em conhecido por desigualdade de Gronwall, obtemos E[|X (t) X (t)|2 IN (t)] = 0, o que implica que IN (t)X (t) = IN (t)X (t) q.c. Ora P [IN (t) / 1 em [0, d]] P sup |X (t)| > N + P sup |X (t)| > N
0td
0td
e, como X (t) e X (t) s ao (devido ` a continuidade q.c.) limitadas q.c. em [0, d], ambas as probabilidades do lado direito podem tornar-se arbitrariamente pequenas para N sucientemente grande. Logo X (t) = Y (t) q.c. para cada t e, portanto tamb em para todo o t Q [0, d] (Q e o conjunto dos racionais). Devido ` a continuidade, vem q.c. X (t) = Y (t) para todo o t [0, d] e, portanto, sup0td |X (t) X (t)| = 0 q.c. Demonstra ca o da exist encia A demonstra c ao da exist encia baseia-se no mesmo m etodo de Picard que e usado para as equa c oes diferenciais ordin arias. Trata-se de um m etodo recursivo de aproxima c oes sucessivas que come ca com X0 (t) X0 e usa a recurs ao
t t
(7.7)
Xn+1 (t) = X0 +
0
f (s, Xn (s))ds +
0
g (s, Xn (s))dW (s).
(7.8)
Vamos provar que Xn (t) (n = 0, 1, 2, ...) s ao fun c oes q.c. cont nuas e que a sucess ao por elas formada converge uniformemente q.c. O seu limite, que resulta ent ao uma fun c ao q.c. cont nua, e, como mostraremos, solu c ao da EDE. Note que, por ser X0 L2 , vem sup0td E[(X0 (t))2 ] < + e vamos ver que Xn (t) L2 e sup0td E[(Xn (t))2 ] < + para qualquer n, para o que se usa o m etodo de indu c ao. Com efeito, supondo a propriedade
2 O lema de Bellman-Gronwall diz que, dadas fun co es (t) 0 e h(t) intet gr aveis em [a, b], se (t) L 0 (s)ds + h(t) para todo o t [a, b] com L const tante positiva, ent ao (t) L 0 exp(L(t s))h(s)ds + h(t) para todo o t [a, b]. Uma demonstra ca o pode ser vista em [33]. Aqui aplicou-se o lema a `s fun co es (t) = E[|X (t) X (t)|2 IN (t)] e h(t) 0.
88
v alida para n 1, vemos que ela e v alida para n porque 3E (X0 )2 + 3K 2 d 0 1 + E (Xn1 (s))2 ds+ t 3K 2 0 1 + E (Xn1 (s))2 ds = t 3E (X0 )2 + B 0 1 + E (Xn1 (s))2 ds 2 3E (X0 ) + Bd 1 + sup0td E (Xn1 (t))2 , (7.9) com B = 3K 2 (d + 1), onde us amos a restri c ao ao crescimento e a propriedade de preserva c ao da norma do integral, bem como (a + b + c)2 2 2 2 3a + 3b + 3c e a desigualdade de Schwarz. Ent ao, podemos usar um racioc nio an alogo ao da demonstra c ao de (7.6), mas sem necessidade agora de recorrer a truncaturas (porque os momentos n ao truncados existem), para obter E[|Xn+1 (t) Xn (t)|2 ] L
t 0
E (Xn (t))2
E |Xn (s) Xn1 (s)|2 ds.
(7.10)
Iterando (7.10) obtemos (pode demonstrar por indu c ao) E[|Xn+1 (t) Xn (t)|2 ] Ln
t 0
(t s)n1 E |X1 (s) X0 (s)|2 ds. (n 1)!

t 0
Pela restri c ao ao crescimento, vem E |X1 (s) X0 (s)|2 = E | 2K 2 (d + 1)

t (1 0 t 0
f (s, X0 )ds +
+ E[(X0 )2 ])ds 2K 2 (d + 1)d(1 + E[(X0 )2 ]) =: M,
g (s, X0 )dW (s)|2
pelo que
0td
sup E[|Xn+1 (t) Xn (t)|2 ] M (Ld)n /n!.
Vem dn := sup0td |Xn+1 (t) Xn (t)| d 0 |f (s, Xn (s)) f (s, Xn1 (s))| ds+ sup0td
t 0
(g (s, Xn (s)) g (s, Xn1 (s))) dW (s) .
Utilizando (6.28) e a condi c ao de Lipschitz, vem E (dn )

2
|Xn (s) Xn1 (s)|2 ds (2K 2 d + 8K )dM (Ld)n1 /(n 1)! = C (Ld)n1 /(n 1)!.
2K 2 d
d E 0 d 8K 2 0 E 2
|Xn (s) Xn1 (s)|2 ds+
Introdu c ao ` as EDE e aplica c oes Pela desigualdade de Tchebyshev, vem C

+ n=1
89
P [dn > 1/2n1 ] n 22(n1) E[(dn )2 ] n1 /(n 1)! < +. n (4Ld)
Pelo lema de Borel-Cantelli, vem P [dn > 1/2n1 para innitos valores de n] = 0, pelo que, a partir de certa ordem, vem dn 1/2n1 q.c. Ent ao, como a + s erie k=0 dk e convergente, a s erie cuja sucess ao das somas iniciais e Xn (t) = X0 (t) +
n1 k=0
(Xk+1 (t) Xk (t)))
(os termos s ao majorados pelos dk ) converge uniformemente q.c. em [0, d]. Isto mostra a converg encia q.c. uniforme em [0, d] de Xn (t) quando n +. Designemos o seu limite por X (t). Como as fun c oes Xn (t) s ao obviamente n ao-antecipativas, o mesmo sucede a X (t). A continuidade q.c. das Xn (t) e a converg encia uniforme implicam a continuidade q.c. de X (t). Obviamente, pela restri c ao ao crescimento e continuidade q.c. t t de X (t), vem 0 |f (s, X (s))|ds 0 (1 + |X (s)|2 )1/2 ds < + q.c. e t t e um |g (s, X (s))|2 ds 0 (1 + |X (s)|2 )ds < + q.c., pelo que X (t) 0 processo de It o e os integrais que aparecem em (7.4) fazem sentido. S o falta ver que X (t) satisfaz (7.4) para t [0, d]. Apliquemos limites em probabilidade a ambos os membros de (7.8). O lado esquerdo Xn (t) converge em probabilidade para X (t) (a converg encia e at e q.c. e uniforme). Do lado direito, temos: Os integrais 0 f (s, Xn (s))ds convergem q.c. (e, portanto, em t c ao probabilidade) para 0 f (s, X (s))ds. Com efeito, a condi de Lipschitz implica K
t 0 t 0 t
f (s, Xn (s))ds
t 0
f (s, X (s))ds
|Xn (s) X (s)|ds 0 q.c.

t
Os integrais 0 g (s, Xn (s))dW (s) convergem em probabilidade para t g (s, X (s))dW (s). Com efeito, a condi c ao de Lipschitz implica 0 t 2 2 t |g (s, Xn (s)) g (s, X (s))| ds K 0 |Xn (s) X (s)|2 ds 0 0 q.c., e da (ver Sec c ao 6.5) resulta o pretendido. Logo, o lado direito X0 +
t 0
f (s, Xn (s))ds+
t 0
g (s, Xn (s))dW (s)
90
Cap tulo 7 - Equa c oes diferenciais estoc asticas converge em probabilidade para
t t
X0 +
0
f (s, X (s))ds +
0
g (s, X (s))dW (s).
Como os limites em probabilidade s ao q.c. iguais, vem

t t
X (t) = X0 +
0
f (s, X (s))ds +
0
g (s, X (s))dW (s) q.c.,
ou seja X (t) satisfaz (7.4). Demonstra ca o de que X (t) est a em H 2 [0, d] e sup0td E (X (t)) +
2
<
De (7.9), fazendo hn (t) = 1 + E[(Xn (t))2 ], tira-se hn (t) 3h0 + t B 0 hn1 (s)ds. Iterando sucessivamente, vem hn (t)
(Bt) ) 3h0 + 3h0 Bt + 3h0 (Bt 2! + ... + 3h0 (n1)! +
2 n 1
Bn
3 h0 1
t (ts)n1 0 (n1)! h0 (s)ds )2 (Bt)n + Bt + (Bt 2! + ... + n!
3h0 eBt ,
donde E[(Xn (t))2 ] 3 1 + E (X0 )2 teorema da converg encia dominada,
eBt e, fazendo n , vem, pelo eBt . (7.11)

2
E (X (t))2 3 1 + E (X0 )2
Claro que daqui resulta que X (t) H 2 [0, d] e sup0td E (X (t)) +.
<
Demonstra ca o de que F (s, ) = f (s, X (s, )) e G(s, ) = g (s, X (s, )) est ao em H 2 [0, d]
2 resultado anterior resulta que 0 E[f (s, X (s))]ds t 2 2 1 + E X (s) ds < + e que 0 E[g (s, X (s))]ds 1 + E X 2 (s) ds < +, pelo que F e G est ao em H 2 [0, t]. Daqui resulta, em particular, que o integral estoc astico t g ( s, X ( s )) dW ( s ) e uma martingala. 0
Do
t K2 0 t K2 0
Introdu c ao ` as EDE e aplica c oes Dedu ca o de (7.5) Pela f ormula de It o (ver (6.36)), vem (X (t))2 = (X0 )2 + t 2 0 2X (s)f (s, X (s)) + g (s, X (s)) ds + Aplicando esperan cas matem aticas vem E (X (t))2 = E (X0 )2 +
0 t t 0
91
2X (s)g (s, X (s))dW (s). (7.12)
E 2X (s)f (s, X (s)) + g 2 (s, X (s)) ds.
Admitiu-se que o integral estoc astico tem esperan ca nula apesar de n ao termos mostrado que a fun c ao integranda esteja em H 2 [0, d]. Rigorosamente dev amos ter truncado X (t) em m odulo por N , o que garante a nulidade do integral estoc astico, e passado ao limite quando N +. Usando a restri c ao ao crescimento e o facto de |x| (1 + x2 )1/2 , vem E (X (t))2 t E (X0 )2 + 0 E 2K |X (s)|(1 + |X (s)|2 )1/2 + K 2 (1 + |X (s)|2 ) ds t E (X0 )2 + K (K + 2) 0 E 1 + E[|X (s)|2 ] ds. Ponha-se (s) = 1 + E[|X (s)|2 ] e h(t) h = 1 + E[|X0 |2 ], note-se que t (t) = h + K (K + 2) 0 (s)ds e aplique-se a desigualdade de Gronwall t para obter 1 + E[|X (s)|2 ] h + K (K + 2)eK (K +2)t 0 eK (K +2)s hds, de onde resulta a primeira igualdade de (7.5). De (7.4), elevando ao quadrado e aplicando esperan cas matem aticas, vem E (X (t) X0 )2 2E 2E
t t 0 t 0
f (s, X (s))ds
+
2
g (s, X (s))dW (s)

t
2t 0 E |f (s, X (s))|2 ds + 2 0 E |g (s, X (s))|2 ds t 2(d + 1)K 2 0 1 + E |X (s)|2 ds. Aplicando a primeira express ao (7.5) e majorando eLs no integral por Lt e , obtemos a segunda express ao. A solu ca o e cont nua m.q. Para t s, X (t) e tamb em solu c ao de X (t) = X (s)+
t s
f (u, X (u))du
92
t
+ s g (u, X (u)dW (u). Como a condi c ao inicial e agora X (s) no instante s e o comprimento do intervalo e t s, vem da segunda rela c ao de (7.5), que E (X (t) X (s))2 2K 2 (d + 1) 1 + E (X (s))2 (t s) exp(K (K + 2)(t s)); (7.13)
atendendo ` a primeira rela c ao de (7.5), podemos majorar 1 + E (X (s))2 2 K (K +2)d . Conclu mos que E (X (t) X (s))2 por 1 + E (X (0)) e 0 quando t s 0, o que prova o pretendido. A solu ca o e um processo de Markov Seja 0 s t d. A justica c ao intuitiva de que X (t) e um processo de Markov vem do facto de X (t) = Xs,X (s) (t), isto e, de X (t) poder ser obtido no intervalo [s, t] como solu ca o de X (t) = X (s) + t t a custa s f (u, X (u))du + s g (u, X (u)dW (u). Logo X (t) ca denido ` (como fun c ao) de Xs e de W (u)W (s) (u [s, d]), pelo que e mensur avel para (X (s), W (u) W (s) : s u t). Como X (s) e mensur avel-As e, portanto, independente de (W (u) W (s) : s u t), conclu mos que, dado X (s), X (t) s o depende de (W (u) W (s) : s u t). Como (X (u) : 0 u s) As e independente de (W (u) W (s) : s u t), tamb em X (t), dado X (s), e independente de (X (u) : 0 u s) e, portanto, e um processo de Markov. Uma demonstra c ao formal pode ver-se, por exemplo, em [34], [3] e [32]. A solu ca o e, para f e g cont nuas em t, um processo de difus ao Seja 0 s t d e = t s. Condicionando em X (s) = x, obtemos de (7.13) Es,x (X (t) X (s))2 2K 2 (d + 1)(1 + x2 )(t s) exp(K (K + 2)(t s)); (7.14) express oes semelhantes podem ser obtidas para momentos de ordem par Es,x (X (t) X (s))2n C (1 + x2n )(t s)n exp(D(t s)), (7.15)
com C e D constantes positivas adequadas. Fica como exerc cio para o leitor obter express oes do g enero da segunda express ao de (7.5) para outros momentos de ordem par 2n no caso de X0 L2n e, da , deduzir (7.15) notando que a condi c ao inicial x e agora determin stica e, portanto, tem momentos de todas as ordens. Dado X (s) = x, vem
Introdu c ao ` as EDE e aplica c oes X (t) = Xs,x (t), pelo que
93
Es,x [(X (t) X (s))k ] := E (X (t) x)k |X (s) = x = E (Xs,x (t) x)k . Devido a (7.15), estes momentos existem para todo o k = 1, 2, 3, 4, .... Como j a sabemos que X (t) e de Markov e tem traject orias q.c. cont nuas, basta mostrar (5.1), (5.2) e (5.3). Claro que f e g s ao fun c oes cont nuas na vari avel x tamb em, devido a condi ` c ao de Lipschitz. De (7.15) com n = 2 vem que Es,x (X (s + ) x)4 A2 , com 1 Es,x (X (s + ) x)4 A = C (1+ x2n ) exp(Dd) constante, pelo que 0 quando 0. Logo 1 1 1 Ps,x [|X (s + ) x| ] Es,x (X (s + ) x)4 0 4 e resulta (5.1). Partindo de (7.4), como o integral estoc astico tem esperan ca nula, obtemos Es,x [X (s + ) x] = s Es,x [f (u, Xs,x (u))] du = s+ s+ f ( u, x ) du + E [( s,x f (u, Xs,x (u)) f (u, x))] du. s s
s+
(7.16)
Vem tamb em, usando a condi c ao de Lipschitz, a desigualdade de Schwarz e (7.14),

s+ s
Es,x [(f (u, Xs,x (u)) f (u, x))] du

s+ s
1/2 K 1/2
Es,x |f (u, Xs,x (u)) f (u, x)| Es,x |Xs,x (u) x|2 du
du
1/2
s+ s
1/2
1/2 = B 3/2 (7.17) com B constante n ao-dependente de s. A continuidade de f em t no intervalo fechado [0, d] e uniforme, pelo que, dado > 0 arbitr ario, existe um > 0 independente de s tal que
s+ f (u, x)du f (s, x) s s+ (f (u, x) f (s, x))du s
K 1/2 2K 2 (d + 1)(1 + x2 ) exp(K (K + 2)d)
1/2
=
t 0
ds = .
(7.18)
De (7.16), (7.17) e (7.18), obt em-se (5.2) com a(s, x) = f (s, x). Para obter (5.3) com b(s, x) = g 2 (s, x), parte-se de (7.12) em vez de
94
(7.4), usando tamb em a condi c ao inicial X (s) = x em vez de X (0) = X0 , e usam-se t ecnicas semelhantes. Est a conclu da a demonstra c ao do teorema.
7.3
Observa c oes e extens oes ao teorema de exist encia e unicidade
O teorema usa uma t ecnica recursiva ((7.7) e (7.8)) para construir a solu ca o da EDE. Esta t ecnica permitiria mesmo obter uma aproxima c ao t ao boa quanto desejado da solu c ao, mas normalmente a converg encia para a solu c ao e lenta e o m etodo pouco pr atico. Para m etodos mais expeditos de resolu c ao num erica e de simula c ao de EDE, remetemos o leitor para [41] e [42]. A condi c ao X0 L2 (X0 ter vari ancia nita) n ao e necess aria para a exist encia se solu c ao e, embora essa condi c ao tenha sido usada na demonstra c ao, seria dispens avel usando uma t ecnica de truncatura de X0 a um intervalo [N, N ] (a v.a. truncada j a estaria em L2 ) seguida da passagem ao limite quando N +. A condi c ao tamb em n ao faz falta para provar a unicidade e continuidade da solu c ao ou para o facto de ela ser um processo de Markov ou de difus ao, mas faz falta para as propriedades que envolvam exist encia de primeiros e segundos momentos da solu c ao. Ali as, se X0 L2n , as solu c oes da EDE t em momentos de ordem 2n. Para a exist encia e unicidade da solu c ao tamb em n ao e essencial a condi c ao de Lipschitz, basta que f e g satisfa cam uma condi c ao de Lipschitz local. Diz-se que uma fun c ao h(s, x) de dom nio [0, d] R satisfaz uma condi ca o de Lipschitz local se, para todo o N , existir um KN > 0 tal que, para todo o t [0, d] e |x| N , |y | N , vier |h(t, x) h(t, y )| KN |x y |. (7.19) A demonstra c ao da exist encia de solu c ao usa um t ecnica de truncatura de X (s) ao intervalo [N, N ] seguida da passagem ao limite quando N +. A restri c ao ao crescimento e a condi c ao de Lipschiz de f (t, x) e g (t, x) nem sempre precisam de vericar-se para todos os pontos x R, ou x R e y R. Basta que se veriquem para um conjunto D R caso a solu c ao X (t) da equa c ao tenha contradom onio contido em D com probabilidade um. Com efeito, se isso suceder, podemos substituir f e g por outras fun c oes a elas id enticas em D e nulas fora de D, que nada se altera.
95
Dados f e g , podemos dizer que a EDE dX (t) = f dt + gdW (t), X (0) = X0 , ou a equa c ao integral estoc astica correspondente X (t) = t t X0 + 0 f (s, X (s))ds + 0 g (s, X (s))dW (s), e uma correspond encia que transforma uma v.a. X0 e um dado processo de Wiener {W (t)}t[0,d] (num dado espa co de probabilidade com uma certa ltra c ao n ao antecipativa As ) na solu c ao {X (t)}t[0,d] da EDE, a qual est a adaptada a ltra ` c ao. Se mudarmos o processo de Wiener escolhido, altera-se a solu c ao. Este tipo de solu c ao, que foi a que n os estud amos (e que se subentende quando nada se diz), tamb em se chama solu ca o forte. Claro que, uma vez escolhido o processo de Wiener, a solu c ao e quase certamente u nica e, a cada corresponde o valor de X0 ( ) e uma traject oria {W (t, )}t[0,d] do processo de Wiener, que e transformada pela EDE (ou equa c ao integral correspondente) numa traject oria {X (t, )}t[0,d] da solu c ao da EDE. Podem tamb em denir-se solu co es fracas, que correspondem ` a situa c ao em que s ao apenas dados f , g e X0 e se procura um espa co de (t)}t[0,d] e {W (t)}t[0,d] de tal probabilidade e um par de processos {X (t) = X0 + t f (s, X (s))ds + t g (s, X (s))dW (s). forma que se tenha X 0 0 A diferen ca e que, enquanto na solu c ao forte, o processo de Wiener era dado a priori e escolhido arbitrariamente, cando a solu c ao (forte) dependente do processo escolhido, agora o processo de Wiener e obtido a posteriori e faz parte da solu c ao do problema. H a que ter cuidado para s ` que se considere uma ltra c ao A a qual X (t) esteja adaptado e para t. E poss a qual o processo de Wiener W (t) seja uma martingala-A vel t (s))dW (s) a esta estender a deni c ao do integral estoc astico 0 g (s, X (t) n situa c ao, mesmo quando X ao est a adaptado ` a ltra c ao gerada pelo processo de Wiener e pela condi c ao inicial. Claro que uma solu c ao forte e tamb em uma solu c ao fraca, mas o rec proco e falso. Um contra-exemplo pode ser visto em [51], em que se mostra que uma dada EDE n ao tem solu c oes fortes mas tem solu c oes fracas. A unicidade que consider amos no teorema da Sec c ao 7.1 e a unicidade forte, isto e, dadas duas solu c oes, as suas traject orias coincidem completamente com probabilidade um. Tamb em se pode denir unicidade fraca, que signica que, dadas duas solu c oes (fortes ou fracas), as suas traject orias t em as mesmas fun c oes de distribui c ao de dimens ao nita. Claro que a unicidade forte implica a unicidade fraca, mas o rec proco e falso. Nas condi c oes do teorema da Sec c ao 7.1, verica-se que quaisquer solu c oes, fortes ou fracas, s ao fracamente u nicas. De facto, dadas duas solu c oes, sejam fortes ou fracas, elas s ao tamb em solu c oes (t), W (t)) e (X (t), W (t)). Ent fracas. Sejam elas (X ao, como existem solu c oes fortes, sejam X (t) e Y (t) as solu c oes fortes correspondentes a
96
(t) e W (t)). Pelo m W etodo de Picard das aproxima c oes sucessivas dado por (7.7)-(7.8), as sucess oes aproximadoras t em as mesmas distribui c oes de dimens ao nita, pelo que o mesmo sucede aos seus limites q.c., que s ao X (t) e Y (t). Repare-se que, satisfeitas as condi c oes do teorema de exist encia e unicidade, do ponto de vista probabil stico, isto e, das fun c oes de distribui c ao de dimens ao nita, n ao h a diferen ca entre solu c oes, sejam fortes ou fracas, pelo que se pode trabalhar com solu c oes fracas para determinar as propriedades probabil sticas da solu c ao forte. Por vezes n ao s ao v alidas as condi c oes de Lipschitz ou de restri c ao ao crescimento e n ao h a garantia de exist encia de solu c ao forte. Importa nesses casos ver se existem solu c oes fracas. Condi c oes de exist encia de solu co es fracas podem ver-se em [55] e [37]. Um outro resultado interessante (ver [37]) e que, se existir solu c ao fraca e se houver unicidade forte, ent ao h a solu c ao forte. Vimos que, quando f e g , al em de satisfazerem as restantes propriedades do teorema da Sec c ao 7.1, eram cont nuas no tempo, a solu c ao da EDE era um processo de difus ao com coeciente de tend encia f (t, x) e coeciente de difus ao g 2 (t, x). O problema rec proco e tamb em relevante. Dado um processo de difus ao X (t) (t [0, d]) num espa co de probabilidade (, F , P ) com coeciente de tend encia a(s, x) e coeciente de difus ao b(s, x), ser a que existe uma EDE da qual o processo seja solu c ao fraca? Sob condi c oes de regularidade adequadas, a resposta e positiva. Para alguns resultados ver [55], [37] e [34]. Assim h a de certa forma uma correspond encia entre solu co es de EDE e processos de difus ao. No caso particular de f e g n ao dependerem do tempo (e satisfazerem as condi c oes do teorema da Sec c ao 7.1), ser ao automaticamente fun c oes cont nuas do tempo e a solu c ao da EDE ser a um processo de difus ao homog eneo com coeciente de tend encia f (x) e coeciente de difus ao g 2 (x). Neste caso, a EDE diz-se uma equa ca o diferencial estoc astica aut onoma e ` a respectiva solu c ao tamb em se diz uma difus ao de It o. Notese que neste caso n ao e necess ario vericar a restri c ao ao crescimento porque ela e uma consequ encia da condi c ao de Lipschitz (a u nica que e ent ao preciso vericar). No caso aut onomo podemos trabalhar com t [0, +) j a que f e g n ao dependem do tempo. No caso aut onomo, nas condi c oes do teorema da Sec c ao 7.1, pode mesmo concluir-se que a solu c ao da EDE e um processo de Markov forte. Veja-se [34] ou [51]. No caso aut onomo, desde que estejamos a trabalhar em dimens ao um (isto e, n ao podemos generalizar a sistemas de EDE), podemos obter resultados mesmo quando falha a condi c ao de Lipschitz mas f (x) e g (x)
97
t em derivada cont nua (note que a exist encia de derivada cont nua limitada implica a condi c ao de Lipschitz mas, se a derivada n ao for limitada, a condi c ao de Lipschitz pode falhar). Neste caso, prova-se que existe uma solu c ao (forte) u nica at e a um instante de explos ao T ( ); a condi c ao de Lipschitz e suciente mas n ao necess aria para evitar explos oes (isto e, para ter T = + q.c.). H a um teste que permite saber se haver a ou n ao explos ao, o teste de Feller (ver [48]). Podemos ter equa co es diferenciais estoc asticas multidimensionais. O enquadramento e semelhante ao dos processos de It o multidimensionais da Sec c ao 6.8, s o que agora usa-se G(s, ) = g(s, X(s, )) e F(s, ) = f (s, X(s, )). A condi c ao de Lipschitz e a restri c ao ao crescimento de f e g no teorema de exist encia e unicidade s ao id enticas com |x y| a signicar a dist ancia euclideana. A validade dos resultados do teorema da Sec c ao 7.1 permanece. Quando a solu c ao e um processo de difus ao, o coeciente de tend encia e o vector f e o coeciente de difus ao e a matriz ggT . Note-se que, neste caso, dado um processo de difus ao com coeciente de tend encia a e coeciente de difus ao b, h a v arias matrizes g para as quais ggT = b, mas todas elas d ao as mesmas propriedades probabil sticas para as solu c oes da EDE, pelo que, do ponto de vista das solu c oes fracas, e indiferente qual delas se escolhe. O tratamento deste Cap tulo permite incluir EDE do tipo dY (t) = f (t, Y (t), W (t))dt + g (t, Y (t), W (t))dW (t), acrescentando a equa c ao dW (t) = dW (t) e trabalhando a duas dimens oes com o vector X(t) = [Y (t), W (t)]T e a EDE dX(t) = f 0 dt + g 1 dW (t).
A condi c ao inicial e da forma X(t) = [Y0 , 0]T . Note que f (t, Y (t), W (t)) = f (t, X(t)) e g (t, Y (t), W (t)) = g (t, X(t)). Tamb em se admitem fun c oes f e g que tenham uma depend encia do acaso mais geral do que s o depender dele atrav es de X (s), mas e preciso que se mantenha o cat acter n ao-antecipativo. Finalmente, podemos considerar equa co es diferenciais estoc asticas de ordem superior da forma (aqui o expoente (n) representa a derivada de ordem n) Y (n) (t) = f (t, Y (t), ..., Y (n1) (t)) + g (t, Y (t), ..., Y (n1) (t))(t)
98
com condi c oes iniciais Y (i) (0) = ai (i = 0, 1, ..., n 1). Usa-se a mesma t ecnica que nas EDO trabalhando com o vector X(t) = [Y (t), Y (1) (t), ..., Y (n1) (t)]T e a EDE 0 Y (1) (t) Y (2) (t) 0 dt + dX(t) = dW (t). 0 ... g (t, X(t) f (t, X(t)
Cap tulo 8
Estudo do modelo de Black-Scholes

8.1 Estudo pelo c alculo de It o
O modelo de Black-Scholes foi referido no Cap tulo 3 e pode, entre outras coisas, ser usado para modelar a cota c ao de uma ac c ao na bolsa e tamb em o crescimento de uma popula c ao de seres vivos em ambiente sujeito a perturba c oes aleat orias que afectem a taxa de crescimento per capita da popula c ao. Trata-se pois de uma aleatoriedade ambiental. O modelo n ao serve para tratar a aleatoriedade demogr aca, isto e, as perturba c oes demogr acas do n umero de nascimentos e mortes devidas ao acaso, que ocorrem mesmo quando as taxas de natalidade e mortalidade s ao constantes (isto e, mesmo na aus encia de perturba c oes ambientais que afectem tais taxas). O modelo e descrito pela EDE dX (t) = rX (t)dt + X (t)dW (t), ou pela correspondente forma integral
t t
X (0) = x0
(8.1)
X (t) = x0 +
0
rX (s)ds +
0
X (s)dW (s).
(8.2)
Aqui r representa a taxa m edia de rendimento ou crescimento. Quanto a , mede a intensidade dos efeitos das utua c oes aleat orias do mercado/ambiente sobre a taxa de rendimento/crescimento. D a uma ideia do desvio-padr ao das utua c oes em torno do valor m edio das taxas e e conhecido na literatura nanceira por volatilidade. Estamos a supor que o valor inicial x0 e conhecido, isto e, determin stico e vamos supor 99
100
Cap tulo 8 - Estudo do modelo de Black-Scholes
ainda que x0 > 0. N ao esquecer que W (t) = W (t, ) e X (t) = X (t, ) dependem do acaso (cen ario do mercado ou estado da natureza nos exemplos dados). Nesta Sec c ao vamos adoptar o c alculo de It o, isto e, o segundo integral em (8.2) vai ser interpretado como integral de It o. Vamos agora determinar a solu c ao da EDE (8.1), ou seja, a solu c ao da forma integral (8.2). Como f (t, x) rx e g (t, x) x no teorema da Sec c ao 7.1, a EDE e aut onoma e satisfaz a condi c ao de Lipschitz; pelo facto de ser aut onoma, a condi c ao de restri c ao ao crescimento e consequ encia da condi c ao de Lipschitz. Sabemos assim que existe uma e uma s o solu c ao q.c. cont nua, a qual e um processo de Markov e, at e, um processo de difus ao homog eneo ( e uma difus ao de It o) com coeciente de tend encia a(x) = rx e coeciente de difus ao b(x) = 2 x2 . Como o fen omeno e por natureza multiplicativo, pode ser u til trabalhar em escala logar tmica, usando a nova vari avel Z (t) = ln(X (t)/x0 ). (8.3)
Vamos obter a solu c ao da EDE por tr es vias diferentes a m de explorar v arios conceitos e t ecnicas. Solu ca o via uso da f ormula de It o Seja h(t, x) = ln(x/x0 ), pelo que Z (t) = h(t, X (t)). Aplicando a f ormula de It o (ver (6.35) ou a mnem onica que se segue), obtemos dZ (t) = Rdt + dW (t), Z (0) = 0,
t t
(8.4)
com R = r 2 /2. Na forma integral, vem Z (t) = 0 Rds + 0 dW (s). t Como, por (6.13), 0 1dW (t) = 1(W (t) W (0)) = W (t) (a fun c ao integranda e fun c ao em escada com um u nico degrau), a solu c ao desejada e Z (t) = Rt + W (t). (8.5) Se se preferir escrever a solu c ao em termos da escala original, teremos X (t) = x0 exp(Rt + W (t)), a que se chama movimento browniano geom etrico. Breve estudo da solu ca o Vem Z (t) N (Rt, 2 t). (8.6)
101
de notar que o valor m E edio (esperan ca matem atica) Rt de Z (t) e diferente da solu c ao (Z (t) = rt) do modelo determin stico dX = rXdt. Resulta que X (t) tem distribui c ao lognormal com valor esperado E [X (t)] = x0 exp Rt + 2 t/2 = x0 exp(rt), (8.7)
o mesmo valor que a solu c ao determin stica X (t) = x0 exp(rt). Como W (t)/t 0 q.c. quando t +, obtemos Z (t) = t (R + W (t)/t) Rt q.c.. Portanto, quando t +, obtemos X (t) + q.c. se R > 0 ou seja, se r > 2 /2 0 q.c. se R < 0 ou seja, se r < 2 /2. (8.8)
Este comportamento difere aparentemente do do modelo determin stico, em que r > 0 ou r < 0 determina limite + ou limite nulo, respectivamente. Este diferente comportamento qualitativo permite, por exemplo no caso do crescimento populacional, que a popula c ao se extinga com probabilidade um mesmo para valores positivos (desde que inferiores a 2 /2) da taxa m edia de crescimento r. A partir da distribui c ao normal de Z (t) facilmente se ob em a f.d.p. p(t, y ) de X (t): (ln(y/x0 ) Rt) 1 exp p(t, y ) = 2 2 2 t y 2 t
2
(8.9)
Para s > t, podemos tamb em obter X (t) condicionado ao valor de t t X (s) visto que X (t) = X (s) + s rX (u)du + s X (u)dW (u) ou, em t t termos de Z (t), Z (t) = Z (s) + s Rdu + s dW (u). Vem Z (t) |(Z (s) = c) N (c + R(t s), 2 (t s)). (8.10)
Daqui resulta, pondo c = ln(x/x0 ), que a f.d.p. de transi c ao para X (t) e p(t s, y |x) = 1 y 2 2 (t s) exp (ln(y/x) R(t s)) 2 2 (t s)
2
, (8.11)
que nos d a a f.d.p. de X (t) condicionado a se ter X (s) = x. Solu ca o via equa co es de Kolmogorov A express ao (8.11) pode tamb em obter-se resolvendo directamente a
102
equa ca o de Kolmogorov progressiva 1 2 p(, y |x) + (a(y )p(, y |x)) (b(y )p(, y |x)) = 0 y 2 y 2 com a condi c ao terminal lim 0 p(, y |x) = (y x) e com a(y ) = ry e b(y ) = 2 y . Para resolver esta equa c ao, ajuda fazer a mudan ca de vari avel z = ln(y/x0 ). Quanto ` a express ao (8.9), pode obter-se resolvendo directamente a equa c ao de Kolmogorov progressiva p(t, y ) 1 2 + (a(y )p(t, y )) (b(y )p(t, y )) = 0 t y 2 y 2 com a condi c ao terminal lim 0 p(, y ) = (y x0 ) e com a(y ) = ry e b(y ) = 2 y . Claro que agora isso e desnecess ario pois j a obtivemos (8.11) e, como a condi c ao inicial e determin stica (X0 = x0 ), basta atender a que p(t, y ) = p(t, y |x0 ). Note-se que as equa c oes de Kolmogorov nos permitem obter as densidades de transi c ao donde, conhecendo a distribui c ao inicial (neste caso, em que a condi c ao inicial e determin stica, conhecendo o valor de x0 ), podemos determinar qualquer distribui c ao de dimens ao nita da solu c ao. Mas e um m etodo mais limitado que o anterior pois n ao nos d a uma express ao para a solu c ao X (t) como fun c ao da condi c ao inicial e da traject oria concreta do processo de Wiener W (t). Na maioria dos casos, a traject oria de W (t) n ao e conhecida e queremos mesmo e calcular probabilidades de certos acontecimentos relativos ao processo X (t) e, neste caso, o conhecimento das distribui c oes de dimens ao nita e suciente. Solu ca o via convers ao a uma equa ca o de Stratonovich Tamb em podemos converter a EDE de It o (8.1) numa EDE de Stratonovich equivalente (com a mesma solu c ao) usando a equival encia (6.45)(6.47). Esta pode ser resolvida usando as regras usuais de c alculo, a que estamos habituados, o que se torna nais simples. A EDE de It o (8.1) e equivalente ` a EDE de Stratonovich (S ) dX (t) = rX (t) 1 2 X (t) dt + X (t)dW (t) = RX (t)dt + X (t)dW (t), X (0) = x0 . (8.12)
Utilizando nesta regras usuais de diferencia c ao de fun c oes compostas vem 1 (S ) dZ (t) = dX (t) = Rdt + dW (t), X (t)

t t
103
que, na forma integral, d a Z (t) = 0 Rdt + (S ) 0 dW (t) = Rt + W (t), o mesmo resultado que j a t nhamos obtido antes. Note-se que t (S ) 0 1dW (t) = 1(W (t) W (0)) = W (t) e dado por (6.44), neste caso com g 1, e vai coincidir, porque se trata de fun c ao g (t, x) n aodependente de x, com o integral de It o. Note-se que us amos o c alculo de Stratonovich apenas como auxiliar, j a que o objectivo e resolver a equa c ao original (8.1) segundo o c alculo de It o. S o que, para o fazer, tir amos partido de isso ser equivalente a resolver a equa c ao modicada (8.12) segundo o c alculo de Stratonovich. Convidamos o leitor a tornar a olhar para as Figuras 2.1 e 2.2 do Cap tulo 2. A Figura 2.1 mostra em escala logar tmica a traject oria real (correspondente ao cen ario do mercado que efectivamente ocorreu) das cota c oes di arias de fecho de ac c oes do BCP no per odo de 8 de Abril de 1991 a 30 de Junho de 1997. As estimativas dos par ametros para = 0.084/ano o modelo (8.1) feitas a partir destas observa c o es foram R (R = r 2 /2) e 2 = 0.0373/ano ( = 0.193/ ano). Neste caso em que temos uma solu c ao expl cita, a estima c ao dos par ametros pode fazer-se pelo m etodo da m axima verosimilhan ca, atendendo ` a propriedade de Markov da solu c ao. Suponhamos que, al em do valor inicial x0 (suposto determin stico), observ amos as cota c oes X (tk ) = xk nos instantes tk (k = 1, 2, ..., n), instantes que supomos ordenados mais c crescentemente. E omodo trabalhar com Z (tk ) = ln(X (tk )/x0 ) = ln(xk /x0 ) = zk ; note-se que, fazendo t0 = 0, vem Z (t0 ) = z0 = 0. Claro que, pela propriedade de Markov da solu c ao, a f.d.p. conjunta fZ (t1 ),...,Z (tn) (z1 , ..., zn ) das v.a. Z (t1 ), ..., Z (tn ) e igual ao produto fZ (t1 )|Z (t0 )=z0 (z1 )fZ (t2 )|Z (t1 )=z1 (z2 )...fZn |Zn1 =zn1 (zn ) das sucessivas densidades de transi c ao. Estas s ao f aceis de obter j a que Z (ti )|(Z (ti1 ) = zi1 ) N (zi1 + R(ti ti1 )+ (ti ti1 )). Deixamos ao leitor, a t tulo de exerc cio, o trabalho de explicitar os c alculos. A express ao da f.d.p. conjunta das observa co es, considerada como fun c ao dos par ametros R e , e a fun c ao de verosimilhan ca das observa c oes e os estimadores de m axima verosimilhan ca dos par ametros s ao os valores dos par ametros que maximizam a fun c ao de verosimilhan ca. Foi assim que obtiv emos as estimativas acima indicadas. Para mais informa c oes sobre m etodos de estima c ao, teste e predi c ao neste tipo de equa c oes de Black-Scholes (permitindo at e compara c oes entre v arias taxas de rendimento), veja [11] e [15]. Para modelos de din amica de popula c oes, podem ver-se alguns destes problemas estat sticos tratados em [9], [10], [11], [13] e [14]. Muitas vezes, por em, n ao se disp oe de solu c ao de expl cita nem das densidades de transi c ao e n ao e poss vel obter a fun ca o de verosimilhan ca.
104
No entanto, mesmo nesses casos, e muito importante para as aplica c oes a estima c ao param etrica ou n ao-param etrica dos coecientes de tend encia e de difus ao a partir das observa c oes de uma ou mais traject orias (normalmente s o se disp oe de uma traject oria), sejam as observa c oes feitas em tempo cont nuo ou (como sucedeu no exemplo) em tempo discreto. Problemas estat sticos relacionados s ao os da escolha do modelo, os testes de hip oteses sobre par ametros e a previs ao de valores n ao observados do processo. A leitura sobre estas mat erias est a ainda muito dispersa. Pode consultar [5], [26] e [43]. A Figura 2.2 mostra na mesma escala logar tmica duas traject orias simuladas pelo m etodo de Monte Carlo de um movimento browniano geom etrico usando como par ametros as estimativas anteriores, isto e, com R = r 2 /2 = 0.084/ano, = 0.193/ ano. Correspondem a dois valores de simulados. N ao sabendo, poder a ser dif cil dizer qual a traject oria real e quais s ao simuladas, o que e uma indica c ao da razoabilidade do modelo de Black-Scholes como um primeiro modelo para o estudo de cota c oes de ac c oes. Os estudos mais aprofundados indicam que o comportamento das ac c oes parece diferir, em v arios aspectos mais nos, do comportamento do movimento browniamo geom etrico. Por exemplo, a distribui c ao dos retornos ln(X (t + )/X (t)), que no modelo s ao v.a. independentes identicamente distribu das normais, parece ter alguma assimetria e ter caudas mais pesadas do que a normal. Na Figura 8.1 vemos em simult aneo duas traject orias simuladas com o mesmo R mas com valores de diferentes. A mais saltitante usa = 0.193/ ano, a outra usa um valor 10 vezes menor, = 0.0193/ ano. De facto, us amos em ambas a mesma traject oria do ru do perturbador (donde a mesma traject oria do processo de Wiener), pelo que as diferenc as entre as duas curvas s ao devidas unicamente ` a diferente escolha do valor de . Assim, o leitor poder a apreciar o papel desempenhado por . J a agora, indicamos ao leitor como foram feitas as simula c oes. Neste modelo, a tarefa est a muito facilitada pois basta simular o processo de Wiener (pelo m etodo descrito na Sec c ao 4.3) uma vez que temos uma solu ca o expl cta directamente em termos do processo de Wiener W (t) (ver(8.5)). Chamamos s o a aten c ao que n ao apresentamos os gr acos de Z (t) mas de Y (t) = ln X (t) = Z (t) + x0 . Normalmente n ao se disp oe de uma solu c ao expl cita da EDE e, nesse caso, a simula c ao pelo m etodo de Monte Carlo e ainda mais importante porque permite obter valores aproximados da solu c ao e estudar propriedades da mesma que, de outra forma, n ao estariam ao nosso alcance. Nestes casos, as t ecnicas de simula c ao ter ao de ser diferentes, inspirando-se nas t ecnicas de resolu c ao num erica de equa c oes diferenci-
105
8,4
8,2
Y(t)=ln (cotao)
7,8
7,6
7,4
7,2 0 1 2 3 4 5 6 7
t (anos)
Figura 8.1: Traject orias simuladas em escala logar tmica do movimento browniano geom etrico com R = r 2 /2 = 0.084/ano e = 0.193/ ano (curva mais saltitante) ou = 0.0193/ year (curva menos saltitante usando a mesma traject oria do ru do perturbador). ais ordin arias (EDO) conjugadas com a simula c ao das traject orias do processo de Wiener. A situa c ao, por em, e bastante mais complexa do que nas EDO. O leitor interessado pode consultar [41], [42] e [7].
8.2
Estudo pelo c alculo de Stratonovich
Aqui vamos resolver a EDE com o mesmo aspecto que (8.1) mas usando o c alculo de Stratonovich. O nosso modelo agora e a EDE de Stratonovich (S ) dX (t) = rs X (t)dt + X (t)dW (t), X (0) = x0 . (8.13)
Esta equa c ao n ao e equivalente ` a EDE de It o (8.1). Por isso us amos rs em vez de r para facilitar a distin c ao entre este modelo e o modelo (8.1) do c alculo de It o (quanto a n ao h a necessidade de distinguir). A solu c ao de (8.13) obt em-se facilmente usando regras usuais de c alculo. Fazendo a mudan ca de vari avel (8.3), vem (S ) dZ (t) = 1 dX (t) = rs dt + dW (t), X (t)
t 0 rs dt
(8.14)
ou, na forma integral, Z (t) =
+ (S )
t 0
dW (t), donde a solu c ao
106 almejada
Cap tulo 8 - Estudo do modelo de Black-Scholes Z (t) = rs t + W (t) N (rs t, 2 t).
(8.15)
O aspecto e, de facto, diferente do resultado (8.5)-(8.6) obtido pelo c alculo de It o. Agora o valor esperado de Z (t) coincide com a solu c ao do modelo determin stico. Mas agora o valor esperado de X (t), E [X (t)] = x0 exp rs t + 2 t/2 , j a n ao coincide com a solu c ao do modelo determin stico. Agora vem Z (t) = t (rs + W (t)/t) rs t q.c. Logo, quando t +, vem + q.c. se rs > 0 X (t) (8.16) 0 q.c. se rs < 0. Este comportamento concorda com o do modelo determin stico, mas discorda do comportamento do modelo (8.1) do c alculo de It o usado na Sec c ao 8.1. Agora, no caso da aplica c ao ao crescimento de uma popula c ao, sempre que a taxa m edia rs de crescimento for positiva, a popula c ao cresce de forma ilimitada e, sempre que aquela taxa for negativa, a popula c ao extingue-se com probabilidade um. Esta diferen ca de comportamentos quando se usam c alculos diferentes p oe um problema delicado nas aplica c oes, particularmente quando tem incid encia sobre quest oes t ao importantes como a extin c ao. Qual dos c alculos se deve usar? Vamos examinar estas quest oes no Cap tulo 9.
Cap tulo 9
A quest ao dos c alculos de It o e de Stratonovich

9.1 Controv ersia
Veric amos no Cap tulo 8, com o modelo de Black-Scholes, que o uso do c alculo de It o ou do c alculo de Stratonovich na resolu c ao de uma equa c ao diferencial estoc astica podia dar resultados diferentes e que os respectivos modelos tinham comportamentos qualitativos diferentes, por exemplo, quando aplicados ao crescimento de popula c oes em ambientes aleat orios, no que dizia respeito ` a extin c ao da popula c ao. Estas diferen cas s ao frequentes na literatura aplicada. Noutros modelos mais realistas de crescimento populacional, como o modelo log stico, h a situa c oes em que o c alculo de Stratonovich prev ea n ao-extin c ao e a exist encia de uma densidade estacion aria (uma esp ecie de equil brio estoc astico) e o modelo de It o prev e extin c ao com probabilidade um. Esse facto provocou controv ersias na literatura sobre qual o c alculo mais apropriado nas aplica c oes. Houve mesmo uma teoria sobre a limita c ao ` a sobreposi c ao de nichos ecol ogicos para uma comunidade de esp ecies em competi c ao, avan cada em 1972 por May e MacArthur (ver [47], [45] e [46]), que (al em de outros problemas) falharia se, em vez do c alculo de It o, se usasse o c alculo de Stratonovich (ver [29] e [57]). Vimos na Sec c ao 6.7 que o c alculo de It o parece ser a melhor aproxima c ao quando o fen omeno ocorre intrinsecamente em tempo discreto (com perturba c oes induzidas por um ru do branco em tempo discreto). J a quando o fen omeno ocorre intrinsecamente em tempo cont nuo (com perturba c oes induzidas por um ru do colorido em tempo cont nuo), o c alculo de Stratonovich parece ser a melhor aproxima c ao. Esta discuss ao 107
108
Cap tulo 9 - A quest ao It o-Stratonovich
sobre a utiliza c ao nas aplica c oes e tratada em v arios livros de texto. Mas, na vida real, n ao e f acil descortinar qual das duas situa c oes e aplic avel. Com efeito, imaginem que desejam modelar o crescimento de uma popula c ao. Se a popula c ao tiver gera c oes sobrepostas com reprodu c ao ocorrendo continuamente no tempo, a indica c ao ser a para usar o c alculo de Stratonovich. Se, pelo contr ario, existirem epocas reprodutivas peri odicas, curtas e bem denidas, ou se as gera c oes n ao se sobrepuserem, a indica c ao ser a para usar um modelo em tempo discreto. Por em, estas indica c oes s ao em boa parte in uteis e pode-se discutir, e discute-se, qual delas e a que mais se aproxima de uma determinada situa c ao real. Devemos lembrar-nos que os nascimentos e mortes s ao acontecimentos discretos mas que podem ocorrer em qualquer instante num intervalo de tempo cont nuo e, mesmo os nascimentos que ocorrem numa curta esta ca o reprodutiva, se espalham de facto ao longo da esta c ao. Estas diferen cas entre os c alculos t em sido um obst aculo ` a sua aplica c ao e ` a credibilidade destes modelos em certas a reas. Voltemos ao modelo de Black-Scholes (8.1) ou (8.13), conforme se use o c alculo de It o ou o de Stratonovich. Ser a que o par ametro r (que design amos por rs no c alculo de Stratonovich para ajudar a distinguir), interpretado como taxa m edia de crescimento/rendimento, representa a mesma taxa m edia? Ou ser a que representa m edias de tipos diferentes? Veremos que e este o caso e que toda a controv ersia que existiu sobre a quest ao do c alculo a usar nas aplica c oes se baseou num equ voco. E que implicitamente a literatura presume que a letra r que usa para ambos os c alculos signica a mesma coisa nos dois c alculos, a chamada taxa m edia de crescimento/rendimento. Tamb em implicitamente se tem presumido que o termo m edia, sem especica c ao de qual o tipo de m edia, e inequ voco e que, portanto, a mesma m edia e usada nos dois c alculos. Isso n ao e verdade e era a fonte de toda a controv ersia.
9.2
Resolu c ao da controv ersia
Vejamos ent ao o que signica taxa de rendimento (ou de crescimento) e taxa m edia de rendimento. Podemos pensar no contexto da cota c ao de uma ac c ao, ou equivalentemente no valor do capital investido numa ac c ao, para tornar mais v vida a compreens ao dos conceitos. No modelo determin stico dX (t)/dt = rX (t), a taxa de rendimento quando o capital (cota c ao da ac c ao) e x no instante t e a taxa de crescimento por unidade de capital. No caso do crescimento de uma popula c ao, signica a taxa de crescimento per capita. Seja qual for a aplica c ao, ela
Introdu c ao ` as EDE e aplica c oes e dada por 1 1 1 dX (t) = lim (X (t + t) x) , X (t) dt x t0 t
109
que e simplesmente r. No caso estoc astico, X (t + t) e uma v.a. e temos de utilizar uma m edia. Mas h a v arios tipos de m edias. Se tirarmos a m edia arutm etica, obtemos a taxa m edia aritm etica de rendimento quando o capital no instante t e x: 1 ra = 1 1 lim (Et,x [X (t + t)] x) . x t0 t (9.1)
Esta m edia e igual a r se se usar o c alculo de It o (modelo (8.1)) e e igual a rs + 2 /2 se se usar o c alculo de Stratonovich (modelo (8.13)). Exerc cio: Use os resultados obtidos no Cap tulo 8 para demonstrar esta arma c ao. Podemos tamb em usar a taxa m edia geom etrica de rendimento quando o capital no instante t e x: rg = =
1 x
limt0
1 t
1 limt0 t Et,x
(exp (Et,x [ln X (t + t)]) x)

t) ln X (t+ . x
(9.2)
Vem igual a R = r 2 /2 se se usar o c alculo de It o e rs quando se usa o c alculo de Stratonovich. Exerc cio: Use os resultados obtidos no Cap tulo 8 para demonstrar esta arma c ao. Assim, quando usavam a mesma letra r em ambos os c alculos para se referir ` a taxa m edia de rendimento, os autores pensavam que estavam a falar da mesma m edia mas n ao estavam. Como vimos, no c alculo de It o, r signica a taxa m edia aritm etica de rendimento (a taxa m edia geom etrica e R = r 2 /2) e, no c alculo de Stratonovich, signica a taxa m edia geom etrica de rendimento. Portanto, se especicarmos qual a m edia que est a em uso, ambos os c alculos produzem exactamente os mesmos resultados qualitativos e
1 Como estamos a lidar com equa co es aut onomas, esta taxa n ao depende de t. Neste modelo de Black-Scholes, que e muito simples, tamb em n ao depende de x, mas isso n ao e assim noutros modelos aut onomos (em que a taxa de rendimento no modelo determin stico tamb em dependa de x).
110
Cap tulo 9 - A quest ao It o-Stratonovich
quantitativos. Nomeadamente, em termos de taxa m edia geom etrica de rendimento (o leitor pode ver o que se passa em termos da taxa m edia aritm etica), ambos os c alculos d ao Z (t) = rg t + W (t) X (t) = x0 exp(rg t + W (t)) e tamb em X (t) + q.c. se rg > 0 0 q.c. se rg < 0. (9.3)
(9.4)
Isto e, no caso do crescimento populacional, h a extin c ao (X (t) 0 quando t +) ou crescimento ilimitado (X (t) +) conforme a taxa m edia geom etrica de crescimento rg seja negativa ou positiva. Sendo o fen omeno multiplicativo, e natural que seja o uso da m edia geom etrica que d a resultados qualitativamente an alogos ao modelo determin stico e, o que quer amos destacar, resultados id enticos para ambos os c alculos. A aparente diferen ca entre os dois c alculos, que gerou muita controv ersia na literatura sobre qual o c alculo mais apropriado em diversas aplica c oes, era apenas uma confus ao sem antica. Eliminada a confus ao, podemos utilizar indiferentemente qualquer dos dois c alculos, que produzem exactamente os mesmos resultados. S o temos de ter cuidado e usar para r o valor da m edia apropriada ao c alculo que estamos a usar (a taxa m edia aritm etica de rendimento se usarmos o c alculo de It o, a taxa m edia geom etrica de rendimento se usarmos o c alculo de Stratonovich). Para mais pormenores, ver [20]. Mas ser a esta conclus ao v alida apemas para o modelo de BlackScholes? Em [21] este resultado de total harmonia entre os dois c alculos e alargado a modelos aut onomos bastante gerais da forma dX (t) = f (X (t))X (t)dt + X (t)dW (t) (com algumas restri c oes sobre f ). De novo, ambos os c alculos d ao os mesmos resultados se usarmos para f (x) a express ao da taxa m edia aritm etica ou geom etrica de rendimento/crescimento quando o capital e x, isso conforme usemos o c alculo de It o ou de Stratonovich, respectivamente. Uma extens ao posterior (em fase de publica c ao) a modelos da forma dX (t) = f (X (t))X (t) + h(X (t))X (t)dW (t) (com algumas restri c oes sobre f e h) requer uma modica c ao da taxa m edia geom etrica.
Cap tulo 10
Estudo de alguns funcionais

10.1 F ormula de Dynkin
Consideremos uma equa ca o diferencial estoc astica aut onoma dX (t) = f (X (t))dt + g (X (t))dW (t), ts X (s) = x (10.1)
com f (x) e g (x) satisfazendo uma condi c ao de Lipschitz, pelo que se vericam as condi c oes para aplica c ao do teorema de exist encia e unicidade (ver Sec c ao 7.1), j a que a restri c ao ao crescimento decorre, no caso aut onomo, da condi c ao de Lipschitz. Designemos a solu c ao por Xs,x (t). A solu c ao e tamb em um processo de difus ao homog eneo com coeciente de tend encia a(x) = f (x) e coeciente de difus ao b(x) = g 2 (x),
a que se chama difus ao de It o. A homogeneidade implica que Xs,x (s+ ) e X0,x ( ) t em, como processos em 0, as mesmas distribui c oes iniciais e de transi c ao e, portanto, assim indiferente usar um ou outro as mesmas distribui c oes nitas. E no c alculo de valores esperados. Se trabalharmos com valores esperados condicionais ao valor da solu c ao num determinado instante (tipo Es,x ), s o interessam as probabilidades de transi ca o e podemos mesmo esquecer qual e a condi c ao inicial, designando ent ao simplesmente por X (t) uma solu c ao gen erica da EDE dX (t) = f (X (t))dt + g (X (t))dW (t) sem 111
112
Cap tulo 10 - Estudo de alguns funcionais
especica c ao a priori de qual e a condi c ao inicial no instante 0. Como sabemos, xada essa condi c ao inicial, a solu c ao eu nica q.c. Como s o vamos trabalhar com as distribui c oes de probabilidade, tudo o que se segue neste Cap tulo pode ser aplicado a qualquer processo de difus ao homog eneo com coeciente de tend encia a(x) = f (x) e coeciente de difus ao b(x) = g 2 (x) cont nuos, mesmo que f e g n ao satisfa cam condi c oes de Lipschitz, desde que haja solu c ao fraca e unicidade fraca da correspondente EDE. Sabemos que, se f e g tiverem derivada cont nua, existe mesmo uma u nica solu c ao forte at e um instante de explos ao, bastando, nesse caso, vericar que o instante de explos ao e q.c. innito. Seja u(t, x) := Ex [h(Xt )], (10.2) onde abrevi amos E[...|X (0) = x] = E0,x [...] para Ex [...] e onde h e uma fun ca o mensur avel-Borel cont nua limitada. Se u for cont nua e limitada com primeiras e segundas derivadas parciais em x tamb em cont nuas e limitadas, ent ao, de (5.12), (5.13) e (5.14), ela satisfaz a equa ca o de Kolmogorov regressiva (EKR) u = Du t com condi c ao terminal lim u(t, x) = h(x),
t0
(10.3)
onde D = a(x)
1 2 + b(x) 2 x 2 x
e o operador de difus ao. Vamos denir o operador innit esimal da difus ao de It o X (t): Ah(x) := lim
t0
Ex [h(X (t)] h(x) . t
(10.4)
O conjunto de fun c oes reais h(x) para as quais o limite exista para todo o x ser a chamado o dom nio de A. Note-se que, se h(x) e de classe C 2 e tem suporte compacto, ent ao h est a no dom nio de A e A = D. De facto, podemos aplicar o teorema de It o a Y (t) = h(X (t)) e obter dY (t) = =
h(X (t)) 2 h(X (t)) dX (t) + 1 (dX (t))2 x 2 x2 2 h(X (t)) (X (t)) 1 2 f (X (t)) x + 2 g (X (t)) hx 2 h(X (t)) g (X (t)) x dw(t).
dt+
Introdu c ao ` as EDE e aplica c oes Na forma integral, vem Y (t) = h(X (t)) = 2 t (X (s)) X (s)) 1 2 +2 g (X (s)) hx ds+ h(x) + 0 f (X (s)) h(x 2
t 0 X (s)) g (X (s)) h(x dW (s),
113
(10.5)
bastando agora aplicar esperan cas matem aticas Ex e notar que a esperan ca matem atica do segundo integral e nula para, ap os alguns c alculos, se concluir o pretendido. Pode mesmo provar-se que, se h e de classe C 2 (mesmo que n ao tenha suporte compacto) e se h est a no dom nio de A, ent ao A = D (ver [51]). De (10.5) resulta o caso particular da f ormula de Dynkin para fun c oes reais h de classe C 2 e suporte compacto: Ex [h(X (t))] = h(x) + E h(x) + Ex
t 0
t 0
Ah(X (s))ds = Dh(X (s))ds .
(10.6)
Uma vers ao mais geral da f ormula de Dynkin permite utilizar qualquer tempo de Markov tal que Ex [ ] < +:
Ex [h(X ( ))] = h(x) + Ex

0
Dh(X (s))ds .
(10.7)
Uma demonstra c ao pode ver-se em [51], onde se chama tamb em a aten c ao de que a exig encia de h ter suporte compacto e dispens avel se for o tempo de primeira sa da de um intervalo limitado. Com efeito, nesse caso, os valores de X (s) que aparecem no integral cam connados a esse intervalo, pelo que h pode ser substitu da por uma fun c ao com suporte compacto que coincida com h no intervalo. De (10.6) obt em-se facilmente, para h de classe C 2 e suporte compacto e u(t, x) := Ex [h(X (t))], u = Ex [Dh(X (t))]. t (10.8)
Vamos mostrar, seguindo de perto [51], que u satisfaz a equa ca o de Kolmogorov regressiva (EKR) u = Du t (10.9)
(no lado direito deve interpretar-se u como fun c ao apenas de x para se
114
Cap tulo 10 - Estudo de alguns funcionais
poder aplicar o operador A = D) com condi c ao terminal u(0+ , x) = h(x). Para demonstrar (10.9), note-se primeiro, atendendo a (10.8) (que resulta da f ormula de Dynkin), que u e diferenci avel em t. Basta agora notar que
1 r
(Ex [u(t, X (r))] u(t, x)) = 1 r Ex EX (r ) [h(X (t))] Ex [h(X (t))] 1 =r Ex [Ex [h(X (t + r))|Ar ] Ex [h(X (t))|Ar ]] )u(t,x) 1 =r Ex [h(X (t + r)) h(X (t))] = u(t+r,xr .
e fazer r 0. Obtemos ` a esquerda Au e ` a direita u t , o que prova o pretendido. Como u e, como fun c ao de x, de classe C 2 , vem A = D. Note-se que u e limitada de classe C 1,2 . Em [51] mostra-se mesmo que a solu c ao eu nica no sentido de que, se u (t, x) e uma solu c ao limitada de classe C 1,2 da EKR (10.9) satisfazendo a condi c ao terminal u (0+ , x) = h(x), ent ao u (t, x) = u(t, x). Os resultados desta sec c ao, que nos ser ao particularmente u teis no Cap tulo 11, s ao facilmente generaliz aveis ao caso multidimensional.
10.2
F ormula de Feynman-Kac
A EKR pode ser generalizada, obtendo-se a f ormula de Feynman-Kac que, para h(x) de classe C 2 com suporte compacto e q (x) cont nua e limitada inferiormente, diz que
t
v (t, x) = Ex exp satisfaz
q (X (s))ds h(X (t))

0
(10.10)
v = Dv qv t v (0+ , x) = h(x).
(10.11)
com a condi c ao terminal
Vamos esbo car a demonstra c ao, seguindo de perto [51]. Seja Y (t) = t h(X (t)) e Z (t) = exp 0 q (X (s))ds . J a aplic amos o teorema de It o
a Y (t), obtendo (10.5). Para Z (t) obt em-se dZ (t) = Z (t)q (X (t))dt. Neste caso, tamb em se obt em d(Y (t)Z (t)) = Y (t)dZ (t) + Z (t)dY (t) + dY (t)dZ (t) = Y (t)dZ (t)+ Z (t)dY (t)+ 0 e, como Y (t)Z (t) e um processo de It o, ent ao v (t, x)= Ex [Y (t)Z (t)] e diferenci avel em t (mesmo racioc nio
Introdu c ao ` as EDE e aplica c oes que antes usando a f ormula de Dynkin). Ent ao
1 r (Ex [v (t, X (r))] v (t, x)) = 1 r Ex EX (r ) [Z (t)h(X (t))] Ex [Z (t)h(X (t))] = t 1 q(X (s+r ))ds 0 |Ar Ex [Z (t)h(X (t))|Ar ] r Ex Ex h(X (t + r))e r 1 = r Ex [Z (t + r) exp 0 q (X ())d h(X (t + r)) Z (t)h(X (t))] 1 = r Ex [h(X (t + r)Z (t + r) h(X (t))Z (t)] r 1 +r Ex h(X (t + r))Z (t + r) exp 0 q (X (s))ds 1 .
115
Fazendo r 0 e notando que 1 r h(X (t+r))Z (t+r) exp 0 q (X (s))ds 1 e limitada e converge pontualmente para h(X (t))Z (t)q (X (0)), obt em-se v (t, x) + q (x)v (t, x). Mais uma vez, temos A = D. Av (t, x) = t Note-se que v e de classe C 1,2 e e limitada em conjuntos da forma K R, com K conjunto real compacto. Em [51] mostra-se mesmo que uma solu c ao com estas propriedades eu nica no sentido de que, se v (t, x) for uma outra solu c ao de (10.11) com tais propriedades satisfazendo a condi c ao terminal v (0+ , x) = h(x), ent ao v (t, x) = v (t, x). Os resultados desta sec c ao, que nos ser ao u teis a prop osito da f ormula de Black-Scholes, s ao facilmente generaliz aveis ao caso multidimensional.
116
Cap tulo 11
Introdu c ao ao estudo das difus oes de It o unidimensionais

11.1 O processo de Ornstein-Uhlenbeck
No Cap tulo 3, vimos que a projec c ao num eixo do movimento browniano de uma part cula suspensa num u do foi descrita por Einstein atrav es de um processo de Wiener da forma X (t) = x0 + W (t), onde x0 e a coordenada da posi c ao inicial da part cula e e o coeciente de difus ao, que nos d a a velocidade de altera c ao da vari ancia da posi c ao da part cula. Este modelo n ao tem em conta que a fric c ao e nita pois a part cula, ap os um choque com uma mol ecula do u do, n ao p ara instantaneamente depois de mudar de posi c ao, antes se move continuamente com velocidade decrescente. No modelo de Einstein, a part cula n ao tem mesmo velocidade denida (pois n ao existe derivada, no sentido corrente, do processo de Wiener). No sentido de melhorar o modelo de Einstein, apareceu em 1930 o modelo de Ornstein-Uhlenbeck (ver [58]), que e a primeira EDE que conhe co. Neste modelo, considera-se que as for cas que actuam sobre a part cula s ao a for ca de fric c ao e a for ca devida ` as colis oes aleat orias com as mol eculas do u do. Sendo V (t) a velocidade da part cula na direc c ao de um eixo coordenado e m a massa da part cula, a for ca mdV (t)/dt que sobre ela actua ser a dada pela EDE m dV (t) = f V (t) + (t), dt 117 (11.1)
118
Cap tulo 11 - Difus oes de It o unidimensionais
onde f e o coeciente de fric c ao. Pondo = f /m e = /m, vem dV (t) = V (t)dt + dW (t). (11.2)
Dada a velocidade inicial, podemos resolver a equa c ao para obter a velocidade V (t) da part cula (que agora est a denida) e, conhecida a posi ca o incial, podemos integrar a velocidade para obter a posi c ao da particula. A solu c ao e o processo de Ornstein-Uhlenbeck. 1 Uma variante deste modelo e usada para modelar a din amica das taxas de juro e e tamb em conhecida por modelo de Vasicek. O modelo considera um valor de refer encia R > 0 e prop oe para a taxa de juro X (t) no instante t a EDE dX (t) = (X (t) R)dt + dW (t), X (0) = x0 , (11.3)
com > 0, > 0 e x0 > 0 (determin stico). Note-se que, na aus encia de utua c oes do mercado ( = 0), h a uma tend encia para que a taxa reverta para o valor de refer encia R (chama-se-lhe revers ao para a m edia ) e, de facto, converge para R quando t +. Quando h a utua c oes aleat orias do mercado, esta revers ao e perturbada. Esta e uma EDE aut onoma com f (x) = (x R) e g (x) satisfazendo as condi c oes do teorema de exist encia e unicidade do Cap tulo 7 (basta vericar a condi c ao de Lipschitz, que e obvia face a estas fun c oes terem derivada cont nua limitada). A solu c ao, que sabemos existir e ser u nica, e uma difus ao de It o. Sabemos que a solu c ao e um processo de difus ao homog eneo com coeciente de tend encia a(x) = (x R) e coeciente de difus ao b(x) 2 . Como g (x) n ao depende de x, os c alculos de It o e Stratonovich coincidem. Assim, podemos usar regras usuais de c alculo. Seja V (t) = X (t) R. Vem dV (t) = dX (t) = V (t)dt + dW (t) (modelo de Ornstein-Uhlenbeck), donde et dV (t) + et V (t)dt = et dW (t). Consequentemente, d (et V (t)) = et dW (t). Ponhamos Z (t) = et V (t) (vem Z (0) = x0 R) para obter Z (t) = t (x0 R) + 0 es dW (s). Logo, X (t) = V (t) + R = et Z (t) + R = et (x0 R) +
t 0
es dW (s) + R =
t s 0 e dW (s).
R + et (x0 R) + et
1 Por vezes, reserva-se a designa ca o de processo de Orntein-Uhlenbeck para uma solu ca o de (11.2) que seja processo estacion ario. Para obter essa solu ca o, h a que escolher convenientemente a v.a. V (0).
Introdu c ao ` as EDE e aplica c oes Como a fun c ao integranda e determin stica,

t t s e dW (s) 0
119 tem distribui c ao .
N Conclu mos que
0,
0
(es ) ds
=N
0,
1 e2t 1 2
X (t) N
R + et (x0 R),
2 1 e2t 2
Como esta distribui ca o transiente converge quando t + para a distribui ca o estacion aria 2 N R, , 2 chamando X+ a uma v.a com esta distribui c ao, podemos dizer que X (t) converge em distribui c ao para X+ . A densidade estacion aria ea f.d.p. desta distribui c ao estacion aria. Assim, ao contr ario do que sucede no modelo determin stico dX (t) = (X (t) R)dt, em que X (t) converge para o ponto de equil brio R, no modelo estoc astico (11.3) a taxa de juro X (t) utua aleatoriamente mas a sua distribui c ao de probabilidade converge para uma distribui c ao de equil brio, a distribui c ao estacion aria acima referida. Podemos falar de um equil brio estoc astico. O processo X (t) e erg odico e, como se referiu na Sec c ao 5.2, podemos estimar a m edia assint otica R e a vari ancia 2 assint otica 2 usando m e dias e vari a ncias temporais ao longo da u nica traject oria do processo usualmente dispon vel (a traject oria observada, correspondente ao cen ario do mercado que efectivamente ocorreu). A aplica c ao do modelo (11.3) a taxas de juro tem o problema de X (t) poder ter valores negativos, embora (para os valores t picos dos par ametros) com probabilidade insignicante. Como curiosidade, referimos que um modelo alternativo em que esse problema e ultrapassado (se R n ao for demasiado elevado) e o modelo de Cox-Ingersoll-Ross (CIR) dX (t) = (X (t) R)dt + X (t)dW (t), X (0) = x0 . (11.4)
No modelo (11.3) conseguimos determinar a solu c ao expl cita da EDE e a sua f.d.p.. Passando ao limite quando t +, vericou-se a converg encia em distribui c ao e pudemos determinar a densidade estacion aria. Geralmente, por em, n ao e poss vel obter a express ao expl cita da solu c ao X (t) de uma difus ao de It o, nem sequer se consegue resolver a equa c ao de Kolmogorov progressiva (que e uma equa c ao ` as derivadas
120
parciais) para determinar a f.d.p. de X (t). Pode, no entanto, ser mesmo assim poss vel determinar a densidade estacion aria caso exista. Ela tem de ser densidade invariante e, portanto, e solu c ao de (5.20), que e uma equa c ao diferencial ordin aria muito mais f acil de resolver. Isso n ao signica que uma solu c ao de (5.20) seja densidade estacion aria, no sentido de X (t) convergir em distribui c ao para uma distribui c ao com essa densidade. Isso ter a de ser deduzido por outra via, nomeadamente estudando o comportamento da solu c ao da EDE nas fronteiras do espa co de estados. Uma introdu c ao ao estudo das difus oes de It o a uma dimens ao ser ao objecto das pr oximas Sec c oes. O estudo, infelizmente, n ao e extens vel, pelo menos nos moldes em que aqui e apresentado, a v arias dimens oes.
11.2
Tempo de sa da de um intervalo
Consideremos um processo de difus ao homog eneo X (t) (t [0, +)) com coeciente de tend encia a(x) = f (x) e coeciente de difus ao b(x) = g 2 (x),
ambos fun c oes cont nuas de x, cujo espa co de estados seja um intervalo (aberto, fechado ou semiaberto) de extremo inferior r1 e extremo superior r2 , com r1 < r2 +. Qualquer das fronteiras r1 e r2 pode pertencer ou n ao ao espa co de estados. Vamos supor que b(x) > 0 para x (r1 , r2 ) e que o processo e solu c ao fraca, fracamente u nica, de uma EDE dX (t) = f (X (t))dt + g (X (t))dW (t) com condi c ao inicial X (0). Vamos supor ainda que o processo e regular, isto e, que Px [Ty < +] := P [Ty < +|X (0) = x] > 0 onde Ty = inf {t 0 : X (t) = y } (11.5) e o tempo de primeira passagem por y (quando o processo n ao passa por y , vem Ty = +); basicamente, isso signica que todos os estados do interior do espa co de estados comunicam entre si (pode-se transitar com probabilidade positiva entre quaisquer dois pontos do interior do espa co de estados). Vamos considerar dois pontos a e b do espa co de estados tal que r1 < a < x < b < r2 e designemos por Ta,b = min{Ta, Tb } (11.6) (r1 < x, y < r2 ),
121
o instante em que o processo atinge a ou b pela primeira vez, ou seja, sai do intervalo (a, b). Teorema. Seja h uma fun ca o cont nua limitada e
Ta,b
vh (x) := Ex
0
h(X (s))ds .
(11.7)
Seja v (x) (x [a, b]) uma solu ca o da equa ca o diferencial Dv (x) = h(x) (11.8) tal que v (a) = v (b) = 0. Ent ao vh (x) < + e vh (x) = v (x). Em particular, fazendo h(x) 1, conclu mos que Ex [Ta,b ] < + (o que implica que Ta,b e q.c. nito) e e dada pela solu ca o da equa ca o diferencial Dv (x) = 1 tal que v (a) = v (b) = 0. Demonstra ca o Seja = min{T, Ta,b} com T > 0 xo. Vem obviamente Ex [ ] < + e podemos aplicar a f ormula de Dynkin (10.7) a v , obtendo
Ex [v (X ( ))] = v (x) + Ex
0
Dv (X (s))ds .
Para s , vem X (s) [a, b] e, portanto, Dv (X (s)) = h(X (s)), pelo que
Ex [v (X ( ))] = v (x) Ex
h(X (s))ds .
0
(11.9)
Ex
Quando T +, vem Ta,b . Como Ex 0 h(X (s))ds = v (x) Ex [v (X ( ))] e uniformemente limitada em T , vem Ex 0 h(X (s))ds
Ta,b 0
h(X (s))ds < +. Tamb em vem X ( ) X (Ta,b ) = a ou b

Ta,b 0
e, portanto, v (X ( )) 0. Logo, de (11.9), vem Ex v (x), como pretendido.
h(X (s))ds =
Teorema. Seja u(x) (x [a, b]) uma solu ca o da equa ca o diferencial Du(x) = 0 tal que u(a) = 0 e u(b) = 1. Ent ao Px [Tb < Ta ] := P [Tb < Ta |X (0) = x] = u(x). (11.11) (11.10)
122
Demonstra ca o Fa camos como na demonstra c ao do teorema anterior e apliquemos a f ormula de Dynkin (10.7) a u. Vem
Ex [u(X ( ))] = u(x) + Ex

0
Du(X (s))ds .
(11.12)
Para s , vem X (s) [a, b] e, portanto, Du(X (s)) = 0, pelo que Ex [u(X ( ))] = u(x). Fazendo T +, vem Ex [u(X (Ta,b ))] = u(x). Como X (Ta,b ) s o pode tomar os valores a (quando Ta < Tb ) ou b (quando Tb < Ta ), vem Ex [u(X (Ta,b ))] = u(a)(1 Px [Tb < Ta ])+ u(b)Px [Tb < Ta ] = Px [Tb < Ta ] = u(x) como pretendido. Para obter express oes expl citas, temos que resolver as equa c oes diferenciais que surgem nos dois teoremas anteriores. Para isso vamos seguir de perto [39] e utilizar duas medidas absolutamente cont nuas com respeito ` a medida de Lebesgue, a medida de escala S e a medida de velocidade M . As suas densidades est ao denidas para (r1 , r2 ) a menos de uma constante multiplicativa (pois 0 (r1 , r2 ) e arbitrariamente escolhido) por
s( ) = exp (densidade de escala ) e m( ) =
2a( ) d b( )
(11.13)
1 b( )s( )
(11.14)
(densidade de velocidade ). Podemos ent ao denir, a menos de constantes multiplicativa e aditiva (pois x0 (r1 , r2 ) e arbitrariamente escolhido), as fun c oes de distribui c ao
x
S (x) =
x0
s( )d
x
(11.15)
e M (x) =
m( )d,
x0
(11.16)
a que chamamos, respectivamente, fun ca o de escala e fun ca o de velocidade. As medidas de densidade e escala podem ent ao ser denidas (a menos de uma constante multiplicativa) para intervalos semiabertos por S (a, b] = S (b) S (a) (11.17)
Introdu c ao ` as EDE e aplica c oes e M (a, b] = M (b) M (a) e, para os outros borelianos do espa co de estados, por extens ao. Para uma fun c ao h(x) de classe C 2 , temos Dh(x) = donde Dh(x) = 1 2 1 m(x) d dx 1 dh(x) s(x) dx dh(x) dS (x) ,
123
(11.18)
1 d 2 dM (x)
(11.19)
du(x) d Para obter u(x), podemos escrever (11.10) na forma dM (x) dS (x) = 0. Integrando com respeito a M e depois com respeito a S , obtemos u(x) = B + AS (x) com A e B constantes. Usando u(a) = 0 e u(b) = 1, vem S (x) S (a) u(x) := Px [Tb < Ta ] = . (11.20) S (b) S (a)
Exerc cio: Escolha uma das fun c oes de escala S (x) e fa ca Y (t) = S (X (t)). Use o teorema de It o e determine os coecientes de tend encia e difus ao de Y (t). Note que o coeciente de tend encia e nulo (no Cap tulo 12 veremos outro m etodo de anular o coeciente de tend encia) e, portanto, SY (y ) = y e uma fun c ao de escala de Y (t). Logo, supondo Y (0) = y , a probabilidade de Y (t) passar por b antes de passar por a a e dada por y c ao das dist ancias). Diz-se que Y (t) est a em ba (a propor escala natural. A raz ao da designa c ao fun c ao de escala prov em de S transformar uma difus ao de It o numa difus ao em escala natural.
h ( ) a M , obtemos dv dS ( ) = 2 a h( )dM ( ) + A = 2 a h( )m( )d + A (A constante). Integrando agora com respeito a S , obtemos
Para obter vh (x), que e solu c ao de (11.8), podemos escrever esta dvh (x) d equa c ao na forma dM (x) dS (x) = 2h(x). Integrando com respeito

vh (x) = 2
h( )m( )ddS ( ) + A(S (x) S (a)) + B
com A e B constantes. Usando vh (a) = 0 e vh (b) = 0, vem B = 0 e
124 A=
2 S (b)S (a)

b a a b
h( )m( )ddS ( ). Logo

a x
vh (x) = 2 u(x)
a
h( )m( )ddS ( )
h( )m( )ddS ( ) .
a a
Uma mudan ca de ordem de integra c ao e algumas contas d ao: vh (x) := Ex

Ta,b h(X (s))ds = 0 b 2u(x) x (S (b) S ( ))m( )h( )d + x
(11.21)
2(1 u(x))
(S ( ) S (a))m( )h( )d.
Para interpretar a medida de velocidade, consideremos um processo em escala natural (S(x)=x), seja > 0 e fa camos a = x , b = x + . De (11.20) vem u(x) = Px [Tx,x+ ] = 1/2 e, de (11.21) com h(x) 1, vem
x + x
Como j a referido, fazendo h(x) 1, obtemos Ex [Ta,b ].
Ex [Tx,x+ ] = pelo que lim0 lim0
(x + )m( )d +
( x + )m( )d,
1 2 Ex [Tx,x+ ] = x + 1 2 x (x + )m( )d
1 2
x ( x
x + )m( )d = m(x).
Isto mostra que, para pequeno, se o processo estiver em escala natural e estiver no ponto x, vai em m edia estar no intervalo (x , x + ) um tempo m(x)2 . Teria talvez sido mais razo avel chamar a M medida de ocupa c ao mas n ao foi essa a designa c ao consagrada. Podemos generalizar o primeiro teorema desta sec c ao de forma a conseguirmos determinar momentos de ordem superior de Ta,b . Teorema. Seja h uma fun ca o cont nua limitada, q uma fun ca o de classe C2 e
Ta,b
Uq,h (x) := Ex q
0
h(X (s))ds
(11.22)
Seja U (x) (x [a, b]) uma solu ca o da equa ca o diferencial DU (x) = h(x)V (x) tal que U (a) = U (b) = q (0), com V (x) := Ex q
Ta,b 0
(11.23) h(X (s))ds
125
(onde q representa a derivada de q ). Ent ao Uq,h (x) < + e vem Uq,h (x) = U (x). n Em particular, fazendo h(x) 1, q (x) = xn e Un (x) := Ex [(Ta,b ) ] (n = 1, 2, ...), conclu mos que Ex [(Ta,b )n ] < + e dada pela solu ca o da equa ca o diferencial DUn (x) = nUn1 (x) tal que Un (a) = Un (b) = 0. Demonstra ca o A t ecnica e semelhante ` a dos teoremas anteriores, pelo que vamos saltar a passagem de come car com = min{T, Ta,b} e fazer depois T +, bem como a demonstra c ao de que a esperan ca e nita. Aplicando a f ormula de Dynkin (10.7) a U , vem
Ta,b
Ex [U (X (Ta,b )] = U (x) + Ex
0
DU (X (s))ds .
(11.24)
y Atendendo a (11.23) e designado por Ta,b o tempo de primeira passagem por a ou b quando o processo se inicia no instante 0 com o valor y (omite-se y quando y = x), vem
Ex Ex Ex
Ta,b 0
DU (X (s))ds = Ex h(X (s))EX (s) q h(X (s))q h(X (s))q Ta,b

s X (s)
Ta,b 0
X (s) Ta,b
h(X (s))V (X (s))ds = h(X (u))du ds =
Ta,b 0 Ta,b 0 Ta,b 0
Ta,b +s s Ta,b s
h(X (u))du ds =
Ex Ex
h(X (u))du ds =
Ta,b 0
Ta,b dq 0
h(X (u))du ds
ds = q (0) Ex q
h(X (u))du
Substituindo em (11.24) e atendendo a que Ex [U (X (Ta,b )] = q (0) (j a que U (a) = U (b) = q (0)), obtemos o resultado desejado
Ta,b
Ex q
0
h(X (u))du
= U (x).
Exerc cio: Determine a express ao de Ex (Ta,b ) das de densidade e escala.
em termos das medi-
Exerc cio: A partir do teorema anterior, obtenha uma equa c ao diferencial para R(, x) = Ex [exp (Ta,b )] (transformada de Laplace da den-
126
sidade do tempo de primeira passagem). Um m etodo mais directo pode n n R(0,x) n = ( 1) E ser visto em [25]. Note que n x [(Ta,b ) ] (n = 1, 2, ...), o que permite obter os momentos de Ta,b . Tamb em a f.d.p. de Ta,b pode ser obtida por invers ao da transformada de Laplace, embora sejam raros os casos em que se conseguem express oes expl citas.
11.3
Comportamento nas fronteiras de difus oes de It o e densidades estacion arias
Aqui seguimos de perto [39]. Consideremos o enquadramento previsto no in cio da Sec c ao 11.2. Em particular, supomos X (0) = x (r1 , r2 ). Seja Tr+ = limar1 Ta e Tr = limbr2 Tb ; escolhendo a < x e b > x, 1 2 como Ta Tr1 e Tb Tr2 , claro que Tr+ Tr1 e Tr Tr2 . Se Tr+ = 1 2 1 +, ent ao Tr1 = + = Tr+ . Se Tr+ < +, dada a continuidade das 1 1 traject orias, vem X (Tr+ ) = limar1 X (Ta ) = limar1 a = r1 donde Tr1 1 Tr+ e, portanto, Tr1 = Tr+ . Logo, em qualquer caso, n ao h a necessidade 1 1 de distinguir Tr+ de Tr1 . Por raz oes an alogas, vem Tr2 = Tr . Note1 2 se que, se r1 n ao estiver no espa co de estados, vem necessariamente Tr1 = +. x Caso S (r1 , x0 ] = r10 s( )d = + para algum x0 (r1 , r2 ), ent ao Px [Tr1 < Tb ] = 0 para todo o r1 < x < b < r2 (11.25)
e a fronteira r1 diz-se n ao-atractiva pois o processo passa primeiro por qualquer ponto ` a esquerda do ponto de partida x antes de poder pasS (b)S (x) sar por r1 . Com efeito, de (11.20), vem Px [Tr1 < Tb ] = S (b)S (r1 ) =
S (x,b] S (r1 ,b] b
= 0 pois S (x, b] = x s( )d > 0 (visto s( ) > 0) e S (r1 , b] = S (r1 , x0 ] + S (x0 , b] = +. Ali as, se S (r1 , x0 ] e innito [nito] para algum x0 (r1 , r2 ), ent ao e innito [nito] para qualquer x0 (r1 , r2 ). x O caso contr ario ao anterior d a-se quando S (r1 , x0 ] = r10 s( )d < + para algum x0 (r1 , r2 ), vindo ent ao Px [Tr1 Tb ] > 0 para todo o r1 < x < b < r2 (11.26)
S (x,b] e a fronteira r1 diz-se atractiva. Com efeito, Px [Tr1 < Tb ] = S (r1 ,b] > 0 pois S (x, b] > 0 e S (r1 , b] < +. Vimos assim que a condi c ao necess aria e suciente para que a fronteira r1 seja atractiva e que s(x) seja integr avel numa vizinha ca direita de r1 . Analogamente, poder amos mostrar que uma condi c ao necess aria e suciente para que a fronteira r2 seja atractiva (a deni c ao e seme-
127
lhante) e que s(x) seja integr avel numa vizinhan ca esquerda de r2 , isto r2 e, S [x0 , r2 ) = x0 s( )d < + para algum x0 (r1 , r2 ). Uma fronteira atractiva pode n ao estar no espa co de estados e pode at e suceder que a probabilidade de a atingir em tempo nito seja nula (fronteira inantig vel). A fronteira r1 diz-se ating vel se a probabilidade de poder ser atingida em tempo nito for positiva, isto e, se Px [Tr1 < +] > 0 para todo o r1 < x < r2 . (11.27)
Se a fronteira r1 e ating vel, ela satisfaz a propriedade Ex [Tr1 ,b ] < + mas nada garante que Ex [Tr1 ] seja nita. Pode provar-se (ver [39]) que uma fronteira n ao-atractiva n ao e ating vel (tendo-se Px [Tr1 < +] = 0 para qualquer x (r1 , r2 )) e que nem sequer e ating vel em tempo innito (isto e, Px [limt+ X (t) = r1 ] = 0 para qualquer x (r1 , r2 )). J a uma fronteira atractiva, seja ou n ao ating vel, pode sempre ser atingida em tempo innito (isto e, Px [limt+ X (t) = r1 ] > 0 para qualquer x (r1 , r2 )). Uma fronteira n ao-ating vel n ao faz obviamente parte do espa co de estados. Uma condi c ao necess aria e suciente para que a fronteira r1 seja x ating vel e (ver [39]) que (r1 ) := r10 S (r1 , ]dM ( ) < + (depende de x0 (r1 , r2 ) mas o valor de x0 e irrelevante para saber se a quantidade e ou n ao nita). Note-se que, trocando a ordem de integra c ao, se pode obter uma express ao alternativa para (r1 ): (r1 ) :=
x0 r1 x0 r1
S (r1 , ]dM ( ) = r10 x0 m( )ds( )d =
s( )dm( )d = r1 x0 M (, x0 ]dS ( ). r1
(11.28)
A classica c ao das fronteiras envolve ainda outros aspectos interessantes. Em particular, se a fronteira e ating vel, h a que especicar, para al em dos coecientes de tend encia e difus ao, o comportamento na fronteira (absor c ao, reex ao, reex ao pegajosa, etc.). Para mais pormenores, consulte-se [39]. Caso r1 e r2 sejam ambas n ao-atractivas, podemos, em linguagem informal, dizer que h a uma tend encia para as traject orias que se aproximam das fronteiras serem empurradas para o interior do espa co de estados, pelo que, como todos os estados interiores comunicam entre si, a distribui c ao transiente (distribui c ao de X (t)) poder a ter uma densidade p(t, y ) = fX (t) (y ) (r1 < y < r2 ). A quest ao e se a distribui c ao transiente estabiliza no sentido de convergir quando t + para uma distribui c ao limite (seja X+ uma v.a. com essa distribui c ao) com f.d.p. p(y ) = fX+ (y ) (r1 < y < r2 ), a chamada densidade estacion aria. Esta
128
e uma possibilidade real dado o processo de difus ao ser homog eneo e, portanto, haver regras de transi c ao entre estados independentes do tempo. Claro que o facto de as fronteiras serem n ao-atractivas e importante, caso contr ario as traject orias, ao serem atra das para uma ou ambas as fronteiras, fariam com que a distribui c ao de probabilidade se concentrasse progressivamente numa ou em ambas as fronteiras, inviabilizando a exist encia de uma densidade limite no interior do espa co de estados. Por em, a condi c ao de as fronteiras serem n ao-atractivas n ao e suciente. Claro que, a existir densidade estacion aria, espera-se intuitivamente que ela seja proporcional ao tempo de ocupa c ao de cada estado, isto e, seja r proporcional a m(y ), o que s o ser a poss vel se r12 m( )d for nito. Suponhamos ent ao que r1 e r2 s ao fronteiras n ao-atractivas. A existir densidade estacion aria p(y ), ela ter a de ser densidade invariante e, portanto, satisfazer (5.20), que tamb em podemos escrever na forma 2 d(a(y )p(y )) 1 d (b(y )p(y )) 2 . Integrando esta equa c ao em ordem a y , vem dy dy 2
)p(y )) = C (C constante). Multipliquemos membro a 2a(y )p(y ) + d(b(y dy membro pelo factor integrante s(y ). Vem, ap os c alculos simples, ds(y ) d(b(y )p(y )) d(b(y )p(y )s(y )) b(y )p(y ) dy + s(y ) = Cs(y ), pelo que = Cs(y ). dy dy Integrando de novo, vem b(y )p(y )s(y ) = CS (y ) + D (D constante), ou seja p(y ) = m(y )(CS (y ) + D).
Como as fronteiras s ao n ao-atractivas, s(y ) e n ao-integr avel na sua vizinhan ca e, portanto, S (y ) + quando y r2 e S (y ) quando y r1 (daqui resulta, em particular, que a difus ao de It o Y (t) = S (X (t)), cujo coeciente de tend encia e nulo, tem como espa co de estados (, +)). S o e poss vel manter p(y ) positivo para quase todo o y (r1 , r2 ) (indispens avel para ser uma f.d.p.) se C = 0. Logo a existir densidade estacion aria p(y ) (y (r1 , r2 )), ela ter a de ser da forma p(y ) = Dm(y ), com D convenientemente escolhido de forma a que r12 p( )d = 1. Para isso ser poss vel e p(y ) ser uma f.d.p. e indispens avel que
r2 r
M (r1 , r2 ) :=
r1
m( )d < +,
caso em que vem p(y ) =

r2 r1
m(y ) m( )d
(r1 < y < r2 ).
(11.29)
129
Mas existir densidade invariante n ao garante que ela seja estacion aria (densidade da distribui c ao limite quando t +). Pode ver-se em [34] a demonstra c ao de que, efectivamente, quando r1 e r2 s ao n aor atractivas e m( ) e integr avel (isto e, r12 m( )d < +), ent ao existe densidade estacion aria, que e dada pela express ao (11.29), e o processo estoc astico e mesmo erg odico. Por processo erg odico entende-se aquele em que as m edias temporais de certas fun c oes ao longo de uma traject oria convergem para a esperan ca matem atica (m edia no conjunto das traject orias) da mesma fun c ao, esperan ca essa calculada relativamente a distribui ` c ao estacion aria. Em particular, temos que, se h(x) for uma fun c ao mensur avel-Borel limitada e se X (0) = x (r1 , r2 ), ent ao (note que o limite e em m edia quadr atica) 1 T + T l.i.m.
T 0 r2
h(X (t))dt = Ex [h(X+ )] =
h(y )p(y )dy.

r1
(11.30)
Para obter ergodicidade q.c. em vez de ergodicidade em m.q., isto e para que 1 T + T lim
T 0 r2
h(X (t))dt = Ex [h(X+ )] =
h(y )p(y )dy

r1
q.c.,
(11.31) nem e preciso exigir que h seja limitada, bastando que Ex [|h(X+ )|] = r2 r1 |h(y )|p(y )dy < +. Um exemplo de EDE aut onoma sem densidade estacion aria e o modelo de Black-Scholes (8.1), em que supomos X (0) = x > 0 (v e-se que o espa co de estados e (0, +)). De facto, se R := r 2 /2 > 0 [R < 0], vem X (t) + [X (t) 0, caso em que a distribui c ao limite est a concentrada no ponto 0 e n ao tem densidade]. Se quisermos usar os 2 m etodos desta Sec c ao, vemos que a(x) = rx, b(x) = 2 x2 , s( ) = 2r/ 1 2r/2 2 (escolhendo 0 = 1), m( ) = . V e-se que, se R > 0, vem 2 s( ) n ao-integr avel na vizinhan ca direita da fronteira 0 e integr avel na vizinhan ca esquerda da fronteira +, pelo que 0 e n ao-atractiva e + e atractiva. Quando R < 0 passa-se precisamente o contr ario. Quando R = 0, ambas as fronteiras s ao n ao-atractivas, mas m(x) n ao e integr avel e, portanto, n ao existe densidade estacion aria; ali as, de (8.6), sabemos que ln(X (t)/x) tem distribui c ao normal com m edia Rt = 0 e vari ancia 2 t + quando t +. Um exemplo de EDE aut onoma com densidade estacion aria (que j a determin amos na Sec c ao 11.1) e o modelo de Vasicek, cujo espa co de estados e (, +). Utilizando os m etodos desta Sec c ao, temos a(x) =
130

2 (
(x R), b(x) = 2 , s( ) = exp

2
R) 1 2(( m( ) = 2 exp 2 /(2)) . Como s( ) + quando , resulta que n ao e integr avel em nenhuma das duas fronteiras r1 = e r2 = +, pelo que estas s ao n ao-atractivas. E obvio que m(y ) e integr avel pois, ` a parte uma constante multiplicativa, e a densidade de uma distribui c ao normal com m edia R e vari ancia 2 /(2), distribui c ao que ser a assim a distribui c ao estacion aria, como j a se tinha visto na Sec ca o 11.1.
R)2 (escolhendo 0 = R) e
11.4
Um exemplo de aplica c ao em crescimento populacional
O modelo de crescimento malthusiano dX (t)/dt = rX (t) para o crescimento de uma popula c ao pressup oe que a taxa de crescimento per capita 1 dX (t) e a constante r , ou seja, n ao h a escassez de recursos a afectar X (t) dt a natalidade e a mortalidade mesmo quando a popula c ao e grande. Em ambiente aleat orio, este modelo originou o modelo de crescimento populacional (8.1), conhecido na literatura nanceira por modelo de BlackScholes. No entanto, se os resursos forem limitados, e mais realista supor que os recursos dispon veis por indiv duo decres cam ` a medida que a popula c ao cresce, o que afectar a a natalidade e/ou mortalidade, levando a que a taxa de crescimento per capita decres ca quando a popula c ao aumenta. O modelo mais simples que incorpora este efeito e o conhecido modelo log stico ou de Pearl-Verhulst, em que a taxa de crescimento per capita decresce linearmente com o tamanho da popula c ao, isto e, 1 dX (t) = r aX ( t ) ( a > 0). Agora r e a taxa m a xima de crescimento X (t) dt per capita, s o aproximada quando a popula c ao e muito pequena e n ao se faz, portanto, sentir a limita c ao dos recursos. Para dar a ideia de que representa a potencial taxa caso n ao houvesse limita c ao de recursos, chama-se a r taxa intr nseca de crescimento. Pondo K = r/a, vem dX (t) X (t) = rX (t) 1 dt K , X (0) = x > 0. (11.32)
Supomos que r > 0 e K > 0. A taxa de crescimento per capita f quando a popula c ao tem o tamanho y e agora r(1 y/K ). E acil ver que os pontos de equil brio s ao X = 0, que e inst avel, e X = K , que e globalmente assintoticamente est avel, vericando-se que X (t) K quando t +, ou seja, K e a popula c ao que e sustent avel em equil brio. Chama-se, por isso, a K , capacidade de sustento do meio. Se 0 < x < K , X (t) e crescente e, se 0 < x < K/2, o gr aco de X (t) como
131
fun c ao de t tem a conhecida forma sigm oide (curva log stica) com ponto de inex ao de ordenada K/2. Se x > K , X (t) e decrescente. Se o ambiente est a sujeito a utua c oes aleat orias, que podemos aproximar por um ru do branco (t) (com > 0 e um ru do branco padr ao), e as utua c oes afectam a taxa de crescimento per capita, vem a EDE de Stratonovich (estamos a supor que o ru do real e colorido e o aproximamos por um ru do branco) (S ) X (t) 1 dX (t) =r 1 X (t) dt K + (t).
Escrevendo na forma mais habitual, temos (S ) dX (t) = rX (t) 1 X (t) K dt + X (t)dW (t), X (0) = x > 0. (11.33) Esta EDE de Stratonovich e equivalente ` a EDE de It o dX (t) = rX (t) 1
X (t) K 2 2 X (t)
dt+
X (t)dW (t), X (0) = x > 0.
Como e uma EDE aut onoma em dimens ao 1 e os coecientes s ao de classe C 1 , a solu c ao forte existe e eu nica at e a um poss vel instante de explos ao, que iremos ver ser q.c. innito, pelo que a solu c ao existe e e u nica para todo o t 0. A solu c ao e um processo de difus ao com coeciente de tend encia a(x) = rx 1 e coeciente de difus ao x K + 2 x 2
b(x) = 2 x2 .
Como a(0) = 0 e b(0) = 0, reconhece-se que r1 = 0 e r2 = + s ao as fronteiras. As densidades de escala e velocidade obt em-se facilmente, vindo s( ) = C 2r/ e m( ) =
2
exp
2r 2 K
(11.34)
1 2r/2 1 2r exp 2 , C 2 K
(11.35)
onde C e uma constante positiva arbitr aria. Constata-se facilmente que
132
s( ) n ao e integr avel na vizinham ca direita de 0 nem na vizinhan ca esquerda de , pelo que ambas as fronteiras s ao n ao-atractivas e, portanto, inating veis. Vemos assim que n ao h a explos ao (a solu c ao nunca se torna innita) e que o espa co de estados e (0, +). Como sabemos, as fronteiras s ao tamb em inating veis em tempo innito, pelo que X (t) n ao tende para zero nem para + quando t +. Em particular, n ao h a extin ca o matem atica da popula c ao, querendo com isto dizer que, q.c., n ao existe nenhum t tal que X (t) = 0 nem se verica que X (t) tenda para zero quando t +. Vamos ver se existe densidade estacion aria p(y ) (0 < y < +), caso em que ela ser a proporcional a m(y ) (escolhendo a constante de propor+ + cionalidade para que 0 p( )d = 1). Basta ver que 0 m( )d < +. Reconhece-se facilmente que, ` a parte uma constante multiplicativa, m( ) e a f.d.p. de uma distribui ca o gama com par ametro de forma 2r/ 2 e par ametro de escala 2 K/(2r), pelo que e obviamente integr avel. Claro que p(y ) ser a precisamente a densidade de uma distribui c ao gama com os par ametros referidos, pelo que p(y ) = 1
2 K 2r 2r/2
y 2r/ (2r/ 2 )
exp
y
2 K 2r
(0 < y < +).
(11.36) Note-se que a m edia da distribui c ao estacion aria e precisamente K , o valor de equil brio do modelo determin stico. A moda da distribui c ao estacion aria e K (1 2 /(2r)), que est a muito pr oxima de K no caso de a intensidade do ru do ser pequena. Claro que o processo e erg odico. Note-se que r(1 y/K ) dever a agora interpretar-se (ver Sec c ao 9.2) como taxa m edia geom etrica de crescimento per capita quando o tamanho da popula c ao e y . Alguns autores preferem usar o c alculo de It o em vez de Stratonovich. Nesse caso, r(1y/K ) dever a interpretar-se como sendo a taxa m edia aritm etica de crescimento per capita quando o tamanho da popula c ao e y . Para o estudo deste modelo e de outros semelhantes, o leitor pode ver, por exemplo, [8], [9], [22], [27], [29] e [56]. Contudo, as conclus oes s ao espec cas da forma como a limita ca o de recursos afecta as taxas de natalidade e mortalidade, forma que e mal conhecida. Assim, para obter resultados que sejam robustos relativamente a essa forma (isto e relativamente ao modelo concreto escolhido), [16] usou modelos gerais em que a taxa m edia geom etrica de crescimento per capita e uma fun c ao arbitr aria r(y ). H a que fazer algumas suposi c oes, claro, mas que sejam ditadas por considera c oes biol ogicas. Sup oe-se, em particular, que a fun c ao r(y ) e de classe C 1 estritamente decrescente, que + r(0 ) > 0 (podendo mesmo ser +), que r(+) < 0 (podendo mesmo ser ) e que limy0 yr(y ) = 0 (admite-se que n ao h a imigra c ao). Com
133
estas hip oteses, atingiram-se as mesmas conclus oes, designadamente a exist encia de solu c ao u nica para todo o t 0, o espa co de estados ser (0, +), as fronteiras desse espa co serem n ao-atractivas, a inexist encia de extin c ao matem atica, a ergodicidade, a exist encia de densidade estacion aria e o facto de a sua moda estar pr oxima do equil brio determin stico globalmente assintoticamente est avel quando o ru do tem uma intensidade pequena. Claro que, se se tivesse suposto que r(0+ ) < 0, a fronteira 0 seria atractiva e viria X (t) 0 quando t + (extin c ao matem atica). Os resultados foram generalizados em [18] para intensidades de ru do (y ) que possam depender quase arbitrariamente (h a pequenas restri c oes) do tamanho y da popula c ao. O facto de n ao haver extin c ao matem atica nos modelos referidos com as suposi c oes feitas, n ao signica que a popula c ao esteja livre da extin c ao no sentido biol ogico do termo. De facto, a vari avel de estado X e cont nua, mas os tamanhos reais da popula c ao s ao discretos, pelo que pode suceder que, no modelo, X se possa aproximar muito de zero sem ocorrer a extin c ao matem atica, enquanto que, numa popula ca o real, valores positivos abaixo de um indiv duo s ao imposs veis. Por outro lado, as hip oteses do modelo excluem utua c oes aleat orias de natureza demogr aca (s o se consideram utua c oes ambientais), que s ao particularmente relevantes para popula c oes pequenas. Em popula c oes reais, podem ainda ocorrer outros fen omenos n ao considerados no modelo, como os efeitos de Allee. Assim, para estudar a extin c ao e prefer vel n ao usar o conceito de extin c ao matem atica, mas o conceito de extin ca o realista, em que se considera extinta qualquer popula c ao que atinja um limiar de extin ca o a > 0 adequadamente escolhido (por exemplo, pode ser a = 1 ou a = 2 em popula c oes sexuadas, ou um valor a abaixo do qual se instalam efeitos de Allee), considerando-se que, quando o tamanho da popula c ao atinge esse valor, a extin c ao e inevit avel. Para que o problema tenha interesse isto e, para que a popula c ao n ao esteja extinta ` a partida, vamos supor a < X (0) = x. A probabilidade de extin ca o P [existir t > 0 tal que X (t) a] e, para os modelos considerados acima, igual a 1 dado que a ergodicidade implica que todos os estados interiores (neste caso todos s ao interiores) sejam visitados, mais cedo ou mais tarde, com probabilidade um. Sendo a extin c ao (realista) inevit avel, a quest ao relevante e estudar o tempo de extin ca o, que n ao e mais que o tempo de primeira passagem Ta pelo limiar de extin c a o a. Na Sec c ao 11.2, estud amos Ta,b com a < x < b. Como o processo passa por a com probabilidade um, isto e, Ta < + q.c. e como n ao passa por r2 = + visto ser fronteira inacess vel, temos Ta = Ta,+ = limb+ Ta,b , pelo que basta fazer b + no estudo anteriormente feito. Pode ver-se em [23] a aplica c ao aos modelos log stico e de Gompertz.
134
Aqui vamos apenas apresentar o caso do modelo log stico (11.33). Pod amos recorrer ao u ltimo teorema da Sec c ao 11.2 com h(x) 1 e q ( ) = exp( ) para obter uma equa c ao diferencial para a transformada de Laplace Ex [exp(Ta,b )] pois, uma vez resolvida, pod amos determinar a f.d.p. de Ta,b por invers ao e os momentos Ex [(Ta,b )n ] por deriva c ao em ordem a no ponto = 0. Infelizmente, n ao conseguimos resolver a equa c ao diferencial explicitamente e os m etodos num ericos de invers ao s ao um tanto inst aveis. Recorremos assim a (11.21) com h(x) 1 para obter Ex [Ta,b ]. Vem U1 (x) = Ex [Ta,b ] = b 2 u(x) x (S (b) S ( ))m( )d + (1 u(x))
x a (S ( )
S (a))m( )d ,
com u(x) dado por (11.20). Usando (11.34) e (11.35), obtemos u(x) = com

z 2 1 ez dz z 2 1 ez dz
2r
2r
2r 2r 2r a, = 2 b, = 2 x, 2 K K K e, ap os algumas simplica c oes, = Ex [Ta,b ] =

2
2r 1 y 2 ey dy
y 2 1 ey dy y 2 1 ey dy
2r
2r
v v
y 2 1 ey dyv 2 1 ev dv y 2 1 ey dyv 2 1 ev dv .
2r 2r
2r
2r
Fazendo b + (que implica +), obtemos, ap os levantamento de indetermina c oes, Ex [Ta ] = onde (c, x) = 2 2
2r 2r , y y 2 1 ey dy, 2
+ c 1 t t e dt x
e a fun c ao gama incompleta.
Apresentamos na Figura 11.1 alguns gr acos do tempo m edio de extin c ao. Para isso, h a vantagem em trabalhar com grandezas adir mensionais, para o que vamos considerar R = ecie de rela c ao 2 (esp sinal/ru do), d = a/K (limiar de extin c ao expresso como frac c ao da capacidade de sustento do meio) e z = x/a (medida do afastamento re-
135
lativo da popula c ao inicial relativamente ao limiar de extin c ao). Como r e uma taxa de renova c ao quando o tamanho da popula c ao e pequeno, 1/r e o tamanho m edio duma gera c ao nas mesmas circunst ancias, pelo que rTa e o tempo de extin c ao medido em n umero dessas gera c oes; o gr aco mostra-nos o seu valor esperado Ex [rTa ] como fun c ao de z para alguns valores de R e d. Note-se que
2Rdz
Ex [rTa ] = 2R
2Rd
(2R, y )y 2R1 ey dy.
modelo logistico, R=1, d=0.01

2500 1.4e+31 1.2e+31 2000 1e+31 1500 8e+30 6e+30 4e+30 500 2e+30 0 2 4 6 8 10 0 2
1000
10

30 8e+11 25 20 15 10 2e+11 5 0 0 6e+11
4e+11
10
10
Figura 11.1: Comportamento do tempo m edio de extin c ao para uma popula c ao descrita pelo modelo log stico. A abcissa e z = x/a e a ordenada e r Ex [Ta ]. Note-se que a escala vertical difere entre os gr acos.
Note-se que o tempo m edio de extin c ao aumenta quando R aumenta (logo aumenta quando a intensidade das utua c oes aleat orias diminui) e diminui quando d aumenta (isto e, quando a capacidade de sustento se aproxima do limiar de extin c ao). Tamb em se v e que o tempo m edio de extin c ao aumenta quando z aumenta (logo aumenta quando a popula c ao inicial x aumenta ou quando o limiar de extin c ao a diminui), embora esse aumento seja muito t enue a partir de certa altura (para os casos
136
ilustrados na Figura 11.1, vemos que, quando z > 2, o tempo m edio de extin c ao est a praticamente estabilizado). Em [23] tamb em se obt em o devio-padr ao do tempo de extin c ao, que e da mesma ordem de grandeza da m edia. Para isso, sendo Un (x) = n Ex [(Ta,b ) ], resolveu-se a equa c ao diferencial (ver u ltimo teorema da Sec ca o 11.2) DUn (x) = nUn1 (x) com Un (a) = Un (b) = 0 e n = 2, recorrendo ` a express ao j a obtida de U1 (x), e fez-se b +. Para o estudo de modelos de crescimento populacional com pesca pode consultar [10], [12], [17], [19] e refer encias neles contidas. A este prop osito, a gest ao de explora c oes de pesca, ca ca ou oresta pode beneciar de uma area de estudo muito interessante, o controlo optimo estoc astico, de forma a regular o esfor co de capturas no sentido de optimizar determinada fun c ao objectivo (por exemplo, relacionada com os lucros) sujeita a certas restri c oes (por exemplo, de natureza econ omica, ambiental ou social). As aplica c oes do controlo optimo estoc astico estendem-se a outras areas, como a gest ao de carteiras de investimento e consumo ou a explora c ao espacial (por exemplo, no consumo de combust vel em correc c ao de traject oria de sat elites). O leitor interessado em controlo optimo estoc astico pode consultar [30]. Para algumas aplica c oes ` a gest ao de recursos naturais, pode consultar [2] e [44] ou, para uma conex ao entre esta mat eria e as op c oes nanceiras, [1].
Cap tulo 12
Teorema de Girsanov
12.1 Introdu c ao atrav es de um exemplo
Consideremos um espa co de probabilidade (, F , P ) e um processo de Wiener W (t) nele denifdo. Consideremos uma EDE aut onoma dX (t) = f (X (t))dt + g (X (t))dW (t), X (0) = x t [0, d], (12.1)
com f e g satisfazendo uma condi c ao de Lipschitz, de forma a garantir a exist encia e unicidade de solu c ao. Tamb em podemos escrever a EDE na forma integral
t t
X (t) = x +
0
f (X (s))ds +
0
g (X (s))dW (s),
t [0, d].
(12.2)
Como em EDE aut onomas a condi c ao de Lipschitz implica a condi c ao de restri c ao ao crescimento, podemos aplicar o teorema de exist encia e unicidade (ver Sec c ao 7.1). Assim, a solu c ao X (t) e um processo de difus ao homog eneo com coeciente de tend encia a(y ) = f (y ) e coeciente de difus ao b(y ) = g 2 (y ) e a solu c ao est a em H 2 [0, d]. Uma vez que estamos a supor uma condi c ao inicial determin stica (automaticamente independente do processo de Wiener), podemos trabalhar com a ltra c ao natural do processo de Wiener Ms = (W (u) : 0 u s), como suporemos neste Cap tulo, salvo men c ao em contr ario. Ali as, como estamos a trabalhar exclusivamente no intervalo de tempo [0, d] e Ms Md para s [0, d], podemos restringir o processo de Wiener a esse intervalo e trabalhar com o espa co de probabilidade (, Md , P ), onde utilizamos a mesma letra P para designar a restri c ao da probabilidade P a Md . Como podemos e como e conveniente, ser a isso que faremos daqui em 137
138
Cap rulo 12 - Teorema de Girsanov
diante. Se o coeciente de tend encia fosse nulo, viria X (t) = x+ t g ( X ( s )) dW ( s ) e X ( t ) seria uma martingala (relativamente ` a ltra c ao 0 Ms ). A vantagem de se trabalhar com martingalas e de tirar partido das suas propriedades e ineg avel, quer do ponto de vista da teoria, quer das aplica c oes. Na Sec c ao 11.2 vimos um m etodo de tornar nulo o coeciente de tend encia atrav es de uma mudan ca de vari avel Y (t) = S (X (t)), onde S e uma fun c ao de escala. Mas, naturalmente, o processo inicial X (t) mant em o seu coeciente de tend encia inicial. Aqui, vamos ver um outro m etodo, em que n ao precisamos de alterar o processo X (t). O m etodo permite n ao apenas mudar o coeciente de tend encia para um coeciente nulo mas tamb em para outro coeciente de tend encia por n os escolhido. Isto e particularmente interessante em aplica c oes nanceiras, em que podemos estar interessados em trabalhar com pre cos constantes ou normalizados (pre cos em que se desconte alguma taxa com varia c ao determin stica, por exemplo a taxa de rendimento de certas obriga c oes). Diz amos que n ao era preciso alterar o processo X (t). Mas alguma coisa ter a que mudar porque alterar apenas o coeciente de tend encia alteraria a solu c ao, que j a n ao seria X (t). A ideia ser a alterar o coeciente de tend encia e, para compensar, alterar o processo de Wiener W (t) que aparece na EDE de forma a que solu c ao se mantenha. Lembramos que naW (t) era um processo de Wiener com respeito ` a probabilidade P . E tural que o processo alterado W (t) j a n ao seja um processo de Wiener com resprito a P . Felizmente, por em, W (t) e um processo de Wiener com respeito a uma probabilidade modicada P e, al em disso, a probabilidade P e equivalente a P . 1 A mudan ca de P para P compensa a mudan ca do coeciente de tend encia. No caso particular de a altera c ao se fazer para um coeciente de
1 As probabilidades P e P dizem-se equivalentes se P for absolutamente cont nua com respeito a P e vice-versa. O conceito aplica-se tamb em a medidas. Uma medida (que pode, em particular, ser uma medida de probabilidade) denida num espa co mensur avel (, F ) diz-se absolutamente cont nua com respeito a outra medida denida no mesmo espa co mensur avel se (N ) = 0 implicar (N ) = 0; escreve-se << . Suponha que e medida nita- (isto e, qualquer conjunto mensur avel e uni ao cont avel de conjuntos com medida nita); as probabilidades s ao medidas nitas e, portanto, tamb em s ao medidas nitas-. O teorema de Radon-Nikodym mostra que << sse tem uma fun c ao densidade- f ( ) n ao-negativa, chamada derivada de Radon-Nikodym e representada por f = d . Quer-se com isso dizer que (A) = d f d para todo o A F . Essa derivada est a quase sempre (relativamente a ) A univocamente denida e, para fun co es mensur aveis arbitr arias X ( ), vem Xd = d X d sempre que um dos integrais esteja denido. Note que a f.d.p. de uma d v.a. absolutamente cont nua X e a derivada de Radon-Nikodym da sua distribui ca o de probabilidade PX .
139
tend encia nulo, a solu c ao X (t) da EDE, que n ao era martingala para a probabilidade P , torna-se uma martingala para a nova probabilidade P . A propriedade de ser martingala e particularmente poderosa em aplica c oes nanceiras; assim, se Y (t) e uma martingala para P , vem, para t [0, d], Y (t) = EP [Y (d)|Mt ] (representamos por EP a esperan ca matem atica com respeito ` a prrobabilidade P ), e podemos obter Y (t) (t [0, d]) ` a custa do conhecimento de Y (d). Isso e particularmente u til para a determina c ao do valor de alguns produtos nanceiros, por exemplo op c oes de compra europeias (ver Cap tulo 13). Note-se que, enquanto P pode ser interpretada como dando as probabilidades efectivas dos diferentes cen arios de mercado, a nova probabilidade P dar a probabilidades ct cias especicamente constru das para que X (t) n ao tenha tend encia (isto e, seja uma martingala, o que signica ser neutra do ponto de vista do risco nanceiro). Para melhor entender o m etodo, vamos utiliz a-lo num caso particular muito simples, precisamente o caso em que os coecientes de tend encia e difus ao s ao constantes (movimento browniano com tend encia ). Mais precisamente, vamos considerar o caso a(x) = f (x) e b(x) = g 2 (x) = 1. Temos a EDE dX (t) = dt + 1dW (t), com X (0) = x (x R), cuja solu c ao e um processo em tempo cont nuo X (t) (t [0, d]). Para melhor acompanhar o que est a a suceder, vamos simultaneamente considerar uma discretiza c ao temporal deste problema com dt substitu do por t > 0 e, para facilitar os c alculos, vamos supor t = 1. Em tempo discreto, temos os instantes t = 0, 1, ..., n e, para facilitar a analogia, vamos p or d = n. Vamos designar o processo em tempo discreto correspondente a X (t) (t [0, n]) por Xt (t = 0, 1, ..., n). O processo Xt ser a a solu c ao da equa c ao ` as diferen cas estoc astica Xt = t+1W (t) com X0 = x, onde Xt := Xt Xt1 e W (t) := W (t) W (t 1). Podemos escrever a equa c ao ` as diferen cas estoc astica na forma Xt Xt1 = + Zt (t = 0, 1, ..., n), onde Zt := W (t) (t = 1, 2, ..., n) e um ru do branco em tempo discreto gaussiano, isto e, uma sequ encia de v.a. i.i.d. normais padr ao. Ent ao Vt = Z1 + Z2 + ... + Zt (t = 1, ..., n), que tem distribui c ao normal com m edia 0 e vari ancia t, representa em tempo discreto um papel an alogo ao papel que W (t) representa em tempo cont nuo (ali as, para t = 0, 1, ..., n, vem Vt = W (t)). Repare-se que W (t) e uma martingala em tempo cont nuo (para a ltra c ao natural Mt ) e que Vt e uma martingala em tempo discreto (para a ltra c ao natural Nt = (Vu : 0 u t)). ` semelhan A ca do que z emos em tempo cont nuo, s o precisamos de trabalhar (e, portanto, s o vamos trabalhar) no espa co de probabilidade (, Nn , P ), onde utilizamos a mesma letra P para designar a restri c ao da probabilidade P a Nn .
140
Note que, neste exemplo muito simples em que os coecientes de tend encia e difus ao s ao constantes, a discretiza c ao temporal concorda sem erros com o problema inicial em tempo cont nuo. Com efeito, a solu ca o da EDE e X (t) = x + t + W (t), com distribui c ao normal de m edia x + t e vari ancia t. Ora, para t inteiro n ao-negativo, a solu c a o Xt da equa c ao ` as diferen cas estoc astica e Xt = x + t + Vt , com distribui c ao normal de m edia x + t e vari ancia t. Seja Zt = + Zt (que queremos corresponda a dW (t)); note-se que a m edia j a n ao e zero mas antes . Seja Vt = Z1 + Z2 + ... + Zt = t + Vt , que tem distribui c ao N (t, t). O correspondente em tempo cont nuo ser a W (t) = t + W (t) N (t, t), mas e obvio que j a n ao e um processo de Wiener, nem e martingala, com respeito ` a probabilidade P com que estamos a trabalhar. Da mesma forma, Vt tamb em j a n ao e martingala. Agora vem a nova equa c ao ` as diferen cas estoc astica Xt Xt1 = 0 + Zt , em que o novo coeciente de tend encia e zero. Corresponde-lhe, em tempo cont nuo, a nova EDE dX (t) = 0dt + dW (t), tamb em com novo coeciente de tend encia nulo. 2 e uma Repare-se que Mt = exp Vt 1 2 t (t = 0, 1, 2, ..., n) 1 2 martingala em tempo discreto. Tamb em M (t) = exp W (t) 2 t (t [0, n]) e martingala em tempo cont nuo. Seja P a nova probabilidade denida pela derivada de Radon-Nikodym dP /dP = Mn no espa co mensur avel (, Nn ) (o mesmo que foi usado para P ). Dizer que dP /dP = Mn signica que, para qualquer A Nn , P (A) =
A
dP ( ) =
A
dP dP ( ) = dP
Mn dP ( ).
A
Em particular, a f.d. conjunta de Z1 , Z2 , ..., Zn com respeito ` a nova probabilidade P e P FZ (z1 , z2 , ..., zn ) = P [Z1 z1 , Z2 z2 , ..., Zn zn ] 1 ,Z2 ,...,Zn
= = =
1 2 z ,Z z ,...,Z z ] exp Vn 2 n dP ( ) [Z1 n n 1 2 2 zn z2 z1 n 1 2 t=1 yt 2 n ... exp P fZ (y1 , y2 , ..., yn )dy1 dy2 ...dyn 1 ,Z2 ,...,Zn
Zn
z ,Z z ,...,Z z ] [Z1 n n 1 2 2
dP ( )
...
Z2 Z1
( =
Zn
1 n 2 )
1 exp 2
exp
1 n 2 )
n t=1 (yt n t=1
(yt )2 dy1 dy2 ...dyn n t=1 2 yt dy1 dy2 ...dyn .
2 ) 1 2 n
...
Z2 Z1
1 exp 2
141
Tabela 1: Exemplo de mudan ca de tend encia: correspond encia entre o modelo em tempo cont nuo e em tempo discreto.
Modelo em tempo cont nuo Instantes t [0, n] Processo estoc astico X (t) em tempo cont nuo dX (t) dt dW (t) W (t) = W (1) + ... + W (t) N (0, t) e martingala em tempo cont nuo equa c ao diferencial estoc astica dX (t) = dt + dW (t) com X0 = x a solu c ao e X (t) = x + t + W (t) N (x + t, t) dW (t) W (t) = t + W (t) N (t, t) n ao e martingala nem processo de Wiener com respeito a P equa c ao diferencial estoc astica nova dX (t) = 0dt + dW (t) coeciente de tend encia = 0 solu c ao: X (t) = x + W (t) M (t) = exp W (t) 1 2 t 2 e martingala nova probabilidade P denida por dP /dP = M (n) Modelo correspondente em tempo discreto Instantes t = 0, 1, ..., n Processo estoc astico Xt em tempo discreto Xt = Xt Xt1 t = 1 Zt := W (t) = W (t) W (t 1) (v.a. normais padr ao i.i.d.) Vt := Z1 + ... + Zt (= W (t)) N (0, t) e martingala em tempo discreto equa c ao ` as diferen cas estoc astica Xt = t + W (t) ou Xt Xt1 = + Zt com X0 = x a solu c ao e Xt = x + t + Vt N (x + t, t) Zt = + Zt N (, 1) Vt = Z1 + Z2 + ... + Zt = t + Vt N (t, t) n ao e martingala com respeito a P equa c ao ` as diferen cas estoc astica nova Xt Xt1 = 0 + Zt coeciente de tend encia = 0 solu c ao: Xt = x + Vt Mt = exp Vt 1 2 t 2 e martingala nova probabilidade P denida por dP /dP = Mn com respeito a P Z1 , Z2 , ..., Zn s ao i.i.d. N (0, 1) com respeito a P Vt N (0, t) e e martingala
com respeito a P W (t) N (0, t) e e processo de Wiener (logo martingala)
142
Logo, com respeito a P , as v.a. Z1 , Z2 , ..., Zn s ao i.i.d. com distribui c ao normal padr ao, pelo que t em m edia zero. Portanto, com res peito a P , Vt = Z1 + Z2 + ... + Zt tem distribui ca o N (0, t) e facilmente se reconhece que, relativamente a P , e uma martingala em tempo discreto.
Analogamente, W (t) ser a, com respeito a uma probabilidade P apropriada, um processo de Wiener e, portanto, uma martingala. A probabilidade P apropriada para tempo cont nuo e denida pela derivada de Radon-Nikodym dP /dP = M (n) = M (d) no espa co mensur avel (, Mn ) (o mesmo que foi usado para P ). Isso signica que, para qualquer A Mn , P (A) =
A
dP ( ) =
dP dP ( ) = A dP
M (n)dP ( ).
A
Note-se ainda que, sendo M (d) > 0, vem dP/dP = 1/M (d) e, portanto, tendo qualquer das probabilidades derivada de Radon-Nikodym relativamente ` a outra, elas s ao absolutamente cont nuas relativamente ` a outra, logo equivalentes. T em, assim, os mesmos conjuntos de probabilidade nula. Vamos mostrar que W (t) e processo de Wiener relativamente ` a probabilidade P . Note-se que W (t) = t + W (t) (t [0, d]) tem a mesma ltra c ao natural Mt que W (t). Reconhece-se que, para s < t, o incremento W (t) W (s) = (t s) + W (t) W (s) e, tal como o incremento W (t) W (s) do processo W (t), independente de Ms e, portanto, independente de qualquer incremento no intervalo [0, s]. Assim, conclu mos que o processo W (t) tem incrementos independentes. Tamb em e obvio que W (0) = 0 q.c.-P (pois P e P t em os mesmos conjuntos de probabilidade nula). Para mostrar que W (t) e processo de Wiener relativamente ` a probabilidade P basta s o mostrar que, para 0 s < t d, a distribui c ao com Q respeito a P de W (t) W (s) e N (0, t s). Designemos por FZ (z ) = Q Q[Z z ] e por fZ a f.d. e a f.d.p. (se existir), respectivamente, da v.a Z com respeito ` a probabilidade Q. Seja Ax = { : W (t) W (s) x} = { : W (t) W (s) + (t s) x}. A f.d. de W (t) W (s)
Introdu c ao ` as EDE e aplica c oes com respeito a P e

P FW (t)W (s) (x) = P (Ax ) = dP ( ) dP ( ) IAx ( )dP ( )
143
Ax
dP ( ) =
dP ( ) dP ( ) Ax dP ( ) 1 2 2 d
=E
e 2 d e 2 e
1 2 (ts)
1 2 2 (ts) 2
e EP e(W (d)W (t)) e(W (t)W (s)) IAx ( )eW (s) = 1 2 2 d P e E e(W (d)W (t)) P E e(W (t)W (s)) IAx ( ) EP eW (s) =
1 2 1 2
1 2 2 d
exp W (d)
IAx ( ) =
(dt) P
e(W (t)W (s)) IAx ( ) e 2 dP ( ) =
Ax x(ts) z P e fW (t)W (s) (z )dz = e 1 2 x ( t s ) z2 e 2 (ts) exp 2(t ez 1 s) 2 (ts) x(ts)
(W (t)W (s))
dz =
1 2 (ts)
(ts)) exp (z+ 2(ts)

2
dz =
1 2 (ts)
v exp 2(t s) dv,
que e precisamente a f.d. de uma v.a. N (0, t s). Est a conclu da a demonstra c ao de que W (t) e um processo de Wiener com respeito ` a nova probabilidade P . t Claro que a solu c ao de dX (t) = 0dt + dW (t) e X (t) = x + 0 dW (s) = x + W (t) e e uma martingala para a probabilidade P (e a ltra c ao Mt ). A remo c ao da tend encia e constru c ao da nova probabilidade a que acab amos de proceder para este exemplo, quer em tempo cont nuo quer em vers ao discreta, encontram-se resumidos na Tabela 1. O resultado obtido para o modelo em tempo cont nuo pode ser estendido ao caso geral em que f e g n ao t em que ser constantes e tamb em se pode mudar para um coeciente de tend encia diferente do inicial mas esse resultado que constitui o teorema de n ao necessariamente nulo. E Girsanov, a ser estudado na Sec c ao 12.2.
12.2
Teorema de Girsanov
Seja 0 < d < . Consideremos um espa co de probabilidade (, F , P ) e nele um processo de Wiener W (t) (t [0, d]). Seja Mt = (W (u) : 0 u t) a ltra c ao natural do processo de Wiener. Vamos restringir P a Md , isto e, vamos trabalhar com o espa co de probabilidade (, Md , P ).
144
Teorema de Girsanov Seja X (t) a solu ca o da EDE dX (t) = f (X (t))dt + g (X (t))dW (t), X (0) = x t [0, d], (12.3)
com f e g satisfazendo uma condi ca o de Lipschitz (o que garante exist encia e unicidade de solu ca o). Suponhamos que f (x) tamb em satisfaz uma condi ca o de Lipschitz. Suponhamos que existe uma fun ca o (x) tal que 2 g (x)(x) = f (x) f (x) e seja
t
(12.4)
M (t) = exp
(X (s))dW (s)
1 2
t 0
2 (X (s))ds .
(12.5)
Suponhamos que (X (t)) M 2 [0, d] 3 e que M (t) (t [0, d]) e uma martingala com respeito a P (relativamente a ` ltra ca o Mt ). Uma condi ca o suciente para que isto se verique e que seja v alida a condi ca o de Novikov 1 d 2 EP exp (X (s))ds < +. (12.6) 2 0 Seja P uma nova medida de probabilidade no espa co mensur avel (, Md ) denida pela derivada de Radon-Nikodym dP /dP = M (d) e seja W (t) = W (t) +
0 t
(X (s))ds.
(12.7)
Ent ao P e equivalente a P e W (t) e um processo de Wiener relativamente a P . 4 Al em disso, o processo X (t) satisfaz a EDE dX (t) = f (X (t))dt + g (X (t))dW (t), X (0) = x t [0, d] (12.8)
e, portanto, as distribui co es de dimens ao nita de X (t) relativamente a

g (x) = 0, vem (x) = . g (x ) 3 Ou seja (ver Cap tulo 6) (t, ) := (X (t, )) e fun ca o conjuntamente mensur avel d 2 adaptada a ` ltra ca o Mt aqui escolhida e tal que 0 (t, )dt < + q.c.-P. 4 Em geral, n ao e um processo de Wiener relativamente a P .
2 Caso f ( x ) f ( x )
145
P coincidem com as distribui co es de dimens ao nita relativamente a P da solu ca o Y (t) da EDE 5 dY (t) = f (Y (t))dt + g (Y (t))dW (t), Y (0) = x t [0, d].
t
(12.9)
Nota. No caso particular de f 0, tem-se X (t) = x+ 0 g (X (s)dW (s). Como g satisfaz uma condi c ao de Lipschitz, sabemos que g (s, ) := g (X (s, )) H 2P [0, d] (H 2P [0, d] e a classe das fun c oes conjuntamente d 2 mensur aveis adaptadas ` a ltra c ao Ms tais que EP g (s)ds < +). 0 Logo, devido ` as propriedades do integral estoc astico como fun c ao do limite superior de integra c ao, X (t) ser a, neste caso particular, uma martingala relativamente a P (com respeito ` a ltra c ao Mt ). Temos assim um processo de transformar a solu c ao de uma EDE aut onoma, que em geral n ao e martingala relativamente ` a probabilidade original, numa martingala, mas relativamente a uma nova medida de probabilidade. O exemplo tratado na Sec c ao 12.1 e o caso particular de f (x) e g (x) 1, vindo x )0 = . (x) = f ( g (x ) Nota. N ao e dif cil generalizar ao caso de EDE multidimensionais nos termos referidos na Sec c ao 7.3. Naturalmente que e agora uma vector coluna com a mesma dimens ao m do vector do processo de Wiener e t t T que M (t) = exp 0 T (X(s))dW(s) 1 2 0 (X(s)) (X(s))ds . Na condi c ao de Novikov, deve substituir-se 2 por T . No caso de n = m e de a matriz g ser invert vel, pode escolher-se = g1 (f f ).
Nota. Outra generaliza c ao relativamente trivial consiste em permitir a substitui c ao de f (X (s)) por F (s, ) M 2 [0, d] (agora a EDE inicial pode n ao ser aut onoma), desde que exista (s, ) tal que g (X (s, ))(s, ) = F (s, ) f (x). Exige-se agora que (s, ) M 2 [0, d] e que, relatit t
vem W (t) = W (t) +
2 seja vamente a P , M (t) = exp 0 (s, )dW (s) 1 2 0 (s, ))ds martingala, sendo condi c ao suciente para que tal suceda que se veri1 d 2 que a condi c ao de Novikov E exp 2 (s, )ds < +. Agora 0 t 0
(s, )ds.
Antes de demonstrar o teorema, vamos demonstrar dois lemas.

s o as distribui co es de dimens ao nita s ao relevantes para o c alculo de probabilidades relativas aos valores do processo, e indiferente trabalhar com as distribui co es de Y (t) relativamente a P ou com as distribui co es de X (t) relativamente a P . Isso pode ser u til na determina ca o de solu co es fracas de EDE.
5 Como
146
Lema. Sejam P e P probabilidades num espa co mensur avel (, G ) P = h ( ) , seja Y uma v.a. em ( , G ) tal que E [|Y |] = tal que dP dP | Y ( ) | h ( ) dP ( ) < + e seja H uma sub- a lgebra de G . Ent ao EP [hY |H] = EP [Y |H]EP [h|H] q.c.-P. Demonstra ca o Seguimos de perto a demonstra c ao de [51]. Seja H H. Vem, usando a deni c ao de probabilidade condicional e as propriedades das esperan cas condicionais, EP [Y |H]hdP = H EP [Y |H]dP = Y hdP = H EP [Y h|H]dP. H
H

Y dP =
Por outro lado,

H
EP [Y |H]hdP =
EP EP EP [Y |H]hIH |H EP [Y |H]EP [h| H]dP. H
EP [Y |H]hIH dP = EP EP [Y |H]hIH = = EP IH EP [Y |H]EP [h| H] =
Logo
H
EP [Y |H]EP [h| H]dP =
EP [Y h|H]dP
dP dP
para qualquer H H, o que prova o pretendido. O facto de no teorema de Girsanov se ter signica que, dado qualquer A Md , vem P (A) =
A
= M (d) em Md
dP ( ) =
A
dP dP ( ) = dP
M (d)dP ( ).
A
Ser a que se pode ir mais longe caso A Mt com t [0, d]? Vejamos o: Lema. Nas condi co es do teorema de Girsanov e para t [0, d], vem dP = M ( t ) em M , querendo com isto signicar que, para A Mt , se t dP tem P (A) = dP ( ) = M (t)dP ( ).
A A
Demonstra ca o Seguimos de perto a demonstra c ao de [51]. De facto, atendendo a que M (t) e uma martingala relativamente a P (com respeito ` a ltra c ao
Introdu c ao ` as EDE e aplica c oes Mt ), vem P (A) =
147
dP = A M (d)dP = IA M (d)dP = EP [IA M (d)] = E EP [IA M (d)|Mt ] = EP IA EP [M (d)|Mt ] = EP [IA M (t)] = A M (t)dP.
A P
Esbo co da demonstra ca o do teorema de Girsanov Condi ca o de Novikov Seja Z (t) =

0 t
(X (s)dW (s)
1 2
t 0
2 (X (s))ds.
Aplicando o teorema de It o a M (t) = exp(Z (t)), e atendendo a que (X (t)) M 2 [0, t], vem dM (t) =
Z (t) eZ (t) dZ (t) + 1 (dZ (t))2 = 2e 1 2 1 M (t) dW (t) 2 dt + 2 M (t)2 dt = (X (t))M (t)dW (t),
donde, como M (0) = 1,

t
M (t) = 1
(X (s))M (s)dW (s).

0
(12.10)
Se a fun c ao integranda (X (s))M (s) estiver em H 2 [0, d], as propriedades do integral estoc astico como fun c ao do limite superior de integra c ao implicam que M (t) seja uma martingala relativamente a P (com respeito a ltra ` c ao Mt ). Mas nada garante que (X (s))M (s) H 2 [0, d], da se ter exigido no enunciado que M (t) seja martingala relativamente a P . A condi c ao de Novikov implica exp EP 1 2
d 0
2 (X (s))ds
EP exp
1 2
d 0
2 (X (s))ds
< +,
e, portanto, implica H 2 [0, d] M 2 [0, d]. A condi c ao de Novikov tamb em implica que M (t) seja martingala relativamente a P pois permite aproximar (12.10) por uma t ecnica de truncatura sosticada que garante a propriedade de martingala, mas que est a fora do ambito deste livro. O leitor interessado pode v e-la em [37]. Equival encia Tal como se fez na Sec c ao 12.1, basta atender a que M (d) > 0.
148 X (t) satisfaz (12.8)
W (t) e processo de Wiener relativamente a P
Basta notar que dW (t) = dW (t) + (X (t))dt e substituir dW (t) por dW (t) (X (t))dt em (12.3) para obter (12.8). Seguimos de perto a demonstra c ao de [51]. Seja R(t) = W 2 (t) t. Atendendo ` a caracteriza ca o de L evy (ver Sec c ao 4.2) do processo de Wiener, basta mostrar que W (t) e R(t) s ao martingalas relativamente a P (e com respeito ` a ltra c ao Mt ). Sejam K (t) = M (t)W (t) e L(t) = M (t)R(t). Vem K (0) = 0 e dK (t) = M (t)dW (t) + W (t)dM (t) + dM (t)dW (t) = M (t)((X (t))dt + dW (t)) + W (t)((X (t))M (t)dW (t)) (X (t))M (t)dt = M (t)(1 (X (t))W (t))dW (t), donde K (t) =
0 t
M (s)(1 (X (s))W (s))dW (s)
e martingala relativamente a P . Para 0 s < t d e atendendo a que Ms Mt , vem, usando a propriedade de martingala e os dois lemas acima, M (s)W (s) = K (s) = EP [K (t)|Ms ] = EP [M (t)W (t)|Ms ] =
EP
EP [W (t)|Ms ] EP [M (t)|Ms ] = EP [W (t)|Ms ] M (s). Como M (s) = 0, vem W (s) = EP [W (t)|Ms ] , o que prova que W (t) e martingala relativamente a P . A demonstra c ao de que R(t) = W 2 (t) t e martingala relativamente a P e semelhante, trabalhando-se agora com L(t) em vez de K (t).
dP dP W (t)|Ms
= EP [W (t)|Ms ] EP
dP dP |Ms
Cap tulo 13
Op c oes e f ormula de Black-Scholes

13.1 Introdu c ao
Uma op ca o confere ao seu detentor o direito, mas n ao a obriga c ao, de efectuar determinada actividade nanceira. O detentor exercer a esse direito conforme o que lhe for mais vantajoso. Vejamos dois exemplos: Um importador recebeu uma encomenda cujo custo e de um milh ao de d olares a pagar em 60 dias. Suponhamos que actualmente o pre co de compra do d olar e de 0, 81 Euros mas que, se o importador tiver de os comprar daqui a 60 dias a um pre co superior a 0, 85 Euros, ter a preju zos consider aveis. Para resolver o problema, poder a adquirir uma op c ao de compra de um milh ao de d olares com data de expira c ao daqui a 60 dias ao pre co de exerc cio de 0, 85 Euros por d olar. Se, daqui a 60 dias, o pre co de compra do d olar for superior a 0, 85 Euros, ele exercer a a op c ao e comprar a o milh ao de d olares ao pre co de exerc cio de 0, 85 Euros por d olar. Se o pre co de compra do d olar for inferior a 0, 85 Euros, ele prescinde de exercer a sua op c ao e compra os d olares no mercado. Uma empresa tem de pagar mensalmente juros de um empr estimo a taxa EURIBOR mais um spread de 1, 5% e quer fazer o seu ` or camento. Para evitar desvios negativos desagrad aveis relativamente ` as previs oes or camentais, gostaria de ter a garantia de que a taxa EURIBOR, actualmente de 2%, n ao ultrapassar a 2, 5%, mas gostaria de poder beneciar se porventura ela n ao subisse tanto 149
150
Cap tulo 13 - Op c oes e f ormula de Black-Scholes ou at e descesse. Pode adquirir um cabaz de op c oes a vencer mensalmente que o reembolsem da diferen ca caso a taxa EURIBOR ultrapasse na ocasi ao os 2, 5%.
Estes foram apenas dois exemplos de uma grande variedade de op c oes, que tamb em podem ser adquiridas para ns meramente especulativos. H a op c oes sobre ac c oes, sobre obriga c oes, sobre mercadorias (caf e, soja, barrigas de porcos, ouro, zinco, etc.), sobre cota c oes de moedas estrangeiros, sobre ndices de ac c oes, sobre cota c oes de fundos nanceiros, sobre cat astrofes. As op coes podem ser de compra (em ingl es call option) ou venda (em ingl es put option) de um produto nanceiro. As op c oes podem ser europeias (caso a data de exerc cio seja r gida e xada previamemnte), americanas (caso possa ser exercida em qualquer altura at e a uma data pr e-estabelecida). Existem ainda outras variantes de produtos nanceiros derivados (warrants, op c oes ex oticas de v atios tipos, etc.). Aqui vamos concentrar-nos no problema cl assico de op c oes europeias de compra de ac c oes tratado por Black, Scholes e Merton (ver [6] e [50]), que foi a primeira pedra de um novo e emocionante cap tulo da matem atica nanceira. Considere dois activos nanceiros, um que e investimento sem risco, suponhamos uma obriga c ao com taxa instant anea de rendimento xa (pode tamb em ser uma conta banc aria permitindo dep ostitos ou empr estimos com taxa de juro xa ), e o outro e uma ac c ao cotada na bolsa. Designemos por B (t) o valor da obriga c ao no instante t (isto e, daqui a t unidades de tempo), que ser a naturalmente dado por B (t) = B (0) exp(t) pois dB (t)/dt = B (t). Podemos escrever dB (t) = B (t)dt. (13.2) (13.1)
Supomos B (0) um valor conhecido (determin stico). No caso de ser obriga c ao, pressup oe-se que e transaccion avel em qualquer instante (transac c oes em cont nuo) e que a transac c ao, seja compra ou venda (com o mesmo valor da obriga c ao para ambos os casos), se faz sem encargos (impostos, taxas ou comiss oes). Estamos a supor que o rendimento ser a sempre pago na integra no instante da transac c ao, seja ele qual for; n ao e esse o caso de certos dep ositos a prazo, por exemplo a 30 dias, em que os juros s ao pagos na totalidade se o dep osito for levantado em instantes m ultiplos inteiros de 30 dias mas se perdem os
151
juros desde o u ltimo nal de prazo em caso de levantamento intercalar. Sup oe-se tamb em que qualquer interventor no mercado pode comprar ou emitir obriga c oes, pelo que o n umero de obriga c oes que det em pode ser positivo ou negativo. Se for negativo, isso signica que as emitiu para outros interventores e que est a obrigado a entregar-lhes o seu valor B (t) por cada obriga c ao se os outros interventores decidirem resgat a-las no instante t. Costuma-se falar em posi co es longas (do ingl es long) ou posi co es curtas (do ingl es short), respectivamente para a deten c ao de um n umero negativo ou positivo de obriga c oes. Tamb em podem ser vendidos e comprados n umeros n ao inteiros de obriga c oes (na pr atica, se cada obriga c ao for de pequeno valor, esta hip otese e uma razo avel aproxima c ao). Caso se trate de uma conta banc aria (em vez de obriga c oes), as nossas suposi c oes signicam que pode ter saldo positivo ou negativo e a taxa de juro e a mesma em ambos os casos, podendo o detentor levantar e depositar na conta a quantia (mesmo n ao-inteira) que desejar em qualquer instante sem perda de juros, n ao havendo encargos com essas transac c oes. Mas, para xar a linguagem, falaremos daqui em diante de obriga c oes (sem risco) com rendimento xo. Designemos por S (t) a cota c ao da ac c ao no instante t e suponhamos que ela tem uma taxa m edia (aritm etica) de rendimento r e uma volatilidade > 0, seguindo um modelo de Black-Scholes (ver Cap tulo 3 e Cap tulo 8 e ainda, para a interpreta c ao de r, o Cap tulo 9). Seja S (0) > 0 conhecido (determin stico). Temos assim a EDE de It o dS (t) = rS (t)dt + S (t)dW (t), cuja solu c ao e, como sabemos, S (t) = S (0) exp (r 2 /2)t + W (t) . (13.4) (13.3)
Tamb em as ac c oes se sup oem transaccion aveis em qualquer instante (transac c oes em cont nuo), com o mesmo valor para a compra ou a venda e sem encargos de transac c ao. Sup oes-se que n ao h a dividendos (embora tamb em se possam incluir com uma modica c ao do modelo de BlackScholes). Sup oe-se tamb em que pode haver posi c oes longas ou curtas. Se um interventor tem posi c ao curta (n umero negativo de ac c oes), isso signica que ele vendeu ac c oes que n ao tinha, cando obviamente obrigado a compr a-las de volta a quem as detenha em qualquer instante t ao valor de mercado S (t). Tamb em podem ser vendidos e comprados n umeros n ao inteiros de ac c oes (na pr atica, se cada ac c ao for de pequeno valor, esta hip otese e uma razo avel aproxima c ao). Uma op ca o europeia de compra com data de expira ca o d > 0 (instante determin stico) e valor de exerc cio K > 0 d a ao seu detentor o direito,
152
Cap tulo 13 - Op c oes e f ormula de Black-Scholes
mas n ao a obriga c ao, de adquirir uma ac c ao no instante d pagando o pre co de exerc cio K . Caso a cota c ao S (d) no instante d seja superior a K , o detentor da op c ao exerc e-la- a comprando uma ac c ao ao pre co K e cando com um benef cio S (d) K > 0 (pode se quiser vend e-la ao pre co de mercado S (d) > K ). Caso S (d) seja inferior a K , o detentor da op c ao n ao ir a exerc e-la (se o zesse teria de pagar K pela ac c ao, o que lhe traria um preju zo j a que pode compr a-la no mercado ao pre co S (d) < K ); logo o seu benef cio ser a nulo. Conclui-se que uma op ca o de compra d a ao seu detentor um benef cio (S (d) K )+ := max(S (d) K, 0). Claro que a op c ao n ao pode ser gratuita pois quem a fornecesse, na melhor das hip otese, nada ganharia e, na pior, teria um preju zo. A quest ao posta por Black, Merton e Scholes foi a de saber qual deveria ser, em cada instante t, o pre co ou custo justo Y (t) da op c ao. Normalmente interessa saber o pre co Y (0) da op c ao no instante t = 0 da sua compra, mas, como o seu detentor poder a querer vend e-la num instante posterior t d (depois de d a op c ao deixa de ter qualquer interesse ou valor), interessa tamb em saber o seu valor em qualquer desses instantes. Para al em das hip oteses simplicadoras atr as referidas (e que podem ser depois relaxadas com modica c oes adequadas do modelo), suposeram tamb em o princ pio de n ao-arbitragem. A tradu c ao matem atica do termo e complexa mas, em linguagem corrente, signica que n ao e poss vel, com um investimento nulo, obter um lucro sem risco. Outra deni c ao equivalente e a de que, se dois portfolios (carteiras de investimentos) t em, em certo instante futuro, o mesmo valor quaisquer que sejam os cen arios do mercado , ent ao devem ter o mesmo valor agora. Com efeito, se assim n ao fosse, quem tivesse o portfolio mais valorizado agora, poderia troc a-lo pelo menos valorizado, cando no futuro com o mesmo valor que teria se n ao tivesse feito a troca mas embolsando a diferen ca entre o valor actual dos dois portfolios; teria assim um lucro com um investimento nulo e sem correr qualquer risco. A hip otese de n ao-arbitragem e, de certa forma, consequ encia da ideia de mercado eciente e de operadores de mercado igualmente informados e de comportamento inteligente, pelo que qualquer situa ca o de arbitragem seria rapidamente desfeita pela maior procura e subida do valor dos activos subvalorizados; n ao sobrevive obviamente se houver inside trading. Vejamos agora o que se entende por estrat egia de transac ca o (b(t), s(t)) (t 0) de um interventor no mercado. Aqui b(t) representa o n umero de obriga c oes e s(t) o n umero de ac c oes que ele det em no instante t. Note-se que b(t) e s(t) podem tomar valores reais positivos (posi c oes longas) ou negativos (posi c oes curtas). O conhecimento da es-
153
trat egia indica-nos quais as compras e vendas efectuadas. Por exemplo, sempre que s(t) desce de uma certa quantidade, isso signica que naquele instante o inverventor vendeu tantas ac c oes quanto a descida observada. Se sobe, houve compra. Claro que (b(0), s(0)) e o portfolio inicial de obriga c oes e ac c oes e o seu valor ser a b(0)B (0) + s(0)S (0). A estrat egia diz-se autonanciada se o seu valor em cada instante t for o valor inicial mais os rendimentos acumulados gerados pelas ac c oes t t s ( u ) dS ( u ) e pelas obriga c o es b ( u ) dB ( u ) detidas em cada momento. 0 0 Isto e, as compras e vendas de obriga c oes e ac c oes s ao livres mas s o podem recorrer a meios nanceiros contidos no portfolio, n ao podendo haver sa das ou entradas de meios nanceiros. Em termos matem aticos, a estrat egia e autonanciada se, para todo o t 0, se tiver
t t
b(t)B (t)+ s(t)S (t) = b(0)B (0)+ s(0)S (0)+

0
b(u)dB (u)+
0
s(u)dS (u). (13.5)
13.2
F ormula de Black-Scholes e estrat egia hedging
Olhemos agora para o valor da op c ao Y (t). Como no instante d ela confere o benef cio (S (d) K )+ , esse dever a ser o seu justo valor (custo) no instante d, isto e Y (d) = (S (d) K )+ . Suponhamos que existe uma estrat egia autonanciada (b(t), s(t)) cujo valor no instante d e precisamente Y (d), ou seja b(d)B (d) + s(d)S (d) = Y (d). Ent ao a hip otese de n ao-arbitragem obriga a que b(0)B (0) + s(0)S (0) = Y (0). Com efeito, caso fosse b(0)B (0) + s(0)S (0) < Y (0), algu em poderia vender uma op c ao (s ao permitidas posi c oes longas e curtas) por Y (0), utilizar parte desse dinheiro para adquirir o portfolio (b(0), s(0)) de valor b(0)B (0) + s(0)S (0) (isto e, adquirir b(0) obriga c oes e s(0) ac c oes) e guardar a diferen ca Y (0) (b(0)B (0) + s(0)S (0)) > 0. Usando o portfolio e adoptando a estrat egia de transac co es (b(t), s(t)) at e ao instante d (como e autonanciada, as transac c oes fazem-se com os meios gerados pelo pr oprio portfolio), no instante d o portfolio vale b(d)B (d) +
154
s(d)S (d) = Y (d), podendo ser liquidado o portfolio para obter a quantia Y (d), que ser a precisamente o benef cio que dever a entregar ao detentor da op c ao. Quem seguisse estes procedimentos caria a ganhar precisamente a diferen ca guardada no in cio Y (0) (b(0)B (0) + s(0)S (0)) > 0 sem ter feito qualquer investimento nem corrido qualquer risco, pelo que haveria arbitragem. Caso fosse b(0)B (0) + s(0)S (0) > Y (0), poderia seguir um procedimento sim etrico, adquirindo o portfolio (b(0), s(0)) de valor b(0)B (0) s(0)S (0) e simultaneamente comprando uma op c ao por Y (0), guardando a diferen ca Y (0) + (b(0)B (0) s(0)S (0)) > 0. Depois investiria de acordo com a estrat egia (que tamb em e autonanciada) (b(t), s(t)), liquidando o portfolio no instante d pelo valor b(d)B (d) s(d)S (d) = Y (d), precisamente oque ir a receber de benef cio pela op c ao. Quem seguisse estes procedimentos caria a ganhar precisamente a diferen ca guardada no in cio Y (0)+(b(0)B (0) s(0)S (0)) > 0 sem ter feito qualquer investimento nem corrido qualquer risco, pelo que haveria arbitragem.
O mesmo racioc nio aplicado ao instante t [0, d] levaria a concluir que o princ pio da n ao-arbitragem implica b(t)B (t) + s(t)S (t) = Y (t). (13.6)
Claro que o pre co Y (t) da op c ao no instante t, dado o car acter markoviano e n ao antecipativo da informa c ao, s o pode depender do instante t e da cota c ao S (t) da ac c ao nesse instante (e n ao em instantes anteriores ou posteriores). Note-se que o valor da obriga c ao em cada momento e determin stico. Logo, existe uma fun c ao C (t, x) tal que Y (t) = C (t, S (t)). Usando a f ormula de It o, vem, usando (13.2) e (13.3), dY (t) =
t,S (t)) 2 C (t,S (t)) C (t,S (t)) dt + C (x dS (t) + 1 (dS (t))2 = t 2 x2 C C 1 2 C 2 2 C t + x rS (t) + 2 x2 S (t) dt + x S (t)dW (t).
(13.7) Atendendo a (13.5) e (13.6), vem Y (t) = b(t)B (t) + s(t)S (t) = t b(0)B (0) + s(0)S (0) + 0 b(u)dB (u) +
t 0 s(u)dS (u),
(13.8)
Introdu c ao ` as EDE e aplica c oes donde resulta
155
dY (t) = b(t)dB (t) + s(t)dS (t) = b(t)B (t)dt + s(t) (rS (t)dt + S (t)dW (t)) = (b(t)B (t) + s(t)rS (t)) dt + s(t)S (t)dW (t). (13.9) Como Y (t) e um processo de difus ao e, portanto, tem um s o coeciente de tend encia e um s o coeciente de difus ao, podemos igualar os coecientes entre (13.7) e (13.9). Vem b(t)B (t) + s(t)rS (t) = C 1 2C 2 2 C + rS (t) + S (t) t x 2 x2 C S (t). x (13.10) (13.11)
s(t)S (t) = Como S (t) > 0, de (13.11) vem s(t) =
C (t, S (t)) , x
(13.12)
pelo que C (t, S (t)) = Y (t) = b(t)B (t) + s(t)S (t) = b(t)B (t) + t,S (t)) S (t) C (x , donde b(t) = 1 B (t) C (t, S (t)) C (t, S (t)) S (t) . x (13.13)
Substituindo em (13.10) b(t) e s(t) pelas suas express oes (13.12) e (13.13), obtemos, usando x em lugar de S (t) para simplicar a nota c ao, para t [0, d) e x > 0, a equa c ao ` as derivadas parciais C (t, x) C (t, x) 1 2 C (t, x) 2 2 = x + x C (t, x). t x 2 x2 (13.14)
A condi c ao de fronteira e obviamente C (d, x) = (x K )+ . (13.15)
Se invertermos a ordem do tempo, pondo = d t e D(, x) = D 1 2 D 2 2 C (d , x) (donde Y (t) = D(d t, S (t))), vem D = x x + 2 x2 x D com condi c ao terminal D(0, x) = (x K )+ . Trata-se de um caso particular da equa c ao de Feynman-Kac (10.11) para h(x) = (x K )+ (n ao e propriamente de suporte compacto mas pode ser aproximada por fun c oes desse tipo), q (x) , um coeciente de tend encia x e um coeciente de difus ao 2 x2 . Assim, atendendo a (10.10), a solu c ao D(, x) ser a da
156 forma
(X ( ) K )+ = Ex e (X ( ) K )+ , (13.16) onde X (t) e um processo de difus ao com valor inicial X (0) = x e os coecientes de tend encia e difus ao j a referidos. Logo dX (t) = X (t)dt + X (t)dW (t), pelo que vem X ( ) = x exp ( 2 /2) + W ( ) . Como e determin stico e Z ( ) = ln X ( ) N (ln x + ( 2 /2), 2 ), vem, com = 2 /2 e = + 2 /2, D(, x) = Ex e
0
ds
D(, x) = e Ex
+ + ln K z
x )2 e (e K ) 1 dz exp (zln 22 2 2 x ) e (ez K ) 1 dz = exp (zln 22 2 2 + z (z ln x ) 1 e e 2 exp dz 22 ln K 2 + x ) exp (zln K 1 dz = ln K e 22 2 2 + (z ln x ) 1 dz x exp 22 ln K 2 + ( z ln x )2 K 1 exp dz = 22 ln K e 2 2 + 1 u2 /2 + 1 ev /2 dv x ln K ln e du Ke x ln K ln x 2 2 ln ln x x x 1 ln K Ke 1 ln K , +
e Z ( ) K
onde (u) = normal padr ao.
2 1 ev /2 dv 2
e a fun c ao de distribui c ao de uma v.a.
Daqui resulta, ap os algumas contas, C (t, x) = x (t ) K exp((d t)) t d t , 2 + /2)(dt) t = ln(x/K )+( . d t Esta e a c elebre f ormula de Black-Scholes. (13.17)
Para obter o valor da op c ao num instante t basta saber o valor x = S (t) da cota c ao da ac c ao nesse instante: Y (t) = C (t, S (t)), (13.18)
Introdu c ao ` as EDE e aplica c oes pelo que Y (t) = C (t, S (t)) = 2 (t) ln( SK + )+( 2 )(dt) S (t) d t
(t) ln( SK )+( 2 )(dt) d t 2
157
Ke(dt)
(13.19) O valor inicial da op c ao facilmente se obt em pondo t = 0. Note-se que a f ormula n ao depende da taxa m edia de rendimento r das ac c oes mas antes da taxa de rendimento das obriga c oes sem risco, o que e particularmente importante porque r e um par ametro muito dif cil de estimar com precis ao a partir da observa c ao das cota c oes da ac c ao. Note que C (d, S (d)) = (S (d) K )+ ; com efeito, com x = S (d), d = + [] conforme S (d) > K [< K ] e note que, para t = d, d d t = d , pelo que C (d, S (d)) = S (d) K se S (d) > K e C (d, S (d)) = 0 se S (d) < K . A validade da f ormula de Black-Scholes dependia, por em, da exist encia de uma estrat egia autonanciada (b(t), s(t)) tal que Y (T ) = b(T )B (T ) + s(T )S (T ). Ser a que ela existe? A resposta e positiva. E precisamente a estrat egia dada pelas express oes (13.12) e (13.13), de que se obt em, utilizando (13.19) e ap os alguns c alculos, 2 (t) ln SK + ( + 2 )(d t) s(t) = (13.20) dt e ln 1 Ke(dt) b(t) = B (t)
S (t) K
Note-se que s(t) > 0 e b(t) < 0, o que signica que a estrat egia autonanciada referida tem sempre uma posi c ao longa em ac c oes e curta em obriga c oes. O capital da estrat egia autonanciada investido em ac c oes e obriga c oes deve ser, no instante t, respectivamente, a primeira e a se f gunda parcela da segunda linha da express ao (13.19). E acil ver que a estrat egia e de facto autonanciada. Uma conclus ao extremamente importante e que existe uma estrat egia autonanciada dada por (13.20) e (13.21) cujo valor da carteira reproduz, em cada instante t, o valor da op c ao Y (t), isto e, reproduz os resultados que se podem obter com a compra de uma op c ao cujo pre co seja calculado de acordo com a f ormula de Black-Scholes. Podemos cham a-la estrat egia hedging (a palavra inglesa hedging refere-se a coloca c ao de uma cerca ` a
2 + ( 2 )(d t) . dt
(13.21)
158
volta da casa), que poder amos traduzir por estrat egia de protec ca o. Em princ pio, a aquisi c ao de uma op c ao europeia de compra com pre co dado pela f ormula de Black-Scholes e desnecess aria pois o que se iria gastar com a sua aquisi c ao pode ser gasto na compra do portfolio (b(0), s(0)) e seguido da adop c ao da estrat egia autonanciada hedging, que resulta em obter-se no instante d o mesmo benef cio que se obteria com a op c ao, isto seja qual for o cen ario do mercado. Tamb em o operador nanceiro que venda uma op c ao pelo valor determinado pela f ormula de BlackScholes ca isento de qualquer benef cio ou preju zo, pois o que recebe da venda pode ser investido na compra do portfolio (b(0), s(0)) e seguido da adop c ao da estrat egia autonanciada hedging, resultando na obten c ao no instante d de resultados nanceiros iguais ao benef cio a pagar ao comprador da op c ao. H a, por em, uma quest ao relevante, que e a de, sempre que S (t) varia, variam os valores de b(t) e de s(t), obrigando ` a compra ou venda de ac c oes e obriga c oes para se manter na estrat egia hedging, o que n ao e pr atico para operadores individuais. Teoricamente, S (t) varia continuamente ao longo do intervalo [0, d], o que signica transac c oes cont nuas. Tal, naturalmente, s o e vi avel sem custos de transac c ao (com custos, h a que fazer ajustamentos).
13.3
Um exemplo num erico
Consideremos o exemplo da cota c ao das ac c oes do banco BCP entre 8 de Abril de 1991 e 30 de Junho de 1997, cuja traject oria observada, em escala logat tmica, aparece na Figura 2.1 (Sec c a o 2.3). Da traject oria foi poss vel estimar os par ametros = 0, 1932/ ano (um intervalo de = 0, 084/ano (um intervalo de conan ca a 95% e 0, 1932 0, 0070) e R conan ca a 95% e 0, 084 0, 152), com R = r 2 /2. Vamos supor que a taxa instant anea de rendimento das obriga c oes sem risco e de = 4% ao ano ( e um valor um tanto elevado para os dias de hoje mas n ao para aquela epoca). Suponhamos que, no dia 30 de Junho de 1997, que vamos tomar como o nosso instante 0, algu em adquiriu uma op c ao europeia de compra de uma ac c ao com data de exerc cio em 30 de Setembro de 1997 (o nosso instante d = 0, 2518 anos) e valor de exerc cio de K = 3500 escudos (a moeda era ent ao o escudo). Note-se que, no dia 30 de Junho de 1997, a cota c ao da ac c ao era de S (0) = 3350 escudos e o intervalo de conan ca a 95% da previs ao do valor da ac c ao a 30 de Setembro de 1997 era de 3422 732 escudos. Quem comprou a op c ao n ao podia saber que, no dia 30 de Setembro de 1997, a cota c ao da ac c ao no mercado seria S (d) = 3720 escudos, pelo que iria ter um benef cio de 220 escudos (podia mesmo n ao ter qualquer

Cotao Aco S(t) Valor em aces s(t)S(t) Valor carteira Y(t)=b(t)B(t)+s(t)S(t) Valor em obrigaes b(t)B(t)
159
4000 3000
valor em escudos
2000 1000 0 -1000 -2000 -3000 -4000 0
t (anos)
0,2518
350
300
250
valor em escudos
200
150
100
50
0 0 0,2518
t (anos)
Figura 13.1: Estrat egia hedging para uma op c ao de compra europeia de

uma ac c ao do BCP, adquirida em 30 de Junho de 1997 (t = 0) com data de exerc cio 30 de Setembro de 1997 (d = 0, 2518 anos) e valor de exerc cio K = 3500 escudos. A taxa de rendimento instant anea das obriga c oes sem risco e = 4% ao ano. Na parte superior da gura, encontramos, de cima para baixo, a evolu c ao de: a) cota c ao S (t) da ac c ao (S (0) = 3350 escudos, S (d) = 3720 escudos); b) valor s(t)S (t) da componente em ac c oes da estrat egia hedging; c) valor total da estrat egia hedging e tamb em valor da op c ao Y (t) = b(t)B (t)+ s(t)S (t) (Y (0) = 82, 21 escudos e Y (d) = 3720 3500 = 220 escudos), que est a repetido e ampliado na parte inferior da gura; d) valor b(t)B (t) da componente em obriga c oes da estrat egia hedging.
160
benef cio se a cota c ao na data de expira c ao da op c ao estivesse abaixo de 3500, como at e era mais prov avel de acordo com as previs oes). De acordo com a f ormula de Black-Scholes, o custo em 30 de Junho de 1997 da op c ao era Y (0) = 82, 21 escudos. A Figura 13.1 apresenta a evolu c ao da estrat egia autonanciada hedging, dicriminando o valor global da carteira e o valor em ac c oes e obriga c oes.
13.4
Obten c ao da f ormula de Black-Scholes via teorema de Girsanov
Vamos chegar ` a f ormula de Black-Scholes por outra via, que tira partido do teorema de Girsanov e que facilita o tratamento deste problema quando se utilizam modelos mais complexos que o modelo de BlackScholes. D a jeito trabalhar com pre cos deaccionados, usando como refer encia o pre co do investimento (neste caso as obriga co es) sem risco B (t) = B (0) exp(t). Os pre cos deaccionados das obriga c oes, das ac c oes e das op c oes s ao, respectivamente, (t) = B (t)/B (t) 1, B (t) = S (t)/B (t) = S (t) exp(t)/B (0) S e Vem (t) = dS donde 1 {S (t) exp(t)dt + exp(t)dS (t) + 0(dS (t))2 }, B (0) (t) = (r )S (t)dt + S (t)dW (t), dS (13.25) (t) = Y (t)/B (t). Y (13.22) (13.23) (13.24)
(t) pelo que S e um processo de difus ao homog emeo com coeciente de tend encia f (x) = (r )x (13.26) e coeciente de difus ao g 2 (x) = (x)2 . (13.27)
Vamos querer mudar o seu coeciente de tend encia para f (x) = 0 (13.28)
por aplica c ao do teorema de Girsanov. A fun c ao (que representa o pre co
Introdu c ao ` as EDE e aplica c oes de mercado do risco )
161
r (13.29) satisfaz a equa c ao (12.4), que neste caso toma a forma x(x) = (r )x 0. De (12.5) obtemos a martingala (x) = M (t) = exp (r )2 r W (t) t 2 2 (13.30)
e denimos a nova medida de probabilidade P atrav es da sua derivada de Radon-Nikodym dP r (r )2 = M (d) = exp W (d) d . dP 2 2 De (12.7) obtemos W (t) = W (t) + r t, (13.32) (13.31)
que e um processo de Wiener relativamente ` a probabilidade P . De (12.8) vem (t) = S (t)dW (t), dS (13.33) cuja solu c ao e (t) = S (0) + S
0 t
(u)dW (u). S
(13.34)
(t) Pelas propriedades do integral estoc astico, S e uma martingala com respeito a P . Pelo facto de P transformar em martingala o processo das cota c oes da ac c ao desinaccionadas pelo valor do investimento sem risco e pelo facto de ser uma medida de probabilidade equivalente a P , a literatura nanceira designa P por medida martingala equivalente. Usando o teorema de It o, vem (t)B (t)) = S (t)dt + S (t)dW (t). dS (t) = d(S (13.35)
Repare-se que, relativamente a W (t) (processo de Wiener relativamente a P ), ou seja relativamente ` a medida martingala equivalente P , a taxa m edia (aritm etica) de rendimento das ac co es e igual a , isto e, igual ` a taxa de rendimento do investimento sem risco. A nova probabilidade P modica as probabilidades dos cen arios de mercado de maneira a que a economia pare ca neutral ao risco.
162
Se houver uma estrat egia hedging (b(t), s(t)), isto e, uma estrat egia autonanciada que reproduza o valor Y (t) da op c ao, ent ao Y (t) = b(t)B (t) + s(t)S (t) = t b(0)B (0) + s(0)S (0) + 0 b(u)dB (u) + Logo dY (t) = b(t)dB (t) + s(t)dS (t) = b(t)B (t)dt + s(t) (S (t)dt + S (t)dW (t)) = (b(t)B (t) + s(t)S (t)) + s(t)S (t)dW (t) = Y (t)dt + s(t)S (t)dW (t) e (t) = dY
1 t Y (t)) = B (0) d (e 1 t Y (t)dt + et dY (t) + 0(dY (t))2 B (0) e 1 B (t) (Y (t)dt + dY (t)) = 1 B (t) (Y (t) + Y (t)dt + s(t)S (t)dW (t)) t 0
s(u)dS (u).
= =
s(t)S (t)dW (t). Daqui resulta que (t) = Y (0) + Y
t 0
(u)dW (u) s(u)S
(13.36)
e uma martingala relativamente a P . Logo temos, para 0 t d, (t) = EP [Y (d)|Mt ]. Y (13.37)
Traduzindo directamente (13.37) vem, pondo Y (t) = C (t, S (t)),

C (t, S (t)) = EP B (0)et
S (d) K B (0)ed
S (t) ,
donde C (t, x) = EP De (13.35), vem d ln S (t) = ( 2 /2)dt + dW (t) (13.39)
S (d)e(dt) Ke(dt)
S (t) = x .
(13.38)
Introdu c ao ` as EDE e aplica c oes e, portanto, ln S (d) = ln S (t) + ( 2 /2)(d t) + (W (d) W (t)).
163
Logo, condicionalmente a S (t) = x e relativamente ` a probabilidade P , a v.a Z = ln S (d) tem distribui c ao N ln x + ( 2 /2)(d t), 2 (d t) , a v.a. U= e normal padr ao e vem Z ln x ( 2 /2)(d t) dt
+
S (d)e(dt) Ke(dt) xe
2 (dt)/2+ dt U
=
+
Ke
(dt)
Logo, de (13.38), resulta que C (t, x) e a esperan ca matem atica de xe

2
(dt)/2+ dt U
Ke(dt)
com U v.a. normal padr ao. Logo, pondo = vem C (t, x) =

+ +
ln K ln x ( 2 /2)(d t) , dt
2
xe
(dt)/2+ dt u
xe
2 (dt)/2+ dt u
x x
x 1 dt x
2
2 + 1 + 1 eu /2 du exp (u 2 dt) du Ke(dt) 2 2 2 + 1 + v 2 /2 1 eu /2 du = dv Ke(dt) dt 2 e 2 (dt)
Ke
(dt)
Ke(dt)
2 1 eu /2 du 2
2 1 eu /2 du 2
= =
ln(x/K )+(+ /2)(dt) d t
Ke
Ke(dt)
(1 ( )) =
ln(x/K )+(2 /2)(dt) d t
Obtiv emos por outra via a f ormula de Black-Scholes (13.17). A dedu c ao anterior pressuponha a exist encia da estrat egia hedging. Da express ao de C (t, x) podemos obter essa estrat egia e mostrar que reproduz o valor da op c ao pelos mesmos m etodos que us amos na Sec c ao
164
13.2. Noutros modelos mais complexos do que o de Black-Scholes em que n ao seja poss vel obter a express ao expl cita de C (t, s), a prova da exist encia e a determina c ao da estrat egia hedging poder a ter de recorrer ao teorema da representa c ao de Yor, que est a fora do ambito deste texto. Nesses modelos mais complexos, e poss vel obter valores aproximados de Y (t), calculando aproximadamente C (t, x) por simula c ao de Monte Carlo, uma vez que a esperan ca matem atica de (13.38) pode ser simulada. Essa a vantagem deste m etodo do teorema de Girsanov. Vamos na pr oxima Sec c ao ver um m etodo num erico alternativo para obter aproximadamente C (t, x), baseado na aproxima c ao pelo modelo binomial.
13.5
O modelo binomial
O modelo binomial, tamb em conhecido como modelo de Cox-RossRubinstein ou modelo CRR, e uma discretiza c ao no tempo e no espa co de estados para o processo ln S (t), trabalhando com a medida martingala equivalente P , que nesta t ecnica e, em cada passo, aproximada por uma v.a. de Bernoulli. Esta t ecnica pode tamb em ajudar o leitor a compreender melhor o que se est a a passar. Mas o seu objectivo e o de fazer simula c oes dos fen omenos de uma forma muito r apida e obter aproxima c oes das quantidades de interesse, como seja o valor de uma op c ao. Vamos exemplicar com o modelo de Black-Scholes, usando o exemplo da Sec c ao 13.2, mas a t ecnica aplica-se, com as necess arias adapta c oes, a qualquer outro modelo. Pela sua exibilidade e rapidez, trata-se de um instrumento muito u til. Partamos da equa c ao (13.39), em que vemos que o processo ln S (t) e, relativamente ` a medida martingala equivalente P , um processo de difus ao com coefciente de tend encia 2 /2 e coeciente de difus ao 2 . A ideia e substituir este processo por um passeio aleat orio adequado (t), que ln S e um processo em tempo discreto e com espa cos de estados discreto tal que, em cada passo do tempo, o processo se move para um dos dois estados imediatamente cont guos ` aquele em que estava. O intervalo de tempo [0, d] e discretizado em n passos de igual dura c ao t = d/n. t+t t+t dW (s) ( 2 /2)ds+ t Note-se que ln S (t+t)ln S (t) = t = ( 2 /2)t + W (t) N (( 2 /2)t, 2 t), isto e, no passo temporal que vai de t para t + t, o processo original e incrementado de uma quantidade aleat o ria com distribui c a o normal de m edia ( 2 /2)t 1 e desvio-padr ao t. O que se faz e, em cada passo temporal, apro1 Para outros modelos, a distribui ca o seria aproximadamente normal com m edia igual ao coeciente de tend encia multiplicado por t e desvio-padr ao igual a ` ra z
165
ximar a distribui c ao normal por uma distribui c ao de Bernoulli aproximadamente com a mesma m edia e desvio-padr ao. Suponhamos que, no (t) est ao instante t, o processo ln S a no estado z e seja z = t. Ent ele pode, no passo temporal discreto que vai de t para t + t, transitar para o estado z + z ou z z , com probabilidades p e q = 1 p , respectivamente. Se p fosse igual a 1/2, o salto edio seria 0, diferente m do pretendido, e o desvio padr ao seria z = t, precisamente o pretendido. H a portanto que fazer uma pequena correc c ao do valor de p de modo a acertar a m edia sem, no entanto, alterar signicativamente o desvio-padr ao. Como o salto m edio e p z q z = (2p 1)z , obt em-se exactamente a m edia desejada ( 2 /2)t escolhendo ( 2 /2)t . (13.40) t O desvio-padr ao, por em, vem agora = t+termos de ordem inferior, o que e uma aproxima c ao satisfat oria. Claro que, ao m de alguns saltos, o incremento global ter a (neste exemplo) distribui c ao binomial (soma de v.a. de Bernoulli i.i.d.). Facilmente se reconhece que, para t = (t) se aproxima, 0, t, 2t, ..., d = nt, a distribui c ao binomial de ln S quando n +, da distribui c ao normal (relativamente ` a medida de probabilidade P ) de ln S (t). A Figura 13.2 ilustra uma traject oria do modelo binomial. Apliquemos o m etodo no caso do exemplo da Sec c ao 13.3, onde S (0) = 3350, = 0, 1932/ ano (estimativa), = 0, 04 por ano, d = 0, 2518 anos. Para simplicar as contas, e porque se trata s o de uma ilustra c ao, vamos p or n = 1, mas seria desej avel um n relativamente grande para que a c ao fosse razo avel. Logo t = d/n = 0, 2518 anos aproxima e z = t = 0, 09695. Pode-se ent ao saltar de ln S (0) = 8, 116716 (0 + t) = para 8, 116716 + 0, 09695 = 8, 213666 (a que corresponde S (d) = 3691, 05 escudos) ou para 8, 116716 0, 09695 = 8, 019766 (a que S (0 + t) = S (d) = 3040, 47 escudos). As probabilidades corresponde S de cada salto s ao, respectivamente, p = 0, 52771 (usou-se (13.40)) e q = 0, 47229. Note-se que como se usou K = 3500 escudos, se fosse S (d) = 3040, 47 viria Y (d) = 0 e, se fosse S (d) = 3691, 05 escudos, viria Y (d) = 191, 05 escudos. Supondo que cada obriga c ao vale 1 escudo no instante t = 0, ela vale B (d) = B (0) exp(d) = exp(0, 04 0, 2518) = 1, 010123 no ins (d) = Y (d)/1, 010123, tante d e o valor desinaccionado da op c ao ser aY (d) com a informa ou seja, ser a 0 ou 189, 14. O valor esperado de Y c ao dispon vel no instante 0 depender a da probabilidade p . Usando o valor p = 1 2 1+
quadrada do coeciente de difus ao multiplicado por t.
166
ln S(t)
O
p*
O
O O O O O O O
ln S(0)
q*
t t 2 t d=n t
Figura 13.2: Ilustra c ao do modelo binomial. Note-se que z = t

e que o n umero de intervalos n em que e partido o intervalo [0, d] deve ser relativamente elevado (nesta ilustra c ao, p os-se n = 3). Ilustra-se uma poss vel (t), que aproxima ln S (t). As probabilidades de, em traject oria do processo ln S cada passo temporal, se mover para cima ou para baixo s ao, respectivamente, p (dada por (13.40)) e q = 1 p .
aproximado p = 0, 52271 acima obtido, o valor esperado (que aproxi (d) ma o valor esperado segundo a medida martingala equivalente) de Y e 0, 52271 189, 14 + 0, 47229 0 = 98, 87. Esse deveria ser aproxi (0), que, como B (0) = 1, seria tamb madamente o valor de Y em Y (0). Como vimos na Sec c ao 13.3, o valor exacto de Y (0) e de 82, 21 escudos. A aproxima c ao n ao e famosa mas, tendo usado um s o passo, n ao estar amos ` a espera de milagres. Como obter aproximadamente a estrat egia hedging? Neste caso, como s o h a um passo temporal que come ca em 0, a estrat egia consiste na u nica transac c ao que se faz no in cio para constituir a carteira. Se houvesse v arios passos temporais, em cada um deles haveria compras e vendas apropriadas de ac c oes e obriga c oes. Neste exemplo com um s o passo temporal, indicar a estrat egia e indicar o n umero de obriga c oes b = b(0) = b(d) e o n umero de ac c oes s = s(0) = s(d) a incluir inicialmente na carteira. Se, no u nico passo temporal deste exemplo,
167
(d) = 3691, 05 escudos, vem que o valor da carteira saltarmos para ln S no instante d e b B (d) + s 3691, 05 = b exp(0, 04 0, 2518) + s 3691, 05 = 1, 010123b + 3691, 05s, mas este valor deve igualar o benef cio de 191, 05 escudos do detentor da op c ao, pelo que temos a equa c ao (d) = 3040, 47 es1, 010123b + 3691, 05s = 191, 05. Caso saltemos para S cudos, obtemos semelhantemente a equa c ao 1, 010123b + 3040, 47s = 0. Resolvendo o sistema das duas equa c oes, vemos que a estrat egia ser a adquirir s = 0, 29366 ac c oes e b = 883, 92 obriga c oes. Claro que bB (0) + sS (0) = 883, 92 + 0, 29366 3350 = 98, 84 d a (` a parte um pequeno erro de c alculo) o valor j a obtido de Y (0). Claro que esta estrat egia em um s o acto, em que n ao se d a oportunidade de ir transaccionando ao longo do tempo, dar a uma aproxima c ao muito crua. Naturalmente, obter amos aproxima c oes muito melhores de Y (0) (e de Y (t) para valores de t pertencentes ` a grelha temporal considerada na discretiza c ao) e tamb em melhores aproxima c oes da estrat egia hedging (agora com v arios per odos de transac c ao em vez de um s o) se tivessemos usado um n elevado em vez de n = 1.
13.6
Op c oes europeias de venda
Uma op ca o europeia de venda com data de expira ca o d > 0 (instante determin stico) e valor de exerc cio K > 0 d a ao seu detentor o direito, mas n ao a obriga c ao, de vender uma ac c ao no instante d pelo pre co de exerc cio K . Caso a cota c ao S (d) no instante d seja inferior a K , o detentor da op c ao exerc e-la- a vendendo uma ac c ao ao pre co K e cando com um benef cio K S (d) > 0. Caso S (d) seja superior a K , o detentor da op c ao n ao ir a obviamente exerc e-la e o seu benef cio ser a nulo. Conclui-se que uma op c ao de venda d a ao seu detentor um benef cio (K S (d))+ := max(K S (d), 0). O tratamento destas op c oes reduz-se ao tratamento j a feito das op c oes de compra mediante f ormulas simples que permitem passar de um caso para outro, as quais vamos apresentar de seguida. Seja YP (t) (usamos o ndice P para indicar que e uma op c ao de venda, que, em ingl es, se diz put option) o valor de uma op c ao de venda no instante t e seja (bP (t), sP (t)) (t [0, d]) uma estrat egia hedging, isto e uma estrat egia autonanciada que reproduza o valor YP (d) da op c ao no instante d (e, portanto, pelo princ pio da n ao-arbitragem, tamb em reproduza o valor da op c ao em todos os instantes t [0, d]). Facilmente se v e que, sendo Y (t) o valor de uma op c ao de compra com a mesma
168
data e valor de exerc cio, vem YP (d) Y (d) = S (d) + K = S (d) + K B (d). B (0) exp(d)
Logo, um portfolio com 1 op c ao de venda e 1 op c ao de compra tem, no K instante d, o mesmo valor que um portfolio com 1 ac c ao e B (0) exp( d) obriga c oes. Pelo princ pio da n ao-arbitragem, os dois portfolios devem ter o mesmo valor em qualquer instante t [0, d], pelo que vem
K YP (t) Y (t) = S (t) + K = S (t) + B (0) exp( d) B (t) = (dt) S (t) + Ke ,
donde K B (t) = Y (t) S (t) + Ke(dt) . B (0) exp(d) (13.41) Seja (b(t), s(t)) a estrat egia hedging da op ca o de compra. Ent ao temos b(t)B (t) + s(t)S (t) = Y (t) e bP (t)B (t) + sP (t)S (t) = YP (t), o que, substitu do em (13.41), d a YP (t) = Y (t) S (t) + bP (t) b(t) K B (0) exp(d) B (t) + (sP (t) s(t) + 1) S (t) = 0.
Isso sugere que a estrat egia hedging para a op ca o de venda seja dada por K bP (t) = b(t) + B (0) exp( d) (13.42) sP (t) = s(t) 1. trivial vericar que a sugest E ao est a correcta, o que ca como exerc cio para o leitor. J a as op c oes americanas de compra e venda s ao de mais dif cil tratamento.
13.7
Outros modelos e op c oes
O que se fez nas Sec c oes anteriores pode ser consideravelmente generalizado. Para come car, podem existir v arias ac c oes ou activos nanceiros (at e taxas de juro, taxas de c ambio, etc.) com cota c oes/valores S1 (t), S2 (t), ..., Sn (t). Estes activos podem seguir modelos diferentes (com outros comportamentos da taxa m edia de rendimento e da volatilidade) do modelo de Black-Scholes, o investimento sem risco pode ser
169
agora apenas um investimento seguro com uma taxa de rendimento vari avel e podem considerar-se outros tipos de op c oes mais complicadas. Daqui em diante, supomos que t varia no intervalo [0, d], com d real positivo. Consideremos um processo de Wiener a m dimens oes W(t) = [W1 (t), ..., Wm (t)]T num espa co de probabilidade (, F , P ) e seja Mt a sua ltra c ao natural. Em vez de B (t), vamos designar por S0 (t) o valor do investimento seguro e supor que ele satisfaz dS0 (t) = (t, )S0 (t)dt com condi c ao inicial S0 (0) determin stica e com a taxa de rendimento fun c ao limitada e adaptada ` a ltra c a o Mt . Para i = 1, ..., n, vamos supor que Si (t) satisfaz
m
dSi (t) = Fi (t, )dt +

j =1
Gij (t, )dWj (t)
com Si (0) determin stico. Se designarmos por F o vector coluna dos Fi , por G a matriz n m dos Gij e por Gi a sua i- esima linha, podemos escrever dSi = Fi dt + Gi dWi (t) (i = 1, ..., n). Supomos que F e G s ao adaptadas ` a ltra c ao Mt e satisfazem as condi c oes para que o vector coluna S(t) = [S0 (t), S1 (t), ..., Sn (t)]T seja um processo de It o. Claro que, se, em particular, se tiver (s, ) = (t, S0 (t, ), S1 (t, ), ..., Sn (t, )) e semelhantemente para os Fi e os Gij , temos uma EDE multidimensional mas em que S0 (t) = t ao e impulsionado pelo processo de Wiener. S0 (0) exp 0 (u, )du n A S(t) chama-se um mercado. Chamamos mercado normalizado 0 (t), S 1 (t), ..., S n (t)]T = [1, S1 (t)/S0 (t), ..., Sn (t)/S0 (t)]T (t) = [S S ao que resulta de usar como deactor o processo S0 (t). Vem (t) = dS 1 (dS(t) (t)S(t)dt). S0 (t)
Um portfolio s(t, ) (t [0, d]), que abreviamos para s(t), e um vector linha s(t) = [s0 (t), s1 (t), ..., sn (t)] adaptado ` a ltra c ao Mt , que representa a quantidade de cada um dos n + 1 activos nanceiros detidos em cada momento por um investidor.
170 O seu valor e
V (t) = Vs (t, ) = s(t)S(t) =

i=0
si (t)Si (t).
O portfolio diz-se autonanciado se

t
V (t) = V (0) +
0
s(u)dS(u),
ou seja dV (t) = s(t)dS(t), al em de satisfazer uma condi c ao t ecnica adequada para que a express ao denidora fa ca sentido (por exemplo, embora n ao seja precisa condi c ao t ao forte, que , F, G, s e S estejam em M 2 [0, t]). Um portfolio autonanciado diz-se um portfolio admiss vel se o seu valor for limitado inferiormente (isso impede endividamentos sem limite, evitando situa c oes semelhantes ` a da estrat egia sempre ganhadora em jogos de azar que consiste em duplicar a aposta at e ganhar). Um portfolio diz-se uma arbitragem se for admiss vel, se o seu valor for nulo no instante 0 e n ao-negativo no instante d e se houver uma probabilidade positiva de ter valor positivo no instante d. Isto signica que, com um investimento nulo e sem qualquer risco, h a uma probabilidade positiva de lucro. A hip otese habitual de trabalho e a de que o mercado n ao permite a exist encia de arbitragens. Uma medida de probabilidade P denida em (, Md ) equivalente a P diz-se uma medida martingala equivalente se o mercado normalizado (t) for uma martingala relativamente a P (com respeito ` S a ltra c ao Mt ). Um resultado importante, que n ao demonstramos aqui (pode ver, por exemplo, [51]) e o de que, se existe uma medida martingala equivalente, ent ao n ao h a arbitragens no mercado. O rec proco n ao e verdadeiro; e precisa uma propriedade um pouco mais forte que a aus encia de arbitragem para garantir a exist encia de medida martingala equivalente. O teorema de Girsanov d a-nos condi c oes sucientes para isso. Embora ainda se possa generalizar mais, referimos aqui o caso de uma op c ao europeia mais geral, que pode ser qualquer v.a. C mensur avel-Md limitada inferiormente, correspondente ao benef cio a que o seu detentor tem direito na data de expira c ao d. Ela diz-se ating vel no mercado S(t) se existir pelo menos um portfolio hedging, isto e, um portfolio admiss vel d umero real z . Aqui z repres(t) tal que C = z + 0 s(t)dS(t) para algum n senta a riqueza inicial e o integral representa a valoriza c ao do portfolio. O mercado diz-se completo se todas as op c oes acima consideradas forem ating veis. Pode provar-se que, para saber se uma op c ao e ating vel e
171
indiferente trabalhar com o mercado original ou com o mercado normalizado, pelo que o mercado original e completo sse o mercado normalizado tamb em for. Em [51] pode ver-se que, se existir um vector coluna m-dimensional (t, ) em H 2 [0, d] tal que 2 G(t) (t) = F(t) (t)[S1 (t), ..., Sn (t)]T
T < , e se verique a condi ca o de Novikov EP exp 1 2 0 (u) (u)du ent ao o mercado e completo sse a matriz G(t) tiver caracter stica m para quase todo o par de valores (t, ). Claro que s o podemos ter um mercado completo se n m. O n umero de fontes de ru do independentes e a dimens ao m do processo de Wiener. O facto de a caracter stica de G(t) ser m signica que, entre os n activos n ao-seguros do mercado que podem ser utilizados para fazer hedging, h a m activos nanceiros sem redund ancias. Consideramos que haver a redund ancia entre v arios activos n ao-seguros se o valor de um deles depender apenas do valor dos restantes e do do activo seguro. Por exemplo, uma ac c ao e uma op c ao europeia de compra sobre ela formam um conjunto redundante de activos, porque o valor da op c ao e fun c ao da cota c ao da ac c ao e do valor da obriga c ao sem risco. Tamb em, um conjunto xo de 20 ac c oes e um ndice bolsista baseado na m edia das suas cota c oes e necessariamente redundante, pois a informa c ao contida no ndice est a j a contida nas ac c oes componentes. Ao leitor interessado nestas e noutras quest oes relacionadas, recomendamos a leitura de [38]. d
2 Corresponde a (12.4) com f escolhido de modo a que o processo normalizado tenha tend encia nula.
172
Cap tulo 14
S ntese
Fa camos uma breve s ntese dos principais aspectos tratados neste texto, com uma certa informalidade que leva a n ao mencionar as quest oes mais t ecnicas. As equa c oes diferenciais estoc asticas (EDE) s ao u teis nos mais diversos ramos da Ci encia e da Tecnologia para modelar fen omenos din amicos que seriam descritos por equa c oes diferenciais ordin arias n ao fora o facto de a sua din amica ser perturbada por um ru do. O ru do, processo estoc astico em tempo cont nuo, ser a, por raz oes de comodidade matem atica, aproximado por um ru do branco (t) = (t, ), que e um processo estoc astico generalizado gaussiano estacion ario em que os valores do processo em instantes distintos s ao independentes. Ele ser aa derivada (no sentido das fun c oes generalizadas, j a que a derivada ordin aria n ao existe) do processo de Wiener (tamb em conhecido por movi mento browniano) W (t, ) (t 0). E costume abreviar para W (t), isto e, n ao referir explicitamente a depend encia do acaso . O processo de Wiener, que supomos denido num espa co de probabilidade (, F , P ), e um processo estoc astico (propriamente dito) em tempo cont nuo com valores em R, com traject orias quase certamente (q.c.) cont nuas, com incrementos independentes, com X (0) = 0 e tal que o incremento W (t) W (s) (s < t) tem distribui c ao N (0, t s) (distribui c ao normal com m edia 0 e vari ancia t s). Ele foi usado inicialmente por Bachelier em 1900 para decrever a cota c ao de uma ac c ao na bolsa e (na vers ao multidimensional) por Einstein em 1905 para descrever o movimento browniano de uma part cula suspensa num u do (a primeira EDE, cuja solu c ao e o processo de Ornstein-Uhlenbeck, surge precisamente para melhorar este modelo do movimento browniano). Wiener e L evy s ao respons aveis pela teoria matem atica. O pro173
174
Cap tulo 14 - S ntese
cesso de Wiener e um processo de Markov, isto e, conhecido o valor at presente, o futuro e independente do passado. E e um processo de Markov forte, isto e, a propriedade de Markov funciona mesmo quando se toma para instante presente um instante aleat orio, desde que seja um tempo de Markov , isto e, desde que seja poss vel determinar se t, com t xo, apenas conhecendo os valores do processo at e ao instante t, inclusiv e. A f.d.p. de transi c ao do processo de Wiener, isto e, para s < t, a f.d.p. de W (t) dado W (s) = x e N (x, t s). O processo de Wiener e tamb em uma martingala (com repeito ` a sua ltra c ao natural), isto e, para s < t, E[W (t)|W (u) : 0 u s] = W (s). As suas traject orias s ao cont nuas mas muito irregulares, de varia ca o ilimitada q.c. e, portanto, q.c. sem derivada. Estudaram-se EDE da forma dX (t) = f (t, X (t)) + g (t, X (t))(t), dt X (0) = X0 , t [0, d],
onde a condi c ao inicial X0 e uma v.a. independente do processo de Wiener (que pode ser degenerada numa constante determin stica). E habitual escrev e-las na forma dX (t) = f (t, X (t))dt + g (t, X (t))dW (t), X (0) = X0 , t [0, d],
ou, para lhe dar verdadeiramente signicado, na forma integral (abreviamos, como usualmente, X (t, ) para X (t))
t t
X (t) = X0 +
0
f (s, X (s))ds +
0
g (s, X (s))dW (s),
t [0, d].
O primeiro integral pode ser denido para cada (isto e para cada traject oria) como integral de Riemann ou de Lebesgue, mas o segundo integral n ao pode ser denido como integral de Riemann-Stieltjes porque a varia c ao ilimitada da fun c ao integradora W (t) provoca (salvo nos casos mais simples) que os limites (por exemplo, em m edia quadr atica) das somas de Riemann-Stieltjes dependam da escolha dos pontos in portanto, necess term edios da fun c ao integranda. E, ario, denir os integrais estoc asticos. S o vamos considerar fun c oes integrandas G(s, ) n ao-antecipativas, que s ao fun c oes que, al em de conjuntamente mensur aveis nas suas duas vari aveis, n ao adivinham o futuro, isto e, s ao independentes dos futuros valores do ru do perturbador, o mesmo e dizer independentes dos incrementos futuros do processo de Wiener. Embora a deni c ao seja um pouco mais complexa para fun c oes integrandas G(s, ) mais gerais, no caso de elas serem n ao-antecipativas e cont nuas
Introdu c ao ` as EDE e aplica c oes em m edia quadr atica, o integral estoc astico pode denir-se por
t 0
175
G(s)dW (s) =
G(s, )dW (t, ) = n l.i.m.n+ k=1 G(tn,k1 )(W (tn,k ) W (tn,k1 ).
t 0
Aqui 0 = tn,0 < tn,1 < ... < tn,n = t (n = 1, 2, ...) s ao decomposi c oes do intervalo de integra c ao com di ametro a tender para zero quando n + e l.i.m. representa o limite em m edia quadr atica. Este integral, em que se faz a escolha n ao-antecipativa para os pontos interm edios da fun c ao integranda, e o integral de It o. A escolha n ao-antecipativa traduz a ideia de n ao adivinha c ao do futuro e d a ao integral boas propriedades probabil sticas. Por em, ele n ao segue as regras usuais de c alculo. Outras escolhas ou combina c oes de escolhas dos pontos interm edios d ao outros integrais estoc asticos, entre os quais se destaca o de Stratonovich, que t t se representa por (S ) 0 G(s)dW (s) ou 0 G(s) dW (s) e que segue as regras usuais de c alculo, embora n ao tenha t ao boas propriedades probabil sticas. Trabalh amos com o integral de It o e estendemos a deni c ao para fun c oes integrandas pertencentes ao espa co de Hilbert H 2 [0, t] de fun c oes t 2 2 n ao-antecipativas tais que ( G 2 ) = 0 E[G ]ds < + ( 2 e a norma). O integral e uma v.a. e est a no espa co de Hilbert L2 das v.a. com norma nita (em L2 a norma de uma v.a. X e E[X 2 ])1/2 ). Veric amos que o integral tem esperan ca matem atica nula e preserva a norma, isto eE
t 0
G(s)dW (s)
t 0
E[G2 (s)]ds. Tamb em veric amos, que
como fun c ao do limite superior de integra c ao, o integral de It o e uma fun c ao cont nua e uma martingala. No caso de G ser determin stica, o t t integral 0 G(s)dW (s) tem distribui c ao N (0, 0 G2 (s)ds). O integral de It o foi depois estendido a fun c oes da classe M 2 [0, t], t isto e, fun c oes n ao-antecipativas tais que 0 G(s)ds < + q.c., mas para estas fun c oes j a n ao h a garantia de ele ter momentos nem de ser martingala. Deniu-se um processo de It o como um processo da t t forma X (t) = X0 + 0 F (s, )ds + 0 G(s, )dW (s, ) (ou seja, dX (t) = F (t)dt + G(t)dW (t) em nota c ao diferencial) com F n ao-antecipativa tal d o segue que 0 |F (s)|ds < + q.c. e G M 2 [0, d]. O integral de It regras especiais de c alculo, o c alculo de It o, que s ao consubstanciadas no teorema/f ormula de It o. Esta diz que, se h(t, x) for uma fun c ao real de classe C 1,2 , e se X (t) for o processo de It o acima, ent ao Y (t) = h(t, X (t)) e um processo de It o e vem dY (t) = h(t, X (t)) h(t, X (t)) 1 2 h(t, X (t)) dt + dX (t) + (dX (t))2 , t x 2 x2
176
onde (dX (t))2 deve ser calculado usando as regras (dt)2 = dtdW (t) = 0 e (dW (t)) = dt (esta u ltima e que fura as regras usuais). Denido o integral estoc astico, a forma integral da EDE tem sentido e podemos procurar condi c oes para a exist encia e unicidade de solu c ao. Apresent amos um teorema de exist encia e unicidade de solu c ao para a EDE dX (t) = f (t, X (t))dt + g (t, X (t))dW (t) (t [0, d]) com X (0) = X0 2 independente do processo de Wiener tal que E[X0 ] < +, que exige que f (t, x) e g (t, x) satisfa cam, relativamente a x, uma condi c ao de Lipschitz e uma restri c ao ao crescimento. Nestas condi c oes veric amos que a solu ca o est a em H 2 [0, d], e cont nua e cont nua em m edia quadr atica, tem m edia e vari ancia nitas e e um processo de Markov. Veric amos ainda que, se f e g forem cont nuas em t, a solu c ao e tamb em um processo de difus ao com coeciente de tend encia a(s, x) = f (s, x) e coeciente de difus ao b(t, x) = g 2 (t, x), isto e, um processo de Markov de traject orias q.c cont nuas que verica as propriedades (5.1), (5.2) e (5.3). Os coecientes de tend encia e difus ao caracterizam o processo de difus ao e d ao-nos as velocidades com que variam a m edia e a vari ancia do processo, respectivamente. A vantagem e que, para estes processos s ao v alidas as equa c oes de Kolmogorov (ver Sec c ao 5.2). No caso particular das EDE aut onomas, aquelas em que f (t, x) f (x) e g (t, x) g (x) n ao dependem do tempo t, a condi c ao de Lipschitz e suciente pois implica a restri c ao ao crescimento e a solu c ao e um processo de difus ao homog eneo (os coecientes de tend encia e difus ao tamb em n ao dependem do tempo) com coeciente de tend encia a(x) = f (x) e coeciente de difus ao b(x) = g 2 (x). Neste caso, quando a condi c ao inicial X0 x e determin stica, chamamos ` a sua solu c ao difus ao de It o. Neste caso, a equa c ao de Kolmogorov regressiva para funcionais u(t, x) = Ex [h(X (t))] := E[h(X (t))|X (0) = x], com h(x) fun c ao mensur avel-Borel cont nua limitada, toma a forma u t = D u, com limu0 u(t, x) = h(x). 2 Aqui D = a(x) x +1 e o operador de difus ao. 2 b(x) x2 Para as EDE aut onomas, no caso unidimensional (isto e, n ao podemos extrapolar quando generalizarmos a sistemas de EDE), basta at e que f e g sejam de classe C 1 para existir solu c ao u nica at e um instante de explos ao e, sempre que seja poss vel mostrar (por outras t ecnicas) que o instante de explos ao e q.c. innito, pode concluir-se que existe solu c ao u nica para todo o t 0. Se usarmos integrais de Stratonovich em vez de integrais de It o na forma integral da EDE, teremos EDE de Stratonovich, que representamos por (S ) dX (t) = f (t, X (t))dt + g (t, X (t))dW (t), X (0) = X0 .
Introdu c ao ` as EDE e aplica c oes Na forma integral e

t t
177
X (t) = X0 +
0
f (s, X (s))ds + (S )
0
g (s, X (s))dW (s),
onde podemos, sob condi c oes de regularidade adequadas, denir o integral de Stratonovich por (S )
t 0
g (s, X (s))dW (s) =

n k=1
l.i.m.
t 0 g (s, X (s)) X (tn,k1 )+X (tn,k ) tn,k1 , 2
dW (s) = (W (tn,k ) W (tn,k1 )) .
Ent ao conclui-se que a EDE de Stratonovich referida e equivalente (tem a mesma solu c ao) que a EDE de It o dX (t) = f (t, X (t)) + 1 g (t, X (t)) g (t, Xt)) dt + g (t, X (t))dW (t). 2 x
A f ormula, usada em sentido inverso, permite reduzir uma EDE de It o a uma de Stratonovich com a mesma solu c ao, o que e muito u til pois, para resolver esta, podemos usar as regras de c alculo a que estamos habituados em vez do c alculo de It o que nos e estranho. Tudo isto pode ser generalizado ao caso multidimensional, o que permite tratar sistemas de EDE. No Cap tulo 8, trat amos com algum detalhe o modelo de BlackScholes dX (t) = rX (t)dt + X (t)dW (t), com X (0) = x0 determin stico. Ele e usado para modelar a din amica da cota c ao de uma ac c ao na bolsa e a din amica de crescimento de uma popula c ao sem restri c ao de recursos em ambiente aleat orio. Aqui o acaso representa um cen ario do mercado ou um estado da natureza escolhido ao acaso no conjunto de todos os poss veis cen arios do mercado ou estados da natureza. O modelo pode escrever-se na forma dX (t)/dt = (r + (t))X (t) que traduz a ideia de que a taxa de rendimento r, em vez de ser constante, e perturbada por um ru do branco. O par ametro r pode interpretar-se agora como uma taxa m edia de rendimento. O par ametro , que mede a intensidade das utua c oes aleat orias, e conhecido por volatilidade na literatura nanceira. A solu c ao X (t) = x0 exp (r 2 /2)t + W (t) foi facilmente obtida, quer recorrendo ` a f ormula de It o aplicada a ln X (t), quer convertendo-a numa EDE de Stratonovich equivalente e resolvendoa pelas regras usuais de c alculo. EDE id enticas d ao solu c oes diferentes conforme se adopte o c alculo de It o ou o de Stratonovich e isso tem dado controv ersias na literatura. As diferen cas podem mesmo ser de car acter qualitativo. Por exemplo, no modelo de Black-Scholes aplicado ao crescimento de uma popula c ao,
178
o c alculo de Stratonovich garante que a popula ca o n ao se extingue se a taxa m edia de crescimento per capita r for positiva, mas no c alculo de It o ela extingue-se para r < 2 /2, o que inclui valores positivos de r. habitual dar-se a receita, baseada em certos teoremas limite, de que, E se o processo decorre intinsecamente em tempo cont nuo na natureza e o ru do perturbador e colorido, quando n os o aproximamos pela c c ao matem atica de um ru do branco, o c alculo que d a melhor aproxima c ao e o de Stratonovich. Em contrapartida, se o processo decorre intrinsecamente em tempo discreto (com um ru do branco em tempo discreto, que e um processo estoc astico propriamente dito) e n os aproximamos a equa c ao ` as diferen cas estoc astica por uma EDE (agora com a c c ao matem atica de ru do branco em tempo cont nuo), a melhor aproxima c ao e o c alculo de It o. Por em, em muitas aplica c oes, e duvidoso qual das situa c oes se aplica. A controv ersia foi por n os resolvida (ver Cap tulo 9) notando que o par ametro r, ao contr ario do que implicitamente se sup oe na literatura, tem signicados diferentes em termos da din amica populacional, signicando diferentes tipos de m edia. De facto, se usarmos o c alculo de It o, r signica a taxa m edia aritm etica e, se usarmos o c alculo de Stratonovich, signica a taxa m edia geom etrica (rigorosamente, n ao dever amos usar a mesma letra para quantidades com signicados diferentes) e, se atendermos a ` diferen ca 2 /2 entre as duas m edias, os dois c alculos coincidem completamente nos seus resultados. E isso e uma situa c ao mais geral que se aplica a uma ampla classe de modelos. Estud amos (Sec c ao 11.1) o modelo de Ornstein-Uhlenbeck e uma sua variante, o modelo de Vasicek, vericando nestes dois casos a exist encia de densidade estacion aria. Isto e, nestes casos a solu c ao X (t) da EDE tem distribui c ao de probabilidade que converge quando t + para uma distribui c ao limite cuja f.d.p. e a densidade estacion aria. Esta verica c ao foi poss vel porque conseguimos resolver explicitamente a EDE, o que nem sempre sucede. Para processos de difus ao unidimensionais regulares (todos os estados do interior do espa co de estados comunicam entre si) com coecientes de tend encia a(x) e de difus ao b(x) cont nuos em que o coeciente de difus ao e positivo no interior do espa co de estados, existem m etodos de verica c ao de exist encia e determina c ao da densidade estacion aria que n ao exigem a resolu c ao expl cita da EDE correspondente. Esses m etodos baseiam-se na classica ca o das duas fronteiras r1 e r2 + (com r1 < r2 ) do espa co de estados. de velocidade m( ) = onde 0 e um ponto arbitr ario do interior do espa co de estados, pelo que estas fun c oes est ao denidas a menos de uma constante multiplicativa. As fun coes de escala e de velocidade, Para tal usam-se as densidades de escala s( ) = exp
1 s( )b( ) , 2a( ) 0 b( d
179
denidas a menos de constantes aditiva e multiplicativa, s ao S (x) = x x s ( ) d e M ( x ) = m ( ) d , com x escolhido arbitrariamente no 0 x0 x0 interior do espa co de estados. Elas denem as medidas de escala e de velocidade S (c, d] = S (d) S (c) e M (c, d] = M (d) M (c). Verica-se Se r1 < a < x < b < r2 e partirmos de X (0) = x, obtemos (ver Sec c ao 11.2) equa c oes diferenciais ordin arias para certos funcionais do tempo de Markov Ta,b = min{Ta , Tb } (tempo de primeira sa da do intervalo (a, b), onde Ty = inf {t 0 : X (t) = y } e o tempo de primeira passagem por y ). Em particular, resolvendo a equa c ao apropriada, mostr amos que (x)S (a) (probabilidade u(x) = Px [Tb < Ta ] := P [Tb < Ta |X (0) = x] = S S (b)S (a) de a primeira sa da de (a, b) ser no ponto b). Daqui resulta que, para r1 < x < b < r2 , vem Px [Tr1 < Tb ] = 0, isto e, a fronteira r1 e n aoatractiva, sse S (r1 , b] = + (ou seja, sse s(x) e n ao integr avel numa vizinha ca de r1 ). Conclus ao semelhante pode tirar-se para a fronteira r2 . Pode provar-se que as fronteiras n ao-atractivas n ao s ao ating veis nem em tempo nito nem no limite quando t +. Caso ambas as fronteiras sejam n ao-atractivas, a probabilidade e empurradapara o interior do espa co de estados e h a esperan ca de que exista densidade estacion aria. De facto assim sucede desde que tamb em m(x) r seja integr avel, isto e M = r12 m( )d < +, vindo para densidade estacion aria p(y ) = m(y )/M (r1 < y < r2 ), express ao que se obt em usando a equa c ao de Kolmogorov progressiva. Neste caso, o processo e tamb em erg odico, isto e certos momentos da solu c ao podem ser estimados usando os correspondentes momentos amostrais ao longo de uma u nica traject oria do processo, o que e extremamente u til pois, em muitas aplica c oes, como as nanceiras, s o temos uma traject oria observada e n ao podemos fazer o tempo andar para tr as e repetir a experi encia com outros cen arios de mercado. O estudo que z emos na Sec c ao 11.2 sobre tempos de primeira passagem foi utilizado num exemplo para estudar a extin c ao de popula c oes (ver Sec c ao 11.4). O teorema de Girsanov foi tratado no Cap tulo 12 e permite mudar o coeciente de tend encia numa EDE dX (t) = f (X (t))dt + g (X (t))dW (t) (t [0, d]) para outro coeciente f . Isso tem particular vantagem quando se muda para um coeciente nulo, pois uma EDE da forma dY (t) = 0dt + g (Y (t))dW (t) (t [0, d]) com Y (0) = x tem como solu c ao t c ao integranda estiver em Y (t) = x + 0 g (Y (t))dW (t), que, se a fun H 2 [0, d], e, devido ` as propriedades do integral estoc astico, uma martingala. A vantagem de uma martingala e que o seu valor em qualquer instante pode ser obtido como uma esperan ca matem atica condicional que, se h(x) e de classe C 2 , vem Dh(x) =
d 1 2 dM (x) dh(x) dS (x)
180
do seu valor no instante terminal d e h a aplica c oes nanceiras em que isso e muito u til. Para mudar o coeciente de tend encia de f para f sem alterar a solu c ao precisamos de alterar o processo de Wiener. Por em, ao faz e-lo, este deixa de ser processo de Wiener relativamente ` a probabilidade inicial P , mas existe uma outra probabilidade P equivalente a P relativamente ` a qual o processo alterado passa a ser um processo de Wiener. Temos uma nova EDE com respeito a um novo processo de Wiener num novo espa co de probabilidade. O leitor dever a consultar o enunciado do Teorema da Sec c ao 12.2 para ver os pormenores deste procedimento. No Cap tulo 13 estuda-se a c elebre f ormula de Black-Scholes para uma op c ao europeia de compra, mas julgamos prefer vel n ao apresentar aqui um resumo e remeter o leitor para a leitura do pr oprio Cap tulo. Outras aplica c oes nanceiras s ao tamb em mencionadas, embora muito sucintamente. Ao longo deste texto fomos dando indica c oes para o leitor interessado noutros t opicos importantes que a natureza introdut oria deste trabalho n ao permite tratar. Mas outras areas como o c alculo de Malliavin ou as equa c oes ` as derivadas parciais estoc asticas s ao desenvolvimentos relativamente recentes extremamente promissores. As EDE t em tamb em grande import ancia no estudo te orico de certas equa c oes diferenciais parciais. Em termos de aplica c oes, demos apenas alguns exemplos em areas cient cas nuito delimitadas, principalmente nas areas nanceiras e de din amica de popula c oes, mas e rara a area cient ca e tecnol ogica onde modelos baseados em EDE n ao tenham sido aplicados. Mesmo nas areas focadas, apenas abord amos algumas das muitas quest oes que t em sido tratadas. Por exemplo, a n vel nanceiro, n ao trat amos as op c oes americanas, n ao consider amos a inu encia de dividendos e custos de transac c ao, nem o caso em que a volatilidade (e, portanto, o coeciente de difus ao) pode ser ela pr opria perturbada por um ru do. O caso de processos n ao cont nuos, em que se admitem tamb em saltos poissonianos para modelar ocasionais cat astrofes, n ao foi aqui estudado, embora tenha bastante interesse em diversas aplica c oes. O estudo que z emos das EDE e de car acter introdut orio, mas procura proporcionar ao leitor uma entrada neste mundo, fornecendo-lhe alguns dos instrumentos mais relevantes para a utiliza ca o das EDE em modela c ao.
Refer encias
[1] Alvarez, L. H. R. (2000). On the option interpretation of rational harvesting planning. J. Mathematical Biology 40: 383-405. [2] Alvarez, L. H. R. e Shepp, L. A. (1997). Optimal harvesting in stochastically uctuating populations. J. Mathematical Biology 37: 155-177. [3] Arnold, L. (1974). Stochastic Dierential Equations. Theory and Applications. Wiley, New York. [4] Bachelier, L. (1900). Th eorie de la speculation. Annales Scientiques de lEcole Normal Sup erieure 3 eme S erie 17: 21:88. [5] Basawa, I. V. e Prakasa Rao, B. L. S. (1980) Statistical Inference for Stochastic Processes. Academic Press, Londom. [6] Black, F. e Scholes, M. (1973). The pricing of options and corporate liabilities. J. Political Economy 81: 637-654. [7] Bouleau, N. e L epingle, D. (1994) Numerical Methods for Stochastic Processes. Wiley, New York. [8] Braumann, C. A. (1983). Population growth in random environments. Bull. Mathematical Biology 45: 635-641. [9] Braumann, C. A. (1983). Population extinction probabilities and methods of estimation for population stochastic dierential equation models. Em Nonlinear Stochastic Problems (Bucy, R. S. e Moura, J. M. F., eds.), p. 553-559, D. Reidel, Dordrecht. [10] Braumann, C. A. (1985). Stochastic dierential equation models of sheries in an uncertain world: extinction probabilities, optimal shing eort, and parameter estimation. Em Mathematics in Biology and Medicine (Capasso, V., Grosso, E. e Paveri-Fontana, L. S., eds.), p. 201-206, Springer, Berlin. [11] Braumann, C. A. (1993). Model tting and prediction in stochastic population growth models in random environments. Bull. Intl. Statistical Institute LV-CP1: 163-164. [12] Braumann, C. A. (1993). General models of shing with random growth parameters. Em Mathematics Applied to Biology and Medicine (Demongeot, J. e Capasso, V., eds.), p. 155-161, Wuerz, Winnipeg.
181
182
Refer encias
[13] Braumann, C. A. (1996). Estima c ao de par ametros em modelos de crescimento e pesca em ambientes aleat orios. Em Bom Senso e Sensibilidade, Traves Mestras da Estat stica (Branco, J., Gomes, P. e Prata, J., eds.), p. 103-107, SPE e Edi c oes Salamandra, Lisboa. [14] Braumann, C. A. (1997). Parameter estimation in population growth and shing models in random environments. Bull. Intl. Statistical Institute LVII-CP1: 21-22. [15] Braumann, C. A. (1999). Comparison of geometric Brownian motions and applications to population growth and nance. Bull. Intl. Statistical Institute LVIII-CP1: 125-126. [16] Braumann, C. A. (1999). Applications of stochastic dierential equations to population growth. Em Proceedings of the Ninth International Colloquium on Dierential Equations (Bainov, D., ed.), p. 47-52, VSP, Utrecht. [17] Braumann, C. A. (1999). Variable eort shing models in random environments. Mathematical Biosciences 156: 1-19. [18] Braumann, C. A. (2001). Crescimento de popula c oes em ambiente aleat orio: generaliza c ao a densidades de ru do dependentes da densidade da popula c ao. Em A Estat stica em Movimento (Neves, M. M., Cadima, J., Martins, M. J. e Rosado, F., eds.), p. 119-128, Edi c oes SPE. [19] Braumann, C. A. (2002). Variable eort harvesting models in random environments: generalization to density-dependent noise intensities. Mathematical Biosciences 177&178: 229-245. [20] Braumann, C. A. (2003). Modeling population growth in random environments: Ito or Stratonovich calculus? Bull. Intl. Statistical Institute LX-CP1: 119-120. [21] Braumann, C. A. (2005). Ito or Stratonovich calculus in random population growth. Mathematical Biosciences (no prelo). [22] Capocelli, R. M. e Ricciardi, L. M. (1974). A diusion model for population growth in a random environment. Theoretical Population Biol. 5: 28-41. [23] Carlos, C. e Braumann, C. A. (2005). Tempos de extin c ao para popula c oes em ambiente aleat orio. Em Estat stica Jubilar (Braumann, C. A., Infante, P., Oliveira, M. M., Alp zar-Jara, R. e Rosado, F., eds.), p. 133-142, Edi c oes SPE. [24] Clark, J. M. C. (1966). The Representation of Nonlinear Stochastic Systems with Applications to Filtering, Ph. D. Thesis. Imperial College, London. [25] Cox, D. R. e Miller, H. D. (1965). The Theory of Stochastic Processes. Chapman and Hall, London. [26] Dacunha -Castelle, D. e Florens-Zmirou, D. (1986). Estimators of coecients of a diusion from discrete observations. Stochastics 19: 263-284.
183
[27] Dennis, B. e Patil, G. P. (1984). The gamma distribution and weighted multimodal gamma distributions as models of population abundance. Mathematical Biosciences 68: 187-212. [28] Einstein, A. (1956). Investigations on the Theory of Brownian Movement. Dover, New York. [29] Feldman, M. W. e Roughgarden, J. (1975). A populations stationary distribution and chance of extinction in a stochastic environment with remarks on the theory of species packing. Theoretical Population Biol. 7: 197-207. [30] Fleming, W. H. e Rishel, R.W. (1975). Deterministic and Stochastic Optimal Control. Springer, New York. [31] Freedman, D. (1983). Brownian Motion and Diusion. Springer, New York. [32] Gard, T. C. (1988). Introduction to Stochastic Dierential Equations. Marcel Dekker, New York. [33] Gikhman, I. I. e Skorohod, A. V. (1969). Introduction to the Theory of Random Processes. W. B. Saunders, Philadelphia. [34] Gikhman, I. I. e Skorohod, A. V. (1972). Stochastic Dierential Equations. Springer, Berlin. [35] Gray, A. H. (1964). Stability and Related Problems in Randomly Excited Systems, Ph. D. Thesis. California Institute of Technology Press. [36] It o, K. (1951). On Stochastic Dierential Equations. American Mathematical Society Memoirs No. 4, New York. [37] Karatzas, I. e Shreve, S. E. (1991). Brownian Motion and Stochastic Calculus, 2nd. edition. Springer, New York. [38] Karatzas, I. e Shreve, S. E. (1998). Methods of Mathematical Finance. Springer, New York. [39] Karlin, S. e Taylor, H. M. (1981). A Second Course in Stochastic Processes. Academic Press, New York. [40] Khashminsky, R. Z. (1969). Ustoychivost Sistem Dientsualnykh Uraveniy pri Sluchaynykh Vozmushcheniyskh (em russo), Estabilidade de Sistemas de Equa c oes Diferenciais na Presen ca de Perturba c oes Aleat orias. Nauka Press, Moscovo. [41] Kloeden, P. E. e Platen, E. (1992). Numerical Solution of Stochastic Differential Equations. Springer, Berlin. [42] Kloeden, P. E., Platen, E. e Schurz, H. (1994). Numerical Solution of SDE Through Computer Experiments. Springer, Berlin. [43] K uchler, U. e Srensen, M. (1997). Exponential Families of Stochastic Processes. Springer, New York. [44] Lungu, E. e ksendal, B. (1997). Optimal harvesting from a population in a stochastic crowded environment. Mathematical Biosciences 145: 47-75.
184
Refer encias
[45] May, R. M. (1973). Stability in randomly uctuating versus deterministic environments. American Naturalist 107: 621-650. [46] May, R. M. (1974). Stability and Complexity in Model Ecosystems (2nd edition). Princeton University Press, New Jersey. [47] May, R. M. e MacArthur, R. H. (1972). Niche overlap as a function of environmental variability. Proc. Natl. Acad. Sci. USA 69: 1109-1113. [48] McKean, H. P. (1969). Stochastic Integrals. Academic Press, New York. [49] Merton, R. (1971). Optimum consumption and portfolio rules in a continuous time model. J. Economic Theory 3: 373-413. [50] Merton, R. (1973). Theory of rational option pricing. Bell J. Economics and Management Science 4: 141-183. [51] ksendal, B. (2003). Stochastic Dierential Equations. An Introduction with Applications (sixth edition). Springer, Berlin. [52] Rudin, W. (1974). Real and Complex Analysis (second edition). McGrawHill, New York. [53] Schuss, Z. (1980). Theory and Applications of Stochastic Dierential Equations. John Wiley & Sons, New York. [54] Stratonovich, R. L. (1966). A new representation of stochastic integrals and equations. SIAM J. Control 4: 362-371. [55] Stroock, D. W. e Varadhan, S. R. S. (1979). Multidimensional Diusion Processes. Springer, Berlin. [56] Tuckwell, H. C. (1974). A study of some diusion models of population growth. Theoretical Population Biol. 3: 345-357. [57] Turelli, M. (1978). A reexamination of stability in randomly varying environments with comments on the stochastic theory of limiting similarity. Theoretical Population Biol. 13: 244-267. [58] Uhlenbeck, G. E. e Ornstein, L. S. (1930). On the theory of Brownian motion. Physical Review 36: 823-841. [59] Wong, E. e Hajek, B. (1985). Stochastic Processes in Engineering Systems. Springer, New York. [60] Wong, E. e Zakai, M. (1965). The oscillationms of stochastic integrals. Z. Wahrscheinlichkeitstheorie verw. Geb., 4: 103-112. [61] Wong, E. e Zakai, M. (1969). Riemann-Stieltjes approximation of stochastic integrals. Z. Wahrscheinlichkeitstheorie verw. Geb., 12: 87-97.
Indice Remissivo
acaso, 8, 9, 13 acontecimentos, 7, 8 acontecimentos independentes, 32 aditividade- , 7, 56 aleatoriedade ambiental, 99 aleatoriedade demogr aca, 99 algebra- , 7 algebra- de Borel, 9 algebra- gerada, 9 algebras- independentes, 32 arbitragem, 152, 170 atomos, 10 Bachelier, 2 Black, 3, 26, 150 Brown, 1 c alculo de It o, 72 c alculo de Stratonovich, 77, 78 call option, 150 capacidade de sustento do meio, 130 caracteriza c ao de L evy, 35, 148 cen ario do mercado, 8, 13, 26 classes de equival encia, 10 coeciente de difus ao, 42 coeciente de tend encia, 42 com probabilidade um, 10 condi c ao de Lipschitz, 84 condi c ao de Lipschitz local, 94 condi c ao de Novikov, 144, 171 conjunto de ndices, 13 conjunto mensur avel, 7 185 conjunto negligenci avel, 9 conjunto universal, 7 continuidade em m edia quadr atica, 55 converg encia com probabilidade um, 69 converg encia em distribui c ao, 46 converg encia em m edia quadr atica, 35, 69 converg encia em probabilidade, 69 converg encia quase certa, 35, 69 cota c ao de ac c ao, 26, 99 covari ancia, 11 Cox, 164 crescimento populacional, 25, 99, 130 crit erio de Kolmogorov, 17 data de expira c ao, 151, 167 densidade com respeito a uma medida, 138 densidade de equil brio, 46 densidade de escala, 122 densidade de transi c ao, 23 densidade de velocidade, 122 densidade espectral, 18 densidade estacion aria, 46, 119, 127, 129 densidade invariante, 46 derivada de Radon-Nikodym, 138, 140 desigualdade de Gronwall, 87
186 desigualdade de Schwarz, 66 desigualdade de Tchebyshev, 70 desigualdades maximais das martingalas, 19 difus ao de It o, 96, 111, 118 distribui c ao estacion aria, 119 distribui c ao gama, 132 distribui c ao normal, 10, 27 distribui c ao normal multivariada, 11 distribui c ao transiente, 119 distribui c oes de dimens ao nita, 15 dom nio do operador innit esimal, 112 Dynkin, 4 Einstein, 2, 27, 117 equa c ao ` as diferen cas estoc astica, 26 equa c ao de difus ao, 45 equa c ao de Fokker-Planck, 45 equa c ao de It o, 102 equa c ao de Kolmogorov progressiva, 45, 102 equa c ao de Kolmogorov regressiva, 43, 112, 113 equa c ao de ordem superior, 97 equa c ao de Stratonovich, 78, 102, 105 equa c ao diferencial estoc astica, 1, 26, 51, 83, 84 equa c ao diferencial estoc astica aut onoma, 96, 100, 111 equa c ao diferencial estoc astica multidimensional, 80, 97 equa c ao do calor, 47 equa c ao integral estoc astica, 52, 84 equa c oes de Chapman-Kolmogorov, 23 escala natural, 123 espa co amostral, 7
Indice remissivo espa co de Banach, 11 espa co de estados, 15 espa co de Hilbert, 11, 56 espa co de medida, 56 espa co de probabilidade, 7 espa co de probabilidade completo, 8 espa co mensur avel, 7 espa co mensur avel produto, 17 espa cos-Lp, 10, 11 esperan ca matem atica, 10, 11 esperan ca matem atica condicional, 12 estado da natureza, 8, 26 estimadores de m axima verosimilhan ca, 103 estrat egia autonanciada, 153 estrat egia de protec c ao, 158 estrat egia de transac c ao, 152 estrat egia hedging, 157, 162 exist encia, 84 extin c ao de popula c ao, 101 extin c ao matem atica, 132 extin c ao realista, 133 Feynman, 4 ltra c ao, 18 ltra c ao n ao-antecipativa, 55 ltra c ao natural, 18 formula de Black-Scholes, 156 formula de Dynkin, 113 formula de Feynman-Kac, 114 formula de It o, 72, 100 formula de It o multidimensional, 81 fronteira ating vel, 127 fronteira atractiva, 126 fronteira n ao-atractiva, 126 fun c ao caracter stica, 10 fun c ao de auto-covari ancia, 18, 29 fun c ao de distribui c ao, 9
Introdu c ao ` as EDE e aplica c oes fun c ao de distribui c ao conjunta, 11 fun c ao de distribui c ao espectral, 18 fun c ao de distribui c ao impr opria, 20 fun c ao de escala, 122 fun c ao de velocidade, 122 fun c ao delta de Dirac, 29 fun c ao densidade de probabilidade, 9, 11 fun c ao em escada, 57 fun c ao indicatriz de um conjunto, 10 fun c ao integranda com valores matriciais, 80 fun c ao massa de probabilidade, 9 fun c ao mensur avel, 8, 62 fun c ao n ao-antecipativa, 55, 57 fun c ao simples, 10 Girsanov, 5 iguais com probabilidade um, 10 incremento, 26 incrementos estacion arios, 32 incrementos independentes, 32 incrementos n ao-correlacionados, 68 independ encia, 32 integral como aplica c ao cont nua, 60, 61 integral como aplica c ao linear, 59, 61 integral de fun c ao em escada, 57 integral de It o, 53, 55, 60, 84, 100 integral de It o como fun c ao do limite superior de integra c ao, 65 integral de It o de fun c ao cont nua m.q., 55, 62
187 integral de It o de fun c ao determin stica, 62 integral de It o multidimensional, 80 integral de Lebesgue, 10 integral de Riemann-Stieltjes, 52 integral de Stratonovich, 55, 78 integral n ao-antecipativo, 53 It o, 1 Kac, 4 lei do arcoseno, 39 lei do logaritmo iterado, 36 lei forte dos grandes n umeros, 36 lema de Bellman-Gronwall, 87 lema de Borel-Cantelli, 64, 67 Levy , 2, 31 limiar de extin c ao, 133 martingala, 19, 66 matriz de vari ancia-covari ancia, 11 maximo do processo de Wiener, 39 media , 10 media innit esimal, 42 medida, 56 medida absolutamente cont nua, 138 medida de escala, 122 medida de Lebesgue, 9, 56 medida de velocidade, 122 medida nita- , 138 medida martingala equivalente, 161, 170 mercado, 169 mercado completo, 170 mercado normalizado, 169 Merton, 2, 150 modelo binomial, 164 modelo CRR, 164 modelo de Black-Scholes, 26, 51, 99, 129, 151
188 modelo de Cox-Ingersoll-Ross, 119 modelo de Cox-Ross-Rubinstein, 164 modelo de Ornstein-Uhlenbeck, 117 modelo de Pearl-Verhulst, 130 modelo de Vasicek, 118, 129 modelo log stico, 130 modelo malthusiano, 25 momentos amostrais, 46 momentos de conjunto, 46 momentos innit esimais, 42 movimento browniano, 1, 27, 31, 117 movimento browniano com tend encia, 43, 47, 139 movimento browniano geom etrico, 100 n ao-arbitragem, 152 Nikodym, 138 norma-Lp, 11 norma-L2, 56, 80 op c ao, 149 op c ao americana, 150 op c ao ating vel, 170 op c ao de compra, 150 op c ao de venda, 150 op c ao europeia, 150 op c ao europeia de compra, 151 op c ao europeia de venda, 167 operador de difus ao, 43, 112 operador innit esimal, 112 Ornstein, 1 Ornstein-Ulhenbeck, 1 passeio aleat orio, 34 portfolio, 152, 169 portfolio admiss vel, 170 portfolio autonanciado, 170 portfolio hedging, 170 posi ca o curta, 151
Indice remissivo posi c ao longa, 151 pre co de mercado do risco, 160 preserva c ao da norma, 60, 61 probabilidade, 7 probabilidade condicional, 12 probabilidade de extin c ao, 133 probabilidades de transi c ao, 23 probabilidades equivalentes, 138, 142 problema de Cauchy, 51 processo adaptado a uma ltrac ao, 19 processo cont nuo, 16 processo cont nuo em m edia quadr atica, 18 processo de difus ao, 41 processo de difus ao homog eneo, 42, 44, 45 processo de difus ao multidimensional, 48 processo de It o, 71 processo de It o multidimensional, 81 processo de Markov, 21, 22 processo de Markov forte, 24, 37, 96 processo de Markov homog eneo, 23 processo de Ornstein-Uhlenbeck, 118 processo de Wiener, 32, 42 processo de Wiener multidimensional, 39 processo de Wiener padr ao, 27, 31 processo erg odico, 46, 119, 129 processo estacion ario, 18 processo estacion ario de segunda ordem, 18 processo estacion ario em sentido lato, 18 processo estoc astico, 13 processo estoc astico em tempo
Introdu c ao ` as EDE e aplica c oes cont nuo, 13 processo estoc astico em tempo discreto, 13 processo estoc astico estritamente estacion ario, 18 processo estoc astico generalizado, 29 processo estoc astico multidimensional, 17 processo gaussiano, 18 processo mensur avel, 17 processo regular, 120 processo separ avel, 16, 17 processos com traject orias id enticas, 16 processos estoc asticos equivalentes, 16 produto interno, 11, 57, 80 propriedade de compatibilidade, 15 propriedade de Markov, 22 propriedade de Markov forte, 24 propriedade de simetria, 15 put option, 150 quase certamente, 10 Radon, 138 regra da cadeia, 72 regra de diferencia c ao de uma fun c ao composta, 72 restri c ao ao crescimento, 84 revers ao para a m edia, 118 Ross, 164 Rubinstein, 164 ruido branco, 30 ruido branco em tempo discreto, 29 ruido branco padr ao, 29 ruido branco padr ao em tempo discreto, 139 ruido colorido, 29 Scholes, 2, 3, 26, 150
189 sistema de equa c oes diferenciais estoc asticas, 80 sistema de equa c oes integrais estoc asticas, 80 solu c ao de equa c ao diferencial estoc astica, 51, 84 solu c ao forte, 95 solu c ao fraca, 95 solu c ao fundamental, 44, 45 somas de Riemann-Stieltjes, 52 Stratonovich, 4 subespa co denso, 63 submartingala, 19 sucess ao aproximadora, 60, 63, 68 supermartingala, 19 taxa de crescimento per capita, 25 taxa de juro, 25, 118 taxa de rendimento, 25 taxa intr nseca de crescimento, 130 taxa m edia aritm etica de rendimento, 109 taxa m edia geom etrica de rendimento, 109 tempo de extin c ao, 133 tempo de Markov, 20 tempo de paragem, 20 tempo de primeira passagem, 20, 38, 133 teorema da extens ao de Kolmogorov, 15 teorema de Fubini, 56 teorema de Girsanov, 160 teorema de It o, 72, 73, 81 teorema de Lusin, 64 teorema de Radon-Nikodym, 12, 138 teste de Feller, 97 traject oria, 13 traject orias cont nuas, 67
190 transformada de Fourier, 18, 29 Uhlenbeck, 1 unicidade, 84 unicidade forte, 95 unicidade fraca, 95 universo, 7 valor de exerc cio, 151, 167 valor esperado, 10 valor m edio, 10 varia c ao ilimitada, 35 varian cia, 10 varian cia innit esimal, 42 variav eis aleat orias independentes, 32 variav eis aleat orias equivalentes, 10 variav eis aleat orias quase iguais, 10 variav el aleat oria, 8 variav el aleat oria absolutamente cont nua, 9 variav el aleat oria discreta, 9 variav el aleat oria estendida, 20 variav el aleat oria gaussiana, 10 variav el aleat oria multidimensional, 11 variav el aleat oria normal, 10 vector aleat orio, 11 vector aleat orio absolutamente cont nuo, 11 vector aleat orio discreto, 11 vector aleat orio gaussiano, 11 vector aleat orio normal, 11 vector m edio, 11 vers ao de um processo estoc astico, 16 vers ao separ avel, 17 volatilidade, 27, 99 Wiener, 2, 31
Indice remissivo

Introdução As EDP Estocásticas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Introdução As EDP Estocásticas

Enviado por

Direitos autorais:

Formatos disponíveis

XIII Congresso Anual da Sociedade Portuguesa de Estat stica Ericeira, 28 de Setembro a 1 de Outubro de 2005

o a ` s Equa es Introdu ca co Diferenciais sticas e Estoca es Aplica co

` Manuela A ` mem A oria dos meus Pais

Cap tulo 1 - Introdu c ao

Introdu c ao ` as EDE e aplica c oes

Cap tulo 1 - Introdu c ao

Introdu c ao ` as EDE e aplica c oes

Revis ao de probabilidades e processos estoc asticos

Cap tulo 2 - Revis ao

Introdu c ao ` as EDE e aplica c oes

Cap tulo 2 - Revis ao

Cap tulo 2 - Revis ao

Esperan cas matem aticas e probabilidades condicionais

Introdu c ao ` as EDE e aplica c oes

Breve revis ao de processos estoc asticos

ingl es usa-se trajectory ou sample path.

Cap tulo 2 - Revis ao

Introdu c ao ` as EDE e aplica c oes

Cap tulo 2 - Revis ao

Introdu c ao ` as EDE e aplica c oes

Cap tulo 2 - Revis ao

Breve revis ao de processos estacion arios

Filtra c oes, martingalas e tempos de Markov

Introdu c ao ` as EDE e aplica c oes

Cap tulo 2 - Revis ao

Introdu c ao ` as EDE e aplica c oes

Figura 2.3: Tempo de primeira passagem Ta = Ta ( ) para uma traject oria

Cap tulo 2 - Revis ao

Introdu c ao ` as EDE e aplica c oes

P (t, B |s, z )Ps (dz )

p(t, y |u, z )p(u, z |s, x)dz

(s < u < t).

Cap tulo 2 - Revis ao

Uma introdu c ao informal ` as equa c oes diferenciais estoc asticas

Cap tulo 3 - Uma introdu c ao informal ` as EDE

Introdu c ao ` as EDE e aplica c oes

Cap tulo 3 - Uma introdu c ao informal ` as EDE

Figura 3.1: Simula c ao, usando o modelo de Einstein com x0 = y0 = 0 e =

Introdu c ao ` as EDE e aplica c oes

Cap tulo 3 - Uma introdu c ao informal ` as EDE

Introdu c ao ` as EDE e aplica c oes

xi xi1 ) exp (2( ti ti1 )

Introdu c ao ` as EDE e aplica c oes

Algumas propriedades anal ticas

(tn,k tn,k1 ) 2(b a)n 0.

Cap tulo 4 - O processo de Wiener

Introdu c ao ` as EDE e aplica c oes

Tempos de primeira passagem

Cap tulo 4 - O processo de Wiener

Introdu c ao ` as EDE e aplica c oes

Processos de Wiener multidimensionais

Cap tulo 4 - O processo de Wiener

(5.1) (5.2) (5.3)

Nota. A deni c ao mais vulgar e semelhante mas n ao exige nem a con41

Cap tulo 5 - Processos de difus ao

Introdu c ao ` as EDE e aplica c oes

Equa c oes de Kolmogorov

Cap tulo 5 - Processos de difus ao

46 e para condi c ao terminal

Cap tulo 5 - Processos de difus ao

lim p(, y |x) = (x y ).

Introdu c ao ` as EDE e aplica c oes

Cap tulo 5 - Processos de difus ao