Você está na página 1de 89

MODELAGEM DE CONGLOMERADOS DE PERDAS EXTREMAS: ~ EM RESSEGUROS UMA APLICAC AO

Juliana S a Freire de Lima

UFRJ - Mestrado

Beatriz Vaz de Melo Mendes Ph.D.

RIO DE JANEIRO, RJ - BRASIL

2002

ii MODELAGEM DE CONGLOMERADOS DE PERDAS EXTREMAS: ~ EM RESSEGUROS UMA APLICAC AO

Disserta ca ~o submetida ao corpo docente do Departamento de Estat stica do Instituto de Matem atica da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necess arios a obten ca ~o do grau de Mestre.

Aprovada por:

- Orientadora Prof. Beatriz Vaz de Melo Mendes, Ph.D.

Prof. H elio dos Santos Migon, Ph.D.

Prof. Gauss Moutinho Cordeiro, Ph.D.

RIO DE JANEIRO 2002

iii

Beatriz, que me orienta A desde 1997.

Agradecimentos
Agrade co a minha orientadora Beatriz que me ensinou a dar aten ca ~o aos eventos extremos. Aos professores H elio dos Santos Migon e Gauss Moutinho Cordeiro por se disporem a participar da banca examinadora dessa disserta ca ~o. Aos meus pais por todo apoio e pelo valor que me zeram atribuir ao estudo. Reconhe co o quanto minha vida mudou para melhor em fun ca ~o desse esfor co. Ao Alessandro por toda preocupa ca ~o, aten ca ~o, apoio, dedica ca ~o e pela revis~ ao ortogr aca que por m me ajudaram a fechar essa disserta ca ~o. A todos os professores do departamento de estat stica, com quem convivo desde a gradua ca ~o e que me ensinaram o valor do trabalho acad^ emico. Aos amigos da p os-gradua ca ~o da estat stica por todas as gargalhadas que demos nos intervalos de estudo, em especial, a Gabriela, que e excelente companheira de estudo. Ea Lia por ter quebrado os meus galhos na secretaria.

iv

v RESUMO

Lima, Juliana S. F. Modelagem de Conglomerados de Perdas Extremas: Uma Aplica ca ~o em Resseguro. Orientadora: Beatriz Vaz de Melo Mendes. Rio de Janeiro: Departamneto de Estat stica/IM/UFRJ, 2002. Disserta ca ~o.(Mestrado em Estat stica)

Neste trabalho estudamos a distribui ca ~o do montante de excessos de sinistros por ano. Quando existem conglomerados de excessos numa s erie de sinistros, o modelo de riscos homog^ eneos n~ ao permite que estudemos a distribui ca ~o dos excessos separadamente da do n umero de excessos por ano. Propomos encarar o montante como a soma dos excessos agregados a m de contornar uma estrutura de depend^ encia local nos dados. Usamos a sugest~ ao de ajustar uma distribui ca ~o Pareto Generalizada Modicada aos excessos agregados, que e encontrada em Anderson e Dancy [1992] e se baseia na Teoria dos Valores Extremos para s erie estritamente estacion aria. Aplicamos essas id eias a um conjunto de dados de sinistros de uma carteira de inc^ endio com a nalidade de precica ca ~o de resseguro. Comparamos as aproxima co ~es, para a distribui ca ~o do montante de excessos, produzidas pela abordagem dos excessos e pela abordagem dos excessos agregados. Exploramos casos de conglomerados maiores e de excessos acima de limiares mais altos.

vi ABSTRACT

Lima, Juliana S. F. Modelagem de Conglomerados de Perdas Extremas: Uma Aplica ca ~o em Resseguro. Orientadora: Beatriz Vaz de Melo Mendes. Rio de Janeiro: Departamneto de Estat stica/IM/UFRJ, 2002. Disserta ca ~o.(Mestrado em Estat stica)

In this work we study a distribution of the total claim amount per year. When there is excess clusters in a series of claims, the homogeneou risk model does not allow us to study the excesses apart from the number of excesses per year. We propose to face the total excess claim amount as the sum of aggregate excesses within a cluster in order to by-pass a local dependence in data. We use the suggestion to adjust a Modied Generalized Pareto distribution to the aggregate excess which is found in Anderson & Dancy [1992] and is based on the Extreme Values Theory for strictly stationary sequences. We apply these ideas to a set of claim data of re insurance portfolio in order to establish the premium of a reinsurance. We compare approximations for the distribution of the excess approach or by the aggregate excess approach. We explore cases of bigger clusters and excesses over higher thresholds.

Lista de Figuras
2.1 2.2 2.3
Densidades das tr^ es distribui c~ oes padr~ oes de valores extremos. . . . . . . . . . . . 17 Exemplo de densidades GP: Pareto - P1 ; Beta - P0:5 ; Exponencial - P0 . . . . . . 20 Gr aco da fun c~ ao da m edia dos excessos emp rica en (u) de 1000 dados simulados comparado com a correspodente fun c~ ao da m edia dos excessos te orica e(u) (linha cheia): Exponencial com par^ ametro = 13; GPD com par^ ametros = 0; 5; = 5;MGPD com par^ ametros = 0; 3 e = 5 e = 0; 8; e Gama com par^ ametros = 0; 5 e = 0; 05.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.1 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9

Compara c~ ao entre a GPD e a MGPD. Todas as curvas t^ em o par^ ametro = 1. . . 34 S erie de sinistros da carteira de seguro de inc^ endio. . . . . . . . . . . . . . . . . 37 Representatividade das classes de sinistros. . . . . . . . . . . . . . . . . . . . . . 38 Fun ca ~o da m edia dos excessos dos sinistros da carteira de inc^ endio. . . . . . . . . 39 Gr aco no tempo dos excessos (y1 ; : : : ; y216 ). . . . . . . . . . . . . . . . . . . . . 54 Histograma e gr aco da fun c~ ao da m edia dos excessos (y1 ; : : : ; y216 ). Histograma com densidades dos ajustes de (y1 ; : : : ; y216 ).

. . . . . . . 55

. . . . . . . . . . . . . 56

Qq-plot dos ajustes de (y1 ; : : : ; y216 ). . . . . . . . . . . . . . . . . . . . . . . . . 57 Histogramas dos ajustes de (n1 ; : : : ; n11 ). . . . . . . . . . . . . . . . . . . . . . . 58 Gr aco no tempo dos excessos agregados (a1 ; : : : ; a168 ). . . . . . . . . . . . . . . 59

4.10 Histograma e gr aco da fun c~ ao da m edia dos excessos de (a1 ; : : : ; a168 ). . . . . . . 60 4.11 An alise explorat oria da fun ca ~o V da distribui ca ~o (3.7) . . . . . . . . . . . . . . . 61 4.12 Histograma com as densidade dos ajustes de (a1 ; : : : ; a168 ). . . . . . . . . . . . . 63 4.13 Qq-plot dos ajustes de (a1 ; : : : ; a168 ). . . . . . . . . . . . . . . . . . . . . . . . . 63 4.14 Histogramas dos ajustes de (c1 ; : : : ; c11 ). . . . . . . . . . . . . . . . . . . . . . . 64 4.15 Pr^ emios pela abordagem Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4.16 Pr^ emios pela abordagem A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

vii

viii 4.17 Aproxima co ~es para a densidade de S pela abordagem Y . . . . . . . . . . . . . . . 71 4.18 Aproxima co ~es para a densidade de S pela abordagem A. . . . . . . . . . . . . . . 71 4.19 Aproxima co ~es para a densidade de S pelas abordagens Y e A. . . . . . . . . . . . 72 4.20 Histogramas de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). . . . . . . . . . . . . . . . . . 74 4.21 Gr aco da fun c~ ao da m edia dos excessos de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). . . . 74 4.22 Histograma com densidades de (a21 ; : : : ; a2102 ). . . . . . . . . . . . . . . . . . . 76 4.23 Qq-Plots de (a21 ; : : : ; a2102 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4.24 Histogramas com densidades dos ajustes de (a31 ; : : : ; a374 ). . . . . . . . . . . . . 77 4.25 Qq-plots dos ajustes de (a31 ; : : : ; a374 ). . . . . . . . . . . . . . . . . . . . . . . . 77 4.26 Pr^ emios versus probabilidade usando as amostras (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). 78 4.27 Gr aco da densidade de S por (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). . . . . . . . . . 79

4.28 Gr acos de compara c~ ao das aproxima c~ oes para a densidade de S resultantes das
amostras (a1 ; : : : ; a168 ), (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ) usando as distribui c~ oes MGPD e Emp rica para A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.29 Histograma e gr ; : : : ; y15 aco da fun c~ ao da m edia dos excessos de (y1 ). . . . . . . 81 ; : : : ; y15 4.30 Histograma com densidade dos ajustes de (y1 ). . . . . . . . . . . . . . . 82 ; : : : ; y15 4.31 Qq-plot dos ajustes de (y1 ). . . . . . . . . . . . . . . . . . . . . . . . . 82

4.32 Pr^ emios para S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 4.33 Densidades das aproxima co ~es de S . . . . . . . . . . . . . . . . . . . . . . . . . 84

Lista de Tabelas
2.1 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9
Fun ca ~o da m edia dos excessos para algumas distribui c~ oes padr~ oes. . . . . . . . . . 22 Estat sticas descritivas da s erie de sinistros. . . . . . . . . . . . . . . . . . . . . 38 Modelos utilizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Estat sticas descritivas dos excessos (y1 ; : : : ; y216 ). . . . . . . . . . . . . . . . . . 54 Ajustes dos excessos (y1 ; : : : ; y216 ) por m axima verossimilhan ca. . . . . . . . . . . 55 P-valores dos testes da raz~ ao das verossimilhan cas dos ajustes de (y1 ; : : : ; y216 ). . . 56 Crit erio de sele c~ ao de modelos BIC para (y1 ; : : : ; y216 ).

. . . . . . . . . . . . . . 56

Ajuste de (n1 ; : : : ; n11 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Distribui c~ ao emp rica de (n1 ; : : : ; n11 ). . . . . . . . . . . . . . . . . . . . . . . . 58 Estat sticas descritivas de (a1 ; : : : ; a168 ). . . . . . . . . . . . . . . . . . . . . . . 60

4.10 Ajustes de (a1 ; : : : ; a168 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.11 P-valores dos testes da raz~ ao das verossimilhan cas dos ajustes de (a1 ; : : : ; a168 ). . . 62 4.12 Crit erio de sele c~ ao de modelos BIC para (a1 ; : : : ; a168 ). . . . . . . . . . . . . . . 62 4.13 Ajuste de (c1 ; : : : ; c11 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.14 Distribui c~ ao emp rica de (c1 ; : : : ; c11 ). . . . . . . . . . . . . . . . . . . . . . . . 65 4.15 Estat sticas das aproxima co ~es para a distribui ca ~o de S . . . . . . . . . . . . . . . 68 4.16 Pr^ emios das aproxima c~ oes pela normal para a distribui c~ ao de S . . . . . . . . . . 69 4.17 Estat sticas descritivas de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). . . . . . . . . . . . . 73 4.18 Ajustes de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). . . . . . . . . . . . . . . . . . . . . 75 4.19 P-valores dos testes da raz~ ao das verossimilhan cas dos ajustes de (a21 ; : : : ; a2102 )
e (a31 ; : : : ; a374 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.20 Estat sticas das aproxima co ~es da distribui c~ ao de S usando as amostras a2 e a3. . 78
; : : : ; y15 4.21 Estat sticas descritivas de (y1 ). . . . . . . . . . . . . . . . . . . . . . . 80 4.22 Ajustes de (y1 ; : : : ; y15 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.23 Estat sticas das aproxima co ~es para a distribui ca ~o de S . . . . . . . . . . . . . . . 83 ix

Sum ario
1 Introdu c~ ao 2 Teoria dos Valores Extremos 2.1 2.2 2.3 12 14

Resultados Limites para o M aximo . . . . . . . . . . . . . . . . . . . . . . . 15 Resultado Limite para Excessos acima de um Limiar . . . . . . . . . . . . . 19 Fun ca ~o da M edia dos Excessos . . . . . . . . . . . . . . . . . . . . . . . . . 21 24

3 Distribui c~ ao do Excesso Agregado 3.1

Processo de Pontos de Excedentes . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 Indice Extremal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.3 Distribui ca ~o Limite do Excesso Agregado . . . . . . . . . . . . . . . . . . . 30

4 Aplica c~ ao: Resseguro do Tipo Excesso de Danos 4.1 4.2 4.3 35

An alise Explorat oria dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . 37 Modelo de Riscos Homog^ eneos . . . . . . . . . . . . . . . . . . . . . . . . . 40 Modelos e M etodos de Ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.3.1 4.3.2 4.3.3 M etodo da M axima Verossimilhan ca . . . . . . . . . . . . . . . . . . 47 M etodo dos Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Distribui co ~es Emp ricas . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.4

Ajustes das Distribui co ~es . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.4.1 4.4.2 4.4.3 4.4.4 Excessos Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 N umero de Excessos N . . . . . . . . . . . . . . . . . . . . . . . . . 57

Excessos Agregados A . . . . . . . . . . . . . . . . . . . . . . . . . . 59 N umero de Conglomerados C . . . . . . . . . . . . . . . . . . . . . . 63

4.5

Aproxima ca ~o da Distribui ca ~o de S . . . . . . . . . . . . . . . . . . . . . . . 65

xi 4.5.1 4.6 4.7 Apresenta ca ~o dos Resultados . . . . . . . . . . . . . . . . . . . . . . 67

Aumento Articial do Tamanho dos Conglomerados . . . . . . . . . . . . . 72 Excessos Al em de Um Limiar Mais Alto . . . . . . . . . . . . . . . . . . . . 79 85 88

5 Conclus~ ao Refer^ encias

Cap tulo 1

Introdu c~ ao

Um dos principais trabalhos de um atu ario e denir o pr^ emio total que a seguradora precisar a cobrar por sua carteira. Pr^ emio e um valor que se paga antecipadamente ao per odo de vig^ encia da ap olice. Este valor e proposto como sendo o necess ario para cobrir os gastos com indeniza co ~es dos sinistros dos riscos segurados na carteira. A t tulo de curiosidade, a palavra pr^ emio no contexto de seguros n~ ao est a relacionada a qualquer recompensa, mas sim ao fato de que o pr^ emio e aquilo que se paga primeiro, antes de ter o risco segurado. importante fazer distin E ca ~o entre pr^ emio puro e pr^ emio estat stico. O pr^ emio puro e o valor esperado do montante de sinistro at e o m do per odo de vig^ encia da ap olice, neste valor n~ ao est a inclu do o carregamento comercial, que envolve os custos administrativos e o lucro. O pr^ emio estat stico e o pr^ emio puro mais um carregamento de seguran ca que visa cobrir as oscila co ~es dos riscos. No mercado de seguros existe uma grande preocupa ca ~o com o risco de sinistros1 que gerem indeniza co ~es de valores altos. Freq uentemente concentra co ~es desse sinistros est~ ao relacionadas a eventos catastr ocos como furac~ oes, terremotos, enchentes, tempestades etc. Tais eventos podem ter um peso muito grande no montante total de sinistros, que e a soma das indeniza co ~es pagas pela seguradora durante um certo per odo em uma dada carteira. A m de se proteger contra esses infort unios a seguradora faz contrato de resseguro. As t ecnicas trabalhadas nessa disserta ca ~o dizem respeito ao resseguro do tipo excesso de danos. Em contratos desse tipo existe um valor de corte, ou limite de perda, que
1

No contexto de seguros sinistro e o desastre que acontece a um bem segurado e que gera indeniza c~ ao.

12

13 limita o preju zo da seguradora com cada sinistro a esse valor. A resseguradora assume a responsabilidade pelos excessos al em do limite, quer dizer, por cada sinistro que exceder o limite, paga a diferen ca entre seu valor e o limite. Para estabelecer o pr^ emio de tal contrato e preciso estudar a distribui ca ~o do montante anual de excessos de sinistros, ou seja, a soma no ano dos excessos acima do limite. O montante de excessos e na verdade uma soma de um n umero aleat orio de parcelas cujos valores tamb em s~ ao aletat orios. Somas desse tipo s~ ao bem analisadas pela teoria do risco coletivo. Sob a condi ca ~o de parcelas independentes, identicamente distribu das e independentes do n umero de parcelas, o problema de determinar a distribui ca ~o do montante de excessos pode ser dividido em duas partes: estudo do n umero de excessos e estudo dos valores dos excessos. Existe uma boa chance dos sinistros de valores altos ocorrerem em conglomerados no tempo visto que podem estar associados a eventos catastr ocos. Se isto ocorre a hip otese de independ^ encia entre os excessos n~ ao se verica. Para superar este problema, propomos ver o montante de excessos tamb em como a soma dos excessos agregados. Os excessos agregados nada mais s~ ao do que a soma dos excessos que ocorreram em um mesmo conglomerado. Assim o n umero de parcelas do montante de excessos se reduziria ao n umero de conglomerados uma vez que cada concentra ca ~o de sinistros de valores altos se transformaria em uma u nica observa ca ~o. Dessa forma passar amos a trabalhar com uma nova vari avel que n~ ao teria a estrutura de depend^ encia local que existia nos excessos originais. A distribui ca ~o te orica dos excessos agregados e estudada a partir da teoria dos valores extremos para seq u^ encias de vari aveis independentes e identicamente distribu das. No Cap tulo 2 apresentamos um resumo dessa teoria. Em Anderson e Dancy [1992] e obtido um resultado limite para os excessos agregados que se baseia em um processo de pontos de uma seq u^ encia estritamente estacion aria. O Cap tulo 3 mostra o processo de pontos utilizado, os teoremas de interesse a este relacionados, o resultado limite para os excessos agregados e como estes elementos se relacionam. No Cap tulo 4 comparamos o uso dos excessos agregados ao dos excessos no c alculo do pr^ emio de resseguro do tipo excesso de danos numa carteira de inc^ endio. Por m no Cap tulo 5 tecemos nossas conlus~ oes nais a respeito dessa aplica ca ~o.

Cap tulo 2

Teoria dos Valores Extremos


A teoria dos valores extremos estuda as distribui co ~es de vari aveis aleat orias ligadas extensa a literatura a ao comportamento extremo de um processo estoc astico fXi gi2N . E respeito de m aximos, que podem ser: em n observa co ~es, coletados em blocos de tamanho xo, em conglomerados etc. Outra vari avel de interesse para a teoria dos valores extremos ao chamados de s~ ao os excessos acima de um alto limiar u. Os valores Xi tais que Xi > u s~ em do limiar u relacionado a Xij , que e o j- esimo excedente excedentes; e o excesso Yj al e um ponto do processo que de u, e o valor Xij u. Resumindo temos que excedente ultrapassa u e seu excesso e o quanto u foi ultrapassado. Os tempos de ocorr^ encia de excedentes tamb em s~ ao estudados pela teoria dos valores extremos. Esta teoria e uma ferramenta de grande utilidade no campo do seguro. Por exemplo, pode tratar do risco potencial de sinistros de valores altos e inclusive relacion a-los a eventos catastr ocos. Como um segurador deve compensar suas perdas devido a indeniza co ~es de uma determinada carteira com cobran ca de pr^ emios apropriados, um atu ario, antes de tudo, preocupa-se com estimar o pr^ emio estat stico, que e um valor que garante com uma razo avel probabilidade que o montante total de sinistros n~ ao ultrapassar a o montante dos pr^ emios. O montante total de sinistros em um ano e a soma das indeniza co ~es pagas devido a sinistros que foram avisados a seguradora durante o ano em quest~ ao. Se o atu ario n~ ao estuda direito os comportamentos das freq u^ encias e dos valores das indeniza co ~es maiores, ele ca propenso a cobrar caro demais pelo seguro por superestimar as cat astrofes ou cobrar muito pouco por n~ ao conseguir prev^ e-las. Se o pr^ emio estat stico e subestimado e prov avel que a seguradora tenha preju zo com a carteira. Por outro lado, sua superestima ca ~o diminui a competitividade da seguradora e ainda pode levar a um fen^ omeno 14

15 comportamental conhecido por antisele ca ~o, que se caracteriza pela tend^ encia da carteira de atrair e manter maus riscos e espantar os bons riscos. A explica ca ~o para este fen^ omeno e que um indiv duo s o pagar a caro por um seguro se acreditar que a chance de que ocorra um sinistro com seu bem segurado e grande. Esclarecida a import^ ancia de precicar bem uma carteira, o valor de um ferramenta que aumente o conhecimento do comportamento de indeniza co ~es de valores altos se torna evidente. Se uma seguradora n~ ao tem capital suciente para arcar com todo o risco que assumiu ou concluiu que h a vantagem operacional em n~ ao ret^ e-lo todo ent~ ao esta transfere parte do seu risco a outra seguradora por meio de contrato de resseguro. Neste trabalho apresentamos resultados que dizem respeito ao resseguro do tipo excesso de perda, no qual o ressegurador paga o excesso de indeniza ca ~o por cada sinistro que ocorre na carteira ressegurada e que ultrapassa um limite xado. Este cap tulo diz respeito a teoria cl assica de valores extremos que pode ser vista com mais detalhes em Embrechts, Kl uppelberg e Mikosch [1997]. Na primeira se ca ~o temos o resultado central do cap tulo que e o teorema de Fisher e Tippett. Este teorema especica a forma da distribui ca ~o limite para o m aximo centrado e normalizado. As tr^ es fam lias de distribui co ~es limites n~ ao degeneradas poss veis s~ ao conhecidas como distribui co ~es de valores extremos. Uma reparametriza ca ~o leva a uma express~ ao que generaliza estas distribui co ~es: a distribui ca ~o de valores extremos generalizada. Aproxima ca ~o de Poisson e apresentada como uma condi ca ~o necess aria e suciente para validar este teorema e o dom nio de atra ca ~o m aximo e denido. Na segunda se ca ~o caracterizamos o m aximo dom nio de atra ca ~o e por conta deste apresentamos a distribui ca ~o Pareto generalizada como aproxima ca ~o para a distribui ca ~o dos excessos acima de um alto limiar. Na u ltima se ca ~o apresentamos a fun ca ~o da m edia dos excessos que caracteriza uma distribui ca ~o e e base para uma ferramenta gr aca de grande utilidade para o ajuste de modelos a caudas de distribui co ~es.

2.1

Resultados Limites para o M aximo

Neste cap tulo vamos assumir que as vari aveis aleat orias X1 ; X2 ; : : : provindas do processo estoc astico fXi gi2N s~ ao independentes e identicamente distribu das com fun ca ~o de distribui ca ~o F cujo limite superior do dom nio e xF +1. Uma vari avel de interesse no estudo de extremos e o m aximo de n observa co ~es Mn = max(X1 ; :::; Xn ). Podemos

16 determinar a distribui ca ~o exata de Mn de forma muito simples FMn (m) = P (Mn m) = P (X1 m; : : : ; Xn m) = (P (X m))n = (FX (m))n para m 2 R e n 2 N. Cabe comentar que os resultados para o m nimo podem equivalentemente ser obtidos usando a rela ca ~o M in(X1 ; : : : ; Xn ) = max(X1 ; : : : ; Xn ): Em aplica co ~es a dados reais, onde as perdas s~ ao valores negativos, normalmente, multiplicase os dados por (-1) e analisa-se os m aximos. Quando n~ ao se conhece a distribui ca ~o original dos dados F resultados assint oticos para encia sobre o m aximo. a distribui ca ~o de Mn se tornam de grande valia para se fazer infer^
P CP 1 f encia em probabilidade) e Mn ! xF (converg^ encia E acil ver que Mn ! xF (converg^

com probabilidade um). Mais detalhes sobre converg^ encias de vari aveis aleat orias s~ ao encontrados em James [1996]. No entanto estas converg^ encias s o nos auxiliam a determinar o supremo do suporte da distribui ca ~o de Xj . Um resultado mais interessante do ponto de vista da infer^ encia e a converg^ encia em distribui ca ~o para o m aximo centrado e normalizado. O teorema de Fisher e Tippett, que trata dessa converg^ encia, e t~ ao importante para a teoria dos valores extremos como o e o teorema central do limite para a teoria das somas. u^ encia de vari aveis aleat orias inTeorema 2.1 (Fisher e Tippett) Seja fXn g uma seq dependentes e identicamente distribu das. Se existirem seq u^ encias de constantes normalica ~o n~ ao degenerada H tal que zadoras cn > 0 e dn 2 R e uma distribui Mn dn d ! H quando n ! 1; cn ent~ ao H e do tipo de uma das tr^ es fun co ~es de distribui ca ~o abaixo: Gumbel : (x) = expfex g x 2 R 8 < 0; x0 >0 Fr echet : (x) = : expfx g; x > 0 8 < expf(x) g; x 0 Weibull : (x) = <0 : 1; x>0 (2.1) (2.2)

(2.3)

17 As distribui co ~es que est~ ao em 2.1, 2.2 e 2.3 s~ ao chamadas de distribui co ~es de valores extremos. Se incluirmos os par^ ametros de loca ca ~o () e escala (), as fun co ~es de distribui ca ~o de valores extremos cam Gumbel : ; (x) = expfe(x)= g; x 2 R x ; x Fr echet; > 0 : ; (x) = x x : Weibull; < 0 : ; (x) =

O teorema de Fisher e Tippett estabelece que a distribui ca ~o do m aximo normalizado de uma seq u^ encia de vari aveis independentes e identicamente distribu das converge para uma distribuic~ ao de valores extremos ou para uma distribui ca ~o degenerada. Este teorema sugere a utiliza ca ~o destas distribui co ~es para a modelagem de m aximos coletados em blocos do mesmo tamanho quando o tamanho dos blocos, n, e grande. A Figura (2.1) mostra as densidades das tr^ es distribui co ~es padr~ ao de valores extremos.
1.0

Gumbel Frchet Weibull

Densidades

0.0

0.2

0.4

0.6

0.8

-2

0 x

Figura 2.1: Densidades das tr^ es distribui c~ oes padr~ oes de valores extremos.
dn e O teorema nos leva a trabalhar com probabilidades da forma P ( Mn x) que cn

equivalente a P (Mn un ) onde un = cn x + dn . Torna-se de fundamental import^ ancia caracterizar as distribui co ~es F e as seq u^ encias un para as quais o teorema de FisherTippett vale. A condi ca ~o elementar que deve ser satisfeita e a aproxima ca ~o de Poisson.

18 Proposi c~ ao 2.1 (Aproxima c~ ao de Poisson) Dado 2 [0; 1] e uma seq u^ encia (un ) de n umeros reais, as express~ oes seguintes s~ ao equivalentes: (un ) ! ; 2 [0; 1] nF e P rfMn un g ! e :

As distribui co ~es que satisfazem a aproxima ca ~o de Poisson t^ em v arias propriedades assit oticas interessantes. Isso nos leva a deni ca ~o do dom nio de atra ca ~o do m aximo que e muito interessante porque se conseguimos mostrar que uma distribui ca ~o pertence a um certo dom nio de atra ca ~o do m aximo ent~ ao podemos contar com uma s erie de propriedades para essa distribui ca ~o.

Deni c~ ao 2.1 (Dom nio de Atra c~ ao do M aximo - DAM) Dizemos que uma vari avel aleat oria X (ou a fun ca ~o de distribui ca ~o F de X ) pertence ao dom nio de atra ca ~o do m aximo da distribui ca ~o de valor extremo H se existem constante cn e dn 2 R tais que
1 c n (Mn dn ) ! H: d

Escrevemos X 2 DAM(H ) (ou F 2 DAM(H )). Por meio da reparametriza ca ~o = 1= os tr^ es tipos de distribui co ~es de valores extremos podem ser vistos como membros de uma u nica fam lia de distribui co ~es: a distribui ca ~o de valores extremos generalizada (GEV). Ou seja, essa reparametriza ca ~o faz com que as distribui co ~es se tornem um modelo cont nuo e unicado.

Deni c~ ao 2.2 (Distribui c~ ao de Valores Extremos Generalizada) Denimos a fun ca ~o de distribui ca ~o H por 8 1 > > expf(1 + y ) g se 6 =0 > < > > > : expf expfygg se = 0 ;

H (y) =

(2.4)

onde 1 + y > 0. Se o par^ ametro de forma = 0, H corresponde a distribui ca ~o Gumbel. A express~ ao para = 0 se justica porque

19

c!1

lim (1 cy) c = ey :

Os casos onde < 0 ou > 0 correspondem respectivamente a s distribui co ~es Weibull ou a Fr echet. A fam lia de loca ca ~o e escala correspondente, H;; , e obtida substituindo-se y por (y )= , para 2 R e > 0 e adaptando os dom nios a essas mudan cas.

2.2

Resultado Limite para Excessos acima de um Limiar


Outra vari avel de interesse para a teoria dos valores extremos proveniente do processo

ao os excessos acima de um alto limiar u que denominamos de Yj . Aqui tamb em fXi gi2N s~ ao independentes e identicamente distribu das com disconsideramos o caso no qual Xi s~ u^ encia de Yj tamb em e de vari aveis independentes e identicamente tribui ca ~o FX . A seq X (u) = 1 FX (u) distribu das com distribui ca ~o que denotamos por Fu . Chamamos de F ca ~o de a fun ca ~o de cauda da distribui ca ~o FX . Podemos escrever Fu em termos da fun distribui ca ~o FX da seguinte maneira: Fu (y) = P rfY y jX > ug = P rfX u y jX > ug FX (u + y ) FX (u) ; para y 0: = X (u) F No entanto, se a distribui ca ~o F n~ ao e conhecida n~ ao conseguimos encontrar Fu com a equa ca ~o acima. Neste caso, precisamos de um resultado assint otico. O teorema a seguir caracteriza o dom nio de atra ca ~o para o m aximo e motiva a deni ca ~o da distribui ca ~o Pareto generalizada e sua utiliza ca ~o como aproxima ca ~o da distribui ca ~o dos excessos acima de altos limiares. Teorema 2.2 (Caracteriza c~ ao do DAM(H )) Para 2 R as seguintes arma co ~es s~ ao equivalentes: (a) F 2 DAM (H ). (b) Existe uma fun ca ~o a() positiva e mensur avel tal que para 1 + x > 0 8 X (u + xa(u)) < (1 + x)1= ; se 6 =0 F lim = : ex ; u"xFX F (u) se = 0

20 O item (b) do teorema 2.2 pode ser reescrito como: 8 < (1 + x)1= ; se 6 =0 X u > xjX > u = lim P r : u"xFX a(u) se = 0 ex ;

(2.5)

Com isso temos uma aproxima ca ~o assint otica para a distribui ca ~o dos excessos acima de um alto limiar u reduzidos do fator de escala a(u) para quando F pertence a algum dom nio de atra ca ~o do m aximo. Note que o par^ ametro que aparece no resultado para o excesso e o mesmo que o que aparece para o m aximo. O teorema 2.2 motiva a deni ca ~o ca ~o e da distribui ca ~o Pareto generalizada (GPD), que denotaremos por P cuja distribui dada por 8 < 1 (1 + y )1= ; se 6 =0 P (y) = : 1 ey ; se = 0

para y 0 se 0 e 0 y 1= se < 0. P0 pode ser interpretada como o limite da P quando ! 0. Podemos considerar a reparametriza ca ~o = 1= e obter tr^ es classes de distribui co ~es que s~ ao: Exponencial quando ! 1; Pareto quando > 0; e Beta quando < 0. A Figura 2.2 ilustra a distribui ca ~o GPD para tr^ es diferentes valores do par^ ametro .
1.0

densidade

0.0

0.2

0.4

0.6

0.8

Pareto Beta Exponencial

2 x

Figura 2.2: Exemplo de densidades GP: Pareto - P1 ; Beta - P0:5 ; Exponencial - P0 . Note que quanto maior mais pesada e a cauda. Temos tamb em que para < 0 o dom nio da distribui ca ~o e nito. A fam lia de loca ca ~o e escala P;; pode ser obtida substituindo-se o argumento y por (y )= , para 2 R; > 0 e adaptando os dom nios a essa mudan ca.

21

2.3

Fun c~ ao da M edia dos Excessos

Qualquer distribui ca ~o F cont nua e unicamente determinada pela sua fun ca ~o da m edia dos excessos e vice-versa. Esta fun ca ~o d a suporte a uma ferramenta gr aca muito u til uma ferramenta de na an alise de dados chamada de gr aco da m edia dos excessos. E f acil utiliza ca ~o que pode ajudar na escolha de um modelo para dados que estejam sendo analisados, em particular aqueles relacionados a excessos porque justamente ajuda na discrimina ca ~o do comportamento de caudas. A seguir denimos a fun ca ~o da m edia dos excessos. Deni c~ ao 2.3 (Fun c~ ao da M edia dos Excessos) Seja X uma vari avel aleat oria com ao limite superior do dom nio xF ent~ e(u) = E (X ujX > u); 0 u < xF ; e chamada de fun ca ~o da m edia dos excessos de X . Um teste gr aco para o comportamento da cauda da distribui ca ~o de uma amostra se baseia na fun ca ~o da m edia dos excessos emp rica en (u). Suponha que X1 ; : : : ; Xn sejam ca ~o independentes e identicamente distribu das com fun ca ~o de distribui ca ~o F e seja Fn a fun de distribui ca ~o emp rica e n (u) = fi : i = 1; : : : ; n; Xi > ug, ent~ ao Z 1 X 1 1 n (y )dy = F en (u) = (Xi u); u 0; cardn (u) Fn (u) u
i2n (u)

com a conven ca ~o de que 0=0 = 0. O gr aco da m edia dos excessos consiste dos pontos
(k ) (k ) ; en (Xn )) : k = 1; : : : ; ng; f(Xn

onde max(Xi ) = Xn Xn X1 ; : : : ; Xn .

(1)

(n )

= min(Xi ) s~ ao as estat sticas de ordem da amostra

Alguns exemplos de distribui co ~es e suas respectivas fun co ~es da m edia dos excessos est~ ao na Tabela 2.1. As fun co ~es de distribui ca ~o s~ ao denidas na Se ca ~o 4.3. Usamos estas fun co ~es da m edia dos excessos para desenhar a Figura 2.3. Nesta gura h a alguns exemplos simulados contrastados com suas fun co ~es da m edia dos excessos te orica.
1 ) que aparece na express~ ao da m edia dos excessos da Gama A rela ca ~o assint otica o( u

signica que, onde esta aparece, h a um termo que e fun ca ~o de u, digamos, t(u) tal que limu!1 ut(u) = 0:

22 ou densidade f Cauda F 1 x x e f (x) = ( ) (x) = ex F (x) = (1 + x= )1= F (x) = 1 + x = 1= F

Distribui ca ~o Gama

Fun ca ~o da M edia dos Excessos 1 1 1 +o 1+ u u 1 + u 1 + u

Exponencial

GPD, > 0

MGPD, > 0

Tabela 2.1: Fun ca ~o da m edia dos excessos para algumas distribui c~ oes padr~ oes. Podemos notar que se FX e a distribui ca ~o Pareto ent~ ao e(u) e fun ca ~o linear de u. Por e a distribui ca ~o Exponencial e(u) n~ ao depende do limiar, ou seja, e outro lado, se FX constante.
MGPD
200 200

GPD

Mdia dos Excessos

Mdia dos Excessos 0 100 200 Limiar 300 400

150

100

50

50 0

100

150

50

100

150 Limiar

200

250

EXP
20 30

GAMA

Mdia dos Excessos

Mdia dos Excessos 0 20 40 Limiar 60 80

15

10

10 0

15

20

25

20

40 Limiar

60

80

Figura 2.3: Gr aco da fun ca ~o da m edia dos excessos emp rica en (u) de 1000 dados simulados
comparado com a correspodente fun c~ ao da m edia dos excessos te orica e(u) (linha cheia): Exponencial com par^ ametro = 13; GPD com par^ ametros = 0; 5; = 5;MGPD com par^ ametros = 0; 3 e = 5 e = 0; 8; e Gama com par^ ametros = 0; 5 e = 0; 05.

Em cada gr aco da Figura 2.3 temos a fun ca ~o da m edia dos excessos de uma das

23 distribui co ~es que consideramos e os pontos de amostras simuladas destas distribui co ~es. O gr aco da m edia dos excessos pode ser usado como ferramenta para distinguir entre modelos com caudas leves e pesadas. Devemos ter cautela ao interpretar tais gr acos e pequeno porque para grandes valores de u o n umero de pontos usados para calcular en (u) o que deixa essa estat stica muito sens vel a varia co ~es nos dados. A fun ca ~o da m edia dos excessos te orica da Gama est a desenhada com a omiss~ ao da
1 ). Ent~ ao a id eia melhor do comportamento da fun ca ~o se d a para rela ca ~o assint otica o( u

os maiores valores de u e e justamente nestes que os valores simulados se aproximam da curva te orica.

Cap tulo 3

Distribui c~ ao do Excesso Agregado

Neste cap tulo estudamos o comportamento da soma dos excessos acima de um alto limiar u em conglomerados, que chamamos de excesso agregado. Em Anderson e Dancy [1992] o excesso agregado de uma vari avel de refer^ encia e apontado como uma razo avel medida da severidade de per odos de turbul^ encia ambiental. No Cap tulo 4 usamos o excesso agregado para determinar a distribui ca ~o do montante de excessos de sinistros. Para uma deni ca ~o mais precisa denotamos o n umero de excedentes dentro do conglomerado i por Ki e tomamos Yij , para j = 1; : : : ; Ki , como os correspondentes excessos e acima de um limiar u. O excesso agregado no i- esimo conglomerado, Ai , 8 P < Ki Yij ; se Ki > 0 j =1 Ai = : 0; se Ki = 0: Por simplicidade, quando e poss vel, retiramos o sub ndice i de Yij e escrevemos Yj para representar uma vari avel aleat oria com a mesma distribui ca ~o de Y . Nesse caso escrevemos K no lugar de Ki e obtemos YK YK correspondentes. Por tratar-se de uma vari avel aleat oria ligada a extremos, o excesso agregado faz parte as do excesso agregado, as da teoria dos valores extremos. No processo fXi gi2N por detr ao s~ ao independentes porque conglomerados de excessos s~ ao formados. Por vari aveis Xi n~ ao satisfazem a s hip oteses do teorema 2.1. Os resultados que usamos est~ ao isso as Xi n~ relacionados a seq u^ encias estritamente estacion arias e est~ ao explicados neste cap tulo.
(1) (K )

como as estat sticas de ordem

24

25 Estamos interessados em encontrar uma aproxima ca ~o assint otica para a distribui ca ~o dos excessos agregados dentro de um conglomerado que reita o tamanho do conglomerado ao temos qualquer e o padr~ ao de depend^ encia entre excessos individuais Yj . Infelizmente, n~ teorema que indique a forma desta distribui ca ~o. Anderson e Dancy [1992], combinando teoria com m etodos gr acos, sugeriram a distribui ca ~o Pareto generalizada modicada para aveis ambientais. Se uma vari avel W a distribui ca ~o dos Ai em problemas envolvendo vari tem distribui ca ~o Pareto generalizada modicada isso signica que para algum > 0 temos ca ~o GPD. No Cap tulo 4 testamos essa distribui ca ~o para modelar que W tem distribui excessos agregados de valores de sinistros e obtemos bons resultados. Uma intui ca ~o para o fato da aproxima ca ~o para A ter rela ca ~o com a GPD e que como A YK , espera-se que A tenha (no limite quando u cresce) cauda t~ ao ou mais pesada do ca ~o 3.3 tem distribui ca ~o Pareto que a da distribui ca ~o limite de YK , que como vemos na Se generalizada quando a distribui ca ~o dos m aximos dos conglomerados pertence ao dom nio de atra ca ~o do m aximo. Na Se ca ~o 3.1 denimos o que e um processo de pontos e mostramos como esta ferramenta pode nos ajudar a encontrar distribui co ~es limites relacionadas a processos estoc asticos. Apresentamos o teorema 3.1 obtido por Hsing [1987] para o processo de pontos de excedentes em que se baseia Anderson e Dancy [1992] para obter a distribui ca ~o limite de A. Na Se ca ~o 3.2 denimos o ndice extremal, que e necess ario para obte ca ~o dos resultados para o excesso agregado que e descrita na Se ca ~o 3.3.
(1) (1)

3.1

Processo de Pontos de Excedentes


T ecnicas de processo de pontos s~ ao de grande valia para a teoria de valores extremos,

porque com estas pode-se obter resultados sobre as estruturas limites relacionadas a extremos de seq u^ encias estacion arias de vari aveis aleat orias. Nesta se ca ~o, apresentamos o teorema de converg^ encia obtido em Hsing [1987] para um certo processo de pontos, teorema este que foi base para Anderson e Dancy [1992] encontrar a distribui ca ~o limite do excesso agregado. Este resultado diz respeito a seq u^ encias estritamente estacion arias. Portanto cabe aqui denir o que e uma seq u^ encia estritamente estacion aria. Deni c~ ao 3.1 (Seq u^ encia Estritamente Estacion aria) Uma seq u^ encia e estritamente estacion aria se suas distribui c~ oes nito-dimensionais s~ ao invariantes sob deslocamento no

26 tempo, ou seja, (Xt1 ; : : : ; Xtm ) = (Xt1 +h ; : : : ; Xtm +h ) para qualquer escolha de ndices t1 ; : : : ; tm e inteiros h.
d

Seja fXi g uma seq u^ encia estritamente estacion aria de vari aveis aleat orias do espa co amostral que podem assumir valores em E . Um processo de pontos M pode ser visto co. Para uma dada congura ca ~o de como uma distribui ca ~o aleat oria de pontos Xi no espa Xi e um dado conjunto B E , M (B ) conta o n e uma fun ca ~o que umero de Xi 2 B . M ca ~o de conjunto1 denida para uma - algebra de leva a vari avel aleat oria Xi em uma fun subconjuntos de E . Ent~ ao cada realiza ca ~o ! do espa co amostral conduz a fun ca ~o de conjunto M (!; ) que conta quantos pontos de ! pertencem a um determinado conjunto. (Para mais detalhes sobre aplica ca ~o de processo de pontos na teoria dos valores extremos ver o Cap tulo 5 de Embrechts, Kl uppelberg, e Mikosch [1997]). Para denir o processo de pontos de excedentes que nos interessa precisamos caracu^ encia de observa co ~es. Denote por terizar as seq u^ encia de fun co ~es un . Seja fXi g uma seq Xn
(1) (n )

Xn

as estat sticas de ordem de X1 ; : : : ; Xn . Suponha que, para cada n,

haja uma fun ca ~o cont nua a esquerda, n~ ao crescente, un , tal que (I)
2 !1
1 !0

lim P fun (2 ) < X1 < un (1 )g = 1

(II) para cada > 0


(1) lim P (Xn un ( )) = e :

n!1

(3.1)

De maneira pouco precisa temos que, para n grande, a fun ca ~o un retorna aproximada probabilidade e . A exist^ encia de un mente o quantil da distribui ca ~o de Xn associado a est a vinculada a distribui ca ~o de Xi pertencer a algum dom nio de atra ca ~o do m aximo.
1 ca ~o inversa de un . Considere uma seq u^ encia de Seja u n = supf > 0 : x un ( )g fun (1)

processos de pontos Mn com pontos


1 (j=n; u n (Xi )):
1

(3.2)

fun ca ~o que leva subconjuntos de E em R [ f+1g

27
1 A equival^ encia fx : u n (x) < g , fx : x > un ( )g nos possibilita obter resultados

encia de Mn . Por exemplo, limites para os extremos de Xi por meio do estudo da converg^ co ~es de Xn ; k = 1; : : : ; n usando os processos de pontos Mn podemos obter as distribui visto que Mn ((0; x) (0; )) k 1 , X[nx] un ( ); ; x > 0; 1 k [nx] onde [] representa a parte inteira. Muitos processos de pontos amostrais, como e o caso do processo de excedentes no qual estamos interessados, convergem em distribui ca ~o para um processo de pontos que envolve um processo de Poisson no espa co. Este processo tamb em e conhecido como medida de Poisson. Deni c~ ao 3.2 (Medida de Poisson) Seja uma medida aleat oria na - algebra B de Borel, isto e, (A) < 1 em conjuntos compactos A. Um processo de pontos M e chamado de medida de Poisson com medida m edia se as seguintes condi co ~es s~ ao satisfeitas: (a) Para A B,
(k) (k)

(3.3)

8 < e(A) (A)k k! P (M (A) = k ) = : 0

se (A) < 1; se (A) = 1;

k 0:

ao conjuntos em B mutuamente disjuntos (b) Para qualquer m 1, se A1 ; : : : ; Am s~ ao vari aveis aleat orias independentes. ent~ ao M (A1 ); : : : ; M (Am ) s~ No caso em que temos (A) = jAj, onde j j e a medida de Lesbegue, chamamos o processo de medida de Poisson homog^ enea de m edia . Mori [1977] determinou que sob uma certa condi ca ~o o limite da seq u^ encia de processos de pontos em 3.2 quando existe tem uma forma espec ca a qual e determinada por um encia de fXi g. processo de Poisson homog^ eneo em R2 e pela estrutura local de depend^ Hsing [1987] generalizou o trabalho de Mori [1977] encontrando uma condi ca ~o sobre a qual se obt em o mesmo resultado de converg^ encia por em para uma classe substancialmente maior de processos de pontos. A condi ca ~o e o teorema de converg^ encia do processo de pontos s~ ao descritos a seguir.

28 Deni c~ ao 3.3 (Condi c~ ao ) Seja k e n inteiros. Para cada escolha de 1 ; : : : ; k > 0, e 1 ` n 1 dene-se a fun ca ~o como (n; `; 1 ; : : : ; k ) = maxfjP (GH ) P (G)P (H )j : G 2 F1;s ; H 2 Fs+`;n ; 1 s n `g onde Fij e a - algebra gerada pelos eventos fXs un (m )g; i s j; 1 m k. A condi ca ~o e satisfeita para as observa co ~es fXi g e para a seq u^ encia de fun co ~es un se para cada escolha de inteiros k e n, e 1 ; : : : ; k > 0 (n; [n]; 1 ; : : : ; k ) ! 0 as n ! 1 para cada 2 (0; 1). s u ltimas antes Note que G se refere a s primeiras observa co ~es, X1 ; : : : ; Xs , e H , a ca ~o exige que, de uma certa forma, no limite, de n, Xs+` ; : : : ; Xn . Portanto a condi a depend^ encia entre as observa co ~es s o se d^ e localmente. Obviamente a condi ca ~o e satisfeita se as observa co ~es Xi forem independentes. Teorema 3.1 Seja fXi g uma seq u^ encia de vari aveis aleat orias estritamente estacion aria

u^ encia de fun co ~es em R0 e fun g uma seq + = (0; 1) para a qual (3.1) se verica. Suponha que a condi ca ~o e satisfeita para fXi g e fun g e que o processo de pontos Mn := X
i2I

(i=n;u 1 n (Xi ))

converge em distribui ca ~o para algum processo de pontos M , onde Mn e M s~ ao processos de pontos em R R0 + e 8 < 1 se (x; y) 2 A; (x;y) (A) = A 2 B: : 0 se (x; y) 2 = A;
Ki 1 X X i=1 j =1

Ent~ ao M tem a representa ca ~o (Ri ;Ti Zij ) ;

onde (Ri ; Ti ) s~ ao pontos de um processo de pontos, , Poisson homog^ eneo de m edia um em ao pontos de um processo de pontos i em [1; 1) com Zi1 = 1. R R0 + e Zij ; 1 j Ki , s~ ao identicamente distribu dos e ; 1 ; 2 ; : : : s~ ao mutualmente Al em disso, 1 ; 2 ; : : : s~ independentes.

29 Uma interpreta ca ~o do resultado de converg^ encia e que grandes valores de Xi ocorrem em conglomerados. O processo limite M pode ser imaginado como uma cole ca ~o de colunas de pontos no primeiro quadrante do plano onde cada coluna corresponde a um conglomerado. Os pontos da base das colunas (Ri ; Ti ) se localizam no plano conforme um processo de Poisson bidimensional. As alturas dos pontos da coluna i s~ ao dadas por Ti ; Ti Zi2 ; Ti Zi3 : : : e decrescente A transforma ca ~o que leva o processo Xi aos pontos do processo de pontos M base da coluna em M e, portanto, um pico de Xi em um conglomerado corresponde a relativa a este conglomerado. Em particular, estamos interessados em conglomerados de fXi g de excedentes de um

1 1 e equivalente a u ao Xi > u ao, no alto limiar u. Seja v = u n (u). Ent~ n (Xi ) < v e ent~

limite, conglomerados de excedentes de u correspondem exatamente a conglomerados no processo de pontos para os quais Ti < v . De (3.3) temos que
(1) P (Xn un ( )) = P (Mn ( (0; 1)x(0; ) ) 1)

e portanto

n!1

(1) lim P (Xn un ( )) = lim P (Mn ( (0; 1)x(0; ) ) 1) = P (M ( (0; 1)x(0; ) ) 1): n!1

Uma vari avel que nos e muito u til no estudo da distribui ca ~o de Ai e o excesso do m aximo dentro do conglomerado i que denotamos por Yi;Ki . O Teorema 3.1 nos informa que sob a condi ca ~o os m aximos dos conglomerados seguem um processo de Poisson, portanto s~ ao independentes e identicamente distribuidos. Logo se a distribui ca ~o desses m aximos pertence a algum dom nio de atra ca ~o do m aximo, ent~ ao os excessos desses m aximos al em de um alto limiar ter~ ao distribui ca ~o limite assint otica GPD.
(1)

3.2

Indice Extremal

Eventos extremos freq uentemente ocorrem em conglomerados causados por depend^ encia local dos dados. Por exemplo, sinistros altos em seguros ocorrem principalmente devido a fura co ~es, tempestades, enchentes, terremotos etc. Como esses sinistros est~ ao ligados a esses eventos e portanto n~ ao ocorrem independentemente. Nestes casos a hip otese do teorema de Fisher-Tippett de observa co ~es independentes n~ ao se verica e para que se possa

30 utilizar o Teorema 3.1 e necess ario modelar a estrutura de depend^ encia local dos dados. Uma forma de fazer esta modelagem e usando o ndice extremal. Deni c~ ao 3.4 ( Indice Extremal) Seja fXn g uma seq u^ encia estritamente estacion aria e 2 [0; 1]. Assuma que para todo > 0 existe uma seq u^ encia fun g tal que
n!1

(un ) = lim nF

n!1

lim P (Mn un ) = e :

Ent~ ao e chamado ndice extremal da seq u^ encia (Xn ). Para inclus~ ao da estrutura de depend^ encia dos dados na modelagem do comportamento extremo dos mesmos, o ndice extremal, , e usado da seguinte forma: P (Mn x) F n (x): Quando temos = 1 voltamos para o caso onde as observa co ~es s~ ao independentes. O caso = 0 e um caso patol ogico sem grande interesse pr atico. Para 2 (0; 1) temos que quanto menor o valor de maior e o grau de depend^ encia dos dados. Uma interpreta ca ~o poss vel para o ndice extremal e de que seu inverso e o tamanho m edio limite dos conglomerados.

3.3

Distribui c~ ao Limite do Excesso Agregado


Quando a estrutura de depend^ encia local das vari aveis pode ser descrita pelo ndice

extremal podemos escrever o excesso agregado em fun ca ~o do resultado limite do processo de pontos de excedentes. Suponha que a seq u^ encia estritamente estacion aria fXi g tem distribui ca ~o marginal F e ndice extremal positivo, . Ent~ ao lim P (Mn un ( )) = lim F n (un ( )):
n!1

n!1

(3.4)

= 1 F . Usando que log (c) ' c 1 se c ' 1 temos que para n grande Seja F (un ( )) log (F (un ( ))): F Logo, segue das equa co ~es 3.1 e 3.4 que para n grande (un ( )) n log (F (un ( ))) : nF

31 Podemos assim denir un ( ) por 1 ( =n): un ( ) = F (u) = v . Em particular n F ca ~o temos que os excessos dentro de um conglomerado, Quando fXi g satisfaz a condi em ordem descrescente, s~ ao no limite YK
(j )

1 (T Zj F (u)=v) u = un (T Zj ) u = F 1 (T 0 Zj F (u)) u; = F j = 1; : : : ; N:

e uniformemente distribu do uniformemente distribu do sobre (0; v ). Portanto T 0 = T =v em (0,1). O excesso agregado para conglomerados em fun ca ~o do processo de pontos limite M e

Segue da natureza do processo de pontos de Poisson unit ario de f(Ri ; Ti )g que Ti e

A=

N X i=1

Yj =

N X i=1

1 (T 0 Zj F (u)) u F

(3.5)

onde N = maxfj : T 0 Zj < 1g e o n umero de excedentes dentro de um conglomerado, e T 0 e independente do processo Zj . Em Anderson e Dancy [1992], assumindo que a distribui ca ~o limite dos excessos dos e GPD, e obtido a partir de 3.5 o resultado descrito no m aximos dos conglomerados YN teorema 3.2. A distribui ca ~o assint otica de A depende parcialmente do processo Z por Qj que e denido como 8 Pj Zj + 1 > > 1 > i=1 > > Zi > < P Zj + 1 j Qj = `og i=1 > Zi > > > > P Zj + 1 > : j i=1 1 Zi
(1)

>0 =0 : <0

Teorema 3.2 (Distribui c~ ao Limite de A) Suponha que a seq u^ encia estritamente estacion aria fXi g satisfaz a condi ca ~o , tem ndice extremal positivo e que a distribui ca ~o e tal que a distribui ca ~o limite dos excessos dos m aximos dentro dos marginal F de Xi conglomerados e GPD com par^ ametro de forma . Suponha tamb em que o processo de

32
1 pontos correspondente, f(i=n; u n (Xi ))g, converge para um processo limite com a estru-

e o limite superior do tura descrita no teorema 3.1. Ent~ ao, quando u ! xF (onde xF dom no de X) temos 8 Pjs i=1 Zi > > E [( )] > s + j s < P

u!xF

lim P

onde as esperan cas s~ ao tomadas com respeito ao processo pontual fZj g e 8 > > u > < >0

>0 js A s+ i=1 `ogZi >a = E [exp( )] = 0 js > (u) P > js > : E [( i=1 Zi )] <0 sjs

(3.6)

(u) =

para uma fun ca ~o ` de varia ca ~o lenta e

(u)) = 0 `(1=F > > > : x u <0 +

js = minfj : Zj +1 = 1 ou Qj sg:

Notamos que a equa ca ~o (3.6) revela de forma razoavelmente expl cita a depend^ encia entre a distribui ca ~o de A e o n umero e o padr~ ao de excessos dentro de um conglomerado. Muitos exemplos foram estudados em Anderson e Dancy [1992] que sugeriram que o excesso agregados poderia ser modelado por uma distribui ca ~o com fun ca ~o de cauda da forma 8 < (1 + sinal( )V (a; ))1= 6 =0 A >a = : exp(V (a; 0)) (u) =0

u!x+

lim P

(3.7)

Nos casos estudados V (a; ) tinha o mesmo formato geral: uma fun ca ~o de a c^ oncava, crescente, dominada por a quando 0 e por minf1; ag quando < 0. O artigo ent~ ao sugere uma estrat egia para explicitar modelos para a distribui ca ~o de A. Da equa ca ~o 3.7 esperamos que k A >a 1 sinal( )V (a; ) se k 6 =0 P (u)

33 e A >a V (a; 0) se k = 0: log P (u) n denota a fun ca ~o de sobreviv^ encia emp rica baseada no excesso agregado das Ent~ ao, se F ^ e uma estimativa do par^ ametro de forma n primeiras observa co ~es a1 ; : : : ; an de A, e k da distribui ca ~o GP do excessos do m aximos dos conglomerados, ent~ ao (assumindo por ^6 enquanto que k = 0)
^

n (a= )]k 1 sinal( )V (a; ): [F

onde e um fator de escala. Seja an a i- esima maior estat stica de ordem da amostra dos excessos agregados, segue que um gr aco de
^ ^ i) k i) n (a( [1 i=n]k 1 = [F 1 vs a( n )] n (i)

(3.8)

poderia indicar, a menos do par^ ametro de escala, a forma emp rica da fun ca ~o V . No artigo foi utilizado um conjunto de dados sobre medidas ligada a enchentes. Chegouse a conclus~ ao de que um modelo Weibull para os excessos da forma

P (A > a) = ea

a>0

para algum > 0 se ajustava bem. Como este modelo nada mais e do que uma distribui ca ~o e um caso especial da GPD, uma extens~ ao natural exponencial para A e a exponencial seria um modelo GPD para A : 8 < (1 a )1= ; se 6 =0 P (A > a) = : exp(a ); se = 0

(3.9)

onde o modelo que havia sido obtido e o caso em que = 0. O modelo descrito em (3.9) e chamado de distribui ca ~o Pareto generalizada modicada que denotamos por MGPD. A Figura 3.1 mostra alguns exemplos de MGPD comparados a GPD. As curvas em pretos que aparecem em todos os gr acos correspondem a GPD. O t tulo de cada gr aco

34 fornece o par^ ametro de forma usado em todas as curvas do gr aco, tanto a da distribui ca ~o GPD quanto as das distribui co ~es MGPD. O par^ ametro de cada curva do respectivo gr aco e identicado na legenda. Note que a GPD n~ ao tem par^ ametro , mas e o caso particular da MGPD quando = 1, por isso o valor 1 aparece nas legendas.

=1
=1 = 0,8 = 0,5 = 0,2 0.8 0.8

= 0,3
=1 = 0,8 = 0,5 = 0,2

densidade

densidade 5

0.4

0.0

2 x

0.0 0

0.4

2 x

=1
=1 = 1,5 =2 = 2,5 0.8 0.8

= 0,3
=1 = 1,5 =2 = 2,5

densidade

densidade 5

0.4

0.0

2 x

0.0 0

0.4

2 x

Figura 3.1: Compara c~ ao entre a GPD e a MGPD. Todas as curvas t^ em o par^ ametro = 1. Nesta gura podemos analisar o efeito do par^ ametro . Temos que tem que ser maior do que 0. Dentre os casos que analisamos, vemos que 0 < 1 leva a densidades convexas, estritamente decrescentes, enquanto que > 1 produz densidades unimodais. A medida que o valor de diminui e como se a curva fosse se encostando no eixo x = 0. Para 0 < 1, medida que o valor de diminui, a curvatura m axima da distribui ca ~o vai cando maior e o ponto onde ela ocorre vai se aproximando de zero. Para > 1, medida que o valor de diminui, a curvatura m axima da distribui ca ~o vai cando menor e o ponto onde ela ocorre tamb em vai se aproximando de zero. A MGPD para < 1 tira peso dos pontos medianos e d a mais peso tanto a cauda inferior como para a cauda superior.

Cap tulo 4

Aplica c~ ao: Resseguro do Tipo Excesso de Danos


Resseguro e o principal mecanismo que seguradoras usam para transferir todo ou parte do risco que assumem. Uma importante modalidade de resseguro e o resseguro do tipo excesso de danos, no qual existe um valor de corte, ou limite de perda, que limita o preju zo da seguradora com cada sinistro a esse valor, ou seja, os excessos de sinistros acima do limite s~ ao repassados a resseguradora. A vari avel aleat oria de interesse para a resseguradora neste contrato e o montante de excessos acima do limite durante o per odo de vig^ encia do contrato de resseguro, que adotamos como sendo de um ano. Chamando de S o montante de excessos, Yi para i = 1; : : : ; N os excessos que ocorreram no ano e N o n umero de excessos no ano. Temos que
N X i=1

S=

Yi ;

baseando-se ou seja, S e uma soma de um n umero aleat orio de vari aveis aleat orias. E na distribui ca ~o de S que se calcula o pr^ emio estat stico de contratos de resseguro do tipo excesso de danos. Podemos determinar o pr^ emio p como, por exemplo, o valor tal que P (S > p) = , onde e uma probabilidade pequena.

35

36 A forma mais simples de estudar a distribui ca ~o desse montante e considerando um modelo de riscos homog^ eneos, que e descrito na Se ca ~o 4.2. Sob as hip oteses do modelo, dentre as quais est a a de independ^ encia entre os excessos, podemos estudar a distribui ca ~o do montante de excessos combinando a distribui ca ~o dos excessos com a distribui ca ~o do n umero de excessos em um ano pela equa ca ~o (4.3). Os bens segurados em ap olices diferentes de uma carteira de sinistros, a princ pio, n~ ao tem os riscos de ocorr^ encia de sinistro relacionados. Por em, existe uma boa chance de ocorrer concentra ca ~o de sinistros de valores altos em per odos associados a eventos catastr ocos. Nesse caso, a hip otese de independ^ encia entre os excessos n~ ao se verica. Para superar este problema, propomos ver o montante de excessos anual tamb em como a soma dos excessos agregados, estudados no Cap tulo 3. Vale a pena lembrar que os excessos agregados nada mais s~ ao do que a soma dos excessos que ocorreram dentro de um mesmo conglomerado, onde conglomerado e um per odo de concentra ca ~o excedentes de sinistros acima de um limiar alto. Assim, o n umero de parcelas do montante de excessos se reduz ao n umero de conglomerados. A depend^ encia local nos dados e, ent~ ao, contornada e, uma vez que tenhamos independ^ encia entre os conglomerados, o modelo de riscos homog^ eneos pode ser utilizado. Carteiras de seguro de inc^ endio se caracterizam pelo fato de os valores mais altos de sinistros serem respons aveis por uma propor ca ~o grande do montante dos sinistros. Isso faz com que a preocupa ca ~o da seguradora com o valor de cada sinistro seja maior do que com o n umero de sinistros. Em fun ca ~o disso, se torna muito interessante para a seguradora fazer um resseguro do tipo excesso de danos. Neste cap tulo vamos determinar a distribui ca ~o do montante de excessos de sinistros por ano de uma carteira de inc^ endio utilizando as abordagens de encar a-lo como soma de excessos ou como soma de excessos agregados. Estas abordagens est~ ao bem descritas na Se ca ~o 4.2. Em ambas consideramos v arios modelos que est~ ao apresentados na Se ca ~o 4.3. Os ajustes das distribui co ~es est~ ao na Se ca ~o 4.4. Nossos maiores objetivos nessa aplica ca ~o s~ ao: estudar o efeito de considerar excessos agregados no lugar dos excessos no c alculo do montante de excessos de sinistros e vericar se a a distribui ca ~o Pareto generalizada modicada, sugerida em Anderson e Dancy [1992], se ajusta bem aos excessos agregados produzidos por uma s erie de sinistros. Na Se ca ~o 4.5 descrevemos como obter aproxima co ~es para a distribui ca ~o dos montantes

37 de excessos e apresentamos os resultados obtidos usando os ajustes da Se ca ~o 4.4. A m de estudar melhor o efeito da forma ca ~o de conglomerados, provocamos um aumento articial no tamanho destes. Os resultados desta experi^ encia est~ ao na Se ca ~o 4.6. Na Se ca ~o 4.7, estudamos os excessos produzidos por um limiar maior e sua import^ ancia nos pr^ emios calculados para o montante de excessos acima do primeiro limiar que consideramos.

4.1

An alise Explorat oria dos Dados


Nesta se ca ~o vamos explorar uma s erie de sinistros de uma carteira de inc^ endio da

Dinamarca. H a um total de 2.167 observa co ~es que correspondem ao per odo de 1980 a 1990 inclusive. Os valores dos sinistros est~ ao em milh~ oes de Kroner dinamarqu^ eses (pre cos de 1985). Os dados foram gentilmente cedidos pelo professor Paul Embrechts da ETH Zurich, que os utiliza para ilustrar o uso de v arias ferramentas de valores extremos em Embrechts, Kl uppelberg e Mikosch [1997]. Cada valor de sinistro est a associado a data da sua ocorr^ encia. A Figura 4.1 apresenta a s erie dos valores dos sinistros de inc^ endio ao longo do tempo.

Sinistros de Incndio

0 0

50

100

150

200

250

1000

2000 Dias

3000

4000

Figura 4.1: S erie de sinistros da carteira de seguro de inc^ endio. Para localizar os sinistros no tempo, ao inv es da data do sinistro, pusemos no eixo das abcissas o n umero de dias corridos a partir de 01/01/80 at e o momento da ocor^ encia do sinistro. A discrep^ ancia das tr^ es maiores observa co ~es, aquelas que ultrapassam o valor 100, chama a aten ca ~o.

38 Na Tabela 4.1 apresentamos algumas estat sticas descritivas dos dados dessa s erie de sinistros. Min. 1 1o. Qu. 1,32 Mediana 1,78 M edia 3,39 3o. Qu. 2,97 M ax. 263 vari^ ancia 72,377

Tabela 4.1: Estat sticas descritivas da s erie de sinistros.

Notamos que o m aximo est a bastante distante da mediana, com uma dist^ ancia em torno de 30 desvios padr~ oes. O peso das observa co ~es maiores se reete na m edia fazendo com que esta seja maior do que o terceiro quartil. As tr^ es maiores observa co ~es se afastam bastante do restante dos dados, ultrapassando 100; s~ ao elas: 144,65, 152,41 e 263,25. A maior observa ca ~o antes desses valores era apenas de 65,70. Na Figura 4.2 temos a representatividade das classes de sinistros, onde a esquerda est a a barra relativa aos 10% maiores sinistros e a direita, a barra relativa aos 10% menores. As alturas das barras revelam a propor ca ~o a que corresponde o montante da classe relativa ao montante total de sinistros. Os valores sob as barras indicam o menor valor de sinistro encontrado na classe.

Propores

0.0

0.1

0.2

0.3

0.4

5.5639

3.5000

2.5656

2.0650

1.7801

1.5816

1.4035

1.2565

1.1132

1.0000

Classes

Figura 4.2: Representatividade das classes de sinistros. A altura de cada barra e igual a soma dos valores de 10% dos sinistros dividida pela soma total dos sinistros. Colocamos as observa co ~es em ordem descrescente, determinamos classes com 216 ou 217 observa co ~es (10% das 2.167 observa co ~es), somamos os valores dentro de cada classe e dividimos pelo montante total de sinistros que e 7.335,5. Por exemplo, na primeira classe (classe mais a esquerda) est~ ao os valores maiores ou iguais a 5,5638 e na u ltima classe (classe mais a direita) os valores maiores ou iguais a 1 e menores

39 do que 1,1132. Vemos que os 10% maiores sinistros s~ ao respons aveis por quase metade do montante total. Os n umeros em quest~ ao s~ ao: 216 sinistros ultrapassaram o quantil 90%, cujo valor emp rico e, precisamente, 5,5617. Esses sinistros somam 3.372,1 e esse montante representa 45,97% da soma do total dos sinistros, que e de 7.335,5, ocorridos durante o per odo em que foi observada a s erie. Isto conrma o que dissemos a respeito de numa carteira de inc^ endio uma pequena quantidade de sinistros ter bastante express~ ao sobre o montante total. Na pr atica, al em do gerenciamento dos riscos em si, as seguradoras escolhem o limite de perda baseadas em sua capacidade de reten ca ~o de risco, que est a associada ao seu aporte de capital. Quest~ oes de custos operacionais tamb em contribuem para essa decis~ ao. No nosso problema, como s o t nhamos a informa ca ~o da s erie de sinistros, optamos por um crit erio de escolha de limiar que reduzisse a variabilidade da carteira e que mantivesse um grande n umero de sinistros por conta da seguradora. Baseados na Figura 4.2 escolhemos o maior valor menor do que 5,5638 observado nos dados para ser o limite de perda que chamamos de u, que e igual a 5,5617. Este e o limiar que usamos em nossas primeiras an alises para denir os excessos. Dessa forma os excessos al em de u s~ ao justamente os relativos a classe dos 10% maiores sinistros. A Figura 4.3 apresenta a fun ca ~o da m edia dos excessos dos dados da carteira de inc^ endio.
120 Mdia dos Excessos 20 40 60 80 100

u 0

U 50 Limiar u 100 150

Figura 4.3: Fun c~ ao da m edia dos excessos dos sinistros da carteira de inc^ endio.

40 Partindo deste gr aco percebemos que as observa co ~es maiores do que 30 apresentam uma m edia dos excessos mais dispersa do padr~ ao apresentado para valores menores. Estudamos os excessos acima do limiar U = 30 a m de medir o impacto desses sobre os pr^ emios de resseguro. A an alise para os excessos acima de U = 30 est~ ao na Se ca ~o 4.7. Aproveitamos para localizar na gura os limiares u = 5; 5617 e U = 30. A fun ca ~o da m edia dos excessos emp rica apresenta um comportamento geral linear e crescente desde os menores valores de limiar. Em algumas faixas h a uma sutil diferen ca desse comportamento. Os valores menores do que u est~ ao mais claramente sobre uma linha reta. Entre os limiares u e U a linha desenhada pelos pontos e ligeiramente curva. A partir de U as observa co ~es se dispersam mais.

4.2

Modelo de Riscos Homog^ eneos

A teoria do risco coletivo lida com a soma de um n umero aleat orio de vari aveis aleat orias geradas por um processo estoc astico. Quando assumimos um modelo de riscos homog^ eneos podemos dividir o estudo da tal soma nos estudos do n umero de parcelas e dos valores das parcelas. Esse modelo tem como hip otese que as distribui co ~es das parcelas s~ ao id^ enticas, independentes, n~ ao variam no tempo, e s~ ao tamb em independentes do n umero de parcelas. Nosso objetivo neste trabalho e estudar a distribui ca ~o do montante de excessos de sinistros S por ano que, no ano i, nada mais e do que Si =
Ni X j =1

Yij

onde os Yij s~ ao os valores dos excessos que ocorreram no ano i e Ni e o n umero de excessos ocorridos no ano i. Para simplicar a nota ca ~o vamos a partir daqui omitir o ndice i. ao independentes, idenSe supusermos que, em cada ano, as vari aveis aleat orias Yj s~ ticamente distribu das com distribui ca ~o que n~ ao varia ao longo dos anos e independentes da vari avel aleat oria N , ent~ ao ca mos num modelo de riscos homog^ eneos. Temos que E [S ] = E [E [S jN ]] = E [E [Y1 + + Yn jN = n]] = E [N E [Y ]] = E [Y ]E [N ]; (4.1)

41

V [S ] = E [V [S jN ]] + V [E [S jN ]] = E [N V [Y ]] + V [E [Y ]N ] = E [N ]V [Y ] + V [N ](E [Y ])2 : (4.2)

A distribui ca ~o de S em fun ca ~o das distribui co ~es de Yj e N se d a por meio das convolu co ~es de Yj . P (S < s) =
1 X

n=0

P (S < sjN = n)P (N = n)


1 X

= P (N = 0) +

n=1

P (Y1 + + Yn < s)P (N = n):

(4.3)

Quando assumimos o modelo de riscos homog^ eneos e tamb em que a distribui ca ~o de N e Poisson ou Binomial Negativa temos que a distribui ca ~o de S pode ser aproximada assintoticamente por uma distribui ca ~o normal com m edias E [S ] e vari^ ancia V [S ]. A aproxima ca ~o e tanto melhor quanto maior for o valor esperado de N . Mais detalhes sobre a teoria do risco coletivo podem ser encontrados em Bowers et al. [1986]. Nossa proposta e olhar para o montante de excessos S como a soma aleat oria dos excessos agregados, ou seja, S=
C X j =1

Aj ;

onde C e o n umero de conglomerados. Note que o valor de S em cada ano e exatamente o mesmo em ambas as abordagens, para um mesmo limiar xo, a menos de considera co ~es que se fa ca a respeito de conglomerados que perten cam a dois anos seguidos, situa ca ~o essa que n~ ao ocorreu em nossa amostra. Dessa forma precisamos que as somas dos excessos dentro dos conglomerados, e n~ ao mais, simplesmente, os excessos, sejam independentes e identicamente distribu das. Do mesmo modo que e obtido para os excessos chegamos aos seguintes resultados para os excessos agregados: EA [S ] = E [CE [A]] = E [A]E [C ]: VA [S ] = E [C ]V [A] + V [C ](E [A])2 PA (S < s) = P (C = 0) +
1 X

(4.4)

(4.5) (4.6)

n=1

P (A1 + + An < s)P (C = n):

42 A partir dessas identidades podemos estimar S ou considerando que e soma de excessos, que chamamos de abordagem Y , ou que e soma de excessos agregados, que chamamos de abordagem A. Apesar de o valor de S ser o mesmo em ambas as abordagens, estas levam a aproxima co ~es diferentes para a distribui ca ~o de S . Para uma ou outra podemos considerar diversos modelos que s~ ao denidos pela escolha das distribui co ~es do n umero de parcelas, N ou C , e dos valores das parcelas, Y ou A respectivamente. Quando escolhemos uma abordagem, uma distribui ca ~o para o n umero de parcelas e uma para os valores das parcelas, denimos um modelo para a distribui ca ~o de S . No total ajustamos 26 modelos. As distribui co ~es consideradas e os modelos resultantes est~ ao na Tabela 4.2.

4.3

Modelos e M etodos de Ajuste


Nesta se ca ~o descrevemos as distribui co ~es que ajustamos a s vari aveis de interesse, N ,

C , Y e A, e os m etodos de estima ca ~o que usamos. Para todas essas vari aveis, conside vari ramos as distribui co ~es emp ricas. As aveis discretas, N e C , ajustamos as distribui co ~es Poisson e Binomial Negativa; e a s vari aveis cont nuas, Y e A, as distribui co ~es Pareto Generalizada Modicada e Pareto Generalizada (que daqui por diante passam a se referir apenas aos casos em que 6 = 0), Exponencial Modicada, Gama e Exponencial. Para n~ ao sobrecarregar o texto, adotamos os seguintes termos para fazer refer^ encia a s distribui co ~es param etricas que utilizamos: MGPD Distribui ca ~o Pareto Generalizada Modicada com 6 = 0; MEXP Distribui ca ~o Exponencial Modicada. Era o caso em que = 0 da distribui ca ~o Pareto Generalizada Modicada; a distribui GPD Distribui ca ~o Pareto Generalizada com 6 = 0. E ca ~o Pareto Generalizada Modicada com = 1; EXP Distribui ca ~o Exponencial. Era o caso em que = 0 da distribui ca ~o Pareto Generalizada; GAMA Distribui ca ~o Gama; Poisson Distribui ca ~o Poisson;

43 BN Distribui ca ~o Binomial Negativa; A escolha das distribui co ~es que consideramos para N e C se justica em fun ca ~o de serem t picas no ajustes de contagens e muito usadas na teoria do risco coletivo. A escolha das distribui co ~es para A se deve a teoria apresentada no Cap tulo 3 e a sugest~ ao dada em Anderson e Dancy [1992], citada na Se ca ~o 3.3, de que as distribui co ~es MGPD e MEXP seriam apropriadas para o ajuste do excesso agregado. Temos que a GPD e a EXP s~ ao casos particulares da MGPD. Ajustamos tamb em a distribui ca ~o GAMA porque e um exemplo de distribui ca ~o tipicamente utilizada para s eries de sinistros. Cabe ressaltar que a MEXP e mais conhecida como Weibull e a GPD com > 0 e uma distribui ca ~o Pareto e que essas tamb em s~ ao distribui co ~es bastante usadas para ajustar a s eries de sinistros. As mesmas distribui co ~es que usamos para A tamb em ajustamos a Y para podermos comparar as aproxima co ~es para a distribui ca ~o de S . A Tabela 4.2 resume os modelos que consideramos e estabelece c odigos para facilitar a refer^ encia ao longo do texto. Esse c odigo e composto por tr^ es coordenadas: duas letras e um d gito. Abordagem Y N YP1 YP2 YP3 YP4 YP5 YP6 YB1 YB2 YB3 YB4 YB5 YB6 YE6 Poisson Poisson Poisson Poisson Poisson Poisson BN BN BN BN BN BN Emp rica Y MGPD MEXP GPD EXP GAMA Emp rica MGPD MEXP GPD EXP GAMA Emp rica Emp rica AP1 AP2 AP3 AP4 AP5 AP6 AB1 AB2 AB3 AB4 AB5 AB6 AE6 Abordagem A C Poisson Poisson Poisson Poisson Poisson Poisson BN BN BN BN BN BN Emp rica A MGPD MEXP GPD EXP GAMA Emp rica MGPD MEXP GPD EXP GAMA Emp rica Emp rica

Tabela 4.2: Modelos utilizados.

44 No total s~ ao 26 modelos, treze na abordagem Y e treze na A. Em cada abordagem, seis modelos levam em conta que o n umero de parcelas de S tem distribui ca ~o Poisson e seis, que o n umero de parcelas tem distribui ca ~o BN. Estes grupos de seis modelos se referem a s seis distribui co ~es ajustadas ao valor das parcelas: MGPD, MEXP, GPD, EXP, GAMA e Emp rica. Al em desses 24 modelos h a dois s o com distribui co ~es Emp ricas, um para cada abordagem. A primeira letra do c odigo pode ser Y ou A para abordagem Y ou abordagem A. A segunda letra se refere a distribui ca ~o ajustada a N ou C dependendo da abordagem; pode ser P, B ou E para Poisson, BN ou Emp rica respectivamente. O d gito que aparece por u ltimo no c odigo identica a distribui ca ~o que foi ajustada aos valores das parcelas de S . S~ ao os n umeros de 1 a 6, onde 1 signica MGPD; 2, MEXP; 3, GPD; 4, EXP; 5, GAMA; e 6, Emp rica. Assim o c odigo YP6 representa o modelo da abordagem Y usando a Poisson para o ajuste de N e a distribui ca ~o Emp rica para Y . J a o c odigo AE6 representa o modelo da abordagem A onde consideramos a distribui ca ~o Emp rica de C e a distribui ca ~o Emp rica de A. Fazemos uso da nota ca ~o \ " quando queremos nos referir a um grupo de ao os seis modelos da abordagem Y que ajustam a Poisson modelos. Por exemplo, Y P s~ a N. As fun co ~es de distribui co ~es, densidades, esperan cas e vari^ ancias das distribui co ~es estudadas est~ ao expostas a seguir.

MGPD Fun ca ~o de Distribui ca ~o: P (X < x) = 1 (1 + x )1= 8 < x0 onde : 0 x < ( )1=

se > 0 se < 0

Densidade: pX (x) = (1 + x )(1+1= ) x1 8 < x0 onde : 0 x < ( )1=

se > 0 se < 0

A esperan ca e a vari^ ancia da MGPD foram calculadas numericamente.

45

MEXP Densidade: pX (x) =


x e x1 onde x > 0

Esperan ca e Vari^ ancia: E[X] = 1= (1 + 1 )

V[X] = 2= [(1 + 21 ) 2 (1 + 1 )] GPD Fun ca ~o de Distribui ca ~o: x P (X < x) = 1 (1 + )(1+1=) 8 < x0 onde : 0 x <

se > 0 se < 0

Densidade: pX (x) = x 1 (1 + )(1+1= ) 8 < x0 onde : 0 x <

se > 0 se < 0

Esperan ca e Vari^ ancia: se < 1 1 E[X] = > : 1 se 1 8 2 > < se < 0; 5 (1 )2 (1 2 ) V[X] = > : 1 se 0; 5 EXP Densidade: pX (x) =
x 1 e onde x > 0 se = 0

8 > <

46

Esperan ca e Vari^ ancia: E[X] = 1

2 1 V[X] =

GAMA Densidade: 1 x x e se x > 0 ( )

Esperan ca e Vari^ ancia: E[X] = 2

V[X] =

Poisson Fun ca ~o de Probabilidade P (N = n) = Esperan ca e Vari^ ancia: E[X] = e n n!

V[X] = 2 BN Fun ca ~o de Probabilidade P (N = n) = (r + n 1)! r p (1 p)n n!(r 1)!

47 Esperan ca e Vari^ ancia: E [N ] = V [N ] = r(1 p) p r(1 p) p2

A seguir apresentamos os m etodos de estima ca ~o que usamos. As distribui co ~es cont nuas MGPD, MEXP, GPD, EXP e GAMA s~ ao ajustadas pelo m etodo da m axima verossimilhan ca e as distribui co ~es discretas pelo m etodo dos momentos. Tamb em descrevemos como obter as distribui co ~es emp ricas que s~ ao consideradas para todas as quatros vari aveis de interesse N , C , Y e A. Enm, temos que cada um dos 26 modelos e ajustado de uma u nica maneira aos dados. As descri co ~es que apresentamos dos m etodos se baseiam nas contidas em Migon e Gamerman [1999].

4.3.1

M etodo da M axima Verossimilhan ca

O estimador de m axima verossimilhan ca determina as estimativas dos par^ ametros de um dado modelo escolhendo os valores que maximizam a verossimilhan ca. Em alguns modelos e f acil encontrar esses pontos de m aximo analiticamente. Por em e comum ser necess aria a utiliza ca ~o de m etodos num ericos para determin a-los. Um dos m etodos num ericos mais simples que existe e que foi o que n os usamos neste trabalho e o de busca em uma grade. Chamamos de grade um conjunto de valores poss veis para os par^ ametros que montamos da seguinte forma: para cada par^ ametro denimos uma seq u^ encia de valores igualmente espa cados; nossa grade e o conjunto de pares (ou trios) ordenados dessas seq u^ encias, tomando o cuidado de vericar se os pontos pertencem ao dom nio da verossimilhan ca. Para determinar a aproxima ca ~o para o m aximo observamos a fun ca ~o em cada um dos pontos da grade e escolhemos aquele que produz o maior valor para a fun ca ~o de verossimilhan ca. importante ressaltar a import^ E ancia da constru ca ~o da grade. Primeiramente h a de se ter o cuidado de escolher apenas pontos que perten cam ao dom nio da distribui ca ~o. Depois disso precisamos ter alguma id eia da regi~ ao onde est a o m aximo da fun ca ~o. Um modo de fazer isso e iniciar por uma grade que cubra uma grande entens~ ao do dom nio, por em com pontos nem t~ ao pr oximos (uma grade grossa) e usar esses pontos para apontar para a regi~ ao onde se poderia encontrar o m aximo. Ent~ ao vai-se renando a grade, ou

48 seja, vai-se considerando pontos cada vez mais pr oximos por em que est~ ao numa regi~ ao menor do dom nio. Para facilitar as contas costumamos trabalhar n~ ao com a verossimilhan ca em si mas sim com o seu logaritmo. A seguir apresentamos os logaritmos das fun co ~es de verossimilhan ca das distribui co ~es que ajustamos por m axima verosssimilhan ca. Utilizando busca em grade, maximizamos essas log-verossimilhan cas e estimamos os par^ ametros dos modelos como sendo esses pontos de m aximo. A excess~ ao e a EXP cujas estimativas de m axima verossimilhan ca dos par^ ametros e obtida analiticamente. Em seguida, apresentamos tamb em o teste da raz~ ao das verossimilhan cas que usamos para testar a signic^ ancia de considerar a MGPD ao inv es dos modelos mais simples que s~ ao seus casos particulares.

MGPD Logaritmo da Verossimilhan ca: X x 1 X i log 1 + (log (xi )) + nlog ( ) + ( 1) 1+


i i

onde xi > 0; > 0; > 0 e >

. max(xi )

MEXP Logaritmo da Verossimilhan ca: n n X 1X xi + nlog log (xi ); onde > 0 + ( 1)


i=1 i=1

GPD Logaritmo da Verossimilhan ca: n xi 1 X log 1 + 1+ nlog ( )


i=1

onde xi > 0; > 0 e > max(xi )

49

EXP Logaritmo da Verossimilhan ca:


n 1X xi nlog; onde > 0 i

Estimativa por M axima Verossimilhan ca: ^= Pn


i

xi

GAMA Logaritmo da Verossimilhan ca: nlog ( ) + nlog (( )) + ( 1) onde ; > 0.


n X i=1

log (xi )

n X i=1

xi

Teste da Raz~ ao das Verossimilhan cas stica Um procedimento geral para testar H0 : 2 0 vs H1 : 2 1 se baseia na estat de teste da raz~ ao das m axima verossimilhan cas supf`(X; ) : 2 0 g ; supf`(X; ) : 2 1 g

(X) =

e uma amostra aleat oria e `(X; ) e a verossimilhan ca para X onde X = (X1 ; : : : ; Xn ) no ponto . Note que (X) depende da amostra. Vamos considerar casos onde `(X; ) e e todo o espa co param etrico, 0 \ 1 = ; e 0 tem cont nua em , 0 [ 1 = , onde e substitu do pelo supremo dimens~ ao menor do que a de 1 . Nesse caso, o denominador sobre todo o espa co param etrico o que signica que estamos substituindo (X) por maxf(X); 1g. O teste da raz~ ao das verossimilhan cas de n vel para H0 rejeita H0 se (x), calculado a partir da amostra observada x, for menor do que c, onde c satisfaz

supfP ((X) < c j ) : 2 0 g: Em muitos casos n~ ao e poss vel obter analiticamente a distribui ca ~o exata de (X) e m etodos assint oticos s~ ao freq uentemente usados. Os testes assint oticos s~ ao baseados

50 na aproxima ca ~o assint otica para a distribui ca ~o da estat stica de teste. Uma aproxima ca ~o freq uentemente utilizada, que pode ser encontrada com mais detalhes em Bickel e Doksum ao [2001], e que se a dimens~ ao de = k e a de 0 = k p > 0 ent~ 2log(X) 2 p; e a distribui ca ~o qui-quadrada com p graus de liberdade. O teste com n vel onde 2 p calculado de forma que e rejeitada. E e o menor n vel de signic^ ancia para o qual H0 encia de que H0 deve ser 2log(X) = 2 p (p-valor). Quanto maior o p-valor, mais evid^ vel de 10% de signic^ ancia ent~ ao rejeitamos H0 se o aceita. Se queremos testar H0 ao n p-valor for menor do que 0,1. Crit erio BIC de Sele c~ ao de Modelos O crit erio BIC (Bayesian Information Criterion) de sele ca ~o de modelos e usado para baseado em conidentica ca ~o de modelos estat sticos numa diversidade de situa co ~es. E ceitos de informa ca ~o te orica e pode ser visto como um crit erio de sele ca ~o de modelos pela parsim^ onia. Quando um modelo envolvendo q par^ ametros de ajuste independentes e ajustado aos dados, o BIC e denido por BIC (q ) = (2log (M axima Verossimilhan ca)) + qlog (n); onde n e o tamanho da amostra. O melhor ajuste e apontado pelo menor BIC. ca ~o de 2 rejeita H0 se 2log(X) > 2 p () (quantil 1 da distribui kp ). O p-valor

4.3.2

M etodo dos Momentos

Assuma que a distribui ca ~o dos dados tem vetor de par^ ametros de tamanho k e tem etodo dos pelo menos k momentos nitos dados por i = E [X i j] para i = 1; : : : ; k. O m momentos recomenda a estima ca ~o de k por ^k = 1X k Xi ; n
i=1 n

onde X1 ; : : : ; Xn s~ ao os elementos de uma amostra aleat oria de tamanho xo n. Deste modo, as estimativas dos momentos populacionais s~ ao igualadas aos momentos amostrais.

Para qualquer distribui ca ~o com k < 1, a lei dos grandes n umeros garante que ^k ! k , com probabilidade 1 quando n ! 1. Ent~ ao estimadores obtidos pelo m etodo

51 dos momentos carregam consigo boas propriedades assint oticas. Cabe ressaltar que, por deni ca ~o, a distribui ca ~o que envolve k par^ ametros quando ajustada pelo m etodo dos momentos tem os k primeiros momentos coincidindo com os observados na amostra. Neste trabalhos, ajustamos a Poisson e a binomial negativa a N e a C pelo m etodo dos momentos. No caso da Poisson() o estimador de pelo m etodo dos momentos e ^= ^1 : No caso da BN(p; r) os estimadores cam p ^= ^1 ^2 ^2 1 e r ^= ^2 1 : ^2 ^2 ^1 1

4.3.3

Distribui c~ oes Emp ricas

A distribui ca ~o emp rica e um m etodo n~ ao param etrico uma vez que n~ ao envolve a hip otese de que a forma da distribui ca ~o verdadeira e conhecida a menos de seus par^ ametros.

^ . Seja (X1 ; : : : ; Xn ) uma amostra Denotamos a fun ca ~o de distribui ca ~o emp rica por F ^ aleat oria de uma fun ca ~o de distribui ca ~o desconhecida F , ent~ ao F e dada por
0 ^ (x) = #Xi s x ; F n

^ (x) ou seja, F e a propor ca ~o de elementos da amostra que s~ ao menores do que x. Observe ^ que como F , F e n~ ao descrescente e est a contida no intervalo [0,1] conforme deve ser uma fun ca ~o de distribui ca ~o. No caso de distribui co ~es discretas, este m etodo n~ ao param etrico se distingue do m etodo de substitui ca ~o das freq u^ encias para o ajuste de uma multinomial pelo fato de que a hip otese de distribui ca ~o multinomial n~ ao foi assumida.

52

4.4

Ajustes das Distribui c~ oes


O esquema a seguir resume os passos que demos no estudo da distribui ca ~o de S e a

forma como apresentamos os resultados.

S
# Abordagens . PN
i=1 Yi

& PC
i=1 Ai

# Modelos . Dist. N Poisson Bin. Neg. Emp rica + & Dist. Y MGPD MEXP GPD EXP GAMA Emp rica | {z } | Dist. C Poisson Bin. Neg. Emp rica .

# Modelos & Dist. A MGPD MEXP + GPD EXP GAMA Emp rica {z }

13 Modelos &

13 Modelos .

26 Aproxima co ~es para a Distribui ca ~o exata de S # Apresenta ca ~o dos Resultados . Tabela [ E [S ] [ V [S ] Pr^ emios & Gr acos Pr^ emios Densidades

Nosso objetivo e obter aproxima co ~es para a distribui ca ~o de S . Tratamos o problema pela abordagem Y , que considera S soma de excessos e, pela abordagem A, que considera

53 S soma de excessos agregados. Para cada abordagem consideramos 3 distribui co ~es para o n umero de parcelas e 6 para os valores das parcelas. S~ ao produzidos 13 modelos para cada abordagem gerando 26 aproxima co ~es para a distribui ca ~o exata de S . Estes modelos est~ ao enumerados na Tabela 4.2. Os resultados das aproxima co ~es s~ ao apresentados em uma tabela e em gr acos que est~ ao na Se ca ~o 4.5. A tabela cont em as estimativas da esperan ca e da vari^ ancia de S e os pr^ emios estat sticos que representam os quantis 90% e 95% estimados. Os gr acos nos permitem visualisar os pr^ emios para qualquer quantil e as densidades. Esses resultados tamb em s~ ao comparados aos produzidos pelas aproxima co ~es assint oticas. Para indicar os valores estimados pomos um acento circunexo (^) nos s mbolos que [ [S ] e a estimativa representam estimativas de quantidades populacionais, por exemplo E para esperan ca de S . Para vericar os ajustes das distribui co ~es utilizamos duas ferramentas gr acas. A primeira e um gr aco onde as curvas das densidades das distribui co ~es ajustadas s~ ao desenhadas sobre o histograma da amostra. Quanto melhor a qualidade do ajuste mais parecida e a densidade com a forma do histograma. A segunda ferramenta e o chamado qq-plot. Neste gr aco, os quantis da distribui ca ~o ajustada s~ ao desenhados versus os quantis observados que nada mais s~ ao do que as observa co ~es da amostra em ordem crescente. O qq-plot de um bom ajuste e aproximadamente a reta identidade (x=y). Para facilitar a an alise do gr aco desenhamos tamb em a reta x=y. Pelo qq-plot podemos n~ ao s o concluir a repeito do ajuste como um todo mas tamb em vericar que pontos da amostra caram bem ajustados (sobre a reta), subestimados (embaixo da reta) ou sobrestimados (em cima da reta).

4.4.1

Excessos Y

Para obtermos os excessos, primeiro identicamos os excedentes acima de u = 5; 5617 da s erie de sinistros de inc^ endio. Coletamos 216 excedentes. Os excessos s~ ao calculados subtraindo o limiar u dos excedentes. Desse modo formamos a amostra y = (y1 ; : : : ; y216 ) dos excessos. Estas observa co ~es est~ ao dispostas na Figura 4.4 versus o momento em ocorreram, que e medido pelo n umero de dias corridos a partir de 01/01/1980. Notamos que os pontos est~ ao bem distribu dos ao longo do per odo observado indicando que o padr~ ao de comportamento

54 dos dados n~ ao e inuenciado pelo tempo.

Excessos acima de u

0 0

50

100

150

200

250

1000

2000 Dias

3000

4000

Figura 4.4: Gr aco no tempo dos excessos (y1 ; : : : ; y216 ). Na Tabela 4.3 podemos encontrar um resumo das estat sticas dos excessos coletados da s erie de sinistros. Min. 0,00212 1o. Qu. 1,23 Mediana 4,48 M edia 10 3o. Qu. 10,8 M ax. 258 Vari^ ancia 552,8

Tabela 4.3: Estat sticas descritivas dos excessos (y1 ; : : : ; y216 ). . quartil, sendo que a dist^ Notamos que o valor do m aximo se afasta bastante do 3o ancia . quartis. Outra forma de . e o 1o entre eles representa mais de 25 vezes a dist^ ancia entre 3o avaliar essa dist^ ancia e em termos de desvio padr~ ao: s~ ao mais de 10 desvios. O m aximo se destaca junto com outras 2 observa co ~es cujos valores s~ ao: 139 e 147. Antes destas o maior valor observado foi 60. O histograma e o gr aco da m edia dos excessos emp rica de (y1 ; : : : ; y216 ) est~ ao apresentados na Figura 4.5. No histograma, vemos que e muito grande a concentra ca ~o de valores de excessos agregados pequenos e que as probabilidades das classes do histograma decaem rapidamente. No entanto, decaem para um patamar que se mant em por uma longa extens~ ao e que e depois seguido de observa co ~es muito grandes que cam isoladas. No gr aco da m edia dos excessos, os dois maiores limiares cam bastante distoantes dos restantes, mas j a t nhamos percebido que havia tr^ es observa co ~es que cavam muito distantes das outras. Cabe lembrar que no gr aco da m edia dos excessos h a um ponto a

55 menos do que o tamanho da amostra porque n~ ao h a excessos al em da maior observa ca ~o, logo, esta n~ ao produz ponto para o gr aco da m edia dos excessos. O comportamento de tend^ encia linear crescente que se observa no gr aco sugere uma distribui ca ~o de cauda pesada, que poderia ser talvez uma MGPD ou uma GPD.
120 0.06 Mdia dos Excessos 0 50 100 150 200 250 Probabilidade 0.04 0.02 0.0 20 0 40 60 80 100

50 Limiar u

100

150

Limiar u

Figura 4.5: Histograma e gr aco da fun c~ ao da m edia dos excessos (y1 ; : : : ; y216 ). Os valores das estimativas dos par^ ametros e do logaritmo da verossimilhan ca (L-Vero) das distribui co ~es param etricas ajustadas a Y por m axima verossimilhan ca: MEXP, GPD, EXP e GAMA; est~ ao na Tabela 4.4. Nessa tabela tamb em encontramos as estimativas da esperan ca e da vari^ ancia de cada uma das distribui co ~es. As parametriza co ~es consideradas est~ ao esclarecidos na Se ca ~o 4.4. FY MGPD MEXP GPD EXP GAMA L-Vero -664,40 -668,86 -667,92 -714,43 -678.53 ^ 3,90 3,57 4,51 10,05 0,05 0,54 0,58 ^ 0,28 ^ 0,80 0,65 [ E [Y ] 9,78 9,57 10,85 10,05 10,05 [ V [Y ] 490,7 230,91 1 101 187,66

Tabela 4.4: Ajustes dos excessos (y1 ; : : : ; y216 ) por m axima verossimilhan ca. A estimativa da vari^ ancia de Y no modelo GPD e innito para o par^ ametro de forma > 0; 5. As estimativas da esperan ca caram todas pr oximas da m edia amostral que e 10. Por outro lado as estimativas das vari^ ancias variaram de 101, obtida para a EXP, at e 490,7, para a MGPD. Notamos que a MEXP teve a segunda maior estimativa para a vari^ ancia e a menor estimativa para a esperan ca.

56 A Tabela 4.5 apresenta o p-valor do teste da raz~ ao das verossimilhan cas para as distribui co ~es que s~ ao casos particulares da MGPD consideradas para o ajuste de Y . GPD x MGPD 0,0079 MEXP x MGPD 0,0028 EXP x GPD 0

Tabela 4.5: P-valores dos testes da raz~ ao das verossimilhan cas dos ajustes de (y1 ; : : : ; y216 ). Todas as distribui co ~es s~ ao rejeitadas em favor da MGPD ao n vel de 10%. Temos ent~ ao que para o ajuste dos excessos a MGPD se saiu signicativamente melhor do que se casos particulares. Quanto a GAMA, que n~ ao pode ser comparada a MGPD por esse teste, podemos observar que sua L-Vero e menor do qua as da MEXP e da GPD que s~ ao dois outros modelos com dois par^ ametros e que foram rejeitados em favor da MGPD pelo teste. Utilizamos tamb em o crit erio BIC para sele ca ~o de modelos, cujos valores est~ ao na Tabela 4.6 e vericamos que este conrma a escolha que sugere o teste das verossimilhan cas. O menor valor obtido foi para a ditribui ca ~o MGPD. MGPD 1334.8 MEXP 1341.7 GPD 1339.8 EXP 1430.9 Gama 1361.1

Tabela 4.6: Crit erio de sele c~ ao de modelos BIC para (y1 ; : : : ; y216 ). Na Figura 4.6 temos as densidades dos ajustes de Y sobrepostas ao histograma de (y1 ; : : : ; y216 ).

0.06

Probabilidades

MGPD GPD MEXP EXP GAMA

0.0 0

0.02

0.04

50

100 excessos

150

200

250

Figura 4.6: Histograma com densidades dos ajustes de (y1 ; : : : ; y216 ).

57 Na Figura 4.7 temos os qq-plots dos ajustes de Y . Os tr^ es maiores quantis caram mal ajustados em todas as distribui co ~es. A EXP e a GAMA ajustam mal as observa co ~es maiores do que 50. A GPD ajusta as tr^ es maiores observa co ~es melhor do que a MGPD, por em podemos notar que sobrestima as maiores observa co ~es menores do que 100. Nessa compara ca ~o precisamos mesmo nos basear no resultado do teste da raz~ ao das verossimilhan cas para escolher entre a MGPD e GPD; e o teste rejeita a GPD ao n vel de 10% de signic^ ancia. Note que o teste tamb em rejeitaria ao n vel de signic^ ancia de 5%. A MEXP, a EXP e a GAMA est~ ao visilvelmente piores do que a MGPD: as menores observa co ~es desenham uma curva c^ oncava por sobre a reta x=y e os tr^ es maiores quantis t^ em estimativas menores para a MEXP, a EXP e a GAMA do que para MGPD.

MGPD

MEXP

GPD

Ajustados

Ajustados

50 100

50 100

Ajustados 0 50 150 250

50

150

250

0 0 50

50 100

150

250

Observados

Observados

Observados

EXP

GAMA

Ajustados

50 100

Ajustados 0 50 150 250

0 0 50

50 100

150

250

Observados

Observados

Figura 4.7: Qq-plot dos ajustes de (y1 ; : : : ; y216 ).

4.4.2

N umero de Excessos N

Para estimar a distribui ca ~o de S pela abordagem Y precisamos al em de ajustar os Yj ajustar o n umero de excessos por ano N . Nos baseamos numa amostra de tamanho co ~es 11, n = (n1 ; : : : ; n11 ), referentes aos 11 anos observados. Consideramos as distribui Poisson, BN e Emp rica. As distribui co ~es Poisson e BN s~ ao ajustadas pelo m etodo dos momentos. A esperan ca e a vari^ ancia amostrais e os par^ ametros ajustados pela Poisson e pela

58 ^ l 19,636

M edia 19,636

Vari^ ancia Amostral 35,504

p ^ 0,55307

r ^ 24

Tabela 4.7: Ajuste de (n1 ; : : : ; n11 ). l BN est~ ao na Tabela 4.7. Cabe lembrar que ^ e o par^ ametro da Poisson e p ^e r ^ s~ ao os par^ ametros de BN. [ [N ] s~ ao iguais a m edia amostral 19,636 tanto para a Poisson como As estimativas E [ [N ] para a BN e igual a vari^ ancia amostral 35,504 enquanto para a BN. A estimativa V que a para a Poisson e igual a m edia amostral 19,636. A Figura 4.8 e um gr aco de barras das distribui co ~es ajustadas a N . Podemos perceber como o ajuste da BN cou mais disperso do que o da Poisson. A BN ajustada e ligeiramente assim etrica para a direita, mas ambas as distribui co ~es ajustadas lembram muito uma distribui ca ~o normal.
Poisson BN

0.08

0.06

Probabilidade

Probabilidade 0 5 10 15 n 20 25 30

0.04

0.0

0.02

0.0 0

0.02

0.04

0.06

10

15 n

20

25

30

Figura 4.8: Histogramas dos ajustes de (n1 ; : : : ; n11 ). A Tabela 4.8 apresenta a distribui ca ~o Emp rica de N . n P (N = n) 11 0,182 13 0,091 16 0,091 20 0,182 22 0,091 23 0,091 24 0,091 26 0,091 30 0,091

Tabela 4.8: Distribui c~ ao emp rica de (n1 ; : : : ; n11 ).

59 S~ ao muito poucas observa co ~es e a distribui ca ~o emp rica n~ ao cou com uma forma denida. Isso inviabiliza fazer testes de bondade de ajuste para as distribui co ~es Poisson e BN ajustadas.

4.4.3

Excessos Agregados A

Nosso primeiro passo foi identicar os conglomerados a m de obter a medida do excesso agregado A. Para identicar os conglomerados, impomos que cada excedente al em de u est a em um conglomerado e que os conglomerados se separam quando h a pelo menos tr^ es dias sem ocorr^ encia de excedentes. Com isso pretend amos garantir a hip otese de independ^ encia entre os conglomerados e garantir que a soma dos excessos agregados no ano seria igual a soma dos excessos no ano. Aproveitamos este procedimento para coletar tamb em o m aximo dos excessos dentro de cada conglomerado, YNj . Com esta
(1) ^ do par^ amostra podemos obter a estimativa k ametro de forma da GPD para YNj , fazer o (1)

gr aco proposto em (3.8) e vericar se esse procedimento tamb em sugere uma MGPD aos excessos agregados da s erie de sinistros, como aconteceu em Anderson e Dancy [1992]. Obtivemos 168 conglomerados e, portanto, este e o tamanho da nossa amostra de A, denotada por a = (a1 ; : : : ; a168 ). Estas observa co ~es est~ ao dispostas na gura abaixo versus o momento em ocorreram, que e medido pelo n umero de dias corridos a partir de 01/01/1980. Notamos que os pontos est~ ao bem distribu dos ao longo do per odo observado indicando que o padr~ ao de comportamento dos dados n~ ao e inuenciado pelo tempo.

Excesssos Agregados

0 0

50

100

150

200

250

1000

2000 Dias

3000

4000

Figura 4.9: Gr aco no tempo dos excessos agregados (a1 ; : : : ; a168 ). Um resumo das estat sticas a respeito dos excessos agregados est a na Tabela 4.9.

60 . quartil, sendo que a dist^ ancia Notamos que o valor do m aximo se afasta bastante do 3o . e o 1o . quartil. Outra forma de entre eles representa mais de 21 vezes a dist^ ancia entre 3o avaliar essa dist^ ancia e em termos de desvio padr~ ao: s~ ao mais de 8 desvios. O m aximo se destaca junto com outras 2 observa co ~es cujos valores s~ ao: 158 e 176. Antes destas tr^ es o maior valor observado foi 92. Min. 0,00212 1o. Qu. 1,84 Mediana 5,67 M edia 12,9 3o. Qu. 13.3 M ax. 258 vari^ ancia 802,87

Tabela 4.9: Estat sticas descritivas de (a1 ; : : : ; a168 ).

Comparando-a com a Tabela 4.3 que correspondia aos excessos notamos que o m aximo se manteve o mesmo enquanto os tr^ es primeiros quantis caram maiores. A vari^ ancia tamb em aumentou bastante. Para os excessos agregados as dist^ ancias em termos de desvios . quartil diminu . quartis e entre o m . e o 3o ram. aximo e o 3o padr~ oes entre o 1o A Figura 4.10 mostra o histograma e o gr aco da m edia dos excessos de a. Por essa temos uma id eia da forma e do comportamento da cauda da distribui ca ~o de A.
120 Mdia dos Excessos 0 50 100 150 200 250 20 0 40 60 80 100

Probabilidade

0.0

0.02

0.04

0.06

50

100 Limiar u

150

Limiar u

Figura 4.10: Histograma e gr aco da fun c~ ao da m edia dos excessos de (a1 ; : : : ; a168 ). O histograma cou parecido com o relativo aos excessos da Figura 4.5. O que vemos de diferente e uma diminui ca ~o da probabilidade na primeira classe do histograma e que se distribuiu pelas classes seguintes, ou seja, h a uma suaviza ca ~o do decaimento das probabilidades das classes do histograma. J a o gr aco da m edia dos excessos tem crescimento linear de inclina ca ~o maior do que a dos excessos.

61 A Figura 4.11 mostra a esquerda o gr aco proposto em (3.8) e a direita uma proposta de lineariza ca ~o.
5 5 Forma Emprica de V 0 50 a 100 150 0 1 2 3 4

Forma Emprica de V

50

100 a^0,888

150

Figura 4.11: An alise explorat oria da fun c~ ao V da distribui c~ ao (3.7) Ajustamos os m aximos dos conglomerados a uma GPD e obtemos uma estimativa de ^ = 0; 49. Observamos que m axima verossimilhan ca para o par^ ametro de forma que ek o primeiro gr aco j a tem um aspecto linear sugerindo que V (a; ) / a o que nos levaria a um modelo GPD. Considerando a sugest~ ao do artigo de usar a MGPD para ajustar excessos agregados, no segundo gr aco elevamos as estat sticas de ordem an a = 0; 888. O valor para foi obtido no ajuste dos excessos agregados a uma MGPD por m axima verossimilhan ca. A transforma ca ~o leva as maiores observa co ~es a se aproximarem mais de uma suposta reta sobre a qual estariam a maioria dos dados. Com essa transforma ca ~o temos que V (a; ) / a o que levaria a um modelos MGPD. A Tabela 4.10 d a os valores dos par^ ametros das distribui co ~es ajustadas por m axima verossimilhan ca aos excessos agregados. Os valores esperados e as vari^ ancias dos modelos tamb em est~ ao presentes na tabela. Assim como no ajuste feito aos excessos, a estimativa do par^ ametro da GPD tamb em foi maior do que 0,5 o que levou a uma vari^ ancia innita. As estimativas da esperan ca caram todas pr oximas da m edia amostral que e 12,9. Por outro lado as estimativas nitas da vari^ ancia variam de 166,95, obtida para EXP, at e 965,04, para a MGPD. Notamos que a MEXP teva a segunda maior estimativa para a vari^ ancia e a menor para a esperan ca. Enm, observamos para o ajuste de A caracter sticas muito similares a s do ajuste de Y .
(i)

62 ^ 5,5862 6,3939 4,7198 12,921 0,0448 0,5788 ^ 0,3531 0,5081 0,6879 ^ 0,8880 [ E [A] 12,547 12,996 12,287 12,921 12,921 [ V [A] 965,04 1 336,16 166,95 288,44

FA MGPD GPD MEXP EXP GAMA

L-Vero -564,1930 -564,9443 -569,4161 -597,89 -576.8333

Tabela 4.10: Ajustes de (a1 ; : : : ; a168 ) A Tabela 4.11 apresenta o p-valor do teste da raz~ ao das verossimilhan ca para as distribui co ~es que s~ ao casos particulares da MGPD. GPD x MGPD 0,22026 MEXP x MGPD 0,001229 EXP x GPD 0

Tabela 4.11: P-valores dos testes da raz~ ao das verossimilhan cas dos ajustes de (a1 ; : : : ; a168 ). Ao contr ario do obtido no ajuste de Y , a distribui ca ~o GPD n~ ao e rejeitada em favor da MGPD ao n vel de 10%, sequer seria rejeitada ao n vel de 20%. As distribui co ~es MEXP e EXP continuaram a ser rejeitadas ao n vel de 10%. Utilizamos tamb em o crit erio BIC para sele ca ~o, cujos valores est~ ao na Tabela 4.12 de modelos e vericamos que este conrma a escolha que sugere o teste das verossimilhan cas. O menor valor obtido foi para a ditribui ca ~o GPD. MGPD 1134.4 MEXP 1142.8 GPD 1133.9 EXP 1197.8 Gama 1157.7

Tabela 4.12: Crit erio de sele c~ ao de modelos BIC para (a1 ; : : : ; a168 ).

Na Figura 4.12 temos o histograma com as densidades dos ajustes de A e na Figura 4.13 temos os gr acos da fun ca ~o da m edia dos excessos emp rica. Pudemos notar que as quatro maiores observa co ~es caram subestimadas em todas as distribui co ~es consideradas. Como no ajuste dos excessos, a EXP e a GAMA ajustam visivelmente mal os quantis maiores do que 50. Os ajustes da GPD e da MGPD est~ ao mesmo muito parecidos como aponta o teste da raz~ ao das verossimilhan cas.

63

Histograma

0.06

MGPD MEXP GPD EXP GAMA

Probabilidades

0.0 0

0.02

0.04

50

100

150

200

250

Excessos Agregados

Figura 4.12: Histograma com as densidade dos ajustes de (a1 ; : : : ; a168 ).


MGPD MEXP GPD

Ajustado

Ajustado

50 100

50 100

Ajustado 0 50 150 250

50

150

250

0 0

50 100

50

150

250

Observados

Observados

Observados

EXP

GAMA

Ajustado

50 100

Ajustado 0 50 150 250

0 0

50 100

50

150

250

Observados

Observados

Figura 4.13: Qq-plot dos ajustes de (a1 ; : : : ; a168 ).

4.4.4

N umero de Conglomerados C

Para estimar a distribui ca ~o de S pela abordagem A precisamos al em de ajustar A ajustar o n umero de conglomerados por ano C . Nos baseamos numa amosta de tamanho 11, c = (c1 ; : : : ; c11 ), referentes aos 11 anos observados. Como no caso dos excessos, para os

64 excessos agregados tamb em ajustamos uma binomial negativa e uma Poisson a C usando m etodo dos momentos. Obtivemos estimativa para a distribui ca ~o de C tamb em usando a distribui ca ~o emp rica. A m edia e a vari^ ancia amostrais e os par^ ametros ajustados est~ ao l e da Poisson. na tabela abaixo. Os par^ ametros p ^e r ^ s~ ao da Binomial Negativa e ^ M edia 15,273 Vari^ ancia Amostral 22,744 p ^ 0,67151 r ^ 31 ^ l 19,636

Tabela 4.13: Ajuste de (c1 ; : : : ; c11 ). [ [C ] s~ ao iguais a m edia amostral 15,273 tanto para a Poisson como As estimativas E [ [C ] para a BN e igual a vari^ ancia amostral 22,744 enquanto para a BN. A estimativa V que a para a Poisson e igual a m edia amostral 15,273. A Figura 4.14 e um gr aco de barras das distribui co ~es ajustadas a C . Comparada a Figura 4.8 vemos que as dispers~ oes das distribui co ~es Poisson e BN est~ ao bem mais parecidas. Al em disso, a assimetria da BN advinda do ajuste de C e mais acentuada.
Poisson
0.10

BN

0.08

Probabilidade

0.06

Probabilidade 0 5 10 15 n 20 25 30

0.04

0.0

0.02

0.0 0

0.02

0.04

0.06

0.08

10

15 n

20

25

30

Figura 4.14: Histogramas dos ajustes de (c1 ; : : : ; c11 ). A distribui ca ~o emp rica para C e apresentada na Tabela 4.14. S~ ao muito poucas observa co ~es e a distribui ca ~o n~ ao cou com uma forma denida. Isso inviabiliza fazer teste de bondade de ajuste para as distribui co ~es Poisson e BN ajustadas.

65

c P (C = c)

8 0,091

9 0,182

14 0,182

16 0,091

17 0,091

18 0,091

20 0,091

23 0,091

Tabela 4.14: Distribui c~ ao emp rica de (c1 ; : : : ; c11 ).

4.5

Aproxima c~ ao da Distribui c~ ao de S

Raramente conseguimos determinar a express~ ao anal tica para a distribui ca ~o exata de S . Pelas equa co ~es (4.3) e (4.6) vemos que s~ ao duas as diculdades: determinar as express~ oes das convolu co ~es de Y ou de A; e, caso isso seja poss vel, determinar a soma innita das convolu co ~es ponderadas pelas probabilidades de N ou de C respectivamente. Sem a solu ca ~o anal tica o que podemos fazer e calcular o valor aproximado da distribui ca ~o de S . A aproxima ca ~o se d a num sentido num erico por considerar o truncamento da soma innita, considera-se um n umero grande, por em nito, de valores para N ; como tamb em num sentido estoc astico por fazer uso de t ecnicas de simula ca ~o tipo Monte Carlo para obter estimativas das probabilidades de convolu ca ~o de Y nos pontos escolhidos. Nessa se ca ~o vamos nos referir apenas a abordagem Y . O m etodo para a abordagem A e exatamente o mesmo bastando substituir Y por A e N por C . Para facilitar a visualiza ca ~o do problema, escrevemos aqui a equa ca ~o da estimativa que ametros da distribui ca ~o ajustada a o vetor par^ fazemos da equa ca ~o (4.3). Chamando de ^ ^ o vetor de par^ Y e de ametros da distribui ca ~o ajustada a N :

^) + ^) = P ^ (N = 0j ^ (S < sj^ P ;

n=1

nit X

^) ^ (N = nj ^ (Y1 + + Yn < sj^ )P P

(4.7)

onde nit e o n umero m aximo de parcelas consideradas para a proxima ca ~o de S , ou seja, ^ ); ^ (N = nj e o valor que trunca o somat orio das convolu co ~es, P das convolu coes de Y a partir das distribui co ~es ajustadas a Y . Nos casos das distribui co ~es GAMA e EXP, n~ ao e necess ario fazer estimativas das probabilidades das convolu co ~es visto que podemos obt^ e-las analiticamente. Temos que se Pn ao i=1 Yi GAM A(na; b). Como a EXP ( ) Yi GAM A(a; b) para i = 1; : : : ; n, ent~ nada mais e do que uma GAM A(1; 1= ) ent~ ao a convolu ca ~o de ordem n para EXP ( ) n = 0; : : : ; nit, e a

^ (Y1 + + Yn < sj^ ) s~ ao as distribui co ~es probabilidade ajustada a distribui ca ~o de N e P

66 e GAM A(n; 1= ). Por isso para os modelos: YE4, YE5, YE6, AE4, AE5 e AE6; a distribui ca ~o de S e obtida como uma fun ca ~o determin stica dos ajustes, sem a necessidade de aproxima ca ~o. As t ecnicas de simula ca ~o tipo Monte Carlo se utilizam de grandes amostras simuladas f para estimar par^ ametros de uma distribui ca ~o. E acil amostrar de uma distribui ca ~o F se ca ~o que retorna os quantis, e conhecida. Nos a express~ ao da sua fun ca ~o inversa F 1 , fun ao os valores transforbaseamos simplesmente no fato de que se u1 ; : : : ; un U (0; 1) ent~ mados F 1 (u1 ); : : : ; F 1 (un ) F .

A seguir descrevemos o algoritmo para obten ca ~o de pontos da distribui ca ~o de S dadas ^Y de Y e F ^N de N . as distribui co ~es ajustadas F 0. Para inicializar precisamos das seguntes informa co ~es: - s: a seq u^ encia de pontos onde se quer calcular os valores da distribui cao de S . Consideramos uma seq u^ encia de tamanho 100, com separa ca ~o igual entre os pontos, s = (s1 ; : : : ; s100 ) onde s1 = 0 e s100 = 600; ^N , e os par^ - o modelo considerado para ajustar a distribui ca ~o de N , F ametros ajustados; ^Y , e os par^ ametros - o modelo considerado para ajustar a distribui ca ~o de Y , F ajustados; - nit: maior valor que ser a considerado para n. Determina o truncamento da soma innita que dene a distribui ca ~o de S ; - namostra: tamanho das amostras simuladas das convolu co ~es. 1. ns:=comprimento de s; 2. Denimos a vari avel P como um vetor de tamanho ns que conter a a soma das parcelas ^ ^ (S < s) em (4.7). Todos os valores do vetor P iniciam com F que comp~ oe P N (N = ^ ametros estimados que s~ ao 0). Note que sabemos calcular F N (N = 0) com os par^ ^ fornecidos antes de iniciar o algortimo. P := F N (N = 0) 3. Denimos o vetor conv de tamanho namostra que conter a amostras das convolu co ~es. 4. Denimos o vetor pconv de tamanho ns que conter a as estimativas das distribui co ~es nos pontos s.

67 5. n:=1 ^Y (s) para cada valor de s 6. pconv := F ^N (N = n) x pconv; 7. P:= P + F 8. n := n+1; ^Y ; 9. conv := conv + nova amostra de tamanho namostra de F 10. pconv[i] := m edia(conv < s[i]) para i=1,...,n. Cada posi ca ~o de pconv recebe a propor ca ~o de valores menores do que o valor da respectiva posi ca ~o em s. Ou seja, temos uma estimativa tipo Monte Carlo para P (Y1 + + Yn < s); ^N (N = n) x pconv. Note que trabalhamos vetorialmente; 11. P := P + F 12. Repete 8,9,10,11 at e n = nit inclusive. 13. Retorna o vetor P. O vetor P que e o resultado deste algoritmo nos fornece as estimativas para os valores da distribui ca ~o de S nos pontos s. Dados os vetores s e P calculamos as aproxima co ~es ao os valores guardados em P da das derivadas da distribui ca ~o de S nos pontos s que s~ seguinte maneira: Para i=1,...,(ns-1) faz s [i] := (s[i+1] + s[i])/2 P [i] := (P[i+1] - P[i])/(s[i+1] - s[i])

4.5.1

Apresenta c~ ao dos Resultados

Apresentamos os resultados das aproxima co ~es para a distribui ca ~o de S por meio de tabelas e gr acos. As estimativas sobre a distribui ca ~o de S que apresentamos na Tabela [ [S ]; a vari^ ancia, cuja 4.15 se referem ao valor esperado, cuja estimativa chamamos de E [ estimativa chamamos de V [S ]; e aos pr^ emios estat sticos P (S > s) = 10% e P (S > s) = 5% ^0:05 . Os ^0;1 e P que correspondem aos quantis 90% e 95%, cujas estimativas chamamos de P interessante lembrar modelos s~ ao identicados pelos c odigos que est~ ao na Tabela 4.3. E d e tamb em o pr^ emio puro. Os ajustes feitos na Se ca ~o 4.4 foram usados para que ES

[ [ ^0;1 e P ^0;05 s~ determinar os valores de E [S ] e V [S ]. J a os pr^ emios P ao calculados fazendo uso das equa co ~es em (4.7) e de sua an aloga para a abordagem A.

68 [ E [S ] 192.03 187,97 213,05 197,34 197,34 197,34 192.03 187.97 213,05 197,34 197,34 197,34 197,34 [ V [S ] 11.514 6.333,5 1 3.966,6 5.668,3 12.788 13.031 7.787,5 1 5.569,2 7.271 14.391 14.391 ^0;1 P 315.63 297,47 351,93 285.37 303,53 364,03 321.68 303,53 357,98 297.47 309,58 370,08 188,57 ^0;05 P 376.13 339,83 454,79 309.58 333,78 430,59 388.23 351,93 460,84 333.78 351,93 436,64 261,17 [ E [S ] 191.63 187,66 198,51 197,34 197,34 197,34 191,63 187,66 198,51 197,34 197,34 197,34 197,34 [ V [S ] 17.143 7.439,9 10.382 5.099,9 6.955,3 14.739 18.319 8.567,8 11.644 6.347,2 8202.6 15.986 15.986 ^0;1 P 327,73 303,53 339,83 297,47 309,58 297,47 333,78 315,63 345,88 303,53 321.68 303,53 188,57 ^0;05 P 394,28 351,93 424,54 327,73 351,93 370,08 406,38 357,98 430,59 339,83 364.03 370,08 261,17

Modelo YP1 YP2 YP3 YP4 YP5 YP6 YB1 YB2 YB3 YB4 YB5 YB6 YE6

Modelo AP1 AP2 AP3 AP4 AP5 AP6 AB1 AB2 AB3 AB4 AB5 AB6 AE6

Tabela 4.15: Estat sticas das aproxima c~ oes para a distribui c~ ao de S . [ [S ] n~ ao varia com a mudan ca da distribui ca ~o do n umero de parcelas. Na tabela, AE [ [S ] quando isso pode ser vericado ao se encontrar o mesmo valor para as estimativas E se compara modelos cujos c odigos t^ em a primeira e a terceira coordenadas iguais. Isso ocorre porque o m etodo de estima ca ~o usado para essas duas distribui co ~es e o m etodo dos momentos, que imp~ oe que o primeiro momento dessas distribui co ~es coincidam. O que pode ser vericado nas equa co ~es (4.1) e (4.4). Por outro lado, a distribui ca ~o Poisson provoca que [ [ V [S ] e os pr^ emios sejam menores. Por exemplo, no modelo YP2 temos V [S ] = 6:333; 5, ^0;05 = 339; 83 enquanto que no modelo YB2 estes valores s~ ^0;1 = 297; 47 e P P ao maiores, [ [S ] nos modelos com distribui ca ~o iguais a 7.787,5, 303,53 e 351,93 respectivamente. A E das parcelas GAMA ou EXP tem valor igual ao obtido pelos modelos que consideram a [ [ [A] por esses modelos s~ ao iguais a s m edias [Y ] ou E distribui ca ~o Emp rica. Isto porque E amostrais de (y1 ; : : : ; y216 ) e a. [ [ [S ] maior [S ] menor e V Na abordagem A, houve uma tend^ encia dos modelos terem E [ [S ] s~ ao iguais do que na abordagem Y . As excess~ oes caram por conta dos modelos cujas E [ as dos modelos emp ricos YE5 e AE5, nos quais E [S ] = 197; 34 em ambas as abordagens; [ e por conta dos modelos que envolvem a GPD, que na abordagem Y , n~ ao tem E [S ] nita.

69

O efeito nos pr^ emios n~ ao e t~ ao claro, depende da distribui ca ~o escolhida para as parcelas. Alguns modelos apresentaram pr^ emios maiores pela abordagem Y , por exemplo, os pr^ emios de YP3 s~ ao maiores do que os de AP3; e outros pela abordagem A, por exemplo, os pr^ emios de AP2 s~ ao maiores do que os de YP2. O que se pode dizer e que o sentido da desigualdade e o mesmo quando se compara os pr^ emios provindos de uma mesma distribui ca ~o das parcelas. Isso quer dizer que, por exemplo, se os pr^ emios do modelo YP2 s~ ao menores do que os de AP2, ent~ ao os de YB2 s~ ao menores do que os de AB2. A Tabela 4.16 mostra os pr^ emios obtidos pelas aproxima co ~es normais. Modelo YP1 YP2 YP3 YP4 YP5 YP6 YB1 YB2 YB3 YB4 YB5 YB6 YE6 ^0;1 P 329,54 289,96 6 9 278,06 293,83 342,27 359,42 298,20 329,09 288,86 304,22 351,08 351,08 ^0;05 P 368,52 318,87 6 9 300,94 321,18 383,35 406,99 329,54 366,11 314,81 334,52 394,66 394,66 Modelo AP1 AP2 AP3 AP4 AP5 AP6 AB1 AB2 AB3 AB4 AB5 AB6 AE6 ^0;1 P 338,32 301,06 6 9 292,98 306,62 242,51 365,08 306,28 336,8 299,44 359,38 359,38 359,38 ^0;05 P 379,79 333,12 6 9 320,09 337,60 286,62 414,26 339,91 376,0 328,39 405,31 405,31 405,31

Tabela 4.16: Pr^ emios das aproxima c~ oes pela normal para a distribui c~ ao de S . Na pr atica, a forma mais comum de se obter uma distribui ca ~o para S e fazendo uso da aproxima ca ~o assint otica que citamos na Se ca ~o 4.2. Podemos usar essa aproxima ca ~o quando [ [ [C ] n~ ao [N ] e E ajustamos a distribui ca ~o Poisson ou BN a N ou C . Devido ao fato de E serem valores grandes, n~ ao esperamos que as aproxima co ~es quem boas. Nos modelos YP3 e AP3 n~ ao conseguimos obter as aproxima co ~es assint oticas para a distribui ca ~o de S porque as estimativas das vari^ ancia de S s~ ao de valores innitos. Pela aproxima ca ~o normal os pr^ emios quase sempre cam subsetimados em rela ca ~o as aproxima co ~es que obtemos para

70 a distribui ca ~o exata de S . As Figuras 4.15 e 4.16 mostram gr acos dos pr^ emios versus os percentis.

YP_
100 200 300 400 500 600 MGPD GPD MEXP EXP GAMA Prmio 100 200 300 400 500 600

YB_
MGPD GPD MEXP EXP GAMA

Prmio

0.0

0.2

0.4

0.6

0.8

1.0

0 0.0

0.2

0.4

0.6

0.8

1.0

Probabilidade

Probabilidade

Figura 4.15: Pr^ emios pela abordagem Y .

AP_
100 200 300 400 500 600 MGPD GPD MEXP EXP GAMA Prmio 100 200 300 400 500 600

AB_
MGPD GPD MEXP EXP GAMA

Prmio

0.0

0.2

0.4

0.6

0.8

1.0

0 0.0

0.2

0.4

0.6

0.8

1.0

Probabilidade

Probabilidade

Figura 4.16: Pr^ emios pela abordagem A. Nesses gr acos podemos visualisar como crescem os pr^ emios em rela ca ~o aos percentis. Notamos que as aproxima co ~es para os pr^ emios s~ ao mais parecidas nos modelos que envolvem a distribui ca ~o Poisson do que nos modelos que envolvem a distribui ca ~o BN. O mais interessante de observar nestes gr aco e que por volta da probabilidade 0,8 os pr^ emios que consideram as distribui co ~es MGPD e GPD passam a ser maiores dos que os pr^ emios das outras distribui co ~es, caracter stica das distribui co ~es de valores extremos.

71 As Figuras 4.17, 4.18 e 4.19 mostram as aproxima co ~es das densidades de S pela abordagem Y e A. Nos gr acos das Figuras 4.18 as curvas relativas a MGPD e a GPD s~ ao t~ ao parecidas que uma praticamente se sobrep~ oe a outra.

YP_
0.006 MGPD MEXP GPD EXP GAMA 0.006

YB_
MGPD MEXP GPD EXP GAMA

0.004

Densidade

0.002

Densidade 600

0.0

100

200

300 s

400

500

0.0 0

0.002

0.004

100

200

300 s

400

500

600

Figura 4.17: Aproxima c~ oes para a densidade de S pela abordagem Y .

AP_
0.006 MGPD MEXP GPD EXP GAMA 0.006

AB_
MGPD MEXP GPD EXP GAMA

0.004

Densidade

0.002

Densidade 600

0.0

100

200

300 s

400

500

0.0 0

0.002

0.004

100

200

300 s

400

500

600

Figura 4.18: Aproxima c~ oes para a densidade de S pela abordagem A. A distribui ca ~o que se destaca em ambas as abordagens e a EXP: a moda cou mais para a direita e com densidade maior. Na Figura 4.19, os modelos YE5 e AE5 produziram aproxima co ~es muito ruins para

72

Y_6
0.015 Emprica BN Poisson Densidade 0.015

A_6
Emprica BN Poisson

0.010

Densidade

0.005

0.0

100

200

300 s

400

500

600

0.0 0

0.005

0.010

100

200

300 s

400

500

600

Figura 4.19: Aproxima c~ oes para a densidade de S pelas abordagens Y e A. S . J a os outros modelos caram parecidos com os das guras anteriores a menos de uma \onda" que aparece nas caudas entre os valores 300 e 400 de S .

4.6

Aumento Articial do Tamanho dos Conglomerados


Os resultados das abordagens Y e A caram muito parecidos em fun ca ~o, provavel-

mente, da tend^ encia de aglomera ca ~o de excedentes ser muito pequena: o n umero m edio de excessos nos conglomerados da amostra a e apenas 1,29. Por meio de simula ca ~o, investigamos o que aconteceria se essa tend^ encia fosse maior. Nos baseamos nos excessos acima de u observados na s erie de sinistros de inc^ endio. Distribu mos os valores y1 ; : : : ; y216 de (y1 ; : : : ; y216 ) em conglomerados de tamanhos gerados pela dstribui ca ~o Poisson. Fizemos esse procedimento duas vezes: uma com o par^ ametro da Poisson igual a 2 e outra com = 3. Assim obtivemos duas novas amostras de excessos agregados cujas aproxima ca ~o que produziram para a distribui ca ~o de S comparamos aos resultados obtidos por a. Chamamos de a2 = (a21 ; : : : ; a2n2 ) a amostra de excessos agregados cujos tamanhos dos conglomerados seguem uma Poisson (2) e de a3 = (a31 ; : : : ; a3n3 ) aquela cujos tamanhos dos conglomerados seguem uma Poisson (3). O processo de obten ca ~o desses novos excessos agregados segue os passos descritos abaixo: 1. mantemos a seq u^ encia original da amostra de excessos de sinistros, (y1 ; : : : ; y216 );

73 2. geramos duas amostras de tamanhos de conglomerados: t2 = (t21 ; : : : ; t2n2 ) vinda ca ~o de uma distribui ca ~o Poisson (2) e t3 = (t31 ; : : : ; t3n3 ) vinda de uma distribui Poisson (3). Cada uma tem observa co ~es geradas at e que a soma de seus elementos seja maior ou igual a 216, que e o n umero total de excessos. Dessa forma s~ ao denidos n2 e n3, os tamanhos das amostras t2 e t3. Se a soma ultrapassar 216 ent~ ao o u ltimo conglomerado tem seu tamanho determinado pelo n umero de excessos que restaram; 3. O tamanho das amostras de A2 e A3 s~ ao iguais a n2 e n3 respectivamente. A e a soma dos t21 primeiros elementos de (y1 ; : : : ; y216 ), a primeira observa ca ~o a21 e que soma dos t22 seguintes elementos de (y1 ; : : : ; y216 ) produz a a22 e assim vai at a2n2 e a soma dos u ltimos t2n2 elementos de (y1 ; : : : ; y216 ). De maneira an aloga obtemos A3. O n umero de observa co ~es de a2 foi 102 e de a3 foi 74. Determinando a2 e a3 da maneira descrita camos sem poder contar quantos conglomerados ocorreram em cada ano. Para contornar este problema ajustamos apenas a Poisson ao n umero de conglomerados por ano que chamamos de C 2 e C 3. Fazemos isso porque o ajuste da Poisson s o necessita do primeiro momento amostral que s o depende do n umero total de conglomerados e do n umero de anos observados, que s~ ao valores de que dispomos. A estimativa do par^ ametro que obtivemos para C 2 foi 9,2727 e para C 3 foi 6,7273. A tabela abaixo apresenta um resumo das estat sticas de a2 e a3. Min. a2 a3 0.0383 0.206 1o. Qu. 3.03 6.95 Mediana 10.1 17.3 M edia 21.3 29.3 3o. Qu. 23.5 36.6 M ax. 263 274 Vari^ ancia 1303.9 1667.6

Tabela 4.17: Estat sticas descritivas de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ).

Os valores dessa tabela s~ ao razoavelmente maiores do que os da Tabela 4.9 referente a justamente o que esper A. E avamos que acontecesse, pois o efeito da maior concentra ca ~o de excedentes provoca que a amostra de excessos agregados contenha observa co ~es de valores maiores. Na Figura 4.20 temos os histogramas de a2 e a3 e na Figura 4.21, os gr acos das fun co ~es da m edia dos excessos. Notamos nos histogramas que para os menores valores de excesso agregado a maior conglomera ca ~o parece suavizar o decaimento das probabilidades

74 das classes dos histograma. Vemos tamb em que as maiores observa co ~es caram ainda maiores. Em a2 as observa co ~es que ultrapassaram o valor 100 foram: 262,77, 162,16 e 157,38; e em a3 foram: 274,09, 158,10 e 151,07.
A2 A3

0.03

Probabilidades

Probabilidades 0 50 100 150 200 250

0.01

0.0

0.0

0.005

0.010

0.015

0.02

0.020

0.025

50

100

150

200

250

Excessos Agregados

Excessos Agregados

Figura 4.20: Histogramas de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ).


A2
100

A3

Mdia dos Excessos

80

Mdia dos Excessos 0 50 Limiar u 100 150

60

40

20

40 0

60

80

100

50 Limiar u

100

150

Figura 4.21: Gr aco da fun ca ~o da m edia dos excessos de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). A tend^ encia de crescimento nos gr acos das fun co ~es da m edia dos excessos repete a observada no gr aco relativo a a na Figura 4.10. Em a2 a apar^ encia linear ainda e evidente, mas em a2 se desenha uma curva suavemente convexa. A Tabela 4.18 d a os valores dos par^ ametros das distribui co ~es ajustadas a a2 e a3. As

75 estimativas dos valores esperados e das vari^ ancias das distribui co ~es tamb em s~ ao apresentados na tabela. Dist. A2 MGPD MEXP GPD EXP GAMA Dist. A3 MGPD MEXP GPD EXP GAMA L-Vero -401,7 -404,2498 -401,7462 -413,903 -407,0214 L-Vero -320,91 -322,5315 -321,0675 -324,029 -323,2334 ^ 11,138 8,7275 12,0690 21,282 0,0310 ^ 27,586 17,2122 22,2414 29,335 0,02862 0,8395 0,2379 0,6601 ^ 0,3345 ^ 1,0862 0,8633 0,4517 ^ 0,3966 ^ 0,9586 0,7571 [ E [A] 21,686 20,659 22,013 21,282 21,282 [ E [A] 29,308 29,112 29,186 29,335 29,335 [ V [A] 3.306,1 764,89 5.018,6 452,93 686,16 [ V [A] 2.629,3 1.145,1 1.625,1 860,53 1.025,1

Tabela 4.18: Ajustes de (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). Notamos que o aumento do tamanho dos conglomerados fez aumentar as estimativas ^ encontrados na do par^ ametro das distribui co ~es MGPD e MEXP. Se comparadas aos Tabela 4.10 estes novos valores s~ ao mais pr oximos de 1. Isso vai contra nossa id eia de que t nhamos de como o par^ ametro pudesse reetir o n vel de conglomera ca ~o dos dados. Como quanto menor a conglomera ca ~o os excessos agregados cam mais parecidos com os excessos, imaginamos que quanto menor a conglomera ca ~o ter amos m ais pr oximo de 1. Isso porque = 1 e uma GPD, que e justamente a distribui ca ~o de assint otica para os excessos sob as condi co ~es descritas na Se ca ~o 2.2. A Tabela 4.19 apresenta o p-valor do teste da raz~ ao das verossimilhan cas para as distribui co ~es que s~ ao casos particulares da MGPD. GPD x MGPD a2 a3 0.76579 0.57938 MEXP x MGPD 0.023983 0.072065 EXP x GPD 0 0.014937

Tabela 4.19: P-valores dos testes da raz~ ao das verossimilhan cas dos ajustes de (a21 ; : : : ; a2102 ) e
(a31 ; : : : ; a374 ).

76 Vemos que novamente ao n vel de 10% a hip otese da MEXP e rejeitada em rela ca ~o a MGPD assim como a EXP em rela ca ~o a GPD. No entanto, para estas amostras que envolvem congloremados maiores dos que os de a foi bem maior a evid^ encia de que a contribui ca ~o que a MGPD tr as ao ajuste e pouco signicativa em rela ca ~o a GPD. Ou seja, aceitamos com mais evid^ encia a distribui ca ~o GPD. Os gr acos de ajuste de a2 e a3 est~ ao nas Figuras 4.22,4.23,4.24 e 4.25.
0.05 MGPD MEXP GPD EXP GAMA

Probabilidades

0.0 0

0.01

0.02

0.03

0.04

50

100

150

200

250

Excessos Agregados

Figura 4.22: Histograma com densidades de (a21 ; : : : ; a2102 ).


MGPD MEXP GPD

Ajustado

Ajustado

50 100

50 100

Ajustado 0 50 150 250

50

150

250

0 0 50

50 100

150

250

Observados

Observados

Observados

EXP

GAMA

Ajustado

50 100

Ajustado 0 50 150 250

0 0 50

50 100

150

250

Observados

Observados

Figura 4.23: Qq-Plots de (a21 ; : : : ; a2102 ).

77

0.030

MGPD MEXP GPD EXP GAMA

Probabilidades

0.0 0

0.005

0.010

0.015

0.020

0.025

50

100

150 Excessos Agregados

200

250

Figura 4.24: Histogramas com densidades dos ajustes de (a31 ; : : : ; a374 ).


MGPD MEXP GPD

Ajustado

Ajustado

50 100

50 100

Ajustado 0 50 150 250

0 50

150

250

0 0 50

50 100

150

250

Observados

Observados

Observados

EXP

GAMA

Ajustado

50 100

Ajustado 0 50 150 250

0 0 50

50 100

150

250

Observados

Observados

Figura 4.25: Qq-plots dos ajustes de (a31 ; : : : ; a374 ). O que se pode notar de diferente entre esses gr acos de ajuste e aqueles que dizem respeito a, nas Figuras 4.12 e 4.13, e que as distribui co ~es cam mais parecidas a medida que a concentra ca ~o de excessos aumenta. Na Figura 4.24 a curva da GPD chega a desaparecer sobreposta pela MGPD. A Tabela 4.20 mostra as estimativas da esperan ca e da vari^ ancia e os pr^ emios resultados das aproxima co ~es para a distribui ca ~o de S baseadas nos ajustes feitos para a2 e a3.

78

A2 Dist. Parcelas MGPD GPD MEXP EXP GAMA Emp rico [ E [S ] 201.09 204.12 269.95 197.34 197.34 197.34 [ V [S ] 35.018 11.050 51.029 8.399,8 10.562 16.291 ^0;1 P 370.08 370.08 333.78 321.68 339.83 382.18 ^0;05 P 460.84 472.94 394.28 370.08 388.23 448.74 [ E [S ] 197.16 195.84 196.34 197.34 197.34 197.34 [ V [S ]

A3 ^0;1 P 364.03 357.98 364.03 345.88 351.93 382.18 ^0;05 P 442.69 418.48 436.64 400.33 412.43 454.79

23.467 13.405 16.663 11.578 12.685 17.007

Tabela 4.20: Estat sticas das aproxima c~ oes da distribui c~ ao de S usando as amostras a2 e a3. [ [S ] tamb em aumenta, Obviamente a medida que a concentra ca ~o dos excessos aumenta E [ [S ] visto que tende a ser maior o n umero de parcelas que comp~ oe cada excesso agregado. V tamb em v~ ao cando maiores com a concentra ca ~o dos excessos e o mesmo se v^ e para os pr^ emios. Nas amostras a2 e a3 houve a vantagem de todas as distribui co ~es ajustadas terem [ [S ] nos modelos que fazem uso esperan ca e vari^ ancia nitas. Assim podemos comparar a V [ da MGPD e da GPD e ver que nos primeiros V [S ] s~ ao maiores do que nos segundos. Al em [ [S ]. disso, quanto maior a conglomera ca ~o maiores foram os valores encontrados para V

A2
100 200 300 400 500 600 MGPD GPD MEXP EXP GAMA 100 200 300 400 500 600 MGPD GPD MEXP EXP GAMA

A3

Densidade

Densidade 0.6 s 0.8 1.0

0.0

0.2

0.4

0 0.0

0.2

0.4 s

0.6

0.8

1.0

Figura 4.26: Pr^ emios versus probabilidade usando as amostras (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). Os gr acos da Figura 4.26 que fornece uma forma de visualisar os pr^ emios mostra que tamb em para as amostras a2 e a3 os pr^ emios pela MGPD e pela GPD tamb em ultrapassam os das demais distribui co ~es por volta da probabilidade 0,8. O que surpreende nesta gura e como os pr^ emios caram parecidos para a amostra a3. Na Figura 4.27 das

79 aproxima co ~es para a densidade de S , a semelhan ca entre as distribui co ~es tamb em cam muito claras.

A2
0.006 0.006

A3

0.004

Densidade

0.002

Densidade

0.0

100

200

300 s

400

500

600

0.0

0.002

0.004

MGPD GPD MEXP EXP GAMA

MGPD GPD MEXP EXP GAMA

100

200

300 s

400

500

600

Figura 4.27: Gr aco da densidade de S por (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ). Pelo gr aco abaixo podemos comparar os resultados obtidos para A, A2 e A3.

MGPD
0.006 A A2 A3 Densidade 0.006

Emprica
A A2 A3

0.004

Densidade

0.002

0.0

100

200

300 s

400

500

600

0.0 0

0.002

0.004

100

200

300 s

400

500

600

Figura 4.28: Gr acos de compara c~ ao das aproxima c~ oes para a densidade de S resultantes
das amostras (a1 ; : : : ; a168 ), (a21 ; : : : ; a2102 ) e (a31 ; : : : ; a374 ) usando as distribui c~ oes MGPD e Emp rica para A.

Fica claro que a maior concentra ca ~o de excessos causa o efeito de aumentar a dispers~ ao da distribui ca ~o de S .

4.7

Excessos Al em de Um Limiar Mais Alto

A m de estudar a inu^ encia das maiores observa co ~es na distribui ca ~o de S consideramos um limiar mais alto U = 30 e determinamos aproxima co ~es para a distribui ca ~o do

80 montante de excessos acima de U , que chamamos de S . Comparamos os pr^ emios obtidos para a distribui ca ~o de S com os obtidos para S para olhar a propor ca ~o que os segundos representam dos primeiros e com isso ter uma id eia de como as maiores observa co ~es afetaram os pr^ emios para o montante de excessos. Os excessos acima de U chamamos de Y . Para Y obtivemos a amostra de 15 excessos
; : : : ; y ). Os excessos coincidem com os excessos agregados porque n~ ao se formou y = (y1 15

conglomerado com mais de uma observa ca ~o maior do que U . As nota co ~es usada nessa se ca ~o s~ ao as mesmas usadas anteriormente acrescidas de *. O n umero t~ ao pequeno de observa co ~es inviabiliza um tratamento n~ ao param etrico a s em podemos consider a-lo para os c alculos da esperan ca e da distribui co ~es de Y e N . Por vari^ ancia de S . A Tabela 4.21 apresenta um resumo das estat sticas de y . Min. 1.06 1o. Qu. 6.15 Mediana 17 M edia 42.9 3o. Qu. 31.6 M ax. 233 Vari^ ancia 3923.2

Tabela 4.21: Estat ; : : : ; y15 sticas descritivas de (y1 ).

A vari^ ancia de y e enorme comparada a de (y1 ; : : : ; y216 ). Nessa amostra, a caracter stica da exist^ encia de muitas observa co ~es pequenas e algumas que distoam n~ ao e mais t~ ao acentuada porque o n umero de grandes observa co ~es passou a representar uma propor ca ~o muito maior na amostra. Com isso a dist^ ancia entre o m aximo e o terceiro quartil e de n~ ao mais que 3,5 desvios padr~ oes contra os mais de 10 desvios da amostra de (y1 ; : : : ; y216 ). O histograma e o gr aco da m edia dos excessos de y que aparecem na Figura 4.29 continuam mostrando a necessidade de distribui ca ~o de cauda pesada para ajustar aos dados. No histograma, apesar de as u ltimas classes s o terem uma observa ca ~o, as alturas delas s~ ao bem altas em fun ca ~o do pequeno n umero de observa co ~es e y .

81
Histograma
0.03 120

Mdia dos Excessos

Mdia dos Excessos 0 50 100 150 200

0.02

0.01

0.0

60 0

80

100

20

40

60 Limiar u

80

100

120

Limiares U

Figura 4.29: Histograma e gr ; : : : ; y15 aco da fun ca ~o da m edia dos excessos de (y1 ).

Na Tabela 4.22 est~ ao os resultados dos ajustes de y . As distribui co ~es MGPD e GPD ao bem ajustadas n~ ao t^ em vari^ ancia nita. A vari^ ancia e a esperan ca estimadas para Y s~ maiores do que as de Y que aparecem na Tabela 4.4. FY MGPD MEXP GPD EXP GAMA L-Vero -69,25 -69,63 -69,26 -71,38 -70,05 ^ 21,21 11,82 19,24 42,90 0,015 0,62 0,66 ^ 0,76 ^ 1,05 0,70 E [Y ] 62,94 42,01 56,36 42,90 42.90 V [Y ] 1 5.364 1 1.840,7 2.947,9

Tabela 4.22: Ajustes de (y1 ; : : : ; y15 ).

As Figuras 4.30 e 4.31 mostram o histograma com as densidades e os qq-plots das


; : : : ; y ). Principalmente nos qq-plots percebemos que as distribui co ~es ajustadas a (y1 15

observa co ~es maiores inuenciam muito no ajuste fazendo com que as observa co ~es menores cassem sobrestimadas.

82
Histograma

0.03

MGPD MEXP GPD EXP GAMA

Probabilidades

0.0 0

0.01

0.02

50

100

150

200

Excessos Agregados

Figura 4.30: Histograma com densidade dos ajustes de (y1 ; : : : ; y15 ).

MGPD

MEXP

GPD

Ajustado

Ajustado

50 100

50 100

Ajustado 0 50 100 Observados 200

50 100 Observados

200

0 0

50 100

50 100 Observados

200

EXP

GAMA

Ajustado

50 100

Ajustado 0 50 100 Observados 200

0 0

50 100

50 100 Observados

200

Figura 4.31: Qq-plot dos ajustes de (y1 ; : : : ; y15 ).

A Tabela 4.23 mostra os resultados para as aproxima co ~es da distribui ca ~o de S provinda dos ajustes. [ ^0;1 e P ^0;05 dessa tabela s~ [S ], P ao contrastados aos apresentados na Tabela Os valores E oes interessantes 4.15 para os modelos YP . Com isso podemos podemos chegar a conclus~

83 [ E [S ] 85.83 57.29 76.86 58.50 58.50 [ V [S ] 1 7.486,9 1 5.020,1 6.529,8 ^0;1 P 164,36 164,36 164,36 158,31 170,41 ^0;05 P 285,37 230,92 273.27 206,72 224,87

FY MGPD MEXP GPD EXP GAMA

Tabela 4.23: Estat sticas das aproxima c~ oes para a distribui c~ ao de S . sobre a import^ ancia dos excessos acima de U nos pr^ emios para S . Por exemplo, no modelo com a MGPD U. A Figura 4.32 mostra os pr^ emios para o montante de excessos al em de U versus as probabilidades.
85;828 192;03

= 44; 695% do pr^ emio puro para S seria devido aos excesso acima de

600

MGPD MEXP GPD EXP GAMA

Prmio

100

200

300

400

500

0.4

0.6 Probabilidade

0.8

1.0

Figura 4.32: Pr^ emios para S . Comparando-o a Figura 4.15 vemos que a forma do gr aco mudou. Nessa gura aqui, as fun co ~es s~ ao sempre convexas enquanto que na gura anterior, para as menores probabilidades a fun ca ~o e c^ oncava. Al em disso, a probabilidade em que os pr^ emios pelos modelos MGPD e GPD ultrapassam os pr^ emios dos outro modelos e por volta de 0,9 enquanto que antes era por volta de 0,8. A Figura 4.33 mostra as aproxima co ~es das densidades dos montante de excessos de

84 sinistros acima de U . As densidades obtidas s~ ao descrescentes em todos os pontos difee atingir rentemente daquelas dadas na Figura 4.17 para os modelos YP , que cresciam at uma moda para um valor de s entre 100 e 200 e depois decresciam.

0.015

Densidade

0.0

0.005

0.010

MGPD MEXP GPD EXP GAMA

100

200

300 s

400

500

600

Figura 4.33: Densidades das aproxima c~ oes de S .

Cap tulo 5

Conclus~ ao
Neste trabalho estudamos a distribui ca ~o do montante de excessos de sinistros por ano, S , que e a vari avel fundamental no c alculo dos pr^ emios de resseguro do tipo excesso de danos. A forma cl assica de tratar esse montante e usando o modelo de riscos homog^ eneos e dividindo o problema em duas partes: o estudo do n umero de excessos por ano e o estudo da distribui ca ~o dos excessos. Esse modelo imp~ oe a restri ca ~o de independ^ enicia entre os excessos, o que pode n~ ao ser vericada em carteiras de seguros. Nossa proposta para contornar o problema de estrutura de depend^ encia local dos excessos foi olhar para o montante de excessos de sinistros como a soma no ano dos excessos agregados nos conglomerados. Ao somar as observa co ~es dependentes disfazemos uma estrutura de depend^ encia local dos dados. Obtivemos aproxima co ~es para a distribui ca ~o de S de uma carteira de inc^ endio utilizando duas abordagens: a pelos excessos, que chamamos de Y , e a pelos excessos agregados que chamamos de A. Nosso maior objetivo nessa aplica ca ~o era comparar as aproxima co ~es produzidas por cada abordagem. Estudamos a distribui ca ~o dos excessos agregados com base no resultado obtido em Anderson e Dancy [1992]. Nesse artigo, a medida do excesso agregado foi usada para medir a severidade de eventos extremos em s eries ambientais. Para esse tipo de s erie chegou-se a sugest~ ao de que os excessos agregados poderiam ser bem ajustados por uma distribui ca ~o MGPD. Um de nossos maiores objetivos era vericar se a MGPD se ajustava bem aos excessos agregados de sinistros. A distribui ca ~o MGPD se mostrou adequada para o ajuste dos excessos agregados dos dados que analisamos. No entanto, seu caso particular, a GPD, se mostrou suciente: o

85

86 teste da raz~ ao das verossimilhan cas aceitou a GPD ao n vel de 10%. Dois aspectos s~ ao interessantes de destacar. O primeiro e que o gr aco da forma de V (fun ca ~o que aparece na distribui ca ~o limite dos excessos agregados), que e usado por Anderson e Dancy [1992] para determinar uma distribui ca ~o para o excesso agregado em um particular exemplo ligado uma s erie ambiental, tamb em conseguiu identicar a MGPD e a GPD para o ajuste dos excessos agregados dos sinistros. O segundo e que a medida que aumentamos os tamanhos dos conglomerados, a GPD foi se mostrando cada vez mais apropriada pelo teste da raz~ ao das verossimilhan cas em que a hip otese alternativa era a MGPD. Foi interessante notar que a MGPD tamb em se ajustou bem aos excessos. Inclusive o teste de raz~ ao de verossimilhan cas rejeitou a GPD em favor da MGPD ao n vel de signic^ ancia de 10%. Isso nos leva a sugerir o uso da MGPD para excessos quando a amostra apresentar os maiores valores muito maiores do que os medianos e concentra ca ~o muito grande de pequenos valores. Em casos assim a GPD n~ ao se ajusta muito bem. Os modelos que consideram a GPD e a MGPD para os ajustes das parcelas de S levam aos maiores pr^ emios apenas quando se considera probabilidades pequenas do montante de sinistros ultrapassar o pr^ emio, pr oximas ou menores do que 0,2. Essa caracter stica e esperada pelas distribui co ~es da teoria de valores extremos. O que vimos ent~ ao e que distribui co ~es das parcelas com caudas pesadas levaram a distribui co ~es de S tamb em com caudas pesadas. As aproxima co ~es das distribui co ~es de S pela abordagem A resultaram em densidades com m edias menores, mais dispersas e mais assim etricas para a direita do que as resultantes pela abordagem Y . Esse efeito cou mais acentuado quando aumentamos articialmente os tamanhos dos conglomerados. Entendemos que essa abordagem de considerar o excesso agregado no lugar do excesso e muito interessante porque amplia a classe dos problemas que pode tratar a teoria do risco coletivo e n~ ao prejudica a an alise quando se est a lidando com excessos sem ou com pouca tend^ encia de conglomera ca ~o. Na aplica ca ~o que estudamos utilizamos crit erios para separar os conglomerados baseados totalmente nas observa co ~es. No entanto, em aplica co ~es reais os conglomerados podem ser identicados de maneiras relacionadas a natureza dos dados, ao problema com o qual se est a trabalhando ou a informa co ~es que s~ ao obtidas al em da s erie de sinistros. Para

87 que o montante de excessos possa ser denido como a soma dos excessos agregados e o modelo de riscos homog^ eneos possa ser usado e preciso garantir certas caracter sticas dos conglomerados: todos os excedentes tem que estar em um conglomerado; a separa ca ~o entre os conglomerados precisa garantir a independ^ encia entre eles; e h a de se ter a preocupa ca ~o em homogeneizar a distribui ca ~o dos excessos agregados, valendo para tal o uso de t ecnicas que retirem tend^ encia e sazonalidade dos dados. Faremos uma extens~ ao desse trabalho considerando dados simulados. Com isso poderemos estudar com mais detalhes como essas metodologias com que trabalhamos se comportam diante de diversos tipos de conglomerados. Consideraremos modelos de s eries temporais bem conhecidos como, por exmplo, o modelo GARCH. Tamb em analisaremos depend^ encia causada por um processo por detr as do processo observado, o que se aproximaria mais da forma como vemos a possibilidade de ocorr^ encia de conglomerados em s eries de sinistros. Lembrando, em s erie de sinistros vemos que a possibilidade de ocorr^ encia de conglomerados se daria em fun ca ~o de eventos catastr ocos que aumentariam a probabilidade de sinistros em certos per odos no tempo. Outras extens~ oes deste estudo podem seguir, por exemplo, no sentido de explorar t ecnicas de identica ca ~o de conglomerados seguidas da an alise dos excessos agregados; ou estudar dados de outros tipos de carteiras de seguros com outro comportamento de extremos; ou incluir efeitos de tend^ encia e sazonalidade nos modelos; ou simplesmente repetir o estudo que zemos em outro contexto que n~ ao o de atu aria nem o de meio ambiente.

Refer^ encias Bibliogr acas

Anderson, C. W. \The Aggregatte Excess Measure of Severity of Extreme Events". Journal of Reseach of the National Institute of Standards and Technology 99, 555-561, 1994.

Anderson, C. W. e Dancy,G. P. \The severity of extreme events". Research Report (24 pag) 92/593 Department of Probability and Statistic, University of Sheeld, 1992. Bickel, P. e Doksum, K. Mathematical Statistics: Basic Ideas and Topics. University of California, Berkeley, 2001. Bowers, N. L., Jr., Gerber, H. U., Hickman, J. C. , Jones, D. A. e Nexbitt, C. J. Actuarial Mathematics. Society of Actuaries, Illinois, 1986. Coles, S. G. \On goodness of t tests for the two-parameter Weibull distribuition derived from the stabilized probability plot". Biometrika 76, 593-598, 1989. Embrechts, P., Kl uppelberg, C. e Mikosch, T. Modelling Extremal Events for Insurence and Finance. Springer-Verlag, Berlim, 1997. Hsing, T. \On the characterization of certain point processes". Stoch. Processes Appl. 26, 297-316, 1987. James, B. R. Probabilidade: Um Curso em N vel Intermedi ario. Projeto Euclides - IMPA, Brasil, 1996. Leadbetter, M., Lindgren, G. and Rootz en, H. Extremes and Related Properties of Random Sequences and Processes. Springer-Verlag, Berlim, 1983. Mendes, B. V. A Teoria dos Valores Extremos e Aplica co ~es em Finan cas. Editora Atlas, Brasil, 2002.

88

89 Michael, J. R. \The stabilized probability plot". Biometrika 70, 11-17, 1983. Migon, H. S. e Gamerman, D. Statistical Inference: an Integrated Approach. Arnold , Londres, 1999. Mori, T. \Limit distribution of two-dimensional point processes generated by strongmixing sequences". Yokohama Math. J. 25, 155-168, 1977. Reiss, R. -D. e Thomas, M.Statistical Analysis of Extreme Values. Birkh auser-Verlag, Basel-Boston-Berlim, 1997.

Você também pode gostar