Você está na página 1de 619
CARLOS DANIEL PAULINO - M. ANTONIA AMARAL TURKMAN, BENTO MURTEIRA - GIOVANIL. SILVA ESTATISTICA BAYESIANA 2.4 edigéo revista e ampliada h(@}x) o f(x}6) h(0) \ f0) FUNDACAO CALOUSTE GULBENKIAN Prefacio 4 Segunda Edigao E oportuno e legitimo registar-se que finalmente surge a ha muito aguardada 2* edicao deste livro, dado terem transcorridos 15 anos desde a publicagio da 1* edigao, que rapidamente se esgotou no seio da comunidade cientifica capaz de entender a lingua portuguesa escrita. Deven-se este longo interhidio fundamentalmente aos seguintes motivos. Por um. lado, & nossa recusa em permitir simples reimpress6es numa época em que 0 con- timuado desenvolvimento e expansio do uso da Estatistica Bayesiana jé requeria a preparagio de uma compatfvel 2* edigdio. Por outro, as sucessivas vicissitudes decor- rentes de persistentes ocupages dos autores profissionalmente ativos perante diversas solicitagdes. Mesmo com o alargamento da equipa autoral, s6 agora se considerou terem sido atingidos os propésitos tragados para o aperfeigoamento ¢ ampliagao desta nova edigao, de modo a torné-la mais proveitosa ¢ atrativa para uma mais alargada audiéncia. As mudangas operadas nesta nova edigio sio, para além da introdugao de correcdes de natureza diversa, sistematizaveis em expansio, ampliagio e reorganizagao. O gran de cobertura de tépicos foi significativamente expandido sendo coneretizagées disto 0s topicos de inidentificabilidade e suas implicagGes inferenciais (no novo Capitulo 8), abordagem INLA (no Capitulo 5), avaliagio de modelos (nos novos Capitulos 8 e 10) e métodos de simulagio MCMG (nos novos Capitulos 9 10). O reforgo da componente pratica foi nomeadamente conseguido ampliando subs- tancialmente o mimero de exemplos de ilustragao e problemas de aplicagio ao longo do texto, com destaque para os novos Capitulos 9, 10 e 11. Em particular, este til- timo capitulo esgota-se na deserigao de alguns casos de estudo, oriundos de diversos dominios de aplicagdo, em que algum de nés esteve envolvido. Preocupacées didaticas justificaram a reorganizagéo de material antigo e novo, © que incluiu a deslocagio de material dos anteriores Capitulos 3 ¢ 6 para 0 novo Capitulo 8, 0 rearranjo aqui de tépicos de critica, selegio e comparagéo de modelos € a subdivisio do material expandido de MCMC pelos novos Capitulos 9 e 10. Além disso, optou-se por uma estruturagdo de questdes mais especificas em notas separadas, geralmente remetidas para o fim de capitulos, como forma de propiciar uma leitura mais fluida dos assuntos de interesse de cada leitor em momento préprio. Esta 28 edicdo apresenta ainda outros instrumentos que contribuem para um es- tudo mais eficaz do livro por parte de uma audiéncia interessada, que prevemos bas- tante heterogénea na sua formagiio de base ¢ prossecucio de objetivos. Destaca-se um apéndice sumariando aspetos fundamentais de modelos probabilisticos abordados no corpo do texto, um indice remissivo abreviado mas com entradas suficientes e uma pagina web do livro (vide localizagao abaixo) com bastantes elementos informativos. Esta pégina deveré ser construfda de modo a incluir i) solugdes de exereicios; ii) con~ juntos relativamente extensos de dados, néo exibidos no corpo do texto por motivos de espaco; ili) breve descrigdo de pacotes computacionais bayesianos com exemplos ilustrativos da sua aplicacao. Na impossibilidade real de uma enumeracio sem se cometer injustigas, queremos desde ja deixar expressos 0s nossos agradecimentos a todos os que de algum modo nos ajudaram a concretizar este longo projeto, 0 que inclui naturalmente alguns dos parceiros na atividade de investigagdo de cada um de nés. Desejamos em especial manifestar a nossa gratidao: ~ a Thelma Séfadi (Universidade Federal de Lavras) por criar oportunidades que permitiram a CDP fazer avangar a preparagio desta obra; a Julio Singer (Universidade de Sao Paulo) pela disponibilizagao de conjuntos de dados aqui utilizados; a Nuno Sepiilveda (London School of Hygiene and Tropical Medicine) pela sua colaboragao na andlise de um dos casos de estudo; - A FCT pelo financiamento concedido ao CEAUL, unidade de investigagao em que esto integrados CDP, MAAT e GS, através dos diversos projetos plurianuais ¢ estratégicos, em particular o atual projeto FCT/UI/MAT/00006/2013. Pretendemos, para prevenir incompreensées, deixar explicito que a escrita do texto se pauton pelas normas do Acordo Ortogréfico de 1990. Informamos ainda que os abreviados curricula vitae autorais foram transferidos da contracapa para a parte final do texto do livro. Por fim, reiteramos que os eventuais erros, linguisticos ou cientificos, e outras deficiéncias (como lacunas ¢ falta de clareza), que decerto existirfo no texto, sdo da nossa inteira responsabilidade, deixando antecipadamente expresso 0 nosso obrigado a quem dessas falhas nos der conhecimento. Lisboa, abril de 2018 Os Autores URL: https://www.math.tecnico.ulisboa.pt/~gsilva/EBed2/ vi Prefacio 4 Primeira Edigao Desde meados da década de 80 que se observa no dominio da Estatistica e suas aplicagdes um enorme desenvolvimento da metodologia bayesiana. A este facto nao é decerto alheio o desenvolvimento informitico e o aparecimento de software espectfico, o qual permite resolver muitos e complexos problemas de indole prética usando aquela metodologia. Foi esse cenério que levou alguns de nés, profundamente envolvidos em actividades de investigac&o e ensino na area de Estatistica Bayesiana, a tomar iniciativas coor- denadas que contribuissem para a difusio na comunidade estatistica portuguesa da teoria e prética bayesianas e incremento do seu uso em variados campos de aplicagéo estatistica. A primeira delas consistiu num curso intensivo de Estatistica Bayesiana, organizado no ambito dos Projectos PRAXIS XXI/2/2.1/MAT/429/94 e PRAXIS PCEX/P/MAT/41/96 e ministrado em Fevereiro de 1999 no Departamento de Esta- t{stica e Investigacdo Operacional da Faculdade de Ciéncias de Lisboa (sessées de aulas tedricas) e no Departamento de Matematica do Instituto Superior Técnico (sessbes de aulas prticas com computadores), com o apoio de alguns colegas. Desde a organizagéo da primeira iniciativa que ficou gravada na nossa mente a ideia da. conveniéncia ¢ necessidade de tomar as notas elaboradas para apoio ao curso como uma base para a produgéo de um manual universitério, tendo em especial aten- co a escassez de obras em lingua portuguesa, seja na variante curopeia scja na va- tiante americana, sobre a abordagem bayesiana A Inferéncia Estatistica, de enorme repercussao actual para a Estatistica Aplicada. A este respeito, é de assinalar reco- nhecidamente 0 constante incentivo que recebemos para tal de muitos dos préprios participantes naquele curso. ‘A obra que produzimos ¢ adequada para ser usada como livro de texto em disci- plinas de Estatistica de nivel de fim de licenciatura e de pés-graduagao, cujos alunos tenham previamente adquirido sdlidos conhecimentos de Probabilidade ¢ Inferéncia Estatistica e para quem, naturalmente, o portugués escrito se afigure compreensivel, © que extravasa claramente 0 dominio dos falantes nativos da lingua nas suas diver- sas variantes. Naturalmente que, dada a extensdo do livro, uma disciplina semestral exigird, por parte do respectivo professor uma selecgdo dos capitulos e das partes jul- gadas mais apropriadas para o nivel estabelecido para a disciplina, Nao foi nossa orientacao preparar um livro que se revelasse ajustado para a veiculagdo de ideias e métodos bayesianos em disciplinas introdutérias de Estatistica. ‘Todavia, julgamos que este livro poder ser titil para uma disciplina de Estatistica Bayesiana de nivel introdutério, mediante a intervenciio do professor na triagem e organizacio do ma- terial mais consentéineo com os objectivos programaticos da disciplina. Além disso, cremos que este livro possa satisfazer as necessidades de auto-aprendizagem de quem se integre em varios campos de aplicagio estatistica, como é 0 caso de investigadores ¢ técnicos trabalhando em dominios tio diversos como os da Biologia Computacional, Epidemiologia Espacial, Anélise e Processamento de Imagens ¢ Redes Neuronais e Aprendizagem O presente livro inicia-se com um capitulo que visa descrever as caracteristicas es- senciais da abordagem bayesiana a Inferéncia e Decisao Estatisticas, no plano quer dos métodos que a enformam quer dos princfpios norteadores. Segue-se-lhe um capitulo dedicado As questées inerentes 4 passagem da informagao a priori para a distribuigio Vii J) 1 priori O capitulo 3 d desenvolvidamente as ideias e instrumentos fundamen- is da metodologia bayesiana no tragado de inferéncias, ao qual sucede um primeiro capitulo de aplicagées a problemas analiticamente resoltiveis envolvendo modelos gaus- sianos que incluem triagem, comparac&o de duas médias e varidncias, andlise de vari- Ancia andlise de regressio linear. O capitulo 5 dedica-se entaio a uma descri¢do de métodos assentes em aproximagoes analiticas e numéricas de quantidades a posteriori que so, por sua vez, aplicados no capitulo seguinte a problemas com modelos discretos envolvendo, particularmente, a anilise de tabelas de contingéncia. O capitulo 7 dé inicio & apresentacdo de métodos de simulagio estocdstica para a execugao da anélise bayesiana, confinando-se a métodos de Monte Carlo tradicionais, abrindo terreno para os modernos métodos de Monte Carlo baseados em Cadeias de Markov expostos no capitulo seguinte. O capitulo 9 fecha cientificamente 0 livro com a descrigao de andlises bayesianas de problemas concretos mais complexos, envolvendo a aplicagiio de métodos detalhados em capitulos anteriores. ‘Nao resistimos & tentacdo de expor em apéndice uma versio bayesiana de algumas famosas cancdes do reportério musical internacional, com o intuito de contribuir para 0 evidenciar do espirito de si alegria e irreveréncia que tem sido apandgio das reunides cientificas magnas dos estatisticos bayesianos (0s Valencia Meetings). Os leitores interessados poderao aceder a todo o material do The Bayesian Songbook através da sua webpage, http://www.biostat.umn.edu/~brad/cabaret.html, mantida pelo seu editor, Bradley Carlin. Varias sfio as pessoas ¢ entidades a quem estamos gratos pela sua colaboragio em maior ou menor grau neste empreendimento. Destacamos em primeiro lugar os nossos orientandos e colegas Giovani Silva, Paulo Soares e Patricia Bermudez pelo seu inestimavel apoio nos cursos por nés organizados. Paulo Soares teve ainda um papel determinante na composico do material, e também na sua digitacdo iniciada pelo Rui Paulo e Teresa Ferreira. Os nossos agradecimentos dirigem-se também a quem nos ajudou com os seus comentarios, nomeadamente, Isabel Pereira, Fernando Magalhies, Jtilia Teles e Inés Sequeira, pedindo antecipadamente desculpas a quem foi involuntéria e injustamente omitido. Finalmente, queremos deixar aqui registada fa nossa gratid’io & Fundagdo para a Ciéncia e Tecnologia pelo apoio A investigacao concedido através do Centro de Estatistica e Aplicagées da Universidade de Lisboa e do entio Centro de Matemstica Aplicada do Instituto Superior Técnico e, em especial, & Fundacio Calouste Gulbenkian pelo estimulo concedido promogao da cultura cientffica em Portugal, Fazemos naturalmente questo em referir que os erros de todo o tipo que certa- mente permanecerdo no texto sfio da nossa inteira responsabilidade e em manifestar os nossos antecipados agradecimentos a quem deles nos der conhecimento. Lisboa, Maio de 2003 Os Autores Carlos Daniel Paulino M. Anténia Amaral Turkman Bento Murteira viii Contetido Prefacio 4 Segunda Edigéo Preficio & Primeira Edigao 1 Fundamentos da Inferéncia Bayesiana 1.1 O problema fundamental da Estatistica 1.2 O paradigma cléssico 1.3 O paradigma bayesiano . . 1.4 Principio de coeréncia.. 0... eee 1.5. Inferéncia bayesiana 1.6 Prinefpios de verosimilhanga, suficiéncia ¢ condicionalidade L7 Independéncia e permutabilidade ..........--- 18 Decisfio bayesiana 1.9 O argumento axiomético .... 6... 0 eee ee 1.10 Valor da informagio . . . . 1.11 Exereicios 2 Representagao da Informagao a priori 2.1 Conceitos de probabilidade . 2.2 Distribuigées a priori subjetivas . 2.2.1 Informagao a priori de um especialista sobre um acontecimento 2.2.2 Informacio a priori de um especialista sobre varios aconteci- meno gbco0oda 2.2.3 Método estrutural de eliciagdo 2.2.4 Método preditivo de cliciagao pe 2.3. Distribuigdes a priori conjugadas ..... . « ix vii eee ew 23 26 33, 47 55 56 61 69 70 74 5 79 81 88 88 24 25 2.3.1 Familias conjugadas 2.3.2 Conjugagao e familia exponencial . . Distribuigées a priori nfo-informativas . . . 2.4.1 Método de Bayes-Laplace ....... + oo. 2.4.2 Método de Jeffreys 2. Método de Box-Tiao 2.4.4 Distribuigdes impréprias e suas implicagoes . - 2.4.5 Método de entropia méxima 2.4.6 Método de Berger-Bernardo Exercicios Metodologia Inferencial 3.1 3.2 3.3 34 3.5 3.6 3.7 Introdugio 0.0 Estimagéo pontual Estimagdo por regides .....- « Testes de hipéteses 3.4.1 Conceitos basicos . . . 3.4.2 Testes bilaterais de hipdteses categéricas 3.4.3 O uso de distribuicées impréprias 3.4.4 A presenca de pardmetros perturbadores .... 2.22.20 ess Predigio ..... eee rs Problema de revisio: Inferéncias no modelo Normal com ambos os pardmetros desconhecidos . Beebo geo 3.6.1 Distribuicdes Gama e Qui-quadrado Invertidas e distribuigdes Csuden ee 3.6.2 Distribuicdes a posteriori 3.6.3 Estimagao e testes de hipéteses sobre os pardmetros . . 3.6.4 Predig&o de novas observacées Exerclcios 60-22 e eee eee bo o00 bode Aplicagées a Problemas com Modelos Normais 41 Triagem de populagées baseada em dados Normais 4.1.1 Descrigio do método sob um modelo dicotémico para a vari vel de grupo 4.1.2 Aplicagao a varidveis de triagem Normais . 41.3 Mustragio.... . bee eco oc ocee 2 0cc0e Comparacio de duas populagées Normais . . 4.2.1 Comparagio de médias no caso de varincias iguais . . 4.2.2 Comparacio de médias no caso de varidincias diferentes. 89 7 97 98 99 103 106 - 110 - 6 128 137 137 . 138 142 148, - 148 152 . 168 159 - 165 - 168 169 171 sour} 174 - 175 185 - 185 185 . 186 188 . 189 189 191 4.2.3 Comparagio de variancias 193 4,3. Anélise de modelos lineares.... 26... + : 194 4.3.1 Distribuicdo Student multivariada .. 22... « 22.196 4.3.2 Distribuigdes a posteriori bese cee ee 197 4.3.3 Inferéncias paramétricas ¢ preditivas . . beeen eee + 199 4.4 Aplicagdo & andlise de regresstio linear simples... ... +. - » 202 4.5 Aplicagdes & andlise de variancia com um fator . . . . . 7 203 4.6 Exercicios ....... - 205 Métodos via Aproximagées Analiticas e Numéricas 209 5.1 Introdugio . . . Bee eo +. 209 5.2 Métodos analiticos .... 20-0... eevee eee eee DL 5.2.1 Aproximagio a distribuigao Normal multivariada ........ . 211 5.2.2 Método classico de Laplace ...... oo . 216 5.3 Métodos numéricos..... 2... ++ oe 5.4 Modelos gaussianos latentes : : 2 .5 Abordagem via aproximagdes de Laplace encaixadas e integradas (INLA)227 5.6 Notas de capitulo... . . ea cee +s. 229 5.7 Bxercicios ..... Beco oe - 233 Aplicagdes a Problemas com Modelos Discretos 239 6.1 Anélise conjugada de dados categorizados ..... 2... ++ ce 289 6.1.1 Distribuicdes Multinomial e Dirichlet... ....-..-- 239 6.1.2 Inferéncias paramétricas e preditivas . 2 dd 6.2 Testes de hipéteses em tabelas de contingéncia bidimensionais . . . . . . 249 6.2.1 Testes de simetria... 0.6.2... cee ee 249 Testes exatos ene wee wee DAD Testes assintéticos . . nee nn . 251 6.2.2 Testes de homogeneidade marginal... .. 2.00.5 + +. 253 6.2.3 Testes de independéncia . . 255 Teste exato .. 2... ee Teste assintético. . . . bo ee ween B57 6.2.4 Testes de comparagao de proporgées .... 0. + i) 6.3 Anélise de modelos log-lineares ©... 2... -0-0 05+ (| or 6.3.1 Enquadramento em tabelas bidimensionais . . weve e262 Cendrio Multinomial ... 2... 6.005 7 wee ee 6 262 Cenério Produto de Multinomis . 263 Cenétio poissoniano » 264 6.3.2 Exemplificacio em tabela tridimensional ....... 265 64 Exercicios ....... boots begeoo sees 269 Métodos de Monte Carlo 277 7.1 Monte Carlo simples dau - 278 7.1.1 Probabilidades a posteriori ......-.---- bee 279 7.1.2 Densidades a posteriori marginais ... . . boo 0s 279 7.1.3 Intervalos de credibilidade obo cobs = 281 7.1.4 Quantidades preditivas a: s+ +» 283 7.1.5 Aph 7.2. Monte Carlo com amostragem de importancia, 7.21 Intervalos de credibilidade 7.2.2 Fatores de Bayes ‘agiio: anélise do modelo Multinomial com dados omissos . 285 7.2.8 Densidades a posteriori marginais ...... . 73 dos de simulagio estocés 7.3.1 Métodos de rejeicao . « 7.3.2 Método de rejeigio adaptative . 7.3.3 Métodos da razio de Uniformes....... 7.3.4 Método de inversao aproximado 7.4 Exerefcios Metodologia Inferencial Complementar 313 8.1 Modelos inidentificdveis e implicagées inferenciais ........ + - 313 8.1.1 Ilustracdo com diagnéstico bindrio em uma ou mais populagées 3 8.1.2 Problema de um teste de diagnéstico bindrio com uso de padréo deouro ....--- oo. | +... 317 8.1.3 Problema de dois testes de diagnéstico binério condicionalmente independentes e dependentes em duas populagdes sem padriio deouro .... Boo o soso - see. 818 8.2 Modelos bayesianos hierarquicos.... 6.2... +. 320 8.3. Andlise bayesiana empirica..... 0... --- 5 oe oe 84 Anélise hie Sonne g55050 332 8.5 Critica e adequabilidade de modelos . . . dococg. sees + 887 8.5.1 Valores-P bayesianos ©. 626. ee 337 8.5.2 Outras medidas de diagnéstico/adequabilidade ......... . 339 8.6 Selecdo e comparagiio de modelos ....... - oo 8.6.1 Acurécia preditiva......... gcc0q0 - +. 346 8.6.2 Medidas de desempenho preditivo cose cece B47 xi Critério de informagao AIC ee TY Critério de informacio DIC . . . oo Critério de informagio WAIC .. . . abr Critério de informagio CVC... 20... foo Critério de informagio SIC/BIC 353 8.6.3 Selecdo por comportamento preditivo a posteriori... . . 354 8.6.4 Selecio via Fator de Bayes . wee BBB 8.6.5 Ponderacio bayesiana de modelos - 362 8.7 Simulagio em avaliagdo de modelos . . . . . - 367 8.7.1 Estimagdo de densidades preditivas a posteriori ........ . . 367 8.7.2 Amostragem de distribuigdes preditivas ......... 368 8.7.3 Estimacio do valor esperado de fungdes de avaliagio ..... . . 369 8.7.4 Estimagio da distribuicdo marginal dos dados ......... . . 370 88 Notas de capitulo... ........0.00. on 8.9 Exercicios eee eee cece 376 Métodos de Monte Carlo em Cadeias de Markov - Parte I 381 9.1 NogGes e resultados basicos sobre cadeias de Markov 9.2.1 9.2.2 382 9.2 Algoritmo de Metropolis-Hastings . . 385 NogGes fundamentais .... 02.600 eee eee eee 385 Especializagoes.. 2. 0-0-0 eee eee eee 388 Algoritmo M-H com independéncia .. 2... 0. sees ee 388 Algoritmo M-H com passeio aleatorio . 2... 2.2 ee es 889 Algoritmo M-H por componentes ........-- cee BOL 9.3 9.4 Amostrador de Gibbs . . . 393 9.3.1 Aspetos basicos e variantes 393 Algoritmo Gibbs com pronta atualizagio 0... 0s. e » 894 Algoritmo Gibbs com agrupamento a6 Algoritmo Gibbs com hibridagio . . eee . . 396 9.3.2. Algoritmo Gibbs com ampliagio do alvo . . . - «399 Amostrador em fatias . . eee eee cee 402 9.4.1 Deserigfo ......... bocce ee eee - 403 9.4.2 Generalizagao - 407 Monte Carlo hamiltoniano . - 409 9.5.1 Fundamentagéo a) 9.5.2 As equacdes de Hamilton no contexto bayesiano......... . 410 9.5.3. Algoritmo de Monte Carlo hamiltoniano .. 2.6... 2-0 412 adil 9.6 97 9.8 Aplicagées a andlises de modelos simples 9.6.1 Anélise de dados de radiagao de fundo - modelo de regressdo linear simples... 0-0-0 see eee e neers bene 9.6.2 Anilise de dados de emissdes de diéxido de carbono - modelos de regressio linear com transformagio de varidvei 9.6.3 Comparacdo de ragdes porcinas - modelo ANOVA simples - 9.6.4 Comparacdo de barras laminadas de diferentes materiais - mo- delo ANOVA dupla 9.6.5 Comparagio no teor de Na de cervejas - modelo ANOVA hie rérquico bo ssoe 9.6.6 Associagao entre classificagio final de estudantes ¢ rendimento familiar - modelo log-linear em tabela bidimensional . . 9.6.7 Associagio entre leséo arterial obstrutiva, idade ¢ hipertensao em pacientes do foro cardiolégico - modelos log-lineares em ta- bela tridimensional Notas de capitulo . oot Exercicios . 10 Métodos de Monte Carlo em Cadeias de Markov - Parte IT 10.1 10.2 10.3 10.4 Aspetos inerentes A execucio dos inétodos 10.1.1 Dualidade cadeia ‘nica versus cadeias muiltiplas 10.1.2 Diagnéstico de convergéncia..... 0-6 essere ees Instrumentos de monitorizagao . Métodos formais de avaliagéo 10.1.3 Reparametrizacio Funcionalidade do algoritmo Gibbs 10.2.1 Exemplos motivadores 10.2.2 Especificagio da distribuigéo conjunta através das distribuigoes condicionais .....-- c Gaooo ppc eobdds MCMC em selegao de modelos . « 10.3.1 Métodos adicionais sobre 0 espago paramétrico por modelo . . - . 463 10.3.2 Selecdo de varidveis envolvendo o espago-modelo 10.3.3 Selegdo de modelos sobre o espago modelo-parametro . - Método de Carlin-Chib ‘Método de Carlin-Chib “metropolizado” ‘Método MCMC com saltos reversiveis . Aplicag 10.4.1 Crescimento foliar - modelos de regressio nfo linear Normal 10.4.2 Calibracio de doses de radiagdo - modelos de regressiio Poisson 417 418 419 - 421 422 - 425 426 - 427 430 - 432 441 4a 442 443 aad - 446 - 448, 451 - 452 455 462 462 466 466 468 469 473 473 ATT 10.4.3. Triage de cardiopatia isquémica - andlise discriminante logistica480 xiv 10.4.4 Fatores de risco de doengas vasculares ~ modelos lineares gene- ralizados .. 2... -- 00005 a... 10.4.5 Defeitos de fibras téxteis - modelos Poisson bivariados . 10.4.6 Diagnose de dirofilariose canina,- modelos de classes latentes 10.4.7 Fatores de prognéstico de cancro da mama - modelos de regres- sao Weibull em sobrevivéncia com censura . AO Notas do caput ee a r—<“—i—ts—ts—sOSSCssssi 11 Casos de Estudo 11.1 Medicées de dreas de picos em espetrometria gama - modelos com so- bredispersio.... 2... 7 11.1.1 Modelagio estatistica...... . . eee 11.1.2. Verificagao e comparaciio de modelos 11.2 Dosimetria citogenética em grupos de individuos - modelos bivariados de dose-resposta 2... e eee ese e renee 121 Introdugio 2... eee 11.2.2 Modelagao estatistica . 11.2.3 Selegio de modelos ¢ inferéncias paramétricas .. 2.2... 11.2.4 Comparacao de grupos e predicio inversa . 11.3 Fatores de risco de infegao viral — regressiio Binomial com resposta mal Cases 11.3.1 Descrigfio do problema .............. 7. 11.3.2 Modelagao estatistica . 11.8.3. Método computacional 11.3.4 Anélise dos resultados 11.4 Diversidade do repertério de recetores de células T - modelos de mistura Poisson... 0... ee 11.4.1 Introdugio . . 11.4.2 Modelos estatisticos........ 11.4.3 Anilise dos resultados .............. 11.5 Comparagio de testes de diagné: ‘omissdio ao acaso jac ‘ico - modelo Multinomial com densa. 11.5.1 Modelagao estatistica . 11.5.2 Método computacional . . . . 11.5.3 Anélise de resultados... 0... ...02.55 bee 11.6 Risco de incéndio florestal - modelos espaco-temporais . 11.6.1 Descrigfio dos dados..... 0.0.0... beck e 11.6.2 Modelaciio estatistica. 2... eee xv 483 491 495 - 502 - 506 510 519 519 519 - 520 523 - 523 524 525 528 529 529 - 530 - 532 - 533 - 535 535 - 538, - 539 540 . B41 543, Bad 546 5a7 11.6.3. Selecio de modelos hierarquicos 11.6.4 Conclusées : popooc. : 11.7 Canero do estémago em Portugal - modelos APC. 11.7.1 Descrig&o dos dados 11.7.2. Modelo hierérquico com componente espaco-temporal . - - 11.7.3. Anilise de resultados 11.8 VIH/SIDA no Brasil - modelagéo conjunta de dados Ign sobrevivéncia espacial . eee core 11.8.1 Introdugio 11.8.2 Modelagio estatistica 0626-02 e eres 11.8.3. Andlise de resultados Apéndice Distribuigdes de probabilidade . . . . Bibliografia indice Remissivo xvi ede Capitulo 1 Fundamentos da Inferéncia Bayesiana 1.1 O problema fundamental da Estatistica Antes de abordar os alicerces da inferéncia bayesiana parece conveniente fazer refe- réncia ao problema fundamental da estatistic Para O'Hagan (1994): “The fundamental problem towards which the study of sta- tistics is addressed is that of inference. Some data are observed and we wish to make statements, inferences, about one or more unknown features of the physical system which gave rise to these data.” Pode dizer-se que, depois de proceder eventualmente a uma andlise descritiva dos fenémenos ou observagoes passados, o propdsito de qualquer estatistico é fazer infe- réncias ou predigdes acerca de novos fenémenos ou de novas observagées da mesma natureza [Robert (1994)], atividade em que esté em geral presente uma questdo subs- tantiva [Welsh (1996)]. Para os investigadores, mesmo para aqueles que dao o devido apreco ao aspeto descritivo, o aspeto inferencial ou preditivo é mais importante. Mas convém nao esquecer que em ciéncia ou matematica aplicada a fase formal de elabo- ragio tedrica é em geral precedida de uma fase informal em que a andlise exploratéria de dados representa importante papel, sendo por vezes dificil tragar fronteiras entre © informal e o formal. Ao aprofundar o estudo da estatistica, saindo naturalmente dos procedimentos classicos, depara-se com grande nimero de correntes ou escolas. Sem falar na falta de unidade dos chamados clissicos (Fisher para um lado, Neyman-Pearson para outro'), © desfile 6 extenso: bayesianos (objetivos, subjetivos, ...), estruturalistas, fiducialis- tas, verosimilhancistas, ... A diversidade nao é inesperada! As conclusdes ou informagées retiradas dos dados estatisticos sobre parametros ou modelos enquadram-se, em geral, na légica indutiva e é bem sabido que a justificagdo da indugéo 6 um dos problemas mais controver- $$ da filosofia. Cada escola tem princfpios e procedimentos préprios. Os princfpios Segundo Jaynes (1996), foi a auséncia de um principio de inferéncia unificador ou de um cri aceite por todos 08 considerados “ortodoxos” que perpetuou esta divisio. 2 1. Fundamentos da Inferéncia Bayesiana devem arrastar a validade das inferéncias corretas e nunca implicar a validade de qualquer inferéncia incorreta, A respetiva anélise conduz aos fundamentos da infe- rancia estatistica que Berger (1984) desenvolve nos seguintes termos: “Statistics needs a: foundation’, by which I mean a framework of analysis within which any statist- cal investigation can theoretically be planned, performed, and meaningfully evaluated. ‘The words ‘any’ and ‘theoretically’ are key, in that the framework should apply to any ‘situation but may only theoretically be implementable. Practical difficulties or time limitations may prevent complete (or even partial) utilisation of such framework, but the direction in which ‘truth’ could be found would at least be known. ”. Os fundamentos da inferéncia bayesiana, principal objetivo do presente estudo, sio melhor compreendidos quando introduzidos em confronto com os fundamentos da principal “concorrente”, a inferéncia classica. Justifica-se, portanto, uma répida recapitulagio dos fundamentos da inferéncia clissica. Porém, antes de o fazer im- porta referir, mas sem participar, a acesa controvérsia [veja-se Barnett (1999)] sobre a distingdo ou nao distingio entre inferéncia e deciso, isto é, entre (1) andlise em termos probabilfsticos do conjunto de fenémenos observados de modo a desenvolver © conhecimento cientifico e (ii) a prescrigéo de modos de ago prética no contexto de uma dada situacio através do processamento de informagio adequada. Pedagogicamente parece conveniente — mas deixa-se em aberto a possibilidade de discussio — comecar pela inferéncia bayesiana sem introduzir, pelo menos inici- almente, a economia do problema correspondente & “contabilidade” — em termos de utilidade, de perca ou proveito ou de custo-beneficio — das consequéncias das acces ou decisées. Mais tarde faz-se uma répida passagem pela decisio bayesiana. Mas convém advertir que os modernos tratadistas [sobretudo Bernardo e Smith (1994)] consideram a inferéncia uma forma particular de deciséio ou, mais especificamente, ‘um problema de decisdo em que uma aco corresponde ao relato ou proposta de uma distribuigdo de probabilidade (do tipo subjetivo, como vai ver-se) sobre uma quanti- dade desconhecida considerada de interesse. Esta posigéo — que nao 6, repitase, & aqui adotada — ao considerar a teoria da decisio estatistica numa perspetiva muito ampla dispensa, é claro, a elaboragéo de uma teoria da inferéncia estatistica. 1.2 O paradigma classico ‘A inferéncia classica 6 talvez assim rotulada pelo papel predominante que desempe- nhow na primeira metade deste século sob o impulso dos seus “fundadores”: Karl Pearson, Ronald A. Fisher e Jerzy Neyman. No quadro cléssico o principal obje~ tivo da inferéncia estatistica costuma reformular-se do seguinte modo: determinar que generalizagdes (se algumas sio possiveis) sobre a populagéo podem fazer-se & partir da amostra que da mesma foi recolhida. A designagao de amostra é tomada correntemente como sinénima de observages ou dados estatisticos resultantes de ex- periéncias ou inquéritos repetidos em condigdes constantes ou aproximadamente cons- tantes, enquanto a populagio é a totalidade, isto é, 0 conjunto de todas as observagoes possiveis ou concebfveis feitas em condigdes semelhantes. No que segue os dads es- tatisticos ou amostra vio representar-se simplesmente por « ou em alguns casos por = (01,22,.-.,77,) onde n representa a dimensio da amostra ou da colegio de dados. Resulta imediatamente do contexto se « é um escalar ou win vetor ou se @ expresso em causa se aplica formalmente aos dois casos. O conjunto 4’ de amostras possiveis tal que z € 4 designa-se por espago-amostra. Nos casos mais correntes, 4 ¢ IR ou 1.2. O paradigma clissico 3 4c IR" Um aspeto importante da inferéncia estatistica cléssica consiste em reconhecer @ variabilidade que se verifica de amostra para amostra. Para estabelecer inferéncias, considera indispensdvel ter em mente que os dados observados formam apenas um dos muitos — possivelmente infinitos — conjuntos que poderiam ter sido obtidos nas mesmas circunsténcias. Segundo tal perspetiva a interpretagiio dos dados depende néo apenas do particular conjunto observado mas também das hipéteses adotadas acerca dos possiveis conjuntos alternativos de dados. As consideragées do pardgrafo anterior levam a aceitar os dados como observacio de uma varidvel aleatéria X ou de n varidveis aleatérias X = (X1,X2,...,X,) com fungao de distribuigio Fy que representa a variabilidade ou incerteza na observacio de X. A fungdo de distribuigéo Fy ndo 6, evidentemente, perfeitamente conhecida. No entanto, existe normalmente algum conhecimento inicial sobre a natureza do fenémeno aleatério em estudo ou sobre o processo gerador dos dados que leva a propor ou conjeturar uma familia de distribuigdes? F a que pertence Fy e que se designa por modelo estatistico para X. A proposta de um modelo é conhecida por especificagao e é uma fase essencial no estabelecimento de inferéncias. Se, como 6 prética corrente, as distribuigdes de F sao representadas pelas res- petivas densidades (fungao densidade de probabilidade ou fung&o probabilidade) ¢ estas forem rotuladas por um parémetro @ com dominio num conjunto ©, designado espaco-parametro, o modelo estatistico pode escrever-se F ={f(al0):0 P{T*(a1,2,---,2n) P{T* (1, 225-++5m)

Você também pode gostar