Você está na página 1de 36

Introduo Computao Estatstica em Astronomia

Hektor Monteiro - UNIFEI

o u d o r Int a c i t s t a t Es

o a t u p m o C a i m o n o r t s A em

BY

Introduo

Parte 1 Otimizao Global - a filosofia do ponto de vista prtico - algoritmos clssicos - vantagens e problemas - Cross-Entropy

Parte 2

C C e outro - a filosofia do ponto de vista prtico - principais vantagens e problemas - istogramas! m"ltidimensionais - MCMC

# e goal of science is to "nlock nat"re$s secrets% %%% &"r "nderstanding comes t ro"g t e development of t!eoretical models ' ic are capable of e(plaining t e e"istin# obser$ations as 'ell as making testable predictions% %%% Fort"nately) a variety of sop isticated mat ematical and computational approac!es ave been developed to elp "s t ro"g t is interface) t ese go "nder t e general eading of statistical in%erence%! *+% C% ,regory) -../0

Eric )ei#elson
*7-ray astronomer 'it -/ yrs statistical e(perience0

# e application of statistics to scientific data is not a straig tfor'ard) mec anical enterprise% It re1"ires caref"l statement of t e problem) model form"lation) c oice of statistical met od*s0) calc"lation of statistical 1"antities) and 2"dicio"s eval"ation of t e res"lt% Modern statistics is vast in its scope and met odology% It is diffic"lt to find ' at may be "sef"l *2argon problem30) and t ere are "s"ally several 'ays to proceed% 4ome iss"es are debated among statisticians% Many statistical proced"res are based on mat ematical proofs ' ic determine t e applicability of establis ed res"lts5 it is eas& to i#nore t!ese limits and emer#e 'it! unreliable results( It can be diffic"lt to interpret t e meaning of a statistical res"lt 'it respect to t e scientific goal% 6e are scientists first3 4tatistics is only a tool% 6e s o"ld be kno'ledgeable in o"r "se of statistics and 2"dicio"s in its interpretation%

)re*uentista+ M8todos clssicos de infer9ncia : ip;teses fi(as e dados variam ,a&esiano+ M8todos de inferencia baseados no #eorema de <ayes envolvendo verosemel an=a e distrib"i=>es a priori : ?ados s@o fi(os e ip;teses variam -"ima .erosemel!ana+ M8todo Fre1"entista do 4ec"lo -. para estimar parametros de modelos : verosemel an=a de modelo e dados C C+ M8todo comp"tacional recente para efet"ar integra=>es no espa=o de ip;teses para <ayesianos

As $-rias caras da Estatstica

Astronomia moderna precisa de estatBstica moderna e esta s; pode ser feita comp"tacionalmente

4"rveis) C&) etc

1ueremos entender a natureza


O *ue o astr/nomo *uer+ +robabilidades relacionando dados e modelos &" valores de parDmetros 0uposio implcita+ os dados de fato s@o res"ltados dos processos incl"Bdos no modelo Processo usual+ a2"star "m modelo a "m con2"nto de dados

Infer9ncia com modelos param8tricos

#ipicamente se estima parDmetros via


dados modelo M"itas veEes e(istem sol"=>es analBticas para modelos simples

IncerteEas via contornos +arDmetros do modelo IncerteEa nos dados y

Mel or a2"ste!

Como encontr-2lo3

?ados podem ser bem comple(os

Fatos em A,Ns observados em rdio

?ados podem ser bem comple(os

A2"ste de is;cronas em dados fotom8tricos de aglomerados

Como proceder *uando o problema 4 muito comple"o3


Na maioria dos casos interessantes sol"=@o analBtica 8 impossBvel G/H

GI/H

4todos computacionais5

4todos de otimizao #lobal

J K definir o 1"e 8 "ma boa *mel or0 sol"=@o - K definir como b"scar essa sol"=@o

,uscando a soluo+

uitas estrat4#ias so poss$eis

6eterminsticos - grids "niformes - m8todos de corte - m8todos geom8tricos - o"tros Escol a depende do problema3 Estoc-sticos - 4im"lated annealing - Monte Carlo direto e varia=>es 7eursticos - algoritmos evol"tivos - particleLant s'arm - cross-entropy - o"tros

8m dos mais cl-ssicos+ Al#oritmo #en4tico

&timiEa=@o combinat;ria o" contBn"a

+op"la=@o Inicial

sele=@o 4im"la processo de evol"=@o nat"ral cr"Eamento m"ta=@o

Necessita de representa=@o gen8tica do espa=o de sol"=>es

terminar

n@o

sim

Cruzamento 4 o passo c!a$e

+onto de corte

Codifica=@o binria de parDmetros

Codi%icao pode no ser tri$ial


E(M Espa=o de parDmetros dentro de N/)J.O

n bits

Mapeamento binrioM

J.JJ : JJ : no mapeamento PQ R%ST pois 9(:;<=>??1@2=AB?221AA"11

<inrio *U bits0

decimal

ultiplos parametros : cromossomos feitos de strings binrias concatenadas

PrC"imo passo+ de%inir a *ualidade da soluo


E(press@o matemtica 1"e 1"antifica o 1"e se entende por boa soluo #ipicamente relacionado a "ma distrib"i=@o de probabilidades para a2"ste de f"n=>es e(emplo

XX4V o" NXX4V

+ode incl"ir o"tros crit8rios pertinentes ao problema 4 P MinV"ad W Car*obs-model0 C"idado com valor relativo de cada parte3 In%luencia $elocidade de con$er#Dncia

1ualidades e incon$eniDncias do AG

,O +ermite sol"cionar problemas comple(os YaEoavelmente simples de implementar Cis@o "m tanto pessoal3 Nat"ralmente paraleliEvel &timiEa=@o combinat;ria o" contBn"a

Eo to ,O M"itos parDmetros para acertar! N@o m"ito simples de implementar dependendo dos parDmetros +ode evol"ir para "ma sol"=@oLespecie r"im

Cross2Entrop&+ uma alternati$a mais simples


F"nciona basicamente direcionando! f"n=>es de distrib"i=@o de probabilidades ga"ssianas na dire=@o do ponto ;timo +op"la=@o Inicial baseada em E?m,sA

4ele=@o das mel ores de acordo com 0 Nova +op"la=@o baseada em E?m,sA com F calc"lados dos mel ores

deve ser a2"stado

+ara red"Eir velocidade de converg9ncia

terminar

n@o

sim

8m e"emplo simples

M(imo global

Evol"=@o da distrib"i=@o de sol"=>es para cada itera=@o

1ualidades e incon$eniDncias do CE

,O +ermite sol"cionar problemas comple(os M"ito simples de implementar Nat"ralmente paraleliEvel &timiEa=@o combinat;ria o" contBn"a

Eo to ,O - parDmetros para acertar! +ode convergir para "ma sol"=@o r"im

Ea pr-tica(((

Yesolvendo o problema anterior no I?X "sando CE & efeito do smoot ing! Uma f"n=@o mais comple(a Um problema de a2"ste linear simples #r"ncamento no espa=o de parDmetros

Como calcular os erros3


Um dos grandes problemas 8 a estimativa de erros em modelos comple(os G4cnica de re2amostra#em strap
Amostra original

boot

M"itas veEes sol"=>es analBticas n@o e(istem

Ye-amsotragem com reposi=@o

Calc"lo do estimador

N amostrasZ

n@o

sim
intervalos de confian=a

amostragem com reposi=@o do con2"nto de dados original

E(emplo I?X%%%

E"pressando a incerteza

Ap;s obter amostra bootstrap : se distrib"i=@o ga"ssiana : desvio padr@o

?istrib"i=@o n@o ga"ssiana : ranking de sol"=>es

Fre1"9ncia

I/H valor Yeportar valor referente a I/H

E se eu no *uiser sC o ponto m-"imo3

As veEes o 1"e interessa 8 a distrib"i=@o em si

Cantagem 8 caracteriEa=@o dos erros sem "m passo e(tra

+ossibilita obter integrais comple(as : integra=@o MonteCarlo

In%erDncia ,a&esiana

Outro ol!ar sobre o aHuste de %unIes


ProblemaM N pontos observados onde 1"eremos a2"star "m modelo M Georema de ,a&es ?o ponto de vista <ayesiano

Posteriori Priori " .erosemel!ana

Gudo o *ue se sabe sobre o problema

In%erDncia com modelos param4tricos

F"n=@o de verossemel an=aM dependencia em q 1"ando fi(amos a aten=@o nos dados

#em-se incerteEa sobre 1"al o modelo i e sobre 1"ais os parDmetros qi

Para estimar parametros +remissaM escol a do modelo : o 1"e se pode diEer sobre q

Para in%erir sobre modelos +remissaM escol a do con2"nto de modelos i : o 1"e se pode diEer sobre i

E"emplo

Modelo Contagens de "ma fonte mais f"ndo

Ea pr-tica mesmo(((
4"pon a dados com erros ga"ssianos $erosemel!ana

posteriori

Encontrando o mel!or $alor

Mel or valor : valor 1"e ma(imiEa a Estimando de "ma amostra

IncerteEas via form"las analBticas o" amostras

+ode-se faEer marginaliEa=@o para parDmetros indese2ados

Mas como calc"lar estas integraisZ

Inte#rao

onte Carlo

simples

+or importDncia

OJF mas *uero distribuiIes


+recisamos de mapear *amostrar0

,a"ssianas s@o fceis%%% e em casos mais difBceisZ

arJo$ C!ain

onte Carlo ? C CA

4todo de

etropolis27astin#s

aP

Você também pode gostar