Você está na página 1de 19

Análise de Dados e Simulação

Márcia Branco
Universidade de Sao Paulo
Instituto de Matematica e Estatistica
http:www.ime.usp.br/mbranco


Simula03: V.a. bidimensionais, Box-Muller e método da


composição

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Um vetor aleatório contínuo (X , Y ) é caracterizado por sua


função densidade de probabilidade conjunta (fdp) : f (x, y )
Propriedades
R∞ R∞
f (x, y ) ≥ 0 , ∀x, y e f (x, y )dxdy = 1
−∞ −∞
Rb Rd
P(a ≤ X ≤ b, c ≤ Y ≤ d) = f (x, y )dxdy
a c
Função distribuição acumulada
Rx Ry
F (x, y ) = P(X ≤ x, Y ≤ y ) = f (t, s)dtds
−∞ −∞
R∞
A distribuição marginal f (x) = f (x, y )dy .
−∞

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

R∞ R∞
E [g (X , Y )] = g (x, y )f (x, y )dxdy
−∞ −∞

Exemplo 1: g (X , Y ) = X 2
Z∞ Z∞
2
E [X ] = x 2 f (x, y )dxdy =
−∞ −∞

Z∞ Z∞ Z∞
 

x2  f (x, y )dy  dx = x 2 f (x)dx


−∞ −∞ −∞

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Exemplo 2: g (X , Y ) = X + Y
Z∞ Z∞
E [X + Y ] = (x + y )f (x, y )dxdy =
−∞ −∞

Z∞ Z∞
xf (x, y )dx + yf (x, y )dy = E [X ] + E [Y ]
−∞ −∞

Sob a condição da existência das integrais.

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Exemplo 3: g (X , Y ) = XY
Z∞ Z∞
E [XY ] = xyf (x, y )dxdy =
−∞ −∞

Se X e Y são independentes então f (x, y ) = f (x)f (y ) e


Z∞ Z∞
  

E [XY ] =  xf (x)dx   yf (y )dy  = E [X ]E [Y ]


−∞ −∞

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Resultado 1: X e Y são independentes se e somente se

fX ,Y (x, y ) = fX (x)fY (y )
Exercício: Considere

f (x, y ) = e −(x+y ) x > 0, y > 0.


Mostre que X e Y são independentes.

Z∞ Z∞
−(x+y ) −x
f (x) = e dy = e e −y dy = e −x
0 0

Analogamente f (y ) = e −y .
Portanto, f (x, y ) = f (x)f (y ) e as
variáveis são independentes.

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Resultado 2: Se X e Y são independentes então

E [XY ] = E [X ]E [Y ]
Denição de Covariância:

Cov [X , Y ] = E [(X − E [X ])(Y − E [Y ])] = E [XY ] − E [X ][Y ]

Resultado 3: Variáveis independentes são não correlacionadas,


Cov [X , Y ] = 0.

A volta não é verdadeira. Cov [X , Y ] = 0 não implica em


independência. Buscar exemplos.

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Distribuições condicionais
fX ,Y (x, y )
fX |Y =y (x | y ) =
fY (y )
Resultado 3: X e Y são independentes se e somente se

fx|Y =y (x | y ) = fX (x)

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Exercício: Considere (X , Y ) com fdp conjunta

f (x, y ) = xe −x(y +1) x > 0, y > 0


(a) Obter as distribuições marginais.
(b) X e Y são independentes?
(c) Obter a distribuição condicional de Y | X = x .
(d) Obter E [Y | X = x] e E [Y ].
(e) Note que E [E [Y | X ]] = E [Y ] .

Márcia Branco Análise de Dados e Simulação


Variáveis aleatórias bidimensionais

Propriedades:
E [X ] = E [E [X | Y ]]
Var [X ] = E [Var [X | Y ]] + Var [E [X | Y ]]

Márcia Branco Análise de Dados e Simulação


O método de Box-Muller para simular da Normal

Voltando ao nosso objetivo de simulação de v.a. contínuas.


Apresentamos a idéia geral do algoritmo de B-M que é
baseado em transformação de variáveis bidimensional.
Considere X e Y independentes com distribuição N(0, 1) e a
seguinte transformação de variáveis:
 
2 2 Y
D =X +Y e θ = arctg .
X
Usando o método Jacobiano obtemos que fdp conjunta de (D, θ) é
1 1
f (d, θ) = e −d/2 I (θ) d > 0,
2 2π (0,2π)
em que IA representa a função indicadora.

Márcia Branco Análise de Dados e Simulação


O método de Box-Muller para simular da Normal

Márcia Branco Análise de Dados e Simulação


O método de Box-Muller para simular da Normal

Resulta em θ ∼ U(0,2π) e D ∼ Exp(1/2) independentes.

Lembrando que, se U1 ∼ U(0,1) e U2 ∼ U(0,1) então D = −2lnU1 e


θ = 2πU2 temos o seguinte algoritmo

(i) Simular u1 e u2 independentemente da U(0,1) .


√ √
(ii) Fazer x = −2lnu1 Cos(2πu2 ) e y = −2lnu1 Sen(2πu2 )

Obs: Uma variante mais eciente desse algoritmo


denominado Método Polar pode ser visto em Ross S.,
Simulation .

Márcia Branco Análise de Dados e Simulação


O método da Composição

1. Mistura Finita
Suponha que seja possível decompor uma fda como mistura nita
n
de outras, com pi = 1.
P
i=1
n
X
F (x) = pi Fi (x)
i=1

Considera-se o seguinte esquema de simulação:

(i) Ordenar os pi tal que p (1) ≤ p (2) ≤ · · · ≤ p (n) .


(ii) Simular u ∼ U(0,1) . Se u < p (n) simula X de F(n) e parar.
(iii) Se u < p (n) + p (n−1) simula X de F(n−1) e parar.

Assim sucessivamente.

Márcia Branco Análise de Dados e Simulação


O método da Composição

Exemplo 1: Mistura nita de duas normais.


X1 respresenta a altura dos homens e
X2 representa a altura das mulheres, selecionadas ao acaso.
Suponha que X1 ∼ N(170, 100) e X2 ∼ N(160, 100) .
Se X representa a altura de um indivíduo selecionado ao acaso, sem
especicar o sexo, então

F (x) = p1 F1 (x) + (1 − p1 )F2 (x)


Em que p1 representa a proporção de homens na população.
Fj representa a distribuição normal associada a Xj .

Márcia Branco Análise de Dados e Simulação


O método da Composição

2. Mistura Innita
Z∞
F (x) = FX |Y =y (x | y )fY (y )dy
−∞

A relação acima pode ser escrita usando as fdp


Z∞
f (x) = fX |Y =y (x | y )fY (y )dy .
−∞

Algoritmo:
(i) Simular y da marginal fY .
(ii) Simular x da condicional FX |Y =y .

Márcia Branco Análise de Dados e Simulação


O método da Composição

Exemplo 2: Simular da distribuição t -Student.


Resultado 4: Sejam Z ∼ N(0, 1) e W ∼ Gama( ν2 , ν2 ),
independentes. Então X = √Z
W
tem distribuição t -Student com ν
graus de liberdades.

Uma consequência deste resultado é que X | W = w ∼ N(0, w1 ) .

Algoritmo para obter uma amostra da t -Student:

(i) Simular w da Gama( ν2 , ν2 ).


(ii) Simular x da N(0, w1 )

Márcia Branco Análise de Dados e Simulação


O método da Composição

As fdp das v.a. Z , W e X são, respectivamente


1 −z 2 /2
f (z) = √ e

b a a−1 −bw
f (w ) = w e , a = b = ν/2
Γ(a)
−(ν+1)/2
Γ((ν + 1)/2) x2

f (x) = √ 1+
Γ(ν/2) πν ν

Márcia Branco Análise de Dados e Simulação


Funções de simulação no programa R

runif (n, min = 0, max = 1)


rpois(n, lambda)
rnorm(n, mean = 0, sd = 1)
rgamma(n, shape, rate = 1) . Em que shape = a e rate = b
primeiro e segundo parâmetros, respectivamente.
rt(n, df ). Em que df = ν

Márcia Branco Análise de Dados e Simulação

Você também pode gostar