Você está na página 1de 11

6.

2 Distribuição conjunta
Em muitos casos, é possível ter duas ou mais variáveis aleatórias relacionadas em
termos de probabilidade. Consideraremos que as duas os mais variáveis aleatórias são todas
discretas ou contínuas, não havendo mistura.
• Caso discreto
Suponha X e Y duas variáveis discretas, sua função de probabilidade conjunta é dado
por
P(X = x, Y = y) = f (x, y) (17)
Devendo obedecer às mesmas propriedades no caso de uma variável aleatória, temos
que
1. f ( x, y )  0

2.  f ( x, y ) = 1
x y

A função de distribuição conjunta pode ser representada por uma tabela de dupla-
entrada, denominada tabela de probabilidade conjunta.
Y
y1 y2 .. yn Σ
x1 f (x1, y1) f (x1, y2) .. f (x1, yn) f1 (x1)
x2 f (x2, y1) f (x2, y2) .. f (x2, yn) f1 (x2)
X
: : : .. : :
xm f (xm, y1) f (xm, y2) .. f (xm, yn) f1 (xm)
Σ f2 (y1) f2 (y2) .. f2 (yn) 1

Assumindo que a variável X pode ser qualquer um dos m valores, x1, x2, ..,. , xm e a
variável Y os n valores, y1, y2, ..., yn, a função de probabilidade marginal de X é a
probabilidade de uma determinado valor fixo de x, percorrendo suas probabilidades
associadas aos valores que a variável Y pode assumir, por exemplo, para x1 obtemos da
seguinte forma
n
P(X = xj) = f1(xj) =  f (x , y )
k =1
j k (18)

De forma análoga obtemos a função de probabilidade marginal de Y.


m
P(Y = yk) = f2(yk) =  f (x , y )
j =1
j k (19)
A soma das probabilidades marginais em ambos os casos deve somar 1
m n

 f (x ) =  f ( y ) = 1
j =1
j
k =1
k (20)

Exemplo19: (ANPEC – 2017, Adaptada) Considere a distribuição de probabilidade


conjunta das variáveis aleatórias X e Y, de acordo com a tabela abaixo:
X
0 1 2 3
1 ¼ 1/8 1/8 1/4
Y
2 0 1/8 1/ 8 0

Adotamos x1 = 0, x2 = 1, x3 = 2, x4 = 3 e y1 = 1 e y2 = 2. Agora podemos identificar as


probabilidades conjuntas, por exemplo
P(X = x1, Y = y1) = P(X = 0, Y = 1) = 1/4
e
P(X = x3, Y = y2) = P(X = 2, Y = 2) = 1/8
Vale notar que a soma de todas as probabilidades conjuntas é igual a 1.
1 1 1 1 1 1
 f ( x, y) = 4 + 8 + 8 + 4 + 0 + 8 + 8 + 0 = 1
x y

A probabilidade marginal de x será


P(X = x1) = f1(x1) = f (x1, y1) + f (x1, y2) = 1/4 + 0 = 1/4
P(X = x2) = f1(x2) = f (x2, y1) + f (x2, y2) = 1/8 + 1/8 = 1/4
P(X = x3) = f1(x3) = f (x3, y1) + f (x3, y2) = 1/8 + 1/8 = 1/4
P(X = x4) = f1(x4) = f (x4, y1) + f (x4, y2) = 1/4 + 0 = 1/4
m
1 1 1 1
De modo que  f (x ) = f (x ) + f (x ) + f (x ) + f (x ) = 4 + 4 + 4 + 4 = 1
j =1
j 1 1 1 2 1 3 1 4

A probabilidade marginal de y será


P(Y = y1) = f2(y1) = f (x1, y1) + f (x2, y1) + f (x3, y1) + f (x4, y1) = 1/4+1/8+1/8+1/4 = 3/4
P(Y = y2) = f2 (y2) = f (x1, y2) + f (x2, y2) + f (x3, y2) + f (x4, y2) = 0+1/8+1/8+0 = 1/4
n
3 1
De modo que  f (y ) = f (y ) + f (y ) = 4 + 4 =1
k =1
k 1 1 2 2

Podemos atualizar a tabela de probabilidade conjunta inserindo as probabilidades


marginais de X e Y.
X
0 1 2 3 Σ
1 1/4 1/8 1/8 1/4 3/4
Y
2 0 1/8 1/8 0 1/4
Σ 1/4 1/4 1/4 1/4 1

• Caso contínuo
O caso contínuo é obtido de forma análoga ao anterior, porém substituem-se os
somatórios por integrais. Então a função densidade conjunta de X e Y é

P ( a  X  b, c  Y  d ) =  f ( x, y ) dxdy
b d

x=a  y =c
(21)

Na qual obedecem às seguintes propriedades


1. f ( x, y )  0
 
2.  
− −
f ( x, y ) dxdy = 1

A sua função de distribuição conjunta de X e Y é


F ( x, y ) = P ( X  x , Y  y ) =  f ( u , v ) dudv
x y

u =a v =c
(22)

Dada a função distribuição conjunta de X e Y é possível encontrar a sua função de


probabilidade conjunta, da mesma forma que para uma única variável aleatória, porém agora
com derivadas parciais cruzadas.
2 F
= f ( x, y ) (23)
xy
As funções densidade marginais de X e Y são dados, respectivamente por

𝑓1 (𝑥) = ∫𝑣=−∞ 𝑓(𝑥, 𝑣) 𝑑𝑣 (24)

𝑓2 (𝑦) = ∫𝑢=−∞ 𝑓(𝑢, 𝑦) 𝑑𝑢 (25)
Exemplo20: A função de distribuição conjunta de X é dada por:
0, 𝑠𝑒 𝑥 < 0 𝑒 𝑦 < 0
𝑥
𝐹𝑋,𝑌 (𝑥, 𝑦) = { (1 − 𝑒 −𝑦 ) 𝑠𝑒 0 ≤ 𝑥 < 5, 𝑦 ≥ 0
5
1, 𝑠𝑒 𝑥 ≥ 5, 𝑦 ≥ 0
A função densidade conjunta será
𝜕 2 𝐹(𝑥, 𝑦) 1 −𝑦
𝑓(𝑥, 𝑦) = = 𝑒 , 0 ≤ 𝑥 < 5, 𝑦 ≥ 0
𝜕𝑥𝜕𝑦 5
Agora é possível verificar a propriedade 2.
5 5
∞ 5

1 1 1 𝑥5
∫ ∫ 𝑒 −𝑦 𝑑𝑦 𝑑𝑥 = ∫ [− 𝑒 −𝑦 ] 𝑑𝑥 = ∫ 𝑑𝑥 = | = 1
5 5 𝑂 5 50
0 0
0 0

A função marginal de X


1 1 1
𝑓1 (𝑥) = ∫ 𝑓(𝑥, 𝑣) 𝑑𝑣 = ∫ 𝑒 −𝑉 𝑑𝑉 = − 𝑒 −𝑉 |∞
0 =
𝑣=−∞ 5 5 5
0

A função marginal de Y
5

1 1
𝑓2 (𝑦) = ∫ 𝑓(𝑢, 𝑦) 𝑑𝑢 = ∫ 𝑒 −𝑦 𝑑𝑢 = 𝑥𝑒 −𝑦 |50 = 𝑒 −𝑦
𝑢=−∞ 5 5
0

6.3 Esperança matemática


A esperança matemática é um número real. É também uma média aritmética
ponderada. Uma variável aleatória discreta X com possíveis valores x1, ..., xn a sua esperança
e dado por
n
E ( X ) =  xi . p ( xi ) (26)
i =1

Notação: E(X), μ(X), μx, μ.


Exemplo21: No problema anterior, calcule E(X).
X P(X) X. P(X)
0 1/8 0
1 3/8 3/8
2 3/8 6/8
3 1/8 3/8
1 12/8 = 1,5
Ou
n
1 3 3 1 12
E ( X ) =  xi . p ( xi ) = 0. + 1. + 2. + 3. = = 1,5
i =1 8 8 8 8 8

O número médio de caras no lançamento de 3 moedas é 1,5 cara.


Caso os valores de X assumam um número infinito de valores, por meio da integral
de Riemann, pode-se ter para uma variável aleatória contínua com função densidade f(x), a
seguinte esperança

E( X ) =  x. f ( x)dx
−
(27)

Exemplo22: Dada a função densidade da variável aleatória X


x
 , 0 x2
f ( x) =  2

0, caso contrário
O valor esperado será
 2
 x
2 2
x2 x3 4
E ( X ) =  x. f ( x)dx =  x   dx =  dx = =
0  
−
2 0
2 6 0 3
A esperança de funções de variáveis aleatórias é obtida utilizando o mesmo
raciocínio. Seja Y = g(x) outra função que também depende da variável aleatória X, no caso
discreto a esperança é dada por
n
E ( g ( x ) ) =  g ( xi ). p ( xi ) (28)
i =1

Para o caso contínuo é calculado por



E ( g ( x) ) =  g ( x). f ( x)dx (29)
−

Exemplo23: Dada a função densidade do Exemplo21, suponha g(x) = 3x² - 2x. A esperança
será

E ( g ( x) ) =  g ( x). f ( x)dx
−

x
2
E ( 3 x 2 − 2 x ) =  ( 3 x 2 − 2 x )    dx =
10
0 2 3

É possível generalizar para o caso de funções com duas ou mais variáveis. Suponha
X e Y duas variáveis aleatórias contínuas, com função densidade conjunta dada por f (x,y). A
esperança é dado por
 
E( X ) =   xf ( x, y)dxdy
− −
(30)
Exemplo24: A função densidade conjunta de duas variáveis aleatórias X e Y é dada por

 xy
 , 0  x  4, 1  y  5
f ( x, y) =  96
0, caso contrário

a) E ( X )

  5 4
xy 8
E( X ) = 
− −
xf ( x, y)dxdy =   x
1 0
96
dxdy =
3

b) E (Y )

  5 4
xy 31
E (Y ) =   yf ( x, y)dxdy =   y 96 dxdy =
− − 1 0
9

c ) E ( XY )

  5 4
xy 248
E ( XY ) = 
− −
xyf ( x, y )dxdy =   xy
1 0
96
dxdy =
27

d ) E (2 X + 3Y )

  5 4
xy 47
E (2 X + 3Y ) =   ( 2 x + 3 y ) f ( x, y)dxdy =   ( 2 x + 3 y ) 96 dxdy = 3
− − 1 0

6.3.1 Propriedades da esperança matemática


1. E(k) = k (31)
2. E(k.X) = k.E(X). (32)
3. Se X e Y forem variáveis aleatórias quaisquer
E(X ± Y) = E(X) ± E(Y) (33)
 n  n
4. E   X i  =  E ( X i ) (34)
 i =1  i =1
5. E(aX ± b) = aE(X) ± b (35)
6. E(X - μx) = 0 (36)
7. Se X e Y forem variáveis independentes
E(XY) = E(X).E(Y) (37)
6.3.2 Variância e desvio-padrão
Consideremos as distribuições das variáveis aleatórias discretas X e Y com as suas
respectivas médias.
X P(X) X . P(X)
0 1/8 0
1 6/8 6/8
2 1/8 2/8
1 μx = 1
Y P(Y) Y . P(Y)
-2 1/5 -2/5
-1 1/5 -1/5
0 1/5 0
3 1/5 3/5
5 1/5 5/5
1 μy = 1

Calcularemos da seguinte forma


n
Var ( X ) =  ( xi −  x ) . p ( xi )
2
(38)
i =1

ou
Var ( X ) = E ( X ²) − [ E ( X )]² (39)

Notação: Var(X), V(X), σ²(X), σ²x, σ²

Por praticidade utilizaremos a segunda forma. Note que falta calcularmos E(X²).
X P(X) E(X) = X .P(X) E(X²) = X² .P(X)
0 1/8 0 0
1 6/8 6/8 6/8
2 1/8 2/8 4/8
1 μx = 1 10/8

10
Var ( X ) = E ( X ²) − [ E ( X )]² = − [1]² = 0, 25
8
Y P(Y) Y . P(Y) Y² . P(Y)
-2 1/5 -2/5 4/5
-1 1/5 -1/5 1/5
0 1/5 0 0
3 1/5 3/5 9/5
5 1/5 5/5 25/5
1 μy = 1 E(Y²) = 39/5

39
Var (Y ) = E (Y ²) − [ E (Y )]² = − [1]² = 6,80
5
Observando os valores percebemos que a variância de X é menor que a de Y, ou seja,
possui menor grau de dispersão de probabilidade em torno da média.
Para o caso em que a variável aleatória X é contínua, a variância é calculada por

Var ( X ) = E ( x − E ( X ) )  =   x − E ( X )  f ( x)dx
2 2
(40)
 
−

Ou
Var(X) = E(X²) – [E(X)]² (41)

E ( X ²) =  x . f ( x)dx
2
(42)
−

2 x 0  x 1
Exemplo25: Seja f ( x) =  . Determinar:
0 x  0 ou x  1

a) E(X)
 1
 x³ 
1 1
2
E ( X ) =  x. f ( x)dx =  x.2 xdx =  2 x ² dx =2   =
− 0 0  3 0 3
b) Var(X)
 1
1
 x4 
1
1
E ( X ² ) =  x ². f ( x)dx =  x ².2 xdx =  2 x ³dx =   =
− 0 0  2 0 2
2
1 2 1
Var ( X ) = E ( X ² ) −  E ( X )  = −   =
2

2  3  18
6.3.2.1 Propriedades da Variância
1. Var(k) = 0 (43)
2. Var(k.X) = k².Var(X) (44)
3. Var(Ax ± b) = a²Var(X) (45)
4. Var(X ± Y) = Var(X)+ Var(Y) ±2.cov(X, Y) (46)
 n  n
5. Var   X i  =  Var ( X i ) + 2 cov ( X i , X j )
n
(47)
 i =1  i =1 i j

Onde covariância entre X e Y.

σXY = Cov (X, Y) = E[X – E(X)] . E[Y – E(Y)] = E(XY) – E(X).E(Y)


A covariância mede o grau de dependência entre as duas variáveis X e Y.
6. Coeficiente de correlação
Cov( X , Y )
= , com − 1    1 (48)
 X Y

6.4 Variáveis aleatórias padronizadas


Em muitas situações é necessário obter outra variável a partir da variável aleatória,
essa será dita padronizada, obtida da seguinte forma:
X −
Z= (49)

Uma das propriedades mais interessantes que a variável aleatória Z terá média zero e
desvio-padrão 1.
Exemplo26: Suponha uma variável aleatória X assumindo os seguintes valores: 8, 9, 10, 11
e 12.
Primeiro calcularemos a média
8 + 9 + 10 + 11 + 12
= = 10
5
e desvio-padrão de X

(8 − 10 ) + ( 9 − 10 ) + (10 − 10 ) + (11 − 10 ) + (12 − 10 )


2 2 2 2 2

=  1, 41
4
Os valores da variável Z é então obtido
X 1 −  8 − 10
Z1 = = = −1, 414
 1, 41
X 2 −  9 − 10
Z2 = = = −0,707
 1, 41
X 3 −  10 − 10
Z3 = = =0
 1, 41
X 4 −  11 − 10
Z4 = = = 0,707
 1, 41
X 5 −  12 − 10
Z5 = = = 1, 414
 1, 41
A tabela mostra os valores da variável aleatória X e sua respectiva variável
padronizada Z.
X Z
8 -1.414
9 -0.707
10 0
11 0.707
12 1.414

6.5 Outras medidas de tendência central


Nos tópicos anteriores vimos que a média de uma variável aleatória pode ser obtida
pela sua esperança matemática, porém é possível utilizar outras medidas de tendência central
já conhecidas, como a moda e mediana.
6.5.1 Moda
A moda de uma variável aleatória discreta é aquela que ocorre com a maior
probabilidade de ocorrer. Quando a variável aleatória é contínua, sua moda é calculada
encontrando seu valor por meio da maximização de sua função densidade de probabilidade.
6.5.2 Mediana
A mediana será o valor da variável aleatória que possui probabilidade igual a 0,5, isto
1
é, P ( X  x ) = P ( X  x ) = .
2
Exemplo27: A função densidade da variável aleatória contínua X é
 4 x (9 − x2 )
 , 0 x3
f ( x) =  81
0, caso contrário

a) Encontre a moda
Devemos encontrar onde a função densidade tem um máximo relativo, nesse caso
recorremos as técnicas de otimização.
Em primeiro lugar utilizamos a condição necessária, a mesma consiste em derivar a
função densidade e igualar a zero.
4 x (9 − x2 )
f ( x) =
81

36 − 12 x 2
f '( x) = =0  x= 3
81
Vale lembrar que os valores que a variável aleatória X pode assumir são entre 0 e 3,
logo não temos interesse em valores negativos.
A condição suficiente é utilizada para confirmar se o valor candidato é de fato um
máximo relativo, portanto o valor da segunda derivada deve ser menor que zero.
−24 x
f ''( x) =
81
Como x é positivo, segunda derivada só pode ser menor que zero, confirmando que o
valor de x encontrado é um máximo relativo, ou seja, a moda da variável aleatória X.
b) Encontre a mediana
a
4 x (9 − x2 ) a
4  9a 2 a 4  1
P( X  a) =  dx =
4
81 0
x ( ) 81  2 − 4  = 2
9 − x 2
dx =
0
81  
Realizando os devidos cálculos, chegamos ao seguinte resultado:
2a 4 − 36a 2 + 81 = 0
Onde o único valor que satisfaz as condições da função densidade de probabilidade é
aproximadamente a = 1,62.

Você também pode gostar