Você está na página 1de 26

Variáveis aleatórias

Uma variável aleatória pode ser entendida como uma variável quantitativa, cujo
valor depende de factores aleatórios.

• número obtido no lançamento de um dado


• número de comprimidos defeituosos numa amostra retirada de um lote
• número de visitantes de um determinado site, num certo período de tempo
• volume de água perdido, por dia, num sistema de abastecimento
• tempo em remissão de doentes com certa doença crónica

A uma experiência aleatória pode-se associar um modelo de probabilidade que


pressupõe a construção de um espaço de resultados e a atribuição de uma
probabilidade a cada um dos acontecimentos elementares. Ora, nem sempre os
resultados de uma experiência aleatória são numéricos (e.g. lançamento de
uma moeda: cara ou coroa). Além disso, frequentemente é preferível sintetizar
os aspectos mais significativos dos resultados da experiência aleatória.

Vejamos então uma forma de associar valores numéricos aos resultados de uma
experiência aleatória, introduzindo formalmente o conceito de variável aleatória.

Cristina Rocha - DEIO/FCUL


Uma variável aleatória (v.a.) X é uma função que associa a cada elemento do
espaço de resultados um número real

X : 
  X ( )
Para representar variáveis aleatórias usam-se letras maiúsculas do final do
alfabeto: X, Y, Z, T, W…
Se X for uma variável aleatória (v.a.) representamos por x (minúsculo) um valor
observado dessa v.a., ou seja, um valor que a v.a. pode assumir.

variável aleatória X  valor observado x

Ex: lançamento de uma moeda equilibrada  = {cara, coroa}

Seja X a variável aleatória indicatriz do acontecimento A={sair coroa}


Então P(X = 1) = P(sair coroa) = 1/2 P(X = 0) = P(sair cara) = 1/2

Cristina Rocha - DEIO/FCUL


Ex: são escolhidos ao acaso 100 comprimidos de um grande lote e observa-se se
cada comprimido é “defeituoso” ou “não defeituoso”.

O espaço de resultados  é constituído por 2100 elementos! É mais conveniente


definir a variável

X - nº de comprimidos defeituosos (ou não defeituosos) em 100

As variáveis aleatórias podem ser classificadas como discretas ou contínuas.


Uma v.a. diz-se discreta se apenas assume um número finito ou infinito
numerável de valores distintos.
• número de comprimidos defeituosos numa amostra retirada de um lote
• número de indivíduos infectados pelo vírus da gripe numa dada região,
num certo período de tempo

Uma v.a. diz-se contínua se pode assumir todos os valores de um intervalo


da recta real, sendo nula a probabilidade de assumir um valor especificado.

• nível de glicose no sangue de um indivíduo numa dada população


• tempo de vida de um ser vivo de certa espécie
Cristina Rocha - DEIO/FCUL
Função de distribuição
Uma forma de definir uma v.a., discreta ou contínua, consiste na utilização de
uma função real de variável real designada por função de distribuição.

Função de distribuição (f.d.) de uma v.a. X (discreta ou contínua) é a função


definida por
F(x) = P(X ≤ x) x

x, X ≤ x refere-se ao acontecimento constituído pelos elementos de  tais


que os valores da v.a. X são menores ou iguais a x.

Propriedades da função de distribuição

1. F(-) = 0; F(+) = 1
2. F é uma função não decrescente
3. F é uma função contínua à direita
lim  F ( x)  F (a)
x a

Cristina Rocha - DEIO/FCUL


Para qualquer função de distribuição F de uma v.a. X, vem que

P( X  a)  F (a) - lim - F ( x)
x a

• Se a v.a. X é discreta, a função de distribuição é descontínua (é apenas


contínua à direita); é uma função em escada, com saltos nos pontos onde a v.a.
assume valores com probabilidade não nula.
O valor do salto no ponto xi é pi = P(X = xi)
• Se a v.a. X é contínua, a função de distribuição é contínua (é também contínua
à esquerda)
P( X  a)  0 para qualquer a  

Seja X uma v.a. com f.d. F(x). Então dados os pontos a e b, tais que a<b, tem-se
que
P(a<X≤b) = F(b) – F(a)

Cristina Rocha - DEIO/FCUL


O conhecimento da função de distribuição possibilita, de forma expedita, o
cálculo da probabilidade de uma v.a. assumir valores num dado intervalo.

Notemos que, se a v.a. X for contínua,

P(a<X≤b) = P(a<X<b) = P(a≤X≤b) = P(a≤X<b) = F(b) – F(a)

Se a v.a. X for contínua, estas probabilidades são todas iguais!

Variável aleatória discreta

É natural definir a probabilidade de uma v.a. assumir um determinado valor


como sendo a probabilidade do acontecimento que fez com que a v.a. tivesse
esse valor.
Chama-se função massa de probabilidade (f.m.p.) à função que, a cada valor
numérico que a v.a. assume, faz corresponder a probabilidade associada a esse
valor.

Cristina Rocha - DEIO/FCUL


Uma v.a. X discreta fica perfeitamente identificada pela sua f.m.p., i.e.,
pelos valores xi que a v.a. assume e pelas probabilidades de assumir esses
valores

 xi
X 
 pi  P( X  xi )

Atendendo à definição de Probabilidade, é imediato que qualquer f.m.p. goza


das seguintes propriedades:

1) pi  0 i
2)  pi  1
i

-1 0 1 2
X   a  0.2
0.3 0.1 a 0.4

Cristina Rocha - DEIO/FCUL


Ex: Uma urna contém quatro bolas numeradas de 1 a 4. Extraem-se ao acaso
duas bolas da urna. Defina a v.a. que representa a soma dos números observados
nas bolas extraídas.

(i) Supondo que a extracção é feita com reposição

 ={(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),
(4,1),(4,2),(4,3),(4,4)}

 2 3 4 5 6 7 8
X
1 / 16 1 / 8 3 / 16 1 / 4 3 / 16 1 / 8 1 / 16

(ii) Supondo que a extracção é feita sem reposição

 ={(1,2),(1,3),(1,4),(2,1),(2,3),(2,4),(3,1),(3,2),(3,4),(4,1),(4,2),(4,3)}

3 4 5 6 7
Y
1 / 6 1 / 6 1 / 3 1 / 6 1 / 6
Cristina Rocha - DEIO/FCUL
Função de distribuição da v.a. Y

0 x3
1 / 6 3  x  4

1 / 3 4  x  5
FY ( x)  
2 / 3 5  x  6
5 / 6 6  x  7

1 x7

Cristina Rocha - DEIO/FCUL


Variável aleatória contínua

Define-se função densidade de probabilidade (f.d.p.) de uma v.a. X contínua e


representa-se por f(x) como sendo a derivada, se existir, da função de
distribuição F(x)
dF ( x)
f ( x)  F ' ( x) 
dx
o que é equivalente a
x
F ( x)   f (t )dt visto que F (-)  0
-
Nos pontos em que não existe derivada da f.d., é habitual considerar que f(x) = 0.
Quando a v.a. assume valores apenas num subconjunto de , admite-se que f(x)=0
no exterior daquele subconjunto.

Propriedades da f.d.p.
1) f ( x)  0

2)  f ( x)dx  1
-
Cristina Rocha - DEIO/FCUL
b
Notemos que, para a<b,  f ( x)dx  F (b) - F (a)  P(a  X  b)
a

O cálculo do integral anterior é equivalente a calcular o valor da área


compreendida entre o eixo das abcissas, o gráfico da f.d.p. e as rectas x=a
e x=b.

gráfico da f.d.p. f(x)


P(a<X≤b)

P(X>b)

P(X≤a)
a b
F(a) corresponde à área compreendida entre o eixo das abcissas e o gráfico da
f.d.p., desde - até à recta x=a.
Cristina Rocha - DEIO/FCUL
Características populacionais

Vamos agora definir medidas de localização e dispersão que permitem identificar


muitas das características fundamentais de uma população representada pela
v.a. X. São os chamados parâmetros populacionais, dos quais depende a
distribuição de X.

Parâmetro: quantidade numérica fixa, embora por vezes seja desconhecida

Valor médio

Define-se valor médio ou valor esperado de X e representa-se por E(X) ou m


como sendo:

• Seja X uma v.a. discreta que assume valores xi com probabilidade pi, i=1,2,
Então
E ( X )   xi pi
i

quando | x
i
i | pi  

Cristina Rocha - DEIO/FCUL


O valor esperado de uma v.a. discreta não é necessariamente um valor que a
v.a. pode assumir com probabilidade não nula.

Ex: Seja X a v.a. que representa o número de pontos obtidos no lançamento de


um dado equilibrado.

E(X) = 11/6 + 21/6 + 31/6 + 41/6 + 51/6 + 61/6 = 3.5

• Seja X uma v.a. contínua com f.d.p. f(x). Então



E( X )   x f ( x) dx
-
quando

 | x| f ( x ) dx  
-

O valor médio corresponde ao centro de gravidade da distribuição de


probabilidades. É um parâmetro de localização do centro da distribuição.

Cristina Rocha - DEIO/FCUL


Valor médio de uma função de uma variável aleatória

Seja X uma v.a. e Y = y(X) uma v.a. que é função de X. Então

• Se X é uma v.a. discreta que assume valores xi com probabilidade pi, i=1,2,

E (Y )  Ey ( X )  y ( xi ) pi
i

• Se X é uma v.a. contínua com f.d.p. f(x) e supondo que y(X) é ainda uma
v.a. contínua

E (Y )  Ey ( X )  y ( x) f ( x)dx
-

Supomos em ambos os casos que o valor médio de Y = y(X) existe. Notemos que a
existência de E(X) não implica a existência de E[y(X)] e inversamente.

Cristina Rocha - DEIO/FCUL


Propriedades do valor médio

1. Dadas as v.a. X e Y com valores médios E(X) e E(Y), respectivamente, então

E(X + Y) = E(X) + E(Y)

2. Dada a v.a. X e as constantes a e b, tem-se

E(aX + b) = a E(X) + b

3. Generalizando as propriedades anteriores, se existir E(Xj), j=1,, n, então

 n  n
E   a j X j    a j E ( X j )
 j 1  j 1

Cristina Rocha - DEIO/FCUL


Quantil de probabilidade p (0<p<1)

Vamos considerar apenas o caso de uma v.a. X contínua, visto que são estes os
quantis que têm mais interesse do ponto de vista prático.

Define-se quantil de probabilidade p de uma v.a. X contínua como sendo o


número real x tal que
F ( x)  p  P( X  x)  p

O quantil de probabilidade p representa-se genericamente por cp

É também uma medida de localização.

Quando p = ½ obtem-se a mediana de X

p = ¼ obtem-se o 1º quartil e para p = ¾ obtem-se o 3º quartil de X

Quando p = 0.1,,0.9 obtêm-se os decis; para p = 0.01,,0.99 obtêm-se os


percentis
Cristina Rocha - DEIO/FCUL
Variância (populacional)

Define-se variância da v.a. X e representa-se por var(X) ou s2 como sendo

var(X) = E[(X – E(X))2]

Facilmente daqui se deduz uma expressão mais simples para o cálculo da


variância:
var(X) = E(X2) – [E(X)]2

Propriedades da variância:

1. var(X) ≥ 0

2. Dadas as constantes a e b, tem-se que var(aX+b) = a2 var(X)

A variância de X é uma medida da dispersão da distribuição de X relativamente ao


seu valor médio.

Cristina Rocha - DEIO/FCUL


Desvio padrão (populacional)
É por vezes mais conveniente usar como parâmetro de dispersão a raiz
quadrada da variância, visto que assim estaremos a usar uma medida que se
exprime nas mesmas unidades da variável.

Então, define-se desvio padrão da v.a. X como

s  var(X )
O desvio padrão mede a variabilidade da população relativamente ao seu valor
médio.
Coeficiente de variação (populacional)

O coeficiente de variação da v.a. X é igual, se existir, ao quociente entre o


desvio padrão e o valor médio de X

CV = s/m

O coeficiente de variação é uma grandeza que não depende de qualquer


unidade de medida e é, portanto, muito utilizada para comparar a dispersão
relativa de variáveis aleatórias.
Cristina Rocha - DEIO/FCUL
Par aleatório
Por vezes, é necessário descrever o resultado de uma experiência aleatória
recorrendo a mais do que uma variável. Vamos considerar o caso de duas
variáveis aleatórias e vamos estudar o seu comportamento conjunto.

Par aleatório discreto

Sejam X e Y as duas v.a.’s discretas. Chama-se função massa de probabilidade


(f.m.p.) do par (X,Y) à função que, a cada valor numérico (xi,yj) que o par de
v.a.’s assume, faz corresponder a probabilidade associada a esse valor.

pij  P( X  xi  Y  y j )  P( X  xi , Y  y j ) i  1,..., k ; j  1,..., m

Um par aleatório discreto fica perfeitamente identificado pela sua f.m.p.


conjunta, i.e., pelos valores que o par de v.a.’s assume e pelas probabilidades
de assumir esses valores.

Cristina Rocha - DEIO/FCUL


A f.m.p. do par aleatório (X,Y) costuma representar-se numa tabela:

X \Y y1  yj  ym
x1 p11 p1 j p1m p1.
  
xi pi1 pij pim pi. f.m.p. marginal de X
  
xk p k1 p kj p km pk .
p.1  p. j  p.m 1

f.m.p. marginal de Y

A f.m.p. conjunta goza das seguintes propriedades:

1) pij  0 i, j.
2)  p
i j
ij 1

Cristina Rocha - DEIO/FCUL


As f.m.p. marginais das v.a.’s X e Y são, respectivamente

 xi i  1, , k  y j j  1, , m
Y  p  P(Y  y )  p
X  p  P( X  x )  p
i. i j ij  . j j i ij


Função massa de probabilidade condicional

Sendo (X,Y) um par aleatório discreto tal que P(Y = yj) > 0, a f.m.p. condicional
de X dado Y = yj é dada por

P( X  xi , Y  y j ) pij
P( X  xi | Y  y j )  
P(Y  y j ) p. j

para i=1,…, k. De modo análogo se pode definir a f.m.p. condicional de Y dado


X = xi, desde que P(X = xi) > 0.

Cristina Rocha - DEIO/FCUL


Variáveis aleatórias independentes

X e Y são variáveis aleatórias (discretas) independentes se e só se

P( X  xi , Y  y j )  P( X  xi ) P(Y  y j ) ( xi , y j )

ou seja, para todo o par de valores (xi,yj) em que (X,Y) está definido.

Valor médio de uma função de um par aleatório discreto

Seja g(X,Y) uma função das v.a.’s X e Y que têm f.m.p. conjunta dada por

pij  P( X  xi , Y  y j )

Então, o valor médio de g(X,Y) é Eg ( X , Y )   g ( xi , y j ) pij


i j

Caso particular: E ( X Y )   xi y j pij


i j

Cristina Rocha - DEIO/FCUL


Par aleatório contínuo

O par aleatório (X,Y) é contínuo se existir uma função f não negativa, a que
se chama função densidade de probabilidade conjunta do par (X,Y) , tal que

x y

F ( x, y )  P ( X  x, Y  y )  
- -
f (u, v)dv du ( x, y )   2

onde F(x,y) é a f.d. conjunta das v.a.’s X e Y. Se a f.d.p. f(x,y) for contínua no
ponto (x,y), então 2 2
 F ( x, y )  F ( x, y )
f ( x, y )  
x y y x

Propriedades da f.d.p. conjunta

1) f ( x, y )  0 ( x, y )   2
  
2)   f ( x, y)dx dy  1
- - 

Cristina Rocha - DEIO/FCUL




A f.d.p. marginal de X é f X ( x)   f ( x, y) dy
-



A f.d.p. marginal de Y é fY ( y )   f ( x, y) dx
-

Função densidade de probabilidade condicional


Sendo (X,Y) um par aleatório contínuo, a f.d.p. de X condicional a Y = y é dada
por
f ( x, y )
f X |Y  y ( x)  , se fY ( y )  0
fY ( y )

De modo análogo se define a f.d.p. condicional de Y dado X = x, para fX(x) > 0.

As variáveis aleatórias X e Y (contínuas) são independentes se e só se

f ( x, y)  f X ( x) fY ( y) ( x, y)  2

Cristina Rocha - DEIO/FCUL


Covariância

Dadas duas v.a. X e Y, existe uma medida do grau de intensidade com que as
v.a.’s se associam (linearmente) que se designa por covariância entre X e Y

cov(X,Y) = E[(X – E(X)) (Y – E(Y))]

Pelas propriedades do valor médio, obtem-se uma expressão equivalente:

cov(X,Y) = E(XY) – E(X)E(Y)

1. Para quaisquer v.a.’s X e Y tem-se que

var(X  Y) = var(X) + var(Y)  2cov(X,Y)

2. Se as v.a.’s X e Y são independentes, então cov(X,Y) = 0

Se X e Y são v.a.’s independentes, então

E(XY) = E(X) E(Y)

var(X  Y) = var(X) + var(Y)

Cristina Rocha - DEIO/FCUL


Coeficiente de correlação

A covariância depende das unidades em que se exprimem as v.a. X e Y. Assim, é


conveniente introduzir um novo parâmetro, não dependente dessas unidades,
para medir o grau de associação linear entre X e Y.

O coeficiente de correlação entre as v.a. X e Y é dado por

cov( X , Y ) cov( X , Y )
 
var( X ) var(Y ) s X sY

Pode demonstrar-se que  toma valores no intervalo [-1,1]. Além disso,

• um valor de  próximo de 1 ou de -1 significa uma forte associação linear entre


XeY
• um valor de  próximo de zero significa que a associação linear entre X e Y não
existe ou é muito fraca. Neste caso as v.a. X e Y podem estar correlacionadas
não linearmente.

Cristina Rocha - DEIO/FCUL

Você também pode gostar