Você está na página 1de 48

Universidade Federal do Piauí

Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI


Profa. Gisele

V - VARIÁVEIS ALEATÓRIAS

1. INTRODUÇÃO
Ao descrever o espaço amostral de um experimento aleatório, o resultado individual
não necessariamente é um número. Por exemplo: no lançamento de duas moedas consecutivas
podemos obter: S = {cara-cara, cara-coroa, coroa-cara, coroa-coroa}. Contudo, em muitas
situações experimentais, estaremos interessados na mensuração de alguma coisa e no seu
registro como um número. Ou seja, desejamos atribuir um número real x a todo elemento a do
espaço amostral S. Portanto, no caso do lançamento consecutivo de duas moedas, podemos
transformar os resultados de S em números, atribuindo-se de acordo com a contagem do
NÚMERO DE COROAS obtidas, ou seja, S ={0, 1, 2}, ou de acordo com o NÚMERO DE
CARAS obtidas, ou seja, S ={2, 1, 0}.
A este procedimento de obter uma função X, que associe aos elementos a pertencentes
a S um número real, X(a), é denominada VARIÁVEL ALEATÓRIA.

2. CONCEITOS DE VARIÁVEL ALEATÓRIA


Definição simplificada: Uma vez que os valores da variável estão relacionados a um
experimento aleatório ou probabilístico, VARIÁVEL ALEATÓRIA é toda variável cujos
resultados estão associados a uma probabilidade.

Experimentos aleatórios são aqueles que, repetidos em idênticas condições,


podem produzir resultados diferentes. Embora não se saiba qual o resultado que irá
ocorrer num experimento, em geral, consegue-se descrever o conjunto de todos os
resultados possíveis que podem ocorrer. As variações de resultados, de experimento
para experimento, são devidas a uma multiplicidade de causas que não podemos
controlar, as quais denominam acaso.
acaso

1
Definição estatística: Seja E um experimento aleatório e S o espaço amostral
associado a este experimento. Uma função X, que associe a cada elemento a pertencente a S
um número real, X(a), é denominada VARIÁVEL ALEATÓRIA.

v.a.X
a X(a)

S R

Ex: Considere o experimento probabilístico ou aleatório: lançamento de duas moedas


consecutivas, logo:
S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa}
Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS
obtidas, ou seja:
X = {0, 1, 2},
Portanto,
X(cara-cara) = 0 (NENHUMA COROA NO LANÇAMENTO DE DUAS MOEDAS)
X(cara-coroa) = X(coroa-cara) = 1 (UMA COROA NO LANÇAMENTO DE DUAS MOEDAS)
X(coroa-coroa) = 2 (DUAS COROA NO LANÇAMENTO DE DUAS MOEDAS)

Cara-cara 0
Cara-coroa 1
Coroa-cara
Coroa-coroa 2

R
S

Em que,
S = espaço amostral original correspondente a todos os possíveis resultados do experimento
(numérico ou não);
R = novo espaço amostral associado à variável aleatória X, representando todos os valores
numéricos de interesse (todos os valores possíveis e definidos de X(a) de a em S).

2
Observações:
a) Apesar da terminologia “variável aleatória”, ela é uma função cujo domínio é o
conjunto S e o contradomínio é o conjunto R;
b) O uso de variáveis aleatórias equivale a descrever os resultados de um experimento
aleatório por meio de números ao invés de palavras, o que apresenta a vantagem de
possibilitar melhor tratamento estatístico;
c) Nem toda função é uma variável aleatória, pois uma vez que ao mesmo s forem
atribuídos diferentes X(a), a relação não poderá se caracterizar uma relação funcional
ou função.

Lembrete: Uma quantidade é uma função de outra quando, para cada quantidade da variável
independente (x), corresponde a um único valor denominado f(x) (variável dependente). O
conjunto em que os valores de x podem ser tomados é chamado de domínio da função, e o
conjunto dos valores que f assume para cada x é denominado imagem da função.

As variáveis aleatórias serão sempre representadas por letras maiúsculas (X, Y, Z, W,


etc.). As realizações (ou variações) dessas variáveis em um dado elemento da população serão
sempre representadas por letras minúsculas (x, y, z, w, etc.).
Quando o resultado do experimento probabilístico for registrado como um único
número x ter-se-á uma VARIÁVEL ALEATÓRIA UNIDIMENSIONAL, que poderá ser
discreta ou contínua.
Porém, quando para um determinado experimento, cada resultado é proveniente da
avaliação simultânea de dois caracteres, como por exemplo, estudar a estatura X e o peso Y,
de alguma pessoa escolhida ao acaso, o resultado será (x,y), e ter-se-á uma VARIÁVEL
ALEATÓRIA BIDIMENSIONAL. Nota-se, nesse caso, que cada resultado é identificado por
cada um dos valores que as variáveis aleatórias unidimensionais assumem.

X(a)
v.a.X

S v.a.Y
Y(a)

3
3. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS
3.1. Variável Aleatória Discreta
3.1.1. Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de
X(a) (isto é o seu contradomínio) for finito ou infinito enumerável, denominaremos X de
variável aleatória discreta, assim, os valores possíveis de X são x1, x2,....,xn. No caso finito a
lista de valores de x acaba e no caso infinito enumerável, a lista continua indefinidamente.
Em geral uma variável aleatória é obtida mediante alguma forma de contagem.

3.1.2. Função de probabilidade (f.p.)


Utilizando o conceito de função em que uma quantidade é uma função de outra quando,
para cada quantidade da variável independente (x), corresponde a um único valor denominado
f(x) (variável dependente), chama-se FUNÇÃO DE PROBABILIDADE (f.p.) da variável
aleatória discreta X, a função:
F(x) = P (X = xi) = P (xi)
Pois a cada valor de xi associa-se sua probabilidade de ocorrência.

A função P (xi) será uma f. p. se satisfizer às seguintes condições:


* P(xi) ≥ 0, para todo xi, e,
* ∑ P( x ) = 1 = P( S )
i

OBS.: Mesmo que a variável assuma um número infinito enumerável de valores não há
nenhum problema em comprovar que cada xi contribui com uma quantidade f(xi) ao total, de
modo que,
∞ ∞ ∞


i =1
f ( xi ) = ∑ p ( x i ) = ∑ P ( X = x i ) = 1
i =1 i =1

À coleção de pares [xi, P(xi)], i = 1, 2,..., n, denominamos DISTRIBUIÇÃO DE


PROBABILIDADE da v. a. d. X, que pode ser representada por meio de tabelas e gráficos.

3.1.2.1. Representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de variável


aleatória discreta
É dada por:

4
xi x1 x2 … xn ∑
P(X=xi) P(x1) P(x2) ... P(xn) 1,0

3.1.2.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de variável


aleatória discreta
É obtida alocando-se no eixo das abscissas os valores de x e no eixo das coordenadas
os valores de suas respectivas probabilidades. Uma linha horizontal é feita em cada valor de x
na altura de sua respectiva probabilidade.

Exemplo 1:
Considere o experimento probabilístico ou aleatório: lançamento de duas moedas
consecutivas, logo:
S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa}
Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS
obtidas, ou seja:
X = {0, 1, 2},
Portanto,
X(cara-cara) = 0, X(cara-coroa) = X(coroa-cara) = 1, X(coroa-coroa) = 2. Cujas probabilidades de ocorrência
são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4.
Logo, a representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de X é:

xi 0 1 2 ∑
P(X=xi) 1/4 2/4 1/4 1,0

Em que,
k
P (xi) ≥ 0 e ∑ P[ X = x ] = 1
i =1
i

Nota-se que para uma variável aleatória discreta as probabilidades de cada valor x
correspondem à própria função, por isso esta é chamada de FUNÇÃO DE
PROBABILIDADE.

5
E a representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X é:

2/4

1/4

0 1 2 x
Exemplo 2:
Tem-se 5 animais: 2 animais de uma raça bovina A (A1 e A2) e 3 animais de uma raça
bovina B (B1, B2 e B3). Deseja-se obter uma amostra de 2 animais da raça A, escolhidos ao
acaso dentre os 5 animais.
a) Obter o espaço amostral desse experimento aleatório
S: {A1A2, A1B1, A1B2, A1B3, A2B1, A2B2, A2B3, B1B2, B1B3, B2B3}

b) Obter a variável aleatória X “número de animais da raça A” na amostra.


{B1B2, B1B3, B2B3}, ou seja, nenhum animal da raça A.
{A1B1, A1B2, A1B3, A2B1, A2B2, A2B3}, ou seja, um animal da raça A.
{A1A2}, ou seja, dois animais da raça A.
No entanto, na estatística, é mais fácil utilizar valores numéricos do que trabalhar
diretamente com elementos de um espaço como o anterior. Assim, se X se for a variável
aleatória NÚMERO DE ANIMAIS DA RAÇA A, os valores assumidos por X são x = 0, 1, 2.
Como essa associação de números aos pontos do espaço amostral, define-se uma
função sobre cada elemento desse espaço. Essas funções sobre os elementos do espaço são as
variáveis aleatórias. No caso, tem-se uma variável aleatória discreta, em que se atribui um
único número real a cada elemento do espaço amostral S.

c) Obter a tabela da DISTRIBUIÇÃO DE PROBABILIDADE de X.


Seja a v. a d. X o NÚMERO DE ANIMAIS DA RAÇA A, a representação tabular da
função de probabilidade da variável número de animais da raça A é dada por:

xi 0 1 2 ∑
3 6 1
P(X=xi) 1,0
10 10 10

6
Em que,
k
P (xi) ≥ 0 e ∑ P[ X = x ] = 1
i =1
i

d) Obter o gráfico da DISTRIBUIÇÃO DE PROBABILIDADE de X.


A representação gráfica da função de probabilidade da variável número de animais da
raça A é dada por:

6/10

3/10

1/10

0 1 2 x

Figura 1. Função de probabilidade da variável NÚMERO DE


ANIMAIS DA RAÇA A.

3.1.3. Variável aleatória discreta uniformemente distribuída


Este é o caso mais simples de variável aleatória discreta, em que cada possível valor
ocorre com a mesma probabilidade.

Definição: A variável aleatória discreta X, assumindo os valores x1, x2, ..., xn, tem distribuição
uniforme, se e se somente se:
1
f(x) = P (X = xi) = P (xi) = p = , para todo i = 1, 2, …, n
n
Exemplo:
Considere o experimento aleatório o lançamento de um dado não-viciado.
S = {1, 2, 3, 4, 5, 6}
Considere a variável aleatória discreta X dada pelo NÚMERO DE PONTOS OBTIDOS.
Essa variável assume obviamente os valores de 1 a 6, e a cada valor é possível associar um
único número real, ou seja, um valor de probabilidade, que no caso, para todos é igual a 1/6.

7
Portanto, a representação tabular da função de probabilidade F(x) = P (X = xi) = P (xi), ou
seja, a DISTRIBUIÇÃO DE PROBABILIDADE de X:

xi 1 2 3 4 5 6 ∑
P(X=xi) 1/6 1/6 1/6 1/6 1/6 1/6 1,0

3.1.3.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X.

1/6

1 2 3 4 5 6

Figura 1. Função de probabilidade da variável NÚMERO DE


PONTOS OBTIDOS no lançamento de um dado.

3.2. Variável aleatória contínua


3.2.1. Definição:
Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de X(a) (isto é o seu
contradomínio) for infinito não-enumerável como, por exemplo, um intervalo, X será
denominada de variável aleatória contínua.
Consideremos por exemplo o experimento que consiste em selecionar, ao acaso, um fruto
de tomate de uma área de produção e determinar o valor do peso do fruto em gramas. Nesse
caso, dentro de um determinado grau de precisão decorrente da limitação do equipamento de
mensuração, a variável aleatória X = PESO DO FRUTO pode assumir um valor qualquer em
um determinado intervalo da reta real, sendo, portanto, uma variável aleatória contínua.
Como uma variável aleatória contínua pode assumir uma infinidade de valores em um
intervalo real, ou seja, o conjunto de valores que a variável pode assumir é infinito não-
enumerável, a cada um dos infinitos valores da reta real é atribuída probabilidade nula.
Portanto, não faz sentido fazer uma soma das probabilidades de cada um dos valores como no

8
caso das variáveis aleatórias discretas, mas sim fazer a soma das probabilidades dos valores
em intervalos da reta real. Nesse caso, o que generaliza o conceito de ∑ é o de integral ( ∫ ) ,

ou seja, calcular a integral significa “integrar” ou somar os valores da função.

3.2.2. Função de densidade probabilidade (f.d.p.)


Como para variável aleatória contínua a probabilidade de cada um dos infinitos valores na
reta real é igual a zero, não se tem uma função de probabilidade F(x) = P (X = xi) = P (xi)
como para variável aleatória discreta. Nesse caso, as probabilidades de ocorrência de cada um
dos possíveis resultados do experimento aleatório são determinadas por uma função contínua
f(x) denominada FUNÇÃO DENSIDADE PROBABILIDADE (f.d.p.), que satisfaça as
seguintes condições:
a) f ( x ) ≥ 0 para todo x
As probabilidades não podem ser negativas.
+∞
b) ∫ f ( x )dx = 1
−∞
A probabilidade do espaço amostral é 1, isto é, a probabilidade de ocorrência dos
resultados dentro do intervalo é sempre 100% possível.
b
c) P(a ≤ X ≤ b) = ∫ f ( x )dx
a

A probabilidade de que a variável aleatória assuma valores em um intervalo é a área


sob a curva da função densidade probabilidade no intervalo entre a e b.
É importante ressaltar que, no cálculo da probabilidade de um intervalo, este pode ser
fechado ou aberto, pois a inclusão ou não dos extremos a e b do intervalo não altera o valor
desse cálculo, visto que a probabilidade de um ponto é nula.

IMPORTANTE: A f(x) de uma v. a c., função de densidade probabilidade,


não é probabilidade. Somente quando a função for integrada entre dois
limites, ela produzirá uma probabilidade, que será a área sob a curva da
função X = a e X = b, a < b, ou seja, a probabilidade de x em intervalo entre a e b da reta real.

Exemplo 1: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado
inicial, cuja função de x [f(x)] é dada por:

9
kx, se 10 ≤ x ≤ 20
f(x) =
0, outros valores de x.

Dada a função desta variável, calcule k de modo que f (x) seja uma f.d.p.
Resposta:
+∞
Para isto, a f (x) deve atender as duas condições f ( x ) ≥ 0 para todo x e ∫ f ( x )dx = 1 .
−∞
Assim,
+∞

∫ f ( x)dx = 1
−∞

20

∫ (kx)dx = 1
10

20
x2
k .( ) =1
2 10

1 1
k . (20 2 − 10 2 ) =
2 150
Logo, k = 1/150 também atende a primeira condição de f ( x) ≥ 0 ∀ x .

Portanto qualquer fruto com diâmetro entre 10 e 20 terá a mesma probabilidade de


ocorrência, ou seja, será igual a 1 ou 100%, e fora desse intervalo a probabilidade será sempre
igual a zero. Porém, se desejarmos saber a probabilidade de encontrarmos um fruto com
diâmetro entre 10 e 12, a forma de obtenção da mesma será pela resolução da integral
considerando esse intervalo, qual seja:
12
1
P(10 ≤ x ≤ 12) = ∫ ( x)dx = ?
10
150
12
1 x2
P(10 ≤ x ≤ 12) = .( )
150 2 10

1
P(10 ≤ x ≤ 12) = (12 2 − 10 2 ) = 0,15 ou 15%
300

10
Exemplo 2: Considerando que a demanda diária, em quilogramas, de determinado produto
em um supermercado é uma variável aleatória, dada pela seguinte função densidade
probabilidade (f. d. p.):

kx, se 0 ≤ x ≤ 1/2
f(x) = k(1 - x), se 1/2 ≤ x ≤ 1
0, outros valores de x.

a) Determinar o valor de k.
Para isto, a f (x) ser f.d.p deve atender as duas condições f ( x ) ≥ 0 para todo x e
+∞
∫ f ( x )dx = 1 .
−∞
Assim,
+∞

∫ f ( x)dx = 1
−∞

1/ 2 1

∫ (kx)dx + ∫ [k (1 − x)]dx = 1
0 1/ 2

1/ 2 1 1
x2 x x2
k .( ) + k .( ) − k .( ) = 1
2 0 1 1/ 2 2 1/ 2

1 1
k . [(1 / 2) 2 − 0 2 )] + k .[(1) 2 − (1 / 2) 2 ] − k . [(1) 2 − (1 / 2) 2 ] = 1
2 2
k =4
Logo, k = 4
Portanto,
4x, se 0 ≤ x ≤ 1/2
f(x) = 4(1 - x), se 1/2 ≤ x ≤ 1
0, outros valores de x.

b) Calcular a probabilidade de que a demanda diária do produto esteja entre 250 e 750g.
Sabe-se que para a demanda diária entre 0 e 500 g (ou 0 e 1/2) a função é 4x, e que
para a demanda entre 500g e 1000g (ou 1/2 e 1) a função é 4(x – 1). Logo, para saber a
demanda diária entre 250 e 750 deve-se integrar e somar nos intervalos de 250 a 500g (ou 1/4
e 1/2) e de 500 a 750g (ou 1/2 e 3/4). Ou seja:

11
750 1/ 2 3/ 4


250
f ( x)dx = ∫
1/ 4
f ( x)dx + ∫ f ( x)dx
1/ 2

750 1/ 2 3/ 4


250
f ( x)dx = ∫ (4 x)dx + ∫ [4(1 − x)]dx
1/ 4 1/ 2

750 1/ 2 3/ 4


250
f ( x)dx = ∫ (4 x)dx +
1/ 4
∫ (4 − 4 x)dx
1/ 2

750 1/ 2 3/ 4 3/ 4


250
f ( x)dx = ∫ (4 x)dx +
1/ 4
∫ (4)dx −
1/ 2
∫ (4 x)dx
1/ 2

750 1/ 2 3/ 4 3/ 4
x2 x x2

250
f ( x ) dx = 4 .( )
2 1/ 4
+ 4 .( )
1 1/ 2
− 4 .( )
2 1/ 2
750
4 4
∫ f ( x)dx = 2 .[(1 / 2)
2
+ (1 / 4) 2 ] + 4.(3 / 4 − 1 / 2) − .[(3 / 4) 2 − (1 / 2) 2 ]
250
2
750

∫ f ( x)dx = 0,75 ou 75%


250

Logo, a probabilidade de que a demanda diária do produto esteja entre 250 e 750 é 75%.

3.2.3. Variável aleatória contínua uniformemente distribuída


É o caso mais simples de variável aleatória contínua.
Definição: A v.a. contínua tem distribuição uniforme no intervalo [a,b], sendo a e b finitos, se
a sua função densidade de probabilidade (f. d. p.) for dada por:
 1
 , para a ≤ x ≤ b
f ( x) =  b − a
0, para outros valores de x

4. VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS


Seja E um experimento aleatório e S um espaço amostral associado a E. Seja X uma
variável aleatória e Y outra variável aleatória e X(a) e Y(a) são duas funções, cada uma
associando um número real a cada resultado de a ∈ S, então determinaremos (X,Y) uma
variável aleatória bidimensional. Na prática, significa que para um determinado experimento
aleatório, cada resultado é proveniente da avaliação simultânea de duas variáveis.
Do mesmo modo que no caso unidimensional (X,Y) deve ter associada a cada valor
que pode assumir uma probabilidade de sua ocorrência. Assim, são definidas as funções e

12
distribuições de probabilidades da v.a. bidimensional (X,Y). Para o nosso estudo
consideraremos que X e Y são ambas discretas ou ambas contínuas.

4.1. Quando (X,Y) é variável aleatória discreta bidimensional


Se os valores possíveis da variável (X,Y) forem finitos ou infinitos enumeráveis, esta
será uma v.a. discreta bidimensional. Assim, os valores possíveis de (X,Y) podem ser
representados por (xi, yj) i = 1, 2, ..., n j = 1, 2, ..., m

4.1.1. Função de probabilidade conjunta de X e Y


É dada por:
P ( X = x i , Y = y j ) = P ( xi , y j )

Em que a cada valor de (xi, yi) associa-se a sua probabilidade de ocorrência.

Para que P(xi, yi) seja uma função de probabilidade conjunta é necessário que satisfaça
às seguintes condições:
i) P(xi, yi) ≥ 0, ∀ (xi,yj)
m n
ii) ∑∑ P( x , y
j =1 i =1
i j ) = 1 ,0

4.1.2. Distribuição de probabilidade conjunta de X e Y


É o conjunto {(xi,yj), P(xi,yj)} ∀ i = 1, 2, ..., n j = 1, 2, ..., m
Y Total
X
y1 y2 K ym
m

x1 P(x1, y1) P(x1, y2) K P(x1, ym) P(X = x1) = P(x1) = ∑ P( x1 , y j )


j =1

X2 P(x2, y1) P(x2, y2) K P(x2, ym) P(X = x2) = P(x2) = ∑ P ( x 2 , y j )


j =1

M M M M M M
m

xn P(xn, y1) P(xn, y2) K P(xn, ym) P(X = xn) = P(xn) = ∑ P ( x n , y j )


j =1

P(Y = y1) = P(Y = y2) = P(Y = ym) =


P(y1) P(y2) P(ym)
Total n n K n
1,0
= ∑ P( xi , y1 ) = ∑ P( xi , y 2 ) = ∑ P( xi , y m )
i =1 i =1 i =1

13
A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos
determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas
DISTRIBUIÇÕES MARGINAIS.
A distribuição marginal é constituída pelos valores da variável aleatória e suas
respectivas probabilidades marginais. A probabilidade marginal para cada valor é obtida da
seguinte forma:
m
 Para X: P(X = xi) = P (xi) = ∑ P( x , y
j =1
i j )

n
 Para Y: P(Y = yi) = P (yi) = ∑ P( x , y
i =1
i j )

Ou seja, a marginal de X é a função de probabilidade da v.a. X sem considerar a v.a.Y,


e a marginal de Y é a função de probabilidade da v. a.X sem considerar a v.a.X.

Com as probabilidades marginais para cada valor, podemos construir a distribuição


marginal para a variável aleatória:

 Para X:

xi x1 x2 … xn

P(X=xi) P(x1) P(x2) ... P(xn)

 Para Y:

yi y1 y2 … ym

P(Y=yi) P(y1) P(y2) ... P(ym)

14
Exemplo:
Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é
dada pela tabela:
Y
X
-3 0 1
-2 1/9 0 2/9
0 0 2/9 2/9
1 1/9 1/9 0

a) Obter as probabilidades marginais de X e Y.


m
 Para X: P(X = xi) = P (xi) = ∑ P( x , y
j =1
i j )

P(X = -2) = P (-2) = 1/9 + 0 + 2/9 = 3/9


P(X = 0) = P (0) = 0 + 2/9 + 2/9 = 4/9
P(X = 1) = P (1) = 1/9 + 1/9 + 0 = 2/9
m
Logo, ∑ P( x , y
j =1
i j ) = 3/9 + 4/9 + 2/9 = 1,0

Ou seja,

xi -2 0 1 ∑
P(X = xi) 3/9 4/9 2/9 1,0

n
 Para Y: P(Y = yi) = P (yi) = ∑ P( x , y
i =1
i j )

P(Y = -3) = P (-3) = 1/9 + 0 + 1/9 = 2/9


P(Y = 0) = P (0) = 0 + 2/9 + 1/9 = 3/9
P(Y = 1) = P (1) = 2/9 + 2/9 + 0 = 4/9
n
Logo, ∑ P( x , y
i =1
i j ) = 2/9 + 3/9 + 4/9 = 1,0

Ou seja,

yi -2 0 1 ∑
P(Y = yi) 2/9 3/9 4/9 1,0

15
4.2. Quando (X,Y) é variável aleatória contínua bidimensional
Se a variável (X,Y) puder assumir todos os valores em algum conjunto infinito não-
enumerável, esta será uma v.a. contínua bidimensional.

4.2.1. Função de densidade probabilidade conjunta de X e Y


Seja (X,Y) uma v.a.c. bidimensional. Diz-se que f(x,y) é uma função de densidade
probabilidade conjunta de X e Y, se satisfazer as seguintes condições.
i) f(x,y) ≥ 0, ∀ todo (x,y)
m n
ii) ∫ ∫ f ( x, y)dx.dy = 1
j =1 i =1

Em que, f(x,y) = 0 para (x,y) ∉ aos intervalos de x e y.

4.2.2. Distribuição de probabilidade conjunta de X e Y


A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos
determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas
DISTRIBUIÇÕES MARGINAIS. Porém, para (X,Y) variável aleatória contínua, as funções
de densidade probabilidade marginais de X e Y são dadas por:
+∞
f ( x) = ∫ f ( x, y)dy
−∞

+∞
f ( y) = ∫ f ( x, y)dx
−∞

Exemplo:
Sejam X e Y variáveis aleatórias contínuas com f.d.p. conjunta dada por:
k (2x +y), se 2 ≤ x ≤ 6 0≤ y≤ 5
f(x,y) = 0, para outros valores de x e y

a) Calcular o valor de k
6 5
∫∫
2 0
f ( x, y )dxdy = 1,0
6 5
∫ ∫ k (2 x + y)dxdy = 1,0
2 0

6 5 6 5
∫ ∫ k (2 x)dxdy + ∫ ∫ (ky)dxdy = 1,0
2 0 2 0

6 5 6 5
∫∫
2 0
k (2 x)dxdy + ∫
2 ∫ (ky)dxdy = 1,0
0

16
6 6
5 x2 5 x1
∫0 2
2 k .( ) dy + ∫2 1 ) dy = 1,0
ky.(
2 2

5 5
∫ k.(6 − 2 2 ) dy + ∫ ky.(6 − 2) dy = 1,0
2
0 2

5 5
∫ 32k.dy + ∫ 4ky.dy = 1,0
0 2

5 5
y1 y2
32k ( ) + 4k ( ) = 1,0
1 0 2 0

32k (5 − 0) + 2k (5 2 − 0 2 ) = 1,0
160k + 50 = 1,0
210k = 1,0
1
k=
210

b) Obter as funções marginais de X e Y


Função marginal de X:
5 1
f ( x) = ∫ (2 x + y )dy
0 210
5 2x 5 y
f ( x) = ∫ dy + ∫ dy
0 210 0 210

5
2x 5 1 y2
f ( x) = y0 + .
210 210 2 0

x 1 2
f ( x) =
105
(5 − 0) +
420
5 −0 ( )
x 5
f ( x) = +
21 84
4x + 5
f ( x) =
84

Função marginal de Y:
6 1
f ( y) = ∫ (2 x + y )dx
2 210
6 2x 6 y
f ( x) = ∫ dx + ∫ dx
2 210 2 210

17
6 6
2 x2 y
f ( y) = + .x
210 2 2
210 2
6 6
1 2 y
f ( y) = x + .x
210 2 210 2
1 y
f ( y) = (6 3 − 2 3 ) + (6 − 2)
210 210
1 y
f ( y) = (216 − 8) + 4
210 210
208 4 y
f ( y) = +
210 210
16 2 y
f ( y) = +
105 105
16 + 2 y
f ( y) =
105

5. MEDIDAS DE POSIÇÃO E DISPERSÃO DE VARIÁVEIS ALEATÓRIAS


5.1. Medidas de posição
5.1.1. Esperança matemática (média ou valor esperado de uma v. a.) - E(X)
A ESPERANÇA MATEMÁTICA é a média ou valor esperado de uma variável
aleatória. A esperança matemática de uma distribuição é também denominada uma medida de
tendência central. Do ponto de vista científico, a esperança matemática corresponde ao que se
espera que aconteça em média.

 Se X for uma variável aleatória discreta


Definição. Dado uma v.a. X discreta, assumindo os valores x1, x2,...,xn, chamamos valor
médio ou esperança matemática de X o valor:
n
E(X) = ∑ x .P ( X
i −1
i = xi )

Exemplo:
Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas
consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS
obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4
e P (2) = 1/4.

18
n 1 2 1
E(X) = ∑ x .P ( X
i −1
i = x i ) = 0. + 1. + 2
4 4 4
= 1,0

Interpretação: Se esse experimento aleatório constituído pelo lançamento de duas moedas for
realizado n vezes, espera-se, em média, obter 1,0 coroa.

 Se X for uma variável aleatória contínua


Definição. Dado uma v. a. X contínua, assumindo os valores x1, x2,...,xn, chamamos valor
médio ou esperança matemática de X o valor:
+∞
E(X)= ∫ x. f ( x ) dx
−∞

Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado
inicial, cuja função de x [f(x)] é dada por:
1
x, se 10 ≤ x ≤ 20
f(x) = 150
0, outros valores de x.
20
1
E ( X ) = ∫ x( x)dx
10
150
20
1 x3
E( X ) = .( )
150 3 10

1 1
E( X ) = . (20 3 − 10 3 ) = 15,56mm
150 3

Interpretação: Se esse experimento aleatório constituído pela colheita ao acaso de fruto de


mamão for realizado n vezes, espera-se, em média, obter fruto de 15,56 mm de diâmetro.

As propriedades da Esperança Matemática são:

1º) E (K) = K, sendo K uma constante.


2º) E (X + K) = E (X) + K
3º) E (K.X) = K. E (X)
4º) E (X + Y) = E (X) + E (Y)
5º) E (XY) = E(X).E (Y), se X e Y são independentes (Cov (X,Y) = 0)

19
3.2. Medidas de dispersão
3.2.1. Variância - V(X) ou σ 2
Definição. A variância quantifica a dispersão dos dados em torno da média. É dada por:
V(X) = E[X - µX]2
V(X) = E[X2 – 2.X.µX + µX2]
V(X) = E(X2) – 2.E(X.µX) + E(µX2)
V(X) = E(X2) – 2. µX.E(X) + µX2
V(X) = E(X2) – 2. E(X).E(X) + [E(X)]2
V (X) = E(X2) – 2.[E(X)]2 +[E(X)]2
V (X) = E(X2) – [E(X)]2

A obtenção da variância depende se X é variável aleatória discreta ou contínua.

 Se X for uma variável aleatória discreta


Definição. A variância de uma variável aleatória discreta quantifica a dispersão dos dados em
torno da média esperada. É definida por:
V (X) = E(X2) – [E(X)]2
n
Em que, E ( X 2 ) = ∑ xi2 .P ( xi )
i =n

Exemplo:
Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas
consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS
obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4
e P (2) = 1/4.
n n
1 2 1
∑ xi .P ( X = xi ) = 1,0 e E ( X ) = ∑ xi .P( xi ) = 0 .1 + 1 . + 2
2 2 2 2 2
E(X) = =
i −1 i =n 4 4 4
V (X) = E(X2) – [E(X)]2
V (X) =1,5 – 1,02
V(X) = 0,5

 Se X for uma variável aleatória contínua


Definição. A variância de uma variável aleatória contínua quantifica a dispersão dos dados
em torno da média esperada. É definida por:

20
V (X) = E(X2) – [E(X)]2

Em que E ( X 2 ) = ∫x
2
. f ( x)dx
−∞

Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado
inicial, cuja função de x [f(x)] é dada por:
1
x, se 10 ≤ x ≤ 20
f(x) = 150
0, outros valores de x.
20
1
V (X ) = ∫ x2 ( x)dx − [15,56] 2
10
150
20
1
V (X ) = ∫ x2 ( x)dx − [15,56] 2
10
150
20
1 x4
V (X ) = .( ) - [242,1136]
150 4 10

1 1
V (X ) = . (20 4 − 10 4 ) - [242,1136] = 7,8864 mm2
150 4

As propriedades da Variância são:


1º) V (K) = 0, sendo k uma constante.
2º) V (X + K) = V (X) + V(K) = V(X)
3º) V (K.X) = K2. V (X)
4º) V (XY) = V(X).V (Y)
5º) V (X + Y) = V (X) + V (Y) + 2Cov (X, Y), se X e Y são dependentes (Cov (X,Y) ≠ 0)
6º) V (X + Y) = V (X) + V (Y), se X e Y são independentes (Cov (X,Y) = 0)

4.2.2. Desvio padrão - σ


O desvio padrão de X, DP(X), é definido como a raiz quadrada positiva da variância. É
mais usada como medida de dispersão que a variância por estar na mesma unidade dos dados.

4.2.3. Covariância - Cov (X,Y)


É uma medida de associação entre variáveis aleatórias. É necessário que se tenha pelo
menos duas variáveis para que se obtenha a covariância.

21
A covariância entre duas v. a. X e Y é o produto dos desvios das variáveis (medida de
discrepância), qual seja:
Cov (X,Y) = E[(X - µX).(Y - µY)]
Desenvolvendo a expressão acima, temos:
Cov (X, Y) = E [(XY – X. µY –YµX + µXµY]
Cov (X, Y) = E [(XY – X.E(X) –YE(X) + E(X)E(Y)]
Cov (X, Y) = E (XY) – E(X)E(Y) –E(Y)E(X) + E(Y)E(X)]
Cov (X,Y) = E(XY) – E(X).E(Y)

Em que,
n m n
E(X ) = ∑ x .P ( X
i −1
i = x i ) e E ( XY ) = ∑∑x y
j =1 i −1
i j .P ( x i , y j ) ⇒ para (X,Y) discreta

+∞ +∞ +∞
E(X ) = ∫ x. f ( x ) dx
−∞
e E ( XY ) = ∫ ∫ xy . f ( x , y ) dx dy
− ∞− ∞
⇒ para (X,Y) contínua

Como a covariância é, por definição, a média dos produtos dos desvios (X - µx) por (Y -
µy), a covariância será positiva se ocorrerem desvios do mesmo sinal com maior
probabilidade, e negativa se correrem, com maior probabilidade, desvios com sinais
contrários. Ou seja,
- ∞ < Cov (X,Y) < + ∞

Assim, o sinal da covariância indica a relação entre as variáveis:


- Se Cov (X,Y) = 0, as variáveis X e Y não possuem dependência linear, ou seja, são
independentes;
- Se Cov (X,Y) > 0, as variáveis X e Y possuem uma relação linear de dependência, cuja
variação ocorre no mesmo sentido, ou seja, à medida que uma variável aumenta a outra
também aumenta, ou à medida que uma variável diminui a outra também diminui;
- Se Cov (X,Y) < 0, as variáveis X e Y possuem uma relação linear de dependência, cuja
variação ocorre no sentido contrário, ou seja, à medida que uma variável aumenta a outra
diminui e vice-versa.

As propriedades da Covariância são:


1º) Cov (X, K) = 0, sendo k uma constante.
2º) Cov (X,Y) = Cov (Y,X)

22
3º) Cov (X,X) = V(X)
4º) Cov (aX, bY) = ab.Cov(X,Y)
4º) Cov (X + Z, Y) = Cov (X,Y) + Cov (Z,Y)
5º) Cov (X,Y) = 0, se X e Y são independentes
6º) Cov (X,Y) ≠ 0, se X e Y são dependentes

Exemplo 1: Sabendo-se que Y = 3X – 5 e que E(X) = 2 e V(X) = 1, calcular:


a) E(Y)
E(3X – 5) = E (3X) – E (5)
E(3X – 5) = 3.E (X) – E (5)
E(3X – 5) = 3.2 – 5
E(3X – 5) = 1,0

b) V(Y)
V(3X – 5) = 32.V(X) – V(5) = 9.1 – 0 = 9

c) Cov (X,Y)
Cov (X, 3X – 5) = Cov (X, 3X) - Cov (X, 5) = 3. Cov (X,X) – 0 = 3. V(X) = 3. 1 = 3

d) V(X/3 – Y)
V(X/3) – V(Y) = (1/3)2.V(X) + V(Y) – 2.Cov (X/3,Y) = 1/9.V(X) + V(Y) – 2.1/3.Cov (X,Y)
V(X/3 – Y) = 1/9.1 + 9 – 2/3.(3) = 64/9

Exemplo 2: Seja a variável aleatória bidimensional DISCRETA (X,Y), cuja distribuição de


probabilidade conjunta é dada pela tabela:

X
Y -1 0 2 P (yi)
1 1/9 2/9 0 3/9
3 3/9 1/9 2/9 6/9
P(xi) 4/9 3/9 2/9 1,0

Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) ≠ 0.


Cov (X,Y) = E(XY) – E(X). E(Y)

23
n
4 3 2
E(X) = ∑ x .P ( x ) = − 1 . 9 + 0 . 9 + 2 . 9
i −1
i i
=0

m
3 6
E(Y) = ∑y
j −1
j .P ( y j ) = 1 .
9
+ 3 . = 2,33
9
m n
1 2 3 1 2
E(XY) = ∑ ∑ x .y
j =1 i −1
i j .P ( x i , y j ) = 1 .( − 1).
9
+ 1 .0 . + 1 .2 .0 + 3 .( − 1). + 3 .0 . + 3 .2 . = 0,22
9 9 9 9

Logo, Cov (X,Y) = 0,22 – 0. 2,33


Cov (X,Y) = 0,22

Interpretação: Como a Cov (X,Y) ≠ 0, X e Y são dependentes, havendo uma relação linear
positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento
em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y.

Exemplo 3: Sejam X e Y variáveis aleatórias CONTÍNUAS com f.d.p. conjunta dada por:
1
(2x +y), se 2 ≤ x ≤ 6 0≤y≤5
210
f(x,y) =
0, para outros valores de x e y

E funções de densidade probabilidade marginais:


4x + 5
f ( x) = se 2 ≤ x ≤ 6
84
f(x) =
0, para outros valores de x

16 + 2 y
f ( y) = se 0 ≤ y ≤ 5
105
f(y) =
0, para outros valores de y

Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) ≠ 0.


Cov (X,Y) = E(XY) – E(X). E(Y)
+∞ +∞
E ( XY ) = ∫ ∫ xy . f ( x , y ) dx dy
− ∞− ∞

5 6
 1 
E ( XY ) = ∫ ∫ xy . 210 (2 x + y ) dx dy
0 2

24
5  6  2 x 2 y xy 2  
E ( XY ) = ∫ 0
 ∫2 
  210
+  dx dy
210  

5  2y 6 y2 6 
E ( XY ) = ∫ 0 
 210

2
x 2 dx +
210 ∫2
xdx dy

5  2y x3 6
y2 x2 
6

E ( XY ) = ∫ 0

 210 3
+ dy
210 2 2 
2 
5
∫ [0,00317 y (6 ]
3
E ( XY ) = − 2 3 ) + 0,00238 y 2 ( 6 2 − 2 2 ) dy
0

5
∫ [0,65936 y + 0,07616 y ]dy
2
E ( XY ) =
0

5 5
E ( XY ) = ∫ 0
0,65936 ydy + ∫
0
0 ,07616 y 2 dy
5 5
E ( XY ) = 0,65936 ∫ ydy + 0,07616 ∫ y 2 dy
0 0

5 5
y2 y3
E ( XY ) = 0,65936 + 0 ,07616
2 0
3 0

E ( XY ) = 0,32968 (5 2 − 0 2 ) + 0 ,0254 (5 3 − 0 3 )
E ( XY ) = 11, 4153

+∞
6  4x + 5 
E(X ) = ∫ x. f ( x ) dx = ∫
−∞
2
x
 84 
 dx = 4 , 2540

+∞
5  16 + 2 y 
E (Y ) = ∫ y. f ( y ) dy = ∫
−∞
0
y
 105 
 dy = 2,1429

Logo, Cov (X,Y) = 11,4153 – 4,2540.2,1429


Cov (X,Y) = 2,2996

Interpretação: Como a Cov (X,Y) ≠ 0, X e Y são dependentes, havendo uma relação linear
positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento
em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y.

4.2.4. Coeficiente de correlação (ρXY)


Uma vez que a covariância varia de - ∞ a + ∞, é difícil determinar a intensidade da
relação linear entre as duas variáveis observando simplesmente a partir do valor da
covariância, pois a mesma apenas indica o sentido da relação. Para contornar essa dificuldade,
Karl Pearson propôs uma versão padronizada da covariância (caracterizada pela divisão da

25
covariância pelos desvios-padrão de X e Y), que é o coeficiente de correlação linear
populacional de Pearson, representado por ρXY.

O parâmetro é definido por:


Cov( X , Y ) E ( XY ) − E ( X ).E (Y )
ρ XY = =
V ( X ).V (Y ) V ( X ).V (Y )

⇒ É fácil notar que o coeficiente de correlação linear é uma medida mais eficiente de
associação entre variáveis que a covariância, por possibilitar a quantificação da associação.
Em outras palavras, a covariância apenas indica a existência ou não de relação linear entre as
variáveis e, se existir, se essa é positiva ou negativa. O coeficiente de correlação por sua vez,
além de fazer as mesmas indicações que a covariância sobre a relação linear entre as
variáveis, ainda a quantifica!

O intervalo de variação do coeficiente de correlação é - 1 < ρXY < 1. Isso é facilmente


demonstrado pelo seguinte teorema:
Se X e Y são duas variáveis aleatórias, tem-se:
2
 X − µ X Y − µY 
 ±  ≥ 0 OU
 σX σY 
2
 X − µ X Y − µY 
E  ±  ≥ 0
 σX σY 
 ( X − µ )  2  (Y − µ )  2  ( X − µ X )  (Y − µY ) 
E  X
 +  Y
 ± 2   ≥ 0
 σ X   σY   σX  σ Y 

1 1 1
2
E( X − µ X ) 2 + 2
E (Y − µ Y ) 2 ± 2 [( X − µ X )(Y − µY )] ≥ 0
σ X σ Y σ XσY

Como, E( X − µ X ) 2 = σ X2

E(Y − µ Y ) 2 = σ Y2

E [( X − µ X )((Y − µ Y )]
=ρ , tem-se,
σ XσY

σ X2 σ Y2
+ ± 2ρ ≥ 0
σ X2 σ Y2
2±2ρ>0 ou

26
ρ > 1 e ρ < -1 , logo,
- 1 < ρXY < 1

OBS.: O estimador não viesado para o parâmetro ρXY é denominado rxy.


O coeficiente de correlação é um número puro, sem unidade ou dimensão. É usado para
expressar o quanto os pontos se aproximam de uma reta imaginária. Um coeficiente próximo
da unidade positiva ou negativa significa uma grande concentração dos pontos em torno da
reta, enquanto que um coeficiente menor significa maior dispersão em relação a esta reta.
Valores positivos indicam a tendência de uma variável aumentar quando a outra aumenta, ou
diminuir quando a outra diminui. Quando o coeficiente de correlação é negativo significa que
a tendência de uma variável aumentar enquanto a outra diminui e vice-versa.
Na figura 1, cada eixo representa uma variável, X e Y e, são apresentadas graficamente
a associação entre duas variáveis. Na letra (a) as variáveis não são correlacionadas (r = 0),
então os pontos se encontram dispersos por todo o quadrante. Na letra (b) a correlação é alta e
negativa (r = - 0,95), evidenciada por uma dispersão inversa entre X e Y. Os maiores valores
de X correspondem aos menores valores de Y, concentrados em torno de uma diagonal
fictícia. Na letra (c), X e Y estão correlacionadas positiva e perfeitamente (r = 1,0), logo os
pontos estão alinhados em uma mesma direção ascendente. Por fim, na letra (d), X e Y estão
levemente correlacionados, então a dispersão dos pontos não é tão abrangente no quadrante
nem tão estreita em torno de uma linha.

Figura 1. Representação gráfica de duas variáveis X e Y com diversos graus de correlação.

27
3. DISTRIBUIÇÕES E FUNÇÕES DE PROBABILIDADES DISCRETAS E
CONTÍNUAS
Foi visto nos assuntos anteriores como os dados de uma investigação científica são
representados e como parâmetros da forma da distribuição, valores mais freqüentes e medidas
de posição e variabilidade, são estimados. Foram vistas, também, formas para lidar e
apresentar dados em função de seus tipos. Todavia, além da descrição amostral dos dados, a
estatística como parte integrante do método científico, lida também com aspectos que
envolvem a modelagem teórica das realizações das variáveis aleatórias nos fenômenos
estudados. Essa modelagem envolve os modelos probabilísticos, cujo conhecimento auxilia o
investigador científico na escolha do modelo mais adequado para estudar um determinado
fenômeno e daquele que mais se aproxima de uma situação real. Aqui, iremos estudar os
modelos probabilísticos de algumas variáveis aleatórias discretas e contínuas.
As distribuições de probabilidade (discretas e contínuas) ficam completamente
definidas conhecendo-se os diversos valores que a variável aleatória pode assumir, dentro do
seu intervalo de definição, e as respectivas probabilidades. O conhecimento da distribuição de
uma variável aleatória é importante na descrição dos fenômenos, na especificação dos testes
dos processos da teoria de decisão estatística e na teoria da estimação. Pode-se afirmar que, de
forma geral, os modelos probabilísticos formam a base da teoria estatística, e a linguagem
aplicada representa o fundamento da linguagem científica empreendida nos processos de
decisão e estimação.

3.1. DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS


3.1.1. Distribuição de Bernoulli
Consideremos experimentos aleatórios que possuem apenas dois resultados possíveis,
como por exemplo, uma peça selecionada de um lote, a qual pode ser boa ou defeituosa, um
aluno que é submetido a um exame que pode ser aprovado ou não, um animal em um rebanho
que pode ser sadio ou doente, etc. São experimentos cujos resultados pertencem a uma de
duas categorias possíveis, conforme possuam, ou não, uma determinada característica. O
resultado será chamado de sucesso S se possuir a citada característica, ou de fracasso F, se
não possuir.
Esses experimentos são conhecidos como experimentos de Bernoulli ou ensaios de
Bernoulli. A probabilidade de ocorrência de sucesso será indicada por p, e a de fracasso por q,
em que q = 1 – p. Qualquer um dos dois resultados possíveis do experimento poderá ser

28
chamado de sucesso, bastando somente que a probabilidade de ocorrência seja denominada
por p.
A distribuição de probabilidade para uma variável aleatória X que assume dois
valores: o valor 1 se ocorrer sucesso, e o valor 0 se ocorrer fracasso, é dada por:

xi P(xi)

1 p
0 1-p

Média e Variância de uma v. a. com distribuição de Bernoulii


E(X) = µ x = p
V (X) = 1 − p = q
Quando uma variável aleatória X tem distribuição de Bernoullii representamos
simbolicamente por X ~ B (p; q). Lê-se: X tende para uma distribuição de Bernoulii cujos
parâmetros são p e q.

3.1.2. Distribuição Binomial


A distribuição binomial consiste na realização de n ensaios de independentes de
Bernoulii, cada um com probabilidade de sucesso constante igual a p (e consequentemente de
fracasso constante a q). Desse modo, pode-se definir a variável aleatória X pelo número de
sucessos observados.
São exemplos de variáveis binomiais: florescimentos de plantas de uma espécie em
uma amostra de tamanho n; nascimento de fêmeas em uma amostra de tamanho n; etc. A
distribuição binomial é a mais importante das distribuições de v. a. discretas.
Se p é a probabilidade de sucesso de um evento ocorrer em uma única tentativa e q =
1- p é a probabilidade do fracasso, então, a probabilidade de que nos k primeiros ensaios de
Bernoulii ocorram sucessos e nos n-k restantes ocorram fracassos, considerando-se a
independência dos ensaios é dada por:
P( 1
S, 4
S ,2
S ,...,
43 S, 1
F ,42
4, F ,...,
F 43 4F ) = p .(1 − p)
k n−k

k n−k

Como os k sucessos podem ocorrer em qualquer uma das ordens possíveis nos n
experimentos de Bernoulii, que é igual a ao número de combinações de n elementos k a k

29
n!
dada por C kn = , a probabilidade de obtenção de k sucessos nas n realizações do
k!(n − k )!
experimento é calculada por:
n n
f (x) = P (X=x) =  . p k .(1 − p) n − k = C k
. p k .q n − k
k 

OBS: a denominação binomial decorre do fato de os coeficientes C xn serem os coeficientes


binomiais das n potências (a + b).
Por exemplo: O binômio elevado à potência três:
(a + b)3 = a3 + 3a2b + 3ab2 + b3 corresponde a C33 a3 + C 23 a2b + C13 ab2 + C03 b3
Suposições do modelo binomial:
1. Existe n repetições ou provas idênticas do experimento. Exemplo: número de
plantas sadias colhidas em parcelas de 20 m2 (foram plantadas 27 plantas em cada
parcela), X = 0, 1, 2, ....,27, então, n é o número total de casos possíveis da variável
que estamos estudando.
2. Só há dois tipos de resultados possíveis (Ex.: plantas sadias ou doentes).
3. As probabilidades p de sucesso e 1 – p = q de fracasso permanecem constantes em
todas as repetições.
4. Todos os resultados das repetições são independentes um do outro.

Média e Variância de uma v. a. com distribuição Binomial


E(X) = µ x = np
V (X) = npq = np (1 − p ) = npq
Quando uma variável aleatória X tem distribuição binomial representamos
simbolicamente por X ~ Bin (n; p). Lê-se: X tende para uma distribuição Binomial cujos
parâmetros são n e p.

Exemplo: No rebanho bovino 30% dos animais estão atacados por febre aftosa. Retira-se
por acaso uma amostra de 10 animais.
a) Verifique se a variável “número de animais doentes” pode ser estudada pelo
modelo binomial. Justifique sua resposta.
b) Estruturar a função de probabilidade.
c) Qual a probabilidade de se encontrar 6 animais doentes.
d) Qual a probabilidade de se encontrar pelo menos 6 animais doentes.

30
e) Qual a probabilidade de se encontrar no máximo 6 animais doentes

3.1.3. Distribuição de Poisson


A distribuição de Poisson é um caso limite da distribuição binomial, quando n → ∞, p
→ 0 e µ = np permanece constante, e se aplica no caso em que, em vez de se observar o
número de sucessos em n realizações independentes de um experimento de Bernoulli, o
interesse é o número de sucessos em um intervalo contínuo de observação t (∆t). Esse
intervalo contínuo de observação pode ser um intervalo qualquer em que se vai observar a
ocorrência de sucessos. Nas ciências agrárias e biológicas a distribuição de Poisson é
largamente utilizada para contagens de indivíduos, plantas, colônias de bactérias, itens,
objetos, dados num intervalo de tempo, numa área, num volume, num comprimento. A
unidade de medida deve ser definida de tal modo que as contagens sejam baixas. Considere-se
um número baixo com sendo menor que 10. Um aplicação importante dessa distribuição diz
respeito ao estudo do padrão de dispersão de certa espécie animal ou vegetal num campo ou
floresta, então numa determinada área. É muito utilizada, portanto, em estudos de dinâmica de
população e entomológicos.
São exemplos de variáveis com distribuição de Poisson: número de colônias de
bactérias por quadrante de 1m2; número de colônias de bactérias de uma dada cultura por 0,01
mm2 numa plaqueta de microscópio; número de defeitos por 100 m de tecido; número de
acidentes numa esquina movimentada e bem sinalizada por dia; número de chamadas
telefônicas numa central de PABX num intervalo de tempo de ½ minuto; número de
partículas radioativas emitidas numa unidade de tempo; número de micronúcleos/1000
células, etc.

Para que uma variável aleatória X tenha distribuição de Poisson, deve satisfazer às
seguintes condições:
i) Para intervalos de observação ∆t muito pequenos, a probabilidade de ocorrência de mais de
um sucesso é desprezível;
ii) Para intervalos de observação ∆t muito pequenos, a probabilidade de ocorrência de um
sucesso é proporcional ao tamanho do intervalo e igual a λ.∆t, onde λ > 0 é a taxa de sucesso
por unidade de observação;
iii) As ocorrências de sucessos em intervalos disjuntos (não sobrepostos) são independentes.

31
Então, se uma variável aleatória X, igual ao número de sucessos em um intervalo t de
observação tem distribuição de Poisson, pode-se demonstrar que a sua distribuição de
probabilidade é dada por:
e − λt ( λ t ) k
P( X = k ) = , k = 0,1,2,3,...
k!
Sendo µ = λt o número médio de ocorrências no intervalo t, a expressão acima pode
ser escrita na forma:
e − λt ( µ ) k
P( X = k ) =
k!

Média e Variância de uma v.a. com distribuição de Poisson


E(X) = µ
V(X) = µ

Exemplo: Sabendo-se que na fabricação de determinadas chapas aparecem defeitos à taxa


média de 0,5 defeito por m2, calcule a probabilidade de que:
a) uma chapa de 5 m2 seja perfeita;
b) uma chapa de 15 m2 apresente no mínimo três defeitos.

a) Seja X = número de defeitos por chapa de 5 m2, temos:


λ = 0,5 defeito por m2
t = 5 m2
µ = λt = 0,5.5 = 2,5
e −2,5 .2,5 0
P( X = 0) = =0,082 ou 8,2%
0!

b) Seja X = número de defeitos por chapa de 15 m2, temos:


λ = 0,5 defeito por m2
t = 15 m2
µ = λt = 0,5.15 = 7,5
P( X ≥ 3) = 1 − P( X < 3)
P( X ≥ 3) = 1 − [ P( X = 0) + P( X = 1) + P( X + 2)]

32
 e −7 ,5 .7,5 0 e −7 ,5 .7,51 e −7 ,5 .7,5 2 
P( X ≥ 3) = 1 −  + +  = 1 – 0,020256 = 0,9797 ou 97,97%
 0! 1! 2! 

3.2. DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS


3.2.1. Distribuição Normal ou Gaussiana
A distribuição gaussiana também é denominada de distribuição normal, uma vez que
uma grande maioria das variáveis aleatórias contínuas (inclusive variáveis aleatórias discretas
podem ser aproximadas pela lei gaussiana) da natureza segue esta distribuição.

Diz-se que uma variável aleatória segue distribuição normal de parâmetros µ e σ 2,


2
que representamos do modo X ~ N ( µ , σ ), se sua função densidade probabilidade for:
2


( x −µ )
1 2σ 2
f(x)= ×e
2
2πσ

Em que µ e σ 2 são os parâmetros dessa distribuição, os quais são respectivamente a

média e variância dessa distribuição. O parâmetro µ indica o centro e σ a dispersão. A

distância do centro as pontos de inflexão é precisamente σ .


A forma da função densidade probabilidade é chamada sino de Gauss e o gráfico da
função normal é:

Figura 1. Distribuição normal com média µ e ponto de inflexão µ ±σ


O suporte da distribuição é todo conjunto dos números reais, de modo que a maior
parte da massa de probabilidade (área compreendida entre a curva e o eixo de abscissa) se
encontra concentrado ao redor da média e as ramificações da curva se estendem

33
assintoticamente aos eixos, de modo que qualquer valor “muito distante” da média é possível
mesmo que pouco provável.
A forma do sino de Gauss depende dos parâmetros µ e σ . O parâmetro µ indica a

posição do sino de Gauss (parâmetro de centralização) e σ 2 (ou equivalente, σ ) será o


parâmetro de dispersão. Quanto menor for, maior será a quantidade de massa de probabilidade
concentrada ao redor da média (gráfico de f muito pontiagudo em torno de µ ) e, quanto
maior for, “mais achatado” será.

Figura 2. Distribuições gaussianas com diferentes médias e igual dispersão.

Figura 3. Distribuições gaussianas com média igual, mas com variâncias diferentes.

Propriedades da curva de distribuição Normal:


(i) simétrica em relação a µ;
(ii) tem forma de sino;
(iii) fica completamente definido conhecendo a sua média e variância;

34
(iv) área total sob a curva é igual a 1.

Quando µ = 0 e σ 2 = 1, temos uma distribuição padrão ou reduzida, ou X ~ N (0,1),


cuja função densidade probabilidade reduz-se a:

−z2
1
φ (z ) = e 2

2 x−µ
Logo, se X ~ N ( µ , σ ), então a variável aleatória definida por z = , terá
σ
distribuição normal padronizada, com média 0 e variância 1. Sabe-se que a probabilidade de
X estar entre dois valores quaisquer (a, b) é dado pela área sob a curva normal entre estes
valores:

Figura 4. A probabilidade de x estar entre o ponto a e b corresponde a área


hachurada da figura.
b
P( a <X<b)= ∫ f ( x )dx
a

Como a cálculo dessa integral não é trivial, usam-se as tabelas obtidas a partir da curva
normal padronizada.
Vejamos, então, como obter probabilidades a partir da Tabela (ANEXO 1). Essa tábua dá
as probabilidades sob uma curva normal padrão, que nada mais são do que as correspondentes
áreas sob a curva.
P ( 0 ≤ Z ≤ zc ) onde, Z ~ N (0,1)

35
Figura 5. Probabilidade de P(0 ≤ Z ≤ Zc )

Exemplo: Calculemos algumas probabilidades.


(a) P (0 ≤ Z ≤ 1,73) =

(b) P (-1,73 ≤ Z ≤ 0) =
(c) P (Z ≥ 1,73) =
(d) P (Z ≥ 0) =
(e) P (0,47 ≤ Z ≤ 1,73) =

2
Suponha, agora, que X seja uma v. a. N ( µ , σ ), com µ =3e σ 2 = 16, e queiramos
calcular P(2 ≤ X ≤ 5). Temos:

2− µ X − µ 5− µ  2 − 3 X − µ 5 − 3
P(2 ≤ X ≤ 5)= P ≤ ≤ = P ≤ ≤ 
 σ σ σ   4 σ 4 

Exemplo. A quantidade de kg de leite produzidos por um animal diariamente,


considerando uma determinada raça e rebanho segue a distribuição normal e possui média
9,87kg/dia/animal e variância 8,87(kg/dia/animal)2. Calcule: a probabilidade de um animal
produzir menos de 3kg/dia, a probabilidade de um animal produzir mais de 8kg/dia e a
probabilidade de um animal produzir entre 10kg/dia e 12kg/dia.

2.2.2. Distribuição Qui-quadrado (χ2)


A distribuição de Qui-quadrado é a distribuição amostral relacionada a σ̂ 2 obtida de uma
população normal.
Se considerarmos uma variável aleatória Z com uma distribuição normal padrão
[Z ~ N (0, 1)], então a variável X = Z2 distribui-se conforme uma lei de probabilidade de
distribuição χ2 com grau de liberdade, o que representa como: X ~ χ 2 .

36
Se temos n variáveis aleatórias independentes Zi ~ N (0, 1), a soma de seus quadrados
respectivos é uma distribuição que denominaremos de LEI DE DISTRIBUIÇÃO DE χ2 com n
graus de liberdade, χ n2 .
n
Ou seja: χ n2 = Z12 + Z 22 + ... + Z n2 = ∑ Z i2
i =1

Se temos X1, X2, ..., Xn variáveis aleatórias independentes, onde cada Xi ~ N ( µ , σ 2 ),


então, a variável :
n n n
( X i − µ)2
χ 2 = ∑ X i = ∑ Z 2i = ∑ 2
~ χ n2 , com n graus de liberdade.
i =1 i =1 i =1 σ
Uma variável aleatória X que segue uma distribuição de Qui-quadrado tem densidade
dada por:
n
−1 1
1/ 2  1  2 − 2 x
f ( x) =  x e em que x > 0
Γ(1 / 2)  2 

Figura 4. Função densidade probabilidade de χn2 para valores pequenos de n.

A média e a variância dessa variável são: E(X) = n e V(X) = 2n, respectivamente.


Sejam X1, X2, ..., Xn variáveis aleatórias independentes de uma distribuição normal com
média µ e variância σ 2 [Xi ~ N ( µ , σ 2 )], então, a variável :
n
( X i − X )2 n
χ2 = ∑ = ∑ (Z i − Z ) 2 ~ χ n2 , com n - 1 graus de liberdade, sendo que Zi ~ N (0,1)
i =1 σ2 i =1

( X i − X )2
Se, σˆ 2 = é obtido de uma amostra aleatória de uma distribuição normal com
n −1
(n − 1).σˆ 2
média µ e variância σ 2 , então a variável: χ 2 = , com n - 1 graus de liberdade.
σ2

37
A distribuição de Qui-quadrado possui várias aplicações em estatística. Uma delas é a
de propiciar mecanismos para a realização de inferências sobre o parâmetro σ 2 de uma
população normal. Outra aplicação refere-se aos testes de falta de ajuste de um modelo teórico
aos dados observados em um experimento ou levantamento amostral.

2.3.3. Distribuição t de Student


É importante no que se refere a inferência sobre médias populacionais.
A distribuição t de Student constitui-se como um quociente entre a normal e a raiz de
uma χ2 independentes. De modo preciso, chamamos distribuição t de Student com n graus
de liberdade, tn, a distribuição de uma variável aleatória T.
Z
T=
1 2
χn
n
Em que Z ∼ N (0, 1) χn2 ∼ χn2 . Esse tipo de distribuição aparece quando temos n + 1
variáveis aleatórias independentes.
A distribuição de probabilidade de t é dada por:
X −µ
T= σ
2
1  X i − µi
n

∑
n i =1  σ i


A distribuição de t tem propriedades parecidas com a Normal, quais sejam:
* É centrada na média igual a zero e simétrica com relação à mesma;
* É um pouco mais dispersa que a normal, mas a variância decresce até um quando o número
de graus de liberdade aumenta;
* Quando o número de graus de liberdade tende ao infinito, a distribuição de t tende à Normal
(os valores de ambas são satisfatoriamente próximos a partir do grau de liberdade igual a 30).

OBS.: grau de liberdade = n - 1

38
3.2.4. Distribuição F de Snedecor
A distribuição de F se define como o quociente de distribuições χ2 independentes.
Sejam X ∼ χ2 e Y ∼ χ2 variáveis aleatórias independentes. Dizemos então que a
1
X
mX
variável F = n = ∼ Fn,m segue distribuição de probabilidade de Snedecor, com (n, m)
1 n Y
Y
m
graus de liberdade.

OBS.:Observa-se que Fn,m ≠ Fm,n


A distribuição de probabilidade de F é dada por:
2
1 n  X i − µi
∑
n i =1  σ i

F=  ∼F
2 n,m
1 m  Y j − m j 

m j =1  σˆ j 

A forma mais habitual na qual se encontra essa distribuição é quando se tem n + m


variáveis aleatórias independentes.
Uma das aplicações da distribuição de F é na análise de variância, em que as
avaliações se baseiam em estimativas da variância populacional.

4. LITERATURA CONSULTADA
ARA, A. B.; MUSETTI, A. V.; SHNEIDERMAN, B. Introdução à estatística. São Paulo:
Egard Blucher: Instituto Mauá de Tecnologia, 2003.152p.
CARVALHO, S. Estatística básica. Rio de Janeiro: Campus/Elsevier, 2006. 464p.
FERREIRA, D. F. Estatística básica. Lavras: UFLA, 2005. 664p.
REGAZZI, A. Curso de iniciação à estatística (Apostila). Universidade Federal de Viçosa,
Viçosa – MG, 1997. 136p.
TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. 656p.

Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto, ainda
deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique.
Obrigada, Profa. Gisele

39
ANEXO 1: Tabela I - Distribuição Normal Padrão Z~N(0,1)

P(0<Z<Zc)

Parte inteira da primeira Segunda decimal de Zc


decimal de Zc 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
4,00 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

40
UNIVERSIDADE FEDERAL DO PIAUÍ
Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI
Lista de exercícios: Variáveis aleatórias

1. Cite pelo menos 5 exemplos de variáveis aleatórias discretas e 5 exemplos de variáveis aleatórias
contínuas na área de seu curso. Conceitualmente, como você diferenciaria essas variáveis das
quantitativas discretas e contínuas?

2. Seja X uma variável aleatória discreta com a seguinte distribuição de probabilidade:

xi -2 -1 2 4 Total

P(X=xi) 1/4 1/8 1/2 1/8 1,0

a) Traçar o gráfico da distribuição de probabilidade


b) Calcular E(X)
c) Calcular V(X)
d) Calcular E(X – 2)2
e) Calcular V(3X – 4)
Resposta: a) 2,625 b) 4,625 c) 38,106

3. Dado X,Y é uma variável aleatória discreta bidimensional com a seguinte distribuição conjunta:
Y
X
-3 2 4
1 0,1 0,2 0,2
3 0,3 0,1 0,1

Calcular:
a) E (X), V (X) e DP (X)
b) E (Y), V (Y) e DP (Y)
c) E (X + Y), Cov (X,Y) e rxy
d) X e Y são independentes? Justifique.
Resposta:
a) 2; 1 e 1 b) 0,6; 9,24 e 3,04 c) 2,6; -1,2 e -0,395 d) não

41
4. Dado X,Y é uma variável aleatória discreta bidimensional com a seguinte distribuição conjunta:
Y
X
-3 -2 -1
-2 1/15 1/15 3/30
0 8/30 4/30 2/15
1 2/30 1/30 4/30

Calcular:
a) E (X), V (X) e DP (X)
b) E (Y), V (Y) e DP (Y)

 X 2 2Y 
c) E  − − 10  ,
 3 5 
d) Cov (X,Y), rxy. X e Y são independentes? Justifique.
Resposta:
a) -7/30; 1,112 e 1,055 b) -61/30; 0,766 e 0,875 c) -8,798 d) não

5. Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é dada
pela tabela:
Y
X
-3 0 1
-2 1/9 0 2/9
0 0 2/9 2/9
1 1/9 1/9 0

Calcular:
a) E (X)
b) E (Y)
c) V (X)
d) V (Y)
e) E (XY)
f) Cov (X,Y). Interprete.
g) rxy Interprete
Resposta:
a) -0,45 b) -0,22 c) 1,353 d) 0 e) 0

42
6. Dada a funçao de densidade probabilidade (f.d.p.) abaixo:

1/2, se 0 ≤ x ≤ 1
-1/4(x – 3), se 1 ≤ x ≤ 3
f(x) =
0, para outros valores de x.

Calcular:
a) E(X)
b) V (X)
c) V(12X – 8)
d) P (0,5 ≤ x ≤ 1,5)
Resposta: a) 1,083 b) 1,667 c) 240,048 d) 0,469

7. Dada a função:

k(2 – x), se 0 ≤ x < 1


k, se 1 ≤ x ≤ 2
f(x) =
0, para outros valores de x.

a) Determinar o valor de k para que f(x) seja f. d.p.


b) E(X)
c) E(X – 2)
d) V(X)
e) V(10X – 2)
f) P(1/2 ≤ x < 3/2)
g) P(X = 1)
h) P(1/2 ≤ x < 1,0)
Resposta: a) 2/5 b) 0,867 c) -1,267 d) 1,1 e) 110 f) 0,45
g) 0 h) 3/5

8. Dada função de densidade probabilidade conjunta da variável X,Y bidimensional contínua:


3− y
, se 0 ≤ x < 4 se 0 ≤ y < 2
16
f(x,y) =
0, para outros valores de x e y.

43
E as funções de densidade probabilidade marginais são:
1
, se 0 ≤ x < 4
4
f(x) =
0, para outros valores de x.

1
(3 − y ) , se 0 ≤ y < 2
4
f(y) =
0, para outros valores de y.

Calcular:
a) E (X)
b) E (Y)
c) V (X)
d) V (Y)
e) E (XY)
f) Cov (X,Y). Interprete.
g) rxy Interprete
Resposta: a) 2,0 b) 0,83 c) 5,33 d) 1,0 e) -0,33 f) -1,996
g) -0,86

9. Suponha que as dimensões, X e Y, de uma chapa retangular de metal possam ser consideradas
variáveis aleatórias contínuas com a seguinte função de densidade probabilidade conjunta:

x −1
, se 1 < x ≤ 2 2<y<4
f(x,y) = 2
− x+3
se 2 < x < 3 2<y<4
2
0, para outros valores de x e y.

E funções de densidade probabilidade marginais:

(x – 1) se 1 < x ≤ 2
f(x) = (- x + 3) se 2 < x < 3
0, para outros valores de x.

1
, se 2 < y < 4
2
f(y) =
0, para outros valores de y.

44
Calcular:
a) E (X)
b) E (Y)
c) V (X)
d) V (Y)
e) E (XY)
f) Cov (X,Y). Interprete.
g) rxy Interprete
Resposta: a) 1,83 b) 3,0 c) 4,17 d) 9,33 e) 6,0 f) 0,51
g) 0,082

10. Numa família de 4 filhos, seja X = número de meninos e Y = número de variações na seqüência de
mesmo sexo. Relacionar o espaço amostral e, então:
a) Construir a distribuição de probabilidade conjunta de X e Y;
a) X e Y são independentes?

11. Demonstre, com base nas fórmulas gerais de média e variância de uma variável aleatória discreta
que, a média ou valor médio e a variância de uma variável aleatória binomial X [X ∼ Bin (n; p)]
correspondem a E(X) = np e V(X) = npq, respectivamente. Calcule a média e a variância de uma v. A.
X ∼ Bin (10; 0,3)].
Resposta: E(X) = 3 V(X) = 2,1

12. Entre 2000 famílias com 4 crianças cada uma, quantas se esperaria que tivessem:
a) Pelo menos um menino?
b) Exatamente dois meninos?
Resposta: a) 1875 b) 750

13. Supondo que o número de sementes que germine (Y) de uma espécie forrageira siga distribuição
binomial, e a probabilidade de uma semente germinar é 70%. Pede-se:
a) Qual a probabilidade, em um experimento com um vaso com n = 5 sementes, de pelo menos 4
germinarem?
b) Sabe-se que X representa o número de vasos que tem pelo menos 4 sementes germinadas dessa
espécie (originadas do item a), então qual é o número (tamanho da amostra) de vasos, semeados com 5
sementes, necessário para que um experimento venha a ser realizado com um número não inferior a
200 plantas.
Resposta: a) 0,528 ou 52,8%

45
14. Suponha que a peste suína siga a distribuição binomial, ocorrendo, em média em 1 a cada 50
animais em uma população de suínos de certa região. Qual é a probabilidade de que em uma amostra
aleatória de n = 100 suínos, seja encontrado, pelo menos, um com a doença?
Resposta: 0,87 ou 87%

15. Um fabricante de certo tipo de peças garante que uma caixa de suas peças conterá, no máximo,
duas defeituosas. Se a caixa contém 20 peças e a experiência tem demonstrado que o processo de
fabricação produz 5% de peças defeituosas.
a) Calcule a probabilidade de que uma caixa satisfaça a garantia;
b) Considerando que a caixa vendida determina um lucro de R$ 120,00, caso esteja conforme a
garantia, e um prejuízo de R$ 50,00, se não corresponder à garantia, indique qual será o lucro médio
por caixa vendida.
Resposta: a) 0,924 ou 9,24% b) R$ 107,08

16. Sementes certificadas de feijão são vendidas em um saco de 15 kg ao preço de R$ 20,00 cada. É
característica de produção que 20% das sementes apresentem poder germinativo abaixo do
especificado. Um comprador fez a seguinte proposta ao produtor de sementes: de cada saco escolhe 25
sementes, ao acaso, e paga por saco:
- R$ 25,00 se todas as sementes germinarem;
- R$ 17,00 se uma ou duas sementes não germinarem;
- R$ 10,00 se três ou mais sementes não germinarem.
O que é melhor para o produtor, manter o seu preço de 20,00 u.m. por saco ou aceitar a
proposta do comprador?
Sugestão: encontrar o preço médio esperado pelo produtor.
Resposta: O vendedor não deve aceitar a proposta do comprador [E(X) = 19,51)]

17. Suponhamos que a porcentagem de germinação de sementes de feijão seja de 70%. Vão ser
semeadas 4 sementes por cova, as quais serão espaçadas de 0,40m entre linhas e 0,20m entre covas.
Supondo-se que cada canteiro a ser semeado conste de 6 linhas de 5m de comprimento, qual o número
médio esperado de covas falhadas (nem uma semente germinou, das quatro semeadas) por canteiro?
Resposta: 0,9919 ou 99,19%

18. Um contador eletrônico de bactérias registra em média 5 bactérias por cm3 de um líquido.
Admitindo-se que esta variável tenha distribuição de Poisson:
a) qual é o desvio padrão do número de bactérias por cm3?
b) Encontre a probabilidade de que pelo menos duas bactérias ocorram num volume de líquido de
1cm3.

46
Resposta: a) V(X) = 5 b) 95,96%

19. Numa área dividida em quadrantes de 0,50m2, foram encontrados em média 2,5 espécimes.
Considerando que o modelo de Poisson é adequado, e seja X o número de espécimes por 0,5m2.
a) Qual é a probabilidade de se encontrar num quadrante exatamente 4 espécimes?
b) Qual é a probabilidade de encontrar no máximo 1 espécime por quadrante?
Resposta: a) 13,36% b) 28,7%

20. Numa placa de microscópio, dividida em quadrantes de 1mm2, encontra-se em média 5 colônias
por mm2. Considerando que a distribuição de Poisson é adequada, ou seja: as colônias distribuem-se
aleatoriamente na placa e, o número médio de colônias por mm2 permanece constante e é baixo.
a) Qual a probabilidade de um quadrante ter exatamente uma colônia?
b) Qual a probabilidade de encontrar duas colônias por mm2?
c) Qual a probabilidade de encontrar oito colônias em 2 mm2?
Resposta: a) 3,37% b) 8,42% c) 11,26%

21. Supondo que o peso de animais da raça Charolês, com dois meses de idade, obedeça a
uma distribuição normal com média igual a 75kg e desvio padrão de 10kg. Calcule a
probabilidade de que, um bovino dessa raça e dessa idade, escolhido ao acaso, pese:
a) mais de 69,8kg
b) menos de 97,2kg
c) entre 77,7kg e 82,2kg
d) menos de 77,7kg e mais de 82,2kg
Resposta: a) 69,85% b) 98,68% c) 15,78% c) 84,22%

22. Uma raça de coelhos híbrida, Norfolk, possui peso ao abate aos 90 dias X com distribuição N
(2,60; 0,04). Obter:
a) P (X > 2,70)
b) P (X < 2,45)
c) P (2,55 < X < 2,65)
d) P (X > x) = 0,80
e) P (-x < X < x) = 0,95
f) P (-x < X < x) = 0,90

47
23. Um agricultor usa uma máquina automática para encher sacos de trigo, cada um com um peso
nominal de 112 lb de grão. No entanto, devido a flutuações aleatórias do mecanismo de pesagem, o
peso de cada saco é uma V.A. Normal de média 112,375 lb e desvio padrão 0,226 lb;
a) Calcule a probabilidade de um saco escolhido ao acaso conter menos do que o peso nominal;
b) O agricultor fornece o trigo a um moleiro com a condição de que não mais do que 5% dos sacos são
sub-pesados. Determine o valor mais baixo do peso médio de cada saco que satisfaça a esta condição.

Resposta: a) 4,85% b) 112,0021

24. Num povoamento florestal temos uma distribuição aproximadamente normal dos Diâmetros na
altura do peito (D.A.P.) das árvores, com média de 12,6 cm e variância de 3,1 cm. Se cortarmos todas
as árvores de menos de 15 cm de diâmetro, qual a porcentagem de árvores que restarão de pé?
Resposta: 8,69%

25. As vendas de sementes de milho têm distribuição normal com média igual a 500 sacos e desvio
padrão 50 sacos. Se a empresa decide produzir 600 sacos no mês em estudo, qual é a probabilidade de
que não possa atender a todos os pedidos do mês, por estar com a produção esgotada?
Resposta: 22,28%

26. Sabe-se que o comprimento de pétalas de uma população de plantas da espécie X é normalmente
distribuída com média µ = 3,2 cm e σ = 1,8 cm. Qual proporção na população é ter um comprimento
de pétalas:
a) Maior do que 4,5 cm?
b) Entre 2,9 e 3,6 cm?
c) Determinar o valor do comprimento de pétalas que é superado por 65% das plantas.
Resposta: a) 23,89% b) 15,46% c) 4,874 cm

48

Você também pode gostar