Você está na página 1de 13

4.

Variáveis aleatórias e suas distribuições ~ Mulenga

4. DISTRIBUIÇÕES DE VARIAVEIS ALEATÓRIAS


Neste capítulo serão apresentadas os principais modelos de distribuições de probabilidades, tanto
para variáveis discretas como para variáveis contínuas.

4.1 DISTRIBUIÇÕES DAS VARIÁVEIS ALEATÓRIAS DISCRETAS

4.1.1 Distribuição Binomial

Trata – se de uma distribuição de probabilidades adequada aos experimentos que apresentam


apenas dois resultados: sucesso ou fracasso.

Diz – se que uma variável aleatória discreta X, tem distribuição Binomial ou obedece a lei da
distribuição binomial com parâmetros n e p, quando ela pode tomar valores discretos 0, 1, …, n e
os níveis das probabilidades p(x) forem calculados pela fórmula de Bernoulli.

n
P(n, x, p)    * p x * q n  x . com n  x (4.1)
x

A função P(n,x,p) = Pn(x) é a função de distribuição das probabilidades. A distribuição Binomial


é interpretada como a distribuição do número de sucessos “p” ou fracassos “ q = 1-p” em uma
série de n provas independentes de um experimento aleatório.

Exemplo 4.1 Um analista tem 3 projectos. Se a probabilidade de um projecto ser aprovado for
0.5, encontrar a probabilidade de serem aprovados exactamente 2 projectos pelo analista.

Resolução:

Dados n = 3, p = 0.5; q = 0.5, x = 2.

Como cada análise de um projecto é um acontecimento independente e este se repete 3 vezes,


consideremos sucesso projecto aproado e fracasso a sua reprovação.

n 3 1 1
P(n, x, p)    * p x * q n  x   . * ( )2 * ( )1  0.3750
x  2 2 2

Se considerar n e p constantes e variar x de 0 até n, pode –se calcular todas as probabilidades


p(x) e obteremos uma lei de distribuição das probabilidades do número de projectos aprovados x.

x 0 1 2 … n
qn  n  1 n1  n  2 n 21 … pn
P(x)   p q   p q
1  2

65
4. Variáveis aleatórias e suas distribuições ~ Mulenga

Propriedades da distribuição Binomial

Média ou esperança matemática: E(x) = np


Variância: var(x) = npq
Desvio padrão:  ( x)  var( x)

Exemplo 4.2 Um empresário tem 60% de probabilidade de obter sucesso sempre que começa um
novo negócio. Se o empresário começar 3 novos negócios, calcule a probabilidade de obter:

a) Exactamente em dois negócios ela tenha sucesso;


b) Pelo menos em um negócio ele tenha sucesso;
c) No máximo em dois negócios ele tenha sucesso;
d) Escreva a lei de distribuição das probabilidades do número de sucessos que o empresário
possa obter
e) Calcule a média e a variância da lei de distribuição das probabilidades

Resolução

Dados n = 3, p =0.60, q = 0.40

3 
a) P3(2)    * 0.62 * 0.41  0.432
 2

b) P3( x  1)  P3(1)  P3(2)  P3(3)  0.288  0.432  0.216  0.936

c) P3( x  2)  P3(0)  P3(1)  P3(2)  0.064  0.288  0.432  0.784

d) a lei de distribuição procurada é

x 0 1 2 3 Soma
p(x) 0.064 0.288 0.432 0.216 1.00

e) Média: E(x) = 3*0.6 = 1.80; Var(x) = 3*0.6*0.4 = 0.72, desvio padrão = 0.8

4.1.2 Distribuição de Poisson

Em muitos casos, conhece – se o número de sucessos, porém se torna difícil e as vezes sem
sentido determinar o número de fracassos ou o número total de provas. Por exemplo o número de
automóveis que passam numa esquina num determina intervalo de tempo, pode-se anotar, porém
não poderá ser determinado o número dos carros que deixaram de passar pela esquina.

66
4. Variáveis aleatórias e suas distribuições ~ Mulenga

Situações como estas, sugerem uma variável que depende do tempo t e quando t   , a
probabilidade de realização do evento tende a diminuir. Para encontrar a probabilidade de
realização de x sucessos num intervalo de tempo, quando simultaneamente o número de provas
for grande e a probabilidade de realização de cada acontecimento for muito pequena usa –se a
distribuição de Poisson que substitui a distribuição Binomial.

λ x * e λ
Pn(x)  ; com   0 (4.2)
x!

Onde

x – é o número de sucessos do acontecimento em n provas independentes.


 = np, é o número de médio de ocorrências com sucessos;
e - é a base do logaritmo natural: “ e = 2.718281828…”

A distribuição de Poisson é interpretada como o limite para o qual tende a distribuição Binomial
com parâmetros n e p, quando n cresce e p decresce de tal forma que o produto np se mantém
constante.

A distribuição de Poisson representa um modelo probabilístico adequado para o estudo de um


grande número de fenómenos observáveis. Eis alguns exemplos:

Propriedades da distribuição de Poisson

Média ou esperança matemática E(x) =  = np,


Variância var(x) = 
Desvio padrão  (x)  

Exemplo 4.3. A probabilidade de sair com defeito um exemplar numa fábrica de livros é de
0.001. Achar a probabilidade de que numa tiragem de 10000 livros, exactamente 3 destes sejam
defeituosos.

Resolução
Dados n = 10000, p = 0.001, x = 3, então  = 10000*0.001 = 10 livros
λ x * e λ 103 * e10
Pn(x)    0.0378
x! 3!

Exemplo 4.4. Certo posto de bombeiros recebe em media 3 chamadas por dia. Calcular a
probabilidade de:
a) Receber 4 chamadas num dia;
b) Receber 3 ou mais chamadas por dia;
c) Encontrar o desvio padrão do número das chamadas que o posto possa receber por dia.

67
4. Variáveis aleatórias e suas distribuições ~ Mulenga

Resolução

Dados:   np  3 chamadas em média por dia;


x * e  34 * e 3
a) x  4; Pn( x)    0.1680
x! 4!
b) P( x  3)  1  P( x  3)  1  ( P(0)  P(1)  P(2))  1  e3 * (1  3  4.5)  0.5768
c) var( x)    3  1.7321

A distribuição de Poisson tem uma boa aproximação à distribuição Binomial para x pequeno,
desde que p seja também pequeno. Esta aproximação é ilustrada na tabela para n = 100; p= 0.01
com   np  1.0

X 0 1 2 3 4 5
Bin(x,p) 0.3660 0.3700 0.1850 0.0610 0.0149 0.0029
Po(x) 0.3660 0.3680 0.1840 0.0613 0.153 0.0031

A importância da distribuição de Poisson decorre pelo facto de ela constituir uma boa
aproximação para processos de contagem de eventos aleatórios. Assim, ela serve de um modelo
bastante utilizado para a análise do número de chamadas telefónicas por unidade de tempo;
número de defeitos por unidade de área; acidentes por unidade de tempo; chegada de clientes a
um supermercado por unidade de tempo; número de glóbulos sanguíneos visíveis ao microscópio
por unidade de área; número de partículas emitidas por uma fonte de material radioactiva por
unidade de tempo; etc.

4.2 DISTRIBUIÇÕES DE VARIÁVEIS ALEATÓRIAS CONTINUAS

4.2.1 Distribuição uniforme ou rectangular

A distribuição uniforme é válida para situações nas quais as probabilidades de todos os sucessos
são iguais. E diz –se que uma variável é uniformemente distribuída se a sua função densidade de
probabilidade permanecer constante um intervalo [a; b]

0 se xa
 1

f ( x)   se axb (4.3)
b - a
0 se xb

A sua função de distribuição acumulada é

68
4. Variáveis aleatórias e suas distribuições ~ Mulenga

0 se xa
x  a

F ( x)   se axb (4.4)
 b-a
1 se xb

Os gráficos da função densidade de probabilidade e da função de distribuição acumulada são


ilustrados a seguir.

Função densidade de probabilidade Função de distribuição acumulada

Figura 4.1. Função densidade e acumulada da distribuição uniforme

Propriedades da distribuição uniforme


ab
1. Média ou esperança matemática: E ( x) 
2
(b  a) 2
2. Variância: var( x) 
12
ba
3. Desvio padrão:  ( x) 
2 3

Exemplo 4.5. Um ponto é escolhido ao acaso no segmento de recta [0; 2]. Qual será a
probabilidade de que o ponto escolhido esteja entre 1 e 3/2.

Resolução

Seja X uma variável que representa um ponto no segmento [0; 2]. A função densidade da
variável X é dada por:

0 se x0 0 se x0
 1 1
 
f (x)   se 0  x  2 ou então f (x)   se 0x2
2 - 0 2
0 se x2 0 se x2

A sua função de distribuição acumulada é:

69
4. Variáveis aleatórias e suas distribuições ~ Mulenga

0 se x0
1

F (x)   x se 0x2
2
1 se x2
Como 1 e 3/2 está no intervalo [0 ; 2], a probabilidade procurada será:
3 3 1 3 1 1
P(1  x  )  F ( )  F (1)  *  *1 
2 2 2 2 2 4

Exemplo 4.6. O intervalo do tempo de duração de pequenos anúncios publicitários é estimado


entre 5 a 12 minutos. Admitindo que a duração de cada anúncio é aleatória e todos os anúncios
distribuem –se uniformemente no intervalo indicado.
a) Indique a função densidade de distribuição das probabilidades.
b) Escreva a função de distribuição acumulada das probabilidades.
c) Qual é a probabilidade de um anúncio ter uma duração inferior a 8 minutos. E entre 8 a 10
minutos.
d) Calcule a duração média dos anúncios.

Resolução
a) Substituindo na formula geral de f(x) os valores de a e b temos
1
 se 5  x  12
f (x)   7

0 caso contrario
b) A função de distribuição acumulada corresponde é

0 se x  5
1

F (x)   (x - 5) se 5  x  12
7
q se x  12
1 1 3
c) P( x  8)  P( x  5)  P(5  x  8)  0  F (8)  F (5)  (8  5)  (5  5) 
7 7 7

1 1 2
P(8  x  10)  (10)  F (8)  (10  5)  (8  5) 
7 7 7
a  b 5  12
d) E ( x)    8.5
2 2

4.2.2 Distribuição Exponencial

A distribuição de probabilidade do intervalo de tempo t, entre dois sucessos consecutivos de uma


lei de Poisson é a distribuição Exponencial. A função densidade de probabilidades é dada por:

70
4. Variáveis aleatórias e suas distribuições ~ Mulenga

0 se x  0
f ( x)   onde   0 (4.5)
 * exp(-x) se x  0

Partindo da função densidade de probabilidades, pode –se obter a função de distribuição


acumulada F(x).

0 se x  0
F ( x)   (4.6)
1  exp(-x) se x  0

A probabilidade de que uma variável aleatória contínua X, cuja função de distribuição


acumulada é dada pela distribuição Exponencial assuma um valor num intervalo [a ; b] será igual
a:

P(a  x  b)  exp(a)  exp(b) (4.7)

Os gráficos correspondentes a função densidade e a função de distribuição acumulada são.


Funcao de distriibuicao acumulada

Funcao densidade de probabilidades Funcao de distribuicao acumulada


1

1
.8

.8
.6

.6
.4

.4
.2

.2
0

0 5 10 15
0 5 10 15
Variavel X Variavel x

Figura 4.2. Função densidade de probabilidades e função de distribuição acumulada da


distribuição Exponencial

Propriedades da distribuição exponencial

1
1. Média ou esperança matemática: E ( x) 

1
2. Variância: var( x) 
2
1
3. Desvio padrão:  ( x) 

71
4. Variáveis aleatórias e suas distribuições ~ Mulenga

Exemplo 4.7. O tempo de espera em minutos numa paragem de autocarros, obedece a


distribuição exponencial com média igual a 3 minutos. Considere a variável tempo de espera
com um processo aleatório e responda as seguintes alíneas.
a) Obtenha a função de distribuição acumulada da variável X.
b) Determine a média e o desvio padrão de X.
c) Qual é a probabilidade de que X assuma um valor entre 0.6 a 2 minutos.

Resolução

0 se x  0
a) F (x)  
1  exp(-3x) se x  0
1 1
b) E ( x)  e  ( x) 
3 
c) P(0.6  x  2)  exp(0.6 * 3)  exp(2 * 3)  0.1628

4.2.3 Distribuição Normal

A distribuição normal é uma das mais importantes distribuições das variáveis aleatórias em
estatística. Pois muitos dos fenómenos na vida real são comparados com a distribuição normal,
por exemplo: a altura de um indivíduo, peso, idade, grau de coeficiente de inteligência, nível de
produção atingida num determinado ano, etc. Esta distribuição também é conhecida como
distribuição de Gauss, Laplace ou Laplace – Gauss.
Uma variável aleatória contínua X diz –se que é normalmente distribuída se a sua função
densidade de probabilidade f(x) é definida pela seguinte formula.

1  1  x   2 
f ( x)  exp   *   com    x  
 2    
(4.8)
 2  

Onde
  desvio padrão ,
  média da distribuição ;
  3.141592654
exp  e  2.718281828 ;

X
Figura 4.3. Curva da distribuição normal

Se a variável X com média  e desvio padrão  for expressa em unidades reduzidas (escores
reduzidos) através da variável z, onde z  ( x   ) /  , pode –se mostrar que z é também normal
com média E(z) = 0 e var(z) = 1. e a função f(x) passa para  (z ) .

72
4. Variáveis aleatórias e suas distribuições ~ Mulenga

1
1 2 z2
 ( z)  e ; com    z  
2

Cada valor de  (z ) corresponde ao cumprimento entre a função densidade e o eixo OZ Por se


tratar de cumprimento os valores da função são sempre positivos, e diz se que  (z ) é par, dai
que  ( z ) =  (z ) .

Como a média da variável z é igual a zero, e variância 1, as probabilidades (áreas) sob  (z ) são
calculadas e tabeladas. Nos próximos exemplos será explicado o uso da tabela da distribuição
normal padrão.

Notação:
X  N (  , 2 ) - X tem distribuição normal com média  e variância  2
Z  N (0,1) - Z tem distribuição normal com média 0 e variância 1 ou Z tem distribuição normal
padrão.

Propriedades da distribuição normal

1. Média ou esperança matemática E ( x)    np


2. Variância: var( x)  npq ; desvio padrão  ( x)  npq
3. f(x) é simétrico: E(x) = Mo(x) = Me(x)
4. f(x) tem o máximo para x   ou z = 0.  (0)  1/ 2  0.3989

Função de distribuição acumulada de probabilidades

A função de distribuição acumulada da variável aleatória normalmente distribuída é dada pela


expressão.
x x 1  x  2
1   

 f ( x)dx    
F ( x)  e 2 dx , com    x  
    2

Quando x é expresso em unidades reduzidas, a função de distribuição acumulada será:


z z 1
1  2 z2
F ( z )   f ( z )dz   e dz , com    z  
  2

A função F(z) é usada para o calculo de probabilidades através de tabelas que oferecem as áreas
sob a curva normal padrão. A tabela que será usada nestes apontamentos é a tabela de faixa
central.

Caso 1. A probabilidade de que uma variável aleatória normal z, assuma um valor no intervalo
[z1; z2] é dada pela fórmula de Newton - Leibniz.

P( z1  z  z 2)  ( z 2)  ( z1)

73
4. Variáveis aleatórias e suas distribuições ~ Mulenga

Onde z1, z2 são escores reduzidos; ( z).  ( z) a função é ímpar e ( z  5)  0.5 os valores
de (z ) estão na tabela, que está junto ao material desta unidade.

Exemplo 4.9. Calcular a probabilidade de que z esteja no intervalo (-2.70; 1.86)

Resolução

P(2.70  z  1.86)  (1.86).  (2.70)


 (1.86)  (2.70)
 0.4686  0.4965
 0.9651

Caso 2. P( x1  x  x2)  ( z 2).  ( z1) ; onde z1  ( x1   ) /  e z 2  ( x2   ) / 

Exemplo 4.10. O salário semanal dos operários de uma certa empresa é normalmente distribuído
em torno de uma média de 180 meticais com desvio padrão de 25 meticais.
a) Encontre a probabilidade de um operário ter um salário semanal situado entre 150 à 178
meticais.
b) Dentro de que desvios de ambos os lados da média, cairão 96% dos salários.

Resolução

Dados:   180 ;   25 ; x1 = 150; x2 = 178.


a) z1  ( x1   ) /   (150  180) / 25  1.20 ;
z 2  ( x2   ) /   (178  180) / 26  0.08
P(150  x  178)  (0.08).  (1.20)
 0.0319  0.3849
 0.3530

b) P( x1  x  x2)  P( z1  z  z 2)  0.96 ; eentão ( z 2)  ( z1)  0.96

Para uma distribuição simétrica como a normal


padrão ( z 2)  ( z1) de onde ( z )  0.48 , então
z  2.05 . Usando a transformação para escores
reduzidos temos: x    z *  então
x1 = 180-2.05*25 = 128.75;
x2 = 180+2.05*25 = 231.25,
o intervalo é 128.75  x  231.25

74
4. Variáveis aleatórias e suas distribuições ~ Mulenga

Caso 3. P( z  z1)  0.5  P( z1  z  0) ou P( z  z1)  0.5  P(0  z  z1)


Caso 4. P( z  z1)  0.5  P( z1  z  0) ou P( z  z1)  0.5  P(0  z  z1)

Exemplo 4.11. (a) As estaturas dos alunos de determinada escola são normalmente distribuídas
com média de 1.60 m e desvio padrão 0.30 m. Encontrar a probabilidade de um aluno ter uma
estatura menor do que 1.45 m.

Resolução
Dados:   1.60 ;   0.30 ; x = 1.48;
então z = (1.48-1.60)/0.30 = - 0.40
P( x  1.48)  P( z  0.4)  0.5  P(0.4  z  0)
 0.5  ((0)  (0.4))
 0.5  0.1554
 0.3446

c) Calcular a probabilidade de um valor x assuma um valor maior que -1.38.

P( z  1.38)  P(1.38  z  0)  0.5


 (0)  (1.38)  0.5
 (1.38)  0.5
 0.4162  0.5
 0.9162

4.3 APROXIMAÇÒES ENTRE DISTRIBUIÇÕES

4.3.1 Aproximação da distribuição Binomial para a de Poisson

A distribuição Binomial com parâmetros n e p pode aproximar-se a distribuição de Poisson com


parâmetro   np se n é muito grande (n  50) e p muito pequeno ( p  0.1) . A aproximação é
tanto maior quanto maior for o número das observações independentes n ou quando n   e a
probabilidade p  0 .
Exemplo 4.12. Um contentor contém 500 caixas de latas de sardinha. A probabilidade de tirar do
contentor uma caixa e esta conter latas fora do prazo é de 0.002. Calcular a probabilidade de tirar
exactamente do contentor duas caixas com latas fora do prazo.
a) Usando a distribuição Binomial
b) Usando a distribuição de Poisson.

Resolução
Dados n = 500 caixas; p = 0.002; x = 2
a) X  Bin (500;0.002)

75
4. Variáveis aleatórias e suas distribuições ~ Mulenga

 500 
P(2)    * 0.002 2 * 0.998498  124750 * 0.000004 * 0.368985722  0.184
 2 
12 * exp( 1)
b)   np  500 * 0.002  1 ; X  Po(1) ; P( x  2)   0.1839  0.184
2!

4.3.2 Aproximação da distribuição Binomial para a distribuição Normal

Quando a probabilidade de ocorrência de um sucesso é igual a de um fracasso na


distribuição Binomial, então esta distribuição pode ser usada como aproximação à
distribuição Normal. Uma vantagem prática desta aproximação é a redução dos
cálculos muito chatos a realizar no modelo Binomial.

Se X  Bin (n, p) e p  0.5 , pode se admitir aproximadamente que X  N (np; npq) onde
E( x)    np e var( x)  npq com q = 1-p.

Exemplo 4.13. Calcule a probabilidade de obter entre 4 a 7 caras inclusive em 12


lançamentos de uma moeda honesta. (a) Usando a distribuição Binomial e (b)
Usando a aproximação Normal.

Resolução

a) Consideremos sucesso o número de caras k obtidas no lançamento, então:


12 
X  Bin (12;0.5) logo P( X  x)    * 0.5 x * 0.512 x ; para o caso concreto:
 x
P(4  x  7)  P(4)  P(5)  P(6)  P(7)  0.121  0.193  0.226  0.198  0.7330

b) Usando a distribuição normal

X  N (np; npq) para n = 12; p = 0.5; p = 0.5


temos E(x) = 12*0.5 = 6; var(x) = 12*0.5*0.5 = 3 logo  ( x)  1.7321

Como estamos aproximar uma distribuição de uma variável discreta para uma
variável contínua, é necessário fazer uma correcção dos limites do intervalo de
classe das probabilidades transformando os valores para contínuos.
3.5  6 7.5  6
P(4  x  7)  P(3.5  x  7.5) ; fazendo z1   1.44 ; z 2   0.87
1.7321 1.7321
P(4  x  7)  P(1.44  z  0.87)  (0.87)  (1.44)  0.3078  0.4251  0.7330

76
4. Variáveis aleatórias e suas distribuições ~ Mulenga

4.3.3 Aproximação da distribuição de Poisson para a distribuição Normal

Para as variáveis discretas com distribuição de Poisson com  grande, a distribuição de X será
aproximadamente normal com parâmetros E (x)   e var(x)   ou X  N (;  ) . Geralmente
para obter maior aproximação é necessário que  seja maior que 20.

Exemplo 4.14. A desintegração radiactiva se realiza em quantidades que seguem a distribuição


de Poisson com média de 25 segundos por quantidade. Calcule a probabilidade de que a
quantidade desintegrada esteja no intervalo entre 23 a 27 inclusive.

Resolução
x * exp(  ) 25 x * exp( 25)
a) X  Po(25) , precisa –se P(23  x  267) e P( x)  
x! x!
P(23) = 0.07634203 P(24) = 0.07952295
P(25) = 0.07952295 P(26) = 0.07646438 P(27) = 0.07080035

P(23  x  267) = P(23) +P(24) +P(25) + P(26) + P927) = 0.3826527

b) Usando a distribuição normal X  N (25;25)

P(23  x  27)  P(22.5  x  27.5)  P(0.5  z  0.5)  2 * (0.5)  2 * 0.1915  0.383


22.5  25 27.5  25
Repare que z1   0.5 e z 2   0.5
25 25

O quadro seguinte apresenta as restrições em relação aos parâmetros usados nas distribuições
que devem ser observadas quando se pretende usar as aproximações.

Distribuição Condições dos parâmetros Aproximação

X  Bin (n, p) n  50 e p  0.1 X  Po(np)


X  Bin (n, p) n  10 e p  0.5 ou X  N (np; npq)
n  30 e p  0.5 ou p  0.5
X  Po( )   20 X  N (;  )

77

Você também pode gostar