Você está na página 1de 8

1

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS:

BERNOULLI, BINOMIAL E POISSON

Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os resultados de um espaço amostral; mostra a proporção de vezes em que a variável aleatória tende a assumir cada um dos diversos valores.

Quando se atribuem valores de probabilidade a todos os possíveis valores de uma variável aleatória X, tanto por uma listagem como por uma função matemática, o resultado é uma distribuição de probabilidade. Uma variável aleatória é aquela cujos valores são determinados por processos acidentais, ao acaso, que não estão sob o controle do observador. A soma das probabilidades de todos os resultados possíveis deve ser igual a 1. No contexto das distribuições de probabilidades, os valores individuais de probabilidades deve ser designados pelo símbolo f ( x ), que enfatiza a existência de uma função matemática, por P ( x = X ), que enfatiza que a variável aleatória pode assumir diversos valores, ou simplesmente por P ( x ).

As distribuições de probabilidades proporcionam um método simples para a determinação de certas

probabilidades, os tipos de distribuição podem ser considerados como modelos para descrever situações

que envolvem resultados gerados pela chance.

Há uma variedade de tipos de distribuição de probabilidades na estatística. Cada qual tem seu próprio conjunto de hipóteses que definem as condições sob as quais o tipo de distribuição pode ser utilizado validamente. A chave da utilização de uma distribuição de probabilidades consiste em confrontar as hipóteses do tipo de distribuição com as características da situação real.

A validade da aplicação de determinada distribuição a um problema depende do grau de

aproximação entre a situação real e os modelos de distribuições de probabilidades. Usualmente, quanto melhor a aproximação, melhor a base para uma tomada racional de decisões. Isto permite ao administrador ou a outro analista utilizar o poder da estatística numa situação particular sem precisar sempre recomeçar tudo outra vez. Ou seja, tratar um conjunto de situações problemas essencialmente da mesma maneira.

Os modelos de distribuições de probabilidades, acha-se dividida em duas partes: distribuições descontínuas (discretas) e distribuições contínuas. As distribuições descontínuas (discretas) de probabilidade envolvem variáveis aleatórias relativas a dados que podem ter valores observados somente em pontos isolados ao longo de uma escala de valores. Em estatística aplicada à administração, tais dados ocorrem tipicamente através de processos de contagem; por isso, tais valores são geralmente expressos por números inteiros. Por outro lado, as distribuições contínuas de probabilidades envolvem variáveis aleatórias relativas a dados que podem assumir um valor em qualquer ponto fracionário ao longo de um intervalo especificado de valores. Os dados contínuos são gerados pelo processo de medição.

A discussão

que

segue,

neste

estudo,

limitar-se-á

apenas

às

principais

distribuições

de

probabilidades descontínuas (discretas): Bernoulli, Binomial e Poisson.

DISTRIBUIÇÃO DE BERNOULLI

Suponhamos um experimento tal como a jogada repetida de uma moeda, ou a escolha de repetidas fichas de uma urna, etc. Cada jogada ou extração é chamada uma prova. Em cada prova em particular há uma probabilidade associada a um determinado evento, tal como aparecimento de “cara” na moeda, a escolha de uma ficha vermelha, etc. Em certos experimentos, a probabilidade não varia de prova para prova (tal como no caso da jogada de uma moeda, ou de um dado). Tais provas dizem-se então independentes e costumam designar-se como provas de Bernoulli, que tem significado histórico à James Bernoulli, que primeiro as estudou no fim do século XVII.

Seja um experimento que consiste na realização de uma prova, cujos resultados só podem ser “sucesso” ou “fracasso”. Observando ainda que na realização desta prova os eventos são independentes, vamos chamar X uma variável aleatória que, de acordo com a pressuposição citada, somente assumirá valores 0 (zero) e 1 (um), sendo 0 a ocorrência do evento “fracasso” e 1 a ocorrência do evento “sucesso”, com probabilidades “q” e p = 1 – q , ou seja, P ( X = 0 ) = q e P ( X = 1 ) = p.

2

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

Sua função probabilidade da distribuição é definida por:

f ( x )

=

0

,

se

x

<

0

q

,

se

0

x

<

1

1

,

se

x

1

Quando esta variável estiver assim definida, diremos que ela mesma tem uma distribuição de Bernoulli.

Baseados nas propriedades da Expectância e da Variância temos:

   

X

   

0

   

1

 

P ( X )

     

q

   

p

 

P ( X ) = 1

 

As principais características são:

 

Média:

 

µ =

x

(

E X

)

=

1

x

i

(

p x

i

)

=

0

(

q

)

+

1

(

p

)

=

p

 

i

=

o

Variância:

2

δ =

x

(

Var X

) =

(

E X

)

2

[E X ]

(

)

2

= 0

2

(

q

) +1

2

(

p

) (

p

2

) =

p

p

2

=

p

(1) = ⋅

p

p

Desvio - padrão:

δ =

x

p ⋅ q
p
q

q

Essa distribuição tem importância como geradora de novas distribuições, conforme veremos a seguir.

DISTRIBUIÇÃO BINOMIAL

Usa - se o termo “ binomial” para designar situações em que os resultados de uma variável aleatória podem ser grupados em duas classes ou categorias. Os dados são, pois, nominais. As categorias devem ser mutuamente excludentes, de modo a deixar perfeitamente claro a qual categoria pertence determinada observação; e as classes devem ser coletivamente exaustivas, de forma que nenhum outro resultado fora delas é possível.

É comum referirmo-nos às duas categorias de uma distribuição binomial como “sucesso” ou

“fracasso”, muito embora não importe, para fins de cálculo, qual categoria seja considerada sucesso, e qual seja considerada fracasso, já que as duas são complementares. Por exemplo, no caso de um jogo de chance, o sucesso para um jogador é fracasso para o outro.

As observações de experimento binomial são em geral designadas como “provas”. Por exemplo, um

problema pode exigir a determinação da probabilidade de cinco sucessos em sete provas (observações).

Verifica-se que, porque “sucesso” e “fracasso” são mutuamente excludentes e coletivamente exaustivos, P ( sucesso ) + P ( fracasso ) = 1. Consequentemente, por exemplo, que P (sucesso) = 0,6, segue-se que P(fracasso) = 0,4.

A distribuição binomial é uma distribuição discreta de probabilidade, aplicável sempre que o

processo de amostragem é do tipo do de Bernoulli. Um processo de Bernoulli é um processo de amostragem no qual:

1º. Há n observações ou provas idênticas.

2º. Em cada tentativa existem dois resultados possíveis mutuamente exclusivos.

conveniência, sucesso e fracasso. 3º. As séries de tentativas, ou observações, são constituídas de eventos independentes. 4º. A probabilidade de sucesso, indicada por p, permanece constante de tentativa para tentativa. Ou seja, o

Eles são chamados, por

processo é estacionário.

3

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

dois métodos para obter as probabilidades para uma variável aleatória distribuída binomialmente. Um deles consiste em utilizar a fórmula binomial, e o outro é a utilização das tabelas de probabilidades binomiais.

Para a fórmula binomial são necessários três valores: o número de sucessos tentativas, ou observações ( n ); e a probabilidade de sucesso em cada tentativa ( p ).

( X ); o número de

Associando uma variável aleatória X igual ao número de sucessos nessas n provas, X poderá

assumir valores 0,1,2,3,

Vamos determinar a distribuição de probabilidades dessa variável X, dada através da probabilidade de um número genérico x de sucessos.

, n.

Suponhamos que ocorram apenas sucessos nas x primeiras provas e apenas fracassos nas ( n – x) provas restantes. Indicando sucesso em cada prova por 1 e fracasso por 0, temos:

1,1,1, 1, 0,0, , 0 x n – x
1,1,1,
1,
0,0,
, 0
x n – x

Como as provas são independentes, a probabilidade de ocorrência deste evento é

p

x

q

n

x

.

Porém, o evento x sucessos em n provas pode acontecer em outras ordens distintas, todas com a mesma probabilidade. Como o número de ordens é o número de combinações de n elementos x a x, a probabilidade de ocorrerem x sucessos em n provas será:

P X

(

ou :

P

ou :

(

X

P

(

X

=

=

=

x

x

x

)

)

)

=   n  

x

 

p

x

q

=

=

C

x

n

p

x

n !

q

n

x

!(

n

x

)!

n

x

x

p

x

q

n

x

A expressão obtida para P ( X = x ) é o ( x + 1) termo do desenvolvimento de ( q + p )ⁿ segundo o binômio de Newton, portanto, o nome “distribuição binomial”, dado a essa distribuição.

É conveniente, neste ponto, relembrar os termos do desenvolvimento do binômio de Newton.

Temos:

(

(

(

(

generalizando :

q

q

q

q

)

)

+

+ =

)

)

=

+

+

=

p

p

p

p

1

2

3

4

=

q

q

q

q

+

p

2

3

4

+

+

+

2

3.

4.

p q

.

p q

.

2

3

p q

.

(

q

)

+ =

p

q

n

+

n p q

.

.

n

+

+

+

2

p

3.

p

6.

p

2

2

q

.

.

q

1

+   n   p

2

 

.

+

p

2

+

3

4.

p

2

. q

n

2

3

.

+

q

+

p

4

n   . p

x

 

+ 

x

. q

n

x

+

+

p

n

4

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

OS PARÂMETROS: MÉDIA, VARIÂNCIA E DESVIO – PADRÃO

A média do número X de resultados favoráveis em uma distribuição binomial, ou seja, a esperança de X , é dada pela soma de todos os produtos que se obtém multiplicando cada valor de X pela respectiva probabilidade.

Entretanto, existe uma maneira mais fácil de obter a média de X. Basta definir uma variável I i , com , n , que será igual a 1, se no i-ésimo ensaio ocorrer resultado favorável e igual a zero, se no

i-ésimo ensaio ocorrer resultado desfavorável. Então o número X de resultados favoráveis, em n ensaios, é

i = 1,2,

dado pela soma de n termos I i , isto é:

X = I 1 + I 2 +

+ I

n termos I i , isto é: X = I 1 + I 2 + +

.

Como I i

é uma variável aleatória que só assume valores um e zero, com probabilidades p e q,

respectivamente, podemos obter:

E( Ii ) = 1.p + 0.q = p

Lembrando que X é uma soma de n termos, cada um com esperança p, segue-se que:

µ

x

=

E

(

X

) =

n p

.

Usando o mesmo raciocínio, podemos calcular a variância de X. Então:

Como (p + q) = 1 , segue-se que:

2

δ =

x

(

Var X

)

=

[

E I

i

(

E I

i

)]

2

2

δ =

x

(1

Var I

=

+

(

p

)

i

)

2

.

p

+

=

p q

.

(0

p

)

2

.

q

=

q

2

.

p

+

p

2

.

q

=

(

p q p

.

+

q

)

Logo, como X é uma soma de n termos independentes, cada um com variância p.q, podemos escrever:

2 δ Var X = ( ) x = n p q . . δ
2
δ Var X
=
(
)
x
=
n p q
.
.
δ X

= n p q

.

.

O USO DE TABELAS BINOMIAIS

As tabelas de probabilidades constituem um instrumento muito prático para a análise estatística; dão as probabilidades com um mínimo de esforço. Há dois tipos de tabelas binomiais. Um dá as probabilidades de resultados individuais de uma variável aleatória, e o outro dá as probabilidades de um conjunto de resultados. Conquanto ambos os tipos contenham essencialmente a mesma informação, alguns problemas se prestam mais a um tipo do que a outro, de forma que consideremos ambos.

Utiliza-se a tabela como segue:

1. Procurar no topo da tabela o valor de p indicado.

2. Localizar o n na coluna esquerda da tabela, e procurar o número de x sucessos desejado

3. A probabilidade de x sucessos se encontra na intersecção da linha achada conforme a parte 2 com a coluna achada conforme a parte 1. (Tabela de Probabilidade Binomial Individual). No caso, também pode ser usada para determinar a probabilidade de, x ser igual ou menor, e de x ser maior, do que um número especificado de sucessos. (Tabela de Probabilidades Binomial Acumuladas).

Embora as tabelas constituam o método mais simples e mais prático para determinação de probabilidades, há situações em que as probabilidades desejadas não podem ser obtidas de tabelas. Por essas razões, é conveniente usar a fórmula binomial para obter as probabilidades desejadas.

5

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson pode ser usada para determinar a probabilidade de um dado número de sucessos quando os eventos ocorrem em um continuum de tempo ou espaço. Tal processo, chamado de processo de Poisson, é similar ao processo de Bernoulli, exceto que os eventos ocorrem em um continuum ao invés de ocorrerem em tentativas ou observações fixadas. Tal como no caso do processo de Bernoulli, supõe-se que os eventos são independentes e que o processo é estacionário.

Somente um valor é necessário para determinar a probabilidade de um dado número de sucessos em um processo de Poisson: o número médio de sucessos para a específica dimensão de tempo ou espaço de interesse. Este número médio é geralmente representado por λ (letra grega “lambda) ou por µ . A distribuição de probabilidades de Poisson constitui um caso – limite, quando o número de provas n tende ao infinito e a probabilidade p do sistema de provas binomial é pequeno. Assim:

P X

(

= 1, t ) =λ∆

.)

.

P

P

t

(

(

X > ∆

X =

1,

0,

=

0

t

∆ = −λ∆

t

)

1

t

P

(

X = ∆ =λ

1,

t

)

t

n

∆ =

t

P X

(

t

n

=

,

n

x )

→∞ ∆→

,

0

=

lim

n →∞

n

x

 

. p

x

.

q

n

x

P

P

(

(

x t

,

x t

,

)

= lim

n →∞

) =

lim

n →∞

n λ t  

n  

n

 

 

 

n

.

x

λ t

n

n

. 1

x

(

(

1).(

n

2)

n

x

− +

x

1)

x !

(

λ t

)

x

.

n

x

.  

1

n

− λ t .   1

n


λ t


n

P

P

(

(

x t

,

x t

,

) =

)

=

lim

n →∞

n

(

n

(

1).(

n

2)

n

− +

x

1)

n

n n

n

(

λ t

)

x

.

x !

.  

1

− λ t .   1

n

n

λ t

n

      + 1    x λ t 
  + 1   
x
λ t 
1.  1
1   .   1 −
2  
 .
1
n
 
n
1 −
n
 
n 

1

x

n λ t      .    1 − n
n
λ t 
.
 
1
n
.

e −λ t

λ t

x !

Portanto:

(

P x t

,

) =

( λ )

t

x

x !

.

e −λ t

x

x

Lembrando, que e é a constante 2,7183 usada em conexão com os logaritmos naturais.

6

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

OS PARÂMETROS: MÉDIA, VARIÂNCIA E DESVIO – PADRÃO

µ =

X

2

δ =

x

E ( X

)

=

(

Var X

)

e

X = 0

−λ t

( λ t )

x !

=

x = 0

(

x

−λ

t

t

)

2

e

−λ t

.(

λ

t

)

x

.

x !

t

Logo, a distribuição de Poisson tem a variância igual à média, ou seja:

2 µ =δ =λ t x x desvio − padrão δ = λ t x
2
µ =δ =λ
t
x
x
desvio
− padrão
δ =
λ
t
x

:

4.2 O USO DE TABELAS DE POISSON:

As tabelas de probabilidades de Poisson proporcionam um método conveniente para a obtenção de probabilidades com um mínimo de tempo e de esforço. Por isso, elas devem ser usadas sempre que possível, em lugar do cálculo direto pela fórmula. Tal como no caso da binomial, há dois métodos para fazer isto. Há tabelas individuais e acumuladas onde se encontram as probabilidades para algumas médias.

A DISTRIBUIÇÃO DE POISSON COMO APROXIMAÇÃO DA BINOMIAL

A aproximação é mais adequada quando o número n de observações é grande e a probabilidade de sucesso, p, está próxima de 0 ou próxima de 1 . Convém dispor de um método alternativo para o cálculo de probabilidades binomiais pelas razões seguintes:

1. distribuição binomial descreve adequadamente muitas situações de interesse.

2. maioria das tabelas está limitada a n ≤ 20.

3. A fórmula binomial pode exigir esforço substancial para a obtenção de uma solução exata.

A

A

A vantagem da aproximação reside no fato de que a precisão sofre muito pouco e que o trabalho

necessário é consideravelmente menor. Para usar a aproximação, basta determinar a média, ou o valor

esperado, da distribuição binomial. Essa média é então considerada como a média do processo para a distribuição de Poisson. Ou seja, a média µ do processo é igual à média binomial np.

Exemplo:

Se retirarmos 50 peças da produção de uma máquina que forneça 2% de produção defeituosa, a probabilidade de encontrarmos duas peças defeituosas será:

Usando a aproximação pela distribuição de Poisson de mesma média:

P(X

)

=2 =

 50 

2

.( ,

0 02

)

2

.( ,

0 98

P X

(

=

2)

=

e

1

.1

2

1

=

2!

2.

e

)

48

= 01857

,

= 0,1839

7

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

BINOMIAL

EXERCÍCIOS

1. Num determinado processo de fabricação 10% das peças são consideradas defeituosas. As peças são acondicionadas com 5 unidades cada uma.

a) Qual a probabilidade de haver exatamente 3 peças defeituosas numa caixa?

P

(

X =

3)

=   5

3

 

.(0,10) .(0,90)

3.

2 =

0,0081

b) Qual a probabilidade de haver duas ou mais peças defeituosas numa caixa?

c)

P

P

P

(

(

(

X

X =

X =

2 )

0)

1)

1

[

(

X

=

=   5

P

=

0

.( 0 ,10 )

5   .( 0 ,10 )

= 

1

1

0

0 )

+

P

(

X

.( 0 ,90 )

5

=

.( 0 ,90 )

4

=

=

1)

]

=

0 ,5905

0 ,3280

1

[

0 ,5905

+

0 ,3280

]

=

0 ,0815

Se a empresa paga multa de R$ 10,00 por caixa em que houver alguma peça defeituosa, qual o valor esperado da multa num total de 1000 caixas?

P(CM) = 1 – P(X=0) = 1 – 0,5905 = 0,04095

Teremos uma nova binomial com n = 1000 e p = 0,04095.

O número Esperado de caixas com uma ou mais peças defeituosas será:

E (CM) = np = 1000(0,4095) = 409,5 caixas

Como o valor da multa é R$ 10,00, o valor esperado das multas será:

2

CM = R$ 10,00 (409,5) = R$ 4.095,00

Uma empresa vende e instala seus produtos. Através de “ estatísticas” conhece que 40% dos produtos instalados necessitam de novos ajustamentos. Quatro produtos são vendidos e devem ser instalados. A empresa deseja saber qual a probabilidade de que pelo menos dois destes produtos, após sua instalação, venham a requerer novos ajustamentos. Por outro lado, a empresa estima em R$ 100,00 o custo de cada ajustamento complementar. Qual o custo esperado para a empresa após ter instalado independentemente quatro produtos?

P

P

P

P

( 2

( X =

( X =

(

x =

(

4 )

X

x

2)

3)

4)

= 

P

=

4

.(

=

0,40

2  

4

= 

.( 0,40

3  

=   4

 

2 )

+

P

(

X

2

) .( 0,60

3

) .( 0,60

)

2

=

3)

+

P

= 0,3456

)

1

= 0,1536

= 0,025

 

4

.( 0,40 ) .( 0,60 )

4

0

(

X

=

4 )

=

0,5248

E

(

k

.

X

)

=

k

.

E

(

X

)

E

(

X

)

=

=

4 .( 0 ,4 )

=

1,6

k

=

.

n p

R $ 100 ,00

 

log

o

:

E

(

k

.

X

)

=

100 .(1,6 )

=

R

$ 160 ,00

8

UFMA - DEMAT – Estatística e Probabilidade - Prof. Afonso

POISSON

1. Suponhamos que os navios cheguem a um porto à razão de λ = 2 navios/hora, e que essa razão seja bem aproximada por um sucesso de Poisson. Observando o processo durante um período de meia hora (t = ½), determine a probabilidade de: não chegar nenhum navio, e de chegarem 3 navios.

 

x = λ

t =

2 .

1

=

1

µ

tabela

2

e

1

=

0 ,368

 

P

(

X

=

0 )

=

e

1

.( 1 )

0

   

0!

 

P

(

X

=

3 )

=

e

1

.( 1 )

3

   

6

=

=

0

0

,368

, 061

2.

Suponhamos que os defeitos em fios para tear possam ser aproximados por um processo de Poisson com média de 0,2 defeitos por metro (λ = 0,2). Inspecionando-se pedaços de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 (isto é, 0 ou 1) defeito.

µ =λ =

x

t

0,2.(6)

=

1,2

tabela

e

1,2

= 0,301

P X

(

1)

=

P X

(

=

0)

+

P X

(

=

1)

=

e

1,2

.(1,2)

0

0!

+

e

1,2

.(1,2)

1

1!

=

0,301

+

0,301.(1,2)

=

0,6622