Você está na página 1de 130

Probabilidade e

Distribuições de Probabilidade

Mery Abreu
Variável aleatória

Qualquer característica que pode ser


medida ou categorizada, assumindo uma
série de valores diferentes. Esses
resultados são determinados pelo acaso
Variável aleatória discreta

Variável que pode assumir valores num


conjunto enumerável de resultados, como por
exemplo, número de filhos
Variável aleatória contínua

Variável que pode assumir qualquer valor em


uma escala contínua, sem pulos ou
interrupções, como por exemplo, peso (kg)
Qual é a probabilidade de nascer
um menino em uma família?

• A cada criança nascida em uma


família existem 2 possibilidades 
nascer um menino ou uma menina
• O número de eventos de interesse
(ser menino) é  1
• A probabilidade de ser um menino
 1/2

Probabilidade = número de eventos de


interesse dividido pelo número total de
possibilidades
Qual é a probabilidade de ocorrência de
uma face par ao lançamento de um dado?

• Total de possibilidades:
Faces  1 2 3 4 5 6
• Faces com número par:
Faces  2 4 6

• Probabilidade de face par = 3/6 = 0,50


Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100

• Qual a probabilidade de uma pessoa escolhida ao acaso desse


grupo ter pressão elevada?
Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100

• Qual a probabilidade de uma pessoa escolhida ao acaso desse


grupo ter pressão elevada?
Evento=pressão alta=A
P(A)=
Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100

• Qual a probabilidade de uma pessoa escolhida ao acaso desse


grupo ter pressão elevada?
Evento=pressão alta=A
P(A)=0,20
Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100

• Considerando que a pessoa escolhida tem excesso de peso,


qual a probabilidade dela também ter pressão elevada?
Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100

• Considerando que a pessoa escolhida tem excesso de peso,


qual a probabilidade dela também ter pressão elevada?
• Evento 1 = excesso de peso = B
• Evento 2 = pressão elevada =A
• P(A/B) =
Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100

• Considerando que a pessoa escolhida tem excesso de peso,


qual a probabilidade dela também ter pressão elevada?
• Evento 1 = excesso de peso = B
• Evento 2 = pressão elevada =A
• P(A/B) =0,10/0,25 = 0,40
Distribuição de pacientes segundo peso e
pressão arterial

Pressão Peso Total


arterial Excesso Normal Deficiente

Elevada 10 8 2 20
Normal 15 45 20 80
Total 25 53 22 100
• Considerando que a pessoa escolhida tem excesso de peso,
qual a probabilidade dela também ter pressão elevada?
• Evento 1 = excesso de peso = B
• Evento 2 = pressão elevada =A
• P(A/B) =0,10/0,25 = 0,40 = P(A Π B)/P(B)
Extrações de cartas do baralho

• É extraída uma carta de um baralho comum (total 52


cartas). Qual a probabilidade dela ser um ás?
• Evento  ter um ás = A
• P(A) = 4/52 = 0,077
Extrações de cartas do baralho

• É extraída uma carta de um baralho comum (total 52


cartas). Qual a probabilidade dela NÃO ser um ás?
• Evento  ter um ás = A
• Evento complementar  não ter um ás = Ac
• P(Ac)=
Extrações de cartas do baralho

• É extraída uma carta de um baralho comum (total 52


cartas). Qual a probabilidade dela NÃO ser um ás?
• Evento  ter um ás = A
• Evento complementar  não ter um ás = Ac
• P(Ac)=1-P(A) = 1-0,077=0,923
Extrações de cartas do baralho

• São extraídas duas cartas de um baralho comum


(total 52 cartas). Qual a probabilidade de ambas serem
ás?
• Primeira extração
• Evento  ter um às na 1ª extração = A
• P(A) = 4/52
• Segunda extração
• Evento  ter um às na 2ª extração = B
Quantas cartas restaram no baralho?
Extrações de cartas do baralho

• São extraídas duas cartas de um baralho comum


(total 52 cartas). Qual a probabilidade de ambas serem
ás?
• Primeira extração
• Evento  ter um às na 1ª extração = A
• P(A) = 4/52
• Segunda extração
• Evento  ter um às na 2ª extração = B
Quantas cartas restaram no baralho?
51 cartas, já que 1 já foi retirada
Extrações de cartas do baralho

• Segunda extração
• Evento  ter um às na 2ª extração = B
Quantas cartas restaram no baralho?
51 cartas, já que 1 já foi retirada
Quantos ás restaram?
Extrações de cartas do baralho

• Segunda extração
• Evento  ter um às na 2ª extração = B
Quantas cartas restaram no baralho?
51 cartas, já que 1 já foi retirada
Quantos ás restaram?
Apenas 3 ases

Probabilidade de sair um ás na 2ª extração sendo que


saiu ás na 1ª extração:
P (B/A)=3/51
Extrações de cartas do baralho

• São extraídas duas cartas de um baralho comum


(total 52 cartas). Qual a probabilidade de ambas serem
ás?
• Primeira extração  P(A) = 4/52
• Segunda extração
Quantas cartas restaram no baralho?
51 cartas, já que 1 já foi retirada
Quantos às restaram?
Apenas 3 ases
Extrações de cartas do baralho

• São extraídas duas cartas de um baralho comum


(total 52 cartas). Qual a probabilidade de ambas
serem ás?
• P(A Π B) = P(A)xP(B/A) = 4/52 x 3/51 = 12/2652

• Esses eventos não são independentes, pois a


probabilidade do segundo depende do resultado do
primeiro
Extrações de cartas do baralho

• São extraídas duas cartas de um baralho comum


(total 52 cartas). Porém, a primeira carta é devolvida
ao baralho antes do sorteio da segunda.
Qual a probabilidade de ambas serem ás?
Extrações de cartas do baralho

• Primeira extração
• Evento  ter um às na 1ª extração = A
• P(A) = 4/52
• Segunda extração
• Evento  ter um às na 2ª extração = B
Como há reposição
• P (B/A) = P(B) = 4/52
Extrações de cartas do baralho

• São extraídas duas cartas de um baralho comum


(total 52 cartas). Porém, a primeira carta é devolvida
ao baralho antes do sorteio da segunda.
Qual a probabilidade de ambas serem ás?

P (A Π B) = P(A) x P(B) = 4/52 x 4/52


= 16/2704

Eventos A e B são independentes


Propriedades da probabilidade

• 0 < P(A) < 1 para qualquer evento A


• P(Ac)=1-P(A)
• P(A/B)=P(A Π B) / P(B)  eventos dependentes
• P(A Π B) = P(A/B) x P(B)  eventos dependentes
• P(A Π B) = P(A) x P(B)  eventos independentes
- Cada variável aleatória tem uma determinada
distribuição
- Cada valor dessa variável ocorre com
determinada probabilidade
- Para estudar o comportamento de uma variável 
Distribuição de probabilidade

É um modelo matemático que relaciona


um certo valor da variável em estudo
com a sua probabilidade de ocorrência
Qual é a probabilidade de nascer
um menino em uma família?

• A cada criança nascida em uma


família existem 2 possibilidades 
nascer um menino ou uma menina
• O número de eventos de interesse
(ser menino) é  1
• A probabilidade de ser um menino
 1/2

Probabilidade = número de eventos de


interesse dividido pelo número total de
possibilidades
Qual é a distribuição de probabilidade
do número de meninos em uma
família com duas crianças?

Seja X: o número de
meninos em uma família
com duas crianças
Se a família tem duas crianças, as
possibilidades são:

2 meninas  X=0
Se a família tem duas crianças, as
possibilidades são:

2 meninas  X=0

1 menino e 1 menina  X=1


Se a família tem duas crianças, as
possibilidades são:

2 meninas  X=0

1 menino e 1 menina  X=1

1 menina e 1 menino  X=1


Se a família tem duas crianças, as
possibilidades são:

2 meninas  X=0

1 menino e 1 menina  X=1

1 menina e 1 menino  X=1

2 meninos  X=2
Se a família tem duas crianças, as
possibilidades são:

2 meninas  X=0

1 menino e 1 menina  X=1

1 menina e 1 menino  X=1

2 meninos  X=2
4 possibilidades
Se a família tem duas crianças, as
possibilidades são:

2 meninas  X=0 P(X=0)=1/4

1 menino e 1 menina  X=1


P(X=1)=2/4
1 menina e 1 menino  X=1

2 meninos  X=2 P(X=2)=1/4


Tabela 1: Distribuição de probabilidade do número de
meninos em uma família com duas crianças

Número de meninos (x) P(X=x)


0 1
4
1 1/2

2 1
4
Total 1
Requisitos para uma Distribuição de
Probabilidades:

ΣP( x) = 1 Soma de todas as


probabilidades deve ser 1

0 ≤ P( x) ≤ 1 Cada valor de probabilidade


deve estar entre 0 e 1
- Distribuição de probabilidade calculada a partir
dos resultados daquela variável específica
- Outras variáveis aparecem com freqüência
em situações práticas e justificam estudo mais
aprofundado
- Nesses casos a distribuição pode ser escrita
de maneira mais compacta
- Muitos métodos estatísticos baseiam-se na
premissa de que os dados provem de uma
população com distribuição teórica
conhecida
Distribuições discretas  a probabilidade de
que a variável X assuma um valor específico xo
é dada por:
P(X = xo) = P(xo)

Exemplo:
X  variável aleatória que representa status de
fumantes entre jovens de Belo Horizonte
X = 1  jovem fumante
X = 0  jovem não fumante
P(X=1)=P(1)=probabilidade do jovem ser fumante
- Considere uma variável aleatória dicotômica X
que assume dois valores mutuamente exclusivos:

evento sucesso (X=1)


x x
não evento fracasso (X=0)

- Esse tipo de variável segue o modelo Bernoulli


X 0 1 k 1− k
P ( X = k ) = p (1 − p )
pk 1-p p
k = 0, 1
p=probabilidade de sucesso
Exemplo: Segundo INCA (2002), 11,7% dos jovens
de Belo Horizonte fumam

Tabagismo entre jovens 15 a 24 anos

11,7%

não

sim

88,3%

Abreu et al, ICUH, 2008


Experimento teórico:
• Sorteio de um jovem (15 a 24 anos) de Belo Horizonte
• De acordo com dados amostrais  proporção de jovens
fumantes em BH = 11,7% (p=0,117)
• X  variável aleatória que representa status de
fumante desse jovem
– X = 1  jovem fumante
– X = 0  jovem não fumante
P ( X = 0) = 1 − p
P ( X = 1) = p
P ( X = 0) = 1 − 0,117
P ( X = 1) = 0,117
P ( X = 0) = 0,883
Variável aleatória
discreta

Dicotômica que
assume dois valores
mutuamente exclusivos
(sucesso e fracasso)
p  probabilidade de
sucesso

Um único
experimento

Distribuição
Bernoulli
• Jovem é fumante (X=1) com probabilidade
0,117 e não fumante (X=0) com probabilidade
0,883
• Suponha que selecionamos aleatoriamente três
jovens de Belo Horizonte
• K  variável aleatória representando o número
de jovens fumantes entre os três selecionados
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0
0 0 1
1 1 0
1 0 1
0 1 1
1 1 1
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3

Seja p=0,117
1-p=0,883
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3

P(K=0)=(1-p)3=0,8833=0,688 Seja p=0,117


1-p=0,883
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3

P(K=0)=(1-p)3=0,8833=0,688 Seja p=0,117


P(K=1)=3p(1-p)2=3(0,117)(0,883)2=0,273 1-p=0,883
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3

P(K=0)=(1-p)3=0,8833=0,688 Seja p=0,117


P(K=1)=3p(1-p)2=3(0,117)(0,883)2=0,273 1-p=0,883
P(K=2)=3p2(1-p)=3(0,117)2(0,883)=0,036
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3
P(K=0)=(1-p)3=0,8833=0,688 Seja p=0,117
P(K=1)=3p(1-p)2=3(0,117)(0,883)2=0,273 1-p=0,883
P(K=2)=3p2(1-p)=3(0,117)2(0,883)=0,036
P(K=3)=(0,117)3=0,002
Resultado de K Probabilidade desses Número de
1º jovem 2º jovem 3º jovem resultados fumantes

0 0 0 (1-p)(1-p)(1-p)=(1-p)3 0
1 0 0 p(1-p)(1-p)=p(1-p)2 1
0 1 0 (1-p)p(1-p)=p(1-p)2 1
0 0 1 (1-p)(1-p)p=p(1-p)2 1
1 1 0 pp(1-p)=p2(1-p) 2
1 0 1 p(1-p)p=p2(1-p) 2
0 1 1 (1-p)pp=p2(1-p) 2
1 1 1 ppp=p3 3
P(K=0)=(1-p)3=0,8833=0,688 Seja p=0,117
P(K=1)=3p(1-p)2=3(0,117)(0,883)2=0,273 1-p=0,883
P(K=2)=3p2(1-p)=3(0,117)2(0,883)=0,036
P(K=3)=(0,117)3=0,002
P(K=0)+P(K=1)+P(K=2)+p(K=3)=1
• A distribuição da variável aleatória discreta K é
denominada Distribuição Binomial
• Se temos n ensaios independentes de Bernoulli, cada
um com probabilidade de “sucesso” p  a variável
aleatória K que conta o número total de sucessos
tem distribuição binomial
n!
P( K = k ) = p k (1 − p ) n − k
k!(n − k )!
n k
P( K = k ) =   p (1 − p ) n − k k=0,1,2,...,n
k 
• A Distribuição Binomial envolve três suposições:
1. Há um número fixo de ensaios n, cada um
resulta em dois resultados mutuamente exclusivos
2. Os resultados dos n ensaios são independentes
3. A probabilidade de sucesso p é constante para
cada um dos ensaios
• A Distribuição Binomial envolve três suposições:
1. Há um número fixo de ensaios n, cada um
resulta em dois resultados mutuamente exclusivos
2. Os resultados dos n ensaios são independentes
3. A probabilidade de sucesso p é constante para
cada um dos ensaios
• Exercício
De acordo com os dados do estudo “Saúde em BH”, a
prevalência de tabagismo entre jovens 18 a 24 anos residentes
em Belo Horizonte no ano de 2009 foi de 13,9%

Selecionamos aleatoriamente três jovens de Belo Horizonte na


faixa etária de 18 a 24 anos.
• Exercício
De acordo com os dados do estudo “Saúde em BH”, a
prevalência de tabagismo entre jovens 18 a 24 anos residentes
em Belo Horizonte no ano de 2009 foi de 13,9%

Selecionamos aleatoriamente três jovens de Belo Horizonte na


faixa etária de 18 a 24 anos. Qual a probabilidade de:

• Nenhum ser fumante


• Apenas um ser fumante
• Mais de um ser fumante
• Menos de três serem fumantes
• Exercício
De acordo com os dados do estudo “Saúde em BH”, a prevalência de
tabagismo entre jovens 18 a 24 anos residentes em Belo Horizonte no
ano de 2009 foi de 13,9%
Se selecionarmos aleatoriamente três jovens de Belo Horizonte na
faixa etária de 18 a 24 anos, qual a probabilidade de:

P(x=1) = 0,139
P(x=0) = 0,861 n=3 K=0,1,2,3

• Nenhum ser fumante  P(K=0)


• Apenas um ser fumante  P(K=1)
• Mais de um ser fumante  P(K>1)= [P(K=2)+P(K=3)]
• Menos de três serem fumantes  P(K<3) = 1- P(K=3)
• Exercício
De acordo com os dados do estudo “Saúde em BH”, a prevalência de
tabagismo entre jovens 18 a 24 anos residentes em Belo Horizonte no
ano de 2009 foi de 13,9%
Se selecionarmos aleatoriamente três jovens de Belo Horizonte na
faixa etária de 18 a 24 anos, qual a probabilidade de:

P(x=1) = 0,139 K P (K=k)


P(x=0) = 0,861 n=3 k=0,1,2,3
0 0,638277
• Nenhum ser fumante  P(K=0) 1 0,309131
• Apenas um ser fumante
2 0,049906
• Mais de um ser fumante
• Menos de três serem fumantes 3 0,002686
• Exercício
De acordo com os dados do estudo “Saúde em BH”, a prevalência de
tabagismo entre jovens 18 a 24 anos residentes em Belo Horizonte no
ano de 2009 foi de 13,9%
Se selecionarmos aleatoriamente três jovens de Belo Horizonte na
faixa etária de 18 a 24 anos, qual a probabilidade de:
K P (K=k)
P(x=1) = 0,139
P(x=0) = 0,861 n=3 0 0,638277
1 0,309131
• Nenhum ser fumante  P(K=0) = 0,6383 = 63,83%
• Apenas um ser fumante  P(K=1) = 0,3091 = 30,91% 2 0,049906
• Mais de um ser fumante  P(K>1)= [P(K=2)+P(K=3)]
3 0,002686
= 0,0499 + 0,0027 = 0,0526 = 5,26%
• Menos de três serem fumantes  P(K<3) = 1 – P(K=3) = 1 – 0,0027 = 0,9973 = 99,73%
• Existem inúmeros exemplos na área de saúde nos
quais a distribuição binomial se aplica:
1. Número de meninos em uma família com dois
filhos
2. Número de fumantes entre jovens de BH
(Abreu et al, 2008)

3. Número de pessoas infectadas com o vírus da


dengue (Cunha et al, 2008)

4. Número de pessoas com baixa qualidade de


vida (Cardoso et al 2005)
Variável aleatória
discreta

Dicotômica que
assume dois valores
mutuamente exclusivos
(sucesso e fracasso)
p  probabilidade de
sucesso

Um único n
experimento experimentos

Distribuição Distribuição
Bernoulli Binomial
Exercícios

Dos experimentos abaixo, verifique quais são binomiais e


justifique. Quando possível identifique os parâmetros n e p.

a) De uma sala com 5 mulheres e 3 homens, selecionar


aleatoriamente e com reposição, três pessoas. A variável
aleatória de interesse é o número de mulheres selecionadas
na amostra.
b) Idem ao item a, mas considerando a amostragem sem
reposição
c) De uma população de milhares de pessoas, selecionar
aleatoriamente e com reposição 20 pessoas. A variável de
interesse é o número de mulheres na amostra.
d) Idem ao item c, mas considerando a amostragem sem
reposição.
A probabilidade de um indivíduo ter sangue Rh- é 10%. Um total de 5
indivíduos se apresentaram para exame de sangue e deseja-se
estudar a probabilidade desses indivíduos terem sangue Rh-.

a) Identifique a distribuição que pode ser utilizada nesse caso.


b) Identifique os parâmetros dessa distribuição nesse caso.
c) Qual a probabilidade de:
c1) todos terem Rh-?
c2) no máximo 2 dos 5 indivíduos apresentarem Rh-?
c3) Mais de 3 apresentarem Rh-.
c4) No mínimo 1 ser Rh-.
Utilize a tabela abaixo para responder a questão c).
k P(K=k)
0 0,59049
1 0,32805
2 0,07290
3 0,00810
4 0,00045
5 0,00001
• É um modelo frequentemente usado para
descrever variáveis aleatórias que se expressam
através de contagens

• Nesse caso:

X  variável aleatória que representa o número


de ocorrência de evento em um período de
tempo
X  variável aleatória que representa o número de
ocorrência de evento em um período de tempo
Distribuição de probabilidades é dada por:
e − λ λx x=0,1,...
P( X = x) =
x!
Onde e ≅ 2,7183 e λ é a taxa média de ocorrências
(número médio de ocorrências por unidade de tempo)
• A distribuição de Poisson envolve um conjunto de
suposições:
1. As condições permanecem estáveis no decorrer do
tempo, isto é, a taxa média de ocorrências (λ) é
constante no tempo
2. Intervalos de tempo disjuntos são independentes,
isto é, a informação sobre o número de
ocorrências em um intervalo nada revela sobre o
outro
• Propriedade importante da distribuição Poisson:
Média = variância = λ
Exemplo 1 – Chegadas a um pronto atendimento

• X  número de pacientes que chegam a um pronto


atendimento de uma pequena cidade durante a
madrugada
• O número médio de pacientes que chega a esse
pronto atendimento na madrugada é 3
• X  distribuição Poisson com λ=3
−3 x
e 3 x=0,1,...
P( X = x) =
x!
Exemplo 1– Chegadas a um pronto atendimento

Como obter a distribuição de probabilidades de X?


Vamos calcular P(X=0), P(X=1),P(X=2),...

e −3 30 e −3 31
P ( X = 0) = P ( X = 1) =
0! 1!
P ( X = 0) = e −3 = 0,049 P ( X = 1) = 3e −3 = 0,149

e −3 32
P ( X = 2) =
2!
9 −3
P ( X = 2) = e = 0,224
2
Com cálculos análogos aos anteriores temos que:
• É pequena a probabilidade de
x P(X=x) x P(X=x) nenhum pacientes chegar em uma
0 0,050 7 0,022 determinada madrugada
1 0,149 8 0,008 P(X=0)=5%
2 0,224 9 0,003
• É provável que chegue pelo
3 0,224 10 0,001 menos 1 paciente:
4 0,168 11 0,000 P(X>1)=1-P(X=0)=0,950
5 0,101 12 0,000
6 0,050 > 13 ~0 • É improvável que cheguem 13
ou mais pacientes P(X>13)~0
• Após a escolha da distribuição (modelo) para
descrever uma situação é necessário verificar a
sua adequação aos dados
• Uma forma de verificar essa adequação
consiste em comparar as proporções
observadas com as obtidas pela distribuição de
probabilidades
• Se as discrepâncias são “pequenas” existem
evidências de um bom ajuste do modelo aos
dados
Exemplo 2 – Número de consultas médicas
Em um plano de saúde com 5694 filiados, foram feitas
13098 consultas ao fim de um ano
Nº consultas Frequência Nº consultas Frequência
0 589 5 304
1 1274 6 126
2 1542 7 39
3 1144 8 10
4 663 9 3
Suponha que o número de consultas siga uma
distribuição Poisson com λ=2,3
1×1274 + 2 × 1542 + ... + 8 ×10 + 9 × 3
λ=
589 + 1274 + 1542 + .... + 10 + 3
Número de consultas  Distribuição Poisson:
e −2,3 2,3 x e −2,3 2,30
P( X = x) = P ( X = 0) = = 0,1003
x! 0!
Nº consultas Freq. Obs. % Obs. % Esp.
0 589 10,34 10,03
1 1274 22,37 23,06
2 1542 27,08 26,52
3 1144 20,09 20,33
4 663 11,64 11,69
5 304 5,34 5,38
6 126 2,21 2,06
7 39 0,68 0,68
8 10 0,18 0,19
9 3 0,05 0,05
Total 5694 100,00
30,00

25,00

20,00
Percentual

observado
15,00 esperado

10,00

5,00

0,00
0 2 4 6 8 10

Nº consultas
Variável aleatória
discreta

Dicotômica que Representa o número


assume dois valores
de ocorrência de
mutuamente exclusivos
(sucesso e fracasso) evento em um período
p  probabilidade de de tempo
sucesso

Distribuição
Um único n Poisson
experimento experimentos

Distribuição Distribuição
Bernoulli Binomial
Exercício - Seja X uma variável que representa o número de casos de
tétano registrados em determinado país durante um único mês, em 1989.
Essa variável X tem uma distribuição de Poisson com parâmetro λ=4,5. A
distribuição de probabilidades de X encontra-se na tabela abaixo.

x P(X=x) x P(X=x)
0 0,011 8 0,046
1 0,050 9 0,023
2 0,112 10 0,010
3 0,169 11 0,004
4 0,190 12 0,002
5 0,171 13 0,001
6 0,128 14 0,000
7 0,082 15 0,000
• Qual a probabilidade de que sejam registrados até 3 casos de tétano em
um mês?
• Qual a probabilidade de que 9 casos ou mais sejam registrados?
• É provável que haja mais de 13 casos em um único mês?
• Qual é a média de casos de tétano registrados nesse país durante um
mês? E o desvio-padrão?
Distribuições contínuas  as probabilidades são
especificadas em termos de intervalos, pois a
probabilidade associada a um número específico é
zero
b
P (a ≤ X ≤ b ) = ∫
a
f ( x ) dx

Exemplo:
Distribuição do peso de adultos
Qual a probabilidade de se ter um adulto com peso
acima de 90kg? P(X>90)
Observa-se o peso, em kg, de 1500 pessoas adultas
selecionadas ao acaso em uma população

Histograma da distribuição do peso de 1500 pessoas adultas


Qual a distribuição de probabilidade da
variável aleatória peso?

A distribuição contínua mais comum


é a distribuição normal
• Também conhecida como distribuição gaussiana ou
curva em forma de sino
• A densidade de probabilidade é dada por:

1  x−µ  2
1 −  
2 σ 
f ( x) = e −∞ < x < ∞
σ 2Π

• A curva normal é unimodal e simétrica ao redor da média


(µ)
• A média, mediana e moda da distribuição são idênticas
• O desvio-padrão (σ) representa a dispersão em torno da
média
Muitos fenômenos naturais comportam-se de forma
próxima a essa distribuição. Exemplos:

1. Peso

2. Altura

3. Pressão sanguínea

4. Idade

5. Nível de hemoglobina no sangue

6. Nível de colesterol
Exemplo:

• Considere uma população em que o nível sérico de


colesterol tem distribuição normal com média (µ) e
desvio-padrão (σ)

• Qual a probabilidade de um indivíduo escolhido


aleatoriamente ter
colesterol menor que 250mg/100ml?

1) P(X<250) = ???
• A distribuição normal pode ter um número infinito de
valores possível para sua média e desvio-padrão

• É impossível tabular a área associada a cada uma


das curvas normais

• Somente uma curva é tabulada  distribuição


normal padrão (µ=0 e σ=1)
µ ; σ 2),
Se X ~ N(µ definimos
X −µ
Z=
σ
E(Z) = 0
Var(Z) = 1
f(x)
µ ; σ 2)
X ~ N(µ

f(z)
Z ~ N(0 ; 1) a µ b x

a–µ 0 b–µ z
σ σ
TABELA NORMAL PADRÃO

Denotamos: A(z) = P(Z ≤ z), para z ≥ 0


1) Qual a probabilidade de um indivíduo escolhido
aleatoriamente ter colesterol menor que 250mg/100ml?
Níveis de colesterol  distribuição normal com média 214 e
desvio-padrão 44.
 X − µ 250 − 214 
P ( X < 250) = P <  = P ( Z < 0,82)
 σ 44 
 X − µ 250 − 214 
P ( X < 250) = P <  = P ( Z < 0,82)
 σ 44 
P ( X < 250) = 0,7939

Portanto, nessa população, a probabilidade de se ter um


indivíduo com colesterol abaixo de 250mg/100ml é de
0,7939 (79,39%)
2) Qual a probabilidade de um indivíduo escolhido
aleatoriamente ter colesterol entre 214 e 289?
Níveis de colesterol  distribuição normal com média 214 e
desvio-padrão 44.
 214 − 214 X − µ 289 − 214 
P (214 < X < 289) = P < < 
 44 σ 44 
P ( 214 < X < 289) = P (0 < Z < 1,71)
P(0 < Z ≤ 1,71)

P(0 < Z ≤ 1,71) = P(Z ≤ 1,71) -


b) P(0 < Z ≤ 1,71)

P(0 < Z ≤ 1,71) = P(Z ≤ 1,71) – P(Z ≤ 0)


b) P(0 < Z ≤ 1,71)

P(0 < Z ≤ 1,71) = P(Z ≤ 1,71) – P(Z ≤ 0)


b) P(0 < Z ≤ 1,71)

P(0 < Z ≤ 1,71) = P(Z ≤ 1,71) – P(Z ≤ 0)

= 0,9564 -
b) P(0 < Z ≤ 1,71)

P(0 < Z ≤ 1,71) = P(Z ≤ 1,71) – P(Z ≤ 0)

= 0,9564 - 0,5 = 0,4564

Obs.: P(Z < 0) = P(Z > 0) = 0,5


P (214 < X < 289) = P (0 < Z < 1,71) = 0,4564

A probabilidade de um indivíduo escolhido


aleatoriamente ter colesterol entre 214 e 289 é
de 0,4564 (45,64%)
3) Qual a probabilidade de um indivíduo escolhido
aleatoriamente ter colesterol entre 113 e 152?
Níveis de colesterol  distribuição normal com média 214 e
desvio-padrão 44.

 113 − 214 X − µ 152 − 214 


P (113 < X < 152) = P < < 
 44 σ 44 
P (113 < X < 152) = P (− 2,3 < Z < −1,4 )
P( -2,3 < Z ≤ -1,4)

Pela simetria
P( -2,3 < Z ≤ -1,4) = P(1,4 ≤ Z < 2,3)
P( -2,3 < Z ≤ -1,4)

Pela simetria
P( -2,3 < Z ≤ -1,4) = P(1,4 ≤ Z < 2,3)
= p(Z<2,3) -
P( -2,3 < Z ≤ -1,4)

Pela simetria
P( -2,3 < Z ≤ -1,4) = P(1,4 ≤ Z < 2,3)
= p(Z<2,3) –P(Z<1,4)
P( -2,3 < Z ≤ -1,4)

Pela simetria
P( -2,3 < Z ≤ -1,4) = P(1,4 ≤ Z < 2,3)
= p(Z<2,3) –P(Z<1,4)
= 0,9893
P( -2,3 < Z ≤ -1,4)

Pela simetria
P( -2,3 < Z ≤ -1,4) = P(1,4 ≤ Z < 2,3)
= p(Z<2,3) –P(Z<1,4)
= 0,9893-0,9192=0,07
P (113 < X < 152) = P(− 2,3 < Z < −1,4 ) = 0,07

A probabilidade de um indivíduo escolhido


aleatoriamente ter colesterol entre 113 e 152 é
de 0,07 (7%)
Variável aleatória
discreta Variável aleatória
contínua

Dicotômica que Representa o número


assume dois valores Distribuição em
de ocorrência de
mutuamente exclusivos
(sucesso e fracasso) evento em um período forma de sino
p  probabilidade de de tempo
sucesso

Distribuição
Normal
Distribuição
Um único n Poisson
experimento experimentos

Distribuição Distribuição
Bernoulli Binomial
• Distribuições variáveis aleatórias discretas:
• Uniforme
• Binomial negativa
• Geométrica
• Hipergeométrica
• Distribuições variáveis aleatórias contínuas:
• Exponencial
• Gama
• O uso de distribuições de probabilidade para
descrever padrões biológicos, médicos ou sociais não é
recente

• Quetelet (1835) utilizou as propriedades da


distribuição de Gauss para descrever padrões de altura
de seres humanos

• É importante observar que as distribuições de


probabilidade estão fundamentalmente associadas a
conceitos matemáticos  as conclusões matemáticas
devem mostrar um certo grau de aproximação ou
aderência às observações reais
• Minayo e Sanches (1993) ressaltam que tem
ocorrido um certo abuso na utilização de tais
procedimentos na área de saúde
• O desconhecimento ou não valorização das
limitações dos pressupostos das teorias
estatísticas podem levar:
• extrapolação de suas aplicações
• questionamento dos resultados da análise
• Por isso, é importante uma análise criteriosa
considerando as suposições e adequação dos dados
às distribuições propostas
1. Pagano M, Gauvreau K. Princípios de Bioestatística. 2ª Edição.São
Paulo:Thomson Learning; 2006.

2. Triola MF. Introdução à Estatística. 10ª Edição. Rio de Janeiro: LTC,


2008.

3. Soares JF, Siqueira AL. Introdução à Estatística Médica. 2ª Edição.


Belo Horizonte: COOPMED, 2002.

4. Magalhães MN, Lima ACP. Noções de Probabilidade e Estatística. 3ª


Edição. São Paulo: IME-USP, 2001.

5. Ross S. A First Course in Probability. 4th Ed. New Jersey: Prentice-


Hall, Inc, 1994.

6. Abreu et al. Prevalência e fatores associados ao tabagismo em jovens


de Belo Horizonte. 7th International Conference Urban Health,
Vancouver.
7. Cunha MCM et al. Fatores associados à infecção pelo vírus do dengue
no Município de Belo Horizonte, Estado de Minas Gerais, Brasil:
características individuais e diferenças intra-urbanas. Epidemiol. Serv.
Saúde 2008; 17(3):217-230.
8. Cardoso CC et al. Factors associated with low quality of life in
schizophrenia. Cad. Saúde Pública 2005; 21(5):1338-1348.
9. Oliveira et al. Magnitude, distribuição espacial e tendência da anemia
em pré-escolares da Paraíba. Rev Saúde Pública 2002;36(1):26-32.
10. Minayo MC, Sanches O. Quantitativo-Qualitativo: Oposição ou
Complementaridade? Cad. Saúde Públ. 1993; 9 (3): 239-262.
• Uniforme
• Binomial negativa
• Geométrica
• Hipergeométrica
• X  variável aleatória que atribui a mesma
probabilidade 1/k a cada um dos k valores por ela
assumidos

• Por exemplo:

X Número sorteado em uma rifa com 100 bilhetes


numerados de 1 a 100.
1+ k
P( X = x j ) = 1 / k µ=
2
2
j = 1,2,..., k 2 k −1
σ =
12
• X Número sorteado em uma rifa com 100 bilhetes
numerados de 1 a 100.
• Tenho 5 bilhetes consecutivos numerados de 21 a
25.
• Meu colega tem outros 5 bilhetes com números 1,
11, 29, 68 e 93.
• Quem tem maior possibilidade de ser sorteado?
• Assumindo honestidade da rifa – todos os números
tem a mesma probabilidade de ocorrência

P ( X = x j ) = 1 / 100
• X  variável aleatória resultante de experimentos
independentes, cada um dos experimentos com
probabilidade p de ocorrência de sucesso. Esses
experimentos são repetidos até um total de k
sucessos (k fixado)

• A distribuição de probabilidade de X  número de


experimentos nos quais o k-ésimo sucesso ocorre é:
 x − 1 k k
P( X = x ) =   p (1 − p ) x − k µ=
p
 k − 1 k (1 − p )
2
x = k , k + 1, k + 2... σ =
p2
• X  variável aleatória com distribuição geométrica

k 1− p
P( X = k ) = p (1 − p ) µ=
p
k = 0,1,2... 2 1− p
σ = 2
p

• A distribuição geométrica é um caso particular da


distribuição binomial negativa quando k=1, ou seja, o
experimento requer a ocorrência de apenas 1 sucesso
Uma linha de produção está sendo analisada para efeito de
controle de qualidade das peças produzidas. A produção é
interrompida para regulagem ao se observar uma peça
defeituosa
X Quantidades de peças produzidas
antes da primeira peça defeituosa
tem distribuição geométrica
p=probabilidade de uma peça
ser defeituosa = 0,01

P( X = k ) = 0,01(0,99) k
k = 0,1,2...
Modelo geométrico (p=0,01)
• X  variável aleatória com distribuição hipergeométrica

 m  n − m 
  
k  r − k  K=0,1,...,min(r,m)
P( X = k ) = 
n
 
• Por exemplo: r
Uma fábrica produz peças que são embaladas em caixas
com n unidades. Para aceitar o lote enviado por essa
fábrica, o controle de qualidade de uma empresa age da
seguinte forma:
•Sorteia uma caixa do lote
•Sorteia r peças sem reposições dessa caixa
Seja m o número total de peças defeituosas da caixa
• X  variável aleatória com distribuição hipergeométrica

 m  n − m  K=0,1,...,min(r,m)
  
 k  r − k 
P( X = k ) =
n
 
r
rm
µ=
n
2 r (r − 1)m(m − 1)
σ =
n(n − 1)
• Exponencial
• X  variável aleatória exponencial

−α x
f ( x ) = αe x≥0 µ = 1/ α
2 2
σ = 1/ α
• Por exemplo:

X  Tempo de duração de lâmpadas

X  distribuição exponencial com parâmetro 1/8000


• Probabilidade da lâmpada durar menos que 50 horas
1
50 1 − 8000 x
P(T < 50) = ∫ e dt
0 8000
1 50
1 − x
P(T < 50) = − 8000 e 8000
8000 0

x 50

P(T < 50) = − e 8000

 − 50  − 0 
P(T < 50) = − e 8000 −  − e 8000 
  
50

p (T < 50) = −e 8000
+ 1 = 0,006
• Média de duração das lâmpadas = 8000 horas µ = 1/ α
Autores das distribuições

• Jakob Bernolli – matemático suiço (1654


– 1705)
• Simeon Denis Poisson – matemático e
físico francês (1781 – 1840) 
Distribuição de Poisson publicada em
1838
• Carl Friedrich Gauss – matemático,
astrônomo e físico alemão (1777 – 1855)