Aula 3 - Distribuições de Probabilidade

Você também pode gostar

Você está na página 1de 8

20/05/2021

 Variável aleatória categórica (discreta)


▪ Categorias nominais ou ordinais
▪ Exemplo:
José C. F. Pantoja ▪ Paridade, escores clínicos

 Variável aleatória contínua


▪ Resultado podem ser qualquer um dentro de um
intervalo ou sequência
▪ Exemplo:
▪ Peso
▪ Produção de leite

1 2

 Toda variável aleatória possui uma  Distribuição de probabilidades para a variável


distribuição de probabilidades paridade (X)
125
 P (X = 1) = 205 = 0,61
 Variável aleatória categórica: 100 N = 205 vacas 40
80  P (X = 2) = 205 = 0,20
▪ Todos os resultados possíveis e as respectivas
60
probabilidades de cada um ocorrer % 40

19
P (X = 3) = 205 = 0,09
20
 Variável aleatória contínua: 0 
21
P (X = >3) = 205 = 0,10
1 2 3 >3
▪ Probabilidade de valores ocorrerem em certos Paridade (X)  P(1) + P(2) + P(3)+ P(>3) = 1
intervalos

3 4

 Experimento binomial  Considere a variável aleatória “albinismo” (A)


▪ A ~ b(n , p) → n = 1, p = 0,08
▪ X = Número total de eventos em N tentativas
▪ Somente 2 resultados possíveis
 Condições: ▪ Sim =1 ou não = 0 (mutuamente exclusivos)

▪ Sequência de N experimentos de Bernoulli  População do estudo (n = 813 animais)


▪ mutuamente exclusivos (não acontecem ao mesmo tempo) 68
▪ Resultados de cada experimento são independentes  P (A = 1) = P = = 0,08 Distribuição de
813 Probabilidade
▪ A probabilidade de sucesso P é constante para cada 745 1 0,92
experimento  P (A = 0) = (1 - P) = = 0,92
813
P 0,5
0,08
 X ~ b(n , p)  P(A = 1) + P(A = 0) = 1 0
▪ Distribuição com 2 parâmetros: “n” e “p” P(A = 0) P(A = 1)

5 6

1
20/05/2021

 Considere a variável aleatória X (doença X)  Considere a variável aleatória “albinismo” (A)


▪ X ~ b(n , p) → n = 1, p = 0,08 ▪ A = número de ratos albinos para cada 2 ratos (n =
2) selecionados aleatoriamente da população
𝑛!
 P (X = x ) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥! 𝑛−𝑥 ! ▪ Resultados possíveis
Resultado de A
são: Número de
1! 0 1−0 1° rato 2° rato
 P (X = 0) = 0,08 (0,92) = 0,92 ▪ 0 = nenhum rato é albino ratos albinos
0! 1−0 !
0 0 0
▪ 1 = um rato é albino
1! 1 1−1 ▪ 2 = os dois ratos são 1 0 1
 P (X = 1) = 0,08 (0,92) = 0,08
1! 1−1 ! albinos 0 1 1

 P(X = 1) + P(X = 0) = 1 ▪ P (A) é independente 1 1 2


entre ratos

7 8

 Variável aleatória “albinismo” (A)


 Exemplo anterior usando a fórmula binomial: ▪ A = número de ratos albinos para cada 2 ratos
selecionadas aleatoriamente da população
𝑛!
▪ P (X = x) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 Distribuição de Probabilidade
𝑥! 𝑛−𝑥 !
0,9 0,85
0,8
2!
▪ P (X = 0) = 0,080 (0,92)2−0 = 0,922 = 0,85 0,7
0! 2−0 ! 0,6
0,5
P 0,4
2!
▪ P (X = 1) = 0,081 (0,92)2−1 = 0,15 0,3
1! 2−1 ! 0,2 0,14
0,1 0,06
2! 0
▪ P (X = 2) = 0,082 (0,92)2−2 = 0,0064 P(A = 0) P(A = 1) P(A = 2)
2! 2−2 !

9 10

 Número de vacas com mastite  Número de vacas com mastite


▪ 10% das vacas tinham mastite → P(M) = 0.10 ▪ 50% das vacas tinham mastite → P(M) = 0.5

▪ Amostra de 10 vacas (n = 10) ▪ Amostra de 10 vacas


▪ Probabilidade de 1 vaca ter mastite? ▪ Probabilidade de 1 vaca ter mastite?
▪ X ~ Binomial(n = 10, p = 0,10) ▪ X ~ Binomial(n = 10, p = 0,5)
10! ▪ P (X = 0) = 0,000
▪ P (X = 1) = 0,101(0,90)9= 0,39
1! 9 ! ▪ P (X = 1) = 0,01
▪ P (X = 2) = 0,19 ▪ P (X = 2) = 0,04
▪ P (X = 3) = 0,06 .
. .
. .
▪ P (X = 10) = 0,00... ▪ P (X = 10) = 0,000

11 12

2
20/05/2021

 Distribuição cumulativa
 X ~ Binomial  X ~ Binomial  X ~ Binomial
 (n = 10, p = 0,1)  (n = 10, p = 0,5)  (n = 10, p = 0,7) ▪ P (X ≤ x ) = σ 𝑛
𝑥=0 𝑏 (𝑥; 𝑛, 𝑝) x = 0,1, … . n

 X = P (mastite) ~ b (n = 10 , p = 0,5)

 Probabilidade de que 2 ou menos vacas tenham


mastite
▪ P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)
▪ P(X ≤ 2) = 0,001 + 0,01 + 0,05 = 0,052

13 14

 X = P (mastite) ~ b (n = 10 , p = 0,5)  Média (esperança) de X

 𝜇𝑥 = σ 𝑥 𝑃 𝑥
 Probabilidade de que mais que 1 vaca tenha
mastite  Para um experimento binomial:
▪ P(X ≥ 1) = 1 - P(X ≤ 0) ▪ 𝜇𝑥 = 𝑁𝑃

▪ P(X ≥ 1) = 1 – 0,001 = 0,999  Quando N = 1 (Bernoulli):


▪ 𝜇𝑥 = 𝑃
▪ Média do número de vacas com mastite em um experimento = P (M)

15 16

 Variância e Desvio Padrão de X:  Experimento de Poisson


▪ X = Número total de eventos em um intervalo de tempo ou
▪ V (X) = N x P x (1-P) = NPQ
espaço
▪ σ2 (X) = 𝑁𝑃𝑄
 Condições:
1. A probabilidade de em evento ocorrer em um intervalo é
proporcional ao tamanho do intervalo
 Quando N = 1 (Bernoulli) 2. Dentro de um intervalo, é possível que o número de
▪ V (X) = P (1-P) eventos seja infinito
▪ σ (X) = 𝑃 (1 − 𝑃) 3. Os eventos são independentes
▪ Dentro do mesmo intervalo
▪ Entre intervalos diferentes
 Exemplo prático no final da apresentação  X ~ Poisson(α)
▪ Distribuição com parâmetro “𝜆”

17 18

3
20/05/2021

 Considere a variável X  Casos de cinomose por semana (população 1000 cães)


▪ λ = 4 casos/1000 cães/semana
▪ Número de eventos em um intervalo de tempo
▪ X é uma contagem 𝑒 −λ λ𝑥
▪ P (X = x) =
𝒙!
▪ número inteiro que pode variar entre 0 e ∞
𝑒 −4 45
▪ P (X = 5) = = 0,16
5!
𝑒 −λ λ𝑥
▪ P (X = x ) = 𝑒 −4 40
𝒙!
▪ P (X = 0) = = 0,02
0!

▪ λ é uma constante representando a taxa de ocorrência


de um evento em um certo intervalo ▪ λ é uma constante representando a taxa de ocorrência de
▪ e é uma constante = 2,72 (base do logaritmo natural) cinomose por semana
Fonte: MI-DVHSP-FMVZ-UNESP/Botucatu

19 20

 Taxa de cinomose por semana


▪ Média de 2 casos/1000 cães/semana → λ = 2  X ~ Poisson  X ~ Poisson  X ~ Poisson
▪ (λ = 2) ▪ (λ = 5) ▪ (λ = 8)
▪ Probabilidade de 1 caso/1000
cães/semana?
▪ X ~ Poisson(λ = 2)
▪ P (X = 0) = 0,13
▪ P (X = 1) = 0,27
▪ P (X = 2) = 0,27

21 22

 Para uma variável binomial:


▪ 𝜇𝑥 = NP  Em certas circunstâncias
▪ V (𝑥 ) = N P (1-P) ▪ Resultados de uma variável aleatória não são
 Quando P é muito pequeno: limitados a números inteiros ou contagens
▪ (1-P) → 1 ▪ Exemplo: Peso → 501.4 kg → 501.45746 kg
▪ N P (1-P) → NP
▪ Média e variância se tornam quase idênticas  Densidade de probabilidade
▪ Podem ser representadas por um único parâmetro λ
▪ Número de valores possíveis de X → ∞
 Quando há eventos raros, Poisson é uma boa ▪ Largura dos intervalos → 0
alternativa para modelar os dados
▪ 𝜇𝑥 = V(X) = λ ▪ Curva se torna contínua

23 24

4
20/05/2021

 Área em baixo da curva = 1  Distribuição Gaussiana


 P (X = valor específico) = 0 1 1 𝑥−µ 2
 P (X em um intervalo) pode ser calculada  𝑓 𝑥 = 2𝜋𝜎
𝑒 −2 ( σ
)

▪ Área em baixo da curva entre 2 valores

25 26

 Muitas variáveis biológicas possuem  X = pressão sanguínea


distribuição normal
 Para um animal:
 X = pressão sanguínea ▪ P ( 90 ≤ X ≤ 100)?
▪ P (X > 90) - P (X > 100)
 Para um animal:
▪ P (X < 90)?  Usar tabela ou software
▪ P (X > 90)?
▪ P (X = 90) = não existe!  Variável padronizada

27 28

 Distribuição Normal Padrão


▪ Área = 1
▪ Média (𝜇) = 0 68%
▪ Desvio padrão (𝜎) = 1 95%
▪ 68% das observações
estão entre ± 1 𝜎 da -3 -2 -1 0 1 2 3
média
Z
▪ 95% das observações
estão entre ± 2 𝜎 da
média

29 30

5
20/05/2021

 Distribuição Normal Padrão  Distribuição Normal Padrão


Z Área à direita ▪ Qual o valor de Z que separa os
0,00 0,50
10% mais altos?
1,65 0,05
1,96 0,025 ▪ P(Z > z) = 0,10?
- - - -
2,58 0,001

▪ Simétrica → P (Z > 1) = P(Z < - 1) ▪ Usar a tabela do livro


▪ Qual é a P (-1 < Z < 1)? → usar a tabela do livro ▪ P(Z > z) = 0,10 → Z = 1,28
▪ P (Z > 1 ) + P (Z < -1 ) → mutuamente exclusivos ▪ 10% da área da curva está à direita de 1,28
▪ P (Z > 1 ) + P (Z < -1 ) = 0,159 + 0,159 = 0,318 ▪ 10% da área da curva está à esquerda de -1,28
▪ P (-1 < Z < 1) = 1 – 0,318 = 0,68

31 32

 Como padronizar uma variável com distribuição normal?  Variável aleatória X (altura) ~ Normal(𝜇 , 𝜎)
 Variável aleatória X ~ Normal(𝜇 , 𝜎)
▪ X ~ Normal(63,9 ; 2,6)
▪ Altura ~ Normal(63,9 ; 2,6)

𝑋−𝜇 𝑋 −63,9 𝑋−𝜇 𝑋 −63,9


Z= 𝜎
Z= 2,6
Z= 𝜎
Z= 2,6

 P(Altura ≥ 60) → X = 60
60 −63,9
▪ Z= = −1,50
2,6
▪ Tabela
▪ P(Z > 1,50) = 0,067
▪ 1 – 0,067 = 0,93

33 34

 Altura (X) ~ Normal(63,9 ; 2,6)  Altura (X) ~ Normal(63,9 ; 2,6)


𝑋−𝜇 𝑋 −63,9 𝑋−𝜇 𝑋 −63,9
Z= Z= Z= Z=
𝜎 2,6 𝜎 2,6
 P(60 ≤ X ≤ 68)  Qual é o 95º percentil (5% mais altos)?
60 −63,9
▪ X = 60 → Z = = −1,50 ▪ Tabela → área = 0,05 (5%)
2.6
68 −63,9 ▪ Z = 1,64
▪ X = 68 → Z = 2,6 = 1,58
𝑋 − 63,9
▪ Z=
▪ P(Z < -1,50) = 0,067 2,6
- - 𝑋 − 63,9
▪ P(Z > 1,58) = 0,057 ▪ 1,64 = 2,6 → X = 68,2 - -

▪ P(60 ≤ X ≤ 68) = 1 – (0,067 + 0,057) = 0,87 ▪ 5% dos animais são > 68,2 cm

35 36

6
20/05/2021

 Objetivo = P (contrair brucelose se  Amostra de 5 pessoas picadas


picado por uma agulha de
vacinação)  P (2 pessoas contrairem)
𝑛!
▪ P (X = 2 ) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
 Variável X (1 = doente, 0 = não 𝑥! 𝑛−𝑥 !

doente após picada)


 P (doente após picada) = 0,3 (30%)  P (pelo menos 3 contrairem)
▪ P (X ≥ 3 ) = P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )
 X ~ binomial (n, p)
▪ Cada experimento é binário (contrai a  P (máximo 1 pessoa contrair)
doença ou não)
▪ P (X ≤ 1 ) = P ( X = 0 ) + P ( X = 1 )
▪ Observações independentes
▪ Probabilidade de doença constante
(0,3)

37 38

 Para amostra de 5 pessoas  Objetivo = P (casos de tétano por


picadas ano)

 Variável X (número de casos por


 Média de pessoas doentes ano em Botucatu)
após a picada
▪ 𝜇𝑋 = 𝑛𝑝 = 5 0,3 = 1,5  Taxa anual (𝜆) = 2,5
▪ 𝑉𝑋 = 𝑛𝑝 1 − 𝑝 = 5 0,3 0,7 = 1,05  X ~ Poisson (𝜆 = 2,5)
▪ X entre 0 e ∞
▪ 𝜎𝑋 = 𝑛𝑝 1 − 𝑝 = 1,03
▪ Observações independentes
▪ 𝜆 proporcional ao intervalo

39 40

 P (x casos por ano)  Média do número de casos por


𝑒 −λ λ𝑥 𝑒 −2,5 2,5𝑥
▪ P (X = x) =
𝒙!
= 𝒙! ano
▪ 𝜇𝑋 = 𝑉𝑋 = 𝜆 = 2.5
 P (4 ou mais casos por ano) ▪ 𝜎𝑋 = 𝜆 = 1.58
▪ P (X ≥ 4) = 1 - P (X < 4) = 0,24

 P (6 ou mais casos por ano)


▪ P (X ≥ 6) = 1 - P (X < 6) =

41 42

7
20/05/2021

 Objetivo = Produção média de leite  Variável X (média leite lactação)


em gado holandês ▪ X ~ Nornal (μ = 10629, 𝜎 = 5200)

 Variável X = média leite na lactação  Transformar X em variável normal


padrão (Z)
 Média = 10.629,00 kg 𝑋−𝜇 𝑋 −10629
▪𝑍= =
𝜎 5200

 Desvio padrão = 5.200,00 kg


 Usar tabelas para calcular
probabilidades
 X ~ Normal (μ = 10629, 𝜎 = 5200) ▪ P (9500 < X < 11500)?

43 44

 P (9500 < X < 11500)?


▪ X ~ Nornal (μ = 10629, 𝜎 = 5200)

 Para X = 9500:
9500 −10629
▪ 𝑍= = −0.21
5200

 Para X = 11500:
11500 −10629
▪ 𝑍= = 0.17
5200

 P (9500 < X < 11500) = P (-0.21 < Z < 0.17)


 1 – [ P(Z < -0.21) + P(Z > 0.17) ]

45

Você também pode gostar