Você está na página 1de 16

Notas de Aulas do prof.

João Maurı́cio Araújo Mota da disciplina CC0282- Probabilidade I


ministrada em 2021.1.

1 Distribuição de Bernoulli

1.1 Introdução

Para descrever situações reais que envolvam dados de contagem gerados pelo acaso usam-se
as distribuições de probabilidades discretas. Nessa análise, para efeito de simplificação, é comum a
eliminação de detalhes de pouca importância dos fenômenos reais. Isto origina, como consequência,
que poucos problemas, em suas essências, são geralmente únicos. Por isso, frequentemente um pequeno
número de modelos é suficiente para resolver muitos problemas que, à primeira vista, não parecem
relacionados. Isto, na prática, significa que a grande maioria dos problemas podem ser resolvidos com o
auxı́lio de poucos modelos.

Cada modelo apresenta uma série de pressuposiçôes que devem ser atendidas para que seu uso
possa ser validado.

O ponto-chave para o emprego de um modelo consiste em confrontar as hipóteses básicas do modelo


e as condições da situação real. Se as hipóteses básicas são satisfeitas, pode-se usar o modelo em questão.

Depois do modelo uniforme, o modelo Bernoulli vai ser apresentado com todos os detalhes teóricos
e práticos analisados.

Considere o experimento em que um dado honesto é lançado uma única vez e uma pessoa aposta
que aparecerá um número par. Seja, Ω = {1, 2, 3, 4, 5, 6}, o espaço amostral associado a essa experiência
aleatória . Considere o evento A = {2, 4, 6} o evento de interesse e X a variável aleatória que descreve a
ocorrência ou não do evento A. Assim, os valores possı́veis de X, x, são:


 0 se A não ocorre ;
x=
 1 se A ocorre.

Assim,


 0 se ocorrer face ı́mpar ;
x=
 1 se ocorrer face par.

Vai-se estabelecer algumas pressuposições:

1
1. Só é feita uma única tentativa(repetição) do experimento.

2. Só são possı́veis dois resultados( sucesso=par ou fracasso=ı́mpar)

Considere que a probabilidade da ocorrência do evento A seja p = P (A) e a probabilidade de não


ocorrência seja q = P (Ac ) = 1 − P (A) = 1 − p = q.

Um experimento desse tipo é conhecido na literatura como experimento de Bernoulli e a variável


aleatória discreta indicadora da ocorrência do evento de interesse


 0 se A não ocorre ;
X = IA (ω) = ,
 1 se A ocorre.

é dita possuir distribuição de Bernoulli de parâmetro p que conhecido como probabilidade de


sucesso.

Um pesquisador tem interesse em vários diferentes tipos de situações:

1. Uma semente plantada germina(sucesso) ou não germina(fracasso).

2. Um paciente morre durante uma operação (sucesso) ou não(fracasso).

3. Um coelho apresenta mutação óssea(sucesso) ou não apresenta (fracasso).

4. Um estudante do curso de Estatı́stica da UFC é estagiário(sucesso) ou não(fracasso).

5. Um paciente apresenta câncer de pulmão (sucesso) ou não(fracasso).

6. Um cearense pertence à classe C(sucesso) ou não(fracasso).

7. Uma bola extraı́da de uma urna é vermelha(sucesso) ou não(fracasso).

8. Um relé empregado em circuito elétrico falha (sucesso) ou não(fracasso).

9. Um estudante da Escola Pública passa no vestibular da UFC(sucesso) ou não(fracasso).

10. Um quixadaense ganha mais de mil reais(sucesso) ou não(fracasso).

Como se nota em várias Ciências poderá existir uma situação real onde se possa aplicar a distribuição
de Bernoulli. Um estudo rigoroso dessa distribuição é feito a seguir.

2
1.2 Definição

Uma variável aleatória discreta X é dita possuir distribuição Bernoulli de parâmetro p = 1 − q,


0 ≤ p ≤ 1, se sua função de probabilidade (f p) é da forma:



 q se x = 0

f (x) = px q 1−x I{0,1} (x) = p se x = 1 (1)



 0 para outros valores de x

Notação: X ∼ Ber(p).

Observação: Lê-se a notação acima do seguinte modo: X segue distribuição Bernoulli de parâmetro p.

A Figura 1 apresenta o gráfico da distribuição Bernoulli parâmetro p.

p = 0.10
p = 0.25
0.8 p = 0.15

0.6
f (x)

0.4

0.2

0 0.2 0.4 0.6 0.8 1


x

Figura 1: Gráfico da Função de Probabilidade Bernoulli

1.3 Propriedades da função de probabilidade

Fato 1. A expressão (1) é realmente uma f p.

Prova:

Deve-se verificar que

(i.) f (x) > 0, x ∈ A.

3
X
(ii.) f (x) = 1,
A

sendo A = {x ∈ R|f (x) > 0} o suporte da distribuição de X.

Como A = {0, 1} é o suporte e f (0) = q ≥ 0 e f (1) = p ≥ 0 . Assim f (x) ≥ 0. A segunda


propriedade nos diz que a soma dos valores das probabilidades para os pontos do suporte é 1. Assim
f (0) + f (1) = q + p = 1.

1.4 Função Geradora de Probabilidades

Se X ∼ Ber(p) então ,

G(t) = pt + q. (2)

Prova:

1
X
G(t) = E(tX ) = tx px q 1−x = q + pt = pt + q.
x=0

1.5 Função Geradora de Momentos

Se X ∼ Ber(p) , então

M (t) = pet + q. (3)

Prova:

1
X
M (t) = E(etX ) = etx px q 1−x = q + pet = pet + q.
x=0

1.6 Momentos em relação à origem :

Se X ∼ Ber(p), então

E(X r ) = p, r = 1, 2 . . . . (4)

4
Prova:

1
X
0 r
µr = E(X ) = xr px q 1−x = 0 × q + 1 × p = p.
x=0

1.7 Momentos Centrais :

Se X ∼ Ber(p), então

µr = E [(X − µ)r ] = pq r + (−p)r q, r = 1, 2 . . . . (5)

Prova:

1
X
E [(X − µ)r ] = E [(X − p)r ] = (x − p)r px q 1−x = (−p)r q + (1 − p)r p = (−p)r q + pq r .
x=0

Assim, a variância de X ∼ Ber(p), é dada por:

V ar(X) = µ2 = pq 2 + (−p)2 q = pq(q + p) = pq. (6)

Mostre que a variância da Bernouli no máximo vale 14 , isto é , ocorre quando p = 12 .

Prova: A variância de X é dada por

g(p) = V (X) = pq = p(1 − p) = p − p2 .

A derivada primeira de g(p) é dada por:

g 0 (p) = 1 − 2p.

A derivada segunda de g(p) é dada por:

00
g (p) = −2 < 0.

Assim de g 0 (p) = 0 temos 1 − 2p = 0 e

5
1
p=
2
é ponto de máximo relativo.

Logo

g(p) ≤ g(1/2) = 1/4.

1
pq ≤ .
4

1 p+q √
= ≥ pq,
2 2

pois a média aritmética é sempre mais ou igual a média geométrica , assim elevando-se ao quadrado
a desigualdade tem-se que:

1
pq ≤ .
4

O terceiro momento central de X ∼ Ber(p)

µ3 = pq 3 + (−p)3 q = pq(q 2 − p2 ) = pq(q − p)(q + p) = pq(q − p) = pq(1 − 2p). (7)

O quarto momento central de X ∼ Ber(p)

µ4 = pq(q 3 + p3 ) = pq(1 − 3pq) = pq − 3p2 q 2 = 3p2 q 2 − 6p2 q 2 + pq = 3p2 q 2 + pq(1 − 6pq), (8)

pois
1 = (p + q)3 = p3 + q 3 + 3p2 q + 3pq 2 = p3 + q 3 + 3pq(p + q) = p3 + q 3 + 3pq.

e assim

p3 + q 3 = 1 − 3pq.

6
1.8 Coeficiente de Assimetria

O coeficiente de assimetria de X ∼ Ber(p)

q−p 1 − 2p
α3 = √ =p . (9)
pq p(1 − p)

Prova:
3
E (X − µ) µ3 pq(q − p) q−p 1 − 2p
α3 = = 3/2 = = √ =p .
σ3 µ2 (pq) 3/2 pq p(1 − p)

Assim pode-se classificar a distribuição de Bernoulli quanto à assimetria como: Se p < 1/2 a
distribuição é assimétrica positiva, se p > 1/2 a distribuição é assimétrica negativa . Se p = 1/2 então
α3 = 0 e nada se pode afirmar sobre a simetria da distribuição usando esse coeficiente. Vai-se usar a
definição para provar que X ∼ Ber(1/2) é simétrica em torno do ponto c = 1/2.

Prova: Deve-se provar que f (1/2 + x) = f (1/2 − x), ∀ x

Se x 6= 1/2 então f (1/2 + x) = f (1/2 − x) = 0 e para x = 1/2 tem-se f (1/2 + 1/2) = f (1) = 1/2
e f (1/2 − 1/2) = f (0) = 1/2 e portanto f (1/2 + 1/2) = f (1/2 − 1/2). Logo

f (1/2 + x) = f (1/2 − x), ∀ x.

1.9 Coeficiente de Curtose

O coeficiente de curtose de X ∼ Ber(p)

1 − 6pq
α4 = 3 + . (10)
pq

Prova:
µ4 3p2 q 2 + pq(1 − 6pq) 1 − 6pq
α4 = 2 = 2
=3+ .
µ2 (pq) pq

Como

Assim pode-se classificar a distribuição de Bernoulli quanto à curtose como:

7
1
platicúrtica se pq > .
6

1
mesocúrtica se pq = .
6 .

1
leptocúrtica se pq <
6
Prova:

Como
1 − 6pq
α4 − 3 = ,
pq

tem-se que :

1
Se pq < , α4 > 3.
6

1
Se pq = , α4 = 3.
6

1
Se pq > , α4 < 3.
6

1.10 Momentos Fatoriais :

Se X ∼ Ber(p), então


  p se r = 1
E X[r] = (11)
 0 se r = 2, 3, . . .

Prova:

Como E X[1] = E(X) = p. Para r = 2, 3, . . . tem-se;


E X[r] = E [X(X − 1) . . . (X − r + 1)] = 0,

pois a expressão se anula para x = 0, 1.

8
1.11 Função de Distribuição

A função de distribuição de X ∼ Ber(p)

F (x) = qI[ 0, 1)
(x) + I[ 1, ∞) (x). (12)

0.8

0.6
F (x)

0.4

0.2
p = 0.5
0
−1 0 1 2
x

Figura 2: Gráfico da Função de Distribuição Bernoulli

1.12 Função de Sobrevivência

A função de distribuição de X ∼ Ber(p)

S(x) = I(− ∞, 0) (x) + pI[ 0, 1)


(x). (13)

9
1
p = 0.5

0.8

0.6

S(x) 0.4

0.2

0
−0.5 0 0.5 1 1.5 2
x

Figura 3: Gráfico da Função de Sobrevivência Bernoulli

1.13 Mediana

A mediana da distribuição de X ∼ Ber(p)


 0 se p ≤ 1/2
med = (14)
 1 se p > 1/2

Prova:

Se p ≤ 1/2, tem-se q ≥ 1/2 então FX (0) = q ≥ 1/2 , logo a mediana é x = 0. Por outro se q < 1/2
tem-se p > 1/2 e como FX (0) = q < 1/2 e FX (1) = 1 ≥ 1/2. Logo a mediana vale 1.

1.14 Moda

A moda da distribuição de X ∼ Ber(p)




 0 se p < 1/2

moda = 1 se p > 1/2 (15)



 0, 1 se p = 1/2 bimodal

10
1.15 Coeficiente de Variação

O coeficiente de variação de X ∼ Ber(p)

r
σ q
CV = = . (16)
µ p

Prova: √
pq
r
σ q
CV = = = .
µ p p

2 Complementar

2.1 Estimação do parâmetro p

Seja X1 , X2 , . . . , Xn uma amostra aleatória de X ∼ Ber(p). O número total de sucessos da amostra,


Xn
S= Xi , é usado para se estimar p. Assim a frequência amostral de sucessos é usada como estimador
i=1
de p. Ele é definido por:

n
X
Xi
S i=1
p̂ = = (17)
n n
pq
Pode-se demonstrar que E(p̂) = p e V ar(p̂) = . Além disso S tem uma distribuição binomial
n
de parâmetros n e p.

2.2 Simulação

Do ponto de vista teórico a simulaçao é bastante simples. Considere U ∼ U nif (A), A = [0, 1] e seja
X = I[0,p] (U ), Assim:

P (X = 1) = P (U ≤ p) = F (p) = p.

Para gerar uma amostra de tamanho n de X ∼ Ber(p) , basta pegar U1 , U2 , . . . , Un de U ∼


U nif (A) e fazer Xi = I[0,p] (Ui ). Desta maneira

X1 , X2 , . . . , Xn é a nossa amostra aleatória de tamanho n de X ∼ Ber(p).

11
Vai-se discutir agora a simulação de uma amostra aleatória de tamanho n de X ∼ Be(p) usando
o pacote estatı́stico R. Como exemplo, vai-se simular uma amostra de tamanho 25 de X ∼ Be(p = 0.4)
Isto é feito através dos comandos:

1. Amostra=rbinom(n=25,1,0.4). Simula a amostra.

2.table(Amostra). Tabela de frequências absolutas da amostra.

3.mean(Amostra)-Estimativa da probabilidade de sucesso.

4.var(Amostra)- Variância amostral.

> Amostra=rbinom(25,1,0.4)
> Amostra
[1] 0 1 1 0 1 0 0 1 0 1 1 1 0 1 1 1 0 0 0 1 1 1 1 1 0
>
> table(Amostra)
Amostra
0 1
10 15
> mean(Amostra)
[1] 0.6
> var(Amostra)
[1] 0.25

3 Exercı́cios

3.1 Exercı́cios Resolvidos

1. Seja X ∼ Ber(0, 3). Calcule usando o R:

a P (X = 0) e P (X = 1)

> dbinom(0,1,0.3)###P(X=0)
[1] 0.7
> dbinom(1,1,0.3)###P(X=1)
[1] 0.3
>

12
b. Qual a função de distribuição de X?

> x=0:1;x
[1] 0 1
> fx=dbinom(x,1,0.3)##funç~
ao de probabilidade de X
> Fx=pbinom(x,1,0.3);Fx##Funç~
ao de distribuiç~
ao de X
[1] 0.7 1.0
>
> tab=cbind(x,fx,Fx);tab
x fx Fx
[1,] 0 0.7 0.7
[2,] 1 0.3 1.0
>

c. Qual a média e a variância de X?

> q=dbinom(0,1,0.3)###P(X=0)
>
> p=dbinom(1,1,0.3)###P(X=0)
>
> EX=p;EX
[1] 0.3
> VarX=p*q;VarX
[1] 0.21
>

• Faça o gráfico da função de probabilidade de X.

13
3.2 Exercı́cios propostos

1. Seja Y a variável indicadora da ocorrência de um fracasso

e X a variável indicadora da ocorrência de um sucesso. Sabendo que P (F ) = q e P (S) = p e


p + q = 1.

a. Qual a distribuição de Y ? e a de X?

b. Mostre que Y = 1 − X.

c. Mostre que E(Y ) = 1 − E(X)e V ar(Y ) = V ar(X).

2. Para que valor de p,X ∼ Ber(p), tem variância máxima. Que outro nome recebe essa distribuição?

3. Se X ∼ Ber(p) então E(X) ≥ V (X).

4. Usando a função geradora de probabilidades de X ∼ Ber(p), calcule:

a. O valor esperado de X;

b. O segundo momento fatorial

c. A variância.

5. Usando a função geradora de momentos de X ∼ Ber(p), calcule:

a. O valor esperado de X;

b. O segundo momento fatorial

c. A variância.

6. Seja X ∼ Ber(p). Mostre que a função geradora de cumulantes de X, K(t), é dada por K(t) =
ln (q + pt). Obtenha o valor esperado e a variância de X usando K(t).

7. Seja Y uma variável aleatória discreta com suporte A = {a, b} com a < b.

Y −a
a. Identifique a distribuição de X = .
b−a
b. Mostre que a ≤ E(Y ) ≤ b.
(b − a)2
c. Mostre que var(Y ) ≤ .
4

8. Usando a função caracteristica de X ∼ Ber(p), calcule:

a. O valor esperado de X;

b. O segundo momento fatorial

c. A variância.

14
9. A transformada de Laplace de uma variável aleatória X é definida como: L(t) = E(e−tX ). Calcule
a transformada de Laplace de X ∼ Ber(p).

10. Sejam X ∼ Ber(p1 ) e Y ∼ Ber(p2 ) . Supondo independência entre X e Y , calcule a função geradora
de probabilidades , a função geradora de momentos e a função caracteristica de:

a. S = X + Y.

b. D = X − Y.

11. Numa criação de coelhos, a taxa de nascimento de machos é de 40%. Considere como sucesso o
nascimento de uma fêmea. Seja Y a variável indicadora do nascimento de uma fêmea. Responda:

a. Qual a distribuição de Y ? Apresente um gráfico da função de probabilidade , da função de


distribuição e da função de sobrevivência de Y .

b. Qual a média e a variância de Y?

c. Em um determinado dia nasceram 20 coelhos dos 10 são machos? estime a taxa de nascimento
de fêmeas.

12. Num rebanho bovino 30% dos animais estão atacados de febre aftosa. Seja X a variável indicadora
da presença de febre aftosa em um animal.

a. Verifique se X pode ser estudada pelo modelo de Bernoulli.

b. Classique a distribuição de X quanto à assimetria e a curtose.

c. Qual a função geradora de cumulantes de X?

13. Para participar de um experimento para verificar se a dieta de engorda A é melhor que um a
dieta de engorda B pares de animais com caracteristicas semelhantes são formados. Em um par de
animais dizemos que há um sucesso se o ganho de peso com a dieta A é maior do que com a dieta
B. Um sorteio aleatório é feito em cada par para se saber quem recebe a dieta A. Seja X a variável
indicadora da ocorrência de um ganho de peso maior da dieta A.

a. Verifique se X pode ser estudada pelo modelo de Bernoulli na hipótese que não há diferenças
reais nos ganhos de peso das duas dietas .

b. Classique a distribuição de X quanto à assimetria e a curtose.

c. Na hipótese que a probabilidade de sucesso seja p, desconhecido, estime p sabendo que em um


lote de 24 animais ( 12 pares) em 4 deles o ganho de peso com a dieta B foi maior?

14. Simule uma amostra aleatória de 100 observações de X ∼ Ber(0.7). Use seu número de matrı́cula
como semente.

15
a. Apresente o resultado em termos de uma matriz 10x10.

b. Forneça a distribuição de frequência.

c. Calcule: média, variância, assimetria e curtose.

d. Faça um teste de ajuste. Use α = 1%

e. Comente sobre a simulação.

f. Separe as observações do item a em 20 grupos de 5 observações. Seja Y a soma obtida em cada


grupo. Dê a distribuição amostral de Y , sua média e variância. Você obteve uma amostra
aleatória de tamanho 20 de qual distribuição?

15. Suponha que uma sequência de n ensaios de Bernoulli, a probabilidade de sucesso p de cada repetição
é desconhecida. Deseja-se fazer o seguinte teste de hipóteses:

H0 : p = p0 ,
H1 : p 6= p0 .

Seja X̄n a proporção de sucessos na amostra de tamanho n e vamos usar o teste de qui-quadrado
de aderência para testar as hipóteses. :

a. Mostre que a estatı́stica Q pode ser escrita na forma:

n(X̄n − p0 )2
Q= .
p0 (1 − p0 )

b. Suponha H0 verdade, prove que n −→ ∞ a função densidade de Q converge para a densidade


da qui-quadrado com um grau de liberdade.

16

Você também pode gostar