Você está na página 1de 25

João Maurı́cio A.

Mota 1

Material didático preparado pelo professor Maurı́cio Mota para a disciplina CC0282-
Probabilidade I ministrada no semestre 2021.1.

1 Distribuição Hipergeométrica
1.1 Introdução.
Considere uma população com N elementos dos quais A têm uma caracterı́stica
(categoria 1) e B = N − A não têm esta caracterı́stica (categoria 2).
Uma amostra aleatória de tamanho n sem reposição é retirada . Seja:

X= número de elementos da categoria 1 na amostra.

A distribuição de probabilidade X é dada por:


A
 N −A
x n−x
P (X = x) = N
 IC (x), (1)
n

onde C = {li, . . . , ls} e li = max(0, n + A − N ) e ls = min(n, A).

Como
0≤x≤A
e

0≤n−x≤N −A
.
A segunda desigualdade fica A + n − N ≤ x ≤ n. Logo

A + n − N ≤ x ≤ n.
Comparando as duas desigualdades:

li = max(0, A + n − N ) ≤ x ≤ min(A, n) = ls.


Esta distribuição é conhecida na literatura como distribuição Hipergeométrica de
parâmetros N , A e n.
A
A proporção de elementos da categoria 1 na população é p = e a proporção de
N
N −A
elementos da categoria 2 na população é q = .
N
Se a amostra é retirada com reposição X tem distribuição Binomial de parâmetros n
A
ep= .
N

1.2 Origem
O binômio de Newton nos diz que:
n  
n
X n
(a + b) = ai bn−i ,
i=0
i

DEMA - UFC
João Maurı́cio A. Mota 2

a e b reais e n inteiro positivo.


Usando o binômio de Newton prove a fórmula de Lagrange , isto é,
n  2  
X n 2n
= .
i=0
i n
Prova:
Sabemos que
n
X n
X 2n
X
i j
ai x bj x = ck x k
i=0 j=0 k=0

onde
k
X
ck = al bk−l .
l=0

Partindo de
(x + 1)n . (x + 1)n = (x + 1)2n
temos:
n   n  
n
X n i n
X n
(x + 1) = x e (x + 1) = xj
i=0
i j=0
j
E assim,
n   n   n X n    
n n
X n i
X n j
X n n i+j
(x + 1) .(x + 1) = x x = x .
i=0
i j=0
j i=0 j=0
i j

Fazendo i + j = k temos que j = k − i e assim o coeficiente de xk é dado por:


n   
X n n
.
i=0
i k−i
Por outro lado
2n  
2n
X 2n
(x + 1) = xk ,
k=0
k
e assim o coeficiente de xk é dado por:
 
2n
k

Igualando os coeficientes de xk temos:


n     
X n n 2n
= .
i=0
i k−i k
Fazendo k = n temos:
n    X n    n  2  
X n n n n X n 2n
= = = .
i=0
i n − i i=0
i i i=0
i n

DEMA - UFC
João Maurı́cio A. Mota 3

Agora vamos provar fórmula de EULER, isto é,


ls     
X a b a+b
=
i=li
i n−i n
, em que li = max(0, n − b) e ls = min(a, n), a, b e n inteiros não negativos.
Partindo de
(x + 1)a . (x + 1)b = (x + 1)a+b
Sabemos que
a   b  
a
X a i b
X b
(x + 1) = x e (x + 1) = xi
i=0
i j=0
j

Logo,
a   b   a+b
a b
X a i
X b i
X
(x + 1) (x + 1) = x x = ck x k ,
i=0
i j=0
j k=0

onde
   
a b
ai = e bj = ,
i j
e
k n    
X X a b
ck = al bk−l = .
l=0 l=0
l k − l
Mas,
a+b  
a+b
X a+b
(x + 1) = xk ,
k=0
k
e igualando os coeficientes adequados temos:
ls      
X a b a+b
= .
li
l k−l k
Fazendo k = n temos:
ls      
X a b a+b
= .
li
l n−l n
Vamos estudar os limites do somatório:
Sabemos
0≤i≤a
e

0≤j =k−i≤b
que fica

DEMA - UFC
João Maurı́cio A. Mota 4

k−b≤i≤k
e juntando as duas desigualdades temos

li = max(0, k − b) ≤ i ≤ min(a, k) = ls.


Note que a fórmula de Lagrange é um caso particular da fórmula de EULER. Uma

maneira alternativa e elegante de provar a fórmula de EULER é:


Suponha que em uma sala existem a meninas e b meninos. Uma amostra aleatória
sem reposição de n crianças é retirada. De quantas maneiras distintas podemos fazer esta
tarefa?
Na população existem (a + b) crianças e vou retirar n sem reposição. Isto pode ser
feito de:
 
a+b
.
n
Note que na nossa amostra o número de meninas é menor ou igual a min(a, n) e maior
ou igual a max(0, n − b).
Assim o somatório das possibilidades de aparecer qualquer número de meninas na
amostra nos dará o número de amostras possı́veis:
X a  b 
.
i n−i
Logo,
ls      
X a b a+b
= .
li
l n − l n

1.3 Propriedades da função de probabilidade


Fato 2. A expressão (1) é realmente uma função de probabilidade.
Prova: deve-se verificar que

i. f (x) > 0, x ∈ C.; e


X
ii. f (x) = 1,
C

sendo C = {x ∈ R|f (x) > 0} o suporte da distribuição de X. Como C = {Li, Li +


1, . . . , Ls} tem-se f (x) > 0 para qualquer ponto do suporte .
A segunda propriedade nos diz que a soma dos valores das probabilidades para os
pontos do suporte é 1. Assim
ls ls A
 N −A
X X x n−x
f (x) = N
 =1 
x=li x=li n

DEMA - UFC
João Maurı́cio A. Mota 5

ls ls A N −A
 
X X x n−x
f (x) = N

x=li x=li n
ls    
X 1 A N −A
= N
n x=li
x n−x
 
1 N
= N
n
n
= 1,

usando a fórmula de Euler.

2 Momentos Fatoriais da Hipergeométrica .


O r-ésimo momento fatorial de X é dado por:
A
 n
n!A!(N − r)! r
µ[r] = = r! N
r
(n − r)!(A − r)!N ! r

Prova:
O r-ésimo momento fatorial é dado por:
n
X
E(X[r] ) = x[r] P (X = x)
x=r
n A N −A
 
X x n−x
= x[r] N

x=r n

mas,

x[r] (x − r)!
 
A A! A! x! A!
x[r] = x[r] = = ,
x x!(A − x)! (x − r)! x!(A − x)! (x − r)! x!(A − x)!
cancelando o x! temos:
 
A A!
x[r] = ,
x (x − r)!(A − x)!
como
x − r + A − x = A − r,
temos
 
A A!(A − r)! A! (A − r)!r!
x[r] = = ,
x (x − r)!(A − x)!(A − r)! r!(A − r)! (A − x)!(x − r)!
      
A A (A − r)! A A−r
x[r] = r! = r! ,
x r (A − x)!(x − r)! r r−x

DEMA - UFC
João Maurı́cio A. Mota 6

por outro lado,


assim,

n N −A A
 
X n−x x
E(X[r] ) = x[r] N

x=r n
n   N −A
X A n−x
= x[r] N

x=r
x n
n   
1 X A N −A
= N
x[r]
n−x

n x=r
x

vamos substituir

n     
1 X A A−r N −A
E(X[r] ) = N  r!
n x=r
r r−x n−x
n
r! Ar X A − r
    
N −A
= N
r−x n−x

n x=r

Fazendo a mudança y=x − r temos:

 n−r
A X    
r! r A−r N −A
E(X[r] ) = N
n−r−y

n y=0
y
r! Ar N − r
  
= N
n−r

 n
A (N − r)! n!(N − n)!
=
r (n − r)!(N − n)! N!
 
A r!(N − r)! n!r!
=
r N! (n − r)!r!
   
A 1 n
= r! N

r r
A
 nr 
r
= r! N
r
r

O primeiro momento fatorial é igual ao valor da esperança de X


A
 n
1 A
E(X) = 1! N
1 = n = np.
1
N
O segundo momento fatorial é igual a:
A
 n
2 A(A − 1)
E[X[2] ] = 2! N
2 = n(n − 1) .
2
N (N − 1)

DEMA - UFC
João Maurı́cio A. Mota 7

O terceiro momento fatorial é igual a:


A
 n
3 A(A − 1)(A − 2)
E[X[3] ] = 3! N
3 = n(n − 1)(n − 2) .
3
N (N − 1)(N − 2)
O quarto momento fatorial é igual a:

A n
 
4 4 A(A − 1)(A − 2)(A − 3)
E[X[4] ] = 4! N
= n(n − 1)(n − 2)(n − 3) .
N (N − 1)(N − 2)(N − 3)

4

3 Momentos em Relação à origem da Hipergeométrica.

Para a obtenção vamos usar um resultado do livro do ROSS na página 203


Seja X ∼ HG(N, A, n) então
nA
E(X k ) = E[(Y + 1)k−1 ],
N
onde Y ∼ HG(N − 1, A − 1, n − 1).

Prova: Vamos considerar sem perda de generalidade o suporte B = {0, 1, . . . , n}.

n
X
k
E(X ) = xk P (X = x)
x=1
n A N −A
 
X x n−x
= xk N

x=1 n
n A N −A
 
X x n−x
= xk−1 x N

x=1 n

A A−1
 
Vamos usar a identidade x x
=A x−1
pois

   
A A! A(A − 1)! A(A − 1)! A−1
x =x = =A = .
x x!(A − x)! (x − 1)!(A − x)! (x − 1)!((A − 1) − (x − 1)! x−1

Aplicando o mesmo resultado para Nn tem-se:




   
N N −1
n =N
n n−1
e
   
N N N −1
= .
n n n−1

DEMA - UFC
João Maurı́cio A. Mota 8

Vamos voltar a calcular E(X k ):

n A−1 N −A
 
X nA x−1
E(X k ) = x k−1
N −1
n−x
x=1
N n−1
n A−1
 N −A
nA X k−1 x−1 n−x
= x N −1

N x=1 n−1
n−1 A−1
 N −A 
nA X y n−1−y
= (1 + y)k−1 N −1

N y=0 n−1
nA
= E[(1 + Y )k−1 ],
N
pois Y ∼ HG(N − 1, A − 1, n − 1) e foi feita a mudança de variável y = x − 1.
O primeiro momento em relação à origem é obtido fazendo k = 1:
A
E(X) = n E(1) = np.
N
O segundo momento em relação origem é obtido fazendo k = 2:

nA
E(X 2 ) = E(1 + Y )
N
nA
= (1 + E(Y ))
N  
nA (n − 1)(A − 1)
= 1+
N N −1
nA (N − 1 + (n − 1)(A − 1))
=
N (N − 1)

O terceiro momento em relação à origem é dado por:

nA
E(X 3 ) = E(1 + Y )2
N
nA
= (1 + 2E(Y ) + E(Y 2 ))
N  
nA (n − 1)(A − 1) (n − 1)(A − 1)t(N − 2 + (n − 2)(A − 2)
= 1+2 +
N N −1 (N − 1)(N − 2)

O quarto momento em relação à origem é dado por:

nA
E(X 4 ) = E(1 + Y )3
N
nA
= E(1 + 3E(Y ) + 3E(Y 2 ) + E(Y 3 )),
N

E´ melhor calcular separadamente E(Y ), E(Y 2 ) e E(Y 3 ) e então calcular


E(X 4 ). A fórmula usando os parâmetros N , A e n de tão grande não é operacional.

DEMA - UFC
João Maurı́cio A. Mota 9

4 Momentos Centrais da Hipergeométrica .

O segundo momento central é dado por:


N −n
V (X) = µ2 = npq .
N −1
Prova:

V (X) = E(X 2 ) − E 2 (X)


   2
nA N + nA − n − A nA
= −
N N −1 N
 
nA N + nA − n − A nA
= −
N N −1 N
2
nA N + nN A − nN − AN − nN A + nA
=
N N (N − 1)
2
nA N − nN − AN + nA
=
N N (N − 1)
nA N (N − n) − A(N − n)
=
N N (N − 1)
nA (N − A)(N − n)
=
N N (N − 1)
A N −AN −n
= n
N N N −1
N −n
= npq .
N −1
N −n
O fator é conhecido como fator de correção de população finita.
N −1
O terceiro momento central é dado por:

µ2 (N − 2A)(N − 2n)
µ3 = .
N (N − 2)
O quarto momento central é dado por:
µ2
µ4 = {C1 + C2 } ,
(N − 2)(N − 3)
em que

C1 = N (N + 1 − 6n) + 3A(N − A)(n − 2) + 6n2


e
3A(N − A)n(6 − n) 18N (N − a)n2
C2 = −
N N2

DEMA - UFC
João Maurı́cio A. Mota 10

4.1 Coeficiente de Assimetria


Fato 12. O coeficiente de assimetria de X ∼ HG(N, A, n)
 1/2  
N −1 (N − 2A)(N − 2n)
α3 = .
n A(N − A)(N − n) N −2

4.2 Coeficiente de Curtose


Fato 13. O coeficiente de curtose de X ∼ HG(N, A, n)
µ4
α4 = .
σ4
A fórmula é tão grande que é melhor usar a definição. .

4.3 Coeficiente de Variação


Fato 14. O coeficiente de variação de X ∼ HG(N, A, n)
s
σ q(N − n)
CV = = .
µ np(N − 1)
Exemplo : Seja X ∼ HG(N = 8, A = 4, n = 5). Calcule todos os momentos, e os
coeficientes de Assimetria, Curtose e Variação.
Solução: O suporte é dado por:

li = max(0, A + n − A) = max(0, 4 + 5 − 8) = max(0, 1) = 1,

ls = min(A, n) = min(4, 5) = 4.
A função de probabilidade de X é dada por:
4
 4 
x 5−x
P (X = x) = 8
 I{1,2,3,4} (x).
5
A f.p.. é dada por:
1 3
[ I{1,4} (x) ] + [ I{2,3} (x) ].
f (x) =
14 7
A saı́da do R apresentada traz a solução do que foi pedido. Escute cuidadosamente e
refaça o exemplo.

>
>
> #####X ~HG( N,A,n)
>
> N=8;A=5;n=4
> ls=min(n,A);ls
[1] 4
> li=max(0, A+n -N);li
[1] 1

DEMA - UFC
João Maurı́cio A. Mota 11

> x=li:ls;x
[1] 1 2 3 4
>
> px=dhyper(x,A,N-A,n);px
[1] 0.07142857 0.42857143 0.42857143 0.07142857
> require(MASS)
> fractions(px)
[1] 1/14 3/7 3/7 1/14
> tab=cbind(x,px)
> fractions(tab)
x px
[1,] 1 1/14
[2,] 2 3/7
[3,] 3 3/7
[4,] 4 1/14
>
> ####Calcular a Esperança de X
> p=A/N;p;q=1-p;q
[1] 0.625
[1] 0.375
> EX=sum(x*px);EX; n*p
[1] 2.5
[1] 2.5
> EX2=sum(x^2*px);EX2
[1] 6.785714
> fractions(EX2)
[1
>
> VX=EX2-EX^2;fractions(VX)
[1] 15/28
>
> num=n*A*(N-A)*(N-n);num
[1] 240
>
> den=N^2*(N-1);den
[1] 448
>
>
> mu_2=num/den;fractions(mu_2)
[1] 15/28
>
>
> ####Calcular o terceiro momento em relaç~
ao à origem
>
> EX3=sum(x^3*px);EX3
[1] 19.64286
> fractions(EX3)
[1] 275/14

DEMA - UFC
João Maurı́cio A. Mota 12

>
> ####Calcular o terceiro momento central
>
> mu_3=EX3-3*EX2*EX +2*EX^3;mu_3;fractions(mu_3)
[1] 0
[1] 0
>
>
> ###Testar a fórmula
>
> mu_2*(N-2*A)*(N-2*n)/(n*(N-2))
[1] 0
>
>
> sigma=sqrt(VX);sigma
[1] 0.7319251
>
>
> ####coeficiente de Assimetria
> alfa_3=mu_3/sigma^3;alfa_3
[1] 0
>
>
> A1=(N-1)/(A*(N-A)*n*(N-n));A1
[1] 0.02916667
>
> A2=(N-2*A)*(N-2*n)/(N-2);A2
[1] 0
>
> As=sqrt(A1)*A2;As
[1] 0
> ####Calcular o quarto momento em relaç~
ao à origem
>
> EX4=sum(x^4*px);EX4
[1] 59.92857
> fractions(EX4)
[1] 839/14
>
>
> ####Calcular o quarto momento central
>
> mu_4=EX4-4*EX3*EX +6*EX2* EX^2 - 3*EX^4;mu_4;fractions(mu_4)
[1] 0.7767857
[1] 87/112
>
>
> ##Testar a fórmula:
>

DEMA - UFC
João Maurı́cio A. Mota 13

> C1=N*(N+1-6*n);C1
[1] -120
> C2=3*A*(N-A)*(n-2)+ 6*n^2 + (3*A*(N-A)*n*(6-n))/N - (18*A*(N-A)*n^2)/(N^2);C2
[1] 163.5
> aux=mu_2/((N-2)*(N-3));aux
[1] 0.01785714
> MC4= aux*(C1+C2);MC4
[1] 0.7767857
> fractions(MC4)
[1] 87/112
>
>
>
>
> ###coeficiente de Curtose
>
> alfa_4=mu_4/sigma^4;alfa_4
[1] 2.706667
>
> alfa_4 <3 #### a distribuiç~
ao é platicúrtica!!!!!!!
[1] TRUE
>
>
>
> ##### Calcular usando a fórmula:
>
>
>
> ####Calcule os quatro primeiros momentos fatoriais.
>
> ##EXf1=EX- primeiro momento fatorial
>
> EXf1=EX ; EXf1
[1] 2.5
>
>
> ##EXf2=E[X(X-1)]- segundo momento fatorial
>
> EXf2=sum(x*(x-1)*px); EXf2; fractions(EXf2);fractions(EX2-EX)
[1] 4.285714
[1] 30/7
[1] 30/7
>
> ##EXf3=E[X(X-1)(X-2)]- terceiro momento fatorial
>
> EXf3=sum(x*(x-1)*(x-2)*px); EXf3; fractions(EXf3)
[1] 4.285714
[1] 30/7

DEMA - UFC
João Maurı́cio A. Mota 14

>
>
> fractions(EX3-3*EX2 +2*EX)
[1] 30/7
>
>
> ##EXf4=E[X(X-1)(X-2)(X-3)]- quarto momento fatorial
>
> EXf4=sum(x*(x-1)*(x-2)*(x-3)*px); EXf4; fractions(EXf4)
[1] 1.714286
[1] 12/7
>
>
> fractions(EX4-6*EX3 + 11*EX2 -6*EX)
[1] 12/7
>
>
> #### fazer geral:
>
> r=1:4
>
> num=factorial(n)*factorial(A)*factorial(N-r);num
[1] 14515200 2073600 345600 69120
> den=factorial(n-r)*factorial(A-r)*factorial(N);den
[1] 5806080 483840 80640 40320
> EXfr=num/den;EXfr
[1] 2.500000 4.285714 4.285714 1.714286
>
> tab1=cbind(r,EXfr);tab1
r EXfr
[1,] 1 2.500000
[2,] 2 4.285714
[3,] 3 4.285714
[4,] 4 1.714286
> fractions(tab1)
r EXfr
[1,] 1 5/2
[2,] 2 30/7
[3,] 3 30/7
[4,] 4 12/7
> CV=sigma/EX;CV
[1] 0.29277
> fractions(CV)
[1] 13610/46487
>
>
> num=q*(N-n)
> den=n*p*(N-1)

DEMA - UFC
João Maurı́cio A. Mota 15

>
> sqrt(num/den )
[1] 0.29277
>

5 Função Geradora de Probabilidades e de Momen-


tos da Hipergeométrica
Não existe forma fechada simples para a função geradora de momentos ou de probabili-
dades de X ∼ HG(N, A, n). No entanto vamos calculá-las para a variável do exemplo
1.
Assim,
4
X t 3t2 3t3 t4 t + t4 3(t2 + t3 )
GX (t) = tx P (X = x) = + + + = + .
x=1
14 7 7 14 14 7
A função geradora de momentos de X é dada por:

et + e4t 3(e2t + e3t )


MX (t) = GX (et ) = + .
14 7

6 Aproximação Binomial Para a Hipergeométrica


n
Quando a fração amostral N
< 0, 05 podemos aproximar a Hipergeométrica X ∼ HG(N, A, n)
A
pela Binomial ,Y , de parâmetros n e p = .
N
o fator de correção fica
n
N −n 1−
F = = N,
N −1 1
1−
N
que se aproxima de 1 quando a fração amostral é pequena.
Vamos ver o que acontece com a média:
A
E(X) = n = np = E(Y ).
N
Vamos ver o que acontece com a variância:
AN −A N −n N −n
V (X) = n = npq ≈ npq = V (Y ).
N N N −1 N −1
A função de probabilidade de X é dada por:

DEMA - UFC
João Maurı́cio A. Mota 16

A N −A
 
x n−x
f (x) = N

n
A! (N − A)! (N − n)!n!
=
x!(A − x)! (N − A − n + x)!(n − x)! N!
n! A! (N − A)!(N − n)!
=
x!(n − x)! N !(A − x)! (N − A − n + x)!
 
n A! (N − A)! (N − n)!
=
x (A − x)! N! (N − n − A + x)!
Mas

A! A(A − 1)(A − 2) . . . (A − x + 1)(A − x)!


=
(A − x)! (A − x)!
= A(A − 1)(A − 2) . . . (A − x + 1)

(N − A)! (N − A)(N − A − 1) . . . (N − A − n + x + 1)(N − n − A + x)!


=
(N − n − A + x)! (N − n − A + x)!
= (N − A)(N − A − 1) . . . (N − A − n + x + 1)

(N − n)! (N − n)!
=
N! N (N − 1)(N − 2) . . . (N − n − 1 + 1)(N − n − A + x)!
= (N )(N − 1)(N − 2) . . . (N − n + 1)
Assim,
 
n A(A − 1) . . . (A − x + 1) (N − A)(N − A − 1) . . . (N − A − n + x + 1)
f (x) =
x N (N − 1)(N − 2) . . . (N − n + 1)

como N n = N x N n−x vamos dividir a fração por N x

  A ( A − 1 ) . . . ( A − x − 1 ) (1 − A )(1 − A − 1 ) . . . (1 − A − n − x − 1 )
n N N N N N N N N N N
f (x) =
x 1 2 n − 1
(1 − )(1 − ) . . . (1 − )
  N N N
n x
≈ p (1 − p)n−x ,
x
a
lembrando que p = e que N → ∞.
N
O Meyer(página 208)diz que a aproximação é bastante boa se a fração amostral é
menor ou igual a 10%.
Vamos utilizar o R para estudar melhor esta aproximação.
Considere o exemplo: Uma remessa de 2000 arruelas contém 400 defeituosas. Duzentas
arruelas são escolhidas ao acaso( sem reposição) e classificadas . Qual a probabilidade de
que sejam encontradas:

DEMA - UFC
João Maurı́cio A. Mota 17

a. no máximo 40 arruelas defeituosas?

b. Calcule as médias das variáveis envolvidas na situação

Solução: Seja X o número de arruelas defeituosas na amostra de 200.


Como a amostra é sem reposição e temos:
N=2000 (tamanho da população), A=400 ( tamanho da população com a caracterı́stica
de interesse) e n=200 tamanho da amostra.
Logo X ∼ HG(N = 2000, A = 400, n = 200), cuja função de probabilidade é dada
por:
400
 1600 
x 200−x
P (X = x) = 2000
 IB (x),
200

onde B = [Li, . . . , Ls] e Li = max(0, 200 + 400 − 2000) = 0 e Ls = min(200, 400) =


200.
Para responder ao item a
40 400
 1600 
X x 200−x
P (X ≤ 40) = 2000
 = 0, 543
x=0 200

n 200
Lembrando que = = 0, 10 a condição para a aproximação está satisfeita.
N 2000
Vamos aproximar pela variável aleatória Y ∼ Bin(n, p)
com n = 200 e p = 400/2000 = 0, 2.
40  
X 200
P (Y ≤ 40) = (0, 2)y (0, 8)200−y = 0, 542.
y=0
y

As probabilidades são bastante próximas e o item b está resolvido na saı́da do R.

> ##X=número de arruelas defeituosa na amostra; X ~HG(N,A,n)


> N=2000;A=400;n=200
>
>
> ###Vamos calcular paex=P(X <=40)- a probabilidade exata
>
> pa_ex=phyper(40,A,N-A,n);pa_ex
[1] 0.5429798
>
>
> ###Vamos aproximar para a binomial Y~Bin(n,p)calcular pa_ap=P(Y<=40)
> #### a probabilidade aproximada
>
>
>
> ###Podemoa aproximar?
> n/N
[1] 0.1
>

DEMA - UFC
João Maurı́cio A. Mota 18

> n/N >0.1 ####Podemos aproximar


[1] FALSE
>
> p=A/N;p
[1] 0.2
>
>
> pa_ap=pbinom(40,n,p);pa_ap
[1] 0.5421796
>
> round(pa_ex,3);round(pa_ap,3) ####Bastante próximas
[1] 0.543
[1] 0.542
>
>
> ####
>
> EX=n*(A/N);EX;EY=n*p;EY
[1] 40
[1] 40
>
>
> VX=n*(A/N)*((N-A)/N)*( (N-n)/(N-1));VX
[1] 28.81441
>
> VY=n*p*(1-p);VY ###Comente!!!!!!
[1] 32
>

6.1 Comentários
6.2 Exemplo
Uma urna contém 10 bolas sendo 2 bolas amarelas, 3 bolas brancas e as restantes são
vermelhas. Uma amostra aleatória de 5 bolas sem reposição é retirada.
Sejam
X= número de bolas amarelas na amostra.
Y = número de bolas brancas na amostra.
Z= número de bolas vermelhas na amostra.
Responda o que se pede:

a. Qual a distribuição de X
Solução:
X tem distribuição hipergeométrica de parâmetros N = 10, A = 2, e n = 5. Logo,

DEMA - UFC
João Maurı́cio A. Mota 19

2 8
 
x 5−x
P (X = x) = 10
 I{0,1,2} .
5

pois Li = max(0, n + a − N ) = max(0, 5 + 2 − 10) = max(0, −3) = 0 e Ls =


min(n, A) = min(5, 2)2.

>
>
> N=10;A=2;n=5
>
> Ls=min(n,A);Ls
[1] 2
> Li=max(n+A-N,0);Li
[1] 0
>
> x=Li:Ls;x
[1] 0 1 2
>
> fx=dhyper(x,A,N-A,n);fx
[1] 0.2222222 0.5555556 0.2222222
> Fx=phyper(x,A,N-A,n);Fx
[1] 0.2222222 0.7777778 1.0000000
> require(MASS)
>
> tabx=cbind(x,fx,Fx);fractions(tabx)
x fx Fx
[1,] 0 2/9 2/9
[2,] 1 5/9 7/9
[3,] 2 2/9 1
>
> ###Faça o gráfico de fx e diga se ele é simétrico.
>
>
>
>
>
> #########Calcule os momentos de X
>
>
> p=A/N;q=(N-A)/N;p
[1] 0.2
> EX=n*p;EX
[1] 1
> Fc=(N-n)/(N-1);Fc
[1] 0.5555556
> VX=n*p*q*Fc;fractions(VX)
[1] 4/9

DEMA - UFC
João Maurı́cio A. Mota 20

> sigma=sqrt(VX);sigma;fractions(sigma)
[1] 0.6666667
[1] 2/3
> mu_2=sum((x-EX)^2*fx);mu_2;fractions(mu_2)
[1] 0.4444444
[1] 4/9
>
> mu_3=sum((x-EX)^3*fx);mu_3;fractions(mu_3)
[1] 0
[1] 0
>
>
> mu_4=sum((x-EX)^4*fx);mu_4;fractions(mu_4)
[1] 0.4444444
[1] 4/9
>
> alfa_3=mu_3/(sigma)^(3/2);alfa_3
[1] 0
>
> alfa_4=mu_4/(sigma)^(4);alfa_4
[1] 2.25
>
> alfa_4 <3 ##### A distribuiç~
ao é platicúrtica.
[1] TRUE
>
>
>
> ####Calcule os momentos fatoriais.
>
> MF2=sum(x*(x-1)*fx);MF2;fractions(MF2)
[1] 0.4444444
[1] 4/9
>
>
> MF3=sum(x*(x-1)*(x-2)*fx);MF3;fractions(MF3)
[1] 0
[1] 0
>
>
> MF4=sum(x*(x-1)*(x-2)*(x-4)*fx);MF3;fractions(MF4)
[1] 0
[1] 0
>

b. Qual a distribuição Y ? Solução:


A distribuição de Y é hipergeométrica de parâmetros N = 10, A = 3 e n = 5. O
suporte de Y é dado por;

DEMA - UFC
João Maurı́cio A. Mota 21

Li = max(0, A + n − N ) ≤ x ≤ min(A, n) = Ls.

assim li = max(0, 3 + 5 − 10) = max(0, −2) = 0 e ls = min(3, 5) = 3.


A f.p. De Y é dada por:

3 8
 
y 5−y
P (Y = y) = 10
 I{0,1,2,3} (x)
5

Vamos utilizar o R para obter a função de probabilidade de Y .


distribuição de Y é hipergeométrica de parâmetros N = 10,A = 3 e n = 5. O
suporte de Y é dado por;

Li = max(0, A + n − N ) ≤ x ≤ min(A, n) = Ls.

assim li = max(0, 3 + 5 − 10) = max(0, −2) = 0 e ls = min(3, 5) = 3.


A f.p. de Y é dada por:

3 7
 
y 5−y
P (Y = y) = 10
 I{0,1,2,3} (y)
5

c. Qual a distribuição Z?
Z tem distribuição hipergeométrica de parâmetros N = 10, A = 5, e n = 5.
O suporte de Z é dado por;

Li = max(0, A + n − N ) ≤ x ≤ min(A, n) = Ls.

assim li = max(0, 5 + 5 − 10) = max(0, 0) = 0 e ls = min(5, 5) = 5.


A f.p. de Z é dada por:

5 5
 
z 5−z
P (Z = z) = 10
 I{0,1,2,3,4,5} (z.)
5

d. Qual a f.g.m. de X?
Solução:
A f.p. de X é dada por:

2 5 2
P (X = x) = I{0} (x) + I{1} (x) + I{2} (x).
9 9 9
A f.g.m. de X é dada por:

2 5 t 2 2t 1 
MX (t) = E(etX ) = 2 + 5et + 2 e2t .

+ e + e =
9 9 9 9

DEMA - UFC
João Maurı́cio A. Mota 22

e. Qual a f.g.p. de Y ?
A f.p. de Y é dada por:

1 5 5 1
P (Y = y) = I{0} (y) + I{1} (y) + I{2} (y) + I{3} (y).
12 12 12 12
A f.g.p. de Y é dada por:

1 5 5 2 1 3 1 
GY (t) = E(tY ) = 2 + 5t + 5 t2 + t3 .

+ t+ t + t =
12 12 12 12 12

> N=10;A=3;n=5
>
> Ls=min(n,A);Ls
[1] 3
> Li=max(n+A-N,0);Li
[1] 0
>
> y=Li:Ls;y
[1] 0 1 2 3
>
> fy=dhyper(y,A,N-A,n);fy
[1] 0.08333333 0.41666667 0.41666667 0.08333333
> Fy=phyper(y,A,N-A,n);Fy
[1] 0.08333333 0.50000000 0.91666667 1.00000000
> taby=cbind(y,fy,Fy);fractions(taby)
y fy Fy
[1,] 0 1/12 1/12
[2,] 1 5/12 1/2
[3,] 2 5/12 11/12
[4,] 3 1/12 1
>

e. Qual a moda de Z? A distribuição de Z é simétrica? Qual a média e a mediana de


Z?

>
>
> N=10;A=5;n=5
>
> Ls=min(n,A);Ls
[1] 5
> Li=max(n+A-N,0);Li
[1] 0
>
> z=Li:Ls;z
[1] 0 1 2 3 4 5

DEMA - UFC
João Maurı́cio A. Mota 23

>
> fz=dhyper(z,A,N-A,n);fz
[1] 0.003968254 0.099206349 0.396825397 0.396825397 0.099206349 0.003968254
> Fz=phyper(z,A,N-A,n);Fz
[1] 0.003968254 0.103174603 0.500000000 0.896825397 0.996031746 1.000000000
> tabz=cbind(z,fz,Fz);fractions(tabz)
z fz Fz
[1,] 0 1/252 1/252
[2,] 1 25/252 13/126
[3,] 2 25/63 1/2
[4,] 3 25/63 113/126
[5,] 4 25/252 251/252
[6,] 5 1/252 1
>
>

Vendo a saı́da do R temos:


A f.p. de Z é dada por:

1 25 100 100 25 1
P (Y = y) = I{0} (z)+ I{1} (z)+ I{2} (z)+ I{3} (z)+ I{4} (z)+ I{5} (z).
252 252 252 252 252 252

A distribuição é bimodal . As modas são M o1 = 2 e M o2 = 3. A distribuição é


simétrica em torno do ponto c = (2 + 3)/2 = 2, 5 = E(X).
A esperança de X é dada por:

A 5
E(X) = n =5× = 2, 5.
N 10
pela saı́da do R a mediana de Z é med = (2 + 3)/2 = 2, 5. Vamos olhar o R

> med=qhyper(0.5,A,N-A,n);med
[1] 2
>

a mediana é o ponto z = 2.

7 Exercı́cios
1. Considere uma turma de 16 alunos do curso de Estatı́stica dos quais seis fizeram
vestibular em 2015,e o restante fez em 2016. Uma amostra de 4 estudantes é retirada
sem reposição. Encontre a probabilidade de que:

a. os 4 estudantes selecionados tenham feito vestibular em 2015;

DEMA - UFC
João Maurı́cio A. Mota 24

b. Nenhum estudante tenha feito vestibular em 2015;


c. A amostra contenha pelo menos um aluno que tenha feito vestibular em 2015?
d. Haja exatamente 2 alunos que fizeram vestibular em 2016 ;
e. Como ficariam suas respostas dos itens anteriores se a amostragem fosse com
reposição?

2. De um baralho comum de 52 cartas são retiradas sem reposição 12 cartas. Um


baralho comum tem quatro naipes (copas, ouros, paus e espadas) cada um com 13
cartas: ás, 2, 3, 4, 5, 6, 7, 8 ,9 ,10, valete, dama e rei. Os naipes ouros e copas são
vermelhos e os restantes pretos. As cartas valete, dama e rei são chamadas figuras
e o ás representa o um. Sejam X1 o número de cartas de copas na amostra, X2
o número de cartas de ouros na amostra, X3 o número de cartas de espadas na
amostra e X4 o número de cartas de paus na amostra.

a. Qual a distribuição de Xi , i = 1, 2, 3, 4?
b. Qual a distribuição de V = X1 + X2 ?
c. Qual a distribuição de U = X1 + X2 ?
d. Qual a média e variância de U ? e a de V ?;
e. Calcule a covariância entre X1 e X2 ?
f. Como ficariam suas respostas dos itens anteriores se a amostragem fosse com
reposição?

3. Suponha que em uma população os quatro tipos sanguı́neos A, B, AB e O repre-


sentem 20%,20%,10% e 50% das pessoas , respectivamente. Um hospital pede a 10
doadores, escolhidos aleatoriamente, para doarem sangue. Qual é a probabilidade
de obter, nessa amostra, 4 com o tipo sanguı́neo O? Qual é a probabilidade de
obter, nessa amostra, 4 com o tipo sanguı́neo A ou AB

4. Uma fazenda tem 30% de suı́nos da raça Duroc, 20% de Landrace e 50% de Large-
White. Sorteando-se 9 animais dessa fazenda:

a. Qual a probabilidade de serem 4 da raça Duroc e 2 da Landrace?


b. Qual a probabilidade de serem da raça Duroc?
c. Se a fazenda tivesse 30 porcos como ficariam as respostas dos itens anteriores?

5. O rebanho leiteiro de uma região é composto por vacas nelore e gir na proporção
5:3. Determine a probabilidade de que num lote de 30 animais:

a. apareçam 16 raça da nelore;


b. todos gir;
c. aconteça exatamente a proporção populacional.

6. Numa pocilga há 18 suı́nos da raça landrace dos quais 3 são machos e 20 animais
da raça Large-White dos quais 5 são machos.

a. Faça uma tabela de contingência 2 × 2 dos dados populacionais nas variáveis


raça e sexo;

DEMA - UFC
João Maurı́cio A. Mota 25

b. 5 animais são selecionados para um exame de rotina, qual a probabilidade de


que haja 3 porcas entre eles?
c. Se 8 animais fossem selecionados qual a probabilidade de aparecer o mesmo
número de animais por raça e sexo?
d. Qual a covariância entre o número de machos e de fêmeas quando são escolhidos
6 animais?
e. Qual a covariância entre o número de machos da raça Landrace e o número de
fêmeas da raça Large-White quando são escolhidos 6 animais?
f. Qual a covariância entre o número de machos da raça Landrace e o número de
fêmeas da raça Landrace quando são escolhidos 6 animais?

DEMA - UFC

Você também pode gostar