Escolar Documentos
Profissional Documentos
Cultura Documentos
Mota 1
Material didático preparado pelo professor Maurı́cio Mota para a disciplina CC0282-
Probabilidade I ministrada no semestre 2021.1.
1 Distribuição Hipergeométrica
1.1 Introdução.
Considere uma população com N elementos dos quais A têm uma caracterı́stica
(categoria 1) e B = N − A não têm esta caracterı́stica (categoria 2).
Uma amostra aleatória de tamanho n sem reposição é retirada . Seja:
Como
0≤x≤A
e
0≤n−x≤N −A
.
A segunda desigualdade fica A + n − N ≤ x ≤ n. Logo
A + n − N ≤ x ≤ n.
Comparando as duas desigualdades:
1.2 Origem
O binômio de Newton nos diz que:
n
n
X n
(a + b) = ai bn−i ,
i=0
i
DEMA - UFC
João Maurı́cio A. Mota 2
onde
k
X
ck = al bk−l .
l=0
Partindo de
(x + 1)n . (x + 1)n = (x + 1)2n
temos:
n n
n
X n i n
X n
(x + 1) = x e (x + 1) = xj
i=0
i j=0
j
E assim,
n n n X n
n n
X n i
X n j
X n n i+j
(x + 1) .(x + 1) = x x = x .
i=0
i j=0
j i=0 j=0
i j
DEMA - UFC
João Maurı́cio A. Mota 3
Logo,
a b a+b
a b
X a i
X b i
X
(x + 1) (x + 1) = x x = ck x k ,
i=0
i j=0
j k=0
onde
a b
ai = e bj = ,
i j
e
k n
X X a b
ck = al bk−l = .
l=0 l=0
l k − l
Mas,
a+b
a+b
X a+b
(x + 1) = xk ,
k=0
k
e igualando os coeficientes adequados temos:
ls
X a b a+b
= .
li
l k−l k
Fazendo k = n temos:
ls
X a b a+b
= .
li
l n−l n
Vamos estudar os limites do somatório:
Sabemos
0≤i≤a
e
0≤j =k−i≤b
que fica
DEMA - UFC
João Maurı́cio A. Mota 4
k−b≤i≤k
e juntando as duas desigualdades temos
DEMA - UFC
João Maurı́cio A. Mota 5
ls ls A N −A
X X x n−x
f (x) = N
x=li x=li n
ls
X 1 A N −A
= N
n x=li
x n−x
1 N
= N
n
n
= 1,
Prova:
O r-ésimo momento fatorial é dado por:
n
X
E(X[r] ) = x[r] P (X = x)
x=r
n A N −A
X x n−x
= x[r] N
x=r n
mas,
x[r] (x − r)!
A A! A! x! A!
x[r] = x[r] = = ,
x x!(A − x)! (x − r)! x!(A − x)! (x − r)! x!(A − x)!
cancelando o x! temos:
A A!
x[r] = ,
x (x − r)!(A − x)!
como
x − r + A − x = A − r,
temos
A A!(A − r)! A! (A − r)!r!
x[r] = = ,
x (x − r)!(A − x)!(A − r)! r!(A − r)! (A − x)!(x − r)!
A A (A − r)! A A−r
x[r] = r! = r! ,
x r (A − x)!(x − r)! r r−x
DEMA - UFC
João Maurı́cio A. Mota 6
n N −A A
X n−x x
E(X[r] ) = x[r] N
x=r n
n N −A
X A n−x
= x[r] N
x=r
x n
n
1 X A N −A
= N
x[r]
n−x
n x=r
x
vamos substituir
n
1 X A A−r N −A
E(X[r] ) = N r!
n x=r
r r−x n−x
n
r! Ar X A − r
N −A
= N
r−x n−x
n x=r
n−r
A X
r! r A−r N −A
E(X[r] ) = N
n−r−y
n y=0
y
r! Ar N − r
= N
n−r
n
A (N − r)! n!(N − n)!
=
r (n − r)!(N − n)! N!
A r!(N − r)! n!r!
=
r N! (n − r)!r!
A 1 n
= r! N
r r
A
nr
r
= r! N
r
r
DEMA - UFC
João Maurı́cio A. Mota 7
A n
4 4 A(A − 1)(A − 2)(A − 3)
E[X[4] ] = 4! N
= n(n − 1)(n − 2)(n − 3) .
N (N − 1)(N − 2)(N − 3)
4
n
X
k
E(X ) = xk P (X = x)
x=1
n A N −A
X x n−x
= xk N
x=1 n
n A N −A
X x n−x
= xk−1 x N
x=1 n
A A−1
Vamos usar a identidade x x
=A x−1
pois
A A! A(A − 1)! A(A − 1)! A−1
x =x = =A = .
x x!(A − x)! (x − 1)!(A − x)! (x − 1)!((A − 1) − (x − 1)! x−1
N N −1
n =N
n n−1
e
N N N −1
= .
n n n−1
DEMA - UFC
João Maurı́cio A. Mota 8
n A−1 N −A
X nA x−1
E(X k ) = x k−1
N −1
n−x
x=1
N n−1
n A−1
N −A
nA X k−1 x−1 n−x
= x N −1
N x=1 n−1
n−1 A−1
N −A
nA X y n−1−y
= (1 + y)k−1 N −1
N y=0 n−1
nA
= E[(1 + Y )k−1 ],
N
pois Y ∼ HG(N − 1, A − 1, n − 1) e foi feita a mudança de variável y = x − 1.
O primeiro momento em relação à origem é obtido fazendo k = 1:
A
E(X) = n E(1) = np.
N
O segundo momento em relação origem é obtido fazendo k = 2:
nA
E(X 2 ) = E(1 + Y )
N
nA
= (1 + E(Y ))
N
nA (n − 1)(A − 1)
= 1+
N N −1
nA (N − 1 + (n − 1)(A − 1))
=
N (N − 1)
nA
E(X 3 ) = E(1 + Y )2
N
nA
= (1 + 2E(Y ) + E(Y 2 ))
N
nA (n − 1)(A − 1) (n − 1)(A − 1)t(N − 2 + (n − 2)(A − 2)
= 1+2 +
N N −1 (N − 1)(N − 2)
nA
E(X 4 ) = E(1 + Y )3
N
nA
= E(1 + 3E(Y ) + 3E(Y 2 ) + E(Y 3 )),
N
DEMA - UFC
João Maurı́cio A. Mota 9
µ2 (N − 2A)(N − 2n)
µ3 = .
N (N − 2)
O quarto momento central é dado por:
µ2
µ4 = {C1 + C2 } ,
(N − 2)(N − 3)
em que
DEMA - UFC
João Maurı́cio A. Mota 10
ls = min(A, n) = min(4, 5) = 4.
A função de probabilidade de X é dada por:
4
4
x 5−x
P (X = x) = 8
I{1,2,3,4} (x).
5
A f.p.. é dada por:
1 3
[ I{1,4} (x) ] + [ I{2,3} (x) ].
f (x) =
14 7
A saı́da do R apresentada traz a solução do que foi pedido. Escute cuidadosamente e
refaça o exemplo.
>
>
> #####X ~HG( N,A,n)
>
> N=8;A=5;n=4
> ls=min(n,A);ls
[1] 4
> li=max(0, A+n -N);li
[1] 1
DEMA - UFC
João Maurı́cio A. Mota 11
> x=li:ls;x
[1] 1 2 3 4
>
> px=dhyper(x,A,N-A,n);px
[1] 0.07142857 0.42857143 0.42857143 0.07142857
> require(MASS)
> fractions(px)
[1] 1/14 3/7 3/7 1/14
> tab=cbind(x,px)
> fractions(tab)
x px
[1,] 1 1/14
[2,] 2 3/7
[3,] 3 3/7
[4,] 4 1/14
>
> ####Calcular a Esperança de X
> p=A/N;p;q=1-p;q
[1] 0.625
[1] 0.375
> EX=sum(x*px);EX; n*p
[1] 2.5
[1] 2.5
> EX2=sum(x^2*px);EX2
[1] 6.785714
> fractions(EX2)
[1
>
> VX=EX2-EX^2;fractions(VX)
[1] 15/28
>
> num=n*A*(N-A)*(N-n);num
[1] 240
>
> den=N^2*(N-1);den
[1] 448
>
>
> mu_2=num/den;fractions(mu_2)
[1] 15/28
>
>
> ####Calcular o terceiro momento em relaç~
ao à origem
>
> EX3=sum(x^3*px);EX3
[1] 19.64286
> fractions(EX3)
[1] 275/14
DEMA - UFC
João Maurı́cio A. Mota 12
>
> ####Calcular o terceiro momento central
>
> mu_3=EX3-3*EX2*EX +2*EX^3;mu_3;fractions(mu_3)
[1] 0
[1] 0
>
>
> ###Testar a fórmula
>
> mu_2*(N-2*A)*(N-2*n)/(n*(N-2))
[1] 0
>
>
> sigma=sqrt(VX);sigma
[1] 0.7319251
>
>
> ####coeficiente de Assimetria
> alfa_3=mu_3/sigma^3;alfa_3
[1] 0
>
>
> A1=(N-1)/(A*(N-A)*n*(N-n));A1
[1] 0.02916667
>
> A2=(N-2*A)*(N-2*n)/(N-2);A2
[1] 0
>
> As=sqrt(A1)*A2;As
[1] 0
> ####Calcular o quarto momento em relaç~
ao à origem
>
> EX4=sum(x^4*px);EX4
[1] 59.92857
> fractions(EX4)
[1] 839/14
>
>
> ####Calcular o quarto momento central
>
> mu_4=EX4-4*EX3*EX +6*EX2* EX^2 - 3*EX^4;mu_4;fractions(mu_4)
[1] 0.7767857
[1] 87/112
>
>
> ##Testar a fórmula:
>
DEMA - UFC
João Maurı́cio A. Mota 13
> C1=N*(N+1-6*n);C1
[1] -120
> C2=3*A*(N-A)*(n-2)+ 6*n^2 + (3*A*(N-A)*n*(6-n))/N - (18*A*(N-A)*n^2)/(N^2);C2
[1] 163.5
> aux=mu_2/((N-2)*(N-3));aux
[1] 0.01785714
> MC4= aux*(C1+C2);MC4
[1] 0.7767857
> fractions(MC4)
[1] 87/112
>
>
>
>
> ###coeficiente de Curtose
>
> alfa_4=mu_4/sigma^4;alfa_4
[1] 2.706667
>
> alfa_4 <3 #### a distribuiç~
ao é platicúrtica!!!!!!!
[1] TRUE
>
>
>
> ##### Calcular usando a fórmula:
>
>
>
> ####Calcule os quatro primeiros momentos fatoriais.
>
> ##EXf1=EX- primeiro momento fatorial
>
> EXf1=EX ; EXf1
[1] 2.5
>
>
> ##EXf2=E[X(X-1)]- segundo momento fatorial
>
> EXf2=sum(x*(x-1)*px); EXf2; fractions(EXf2);fractions(EX2-EX)
[1] 4.285714
[1] 30/7
[1] 30/7
>
> ##EXf3=E[X(X-1)(X-2)]- terceiro momento fatorial
>
> EXf3=sum(x*(x-1)*(x-2)*px); EXf3; fractions(EXf3)
[1] 4.285714
[1] 30/7
DEMA - UFC
João Maurı́cio A. Mota 14
>
>
> fractions(EX3-3*EX2 +2*EX)
[1] 30/7
>
>
> ##EXf4=E[X(X-1)(X-2)(X-3)]- quarto momento fatorial
>
> EXf4=sum(x*(x-1)*(x-2)*(x-3)*px); EXf4; fractions(EXf4)
[1] 1.714286
[1] 12/7
>
>
> fractions(EX4-6*EX3 + 11*EX2 -6*EX)
[1] 12/7
>
>
> #### fazer geral:
>
> r=1:4
>
> num=factorial(n)*factorial(A)*factorial(N-r);num
[1] 14515200 2073600 345600 69120
> den=factorial(n-r)*factorial(A-r)*factorial(N);den
[1] 5806080 483840 80640 40320
> EXfr=num/den;EXfr
[1] 2.500000 4.285714 4.285714 1.714286
>
> tab1=cbind(r,EXfr);tab1
r EXfr
[1,] 1 2.500000
[2,] 2 4.285714
[3,] 3 4.285714
[4,] 4 1.714286
> fractions(tab1)
r EXfr
[1,] 1 5/2
[2,] 2 30/7
[3,] 3 30/7
[4,] 4 12/7
> CV=sigma/EX;CV
[1] 0.29277
> fractions(CV)
[1] 13610/46487
>
>
> num=q*(N-n)
> den=n*p*(N-1)
DEMA - UFC
João Maurı́cio A. Mota 15
>
> sqrt(num/den )
[1] 0.29277
>
DEMA - UFC
João Maurı́cio A. Mota 16
A N −A
x n−x
f (x) = N
n
A! (N − A)! (N − n)!n!
=
x!(A − x)! (N − A − n + x)!(n − x)! N!
n! A! (N − A)!(N − n)!
=
x!(n − x)! N !(A − x)! (N − A − n + x)!
n A! (N − A)! (N − n)!
=
x (A − x)! N! (N − n − A + x)!
Mas
(N − n)! (N − n)!
=
N! N (N − 1)(N − 2) . . . (N − n − 1 + 1)(N − n − A + x)!
= (N )(N − 1)(N − 2) . . . (N − n + 1)
Assim,
n A(A − 1) . . . (A − x + 1) (N − A)(N − A − 1) . . . (N − A − n + x + 1)
f (x) =
x N (N − 1)(N − 2) . . . (N − n + 1)
A ( A − 1 ) . . . ( A − x − 1 ) (1 − A )(1 − A − 1 ) . . . (1 − A − n − x − 1 )
n N N N N N N N N N N
f (x) =
x 1 2 n − 1
(1 − )(1 − ) . . . (1 − )
N N N
n x
≈ p (1 − p)n−x ,
x
a
lembrando que p = e que N → ∞.
N
O Meyer(página 208)diz que a aproximação é bastante boa se a fração amostral é
menor ou igual a 10%.
Vamos utilizar o R para estudar melhor esta aproximação.
Considere o exemplo: Uma remessa de 2000 arruelas contém 400 defeituosas. Duzentas
arruelas são escolhidas ao acaso( sem reposição) e classificadas . Qual a probabilidade de
que sejam encontradas:
DEMA - UFC
João Maurı́cio A. Mota 17
n 200
Lembrando que = = 0, 10 a condição para a aproximação está satisfeita.
N 2000
Vamos aproximar pela variável aleatória Y ∼ Bin(n, p)
com n = 200 e p = 400/2000 = 0, 2.
40
X 200
P (Y ≤ 40) = (0, 2)y (0, 8)200−y = 0, 542.
y=0
y
DEMA - UFC
João Maurı́cio A. Mota 18
6.1 Comentários
6.2 Exemplo
Uma urna contém 10 bolas sendo 2 bolas amarelas, 3 bolas brancas e as restantes são
vermelhas. Uma amostra aleatória de 5 bolas sem reposição é retirada.
Sejam
X= número de bolas amarelas na amostra.
Y = número de bolas brancas na amostra.
Z= número de bolas vermelhas na amostra.
Responda o que se pede:
a. Qual a distribuição de X
Solução:
X tem distribuição hipergeométrica de parâmetros N = 10, A = 2, e n = 5. Logo,
DEMA - UFC
João Maurı́cio A. Mota 19
2 8
x 5−x
P (X = x) = 10
I{0,1,2} .
5
>
>
> N=10;A=2;n=5
>
> Ls=min(n,A);Ls
[1] 2
> Li=max(n+A-N,0);Li
[1] 0
>
> x=Li:Ls;x
[1] 0 1 2
>
> fx=dhyper(x,A,N-A,n);fx
[1] 0.2222222 0.5555556 0.2222222
> Fx=phyper(x,A,N-A,n);Fx
[1] 0.2222222 0.7777778 1.0000000
> require(MASS)
>
> tabx=cbind(x,fx,Fx);fractions(tabx)
x fx Fx
[1,] 0 2/9 2/9
[2,] 1 5/9 7/9
[3,] 2 2/9 1
>
> ###Faça o gráfico de fx e diga se ele é simétrico.
>
>
>
>
>
> #########Calcule os momentos de X
>
>
> p=A/N;q=(N-A)/N;p
[1] 0.2
> EX=n*p;EX
[1] 1
> Fc=(N-n)/(N-1);Fc
[1] 0.5555556
> VX=n*p*q*Fc;fractions(VX)
[1] 4/9
DEMA - UFC
João Maurı́cio A. Mota 20
> sigma=sqrt(VX);sigma;fractions(sigma)
[1] 0.6666667
[1] 2/3
> mu_2=sum((x-EX)^2*fx);mu_2;fractions(mu_2)
[1] 0.4444444
[1] 4/9
>
> mu_3=sum((x-EX)^3*fx);mu_3;fractions(mu_3)
[1] 0
[1] 0
>
>
> mu_4=sum((x-EX)^4*fx);mu_4;fractions(mu_4)
[1] 0.4444444
[1] 4/9
>
> alfa_3=mu_3/(sigma)^(3/2);alfa_3
[1] 0
>
> alfa_4=mu_4/(sigma)^(4);alfa_4
[1] 2.25
>
> alfa_4 <3 ##### A distribuiç~
ao é platicúrtica.
[1] TRUE
>
>
>
> ####Calcule os momentos fatoriais.
>
> MF2=sum(x*(x-1)*fx);MF2;fractions(MF2)
[1] 0.4444444
[1] 4/9
>
>
> MF3=sum(x*(x-1)*(x-2)*fx);MF3;fractions(MF3)
[1] 0
[1] 0
>
>
> MF4=sum(x*(x-1)*(x-2)*(x-4)*fx);MF3;fractions(MF4)
[1] 0
[1] 0
>
DEMA - UFC
João Maurı́cio A. Mota 21
3 8
y 5−y
P (Y = y) = 10
I{0,1,2,3} (x)
5
3 7
y 5−y
P (Y = y) = 10
I{0,1,2,3} (y)
5
c. Qual a distribuição Z?
Z tem distribuição hipergeométrica de parâmetros N = 10, A = 5, e n = 5.
O suporte de Z é dado por;
5 5
z 5−z
P (Z = z) = 10
I{0,1,2,3,4,5} (z.)
5
d. Qual a f.g.m. de X?
Solução:
A f.p. de X é dada por:
2 5 2
P (X = x) = I{0} (x) + I{1} (x) + I{2} (x).
9 9 9
A f.g.m. de X é dada por:
2 5 t 2 2t 1
MX (t) = E(etX ) = 2 + 5et + 2 e2t .
+ e + e =
9 9 9 9
DEMA - UFC
João Maurı́cio A. Mota 22
e. Qual a f.g.p. de Y ?
A f.p. de Y é dada por:
1 5 5 1
P (Y = y) = I{0} (y) + I{1} (y) + I{2} (y) + I{3} (y).
12 12 12 12
A f.g.p. de Y é dada por:
1 5 5 2 1 3 1
GY (t) = E(tY ) = 2 + 5t + 5 t2 + t3 .
+ t+ t + t =
12 12 12 12 12
> N=10;A=3;n=5
>
> Ls=min(n,A);Ls
[1] 3
> Li=max(n+A-N,0);Li
[1] 0
>
> y=Li:Ls;y
[1] 0 1 2 3
>
> fy=dhyper(y,A,N-A,n);fy
[1] 0.08333333 0.41666667 0.41666667 0.08333333
> Fy=phyper(y,A,N-A,n);Fy
[1] 0.08333333 0.50000000 0.91666667 1.00000000
> taby=cbind(y,fy,Fy);fractions(taby)
y fy Fy
[1,] 0 1/12 1/12
[2,] 1 5/12 1/2
[3,] 2 5/12 11/12
[4,] 3 1/12 1
>
>
>
> N=10;A=5;n=5
>
> Ls=min(n,A);Ls
[1] 5
> Li=max(n+A-N,0);Li
[1] 0
>
> z=Li:Ls;z
[1] 0 1 2 3 4 5
DEMA - UFC
João Maurı́cio A. Mota 23
>
> fz=dhyper(z,A,N-A,n);fz
[1] 0.003968254 0.099206349 0.396825397 0.396825397 0.099206349 0.003968254
> Fz=phyper(z,A,N-A,n);Fz
[1] 0.003968254 0.103174603 0.500000000 0.896825397 0.996031746 1.000000000
> tabz=cbind(z,fz,Fz);fractions(tabz)
z fz Fz
[1,] 0 1/252 1/252
[2,] 1 25/252 13/126
[3,] 2 25/63 1/2
[4,] 3 25/63 113/126
[5,] 4 25/252 251/252
[6,] 5 1/252 1
>
>
1 25 100 100 25 1
P (Y = y) = I{0} (z)+ I{1} (z)+ I{2} (z)+ I{3} (z)+ I{4} (z)+ I{5} (z).
252 252 252 252 252 252
A 5
E(X) = n =5× = 2, 5.
N 10
pela saı́da do R a mediana de Z é med = (2 + 3)/2 = 2, 5. Vamos olhar o R
> med=qhyper(0.5,A,N-A,n);med
[1] 2
>
a mediana é o ponto z = 2.
7 Exercı́cios
1. Considere uma turma de 16 alunos do curso de Estatı́stica dos quais seis fizeram
vestibular em 2015,e o restante fez em 2016. Uma amostra de 4 estudantes é retirada
sem reposição. Encontre a probabilidade de que:
DEMA - UFC
João Maurı́cio A. Mota 24
a. Qual a distribuição de Xi , i = 1, 2, 3, 4?
b. Qual a distribuição de V = X1 + X2 ?
c. Qual a distribuição de U = X1 + X2 ?
d. Qual a média e variância de U ? e a de V ?;
e. Calcule a covariância entre X1 e X2 ?
f. Como ficariam suas respostas dos itens anteriores se a amostragem fosse com
reposição?
4. Uma fazenda tem 30% de suı́nos da raça Duroc, 20% de Landrace e 50% de Large-
White. Sorteando-se 9 animais dessa fazenda:
5. O rebanho leiteiro de uma região é composto por vacas nelore e gir na proporção
5:3. Determine a probabilidade de que num lote de 30 animais:
6. Numa pocilga há 18 suı́nos da raça landrace dos quais 3 são machos e 20 animais
da raça Large-White dos quais 5 são machos.
DEMA - UFC
João Maurı́cio A. Mota 25
DEMA - UFC