Você está na página 1de 11

Probabilidades e Processos Estocasticos

aula 07 - Tecnicas de contagem 3: bolas e caixas


1 Introducao
Na aula de hoje, n os vamos estudar o experimento das bolas e caixas. Nesse experimento, n os
imaginamos que m bolas s ao lan cadas aleatoriamente sobre n caixas que se encontram em la
(ver Figura abaixo).
Em geral, o resultado do experimento e denido pela conguracao nal das bolas nas caixas,
onde estamos interessados apenas na quantidade de bolas que caram em cada caixa. Mais
precisamente, o resultado e representado por uma tupla da forma (c
1
, c
2
, . . . , c
n
), onde c
i
indica
o n umero de bolas na caixa i e temos c
1
+ . . . + c
n
= m. Note que, ao denir as coisas dessa
maneira, n os estamos efetivmente assumindo que as bolas sao todas indistinguveis.
Apesar da sua aparencia ingenua, o experimento das caixas e bolas pode ser visto como uma
generaliza cao das estruturas combinat orias que estudamos nas ultimas duas aulas. Por exemplo,
para simular o experimento das permuta coes, basta considerar m = n, assumir que as bolas
s ao todas distintas e introduzir a restricao de que cada caixa deve receber exatamente 1 bola.
E, para simular o experimento da sele cao, n os assumimos novamente que as bolas s ao distintas,
consideramos apenas duas caixas e introduzimos a restricao de que a caixa 1 deve receber
exatamente k bolas. Essas observacoes indicam que as ideias que vimos nas aulas anteriores
poder ao ser aplicadas aqui para responder perguntas sobre o experimento das caixas e bolas.
Uma outra maneira util de ver o experimento das caixas e bolas consiste em imagina-lo como
o lan camento de uma moeda (ou dado) com n faces, onde o resultado e dado pelo n umero de
vezes que cada face apareceu. Esse ponto de vista apresenta o experimento como algo bastante
familiar e bem conhecido. De fato, no nal da aula n os vamos encontrar perguntas semelhantes
`as que foram feitas nas primeiras aulas do curso.
2 Espaco das tuplas aleatorias
Para formalizar o experimento das bolas e caixas, n os vamos denir o conjunto de possibilidades
como o seguinte conjunto de tuplas:
= {(c
1
, c
2
, . . . , c
n
) | 0 c
i
m e c
1
+. . . +c
n
= m}
Como vimos na Introdu cao, a ideia e que cada tupla (c
1
, c
2
, . . . , c
n
) corresponde a um resultado
possvel do experimento, onde o n umero c
i
indica a quantidade de bolas que caiu na i-esima
caixa.
A primeira observacao importante e que o espa co n ao e equiprovavel. Para ver isso, note
que existe apenas uma maneira de realizar o experimento e todas as bolas carem, digamos, na
caixa 1. Por outro lado, existem muitas maneiras distintas de realizar o experimento de modo
que exatamente uma bola caia em cada caixa (assumindo que n = m).
Para lidar com essa situa cao, n os vamos aplicar a ideia de introduzir uma distincao articial
entre as bolas, por exemplo, assumindo que elas est ao numeradas de 1 a m. Em termos formais,
essa suposi cao corresponde `a denicao de uma representacao alternativa para o resultado do
1
experimento:

= {(b
1
, b
2
, . . . , b
m
) | 0 c
i
m e c
1
+. . . +c
n
= m}
Ou seja, agora o resultado do experimento e representado pela tupla (b
1
, b
2
, . . . , b
m
), onde o
n umero b
j
indica a caixa em que a j-esima bola caiu. Como as bolas s ao atiradas de maneira
independente, n os podemos assumir que todos os resultados em

tem a mesma probabilidade


de ocorrer, o que corresponde `a denicao da seguinte funcao de probabilidades:
P

() =
1
|

|
e n ao e difcil ver que |

| = |C|
m
= n
m
, pois existem n op coes para escolher a caixa em que
cada uma das m bolas ir a cair. Portanto,
P

() =
1
n
m
, para todo

.
O espa co de probabilidade (

, P

) e chamado de espa co das tuplas aleat orias, uma vez que

e o conjunto de todas as m-tuplas que podem ser formadas com os elementos do conjunto
{1, 2, . . . , m}.
A seguir, n os observamos que cada elemento do espa co original corresponde a um subcon-
junto A

no espa co

. Isso signica que a sua probabilidade pode ser calculada como:


P() = P

(A

) =
|A

|
n
m
Exerccio: Mostre que a equacao acima pode ser usada para derivar a seguinte express ao para
a funcao de probabilidade P:
P(c
1
, c
2
, . . . , c
n
) =
m!
c
1
! . . . c
n
!

1
n
m
(Voce consegue relacionar essa express ao com as permuta coes com elementos repetidos?)
A seguir, n os vamos investigar alguns fatos interessantes sobre o experimento das bolas e caixas,
assumindo que o n umero de bolas e igual ao n umero de caixas (i.e., m = n).
Exemplos:
a. Qual a probabilidade de que todas as bolas caiam na primeira caixa?
Dena o evento
A = todas as bolas na caixa 1
Observe que esse evento corresponde a um unico ponto do espa co

: a tupla (1, 1, . . . , 1),


que indica que todas as bolas cairam na caixa 1. Portanto,
P(A) =
1
|

|
=
1
n
n
Argumento probabilstico: Podemos chegar `a mesma resposta imaginando que as bolas s ao
atiradas uma de cada vez. A probabilidade de que a primeira bola caia na caixa 1 e igual a
1/n, e essa probabilidade e a mesma para todas as outras bolas. Portanto,
P(A) =
_
1
n
_
n
=
1
n
n

2
b. Qual a probabilidade de que todas as bolas caiam na mesma caixa?
Essa pergunta e uma varia cao simples do exemplo anterior. Dena o evento:
B = todas as bolas na mesma caixa
e observe que ele corresponde ao seguinte subconjunto de

{(1, 1, . . . , 1), (2, 2, . . . , 2), . . . , (n, n, . . . , n)}


Portanto
P(B) =
n
n
n
=
1
n
n1
Argumento probabilstico: Imagine novamente que as bolas s ao atiradas uma de cada vez.
A caixa em que a primeira bola cai n ao e importante, mas a segunda bola precisa cair
nessa mesma caixa, e isso ocorre com probabilidade 1/n. A terceira bola tambem tem
probabilidade 1/n de cair na mesma caixa que a primeira bola, e assim por diante. Portanto,
P(B) =
_
1
n
_
n1
=
1
n
n1

c. Qual a probabilidade de que nenhuma bola caia na primeira caixa?


Dena o evento:
C = nenhuma bola na caixa 1
Note que esse evento corresponde ao subconjunto C

formado por todas a tuplas que


n ao contem o n umero 1:
C

= {(b
1
, b
2
, . . . , b
n
) | b
i
{2, 3, . . . , n}}
Nao e difcil ver que |C

| = (n 1)
n
, e da obtemos
P(C) =
(n 1)
n
n
n
=
_
n 1
n
_
n
Argumento probabilstico: Imagine novamente que as bolas s ao atiradas uma de cada vez. A
primeira bola n ao pode cair na primeira caixa, e isso ocorre com probabilidade (n 1)/n.
Essa probabilidade e a mesma para todas as bolas, portanto,
P(C) =
_
n 1
n
_
n1
=
_
n 1
n
_
n
Uma observacao interessante e que, quando n e um n umero muito grande, essa probabilidade
se torna independente de n:
_
n 1
n
_
n
=
_
1
1
n
_
n

1
e
, quando n .
Ou seja, quando o n umero de caixas e bolas e muito grande, um pouco mais do que um
ter co das caixas cam vazias quando as bolas s ao atiradas aleatoriamente.

d. Qual a probabilidade de que nenhuma bola caia nas primeiras k caixas?


Essa pergunta e uma simples generaliza cao do exemplo anterior. Dena o evento:
D = nenhuma bola nas caixas 1, 2, . . . , k
3
e observe que ele corresponde ao seguinte subconjunto de

:
D

= {(b
1
, b
2
, . . . , b
n
) | b
i
{k + 1, . . . , n}}
Portanto
P(D) =
|D

|
n
n
=
(n k)
n
n
n
=
_
n k
n
_
n
Mais uma vez, o resultado se torna independente do n umero de caixas e bolas quando n e
um n umero muito grande (e assumimos que k est a xo):
_
n k
n
_
n
=
_
1
k
n
_
n
=
_
_
1
1
n/k
_
n/k
_
k
=
_
_
1
1
m
_
m
_
k
onde m = n/k. Agora, quando n tende ao innito e k est a xo, n os tambem temos que m
tende ao innito, e da
_
_
1
1
m
_
m
_
k

1
e
k

e. Qual a probabilidade de que nenhuma caixa que vazia?


Dena o evento:
E = nenhuma caixa vazia
Quando atiramos n bolas sobre n caixas e nenhuma das caixas ca vazia, isso signica que
cada caixa contem exatamente uma bola, e que todas as bolas cairam em caixas diferentes.
Portanto, o subconjunto E

que corresponde a esse evento consiste precisamente no con-


junto de todas as permuta coes de {1, 2, . . . , n}. Essa observacao nos mostra imediatamente
que |E

| = n!, e da
P(E) =
n!
n
n
A seguir, n os podemos tentar aplicar a aproximacao de Stirling (i.e., n!
_
n
e
_
n

2n), para
ver se conseguimos alguma coisa mais simples e facil de interpretar:
P(E)
_
n
e
_
n

2n
n
n
=

2n
e
n
Nesse caso, no entanto, a unica informa cao que obtemos que essa probabilidade e um n umero
muito pequeno.
Outro argumento: Uma outra maneira de chegar `a mesma resposta consiste em imaginar
que as bolas s ao atiradas uma de cada vez, e considerar a probabilidade de que cada uma
delas caia em uma caixa vazia.
A probabilidade de que a primeira bola caia em uma caixa vazia e igual a 1, e claro. No
momento do lan camento da segunda bola, existem exatamente n1 caixas vazias, portanto
a probabilidade de que a segunda bola caia em uma caixa vazia e igual a (n 1)/n. Em
geral, assumindo que ate o k-esimo lan camento todas as bolas caram em caixas vazias, no
momento do lan camento da bola k +1, existem exatamente (n k) caixas vazias. Portanto,
a probabilidade de que a bola k + 1 caia em uma caixa vazia e igual a (n k)/n.
Isso nos d a
P(E) =
n
n

n 1
n

n 2
n
. . .
1
n
=
n!
n
n

4
f. Qual a probabilidade de que apenas a primeira caixa que vazia?
Dena o evento:
F = apenas a primeira caixa vazia
Antes de calcular a probabilidade do evento F, e importante analisar as restricoes que ele
dene sobre a distribuicao das bolas entre as caixas (ver Figura abaixo).
1 2 3 4 n-1 n . . .
Especicamente, o evento implica que
i. a caixa 1 ca vazia
ii. existe uma caixa com 2 bolas
iii. todas as outras n 2 caixas contem exatemente 1 bola
O pr oximo passo consiste em determinar o n umero de tuplas em

que satisfazem essas


condi coes. Para isso, n os observamos que
1. existem (n 1) maneiras distintas de escolher a caixa que receber a 2 bolas;
2. existem
_
n
2
_
maneiras distintas de escolher as 2 bolas que ser ao colocadas nessa caixa; e
3. existem (n 2)! maneiras distintas de distribuir as n 2 bolas restantes entre as outras
caixas, evitando a caixa 1.
Portanto,
P(F) =
(n1)(
n
2
)(n2)!
n
n
=
(
n
2
)(n1)!
n
n
Outro argumento: Ao examinar a forma simplicada da express ao que encontramos para a
probabilidade P(F), nos ocorre uma outra ideia para chegar a essa mesma resposta.
Suponha que, antes de lan car as bolas sobre as caixas, n os removemos duas delas do grupo,
digamos a bola i e a bola j, e colocamos uma nova bola (ij) em seu lugar. Em seguida, n os
distribumos as n 1 bolas entre as caixas, colocando exatamente uma bola em cada caixa,
sem utilizar a caixa 1. Finalmente, depois que as bolas foram distribudas, n os trocamos a
bola (ij) pelas bolas i e j. Nao e difcil ver que esse procedimento produz uma conguracao
como a ilustrada na Figura acima.
Para determinar o n umero de maneiras distintas com que podemos realizar o procedimento,
observe que:
1. existem
_
n
2
_
maneiras distintas de escolher as bolas i e j
2. existem (n 1)! maneiras distintas de distribuir as n 1 bolas, colocando uma em cada
caixa e evitando a caixa 1.
Portanto,
P(F) =
_
n
2
_
(n 1)!
n
n

g. Qual a probabilidade de que exista exatamente uma caixa vazia?


Essa pergunta e uma variante simples do exemplo anterior.
Exerccio: Calcule essa probabilidade utilizando um raciocnio semelhante ao que foi apre-
sentado no tem anterior.
Outro argumento. Denote o evento associado `a pergunta acima por G, e dena a seguinte
famlia de eventos:
5
G
j
= apenas a j-esima caixa vazia
para j = 1, 2, . . . , n.
Entao, n ao e difcil ver que
G = G
1
G
2
. . . G
n
Alem disso, note que todos os eventos G
j
s ao disjuntos e simetricos e, em particular, o evento
G
1
e exatamente o evento F denido no tem anterior. Portanto,
P(G) = P(G
1
) + . . . + P(G
n
)
= n P(G
1
)
= n P(F)
= n
(
n
2
)(n1)!
n
n

3 Estimando n umeros medios


As perguntas que temos estudado ultimamente sempre come cam com Qual a probabilidade de
. . . . No entanto, no incio da disciplina n os tambem calculamos n umeros medios e estimamos o
tempo medio ate que um certo evento ocorra pela primeira vez. A seguir, n os vamos considerar
algumas perguntas desse tipo novamente.
a. Quantas caixas cam vazias quando atiramos n bolas aleatoriamente sobre n caixas?
Lembre do argumento padrao para responder esse tipo de pergunta: n os repetimos o experi-
mento k vezes, onde k e um n umero muito grande, contamos o n umero N
i
de caixas vazias
na i-esima repeticao do experimento, e calculamos a media aritmetica desses n umeros:

i
N
i
k
Para estimar o valor do somat orio

i
N
i
, n os vamos utilizar o resultado do exemplo (a) da
Se cao 2: a probabilidade de que a caixa 1 que vazia e aproximadamente igual a 1/e.
Portanto, como s ao k repeticoes do experimento, isso signica que veremos a caixa 1 vazia
em aproximadamente k/e repeticoes. Alem disso, e facil ver que o mesmo vale para todas
as outras n 1 caixas. Assim, n os podemos concluir que

i
N
i
= n
k
e
e da chegar `a resposta de que, em media, n/e caixas cam vazias quando atiramos n bolas
aleatoriamente sobre n caixas.

b. Quantas caixas recebem exatamente k bolas, quando atiramos n bolas sobre n caixas?
Essa pergunta e uma simples generaliza cao do exemplo anterior, e pode ser respondida
utilizando o mesmo tipo de argumento. Mas, para isso, e preciso calcular a probabilidade
de que a caixa 1 receba exatamente k bolas em uma realiza cao do experimento.
Vamos calcular essa probabilidade contando o n umero de tuplas em

que satisfazem essa


condi cao. Observe que,
existem
_
n
k
_
maneiras distintas de escolher as k bolas que vao car na caixa 1;
existem (n1)
nk
maneiras distintas de distribuir as nk bolas restantes entre as outras
n 1 caixas.
6
Da, n os conclumos que
P(k bolas na caixa 1) =
(
n
k
)(n1)
nk
n
n
=
n(n1)...(nk+1)(n1)
nk
k! n
n
Quando k e um n umero pequeno com rela cao a n, a seguinte aproximacao e razo avel:
n (n 1) . . . (n k + 1) (n 1)
k
e isso permite obter uma express ao bastante simples para a probabilidade que estamos
calculando:
P(k bolas na caixa 1)
1
k!

_
n 1
n
_
n

1
k!

1
e
Assim, para valores pequenos de k, n os podemos dizer que obtemos, em media,
n
ek!
caixas
com exatamente k bolas, quando atiramos n bolas aleatoriamente sobre n caixas. Veja que,
para k = 1, essa express ao se reduz a n/e. Ou seja, o n umero medio de caixas vazias e o
n umero medio de caixas com exatamente 1 bola e o mesmo.

c. Qual o n umero de bolas na caixa mais cheia, quando atiramos n bolas sobre n caixas?
O argumento que vamos apresentar a seguir n ao e muito rigoroso, mas permite obter uma
boa aproximacao para a resposta correta.
No exemplo anterior, n os obtivemos o resultado de que, em media,
n
ek!
caixas recebem
exatamente k bolas, quando n bolas s ao atiradas aleatoriamente sobre n caixas. Veja que
o valor dessa express ao diminui (rapidamente) a medida que aumentamos o valor de k.
Em particular, n os podemos considerar o valor k
o
que faz com que essa express ao seja
aproximadamente igual a 1:
n
e k
o
!
1 (1)
Aqui, e importante relembrar a interpretacao dessa equacao: quando n bolas s ao atiradas
aleatoriamente sobre n caixas, n os obtemos, em media, 1 caixa com exatamente k
o
bolas.
Isso signica (e essa e a parte pouco rigorosa do argumento) que, em uma realiza cao tpica
do experimento, n os esperamos ver ao menos uma caixa com exatamente k
o
bolas, mas
nenhuma caixa com mais bolas do que isso (pois, para valores maiores do que k
o
, o n umero
medio acima e menor do que 1).
Portanto, o n umero m aximo de bolas na caixa mais cheia e (aproximadamente) igual a k
o
.
Agora, e preciso resolver a equac ao acima para obter uma express ao para k
o
em termos
do par ametro n. Aplicando uma vers ao simplicada da aproximacao de Stirling
1
, fazendo
algumas manipulacoes algebricas, e calculando o logaritmo natural em ambos os lados, a
Equa cao 1 se reduz a
k
o
ln(k
o
) k
o
ln(n) 1
Em seguida, (ap os um algum esforco de tentativa e erro) descobre-se que o valor de k
o
que
satisfaz essa equacao est a em torno de
ln(n)
lnln(n)
.
De fato, substituindo as ocorrencias de k
o
por essa express ao na equacao acima e fazendo
as contas, verica-se que o lado esquerdo ca um pouco menor do que o lado direito. Por
outro lado, repetindo esse procedimento com a express ao
2ln(n)
lnln(n)
, verica-se que o lado es-
querdo ca consideravelmente maior do que o lado direito. Portanto, a resposta correta
2
e
aproximadamente
ln(n)
lnln(n)
.

1
k!

k
e

k
2
An alises mais rigorosas do problema provam que a probabilidade de que alguma caixa receba mais que
3ln(n)
lnln(n)
bolas tende a zero quando n e grande, e esse fato e consistente com a an alise que nos apresentamos.
7
d. Qual o momento em que, pela primeira vez, uma bola cai em uma caixa que n ao esta vazia?
(. . .)

e. Quantas bolas que precisam ser atiradas sobre n caixas ate que nenhuma delas que vazia?
Para responder essa pergunta, vamos dividir o processo em etapas, onde cada etapa se
encerra quando uma bola cai em uma caixa vazia:
a etapa E
1
se encerra quando uma bola cai pela primeira vez em uma caixa vazia; e facil
ver que essa etapa consiste apenas no lan camento da primeira bola;
a etapa E
2
e iniciada imediatamente ap os a etapa E
1
, e se encerra no momento em que
uma bola cai em uma caixa vazia pela segunda vez (note que a duracao dessa etapa e
aleatoria);
em geral, a etapa E
k
e iniciada imediatamente ap os a etapa E
k1
, e se encerra no
momento em que uma bola cai em uma caixa vazia pela k-esima vez.
Denote por |E
k
| o n umero medio de bolas lan cadas durante a etapa E
k
. O valor de |E
k
|
pode ser calculado observando-se que, durante toda a etapa E
k
, temos sempre k 1 caixas
ocupadas e nk+1 caixas vazias. Ou seja, tudo se passa como se estivessemos lan cando uma
moeda desbalanceada ate obter o resultado Cara, onde P(Cara) =
nk+1
n
. Pelos resultados
das primeiras aulas, sabemos que |E
k
| =
n
nk+1
.
Finalmente, a resposta da pergunta inicial pode ser calculada por:

n
k=1
|E
k
| =

n
k=1
n
nk+1
= n
_
1
n
+
1
n1
+. . . +
1
2
+
1
1
_
n ln(n)

8
Exerccios
1. Imagine que n bolas numeradas de 1 a n s ao atiradas aleatoriamente sobre n caixas
tambem numeradas de 1 a n.
a. Qual a probabilidade de que as bolas se acomodem em ordem crescente nas caixas?
(Note que, para isso, n ao podemos ter duas bolas na mesma caixa.)
b. Qual a probabilidade de que ao menos uma caixa receba a bola com o seu n umero?
c. Qual a probabilidade de que nenhuma caixa receba uma bola com um n umero maior
do que o seu?
d. Qual a probabilidade de que nenhuma bola com n umero par caia em uma caixa com
n umero mpar?
2. Faca o exerccio indicado na p agina 2.
3. Faca o exerccio indicado no exemplo (g) da Se cao 2.
4. Qual a probabilidade de que exatamente 2 caixas quem vazias, quando atiramos n bolas
sobre n caixas aleatoriamente?
5. Imagine que n bolas brancas e n bolas pretas s ao atiradas aleatoriamente sobre n caixas.
a. Qual a probabilidade de que a caixa 1 contenha ao menos uma bola de cada cor?
b. Estime o n umero medio de caixas que contem bolas apenas de uma cor.
6. Imagine que 2n bolas s ao atiradas aleatoriamente sobre n caixas.
a. Qual a probabilidade de que a caixa 1 que vazia?
b. Estime o n umero medio de caixas que cam vazias.
7. Qual a probabilidade de que nenhuma caixa receba mais do que duas bolas, quando
atiramos n bolas sobre n caixas aleatoriamente?
9
Apendice:
Outro argumento: Existe uma outra maneira de responder essa pergunta, que n ao envolve
n umero medio. Considere o evento:
A = ao menos uma caixa vazia, quando atiramos m bolas sobre n caixas
Note que esse e o complemento do evento nenhuma caixa vazia. Alem disso, quando o n umero
m de bolas atiradas sobre as caixas aumenta, a probabilidade do evento A ca cada vez menor,
e por consequencia, a probabilidade do evento nenhuma caixa vazia ca cada vez maior. A ideia,
entao, e encontrar um valor de m que faca com que a probabilidade de A que muito pequena.
Para estimar a probabilidade do evento A, vamos considerar a seguinte famlia de eventos:
B
i
= i-esima caixa vazia, quando atiramos m bolas sobre n caixas, para i = 1, 2, . . . , n.
Nao e difcil ver que
A =
_
i
B
i
No entanto, um pouco de reexao mostra que os eventos B
i
n ao s ao disjuntos (i.e., existem
tuplas de que pertencem a mais de um B
i
). Da, que n ao podemos calcular a cardinalidade
de A como a soma das cardinalidades dos eventos B
i
, pois estaramos contando a mesma tupla
mais de uma vez. No entanto, sempre podemos dizer que
|A|

i
|B
i
| (2)
e vamos utilizar esse fato para obter um limite superior para a probabilidade do evento A.
O primeiro passo consiste em calcular a probabilidade do evento B
i
, e deixaremos como exerccio
a verica cao de que:
P(B
i
) =
_
_
1
1
n
_
n
_
m/n

1
e
m/n
(3)
quando m n s ao n umeros grandes.
Agora, a Equa cao (1) nos d a diretamente que:
P(A)

i
P(B
i
)
e utilizando o resultado acima, obtemos
P(A) n
1
e
m/n
(4)
Observe que, se m = n, o limite superior se reduz a uma express ao simples
P(A)
n
e
mas n ao informativa, pois
n
e
> 1 (lembre que toda probabilidade e menor ou igual a 1).
Para obter alguma informa cao util do limite da Equa cao (3), e preciso que
n
e
m/n
< 1 n < e
m/n
ln(n) < m/n
n ln(n) < m
10
Tendo em vista a forma do limite da Equa cao (3), vamos tomar m = 2n ln(n) para obter:
P(A)
n
e
2ln(n)
=
n
n
2
=
1
n
(5)
A conclusao a que chegamos depois de todas essas contas e a seguinte: ap os atirarmos 2nln(n)
bolas aleatoriamente sobre n caixas, a probabilidade de que ainda reste alguma caixa vazia e
praticamente zero, quando n e muito grande. Em outras palavras, n ao e preciso atirar mais do
que 2nln(n) bolas para que nenhuma caixa que vazia, com alta probabilidade.
11

Você também pode gostar