Você está na página 1de 15

PROBABILIDADES NO FUTEBOL

Bernardo Nunes Borges de Lima


Fabio Brochero
Gilcione Costa
Gustavo Zeferino
Marcelo Terra Cunha
Renato Vidal Martins
Nota. Os autores partipam do Projeto Probabilidades no Futebol, com
apoio da FAPEMIG atraves do Edital de Popularizacao da Ciencia e
Tecnologia.
O interesse por probabilidades em assuntos pouco cientcos e algo
que vem de longa data. As chances de ganhar na loteria, de sair a carta
que eu quero, de encontrar minha alma gemea s ao algumas dentre
tantas preocupac oes comuns, de pessoas comuns, que `as vezes esperam
dos matem aticos, sen ao uma resposta cabal, ao menos lampejo de que
ainda vale a pena alimentar uma esperanca.
E quando o tema e futebol a coisa mais importante, dentre as
menos importantes o interesse aumenta. Aumenta `a medida em que
o campeonato vai chegando a termo, a sina de cada time se desenha,
e o torcedor, a propria mdia, vao atras dos matem aticos como se ` a
procura de um profeta.
Nessas horas perde-se muitas vezes uma otima oportunidade de di-
vulgac ao da Matem atica. Se a postura vai na linha eis aqui os n umeros
que voces querem, o matem atico segue sendo um ente inatingvel, pos-
suidor de uma ciencia oculta, acessvel talvez a uns poucos agraciados
com dom sabe-se la de que ordem. Uma resposta no estilo calcule
voce as probabildades de seu time, alem de mais salutar, e muito
mais honesta.
A verdade e que ha pouco misterio por tras do binomio Probabil-
idades no Futebol. Os modelos sao robustos o bastante para con-
cluirmos que se algum deles n ao funciona, n ao e bem porque seu autor
n ao entende de matem atica; o que ele nao entende e de futebol. De
fato, o metodo de c alculo de probabilidades atraves de simulac oes de re-
sultados e de praxe em todo e qualquer modelo. O que varia de modelo
para modelo e o modo como simular um jogo em concreto, e a contam
1
2 PROBABILIDADES NO FUTEBOL
muito mais nossos conhecimentos futebolsticos, do que propriamente
matem aticos.
O que fazemos nestas breves linhas e, primeiro, fundamentar com o
m aximo de rigor te orico cabvel o metodo de simulac oes, que e o prin-
cipal instrumento de que dispomos na estimativa de probabilidades. E,
na sequencia, exibimos um modelo de previsao para um campeonato
dito de pontos corridos. As duas partes sao independentes e esper-
emos que especialmente a segunda enseje o leitor a criar seu pr oprio
modelo, e assim estara comprovando o que dizemos acima.
1. A Lei dos Grandes N

umeros
`
a luz do Futebol
No ensino medio talvez tenham nos ensinado que para sabermos a
probabilidade de um determinado evento, temos de contar, dentre todas
as possibilidades em questao, quais s ao os casos que lhe correspondem.
Ou mais precisamente
(1) probabilidade =
n
o
de casos favoraveis
n
o
de casos possveis
.
H a pelo menos dois problemas serios na denic ao acima. O primeiro
e de ordem computacional, i.e., o total de casos a serem considera-
dos pode ser assustadoramente grande. Imagine o leitor, por exemplo
em um campeonato de futebol com 20 times, o que signicaria casos
possveis a 15 rodadas do nal. Levando-se em conta somente o re-
sultado de cada jogo vit oria de um, de outro, ou empate em uma
rodada sao 3
10
os cenarios imagin aveis. Em 15 rodadas este n umero
sobe para 3
150
. Bem, em tese, 3
150
(aproximadamente 3 10
71
) e ate
trat avel em um compudador. De fato, para sistemas criptogr acos
seguros s ao usados c odigos de tamanho ate 2
1024
, como e o caso da
nova codicac ao do Banco do Brasil, por exemplo. Agora, o que e ab-
solutamene impraticavel e gerar em tempo nito todos os universos
possveis. Assim, por exemplo, se cada caso fosse gerado em 1 milesimo
de segundo, o computador gastaria 1, 1810
59
seculos para gerar todos
eles.
Mas mesmo supondo fossem nossos computadores de uma gerac ao
vindoura, capazes de arrostar grandezas estelares, ainda assim per-
sistiria um outro problema, agora de ordem pratica: todos sabemos
que nem o primeiro colocado vai perder seus 15 jogos restantes, muito
menos o ultimo colocado vencer 15 jogos em sequencia. H a muitos
cen arios que devem ser descartados ou, ao menos, nao tem direito de
entrar na conta casos possveis com o mesmo peso do que outros
cen arios bem mais viaveis.
PROBABILIDADES NO FUTEBOL 3
Isto nos leva a reetir sobre o pr oprio conceito de probabilidade.
O fato e que no incio do seculo passado, alguns probabilistas se de-
votaram a responder precisamente esta mesma pergunta: anal de
contas, o que e probabilidade?. O problema se inseria dentro de um
contexto mais amplo: a Geometria tambem se perguntava sobre o que
e um ponto, a Teoria dos Conjuntos sobre o que e um conjunto, e
a

Algebra sobre o que e um n umero. O resultado deste esforco e
o que se conhece por axiom atica e a resposta ` as perguntas acima
foi a seguinte: ponto, conjunto, n umero e tambem probabilidade, sao
conceitos que n ao se denem. A grosso modo, simplesmente est ao a
e podem ser reconhecidos pelas propriedades que satisfazem.
Ent ao probabilidade e isto: algo que n ao se dene, mas que existe,
e que satisfaz algumas regras.

E logico que e um pouco decepcionante.
Pior, as tais regras nao e que sejam assim tantas. O principal nome
associado a elas e o de Kolmogorov, e para que o leitor tenha uma
ideia, se lhe perguntassemos, por exemplo, quais as chances de um
time sagrar-se campe ao brasileiro, se limitaria a dizer:
(i) a probabilidade de um time ser campeao e pelo menos 0%;
(ii) a probabilidade de um time mineiro ser campeao e a soma das
probabilidades de Atletico e Cruzeiro o serem;
(iii) a probabilidade de um time brasileiro ser campe ao e 100%,
e caramos na d uvida ser ele matem atico ou poltico.
O que realmente surpreende e que, na realidade, a resposta acima
fornece todos os elementos necess arios para que possamos de fato esti-
mar a probabilidade de um determinado time ser campe ao brasileiro.
Ou seja, dos Axiomas de Kolmogorov dos quais os tres itens acima
s ao mera adaptac ao se deduz matematicamente a Lei dos Grandes
N umeros, e esta sim fundamenta um metodo de calculo de probabili-
dades bem preciso, i.e., o metodo de simula coes.
Em outras palavras, tomando como ponto de partida o que existe de
mais b asico capaz de tipicar o verbete probabilidade, ou seja, que
esta oscila entre 0 e 1 e que para uniao disjunta, soma-se probabilidades
(Axiomas de Kolmogorov) segue-se um resultado importantssimo: a
probabilidade de um evento e a razao entre o n umero de ocorrencias
do mesmo e o n umero de ensaios quando este tende a innito (Lei dos
Grandes N umeros). Ou mais precisamente
(2) probabilidade = lim
n
n
o
de ocorrencias em n ensaios
n
.
Portanto, se quisermos realmente saber qual a probabilidade de um
dado time ser campeao, o que temos de fazer e repetir in umeros campe-
onatos e ver em quantos deles o clube leva a melhor. Quanto mais
4 PROBABILIDADES NO FUTEBOL
edic oes, mais preciso o c alculo. Um total de 3 ttulos em 4 campeonatos
jogados e bem menos signicativo do que, digamos, 612 conquistas em
1000 disputas. A probabilidade real da equipe erguer a ta ca n ao e entao
de 75%, como a princpio se cogitava, mas gira em em torno de 60%.
Ora, o leitor arrazoado dir a que e impossvel repetir mil campeonatos
e com raz ao. Mas nao iremos realizar mil campeonatos e sim sim-
ular n ao s o mil, mas milhares e ate milhoes deles se for necassario.
O computador faz isto em segundos ou quando muito minutos. Tudo
o que temos de fazer e ensina-lo a sortear de forma judiciosa o re-
sultado de cada jogo. Na Se cao 2 propomos um modelo de c alculo
que esperemos elucide o leitor e nas pr oximas subsec oes daremos uma
roupagem formal a tudo o que foi dito acima. A equa cao (2) sera ap-
resentada com rigor no Teorema 1.10, a equacao (1) corresponder a ao
caso de equiprobabilidade.
1.1. Espacos de Probabilidade. Nesta subsec ao introduzimos os
primeiros conceitos em teoria de probabilidades, chamando a aten cao
do leitor apenas para o fato de que nossos espacos de probabilidades
ser ao aqui sempre nitos.
Denicao 1.1 (Axiomas de Kolmogorov). Seja um conjunto
nito e nao vazio e P() o conjunto das partes de , i.e., o conjunto
dos subconjuntos de . Seja P : P() R uma funcao. O par (, P)
e dito um espaco de probabilidades se P satisfaz:
(i) P(A) 0 para todo A P();
(ii) P(A
1
A
2
) = P(A
1
) + P(A
2
) se A
1
e A
2
sao disjuntos.
(iii) P() = 1.
O conjunto e denominado espaco amostral e seus subconjuntos sao
chamados de eventos. A funcao P e dita probabilidade.

E facil ver da denicao acima que para todo evento A P() temos
0 P(A) 1. De fato, se A
c
e o complementar de A em ent ao
0 P(A) P(A) + P(A
c
) = P() = 1.
O exemplo que mais nos interessa e o espaco amostral constitudo
pelos resultados possveis de um campeonato em que todos os times
se enfrentam. No caso mais simples, que ja podemos chamar campe-
onato, ha tres times, digamos G,R,C (de Galo, Raposa e Coelho, por
exemplo) e tres jogos:
Jogo 1 : GR
Jogo 2 : GC
Jogo 3 : R C
PROBABILIDADES NO FUTEBOL 5
e digamos que a sequencia GCE signica que G venceu o primeiro
jogo, C o segundo e houve empate no terceiro. O espaco amostral que
queremos e ent ao
=
_
_
_
GGR GGE GGC GER GEE GEC GCR GCE GCC
EGR EGE EGC EER EEE EEC ECR ECE ECC
RGR RGE RGC RER REE REC RCR RCE RCC
_
_
_
.
A cada uma das sequencias acima est a associado um n umero que oscila
entre 0 e 1 que e justamente a sua probabilidade de ocorrencia. E a
soma destes 27 n umeros e 1. Usando a pontuac ao usual por jogo, e
supondo que dois ou tres times que empatam em pontos na primeira
colocac ao sao decretados campe oes, temos que o evento G e campe ao
corresponde ao subconjunto de dado por
(3) A =
_
_
_
GGR GGE GGC GER
GEE GEC GCR EGR
EGE EGC EEE RGC
_
_
_
cuja probabilidade e a soma das probabilidades de ocorrencia de cada
uma das sequencias acima. No caso de um campeonato com 20 times
onde estes se enfrentam em turno e returno, como, por exemplo, e o
Brasileir ao, o espaco amostral teria 3
380
elementos.
Para , seja p

:= P({}). Ent ao para todo A P() temos


P(A) =

A
p

.
Em termos menos formais, se formos realizar um sorteio onde e o
conjunto das op coes de nosso sorteio, ent ao p

e a probabilidade do
resultado do sorteio ser .
Um caso particular de extrema importancia e quando assumimos que
todos os possveis resultados do nosso sorteio s ao equiprov aveis, isto
e, p

= 1/# para todo . Neste caso, temos que a probabilidade


de um evento A P() ocorrer e dada por
(4) P(A) =
#A
#
.
Ou seja, o problema do calculo de probabilidade se resume a um prob-
lema de contagem, j a que a probabilidade de ocorrencia de qualquer
evento A e dada pela proporc ao entre o n umero de elementos de A e
o n umero de elementos do espaco amostral . Repare o leitor que (4)
e nada mais que (1) dita em termos formais. No nosso exemplo acima
de um campeonato com tres times, a probabilidade de G (ou qualquer
um deles) ser campeao seria ent ao 12/27.
6 PROBABILIDADES NO FUTEBOL
Denicao 1.2. Seja (, P) espaco de probabilidade, A e B eventos
tais que P(B) = 0. Denimos a probabilidade condicional de A
dado B como
(5) P(A|B) =
P(A B)
P(B)
.
Dois eventos quaisquer A, B sao ditos independentes se
(6) P(A B) = P(A)P(B)
Formalmente, P(A|B) e a proporcao que o evento A B ocupa no
evento B. Intuitivamente, podemos pensar em P(A|B) como a proba-
bilidade de acontecer A dado que ocorreu B. Se compomos (5) com (6)
(e supomos P(A) = 0 = P(B)), obtemos que A e B s ao independentes
se P(A|B) = P(A) ou P(B|A) = P(B). Fica ent ao bem mais claro o
conceito de independencia, i.e., A e B s ao independentes se a ocorrencia
de algum deles n ao altera as chances de que o outro aconteca.
Voltemos ao nosso exemplo do campeonato de tres times. Vamos
supor que G nunca empata, tem iguais chances de vencer ou perder
o primeiro jogo, sendo que se vence-lo, vence o segundo jogo com 3/4
de probabilidade, e se perde-lo, a chance de vitoria no segundo jogo
cai para 1/3. Denotemos por V
i
o evento vitoria no i-esimo jogo.

E
l ogico ent ao que V
1
e V
2
n ao s ao eventos independentes posto que se
G leva a melhor no primeiro jogo, aumentam as suas chances de sair
vitorioso no segundo. Em n umeros temos
P(V
2
|V
1
) = 3/4 > 13/24 = P(V
2
).
1.2. Variaveis Aleatorias. A mais clara aplicac ao que norteia a Teo-
ria de Probabilidades e exatamente o c alculo das mesmas. De alguma
forma precisamos fazer contas, e contas se fazem com n umeros. Porem,
o leitor observar a que os espacos amostrais nao sao necessariamente
constitudos por entidades numericas como se deduz dos proprios ex-
emplos que demos acima. Por isso, dependo do que queremos estimar,
precisamos relacionar valores numericos aos elementos de um espaco
amostral. Isto motiva a deni cao que se segue.
Denicao 1.3. Seja (, P) um espaco de probabilidade. Uma variavel
aleat oria e uma funcao
X : R.
Denotamos por o conjunto imagem de X.
PROBABILIDADES NO FUTEBOL 7
No exemplo que demos acima, se quisermos avaliar o desempenho de
um determinado time, digamos G mais uma vez, ha algumas vari aveis
alea orias interessantes a se considerar. Por exemplo, X : {1, 2, 3}
que avalia a colocac ao do time G. Temos ent ao, e.g., que X(GGR) = 1,
X(RGR) = 2, X(RCR) = 3 e, pelas nossas conven coes, X(EGR) = 1.
Ent ao a probabilidade de G ser campe ao e lida agora por P(X = 1) e
a de que n ao seja G ultimo isolado por P(X 2).
Outro exemplo de vari avel aleat oria relevante para o mesmo espaco
amostral e o n umero de pontos que G soma ao nal do campeonato,
dada por X : {0, 1, 2, 3, 4, 6}. Segue, e.g., que X(RCE) = 0,
X(EGE) = 4 e X(GGC) = 6.
Para A denimos a variavel aleat oria I
A
: {0, 1} dada por
I
A
() =
_
1 se A
0 se / A.
Na pr atica, a vari avel aleatoria I
A
indica o sucesso ou fracasso de
um determinado evento A atraves dos valores 1 e 0. A probabilidade de
que o evento A ocorra e P(I
A
= 1), sendo P(I
A
= 0) a probabilidade
de que nao ocorra. Os termos sucesso e fracasso, entenda-se, n ao
guardam necessariamente relacao de benefcio ou perda para os eventu-
ais interessados. A ttulo de exemplo, se o evento em foco e derrota,
a mesma ser a dita sucesso cada vez que ocorrer.
No Campeonato Brasileiro, aquele para o qual # = 3
380
, estamos
interessados em perguntas do tipo o Internacional ser a campe ao?, o
Santo Andre ser a rebaixado?, com 63 pontos, um time se classica
para a Copa Libertadores?. Todas elas correspondem a eventos (que
s ao subconjuntos de ) e a cada um destes esta associado uma vari avel
aleat oria, denida como acima, que indica a sua ocorrencia.
Ate aqui nossos exemplos foram est aticos por assim dizer. Vamos
supor agora que nos interessamos n ao apenas por um campeonato,
mas por uma sequencia deles. Por exemplo, uma sequencia de quatro
campeonatos de tres times tem por espa co amostral o conjunto com
27
4
elementos

4
=
e, por exemplo, para o elemento (GEC, REE, REC, GGC)
4
vemos
que G e campe ao no primeiro e no quarto campeonato, vice no segundo
e ultimo no terceiro. Podemos tambem passar do evento G campeao
correspondente ao conjunto A de 12 elementos denido em (3) para
um novo evento, digamos, G campe ao do segundo campeonato, que
8 PROBABILIDADES NO FUTEBOL
corresponderia ao subconjunto de
4
com 12 27
3
elementos
A
2,4
= A .
Repare o leitor que aparece na primeira, terceira e quarta compo-
nentes acima pois, se o nosso enfoque e o segundo campeonato, tudo
pode acontecer nos demais. Isto motiva a deni cao a seguir.
Denicao 1.4. O espaco produto de ordem n de (, P) e o espaco
de probabilidades (
n
, P
n
) tal que
P
n
:
n
[0, 1]
= (
1
, . . . ,
n
) p

1
. . . p

n
onde p

i
= P({
i
}).
De modo menos formal, diremos que (
n
, P
n
) e a repeticao de n en-
saios independentes de (, P). A independencia acima diz respeito
ao modo como foi denida a func ao P
n
, que faz com que eventos de
ensaios distintos sejam independentes. No caso da repetic ao de nossos
campeonatos, a probabililidade de G ser campe ao, digamos, no setimo
deles independe de seu desempenho nas versoes anteriores e nem inu-
encia resultados em disputas futuras.
Denimos ent ao a vari avel aleat oria I
i
(A) :
n
{0, 1} dada por
I
i
(A)() :=
_
1 se
i
A
0 se
i
/ A
que indica justamente a ocorrencia de A no i-esimo dos n ensaios in-
dependentes de (, P).
Para n os ser a especialmente importante a vari avel aleatoria
S
n
(A) :=
n

i=1
I
i
(A)
que conta quantas vezes ocorreu A em n ensaios.
Denicao 1.5. Duas variaveis aleatorias X, Y : R sao ditas
independentes se para todo par de conjuntos , R os eventos
A = X
1
() e B = Y
1
() sao independentes.
Um exerccio importante que o leitor pode fazer e mostrar que para
todo evento A de um espaco amostral , as vari aveis aleat orias I
i
(A)
e I
j
(A) sao independentes sempre que i = j.
PROBABILIDADES NO FUTEBOL 9
1.3. Esperanca. Introduzimos na sequencia um dos principais con-
ceitos em Teoria de Probabilidades.
Denicao 1.6. A esperanca de uma variavel aleatoria X : e
E(X) =

P(X = ).
Calculando a esperanca nos exemplos que vimos, temos que para
a variavel aleat oria X, denida anteriormente, que avalia a posic ao
de G ao nal do mini-campeonato, E(X) = p
1
+ 2p
2
+ 3p
3
onde p
i
e a probabilidade de G car em i-esimo lugar. Ja para a variavel
aleat oria X : {0, 1, 2, 3, 4, 6} que mede a soma dos pontos de G,
E(X) = p
1
+2p
2
+3p
3
+4p
4
+6p
6
onde p
i
e a probabilidade de G car
com i pontos.
Sejam c R e X, Y vari aveis aleat orias em . Seja A evento
com probabilidade p. Segue da deni cao que
(i) E(c) = c ;
(ii) E(cX) = cE(X) ;
(iii) E(X + Y ) = E(X) + E(Y ) ;
(iv) E(I
A
) = p ;
(v) E(I
i
(A)) = p para 1 i n.
Denicao 1.7. A covariancia entre X, Y : R e
cov(X, Y ) := E(XY ) E(X)E(Y )
e a variancia de X e
V (X) := cov(X, X).
Deixamos a cargo do leitor mostrar que se duas variaveis aleatorias
X e Y s ao independentes entao cov(X, Y ) = 0, ou equivalentemente,
E(XY ) = E(X)E(Y ). Para ilustrarmos que a covari ancia entre duas
vari aveis aleatorias pode ser n ao nula, considere dois eventos A, B .

E f acil ver que I


A
I
B
= I
AB
. Usando a propriedade (iv) acima, segue
que E(I
A
)E(I
B
) = P(A)P(B) e, por outro lado, E(I
A
I
B
) = P(AB).
Portanto cov(I
A
, I
B
) = 0 se e somente se A e B s ao independentes, o
que n ao tem porque acontecer em geral, como j a vimos em exemplo
acima.
Teorema 1.8. (Desigualdade de Chebyshev) Seja X : R
variavel aleatoria nao negativa. Entao
P(X )
E(X)

para todo > 0.


10 PROBABILIDADES NO FUTEBOL
Prova. Se = {x
1
, . . . x
n
}, podemos escrever X na forma
X =
n

i=1
x
i
I
A
i
com A
i
= X
1
(x
i
). Ent ao
E(X) =
n

i=1
x
i
P(A
i
)

x
i

x
i
P(A
i
)

x
i

P(A
i
) = P(X )
e segue o resultado.
1.4. Lei dos Grandes N umeros. Nesta subse cao demonstramos a
Lei Fraca dos Grandes N umeros, cuja prova pode ser adaptada para
se obter o resultado que mais nos interessa, qual seja, o Teorema 1.10
abaixo, que e justamente a formaliza cao da equac ao (2).
Teorema 1.9 (Lei Fraca dos Grandes N umeros). Seja {X
i
}
iN
seq uencia de variaveis aleatorias tais que cov(X
i
, X
j
) = 0 se i = j e
V (X
i
) c para algum c R e todo i N. Entao, para todo > 0,
lim
n
P
_

X
1
+ + X
n
n

E(X
1
+ + X
n
)
n


_
= 0.
Prova. Temos
P
_

n
i=1
X
i
n

E(

n
i=1
X
i
)
n


_
= P
_
_

i=1
X
i
E(X
i
)

2
n
2

2
_
_

E ((

n
i=1
X
i
E(X
i
))
2
)
n
2

2
=

i
V (X
i
) + 2

i<j
cov(X
i
, X
j
)
n
2

c
n
2
onde, na primeira desigualdade acima, foi utilizada a desigualdade de
Chebyshev e na segunda, as hipoteses sobre a sequencia {X
i
}
iN
.
Teorema 1.10. Seja (, P) um espaco de probabilidade e A um
evento com probabilidade p. Seja S
n
(A) a variavel aleatoria, denida
anteriormente, que conta o n umero de ocorrencias de A em n ensaios
independentes. Entao, para todo > 0,
lim
n
P
n
_

S
n
(A)
n
p


_
= 0.
PROBABILIDADES NO FUTEBOL 11
Prova.

E verbatim a prova do teorema anterior, trocando P por P
n
e
X
i
por I
i
(A). Note ent ao que V (I
i
(A)) = p p
2
, que desempenha o
papel de c e que cov(I
i
(A), I
j
(A)) = 0 para i = j posto que I
i
(A) e
I
j
(A) sao independentes neste caso.
Em palavras, o teorema acima nos diz que se realizarmos um grande
n umero de observac oes independentes sobre um determinado evento,
ent ao a raz ao entre o n umero de ocorrencias do mesmo e o n umero
de observac oes converge para a probabilidade do evento acontecer.
Esta armac ao, antes dos Axiomas de Kolmogorov, era a base da
teoria frequencista, que dava `a teoria de probabilidades um carater,
a princpio, mais emprico que matematico. A dedu cao da Lei dos
Grandes N umeros a partir dos Axiomas de Kolmogorov nos mostra
que o empirismo em quest ao j a nao guarda mais eventuais resqucios
pejorativos que o termo possa ter (teste, tentativa, suposic ao, aprior-
ismo, etc). Muito pelo contr ario, o frequencismo passa a ser entao a
nossa grande ferramenta para se estimar probabilidades que (sempre)
desconhecemos. Mais ainda, esta muito bem fundamentado do ponto
de vista te orico, com todo o rigor matem atico.
2. Um modelo de C

alculo de Probabilidades
Como dissemos antes, o modo de se estimar probabilidades em fute-
bol e simples e de certa forma comum aos diferentes modelos. A ideia
e partir da situacao atual do campeonato, e simular os jogos restantes.
Ao nal, o computador gera a classicac ao dos times e a registra. De-
pois, volta a fazer o mesmo in umeras vezes e no termino do processo ja
est a apto a divulgar as probabilidades que nos interessam. Se, por ex-
emplo, queremos saber a probabilidade de um dado time ser campeao,
basta ver a proporcao entre as simulac oes em que terminou lder sobre
o total de simulac oes.
Para determinar o resultado de um jogo Ax B, o computador recebe
dois vetores de probabilidade (PV
A
, PE
A
, PD
A
) e (PV
B
, PE
B
, PD
B
),
que s ao as probabilidades de vitoria, empate e derrota de A e B, re-
spectivamente. A partir destes dados, forma-se o vetor probabilidade
do jogo, que e
P
AxB
=
_
PV
A
+ PD
B
2
,
PE
A
+ PE
B
2
,
PD
A
+ PV
B
2
_
onde as tres coordenadas sao, na ordem, as probabilidades de vit oria de
A, empate, e vitoria de B. Supondo, e.g., que P
AxB
= (0.5, 0.2, 0.3), o
que o computador faz e dividir o intervalo [0,1] em tres partes: [0, 0.5],
(0.5, 0.7) e [0.7, 1]. E ent ao sorteia um n umero aleat orio entre 0 e 1 (ele
12 PROBABILIDADES NO FUTEBOL
sabe como fazer isto). Se, por exemplo, o n umero sorteado foi 0.4579,
ent ao o resultado do jogo e vitoria de A. Depois de simular uma rodada,
atualizam-se todos os vetores de probabilidades de todos os times, de
acordo com os resultados da rodada, e simula-se a rodada seguinte.
Repare o leitor que na proxima simulac ao do campeonato, o resultado
de Ax B pode ser diferente, seja porque o computador sorteou um
n umero diferente, seja porque os pr oprios vetores probabilidades dos
times estao agora diferentes.
O modelo proposto pelos autores destas linhas cujos c alculos efe-
tivos encontram-se disponveis em www.mat.ufmg.br/futebol consiste
em atribuir a cada time participante do campeonato, na verdade, dois
vetores de probabilidade
PC=(PVC, PEC, PDC) e PF=(PVF, PEF, PDF)
onde PVC, PEC e PDC s ao, respectivamente, as probabilidades de
vit oria, empate e derrota do clube em uma partida jogando como man-
dante (em casa), e PVF, PEF e PDF seguem a mesma logica, desta
feita sendo a equipe em quest ao visitante (joga fora de casa).
As condic oes impostas aos vetores acima para que sejam, de fato,
vetores de probabilidade e que suas coordenadas devem ser n umeros
n ao-negativos que somem 1, ou seja, nenhum time tem chance nega-
tiva de vencer, ou empatar, ou perder um jogo e, alem disso, e claro,
vit oria, empate ou derrota s ao as unicas possibilidades aceit aveis.
A cada rodada, os vetores s ao realimentados. Se o time jogou como
mandante, muda-se o seu vetor mandante, e o mesmo vale para seu
vetor visitante, caso o jogo foi fora de casa. A ideia de se tratar um
mesmo time como dois diferentes um em casa, e outro fora dela
n ao e nenhum tipo de esquizofrenia futebolstica. Ao contr ario, reete
apenas o modo como a torcida, ou o pr oprio campo onde a equipe
habitualmente joga, podem inuenciar no desempenho do clube. Em
suma, jogos iguais em campos distintos, s ao distintos.
A quest ao chave e como atualizar os vetores de probabilidades de
duas equipes que se enfrentam, apos a realizacao do jogo. Pode-se
dizer que isto e o que distingue os diferentes modelos de previs ao. A
primeira premissa da qual partimos e a de que, se um time vence uma
partida, aumenta sua probabilidade de vencer a partida seguinte. A
premissa reete algo quase intuitivo no futebol: tem mais chance de
vencer quem vence mais. Alem disso, este aumento na probabilidade
de vitoria e tanto maior quanto melhor for o time derrotado. Analoga-
mente, se o time perde uma partida, aumenta sua probabilidade de
perder o pr oximo jogo e o aumento e tanto maior quanto pior for seu ad-
vers ario. Claramente, existem in umeras maneiras objetivas para medir
PROBABILIDADES NO FUTEBOL 13
a qualidade de um time, como a colocacao na tabela de classica cao, o
n umero de vit orias, etc. O par ametro que adotamos e o rendimento
dado por
r =
n
o
de pontos conquistados
n
o
de pontos disputados
.
Podemos entender o modo como modicamos os tais vetores de prob-
abilidade, atraves de um exemplo. Vamos supor que houve o jogo Fla-
mengo x Palmeiras, que foi disputado no Maracan a, e que o Flamengo
saiu-se vencedor do confronto. Ent ao o novo vetor de Flamengo como
mandante, digamos PC
1
Fla
, e obtido a partir do vetor anterior, digamos
PC
0
Fla
, da seguinte forma
PC
1
Fla
=
p PC
0
Fla
+ r
Pal
(1, 0, 0)
p + r
Pal
onde r
Pal
e o rendimento do Palmeiras (que tambem deve ser modi-
cado para o proximo jogo) e p e o peso que damos ao passado. Por
exemplo, se p = 0 ent ao o que passou n ao conta para nada, e o fato de
que o Flamengo venceu o Palmeiras no Maracana implicaria em que, a
partir de agora, vencer a todas as partidas que disputar em casa, o que
e um absurdo. Por outro lado, se damos a p um valor muito alto, os
vetores de probabilidade seguem quase que inalterados jogo a jogo. Ou
seja, p indica a sensibilidade dos times em relacao ao resultado de uma
partida.

E tanto mais alto quanto menos o time se afeta. Isto varia de
time para time, e claro, mas em nosso modelo padronizamos que p = 5
para todas as equipes. Com isso, os vetores de probabilidade de cada
clube reetem, com uma boa precis ao, os seus 10 ultimos jogos (sendo
5 como mandante e 5 como visitante). Com relac ao ao rendimento, o
que a f ormula acima diz e que, se o Palmeiras tivesse, por exemplo,
um rendimento muito baixo, ent ao a vit oria do Flamengo n ao seria
t ao signicativa a ponto de alterar substancialmente suas chances de
vit oria.
De modo semelhante, apos a derrota no Maracan a, o vetor visitante
do Palmeiras e modicado da seguinte forma
PF
1
Pal
=
p PF
0
Pal
+ (1 r
Fla
) (0, 0, 1)
p + (1 r
Fla
)
.
Na formula acima aparece 1 r
Fla
(e nao r
Fla
, como na anterior) pois
o raciocnio se inverte: perder, por exemplo, para um time hipotetico
que sempre vence (r = 1) n ao signica absolutamente nada (1 r = 0
e o vetor probabilidade ca intacto).
Como se viu pelo c alculo acima, em caso de vit oria (resp. derrota)
de um dos times, reforca-se a ideia de que vencer (resp. perder) uma
14 PROBABILIDADES NO FUTEBOL
partida aumenta a probabilidade de vencer (resp. perder) a pr oxima,
uma vez que a componente PV (resp. PD) aumenta e as demais com-
ponentes diminuem.
Contudo, o mesmo n ao se aplica em caso de empate entre as equipes.
Ou seja, empatar uma partida n ao implica que aumente as chances
de empatar a proxima e diminuam as chances de vencer ou perder.
De fato, suponhamos que um time, jogando como visitante, empatasse
com o lder do campeonato. Certamente, a sua probabilidade de vencer
uma partida, como visitante, tambem deve ser aumentada. Da mesma
forma, se o empate e com o lanterna do campeonato, a probabilidade
de perder a proxima partida tambem deve ser aumentada. A grosso
modo, empate com time bom e meia vit oria, empate com time ruim
e meia derrota.
O modo como pomos isto em n umeros e o seguinte. Voltemos a
Flamengo x Palmeiras no Maracan a, e suponha que houve empate. Se
r
Pal
1/2, entao o Palmeiras n ao e considerado um time tao forte, e
atualizamos o novo vetor probabilidade do Flamengo como mandante
da seguinte forma
PC
1
Fla
=
p PC
0
Fla
+ (1 2 r
Pal
) (0,
1
2
,
1
2
) + 2 r
Pal
(0, 1, 0)
p + 1
.
Ou seja, (0,
1
2
,
1
2
) e a tal meia derrota que dissemos acima e (0, 1, 0) e
o empate puro. Entendemos melhor a formula considerando os casos
extremos. Se o Palmeiras tiver rendimento normal, i.e., r
Pal
= 1/2,
ent ao o segundo termo do numerador se anula e o terceiro e (0, 1, 0), ou
seja, o Flamengo realmente empatou com o Palmeiras. Mas supondo,
hipoteticamente, que o Palmeiras sequer pontuou no campeonato, seu
rendimento e nulo e o terceiro termo do numerador desaparece, sendo
o segundo igual (0,
1
2
,
1
2
). Ou seja, neste caso o Flamengo teve uma
meia derrota para o Palmeiras apesar de ter, na pratica, empatado
o jogo. Os casos intermedi arios 0 < r
Pal
< 1/2 correspondem ` a media
convexa entre os vetores (0,
1
2
,
1
2
) e (0, 1, 0) dependendo do rendimento
do Palmeiras.
Agora, se o Palmeiras vem forte no campeonato, digamos com rendi-
mento r
Pal
> 1/2 entao o empate do Flamengo esta mais para meia
vit oria e seu vetor probabilidade e atualizado do seguinte modo
PC
1
Fla
=
p PC
0
Fla
+ (2 r
Pal
1) (
1
2
,
1
2
, 0) + 2(1 r
Pal
) (0, 1, 0)
p + 1
.
Ap os o empate, o vetor probabilidade do Palmeiras como visitante e at-
ualizado de forma absolumente analoga levando em conta o rendimento
r
Fla
do Flamengo.
PROBABILIDADES NO FUTEBOL 15

E l ogico que o modelo acima e passvel de crtica. Ser a que p = 5 e


um bom peso? Sequencia muito longa de vit orias n ao comeca a aumen-
tar a chance do time perder? O hist orico de jogos entre dois times n ao
mereceria tambem ser levado em conta? Bem, este e apenas um mod-
elo e o leitor agucado pode e deve criar algum outro de seu agrado. Se
com ele responder melhor as perguntas acima e tantas outras que pos-
sam vir ` a tona, nao ser a pelos seus conhecimentos matematicos, muito
menos por eventual vnculo academico. Ao contrario, as quest oes mais
relevantes em Probalidades no Futebol, sao quest oes de futebol.
References
[1] B. James, Probabilidade: um Curso em Nvel Itermediario, Rio de Janeiro,
Projeto Euclides, 3
a
edicao (2008).
[2] F. Brochero, G. N. Costa, M. T. Cunha, B. N. B. de Lima, R. V. Martins,
Futebol: uma Caixinha de ... Sorteios, Ciencia Hoje 254 (2008) 24-29.
[3] I. Richard, The Pleasures of Probability, Nova Iorque, Springer-Verlag (1995).

Você também pode gostar