Escolar Documentos
Profissional Documentos
Cultura Documentos
CDD – 519.23
Ao Targino, Moacyr e Teemu pela orientação, pelos ensinamentos e por toda aten-
ção durante todo o trabalho.
À minha mãe Cláudia e minha avó Regina, por todo o apoio e carinho.
Ao Kaizô e Henrique pelo apoio para ingressar no mestrado e por tudo que aprendi
com eles nos últimos anos.
Ao Flávio, à Maria e a todo o pessoal do Esporte em Números por todas as
conversas e por todo o aprendizado.
A todo corpo docente da EMAp pela excelência de ensino.
Ao Bruno, Thiago, Letícia e todos amigos da EMAp por alegrarem todos meus
dias pré-pandemia.
Ao meu primo Pedro e ao Vinicius pelas discussões aleatórias sobre futebol.
E a todos meus amigos que me ajudaram a superar esse tempo difícil.
Resumo
Futebol é o esporte mais popular do mundo e há um grande interesse na
previsão de resultados das partidas que acontecem ao redor do mundo. O intuito
deste trabalho é desenvolver e avaliar modelos in-play de processos de Poisson para
para a Série A do Campeonato Brasileiro de Futebol. O principal objetivo é apresen-
tar modelos para os gols e para isso, também são descritos modelos para os cartões
vermelhos e acréscimos. São utilizados dados de gols, cartões vermelhos, acréscimos
e valor de mercado dos jogadores das temporadas de 2015 até 2020. Por fim, esses
modelos são comparados com um modelo pre-game de Poissons independentes que
é bastante utilizado na literatura.
Tabela 1 – Valor de mercado médio dos 11 titulares por equipe em milhões de euros 21
Sumário
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2 REVISÃO BIBLIOGRÁFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 BASES DE DADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.1 Súmulas da CBF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.1.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.1.2 Gols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.3 Cartões Vermelhos . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Transfermarkt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4 REFERENCIAL TEÓRICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.1 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.2 Processo de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.3 AIC e BIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.4 Medida de Ignorância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5 MODELAGEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.1 Modelo para resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.2 Modelo para acréscimos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.3 Introdução aos modelos de cartões vermelhos e gols . . . . . . . . . . . . . 31
5.4 Modelo para cartões vermelhos . . . . . . . . . . . . . . . . . . . . . . . . 33
5.5 Modelo para gols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
6 PREVISÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.1 Função de ponderação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.2 Estratégia para previsões . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6.3 Avaliação das previsões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.4 Parâmetro 𝛾 ao longo do tempo . . . . . . . . . . . . . . . . . . . . . . . . 49
6.5 Previsão minuto a minuto . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
10
1 INTRODUÇÃO
Futebol é o esporte mais popular do planeta, com cerca de 4 bilhões de fãs. Ele é
praticado ao redor de todo o mundo mas é particularmente popular na América Latina,
Europa e África (SHVILI, 2020). Devido à essa popularidade, previsões sobre as partidas
de futebol despertam grande interesse de torcedores, jornalistas e das próprias equipes
ao avaliar quem são os favoritos de cada partida e as probabilidades de título, vaga em
competições internacionais e rebaixamento de cada time.
Além de ser o esporte mais popular do mundo, futebol é o esporte em que mais
apostas são realizadas (VAN LIER, 2018). Graças a avanços tecnológicos, a indústria de
apostas esportivas online demonstrou um rápido crescimento nos últimos anos e uma das
novas formas de apostas são as apostas in-play ou in-game em que é possível apostar em
um evento esportivo em tempo real. Por exemplo, é possível apostar no resultado de uma
partida durante o andamento da mesma.
Os modelos de previsão de partidas de futebol podem ser divididos em modelos
pre-match, onde o objetivo é prever o vencedor e/ou o placar de uma partida apenas
com dados disponíveis até o início do jogo, e modelos in-game em que essas previsões são
atualizadas durante a partida. São essenciais para os modelos in-game informações sobre
o estado da partida.
De acordo com Robberechts, Haaren e Davis (2019), modelos de previsão in-game
tornaram-se cada vez mais populares em uma variedade de esportes como basquete, base-
bol e hóquei na última década. Esses modelos ajudam a contar a história de uma partida
encontrando momentos-chave, auxiliam equipes na tomada de decisão durante o jogo e
são relevantes para apostas in-play. Embora esses modelos sejam utilizados com frequên-
cia em outros esportes, eles são relativamente novos para o futebol, sendo popularizados
durante a Copa do Mundo de 2018 quando FiveThirtyEight (BOICE, 2018) e Google
publicaram suas previsões em tempo real.
Esta dissertação visa desenvolver e avaliar modelos in-game para a primeira divisão
do Campeonato Brasileiro de Futebol utilizando informações de gols, cartões vermelhos,
acréscimos e valor de mercado das equipes de todas as partidas realizadas nesse campe-
onato de 2015 até 2020. O principal objetivo é desenvolver modelos para os gols e para
isso, também são apresentados modelos para os acréscimos e cartões vermelhos.
Durante toda a a dissertação, incluindo a coleta de dados, modelagem e análise
dos resultados, foi utilizado o software R (R Core Team, 2021) e todo o código encontra-se
no repositório https://github.com/luizfgnmaia/soccer-live-predictions.
Capítulo 1. INTRODUÇÃO 11
2 REVISÃO BIBLIOGRÁFICA
das equipes, gols, cartões, média do número de passes certos no terceiro terço de campo
nas últimas 10 unidades de tempo e média do percentual de duelos vencidos nas últimas
10 unidades de tempo.
No que concerne a métodos de deep learning, Pettersson e Nyquist (2017) avaliaram
diferentes configurações de redes neurais recorrentes (RNN) com o objetivo de prever
resultados das partidas. Foram considerados os jogadores titulares e técnicos de cada
equipe assim como gols, assistências, cartões, substituições e pênaltis. Haugård e Vu
(2019) utilizaram redes feedforward e RNNs com o intuito de prever a próxima equipe a
marcar um gol. Além das line ups das equipes e eventos das partidas, foi empregada a
métrica Expected Goals (xG) do Understat1 , essa métrica dá uma indicação de o quão boa
é uma tentativa de gol e revela se uma equipe deveria ter marcado mais ou menos gols de
acordo com suas chances criadas durante uma partida ou temporada.
1
Endereço: https://understat.com/. Acesso em 15 de maio de 2021.
14
3 BASES DE DADOS
Fonte: https://www.cbf.com.br/futebol-brasileiro/competicoes/campeonato-brasileiro-serie-a/2015/1.
Acesso em 24 de julho de 2021.
3.1.1 Resultados
Os resultados das partidas foram organizados em um data frame que possui 2.279
2
linhas , uma para cada partida, e as variáveis presentes no Quadro 1.
1
Endereço: https://www.cbf.com.br/. Acesso em 24 de julho de 2021.
2
A quantidade de partidas não é 2.280 pois o jogo entre Chapecoense e Atlético-MG da ultima rodada
de 2016 foi cancelada devido à tragédia do voo da Chapecoense.
Capítulo 3. BASES DE DADOS 15
Variável Descrição
Season Temporada da partida
Match Indicador da partida na temporada, varia de 1 a 380
Date Data de realização da partida
Home Team Time mandante
Score Home Número de gols marcados pelo time mandante
Score Away Número de gols marcados pelo time visitante
Away Team Time visitante
Stoppage Time 1 Minutos de acréscimos do primeiro tempo
Stoppage Time 2 Minutos de acréscimos do segundo tempo
Fonte: Elaboração própria.
O estudo dos acréscimos de uma partida de futebol é importante para a previsão in-
play pois, para esse tipo de previsão, é essencial o conhecimento do tempo de jogo restante
da partida. As Figuras 5 e 6 apresentam o comportamento dos acréscimos no primeiro e
no segundo tempo, respectivamente, considerando todas as partidas das seis temporadas
utilizadas. Percebe-se que os acréscimos do segundo tempo, em geral, são maiores do
que os acréscimos do primeiro tempo, possivelmente, pelo maior número de interrupções
Capítulo 3. BASES DE DADOS 17
3.1.2 Gols
Para estruturar os 5.379 gols coletados nas súmulas, as informações destes gols
foram colocados em um data frame em que cada linha se refere a um gol e as colunas são
descritas no Quadro 2.
Variável Descrição
Season Temporada da partida
Match Indicador da partida na temporada, varia de 1 a 380
Date Data de realização da partida
Home Team Time mandante
Score Home Número de gols marcados pelo time mandante
Score Away Número de gols marcados pelo time visitante
Away Team Time visitante
Team 1 se o gol foi marcado pelo time mandante; 2 caso contrário
Minute Minuto do gol (0 até 45)
Stoppage Time Minutos de acréscimos do gol (se o gol foi marcado após o tempo
regulamentar)
Half 1 se o gol foi marcado no 1º tempo; 2 caso contrário
Fonte: Elaboração própria.
A taxa de gols minuto a minuto é apresentada na Figura 8. É visível que essa taxa
é maior no segundo tempo do que no primeiro tempo. O aumento dessa taxa nos acrés-
cimos também chama atenção, no entanto, são poucas as partidas com tantos minutos
de acréscimo, principalmente no primeiro tempo. Por exemplo, apenas 75 das 2.279 par-
Capítulo 3. BASES DE DADOS 19
Variável Descrição
Season Temporada da partida
Match Indicador da partida na temporada, varia de 1 a 380
Date Data de realização da partida
Home Team Time mandante
Score Home Número de gols marcados pela Time mandante
Score Away Número de gols marcados pela Time visitante
Away Team Time visitante
Team 1 se o cartão vermelho foi recebido por um jogador do time mandante;
2 caso contrário
Minute Minuto do cartão vermelho (0 até 45)
Stoppage Time Minutos de acréscimos do cartão vermelho (se o cartão foi recebido
após o tempo regulamentar)
Half 1 se o cartão vermelho foi recebido no 1º tempo; 2 caso contrário
Fonte: Elaboração própria.
3.2 Transfermarkt
O website Transfermarkt3 disponibiliza, entre outras informações associadas ao
futebol, estimativas do valor de mercado dos jogadores em euros, inclusive de clubes
brasileiros. Por sua vez, a basedosdados.org oferece para download gratuito uma base de
dados4 do Campeonato Brasileiro que possui, entre outras variáveis, a soma dos valores
3
Endereço: https://www.transfermarkt.com/. Acesso em 15 de maio de 2021.
4
Endereço: https://basedosdados.org/dataset/mundo-transfermarkt-competicoes/resource/23e8dde9-
ffb8-4e7c-a92b-83d4ef9d2c79. Acesso em 15 de maio de 2021.
Capítulo 3. BASES DE DADOS 21
Tabela 1 – Valor de mercado médio dos 11 titulares por equipe em milhões de euros
Levando em conta as partidas das temporadas de 2015 até 2020, o maior valor de
uma equipe titular foi de 90,9 milhões de euros do Flamengo na última rodada de 2019
enquanto o menor valor foi do Grêmio, que jogou com um time reserva avaliado em 600
mil euros na última rodada do campeonato de 2017. A maior diferença absoluta entre
os valores das equipes ocorreu na partida entre Grêmio e Bahia em 2019 e foi de 76,85
milhões de euros a favor do Grêmio.
A Figura 10 exibe boxplots para a diferença entre os logaritmos dos valores de
mercado dos times e os gols marcados pelo time mandante. Observa-se que conforme a
diferença entre os valores de mercado aumenta, a equipe mandante tende a fazer mais
gols. Por sua vez, boxplots para a diferença entre os logaritmos dos valores de mercado
dos times e os gols marcados pelo time visitante são apresentados na Figura 11, nesse
caso, nota-se uma correlação negativa entre a diferença dos logaritmos dos valores das
equipes e os gols marcados pelo time visitante.
Figura 10 – Diferença entre os logaritmos dos valores dos times e gols marcados pelo time mandante
Figura 11 – Diferença entre os logaritmos dos valores dos times e gols marcados pelo time visitante
4 REFERENCIAL TEÓRICO
Neste capítulo são descritos conceitos essenciais para a construção dos modelos
estatísticos presentes no Capítulo 5 como processos de Poisson e são apresentadas métricas
para avaliação de modelos e de previsões que são empregadas no Capítulos 5 e 6.
1. 𝑁 (0) = 0;
3. Para 0 ≤ 𝑠 < 𝑡, 𝑁 (𝑡) − 𝑁 (𝑠) é o número de eventos ocorridos no intervalo (𝑠, 𝑡].
(PISHRO-NIK, 2016).
Exemplificando: seja 𝑁 (𝑡) um processo de Poisson não homogêneo com taxa 𝜆(𝑡).
Então a probabilidade de que não aconteça nenhum evento em um intervalo (𝑠, 𝑡] é
⎛ ⎞⎛ ⎞0 ⎛ ⎞
∫︁ 𝑡 ∫︁ 𝑡 ∫︁ 𝑡
exp ⎝ − 𝜆(𝑥)𝑑𝑥⎠⎝ 𝜆(𝑥)𝑑𝑥⎠ /0! = exp ⎝ − 𝜆(𝑥)𝑑𝑥⎠
𝑠 𝑠 𝑠
Por fim, Pasupathy (2010) apresenta diversos métodos para geração de processos
de Poisson não-homogêneos. O método utilizado nesta dissertação foi o método da inversão
proposto por Çinlar (1975).
^
BIC = 𝑘 ln(𝑛) − 2 ln(𝐿)
Por exemplo, considere as seguintes previsões para duas partidas de futebol; par-
tida 1: (H; D; A) = (0,5; 0,3; 0,2) e partida 2: (H; D; A) = (0,7; 0,2; 0,1) em que H, D
e A são respectivamente, a probabilidade estimada de vitória do time mandante, a pro-
babilidade estimada de empate e a probabilidade estimada de vitória do time visitante.
Considere, também, que as equipes mandantes venceram as duas partidas. Neste caso,
valor dessa medida seria:
1
IGN(𝑝1 , 𝑝2 ) = − [log2 (0,5) + log2 (0,7)] ≈ 0,7573.
2
= E[IGN] − H(𝑟)
em que H(𝑟) é a entropia da PDF verdadeira, H(𝑟) = − 𝑛𝑖=𝑖 (𝑟𝑖 log2 𝑟𝑖 ). Como a PDF
∑︀
verdadeira é desconhecida, H(𝑟) não pode ser calculada. Portanto, não há como saber
quando um modelo perfeito (𝐷(𝑟|𝑓 ) = 0) foi obtido. Porém, como 𝐷(𝑟|𝑓 ) não pode
ser negativa, nenhum modelo terá valor menor de E[IGN] do que um modelo perfeito
(ROULSTON; SMITH, 2002).
A Medida de Ignorância só leva em consideração a probabilidade prevista para o
evento que realmente ocorreu e possui uma relação com a média geométrica das probabi-
Capítulo 4. REFERENCIAL TEÓRICO 28
𝑘=1
∑︀𝑁
= 21/𝑁 𝑘=1
log2 (𝑝𝑘 )
= 2−IGN(𝑝1 ,...,𝑝𝑘 )
(FONTANELLA, 2021).
Outro aspecto importante é que para a medida de ignorância, quanto maior o seu
valor, menor a qualidade das previsões enquanto que para a média geométrica, quanto
maior o valor, melhor são as previsões. Para um conjunto de modelos de previsão, o
ranqueamento baseado na média geométrica das probabilidades dos eventos ocorridos
será o mesmo ranqueamento encontrado com a medida de ignorância, levando em conta
a orientação dessas duas medidas.
29
5 MODELAGEM
Neste capítulo são apresentados os modelos cujas previsões são avaliadas no pró-
ximo capítulo. Inicialmente, um modelo para resultados pre-game de Dixon e Coles (1997)
e Maher (1982) é introduzido. Posteriormente são retratados modelos para acréscimos e
cartões vermelhos. Esses dois modelos são necessários para reproduzir o estado do jogo
para que seja possível simular as partidas para obter as previsões. Por fim, são exibidos
os modelos para gols.
Todas as funções de verossimilhança dos modelos apresentados são convexas, ga-
rantindo existência e unicidade de seus máximos. Os parâmetros destas funções foram
estimados pela maximização da função de verossimilhança. Para a maximização destas
funções foi empregado o software de otimização Mosek (APS, 2019) através do pacote de
otimização convexa CVXR (FU; NARASIMHAN; BOYD, 2020). Optou-se por usar este
pacote por sua eficiência e facilidade de uso.
𝑋𝑘 ∼ Poisson(𝛼𝑖 𝛽𝑗 𝛾)
𝑌𝑘 ∼ Poisson(𝛼𝑗 𝛽𝑖 )
em que
𝜆𝑘 = 𝛼𝑖(𝑘) 𝛽𝑗(𝑘) 𝛾
𝜇𝑘 = 𝛼𝑗(𝑘) 𝛽𝑖(𝑘)
e 𝑖(𝑘) e 𝑗(𝑘) são os índices dos times mandante e visitante, respectivamente, da 𝑘-ésima
partida.
𝑈𝑘1 ∼ Poisson(𝜋𝑘1 )
𝑈𝑘2 ∼ Poisson(𝜋𝑘2 )
𝑘=1
Modelo 𝜂1 𝜂2 𝜑1 𝜑2 𝜌1 𝜌2 𝜅
0 3,0158 5,5974 - - - - -
1 3,0197 5,6014 −0,0036 - - -
2 2,9580 5,7077 0,0556 −0,0968 - - -
3 2,9651 5,5024 - - 0,7797 -
4 2,9223 5,5805 - - 1,8709 0,1234 -
5 2,9223 4,7355 - - 1,8709 0,1346 1,1878
Fonte: Elaboração própria
Além disso, define-se as seguintes variáveis dummies para os intervalos (𝑡𝑞𝑘,𝑙 , 𝑡𝑞𝑘,𝑙+1 ]
ou (𝑡𝑞* 𝑞*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 ] do 𝑞-ésimo tempo de uma partida 𝑘
⎧
𝑞
⎨1,
⎪
se a equipe mandante marcou um gol no intervalo (𝑡𝑞𝑘,𝑙 , 𝑡𝑞𝑘,𝑙+1 ];
𝐻𝑘,𝑙 =⎪
⎩0, caso contrário.
Capítulo 5. MODELAGEM 33
⎧
⎨1,
⎪
se a equipe visitante marcou um gol no intervalo (𝑡𝑞𝑘,𝑙 , 𝑡𝑞𝑘,𝑙+1 ];
𝐴𝑞𝑘,𝑙 =
⎩0,
⎪
caso contrário.
⎧
𝑞* se a equipe mandante teve um jogador expulso no intervalo (𝑡𝑞*
⎨1,
⎪ 𝑞*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 ];
𝐻𝑘,𝑙 =⎪
⎩0, caso contrário.
⎧
⎨1,
⎪
se a equipe visitante teve um jogador expulso no intervalo (𝑡𝑞* 𝑞*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 ];
𝐴𝑞*
𝑘,𝑙 =
⎩0,
⎪
caso contrário.
Continuando, condicional ao estado atual de uma partida 𝑘, modela-se as quanti-
dades de gols da equipe mandante, gols da equipe visitante, cartões vermelhos da equipe
mandante e cartões vermelhos da equipe visitante como processos de Poisson com taxas
𝜆𝑘 (𝑡), 𝜇𝑘 (𝑡), 𝜆*𝑘 (𝑡) e 𝜇*𝑘 (𝑡), respectivamente. Ademais, são definidas as seguintes funções
∫︁ 𝑡2
Λ(𝑡1 , 𝑡2 ) = 𝜆𝑘 (𝑡) 𝑑𝑡
𝑡1
∫︁ 𝑡2
M(𝑡1 , 𝑡2 ) = 𝜇𝑘 (𝑡) 𝑑𝑡
𝑡1
∫︁ 𝑡2
Λ* (𝑡1 , 𝑡2 ) = 𝜆*𝑘 (𝑡) 𝑑𝑡
𝑡1
∫︁ 𝑡2
M* (𝑡1 , 𝑡2 ) = 𝜇*𝑘 (𝑡) 𝑑𝑡
𝑡1
Finalmente, é necessário modelar as taxas 𝜆𝑘 (𝑡), 𝜇𝑘 (𝑡), 𝜆*𝑘 (𝑡) e 𝜇*𝑘 (𝑡) para obter os
modelos para gols e cartões vermelhos.
por outro lado, a probabilidade da equipe visitante ter um jogador expulso e a mandante
nenhum é (︂ )︂ (︂ )︂(︂ )︂
exp − Λ* (𝑟, 𝑠) exp − M* (𝑟, 𝑠) M* (𝑟, 𝑠) .
ℓ2*
𝑘 −1
[︃
(︁ )︁ (︁ )︁
]︃
∑︁
* * * *
+ −Λ (𝑡2* 2*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 ) −M (𝑡2* 2*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 ) + 2*
𝐻𝑘,𝑙 log Λ (𝑡2* 2*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 ) + 𝐴2*
𝑘,𝑙 log M (𝑡2* 2*
𝑘,𝑙 , 𝑡𝑘,𝑙+1 )
𝑙=0
em que ℓ𝑞*
𝑘 é a quantidade de eventos (cartões vermelhos, início e fim dos tempos) do 𝑞-
ésimo tempo da 𝑘-ésima partida. A função de log-verossimilhança de todas as partidas é
obtida realizando o somatório das verossimilhanças das partidas. É importante frisar que
esta função de verossimilhança assume que não é possível que dois jogadores da mesma
equipe sejam expulsos no mesmo minuto. Isso é um evento extremamente raro e, caso
aconteça, pode-se considerar que um jogador foi expulso no minuto 𝑡 e o outro no minuto
𝑡 + 1.
Optou-se pelas seguintes expressões para as taxas dos processos dos cartões ver-
melhos (︂ )︂
𝜆*𝑘 (𝑡) = 𝐴𝜆 𝑡 + 45 I{tempo = 2}
(︂ )︂
𝜇*𝑘 (𝑡) = 𝐴𝜇 𝑡 + 45I{tempo = 2}
em que tempo = 1 para o primeiro tempo e tempo = 2 para o segundo tempo. Ou seja,
para essa expressão está sendo considerado o tempo regulamentar agregado ao invés de
reiniciar o relógio ao início do segundo tempo. Dessa forma, a taxa de cartões vermelhos
dos acréscimos do primeiro tempo é similar à taxa dos primeiros minutos do segundo
tempo.
Utilizando os dados de todas as partidas de 2015 até 2020, os parâmetros que
maximizam a função de verossimilhança são 𝐴𝜆 = 1,973 × 10−5 e 𝐴𝜇 = 3,19 × 10−5 , o que
sugere que as equipes visitantes possuem uma maior chance de ter um jogador expulso.
As Figuras 14 e 15 comparam as taxas observadas para os cartões vermelhos com o valor
encontrado com a expressão escolhida para 𝜆*𝑘 (𝑡) e 𝜇*𝑘 (𝑡) com os parâmetros ótimos, o
ajuste é satisfatório considerando a simplicidade da expressão escolhida.
ℓ2𝑘 −1 [︃ (︁ )︁ )︁
]︃
(︁
∑︁
+ − Λ(𝑡2𝑘,𝑙 , 𝑡2𝑘,𝑙+1 ) − M(𝑡2𝑘,𝑙 , 𝑡2𝑘,𝑙+1 ) + 𝐻𝑘,𝑙
2
log Λ(𝑡2𝑘,𝑙 , 𝑡2𝑘,𝑙+1 ) + 𝐴2𝑘,𝑙 log M(𝑡2𝑘,𝑙 , 𝑡2𝑘,𝑙+1 ) .
𝑙=0
em que ℓ𝑞𝑘 é a quantidade de eventos (gols, cartões vermelhos, início e fim dos tempos) do
𝑞-ésimo tempo da 𝑘-ésima partida.
Capítulo 5. MODELAGEM 35
Figura 14 – Taxa de cartões vermelhos da equipe mandante por minuto observada e estimada
Figura 15 – Taxa de cartões vermelhos da equipe visitante por minuto observada e estimada
Variável Descrição
tempo 1 para o primeiro tempo; 2 para o segundo tempo
𝑥(𝑡) Quantidade de gols marcados pela equipe mandante até o minuto 𝑡
𝑦(𝑡) Quantidade de gols marcados pela equipe visitante até o minuto 𝑡
𝑥* (𝑡) Quantidade de jogadores da equipe mandante expulsos até o minuto 𝑡
𝑦 * (𝑡) Quantidade de jogadores da equipe visitante expulsos até o minuto 𝑡
𝑣𝑖 Logaritmo do valor de mercado dos 11 titulares da equipe mandante
𝑣𝑗 Logaritmo do valor de mercado dos 11 titulares da equipe visitante
Fonte: Elaboração própria.
Modelo ln 𝜆𝑘 (𝑡)
0 ln 𝛼𝑖 + ln 𝛽𝑗 + ln 𝛾
1 ln 𝛼𝑖 + ln 𝛽𝑗 + ln 𝛾 + I{tempo = 2} ln 𝜏
2 ln 𝛼𝑖 + ln 𝛽𝑗 + ln 𝛾 + I{tempo = 2} ln 𝜏 + ln Δgol (𝑥(𝑡) − 𝑦(𝑡))
3 ln 𝛼𝑖 + ln 𝛽𝑗 + ln 𝛾 + I{tempo = 2} ln 𝜏 + ln Δgol (𝑥(𝑡) − 𝑦(𝑡)) + ln Δjogador (𝑦 * (𝑡) − 𝑥* (𝑡))
4 ln 𝛼𝑖 + ln 𝛽𝑗 + ln 𝛾 + I{tempo = 2} ln 𝜏 + ln Δgol (𝑥(𝑡) − 𝑦(𝑡)) + ln Δjogador (𝑦 * (𝑡) − 𝑥* (𝑡))
+ ln Δvalor (𝑣𝑖 − 𝑣𝑗 )
Fonte: Elaboração própria
As estimativas pontuais dos parâmetros que não são dependentes dos times são
exibidos na Tabela 7, observa-se que a inclusão de novos parâmetros não proporciona uma
mudança considerável nas estimativas dos parâmetros anteriores.
Os parâmetros 𝛼 e 𝛽 dos Modelos 3, que não utiliza informações do valor de
mercado das equipes, e 4, que utiliza essas informações, são apresentados nas Tabelas 8 e
9, respectivamente. Nota-se um impacto da adição dos valores de mercado nos parâmetros
Capítulo 5. MODELAGEM 37
Modelo ln 𝜇𝑘 (𝑡)
0 ln 𝛼𝑗 + ln 𝛽𝑖
1 ln 𝛼𝑗 + ln 𝛽𝑖 + I{tempo = 2} ln 𝜏
2 ln 𝛼𝑗 + ln 𝛽𝑖 + I{tempo = 2} ln 𝜏 + ln Δgol (𝑦(𝑡) − 𝑥(𝑡))
3 ln 𝛼𝑗 + ln 𝛽𝑖 + I{tempo = 2} ln 𝜏 + ln Δgol (𝑦(𝑡) − 𝑥(𝑡)) + ln Δjogador (𝑥* (𝑡) − 𝑦 * (𝑡))
4 ln 𝛼𝑗 + ln 𝛽𝑖 + I{tempo = 2} ln 𝜏 + ln Δgol (𝑦(𝑡) − 𝑥(𝑡)) + ln Δjogador (𝑥* (𝑡) − 𝑦 * (𝑡))
+ ln Δvalor (𝑣𝑗 − 𝑣𝑖 )
Fonte: Elaboração própria
𝛼 e 𝛽 das equipes e, sumarizando a força das equipes por 𝛼/𝛽, observa-se que os times
que, geralmente, possuem equipes de maior valor de mercado como Cruzeiro, Flamengo,
São Paulo e Corinthians perderam algumas posições enquanto times de menor potencial
financeiro como Ceará, Fortaleza, Goiás, Atlético-GO e Red Bull Bragantino subiram
algumas colocações.
No Modelo 4, a estimativa pontual do parâmetro 𝛾 é 1,5425, o que significa que o
time mandante possui, em média, uma taxa de gols 54% maior do que a do time visitante.
Por sua vez, a estimativa do parâmetro referente ao segundo tempo, 𝜏 , é 1,2248, ou seja,
a taxa de gols é 22,48% maior na segunda metade da partida para ambas as equipes.
A estimativa para o parâmetro Δgol é 0,9063, ou seja, quando uma equipe possui
uma vantagem de um gol no placar, sua taxa de gols é multiplicada por 0,9063 e quando
um time vence por dois gols, sua taxa de gols é multiplicada por 0,90632 = 0,8294. Em
contrapartida, um time que está perdendo por um gol tem sua taxa de gols multiplicada
Capítulo 5. MODELAGEM 38
Time 𝛼 𝛽 𝛼/𝛽
1 Palmeiras 0,1350 0,0705 1,9161
2 Flamengo 0,1345 0,0758 1,7742
3 Grêmio 0,1162 0,0692 1,6810
4 Santos 0,1196 0,0730 1,6386
5 Red Bull Bragantino 0,1148 0,0713 1,6098
6 Corinthians 0,1082 0,0684 1,5820
7 Internacional 0,1024 0,0682 1,5029
8 São Paulo 0,1079 0,0749 1,4410
9 Atlético-MG 0,1294 0,0905 1,4301
10 Athletico-PR 0,0993 0,0724 1,3712
11 Cruzeiro 0,0886 0,0779 1,1365
12 Ceará 0,0893 0,0816 1,0942
13 Fortaleza 0,0944 0,0869 1,0863
14 Bahia 0,0998 0,0919 1,0851
15 Fluminense 0,0962 0,0891 1,0793
16 Ponte Preta 0,0933 0,0928 1,0061
17 Sport 0,0950 0,0993 0,9574
18 Botafogo 0,0833 0,0885 0,9409
19 Atlético-GO 0,0865 0,0948 0,9117
20 Coritiba 0,0797 0,0901 0,8841
21 Chapecoense 0,0854 0,0973 0,8777
22 Vitória 0,0992 0,1140 0,8703
23 Vasco da Gama 0,0815 0,0953 0,8546
24 Goiás 0,0918 0,1128 0,8137
25 Figueirense 0,0728 0,0962 0,7576
26 Santa Cruz 0,0983 0,1399 0,7021
27 Joinville 0,0578 0,0935 0,6184
28 América-MG 0,0576 0,1033 0,5578
29 Avaí 0,0619 0,1111 0,5566
30 CSA 0,0513 0,1145 0,4478
31 Paraná 0,0393 0,1117 0,3518
Fonte: Elaboração própria
por 1/0,9063 = 1,1033 e uma equipe tem sua taxa de gols multiplicada por 1,10332 =
1,2173 quando está atrás no placar por dois gols. O valor menor do que 1 do parâmetro
Δgol indica que, normalmente, as equipes com vantagem no placar diminuem a intensidade
dos seus ataques enquanto as equipes que estão atrás no placar vão em busca do gol com
mais ímpeto.
Para o parâmetro Δjogador a estimativa pontual é 1,3932, ou seja, uma equipe com
um jogador a mais tem sua taxa de gols aumentada em 39,32% enquanto um time com
um jogador a menos possui sua taxa de gols multiplicada por 1/1,3932 = 0,7178. Por fim,
a estimativa para o parâmetro Δvalor é 1,1745, o que significa que um time que possui o
Capítulo 5. MODELAGEM 39
Time 𝛼 𝛽 𝛼/𝛽
1 Red Bull Bragantino 0,1117 0,0734 1,5229
2 Palmeiras 0,1169 0,0814 1,4363
3 Ceará 0,0980 0,0743 1,3199
4 Grêmio 0,1025 0,0778 1,3172
5 Santos 0,1069 0,0812 1,3164
6 Fortaleza 0,1029 0,0797 1,2915
7 Athletico-PR 0,0965 0,0748 1,2901
8 Flamengo 0,1137 0,0898 1,2662
9 Internacional 0,0937 0,0747 1,2543
10 Corinthians 0,0960 0,0774 1,2403
11 Atlético-MG 0,1154 0,1015 1,1364
12 Bahia 0,1019 0,0900 1,1316
13 São Paulo 0,0941 0,0862 1,0919
14 Atlético-GO 0,0948 0,0871 1,0882
15 Ponte Preta 0,0961 0,0905 1,0613
16 Botafogo 0,0861 0,0861 0,9999
17 Coritiba 0,0844 0,0851 0,9920
18 Fluminense 0,0905 0,0946 0,9573
19 Goiás 0,0992 0,1045 0,9486
20 Sport 0,0944 0,1003 0,9404
21 Cruzeiro 0,0804 0,0861 0,9346
22 Chapecoense 0,0883 0,0947 0,9334
23 Vitória 0,1018 0,1117 0,9114
24 Vasco da Gama 0,0820 0,0951 0,8622
25 Santa Cruz 0,1083 0,1275 0,8495
26 Figueirense 0,0751 0,0938 0,8008
27 Joinville 0,0650 0,0838 0,7754
28 Avaí 0,0700 0,0983 0,7123
29 América-MG 0,0629 0,0949 0,6630
30 CSA 0,0565 0,1029 0,5496
31 Paraná 0,0456 0,0967 0,4719
Fonte: Elaboração própria
valor de mercado duas vezes o do seu oponente tem sua taxa de gols multiplicada por
1,1745log(2) = 1,1179 (e a do adversário multiplicada por 1/1,1179 = 0,8945) e, para uma
diferença de dez vezes, a taxa de gols da equipe favorecida é multiplicada por 1,4481.
Uma vantagem da inclusão do parâmetro Δvalor é que ele possibilita captar desfalques de
jogadores-chave nas equipes.
É importante ressaltar que outras formas de inserir o impacto de gols e cartões
vermelhos foram avaliadas, como utilizar parâmetros distintos para as equipes e considerar
que o impacto do placar não depende da quantidade de gols e apenas de quem está
liderando a partida, mas a forma apresentada foi a que apresentou os melhores resultados,
Capítulo 5. MODELAGEM 40
6 PREVISÕES
O intuito deste capítulo é avaliar as previsões para resultado e placar das partidas
selecionadas além de descrever como estas previsões foram realizadas e que modelos foram
utilizados. No fim do capítulo também é apresentado um exemplo de previsão minuto a
minuto para uma partida específica.
longo da partida, cada um dos modelos para gols foi combinado com o modelo de cartões
vermelhos e com o Modelo 5 de acréscimos para realização das previsões.
Para cada partida, estimou-se os parâmetros desses cinco modelos utilizando a
função de ponderação de Dixon e Coles (1997) e, simulou-se o restante da partida a partir
dos minutos 0, 15 e 30 de cada tempo levando em conta o estado atual do jogo. Foram rea-
lizadas 100.000 simulações para cada instante de tempo considerado, totalizando 600.000
simulações para cada partida por modelo. A partir das simulações, é possível construir
as previsões para placar e resultado. Por exemplo, a probabilidade de uma determinada
partida terminar em 2-1 dado que estava 1-0 aos 30 minutos do primeiro tempo é estimada
pela proporção das simulações dessa partida, iniciadas no minuto 30, que terminaram em
2-1. Similarmente, a probabilidade dessa mesma partida terminar em empate é dada pela
proporção das simulações que terminaram empatadas. Essas simulações são necessárias
apenas para os modelos dinâmicos. Para o modelo estático é possível calcular diretamente
as probabilidades dos gols das equipes a partir das taxas das distribuições de Poisson, do
placar atual da partida e do tempo restante de jogo.
A princípio, optou-se por utilizar 𝜉𝐷𝐶 e, posteriormente, estimar um valor para 𝜉
específico para o Campeonato Brasileiro. A estratégia seria avaliar a média geométrica
para as previsões pre-game de resultados do Modelo 0 com diferentes valores para 𝜉 e
utilizar o valor que maximizasse esta medida. Decidiu-se pelo Modelo 0 pois ele é o mais
simples e menos custoso computacionalmente. Entretanto, ao avaliar as médias geométri-
cas, encontrou-se um valor ótimo para 𝜉 muito próximo de 𝜉𝐷𝐶 e decidiu-se por manter
𝜉𝐷𝐶 . A Figura 16 apresenta as médias geométricas para os diferentes valores de 𝜉 com
𝜉𝐷𝐶 destacado em vermelho.
Figura 16 – Médias geométricas para as previsões de resultado do Modelo 0 no início das partidas vs 𝜉
Tabela 10 – Comparação entre as probabilidades para resultados estimadas pelos modelos e a frequência
relativa observada nas partidas
Tabela 11 – Comparação entre as probabilidades para quantidade de gols marcados pelo time mandante
estimadas pelos modelos e a frequência relativa observada nas partidas
Minuto 0 1 2 3 4 5+
Observado 0,2282 0,3617 0,2465 0,1173 0,0350 0,0113
Modelo 0 +0,0289 −0,0319 −0,0163 −0,0023 +0,0110 +0,0107
Modelo 1 +0,0286 −0,0301 −0,0153 −0,0028 +0,0100 +0,0095
0 Modelo 2 +0,0092 −0,0215 −0,0001 +0,0012 +0,0073 +0,0040
Modelo 3 +0,0105 −0,0191 +0,0001 −0,0004 +0,0059 +0,0030
Modelo 4 +0,0079 −0,0227 +0,0001 +0,0021 +0,0080 +0,0046
Modelo 0 +0,0409 −0,0259 −0,0198 −0,0085 +0,0065 +0,0069
Modelo 1 +0,0316 −0,0276 −0,0156 −0,0046 +0,0084 +0,0078
15 Modelo 2 +0,0126 −0,0186 −0,0007 −0,0011 +0,0054 +0,0025
Modelo 3 +0,0137 −0,0164 −0,0005 −0,0025 +0,0041 +0,0016
Modelo 4 +0,0116 −0,0200 −0,0007 −0,0002 +0,0062 +0,0031
Modelo 0 +0,0537 −0,0190 −0,0236 −0,0156 +0,0013 +0,0032
Modelo 1 +0,0348 −0,0241 −0,0156 −0,0071 +0,0060 +0,0059
30 Modelo 2 +0,0165 −0,0151 −0,0015 −0,0042 +0,0030 +0,0013
Modelo 3 +0,0174 −0,0130 −0,0012 −0,0054 +0,0018 +0,0004
Modelo 4 +0,0159 −0,0165 −0,0013 −0,0034 +0,0036 +0,0016
Modelo 0 +0,0373 −0,0131 −0,0169 −0,0129 +0,0023 +0,0034
Modelo 1 +0,0152 −0,0214 −0,0077 −0,0019 +0,0087 +0,0071
45 Modelo 2 +0,0022 −0,0131 +0,0038 −0,0005 +0,0053 +0,0022
Modelo 3 +0,0032 −0,0112 +0,0040 −0,0017 +0,0042 +0,0014
Modelo 4 +0,0020 −0,0144 +0,0037 +0,0001 +0,0058 +0,0028
Modelo 0 +0,0296 −0,0068 −0,0122 −0,0114 +0,0005 +0,0003
Modelo 1 +0,0110 −0,0156 −0,0041 −0,0014 +0,0065 +0,0036
60 Modelo 2 +0,0014 −0,0088 +0,0043 −0,0002 +0,0034 −0,0001
Modelo 3 +0,0016 −0,0072 +0,0044 −0,0007 +0,0025 −0,0006
Modelo 4 +0,0015 −0,0100 +0,0040 +0,0003 +0,0038 +0,0004
Modelo 0 +0,0226 +0,0062 −0,0135 −0,0106 −0,0028 −0,0019
Modelo 1 +0,0068 −0,0025 −0,0056 −0,0023 +0,0029 +0,0007
75 Modelo 2 +0,0009 +0,0020 −0,0006 −0,0018 +0,0009 −0,0013
Modelo 3 +0,0004 +0,0029 −0,0005 −0,0017 +0,0004 −0,0016
Modelo 4 +0,0009 +0,0011 −0,0006 −0,0015 +0,0012 −0,0011
Fonte: Elaboração própria
Tabela 12 – Comparação entre as probabilidades para quantidade de gols marcados pelo time visitante
estimadas pelos modelos e a frequência relativa observada nas partidas
Minuto 0 1 2 3 4 5+
Observado 0,3870 0,3671 0,1792 0,0474 0,0151 0,0043
Modelo 0 +0,0186 −0,0144 −0,0130 +0,0087 +0,0000 +0,0000
Modelo 1 +0,0224 −0,0131 −0,0148 +0,0068 −0,0009 −0,0004
0 Modelo 2 +0,0095 −0,0005 −0,0091 +0,0049 −0,0032 −0,0018
Modelo 3 +0,0062 +0,0006 −0,0075 +0,0055 −0,0031 −0,0018
Modelo 4 +0,0096 −0,0009 −0,0091 +0,0051 −0,0031 −0,0017
Modelo 0 +0,0286 −0,0131 −0,0177 +0,0047 −0,0018 −0,0008
Modelo 1 +0,0220 −0,0112 −0,0146 +0,0059 −0,0015 −0,0008
15 Modelo 2 +0,0086 +0,0016 −0,0087 +0,0041 −0,0037 −0,0020
Modelo 3 +0,0055 +0,0028 −0,0074 +0,0045 −0,0036 −0,0020
Modelo 4 +0,0089 +0,0012 −0,0088 +0,0042 −0,0036 −0,0020
Modelo 0 +0,0352 −0,0108 −0,0204 +0,0011 −0,0036 −0,0016
Modelo 1 +0,0181 −0,0084 −0,0122 +0,0057 −0,0021 −0,0011
30 Modelo 2 +0,0052 +0,0034 −0,0063 +0,0040 −0,0042 −0,0022
Modelo 3 +0,0023 +0,0046 −0,0049 +0,0043 −0,0042 −0,0023
Modelo 4 +0,0055 +0,0030 −0,0064 +0,0041 −0,0040 −0,0022
Modelo 0 +0,0302 −0,0053 −0,0172 −0,0011 −0,0047 −0,0020
Modelo 1 +0,0103 −0,0032 −0,0078 +0,0048 −0,0028 −0,0014
45 Modelo 2 −0,0024 +0,0075 −0,0018 +0,0034 −0,0045 −0,0023
Modelo 3 −0,0044 +0,0088 −0,0008 +0,0032 −0,0046 −0,0023
Modelo 4 −0,0018 +0,0071 −0,0021 +0,0034 −0,0044 −0,0023
Modelo 0 +0,0244 +0,0044 −0,0211 −0,0012 −0,0048 −0,0018
Modelo 1 +0,0065 +0,0054 −0,0118 +0,0041 −0,0031 −0,0012
60 Modelo 2 −0,0035 +0,0138 −0,0072 +0,0031 −0,0044 −0,0019
Modelo 3 −0,0051 +0,0148 −0,0063 +0,0030 −0,0045 −0,0020
Modelo 4 −0,0027 +0,0132 −0,0074 +0,0031 −0,0044 −0,0019
Modelo 0 +0,0201 +0,0101 −0,0201 −0,0043 −0,0042 −0,0017
Modelo 1 +0,0041 +0,0105 −0,0115 +0,0007 −0,0027 −0,0012
75 Modelo 2 −0,0021 +0,0158 −0,0088 +0,0001 −0,0034 −0,0016
Modelo 3 −0,0032 +0,0162 −0,0081 +0,0001 −0,0035 −0,0017
Modelo 4 −0,0015 +0,0151 −0,0087 +0,0000 −0,0034 −0,0016
Fonte: Elaboração própria
valores são muito próximos entre si. Por fim, é importante comentar que se todas as pre-
visões fossem realizadas seguindo as proporções observadas de vitória do time mandante,
empate ou vitória do time visitante presentes na Tabela 10, a média geométrica seria
0,351, valor inferior aos dos modelos analisados.
Considerando a previsão para placares, constata-se que as previsões do Modelo 0,
incluindo as previsões pre-game, não estão em um nível tão bom quanto o nível das pre-
visões para resultado, novamente, isso ocorre pois neste modelo, a taxa de gols independe
do estado atual do jogo. Esta ineficiência do Modelo 0 em prever o placar das partidas
está alinhada com o que as Tabelas 11 e 12 demonstram. Ademais, nota-se um maior salto
Capítulo 6. PREVISÕES 47
Figura 17 – Médias geométricas das previsões para resultados em comparação com o Modelo 0
Tabela 14 – Médias geométricas das previsões para resultado (apenas partidas com cartões vermelhos no
primeiro tempo)
nas médias geométricas das previsões com a inclusão do parâmetro Δgol em comparação
com as previsões de resultado e, mais uma vez, os Modelos 3 e 4 apresentam as maiores
médias geométricas e estas médias são muito próximas.
Capítulo 6. PREVISÕES 48
Figura 18 – Médias geométricas das previsões para resultados em comparação com o Modelo 0 (apenas
partidas com cartões vermelhos no primeiro tempo)
Figura 19 – Médias geométricas das previsões para placares em comparação com o Modelo 0
7 CONSIDERAÇÕES FINAIS
Referências
ALBERTI, G. et al. Goal scoring patterns in major european soccer leagues. Sport
Sciences for Health, Springer, v. 9, n. 3, p. 151–153, 2013. Citado na página 19.
APS, M. The MOSEK optimization toolbox for MATLAB manual. Version 9.0. [S.l.],
2019. Disponível em: <http://docs.mosek.com/9.0/toolbox/index.html>. Citado na
página 29.
BOICE, J. How Our 2018 World Cup Predictions Work. FiveThirtyEight, 2018. Disponível
em: <https://fivethirtyeight.com/features/how-our-2018-world-cup-predictions-work>.
Citado 2 vezes nas páginas 10 e 12.
DIXON, M.; ROBINSON, M. A birth process model for association football matches.
Journal of the Royal Statistical Society: Series D (The Statistician), Wiley Online
Library, v. 47, n. 3, p. 523–538, 1998. Citado na página 12.
ELO, A. E. The rating of chessplayers, past and present. [S.l.]: Arco Pub., 1978. Citado
na página 12.
FU, A.; NARASIMHAN, B.; BOYD, S. CVXR: An R package for disciplined convex
optimization. Journal of Statistical Software, v. 94, n. 14, p. 1–34, 2020. Citado na
página 29.
GODIN, F. et al. Beating the bookmakers: leveraging statistics and twitter microposts
for predicting soccer results. In: KDD Workshop on Large-Scale Sports Analytics. [S.l.:
s.n.], 2014. p. 2–14. Citado na página 12.
LEEPER, T. J. tabulizer: Bindings for Tabula PDF Table Extractor Library. [S.l.], 2018.
R package version 0.2.2. Citado na página 14.
REEP, C.; POLLARD, R.; BENJAMIN, B. Skill and chance in ball games. Journal of
the Royal Statistical Society: Series A (General), Wiley Online Library, v. 134, n. 4, p.
623–629, 1971. Citado na página 12.
ROBBERECHTS, P.; HAAREN, J. V.; DAVIS, J. Who will win it? an in-game win
probability model for football. arXiv preprint arXiv:1906.05029, 2019. Citado 2 vezes
nas páginas 10 e 12.
SHVILI, J. The Most Popular Sports In The World. WorldAtlas, 2020. Disponível em:
<https://www.worldatlas.com/articles/what-are-the-most-popular-sports-in-the-world-
.html>. Citado na página 10.
SUZUKI, A. K. et al. A bayesian approach for predicting match outcomes: the 2006
(association) football world cup. Journal of the Operational Research Society, Taylor &
Francis, v. 61, n. 10, p. 1530–1539, 2010. Citado na página 12.
Referências 54
VAN LIER, J. The Most Popular Sports to Bet on Today. 2018. Disponível em:
<https://bitcoinchaser.com/bitcoin-sportsbook/most-popular-sports-to-bet-on-today>.
Citado na página 10.
WICKHAM, H. rvest: Easily Harvest (Scrape) Web Pages. [S.l.], 2020. R package version
0.3.6. Disponível em: <https://CRAN.R-project.org/package=rvest>. Citado na página
14.
ZOU, Q. et al. A discrete-time and finite-state markov chain model for association
football matches. Communications in Statistics-Simulation and Computation, Taylor &
Francis, v. 47, n. 8, p. 2476–2485, 2018. Citado na página 12.