Você está na página 1de 9

"Modelos de Probabilidade para Apostas de Hóquei"

Ravi Patel IB SL Matemática


O hóquei se estabeleceu indefinidamente como um dos esportes em maior crescimento na
América do Norte. Desde o meu dia assistindo Hockey Night no Canadá quando criança, desenvolvi
uma paixão apaixonada pelo esporte de inverno nacional do Canadá. Ao longo da minha vida
assistindo a esses jogos, eu alcancei uma paixão carinhosa pela grande rivalidade entre as duas
franquias gigantes na NHL. Claro, isso em referência à aclamada rivalidade entre o Toronto Maple
Leaf e o Montreal Canadiens.

Ao longo do meu dia assistindo a esses jogos de hóquei, sempre notei anúncios de empresas
de apostas incentivando seus espectadores a apostar no placar e no vencedor dessas rivalidades
esportivas de alto nível em troca de dinheiro. Todo o conceito de apostar em esportes parecia
extremamente complicado para mim, especialmente quando me deparei com um vídeo da CBC
mostrando que o grande esquema de vencedores do site de apostas do esporte eram indivíduos nerds
que haviam criado modelos matemáticos para prever os vencedores/rankings de futuros jogos e/ou
temporadas. A complexidade desses modelos matemáticos não se apresentou até que eu finalmente
aprendi os conceitos de estatística e distribuição de probabilidade em minha aula de matemática SL.
Notei que distribuições de probabilidade específicas podem ser analisadas e extrapoladas usando
teoremas de probabilidade para criar modelos matemáticos de probabilidade para situações futuras.

No início, eu tinha minhas dúvidas sobre a co-relação de distribuições de probabilidade


normais em apostas de hóquei, no entanto, ao pesquisar diferentes conceitos no livro didático de
matemática HL, cheguei a um tópico. Meu raciocínio desta Avaliação Interna é criar modelos de
probabilidade a partir das estatísticas de Gols Marcados de Toronto e Montreal da temporada 2017-
18 da National Hockey League e, em seguida, encontrar uma equação de um modelo de
probabilidade que melhor corresponda aos dados para prever a pontuação de um jogo futuro da liga.
A fim de manter os parâmetros da equação limitados e evitar qualquer viés do time da casa dentro do
meu modelo matemático, vou assumir que o jogo será jogado em Los Angeles como um "Jogo
Clássico de Inverno" anual. Para criar dados extremamente precisos, não vou arredondar nenhum dos
números que minha calculadora gráfica exibe para garantir que meus valores de parâmetro sejam tão
precisos quanto possível. Além disso, também vou acessar e refletir sobre diferentes variáveis que
afetarão meus cálculos. Essas precauções matemáticas garantirão que minhas probabilidades finais
esperadas sejam as mais precisas possíveis.
O primeiro passo necessário no processo de modelagem matemática é encontrar o valor esperado de
gols que cada equipe pode marcar no jogo. Isso é feito através da criação de um histograma dos Gols
Encaminhados (GF) por cada equipe individual ao longo da temporada de 82 jogos de 2017-18.
Também optei por adicionar uma linha de tendência para exibir a tendência das médias de gols do
Maple Leaf ao longo da temporada. Os dados coletados serão exibidos em um histograma na figura
abaixo.

(Figura 1.0)

GF of the Toronto Maple Leafs


25
20
20 18
FREQUENCY

15 13
11
10 7 6
5 2 3 2
0
0 1 2 3 4 5 6 7 8
# of goals forwarded

Agora que criamos uma tabela de frequência para os gols encaminhados de Toronto, esses dados
devem ser convertidos em um gráfico exibindo probabilidade para que possa ser interpretado para
encontrar valores esperados das tendências de gols da equipe. No início, foi difícil para mim
encontrar um padrão de curva distinto (por exemplo, exponencial, normal) que correspondesse aos
meus dados, pois são discretos. Depois de fazer mais pesquisas, vejo que esse modelo corresponde
melhor a uma curva de Distribuição de Poisson. A Distribuição de Poisson é uma distribuição de
frequência discreta que dá a probabilidade de um número de eventos independentes ocorrerem em
um tempo fixo. Para determinar se o número de chegadas por minuto segue uma distribuição de
Poisson, as hipóteses nulas e alternativas são escritas abaixo:
H 0: O número de chegadas por minuto segue uma distribuição de Poisson

H 1: O número de chegadas por minuto não segue uma distribuição de Poisson

Para analisar se meus dados seguem um Processo de Poisson, devo primeiro determinar o parâmetro
dos meus dados, que é a média, modelada como Lambda ( ƛ ).
c

∑ mj f j
X = j=1
n
277
X= =3.37805= ƛ
82
Este valor de X não será arredondado para três algarismos significativos, pois estou usando esse
valor médio como a estimativa de ƛ . Portanto, usando o Lambda como estimativa da média, as
frequências de X sucessos para ( X =1 ,2 , 3 , 4 , 5 , 6 , 7 , 8) podem ser encontradas. Além disso, a
frequência teórica para cada valor de X é derivada da multiplicação do tamanho da amostra (N) por
cada X valores de probabilidade de Poisson.

Agora que encontrei a estimativa da média para os dados totais, devo calcular a Probabilidade de
Poisson para 10 intervalos de X. Esses intervalos incluem ( X =1 ,2 , 3 , 4 , 5 , 6 , 7.8.9∨more ). Devo
calcular a probabilidade de 9 ou mais, pois é importante notar que a Probabilidade de Poisson está
exibindo um conceito teórico dos objetivos encaminhados pelo Toronto Maple Leaf. Assim, como
teoricamente é possível marcar mais de 9 gols em um jogo, a estimativa da média (3,37805)
fornecerá o valor esperado de ( X =[ 9 , ∞ ])

Para encontrar a Probabilidade de Poisson teórica de X, descobri a Fórmula de Distribuição de


Poisson que é exibida abaixo:
x −ƛ
( ) ƛ e
P X=x =
x!
Onde:
ƛ = Usado como parâmetro na equação (como mencionado anteriormente)
e = Número de Euler, uma constante matemática com o valor 2,71828
Calcular as probabilidades esperadas de cada meta encaminhada parece bastante fácil no início, no
entanto, aproximei-me de um estágio complicado em que tive que encontrar a probabilidade esperada de
(X=0). Foi quando me lembrei do processo que meu tutor havia me ensinado a mostrar que o fatorial 0 é
igual a 1.

n !=n ( n−1 )( n−2 ) ( n−3 ) … .


n !=n(n−1)!
1 !=1(1−1)!
1=1(0! )
1=0!
Usando a expressão de eu então substituí um valor de n !=n ! , n por 1, pois eu sabia que seu fatorial
seria simplesmente 1 (1x1). Além disso, o valor (n-1) também me daria zero e, portanto, encontrei
um que 1= 0! Agora posso continuar com meus cálculos da Probabilidade de Poisson substituindo X
por 0 e ƛ por 3,37805.
0 −3.37805
3.37805 e
P ( X=0 )=
0!

P ( X=0 )=1 e−3.37805 ¿ ¿


0!
1(0.03411)
P ( X=0 )=
1
P ( X=0 )=0.03411
Agora que calculei minha Probabilidade de Poisson Esperada de (X=0), devo continuar a fazer o
mesmo para todos os outros intervalos de X, que incluem (X= 0,1,2,3,4,5,6,7,8,9 ou mais). As
seguintes probabilidades esperadas estão listadas abaixo:
Tabela 1.1
# de Gols P(X) da Distribuição de
Encaminhados Poisson com
(X) ƛ=3.37805
0 0.03411 Eu também encontrei um pouco de dificuldade ao
1 0.11524 tentar encontrar a Probabilidade de 9 ou mais, no
2 0.19464 entanto, eu simplesmente apliquei meu
3 0.21917 conhecimento de estatística e probabilidade para
4 0.18509 obter sua Probabilidade Esperada.
5 0.12505
P ( X ≥ 9 )=1− [ P ( X =0 ) + P ( X =1 ) + P ( X=2 ) + P ( X =3 ) + P ( X=4 )+
6 0.07040
7 0.03398 P ( X ≥ 9 )=0.00744
8 0.01435
9 ou mais 0.00744

Agora que tenho cada um dos P(X) para Metas Encaminhados pelo Toronto Maple Leaf, agora
posso pegar esses dados e criar uma curva visual, que deve modelar o gráfico GF vs Frequency
original da Figura 1.1

Figura 1.2

GF Probablity with Lambda = 3.37805


0.25
0.21917
0.2 0.19464
0.18509
Probability of (X)

0.15
0.12505
0.11524
0.1
0.0704

0.05 0.03411 0.03398


0.01435 0.00744
0
0 1 2 3 4 5 6 7 8 9
# of goals forwarded (X)
Evidentemente, posso ver que essa distribuição é uma Distribuição de Poisson, pois a Figura 1.2
usando o Lambda como parâmetro de probabilidade teórica coincide com o modelo original da
Figura 1.1. Posso confirmar isso porque as linhas de tendência têm os mesmos intervalos de aumento
e diminuição entre os diferentes pontos. No entanto, o gráfico não retrata perfeitamente os dados das
Metas Encaminhadas.
Em vez de usar modelos matemáticos qualitativos, eu precisava encontrar uma maneira de obter um
processo matemático que pudesse pegar meus dados e determinar se meus dados eram Poisson da
maneira mais precisa possível. Para obter uma representação mais precisa de quão próximos meus
dados estão de um modelo de Poisson, decidi realizar um teste de qui-quadrado. O teste Qui-
Quadrado de qualidade de ajuste é um teste não paramétrico que é usado para descobrir como o valor
observado de um dado fenômeno é significativamente diferente do valor esperado. A equação é
exibida como:
❑ 2
(f 0−f e )
=∑
2
ƛ k− p−1
k fe

Onde:
f 0 = É a frequência observada

f e = É a frequência teórica ou esperada

k = O número de categorias ou classes restantes após a combinação de classes


p = O número de parâmetros estimados a partir dos dados
Olhando para a equação abaixo, é evidente que estou perdendo algumas variáveis da equação.
Preciso encontrar a probabilidade teórica ( f e). Esta frequência pode ser encontrada em:
f e =( n ) ( P ( X ) ) . A tabela a seguir mostra os cálculos que fiz para obter o valor final de aproximação
do Lambda ao quadrado. Fiz isso montando uma tabela de equações onde concluo um processo passo
a passo na tentativa de obter a soma da fórmula final, que estão todas listadas na tabela abaixo:
Tabela 1.2
fe ¿) ¿ 2
( f 0−f e )
fe
2.79702 0.79702 0.635241 0.227113
9.44968 1.55032 2.40349 0.254346
15.9605 -2.9605 8.76456 0.549141
17.9719 2.0281 4.11319 0.228868
15.1774 2.8226 7.96707 0.52493
10.2541 -3.2541 10.5892 1.03268
5.7728 0.2272 0.05162 0.008942
2.78636 0.21364 0.045642 0.016381
1.1767 0.8233 0.677823 0.576037
0.61008 0.61008 0.372198 0.61008
Total: 4.02652
Depois de completar a tabela, estou meio desconfiado sobre como o dígito para a frequência teórica
de 10,2541 chegou a ser um valor tão alto em comparação com o resto. No entanto, a soma dessa
equação de Distribuição de Poisson observa que ƛ 2=4.02652 .

Agora que o processo passo a passo está concluído, devo continuar a encontrar o subscrito em ƛ. Para
determinar o subscrito sob ƛ, devo determinar um conceito associado à Distribuição de Poisson
conhecido como Graus de Liberdade. A equação está escrita abaixo como:
2
ƛ =k −p−1
Lembramos que as definições para as variáveis k e p já foram citadas acima. Portanto, o valor de k,
que é o número de classes restantes depois de combinar classes, é 9, pois essa é a classe teórica que
não aparece nas frequências reais observadas. Além disso, o valor de p é 1, pois o único parâmetro
considerado é o Lambda, que está em correlação com o teste Qui-quadrado. Portanto, posso
encontrar os graus de liberdade como seguem:
k − p−1=9−1−1=7
Agora que nossos graus de liberdade são encontrados, devemos usar o método alternativo de teste de
hipótese para determinar finalmente se a distribuição é uma Distribuição de Poisson. Para prosseguir
com este método de teste, devo usar a mesma hipótese de rejeição então mencionada na página 1. No
início, fiquei muito confuso ao encontrar a relação entre o teste de hipótese nula e a adequação dos
meus dados a uma Distribuição de Poisson. Decidi então assistir a alguns vídeos no YouTube e
aprender a realizar o método de testes, que envolve um conceito que me foi ensinado em sala de aula,
conhecidos como pontos críticos. Primeiro defini para configurar o teorema da rejeição:
H 0 : ƛ=3.37805

H 1 : ƛ ≠3.37805

Vai precisar continuar trabalhando nisso. Prossegui com o próximo passo do meu IA, pois já podia
inferir que minha Distribuição era Poisson a partir de observações qualitativas, porém ainda preciso
trabalhar nesse cálculo
Agora que meu teste de Qui-quadrado provou que a distribuição da contagem de Gols Encaminhados
do Toronto Maple Leaf é uma Distribuição de Poisson, no entanto, meu trabalho ainda não está
completo. Como meu objetivo final é criar uma matriz de probabilidades para mostrar a força de
ataque de cada equipe, também devo determinar a Distribuição de Poisson do Montreal Canadiens.
Como meu teste anterior de Chi-Squared funcionou para provar que a distribuição de gols do Maple
Leaf era realmente uma Distribuição de Veneno, agora posso chegar a uma conclusão de que marcar
gols no esporte do hóquei é um Processo de Poisson. Com esse conhecimento, agora posso criar
um modelo P(X) de gols em relação ao valor Lambda encontrado do Montreal Canadiens.
Figura 2

GF by the Montreal Canadiens


20
15 17 18
Frequency

14
10 12
10
5 6
0 2 1 1 1
0 1 2 3 4 5 6 7 8 9 10
# of goals forwaded

Essa figura se assemelha muito à Figura 1, na qual os dados de Metas Encaminhadas foram
distribuídos em uma curva semelhante. Para continuar e encontrar meu gráfico P(X), devo determinar
o valor de ƛ e calcular novamente.
c

∑ mj f j
X = j=1
n
209
X= =2.54878=ƛ
82
# de Gols P(X) da Distribuição de
Encaminhados (X) Poisson com
ƛ=2.54878
0 0.07818
1 0.19926
2 0.25393 P ( X ≥11 )=1− [ P ( X =0 ) + P ( X =1 )+ P ( X=2 ) + P ( X =3 ) + P ( X=

P ( X ≥11 )=0.00006
3 0.21574
4 0.13747
5 0.07007
6 0.02977
7 0.01084
8 0.00345
9 0.00098
10 0.00025
11 ou mais 0.00006
Figura 2.1

Probability of GF with Lambda = 2.54878


0.3
0.25393
0.25
0.21574
0.19926
0.2
Probability of (X)

0.15 0.13747

0.1 0.07818
0.07007
0.05 0.02977
0.01084 0.00345 0.00098 0.00025 0.00006
0
0 1 2 3 4 5 6 7 8 9 10 11 or
more
# of goals scored (X)

A figura 2.1 é semelhante ao gráfico calculado a partir dos dados da figura 2. Notei que as
probabilidades teóricas de P(7 ≤ X ≤ 11∨more ) não correspondiam realmente aos resultados do
gráfico original. Refletindo sobre possíveis fatores limitantes, a razão para isso é porque a frequência
observada de marcar gols em intervalos altos é extremamente rara, razão pela qual há pequenas
flutuações entre o e 1 para P(7 ≤ X ≤ 11∨more ) uma diminuição ainda gradual no gráfico de
probabilidade teórico.
Agora que todas as probabilidades de Poisson são encontradas para Metas Encaminhadas do Toronto
Maple Leaf e do Montreal Canadians, devo calcular as probabilidades de volta na fórmula de
Distribuição de Poisson e, em seguida, criar uma matriz de probabilidades com possíveis resultados
de pontuação.

Você também pode gostar