Escolar Documentos
Profissional Documentos
Cultura Documentos
Ao longo do meu dia assistindo a esses jogos de hóquei, sempre notei anúncios de empresas
de apostas incentivando seus espectadores a apostar no placar e no vencedor dessas rivalidades
esportivas de alto nível em troca de dinheiro. Todo o conceito de apostar em esportes parecia
extremamente complicado para mim, especialmente quando me deparei com um vídeo da CBC
mostrando que o grande esquema de vencedores do site de apostas do esporte eram indivíduos nerds
que haviam criado modelos matemáticos para prever os vencedores/rankings de futuros jogos e/ou
temporadas. A complexidade desses modelos matemáticos não se apresentou até que eu finalmente
aprendi os conceitos de estatística e distribuição de probabilidade em minha aula de matemática SL.
Notei que distribuições de probabilidade específicas podem ser analisadas e extrapoladas usando
teoremas de probabilidade para criar modelos matemáticos de probabilidade para situações futuras.
(Figura 1.0)
15 13
11
10 7 6
5 2 3 2
0
0 1 2 3 4 5 6 7 8
# of goals forwarded
Agora que criamos uma tabela de frequência para os gols encaminhados de Toronto, esses dados
devem ser convertidos em um gráfico exibindo probabilidade para que possa ser interpretado para
encontrar valores esperados das tendências de gols da equipe. No início, foi difícil para mim
encontrar um padrão de curva distinto (por exemplo, exponencial, normal) que correspondesse aos
meus dados, pois são discretos. Depois de fazer mais pesquisas, vejo que esse modelo corresponde
melhor a uma curva de Distribuição de Poisson. A Distribuição de Poisson é uma distribuição de
frequência discreta que dá a probabilidade de um número de eventos independentes ocorrerem em
um tempo fixo. Para determinar se o número de chegadas por minuto segue uma distribuição de
Poisson, as hipóteses nulas e alternativas são escritas abaixo:
H 0: O número de chegadas por minuto segue uma distribuição de Poisson
Para analisar se meus dados seguem um Processo de Poisson, devo primeiro determinar o parâmetro
dos meus dados, que é a média, modelada como Lambda ( ƛ ).
c
∑ mj f j
X = j=1
n
277
X= =3.37805= ƛ
82
Este valor de X não será arredondado para três algarismos significativos, pois estou usando esse
valor médio como a estimativa de ƛ . Portanto, usando o Lambda como estimativa da média, as
frequências de X sucessos para ( X =1 ,2 , 3 , 4 , 5 , 6 , 7 , 8) podem ser encontradas. Além disso, a
frequência teórica para cada valor de X é derivada da multiplicação do tamanho da amostra (N) por
cada X valores de probabilidade de Poisson.
Agora que encontrei a estimativa da média para os dados totais, devo calcular a Probabilidade de
Poisson para 10 intervalos de X. Esses intervalos incluem ( X =1 ,2 , 3 , 4 , 5 , 6 , 7.8.9∨more ). Devo
calcular a probabilidade de 9 ou mais, pois é importante notar que a Probabilidade de Poisson está
exibindo um conceito teórico dos objetivos encaminhados pelo Toronto Maple Leaf. Assim, como
teoricamente é possível marcar mais de 9 gols em um jogo, a estimativa da média (3,37805)
fornecerá o valor esperado de ( X =[ 9 , ∞ ])
Agora que tenho cada um dos P(X) para Metas Encaminhados pelo Toronto Maple Leaf, agora
posso pegar esses dados e criar uma curva visual, que deve modelar o gráfico GF vs Frequency
original da Figura 1.1
Figura 1.2
0.15
0.12505
0.11524
0.1
0.0704
Onde:
f 0 = É a frequência observada
Agora que o processo passo a passo está concluído, devo continuar a encontrar o subscrito em ƛ. Para
determinar o subscrito sob ƛ, devo determinar um conceito associado à Distribuição de Poisson
conhecido como Graus de Liberdade. A equação está escrita abaixo como:
2
ƛ =k −p−1
Lembramos que as definições para as variáveis k e p já foram citadas acima. Portanto, o valor de k,
que é o número de classes restantes depois de combinar classes, é 9, pois essa é a classe teórica que
não aparece nas frequências reais observadas. Além disso, o valor de p é 1, pois o único parâmetro
considerado é o Lambda, que está em correlação com o teste Qui-quadrado. Portanto, posso
encontrar os graus de liberdade como seguem:
k − p−1=9−1−1=7
Agora que nossos graus de liberdade são encontrados, devemos usar o método alternativo de teste de
hipótese para determinar finalmente se a distribuição é uma Distribuição de Poisson. Para prosseguir
com este método de teste, devo usar a mesma hipótese de rejeição então mencionada na página 1. No
início, fiquei muito confuso ao encontrar a relação entre o teste de hipótese nula e a adequação dos
meus dados a uma Distribuição de Poisson. Decidi então assistir a alguns vídeos no YouTube e
aprender a realizar o método de testes, que envolve um conceito que me foi ensinado em sala de aula,
conhecidos como pontos críticos. Primeiro defini para configurar o teorema da rejeição:
H 0 : ƛ=3.37805
H 1 : ƛ ≠3.37805
Vai precisar continuar trabalhando nisso. Prossegui com o próximo passo do meu IA, pois já podia
inferir que minha Distribuição era Poisson a partir de observações qualitativas, porém ainda preciso
trabalhar nesse cálculo
Agora que meu teste de Qui-quadrado provou que a distribuição da contagem de Gols Encaminhados
do Toronto Maple Leaf é uma Distribuição de Poisson, no entanto, meu trabalho ainda não está
completo. Como meu objetivo final é criar uma matriz de probabilidades para mostrar a força de
ataque de cada equipe, também devo determinar a Distribuição de Poisson do Montreal Canadiens.
Como meu teste anterior de Chi-Squared funcionou para provar que a distribuição de gols do Maple
Leaf era realmente uma Distribuição de Veneno, agora posso chegar a uma conclusão de que marcar
gols no esporte do hóquei é um Processo de Poisson. Com esse conhecimento, agora posso criar
um modelo P(X) de gols em relação ao valor Lambda encontrado do Montreal Canadiens.
Figura 2
14
10 12
10
5 6
0 2 1 1 1
0 1 2 3 4 5 6 7 8 9 10
# of goals forwaded
Essa figura se assemelha muito à Figura 1, na qual os dados de Metas Encaminhadas foram
distribuídos em uma curva semelhante. Para continuar e encontrar meu gráfico P(X), devo determinar
o valor de ƛ e calcular novamente.
c
∑ mj f j
X = j=1
n
209
X= =2.54878=ƛ
82
# de Gols P(X) da Distribuição de
Encaminhados (X) Poisson com
ƛ=2.54878
0 0.07818
1 0.19926
2 0.25393 P ( X ≥11 )=1− [ P ( X =0 ) + P ( X =1 )+ P ( X=2 ) + P ( X =3 ) + P ( X=
P ( X ≥11 )=0.00006
3 0.21574
4 0.13747
5 0.07007
6 0.02977
7 0.01084
8 0.00345
9 0.00098
10 0.00025
11 ou mais 0.00006
Figura 2.1
0.15 0.13747
0.1 0.07818
0.07007
0.05 0.02977
0.01084 0.00345 0.00098 0.00025 0.00006
0
0 1 2 3 4 5 6 7 8 9 10 11 or
more
# of goals scored (X)
A figura 2.1 é semelhante ao gráfico calculado a partir dos dados da figura 2. Notei que as
probabilidades teóricas de P(7 ≤ X ≤ 11∨more ) não correspondiam realmente aos resultados do
gráfico original. Refletindo sobre possíveis fatores limitantes, a razão para isso é porque a frequência
observada de marcar gols em intervalos altos é extremamente rara, razão pela qual há pequenas
flutuações entre o e 1 para P(7 ≤ X ≤ 11∨more ) uma diminuição ainda gradual no gráfico de
probabilidade teórico.
Agora que todas as probabilidades de Poisson são encontradas para Metas Encaminhadas do Toronto
Maple Leaf e do Montreal Canadians, devo calcular as probabilidades de volta na fórmula de
Distribuição de Poisson e, em seguida, criar uma matriz de probabilidades com possíveis resultados
de pontuação.