Você está na página 1de 11

UNIVERSIDADE DE SÃO PAULO

Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto


Departamento de Psicologia
Disciplina: Disciplina Estatística Aplicada I
Docente: Ubiraci Pereira da Costa Neves
Discente: Lívia Rocha Carniel (11793872)

Prática sobre distribuição de probabilidade discreta: O Jogo do


Goleiro
A prática registrada nesse trabalho é uma atividade da disciplina de Estatística Aplicada I que
envolve a obtenção de dados através do Jogo do Goleiro e a análise destes a partir das
questões e instruções transcritas abaixo justamente com as respostas.

1. Neste trabalho, cada aluno participará de um jogo on-line divertido denominado


Jogo do Goleiro (https://game.numec.prp.usp.br) e utilizará os resultados de seu jogo para
construir e interpretar uma distribuição de probabilidade. O Jogo do Goleiro envolve a
simulação de um batedor de pênalti e a tentativa de um goleiro em defendê-lo. Motivado por
essa espécie de dilema do goleiro, o centro de pesquisa NeuroMat-USP criou o jogo para lidar
com a forma do cérebro humano de reconhecer padrões. Conforme informado no site do jogo,
alunos e professores podem utilizar o jogo para trabalhar conteúdos relacionados a estatística
e probabilidade de maneira mais divertida.

2. Para participar do jogo, cada aluno acessará a versão on-line do jogo


(https://game.numec.prp.usp.br/demo/). Em seguida, lerá o Termo de Consentimento Livre e
Esclarecido e, se concordar com o termo, acionará os botões indicados para participar do jogo.
As regras do jogo são simples e as instruções são apresentadas na tela. Cada aluno
(participante) fará o papel do goleiro no jogo e deverá, antes de o batedor de pênalti chutar,
adivinhar onde ocorrerá o chute (esquerda, centro ou direita do gol), indicando uma dessas 3
posições com as setas do teclado.

3. A cada cobrança de pênalti (tentativa), o aluno deverá anotar se o goleiro defendeu


o pênalti (ou seja, se adivinhou onde a bola foi chutada) ou se o batedor fez o gol (ou seja, se
não adivinhou onde ocorreu o chute). Para uma melhor estatística na análise dos dados
coletados, recomenda-se realizar 100 cobranças de pênalti. O jogo apresenta pausas para
descanso. Considerando-se que num dado jogo os chutes seguem determinado padrão, é
importante que os resultados sejam anotados na mesma sequência em que ocorreram. Além
disso, recomenda-se evitar de sair do jogo antes de completar todas as cobranças.

4. Apresente os resultados em uma tabela com três colunas, a primeira indicando o


número da tentativa (1, 2, ..., 100), a segunda indicando o número 𝟏 ou 𝟎 (𝟏 se goleiro
defendeu o pênalti ou 𝟎 se não defendeu) e a terceira indicando o número de defesas
(adivinhações ou acertos) a cada sequência de quatro chutes (sugere-se transcrever os
resultados em uma planilha como a do Excel). Neste problema, o experimento probabilístico
será definido considerando-se cada sequência de 𝑛 = 4 chutes consecutivos. Neste sentido,
anota-se o número de acertos (defesas) em uma dada sequência de 4 chutes na terceira coluna
conforme ilustrado [exemplo presente nas instruções originais].

A seguir segue a Tabela 1 com os dados coletados no jogo:

TENTATIVA RESULTADO Número de acertos em 4


(chute) (acertou = 1/errou = 0) chutes seguidos
1 1 3
2 0  
3 1  
4 1  
5 1 1
6 0  
7 0  
8 0  
9 0 2
10 0  
11 1  
12 1  
13 0 2
14 0  
15 1  
16 1  
17 0 1
18 1  
19 0  
20 0  
21 0 0
22 0  
23 0  
24 0  
25 0 2
26 1  
27 1  
28 0  
29 0 1
30 1  
31 0  
32 0  
33 0 0
34 0  
35 0  
36 0  
37 0 1
38 0  
39 0  
40 1  
41 0 0
42 0  
43 0  
44 0  
45 0 1
46 0  
47 1  
48 0  
49 0 2
50 0  
51 1  
52 1  
53 0 1
54 1  
55 0  
56 0  
57 0 0
58 0  
59 0  
60 0  
61 0 3
62 1  
63 1  
64 1  
65 1 4
66 1  
67 1  
68 1  
69 0 1
70 0  
71 0  
72 1  
73 0 2
74 1  
75 0  
76 1  
77 0 1
78 0  
79 1  
80 0  
81 0 2
82 1  
83 0  
84 1  
85 0 1
86 1  
87 0  
88 0  
89 0 2
90 0  
91 1  
92 1  
93 0 2
94 1  
95 1  
96 0  
97 1 4
98 1  
99 1  
100 1  
Tabela 1

5. Defina a seguinte variável aleatória discreta: 𝑌: número de defesas (acertos) em um


único chute. A variável aleatória 𝑌 é uma variável binária (do tipo 0 ou 1) conhecida como
variável de Bernoulli. Para análise da variável 𝑌, considere todos os valores anotados na
coluna 2 da tabela e:

a. Calcule as probabilidades empíricas 𝑃 (𝑌 = 𝑦), com 𝑦 = 0 ou 1, apresentando esta


distribuição de probabilidade numa tabela.
Resposta: As probabilidades empíricas são calculas a partir das frequências relativas dos
dados obtidos experimentalmente, neste caso, os dados coletados no jogo do goleiro presentes
na Tabela 1 e, mais especificamente, na segunda coluna dessa tabela. Assim, as
probabilidades empíricas da variável aleatória Y são apresentadas na Tabela 2 a seguir.

Y P(Y=y) % P(Y=y)
0 61/100 61,00%
1 39/100 39,00%
Total 1 100%
Tabela 2

b. Apresente um gráfico de barras para a distribuição de probabilidade 𝑃(𝑦).

Resposta: A partir da Tabela 2, pode-se construir o Gráfico 1 apresentado abaixo.

Distribuição de Probabilidade P(Y)


70.00%
60.00%
61.00%
50.00%
40.00%
% P(Y)

39.00%
30.00%
20.00%
10.00%
0.00%
0 1
Y

Gráfico 1

c. Calcule o valor esperado 𝐸(𝑌) e o desvio padrão 𝐷𝑃(𝑌).

Resposta: Sendo o valor esperado (também chamado de média ou esperança matemática) de


Y calculado a partir da fórmula E (Y) = ∑ i yi p(yi), o valor esperado desta distribuição de
probabilidade P (Y) é: E (Y) = 0,39.

Sendo a variância de Y calculada a partir da fórmula Var (Y) = ∑ i (yi – E)2 p (yi), ou Var (Y)
= E E(Y)2 – [E (Y)]2, a variância desta distribuição de probabilidade P (Y) é: Var (Y) =
0,2379. A partir disso, sendo o desvio padrão de Y calculado a partir da fórmula DP (Y) =
√ Var (Y ), o desvio padrão desta distribuição de probabilidade P (Y) é: DP (Y) = 0,4877.
6. Defina também a seguinte variável aleatória discreta: 𝑋: número de defesas
(acertos) em uma sequência de 4 chutes consecutivos. Note que a variável aleatória 𝑋, tal
como definida, assumirá os valores 0, 1, 2, 3 ou 4. Para análise da variável 𝑋, considere todos
os valores anotados na coluna 3 e:

a. Calcule as probabilidades empíricas 𝑃 (𝑋 = 𝑥), com 𝑥 = 0, 1, 2, 3 ou 4, apresentando esta


distribuição de probabilidade numa tabela.

Resposta: As probabilidades empíricas neste caso também são calculadas a partir das
frequências relativas dos dados experimentais coletados no jogo do goleiro presentes na
Tabela 1, mas dessa vez a definição da variável X torna a terceira coluna relevante. Assim, as
probabilidades empíricas da variável aleatória X são apresentadas na Tabela 3 a seguir.

X P(X=x) % P(X=x)
0 4/25 16,00%
1 9/25 36,00%
2 8/25 32,00%
3 2/25 8,00%
4 2/25 8,00%
Total 1 100%
Tabela 3

b. Apresente um gráfico de barras para a distribuição de probabilidade 𝑃 (𝑋 = 𝑥).

Resposta: A partir da Tabela 3, pode-se construir o Gráfico 2 apresentado abaixo.

Distribuição de Probabilidade P(X)


40.00%
35.00% 36.00%
30.00% 32.00%
25.00%
% P(X)

20.00%
15.00% 16.00%
10.00%
5.00% 8.00% 8.00%
0.00%
0 1 2 3 4
X

Gráfico 2

c. Calcule o valor esperado 𝐸(𝑋) e o desvio padrão 𝐷𝑃(𝑋).

Resposta: Sendo o valor esperado de X (também chamado de média ou esperança


matemática) calculado a partir da fórmula E (X) = ∑ i xi p(xi), o valor esperado desta
distribuição de probabilidade P (X) é: E (X) = 1,56.
Sendo a variância de X calculada a partir da fórmula Var (X) = ∑ i (xi – E)2 p (xi), ou Var (X)
= E (X2) – [E (X)]2, a variância desta distribuição de probabilidade P (X) é: Var (X) = 1,2064.
A partir disso, sendo o desvio padrão de X calculado a partir da fórmula DP (X) = √ Var (X ), o
desvio padrão desta distribuição de probabilidade P (X) é: DP (X) = 1,0984.

7. Considere que os resultados do jogo possam ser representados por 𝑁 = 25


experimentos probabilísticos, sendo que cada experimento probabilístico é uma dada
sequência de 𝑛 = 4 ensaios de Bernoulli {y4j+1, y4j+2, y4j+3, y4j+4}, em que y i denota o valor da
variável 𝑌 resultante da 𝑖 −ésima tentativa (𝑖 = 1, 2, ..., 100; 𝑗 = 0, 1, ..., 𝑁 − 1). Neste caso, os
ensaios de Bernoulli de cada experimento probabilístico são dependentes ou independentes?
Explique.

Resposta: Nesse caso, os ensaios de Bernoulli de cada experimento probabilístico tendem a


ser dependentes. Isso porque a proposta original do Jogo do Goleiro é coletar dados sobre os
acertos ao longo do jogo daqueles que o jogam para analisar seu aprendizado dos padrões de
chute. Dessa forma, fica evidente que os ensaios não são independentes, pois a realização de
alguns chutes, permitiria a dedução de que existe um padrão de chute e interferiria na
probabilidade dos próximos chutes caso o jogador aprendesse qual é esse padrão, aumentando
a chance de sucesso. Caso o jogador, não conseguisse identificar os padrões é possível que a
distribuição de probabilidades se constituísse como independente, mas via de regra essa
aprendizagem do padrão de chutes tende a ocorrer ao longo do jogo.

8. Caso os experimentos probabilísticos referidos no item anterior pudessem ser


considerados sequências de ensaios de Bernoulli independentes (ou seja, experimentos
binomiais), então o modelo de distribuição binomial poderia ser utilizado para obter a
distribuição de probabilidade teórica da variável aleatória 𝑋, número de acertos (sucessos) em
𝑛 = 4 chutes (ensaios). Admitindo-se, por hipótese, a independência dos eventos, utilize o
modelo de distribuição binomial (com parâmetro 𝑛 = 4) para prever a distribuição de
probabilidade de 𝑋.

a. Neste caso, que parâmetro 𝑝 (probabilidade de sucesso) do modelo binomial você utilizaria
para representar os experimentos? Por quê?

Resposta: O parâmetro adequado para representar os experimentos é p = 1/3, pois para cada
chute há três possíveis posições para onde a bola pode ser chutada (esquerda, direita ou
centro) e apenas uma dessas posições pode ser ocupada pelo goleiro, de modo que escolhendo
uma das três posições o goleiro tem 1/3 de chance de acertar e 2/3 de chance de errar, o que
determina uma possibilidade de sucesso de 1/3.

b. Com os parâmetros 𝑛 e 𝑝 adotados, apresente uma tabela com as probabilidades binomiais


e construa o gráfico de barras correspondente.

Resposta: A partir da definição da variável X que


Distribuição de Probabilidade P(X)
representa o número de defesas (acertos) em uma
45.00%
sequência de 4 chutes consecutivos, sabe-se que a 40.00%
39.51%
35.00%
variável aleatória 𝑋 pode assumir os valores 0, 1,
30.00%
2, 3 ou 4. Desse modo, como para esta análise os 29.63%
25.00%

% P(X)
20.00%
experimentos são analisados como experimentos 19.75%
15.00%
binominais, pode-se calcular a distribuição de 10.00%
9.88%
probabilidade da variável X por meio da fórmula: 5.00%
0.00% 1.23%
0 1 2 3 4
P ( x ) = n p (1− p)
x n−x X
()x
. Além disso, a partir das

considerações anteriores sabe-se que n = 4, p = 1/3 e q = 2/3, de modo que é possível calcular
essa distribuição de probabilidade binominal como registrado na Tabela 4. A quarta coluna da
Tabela 4 explicita como fórmula calcula a probabilidade de cada x i. O Gráfico 3 corresponde
a representação em um gráfico de barras dessa distribuição de probabilidade.

% P (X=x)
X P(X=x)
P(X=x)
0 0,1975 19,75% q4
1 0,3951 39,51% 4pq3
2 0,2963 29,63% 6p2q2
3 0,0988 9,88% 4p3q
4 0,0123 1,23% p4
q + 4pq3 +
4

Total 1 100% 6p2q2 + 4p3q +


p4
Tabela 4 Gráfico 3

c. Calcule o valor esperado 𝐸(𝑋) = 𝑛𝑝 e o desvio padrão 𝐷𝑃(𝑋) = √ np(1−p) desta


distribuição binomial.

Resposta: Sendo o valor esperado de X de uma distribuição binominal calculado a partir da


fórmula E (X) = n p, e dado que n = 4 e p = 1/3, o valor esperado desta distribuição de
probabilidade P (X) é aproximadamente: E (X) = 1,3333.
Sendo a variância de uma distribuição binominal de X calculada a partir da fórmula Var (X) =
n p (1 - p) e dado que n = 4 e p = 1/3, a variância desta distribuição de probabilidade P (X) é:
Var (X) = 0,8889. A partir disso, como o desvio padrão de X é calculado a partir da fórmula
DP (X) = √ Var (X ), o desvio padrão desta distribuição de probabilidade P (X) é: DP (X) =
0,9428.

9. Compare as distribuições de probabilidade da variável 𝑋 (número de acertos ou


sucessos) obtidas empiricamente (no item 6) e teoricamente (no item 8, sob hipótese de
independência de eventos), considerando-se os gráficos, as médias e os desvios padrão.
Comente eventuais discrepâncias entre as duas distribuições, em termos do tamanho de
amostra utilizado (𝑁 = 25) e da validade ou não da hipótese de independência de eventos.

Resposta: Primeiramente deve-se considerar que, como explicado na questão 7, a


aprendizagem dos padrões de chute influência a probabilidade de sucesso (defesa). Mesmo
sendo esperada certa aprendizagem desses padrões, esta é variável entre os indivíduos e é
possível que o jogador não identifique bem os padrões, tornado a distribuição empírica mais
próxima da distribuição teórica sob hipótese de independência de eventos, afinal os eventos
seriam independentes se não houvesse aprendizagem de padrões de chute. No caso dessa
prática em específico, deve ser apontado que os padrões não foram tão bem identificados
durante o jogo em 100 jogadas de modo que as divergências entre as duas distribuições
podem não ser tão expressivas.

A partir disso, é esperado, de forma geral que, sendo os eventos dependentes, a média
empírica seja maior que a média teórica da hipótese de independência dos eventos, pois no
primeiro caso ocorreriam mais acertos. Isso é de fato observado nos dados coletados nessa
prática pois a média da distribuição empírica é maior com uma diferença equivalente a
aproximadamente 0,2267.

Quanto ao desvio padrão, espera-se se o jogador identificar bem os padrões mais


regularmente tenha sucesso nos ensaios de modo que menor é o desvio padrão. Nesse caso, a
prática não correspondeu a isso, pois os acertos não foram regulares devido à má identificação
dos padrões de chute, os acertos aumentaram um pouco, mas não tanto. Pode-se apontar que
mesmo assim, isso colabora para a hipótese de que os eventos são dependentes, pois na
distribuição teórica de eventos independentes se espera uma quantidade maior de erros e um
aumento pequeno de acertos causaria um aumento no desvio padrão da distribuição empírica.
Isso quer dizer que se no caso dessa distribuição teórica os erros são mais regulares, na
distribuição empírica o aumento dos acertos reduz essa regularidade, mas não o bastante para
tornar os acertos tão regulares quanto eram os erros.

Quanto as tabelas, na distribuição teórica sob a hipótese de independência se espera maior


probabilidade de xi menores, tais como 0, 1, 2 e uma probabilidade muito menor de x i maiores
como 3 e 4. Desse modo, podemos dizer que há maiores probabilidades no lado esquerdo do
gráfico, assim como se constata no Gráfico 3. Na distribuição empírica é esperado que essa
situação tenda a se inverter se o jogador aprender bem os padrões e acerte mais, aumentando a
frequência de xi maiores. No caso dessa prática em específico, os x i maiores não foram mais
frequentes, mas foi observado um certo aumento no número de acertos de modo que o lado
direito do gráfico aumentou enquanto o esquerdo diminui.

Os Gráficos 2 e 3 foram reproduzidos novamente lado a lado para facilitar essa análise:

Distribuição de Probabilidade
(Teórica para eventos independentes)
Distribuição de Probabilidade (Empírica) E (X) = 1,3333 e DP (X) = 0,9428
45.00%
E (X) = 1,56 e DP (X) = 1,0984
40.00% 40.00%
39.51%
35.00% 35.00%
36.00%

30.00% 32.00% 30.00%


29.63%
25.00% 25.00%
% P(X)
% P(X)

20.00% 20.00%
19.75%
15.00% 16.00% 15.00%

10.00% 10.00%
9.88%
8.00% 8.00% 5.00%
5.00%

0.00% 0.00% 1.23%


0 1 2 3 4 0 1 2 3 4
X X

Gráfico 2
Gráfico 3

Portanto, pode-se concluir que as discrepâncias entre as duas distribuições podem não
ser tão expressivas, mas já configuram evidências que em conjunto contradizem a hipótese de
que os eventos no jogo do Goleiro são independentes, pois elas apontam para uma divergência
que poderia ser mais significativa com uma amostra maior, já que quanto maior a amostra de
uma distribuição empírica mais ela se aproxima da distribuição teórica correspondente a ela.
Desse modo, realizar mais tentativas no Jogo do Goleiro ou comparar dados de mais
indivíduos, isto é, obter uma amostra maior, poderia constituir uma distribuição de
probabilidade mais confiável, esclarecendo a dependência dos eventos.

Você também pode gostar