Você está na página 1de 5

Introdução à inferência estatística

Lista de exercícios # 3

Thiago Fonseca Morello

fonseca.morello@ufabc.edu.br

sala 301, Bloco Delta, SBC

A resolução desta lista deve ser entregue em papel ao professor, na sala de aula, até no máximo dia 12
de Março (data da primeira prova).

Todos os exercícios têm o mesmo valor, 10/7 = 1,43 pontos (o valor dos itens é equivalente à divisão
equitativa do valor do respectivo exercício).

Todos os exercícios abaixo, exceto pelo quarto e o sexto, podem ser encontrados nos capítulos 10 e 11 de
Bussab & Morettin, 5ª edição.

(Q.1) B&M Ex. 22 Um pesquisador está em dúvida sobre duas possíveis estatísticas, t e t’, para serem
usadas como estimadores de um parâmetro θ. Assim, ele decidiu usar simulação para uma situação
hipotética, procurando encontrar pistas que o ajudassem a decidir qual seria o melhor estimador. Partindo de
uma população fictícia, onde θ = 10, ele retirou 1.000 amostras de 20 elementos, e para cada amostra
calculou o valor das estatísticas t e t’. Em seguida, construiu a distribuição de frequências, segundo o quadro
abaixo.

Classes % de t % de t'
5a7 10 5
7a9 20 30
9 a 11 40 35
11 a 13 20 25
13 a 15 10 5
(a) Verifique as propriedades de t e t’ como estimadores de θ.

(b) Qual dos dois você adotaria? Por que?

R: Uma vez que a fórmula dos estimadores não é fornecida é impossível verificar as três propriedades
principais, ausência de viés, eficiência e consistência. A única solução possível é utilizar os resultados do
exercício de simulação com mil amostras, calculando média e variância, e verificando a diferença entre a
primeira e a média populacional e o tamanho da segunda. Tal expediente assume, pois, que as mil amostras
diferem, em termos da informação que contêm quanto à distribuição amostral, de maneira desprezível em
relação a todas as amostras de tamanho vinte que podem ser retiradas da população (ou seja, a tabela
acima resume a distribuição amostral dos estimadores). Os cálculos se encontram na tabela a seguir,
devendo-se notar que a variância foi calculada conforme a fórmula 𝑆 2 = ∑𝑁 ̅ 2
𝑖=1 𝑓(𝐴𝑖 )(𝐴𝑖 − 𝐴) , sendo A o
ponto médio de cada categoria e f(A) sua frequência relativa.

1
Ponto
% % médio da (A) * (A) * (% de t) * (% de t') *
Classes
de t de t' classe % de t (B) % de t' (B') ((A) - média(B))2 ((A) - média(B'))2
(A)
5a7 10 5 6 0,6 0,3 9,60 4,56
7a9 20 30 8 1,6 2,4 6,40 8,66
9 a 11 40 35 10 4 3,5 0,00 0,04
11 a 13 20 25 12 2,4 3 9,60 13,23
13 a 15 10 5 14 1,4 0,7 22,40 11,77
Média/Variância 10 9,9 48,00 38,26

É notório que o estimador “t” é acurado, i.e., não-viesado, mas, contudo, tem maior variância. A escolha
entre t e t’ não é trivial. Uma possibilidade seria selecionar o estimador com menor erro quadrático médio,
este dado por:

̂̂ )
̂ = (𝑡̅ − 𝜃)2 + 𝑉(𝑡
𝐸𝑄𝑀

Ou seja, trata-se da soma do quadrado do viés e da variância estimada, o que correspondente,


respectivamente, a 48 e 38,27, para t e t’. O estimador t’ é então selecionado. E isso pois sua menor
variância mais do que compensa a falta de acurácia.

(Q.2) [Bussab e Morettin, 5ª edição, Q.11, cap.11, adaptado] 𝜃̂1 e 𝜃̂2 são estimadores para um mesmo
parâmetro θ = 100. Deseja-se saber qual dos dois é o melhor. Para tanto, foram realizados dois exercícios. O
primeiro procurou reproduzir o experimento mental fundamental subjacente às definições de viés e
eficiência. Em tal exercício, foram obtidas, a partir de um gerador de números aleatórios, mil amostras com
tamanho igual a cem (N = 100), e calculadas, para cada uma delas, os valores dos dois estimadores. Em
seguida, as mil estimativas referentes a cada estimador foram resumidas calculando-se média e variância. Já
o segundo exercício procurou reproduzir o experimento mental subjacente à definição de consistência, mas
de maneira bastante simplificada. Nele, o primeiro exercício foi repetido para mil amostras de tamanho igual
a trezentos (N = 300). Os resultados dos dois exercícios se encontram abaixo.

𝜃̂1 𝜃̂2

Média das estimativas com N = 100 110 102


Variância das estimativas com N = 100 25 50
Média das estimativas com N = 300 100 102
Variância das estimativas com N = 300 5 30

(a) Considerando apenas o primeiro exercício (N = 100), responda: qual dos dois estimadores mostrou-se
acurado (em absoluto), relativamente mais acurado e qual se mostrou mais preciso? Justifique com base nas
definições de acurácia e precisão.

R: para N = 100, os dois estimadores são viesados, e, pois nenhum é acurado. Porém, o estimador 2 se
mostrou mais acurado relativamente. Já o estimador 1 mostrou-se mais preciso por ter a menor variância.

2
(b) Com base em sua resposta para o item anterior, responda: é trivial, com base no primeiro experimento,
escolher o melhor estimador?

R: não é trivial, pois nenhum dos dois estimadores é mais acurado e mais preciso. O estimador 1
proporciona ganho em termos de precisão, mas perda em termos de acurácia.

(b) Considerando apenas o segundo exercício (N = 300), refaça o item “a”.

R: Nestas condições, o único estimador acurado é o primeiro, no caso também o mais relativamente
acurado e mais preciso.

(c) Compare as respostas dadas para os itens “a” e “c” e explique a razão para eventual diferença ou
equivalência. Tome por base, para isso, a noção de consistência.

R: As respostas mudaram pois os indicadores de desempenho dos estimadores mudaram e isso com o
primeiro estimador sofrendo relevante melhoria de desempenho e tornando-se o melhor estimador. O que
leva a crer que tal estimador é consistente, ou pelo menos mais consistente, i.e., converge mais rápido para
o parâmetro. De fato, o viés do estimador 2 não se reduziu e sua variância sofreu queda consideravelmente
menor, com o aumento da amostra de 100 para 300.

(d) Com base na resposta ao item anterior, qual estimador você escolheria? Tal escolha depende do fato de
que os dois estimadores são viesados para N = 100.

R: o estimador 1, pois a evidência de que ele verifica a propriedade de consistência é mais forte. De fato,
tal escolha é independente do viés constatado para N = 100, pois se ambos os estimadores são viesados, tal
propriedade não pode ser utilizada para compará-los (ao menos, não quando aplicada em termos
absolutos). E o que se observa é que o viés do estimador 1 é reduzido com o aumento do tamanho amostral,
enquanto que isso não ocorre para o estimador 2 (daí por que faz sentido afirmar que há evidência quanto
à consistência para o estimador 1).

(Q.3) (B&M, Ex.10) Na função de verossimilhança L(p) da binomial, suponha que n = 5 e x = 3. Construa o
gráfico da função para os possíveis valores de p =1/5, 2/5, 3/5, 4/5 e verifique se o valor máximo ocorre
realmente para p = 3/5.

R: este exercício foi discutido em sala de aula (exemplo da probabilidade de tuberculose).

(Q.4) Obtenha o estimador de máxima verossimilhança para uma variável Binomal(N,p).

R: idem.

(Q.5) (B&M, Ex.3) Suponha um experimento consistindo de n provas de Bernoulli, com probabilidade de
sucesso p. Seja X o número de sucessos, e considere os estimadores:

(a) 𝑝̂1 = 𝑋/𝑁

1, 𝑠𝑒 𝑎 𝑝𝑟𝑖𝑚𝑒𝑖𝑟𝑎 𝑝𝑟𝑜𝑣𝑎 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑟 𝑠𝑢𝑐𝑒𝑠𝑠𝑜


(b) 𝑝̂2 = {
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜

Determine a esperança e variância de cada estimador. Por que 𝑝̂ 2 não é um “bom” estimador?

R: conforme visto em sala de aula, E[𝑝̂1] = p e V[𝑝̂1] = p(1-p)/N. Já E[𝑝̂ 2 ] = 1*p + (1-p)0 = p, V[𝑝̂2 ] =
E[(𝑝̂2 – E[𝑝̂2 ])2] = p (1-p)2 + (1-p) (0-p)2 = p (1-p)[(1-p)+p] = p(1-p). O segundo estimador é ruim pois ele
utiliza, a rigor, apenas a primeira prova, o que dá uma base informacional bastante limitada (uma
3
observação) para estimar o parâmetro. E isso se manifesta em uma variância N vezes maior (é claro que, se
N = 1, então os dois estimadores são equivalentes).

(Q.6) A “assimetria” é uma estatística que, na amostra, possui a fórmula (a) abaixo e, na população, possui a
fórmula (b).
𝑁
1
∑(𝑥𝑖 − 𝑥̅ )3 (𝑎)
𝑁
𝑖=1

E[(X-E[X])3] (b)

Obtenha o estimador do método dos momentos para a assimetria (dica: expanda o cubo).

R:

E[(X2+E[X] 2-2X E[X])(X-E[X])]

E[(X3+XE[X] 2-2X2E[X] – E[X]X2-E[X] 3+2X E[X]2)

E[X3]+ E[X] 3-2E[X2]E[X] – E[X]E[X2]-E[X] 3+2E[X] 3

E[X3] - 3E[X2]E[X] + 2E[X] 3 (i)

Há três momentos populacionais em (i), os quais são relacionados abaixo já assumindo igualdade com os
correspondentes momentos amostrais.
𝑁
3]
1
𝐸[𝑋 = ∑ 𝑥𝑖 3 (𝑖𝑖. 𝑎)
𝑁
𝑖=1

𝑁
2]
1
𝐸[𝑋 = ∑ 𝑥𝑖 2 (𝑖𝑖. 𝑏)
𝑁
𝑖=1

𝑁
1
𝐸[𝑋] = ∑ 𝑥𝑖 (𝑖𝑖. 𝑐)
𝑁
𝑖=1

Substituindo ii.a-ii.c em (i), chega-se ao estimador desejado:

1 1 1 1 3
Assi.MM = 𝑁 ∑𝑁 3 𝑁 2 𝑁 𝑁
𝑖=1 𝑥𝑖 - 3(𝑁 ∑𝑖=1 𝑥𝑖 ) (𝑁 ∑𝑖=1 𝑥𝑖 ) + 2(𝑁 ∑𝑖=1 𝑥𝑖 )

(Q.7) B&M, cap.10, Q.10, p275. A capacidade máxima de um elevador é de 500 kg. Se a distribuição X das
massas corpóreas dos usuários for suposta N(70,100):

(a) Qual é a probabilidade de sete passageiros ultrapassarem este limite?

(b) E seis passageiros?

R: (resposta sucinta)

Notar que se trata da estatística soma ou total (S) e deve-se assumir que os usuários compõem uma AAS.

P(X1 + X2 + ... + X7 > 500) ↔ P((S-μS)/(71/2)σS > (500-μS)/(71/2)σS) ↔ P(Z > (500-490)/(71/2)10)
4
(basta calcular o termo à esquerda dentro da probabilidade; o procedimento é análogo para o item “b”).

Você também pode gostar