Escolar Documentos
Profissional Documentos
Cultura Documentos
Autor:
Equipe Exatas Estratégia
Concursos
Aula 09
24 de Fevereiro de 2021
Sumário
4.1.1 – Suficiência..................................................................................................................... 23
Olá, concurseiro!
Na prática, essa aula é a etapa seguinte da aula de Amostragem, vista anteriormente, mas somente
em relação à amostragem aleatória (ou seja, aqui não tratamos da amostragem não
probabilística). Para estimar um parâmetro populacional, primeiro extraímos amostras aleatórias,
calculamos o estimador e, com base nesse estimador, inferimos a respeito do parâmetro
populacional, conforme ilustrado:
# se aproxima
Em outras palavras, conforme o tamanho da amostra 𝒏 aumenta, a média amostral 𝑿
da esperança populacional 𝑬(𝑿).
4
Note que a esperança populacional é um número, ou seja, a Lei dos Grandes Números não trata
da distribuição da média amostral. Esse assunto será visto posteriormente, ainda nesta aula.
A Lei dos Grandes Números é dividida em duas: temos a Lei Fraca e a Lei Forte dos Grandes
Números. A principal diferença entre elas é que a Lei Fraca enuncia uma convergência em
probabilidade e a Lei Forte enuncia uma convergência quase certa.
Para os propósitos deste curso, não precisamos definir formalmente esses conceitos, basta termos
uma noção do que eles significam. Convergência se assemelha ao termo tendência, ou seja, se
uma sequência 𝑋! converge a uma variável 𝑋, então essa sequência 𝑋! tende à variável 𝑋 quando
𝑛 cresce.
Além disso, a convergência quase certa é mais forte que a convergência em probabilidade, ou
seja, se houver convergência quase certa, haverá a convergência em probabilidade, mas o
contrário não é verdadeiro.
Essa diferença do tipo de convergência (em probabilidade ou quase certamente) decorre das
condições em que cada Lei é enunciada.
(CESPE/2012 – ANAC) Se X é uma variável aleatória e se {X1, X2, ... Xn} são observações aleatórias
independentes dessa variável, então, com base na lei forte dos grandes números, é correto afirmar
que, quando o tamanho amostral cresce (até o infinito), a média amostral tem distribuição normal
de média m = E(X).
Comentários:
As Leis dos Grandes Números não tratam da distribuição da média amostral, mas sim da sua
convergência à média populacional. Logo, a questão está errada.
Gabarito: Errado
(2015 – TJ-RO) A Lei dos Grandes Números existe em duas versões que tratam de convergências
de tipos distintos. A Lei Fraca e a Lei Forte abordam, respectivamente, convergências:
a) em probabilidade e em distribuição;
b) quase certa e em probabilidade;
c) em distribuição e quase certa;
d) em distribuição e em probabilidade;
e) em probabilidade e quase certa.
Comentários:
Vimos que a Lei Fraca enuncia uma convergência em probabilidade e a Lei Forte enuncia uma
convergência quase certa.
Gabarito: E.
A Lei Fraca dos Grandes Números enuncia que sendo 𝑋" uma sequência de variáveis
independentes, com variância finita, de modo que 𝑉(𝑋" ) ≤ 𝑐, para alguma constante 𝑐, então:
#! $%[#! ] (
!
→0
Nessa expressão, o termo 𝑆! corresponde ao somatório da sequência 𝑋" , ou seja, 𝑆! = ∑!")* 𝑋" ; e a
(
notação → indica uma convergência em probabilidade.
Ou seja, a diferença entre a soma de 𝑛 variáveis independentes e sua esperança, dividida pelo
número de variáveis 𝑛, tende a zero quando 𝒏 tende a infinito.
𝑆! ( 𝐸[𝑆! ]
→
𝑛 𝑛
(
𝑋5 → 𝐸[𝑋]
É importante ressaltar que é possível aplicar esse Teorema por causa da condição
da Lei Fraca, qual seja, variância finita.
(CESPE/2016 – TCE/PA) Considerando que uma amostra aleatória simples 𝑋* , 𝑋+ , … , 𝑋! tenha sido
retirada de uma população exponencial com média igual a 5, julgue o próximo item, relativo à
, ,, ,…,,
média amostral 𝑋5 = " # ! . !
De acordo com a lei fraca dos grandes números, a média amostral 𝑋5 converge em probabilidade
para 5.
Comentários:
A Lei dos Grandes Números afirma que a média aritmética das observações 𝑋5 converge para a
média (ou esperança) da variável. Segundo a Lei Fraca, há uma convergência em probabilidade.
Gabarito: Certo.
A Lei Forte dos Grandes Números enuncia que sendo 𝑋" uma sequência de variáveis
independentes e identicamente distribuídas (i.i.d.), com média 𝝁 finita, então:
,$ ∑!
$%" ,$
0.2.
∑!")*
!
= !
= 𝑋5 9: 𝜇
0.2.
A notação 9: indica uma convergência quase certa. Ou seja, a razão entre a soma de 𝑛 variáveis
i.i.d. pelo número de variáveis (isto é, a média amostral) tende à média populacional 𝜇 quando 𝒏
tende a infinito.
A principal diferença entre as leis é que para a Lei Forte, as variáveis são identicamente
distribuídas, o que torna a convergência quase certa.
Um caso particular da Lei dos Grandes Números ocorre quando as variáveis 𝑋" seguem distribuição
de Bernoulli, todas com probabilidade 𝑝. Nesse caso, o somatório ∑!")* 𝑋" corresponde à soma de
𝑛 variáveis de Bernoulli independentes, com probabilidade 𝑝. Assim, quando 𝑛 cresce, a razão
∑!
$%" ,$
!
tende a 𝑝:
∑!
$%" ,$
0.2.
!
9: 𝑝
Segundo a lei forte dos grandes números, à medida que o tamanho da amostra aumenta, a
estatística X/n converge para uma distribuição normal com média p.
Comentários:
A Lei dos Grandes Números não trata da distribuição da média amostral, mas sim da convergência
de seu valor. Logo, a questão está errada.
A título de complementação, a Lei Forte enuncia que, considerando n ensaios independentes de
∑!
$%" ,$
Bernoulli, com probabilidade p, à medida que o tamanho da amostra aumenta, a estatística !
converge para p.
Gabarito: Errado.
(CESPE/2013 – FUB) A lei dos grandes números é um importante resultado teórico que permite
o estudo das propriedades de estimadores estatísticos, como, por exemplo, a média amostral.
Considerando que µ representa a média populacional e que o desvio padrão populacional σ2 seja
finito, julgue o item subsequente a respeito desse assunto.
Segundo a lei forte dos grandes números, à medida que o tamanho da amostra aumenta, a
estatística 𝑋5 converge em probabilidade para a média µ.
Comentários:
Segundo a Lei Forte, à medida que o tamanho da amostra aumenta, a média amostral 𝑋5 converge
quase certamente para a média populacional µ.
Gabarito: Errado.
3. DISTRIBUIÇÃO AMOSTRAL
Sabendo que a média amostral tende à média populacional, então podemos imaginar que
utilizaremos essa medida como estimador para tal parâmetro populacional. Nesta seção,
estudaremos a distribuição de probabilidade dos principais estimadores, chamada de Distribuição
Amostral. (Lembre-se de que os estimadores são variáveis aleatórias!)
Inicialmente, cabe pontuar que a distribuição de uma amostra aleatória qualquer segue a mesma
distribuição populacional.
Para entender melhor esse conceito, vamos considerar um exemplo bem simples: uma moeda com
2 faces, que vamos denominar face 0 e face 1. Tratando-se de uma moeda equilibrada, a
probabilidade de cada face é de 50% e a esperança e variância são, respectivamente:
+
(0 − 0,5)+ + (1 − 0,5)+ 0,25 + 0,25
𝜎 = 𝑉(𝑋) = = = 0,25
2 2
Suponha que vamos extrair uma amostra aleatórias de tamanho 3, ou seja, vamos lançar a 3 vezes.
Podemos representar essa amostra por 𝑋* , 𝑋+ , 𝑋3 . Considerando que os possíveis resultados das
amostras são os mesmos da população (0 ou 1) e com as mesmas probabilidades de 50% para
cada face, então temos:
𝐸(𝑋" ) = 𝐸(𝑋) = 𝜇
𝑉(𝑋" ) = 𝑉(𝑋) = 𝜎 +
Como dissemos, para estimarmos a média da população 𝝁, utilizamos como estimador a média
# . Sendo 𝑋* + 𝑋+ + ⋯ + 𝑋! os valores observados da amostra, a média amostral é:
amostral 𝑿
, 4, 4⋯4,!
𝑋5 = " #!
10
Assim como os demais estimadores, a média amostral é uma variável aleatória. De fato, é possível
observar que 𝑋5 varia de acordo com os valores observados da amostra 𝑋* , 𝑋+ , … , 𝑋! .
A esperança dessa variável é a própria média populacional, e a sua variância é, para uma amostra
com 𝑛 observações, dada por:
𝐸(𝑋5) = 𝜇
6(,) 9 #
𝑉(𝑋5 ) = ! = !
O desvio padrão (raiz quadrada da variância) de um estimador é chamado de erro padrão. Assim,
o erro padrão da média amostral é dado por:
9 # 9
𝐸𝑃(𝑋5) = F ! =
√!
, 4, 4⋯4,! , , ,
𝐸(𝑋5) = 𝐸 G " #! H = 𝐸 G !" H + 𝐸 G !# H + ⋯ + 𝐸 G !! H
* * *
𝐸(𝑋5) = ! 𝐸(𝑋* ) + ! 𝐸(𝑋+ ) + ⋯ + ! 𝐸(𝑋! )
* * * *
#) = 𝜇 + 𝜇 + ⋯ + 𝜇 = 𝑛 × × 𝜇 = 𝝁
𝑬(𝑿 ! ! ! !
, 4, 4⋯4,! , , ,
𝑉(𝑋5) = 𝑉 G " #! H = 𝑉 G !" H + 𝑉 G !#H + ⋯ + 𝑉 G !!H
* * *
𝑉(𝑋5) = !# 𝑉(𝑋* ) + !# 𝑉(𝑋+ ) + ⋯ + !# 𝑉(𝑋! )
11
𝟐
# ) = *# 𝜎 + + *# 𝜎 + + ⋯ + *# 𝜎 + = 𝑛 × *# × 𝜎 + = 𝝈
𝑽(𝑿 ! ! ! ! 𝒏
Note que a variância da média amostral é menor do que a variância populacional. Isso faz
sentido, certo? As médias sempre variam menos do que os valores individuais, pois os valores
extremos acabam sendo compensados quando calculamos a média. Logo, a distribuição da
média amostral é menos dispersa do que a distribuição populacional.
(2019 – UEPA) Considere uma amostra aleatória 𝑋* , 𝑋+ , . . . , 𝑋! de uma população normal de média
, ,, ,...,,
𝜇 e variância σ2 = 9. Então, a média e a variância de 5𝑋55!5 = " # ! , são, respectivamente,
!
3
a) 𝜇 e !.
= >
b) ! e !.
>
c) 𝜇 e !.
!
d) 𝜇 e > .
Comentários:
Vimos que a média e a variância da média amostral são, respectivamente:
𝐸(𝑋5) = 𝜇
12
𝑉(𝑋) 9
𝑉(𝑋5) = =
𝑛 𝑛
Gabarito: C.
Os resultados da variância e do desvio padrão da média amostral são válidos para variáveis
𝑋* , 𝑋+ , … , 𝑋! independentes (quando a população é infinita ou quando as amostras são extraídas
com reposição).
Quando isso não ocorre, ou seja, quando a população é finita e as amostras são extraídas sem
reposição, precisamos fazer um ajuste. Sendo 𝑛 o tamanho da amostra e 𝑁 o tamanho da
população, precisamos multiplicar a variância da média amostral, pelo fator de correção de
?$!
população finita ?$*
.
#
555∗ ) = 9 × 𝑵$𝒏
𝑉(𝑋 ! 𝑵$𝟏
555∗ ) é menor do
Observe que o fator de correção é menor do que 1, pois 𝑁 − 𝑛 < 𝑁 − 1, logo, 𝑉(𝑋
que 𝑉(𝑋5).
Quando a população segue distribuição normal (ou gaussiana), a média amostral também
seguirá distribuição normal. Sendo 𝜇 e 𝜎 + a média e a variância da população, respectivamente,
13
9#
a média amostral, com 𝑛 observações independentes, terá média 𝐸(𝑋5) = 𝜇 e variância 𝑉(𝑋5) = !
,
9# 9
ou seja, desvio padrão 𝐷(𝑋5) = O𝑉(𝑋5) = F = .
! √!
Ainda que a população não siga distribuição normal, pelo Teorema Central do Limite, é possível
aproximar a distribuição da média amostral, com extrações independentes, a uma normal,
9 # 9
também com média 𝐸(𝑋5) = 𝜇 e variância 𝑉(𝑋5) = ! , ou seja, 𝐷(𝑋5) = .
√!
De modo equivalente, também podemos dizer que a variável 𝑍,C , definida abaixo, segue
distribuição normal padrão (ou reduzida), isto é, com média igual a 0 e desvio padrão igual a 1,
o que representamos como 𝑁(0,1):
𝑋5 − 𝜇
𝑍,C = 𝜎
√𝑛
(CESPE/2014 – ANATEL) Com base no teorema limite central, julgue o item abaixo.
Sendo uma amostra aleatória simples retirada de uma distribuição X com média µ e variância 1, a
distribuição da média amostral dessa amostra, 𝑋5, converge para uma distribuição normal de média
nµ e variância 1, à medida que n aumenta.
Comentários:
Vimos que a distribuição da média amostral, 𝑋5, converge para uma distribuição normal à medida
6(,)
que n aumenta. Porém, a média dessa distribuição é 𝐸(𝑋5) = 𝜇 e variância 𝑉(𝑋5) = . Sabendo !
*
que 𝑉(𝑋) = 1, a variância da média amostral é 𝑉(𝑋5) = !.
Gabarito: Errado.
14
(CESPE 2018/PF) O tempo gasto (em dias) na preparação para determinada operação policial é
uma variável aleatória X que segue distribuição normal com média M, desconhecida, e desvio
padrão igual a 3 dias. A observação de uma amostra aleatória de 100 outras operações policiais
semelhantes a essa produziu uma média amostral igual a 10 dias. Com referência a essas
informações, julgue o item que se segue, sabendo que 𝑃(𝑍 > 2) = 0,025, em que Z denota uma
variável aleatória normal padrão.
O erro padrão da média amostral foi inferior a 0,5 dia.
Comentários:
O erro padrão da média amostral é dado por:
𝜎
𝐸𝑃(𝑋5) =
√𝑛
Na fórmula acima, temos: 𝑛 é o tamanho da amostra (=10); 𝜎 é o desvio padrão amostral (=3).
3 3
𝐸𝑃(𝑋5) = = = 0,3
√100 10
Gabarito: Certo.
Agora, vamos trabalhar com uma população em que determinada característica está presente
em uma proporção 𝒑 dessa população, por exemplo, 15% da população apresenta olhos azuis;
20% da população está doente, 1% da produção apresenta defeito, etc.
15
Note que o estimador 𝑝̂ é calculado da mesma forma que 𝑿# . Logo, a esperança de 𝑝̂ é calculada
da mesma forma que para 𝑋5, utilizando 𝑝 no lugar de 𝜇:
𝐸(𝑝̂ ) = 𝑝
𝑉(𝑝)
𝑉(𝑝̂ ) =
𝑛
D.0
𝑉(𝑝̂ ) = !
D.0
𝐸𝑃(𝑝̂ ) = F !
Assim, como vimos para a média amostral, também podemos aproximar, pelo Teorema Central
D.0
do Limite, essa distribuição a uma normal, com média 𝐸(𝑝̂ ) = 𝑝 e variância 𝑉(𝑝̂ ) = ! , para 𝒏
grande.
Se a população for finita e a amostra for extraída sem reposição, será necessário aplicar o fator
?$!
de correção para população finita, multiplicando a variância por ?$*
.
Pontue-se que o número de elementos com o atributo sucesso encontrados em uma amostra de
tamanho 𝑛 segue uma distribuição binomial, com parâmetros 𝑛 e 𝑝.
16
17
1 2
^ ×
𝐸= 3 3
201
2
𝐸=^
1809
𝐸 ≅ 0,033
Gabarito: Certo.
9# 9
Esperança: 𝐸(𝑋5) = 𝜇; Variância: 𝑉(𝑋5 ) = !
; Erro Padrão: 𝐸𝑃(𝑋5 ) =
√!
D.0 D.0
Esperança: 𝐸(𝑝̂ ) = 𝑝; Variância: 𝑉(𝑝̂ ) = !
; Erro Padrão: 𝐸𝑃(𝑋5) = F !
∑(,$ $,C ) #
𝑠+ = 𝒏$𝟏
Utilizamos esse estimador, com a divisão por 𝒏 − 𝟏, pelo fato de ele ser melhor do que o estimador
que apresenta a divisão por 𝑛. Esse assunto será tratado na seção 3.
Para esse estimador, a esperança é igual à variância populacional, como indicado abaixo. A sua
variância e erro padrão são dados por:
18
𝐸(𝑠 + ) = 𝜎 +
+.9 '
𝑉(𝑠 + ) = !$*
+
𝐸𝑃(𝑠 + ) = F!$* 𝜎 +
𝒏$𝟏
Se a população seguir uma distribuição normal, então o estimador 𝑠 + , multiplicado pelo fator 𝝈𝟐
,
segue uma distribuição qui-quadrado com 𝒏 − 𝟏 graus de liberdade:
+
𝑛−1
𝒳!$* =d e . 𝑠+
𝜎+
Consequentemente, o estimador 𝑠 + é uma variável com distribuição qui-quadrado, com 𝑛 − 1
9#
graus de liberdade, multiplicada por !$*:
9#+
𝑠 + = G!$*H . 𝒳!$*
Essa informação será muito importante para a parte de estimação intervalar, que veremos
posteriormente.
9#+
𝑠 + = G!$*H . 𝒳!$*
9# + 9#
+ ]
𝐸 [𝑠 + ] = 𝐸 fG!$*H . 𝒳!$* g = G!$*H . 𝐸 [𝒳!$*
+ ]
𝐸 [𝒳!$* =𝑘 =𝑛−1
9#
𝐸 [𝑠 + ] = G!$*H . (𝑛 − 1) = 𝜎 +
19
+
9# + 9# + ] + ] 9'
𝑉 [𝑠 + ] = 𝑉 fG!$*H 𝒳!$* g = G!$*H . 𝑉 [𝒳!$* = G(!$*)#H . 𝑉[𝒳!$*
+ ]
𝑉 [𝒳!$* = 2. 𝑘 = 2. (𝑛 − 1)
Para uma amostragem estratificada, com 𝑘 estratos, a média amostral será dada por:
F
𝑁"
𝑋5 = i 𝑥#
𝑁 G
")*
Nessa expressão, 𝑁" é o tamanho de cada estrato; 𝑁 é o tamanho total da população; e 𝑥#G , a
média amostral observada para cada estrato.
Ou seja, calculamos a média 𝑥#G para cada estrato 𝑖, multiplicamos cada valor pelo tamanho do
estrato 𝑁" e dividimos pelo tamanho total 𝑁.
F
𝑁"
𝑉(𝑋5) = 𝑉 li 𝑥# m
𝑁 G
")*
F
𝑁" +
5
𝑉(𝑋) = i d e 𝑉(𝑥#G )
𝑁
")*
20
F
𝑁" +
𝑠H̅+ = i d e × 𝑠H̅+$
𝑁
J)*
Além disso, a estimativa da variância da média amostral para cada estrato 𝑖, 𝑠H̅+$ , considerando uma
amostra de tamanho 𝑛" para tal estrato, já com a correção para população finita é dada por:
(CESPE/2018 – STM) Um estudo acerca do tempo (x, em anos) de guarda de autos findos em
determinada seção judiciária considerou uma amostragem aleatória estratificada. A população
consiste de uma listagem de autos findos, que foi segmentada em quatro estratos, segundo a
classe de cada processo (as classes foram estabelecidas por resolução de autoridade judiciária.) A
tabela a seguir mostra os tamanhos populacionais (𝑁) e amostrais (𝑛), a média amostral (𝑥̅ ) e a
variância amostral dos tempos (𝑠 + ) correspondentes a cada estrato.
Considerando que o objetivo do estudo seja estimar o tempo médio populacional (em anos) de
guarda dos autos findos, julgue os itens a seguir.
A estimativa do tempo médio populacional da guarda dos autos findos é maior ou igual a 12 anos.
Comentários:
21
Em uma amostra aleatória por estratificação, a média da população é calculada pela relação
F
𝑁"
𝑋5 = i 𝑥#
𝑁 G
")*
Em que 𝑘 é a quantidade de estratos; 𝑁" o tamanho de cada estrato; e 𝑥#G a média de cada estrato.
Vinculando os estratos A, B, C e D aos números 1, 2, 3 e 4, respectivamente, temos:
𝑁* × 555
𝑥* + 𝑁+ × 555
𝑥+ + 𝑁3 × 555
𝑥3 + 𝑁K × 𝑥
555K
𝑋5 =
𝑁
30000 × 20 + 40000 × 15 + 50000 × 10 + 80000 × 5
𝑋5 =
200000
60 + 60 + 50 + 40
𝑋5 =
20
𝑋5 = 10,5
Gabarito: Errado.
Em que
𝑠H+$ 𝑁" − 𝑛"
𝑠H̅+$ = d e
𝑛" 𝑁"
Pelos valores apresentados na tabela, teremos:
3 30000 − 300
𝑠H̅+( = d e = 0,0099
300 30000
16 40000 − 400
𝑠H̅+) = d e = 0,0396
400 40000
5 50000 − 500
𝑠H̅+* = d e = 0,0099
500 50000
8 80000 − 800
𝑠H̅++ = d e = 0,0099
800 80000
Além disso, temos que:
22
𝑁L + 30000 +
d e =d e = 0,0225
𝑁 200000
𝑁M + 40000 +
d e =d e = 0,04
𝑁 200000
𝑁N + 50000 +
d e = d e = 0,0625
𝑁 200000
ND 2 80000 2
d e =d e = 0,16
N 200000
Portanto:
Q
𝑁J +
𝑠H̅+ = id e × 𝑠H̅+,
𝑁
J)*
4. ESTIMAÇÃO PONTUAL
Nesta seção, estudaremos como estimamos os parâmetros populacionais desconhecidos. O
primeiro passo é calcular o valor (número) do estimador, o que chamamos de estimativa pontual.
Ou seja, a estimativa pontual é o cálculo da média amostral 𝑋5, da proporção amostral 𝑝̂ , etc.
Não é qualquer estimador que vamos querer utilizar para estimar os parâmetros populacionais.
Eles devem apresentar determinadas características desejáveis. Mais formalmente, dizemos que
um estimador é uma estatística (isto é, uma função dos dados observados) da qual se espera as
propriedades, que veremos a seguir.
4.1.1 – Suficiência
Uma estatística é considerada suficiente se ela captura, a partir da amostra obtida, toda a
informação possível sobre o parâmetro populacional desconhecido, de modo que qualquer outra
informação não contribuirá com a estimação do parâmetro populacional.
23
Por exemplo, sabemos que a média amostral é utilizada para estimar a média populacional. Essa
estatística é considerada suficiente porque ela captura toda a informação, disponível na amostra,
necessária para estimar a média populacional. Qualquer outra informação, como a média
geométrica ou a variância da amostra, não influencia na estimativa da média populacional.
o Uma estatística é dita suficiente minimal se ela for uma função de qualquer outra estatística
suficiente.
o Por outro lado, uma estatística 𝑆(𝑋) é dita anciliar se ela não trouxer informação alguma a
respeito do parâmetro 𝜃, isto é, se 𝑆(𝑋) for independente de 𝜃.
o Por fim, uma estatística 𝑇 é dita completa para o parâmetro 𝜃, se o fato de a esperança de
uma função 𝑔(𝑇) ser igual a zero para todo 𝜃, 𝐸 [𝑔(𝑇)] = 0, implicar necessariamente em
𝑔(𝑇) = 0 para todo 𝜃.
(CESPE/2018 – EBSERH) X1, X2, ..., X10 representa uma amostra aleatória simples retirada de uma
w+
distribuição normal com média 𝜇 e variância 𝜎 + , ambas desconhecidas. Considerando que 𝜇̂ e 𝜎
representam os respectivos estimadores de máxima verossimilhança desses parâmetros
populacionais, julgue o item subsecutivo.
A soma X1+ X2 +...+ X10 é uma estatística suficiente para a estimação do parâmetro 𝜇.
Comentários:
Observe que a soma dos elementos captura todas as informações disponíveis na amostra para a
estimação da média, de modo que qualquer outra informação (média, variância,...) a respeito
24
dessa amostra não irá influenciar na estimação do parâmetro populacional. Logo, a soma dos
elementos é uma estatística suficiente.
Gabarito: Certo.
Dizemos que um estimador 𝜃x é não viesado (também chamado de não viciado ou não
tendencioso) quando a sua esperança é igual ao parâmetro populacional 𝜃 sendo estimado:
𝐸y𝜃x z = 𝜃
Na seção anterior, vimos que 𝐸(𝑋5) = 𝜇, 𝐸(𝑝̂ ) = 𝑝 e 𝐸(𝑠 + ) = 𝜎 + . Logo, podemos afirmar que a
média amostral 𝑋5 é um estimador não viesado (ENV) para a média populacional; o parâmetro
amostral 𝑝̂ é um ENV para o parâmetro populacional; e 𝑠 + é um ENV para a variância populacional.
∑(,$ $,C ) #
𝑠+ = 𝒏$𝟏
∑(,$ $,C ) #
Dissemos, ainda, que esse estimador é melhor do que o estimador 𝑠∗+ = 𝒏
.
Agora, podemos entender essa afirmação.
25
𝐸(𝑠∗+ ) ≠ 𝜎 +
Outra forma de descrever essa propriedade é a partir do erro, dado pela diferença entre o
estimador e o parâmetro populacional:
𝑒 = 𝜃x − 𝜃
𝐸(𝑒) = 0
𝐸𝑄𝑀y𝜃xz = 𝑉(𝑒)
+
𝐸𝑄𝑀y𝜃x z = 𝑉y𝜃xz − 𝐸€𝑏y𝜃xz•
(CESPE 2020/TJ-PA) Um estimador que fornece a resposta correta em média é chamado não
enviesado. Formalmente, um estimador é não enviesado caso seu valor esperado seja igual ao
parâmetro que está sendo estimado.
Os possíveis estimadores para a média populacional (µ) incluem β, média de uma amostra, α, a
menor observação da amostra, e π, a primeira observação coletada de uma amostra.
Considerando essas informações, julgue os itens subsequentes.
I A média de uma amostra (β) é exemplo de um estimador enviesado para a média populacional
(µ), pois seu valor esperado é igual à média populacional, ou seja, E(β) = µ.
26
II A menor observação da amostra (α) é um exemplo de estimador não enviesado, pois o valor da
menor observação da amostra deve ser inferior à média da amostra; portanto, E(α) < µ.
III A primeira observação coletada de uma amostra equivale a tomar ao acaso uma amostra
aleatória da população de tamanho igual a um e, portanto, é considerado um estimador não
enviesado.
Assinale a opção correta.
a) Nenhum item está certo.
b) Apenas o item I está certo.
c) Apenas o item II está certo.
d) Apenas o item III está certo.
e) Todos os itens estão certos.
Comentários:
A questão trabalha com alguns estimadores: a média amostral β, que normalmente chamamos de
𝑋5; a menor observação da amostra, α; e a primeira observação, π.
Em relação ao item I, sabemos que o valor esperado da média amostral é igual à média
populacional, E(β) = µ, o que defini um estimador não enviesado. Logo, o item I está errado.
Em relação ao item II, o valor esperado da menor observação da amostra é inferior à média da
amostral, E(α) < µ, o que define um estimador enviesado. Logo, o item II está errado.
Em relação ao item III, de fato, a primeira observação pode ser considerada uma amostra com
tamanho n = 1, ou seja, E(π) = µ. Logo, esse estimador é não enviesado. Logo, o item III está certo.
Gabarito: D.
4.1.3 – Eficiência
Considerando que, para um estimador não viesado, temos 𝑏y𝜃x z = 0, então a expressão do Erro
Quadrático Médio (EQM), que acabamos de ver se torna:
𝐸𝑄𝑀y𝜃xz = 𝑉y𝜃xz
Ou seja, para um estimador não viesado, o erro quadrático médio é igual à sua variância. Por
fornecer uma medida de precisão da estimativa, associamos a variância de um estimador não
viesado à sua eficiência. Logo, quanto menor a variância do estimador, maior será sua eficiência.
Dizemos que um estimador é eficiente se apresenta a menor variância possível, que é o caso da
média amostral e da proporção amostral.
27
4.1.4 – Consistência
Para um estimador consistente 𝜃x, as suas estimativas convergem para o parâmetro populacional 𝜃
com o aumento do tamanho amostral.
Mais precisamente, quando o tamanho amostral tende a infinito, a esperança do estimador tende
ao parâmetro populacional e a variância do estimador tende a zero:
lim 𝐸y𝜃x z = 𝜃
!→S
lim 𝑉y𝜃xz = 0
!→S
𝐸y𝜃x z = 𝜃 ↔ 𝐸(𝑒) = 0
∑(,$ $,C ) #
𝑠∗+ = 𝒏
é tendencioso; 𝑋5, 𝑝̂ e 𝑠 + são não tendenciosos
𝑋5 e 𝑝̂ são eficientes
28
Para obtermos bons estimadores, de acordo com alguns dos critérios que vimos, utilizamos
métodos de estimação. Estudaremos agora alguns desses métodos.
O Método dos Momentos se baseia nos momentos teóricos e amostrais das variáveis aleatórias.
Vimos na aula passada que o 𝑘-ésimo momento teórico da variável 𝑋, denotado por 𝜇F , é:
𝜇F = 𝐸(𝑋 F )
Se a variável for discreta, temos:
𝜇F = 𝐸(𝑋 F ) = i 𝑥 F . 𝑃(𝑋 = 𝑥)
Já o 𝑘-ésimo momento amostral, denotado por 𝑚F , para uma amostra de tamanho 𝑛, é dado por:
!
1
𝑚F = i 𝑋"F
𝑛
")*
∑!")* 𝑋"+
𝑚+ =
𝑛
Para um estimador obtido pelo método dos momentos (EMM), denotado por 𝜃xTT , o 𝑘-ésimo
momento amostral tende ao 𝑘-ésimo momento teórico, quando o tamanho da amostra tende ao
infinito:
𝑚F → 𝜇F
Para calcular os estimadores por esse método, substituímos os momentos teóricos, pelos
momentos amostrais. Por exemplo, o EMM para a média populacional, 𝜇̂ TT , é:
∑!")* 𝑋"
𝜇̂ TT = 𝑚* = = 𝑋5
𝑛
29
∑!")* 𝑋"+
+
𝜎‡TT = 𝑚+ − (𝑚* ) = +
− 𝑋5 +
𝑛
Com manipulações algébricas, obtemos como resultado:
+
∑!")*(𝑋" − 𝑋5)+
𝜎‡TT =
𝑛
Entretanto, sabemos que esse estimador é tendencioso, ou seja:
+
𝐸(𝜎‡TT ) ≠ 𝜎+
Portanto, nem sempre o estimador obtido pelo método dos momentos apresenta boas
propriedades. Inclusive, elas podem não ser suficientes.
Também é possível ter mais de um estimador para um mesmo parâmetro populacional. Para a
distribuição de Poisson, por exemplo, temos 𝐸(𝑋) = 𝑉(𝑋) = 𝜆. Assim, o parâmetro 𝜆 pode ser
+
estimado tanto por 𝜇̂ TT , quanto por 𝜎‡TT , o que pode resultar em estimativas bem diferentes.
Ademais, é possível obter valores negativos para os parâmetros de uma distribuição binomial, por
exemplo, segundo esse método.
Para estimar o parâmetro populacional desejado, esse método busca a estimativa para a qual a
probabilidade de se obter os valores observados é a maior possível. Em outras palavras, suponha
que as observações tenham sido 𝑋* , 𝑋+ , … , 𝑋! . Nesse caso, considerando o estimador de máxima
verossimilhança, a probabilidade associada às observações 𝑋* , 𝑋+ , … , 𝑋! é maior do que se
considerássemos qualquer outro estimador.
Esse método terá uma função diferente, de acordo com a distribuição da população. Para uma
variável com distribuição normal, o estimador de máxima verossimilhança (EMV) para a média é:
∑!")* 𝑋"
𝜇‰
T6 = = 𝑋5
𝑛
30
w
+
∑!")*(𝑋" − 𝑋5)+
𝜎T6 =
𝑛
Esse é o mesmo estimador obtido pelo método dos momentos, que sabemos ser tendencioso:
+
𝐸(𝜎‡T6 ) ≠ 𝜎+
Para uma variável aleatória com distribuição de Poisson, o estimador de máxima verossimilhança
(EMV) também é a média amostral:
∑!")* 𝑋"
𝜆w
T6 = = 𝑋5
𝑛
Por fim, se a variável aleatória seguir uma distribuição exponencial, a estimativa de máxima
*
verossimilhança para o parâmetro 𝜆 é (lembre-se que para essa distribuição, 𝐸(𝑋) = U):
1
𝜆w
T6 =
𝑋5
Para uma variável aleatória com distribuição de Bernoulli, o estimador de máxima verossimilhança
para 𝑝 é a proporção amostral (que segue a mesma definição de média amostral):
∑!")* 𝑋"
𝑝‰
T6 = = 𝑝̂
𝑛
(CESPE/2015 – Telebras) Considerando que os principais métodos para a estimação pontual são
o método dos momentos e o da máxima verossimilhança, julgue o item a seguir.
O estimador da máxima verossimilhança para a variância da distribuição normal é expresso por
w+ = * ∑!")*(𝑥" − 𝑥̅ )+ e este estimador é não viciado.
𝜎 !
Comentários:
w+ = * ∑!")*(𝑥" − 𝑥̅ )+ é o estimador de máxima verossimilhança para a
De fato, o estimador 𝜎 !
variância de uma população com distribuição normal, porém esse estimador é viciado.
Gabarito: Errado.
31
Comentários:
A estimativa de máxima verossimilhança para a variância de uma população normal, é:
∑!")*(𝑋" − 𝑋5)+
𝜎w
+
T6 =
𝑛
Para calculá-la, precisamos primeiramente da média amostral, 𝑋5:
∑ 𝑋" 2 + 3 + 0 + 1 6
𝑋5 = = = = 1,5
𝑛 4 4
A estimativa é, portanto:
w+
(2 − 1,5)+ + (3 − 1,5)+ + (0 − 1,5)+ + (1 − 1,5)+ (0,5)+ + (1,5)+ + (−1,5)+ + (−0,5)+
𝜎T6 = =
4 4
0,25 + 2,25 + 2,25 + 0,25 5
𝜎w+
T6 = =
4 4
Observe que a questão exigiu conhecimento justamente da diferença entre o estimador de
máxima verossimilhança e o estimador que utilizamos (não tendencioso).
Gabarito: Errado.
O Método de Mínimos Quadrados busca a estimativa 𝜃w TW que resulta no menor valor para o
quadrado das diferenças entre os valores observados 𝑋" e 𝜃w
TW :
!
+
Min iy𝑋" − 𝜃w
TW z
")*
𝜇‰ 5
TW = 𝑋
32
𝑝‰
TW = 𝑝̂
5. ESTIMAÇÃO INTERVALAR
Após obtermos uma estimativa para o parâmetro populacional desejado (estimação pontual),
calculamos o intervalo dentro do qual esse parâmetro deve variar. Ou seja, na estimação intervalar,
a estimativa deixa de ser um ponto (isto é, um valor único) e passa a ser um intervalo. Esse
intervalo, chamado intervalo de confiança, fornece uma noção de precisão da estimativa.
Como assim o parâmetro “deve” estar no intervalo? É possível que o parâmetro 𝜃 esteja fora
desse intervalo? Por se tratar de um intervalo construído em torno de uma variável aleatória, sim!
Em Inferência Estatística, sempre convivemos com um nível de dúvida. Mas, felizmente, é possível
dimensionar esse nível de dúvida.
33
34
Para estimarmos a média populacional, utilizamos a média amostral como estimador. Porém, para
construirmos um intervalo de confiança em torno desse estimador, é necessário saber se a
variância populacional é conhecida ou não.
1−𝛼
Para encontrar os limites, devemos utilizar a tabela normal padrão. Logo, precisamos utilizar a
transformação para a distribuição normal padrão 𝑍 (com média igual a 0 e desvio padrão igual a
1) que aprendemos na aula passada:
𝑣𝑎𝑙𝑜𝑟 𝑝𝑟𝑜𝑐𝑢𝑟𝑎𝑑𝑜 − 𝒎é𝒅𝒊𝒂 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜
𝑧=
𝒅𝒆𝒔𝒗𝒊𝒐 𝒑𝒂𝒅𝒓ã𝒐 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜
𝑋5 + 𝐸 − 𝑋5 𝐸
𝑧= 𝜎 = 𝜎
√𝑛 √𝑛
35
9
𝐸 = 𝑧.
√!
9 9
G𝑋5 − 𝑧. ; 𝑋5 + 𝑧. H
√! √!
Por exemplo, suponha um nível de confiança 1 − 𝛼 = 95% (normalmente, a prova fornece o valor
do nível de confiança mesmo, ou seja, o valor de 1 − 𝛼).
Para que toda a região indicada no gráfico acima delimite uma área de 1 − 𝛼 = 95%, então a área
entre 0 e z deve ser a metade: 𝑃(0 < 𝑍 < 𝑧) = 0,475.
Pela tabela da normal padrão, observamos que 𝑧 = 1,96. Logo, se o nível de confiança for de 95%,
o intervalo construído será:
𝜎 𝜎
d𝑋5 − 1,96. ; 𝑋5 + 1,96. e
√𝑛 √𝑛
Note que a probabilidade associada aos valores não incluídos no intervalo de confiança é
complementar, ou seja, igual a 𝛼. Por se tratar de uma distribuição simétrica, a probabilidade
associada aos valores superiores ao intervalo é 𝛼¤2 e aos valores inferiores é também 𝛼¤2:
𝛼¤ 𝛼¤
2 1−𝛼 2
36
Assim, é comum utilizar a notação 𝑧XY+ para indicar o limite do intervalo na distribuição normal
padrão (no nosso exemplo, temos 𝑧XY+ = 1,96).
Tamanho Amostral
Pode ser que a questão forneça, além do nível de confiança (1 − 𝛼), o valor do erro máximo, ou
seja, o valor de 𝐸, e indague a respeito do tamanho necessário da amostra 𝑛. Para isso, podemos
utilizar a mesma fórmula do erro que vimos há pouco:
𝜎
𝐸 = 𝑧.
√𝑛
Lembre-se que o valor de 𝑧 é obtido a partir do nível de confiança desejado e que o erro
corresponde à metade da amplitude do intervalo de confiança. Reorganizando essa fórmula,
temos:
9 +
𝑛 = G𝑧. %H
Ou seja, quanto maior o nível de confiança desejado (𝑧), maior será o tamanho amostral; e quanto
menor o erro máximo (𝐸), maior será o tamanho amostral.
Pontue-se que tais fórmulas pressupõem uma população infinita ou amostras extraídas com
reposição. Caso a população seja finita e as amostras extraídas sem reposição, então será
necessário aplicar o fator de correção para população finita. Para isso, devemos multiplicar a
?$!
fórmula do erro pelo fator F ?$* , influenciando, assim, no tamanho da amostra:
𝜎𝑁−𝑛
𝐸 = 𝑧. .^
√𝑛 𝑁 − 1
(CESPE 2020/TJ-PA) Uma equipe de engenheiros da qualidade, com vistas a estimar vida útil de
determinado equipamento, utilizou uma amostra contendo 225 unidades e obteve uma média de
1.200 horas de duração, com desvio padrão de 150 horas.
Considerando-se, para um nível de confiança de 95%, z = 1,96, é correto afirmar que a verdadeira
duração média do equipamento, em horas, estará em um intervalo entre
37
a) 1.190,00 e 1.210,00.
b) 1.185,20 e 1.214,80.
c) 1.177,50 e 1.222,50.
d) 1.180,40 e 1.219,60.
e) 1.174,20 e 1.225,80.
Comentários:
Vamos listar as informações do enunciado:
𝑀é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 → 𝑋5 = 1.200
𝐸𝑠𝑐𝑜𝑟𝑒 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 → 𝓏 = 1,96
𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 → 𝜎 = 150
𝑇𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 → 𝑛 = 225
Agora, podemos apenas aplicar na fórmula do intervalo de confiança para a média (como a
questão já forneceu o valor de 𝓏, não precisamos consultar a tabela para obtê-lo, a partir do nível
de confiança):
𝜎
𝑋5 ± 𝓏 ×
√𝑛
150
1200 ± 1,96 ×
√225
150
1200 ± 1,96 ×
15
1200 ± 1,96 × 10
1200 ± 19,6
Logo, o intervalo é (1200 − 19,6 = 1180,4; 1200 + 19,6 = 1219,6)
Gabarito: D.
(2014/TRT-MA) Para responder às questões use, dentre as informações dadas abaixo, as que
julgar apropriadas.
Se Z tem distribuição normal padrão, então: P(Z < 0,25) = 0,599, P(Z < 0,80) = 0,84, P(Z < 1) =
0,841, P(Z < 1,96) = 0,975, P(Z < 3,09) = 0,999
Considere X1, X2, ...Xn uma amostra aleatória simples, com reposição, da distribuição da variável
X, que tem distribuição normal com média µ e variância 36. Seja X a média amostral dessa amostra.
O valor de n para que a distância entre X e µ seja, no máximo, igual a 0,49, com probabilidade de
95% é igual a:
a) 256
38
b) 225
c) 400
d) 144
e) 576
Comentários:
Ao dizer que a distância entre a média amostral (ou seja, estimativa da média populacional) e a
média populacional seja no máximo igual a 0,49 com probabilidade de 95%, a questão forneceu
o erro máximo (𝑋5 − 𝐸; 𝑋5 + 𝐸), 𝐸 = 0,49, e o nível de confiança de 95%.
Para que 95% da distribuição esteja no intervalo (𝑋5 − 𝐸; 𝑋5 + 𝐸), 2,5% da distribuição estará acima
desse intervalo e 2,5% abaixo:
2,5% 2,5%
95%
Assim, precisamos do valor de z cuja probabilidade P(Z < z) seja igual a 2,5% + 95% = 97,5%.
Pelos valores fornecidas observamos que z = 1,96. Sabendo que a variância é 𝜎 + = 36, ou seja, o
desvio padrão é 𝜎 = √𝜎 + = √36 = 6, tendo em vista que o erro é E = 0,49, temos:
𝜎 +
𝑛 = G𝑧. H
𝐸
6 +
𝑛 = d1,96. e = (24)+ = 576
0,49
Gabarito: E.
Gabarito: Errado.
Sendo a variância populacional desconhecida, não podemos calcular a variância da média amostral
9 #
como 𝑉(𝑋5 ) = ! . Então, precisamos estimar a variância populacional, a partir da variância amostral.
∑!")*(𝑋" − 𝑋5)+
𝑠+ =
𝑛−1
Lembre-se que esse estimador vale para populações infinitas ou amostras extraídas sem reposição.
Caso a população seja finita, de tamanho 𝑁, e a amostra seja extraída com reposição, é necessário
?$!
aplicar o fator de correção, multiplicando o resultado por ?$*
.
Com a estimativa para a variância populacional, calculamos a variância da média amostral (basta
substituir 𝜎 + por 𝑠 + , na fórmula da variância da média amostral, que conhecemos):
𝑠+
𝑉(𝑋5) =
𝑛
Logo, o desvio padrão será:
𝑠+
𝐷(𝑋5 ) = O𝑉(𝑋5 ) = ^
𝑛
𝑠
𝐷(𝑋5 ) =
√𝑛
O método para a construção do intervalo de confiança será similar, porém, ao invés de
considerarmos a distribuição normal, utilizaremos a distribuição t-Student, considerando 𝒏 − 𝟏
graus de liberdade. Como vimos na aula passada, essa distribuição é similar à normal, porém mais
achatada no centro e com caudas mais largas, ou seja, apresenta maior variabilidade.
Precisamos utilizar uma outra distribuição, que não a distribuição normal, porque
agora a variância considerada deixou de ser um valor fixo e passou a ser também
40
uma estimativa, o que justifica o uso de uma distribuição com maior variabilidade
do que a normal.
H$,C
√Z #
[
𝑇=
#
\𝒳.
.
Considerando que 𝑡!$* representa o valor da tabela da distribuição t-Student padrão (com média
igual a zero e desvio padrão igual a 1) para 𝑛 − 1 graus de liberdade, temos:
𝑋5 + 𝐸 − 𝑋5 𝐸
𝑡!$* = 𝑠 = 𝑠
√𝑛 √𝑛
Z
𝐸 = 𝑡!$* .
√!
Ou seja, o erro é calculado assim como fizemos para a população com variância conhecida, apenas
substituindo a variável da normal padrão pela variável t-Student. O intervalo de confiança será da
Z Z
forma G𝑋5 − 𝑡!$* . ; 𝑋5 + 𝑡!$* . H.
√! √!
Por exemplo, suponha o mesmo nível de confiança do nosso exemplo anteriode 1 − 𝛼 = 95% e
uma amostra de tamanho 𝑛 = 9. Logo, precisamos buscar o valor de 𝑡 considerando 𝑛 − 1 = 8
graus de liberdade. Abaixo, inserimos parte da tabela de t-Student, que vimos na aula passada,
que apresenta os valores da função acumulada, ou seja, da forma 𝑃(𝑇 < 𝑡).
41
2,5% 2,5%
95%
Assim, devemos buscar o valor de 𝑡] para o qual 𝑃(𝑇 < 𝑡] ) = 0,975. Pela tabela acima, temos 𝑡] =
2,31. Logo, o intervalo será da seguinte forma (em que o valor da estimativa do desvio padrão 𝑠 é
obtido a partir da amostra):
𝑠 𝑠
G𝑋5 − 2,31. ; 𝑋5 + 2,31. H
3 3
(2019/SEFAZ-BA) Para obter um intervalo de confiança de 90% para a média p de uma população
normalmente distribuída, de tamanho infinito e variância desconhecida, extraiu-se uma amostra
aleatória de tamanho 9 dessa população, obtendo-se uma média amostral igual a 15 e variância
igual a 16. Considerou-se a distribuição t de Student para o teste unicaudal tal que a probabilidade
P(t - t0) = 0,05, com n graus de liberdade. Com base nos dados da amostra, esse intervalo é igual
a
42
a) (12,56; 17,44)
b) (13,76; 16,24)
c) (12,47; 17,53)
d) (12,59; 17,41)
e) (12,52; 17,48)
Comentários:
Pelo enunciado, sabemos que o tamanho amostral é 𝑁 = 9. Logo, temos 𝑁 − 1 = 8 graus de
liberdade. Pela tabela fornecida, para 8 de graus de liberdade, observamos que 𝑡 = 1,86.
Considerando, ainda, que a variância é 𝑠 + = 16, logo 𝑠 = √𝑠 + = √16 = 4, temos:
𝑠 4
𝐸 = 𝑡. = 1,86 × = 2,48
√𝑁 3
Assim, o intervalo de confiança para a média 𝑋5 = 15 é:
𝑋5 − 𝐸 = 15 − 2,48 = 12,52
𝑋5 + 𝐸 = 15 + 2,48 = 17,48
Gabarito: E.
𝑝̂ . 𝑞‡
𝐷(𝑝̂ ) = O𝑉(𝑝̂ ) = ^
𝑛
D^.0^
𝐸 = 𝑧. F !
43
D^.0^ D^.0^
Assim, o intervalo de confiança será da forma ª𝑝̂ − 𝑧. F ! ; 𝑝̂ + 𝑧. F ! «.
Tamanho Amostral
_ +
𝑛 = G% H 𝑝̂ . 𝑞‡
Vale pontuar que o maior valor de 𝑛 é obtido com 𝑝̂ = 𝑞‡ = 0,5, considerando o mesmo nível de
confiança (mesmo 𝑧) e o mesmo erro máximo 𝐸. Assim, mesmo sem conhecer a proporção
amostral, é possível determinar um valor máximo para o tamanho amostral (isto é, um valor
seguro), considerando 𝑝̂ = 𝑞‡ = 0,5 na fórmula acima. De modo geral, o valor de 𝑛 será maior
quanto mais próximo de 0,5 forem essas proporções.
Novamente, tal fórmula pressupõe uma população infinita ou amostras extraídas com reposição.
Caso a população seja finita e as amostras extraídas sem reposição, então será necessário aplicar
o fator de correção para população finita. Para isso, devemos multiplicar a fórmula do erro pelo
?$!
fator F ?$* :
𝑝̂ . 𝑞‡ 𝑁 − 𝑛
𝐸 = 𝑧. ^ .^
𝑛 𝑁−1
44
𝑝̂ × 𝑞‡
𝑝̂ ± 𝑍` × ^
𝑛
0,25 × 0,75
0,25 ± 2 × ^
1.875
0,1875
0,25 ± 2 × ^
1.875
0,25 ± 2 × O0,0001
0,25 ± 2 × 0,01
0,25 ± 0,02
Gabarito: Errado.
(2019/FMS) Uma pesquisa tem como finalidade conhecer a proporção de pessoas em Teresina
que teriam interesse em frequentar uma nova franquia de lanchonete vinda do exterior. O
empreendedor diz que só vale a pena a instalação da franquia, se pelo menos 10% da população
tivesse interesse em frequentar o estabelecimento. Supondo que a proporção máxima da
população não será maior que 30%, qual tamanho de amostra (aproximado) tal que a diferença
entre a proporção populacional e proporção amostral não tenha um erro maior que três pontos
percentuais, com uma confiança de 95%. Obs.: zγ=1,96.
a) 897
b) 683
c) 700
d) 300
e) 654
45
Comentários:
O tamanho amostral é dado por:
𝑧 +
𝑛 = G H 𝑝̂ . 𝑞‡
𝐸
O enunciado informa que 𝑧 = 1,96 e 𝐸 = 0,03. Devemos considerar, ainda, 𝑝̂ = 0,3. (Esse é o valor
máximo para a proporção. Quanto mais próximos de 50%, maior será o valor de n. Logo, ao utilizar
o valor de 30%, estamos calculando um valor seguro para o tamanho amostral). Sabendo que 𝑞‡ =
1 − 𝑝̂ = 0,7, temos:
1,96 +
𝑛=d e × 0,3 × 0,7 ≅ 897
0,03
Gabarito: A.
+
𝑛−1
𝒳!$* = d + e 𝑠+
𝜎
Como essa distribuição é assimétrica, utilizaremos a tabela da distribuição qui-quadrado para
+ +
encontrar tanto o limite superior, 𝒳#a( , quanto o limite inferior, 𝒳b?c , do intervalo de confiança:
+
𝑛−1 + +
𝒳b?c <d e 𝑠 < 𝒳#a(
𝜎+
Isolando 𝜎 + nessa expressão, temos:
(𝑛 − 1). 𝑠 + +
(𝑛 − 1). 𝑠 +
+ < 𝜎 < +
𝒳#a( 𝒳b?c
Ou seja, para o limite inferior, dividimos por 𝓧𝟐𝑺𝑼𝑷 e para o limite superior dividimos por 𝓧𝟐𝑰𝑵𝑭 .
+ + +
Atente-se que 𝒳#a( é um valor maior que 𝒳b?c . Assim, quando dividimos por 𝒳#a( (limite inferior)
+
obtemos um valor menor do que quando dividimos por 𝒳b?c (limite superior).
(!$*).Z # (!$*).Z #
d #
𝒳/01
; #
𝒳234
e
46
+ +
Novamente, os valores 𝒳#a( e 𝒳b?c são obtidos a partir da tabela, dependendo do nível de
confiança 1 − 𝛼 desejado e do tamanho da amostra, conforme ilustrado abaixo.
𝛼¤ 𝛼¤
2 2
1−𝛼
+ +
𝒳b?c 𝒳#a(
+ X
Assim, como para as distribuições anteriores, o valor 𝒳b?c deixa + da distribuição abaixo; e o valor
+ X
𝒳#a( deixa +
da distribuição acima (a diferença é que agora não estamos mais lidando com uma
distribuição simétrica):
+ X
𝑃(𝒳 + < 𝒳b?c ) = +
+ ) X
𝑃(𝒳 + < 𝒳#a( =1−+
Suponha o mesmo nível de confiança de 1 − 𝛼 = 0,95 e uma amostra de tamanho 9. Pela tabela
+
da distribuição qui-quadrado, observamos que o valor de 𝒳b?c é igual a 2,7, pois 𝑃(𝒳>+ < 2,7) =
X + X
+
= 0,025; e o valor de 𝒳#a( é igual a 19,0, pois 𝑃(𝒳>+ < 19,0) = 1 − + = 0,975. Logo, o intervalo
de confiança para a variância para esse exemplo é:
8. 𝑠 + 8. 𝑠 +
ª ; «
19,0 2,7
(2019/DPE-RJ) Com o objetivo de produzir uma estimativa por intervalo para a variância
populacional, realiza-se uma amostra de tamanho n = 4, obtendo-se, após a extração, os seguintes
resultados:
X1 = 6, X2 = 3, X3 = 11 e X4 = 12
Informações adicionais:
P (X24 < 0,75 ) = 0,05 P (X23 < 0,40 ) = 0,05
P (X24 < 10,8 ) = 0,95 P (X23 < 9 ) = 0,95
47
+
∑!")*(𝑋" − 𝑋5)+
𝑠 =
𝑛−1
O valor da média amostral é:
∑ 𝑋" 6 + 3 + 11 + 12 32
𝑋5 = = = =8
𝑛 4 4
Logo, o estimador da variância é:
(6 − 8)+ + (3 − 8)+ + (11 − 8)+ + (12 − 8)+ (−2)+ + (−5)+ + (3)+ + (4)+
𝑠+ = =
4−1 3
4 + 25 + 9 + 16 54
𝑠+ = = = 18
3 3
+
Sabendo que são n – 1 = 3 graus de liberdade e um intervalo de confiança de 95%, temos 𝒳b?c =
+
0,4 e 𝒳#a( = 9, logo o intervalo de confiança é:
3 × 18
𝐼𝑛𝑓 = =6
9
3 × 18
𝑆𝑢𝑝 = = 135
0,4
Gabarito: C.
48
D^.0^
Intervalo para a proporção: 𝐸 = 𝑧. F !
(!$*).Z # (!$*).Z #
Intervalo para a variância: d #
𝒳/01
; #
𝒳234
e
RESUMO DA AULA
Lei dos Grandes Números
D.0 D.0
Þ Proporção amostral 𝑝̂ : 𝐸(𝑝̂ ) = 𝑝, 𝑉(𝑝̂ ) = !
, 𝐸𝑃(𝑝̂ ) = F !
∑(,$ $,C ) #
Þ Estimador da variância amostral: 𝑠 + = !$*
49
Métodos de Estimação
#
w+ = ∑(,$ $,C)
Þ Método dos Momentos: Resulta em 𝑋5 como estimador para a média; e em 𝜎 !
w
como estimador para a variância (𝜎 é tendencioso)
+
Þ Método dos Mínimos Quadrados: Resulta em 𝑋5 como estimador para a média; e em 𝑝̂ como
estimador para a proporção
Estimação Intervalar
9
Þ Intervalo de confiança para população com variância desconhecida: 𝑋5 ± 𝑡!$* .
√!
Erro Máximo
(metade da amplitude
do intervalo)
50
De acordo com a lei fraca dos grandes números, à medida que o tamanho da amostra aumenta, a
variável aleatória 𝑋5 converge para uma distribuição normal padrão.
Comentários:
A Lei dos Grandes Números não trata da distribuição da média amostral, mas sim da convergência
de seu valor. Logo, a questão está errada.
Gabarito: Errado
2. (CESPE/2008 – INSS)
Com relação ao texto, julgue o próximo item, considerando que outras 900 pessoas tenham sido
observadas em uma nova pesquisa, sendo Xα a quantidade de pessoas que sofreram o primeiro
infarto do miocárdio no período de cinco anos antes da publicação do veto e Xb a quantidade de
pessoas que sofreram o primeiro infarto do miocárdio no período até cinco anos após a publicação
do veto.
Pelo teorema conhecido como lei forte dos grandes números, é correto concluir que a variável
aleatória Xα segue aproximadamente uma distribuição normal.
Comentários:
51
Nessa questão, temos a mesma situação: a Lei dos Grandes Números trata da convergência da
média amostral à média populacional e não da distribuição de alguma variável aleatória.
Gabarito: Errado.
Comentários:
A Lei Fraca dos Grandes Números enuncia que a média amostral converge à média populacional,
em probabilidade, não quase certamente.
Gabarito: Errado
De acordo com a lei forte dos grandes números, quase certamente, a média amostral converge
para o valor m, desde que n seja finito e suficientemente grande.
Comentários:
Pela Lei dos Grandes Números, a média amostral converge à média populacional, se esta for finita.
Isso significa que a média amostral tende à média populacional quando n tende a infinito, ou seja,
justamente o contrário de n finito.
Gabarito: Errado.
5. (CESPE/2013 – FUB) A lei dos grandes números é um importante resultado teórico que
permite o estudo das propriedades de estimadores estatísticos, como, por exemplo, a média
amostral . Considerando que μ representa a média populacional e que o desvio padrão
populacional σ seja finito, julgue o item subsequente a respeito desse assunto.
52
Considere que um estimador T converge em média quadrática para um parâmetro 𝜏 à medida que
o tamanho da amostra aumenta. Nessas condições, é correto afirmar que a lei fraca dos grandes
números se aplica para esse estimador.
Comentários:
𝑋TW = O𝐸(𝑋 + )
Logo, se essa média converge a um parâmetro 𝜏, então 𝐸(𝑋 + ) converge ao parâmetro 𝜏 + . Sabendo
que 𝑉(𝑋) = 𝐸(𝑋 + ) − [𝐸(𝑋)]+ , ou seja, 𝑉(𝑋) ≤ 𝐸(𝑋 + ), então 𝑉(𝑋) também converge para algum
parâmetro.
Isso significa que a condição da Lei Fraca, isto é, variância finita, é satisfeita.
Gabarito: Certo.
6. (CESPE/2013 – FUB) A lei dos grandes números é um importante resultado teórico que
permite o estudo das propriedades de estimadores estatísticos, como, por exemplo, a média
amostral . Considerando que μ representa a média populacional e que o desvio padrão
populacional σ seja finito, julgue o item subsequente a respeito desse assunto.
Se 𝑛 é o tamanho da amostra, então na versão fraca da lei dos grandes números, 𝑃(|𝑋5 − 𝜇| > 𝜀) <
* 9 +
!
G n H , para todo 𝜀 > 0.
Comentários:
𝑉(𝑋)
𝑃(|𝑋 − 𝜇| > 𝜀) <
𝜀+
𝑉(𝑋5)
𝑃(|𝑋5 − 𝜇| > 𝜀) <
𝜀+
𝑉(𝑋) 𝜎 +
𝑉(𝑋5) = =
𝑛 𝑛
𝜎+
𝑃(|𝑋5 − 𝜇| > 𝜀) <
𝑛. 𝜀 +
Gabarito: Certo.
7. (CESPE 2016/TCE-PA) Uma amostra aleatória simples 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝒏 foi retirada de uma
população normal com média e desvio padrão iguais a 10. Julgue o próximo item, a respeito
# = [𝑿𝟏 + 𝑿𝟐 +. . . +𝑿𝒏 ]/𝒏.
da média amostral 𝑿
Comentários:
Gabarito: Errado.
O número médio de pessoas maiores de idade por domicílio foi igual a 3 pessoas por domicílio; e
o erro padrão do estimador do percentual 𝑃 é inversamente proporcional a 3√1.000.
54
Comentários:
Como foram entrevistadas 3000 pessoas em 1000 domicílios, a média de pessoas maiores de
idade por domicílio é igual a:
3000
= 3 𝑝𝑒𝑠𝑠𝑜𝑎𝑠 𝑝𝑜𝑟 𝑑𝑜𝑚𝑖𝑐í𝑙𝑖𝑜.
1000
D(*$D)
𝐸=F !
,
Sendo a amostra do número de pessoas de tamanho igual a 3000, o número de pessoas que
conhecem o programa igual a 2250, então 𝑝 = 2250/3000 e
2250 750
^3000 × 3000
𝐸=
3000
750 1 1
𝐸= × = 0,75 ×
1000 √9000 3√1000
Gabarito: Certo.
9. (CESPE 2019/TJ-AM) Para avaliar a satisfação dos servidores públicos de certo tribunal
no ambiente de trabalho, realizou-se uma pesquisa. Os servidores foram classificados em três
grupos, de acordo com o nível do cargo ocupado. Na tabela seguinte, 𝒌 é um índice que se
refere ao grupo de servidores, e 𝑵𝒌 denota o tamanho populacional de servidores
pertencentes ao grupo 𝒌.
55
Nível do Cargo 𝒌 𝑵𝒌 𝒏𝒌 𝒑𝒌
I 1 500 50 0,7
II 2 300 20 0,8
III 3 200 10 0,9
De cada grupo k foi retirada uma amostra aleatória simples sem reposição de
tamanho 𝒏𝒌 ; 𝒑𝒌 representa a proporção de servidores amostrados do grupo k que se
mostraram satisfeitos no ambiente de trabalho.
Com relação ao grupo 𝑘 = 2, o erro padrão da estimativa da proporção dos servidores satisfeitos
no ambiente de trabalho foi inferior a 0,1.
Comentários:
D(*$D)
𝐸=F !
.
0,8 × 0,2
𝐸=^ = O0,008 ≅ 0,089
20
Gabarito: Certo.
56
A estimativa do percentual de pessoas que conhecem o programa justiça itinerante foi inferior a
60%.
Comentários:
Após selecionados os domicílios, foram entrevistados todos os residentes maiores de idade, que
totalizaram 3.000 pessoas. Nesse grupo, o número de participantes que conhecia o programa
justiça itinerante foi de 2.250 pessoas.
2250
𝑝̂ = = 0,75 = 75%
3000
Gabarito: Errado.
Se a amostragem fosse com reposição, a estimativa da variância da proporção amostral teria sido
superior a 0,001.
Comentários:
O Teorema Central do Limite nos garante que a variância da proporção amostral, na amostragem
com reposição, tem distribuição aproximadamente normal, sendo calculada pela relação:
𝑝(1 − 𝑝)
𝑉𝑎𝑟(𝑝̂ ) =
𝑛
57
𝑝(1 − 𝑝)
𝑉𝑎𝑟(𝑝̂ ) =
𝑛
1 2
×
𝑉𝑎𝑟(𝑝̂ ) = 3 3
201
2
𝑉𝑎𝑟(𝑝̂ ) =
1809
𝑉𝑎𝑟(𝑝̂ ) ≅ 0,0011
Gabarito: Certo.
Sabendo que 𝑷(𝒁 < 𝟐) = 𝟎, 𝟗𝟕𝟓, em que Z representa a distribuição normal padrão, julgue o
item que se segue, em relação a essa situação hipotética.
Comentários:
𝑝̂ 𝑞‡
𝑠+ =
𝑛
25 × 0,75
𝑠+ =
1.875
58
0,25 × 0,01
𝑠+ =
25
𝑠 + = 0,01 × 0,01
𝑠 = 0,01
Gabarito: Certo.
13. (CESPE 2018/PF) Uma pesquisa realizada com passageiros estrangeiros que se
encontravam em determinado aeroporto durante um grande evento esportivo no país teve
como finalidade investigar a sensação de segurança nos voos internacionais. Foram
entrevistados 1.000 passageiros, alocando-se a amostra de acordo com o continente de
origem de cada um — África, América do Norte (AN), América do Sul (AS), Ásia/Oceania (A/O)
ou Europa. Na tabela seguinte, N é o tamanho populacional de passageiros em voos
internacionais no período de interesse da pesquisa; n é o tamanho da amostra por origem; P
é o percentual dos passageiros entrevistados que se manifestaram satisfeitos no que se refere
à sensação de segurança.
Origem 𝑵 𝒏 𝑷
AN 300.000 300 70
AS 100.000 100 90
59
Considerando o referido desenho amostral, estima-se que o percentual populacional 𝑃DqD seja
inferior a 79%.
Comentários:
Logo:
780
𝑝̂ = = 78%.
1.000
Gabarito: Certo.
14. (CESPE 2018/STM) Em um tribunal, entre os processos que aguardam julgamento, foi
selecionada aleatoriamente uma amostra contendo 30 processos. Para cada processo da
amostra que estivesse há mais de 5 anos aguardando julgamento, foi atribuído o valor 1; para
cada um dos outros, foi atribuído o valor 0. Os dados da amostra são os seguintes:
110010110111101110101010111011
60
A variância da proporção amostral 𝑝̂ sob a hipótese nula 𝐻` : 𝑝 = 0,5 é menor que 0,1.
Comentários:
𝑝𝑞
𝜎D^ =
𝑛
0,5 × 0,5
=
30
0,25
=
30
≅ 0,00833
Gabarito: Certo.
15. (CESPE 2018/STM) Em um tribunal, entre os processos que aguardam julgamento, foi
selecionada aleatoriamente uma amostra contendo 30 processos. Para cada processo da
amostra que estivesse há mais de 5 anos aguardando julgamento, foi atribuído o valor 1; para
cada um dos outros, foi atribuído o valor 0. Os dados da amostra são os seguintes:
110010110111101110101010111011
A proporção populacional de processos que aguardam julgamento há mais de 5 anos foi
denotada por p; a proporção amostral de processos que aguardam julgamento há mais de 5
anos foi representada por 𝒑
Y
61
Comentários:
20
𝑝̂ = ≅ 66,67%
30
Como é comum usarmos a proporção amostral para estimar a proporção populacional, pode-se
dizer que a estimativa é superior a 60%.
Gabarito: Certo.
16. (CESPE 2018/EBSERH) 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝟏𝟎 representa uma amostra aleatória simples retirada
de uma distribuição normal com média 𝝁 e variância 𝝈𝟐 , ambas desconhecidas. Considerando
que 𝝁
Ye𝝈Y representam os respectivos estimadores de máxima verossimilhança desses
parâmetros populacionais, julgue o item subsecutivo.
s $=
=
A razão 9
segue uma distribuição normal padrão.
Comentários:
Pode-se mostrar que o estimador de máxima verossimilhança para a média de uma distribuição
normal 𝑁(𝜇, 𝜎 + ) é igual a
𝑋* + 𝑋+ + ⋯ + 𝑋*`
𝜇̂ = 𝑋5 = = 𝑀é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙
10
1. a distribuição da média amostral de uma distribuição normal com média 𝜇 e variância 𝜎 + é dada
por
𝜎+
𝑋5 ∼ 𝑁 ª𝜇, «.
𝑛
62
2. para uma variável aleatória 𝑋 com distribuição normal com média μ e variância 𝜎 + , a
transformação:
𝑋−𝜇
𝑍=
𝜎
𝜇̂ − 𝜇 𝑋5 − 𝜇
𝜎 = 𝜎 ~ 𝑁(0,1)
√𝑛 √𝑛
s $=
=
e não a 9
.
Gabarito: Errado.
17. (CESPE 2018/STM) Diversos processos buscam reparação financeira por danos morais.
A tabela seguinte mostra os valores, em reais, buscados em 10 processos — numerados de 1
a 10 — de reparação por danos morais, selecionados aleatoriamente em um tribunal.
Processo Valor
1 3.700
2 3.200
3 2.500
4 2.100
5 3.000
6 5.200
7 5.000
8 4.000
9 3.200
63
10 3.100
A partir dessas informações e sabendo que os dados seguem uma distribuição normal, julgue
o item subsequente.
Se 𝜇 = estimativa pontual para a média dos valores buscados como reparação por danos morais
no referido tribunal, então 3.000 < 𝜇 < 3.300.
Comentários:
Processo Valor
1 3.700
2 3.200
3 2.500
4 2.100
5 3.000
6 5.200
7 5.000
8 4.000
9 3.200
10 3.100
Total 35.000
35.000
𝑋5 = = 3.500
10
Gabarito: Errado.
64
Se, dessa população, for coletada uma amostra aleatória de tamanho 𝑛 = 1, a probabilidade de
um indivíduo apresentar valor 1 é igual a 0,5.
Comentários:
Como na população temos 30% de casos iguais a 1 (ou seja, a população tem 30% de casos
favoráveis), então a chance de a extração resultar em caso favorável é justamente de 30%.
Gabarito: Errado.
19. (CESPE 2016/TCE-PA) Uma amostra aleatória simples 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝒏 foi retirada de uma
população normal com média e desvio padrão iguais a 10. Julgue o próximo item, a respeito
# = [𝑿𝟏 + 𝑿𝟐 +. . . +𝑿𝒏 ]/𝒏.
da média amostral 𝑿
Comentários:
𝜎 = 10
𝜎 + = 100
A média amostral tem variância igual à populacional, dividida por 𝑛, em que 𝑛 é o tamanho da
amostra.
100
𝑉(𝑋5) =
𝑛
65
Gabarito: Errado.
20. (CESPE 2016/TCE-PA) Uma amostra aleatória simples 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝒏 foi retirada de uma
população normal com média e desvio padrão iguais a 10. Julgue o próximo item, a respeito
# = [𝑿𝟏 + 𝑿𝟐 +. . . +𝑿𝒏 ]/𝒏.
da média amostral 𝑿
Comentários:
𝑃(𝑋5 − 10 > 0)
A média amostral 𝑋5, por sua vez, também é normal com média 10. Ou seja, seu comportamento
é simétrico ao redor de 10. Isto significa que a chance de termos valores maiores que 10 é igual à
chance de valores menores que 10, ambas valendo 50%.
O item afirmou que a probabilidade seria menor ou igual a 0,5. Como vimos, ela é justamente
igual, o que torna o item correto.
Gabarito: Certo.
(, 4, 4, 4, )
No que se refere à média amostral 𝑋5 = " # K 7 ' , na qual 𝑋* , 𝑋+ , 𝑋3 , 𝑋K representa uma amostra
aleatória simples retirada dessa distribuição X, é correto afirmar que a estimativa da variância do
estimador 𝑋5 seja igual a 1,25.
66
Comentários:
𝑉(𝑋)
𝑉(𝑋5) =
𝑛
𝐸(𝑋) = 𝑉(𝑋) = 𝜆
(𝑋* + 𝑋+ + 𝑋3 + 𝑋K ) (10 + 4 + 2 + 4) 20
𝜆À = 𝑋5 = = = =5
4 4 4
Logo, temos:
5
𝑉(𝑋5) = = 1,25
4
Gabarito: Certo.
22. (CESPE 2018/ABIN) Considerando que os principais métodos para a estimação pontual
são o método dos momentos e o da máxima verossimilhança, julgue o item a seguir.
Comentários:
Os estimadores para a média e para a variância obtidos tanto pelo método dos momentos, quanto
pelo método da máxima verossimilhança são:
∑!")* 𝑋"
𝜇̂ = = 𝑋5
𝑛
∑!")*(𝑋" − 𝑋5)+
w+ =
𝜎
𝑛
Gabarito: Certo.
67
Comentários:
Em relação à alternativa E, se Var(a) > Var(b), nas condições indicadas na alternativa, então
podemos concluir que b é um estimador melhor (mais eficiente).
Gabarito: D.
68
Comentários:
∑!")* 𝑋" 6 + 8 + 0 + 4 + 2 20
𝜆À = = = =4
𝑛 5 5
Em uma distribuição de Poisson, a variância é igual a esse parâmetro, 𝑉(𝑋) = 𝜆. Logo, o desvio
padrão é dado por:
𝜎 = O𝑉(𝑋) = √𝜆 = √4 = 2
Gabarito: Certo.
Comentários:
Item I – Certo. Vamos usar a fórmula do intervalo de confiança (IC) para uma amostra menor ou
igual a 30:
𝜎
𝑋5 ± 𝑍X/+ ×
√𝑛
𝑋5 → 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙
𝑍X/+ → 𝑍`,`+V = 1,96 → 𝑒𝑠𝑐𝑜𝑟𝑒 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 (1 − 𝛼)
𝜎 = 3 → 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜
𝑛 = 25 → 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
3
𝛽" ± 1,96 ×
5
𝛽" ± 1,176
Item II – Errado. O enunciado nos diz que o intervalo de confiança é de 95%, sendo assim 5%
estará fora desse intervalo, logo, não é verdadeiro o que se afirma em II.
Item III – Certo. Quanto maior o tamanho da amostra, menor a margem de erro.
Gabarito: C.
26. (CESPE 2020/TJ-PA). Ao analisar uma amostra aleatória simples composta de 324
elementos, um pesquisador obteve, para os parâmetros média amostral e variância amostral,
os valores 175 e 81, respectivamente.
70
Comentários:
𝜎
𝑋5 ± 𝓏 ×
√𝑛
9
175 ± 1,96 ×
√324
9
175 ± 1,96 ×
18
175 ± 0,98
175 ± 0,98
Gabarito: B.
27. (CESPE 2020/TJ-PA). A respeito dos intervalos de confiança, julgue os próximos itens.
I. Um intervalo de confiança tem mais valor do que uma estimativa pontual única, pois
uma estimativa pontual não fornece nenhuma informação sobre o grau de precisão da
estimativa.
II. Um intervalo de confiança poderá ser reduzido se o nível de confiança for menor e o
valor da variância populacional for maior.
III. No cálculo de um intervalo de confiança para a média, deve-se utilizar a distribuição t
em lugar da distribuição normal quando a variância populacional é desconhecida e o
número de observações é inferior a 30.
Assinale a opção correta.
Comentários:
Item I – Correto. Uma estimativa pontual não nos dá um parâmetro para definir o quão precisa é
a estimativa. Quando temos um intervalo de confiança, quanto maior a amostra, menor é o erro e
maior é a precisão.
Item II – Errado. Quanto maior o nível de confiança, menor será a margem de erro e,
consequentemente, menor será o intervalo de confiança.
Item III – Certo. Para 𝑛 < 30 e com variância populacional desconhecida utiliza-se t-Student. Se
aumentar a amostra com variância desconhecida, ou dada a variância independentemente do
tamanho da amostra utiliza-se a distribuição normal.
Gabarito: C.
a) 𝜀 = 0,4410.
b) 𝜀 = 0,3436.
c) 𝜀 = 0,2205.
d) 𝜀 = 0,1125.
e) 𝜀 = 0,1103.
Comentários:
72
Agora, podemos apenas aplicar na fórmula da margem do erro no intervalo de confiança para a
média:
𝜎
𝜀 = 𝑍X/+ ×
√𝑛
1,125
𝜀 = 1,96 ×
√100
1,125
𝜀 = 1,96 ×
10
𝜀 = 0,2205
Gabarito: C.
c) Amplitude 2c = 93,45.
73
Comentários:
𝑀é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 → 𝑋5 = 87
𝑡 → 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑡 − 𝑠𝑡𝑢𝑑𝑒𝑛𝑡
𝑡 = 2,093 → 𝑝𝑎𝑟𝑎 95% 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎
𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 → 𝜎 = 101,9419
𝑇𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 → 𝑛 = 20 ⇒ √20 = 4,4721
𝜎
𝑋5 ± 𝑡 ×
√𝑛
101,9419
87 ± 2,093 ×
√20
101,9419
87 ± 2,093 ×
4,4721
87 ± 2,093 × 22,7950
87 ± 47,71
Gabarito: E.
30. (CESPE 2018/EBSERH) Uma amostra aleatória simples Y1, Y2, ..., Y25 foi retirada de
uma distribuição normal com média nula e variância σ², desconhecida. Considerando que P(x²
< 13) = P(X² > 41) = 0,025, em que x² representa a distribuição qui-quadrado com 25 graus
de liberdade, e que 𝑺𝟐 = ∑𝟐𝟓 𝟐
𝒕)𝟏 𝒀𝒊 , julgue o item a seguir.
Comentários:
Vamos calcular o intervalo de confiança para σ² com nível 100(1 − 𝛼)%. Assim, determinaremos se
a afirmativa é verdadeira:
+
𝑆+𝑆+
𝐼𝐶 = (σ , 1 − α) = ª , «
𝑄*$X/+ 𝑄X/+
74
+
𝑆+ 𝑆+
𝐼𝐶 = (σ , 1 − 0,95) = ª , «
𝑄`,>{V 𝑄`,`+V
𝑄`,>{V = 41
𝑄`,`+V = 13
Então:
+ +
𝑃(𝑋+K ≤ 𝑄`,>{V ) = 0,975, ou seja, 𝑃(𝑋+K ≤ 𝑄`,>{V ) = 0,025
Logo,
+
𝑆+ 𝑆+
𝐼𝐶 = (σ , 1 − 0,95) = ª , «
41 13
Gabarito: Certo.
31. (CESPE 2018/PF) O tempo gasto (em dias) na preparação para determinada operação
policial é uma variável aleatória X que segue distribuição normal com média M, desconhecida,
e desvio padrão igual a 3 dias. A observação de uma amostra aleatória de 100 outras
operações policiais semelhantes a essa produziu uma média amostral igual a 10 dias.
Com referência a essas informações, julgue o item que se segue, sabendo que P(Z > 2) = 0,025,
em que Z denota uma variável aleatória normal padrão.
Comentários:
𝑀é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 → 𝑋5 = 10
𝐸𝑠𝑐𝑜𝑟𝑒 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 → 𝓏 = 2
𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 → 𝜎 = 3
𝑇𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 → 𝑛 = 100
75
𝜎
𝑋5 ± 𝓏 ×
√𝑛
3
10 ± 2 ×
√100
3
10 ± 2 ×
10
10 ± 2 × 0,3
10 ± 0,6
Gabarito: Errado.
{0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1}
Uma vez que a amostra é menor que 30, a estatística do teste utilizada segue uma distribuição t
de Student.
Comentários:
Pelo enunciado, sabemos que a população segue distribuição de Bernoulli (0 ou 1). Nessa situação,
utilizamos a proporção amostral, 𝑝̂ , para estimar a proporção populacional, e consideramos a
distribuição normal para estimar o seu intervalo.
Gabarito: Errado.
76
{0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1}
Sendo P(Z > 1,96) = 0,025 e P(Z > 1,645) = 0,05, em que Z representa a variável normal
padronizada, e P(t20 > 2,086) = 0,025 e P(t19 > 1,729) = 0,05, em que t20 e t19 possuem distribuição
t de Student com, respectivamente, 20 e 19 graus de liberdade, o erro utilizado para a construção
do intervalo de confiança é menor que 15%, se considerado um nível de significância de 5%.
Comentários:
𝑝̂ × 𝑞‡
𝑍` × ^
𝑛
0,6 × 0,4
1,96 × ^
20
0,24
1,96 × ^
20
1,96 × O0,012
1,96 × 0,109
0,213 𝑜𝑢 21,3%
Gabarito: Errado.
77
a) 60,0% ± 1,0%
b) 60,0% ± 1,5%
c) 60,0% ± 3,0%
d) 60,0% ± 0,2%
e) 60,0% ± 0,4%
Comentários:
𝑝̂ × 𝑞‡
𝑝̂ ± 𝑍` × ^
𝑛
0,6 × 0,4
0,6 ± 3 × ^
2.400
0,24
0,6 ± 3 × ^
2.400
0,6 ± 3 × O0,0001
0,6 ± 3 × 0,01
0,6 ± 0,03
78
60% ± 3%
Gabarito: C.
Se forem aprovados 90% dos contratos de uma amostra composta de 100 contratos, o erro
amostral será superior a 10%.
Comentários:
𝑝̂ × 𝑞‡
𝑒 = 𝑍` × ^
𝑛
O enunciado não nos dá o nível de confiança, portanto, não é possível calcular o erro sem ele.
Porém, para deixar evidente que a questão está errada, vamos adotar o nível de confiança de 95%,
o escore normal padrão seria de 1,96, valor informado na questão. Então, fica:
0,9 × 0,1
𝑒 = 1,96 × ^
100
𝑒 = 1,96 × O0,0009
𝑒 = 1,96 × 0,03
𝑒 = 0,0579 𝑜𝑢 5,79%
Gabarito: Errado.
79
Considerando-se que, no ano anterior ao da análise em questão, 80% dos contratos tenham sido
aprovados e que 0,615 seja o valor aproximado de 1,962×0,8×0,2, é correto afirmar que a
quantidade de contratos de uma amostra com nível de 95% de confiança para a média
populacional e erro amostral de 5% é inferior a 160.
Comentários:
𝑝̂ × 𝑞‡
𝑒 = 𝑍` × ^
𝑛
0,8 × 0,2
0,05 = 1,96 × ^
𝑛
1,96 × 0,4
√𝑛 =
0,05
√𝑛 = 15,68
𝑛 = 15,68+
𝑛 = 245,8624
Gabarito: Errado.
80
37. (CESPE 2016/TCE-PA) A respeito de uma amostra de tamanho n = 10, com os valores
amostrados {0,10, 0,06, 0,10, 0,12, 0,08, 0,10, 0,05, 0,15, 0,14, 0,11}, extraídos de
determinada população, julgue o item seguinte.
Por um intervalo de confiança frequentista igual a (–0,11, 0,32), entende-se que a probabilidade
de o parâmetro médio ser superior a –0,11 e inferior a 0,32 é igual ao nível de confiança γ.
Comentários:
Gabarito: Errado.
Comentários:
𝜎
𝐴 = 2 × 𝑡` ×
√𝑛
Aumentando o tamanho da amostra em 100 vezes, na fórmula ficará √100 = 10. Logo, concluímos
que A será dividido por 10 e não por 2.
Gabarito: Errado.
81
39. (CESPE 2015/TELEBRAS) Para estimar a porcentagem de eleitores que votariam a favor
de um candidato presidencial, foi escolhida uma amostra aleatória de 200 pessoas. Dessa
amostra, uma avaliação indicou que 60 eleitores votariam no referido candidato.
Considerando que Φ(1,645) = 0,95 e que Φ(1,96) = 0,975 em que a função Φ representa a
função distribuição acumulada da distribuição normal padronizada, julgue o seguinte item.
Comentários:
60
𝑝̂ = = 0,3 → 𝑝𝑟𝑜𝑝𝑜𝑟çã𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙
200
𝑞‡ = (1 − 𝑝̂ ) = 0,7
𝑍X/+ → 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑢𝑏𝑢𝑖çã𝑜 𝑛𝑜𝑟𝑚𝑎𝑙 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 𝛼
𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 5% → 𝑍`,`+V = 1,96
𝑇𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 → 𝑛 = 200
𝑝̂ × 𝑞‡
𝜀 = 𝑍` × ^
𝑛
0,3 × 0,7
𝜀 = 1,96 × ^
200
0,21
𝜀 = 1,96 × ^
200
𝜀 = 1,96 × O0,00105
𝜀 = 1,96 × 0,0324
𝜀 = 0,063
Gabarito: Certo.
40. (CESPE 2015/FUB) Em uma faculdade, o administrador universitário supõe que os alunos
admitidos no primeiro semestre — grupo P — obtenham um índice de rendimento acadêmico
82
(IRA, número que varia entre 0 e 5) em média maior do que o índice dos alunos admitidos no
segundo semestre — grupo S.
Considerando que tenha sido selecionada uma amostra aleatória simples de 1.000 estudantes
do grupo P e uma amostra aleatória simples de 1.000 alunos do grupo S, julgue o item
seguinte.
Considere que o intervalo de 95% de confiança para a diferença entre as médias dos dois grupos
seja igual a (0,1, 1,2). Nesse caso, de acordo com o paradigma frequentista, existe uma
probabilidade de 95% de que a verdadeira diferença entre as médias populacionais dos IRAs seja
superior a 0,1 e inferior a 1,2
Comentários:
A probabilidade de que o parâmetro dado no enunciado esteja no intervalo construído (0,1; 1,2)
é ou 0 ou 1. Pela abordagem frequentista, 95% dos intervalos de confiança conteriam o verdadeiro
valor do parâmetro (média).
Gabarito: Errado.
V;<=,?@A V;<=,?@A
O intervalo de 95% de confiança para 𝜇, é igual a (58 − , 58 + ) em que 𝑧X é o α-
√*` √*`
quantil da distribuição Normal.
Comentários:
Para 𝑛 < 30 e com variância populacional e média desconhecidas utiliza-se T-Student e não uma
distribuição normal.
Gabarito: Errado.
83
Com base nessas informações, o analista elaborou um gráfico da relação entre renda e
consumo (gráfico I). No entanto, posteriormente o analista verificou a existência de erro nesse
gráfico, o que o levou a elaborar um segundo gráfico com os dados corretos (gráfico II).
Considerando que Z siga uma distribuição normal padrão, P(Z ≤ 1,9600) = 0,975, e que T siga
uma distribuição t com 99 graus de liberdade, P(T ≤ 1,9840) = 0,975, julgue o próximo item
acerca da situação hipotética e dos gráficos apresentados, arredondando os valores
encontrados ao inteiro mais próximo quando for o caso.
Considerando-se que a variável renda siga uma distribuição normal com média e variância
desconhecidas, é correto afirmar que o intervalo de confiança bilateral para a média de renda na
população com nível de confiança de 95% é [4.858, 5.920].
Comentários:
𝑠
𝑋5 ± 𝑡` ×
√𝑛
2.709
5.389,00 ± 1,9840 ×
√100
5.389,00 ± 537,46
Gabarito: Errado.
Situação hipotética: Pouco antes de uma eleição municipal para prefeito, um instituto de pesquisa
declarou que um dos candidatos tinha 52% das intenções de votos, com possibilidade de erro de
dois pontos percentuais para mais ou para menos. Assertiva: Nesse caso, o erro destacado
corresponde a erro de medição, que é típico ou representativo da tabulação dos dados.
Comentários:
O erro destacado não corresponde a erro de medição e sim a variabilidade normal de uma amostra
para outra, erro amostral.
Gabarito: Errado.
44. (CESPE 2015/TELEBRAS) Para estimar a porcentagem de eleitores que votariam a favor
de um candidato presidencial, foi escolhida uma amostra aleatória de 200 pessoas. Dessa
amostra, uma avaliação indicou que 60 eleitores votariam no referido candidato.
Considerando que Φ (1,645) = 0,95 e que Φ (1,96) = 0,975 em que a função Φ representa a
função distribuição acumulada da distribuição normal padronizada, julgue o seguinte item.
85
Comentários:
60
𝑝̂ = = 0,3 → 𝑝𝑟𝑜𝑝𝑜𝑟çã𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙
200
𝑛 = 200 → 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
𝑍X/+ → 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑢𝑏𝑢𝑖çã𝑜 𝑛𝑜𝑟𝑚𝑎𝑙 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 𝛼
𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎 5% → 𝑍`,`+V = 1,96 = Φ$* (0,975)
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝐼𝐶(𝑝, 1 − 𝛼) = Ñ𝑝̂ − 𝑍X/+ ^ , 𝑝̂ + 𝑍X/+ ^ Ò
𝑛 𝑛
Logo:
0,3 × 0,7 $*
𝜖=^ Φ (0,975)
200
Gabarito: Errado.
45. (CESPE 2014/ANATEL) Julgue o item que se segue, relativo a conceitos de amostragem.
Para se calcular o tamanho de uma amostra a ser retirada de uma população qualquer, é necessário
conhecer o valor da variância populacional da variável de interesse.
Comentários:
Para se calcular o tamanho de uma amostra, se o valor da variância populacional for desconhecido,
pode-se utilizar o desvio padrão amostral.
Gabarito: Errado.
86
46. (CESPE 2014/ANATEL) Julgue o item que se segue, relativo a conceitos de amostragem.
Considere que o intervalo simétrico de 95% de confiança para a média de uma distribuição normal
seja obtido a partir de uma amostra aleatória simples. Nesse caso, para que a amplitude desse
intervalo seja igual ao dobro do desvio padrão dessa distribuição, é preciso que o tamanho da
amostra seja inferior a 10 unidades.
Comentários:
Temos que o intervalo de confiança de 95% para uma distribuição normal é dado por:
𝜎
𝑋5 ± 1,96 ×
√𝑛
𝜎
2 × 1,96 ×
√𝑛
Logo:
𝜎
2 × 1,96 × = 2𝜎
√𝑛
1,96 = √𝑛
𝑛 = 1,96+ < 10
Gabarito: Certo.
Considere que, para a avaliação da qualidade do sinal de conexão com a Internet que chega a
certo município, tenha sido observada uma amostra aleatória simples de velocidades de conexão
em alguns pontos desse município, tendo sido o intervalo de 95% de confiança para a velocidade
média de conexão (em MB por segundo) igual a [1,5; 3,4]. Nessa situação, supondo-se que a
velocidade média seja constante, não sofrendo variação ao longo do tempo, é correto afirmar que
a velocidade média real de conexão nesse município está no intervalo [1,5; 3,4] com probabilidade
0 ou 1.
Comentários:
87
A probabilidade de que o parâmetro dado no enunciado esteja no intervalo construído [1,5; 3,4]
é ou 0 ou 1. Pela abordagem frequentista, 95% dos intervalos de confiança conteriam o verdadeiro
valor do parâmetro (velocidade média real).
Gabarito: Certo.
48. (CESPE 2014/ANATEL) Julgue o item que se segue, relativo a conceitos de amostragem.
Suponha que, conforme uma pesquisa de satisfação acerca de planos de serviços de telefonia
celular, 30% dos usuários estejam satisfeitos com suas operadoras. Nesse cenário, supondo-se que
o tamanho da amostra seja de 900 usuários e a amostragem, do tipo aleatória simples, o erro
amostral dessa pesquisa é inferior a 0,02.
Comentários:
O𝑝 × 𝑞
𝑒 = 𝑍X/+ ×
√𝑛
Em que:
𝑝 = 0,3 → 𝑆𝑢𝑐𝑒𝑠𝑠𝑜
𝑞 = 0,7 → 𝐹𝑟𝑎𝑐𝑎𝑠𝑠𝑜 (1 − 𝑝)
𝑛 = 900 → 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
Assim:
√0,3 × 0,7
𝑒 = 𝑍X/+ ×
√900
√0,21
𝑒 = 𝑍X/+ ×
30
𝑒 = 0,0152 × 𝑍X/+
Como não sabemos o nível de confiança, pois a questão informou, não podemos afirmar que o
erro será inferior a 0,02.
Gabarito: Errado.
49. (CESPE 2013/ANTT) De acordo com determinada pesquisa, o tempo médio de espera
de um passageiro em uma rodoviária, desde a chegada ao terminal até o embarque no ônibus,
é de 20 minutos. O desvio padrão dos tempos de espera é, também, de 20 minutos e o
88
tamanho da amostra dessa pesquisa é n = 900. Considerando que a pesquisa tenha sido feita
por amostragem aleatória simples, julgue o item a seguir.
𝑋5 = 20 → 𝑚é𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙
𝑧 = 1,96 𝑒𝑠𝑐𝑜𝑟𝑒 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 𝑑𝑒 95% 𝑑𝑎 𝑡𝑎𝑏𝑒𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙.
𝛼 = 20 → 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜
𝑛 = 900 → 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎
𝛼
𝑋5 ± 𝑧 ×
√𝑛
20
20 ± 1,96 ×
√900
20
20 ± 1,96 ×
30
2
20 ± 1,96 ×
3
20 ± 1,31
Gabarito: Errado.
Considerando essa situação, julgue o item que se segue, acerca de inferência estatística.
89
Considere que o intervalo de confiança de 95% para a média da temperatura mínima de operação
do novo dispositivo tenha sido [-47 ºC; -45 ºC]. Nessa situação, se o nível de confiança aumentar
de 95% para 99%, a amplitude do intervalo de confiança de 99% será inferior a 2 ºC.
Comentários:
Para quem preferir pensar por meio de fórmulas, a amplitude do intervalo de confiança é dada
por:
𝐴 = 2 × 𝑍` × 𝑠,C
Em que 𝑍` é o escore da normal padrão que delimita o nível de confiança desejado. Quanto maior
o nível de confiança, maior 𝑍` e, por tabela, maior a amplitude.
Gabarito: Errado.
Com base nessas informações, e considerando que 𝒁𝟎,𝟎𝟐𝟓 = 𝟏, 𝟗𝟔, em que 𝒁𝒂 é definido
por 𝜱(𝒁𝒂 ) = 𝟏 − 𝒂 e 𝜱 representa a função de distribuição acumulada da distribuição normal
padrão, julgue o próximo item.
𝜎
2 × 𝑍` ×
√𝑛
Em que:
90
Gabarito: Errado.
91
2. (CESPE/2008 – INSS)
Com relação ao texto, julgue o próximo item, considerando que outras 900 pessoas tenham sido
observadas em uma nova pesquisa, sendo Xα a quantidade de pessoas que sofreram o primeiro
infarto do miocárdio no período de cinco anos antes da publicação do veto e Xb a quantidade de
pessoas que sofreram o primeiro infarto do miocárdio no período até cinco anos após a publicação
do veto.
Pelo teorema conhecido como lei forte dos grandes números, é correto concluir que a variável
aleatória Xα segue aproximadamente uma distribuição normal.
De acordo com a lei forte dos grandes números, quase certamente, a média amostral converge
para o valor m, desde que n seja finito e suficientemente grande.
5. (CESPE/2013 – FUB) A lei dos grandes números é um importante resultado teórico que
permite o estudo das propriedades de estimadores estatísticos, como, por exemplo, a média
amostral . Considerando que μ representa a média populacional e que o desvio padrão
populacional σ seja finito, julgue o item subsequente a respeito desse assunto.
Considere que um estimador T converge em média quadrática para um parâmetro 𝜏 à medida que
o tamanho da amostra aumenta. Nessas condições, é correto afirmar que a lei fraca dos grandes
números se aplica para esse estimador.
6. (CESPE/2013 – FUB) A lei dos grandes números é um importante resultado teórico que
permite o estudo das propriedades de estimadores estatísticos, como, por exemplo, a média
amostral . Considerando que μ representa a média populacional e que o desvio padrão
populacional σ seja finito, julgue o item subsequente a respeito desse assunto.
Se 𝑛 é o tamanho da amostra, então na versão fraca da lei dos grandes números, 𝑃(|𝑋5 − 𝜇| > 𝜀) <
* 9 +
!
G n H , para todo 𝜀 > 0.
7. (CESPE 2016/TCE-PA) Uma amostra aleatória simples 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝒏 foi retirada de uma
população normal com média e desvio padrão iguais a 10. Julgue o próximo item, a respeito
# = [𝑿𝟏 + 𝑿𝟐 +. . . +𝑿𝒏 ]/𝒏.
da média amostral 𝑿
93
O número médio de pessoas maiores de idade por domicílio foi igual a 3 pessoas por domicílio; e
o erro padrão do estimador do percentual 𝑃 é inversamente proporcional a 3√1.000.
9. (CESPE 2019/TJ-AM) Para avaliar a satisfação dos servidores públicos de certo tribunal
no ambiente de trabalho, realizou-se uma pesquisa. Os servidores foram classificados em três
grupos, de acordo com o nível do cargo ocupado. Na tabela seguinte, 𝒌 é um índice que se
refere ao grupo de servidores, e 𝑵𝒌 denota o tamanho populacional de servidores
pertencentes ao grupo 𝒌.
Nível do Cargo 𝒌 𝑵𝒌 𝒏𝒌 𝒑𝒌
I 1 500 50 0,7
II 2 300 20 0,8
III 3 200 10 0,9
De cada grupo k foi retirada uma amostra aleatória simples sem reposição de
tamanho 𝒏𝒌 ; 𝒑𝒌 representa a proporção de servidores amostrados do grupo k que se
mostraram satisfeitos no ambiente de trabalho.
Com relação ao grupo 𝑘 = 2, o erro padrão da estimativa da proporção dos servidores satisfeitos
no ambiente de trabalho foi inferior a 0,1.
94
A estimativa do percentual de pessoas que conhecem o programa justiça itinerante foi inferior a
60%.
Se a amostragem fosse com reposição, a estimativa da variância da proporção amostral teria sido
superior a 0,001.
Sabendo que 𝑷(𝒁 < 𝟐) = 𝟎, 𝟗𝟕𝟓, em que Z representa a distribuição normal padrão, julgue o
item que se segue, em relação a essa situação hipotética.
13. (CESPE 2018/PF) Uma pesquisa realizada com passageiros estrangeiros que se
encontravam em determinado aeroporto durante um grande evento esportivo no país teve
como finalidade investigar a sensação de segurança nos voos internacionais. Foram
entrevistados 1.000 passageiros, alocando-se a amostra de acordo com o continente de
origem de cada um — África, América do Norte (AN), América do Sul (AS), Ásia/Oceania (A/O)
ou Europa. Na tabela seguinte, N é o tamanho populacional de passageiros em voos
internacionais no período de interesse da pesquisa; n é o tamanho da amostra por origem; P
é o percentual dos passageiros entrevistados que se manifestaram satisfeitos no que se refere
à sensação de segurança.
95
Origem 𝑵 𝒏 𝑷
AN 300.000 300 70
AS 100.000 100 90
Considerando o referido desenho amostral, estima-se que o percentual populacional 𝑃DqD seja
inferior a 79%.
14. (CESPE 2018/STM) Em um tribunal, entre os processos que aguardam julgamento, foi
selecionada aleatoriamente uma amostra contendo 30 processos. Para cada processo da
amostra que estivesse há mais de 5 anos aguardando julgamento, foi atribuído o valor 1; para
cada um dos outros, foi atribuído o valor 0. Os dados da amostra são os seguintes:
110010110111101110101010111011
A variância da proporção amostral 𝑝̂ sob a hipótese nula 𝐻` : 𝑝 = 0,5 é menor que 0,1.
96
15. (CESPE 2018/STM) Em um tribunal, entre os processos que aguardam julgamento, foi
selecionada aleatoriamente uma amostra contendo 30 processos. Para cada processo da
amostra que estivesse há mais de 5 anos aguardando julgamento, foi atribuído o valor 1; para
cada um dos outros, foi atribuído o valor 0. Os dados da amostra são os seguintes:
110010110111101110101010111011
A proporção populacional de processos que aguardam julgamento há mais de 5 anos foi
denotada por p; a proporção amostral de processos que aguardam julgamento há mais de 5
anos foi representada por 𝒑
Y
16. (CESPE 2018/EBSERH) 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝟏𝟎 representa uma amostra aleatória simples retirada
de uma distribuição normal com média 𝝁 e variância 𝝈𝟐 , ambas desconhecidas. Considerando
que 𝝁
Ye𝝈Y representam os respectivos estimadores de máxima verossimilhança desses
parâmetros populacionais, julgue o item subsecutivo.
s $=
=
A razão 9
segue uma distribuição normal padrão.
17. (CESPE 2018/STM) Diversos processos buscam reparação financeira por danos morais.
A tabela seguinte mostra os valores, em reais, buscados em 10 processos — numerados de 1
a 10 — de reparação por danos morais, selecionados aleatoriamente em um tribunal.
Processo Valor
1 3.700
2 3.200
3 2.500
4 2.100
5 3.000
6 5.200
97
7 5.000
8 4.000
9 3.200
10 3.100
A partir dessas informações e sabendo que os dados seguem uma distribuição normal, julgue
o item subsequente.
Se 𝜇 = estimativa pontual para a média dos valores buscados como reparação por danos morais
no referido tribunal, então 3.000 < 𝜇 < 3.300.
Se, dessa população, for coletada uma amostra aleatória de tamanho 𝑛 = 1, a probabilidade de
um indivíduo apresentar valor 1 é igual a 0,5.
19. (CESPE 2016/TCE-PA) Uma amostra aleatória simples 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝒏 foi retirada de uma
população normal com média e desvio padrão iguais a 10. Julgue o próximo item, a respeito
# = [𝑿𝟏 + 𝑿𝟐 +. . . +𝑿𝒏 ]/𝒏.
da média amostral 𝑿
20. (CESPE 2016/TCE-PA) Uma amostra aleatória simples 𝑿𝟏 , 𝑿𝟐 , ..., 𝑿𝒏 foi retirada de uma
população normal com média e desvio padrão iguais a 10. Julgue o próximo item, a respeito
# = [𝑿𝟏 + 𝑿𝟐 +. . . +𝑿𝒏 ]/𝒏.
da média amostral 𝑿
98
(, 4, 4, 4, )
No que se refere à média amostral 𝑋5 = " # K 7 ' , na qual 𝑋* , 𝑋+ , 𝑋3 , 𝑋K representa uma amostra
aleatória simples retirada dessa distribuição X, é correto afirmar que a estimativa da variância do
estimador 𝑋5 seja igual a 1,25.
22. (CESPE 2018/ABIN) Considerando que os principais métodos para a estimação pontual
são o método dos momentos e o da máxima verossimilhança, julgue o item a seguir.
99
26. (CESPE 2020/TJ-PA). Ao analisar uma amostra aleatória simples composta de 324
elementos, um pesquisador obteve, para os parâmetros média amostral e variância amostral,
os valores 175 e 81, respectivamente.
100
c) (174,51; 175,49).
d) (163,35; 186,65).
e) (174,1775; 175,8225).
27. (CESPE 2020/TJ-PA). A respeito dos intervalos de confiança, julgue os próximos itens.
I. Um intervalo de confiança tem mais valor do que uma estimativa pontual única, pois
uma estimativa pontual não fornece nenhuma informação sobre o grau de precisão da
estimativa.
II. Um intervalo de confiança poderá ser reduzido se o nível de confiança for menor e o
valor da variância populacional for maior.
III. No cálculo de um intervalo de confiança para a média, deve-se utilizar a distribuição t
em lugar da distribuição normal quando a variância populacional é desconhecida e o
número de observações é inferior a 30.
Assinale a opção correta.
a) 𝜀 = 0,4410.
b) 𝜀 = 0,3436.
101
c) 𝜀 = 0,2205.
d) 𝜀 = 0,1125.
e) 𝜀 = 0,1103.
c) Amplitude 2c = 93,45.
30. (CESPE 2018/EBSERH) Uma amostra aleatória simples Y1, Y2, ..., Y25 foi retirada de
uma distribuição normal com média nula e variância σ², desconhecida. Considerando que P(x²
< 13) = P(X² > 41) = 0,025, em que x² representa a distribuição qui-quadrado com 25 graus
de liberdade, e que 𝑺𝟐 = ∑𝟐𝟓 𝟐
𝒕)𝟏 𝒀𝒊 , julgue o item a seguir.
31. (CESPE 2018/PF) O tempo gasto (em dias) na preparação para determinada operação
policial é uma variável aleatória X que segue distribuição normal com média M, desconhecida,
e desvio padrão igual a 3 dias. A observação de uma amostra aleatória de 100 outras
operações policiais semelhantes a essa produziu uma média amostral igual a 10 dias.
102
Com referência a essas informações, julgue o item que se segue, sabendo que P(Z > 2) = 0,025,
em que Z denota uma variável aleatória normal padrão.
{0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1}
Uma vez que a amostra é menor que 30, a estatística do teste utilizada segue uma distribuição t
de Student.
{0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1}
Sendo P(Z > 1,96) = 0,025 e P(Z > 1,645) = 0,05, em que Z representa a variável normal
padronizada, e P(t20 > 2,086) = 0,025 e P(t19 > 1,729) = 0,05, em que t20 e t19 possuem distribuição
t de Student com, respectivamente, 20 e 19 graus de liberdade, o erro utilizado para a construção
do intervalo de confiança é menor que 15%, se considerado um nível de significância de 5%.
103
a) 60,0% ± 1,0%
b) 60,0% ± 1,5%
c) 60,0% ± 3,0%
d) 60,0% ± 0,2%
e) 60,0% ± 0,4%
Se forem aprovados 90% dos contratos de uma amostra composta de 100 contratos, o erro
amostral será superior a 10%.
Considerando-se que, no ano anterior ao da análise em questão, 80% dos contratos tenham sido
aprovados e que 0,615 seja o valor aproximado de 1,962×0,8×0,2, é correto afirmar que a
quantidade de contratos de uma amostra com nível de 95% de confiança para a média
populacional e erro amostral de 5% é inferior a 160.
104
37. (CESPE 2016/TCE-PA) A respeito de uma amostra de tamanho n = 10, com os valores
amostrados {0,10, 0,06, 0,10, 0,12, 0,08, 0,10, 0,05, 0,15, 0,14, 0,11}, extraídos de
determinada população, julgue o item seguinte.
Por um intervalo de confiança frequentista igual a (–0,11, 0,32), entende-se que a probabilidade
de o parâmetro médio ser superior a –0,11 e inferior a 0,32 é igual ao nível de confiança γ.
39. (CESPE 2015/TELEBRAS) Para estimar a porcentagem de eleitores que votariam a favor
de um candidato presidencial, foi escolhida uma amostra aleatória de 200 pessoas. Dessa
amostra, uma avaliação indicou que 60 eleitores votariam no referido candidato.
Considerando que Φ(1,645) = 0,95 e que Φ(1,96) = 0,975 em que a função Φ representa a
função distribuição acumulada da distribuição normal padronizada, julgue o seguinte item.
40. (CESPE 2015/FUB) Em uma faculdade, o administrador universitário supõe que os alunos
admitidos no primeiro semestre — grupo P — obtenham um índice de rendimento acadêmico
(IRA, número que varia entre 0 e 5) em média maior do que o índice dos alunos admitidos no
segundo semestre — grupo S.
Considerando que tenha sido selecionada uma amostra aleatória simples de 1.000 estudantes
do grupo P e uma amostra aleatória simples de 1.000 alunos do grupo S, julgue o item
seguinte.
Considere que o intervalo de 95% de confiança para a diferença entre as médias dos dois grupos
seja igual a (0,1, 1,2). Nesse caso, de acordo com o paradigma frequentista, existe uma
105
probabilidade de 95% de que a verdadeira diferença entre as médias populacionais dos IRAs seja
superior a 0,1 e inferior a 1,2
V;<=,?@A V;<=,?@A
O intervalo de 95% de confiança para 𝜇, é igual a (58 − , 58 + ) em que 𝑧X é o α-
√*` √*`
quantil da distribuição Normal.
106
Com base nessas informações, o analista elaborou um gráfico da relação entre renda e
consumo (gráfico I). No entanto, posteriormente o analista verificou a existência de erro nesse
gráfico, o que o levou a elaborar um segundo gráfico com os dados corretos (gráfico II).
Considerando que Z siga uma distribuição normal padrão, P(Z ≤ 1,9600) = 0,975, e que T siga
uma distribuição t com 99 graus de liberdade, P(T ≤ 1,9840) = 0,975, julgue o próximo item
acerca da situação hipotética e dos gráficos apresentados, arredondando os valores
encontrados ao inteiro mais próximo quando for o caso.
Considerando-se que a variável renda siga uma distribuição normal com média e variância
desconhecidas, é correto afirmar que o intervalo de confiança bilateral para a média de renda na
população com nível de confiança de 95% é [4.858, 5.920].
Situação hipotética: Pouco antes de uma eleição municipal para prefeito, um instituto de pesquisa
declarou que um dos candidatos tinha 52% das intenções de votos, com possibilidade de erro de
dois pontos percentuais para mais ou para menos. Assertiva: Nesse caso, o erro destacado
corresponde a erro de medição, que é típico ou representativo da tabulação dos dados.
44. (CESPE 2015/TELEBRAS) Para estimar a porcentagem de eleitores que votariam a favor
de um candidato presidencial, foi escolhida uma amostra aleatória de 200 pessoas. Dessa
amostra, uma avaliação indicou que 60 eleitores votariam no referido candidato.
Considerando que Φ (1,645) = 0,95 e que Φ (1,96) = 0,975 em que a função Φ representa a
função distribuição acumulada da distribuição normal padronizada, julgue o seguinte item.
45. (CESPE 2014/ANATEL) Julgue o item que se segue, relativo a conceitos de amostragem.
Para se calcular o tamanho de uma amostra a ser retirada de uma população qualquer, é necessário
conhecer o valor da variância populacional da variável de interesse.
107
46. (CESPE 2014/ANATEL) Julgue o item que se segue, relativo a conceitos de amostragem.
Considere que o intervalo simétrico de 95% de confiança para a média de uma distribuição normal
seja obtido a partir de uma amostra aleatória simples. Nesse caso, para que a amplitude desse
intervalo seja igual ao dobro do desvio padrão dessa distribuição, é preciso que o tamanho da
amostra seja inferior a 10 unidades.
Considere que, para a avaliação da qualidade do sinal de conexão com a Internet que chega a
certo município, tenha sido observada uma amostra aleatória simples de velocidades de conexão
em alguns pontos desse município, tendo sido o intervalo de 95% de confiança para a velocidade
média de conexão (em MB por segundo) igual a [1,5; 3,4]. Nessa situação, supondo-se que a
velocidade média seja constante, não sofrendo variação ao longo do tempo, é correto afirmar que
a velocidade média real de conexão nesse município está no intervalo [1,5; 3,4] com probabilidade
0 ou 1.
48. (CESPE 2014/ANATEL) Julgue o item que se segue, relativo a conceitos de amostragem.
Suponha que, conforme uma pesquisa de satisfação acerca de planos de serviços de telefonia
celular, 30% dos usuários estejam satisfeitos com suas operadoras. Nesse cenário, supondo-se que
o tamanho da amostra seja de 900 usuários e a amostragem, do tipo aleatória simples, o erro
amostral dessa pesquisa é inferior a 0,02.
49. (CESPE 2013/ANTT) De acordo com determinada pesquisa, o tempo médio de espera
de um passageiro em uma rodoviária, desde a chegada ao terminal até o embarque no ônibus,
é de 20 minutos. O desvio padrão dos tempos de espera é, também, de 20 minutos e o
tamanho da amostra dessa pesquisa é n = 900. Considerando que a pesquisa tenha sido feita
por amostragem aleatória simples, julgue o item a seguir.
108
Considerando essa situação, julgue o item que se segue, acerca de inferência estatística.
Considere que o intervalo de confiança de 95% para a média da temperatura mínima de operação
do novo dispositivo tenha sido [-47 ºC; -45 ºC]. Nessa situação, se o nível de confiança aumentar
de 95% para 99%, a amplitude do intervalo de confiança de 99% será inferior a 2 ºC.
Com base nessas informações, e considerando que 𝒁𝟎,𝟎𝟐𝟓 = 𝟏, 𝟗𝟔, em que 𝒁𝒂 é definido
por 𝜱(𝒁𝒂 ) = 𝟏 − 𝒂 e 𝜱 representa a função de distribuição acumulada da distribuição normal
padrão, julgue o próximo item.
109
GABARITO
1. ERRADO 18. ERRADO 35. ERRADO
2. ERRADO 19. ERRADO 36. ERRADO
3. ERRADO 20. CERTO 37. ERRADO
4. ERRADO 21. CERTO 38. ERRADO
5. CERTO 22. CERTO 39. CERTO
6. CERTO 23. LETRA D 40. ERRADO
7. ERRADO 24. CERTO 41. ERRADO
8. CERTO 25. LETRA C 42. ERRADO
9. CERTO 26. LETRA B 43. ERRADO
10. ERRADO 27. LETRA C 44. ERRADO
11. CERTO 28. LETRA C 45. ERRADO
12. CERTO 29. LETRA E 46. CERTO
13. CERTO 30. CERTO 47. CERTO
14. CERTO 31. ERRADO 48. ERRADO
15. CERTO 32. ERRADO 49. ERRADO
16. ERRADO 33. ERRADO 50. ERRADO
17. ERRADO 34. LETRA C 51. ERRADO
110
CONTROLE DE ALTERAÇÕES
Data da Alteração Descrição da Alteração
26/03/2021 Correção do gabarito da questão 13.
111