Você está na página 1de 44

Intervalos

Estatística de
Confiança

Prof. Walter Sousa


DISTRIBUIÇÕES AMOSTRAIS

A distribuição amostral de um estimador (estatística, tal


como a média ou uma proporção) é a distribuição de
probabilidades de todos os valores que a estatística pode
assumir, quando todas as amostras possíveis de mesmo
tamanho n são extraídas da população.
As distribuições amostrais mais usadas são a binomial e
a normal. Sabe-se que é possível utilizar a distribuição normal
para aproximar a binomial, particularmente quando a
probabilidade de sucesso se aproxima de 0,5. Se o tamanho
da amostra cresce, a necessidade de P(sucesso) próximo de
0,5 diminui.
DISTRIBUIÇÕES AMOSTRAIS DAS MÉDIAS
Uma distribuição amostral das médias é uma distribuição de
probabilidades das médias amostrais, obtidas com todas a amostras de
mesmo tamanho n, tiradas de uma mesma população. 𝑿 ഥ pode ser vista
como uma variável aleatória.
A média das médias amostrais é igual à média da população.
a) Valor esperado:
E(𝑿ഥ ) = 𝜇 (média da população).
Exemplo. Construa a distribuição de probabilidades das médias amostrais,
amostras de tamanho 2, para a população {2, 4, 6}.
➢Um estimador, tal qual 𝑿 ഥ , é dito não tendencioso (não-viesado) quando o
seu valor esperado atinge o parâmetro populacional.
DISTRIBUIÇÕES AMOSTRAIS DAS MÉDIAS
b) Desvio padrão das médias amostrais(𝝈𝑿ഥ ) (Erro padrão da média):
O desvio padrão da distribuição das médias amostrais, também
chamado de erro padrão das médias, é um indicador de proximidade
(precisão) entre o valor da média amostral e o parâmetro populacional. Para
populações infinitas ou muito grandes, temos:
𝝈
𝝈𝑿ഥ =
𝒏
𝑛 é o tamanho da amostra
𝜎 é o desvio padrão da população.
➢Se o desvio padrão da população for desconhecido, pode-se utilizar o
desvio padrão S da amostra, como estimador.
𝑺
𝑺𝒙ഥ =
𝒏
Exemplo
Suponha que uma população infinita tenha média igual a 50 e desvio
padrão igual a 18. Para amostras de tamanho 36, a distribuição das
médias amostrais tem valor esperado e erro padrão da distribuição
igual a:
Questão 01
(CESPE) Um estudo foi realizado em determinada escola para se avaliar o efeito, no
desempenho dos estudantes, do uso de computadores em sala de aula. Para esse estudo,
foram selecionados aleatoriamente 60 alunos de determinado ano escolar, separando-os
em duas turmas A e B, cada uma com 30 alunos. Ao longo de um semestre letivo, um
método de ensino com auxílio de computadores foi aplicado na turma A, enquanto, nesse
mesmo período, outro método sem auxílio de computadores foi aplicado na turma B. Ao
final desse semestre, o mesmo teste foi aplicado para os 60 alunos participantes desse
estudo. O quadro acima mostra algumas estatísticas acerca das notas obtidas pelos
alunos de ambas as turmas.
Questão 01
Considerando essas informações, acerca de probabilidade, inferência e amostragem,
julgue os itens a seguir.
(1) A variância amostral das notas da turma B utilizou um denominador igual a 29.
(2) Considerando que as notas da turma A estão ordenadas da menor nota para a maior
nota, então a mediana dessas notas ocupa a 15.ª posição nesse rol de dados ordenados.
(3) Os alunos da turma B apresentaram desempenho mais homogêneo que os alunos da
turma A, pois a variância amostral da turma B foi inferior a 4,0.
(4) O erro padrão da média das notas dos alunos da turma A foi superior a 0,40.
DISTRIBUIÇÕES AMOSTRAIS DAS PROPORÇÕES

Uma distribuição amostral das proporções é uma distribuição de


probabilidades para proporções amostrais, com todas as amostras
apresentando o mesmo tamanho n. A média (proporção ou percentual
médio) da distribuição amostral das proporções é sempre igual à proporção
da população.
Sendo 𝑃෠ a proporção observada em uma amostra de uma população
infinita (ou muito grande), temos que o desvio padrão das proporções
amostrais (erro padrão das porporções) é:

෠ − 𝑃)
𝑃(1 ෠
𝜎𝑃෠ =
𝑛
exemplo
A partir de uma amostra de 100 policiais, obtida de uma população
considerada muito grande, observou-se que 90% deles apresentaram bom
desempenho no estande de tiro. Calcule o erro padrão das proporções
amostrais.
FATOR DE CORREÇÃO PARA POPULAÇÕES FINITAS
Se a população for finita e o tamanho da amostra é superior a 5% da população, as
fórmulas dos desvios padrão para médias amostrais e para proporções sofrerão uma
modificação, devendo ser multiplicadas pelo fator (fator de correção finita):
𝑁−𝑛
𝑁−1

N = tamanho da população
n = tamanho da amostra.
𝝈 𝑁−𝑛
𝝈𝑿ഥ = ∙
𝒏 𝑁−1

෠ − 𝑃)
𝑃(1 ෠ 𝑁−𝑛
𝜎𝑃෠ = ∙
𝑛 𝑁−1
TEOREMA DO LIMITE CENTRAL
O Teorema do Limite Central é de extrema importância para a inferência
estatística. Veja seus conceitos:
1. Se a população sob amostragem tem distribuição normal, a distribuição das
médias amostrais também será normal para todos os tamanhos de amostra.
2. Se a população básica é não-normal, a distribuição de médias amostrais será
aproximadamente normal para grandes amostras (uma diretiva utilizada é 𝑛 >
30).

Obs: Se 𝑛 ≤ 30 e a população é não-normal, os métodos não se aplicam.


ESTIMAÇÃO
Estimação é o processo que consiste em utilizar dados amostrais
para estimar os valores dos parâmetros populacionais desconhecidos.
A estimação pode ser pontual, quando origina uma única estimativa
do parâmetro ou intervalar, quando fornece um intervalo de valores
possíveis (intervalos de confiança), no qual se admite estar o parâmetro
populacional.
ESTIMAÇÃO POR INTERVALOS
“Um intervalo de confiança dá um intervalo de valores, centrado
na estatística amostral, no qual julgamos, com um risco conhecido de
erro, estar o parâmetro da população” (Stevenson, William J.).
A um intervalo de confiança associa-se um nível (grau) de
confiança, que indica a probabilidade de sucesso na construção do
intervalo que julgamos conter o parâmetro populacional. O grau de
confiança indica a porcentagem de tais intervalos que, espera-se,
incluiriam o parâmetro estimado.
Por exemplo, se o grau de confiança é de 95%, temos 95% de
chance de que o parâmetro pertença aos intervalos construídos. Às vezes,
o nível de confiança é expresso como uma probabilidade ou área, 1 – 𝛼,
onde 𝛼 nível de significância é o complemento do nível de confiança.
Por exemplo, se o nível de confiança é 95%, temos que 𝛼 é igual a 5%.
EXEMPLO
Os subsídios mensais dos policiais civis do DF seguem uma distribuição
normal, com média desconhecida e desvio padrão de R$ 200,00. Uma
amostra de 100 policiais apresentou média de R$ 8.698,78. Construa um
intervalo com 95% de confiança para a verdadeira média salarial. (Dado
P(Z>1,96) = 0,025)

Interpretação: Estamos 95% confiantes de que o intervalo construído


contenha, realmente, a verdadeira média salarial dos policiais.
INTERVALOS CONFIANÇA PARA A MÉDIA
“Um intervalo de confiança para a média é um intervalo estimado, construído com
respeito à média da amostra, pelo qual pode ser especificada a probabilidade de o intervalo
incluir o valor da média da população” (Kasmier, Leonard. Estatística aplicada a economia).
Os intervalos de confiança (IC) para a média são construídos com o estimador 𝑿 ഥ , obtido da
amostra, no centro do intervalo:
𝐼𝐶 = 𝑥ҧ ± 𝑒
Erro de estimação: O erro de estimação diz respeito ao desvio entre a média amostral e a
verdadeira média da população. O erro máximo (𝒆) é igual à metade da amplitude do
intervalo.
𝑒 = 𝑧𝛼/2 ∙ 𝜎𝑥ҧ ou 𝑒 = 𝑡𝛼/2 ∙ 𝑆𝑥ҧ

𝐼𝐶 = 𝑥ҧ ± 𝑧𝛼/2 ∙ 𝜎𝑥ҧ
𝐼𝐶 = 𝑥ҧ ± 𝑡𝛼/2 ∙ 𝑆𝑥ҧ

𝝈
Lembrando: 𝝈ഥ𝒙 = e 𝛼 é o nível de significância do intervalo (complementar da confiança).
𝒏
Distribuição Z ou t-student
A distribuição que devemos utilizar para arbitrar os escores Z (da
distribuição normal) ou t (da distribuição t-student), no cálculo do
intervalo, seguem as seguintes regras básicas:
a) A variável é normal e
➢se o parâmetro da variância populacional for conhecido (consequentemente o desvio
padrão), para qualquer tamanho de amostra, devemos utilizar a distribuição Z (normal
padrão).
➢se o parâmetro da variância for desconhecido, a distribuição t-student, com n – 1
graus de liberdade, é a distribuição amostral adequada. Ocorre que para grandes
amostras, 𝑛 > 30, “os valores de 𝑡 e 𝑧 são aproximadamente os mesmos, podendo-se
(opcionalmente) então usar a distribuição 𝑧 em lugar da 𝑡"(Stevenson, William J. ).
Distribuição Z ou t-student
b) A variável não é normal
➢ Se o desvio padrão é conhecido e o tamanho da amostra for maior que 30, aplica-se o
Teorema do Limite Central e devemos utilizar a distribuição normal Z (normal padrão).
Se o desvio padrão for desconhecido e e o tamanho da amostra for maior que 30,
utiliza-se a distribuição t -student
➢se o tamanho da amostra for pequeno (menor do que ou igual a 30) as técnicas vistas
não podem ser usadas. Neste caso, pode-se utilizar o teorema de Chebyshev: “a
proporção de medidas em um conjunto de dados que se situam dentro de k desvios
1 1
padrão da média não é menor do que 1 − 2 ". Iguala-se 1 − 2 ao grau de confiança
𝑘 𝑘
e arbitra-se o intervalo 𝐼𝐶 = 𝑥ҧ ± 𝑘 ∙ 𝜎𝑥ҧ
EXEMPLO
Os salários semanais dos trabalhadores da construção civil seguem
uma distribuição normal, com média desconhecida e desvio padrão de R$
50,00. Uma amostra de 100 empregados apresentou média de R$ 300,00.
Construa um intervalo com 90% de confiança para a verdadeira média
salarial. (Dado P(Z>1,65) = 0,05)
Exemplo – Questão 12
(FCC) Para responder à questão seguinte, considere as tabelas a seguir. Elas
fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-se à
variável normal padrão, as tabelas 2 e 3 referem-se à variável t de Student com
10 e 15 graus de liberdade, respectivamente.
O peso de crianças recém-nascidas do sexo feminino numa comunidade tem
distribuição normal com média µ e desvio padrão desconhecido. Uma amostra
de 16 recém-nascidos indicou um peso médio de 3,0 kg e desvio padrão
amostral igual a 0,8 kg. Um intervalo de confiança para µ, com coeficiente de
confiança de 96% é dado por:

a) 3,0 ± 0,37
b) 3,0 ± 0,41
c) 3,0 ± 0,45
d) 3,0 ± 0,68
e) 3,0 ± 0,73
Gab. C)
TAMANHO DA AMOSTRA
O Cálculo do tamanho da amostra pode ser determinado a partir do
erro(e) máximo admitido (metade da amplitude do intervalo), o qual
deve ser fixado bem como o grau de confiança. Suponha que se
conhece o desvio padrão 𝜎 (ou este possa ser estimado a partir de
estudos semelhantes), então o tamanho 𝑛 da amostra será
determinado por
𝑍∙𝜎 2
𝑛= ( )
𝑒
Exemplo
Um analista da PCDF quer estimar o número de horas necessárias para
o curso de aperfeiçoamento dos policiais recém contratados. Para
tanto, fixou em 3 horas (para mais ou para menos) o fator de erro e em
90% o grau de confiança. Baseado nos dados da Policia Federal, em
treinamentos semelhantes, o desvio padrão das horas de treinamento
é 𝜎 = 20 horas. O tamanho mínimo necessário da amostra é:
INTERVALOS DE CONFIANÇA PARA PROPORÇÕES

As estimativas de proporções populacionais, associadas a um evento de


interesse, podem ser pontuais ou por intervalos, do mesmo modo que se faz para as
médias populacionais.
A diferença é que na construção dos intervalos de confiança para proporções, a
distribuição t-student não é utilizada. Utiliza-se somente a tabela Z da normal padrão.
O intervalo de confiança (IC) para estimar a proporção populacional será
construído de forma simétrica em relação à proporção amostral, de forma análoga ao
que é feito paras as médias. Sendo 𝑃෠ a proporção amostral favorável a um evento,
temos que o intervalo, construído com base em uma confiança adotada, será:
𝐼𝐶 = 𝑃෠ ± 𝑒
O erro (𝑒) máximo admitido será
e = 𝑍 ∙ 𝜎𝑝ො

𝑝(1− ො
𝑝)
onde 𝜎𝑝ො = . Temos I𝐶 = 𝑃෠ ± 𝑍 ∙ 𝜎𝑝ො
𝑛
Exemplo
Um lote de 100 peças produzidas em uma fábrica apresentou 20 peças
defeituosas. Construa um intervalo de 95% de confiança para a verdadeira
proporção populacional de peças com defeito. Considere a população muito
grande.
CESPE-PF/AGENTE-2018 – Questão 11
Determinado órgão governamental estimou que a probabilidade p de um ex-condenado
voltar a ser condenado por algum crime no prazo de 5 anos, contados a partir da data da
libertação, seja igual a 0,25. Essa estimativa foi obtida com base em um levantamento por
amostragem aleatória simples de 1.875 processos judiciais, aplicando-se o método da
máxima verossimilhança a partir da distribuição de Bernoulli. Sabendo que P(Z < 2) = 0,975,
em que Z representa a distribuição normal padrão, julgue os itens que se seguem, em
relação a essa situação hipotética.
(1) O erro padrão da estimativa da probabilidade p foi igual a 0,01.
(2) A estimativa intervalar 0,25 ± 0,05 representa o intervalo de 95% de confiança do
parâmetro populacional p.
POPULAÇÃO FINITA – FATOR DE CORREÇÃO

Se a população for finita e a amostra for superior a 5% da população,


deve-se utilizar o fator de correção para população finita, no cálculo do erro
padrão das proporções:
𝑝(1
Ƹ − 𝑝)Ƹ 𝑁−𝑛
𝜎𝑝ො = ∙
𝑛 𝑁−1

𝐼𝐶 = 𝑃෠ ± 𝑍 ∙ 𝜎𝑝ො
Intervalos de
Estatística Confiança
Exercícios

Prof. Walter Sousa


Questão 2
Acerca de métodos usuais de estimação intervalar, julgue os itens
subsecutivos.
(1) E possível calcular intervalos de confiança para a estimativa da média de
uma distribuição normal, representativa de uma amostra aleatória.
(2) O cálculo de intervalo de confiança para proporções e inviável quando se
utiliza um processo de amostragem baseado nos ensaios de Bernoulli.
(3) Um intervalo de confiança de 95% descreve a probabilidade de um
parâmetro estar entre dois valores numéricos na próxima amostra não
aleatória a ser coletada.

Gab. C E E
Questão 3
(CESPE) A respeito dos intervalos de confiança, julgue os próximos itens.
I Um intervalo de confiança tem mais valor do que uma estimativa pontual única, pois uma
estimativa pontual não fornece nenhuma informação sobre o grau de precisão da estimativa.
II Um intervalo de confiança poderá ser reduzido se o nível de confiança for menor e o valor da
variância populacional for maior.
III No cálculo de um intervalo de confiança para a média, deve-se utilizar a distribuição t em
lugar da distribuição normal quando a variância populacional é desconhecida e o número de
observações é inferior a 30.
Assinale a opção correta.
A) Apenas o item II está certo.
B) Apenas os itens I e II estão certos.
C) Apenas os itens I e III estão certos.
D) Apenas os itens II e III estão certos.
E) Todos os itens estão certos.

Gab. C)
Questão 4
(CESPE) Na construção de um intervalo de confiança para a média, conhecida a
variância, considerando o intervalo na forma 𝑥 + 𝜀; 𝑥 − 𝜀 , sendo x o valor do
estimador da média e 𝜀 a semi-amplitude do intervalo de confiança ou, como é mais
popularmente conhecida, a margem de erro do intervalo de confiança. Considere que,
para uma determinada peça automotiva, um lote de 100 peças tenha apresentado
espessura média de 4,561 polegada, com desvio padrão de 1,125 polegada. Um
intervalo de confiança de 95% para a média apresentou limite superior de 4,7815 e
limite inferior de 4,3405. Nessa situação, a margem de erro do intervalo é de,
aproximadamente,

(A) 𝜀 = 0,4410.
(B) 𝜀 = 0,3436.
(C) 𝜀 = 0,2205.
(D) 𝜀 = 0,1125.
(E) 𝜀 = 0,1103.

Gab. C)
Questão 5
(CESPE) Uma equipe de engenheiros da qualidade, com vistas a estimar vida útil de
determinado equipamento, utilizou uma amostra contendo 225 unidades e obteve uma
média de 1.200 horas de duração, com desvio padrão de 150 horas. Considerando-se,
para um nível de confiança de 95%, z = 1,96, é correto afirmar que a verdadeira duração
média do equipamento, em horas, estará em um intervalo entre

A) 1.190,00 e 1.210,00.
B) 1.185,20 e 1.214,80.
C) 1.177,50 e 1.222,50.
D) 1.180,40 e 1.219,60.
E) 1.174,20 e 1.225,80.

Gab. D)
Questão 6
(CESPE) O tempo, X, de carregamento de um celular segue uma distribuição normal com
média e variância desconhecidas. Foi coletada uma amostra de tamanho igual a 10, em
que a média amostral é de 58 minutos e o desvio padrão da amostra é de 5 minutos. O
fabricante do celular, para testar se a média de carregamento é de 50 minutos, aplica um
teste t de Student com a hipótese nula H0: 𝜇𝑥 = 50 contra a hipótese alternativa de H1: 𝜇𝑥
≠ 50.
Considerando a situação hipotética descrita, julgue os itens a seguir.
(1) O intervalo de 95% de confiança para 𝜇𝑥 , em que zα é o α-quantil da distribuição
Normal, é igual a

Gab. E
Questão 7
(CESPE) Suponha que o tribunal de contas de determinado estado disponha de 30 dias para analisar as
contas de 800 contratos firmados pela administração. Considerando que essa análise é necessária para
que a administração pública possa programar o orçamento do próximo ano e que o resultado da análise
deve ser a aprovação ou rejeição das contas, julgue os itens a seguir. Sempre que necessário, utilize que
P(Z > 1,96) = 0,025 e P(Z > 1,645) = 0,05, em que Z representa a variável normal padronizada.
(1) Considerando-se que, no ano anterior ao da análise em questão, 80% dos contratos tenham sido
aprovados e que 0,615 seja o valor aproximado de 1,962 × 0,8 × 0,2, é correto afirmar que a quantidade
de contratos de uma amostra com nível de 95% de confiança para a média populacional e erro amostral
de 5% é inferior a 160.

Gab.: E E
Questão 7
(2) Se forem aprovados 90% dos contratos de uma amostra composta de 100 contratos,
o erro amostral será superior a 10%.

Gab.: E E
Questão 8
(CESPE) Para determinado experimento, uma equipe de pesquisadores gerou 20 amostras
de tamanho n = 25 de uma distribuição normal, com média μ = 5 e desvio padrão σ = 3.
Para cada amostra, foi montado um intervalo de confiança com coeficiente de 0,95 (ou
95%). Com base nessas informações, julgue os itens que se seguem.
I Os intervalos de confiança terão a forma βi ± 1,176, em que βi é a média da amostra i.
II Para todos os intervalos de confiança, 𝛽𝑖 + 𝜀 ≥ 𝜇 ≥ 𝛽𝑖 − 𝜀, sendo 𝜀 a margem de
erro do estimador.
III Se o tamanho da amostra fosse maior, mantendo-se fixos os valores do desvio padrão e
do nível de confiança, haveria uma redução da margem de erro 𝜀.
A) Apenas o item II está certo.
B) Apenas os itens I e II estão certos.
C) Apenas os itens I e III estão certos.
D) Apenas os itens II e III estão certos.
E) Todos os itens estão certos.

Gab.: C
Questão 9
(CESPE) A respeito de uma amostra de tamanho n = 10, com os valores
amostrados {0,10, 0,06, 0,10, 0,12, 0,08, 0,10, 0,05, 0,15, 0,14, 0,11},
extraídos de determinada população, julgue os itens seguintes.

(1) Dado que a variância populacional é desconhecida e os dados seguem


uma distribuição normal, é correto afirmar que o teste t para a média
populacional possui 10 graus de liberdade.
(2) Para um teste Z ou t de Student bilateral (com pelo menos 9 graus de
liberdade), uma estatística do teste menor que 1,5 é considerada não
significativa para o nível de significância de 5%.
(3) A estimativa pontual da media a partir dessa amostra é inferior a 0,09.
Gab. E C E
Questão 10
(CESPE) Em estudo acerca da situação do CNPJ das empresas de determinado
município, as empresas que estavam com o CNPJ regular foram representadas
por 1, ao passo que as com CNPJ irregular foram representadas por 0.
Considerando que a amostra {0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1}
foi extraída para realizar um teste de hipóteses, julgue os itens subsequentes.
(1) Sendo P(Z > 1,96) = 0,025 e P(Z > 1,645) = 0,05, em que Z representa a
variável normal padronizada, e P(t20 > 2,086) = 0,025 e P(t19 > 1,729) = 0,05, em
que t20 e t19 possuem distribuição t de Student com, respectivamente, 20 e 19
graus de liberdade, o erro utilizado para a construção do intervalo de confiança
é menor que 15%, se considerado um nível de significância de 5%.
(2) A estimativa pontual da proporção de empresas da amostra com CNPJ
regular e superior a 50%.

Gab. E C
Questão 13
(ESAF/AFPS) Tem-se uma população normal com média 𝜇 e variância 225.
Deseja-se construir, a partir de uma amostra de tamanho n dessa
população, um intervalo de confiança para 𝜇 com amplitude 5 e
coeficiente de confiança de 95%. Assinale a opção que corresponde ao
valor de n. Use como aproximadamente 2 o quantil de ordem 97,5% da
distribuição normal padrão.
a) 225
b) 450
c) 500
d) 144
e) 200
Gab.: D)
Questão 14
(ESAF/SUSEP) Uma variável aleatória X tem distribuição normal com média
desconhecida μ e variância 1. Assinale a opção que dá a amplitude do
menor intervalo de confiança para μ, no nível de 96%, para uma amostra de
X de tamanho 16. Use no cálculo a tabela da função de distribuição da
normal padrão apresentada abaixo
a) 4,0
b) 1,0
c) 2,2
d) 3,2
e) 5,0
Gab.: B)
Questão 15
(FCC/BACEN) Os preços de um determinado produto vendido no mercado têm uma
distribuição normal com desvio padrão populacional de R$ 20,00. Por meio de uma
pesquisa realizada com uma amostra aleatória de tamanho 100, com um
determinado nível de confiança, apurou-se, para a média destes preços, um intervalo
de confiança sendo [R$ 61,08; R$ 68,92]. A mesma média amostral foi obtida
quadruplicando o tamanho da amostra e utilizando também o mesmo nível de
confiança. Nos dois casos considerou-se infinito o tamanho da população. O novo
intervalo de confiança encontrado no segundo caso foi:

a) [R$ 63,04; R$ 66,96]


b) [R$ 62,06; R$ 67,94]
c) [R$ 61,57; R$ 68,43]
d) [R$ 61,33; R$ 68,67]
e) [R$ 61,20; R$ 68,80]
Gab. A)

Você também pode gostar