Escolar Documentos
Profissional Documentos
Cultura Documentos
O IC é um intervalo de valores que é provável de cobrir o parâmetro real da população; sua forma
geral é estimativa pontual ± margem de erro. A estimativa pontual é determinada primeiro. As
estimativas pontuais para a média e a proporção da população são a média e a proporção da
amostra, respectivamente. São nossas melhores estimativas de valor único de parâmetros de
população desconhecidos. Como vimos no Capítulo 5, a média da amostra é um avaliador
imparcial da média da população. O mesmo vale para a proporção da amostra em relação à
estimativa da proporção da população. Assim, o ponto de saída, ou a estimativa pontual, do IC
da média da população é a média da amostra, e a estimativa pontual da proporção da população
é a proporção da amostra.
Imagine que queremos gerar uma estimativa de IC de uma média de população desconhecida.
Mais uma vez, a forma do IC é a estimativa pontual ± margem de erro ou �
X ± margem de erro.
Suponha que selecionamos um nível de confiança de 95%. Isso significa que há uma
probabilidade de 95% de que o IC contenha a média da população real. Assim,
No Capítulo 5, introduzimos o Teorema central do limite que determina que, para amostras
grandes, a distribuição das médias da amostra é aproximadamente normal com uma média de
𝜎𝜎
𝜇𝜇X� = 𝜇𝜇 e um desvio padrão de 𝜎𝜎X� = . Usamos o Teorema central do limite para
√𝑛𝑛
desenvolver a margem de erro.
Para a distribuição normal padrão, o seguinte é uma afirmação verdadeira: P(−1,96 < z < 1,96)
= 0,95, ou seja, há uma chance de 95% de que uma variável normal padrão (z) caia entre -1,96
� −𝜇𝜇
X
e 1,96. O Teorema central do limite determina que, para amostras maiores, 𝑧𝑧 = 𝜎𝜎 . Se
� 𝑛𝑛
√
� −µ
X
fizermos essa substituição, a seguinte afirmação será verdadeira: P �−1,96 𝜎𝜎 < 1,96� = 0,95.
� 𝑛𝑛
√
Usando álgebra, podemos reformular essa desigualdade de forma que a média (µ) seja o meio
termo. As etapas estão descritas a seguir:
�
X−µ
P �−1,96 𝜎𝜎 < 1,96� = 0,95
� 𝑛𝑛
√
𝜎𝜎 𝜎𝜎
P �−1,96 <�
X − µ < 1,96 � = 0,95
√𝑛𝑛 √𝑛𝑛
𝜎𝜎 𝜎𝜎
� − 1,96
P �−X � + 1,96
< −µ < −X � = 0,95
√𝑛𝑛 √𝑛𝑛
𝜎𝜎 𝜎𝜎
� − 1,96
P �−X � + 1,96
<µ<X � = 0,95
√𝑛𝑛 √𝑛𝑛
O IC de 95% da média da população é o intervalo na última afirmação de probabilidade e é
X ± 1,96 𝜎𝜎� . A margem de erro é 𝜎𝜎� é o erro padrão (ou o desvio padrão
fornecido por: �
√𝑛𝑛 √𝑛𝑛
da estimativa pontual, �
X). A forma geral de um IC pode ser reescrita da seguinte forma:
em que z é o valor da distribuição normal padrão que reflete o nível de confiança selecionado
(por exemplo, para um nível de confiança de 95%, z = 1,96). A Tabela 1B no Apêndice contém
os valores z de níveis de confiança populares, como 90%, 95% e 99%. Na Tabela 1B, vemos
que para 90%, z = 1,645; para 95%, z = 1,96; e para 99%, z = 2,576. Níveis mais altos de
confiança têm valores z maiores, o que converte para margens de erro maiores e ICs maiores.
Por exemplo, para ter 99% de confiança de que um IC contém um parâmetro real
desconhecido, precisamos de um intervalo maior. Em muitas aplicações, um nível de confiança
de 95% é usado. Este é um valor geralmente aceito, mas não recomendado.
Na prática, muitas vezes não sabemos o valor do desvio padrão da população (σ). Se o tamanho
da amostra for grande (n > 30), então o desvio padrão da amostra (s) pode ser usado para estimar
o desvio padrão da população. Observe que a derivação anterior foi baseada no Teorema central
do limite, que requer um tamanho de amostra maior. Há casos em que o tamanho da amostra
não é suficientemente grande (p. ex., n < 30), portanto, o resultado geral do Teorema central do
limite não se aplica. Nesse caso, não podemos usar a distribuição normal padrão (z) no intervalo
de confiança. Em vez disso, usamos outra distribuição de probabilidade, chamada de distribuição
t, que é mais adequada para amostras pequenas.
Diretrizes específicas para usar a distribuição normal padrão (z) ou distribuição t são fornecidas
nas seções subsequentes, conforme analisamos as fórmulas de IC para aplicações específicas.
É importante observar que o uso adequado da distribuição t pressupõe que o resultado de
interesse seja aproximadamente distribuído normalmente.
𝑠𝑠
� ± 𝑧𝑧
X .
√𝑛𝑛
O valor z de confiança de 95% é z = 1,96. Substituindo as estatísticas da amostra e o valor z de
confiança de 95%, temos
19,0
127,3 ± 1,96 .
√3534
Fazendo as computações, temos
127,3 ± 0,63.
Somando e subtraindo a margem de erro, temos (126,7, 127,9). Uma estimativa pontual da
pressão arterial sistólica média real na população é de 127,3 e temos 95% de confiança de que
a média real fique entre 126,7 e 127,9. A margem de erro é muito pequena aqui por causa do
tamanho grande da amostra.
Um IC de 90% de IMC é fornecido abaixo. Observe que z = 1,645 para refletir o nível de confiança
de 90%:
5,32
28,15 ± 1,645 ,
√3326
28,15 ± 0,152,
(28,00, 28,30).
emos 90% de confiança de que o IMC médio real na população fique entre 28,00 e 28,30. Mais
uma vez, o IC é muito preciso ou restrito por causa do tamanho grande da amostra.
Suponha que computamos um IC de 95% para a pressão arterial sistólica real usando os dados
da subamostra. Como o tamanho da amostra é pequeno, agora precisamos usar a fórmula de IC
que envolva t em vez de z,
𝑠𝑠
� ± 𝑡𝑡
X
√𝑛𝑛
Primeiro, precisamos determinar o valor t correto da Tabela 2. Para fazer isso, precisamos df =
n – 1 = 10 – 1 = 9. O valor t de 95% de confiança com df = 9 é t = 2,262. Substituindo as
estatísticas da amostra e o valor t de confiança de 95%, temos
11,1
121,2 ± 2,262 .
√10
Fazendo as computações, temos
121,2 ± 7,94.
Somando e subtraindo a margem de erro, temos (113,3, 129,1). Com base nessa amostra de
tamanho n = 10, nossa melhor estimativa da pressão arterial sistólica média real na população é
121,2. Com base nessa amostra, temos 95% de confiança de que a pressão arterial sistólica
média na população fica entre 113,3 e 129,1. Observe que a margem de erro é maior aqui
principalmente por causa do tamanho menor da amostra.
Usando a subamostra, agora computamos um IC de 90% para o IMC médio. Como o tamanho
da amostra é pequeno, novamente precisamos determinar um valor adequado a partir da
distribuição t. Para 90% de confiança com df = 9, t = 1,833.
3,10
27,26 ± 1,833 ,
√10
27,26 ± 1,80,
(25,46, 29,06).
Temos 90% de confiança de que o IMC médio real na população fique entre 25,46 e 29,06.
Novamente, por causa do tamanho pequeno da amostra, o IC é menos preciso.
CAPÍTULO 7: Teste de hipóteses
PÁGINAS 163-164
7.10 RESUMO
Testes de hipóteses envolvem várias etapas, incluindo a especificação da hipótese nula e da
hipótese alternativa ou de pesquisa, a seleção e a computação de uma estatística de teste
adequada, a definição de uma regra de decisão e a conclusão. Existem muitos detalhes a serem
considerados no teste de hipóteses. O primeiro é determinar o teste apropriado. Discutimos que
os testesz, t, χ2 e F são usados para diferentes aplicações. O teste adequado depende da
distribuição da variável do resultado (contínua, dicotômica, categórica ou ordinal), do número de
grupos de comparação (um, dois ou mais de dois), e se os grupos de comparação são
independentes ou dependentes. A Tabela 7–50 resume os diferentes testes de hipóteses
discutidos aqui.
No teste de hipóteses, existem dois tipos de erros que podem ser cometidos. Um erro de Tipo I
ocorre quando um teste rejeita incorretamente uma hipótese nula. Isso é chamado de resultado
falso positivo e a probabilidade de sua ocorrência ser igual no nível de significância, a. O
pesquisador escolhe o nível de significância e escolha intencionalmente um valor pequeno, como
α = 0,05, para controlar a probabilidade de cometer um erro de Tipo I. Um erro de Tipo I ocorre
quando um teste não rejeita a hipótese nula quando, na realidade, ela é falsa. A probabilidade
de sua ocorrência é igual a b. Infelizmente, o pesquisador não conseguirá especificar β, pois
depende de vários fatores, incluindo o tamanho da amostra (amostras menores têm β maiores),
o nível de significância e a diferença no parâmetro sob as hipóteses nulas e alternativas. (Para
obter mais detalhes, consulte D’Agostino, Sullivan e Beiser.5)