Você está na página 1de 184

i

UNIVERSIDADE FEDERAL FLUMINENSE


INSTITUTO DE MATEMTICA



DEPARTAMENTO DE ESTATSTICA




INFERNCIA ESTATSTICA




Ana Maria Lima de Farias













Outubro 2008
Contedo
1 Inferncia Estatstica - Conceitos Bsicos 1
1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Populao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Amostra aleatria simples . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Estatsticas e Parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.6 Propriedades de estimadores . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.9 Soluo do Exerccio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Distribuio Amostral da Mdia 22
2.1 Mdia e varincia da distribuio amostral da mdia . . . . . . . . . . . 22
2.2 Distribuio amostral da mdia para populaes normais . . . . . . . . . 23
2.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.1 Lista de Exerccios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5 Distribuio amostral da varincia amostral . . . . . . . . . . . . . . . . 32
2.6 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.8 Soluo das Listas de Exerccios . . . . . . . . . . . . . . . . . . . . . . . 36
2.9 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Distribuio Amostral da Proporo 43
3.1 Aproximao normal da distribuio binomial . . . . . . . . . . . . . . . 43
3.1.1 Lista de Exerccios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 A distribuio amostral da proporo . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Soluo das Listas de Exerccios . . . . . . . . . . . . . . . . . . . . . . . 51
3.6 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
ii
CONTEDO iii
4 Intervalos de Conana 56
4.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2 Intervalo de conana: mdia da N(;
2
),
2
conhecida . . . . . . . . . 59
4.2.1 Notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2.2 Interpretao do intervalo de conana para . . . . . . . . . . . 61
4.2.3 Lista de Exerccios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.3.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.6 Soluo das Listas de Exerccios . . . . . . . . . . . . . . . . . . . . . . . 68
4.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5 Intervalos de Conana: Propores - Amostra Grande 73
5.1 Estimao de uma proporo populacional . . . . . . . . . . . . . . . . . 73
5.2 Intervalo de conana para a proporo populacional . . . . . . . . . . . 74
5.3 Determinao do tamanho da amostra . . . . . . . . . . . . . . . . . . . 77
5.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.6 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6 Intervalo de Conana: Mdia da N(;
2
),
2
Desconhecida 84
6.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.2 Intervalo de conana para a mdia de uma populao normal com var-
incia desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.4 Amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.5 Resumo comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.5.1 IC para a mdia de populaes normais . . . . . . . . . . . . . . . 90
6.5.2 IC para uma proporo . . . . . . . . . . . . . . . . . . . . . . . . 90
6.5.3 Intervalo de conana para a mdia de populaes no-normais -
amostra grande . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7 Intervalo de Conana: Varincia da N(;
2
) 96
7.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.2 Intervalo de conana para a varincia de uma populao normal . . . . 96
7.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
7.4 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
8 Testes de Hipteses 102
8.1 Noes bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
CONTEDO iv
8.1.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.1.4 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
8.1.5 Exemplo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
8.1.6 Exemplo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.1.7 Lista de Exerccios 1 . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.2 Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.2.1 Hiptese nula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.2.2 Hiptese alternativa . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.2.3 Estatstica de teste, erros e regra de deciso . . . . . . . . . . . . 111
8.2.4 Regio crtica e nvel de signicncia . . . . . . . . . . . . . . . . 111
8.2.5 Funo caracterstica de operao e poder do teste . . . . . . . . . 112
8.3 Exemplo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.4 Exemplo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.5 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.7 Soluo das Listas de Exerccios . . . . . . . . . . . . . . . . . . . . . . . 118
8.8 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
9 Teste de Hiptese: Mdia da N(;
2
) -
2
Conhecida 126
9.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.1.1 Hipteses nula e alternativa . . . . . . . . . . . . . . . . . . . . . 127
9.1.2 Estatstica de teste . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.1.3 Nvel de signicncia e regio crtica . . . . . . . . . . . . . . . . 127
9.1.4 Determinao da regio crtica . . . . . . . . . . . . . . . . . . . . 129
9.1.5 Poder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
9.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
9.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
9.4 Procedimento geral para construo do teste de hiptese sobre a mdia
de uma N(;
2
) -
2
conhecida . . . . . . . . . . . . . . . . . . . . . . . 134
9.4.1 Teste bilateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
9.4.2 Teste unilateral direita . . . . . . . . . . . . . . . . . . . . . . . 137
9.4.3 Teste unilateral esquerda . . . . . . . . . . . . . . . . . . . . . . 137
9.4.4 Teste de hiptese versus intervalo de conana . . . . . . . . . . . 138
9.5 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
9.5.1 Teste bilateral - Valor P para o Exemplo 1 . . . . . . . . . . . . . 139
9.5.2 Teste unilateral direita - Exemplo 2 . . . . . . . . . . . . . . . . 140
9.5.3 Teste unilateral esquerda - Exemplo 3 . . . . . . . . . . . . . . . 140
9.6 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
9.8 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
CONTEDO v
10 Teste de Hiptese: Propores - Amostra Grande 149
10.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
10.2 Teste de hipteses sobre propores . . . . . . . . . . . . . . . . . . . . . 150
10.2.1 Teste bilateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
10.2.2 Testes unilaterais . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
10.3 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
10.4 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
10.5 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
10.6 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
10.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
10.8 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
11 Teste de Hiptese: Mdia da N(;
2
) -
2
Desconhecida 159
11.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
11.2 Procedimento geral para construo do teste de hiptese sobre a mdia
de uma N(;
2
) -
2
desconhecida . . . . . . . . . . . . . . . . . . . . . 160
11.2.1 Hiptese nula e hiptese alternativa . . . . . . . . . . . . . . . . . 160
11.2.2 Estatstica de teste, erros, regra de deciso . . . . . . . . . . . . . 161
11.2.3 Nvel de signicncia e regio crtica . . . . . . . . . . . . . . . . 163
11.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.3.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.3.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
11.3.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
11.4 Poder do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.5 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
11.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
12 Teste de Hiptese: Varincia da N(;
2
) 171
12.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
12.2 Procedimento geral para construo do teste de hiptese sobre a varincia
de uma N(;
2
) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
12.2.1 Hiptese nula e hiptese alternativa . . . . . . . . . . . . . . . . . 172
12.2.2 Estatstica de teste, erros, regra de deciso . . . . . . . . . . . . . 172
12.2.3 Nvel de signicncia e regio crtica . . . . . . . . . . . . . . . . 173
12.3 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
12.4 Exemplo 2 (Bussab&Morettin - Exerccio 40 p. 353) . . . . . . . . . . . . 176
Captulo 1
Inferncia Estatstica - Conceitos
Bsicos
No estudo de mtodos estatsticos, j foi visto como resumir um conjunto de dados
atravs de tabelas de freqncias, grcos e medidas de posio e disperso. Depois,
foram estudados modelos probabilsticos, discretos ou contnuos, para descrever determi-
nados fenmenos. Agora, essas ferramentas sero utilizadas no estudo de um importante
ramo da Estatstica, conhecido como Inferncia Estatstica, que busca mtodos de fazer
armaes sobre caractersticas de uma populao, conhecendo-se apenas resultados de
uma amostra.
Neste captulo voc estudar os seguintes conceitos:
populao e amostra
amostra aleatria simples
estatsticas e parmetros
estimador
distribuio amostral de um estimador
1.1 Introduo
No estudo da estatstica descritiva, vimos que populao o conjunto de elementos para
os quais se deseja estudar determinada(s) caracterstica(s). Vimos tambm que uma
amostra um subconjunto da populao. No estudo da inferncia estatstica, o objetivo
principal obter informaes sobre uma populao a partir das informaes de uma
amostra e aqui vamos precisar de denies mais formais de populao e amostra. Para
facilitar a compreenso destes conceitos, iremos apresentar alguns exemplos a ttulo de
ilustrao.
1
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 2
1.1.1 Exemplo 1
Em um estudo antropomtrico em nvel nacional, uma amostra de 5000 adultos sele-
cionada dentre os adultos brasileiros e uma das variveis de estudo a altura.
Neste exemplo, a populao o conjunto de todos os brasileiros adultos. No en-
tanto, o interesse (um deles, pelo menos) est na altura dos brasileiros. Assim, nesse
estudo, a cada sujeito da populao associamos um nmero correspondente sua altura.
Se determinado sujeito sorteado para entrar na amostra, o que nos interessa esse
nmero, ou seja, sua altura. Como vimos, essa a denio de varivel aleatria: uma
funo que associa a cada ponto do espao amostral um nmero real. Dessa forma, a
nossa populao pode ser representada pela varivel aleatria X = altura do adulto
brasileiro. Como essa uma v.a. contnua, a ela est associada uma funo de densi-
dade de probabilidade f e da literatura, sabemos que razovel supor que essa densidade
seja a densidade normal. Assim, nossa populao, nesse caso, representada por uma
v.a. X N (;
2
). Conhecendo os valores de e teremos informaes completas
sobre a nossa populao.
Uma forma de obtermos os valores de e medindo as alturas de todos os
brasileiros adultos. Mas esse seria um procedimento caro e demorado. Uma soluo,
ento, retirar uma amostra (subonjunto) da populao e estudar essa amostra. Supon-
hamos que essa amostra seja retirada com reposio e que os sorteios sejam feitos de
forma independente, isto , o resultado de cada extrao no altera o resultado das de-
mais extraes. Ao sortearmos o primeiro elemento, estamos realizando um experimento
que d origem v.a. X
1
=altura do primeiro elemento; o segundo elemento d origem
v.a. X
2
=altura do segundo elemento e assim por diante. Como as extraes so
feitas com reposio, todas as v.a. X
1
, X
2
, . . . tm a mesma distribuio, que reete
a distribuio da altura de todos os brasileiros adultos. Para uma amostra especca,
temos os valores observados x
1
, x
2
, . . . dessas variveis aleatrias.
1.1.2 Exemplo 2
Consideremos, agora, um exemplo baseado em pesquisas eleitorais, em que estamos in-
teressados no resultado do segundo turno de uma eleio presidencial brasileira. Mais
uma vez, nossos sujeitos de pesquisa so pessoas com 16 anos ou mais, aptas a votar. O
interesse nal saber a proporo de votos de um e outro candidato. Vamos considerar
uma situao simplicada em que no estamos considerando votos nulos, indecisos, etc.
Ento, cada sujeito de pesquisa d origem a uma varivel aleatria binria, isto , uma
v.a. que assume apenas dois valores. Como visto, podemos representar esses valores por
1 (candidato A) e 0 (candidato B), o que dene uma varivel aleatria de Bernoulli, ou
seja, essa populao pode ser representada pela v.a. X Bern(p). O parmetro p rep-
resenta a probabilidade de um sujeito dessa populao votar no candidato A. Uma outra
interpretao que p representa a proporo populacional de votantes no candidato A.
Para obtermos informao sobre p, retira-se uma amostra da populao e, como
antes, vamos supor que essa amostra seja retirada com reposio. Ao sortearmos o
primeiro elemento, estamos realizando um experimento que d origem v.a. X
1
=voto
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 3
do primeiro elemento; o segundo elemento d origem v.a. X
2
=voto do segundo
elemento e assim por diante. Como as extraes so feitas com reposio, todas as
v.a. X
1
, X
2
, . . . tm a mesma distribuio de Bernoulli populacional, isto , X
i

Bern(p), i = 1, 2, . . . .
1.2 Populao
A inferncia estatstica trata do problema de se obter informao sobre uma populao
a partir de uma amostra. Embora a populao real possa ser constituda de pessoas,
empresas, animais, etc., as pesquisas estatsticas buscam informaes sobre determi-
nadas caractersticas dos sujeitos, caractersticas essas que podem ser representadas por
nmeros. Sendo assim, a cada sujeito da populao est associado um nmero, o que
nos permite apresentar a seguinte denio.
Denio 1.1 A populao de uma pesquisa estatstica pode ser representada por uma
varivel aleatria X que descreve a caracterstica de interesse.
Os mtodos de inferncia nos permitiro obter estimativas dos parmetros de tal
varivel aleatria, que pode ser contnua ou discreta.
1.3 Amostra aleatria simples
Como j dito, bastante comum o emprego da amostragem em pesquisas estatsticas.
Nas pesquisas por amostragem, uma amostra selecionada da populao de interesse e
todas as concluses sero baseadas apenas nessa amostra. Para que seja possvel inferir
resultados para a populao a partir da amostra, necessrio que esta seja represen-
tativa da populao.
Embora existam vrios mtodos de seleo de amostras, vamos nos concentrar aqui
no caso mais simples, que a amostragem aleatria simples. Segundo tal mtodo, toda
amostra de mesmo tamanho n tem igual chance (probabilidade) de ser sorteada.
possvel extrair amostras aleatrias simples com e sem reposio. Quando estudamos as
distribuies binomial e hipergeomtrica, vimos que a distribuio binomial correspon-
dia a extraes com reposio e a distribuio hipergeomtrica correspondia a extraes
sem reposio. No entanto, para populaes grandes - ou innitas - extraes com e
sem reposio no levam a resultados muito diferentes. Assim, no estudo da Inferncia
Estatstica, estaremos lidando sempre com amostragem aleatria simples com reposio.
Este mtodo de seleo atribui a cada elemento da populao a mesma probabilidade
de ser selecionado e esta probabilidade se mantm constante ao longo do processo de se-
leo da amostra (se as extraes fossem sem reposio isso no aconteceria). No restante
desse curso omitiremos a expresso com reposio, ou seja, o termo amostragem (ou
amostra) aleatria simples sempre se referir amostragem com reposio. Por simpli-
cidade, muitas vezes abreviaremos o termo amostra aleatria simples por aas.
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 4
Uma forma de se obter uma amostra aleatria simples escrever os nmeros ou
nomes dos elementos da populao em cartes iguais, colocar estes cartes em uma urna
misturando-os bem e fazer os sorteios necessrios, tendo o cuidado de colocar cada carto
sorteado na urna antes do prximo sorteio. Na prtica, em geral so usados programas
de computador, uma vez que as populaes tendem a ser muito grandes.
Agora vamos formalizar o processo de seleo de uma amostra aleatria simples, de
forma a relacion-lo com os problemas de inferncia estatstica que iremos estudar.
Seja uma populao representada por uma varivel aleatria X. De tal populao
ser sorteada uma amostra aleatria simples com reposio de tamanho n. Como visto
nos exemplos anteriores, cada sorteio d origem a uma varivel aleatria X
i
e, como os
sorteios so com reposio, todas essas variveis tm a mesma distribuio de X. Isso
nos leva seguinte denio.
Denio 1.2 Uma amostra aleatria simples (aas) de tamanho n de uma v.a.
X (populao) um conjunto de n v.a. X
1
, X
2
, ..., X
n
independentes e identicamente
distribudas (i.i.d.).
interessante notar a conveno usual: o valor observado de uma v.a. X repre-
sentado pela letra minscula correspondente. Assim, depois do sorteio de uma aas de
tamanho n, temos valores observados x
1
, x
2
, . . . , x
n
das respectivas variveis aleatrias.
1.4 Estatsticas e Parmetros
Obtida uma aas, possvel calcular diversas caractersticas desta amostra, como, por
exemplo, a mdia, a mediana, a varincia, etc. Qualquer uma destas caractersticas
uma funo de X
1
, X
2
, ..., X
n
e, portanto, o seu valor depende da amostra sorteada.
Sendo assim, cada uma dessas caractersticas ou funes tambm uma v.a. . Por
exemplo, a mdia amostral a v.a. denida por
X =
X
1
+X
2
+ +X
n
n
Temos, ento, a seguinte denio:
Denio 1.3 Uma estatstica amostral ou estimador T qualquer funo da
amostra X
1
, X
2
, ..., X
n
, isto ,
T = g(X
1
, X
2
, ..., X
n
)
onde g uma funo qualquer.
As estatsticas amostrais que estaremos considerando neste curso so
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 5
mdia amostral
X =
X
1
+X
2
+ +X
n
n
(1.1)
varincia amostral
S
2
=
1
n 1
n
P
i=1

X
i
X

2
(1.2)
Para uma amostra especca, o valor obido para o estimador ser denominado esti-
mativa e, em geral, sero representadas por letras minsculas. Por exemplo, temos as
seguintes notaes correspondentes mdia amostral e varincia: x e s
2
.
Outras estatsticas possveis so o mnimo amostral, o mximo amostral, a amplitude
amostral, etc.
De forma anloga, temos as caractersticas de interesse da populao. No entanto,
para diferenciar entre as duas situaes (populao e amostra), atribuimos nomes difer-
entes.
Denio 1.4 Um parmetro uma caracterstica da populao.
Assim, se a populao representada pela v.a. X, alguns parmetros so a esperana
E(X) e a varincia V ar(X) de X.
Com relao s caractersticas mais usuais, vamos usar a seguinte notao:
Caracterstica Parmetro Estatstica
(populao) (amostra)
Mdia X
Varincia
2
S
2
Nmero de elementos N n
Lembre-se que, para uma v.a. discreta (nita) uniforme,
= E(X) =
1
N
N
P
i=1
X
i
V ar(X) =
1
N
N
P
i=1
[X
i
E(X)]
2
=
1
N
N
P
i=1
[X
i
]
2
=
1
N
N
P
i=1
X
2
i

2
1.5 Distribuies Amostrais
Nos problemas de inferncia, estamos interessados em estimar um parmetro da popu-
lao (por exemplo, a mdia populacional) atravs de uma aas X
1
, X
2
, ..., X
n
. Para isso,
usamos uma estatstica T (por exemplo, a mdia amostral) e, com base no valor obtido
para T a partir de uma particular amostra, iremos tomar as decises que o problema
exige. J foi dito que T uma v.a., uma vez que depende da amostra sorteada; amostras
diferentes fornecero diferentes valores para T.
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 6
Consideremos o seguinte exemplo, onde nossa populao o conjunto {1, 3, 6, 8}, isto
, este o conjunto dos valores da caracterstica de interesse da populao em estudo.
Assim, para esta populao, ou seja, para essa v.a. X temos
E(X) = =
1
4
(1 + 3 + 6 + 8) = 4, 5
V ar(X) =
2
=
1
4

(1 4, 5)
2
+ (3 4, 5)
2
+ (6 4, 5)
2
+ (8 4, 5)
2

= 7, 25
Suponha que dessa populao iremos extrair uma aas de tamanho 2 e a estatstica
que iremos calcular a mdia amostral. Algumas possibilidades de amostra so {1,1},
{1,3}, {6,8}, para as quais os valores da mdia amostral so 1, 2 e 7, respectivamente.
Podemos ver, ento, que h uma variabilidade nos valores da estatstica e, assim, seria
interessante que conhecssemos tal variabilidade. Conhecendo tal variabilidade, temos
condies de saber quo infelizes podemos ser no sorteio da amostra. No exemplo
acima, as amostras {1,1} e {8,8} so as que tm mdia amostral mais afastada da
verdadeira mdia populacional. Se esses valores tiverem chance muito mais alta do que
os valores mais prximos de E(X), podemos ter srios problemas.
Para conhecer o comportamento da mdia amostral, teramos que conhecer todos
os possveis valores de X, o que equivaleria a conhecer todas as possveis amostras de
tamanho 2 de tal populao. Nesse exemplo, como s temos 4 elementos na populao,
a obteno de todas as aas de tamanho 2 no difcil.
Lembre-se do nosso estudo de anlise combinatria: como o sorteio feito com
reposio, em cada um dos sorteios temos 4 possibilidades. Logo, o nmero total de
amostras aleatrias simples 4 4 = 16. Por outro lado, em cada sorteio, cada ele-
mento da populao tem a mesma chance de ser sorteado; como so 4 elementos, cada
elemento tem probabilidade 1/4 de ser sorteado. Finalmente, como os sorteios so in-
dependentes, para obter a probabilidade de um par de elementos pertencer amostra
basta multiplicar as probabilidades (lembre-se que Pr(A B) = Pr(A) Pr(B) quando
A e B so independentes). A independncia dos sorteios garantida pela reposio de
cada elemento sorteado. Na Tabela 1.1 a seguir listamos todas as possveis amostras,
com suas respectivas probabilidades e para cada uma delas, apresentamos o valor da
mdia amostral.
Analisando esta tabela, podemos ver que os possveis valores X so 1; 2; 3; 3,5; 4,5;
5,5; 6; 7; 8 e podemos construir a sua funo de distribuio de probabilidade, notando,
por exemplo, que o valor 2 pode ser obtido atravs de duas amostras: (1,3) ou (3,1).
Como essas amostras correspondem a eventos mutuamente exclusivos, a probabilidade
de se obter uma mdia amostral igual a 2
Pr(X = 2) = Pr({1, 3} {3, 1})
= Pr({1, 3}) + Pr({3, 1})
=
1
16
+
1
16
=
2
16
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 7
Amostra Probabilidade Mdia amostral x
(1, 1) (1/4) (1/4) = 1/16 (1 + 1)/2 = 1
(1, 3) (1/4) (1/4) = 1/16 (1 + 3)/2 = 2
(1, 6) (1/4) (1/4) = 1/16 (1 + 6)/2 = 3, 5
(1, 8) (1/4) (1/4) = 1/16 (1 + 8)/2 = 4, 5
(3, 1) (1/4) (1/4) = 1/16 (3 + 1)/2 = 2
(3, 3) (1/4) (1/4) = 1/16 (3 + 3)/2 = 3
(3, 6) (1/4) (1/4) = 1/16 (3 + 6)/2 = 4, 5
(3, 8) (1/4) (1/4) = 1/16 (3 + 8)/2 = 5, 5
(6, 1) (1/4) (1/4) = 1/16 (6 + 1)/2 = 3, 5
(6, 3) (1/4) (1/4) = 1/16 (6 + 3)/2 = 4, 5
(6, 6) (1/4) (1/4) = 1/16 (6 + 6)/2 = 6
(6, 8) (1/4) (1/4) = 1/16 (6 + 8)/2 = 7
(8, 1) (1/4) (1/4) = 1/16 (8 + 1)/2 = 4, 5
(8, 3) (1/4) (1/4) = 1/16 (8 + 3)/2 = 5, 5
(8, 6) (1/4) (1/4) = 1/16 (8 + 6)/2 = 7
(8, 8) (1/4) (1/4) = 1/16 (8 + 8)/2 = 8
Tabela 1.1: Distribuio amostral da mdia amostral
Com o mesmo raciocnio, obtemos a seguinte funo de distribuio de probabilidade
para X :
x 1 2 3 3, 5 4, 5 5, 5 6 7 8
Pr(X = x) 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 1/16
Note que a v.a. de interesse aqui X! Da segue que
E(X) = 1
1
16
+ 2
2
16
+ 3
1
16
+ 3, 5
2
16
+
4, 5
5
16
+ 5, 5
2
16
+ 6
1
16
+ 7
2
16
+ 8
1
16
= 4, 5 =
e
V ar(X) = (1 4, 5)
2

1
16
+ (2 4, 5)
2

2
16
+ (3 4, 5)
2

1
16
+(3, 5 4, 5)
2

2
16
+ (4, 5 4, 5)
2

5
16
+ (5, 5 4, 5)
2

2
16
+(6 4, 5)
2

1
16
+ (7 4, 5)
2

2
16
+ (8 4, 5)
2

1
16
= 3, 625 =
7, 25
2
=

2
2
=

2
n
Neste exemplo podemos ver que E(X) = e V ar(X) =
2
/2, onde 2 o tamanho
da amostra. Esses resultados esto nos dizendo que, em mdia (esperana), a estatstica
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 8
X igual mdia da populao e que sua varincia igual varincia da populao
dividida pelo tamanho da amostra. Na Figura 1.1 temos os grcos da funo de
distribuio de probabilidade de X (populao) na parte (a) e de X (amostra) na parte
(b). Podemos ver que a mdia de ambas 4,5 (ambas so simtricas em torno de 4,5)
e que a distribuio de X tem menor disperso em torno dessa mdia. Note que essa
mdia e essa varincia so calculadas ao longo de todas as possveis aas de tamanho 2.
(a)
(b)
0
0,1
0,2
0,3
0,4
0 1 2 3 4 5 6 7 8 9
0
0,1
0,2
0,3
0,4
0 1 2 3 4 5 6 7 8 9
Figura 1.1: Funo de distribuio de probabilidade de X e de X para aas de tamanho
2 tirada da populao {1, 3, 6, 8}
Consideremos, agora, a mesma situao, s que, em vez de estudarmos a mdia
amostral, uma medida de posio, vamos estudar a disperso. Como visto, a varincia
populacional V ar(X) = 7, 25. Para a amostra, vamos trabalhar com dois estimadores.
Um deles vai ser S
2
, denido na Equao (1.2) e o outro vai ser
b
2
=
1
n
n
P
i=1

X
i
X

2
(1.3)
Da mesma forma que zemos para a mdia amostral, vamos calcular o valor
dessas estatsticas para cada uma das amostras. Na Tabela 1.2 temos os resultados
parciais e globais de interesse.
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 9
Amostra x (x
1
x)
2
(x
2
x)
2
2
P
i=1
(x
i
x)
2
S
2
b
2
(1, 1) 1 (1 1)
2
(1 1)
2
0 0 0
(1, 3) 2 (1 2)
2
(3 2)
2
2 2 1
(1, 6) 3, 5 (1 3, 5)
2
(6 3, 5)
2
12, 5 12, 5 6, 25
(1, 8) 4, 5 (1 4, 5)
2
(8 4, 5)
2
24, 5 24, 5 12, 25
(3, 1) 2 (3 2)
2
(1 2)
2
2 2 1
(3, 3) 3 (3 3)
2
(3 3)
2
0 0 0
(3, 6) 4, 5 (3 4, 5)
2
(6 4, 5)
2
4, 5 4, 5 2, 25
(3, 8) 5, 5 (3 5, 5)
2
(8 5, 5)
2
12, 5 12, 5 6, 25
(6, 1) 3, 5 (6 3, 5)
2
(1 3, 5)
2
12, 5 12, 5 6, 25
(6, 3) 4, 5 (6 4, 5)
2
(3 4, 5)
2
4, 5 4, 5 2, 25
(6, 6) 6 (6 6)
2
(6 6)
2
0 0 0
(6, 8) 7 (6 7)
2
(8 7)
2
2 2 1
(8, 1) 4, 5 (8 4, 5)
2
(1 4, 5)
2
24, 5 24, 5 12, 25
(8, 3) 5, 5 (8 5, 5)
2
(3 5, 5)
2
12, 5 12, 5 6, 25
(8, 6) 7 (8 7)
2
(6 7)
2
2 2 1
(8, 8) 8 (8 8)
2
(8 8)
2
0 0 0
Tabela 1.2: Distribuio amostral de 2 estimadores da varincia
Podemos ver que a funo de distribuio de probabilidade de S
2

s
2
0 2 4, 5 12, 5 24, 5
Pr(S
2
= s
2
) 4/16 4/16 2/16 4/16 2/16
e a funo de distribuio de probabilidade de b
2

k 0 1 2, 25 6, 25 12, 25
Pr(b
2
= k) 4/16 4/16 2/16 4/16 2/16
Para essas distribuies temos:
E(S
2
) = 0
4
16
+ 2
4
16
+ 4, 5
2
16
+ 12, 5
4
16
+ 24, 5
2
16
=
116
16
= 7, 25 =
2
= V ar(X)
e
E(b
2
) = 0
4
16
+ 1
4
16
+ 2, 25
2
16
+ 6, 25
4
16
+ 12, 25
2
16
=
58
16
= 3, 625
Vemos que, em mdia, S
2
igual varincia populacional, o que no ocorre com b
2
.
Estes dois exemplos ilustram o fato de que qualquer estatstica amostral T uma
varivel aleatria, que assume diferentes valores para cada uma das diferentes amostras
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 10
e tais valores, juntamente com a probabilidade de cada amostra, nos forneceriam a
funo de distribuio de probabilidades de T , caso fosse possvel obter todas as aas de
tamanho n da populao. Isso nos leva seguinte denio, que um conceito central
na Inferncia Estatstica.
Denio 1.5 A funo de distribuio amostral de uma estatstica T a funo
de distribuio de probabilidades de T ao longo de todas as possveis amostras de tamanho
n.
Podemos ver que a obteno da distribuio amostral de qualquer estatstica T um
processo to ou mais complicado do que trabalhar com a populao inteira. Na prtica,
o que temos uma nica amostra e com esse resultado que temos que tomar as decises
pertinentes ao problema em estudo. Esta tomada de deciso, no entanto, ser facilitada
se conhecermos resultados tericos sobre o comportamento da distribuio amostral.
1.6 Propriedades de estimadores
No exemplo anterior, relativo varincia amostral, vimos que E(S
2
) =
2
e E(b
2
) 6=

2
. Analogamente, vimos tambm que E(X) = . Vamos entender direito o que esses
resultados signicam, antes de passar a uma denio formal da propriedade envolvida.
Dada uma populao, existem muitas e muitas aas de tamanho n que podem ser
sorteadas. Cada uma dessas amostras resulta em um valor diferente da estatstica de
interesse (X e S
2
, por exemplo). O que esses resultados esto mostrando como esses
diferentes valores se comportam em relao ao verdadeiro (mas desconhecido) valor do
parmetro.
Considere a Figura 1.2, onde o alvo representa o valor do parmetro e os tiros,
indicados pelos smbolo x, representam os diferentes valores amostrais da estatstica de
interesse.
Nas partes (a) e (b) da gura, os tiros esto em torno do alvo, enquanto nas partes
(c) e (d) isso no acontece. Comparando as partes (a) e (b), podemos ver que na parte
(a) os tiros esto mais concentrados em torno do alvo, isto , tm menor disperso. Isso
reete uma pontaria mais certeira do atirador em (a). Analogamente, nas partes (c) e
(d), embora ambos os atiradores estejam com a mira deslocada, os tiros do atirador (c)
esto mais concentrados em torno de um alvo; o deslocamento poderia at ser resultado
de um desalinhamento da arma. J o atirador (d), alm de estar com o alvo deslocado,
ele tem os tiros mais espalhados, o que reete menor preciso.
Traduzindo esta situao para o contexto de estimadores e suas propriedades, temos o
seguinte: nas partes (a) e (b), temos dois estimadores que fornecemestimativas centradas
em torno do verdadeiro valor do parmetro, ou seja, as diferentes amostras fornecem
valores distribudos em torno do verdadeiro valor do parmetro. A diferena que
em (b) esses valores esto mais dispersos e, assim, temos mais chance de obter uma
amostra infeliz, ou seja, uma amostra que fornea um resultado muito afastado do
valor do parmetro. Essas duas propriedades esto associadas esperana e varincia
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 11
Figura 1.2: Propriedades de estimadores
do estimador, que so medidas de centro e disperso, respectivamente. Nas partes (c)
e (d), as estimativas esto centradas em torno de um valor diferente do parmetro de
interesse e na parte (d), a disperso maior.
Temos, assim, ilustrados os seguintes conceitos.
Denio 1.6 Um estimador T dito um estimador no-viesado do parmetro
se E(T) = .
Como nos exemplos vistos, essa esperana calculada ao longo de todas as possveis
amostras, ou seja, a esperana da distribuio amostral de T. Nas partes (a) e (b) da
Figura 1.2 os estimadores so no-viesados e nas partes (c) e (d), os estimadores so
viesados.
Com relao aos estimadores X, S
2
e b
2
, veremos formalmente que os dois primeiros
so no-viesados para estimar a mdia e a varincia populacionais, respectivamente,
enquanto b
2
viesado para estimar a varincia populacional. Essa a razo para se
usar S
2
, e no b
2
.
Denio 1.7 Se T
1
e T
2
so dois estimadores no-viesados do parmetro , diz-se que
T
1
mais eciente que T
2
se V ar(T
1
) < V ar(T
2
).
Na Figura 1.2, o estimador da parte (a) mais eciente que o estimador da parte
(b).
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 12
Uma outra propriedade dos estimadores est relacionada idia bastante intuitiva
de que medida que se aumenta o tamanho da amostra, mais perto devemos car do
verdadeiro valor do parmetro.
Denio 1.8 Uma seqncia {T
n
} de estimadores de um prmetro consistente se,
para todo > 0
lim
n
Pr {|T
n
| > } = 0
Uma maneira alternativa de vericar se uma seqncia de estimadores consistente
dada a seguir.
Teorema 1.1 Uma seqncia {T
n
} de estimadores de um prmetro consistente se
lim
n
E(T
n
) =
lim
n
V ar(T
n
) = 0
1.7 Resumo do Captulo
Ao nal deste captulo, voc dever ser capaz de compreender perfeitamente os seguintes
conceitos:
A populao de uma pesquisa estatstica descrita por uma varivel aleatria X,
que descreve a caracterstica de interesse. Essa varivel aleatria pode ser discreta
ou contnua.
O mtodo de amostragem aleatria simples atribui, a cada amostra de tamanho
n, igual probabilidade de ser sorteada. Se os sorteios dos elementos da amostra
so feitos com reposio, cada sujeito da populao tem a mesma probabilidade
de ser sorteado e essa probabilidade se mantm constante. Dessa forma, uma
amostra aleatria simples comreposio (abreviaremos por aas nesse texto) de uma
populao X um conjunto X
1
, X
2
, . . . , X
n
de variveis aleatrias independentes
e identicamente distribudas, todas com a mesma distribuio da populao X.
Uma estatstica ou estimador T qualquer funo de X
1
, X
2
, . . . , X
n
, isto , T =
g(X
1
, X
2
, . . . , X
n
). Como o estimador depende da amostra sorteada, ele tambm
uma varivel aleatria. Os estimadores descrevem caractersticas da amostra.
Um parmetro uma caracterstica da populao.
As caractersticas que iremos estudar so a mdia ( e X) e a varincia (
2
e S
2
).
Como cada estimador uma varivel aleatria, ele pode ser descrito pela sua funo
de distribuio, que chamada distribuio amostral do estimador. A distribuio
amostral de um estimador a distribuio ao longo de todas as possveis amostras
de mesmo tamanho n.
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 13
Como sempre, a mdia e a varincia de uma distribuio de probabilidades so
parmetros de posio e disperso. No caso da distribuio amostral de um esti-
mador, esses parmetros referem-se distribuio ao longo de todas as possveis
amostras. Assim, a mdia de uma distribuio amostral refere-se mdia dos pos-
sveis valores do estimador ao longo de todas as possveis amostras e a varincia
reete a disperso desses valores em torno dessa mdia.
Um estimador no-viesado se a sua mdia igual ao parmetro que ele pretende
estimar. Isso signica que os valores do estimador ao longo de todas as possveis
amostras esto centrados no parmetro populacional.
Dados dois estimadores no-viesados de um mesmo parmetro, T
1
e T
2
, diz-se
que T
1
mais eciente que T
2
se sua varincia for menor, ou seja, se V ar(T
1
) >
V ar(T
2
).
Uma seqncia {T
n
} de estimadores de um parmetro consistente se, para todo
> 0, lim
n
Pr {|T
n
| > } = 0 ou se
(
lim
n
E(T
n
) =
lim
n
V ar(T
n
) = 0
1.8 Exerccios
Para xar as idias sobre os conceitos apresentados nesta aula, voc ir trabalhar com
amostras aleatrias simples de tamanho 3 retiradas da populao {1, 2, 4, 6, 8}. Pelo
princpio da multiplicao, o nmero total de amostras 5 5 5 = 125 e cada uma
dessas amostras tem probabilidade
1
5

1
5

1
5
=
1
125
. Iremos considerar os seguintes
estimadores para a mdia da populao:
mdia amostral:
X =
X
1
+X
2
+X
3
3
mdia amostral ponderada:
X
p
=
X
1
+ 2X
2
+X
3
4
ponto mdio
=
min(X
1
, X
2
, X
3
) + max(X
1
, X
2
, X
3
)
2
O que voc ir mostrar que (i) X e X
p
so no-viesados e que X mais eciente
que X
p
; (ii) viesado, mas sua varincia menor que a varincia de X e de X
p
. Para
isso, voc ir seguir os seguintes passos:
1. Calcule a mdia e a varincia
2
da populao.
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 14
2. Nas cinco tabelas a seguir, voc tem listadas as 125 amostras. Para cada uma
das amostras, calcule os valores dos estimadores. Para as 6 primeiras amostras os
clculos j esto feitos, a ttulo de ilustrao. Voc no precisa indicar todas as
contas; apenas use a mquina de calcular e anote o resultado obtido.
3. Obtenha a funo de distribuio de probabilidade, explicitando os diferentes val-
ores de cada um dos estimadores e suas respectivas probabilidades
4. Calcule a esperana e a varincia de cada um dos estimadores.
5. Verique as armativas feitas no enunciado do problema.
Amostra Estimador
X
1
X
2
X
3
X X
p

1 1 1
1+1+1
3
= 1
1+21+1
4
= 1
1+1
2
= 1
1 1 2
1+1+2
3
=
4
3
1+21+2
4
=
5
4
1+2
2
=
3
2
1 1 4
1+1+4
3
= 2
1+21+4
4
=
7
4
1+4
2
=
5
2
1 1 6
1+1+6
3
=
8
3
1+21+6
4
=
9
4
1+6
2
=
7
2
1 1 8
1+1+8
3
=
10
3
1+21+8
4
=
11
4
1+8
2
=
9
2
1 2 1
1+2+1
3
=
4
3
1+22+1
4
=
6
4
1+2
2
=
3
2
1 2 2
1 2 4
1 2 6
1 2 8
1 4 1
1 4 2
1 4 4
1 4 6
1 4 8
1 6 1
1 6 2
1 6 4
1 6 6
1 6 8
1 8 1
1 8 2
1 8 4
1 8 6
1 8 8
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 15
Amostra Estimador
X
1
X
2
X
3
X X
p

2 1 1
2 1 2
2 1 4
2 1 6
2 1 8
2 2 1
2 2 2
2 2 4
2 2 6
2 2 8
2 4 1
2 4 2
2 4 4
2 4 6
2 4 8
2 6 1
2 6 2
2 6 4
2 6 6
2 6 8
2 8 1
2 8 2
2 8 4
2 8 6
2 8 8
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 16
Amostra Estimador
X
1
X
2
X
3
X X
p

4 1 1
4 1 2
4 1 4
4 1 6
4 1 8
4 2 1
4 2 2
4 2 4
4 2 6
4 2 8
4 4 1
4 4 2
4 4 4
4 4 6
4 4 8
4 6 1
4 6 2
4 6 4
4 6 6
4 6 8
4 8 1
4 8 2
4 8 4
4 8 6
4 8 8
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 17
Amostra Estimador
X
1
X
2
X
3
X X
p

6 1 1
6 1 2
6 1 4
6 1 6
6 1 8
6 2 1
6 2 2
6 2 4
6 2 6
6 2 8
6 4 1
6 4 2
6 4 4
6 4 6
6 4 8
6 6 1
6 6 2
6 6 4
6 6 6
6 6 8
6 8 1
6 8 2
6 8 4
6 8 6
6 8 8
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 18
Amostra Estimador
X
1
X
2
X
3
X X
p

8 1 1
8 1 2
8 1 4
8 1 6
8 1 8
8 2 1
8 2 2
8 2 4
8 2 6
8 2 8
8 4 1
8 4 2
8 4 4
8 4 6
8 4 8
8 6 1
8 6 2
8 6 4
8 6 6
8 6 8
8 8 1
8 8 2
8 8 4
8 8 6
8 8 8
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 19
1.9 Soluo do Exerccio
Para a populao temos que
=
1 + 2 + 4 + 6 + 8
5
= 4, 2

2
=
1
2
+ 2
2
+ 4
2
+ 6
2
+ 8
2
5
(4, 2)
2
= 6, 56
Completando-se as tabelas dadas, chegamos s seguintes funes de distribuio de
probabilidade dos estimadores:
X Pr(X = x) Clculo de E(X) Clculo de V ar(X)
x p px E(X
2
)
3/3 1/125 3/375 (3/3)
2
(1/125)
4/3 3/125 12/375 (4/3) (3/125)
5/3 3/125 15/375 (5/3) (3/125)
6/3 4/125 24/375 (6/3)
2
(4/125)
7/3 6/125 42/375 (7/3)
2
(6/125)
8/3 6/125 48/375 (8/3)
2
(6/125)
9/3 9/125 81/375 (9/3)
2
(9/125)
10/3 9/125 90/375 (10/3)
2
(9/125)
11/3 12/125 132/375 (11/3)
2
(12/125)
12/3 10/125 120/375 (12/3)
2
(10/125)
13/3 9/125 117/375 (13/3)
2
(9/125)
14/3 12/125 168/375 (14/3)
2
(12/125)
15/3 6/125 90/375 (15/3)
2
(6/125)
16/3 12/125 192/375 (16/3)
2
(12/125)
17/3 3/125 51/375 (17/3)
2
(3/125)
18/3 10/125 180/375 (18/3)
2
(10/125)
20/3 6/125 120/375 (20/3)
2
(6/125)
22/3 3/125 66/375 (22/3)
2
(3/125)
24/3 1/125 24/375 (24/3)
2
(1/125)
Soma 1575/375 22305/ (9 125)
Logo,
E(X) =
1575
375
= 4, 2 =
e
V ar(X) =
22305
9 125
(4, 2)
2
= 2, 186667 =
6, 56
3
=

2
3
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 20
X
p
Pr(X
p
= x) Clculo de E(X
p
) Clculo de V ar(X
p
)
x p px E(X
2
p
)
4/4 1/125 4/500 (4/4)
2
(1/125)
5/4 2/125 10/500 (5/4)
2
(2/125)
6/4 2/125 12/500 (6/4)
2
(2/125)
7/4 4/125 28/500 (7/4)
2
(4/125)
8/4 3/125 24/500 (8/4)
2
(3/125)
9/4 4/125 36/500 (9/4)
2
(4/125)
10/4 6/125 60/500 (10/4)
2
(6/125)
11/4 6/125 66/500 (11/4)
2
(6/125)
12/4 8/125 96/500 (12/4)
2
(8/125)
13/4 4/125 52/500 (13/4)
2
(4/125)
14/4 10/125 140/500 (14/4)
2
(10/125)
15/4 4/125 60/500 (15/4)
2
(4/125)
16/4 9/125 144/500 (16/4)
2
(9/125)
17/4 4/125 68/500 (17/4)
2
(4/125)
18/4 10/125 180/500 (18/4)
2
(10/125)
19/4 4/125 76/500 (19/4)
2
(4/125)
20/4 8/125 160/500 (20/4)
2
(8/125)
21/4 4/125 84/500 (21/4)
2
(4/125)
22/4 8/125 176/500 (22/4)
2
(8/125)
23/4 2/125 46/500 (23/4)
2
(2/125)
24/4 7/125 168/500 (24/4)
2
(7/125)
25/4 2/125 50/500 (25/4)
2
(2/125)
26/4 6/125 156/500 (26/4)
2
(6/125)
28/4 4/125 112/500 (28/4)
2
(4/125)
30/4 2/125 60/500 (30/4)
2
(2/125)
32/4 1/125 32/500 (32/4)
2
(1/125)
Soma 2100/500 40200/(16 125)
Logo,
E(X
p
) = 4, 2 =
e
V ar(X
p
) =
40200
16 125
(4.2)
2
= 2, 46
CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS 21
Pr( = x) Clculo de E() Clculo de V ar()
x p p x E(
2
)
2/2 1/125 2/250 (2/2)
2
(1/125)
3/2 6/125 18/250 (3/2)
2
(6/125)
4/2 1/125 4/250 (4/2)
2
(1/125)
5/2 12/125 60/250 (5/2)
2
(12/125)
6/2 6/125 36/250 (6/2)
2
(6/125)
7/2 18/125 126/250 (7/2)
2
(18/125)
8/8 13/125 104/250 (8/2)
2
(13/125)
9/2 24/125 216/250 (9/2)
2
(24/125)
10/2 24/125 240/250 (10/2)
2
(24/125)
12/2 13/125 156/250 (12/2)
2
(13/125)
14/2 6/125 84/250 (14/2)
2
(6/125)
16/2 1/125 16/250 (16/2)
2
(1/125)
Soma 1062/250 9952/(4 125)
Logo,
E() =
1062
250
= 4, 248
e
V ar() =
9952
4 125
(4, 248)
2
= 1, 858496
Na tabela a seguir apresentamos o resumo dos resultados obtidos.
Parmetro Estimador
populacional X X
p

Mdia = 4, 2 4, 2000 4, 2000 4, 2480
Varincia
2
= 6, 56 2, 1867 2, 4600 1, 8585
Conclui-se que X e X
p
so estimadores no-viesados de e que X mais eciente
que X
p
, uma vez que V ar(X) < V ar(X
p
).
O estimador viesado, pois E() 6= . No entanto, a varincia desse estimador
menor que as varincias dos dois estimadores no-viesados. vezes, na prtica, podemos
trabalhar com estimadores viesados com varincia pequena, desde que o vis no seja
muito grande.
Captulo 2
Distribuio Amostral da Mdia
Neste captulo voc ir aprofundar seus conhecimentos sobre a distribuio amostral da
mdia amostral. No captulo anterior analisamos, atravs de alguns exemplos, o com-
portamento da mdia amostral; mas naqueles exemplos, a populao era pequena e foi
possvel obter todas as amostras, ou seja, foi possvel obter a distribuio amostral ex-
ata. Veremos agora resultados tericos sobre a distribuio amostral da mdia amostral,
que nos permitiro fazer anlises sem ter que listar todas as amostras.
Os principais resultados que estudaremos so:
mdia e varincia da distribuio amostral da mdia
distribuio amostral da mdia para populaes normais
Teorema Limite Central
distribuio amostral da varincia amostral
2.1 Mdia e varincia da distribuio amostral da
mdia
No captulo anterior, vimos, atravs de exemplos, que a mdia amostral X um esti-
mador no-viesado da mdia populacional . Na verdade, temos o seguinte resultado
geral.
Teorema 2.1 Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de tamanho n de uma
populao representada pela varivel aleatria X com mdia e varincia
2
. Ento,
E(X) = (2.1)
V ar(X) =

2
n
(2.2)
Demonstrao:
22
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 23
Por denio de amostra aleatria simples, as X
i
so independentes e todas tm
a mesma distribuio da v.a. populacional X; logo, E(X
i
) = e V ar(X
i
) =
2
. Da
independncia resulta que Cov(X
i
, X
j
) = 0 i 6= j. Por outro lado, o estudo dos ve-
tores aleatrios, vimos que a esperana da soma de variveis aleatrias a soma das
esperanas. Ento:
E(X) = E

X
1
+X
2
+ +X
n
n

=
1
n
E(X
1
+X
2
+ +X
n
)
=
1
n
[E(X
1
) +E(X
2
) + +E(X
n
)]
=
1
n
( + + +) =
1
n
n =
V ar(X) = V ar

X
1
+X
2
+ +X
n
n

=
1
n
2
V ar(X
1
+X
2
+ +X
n
)
=
1
n
2
"
V ar(X
1
) +V ar(X
2
) + +V ar(X
n
) +
P
i6=j
Cov(X
i
, X
j
)
#
=
1
n
2

2
+
2
+ +
2
+ 0

=
1
n
2
n
2
=

2
n
importante notar que esse resultado se refere a qualquer populao X. O que
ele estabelece que as mdias amostrais das diferentes amostras aleatrias simples de
tamaho n tendem a acertar o alvo da mdia populacional ; lembre-se da Figura 1.2,
partes (a) e (b). Alm disso, medida que o tamanho amostral n aumenta, a disperso
em torno do alvo, medida por V ar(X), vai diminuindo e tende a zero quando n .
Esse teorema nor permite ver que {X
n
} consistente para estimar a mdia popula-
cional .
Odesvio padro da distribuio amostral de qualquer estatstica usualmente chamado
de erro padro. Ento, o erro padro da mdia amostral EP(X) =

n
.
2.2 Distribuio amostral da mdia para populaes
normais
Na prtica estatstica, vrias populaes podem ser descritas, pelo menos aproximada-
mente, por uma distribuio normal. Obviamente, o teorema anterior continua valendo
no caso de uma populao normal, mas temos uma caracterstica a mais da distribuio
amostral da mdia: ela tambm normal.
Teorema 2.2 Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de tamanho n de
uma populao normal, isto , uma populao representada por uma varivel aleatria
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 24
normal X com mdia e varincia
2
. Ento, a distribuio amostral da mdia amostral
X normal com mdia e varincia
2
/n, ou seja
X N

;
2

=X N

;

2
n

Na Figura 2.1 ilustra-se o comportamento da distribuio amostral da mdia amostral


com base em amostras de tamanho n = 4 para uma populao normal com mdia 2 e var-
incia 9. A ttulo de comparao, apresenta-se a a distribuio populacional. Podemos
ver que ela mais dispersa que a distribuio amostral de X, mas ambas esto centradas
no verdadeiro valor populacional = 2.
0,0
0,1
0,2
0,3
-8 -6 -4 -2 0 2 4 6 8 10 12
) 9 ; 2 ( ~N X
( ) 4 9 ; 2 ~N X
Figura 2.1: Distribuio amostral de X com base em aas de tamanho n = 4 de uma
populao N(2; 9)
2.3 Exemplos
Exemplo 2.1 A capacidade mxima de um elevador de 500 kg. Se a distribuio dos
pesos dos usurios N(70; 100), qual a probabilidade de que 7 pessoas ultrapassem este
limite? E de 6 pessoas?
Soluo
Podemos considerar os 7 passageiros como uma amostra aleatria simples da pop-
ulao de todos os usurios, representada pela v.a. X N(70; 100). Seja, ento,
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 25
X
1
, . . . , X
7
uma aas de tamanho n = 7. Se o peso mximo 500, para que 7 pessoas
ultrapassem o limite de segurana temos que ter
7
P
i=1
X
i
> 500
1
7
7
P
i=1
X
i
>
500
7
X > 71, 729
Mas, pelo Teorema 2.2, sabemos que
X N

70;
100
7

Logo,
Pr(X > 71, 729) = Pr

X 70
q
100
7
>
71, 729 70
q
100
7

= Pr(Z > 0, 46) = 0, 5 tab(0, 46) = 0, 5 0, 17724 = 0, 32276


Com 6 pessoas teramos que ter
Pr

X >
500
6

= Pr

Z >
83.333 70
q
100
6

= Pr(Z > 3, 27) = 0, 5 tab(3, 27)


= 0.5 0.49946 = 0, 00054
Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoas
ultrapassarem o limite de segurana. J com 6 pessoas, essa probabilidade bastante
pequena. Assim, o nmero mximo de pessoas no elevador deve ser estabelecido como
6 ou menos.
Exemplo 2.2 Uma v.a. X tem distribuio normal com mdia 100 e desvio padro 10.
1. Calcule Pr(90 < X < 110)
2. Se X a mdia de uma amostra aleatria simples de 16 elementos retirados dessa
populao, calcule Pr(90 < X < 110).
3. Construa, num nico sistema de coordenadas, os grcos das distribuies de X e
X.
4. Que tamanho deveria ter a amostra para que Pr(90 < X < 110) = 0, 95?
Soluo
1.
Pr(90 < X < 110) = Pr

90 100
10
< Z <
110 100
10

= Pr(1 < Z < 1)


= 2 Pr(0 < Z < 1)
= 2 tab(1, 0) = 0, 68268
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 26
2. Com n = 16, resulta que X N

100;
100
16

Pr(90 < X < 110) = Pr

90 100
q
100
16
< Z <
110 100
q
100
16

= Pr(4 < Z < 4)


= 2 Pr(0 < Z < 4)
= 2 tab(4, 0) 1, 00
3. Veja a Figura 2.2. Como visto, a distribuio amostral com n = 16 menos
dispersa que a distribuio populacional e a podemos ver que, entre 90 e 110,
temos concentrada praticamente toda a distribuio de X.
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
60 70 80 90 100 110 120 130 140
N(100,100)
N(100,100/16)
Figura 2.2: Distribuio amostral de X com base em amostras de tamanho n = 16 de
uma populao N(100; 100)
4. Queremos que Pr(90 < X < 110) = 0, 95, ou seja
Pr(90 < X < 110) = 0, 95
Pr

90 100
q
100
n
< Z <
110 100
q
100
n

= 0, 95
Pr(

n < Z <

n) = 0, 95
2 Pr(0 < Z <

n) = 0, 95
2 tab(

n) = 0, 95
tab(

n) = 0, 475

n = 1, 96
n 4
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 27
A ttulo de ilustrao, apresentam-se na Figura 2.3 as distribuies amostrais de
X para n = 16 e n = 4.
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
60 70 80 90 100 110 120 130 140
N(100;100/4)
N(100;100/16)
Figura 2.3: Distribuio amostral de X com base em amostras de tamanhos n = 16 e
n = 4 de uma populao N(100; 100)
Exemplo 2.3 A mquina de empacotar um determinado produto o faz segundo uma
distribuio normal, com mdia e desvio padro 10 g.
1. Em quanto deve ser regulado o peso mdio para que apenas 10% dos pacotes
tenham menos do que 500 g?
2. Com a mquina assim regulada, qual a probabilidade de que o peso total de 4
pacotes escolhidos ao acaso seja inferior a 2 kg?
Soluo
1. Seja X a varivel aleatria que representa o peso dos pacotes. Sabemos, ento,
que X N(; 100). Queremos que
Pr(X < 500) = 0, 10
Pr

X
10
<
500
10

= 0, 10
Pr

Z <
500
10

= 0, 10
Ento, na densidade normal padro, esquerda da abscissa
500
10
temos que ter
uma rea (probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Us-
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 28
ando a simetria da densidade normal temos as seguintes equivalncias:
Pr

Z <
500
10

= 0, 10
Pr

Z >
500
10

= 0, 10
Pr

Z >
500
10

= 0, 10
Pr

0 Z
500
10

= 0, 40
tab

500
10

= 0, 40
500
10
= 1, 28
= 512, 8 g
Veja a Figura 2.4 onde so ilustradas essas equivalncias.
Figura 2.4: Soluo do Exemplo 3
2. Sejam X
1,
X
2
, X
3
, X
4
os pesos dos 4 pacotes da amostra. Queremos que
4
P
i=1
X
i
<
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 29
2000g. Isso equivalente a X < 500. Logo,
Pr(X < 500) = Pr

X 512, 8
q
100
4
<
500 512, 8
q
100
4

= Pr(Z < 2, 56)


= Pr(Z > 2, 56)
= 0, 5 Pr(0 Z 2, 56)
= 0, 5 tab(2, 56)
= 0, 5 0, 49477
= 0, 00523
Com a mquina regulada para 512,8g, h uma probabilidade de 0,00523 de que
uma amostra de 4 pacotes apresente peso mdio inferior a 500g. Note que com
um pacote apenas, essa probabilidade de 10%. Por isso, as inspees de controle
de qualidade so sempre feitas com base em amostras de tamanho n > 1.
2.3.1 Lista de Exerccios 1
1. Os comprimentos das peas produzidas por determinada mquina tm distribuio
normal com uma mdia de 172 mm e desvio padro de 5 mm. Calcule a probabil-
idade de uma amostra aleatria simples de 16 peas ter comprimento mdio
(a) entre 169 mm e 175 mm;
(b) maior que 178 mm;
(c) menor que 165 mm.
2. Qual dever ser o tamanho de uma amostra aleatria simples a ser retirada de
uma populao N(150; 13
2
) para que Pr(

< 6, 5) = 0, 95?
2.4 Teorema Limite Central
Os resultados vistos anteriormente so vlidos para populaes normais, isto , se uma
populao normal com mdia e varincia
2
, ento a distribuio amostral de X
tambm normal com mdia e varincia
2
/n, onde n o tamanho da amostra. O
teorema limite central que veremos a seguir nos fornece um resultado anlogo para qual-
quer distribuio populacional, desde que o tamanho da amostra seja sucientemente
grande.
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 30
Teorema 2.3 Teorema Limite Central
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao X tal que
E(X) = e V ar(X) =
2
. Ento, a distribuio de X converge para a distribuio
normal com mdia e varincia
2
/n quando n . Equivalentemente,
X

n
N(0, 1)
Ainterpretao prtica do teorema limite central a seguinte: para amostras grandes
de qualquer populao, podemos aproximar a distribuio amostral de X por uma dis-
tribuio normal com a mesma mdia populacional e varincia igual varincia popu-
lacional dividida pelo tamanho da amostra.
Quo grande deve ser a amostra para se obter uma boa aproximao depende das car-
actersticas da distribuio populacional. Se a distribuio populacional no se afastar
muito de uma distribuio normal, a aproximao ser boa, mesmo para tamanhos pe-
quenos de amostra. Na Figura 2.5 ilustra-se esse teorema para a distribuio exponen-
cial, ou seja, para uma populao distribuda segundo uma exponencial com parmetro
= 1. O grco superior representa a distribuio populacional e os histogramas repre-
sentam a distribuio amostral de X ao longo de 5000 amostras de tamanhos 10, 50, 100
e 250. Assim, podemos ver que, embora a populao seja completamente diferente da
normal, a distribuio amostral de X vai se tornando cada vez mais prxima da normal
medida que n aumenta.
Em termos prticos, esse teorema de extrema importncia, da ser chamado de
teorema central e, em geral, amostras de tamanho n > 30 j fornecem uma aproximao
razovel.
Exemplo 2.4 Uma moeda lanada 50 vezes, com o objetivo de se vericar sua hon-
estidade. Se ocorrem 36 caras nos 50 lanamentos, o que podemos concluir?
Soluo
Neste caso, a populao pode ser representada por uma varivel de Bernoulli X
com parmetro p, isto , X assume o valor 1 com probabilidade p na ocorrncia de
cara e assume o valor 0 com probabilidade 1 p na ocorrncia de coroa. Para uma
varivel Bernoulli, temos que E(X) = p e V ar(X) = p(1 p). Como so feitos 50
lanamentos, o tamanho da amostra 50 (n grande!) e, pelo teorema limite central, X
aproximadamente normal com mdia E(X) = p e varincia V ar(X) =
p(1p)
50
.
Suponhamos que a moeda seja honesta, isto , que p = 1/2. Nestas condies,
qual a probabilidade de obtermos 36 caras em 50 lanamentos? Com a hiptese de
honestidade da moeda, o teorema limite central nos diz que
X N

1
2
;
1
2

1
2
50

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 31


n=10
0
200
400
600
800
1000
1200
1400
1600
1800
0,261 0,761 1,261 1,761 2,261
F
r
e
q
u
e
n
c
y
n=50
0
200
400
600
800
1000
1200
1400
1600
0,604 0,804 1,004 1,204 1,404 1,604
F
r
e
q
u
e
n
c
y
n=100
0
200
400
600
800
1000
1200
1400
0,690 0,790 0,890 0,990 1,090 1,190 1,290
F
r
e
q
u
e
n
c
y
n=250
0
200
400
600
800
1000
1200
1400
1600
0,804 0,854 0,904 0,954 1,004 1,054 1,104 1,154 1,204
F
r
e
q
u
e
n
c
y
Distribuio exponencial commdia 1
0,0
0,2
0,4
0,6
0,8
1,0
1,2
0 1 2 3 4 5 6 7
Figura 2.5: Ilustrao do Teorema Limite Central para uma populao X exp(1)
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 32
A probabilidade de se obter 36 ou mais caras em 50 lanamentos equivalente
probabilidade de X ser maior ou igual a
36
50
= 0, 72 e essa probabilidade
Pr(X 0, 72) = Pr

X 0, 5

200

0, 72 0, 5
q
1
200

= Pr(Z 3, 11) = 0, 5 Pr(0 Z < 3, 11) =


= 0, 5 tab(3, 11) = 0, 5 0, 49906 = 0, 00094
Note que essa probabilidade bastante pequena, ou seja, h uma pequena probabilidade
de obtermos 36 ou mais caras em um lanamento de uma moeda honesta. Isso pode nos
levar a suspeitar sobre a honestidade da moeda!
2.4.1 Lista de Exerccios 2
1. O fabricante de uma lmpada especial arma que o seu produto tem vida mdia
de 1600 horas, com desvio padro de 250 horas. O dono de uma empresa compra
100 lmpadas desse fabricante. Qual a probabilidade de que a vida mdia dessas
lmpadas ultrapasse 1650 horas?
2.5 Distribuio amostral da varincia amostral
No captulo anterior, consideramos dois estimadores para a varincia: S
2
e b
2
. Atravs
de um exemplo, vimos que b
2
um estimador viciado. Vamos demonstrar agora que S
2
no viciado para estimar a varincia de uma populao qualquer.
Teorema 2.4 Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples extrada de uma pop-
ulao com N elementos e varincia populacional

2
=
1
N
N
P
i=1
(X
i
)
2
onde =
1
N
N
P
i=1
X
i
a mdia (esperana) populacional. Ento S
2
=
1
n1
n
P
i=1
(X
i
X)
2

um estimador no viesado para estimar


2
.
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 33
Demonstrao
n
P
i=1
(X
i
X)
2
=
n
P
i=1
(X
i
+ X)
2
=
n
P
i=1

(X
i
)

2
=
n
P
i=1
(X
i
)
2
+
n
P
i=1

2
2
n
P
i=1
(X
i
)

=
n
P
i=1
(X
i
)
2
+n

2
2

n
P
i=1
(X
i
)
=
n
P
i=1
(X
i
)
2
+n

2
2

n
P
i=1
X
i
n

=
n
P
i=1
(X
i
)
2
+n

2
2

X

nX n

=
n
P
i=1
(X
i
)
2
n

2
Da segue que
E(S
2
) = E

1
n 1
n
P
i=1
(X
i
X)
2

=
1
n 1
E

n
P
i=1
(X
i
)
2
n

=
1
n 1

n
P
i=1
E(X
i
)
2
nE

Mas como = E(X


i
) = E(X) e E(X
i
)
2
= V ar(X
i
) =
2
e E

2
= V ar(X)
resulta que
E(S
2
) =
1
n 1

n
P
i=1
V ar(X
i
) nV ar(X)

=
1
n 1

n
P
i=1

2
n

2
n

=
1
n 1

n
2

=
2
e isso completa a prova.
Teorema 2.5 Se X
1
, X
2
, . . . , X
n
uma amostra aleatria simples extrada de uma po-
pulao X N(;
2
) ento
V ar(S
2
) =
2
4
n 1
2.6 Resumo do Captulo
Neste captulo, foram estudadas propriedades da mdia amostral X e da varincia
amostral S
2
. Ao nal, voc dever ser capaz de compreender perfeitamente os seguintes
resultados:
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 34
Dada uma aas (amostra aleatria simples com reposio) X
1
, X
2
, . . . , X
n
de uma
populao X com mdia e varincia
2
, a mdia amostral X um estimador no-
viesado de com varincia igual varincia populacional dividida pelo tamanho
amostral n, isto :
E(X) =
V ar(X) =

2
n
e a varincia amostral S
2
um estimador no viesado para estimar
2
, isto
E(S
2
) =
2
O desvio padro da distribuio amostral de qualquer estatstica usualmente
chamado de erro padro. Ento, o erro padro da mdia amostral EP(X) =

n
Nas condies anteriores e com a hiptese adicional de a populao X ser normal,
a distribuio amostral de X tambm normal, isto :
X N

;
2

=X N

;

2
n

e
V ar(S
2
) =
2
4
n 1
O teorema limite central um dos mais importantes teoremas da teoria inferencial.
Ele nos d informaes sobre a dsitribuio amostral de X para amostras grandes
de qualquer populao. Mais precisamente, se X
1
, X
2
, . . . , X
n
uma amostra
aleatria simples de uma populao X tal que E(X) = e V ar(X) =
2
, ento
a distribuio de X converge para a distribuio normal com mdia e varincia

2
/n quando n . Equivalentemente,
X

n
N(0, 1)
ou

n
X

N(0, 1)
2.7 Exerccios
1. Uma amostra de tamanho n = 18 extrada de uma populao normal com mdia
15 e desvio padro 2,5. Calcule a probabilidade de que a mdia amostral
(a) esteja entre 14,5 e 16,0;
(b) seja maior que 16,1.
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 35
2. Volte ao Exemplo 17.3. Depois de regulada a mquina, prepara-se uma carta de
controle de qualidade. Uma amostra de 4 pacotes ser sorteada a cada hora. Se
a mdia da amostra for inferior a 497g ou superior a 520g, a produo deve ser
interrompida para ajuste da mquina, isto , ajuste do peso mdio.
(a) Qual a probabilidade de uma parada desnecessria?
(b) Se a mquina se desregulou para = 500g, qual a probabilidade de
continuar-se a produo fora dos padres desejados?
3. Uma empresa produz parafusos em duas mquinas. O comprimento dos parafusos
produzidos em ambas aproximadamente normal com mdia de 20mm na primeira
mquina e 25 mm na segunda mquina e desvio padro comum de 4mm. Uma
caixa com 16 parafusos, sem identicao, encontrada e o gerente de produo
determina que, se o comprimento mdio for maior que 23 mm, ento a caixa ser
identicada como produzida pela mquina 2. Especique os possveis erros nessa
deciso e calcule as suas probabilidades.
4. Denimos a varivel e = X como sendo o erro amostral da mdia, onde X a
mdia de uma aas de tamanho n de uma populao com mdia e desvio padro
.
(a) Determine E(e) e V ar(e).
(b) Se a populao normal com = 20, que proporo das amostras de tamanho
100 ter erro amostral absoluto maior do que 2 unidades?
(c) Neste caso, qual deve ser o valor de para que Pr(| e | > ) = 0, 01?
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais ab-
solutos sejam inferiores a 1 unidade?
5. Uma fbrica produz parafusos especiais, para atender um determinado cliente,
que devem ter comprimento de 8,5 cm. Como os parafusos grandes podem ser
reaproveitados a um custo muito baixo, a fbrica precisa controlar apenas a pro-
poro de parafusos pequenos. Para que o processo de produo atinja o lucro
mnimo desejvel, necessrio que a proporo de parafusos pequenos seja no
mximo de 5%.
(a) Supondo que a mquina que produz os parafusos o faa de modo que os
comprimentos tenham distribuio normal com mdia e desvio padro de
1,0 cm, em quanto deve ser regulada a mquina para satisfazer as condies
de lucratividade da empresa?
(b) Para manter o processo sob controle, programada uma carta de qualidade.
A cada hora ser sorteada uma amostra de 4 parafusos e, se o comprimento
mdio dessa amostra for menor que 9,0 cm, o processo de produo inter-
rompido para uma nova regulagem da mquina. Qual a probabilidade de
uma parada desnecessria?
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 36
(c) Se a mquina se desregulou de modo que o comprimento mdio passou a ser
9,5 cm, qual a probabilidade de se continuar o processo de produo fora
dos padres desejados?
6. A diviso de inspeo do Departamento de Pesos e Medidas de uma determinada
cidade est interessada em calcular a real quantidade de refrigerante que colocada
em garrafas de 2 litros, no setor de engarrafamento de uma grande empresa de
refrigerantes. O gerente do setor de engarrafamento informou diviso de inspeo
que o desvio padro para garrafas de 2 litros de 0,05 litro. Uma amostra aleatria
de 100 garrafas de 2 litros, obtida deste setor de engarrafamento, indica uma mdia
de 1,985 litro. Qual a probabilidade de se obter uma mdia amostral de 1,985
ou menos, caso a armativa do gerente esteja certa? O que se pode concluir?
2.8 Soluo das Listas de Exerccios
Lista de Exerccios 1
1. Seja X = comprimento das peas; ento X N(172; 25) e n = 16
(a)
Pr(169 X 175) = Pr

169 172
q
25
16

X 172
q
25
16

175 172
q
25
16

= Pr(2, 4 Z 2, 4) = 2 Pr(0 Z 2, 4)
= 2 tab(2, 4) = 2 0, 4918 = 0, 9836
(b)
Pr(X > 178) = Pr

Z >
178 172
q
25
16

= Pr(Z > 4, 8) 0
(c)
Pr(X < 165) = Pr

Z <
165 172
q
25
16

= Pr(Z < 5, 6) 0
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 37
2. Temos que X N(150; 13
2
) e queremos determinar n para que Pr(

<
6, 5) = 0, 95.
Pr(

X 150

< 6, 5) = 0, 95
Pr(6, 5 < X 150 < 6, 5) = 0, 95
Pr

6, 5
13

n
<
X 150
13

n
<
6, 5
13

n
!
= 0, 95
Pr(0, 5

n < Z < 0, 5

n) = 0, 95
2 Pr(0 < Z < 0, 5

n) = 0, 95
Pr(0 < Z < 0, 5

n) = 0, 475
tab(0, 5

n) = 0, 475
0, 5

n = 1, 96

n =
1, 96
0, 5
= 3, 92
n = (3, 92)
2
16
Lista de Exerccios 2
1. Podemos aceitar que as 200 lmpadas compradas sejam uma amostra aleatria
simples da populao referente s lmpadas produzidas por esse fabricante. Como
n = 100 um tamanho sucientemente grande de amostra, podemos usar o teo-
rema limite central , que nos diz que X N

1600;
250
2
100

. Logo
Pr(X > 1650) = Pr

X 1600
q
250
2
100
>
1650 1600
q
250
2
100

= Pr(Z > 2, 0)
= 0, 5 Pr(0 Z 2)
= 0, 5 tab(2, 0)
= 0, 5 0, 47725 = 0, 02275
2.9 Soluo dos Exerccios
1. X N

15;
2,5
2
18

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 38


(a)
Pr(14, 5 X 16) = Pr

14, 5 15
q
2,5
2
18
Z
16 15
q
2,5
2
18

= Pr(0, 85 Z 1, 70)
= Pr(0, 85 Z 0) + Pr(0 < Z 1, 70)
= Pr(0 Z 0, 85) + Pr(0 Z 1, 70)
= tab(0, 85) + tab(1, 70) = 0, 75777
(b)
Pr(X > 16, 1) = Pr

Z >
16, 1 15
q
2,5
2
18

= Pr(Z > 1, 87)


= 0, 5 Pr(0 Z 1, 87)
= 0, 5 tab(1, 87) = 0, 03074
2. X N(512, 8; 100)
(a) Parada desnecessria: amostra indica que o processo est fora de controle
(X < 497 ou X > 520), quando, na verdade, o processo est ajustado ( =
512, 8). Neste caso, podemos usar a notao de probabilidade condicional
para auxiliar na soluo do exerccio. Queremos calcular
Pr

X < 497

X > 520

| X N

512, 8;
100
4

=
= Pr

X < 497 | X N (512, 8; 25)

+ Pr

X > 520 | X N (512, 8; 25)

= Pr

Z <
497 512, 8
5

+ Pr

Z >
520 512, 8
5

= Pr(Z < 3, 16) + Pr(Z > 1, 44)


= Pr(Z > 3, 16) + Pr(Z > 1, 44)
= [0, 5 Pr(0 Z 3, 16)] + [0, 5 Pr(0 Z 1, 44)]
= 0, 5 tab(3, 16) + 0, 5 tab(1, 44)
= 1, 0 0, 49921 0, 42507
= 0, 07572
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 39
(b) Agora queremos
Pr

497 X 520 | X N(500; 25)

=
= Pr

497 500
5
Z
520 500
5

= Pr(0, 6 Z 4)
= Pr(0, 6 Z < 0) + Pr(0 Z 4)
= Pr(0 Z 0, 6) + Pr(0 Z 4)
= tab(0, 6) + tab(4, 0)
= 0, 72572
Note que a probabilidade de uma parada desnecessria pequena, s custas
de uma alta probabilidade de se operar fora de controle.
3. Os erros so: E
1
: estabelecer que so da mquina 1, quando na verdade foram
produzidos pela mquina 2 ou E
2
: estabelecer que so da mquina 2, quando na
verdade foram produzidos pela mquina 1. A regra de deciso a seguinte:
X > 23 = mquina 2
X 23 = mquina 1
Na mquina 1 o comprimento N(20; 16) e na mquina 2, N(25; 16).
Pr(E
1
) = Pr

X 23|X N

25;
16
16

= Pr

Z
23 25
1

= Pr(Z 2)
= Pr(Z 2) =
= 0, 5 tab(2, 0)
= 0, 5 0, 47725
= 0, 02275
Pr(E
2
) = Pr

X > 23|X N

20;
16
16

= Pr

Z >
23 20
1

= Pr(Z > 3)
= 0, 5 tab(3, 0)
= 0, 5 0, 49865
= 0, 00135
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 40
4. Note que e igual a X menos uma constante e sabemos que E(X) = e V ar(X) =

2
n
.
(a) Das propriedades da mdia e da varincia, resulta que
E(e) = E(X) = = 0
V ar(e) = V ar(X) =

2
n
(b) X N(; 20
2
) e n = 100. Queremos
Pr(|e| > 2) = Pr(e < 2) + Pr(e > 2)
= Pr(X < 2) + Pr(X > 2)
= Pr

X
20
10
<
2
20
10

+ Pr

X
20
10
>
2
20
10

= Pr(Z < 1) + Pr(Z > 1)


= 2 Pr(Z > 1)
= 2 [0, 5 Pr(0 Z 1)]
= 2 [0, 5 tab(1, 0)]
= 0, 31732
(c)
Pr(|e| > ) = 0, 01
Pr(e < ) + Pr(e > ) = 0, 01
Pr(X < ) + Pr(X > ) = 0, 01
Pr

X
20
10
<

20
10

+ Pr

X
20
10
>

20
10

= 0, 01
Pr

Z <

+ Pr

Z >

2

= 0, 01
2 Pr

Z >

2

= 0, 01
Pr

Z >

2

= 0, 005
0, 5 Pr

0 Z

2

= 0, 005
Pr

0 Z

2

= 0, 495
tab

= 0, 495

2
= 2, 58 = 5, 16
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 41
(d)
Pr (|e| < 1) = 0, 95
Pr(1 < X < 1) = 0, 95
Pr

1
20

n
< Z <
1
20

n
!
= 0, 95
Pr

1
20

n
< Z < 0
!
+ Pr

0 Z <
1
20

n
!
= 0, 95
2 Pr

0 Z <
1
20

n
!
= 0, 95
Pr

0 Z <
1
20

n
!
= 0, 475

n
20
= 1, 96

n = 39, 2 n 1537
5. Parafusos pequenos: X < 8, 5, onde X o comprimento do parafuso.
(a) X N(; 1). Como Pr(X < 8, 5) = 0, 05, resulta que 8,5 tem que ser menor
que , ou seja, a abscissa 8, 5 tem que estar no lado negativo da escala
da normal padronizada.
Pr(X < 8, 5) = 0, 05
Pr

Z <
8, 5
1

= 0, 05
Pr

Z >
8, 5
1

= 0, 05
Pr(0 Z 8, 5) = 0, 45
8, 5 = 1, 64
= 10, 14
(b) Parada desnecessria: amostra indica processo fora de controle (X < 9),
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 42
quando, na verdade, o processo est sob controle ( = 10, 14).
Pr

X < 9 | X N

10, 14;
1
4

= Pr

Z <
9 10, 14
0, 5

= Pr(Z < 2, 28)


= Pr(Z > 2, 28)
= 0, 5 Pr(0 Z 2, 28)
= 0, 5 tab(2, 28)
= 0, 5 0, 4887 = 0, 0113
(c) Mquina desregulada: X > 9; processo operando sem ajuste: X N (9, 5; 1)
Pr

X > 9 | X N

9, 5;
1
4

= Pr

Z >
9 9, 5
0, 5

= Pr(Z > 1)
= Pr(1 < Z < 0) + Pr(Z 0)
= Pr(0 < Z < 1) + Pr(Z 0)
= tab(1, 0) + 0, 5
= 0, 841314
6. Armativa do gerente: = 2 e = 0, 05. Como n = 100, podemos usar o teorema
limite central . Logo, X N

2;
0,05
2
100

.
Pr(X 1, 985) = Pr

Z
1, 985 2
0,05
10
!
= Pr(Z 3, 0)
= Pr(Z 3, 0)
= 0, 5 tab(3, 0)
= 0, 5 0, 49865 = 0, 00135
A probabilidade de se obter esse valor nas condies dadas pelo gerente muito
pequena, o que pode nos fazer suspeitar da veracidade das armativas. provvel
que, ou a mdia no seja 2 (e, sim, menor que 2), ou o desvio padro no seja 0,05
(e, sim, maior que 0,05). Esboce grcos da normal para compreender melhor esse
comentrio!
Captulo 3
Distribuio Amostral da Proporo
Neste captulo voc ver uma importante aplicao do Teorema Limite Central: iremos
estudar a distribuio amostral de propores. Assim, voc ver os resultados referentes
aproximao da distribuio binomial pela distribuio normal, que nos permitir fazer
inferncia sobre propores.
Voc ver os seguintes resultados:
aproximao da binomial pela normal
correo de continuidade
distribuio amostral da proporo amostral
3.1 Aproximao normal da distribuio binomial
No captulo anterior, vimos o Teorema Limite Central, que trata da distribuio da
mdia amostral X quando n . Esse teorema nos diz que, se X uma populao
com mdia e varincia
2
, ento a distribuio amostral da mdia de uma amostra
aleatria simples de tamanho n se aproxima de uma distribuio normal com mdia
e varincia

2
n
quando n .
Usando as propriedades da mdia e da varincia, podemos estabelecer esse teorema
em termos de S
n
=
n
P
i=1
X
i
, em vez de X. Como S
n
= nX, ento E(S
n
) = nE(X) e
V ar(S
n
) = n
2
V ar(X) e isso nos d o seguinte resultado.
Teorema 3.1 Teorema Central do Limite
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao X tal que
E(X) = e V ar(X) =
2
. Ento, a distribuio de S
n
=
n
P
i=1
X
i
converge para a
distribuio normal com mdia n e varincia n
2
quando n .
43
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 44
A varivel aleatria binomial foi denida como nmero de sucessos em n repeties
independentes de um experimento de Bernoulli com parmetro p. Ento, uma varivel
binomial a soma de n variveis independentes Bern(p). Pelo teorema acima e usando
o fato de que se X Bern(p) ento E(X) = p e V ar(X) = p(1p), podemos dizer que
a distribuio binomial com parmetros n e p se aproxima de uma normal com mdia
np e varincia np(1 p) quando n .
Alguns cuidados devem ser tomados na aproximao da binomial pela normal. Um
fato importante a observar que a distribuio binomial discreta, enquanto a varivel
normal contnua. Veja a Figura 3.1. A o histograma representa uma v.a. X com
distribuio binomial com n = 12 e p = 0, 5. OS retngulos, centrados nos possveis
valores de X, tm base 1 e altura igual a Pr(X = k), de modo que a rea de cada
retngulo igual a Pr(X = k). A curva normal a representada de uma v.a. Y com
mdia = 12 0, 5 = 6 e varincia
2
= 12 0, 5 0, 5 = 3.
0,00
0,05
0,10
0,15
0,20
0,25
0 1 2 3 4 5 6 7 8 9 10 11 12
Figura 3.1: Aproximao normal da distribuio binomial
Suponha que queiramos calcular Pr(X 8). Isso equivale a somar as reas dos 4
ltimos retngulos superiores. Pela aproximao normal, no entanto, temos que calcular
a rea (probabilidade) acima do ponto 7,5, de modo a incluir os 4 retngulos. Assim,
Pr(X 8) Pr(Y 7, 5) = Pr

Y 6

3

7, 5 6

= Pr(Z 0, 87)
= 0, 5 tab(0, 87)
= 0, 5 0, 30785
= 0, 19215
O valor exato, calculado pela distribuio binomial, Pr(X 8) = 0, 1938.
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 45
Vamos, agora, calcular Pr(X > 10). Isso equivale rea dos 2 retngulos superiores,
centrados em 11 e 12 (este ltimo no visvel, pois Pr(X = 12) = 0, 000244); logo,
pela distribuio normal temos que calcular Pr(Y 10, 5) :
Pr(X > 10) Pr(Y 10, 5) = Pr

Y 6

3

10 6

= Pr(Z 2, 31)
= 0, 5 tab(2, 31)
= 0, 5 0, 48956
= 0, 01044
Se queremos Pr(X < 5), isso equivale s reas dos 4 retngulos inferiores e, portanto
Pr(X < 5) Pr(Y 4, 5) = Pr

Y 6

3

5 6

= Pr(Z 0, 58)
= Pr(Z 0, 58)
= 0, 5 tab(0, 58)
= 0, 5 0, 21904
= 0, 28096
Se queremos Pr(4 X < 8), temos a seguinte aproximao:
Pr(4 X < 8) Pr(3, 5 Y 7, 5)
= Pr

3, 5 6

3
Z
7, 5 6

= Pr(1, 44 Z 0, 87)
= Pr(1, 44 Z 0) + Pr(0 Z 0, 87)
= Pr(0 Z 1, 44) + Pr(0 Z 0, 87)
= tab(1, 44) + tab(0, 87)
= 0, 42507 + 0, 30785
= 0, 73292
interessante observar que para uma varivel binomial faz sentido calcular Pr(X =
k); no caso da normal, essa probabilidade nula, qualquer que seja k. Para usar a
aproximao normal para calcular, por exemplo, Pr(X = 5), devemos notar que essa
probabilidade equivale rea do retngulo centrado em 5 e, em termos da curva normal,
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 46
temos que calcular a rea compreendida entre 4,5 e 5,5:
Pr(X = 5) Pr(4, 5 Y 5, 5)
= Pr

4, 5 6

3
Z
5, 5 6

= Pr(0, 87 Z 0, 29)
= Pr(0, 29 Z 0, 87)
= tab(0, 87) tab(0, 29)
= 0, 30785 0, 11409
= 0, 19376
e o valor exato 0,193359.
Esses procedimentos so chamados de correo de continuidade e na Figura 3.2
ilustra-se o procedimento geral; lembre-se que o centro de cada retngulo o valor da
varivel binomial.
A aproximao dada pelo teorema limite central melhor para valores grandes de n.
Existe a seguinte regra emprica para nos ajudar a decidir o que grande:
A distribuio binomial com parmetros n e p pode ser aproximada por uma dis-
tribuio normal com mdia = np e varincia
2
= np(1 p) se so satisfeitas as
seguintes condies:
1. np 5
2. n(1 p) 5
3.1.1 Lista de Exerccios 1
Em cada um dos exerccios abaixo, verique que as condies para aproximao da bino-
mial pela normal so satisfeitas e calcule a probabilidade pedida usando a aproximao
normal.
1. X bin(18; 0, 4); Pr(X 15) e Pr(X < 2)
2. X bin(40; 0, 3); Pr(X < 10) e Pr(25 < X < 28)
3. X bin(65; 0, 9); Pr(X = 58) e Pr(60 < X 63)
4. X bin(100; 0, 2); Pr(25 X 35)
5. X bin(50; 0, 2); Pr(X > 26) e Pr(5 X < 10)
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 47
Figura 3.2: Correo de continuidade para a aproximao normal da binomial
(a) Pr(X = k) (b) Pr(X k) (c) Pr(X < k) (d) Pr(X k) (e) Pr(X > k)
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 48
3.2 A distribuio amostral da proporo
Considere uma populao em que cada elemento classicado de acordo com a presena
ou ausncia de determinada caracterstica. Por exemplo, podemos pensar em eleitores
escolhendo entre 2 candidatos, pessoas classicadas de acordo com o sexo, trabalhadores
classicados como trabalhador com carteira assinada ou no, e assim por diante. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :
X =

1 se elemento possui a caracterstica de interesse
0 se elemento no possui a caracaterstica de interesse
Vamos denotar por p a proporo de elementos da populao que possuem a carac-
terstica de interesse. Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1p). Em geral,
esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X
1
, X
2
, . . . , X
n
com reposio. Essas n extraes correspondem a n variveis aleatrias
de Bernoulli independentes e, como visto, S
n
=
n
P
i=1
X
i
tem distribuio binomial com
parmetros n e p. Note que S
n
d o nmero total de sucessos nas n repeties, onde
sucesso, neste caso, representa a presena da caracterstica de interesse. Os valores
possveis de S
n
so 0, 1, 2, . . . , n. Com relao proporo
b
P de elementos na amostra
que possuem a caracterstica de interesse, temos que
b
P =
S
n
n
=
X
1
+X
2
+ +X
n
n
(3.1)
e os valores possveis de
b
P so 0,
1
n
,
2
n
, . . . ,
n1
n
, 1 com
Pr

b
P =
k
n

= Pr(S
n
= k) (3.2)
Analisando a expresso (3.1), podemos ver que
b
P nada mais que a mdia amostral
de X
i
Bern(p), i = 1, . . . , n. Logo, o Teorema 2.1 se aplica comE(X) = p e V ar(X) =
p(1 p),ou seja:
E(
b
P) = p
V ar(
b
P) =
p(1 p)
n
Vemos, ento, que a proporo amostral um estimador no-viesado da proporo
populacional p. A distribuio exata dada pela expresso (3.2).
Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central
nos diz, ento, que a distribuio da proporo amostral se aproxima de uma nornal
com mdia p e varincia
p(1p)
n
. Como essa aproximao uma conseqncia direta da
aproximao normal da binomial, as mesmas regras continuam valendo: a aproximao
deve ser feita se np 5 e n(1 p) 5.
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 49
Exemplo 3.1 De um lote de produtos manufaturados, extrai-se uma amostra aleatria
simples de 100 itens. Se 10% dos itens do lote so defeituosos, calcule a probabilidade
de serem sorteados no mximo 12 itens defeituosos.
Soluo
As condies para utilizao da aproximao normal so vlidas: com n = 100 e
p = 0, 1 temos que
100 0, 1 = 10 > 5
100 0, 9 = 9 > 5
Seja X = nmero de itens defeituosos na amostra. Ento, X bin(100; 0, 1) e
X N(10; 9). Queremos calcular Pr(X 12). Usando a correo de continuidade e
denotando por Y uma v.a. N(10; 9), temos que
Pr(X 12) Pr(Y 12, 5)
= Pr

Z
12, 5 10

= Pr(Z 0, 83)
= 0, 5 + tab(0, 83)
= 0, 79673
O valor exato Pr(X 12) = 0, 802.
3.2.1 Lista de Exerccios 2
Aconabilidade de umcomponente a probabilidade de que ele funcione sob as condies
desejadas. Uma amostra aleatria simples de 1000 desses componentes extrada e cada
componente testado. Calcule a probabilidade de obtermos pelo menos 30 itens defeitu-
osos supondo que a conabilidade do item seja
1. 0,995
2. 0,85
3.3 Resumo do Captulo
Neste captulo estudamos dois resultados bsicos sobre a distribuio binomial; o primeiro
envolve a aproximao normal e o segundo, a distribuio amostral de propores
amostrais. Ao nal, voc deve compreender os seguintes resultados.
Se X bin(n; p), ento probabilidades desta varivel podem ser aproximadas
pelas probabilidades da distribuio N [np; np(1 p)] , desde que sejam satisfeitas
as seguintes condies:
np 5
n(1 p) 5
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 50
Na aproximao da binomial pela normal, deve ser usada a correo de con-
tinuidade, conforme resumido na tabela a seguir, onde X bin(n; p) e Y
N [np; np(1 p)] (veja tambm a Figura 3.2):
Binomial Aproximao Normal
Pr(X = k) Pr(k 0, 5 Y k + 0, 5)
Pr(X k) Pr(Y k + 0, 5)
Pr(X < k) Pr(Y < k + 0, 5)
Pr(X k) Pr(Y k 0, 5)
Pr(X > k) Pr(Y k + 0, 5)
Seja uma populao descrita pela varivel aleatria X Bern(p). Ento, Pr(X =
1) = p, Pr(X = 0) = 1 p, E(X) = p e V ar(X) = p(1 p). Seja X
1
, X
2
, . . . , X
n
uma aas desta populao. Denindo a proporo amostral
b
P =
X
1
+X
2
+. . . +X
n
n
resulta que
b
P N

p;
p(1 p)
n

e essa aproximao pode ser usada se np 5 e n(1 p) 5.


3.4 Exerccios
1. Use a aproximao normal para calcular as probabilidades pedidas, tendo o cuidado
de vericar que as condies para essa aproximao so realmente satisfeitas.
(a) Pr(X 25) se X bin(50; 0, 7)
(b) Pr(42 < X 56) se X bin(100; 0, 5)
(c) Pr(X > 60) se X bin(100; 0, 5)
(d) Pr(X = 5) se X bin(20; 0, 4)
(e) Pr(X 12) se X bin(30; 0, 3)
(f) Pr(9 < X < 11) se X bin(80; 0, 1)
(g) Pr(12 X 16) se X bin(30; 0, 2)
(h) Pr(X > 18) se X bin(50; 0, 3)
(i) Pr(X = 6) se X bin(28; 0, 2)
(j) Pr(30 X < 48) se X bin(95; 0, 4)
2. Em uma sondagem, perguntou-se a 1002 membros de determinado sindicato se eles
haviam votado na ltima eleio para a direo do sindicato e 701 responderam
armativamente. Os registros ociais obtidos depois da eleio mostram que 61%
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 51
dos membros aptos a votar de fato votaram. Calcule a probabilidade de que,
dentre 1002 membros selecionados aleaoriamente, no mnimo 701 tenham votado,
considerando que a verdadeira taxa de votantes seja de 61%. O que o resultado
sugere?
3. Supondo que meninos e meninas sejam igualmente provveis, qual a probabili-
dade de nascerem 36 meninas em 64 partos? Em geral, um resultado considerado
no-usual se a sua probabilidade de ocorrncia pequena, digamos, menor que
0,05. no-usual nascerem 36 meninas em 64 partos?
4. Com base em dados histricos, uma companhia area estima em 15% a taxa de
desistncia entre seus clientes, isto , 15% dos passageiros com reserva no apare-
cem na hora do vo. Para otimizar a ocupao de suas aeronaves, essa companhia
decide aceitar 400 reservas para os vos em aeronaves que comportam apenas 350
passageiros. Calcule a probabilidade de que essa companhia no tenha assen-
tos sucientes em um desses vos. Essa probabilidade alta o suciente para a
companhia rever sua poltica de reserva?
5. No controle de qualidade de produtos, uma tcnica comumente utilizada a
amostragem de aceitao. Segundo essa tcnica, um lote inteiro rejeitado se
contiver mais do que um nmero determinado de itens defeituosos. A compan-
hia X compra parafusos de uma fbrica em lotes de 5000 e rejeita o lote se uma
amostra aleatria simples de 20 parafusos contiver pelo menos 2 defeituosos. Se o
processo de fabricao tem uma taxa de 10% de defeituosos, qual a probabilidade
de um lote ser rejeitado pela companhia X?
3.5 Soluo das Listas de Exerccios
Lista de Exerccios 1
1. 18 0, 4 = 7, 2 > 5
18 0, 6 = 10, 8 > 5
X N (7, 2; 4, 32)
Pr(X 15) Pr

Z
14, 5 7, 2

4, 32

= Pr(Z 3, 51) = 0, 5 0, 49978 = 0, 00022


Pr(X < 2) Pr

Z
1, 5 7, 2

4, 32

= Pr(Z 2, 74) = Pr(Z 2, 74)


= 0, 5 0, 49693 = 0, 00307
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 52
2. 40 0, 3 = 12 > 5
40 0, 7 = 28 > 5
X N(12; 8. 4)
Pr(X < 10) = Pr

Z
9, 5 12

8, 4

= Pr(Z 0, 86) = Pr(Z 0, 86)


= 0, 5 0, 30511 = 0, 19489
Pr(25 < X < 28) = Pr

25, 5 12

8, 4
Z
27, 5 12

8, 4

= Pr(4, 66 Z 5, 35) 0
3. 65 0, 9 = 58, 5 > 5
65 0, 1 = 6, 5 > 5
X N(58, 5; 5, 85)
Pr(X = 58) = Pr

57, 5 58, 5

5, 85
Z
58, 5 58, 5

5, 85

= Pr(0, 41 Z 0) = Pr(0 Z 0, 41) = 0, 15910


Pr(60 < X 63) = Pr

60, 5 58, 5

5, 85
Z
63, 5 58, 5

5, 85

= Pr(0, 83 Z 2, 07) = 0, 48077 0, 29673 = 0, 18404


4. 100 0, 2 = 20, 0 > 5
100 0, 8 = 80, 0 > 5
X N(20; 16)
Pr(25 X 35) = Pr

24, 5 20
4
Z
35, 5 20
4

= Pr(1, 13 Z 3, 88) = 0, 49995 0, 37076 = 0, 12919


5. 50 0, 2 = 10, 0 > 5
50 0, 8 = 40, 0 > 5
X N(10; 8)
Pr(X > 26) = Pr

Z
26, 5 10

= Pr(Z 5, 83) 0
Pr(5 X < 10) = Pr

4, 5 10

8
Z
9, 5 10

= Pr(1, 94 Z 0, 18) = Pr(0, 18 Z 1, 94)


= 0, 47381 0, 07142 = 0, 40239
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 53
Lista de Exerccios 2
1. Se a conabilidade 0,995, ento a probabilidade de um item ser defeituoso
0,005. Seja X = nmero de defeituosos na amostra. Ento, X N(1000
0, 005; 1000 0.005 0.995) ou seja, X N(5; 4, 975). Note que 1000 0, 005 = 5
e 1000 0, 995 = 995, de modo que podemos usar a aproximao normal.
Pr(X 30) Pr

Z
29, 5 5

4, 975

= Pr(Z 10, 98) 0


2. 1000 0, 85 = 850 e 1000 0, 15 = 150.
X N(150; 127, 5)
Pr(X 30) Pr

Z
29, 5 150

127, 5

= Pr(Z 10, 67) 1, 0


3.6 Soluo dos Exerccios
1. .
(a) np = 35 n(1 p) = 15 X N(35; 10, 5)
Pr(X 25) = Pr

Z
25, 5 35

10, 5

= Pr(Z 2, 93) = 0, 5 0, 49831 = 0, 00169


(b) np = 50 n(1 p) = 50 X N(50; 25)
Pr(42 < X 56) = Pr

42, 5 50
5
Z
56, 5 50
5

= Pr(1, 5 Z 1, 3) = 0, 43319 + 0, 40320 = 0, 83639


(c) np = 50 n(1 p) = 50 X N(50; 25)
Pr(X > 60) = Pr

Z
60, 5 50
5

= Pr(Z 2, 1) = 0, 5 0, 48214 = 0, 01786


(d) np = 8 n(1 p) = 12 X N(8; 4, 8)
Pr(X = 5) = Pr

4, 5 8

4, 8
Z
5, 5 8

4, 8

= Pr(1, 60 Z 1, 14) = Pr(1, 14 Z 1, 60)


= 0, 44520 0, 37286 = 0, 072 34
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 54
(e) np = 9 n(1 p) = 21 X N(9; 6, 3)
Pr(X 12) = Pr

Z
11, 5 9

6, 3

= Pr(Z 1)
= 0, 5 0, 34134 = 0, 15866
(f) np = 8 n(1 p) = 72 X N(8; 7, 2)
Pr(9 < X < 11) = Pr

9, 5 8

7, 2
Z
10, 5 8

7, 2

= Pr(0, 56 Z 0, 93) = 0, 32381 0, 21226 = 0, 11155


(g) np = 6 n(1 p) = 24 X N(8; 4, 8)
Pr(12 X 16) = Pr

11, 5 8

4, 8
Z
16, 5 8

4, 8

= Pr(1, 60 Z 3, 88) = 0, 49995 0, 44520 = 0, 05475


(h) np = 15 n(1 p) = 35 X N(15; 10, 5)
Pr(X > 18) = Pr

Z
18, 5 15

10, 5

=
Pr(Z 1, 08) = 0, 5 0, 35993 = 0, 140 07
(i) np = 5, 6 n(1 p) = 22, 4 X N(5, 6; 4, 48)
Pr(X = 6) = Pr

5, 5 5, 6

4, 48
Z
6, 5 5, 6

4, 48

= Pr(0, 05 Z 0, 43) = 0, 01994 + 0, 16640 = 0, 18634


(j) np = 38 n(1 p) = 57 X N(38; 22, 8)
Pr(30 X < 48) = Pr

29, 5 38

22, 8
Z
47, 5 38

22, 8

= Pr(1, 78 Z 1, 99) = 0, 47670 + 0, 46246 = 0, 93916


2. X = nmero de pessoas que votaram. Ento X bin(1002; 0, 61) e X
N(611, 22; 238, 3758)
Pr(X 701) Pr

Z
700.5 611.22
p
238.3758)
!
= Pr(Z 5.78) = 0
Se a proporo de votantes de 61%, a probabilidade de encontrarmos 701 ou
mais votantes em uma aas de 1002 muito baixa. Talvez as pessoas entrevistadas
no estejam sendo sinceras, com vergonha de dizer que no votaram...
CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 55
3. X = nmero de meninas em 64 partos; X bin(64; 0, 5) e X N(32; 16)
Pr(X > 36) Pr

Z
36.5 32
4

= Pr(Z 1.13) = 0.5 0.37076 = 0.12924


Esse um resultado que pode ocorrer por mero acaso, ou seja, no um resultado
no-usual.
4. X = nmero de passageiros que se apresentam para o vo em questo. X
bin(400; 0, 85) e X N(340; 51).
Pr(X > 350) = Pr

Z
350, 5 340

51

= Pr(Z 1, 47) = 0, 5 0, 42922 = 0, 070 78


Essa uma probabilidade um pouco alta; talvez valha a pena a companhia rever
a poltica de reservas e aceitar menos que 400 reservas.
5. X = nmero de defeituosos na amostra; X bin(20; 0.1). Note que aqui no
podemos usar a aproximao normal. uma vez que 20 0.1 = 2 < 5. Queremos
Pr(X 2) = 1 Pr(X < 2) = 1 [Pr(X = 0) + Pr(X = 1)]
= 1

20
0

(0, 1)
0
(0, 9)
20

20
1

(0, 1)(0, 9)
19
=
= 1 0, 39175 = 0, 60825
Captulo 4
Intervalos de Conana
Neste captulo voc aprender um mtodo muito importante de estimao de parmet-
ros. Vimos anteriormente que a mdia amostral X um bom estimador da mdia
populacional . Mas vimos, tambm, que existe uma variabilidade nos valores de X,
ou seja, cada amostra d origem a um valor diferente do estimador. Uma maneira de
informar sobre esta variabilidade atravs da estimao por intervalos. Sendo assim,
neste captulo voc aprender os seguintes conceitos e mtodos:
intervalo de conana
margem de erro
nvel de conana
nvel de seignicncia
intervalo de conana para a mdia de uma populao N (;
2
) com varincia
conhecida
4.1 Idias bsicas
O objetivo central da Inferncia Estatstica obter informaes para uma populao a
partir do conhecimento de uma nica amostra. Em geral, a populao representada
por uma varivel aleatria X, com funo de distribuio ou densidade de probabilidade
f
X
. Dessa populao, ento, extrai-se uma amostra aleatria simples com reposio,
que d origem a um conjunto X
1
, X
2
, . . . , X
n
de n variveis aleatrias independentes
e identicamente distribudas, todas com a mesma distribuio f
X
. Se f
X
depende de
um ou mais parmetros, temos que usar a informao obtida a partir da amostra para
estimar esses parmetros, de forma a conhecermos a distribuio. Vimos, por exemplo,
que a mdia amostral X um bom estimador da mdia populacional , no sentido
de que ela tende a acertar o alvo da verdadeira mdia populacional, isto , a mdia
amostral um estimador no-viesado da mdia populacional. Mas vimos, tambm, que
existe uma variabilidade nos valores de X, ou seja, cada amostra d origem a um valor
56
CAPTULO 4. INTERVALOS DE CONFIANA 57
diferente do estimador. Para algumas amostras, X ser maior que , para outras ser
menor e para outras ser igual.
Na prtica, temos apenas uma amostra e, assim, importante que se d alguma in-
formao sobre essa possvel variabilidade do estimador. Ou seja, importante informar
o valor do estimador
b
obtido com uma amostra especca, mas importante informar
tambm que o verdadeiro valor do parmetro poderia estar num determinado intervalo,
digamos, no intervalo [
b
,
b
+ ]. Dessa forma, estamos informando a nossa margem
de erro no processo de estimao; essa margem de erro conseqncia do processo de
seleo aleatria da amostra.
O que vamos estudar agora como obter esse intervalo, de modo a acertar na
maioria das vezes, isto , queremos um procedimento que garanta que, na maioria
das vezes (ou das amostras possveis), o intervalo obtido conter o verdadeiro valor do
parmetro. A expresso na maioria das vezes ser traduzida como probabilidade
alta. Dessa forma, estaremos lidando com armativas do seguinte tipo:
Com probabilidade alta (em geral, indicada por 1), o intervalo [
b
erro;
b
+ erro] conter o verdadeiro valor do parmetro .
A interpretao correta de tal armativa a seguinte: se 1 = 0, 95, por exemplo,
ento isso signica que o procedimento de construo do intervalo tal que, em 95%
das possveis amostras, o intervalo [
b
erro;
b
+ erro] obtido conter o verdadeiro valor
do parmetro. Note que cada amostra resulta em um intervalo diferente; mas, em 95%
das amostras, o intervalo contm o verdadeiro valor do parmetro. Veja a Figura 4.1.
A dois dos intervalos no contm o parmetro .
O valor 1 chamado nvel de conana, enquanto o valor conhecido como
nvel de signicncia. O intervalo [
b
erro;
b
+ erro] chamado de intervalo de conana
de nvel de conana 1 .
Tendo clara a interpretao do intervalo de conana, podemos resumir a frase acima
da seguinte forma:
Pr


h
b
;
b
+
i
= 1 (4.1)
Mais uma vez, a probabilidade se refere probabilidade dentre as diversas possveis
amostras, ou seja, a probabilidade est associada distribuio amostral de
b
. Note que
os limites do intervalo dependem de
b
, que depende da amostra sorteada, ou seja, os
limites do intervalo de conana so variveis aleatrias. Cada amostra d origem a um
intervalo diferente, mas o procedimento de obteno dos intervalos garante probabilidade
1 de acerto.
CAPTULO 4. INTERVALOS DE CONFIANA 58

Figura 4.1: Interpretao dos Intervalos de Conana


CAPTULO 4. INTERVALOS DE CONFIANA 59
4.2 Intervalo de conana: mdia da N(;
2
),
2
con-
hecida
Vamos agora introduzir os mtodos para obteno do intervalo de conana para a mdia
de uma populao. Como visto, a mdia populacional um parmetro importante que
pode ser muito bem estimado pela mdia amostral X. Para apresentar as idias bsicas,
vamos considerar um contexto que pouco freqente na prtica. O motivo para isso
que, em termos didticos, a apresentao bastante simples. Como o fundamento o
mesmo para contextos mais gerais, essa abordagem se justica.
Consideremos uma populao descrita por uma varivel aleatria normal com mdia
e varincia
2
: X N(;
2
). Vamos supor que o valor de
2
seja conhecido e
que nosso interesse seja estimar a mdia a partir de uma amostra aleatria simples
X
1
, X
2
, . . . , X
n
. Como visto anteriormente, a distribuio amostral de X normal com
mdia e varincia

2
n
, ou seja
X N

;
2

=X N

;

2
n

Da denio de distribuio amostral, isso signica que os diferentes valores de X obtidos


a partir das diferentes possveis amostras se distribuem normalmente em torno de com
varincia

2
n
.
Das propriedades da distribuio normal, resulta que
Z =
X
q

2
n
N(0; 1)
ou equivalentemente,
Z =

n
X

N(0; 1) (4.2)
4.2.1 Notao
Vamos estabelecer a seguinte notao: vamos indicar por z

a abscissa da curva normal


padro que deixa probabilidade (rea) igual a acima dela. Veja a Figura 4.2. Temos,
ento, que Pr(Z > z

) = . Essa abscissa z

normalmente chamada de valor crtico.


Consideremos, agora, o valor crtico z
/2
;veja a Figura 4.3. Da podemos ver que,
se Z N(0; 1), ento
Pr

z
/2
Z z
/2

= 1 (4.3)
Note que isso vale para a distribuio normal padro, em geral. Ento, usando os
resultados (4.2) e (4.3), obtemos que
Pr

z
/2

n
X

z
/2

= 1
CAPTULO 4. INTERVALOS DE CONFIANA 60
Figura 4.2: Ilustrao do valor crtico z

Figura 4.3: Denio do valor crtico z


/2
CAPTULO 4. INTERVALOS DE CONFIANA 61
Mas isso equivalente a
Pr

z
/2

n
X z
/2

= 1
Pr

X z
/2

n
X +z
/2

= 1
Pr

X z
/2

n
X +z
/2

= 1 (4.4)
Note a ltima expresso; ela nos diz que
Pr

X z
/2

n
; X +z
/2

= 1
Mas essa exatamente a forma geral de um intervalo de conana, conforme explicitado
na equao (4.1). Temos, ento, a seguinte concluso:
Denio 4.1 Intervalo de conana para a mdia de uma populao normal
com varincia conhecida
Seja X N(;
2
) uma populao normal com varincia
2
conhecida. Se X
1
, X
2
, . . . , X
n
uma amostra aleatria simples dessa populao, ento o intervalo de conana de nvel
de conana 1 para a mdia populacional dado por

X z
/2

n
; X +z
/2

4.2.2 Interpretao do intervalo de conana para


O intervalo de conana para pode ser escrito na forma [X; X+] onde = z
/2

n
a margem de erro. Como visto, essa margem de erro est associada ao fato de que
diferentes amostras fornecem diferentes valores de X cuja mdia igual a . As diferentes
amostras fornecem diferentes intervalos de conana, mas uma proporo de 100 (1
)% desses intervalos ir conter o verdadeiro valor de . Note que aqui fundamental
a interpretao de probabilidade como freqncia relativa: estamos considerando os
diferentes intervalos que seriam obtidos, caso sortessemos todas as possveis amostras.
Assim, o nvel de conana est associado conabilidade do processo de obteno do
intervalo: esse processo tal que acertamos (isto , o intervalo contm ) em 100 (1
)% das vezes.
Na prtica, temos apenas uma amostra e o intervalo obtido com essa amostra es-
pecca, ou contm ou no contm o verdadeiro valor de . A armativa
Pr

X z
/2

n
; X +z
/2

= 1
vlida porque ela envolve a varivel aleatria X, que tem diferentes valores para as
diferentes amostras. Quando substitumos o estimador X por uma estimativa especca
CAPTULO 4. INTERVALOS DE CONFIANA 62
x obtida a partir de uma amostra particular, temos apenas um intervalo e no faz mais
sentido falar em probabilidade.
Para ajudar na interpretao do intervalo de conana, suponha que, com uma
amostra de tamanho 25, tenha sido obtido o seguinte intervalo de conana com nvel
de conana de 0,95:

5 1, 96
2

25
; 5 + 1, 96
2

25

= [4, 216; 5, 784]


Esse intervalo especco contm ou no contm o verdadeiro valor de . O que esta-
mos dizendo que, se repetssemos o mesmo procedimento de sorteio de uma amostra
aleatria simples da populao e conseqente construo do intervalo de conana, 95%
dos intervalos construdos conteriam o verdadeiro valor de .
Sendo assim, errado dizer que h uma probabilidade de 0,95 de o intervalo especco
[4, 216; 5, 784] conter o verdadeiro valor de . Mas certo dizer que com probabilidade
0,95 o intervalo

X 1, 96
2

25
; X + 1, 96
2

25

contm . Note a varivel aleatria X no limite do intervalo.


Exemplo 4.1 Em determinada populao, o peso dos homens adultos distribudo nor-
malmente com um desvio padro de 16 kg. Uma amostra aleatria simples de 36 homens
adultos sorteada desta populao, obtendo-se um peso mdio de 78,2 kg. Construa um
intervalo de conana de nvel de conana 0,95 para o peso mdio de todos os homens
adultos dessa populao.
Soluo
Vamos incialmente determinar o valor crtico associado ao nvel de conana de 0,95.
Como 1 = 0, 95, resulta que = 0, 05 e /2 = 0, 025.
Analisando a Figura 4.3, vemos que nas duas caudas da distribuio normal padro
temos que ter 5% da rea ( = 0, 05); logo, em cada cauda temos que ter 2,5%
(/2 = 0, 025) da rea total. Em termos da nossa tabela da distribuio normal padro
(apresentada novamente ao nal da apostila como Tabela 1), isso signica que entre 0
e z
0,025
temos que ter (50 2, 5)% = 47, 5% e, assim, temos que procurar no corpo da
tabela o valor de 0,475 para determinar a abscissa z
0,025
. Veja a Figura 4.4.
Procurando no corpo da tabela da distribuio normal padro, vemos que o valor
0,475 corresponde abscissa z
0,025
= 1, 96. Logo, nosso intervalo de conana

78, 2 1, 96
16

36
; 78, 2 + 1, 96
16

36

= [72, 9733 ; 83, 4267]


Esse intervalo contm ou no o verdadeiro valor de , mas o procedimento utilizado
para sua obteno nos garante que h 95% de chance de estarmos certos.
CAPTULO 4. INTERVALOS DE CONFIANA 63
Figura 4.4: Valor crtico associado ao nvel de conana 1 = 0, 95
4.2.3 Lista de Exerccios 1
1. Encontre os valores crticos da normal padro correspondentes aos seguintes nveis
de conana 1 = 0, 90; 0, 99; 0, 80.
2. Encontre o nvel de conana correspondente aos seguintes valores crticos z
/2
=
1, 28; 1, 80.
3. De uma populao normal com desvio padro 2, extrai-se uma aas de tamanho 36,
que fornece o seguinte resultado:
36
P
i=1
x
i
= 1236. Calcule o intervalo de conana
para a mdia populacional , utilizando o nvel de signicncia = 2%.
4.3 Margem de erro
Vamos, agora, analisar a margem de erro do intervalo de conana para a mdia de uma
populao normal com varincia conhecida. Ela dada por
= z
/2

n
(4.5)
Lembrando que o erro padro o desvio padro do estimador, podemos escrever
= z
/2
EP(X) (4.6)
Analisando a equao (4.5), podemos ver que ela depende diretamente do valor crtico
e do desvio padro populacional e inversamente proporcional ao tamanho da amostra.
Na Figura 4.5 ilustra-se a relao de dependncia da margem de erro em relao
ao desvio padro populacional . Temos a duas distribuies amostrais centradas na
mesma mdia e baseadas em amostras de mesmo tamanho. Nas duas distribuies a
rea total das caudas sombreadas , de modo que o intervalo limitado pelas linhas
verticais o intervalo de conana de nvel de conana 1 . Para a distribuio mais
dispersa, isto , com maior, o comprimento do intervalo maior. Esse resultado deve
CAPTULO 4. INTERVALOS DE CONFIANA 64
Figura 4.5: Margem de erro versus sigma:
1
<
2

1
<
2
ser intuitivo: se h mais variabilidade na populao, a nossa margem de erro tem que ser
maior, mantidas xas as outras condies (tamanho de amostra e nvel de conana).
Por outro lado, se mantivermos xos o tamanho da amostra e o desvio padro popu-
lacional, razovel tambm esperar que a margem de erro seja maior para um nvel de
conana maior. Ou seja, se queremos aumentar a probabilidade de acerto, razovel
que o intervalo seja maior. Aumentar a probabilidade de acerto signica aumentar
o nvel de conana, o que acarreta em um valor crtico z
/2
maior. Veja a Figura
4.6, onde ilustra-se o intervalo de conana para dois nveis de conana diferentes:
1
2
> 1
1
. O primeiro intervalo maior, reetindo o maior grau de conana.
Figura 4.6: Margem de erro versus nvel de conana: 1
2
> 1
1

2
>
1
Finalmente, mantidos o mesmo desvio padro populacional e o mesmo nvel de con-
ana, quanto maior o tamanho da amostra, mais perto vamos cando da populao e,
assim, vai diminuindo a nossa margem de erro.
Exemplo 4.2 De uma populao normal com varincia 25 extrai-se uma amostra aleatria
CAPTULO 4. INTERVALOS DE CONFIANA 65
simples de tamanho n com o objetivo de se estimar a mdia populacional com um nvel
de conana de 90% e margem de erro de 2. Qual deve ser o tamanho da amostra?
Soluo
Para um nvel de conana 0,90, o valor do nvel de signicncia = 0, 10. Ento,
na cauda superior da distribuio normal padro temos que ter uma rea (probabilidade)
de 0,05 e, portanto, para encontrarmos o valor de z
0,05
temos que procurar no corpo da
tabela o valor 0,45 (se necessrio, consulte a Figura 4.4). Resulta que z
0,05
= 1, 64.
Temos, ento, todos os valores necessrios:
2 = 1, 64
5

n =
1, 64 5
2
= 4, 1 n = 16, 71
Como o valor de n tem que ser um inteiro, uma estimativa apropriada n = 17 (devemos
arredondar para cima para garantir um nvel de conana no mnimo igual ao desejado).
Exemplo 4.3 Na divulgao dos resultados de uma pesquisa, publicou-se o seguinte
texto (dados ctcios): Com o objetivo de se estimar a mdia de uma populao,
estudou-se uma amostra de tamanho n = 45. De estudos anteriores, sabe-se que essa
populao muito bem aproximada por uma distribuio normal com desvio padro 3,
mas acredita-se que a mdia tenha mudado desde esse ltimo estudo. Com os dados
amostrais obteve-se o intervalo de conana [1, 79; 3, 01], com uma margem de erro de
0,61. Quais so as informaes importantes que no foram divulgadas? Como podemos
obt-las?
Soluo
Quando se divulga um intervalo de conana para um certo parmetro, cos-
tume publicar tambm a estimativa pontual. Nesse caso, temos que informar a mdia
amostral, que pode ser achada observando que o intervalo de conana simtrico em
torno da mdia. Logo, x o ponto mdio do intervalo:
x =
1, 79 + 3, 01
2
= 2, 4
Outra informao importante o nvel de conana, que encontrado a partir da abscissa
z
/2
:
0, 61 = z
/2

3

45
z
/2
=
0, 61

45
3
= 1, 36
Consultando a tabela da distribuio normal, vemos que tab(1, 36) = 0, 41308. Veja a
Figura 4.7: o nvel de conana 2 0, 41308 = 0, 826 16 0, 83.
Como dito no incio do captulo, a situao abordada aqui pouco realista. Na
prtica, em geral no conhecemos o desvio padro da populao. Nos prximos captulos
iremos estudar o caso mais geral em que no conhecido.
CAPTULO 4. INTERVALOS DE CONFIANA 66
Figura 4.7: Clculo do nvel de conana a partir de , , n
4.3.1 Lista de Exerccios 2
1. Considere os dois intervalos de conana a seguir, obtidos a partir de uma mesma
amostra de uma populao N(; 16). Sem fazer qualquer clculo, identique para
qual deles o nvel de conana maior.
[13, 04; 16, 96]
[12, 42; 17, 58]
2. Obtido um intervalo de conana para a mdia de uma N (; 25), o que deve ser
feito para se reduzir a margem de erro pela metade se no devemos alterar o nvel
de conana?
4.4 Resumo do Captulo
Como existe uma variabilidade nos valores de umestimador
b
ao longo das possveis
amostras, uma maneira de informar sobre esta variabilidade atravs da estimao
por intervalos de conana. Esses intervalos, em geral, tm a forma
h
b
;
b
+
i
,
onde margem de erro.
A obteno de um intervalo de conana feita de modo que
Pr


h
b
;
b
+
i
= 1
O valor 1 o nvel de conana, enquanto o valor o nvel de signicncia.
A probabilidade se refere probabilidade dentre as diversas possveis amostras, ou
seja, a probabilidade est associada distribuio amostral de
b
. Cada amostra d
origem a um intervalo diferente, mas o procedimento de obteno dos intervalos
garante probabilidade 1 de acerto, ou seja, incluso do verdadeiro valor do
parmetro.
CAPTULO 4. INTERVALOS DE CONFIANA 67
A margem de erro do intervalo de conana para a mdia de uma populao normal
com varincia conhecida
= z
/2

n
= z
/2
EP(X)
onde z
/2
o valor crtico da densidade normal padro que deixa probabilidade
/2 acima dele.
4.5 Exerccios
1. De uma populao N(; 9) extrai-se uma amostra aleatria simples de tamanho
25, obtendo-se
25
P
i=1
x
i
= 60. Desenvolva detalhadamente o intervalo de conana de
nvel de conana 99% para a mdia da populao.
2. Determine o tamanho da amostra necessrio para se estimar a mdia de uma
populao normal com = 4, 2 para que, com conana de 95%, o erro mximo
de estimao seja 0, 05.
3. O peso X de um certo artigo descrito aproximadamente por uma distribuio
normal com = 0, 58. Uma amostra de tamanho n = 25 resultou em x = 2, 8.
Desenvolva detalhadamente o intervalo de conana de nvel de conana 0, 90.
4. De uma populao normal com = 5, retira-se uma amostra aleatria simples de
tamanho 50, obtendo-se x = 42.
(a) Obtenha o intervalo de conana para a mdia com nvel de signicncia de
5%.
(b) Qual o erro de estimao?
(c) Para que o erro seja 1, com probabilidade de acerto de 95%, qual dever
ser o tamanho da amostra?
5. Os valores da venda mensal de determinado artigo tm distribuio aproximada-
mente normal com desvio padro de R$500,00. O gerente da loja arma vender,
em mdia, R$34.700,00. O dono da loja, querendo vericar a veracidade de tal ar-
mativa, seleciona uma amostra aleatria das vendas em determinado ms, obtendo
os seguintes valores:
33840, 00 32960, 00 41815, 00 35060, 00 35050, 00
32940, 00 32115, 00 32740, 00 33590, 00 33010, 00
(a) Obtenha o intervalo de conana para a venda mdia mensal com nvel de
signicncia de 5%.
(b) Obtenha o intervalo de conana para a venda mdia mensal com nvel de
signicncia de 1%.
CAPTULO 4. INTERVALOS DE CONFIANA 68
(c) Em qual dos dois nveis de signicncia podemos armar que o gerente se
baseou para fazer a armativa?
6. Intervalo de conana com limites assimtricos O tempo de execuo de de-
terminado teste de aptido para ingresso em um estgio normalmente distribudo
com desvio padro de 10 minutos. Uma amostra de 25 candidatos apresentou um
tempo mdio de 55 minutos. Construa um intervalo de conana de limites L
1
e
L
2
(L
1
< L
2
) de modo que seja observada a seguinte especicao: desconana
de que < L
1
atribuiremos um nvel de signicncia de 5% e desconana de
que > L
2
atribuiremos o nvel de signicncia de 10%.
4.6 Soluo das Listas de Exerccios
Lista de Exerccios 1
1. 1 = 0, 90 =z
0,05
= 1, 64
1 = 0, 99 =z
0,005
= 2, 58
1 = 0, 80 =z
0,10
= 1, 28
2. tab(1, 28) = /2 = 0, 39973 = = 2 0.39973 = 0.79946 0, 80 ou 80%
tab(1, 80) = /2 = 0, 46407 = = 2 0.46407 = 0.92814 0, 93 ou 93%
3. = 2% =1 = 98% =tab(z
0,01
) = 0, 49 =z
0,01
= 2, 33
= 2.33
2

36
= 0, 7767
Como a mdia amostral observada x =
1236
36
= 34.333, o intervalo de conana
[34.333 0.7767; 34.333 + 0.7767] = [33, 556; 35, 110]
Lista de Exerccios 2
1. Como a amostra a mesma, isso signica que a populao a mesma, bem como
o tamanho de amostra, ou seja, e n so os mesmos. Vimos que um nvel de
conana maior resulta em um intervalo de conana maior; logo, o segundo in-
tervalo foi construdo com base em um nvel de conana maior do que o utilizado
na construo do primeiro.
2. Mantidos xos o nvel de conana e o desvio padro populacional, vimos que a
margem de erro inversamente proporcional raiz quadrada de n. Assim, para
reduzir pela metade a margem de erro, temos que dobrar

n, ou seja, temos que
quadruplicar o tamanho amostral n.
CAPTULO 4. INTERVALOS DE CONFIANA 69
4.7 Soluo dos Exerccios
1. dado que X N(; 9). Como n = 25, sabemos que
X N

;
9
25

Com 1 = 0, 99, temos que = 0, 01 e /2 = 0, 005. Assim, temos que procurar


no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 005 = 0, 495,o que
nos d z
0,005
= 2, 58. Ento
Pr(2, 58 Z 2, 58) = 0, 99
Pr

2, 58
X
q
9
25
2, 58

= 0, 99
Pr

2, 58
r
9
25
X 2, 58
r
9
25
!
= 0, 99
Pr(1, 548 X 1, 548) = 0, 99
Pr(X 1, 548 X + 1, 548) = 0, 99
Como a mdia amostral obtida x =
60
25
= 2, 4 o intervalo de conana de 99% de
conana
[2, 4 1, 548 ; 2, 4 + 1, 548] = [0, 852 ; 3, 948]
2. Queremos || 0, 05, com = 4, 2 e 1 = 0, 95.
1 = 0, 95 z
/2
= 1, 96
Ento
1, 96
4, 2

n
0, 05

n
1, 96 4, 2
0, 05
= 164, 64
n 27106, 3296
Logo, o tamanho mnimo necessrio n = 27107.
3. dado que X N(; 0, 58
2
). Como n = 25, sabemos que
X N

;
0, 58
2
25

Com 1 = 0, 90, temos que = 0, 10 e /2 = 0, 05. Assim, temos que procurar


no corpo da tabela a abscissa correspondente ao valor 0, 50, 05 = 0, 45,o que nos
CAPTULO 4. INTERVALOS DE CONFIANA 70
d z
0,05
= 1, 64. Ento
Pr(1, 64 Z 1, 64) = 0, 90
Pr

1, 64
X
q
0,58
2
25
1, 64

= 0, 90
Pr

1, 64
0, 58
5
X 1, 64
0, 58
5

= 0, 90
Pr(0, 19024 X 0, 19024) = 0, 90
Pr(X 0, 19024 X + 0, 19024) = 0, 90
Como a mdia amostral obtida x = 2, 8 o intervalo de conana de nvel de
conana 99%
[2, 8 0, 19024 ; 2, 8 + 0, 19024] = [2, 60976 ; 2, 99024]
4. = 0, 05 1 = 0, 95 z
0,025
= 1, 96
(a) A margem de erro
= 1, 96
5

50
= 1, 3859
Logo, o intervalo de conana de nvel de conana 0,95
[42 1, 385 9 ; 42 + 1, 3859] = [40, 6141 ; 43, 3859]
(b) Como visto em (a) a margem de erro = 1, 3859.
(c) Temos que reduzir a margem de erro; logo, o tamanho da amostra ter que
ser maior que 50.
= 1, 96
5

n
1

n 1, 96 5 = 9, 8
n 9, 8
2
= 96, 04
Logo, n deve ser no mnimo igual a 97.
5. A mdia amostral x =
343120
10
= 34312.
(a) A margem de erro
= 1, 96
500

10
= 309, 9
Logo, o intervalo de conana de nvel de conana 95%
[34312 309, 9 ; 34312 + 309, 9] = [34002, 1 ; 34621, 9]
CAPTULO 4. INTERVALOS DE CONFIANA 71
(b) A margem de erro
= 2, 58
500

10
= 407, 93
Logo, o intervalo de conana de nvel de conana 95%
[34312 407, 93 ; 34312 + 407, 93] = [33904, 07 ; 34719, 93]
(c) O gerente deve estar usando o nvel de signicncia de 1% (ou nvel de con-
ana de 99%).
6. Veja a Figura 4.8.
Figura 4.8: Soluo do Exerccio 6 - Intervalo de conana assimtrico
Temos que ter
Pr(Z < z
1
) = 0, 05 Pr(Z > z
1
) = 0, 05
tab(z
1
) = 0, 45 z
1
= 1, 64 z
1
= 1, 64
Temos que ter
Pr(Z > z
2
) = 0, 10 tab(z
2
) = 0, 40 z
2
= 1, 28
Resulta, ento, que
Pr(1, 64 Z 1, 28) = 0, 85
Pr

1, 64

n
X

1, 28

= 0, 85
Pr

1, 64

n
X 1, 28

= 0, 85
Pr

X 1, 64

n
X + 1, 28

= 0, 85
Pr

X 1, 28

n
X + 1, 64

= 0, 85
CAPTULO 4. INTERVALOS DE CONFIANA 72
Com os dados obtidos, o intervalo de conana assimtrico

55 1, 28
10

25
; 55 + 1, 28
10

25

= [52, 44 ; 57, 56
Captulo 5
Intervalos de Conana: Propores
- Amostra Grande
No captulo anterior, foram apresentadas as idias bsicas da estimao por intervalos
de conana. Para ilustrar o princpio utilizado na construo de tais intervalos, con-
sideramos a situao especial de estimao da mdia de uma populao normal com
varincia conhecida. Neste caso, a distribuio amostral da mdia amostral normal e
foi com base nessa distribuio amostral normal que obtivemos o intervalo de conana.
Neste captulo usaremos o teorema limite central, que garante que a distribuio
amostral da proporo amostral pode ser aproximada por uma distribuio normal,
desde que utilizemos amostras grandes.
5.1 Estimao de uma proporo populacional
O contexto de interesse o seguinte: temos uma populao em que cada elemento
classicado de acordo com a presena ou ausncia de determinada caracterstica. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :
X =

1 se elemento possui a caracterstica de interesse
0 se elemento no possui a caracaterstica de interesse
Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p). O parmetro p tambm
a proporo de elementos da populao que possuem a caractersitca de interesse. Em
geral, esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X
1
, X
2
, . . . , X
n
com reposio. Vimos que a proporo
b
P de elementos na amostra que
possuem a caracterstica de interesse, denida por
b
P =
S
n
n
=
X
1
+X
2
+ +X
n
n
(5.1)
73
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE74
um estimador no-viesado para p com varincia
p(1p)
n
. Mais precisamente,
E(
b
P) = p
V ar(
b
P) =
p(1 p)
n
Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central
nos diz que a distribuio de
b
P se aproxima de uma nornal com mdia p e varincia
p(1p)
n
. Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e, em geral,
essas condies so satisfeitas se n 30. Note que, com n = 30, np 5 sempre que
p 0, 1667; logo, essa indicao n 30 em geral funciona, desde que a caracterstica de
interesse no seja extremamente rarefeita na populao (em estatstica, usa-se o termo
populaes raras nos casos em que p muito pequeno). Caso haja suspeitas de que p
seja muito pequeno, deve-se aumentar o tamanho da amostra.
Resumindo, temos o seguinte resultado:
b
P N

p;
p(1 p)
n

Usando as propriedades da distribuio normal, temos que


b
P p
q
p(1p)
n
N(0; 1)
ou equivalentemente

n
b
P p
p
p(1 p)
N(0; 1) (5.2)
Vamos ver, agora, como usar esse resultado para obter um intervalo de conana para
a verdadeira proporo populacional p.
5.2 Intervalo de conana para a proporo popu-
lacional
O procedimento de construo do intervalo de conana para a proporo populacional
totalmente anlogo ao do intervalo de conana para a mdia de uma populao
normal com varincia conhecida, visto no captulo anterior. Assim, iremos usar a mesma
notao, a saber: vamos representar por z

a abscissa da curva normal padro que


deixa probabilidade (rea) acima dela. Como visto, temos o seguinte resultado, onde
Z N(0; 1) :
Pr(z
/2
Z z
/2
) = 1 (5.3)
Veja a Figura 5.1.
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE75
Figura 5.1: Denio do valor crtico z
/2
da N(0; 1)
Como o resultado (5.3) vale para qualquer varivel aleatria N(0; 1), podemos usar
(5.2) para obter
Pr

z
/2

n
b
P p
p
p(1 p)
z
/2
!
= 1
e, portanto
Pr

z
/2
r
p(1 p)
n

b
P p z
/2
r
p(1 p)
n
!
= 1 =
Pr

b
P z
/2
r
p(1 p)
n
p
b
P +z
/2
r
p(1 p)
n
!
= 1 =
Pr

b
P z
/2
r
p(1 p)
n
p
b
P +z
/2
r
p(1 p)
n
!
= 1
Como no caso da mdia, chegamos a uma expresso do seguinte tipo:
Pr

b
P p
b
P +

= 1
onde = z
/2
q
p(1p)
n
.
Tanto no caso da mdia de uma populao normal com varincia conhecida, quanto
no caso da proporo, a margem de erro tem a forma
= z
/2
EP(
b
)
onde EP(
b
) representa o erro padro do estimador em questo. No caso da mdia,
EP(
b
) = EP(X) =

n
(5.4)
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE76
e no caso da proporo,
EP(
b
) = EP(
b
P) =
r
p(1 p)
n
(5.5)
Analisando as expresses (5.4) e (5.5), podemos ver uma diferena fundamental: o
erro padro da proporo amostral depende do parmetro desconhecido p. Na prtica,
para construir o intervalo de conana, temos que substituir esse valor por alguma
estimativa.
Existem 3 abordagens possveis:
1. Usar a prpria proporo amostral observada; nesse caso, o intervalo de conana
seria
b
P z
/2
r
b p(1 b p)
n
2. Usar o intervalo de conana conservador, ou seja, usar o maior valor possvel
para EP(
b
P) para um dado n, o que equivale a obter o intervalo de conana com
o maior comprimento possvel. Como o comprimento do intervalo diretamente
proporcional a
p
p(1 p) ou equivalentemente, a p(1 p), vamos estudar o com-
portamento desta funo. Na Figura 5.2, temos o grco da funo p(1p) para
valores de p no intervalo de interesse [0, 1]. Vemos que o mximo dessa funo
ocorre quando p = 0, 5. Logo, na falta de uma estimativa melhor para p, podemos
tomar p = 0, 5, que fornece o maior intervalo de conana possvel, mantidas as
outras condies constantes.
Figura 5.2: Grco da funo p(1 p) para 0 p 1
Neste caso, o o intervalo de conana se torna
b
P z
/2
r
0, 5 0, 5
n
=
b
P z
/2
0, 5

n
3. Usar algum valor auxiliar b p
0
ou estimativa prvia, obtida de outras fontes ou de
uma amostra piloto:
d
EP

P
=
r
b p
0
(1 b p
0
)
n
(5.6)
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE77
Denio 5.1 Intervalo de conana para uma proporo populacional
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao representada
pela varivel X de Bernoulli com
Pr(X = 1) = p
Pr(X = 0) = 1 p
Se o tamanho n da amostra sucientemente grande [em geral, deve-se ter np 5 e
n(1 p) 5], ento o intervalo de conana aproximado para p de nvel de conana
1 dado por
"
b
P z
/2
r
b p
0
(1 b p
0
)
n
;
b
P +z
/2
r
b p
0
(1 b p
0
)
n
#
onde z
/2
abscissa da curva normal padro que deixa rea /2 acima dela e b p
0

alguma estimativa para o verdadeiro valor p.
Exemplo 5.1 Um gerente de produo deseja estimar a proporo de peas defeituosas
em uma de suas linhas de produo. Para isso, ele seleciona uma amostra aleatria
simples de 100 peas dessa linha de produo, obtendo 30 defeituosas. Determine o
intervalo de conana para a verdaeira proporo de peas defeituosas nessa linha de
produo, a um nvel de signicncia de 5%.
Soluo
O primeiro fato a observar que a amostra grande, o que nos permite usar a
aproximao normal. Com um nvel de signicncia de = 0, 05, o nvel de conana
1 = 0, 95 e da tabela da normal padro, obtemos que z
/2
= 1, 96. Como no temos
estimativa prvia da proporo de defeituosas p, temos que usar a proporo amostral
b p = 0, 30. Assim, a margem de erro
= 1, 96
r
0, 3 0, 7
100
= 0, 0898
e o intervalo de conana
[0, 30 0, 0898; 0, 30 + 0, 0898] = [0, 2102; 0, 3898]
5.3 Determinao do tamanho da amostra
Uma questo que se coloca freqentemente : qual o tamanho da amostra necessrio
para se estimar uma proporo p com uma margem de erro e nvel de conana 1?
Vamos analisar a expresso da margem de erro:
= z
/2
r
p(1 p)
n
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE78
Resolvendo para n, obtemos que

n = z
/2
p
p(1 p)

ou
n = [p(1 p)]

z
/2

2
Vemos, ento, que n diretamente proporcional a p(1p), ou seja, quanto maior p(1p),
maior ser o tamanho da amostra n. Na prtica, no conhecemos p (na verdade, esta-
mos querendo estimar esse parmetro). Ento, para determinar o tamanho de amostra
necessrio para uma margem de erro e um nvel de conana dados, podemos considerar
o pior caso, ou seja, podemos tomar o maior valor possvel de p(1 p) e calcular o
tamanho da amostra com base nesse pior caso, que ocorre quando p = 0, 5. claro
que essa uma escolha conservadora, que em alguns casos pode levar a um tamanho de
amostra desnecessariamente grande. Usando esta estimativa para p, obtemos que
n =

0, 5
z
/2

2
Exemplo 5.2 Para estudar a viabilidade de lanamento de um novo produto no mer-
cado, o gerente de uma grande empresa contrata uma rma de consultoria estatstica
para estudar a aceitao do produto entre os clientes potenciais. O gerente deseja obter
uma estimativa com um erro mximo de 1% com probabilidade 80% e pede ao consultor
estatstico que fornea o tamanho de amostra necessrio.
1. De posse das informaes dadas, o consultor calcula o tamanho da amostra necessrio
no pior cenrio. O que signica pior cenrio nesse caso? Qual o tamanho de
amostra obtido pelo consultor?
2. O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor
a realizar um estudo piloto com uma amostra de 100 pessoas para obter uma esti-
mativa da verdadeira proporo. O resultado desse estudo piloto uma estimativa
b p = 0, 76 de aceitao do novo produto. Com base nessa estimativa, o consultor
recalcula o tamanho da amostra necessrio. Qual esse tamanho?
3. Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma
proporo de 72% de clientes favorveis ao produto. Construa um intervalo de
conana para a verdadeira proporo com nvel de conana de 90%.
Soluo
1. O pior cenrio quando a populao est dividida meio-a-meio em suas prefern-
cias, ou seja, quando p = 0, 5. Com nvel de conana de 80%, obtemos z
0,10
=
1, 28. Nesse caso,
0, 01 = 1, 28
r
0, 5 0, 5
n
=
n =

1, 28
0, 01

2
0, 25 = 4096
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE79
2. Vamos agora utilizar b p = 0, 76 :
0, 01 = 1, 28
r
0, 76 0, 24
n
=
n =

1, 28
0, 01

2
0, 76 0, 24 = 2988, 4
ou seja, n = 2989
3. 1 = 0, 90 =z
0,05
= 1, 64
= 1, 64
r
0, 72 0, 28
2989
= 0, 0135
e o intervalo de conana
[0, 72 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335]
Exemplo 5.3 Uma associao de estudantes universitrios de uma grande universidade
deseja saber a opinio dos alunos sobre a proposta da reitoria sobre o preo do bandejo.
Para isso, seleciona aleatoriamente uma amostra de 200 estudantes, dos quais 120 so
favorveis proposta da reitoria.
1. Construa um intervalo de conana para a verdadeira proporo de alunos fa-
vorveis poltica da reitoria, ao nvel de signicncia de 2%.
2. Qual a margem de erro em (1)?
3. Qual dever ser o tamanho da amostra para se ter um erro de no mximo 5%,
com nvel de conana de 98%?
Soluo
1. Com nvel de signicncia de 2%, o nvel de conana 98%, o que resulta em
z
0,01
= 2, 33. Com 120 estudantes favorveis dentre 200, temos que b p =
120
200
= 0, 6.
Logo
= 2, 33
r
0, 6 0, 4
200
= 0, 0807
e o intervalo de conana
[0, 6 0, 0807; 0, 6 + 0, 0807] = [0, 5193; 0, 6807]
2. A margem de erro = 0, 0807.
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE80
3. Queremos, agora, reduzir a margem de erro para 5%, mantendo o mesmo nvel de
conana. Certamente teremos que aumentar o tamanho da amostra:
0, 05
2, 33
r
0, 6 0, 4
n
0, 05

n
2, 33
0, 05

p
0, 6 0, 4
n

2.33
0.05

2
0.6 0.4
n 522
Se usssemos o pior cenrio, isto , p = 0, 5 teramos que ter
n

2, 33
0, 05

2
0, 25
n 543
5.4 Resumo do Captulo
No estudo da proporo amostral, a populao descrita por uma varivel aleatria
de Bernoulli X tal que
Pr(X = 1) = p
Pr(X = 0) = 1 p
em que X = 1 representa a presena da caracterstica de interesse.
Dada uma aas X
1
, X
2
, . . . , X
n
de tal populao, a proporo
b
P de elementos na
amostra que possuem a caracterstica de interesse
b
P =
S
n
n
=
X
1
+X
2
+ +X
n
n
com as seguintes propriedades:
E(
b
P) = p
V ar(
b
P) =
p(1 p)
n
Pelo Teorema Limite Central, resulta que
b
P N

p;
p(1 p)
n

e essa aproximao s deve ser usada se np 5 e n(1 p) 5.


CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE81
A margem de erro do intervalo de conana para a proporo populacional
= z
/2
r
p(1 p)
n
= z
/2
EP(
b
P)
onde z
/2
o valor crtico da densidade normal padro que deixa probabilidade
/2 acima dele.
Como a margem de erro depende do parmetro a ser estimado, uma alternativa
trabalhar com alguma estimativa prvia ou com a prpria estimativa usada na
construo do intervalo de conana. Assim, o intervalo de conana estimado
para a proporo populacional p dado por
"
b p z
/2
r
b p
0
(1 b p
0
)
n
; b p +z
/2
r
b p
0
(1 b p
0
)
n
#
Na determinao do tamanho amostral necessrio para se obter determinada margem
de erro ao nvel de conana 1, podemos usar o pior cenrio, que corresponde a
uma populao dividida ao meio, isto , p = 0, 5. Neste caso, o tamanho amostral
dado por
n =

z
/2

2
p(1 p) =

z
/2
2

2
5.5 Exerccios
1. Construa um intervalo de conana para a proporo populacional para cada um
dos casos listados a seguir:
(a)
n = 600
= 2%.
Nmero de sucessos na amostra = 128
(b)
n = 1200
= 10%.
Nmero de sucessos na amostra = 710
estimativa prvia b p
0
= 55%
2. Uma amostra de 300 habitantes de uma grande cidade revelou que 180 desejavam a
uorao da gua. Encontre o intervalo de conana para a verdadeira proporo
dos que no desejam a uorao da gua para
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE82
(a) um nvel de signicncia de 5%;
(b) um nvel de conana de 96%.
3. Querendo estimar a proporo de peas defeituosas em uma linha de produo,
examinou-se uma amostra de 100 peas, encontrando-se 32 defeituosas. Sabe-
se que o estimador
b
P para esse tamanho de amostra tem desvio padro de 3%.
Calcule o intervalo de conana ao nvel de signicncia de 3%.
4. Em uma pesquisa de mercado, 57 das 150 pessoas entrevistadas armaram que
comprariam determinado produto sendo lanado por uma empresa. Essa amostra
suciente para se estimar a verdadeira proporo de futuros compradores, com
uma preciso de 0,08 e uma conana de 90%? Em caso negativo, calcule o
tamanho de amostra necessrio.
5. Uma amostra aleatria simples de 400 itens forneceu 100 itens correspondentes ao
evento Sucesso.
(a) Qual a estimativa pontual b p para a verdadeira proporo de Sucessos na
populao?
(b) Qual o erro padro estimado de b p?
(c) Calcule o intervalo de conana para a verdadeira proporo de Sucessos na
populao ao nvel de conana de 80%.
6. Em uma sondagem, uma estimativa preliminar de Sucessos em uma populao
de 0,35. Que tamanho deve ter uma amostra para fornecer um intervalo de
conana de 95% com uma margem de erro de 0,05?
5.6 Soluo dos Exerccios
1. .
(a) = 2% 1 = 98% z
0,01
= 2, 33
b p =
128
600
= 0, 213 3
= 2, 33
r
0, 213 3(1 0, 2133)
600
= 0, 03897
e o intervalo de conana
[0, 2133 0, 03897; 0, 2133 + 0, 03897] = [0, 17433; 0, 25227]
(b) = 10% 1 = 90% z
0,05
= 1, 64
b p =
710
1200
= 0, 591 67 =
= 1, 64
r
0, 55 0, 45
1200
= 0, 02355
CAPTULO5. INTERVALOS DECONFIANA: PROPORES - AMOSTRAGRANDE83
e o intervalo de conana
[0, 59167 0, 02355; 0, 59167 + 0, 02355] = [0, 56812; 0, 61522]
2. O problema pede a estimativa para a proporo dos que no querem a uorao;
logo, b p =
120
300
= 0, 4
(a) = 5% 1 = 95% z
0,025
= 1, 96
= 1, 96
r
0, 4 0, 6
300
= 0, 05544
e o intervalo de conana
[0, 4 0, 05544; 0, 4 + 0, 05544] = [0, 34456; 0, 045544]
(b) 1 = 96% z
0,02
= 2, 05
= 2, 05
r
0, 4 0, 6
300
= 0, 05798
e o intervalo de conana
[0, 4 0, 05798; 0, 4 + 0, 05798] = [0, 34202; 0, 045798]
3. dado que n = 100, b p = 0, 32 e EP(
b
P) = 0, 03.
= 3% z
0,015
= 2, 17
= 2, 17 0, 03 = 0, 0651
[0, 32 0, 0651; 0, 32 + 0, 0651] = [0, 2549; 0, 3851]
4. b p =
57
150
= 0, 38. Para uma margem de erro de 0,08 e um nvel de conana de
90%, o tamanho da amostra teria que ser
n

1, 64
0, 08

2
0, 38 0, 62 = 99, 011
Como o tamanho da amostra 150, essa amostra suciente.
5. .
(a) b p =
100
400
= 0, 25
(b) EP(
b
P) =
q
0,250,75
400
= 0, 02651
(c) 1 = 0, 80 z
0,1
= 1, 28
[0, 25 1, 28 0, 021651; 0, 25 + 1, 28 0, 021651] = [0, 22229; 0, 27771]
6. b p
0
= 0, 35
n

1, 96
0, 05

2
0, 35 0, 65 = 349, 59
Logo, n 350
Captulo 6
Intervalo de Conana: Mdia da
N(;
2
),
2
Desconhecida
Neste captulo voc completar seu estudo bsico sobre intervalos de conana para a
mdia de uma populao, analisando o problema de estimao da mdia de uma popu-
lao normal quando no se conhece a varincia desta populao. Voc ver que, neste
caso, necessrio estimar essa varincia e isso introduz mais uma fonte de variabilidade
nas nossas estimativas: com uma nica amostra, temos que estimar a mdia e a var-
incia da populao. O procedimento simples e anlogo aos casos anteriores vistos
nos captulos amteriores; o que muda a distribuio amostral do estimador X. Em
vez de usarmos a distribuio normal para determinar os valores crticos, usaremos a
distribuio t de Student.
Voc ver os seguintes conceitos:
estimao da varincia de uma populao
distribuio amostral da mdia amostral de uma populao normal com varincia
desconhecida
intervalo de conana para a mdia de uma populao normal com varincia de-
sconhecida
6.1 Idias bsicas
Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia
2
: X N(;
2
). Nosso interesse estimar a mdia a partir de uma amostra
aleatria simples X
1
, X
2
, . . . , X
n
. Como visto anteriormente, a distribuio amostral de
X normal com mdia e varincia

2
n
, ou seja
X N(;
2
) =X N

;

2
n

84
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA85
Assim, se o valor de conhecido, resulta que
Z =

n
X

N(0; 1) (6.1)
e esse resultado foi utilizado na construo do intervalo de conana para a mdia de
uma populao normal com varincia conhecida, fornecendo o seguinte intervalo:

X z
/2

n
; X +z
/2

Suponhamos, agora, que a varincia


2
no seja conhecida. Neste caso, temos que
estim-la com os dados amostrais. Foi demonstrado que
S
2
=
1
n 1
n
P
i=1
(X
i
X)
2
=
1
n 1

n
P
i=1
X
2
i
nX
2

um estimador no-viesado de
2
. Isso signica que, se calculssemos o valor de S
2
para
cada uma das possveis amostras aleatrias simples de tamanho n, a mdia desses valores
seria igual a
2
. Dessa forma, S
2
um bom estimador de
2
e podemos us-lo como
uma estimativa pontual de
2
. Como o desvio padro a raiz quadrada da varincia,
natural perguntar: S um bom estimador de , ou seja, S um estimador no-viesado
de ? A resposta NO, mas, para grandes amostras, o vis pequeno, de modo que,
em geral, usa-se S como estimador de .
Sendo assim, natural pensarmos em substituir o valor de por S na expresso
(6.1) e utilizarmos a estatstica
T =

n
X
S
na construo de intervalos de conana para . Isso exatamente o que faremos, mas,
ao introduzirmos S no lugar de , a distribuio amostral de T deixa de ser normal e
passa a ser uma distribuio t de Student.
A distribuio t de Student (ou simplesmente distribuio t) foi obtida por William
Gosset (1876-1937), que trabalhava na Cervejaria Guinness na Irlanda. Como a cerve-
jaria no permitia a publicao de resultados de pesquisa obtidos por seus funcionrios,
Gosset publicou, sob o pseudnimo de Student, o artigo The Probable Error of a Mean
na revista Biometrika (vol. 6, no. 1).
6.2 Intervalo de conana para a mdia de uma po-
pulao normal com varincia desconhecida
O intervalo de conana para a mdia de uma populao normal com varincia descon-
hecida obtido com base no seguinte resultado:
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA86
Teorema 6.1 Se X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao
X N (;
2
) , ento
T =

n
X
S
t(n 1) (6.2)
onde S
2
=
1
n1
n
P
i=1
(X
i
X)
2
=
1
n1

n
P
i=1
X
2
i
nX
2

.
O nmero de graus de liberdade gl = n 1 resulta do fato de que, na soma que
dene S
2
, h apenas n1 parcelas independentes, ou seja, dados S
2
e n1 das parcelas
(X
i
X)
2
, a nsima parcela ca automaticamente determinada.
Usando a simetria da densidade t, temos o seguinte resultado:
Pr

t
n; /2
t(n) t
n; /2

= 1 (6.3)
Veja a Figura 6.1.
Figura 6.1: Valores crticos da tStudent para construo do intervalo de conana da
mdia de uma normal com varincia desconhecida
Como o resultado (6.3) vale para qualquer distribuio t, usando o resultado (6.2)
obtemos:
Pr

t
n1; /2

n
X
S
t
n1; /2

= 1 =
Pr

t
n1; /2
S

n
X t
n1; /2
S

= 1 =
Pr

X t
n1; /2
S

n
X +t
n1; /2
S

= 1
Essa ltima expresso o intervalo de conana para a mdia de uma populao
normal com varincia desconhecida.
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA87
Denio 6.1 Intervalo de conana para a mdia da N(;
2
)
2
descon-
hecida
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao X N (;
2
) .
O intervalo de conana para de nvel de conana 1

X t
n1; /2
S

n
; X +t
n1; /2
S

onde t
n1; /2
o valor crtico da distribuio tStudent com n 1 graus de liberdade
que deixa rea /2 acima dele.
6.3 Margem de erro
Note, mais uma vez, a forma do intervalo de conana:
X
onde a margem de erro , agora, denida em termos do valor crtico da distribuio t
e do erro padro estimado de X :
= t
n1; /2
S

n
.
= t
n1; /2
d
EP(X) (6.4)
onde
d
EP(X) =
S

n
(6.5)
6.4 Amostras grandes
Vimos que, para populaes normais, a distribuio exata da estatstica T =

n
X
S
t(n 1). Mas vimos tambm que, quando o nmero de graus de liberdade grande,
as diferenas entre as distribuies t e N(0; 1) tornam-se desprezveis.
Por outro lado, se a populao no normal, mas tem mdia e varincia
2
, o
teorema limite central nos diz que a distribuio de

n
X

se aproxima de uma
N(0; 1) medida que n . Pode-se mostrar que esse resultado continua valendo se
substitumos por seu estimador S.
A concluso dessas duas observaes a seguinte:
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA88
Denio 6.2 Intervalo de conana para a mdia - Amostras grandes
Dada uma amostra aleatria simples X
1
, X
2
, . . . , X
n
de uma populao X com mdia
e varincia
2
, ento

n
X
S
N(0; 1)
para n sucientemente grande. Nesse caso, o intervalo de conana aproximado de
nvel de conana 1 para

X z
/2
S

n
; X +z
/2
S

J
Exemplo 6.1 De uma populao normal com mdia e varincia desconhecidas, extrai-
se uma amostra de tamanho 15 obtendo-se x = 12 e s
2
= 49. Obtenha um intervalo de
conana para a verdadeira mdia populacional, utilizando o nvel de conana de 95%.
Soluo
Os seguintes requisitos para o IC para so satisfeitos: a populao normal e
a amostra pequena. Dessa forma, temos que usar a distribuio t com n 1 = 14
graus de liberdade. Como o nvel de conana de 95%, em cada cauda da distribuio
temos que ter 2,5%. Assim, devemos procurar a abscissa t
14;0,025
procurando na linha
correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,025.
Encontramos
t
14;0,025
= 2, 145
A margem de erro
= 2, 145
7

15
= 3, 8769
e o intervalo de conana
[12 3, 8769; 12 + 3, 8769] = [8, 1231; 15, 8769]
Exemplo 6.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
Construa o intervalo de conana para a mdia populacional, com nvel de signicncia
de 10%.
Soluo
Como antes, temos uma amostra pequena de uma populao normal; logo, temos
que usar a distribuio t-Student. Como n = 9, gl = n 1 = 8.
A mdia amostral
x =
P
x
i
n
=
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
9
=
78
9
= 8, 6667
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA89
e a varincia amostral
S
2
=
1
n 1
P
(x
i
x)
2
=
1
n 1
"
P
x
2
i

(
P
x
i
)
2
n
#
=
=
1
8

6
2
+ 6
2
+ 7
2
+ 8
2
+ 9
2
+ 9
2
+ 10
2
+ 11
2
+ 12
2

78
2
9

=
1
8

712
6084
9

=
36
8
= 4, 5
Como o nvel de signicncia = 10%, o nvel de conana 1 = 90%. Em
cauda da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na
linha correspondente a 8 graus de liberdade a abscissa relativa rea superior de 0,05.
Obtemos t
8;0,05
= 1, 860. A margem de erro
= 1, 860
r
4, 5
8
= 1, 395
e o intervalo de conana
[8, 6667 1, 395; 8, 6667 + 1, 395] = [7, 2717; 10, 0617]
Exemplo 6.3 A partir de uma amostra aleatria simples de tamanho n = 100, os
seguintes valores foram obtidos: x = 12, 36 e s
2
= 132, 56. Obtenha um intervalo de
conana de nvel de conana 90% para a mdia populacional .
Soluo
Como o tamanho amostral grande, podemos usar a aproximao normal. Como
1 = 0, 90, em cada cauda temos que ter 5% e,assim, devemos procurar no corpo da
tabela da distribuio normal o valor mais prximo de 0,45. Resulta que z
0,05
= 1, 64, o
que nos d a seguinte margem de erro:
= 1.64
r
132.56
100
= 1, 8882
O intervalo de conana de 90% de conana
[12.36 1.8882 ; 12.36 + 1.8882] = [10.472 ; 14.248]
6.5 Resumo comparativo
Para nalizar a parte relativa construo de intervalos de conana para mdias, vamos
resumir os resultados vistos nos ltimos captulos. importante notar que existem
procedimentos para construo de intervalos de conana para outros parmetros, tal
como a varincia de uma populao normal, diferena entre mdias, etc. O procedimento
anlogo; o que muda a distribuio amostral.
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA90
6.5.1 IC para a mdia de populaes normais
O contexto bsico analisado o seguinte: de uma populao normal extrai-se uma
amostra aleatria simples X
1
, X
2
, . . . , X
n
com o objetivo de se obter uma estimativa
intervalar para a mdia . Foram consideradas duas situaes: (i)
2
conhecida e (ii)
2
desconhecida. Em ambos os casos, a expresso para o intervalo de conana de nvel de
conana 1
X
com a margem de erro assumindo a forma geral
=
/2
EP(X)
onde
/2
representa o valor crtico de alguma distribuio e EP(X) o erro padro da
mdia amostral.

2
conhecida

/2
= z
/2
N(0; 1)
EP(X) =

2
desconhecida

/2
= t
n1; /2
t(n 1)
EP(X) =
S

n
Quando n > 31, pode-se usar z
/2
no lugar de t
n1; /2
.
6.5.2 IC para uma proporo
O contexto bsico considerado foi o seguinte: de uma populao representada por uma
varivel aleatria X Bern(p) extrai-se uma amostra aleatria simples X
1
, X
2
, . . . , X
n
com o objetivo de se estimar a proporo populacional p dos elementos que possuem
determinada caracterstica de interesse. Se a amostra sucientemente grande (em
geral, n > 30),o intervalo de conana para p tem a forma
b
P
com a margem de erro assumindo a forma geral
= z
/2
EP(
b
P)
com
EP(
b
P) =
r
b p
0
(1 b p
0
)
n
Aqui, b p
0
uma estimativa prvia da proporo populacional p ou a prpria proporo
amostral b p obtida a partir da amostra ou ainda p
0
= 0, 5 para o intervalo conservador.
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA91
6.5.3 Intervalo de conana para a mdia de populaes no-
normais - amostra grande
Dada uma aas de tamanho grande de uma populao qualquer com mdia , o intervalo
de conana de nvel de conana aproximado 1
X z
/2
S

n
Esses resultados esto resumidos na Tabela 6.1 e na Figura 6.2.
Tabela 6.1: Resumo Comparativo dos Resultados sobre Intervalos de Conana
Parmetro de Interesse Estatstica Amostral Margem I.C.
e sua Distribuio de erro
Mdia da
2
conhecida

n
X

N(0; 1) = z
/2

n
populao X
N(;
2
)

2
desconhecida

n
X
S
t(n 1) = t
n1; /2
S

n
Proporo
[mdia Bern(p)]

n
b
P p
p
p(1 p)
N(0; 1) = z
/2
q
p
0
(1 p
0
)
n
b
P
Mdia de uma (amostra grande)

n
X
S
N(0; 1) = z
/2
S

n
X
populao X
6.6 Exerccios
1. Para uma distribuio t de Student com 12 graus de liberdade, encontre a proba-
bilidade (rea) de cada uma das seguintes regies (esboce um grco para auxiliar
na soluo do exerccio):
(a) esquerda de 1, 782;
(b) direita de 1, 356;
(c) direita de 2, 681;
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA92
SIM NO
SIM NO SIM NO
populao
normal?
varincia
conhecida?
amostra
grande?
Consulte umestatstico!
No foram estudados
mtodos apropriados
para esta situao!
n
S
t
n t
S
X
n
n 2 / ; 1
) 1 ( ~

n
z
N
X
n



2 /
) 1 ; 0 ( ~
=

n
s
z
N
S
X
n
2 /
) 1 ; 0 (

n
p p
P P S
P X
p Bern X
) 1 (
) 1 (

) ( ~
0 0

=
=

Figura 6.2: Resumo de Intervalos de Conana para a Mdia


CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA93
(d) entre 1, 083 e 3, 055;
(e) entre 1, 356 e 2, 179.
2. Encontre os seguintes valores crticos da distribuio t de Student:
(a) t
15;0,05
(b) t
18;0,90
(c) t
25;0,975
3. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de
treinamento esto listados abaixo. razovel supor, nesse caso, que essa seja uma
amostra aleatria simples de uma populao normal, ou seja, razovel supor que
a populao de todos os tempos de funcionrios submetidos a esse treinamento seja
aproximadamente normal. Obtenha o intervalo de conana de nvel de conana
de 95% para o tempo mdio populacional.
52 44 55 44 45 59 50 54
62 46 54 58 60 62 63
4. Uma amostra aleatria simples de uma populao normal apresenta as seguintes
caractersticas:
n = 25 x = 500 s
2
= 900
Construa um intervalo de conana de nvel de conana de 98% para a mdia da
populao.
5. Em uma fbrica, uma amostra de 30 parafusos apresentou os seguintes dimetros
(em mm):
10 13 14 11 13 14 11 13 14 15
12 14 15 13 14 12 12 11 15 16
13 15 14 14 15 15 16 12 10 15
Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo
de conana para o dimetro mdio de todos os parafusos produzidos nessa fbrica,
usando o nvel de signicncia de 2%. Para facilitar a soluo do exerccio, voc
pode usar os seguintes resultados:
30
P
i=1
x
i
= 401
30
P
i=1
x
2
i
= 5443
6. Repita o exerccio anterior com os seguintes dados de uma amostra de 100 para-
fusos:
x = 13, 78 s
2
= 2, 865
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA94
6.7 Soluo dos Exerccios
1. Temos que usar a Tabela 2, concentrando-nos na linha correspondente a 12 graus
de liberdade. Os valores dados podem ser encontrados no corpo da tabela nesta
linha.
(a) direita de 1, 782 temos uma rea de 0, 05; logo, esquerda de 1, 782 a rea
de 0, 95.
(b) A rea abaixo de 1, 356 igual rea acima de 1, 356, que de 0, 10. Logo,
esquerda de 1, 356 temos uma rea de 0, 10 e direita de 1, 356 temos
uma rea de 0, 90.
(c) direita de 2, 681 a rea 0, 01.
(d) direita de 1, 083 a rea 0, 15; direita de 3, 055 a rea de 0, 005. Logo,
a rea entre 1, 083 e 3, 055 0, 15 0, 005 = 0, 145 .
(e) Como visto no item (b), a rea direita de 1, 356 0, 90. A rea direita
de 2, 179 0, 025. Logo, a rea entre 1, 356 e 2, 179 0, 90 0, 025 = 0, 875
2. .
(a) t
15;0,05
= 1, 753
(b) O primeiro fato a observar que t
18;0,90
tem que ser negativo, pois direita
dele a rea de 0, 90 > 0, 50. Se direita a rea 0,90, a rea esquerda
0,10. Pela simetria da curva, t
18;0,90
= t
18;0,10
. Veja a Figura 6.3. Resulta
que
t
18;0,90
= t
18;0,10
= 1, 33
Figura 6.3: Soluo do Exerccio 2
(c) Analogamente encontra-se que t
25;0,975
= 2, 060
CAPTULO6. INTERVALODECONFIANA: MDIADAN(;
2
),
2
DESCONHECIDA95
3. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student
n = 15 1 = 0, 95 t
14;0,025
= 2, 145
x =
808
15
= 53, 8667
s
2
=
1
14

44176
808
2
15

= 46, 5524
= 2, 145
r
46, 5524
15
= 3, 7788
O intervalo de conana
[53, 8667 3, 7788; 53, 8667 + 3, 7788] = [50, 088; 57, 6455]
4. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student
t
24;0,01
= 2, 492
"
500 2, 492
r
900
25
; 500 + 2, 492
r
900
25
#
= [485, 05; 514, 95]
5. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student
= 2% t
29;0,01
= 2, 462
x =
401
30
= 13, 367
s
2
=
1
29

5443
401
2
30

= 2, 861
O intervalo de conana
"
13, 367 2, 462
r
2, 861
30
; 13, 367 + 2, 462
r
2, 861
30
#
= [12, 607; 14, 127]
6. Como n grande, podemos usar a abscissa da distribuio normal z
0,01
= 2, 33 (o
valor exato t
99;0,01
= 2, 3646),
"
13, 78 2, 33
r
2, 865
100
; 13, 78 + 2, 33
r
2, 865
100
#
= [13, 386; 14, 174]
Captulo 7
Intervalo de Conana: Varincia
da N(;
2
)
Neste captulo voc completar seu estudo bsico sobre intervalos de conana, anal-
isando o problema de estimao da varincia de uma populao normal. Como antes,
este intervalo se basear na distribuio amostral de um estimador no-viesado para

2
, a saber, S
2
. Como a varincia um nmero no negativo, essa distribuio no
simtrica e est denida apenas para valores no-negativos.
Voc ver os seguintes conceitos:
estimao da varincia de uma populao
intervalo de conana para a varincia de uma populao normal
7.1 Idias bsicas
Ocontexto subjacente o seguinte: a partir de uma amostra aleatria simples X
1
, X
2
, . . . , X
n
retirada de uma populao normal com mdia e varincia
2
queremos construir um
intervalo de conana para
2
. A hiptese de normalidade da populao fundamental
aqui. Assim como no caso da mdia, temos que usar a distribuio amostral de algum
estimador. Neste caso, o estimador S
2
e o resultado importate o seguinte:
(n 1)S
2

2
tem distribuio qui-quadrado com n 1 graus de liberdade:
(n 1)S
2

2

2
(n 1) (7.1)
7.2 Intervalo de conana para a varincia de uma
populao normal
Como no caso da distribuio tStudent, vamos denir o valor crtico
2
n;
como a
abscissa da distribuio qui-quadrado com n graus de liberdade que deixa probabilidade
acima dela. Veja a Figura 7.1.
96
CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(;
2
) 97
Figura 7.1: Valor crtico da distribuio qui-quadrado com n graus de liberdade
Com essa denio, podemos ver que a abscissa
2
n;/2
deixa probabilidade /2 acima
dela [veja Figura 7.2-(a)] e a abscissa
2
n;1/2
deixa probabilidade /2 abaixo dela
[veja Figura 7.2-(b)]. Logo,
Pr

2
n;1/2

2
(n)
2
n;/2

= 1 (7.2)
Como o resultado (7.2) vale para qualquer distribuio qui-quadrado, podemos usar
o resultado (7.1) para escrever
Pr

2
n1;1/2

(n 1)S
2

2

2
n1;/2

= 1
Da resulta que
Pr

2
n1;1/2
(n 1)S
2

1

2


2
n1;/2
(n 1)S
2
!
= 1 =
Pr

(n 1)S
2

2
n1;/2

2

(n 1)S
2

2
n1;1/2
!
= 1
e esse o intervalo de conana para a varincia de uma populao normal.
Denio 7.1 Intervalo de conana para a varincia de uma populao nor-
mal
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao X N (;
2
) .
O intervalo de conana para
2
de nvel de conana 1
"
(n 1)S
2

2
n1;/2
;
(n 1)S
2

2
n1;1/2
#
onde
2
n;
representa o valor crtico da distribuio qui-quadrado com n graus de liberdade
que deixa probabilidade acima dele.
CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(;
2
) 98
Figura 7.2: Valores crticos da distribuio qui-quadrado para construo de intervalos
de conana
CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(;
2
) 99
Note que o intervalo de conana construdo de tal forma a dividir o nvel de
signicncia em duas partes iguais, mesmo a distribuio no sendo simtrica.
Exemplo 7.1 De uma populao normal com mdia e varincia desconhecidas, extrai-
se uma amostra de tamanho 15 obtendo-se x = 12 e s
2
= 49. Obtenha um intervalo de
conana para a varincia populacional, utilizando o nvel de conana de 95%.
Soluo
O requisito para o IC para
2
satisfeito, uma vez que a populao normal. Temos
que usar a distribuio
2
com n1 = 14 graus de liberdade. Como o nvel de conana
de 95%, em cada cauda da distribuio temos que ter 2,5%. Assim, para a cauda
superior, devemos procurar a abscissa
2
14;0,025
procurando na linha correspondente a 14
graus de liberdade e na coluna correspondente rea de 0,025. Encontramos

2
14;0,025
= 26, 119
Para a cauda inferior, devemos procurar a abscissa
2
14;0,975
procurando na linha corre-
spondente a 14 graus de liberdade e na coluna correspondente rea de 0,975. Encon-
tramos

2
14;0,975
= 5, 629
O intervalo de conana

14 49
26, 119
;
14 49
5, 629

= [26, 26; 121, 87]


Exemplo 7.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
Construa o intervalo de conana para a mdia populacional, com nvel de signicncia
de 10%.
Soluo
Temos uma amostra pequena de uma populao normal; logo, podemos usar a dis-
tribuio
2
. Como n = 9, gl = n 1 = 8.
A mdia amostral
x =
P
x
i
n
=
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
9
=
78
9
= 8, 6667
e a varincia amostral
S
2
=
1
n 1
P
(x
i
x)
2
=
1
n 1
"
P
x
2
i

(
P
x
i
)
2
n
#
=
=
1
8

6
2
+ 6
2
+ 7
2
+ 8
2
+ 9
2
+ 9
2
+ 10
2
+ 11
2
+ 12
2

78
2
9

=
1
8

712
6084
9

=
36
8
= 4, 5
CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(;
2
) 100
Como o nvel de signicncia = 10%, o nvel de conana 1 = 90%. Em cauda
da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na linha
correspondente a 8 graus de liberdade as abscissas relativas rea superior de 0,05 e de
0,95. Obtemos
2
8;0,05
= 15, 507 e
2
8;0,95
= 2, 733. O intervalo de conana

7 4, 5
15, 507
;
7 4, 5
2, 733

= [2, 03; 11, 53]


7.3 Exerccios
1. Seja X uma varivel aleatria com distribuio qui-quadrado com 17 graus de
liberdade. Encontre o valor da abscissa k tal que:
(a) Pr(X > k) = 0, 2
(b) Pr(X < k) = 0, 2
(c) Pr(X < k) = 0, 90
2. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de
treinamento esto listados abaixo. razovel supor, nesse caso, que essa seja uma
amostra aleatria simples de uma populao normal, ou seja, razovel supor que
a populao de todos os tempos de funcionrios submetidos a esse treinamento seja
aproximadamente normal. Obtenha o intervalo de conana de nvel de conana
de 95% para a varincia populacional.
52 44 55 44 45 59 50 54
62 46 54 58 60 62 63
3. Uma amostra aleatria simples de uma populao normal apresenta as seguintes
caractersticas:
n = 25 x = 500 s
2
= 900
Construa um intervalo de conana de nvel de conana de 98% para a mdia da
populao.
4. Em uma fbrica, uma amostra de 30 parafusos apresentou os seguintes dimetros
(em mm):
10 13 14 11 13 14 11 13 14 15
12 14 15 13 14 12 12 11 15 16
13 15 14 14 15 15 16 12 10 15
Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo
de conana para o dimetro mdio de todos os parafusos produzidos nessa fbrica,
usando o nvel de signicncia de 2%. Para facilitar a soluo do exerccio, voc
pode usar os seguintes resultados:
30
P
i=1
x
i
= 401
30
P
i=1
x
2
i
= 5443
CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(;
2
) 101
7.4 Soluo dos Exerccios
1. Na linha correspondente a 17 graus de liberdade, devemser consultadas as seguintes
colunas:
(a) = 0, 2 =k = 21, 615
(b) = 0, 8 =k = 12, 002
(c) = 0, 1 =k = 24, 769
2. Contexto: Populao normal
n = 15 1 = 0, 95


2
14;0,025
= 26, 119

2
14;0,975
= 5, 629
x =
808
15
= 53, 8667
s
2
=
1
14

44176
808
2
15

= 46, 5524
Intervalo de conana:

14 46, 5524
26, 119
;
14 46, 5524
5, 629

= [24, 95; 1157, 78]


3. Contexto: Populao normal
n = 25 s
2
= 900 1 = 0, 98


2
24;0,01
= 42, 980

2
24;0,99
= 10, 856
Intervalo de conana:

24 900
42, 98
;
24 900
10, 856

= [502, 56; 1989, 68]


4. Contexto: Populao normal
n = 30 = 2% 1 = 0, 98


2
29;0,01
= 49, 588

2
29;0,99
= 14, 258
x =
401
30
= 13, 367
s
2
=
1
29

5443
401
2
30

= 2, 861
Intervalo de conana:

29 2, 861
49, 588
;
29 2, 861
14, 258

= [1, 67; 5, 82]


Captulo 8
Testes de Hipteses
Na teoria de estimao, vimos que possvel, atravs de estatsticas amostrais ade-
quadas, estimar parmetros de uma populao, dentro de um certo intervalo de con-
ana. Nos testes de hipteses, ao invs de se construir um intervalo de conana no
qual se espera que o parmetro da populao esteja contido, testa-se a validade de uma
armao sobre um parmetro da populao. Ento, num teste de hiptese, procura-
se tomar decises a respeito de uma populao, com base em informaes obtidas de
amostras desta mesma populao.
Neste captulo voc aprender os seguintes conceitos:
hipteses nula e alternativa
erros tipo I e II
estatstica de teste
regra de deciso
regio crtica
funo caracterstica de operao
poder do teste
8.1 Noes bsicas
Vamos trabalhar com alguns exemplos para ilustrar os conceitos bsicos que precisamos
para construir testes de hipteses estatsticos.
8.1.1 Exemplo 1
Um detetive de polcia encarregado da investigao de um crime. Baseado nas evidn-
cias encontradas, o detetive suspeita inicialmente do mordomo e precisa decidir, ento,
se prende ou libera o mordomo. Por outro lado, o mordomo pode ser culpado ou in-
ocente. Assim, h 4 possibilidades, resumidas no Quadro 1, que podem ocorrer quando
o detetive tomar sua deciso:
102
CAPTULO 8. TESTES DE HIPTESES 103
prender o mordomo, quando, na verdade, o mordomo o assassino deciso
correta
prender o mordomo, quando, na verdade, o mordomo inocente deciso errada
liberar o mordomo, quando, na verdade, o mordomo o assassino deciso
errada
liberar o mordomo, quando, na verdade, o mordomo inocente deciso correta
Quadro 1
Possibilidades sobre a deciso do detetive
Detetive
Prende Libera
Mordomo Inocente Errado OK
Culpado OK Errado
Se o problema do detetive fosse de origem estatstica, a primeira providncia que
ele teria que tomar seria formular uma hiptese nula, que uma armao sobre um
parmetro da populao. A hiptese nula, normalmente designada por H
0
, uma
armao que estabelecida com o objetivo de ser testada; ela pode ser rejeitada ou
no. Normalmente, a hiptese nula formulada de tal forma que o objetivo rejeit-la.
No exemplo, como o detetive suspeita do mordomo, a formulao mais adequada
H
0
: mordomo inocente
Se as evidncias so sucientes para se rejeitar a hiptese nula, ento aceita-se a
hiptese alternativa, normalmente designada por H
1
, que ser aceita se a hiptese nula
for rejeitada. No exemplo, como s existem 2 possibilidades, temos que
H
1
: mordomo culpado
Observe que o mtodo aplicado para se testar a hiptese nula. A hiptese alter-
nativa ser aceita se e somente se a hiptese nula for rejeitada, ou seja, a estratgia
tomar uma deciso com relao hiptese nula.
Depois de examinar todas as evidncias, o detetive deve rejeitar H
0
(e concluir que
o mordomo culpado) ou no rejeitar H
0
(e concluir que o mordomo inocente). Note
que as concluses so sempre estabelecidas em termos da hiptese nula. Como j visto,
o detetive pode cometer dois tipos de erro:
erro tipo I: rejeitar a hiptese nula quando verdadeira;
erro tipo II: no rejeitar a hiptese nula quando falsa.
No Quadro 2 a seguir temos a ilustrao dessas situaes.
CAPTULO 8. TESTES DE HIPTESES 104
Quadro 2
Possibilidades para a deciso
Deciso
Rejeitar H
0
No rejeitar H
0
Possibi- H
0
verdadeira Erro I OK
lidades H
0
falsa OK Erro II
Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hiptese nula.
No exemplo, isso signica que o detetive nunca cometeria o erro de condenar um homem
inocente. De forma anloga, o erro tipo II pode ser evitado se sempre rejeitarmos a
hiptese nula e, no exemplo, o detetive nunca liberaria um assassino.
A teoria estatstica de testes de hipteses trata de regras de deciso, baseadas em
probabilidades, que tentam balancear esses dois tipos de erro.
8.1.2 Exemplo 2
Uma empresa compra anis de vedao de dois fabricantes. Segundo informaes dos
fabricantes, os anis do fabricante 1 tm dimetro mdio de 14 cm com desvio padro
de 1,2 cm e os anis do fabricante 2 tm dimetro mdio de 15 cm com desvio padro de
2,0 cm. Ambos os processos de produo geram anis com dimetros cuja distribuio
aproximadamente normal.
Uma caixa com 16 anis sem identicao encontrada pelo gerente do almoxarifado.
Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer uma
medio dos anis e basear sua deciso no dimetro mdio da amostra: se o dimetro
mdio for maior que 14,5 cm, ele identicar a caixa como oriunda do fabricante 2; caso
contrrio, ele identicar a caixa como oriunda do fabricante 1.
Esse um problema tpico de deciso empresarial. Vamos analisar esse processo de-
cisrio sob o ponto de vista estatstico, estudando os possveis erros e suas probabilidades
de ocorrncia.
Uma primeira observao que existem apenas duas possibilidades para a origem
dos anis de vedao. Como ele suspeita que a caixa venha do fabricante 1, vamos
estabelecer a hiptese nula de forma que o resultado desejado seja rejeit-la. Denimos,
ento, a hiptese nula como sendo
H
0
: anis vm do fabricante 2
e, obviamente, a hiptese alternativa ser
H
1
: anis vm do fabricante 1
Se denotamos por X a varivel aleatria que representa o dimetro dos anis, essas
hipteses se traduzem como
H
0
: X N(15; 2, 0
2
)
H
1
: X N(14; 1, 2
2
)
CAPTULO 8. TESTES DE HIPTESES 105
A regra de deciso do gerente baseada na mdia amostral observada para os 16
anis encontrados. Como dito, nossa deciso deve ser expressa sempre em termos de
H
0
. Logo, a regra de deciso
x 14, 5 = rejeito H
0
x > 14, 5 = no rejeito H
0
Os erros associados a essa regra de deciso so:
Erro I: rejeitar H
0
quando H
0
verdadeira
Erro II: no rejeitar H
0
quando H
0
falsa
Se H
0
verdadeira, a amostra vem de uma populao normal com mdia 15 e desvio
padro 2,0. Nesse caso, a mdia amostral com base em amostra de tamanho 16
tambm normal com mdia 15 e desvio padro
2,0

16
. Se H
0
falsa, a amostra vem de
uma populao normal com mdia 14 e desvio padro 1,2. Nesse caso, a mdia amostral
com base em amostra de tamanho 16 tambm normal com mdia 14 e desvio padro
1,2

16
.
Ento, as probabilidades associadas aos erros podem ser expressas em termos de
probabilidade condicional:
Pr(Erro I) = Pr

X 14, 5|X N

15;
2, 0
2
16

Pr(Erro II) = Pr

X > 14, 5|X N



14;
1, 2
2
16

Na Figura 8.1 a probabilidade associada ao erro I corresponde rea sombreada de


cinza claro, enquanto a rea sombreada de cinza escuro corresponde probabilidade do
erro tipo II.
Vamos calcular essas probabilidades. Em geral, a probabilidade do erro tipo I
denotada por e a probabilidade do erro tipo II por . Assim,
= Pr(Erro I) =
= Pr

X 14, 5|X N

15;
2, 0
2
16

= Pr

Z
14, 5 15
2
4

= Pr(Z 1, 00)
= Pr(Z 1, 00)
= 0, 5 tab(1, 00) = 0, 5 0, 34134
= 0, 15866
CAPTULO 8. TESTES DE HIPTESES 106
Figura 8.1: Probabilidades dos erros I e II para o Exemplo 2
= Pr(Erro II) =
= Pr

X > 14, 5|X N



14;
1, 2
2
16

= Pr

Z >
14, 5 14
1.2
4

= Pr(Z > 1, 67)


= 0, 5 tab(1, 67) = 0, 04746
importante voc entender a sutileza da notao. A deciso do gerente tem que
ser tomada em funo do resultado amostral observado; assim, usamos a notao x.
Lembre-se que usamos letras minsculas para representar o valor observado de uma
varivel aleatria. Quando falamos da probabilidade do erro ou mesmo da regra de
deciso em termos gerais, estamos considerando o procedimento decisrio geral. Como
esse procedimento depende da amostra sorteada, temos que expressar as probabilidades
dos erros e a regra de deciso levando em conta as possveis amostras, ou seja, temos que
levar em conta a varivel aleatria X que descreve a mdia amostral de uma possvel
amostra aleatria simples de tamanho n.
No exemplo, a regra de deciso geral : se X > 14, 5 o gerente classica como
produo do fabricante 2. Assim, se a caixa em questo tiver uma mdia de, por
exemplo, 14,4 o gerente classicar a caixa como produzida pelo fabricante 1.
8.1.3 Exemplo 3
Para resumir os resultados do exemplo anterior, podemos construir o seguinte quadro:
CAPTULO 8. TESTES DE HIPTESES 107
Gerente decide que origem do
Fabricante 1 Fabricante 2
Fabricante 2 Erro I ( = 0, 15866) OK
Verdadeiro 1 OK Erro II ( = 0, 04746)
Vemos a que a probabilidade do erro tipo I maior. Analisando a Figura 8.1
podemos ver tambm que, se mudarmos a regra de deciso escolhendo um valor de corte
diferente de 14,5, essas probabilidades se alteraro. Aumentando , diminui e vice-
versa. Vamos, agora, estabelecer uma nova regra de deciso de modo que a probabilidade
do erro tipo I passe a ser 0,05. A nossa regio de rejeio, ou regio crtica, continua
tendo a forma X k. Pela Figura 8.1, vemos que k tem que ser menor que 14,5.
= 0, 05
Pr

X k | X N

15;
2, 0
2
16

= 0, 05
Pr

Z
k 15
2
4

= 0, 05
Pr

Z
k 15
0, 5

= 0, 05
0, 5 tab

k 15
0, 5

= 0, 05
tab

k 15
0, 5

= 0, 45

k 15
0, 5
= 1, 64
k = 14, 18
Com essa nova regra de deciso, o erro tipo II passa a ter probabilidade
= Pr(Erro II) =
= Pr

X > 14, 18|X N



14;
1, 2
2
16

= Pr

Z >
14, 18 14
1,2
4
!
= Pr(Z > 0, 6)
= 0, 5 tab(0, 6) = 0, 27425
8.1.4 Exemplo 4
Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual a regra
de deciso?
CAPTULO 8. TESTES DE HIPTESES 108
=
Pr

X k | X N

15;
2, 0
2
16

= Pr

X > k | X N

14;
1, 2
2
16

Pr

Z
k 15
2.0
4

= Pr

Z >
k 14
1.2
4

k 15
0, 5
=
k 14
0, 3

0, 3k 4, 5 0, 5k + 7
0, 8k = 11, 5
k = 14, 375
Neste caso, as probabilidades dos erros tipo I e II so
= = Pr

X 14, 375 | X N

15;
2, 0
2
16

= Pr

Z
14, 375 15
0, 5

= Pr(Z 1, 25)
= Pr(Z 1, 25)
= 0, 5 tab(1, 25) = 0, 10565
8.1.5 Exemplo 5
O procedimento de se xar a probabilidade do erro tipo I o mais utilizado pois,
em geral, na prtica a situao no to simples como a escolha entre duas decises.
Suponha, nos dois exemplos acima, que a empresa compre anis de diversos fabricantes
mas, pelas caractersticas de produo do fabricante 2, os anis produzidos por ele sejam
especiais para a empresa. Assim, importante identicar corretamente a origem, caso
eles sejam oriundos do fabricante 2. Nesta situao, nossas hipteses passariam a ser:
H
0
: anis so produzidos pelo fabricante 2
H
1
: anis no so produzidos pelo fabricante 2
Queremos que a probabilidade seja pequena; assim, podemos xar como 0,05 ou
mesmo 0,01. De posse do valor dessa probabilidade, poderamos estabelecer a regio
crtica ou regio de rejeio. A diferena fundamental aqui est no clculo da proba-
bilidade do erro tipo II: no existe um nico valor de , j que, sob H
1
, a distribuio
pode ter qualquer mdia.
CAPTULO 8. TESTES DE HIPTESES 109
8.1.6 Exemplo 6
Considere a seguinte regra de deciso sobre a honestidade de uma moeda. Se em trs
lanamentos aparecerem 3 coroas, decidimos rejeitar a hiptese de que a moeda hon-
esta. Como devemos estabelecer as hipteses nula e alternativa? Como devemos pro-
ceder para calcular e ?
Em termos gerais, a questo que se coloca se a moeda honesta ou no. Como
regra geral, neste curso deveremos sempre denir a hiptese nula de modo que ela
represente um nico valor do parmetro de interesse. Ou seja, a hiptese nula deve
ser uma hiptese simples. Neste exemplo, a distribuio em questo uma binomial
com parmetros n = 3 e p desconhecido. Moeda honesta signica p =
1
2
. Logo, nossas
hipteses devem ser:
H
0
: p =
1
2
H
1
: p 6=
1
2
Seja X = nmero de coroas nos trs lanamentos. Ento, X bin(3; p). Nossa regra
de deciso rejeitar H
0
se X = 3. A probabilidade do erro tipo I
= Pr

X = 3|X bin

3;
1
2

=
1
2

1
2

1
2
=
1
8
No possvel calcular = Pr(no rejeitar H
0
|H
0
falsa), pois a hiptese alternativa
(aquela que devemos considerar quando H
0
no aceita) no estipula um valor nico
para p. Mas neste exemplo simples, podemos obter uma expresso para em funo de
p. Note que
= Pr [X < 3|X bin(3; p)]
= 1 Pr [X 3|X bin(3; p)]
= 1 Pr [X = 3|X bin(3; p)]
= 1 p
3
8.1.7 Lista de Exerccios 1
1. Estabelea as hipteses nula e alternativa para as seguintes situaes:
(a) Depois de uma pane geral no sistema de informao de uma empresa, o
gerente administrativo deseja saber se houve alterao no tempo de processa-
mento de determinada atividade. Antes da pane, o tempo de processamento
podia ser aproximado por uma varivel aleatria normal com mdia de 100
minutos e desvio padro de 10 minutos. O gerente acredita que a pane no
tenha alterado a variabilidade do processo.
CAPTULO 8. TESTES DE HIPTESES 110
(b) O dono de uma mdia empresa decide investigar a alegao de seus empre-
gados de que o salrio mdio na sua empresa menor que o salrio mdio
nacional, que de 900 reais.
(c) Uma empresa fabricante de balas arma que o peso mdio de suas balas de
pelo menos 2 gramas.
2. Considere uma populao normal comvarincia 225, da qual se extrai uma amostra
aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses:
H
0
: = 40
H
1
: = 45
(a) Se a regio crtica RC : X > 43 calcule as probabilidades dos erros tipo I e
II.
(b) Determine a regio crtica da forma X > k tal que a probabilidade do erro
tipo I seja 0,10. Nesse caso, qual a probabilidade do erro tipo II?
8.2 Conceitos bsicos
O contexto em que se baseia a teoria de teste de hiptese basicamente o mesmo da
teoria de estimao por intervalo de conana. Temos uma populao representada por
uma varivel aleatria X cuja distribuio de probabilidade depende de algumparmetro
. O interesse agora est em testar a veracidade de alguma armativa sobre .
8.2.1 Hiptese nula
A hiptese nula, representada por H
0
, a hiptese bsica que queremos testar. Em
geral, denimos a hiptese nula de modo que o nosso objetivo seja rejeitar H
0
. Nesse
texto consideraremos apenas hipteses nulas simples, isto , hipteses que estabelecem
que o parmetro de interesse igual a um determinado valor. A forma geral
H
0
: =
0
Alguns exemplos so:
H
0
: = 6 H
0
: p = 0, 5 H
0
:
2
= 25
O procedimento de teste de hiptese resultar em uma regra de deciso que nos permitir
rejeitar ou no rejeitar H
0
.
CAPTULO 8. TESTES DE HIPTESES 111
8.2.2 Hiptese alternativa
A hiptese alternativa, representada por H
1
, a hiptese que devemos considerar no
caso de rejeio da hiptese nula. A forma mais geral de H
1
a hiptese bilateral
H
1
: 6=
0
Em algumas situaes, podemos ter informao que nos permita restringir o domnio
da hitese alternativa. Por exemplo, se uma empresa farmacutica est testando um
novo medicamento para enxaqueca no intuito de reduzir o tempo entre a ingesto do
medicamento e o alvio dos sintomas, uma possvel hiptese alternativa
H
1
: < 10
Temos, ento, hipteses unilaterais esquerda
H
1
: <
0
e hipteses unilaterais direita:
H
1
: >
0
A escolha entre essas formas de hiptese alternativa se faz com base no conhecimento
sobre o problema sendo considerado.
8.2.3 Estatstica de teste, erros e regra de deciso
Assim como na construo dos intervalos de conana, iremos usar uma estatstica
amostral apropriada para construir o nosso teste de hiptese e nesse contexto, essa
estatstica chamada estatstica de teste. As estatsticas de teste usuais so a mdia
amostral X e a proporo amostral
b
P, que sero usadas na construo de testes sobre
a mdia e a proporo populacionais, respectivamente.
O procedimento de deciso denido em termos da hiptese nula H
0
: as decises
possveis so (i) rejeitar ou (ii) no rejeitar H
0
. Conforme resumo apresentado no quadro
abaixo, existem duas possibilidades de erro:
Erro tipo I: rejeitar H
0
quando H
0
verdadeira
Erro tipo II: no rejeitar H
0
quando H
0
falsa
A deciso sobre a hiptese nula tomada com base em uma regra que estabelece
um conjunto de valores, chamado regio crtica ou regio de rejeio, de modo que se, o
valor observado da estatstica amostral cair nesse regio, rejeitaremos H
0
; caso contrrio,
no rejeitaremos H
0
. Vamos denotar por RC a regio crtica.
8.2.4 Regio crtica e nvel de signicncia
Em geral, a denio da regio crtica feita da seguinte forma: RC o conjunto de
valores cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H
0
.
CAPTULO 8. TESTES DE HIPTESES 112
Vamos considerar o seguinte exemplo: se, ao lanarmos uma moeda 30 vezes, ob-
tivermos 28 caras, iremos desconar da hiptese de honestidade da moeda, porque a
probabilidade de obtermos 28 caras ou mais em 30 lanamentos de uma moeda honesta
0,000000433996, uma probabilidade bastante pequena. claro que o evento 28 caras
ou mais em 30 lanamentos um evento possvel (acertar a sena no jogo da mega-sena
tambm ...) mas, sob o ponto de vista do teste de hiptese, a obteno de tal evento
ser uma evidncia de que a nossa hiptese nula de honestidade da moeda no muito
plausvel. Nesse caso, no diremos que a moeda no honesta (no podemos dizer que
impossvel acertar a sena!); nossa concluso que no h evidncia suciente para
apoiar a hiptese nula. (Situao anloga ocorre quando um jri diz que o ru no
culpado.)
A denio de probabilidade pequena se faz atravs da escolha do nvel de sig-
nicncia do teste, que a probabilidade do erro tipo I, isto :
= Pr(erro tipo I) = Pr(rejeitar H
0
| H
0
verdadeira)
Em geral, o valor de pequeno e as escolhas mais comuns so = 0, 05 e = 0, 01.
Denido o nvel de signicncia , podemos estabelecer a regio crtica usando a
distribuio amostral da estatstica de teste.
8.2.5 Funo caracterstica de operao e poder do teste
No procedimento de teste de hiptese, as decises possveis so rejeitar ou no rejeitar
H
0
. Denem-se, assim, as seguintes funes em termos das probabilidades de cada uma
delas. A funo caracterstica de operao denida como
() = Pr(no rejeitar H
0
| )
Dene-se a funo poder do teste como
Q() = 1 () = Pr(rejeitar H
0
| )
Estas funes (probabilidades) esto condicionadas ao verdadeiro e desconhecido valor
do parmetro . Se este valor estiver no conjunto de valores denidos pela hiptese alter-
nativa, ento Q() corresponde a uma probabilidade de acerto: ela mede a probabilidade
de se rejeitar H
0
quando H
0
falsa. Por outro lado, se a hiptese nula H
0
: =
0
,
ento
Q(
0
) = 1 (
0
)
= 1 Pr(no rejeitar H
0
|
0
)
= 1 Pr(no rejeitar H
0
| H
0
verdadeira)
= Pr(rejeitar H
0
| H
0
verdadeira)
=
CAPTULO 8. TESTES DE HIPTESES 113
8.3 Exemplo 7
Consideremos uma populao representada por uma varivel aleatria normal commdia
e varincia 400. Deseja-se testar
H
0
: = 100
H
1
: 6= 100
com base em uma amostra aleatria simples de tamanho n = 16. Para tal, dene-se a
seguinte regio crtica:
RC : X < 85 ou X > 115
1. Calcule a probabilidade do erro tipo I.
2. Calcule a funo poder do teste para os seguintes valores de : 75, 80, 85, 90, 95,
100, 105, 110, 115, 120, 125. Quanto vale a funo poder do teste quando = 100?
Soluo
Como queremos fazer um teste sobre a mdia da populao, natural usarmos X
como estatstica de teste. Como a populao normal com mdia e varincia 400,
sabemos que X tambm normal com mdia e varincia
400
16
= 25.
1. Sob a hiptese nula, = 100. Ento,
= Pr(rejeitar H
0
| H
0
verdadeira)
= Pr

X < 85

X > 115

| X N(100; 25)

= Pr

X < 85 | X N(100; 25)

+ Pr

X > 115 | X N(100; 25)

= Pr

Z <
85 100
5

+ Pr

Z >
115 100
5

= Pr(Z < 3) + Pr(Z > 3)


= 2 Pr(Z > 3)
= 2 [0, 5 tab(3)]
= 0, 0027
2. A funo poder dada por
1 () = 1 Pr(no rejeitar H
0
| )
= 1 Pr(85 X 115 | )
= 1 Pr

85 X 115 | X N(; 25)

= 1 Pr

85
5
Z
115
5

Vamos ilustrar o clculo para = 75 :


1 (75) = 1 Pr(2 Z 8)
= 1 [tab(8) tab(2)]
= 0, 97725
CAPTULO 8. TESTES DE HIPTESES 114
De forma anloga obtemos a seguinte tabela:
1 ()
75 0,97725
80 0,84134
85 0,50000
90 0,15866
95 0,02278
100 0,00270
105 0,02278
110 0,15866
115 0,50000
120 0,84134
125 0,97725
Observe que, para = 100, valor da hiptese nula, a funo poder igual
probabilidade do erro tipo I (nvel de signicncia).
interessante notar tambm que quanto mais distante do valor
0
= 100, maior o
poder do teste, ou seja, h uma probabilidade mais alta de se rejeitar H
0
quando
o valor alternativo est bem distante de
0
.
8.4 Exemplo 8
Considere a situao do exemplo anterior, com as seguintes diferenas: o tamanho da
amostra n = 100 e a regio crtica passa a ser
RC : X < 94 ou X > 106
Note que razovel estreitar a regio crtica, j que a amostra maior. Vamos calcular
e a funo poder do teste para os mesmos valores.
Soluo
Como antes, a funo poder dada por
Q() = 1 Pr(no rejeitar H
0
| )
= 1 Pr(94 X 106 | )
= 1 Pr

94 X 106 | X N(; 4)

= 1 Pr

94
2
Z
106
2

CAPTULO 8. TESTES DE HIPTESES 115


com os seguintes valores:
Q()
75 1,00000
80 1,00000
85 0,99999
90 0,97725
95 0,30854
100 0,00270
105 0,30854
110 0,97725
115 0,99999
120 1,00000
125 1,00000
Note que esse teste tem o mesmo nvel de signicncia do exemplo anterior: =
Q(100) = 0, 0027.
Na Figura 8.2 temos o grco da funo poder para os dois exemplos. Note que o
poder do teste baseado em uma amostra de tamanho 100 sempre maior que o poder
do teste baseado em uma amostra de tamanho 16.
0,0
0,2
0,4
0,6
0,8
1,0
1,2
50 60 70 80 90 100 110 120 130
n=16
n=100
Figura 8.2: Comparao do poder de dois testes
8.4.1 Lista de Exerccios 2
1. Considere uma populao normal comvarincia 225, da qual se extrai uma amostra
aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses:
H
0
: = 40
H
1
: 6= 40
CAPTULO 8. TESTES DE HIPTESES 116
(a) e para isso dene-se a seguinte regio crtica:
RC : X > 46 ou X < 34
(b) Calcule a probabilidade do erro tipo I.
(c) Obtenha a expresso geral para a funo poder do teste.
(d) Calcule o poder do teste para os seguintes valores de : 20, 22, 24, . . . , 56, 58, 60.
(e) Esboce o grco da funo poder.
8.5 Resumo do Captulo
Neste captulo estudamos os conceitos bsicos da teoria de testes de hipteses, em que o
interesse est em testar a validade de uma armao sobre um parmetro da populao.
Ento, num teste de hiptese, procura-se tomar decises a respeito de uma populao,
com base em informaes obtidas de amostras desta mesma populao.
Ao nal deste captulo voc deve ser capaz de entender perfeitamente os seguintes
conceitos.
A hiptese nula, representada por H
0
, a hiptese bsica que queremos testar.
Nesse texto consideraremos apenas hipteses nulas simples do tipo
H
0
: =
0
A hiptese alternativa, representada por H
1
, a hiptese que devemos considerar
no caso de rejeio da hiptese nula. A forma mais geral de H
1
a hiptese
bilateral, mas podemos ter hipteses unilaterais esquerda e hipteses unilaterais
direita:
H
1
: 6=
0
H
1
: <
0
H
1
: >
0
A estatstica de teste a estatstica amostral apropriada para construir o nosso
teste de hiptese. As estatsticas de teste usuais so a mdia amostral X e a
proporo amostral
b
P, que sero usadas na construo de testes sobre a mdia e
a proporo populacionais, respectivamente.
O procedimento de deciso denido em termos da hiptese nula H
0
, com as
seguintes decises possveis (i) rejeitar H
0
ou (ii) no rejeitar H
0
.
Os erros possveis no processo de decio baseado em um teste de hiptese so
Erro tipo I: rejeitar H
0
quando H
0
verdadeira
Erro tipo II: no rejeitar H
0
quando H
0
falsa
A regio crtica ou regio de rejeio o conjunto de valores da estatstica de teste
que levam rejeio de H
0
; a regio crtica ser denotada por RC .
CAPTULO 8. TESTES DE HIPTESES 117
Em geral, a denio da regio crtica feita xando-se a probabilidade do erro
tipo I; essa probabilidade chamada nvel de signicncia e ser indicada pela
letra grega alfa: .
A funo caracterstica de operao denida como
() = Pr(no rejeitar H
0
| )
Para valores de fora da regio crtica, essa probabilidade corresponde proba-
bilidade de um acerto.
A funo poder do teste denida como
Q() = 1 () = Pr(rejeitar H
0
| )
Para valores de dentro da regio crtica, essa probabilidade corresponde prob-
abilidade de um acerto.
8.6 Exerccios
1. Considere uma populao normal com varincia 64, da qual se extrai uma amostra
aleatria simples de tamanho 16. Deseja-se testar as seguintes hipteses:
H
0
: = 23
H
1
: = 28
(a) Se a regio crtica RC : X > 25, 5 calcule as probabilidades dos erros tipo
I e II.
(b) Determine a regio crtica da forma X > k tal que a probabilidade do erro
tipo I seja 0,05. Nesse caso, qual a probabilidade do erro tipo II?
2. Desejando-se testar as hipteses
H
0
: = 45
H
1
: < 45
sobre a mdia de uma populao normal com varincia 36, estabeleceu-se a
seguinte regio crtica com base em amostra aleatria simples de tamanho n = 16:
RC : X < 41, 25
(a) Calcule a probabilidade do erro tipo I.
(b) Calcule o poder do teste para os seguintes valores de : 30, 31, . . . , 59, 60.
(c) Esboce o grco da funo poder plotando os pontos (; Q()).
CAPTULO 8. TESTES DE HIPTESES 118
3. Para uma populao representada por uma varivel de Bernoulli com parmetro
p, deseja-se testar a hiptese
H
0
: p = 0, 5
H
1
: p 6= 0, 5
Com base em uma amostra de tamanho 10, estabelecida a seguinte regio crtica:
RC : X = 0, 1, 2, 8, 9, 10
onde X = nmero de sucessos na amostra.
(a) Determine o nvel de signicncia .
(b) Calcule o poder do teste para os seguintes valores de p : 0, 2; 0, 4; 0, 6; 0, 8.
Esboce o grco da funo poder.
8.7 Soluo das Listas de Exerccios
Lista de Exerccios 1
1. .
(a) Antes da pane: T N(100; 100)
Depois da pane: T N(; 100)
H
0
: = 100
H
1
: 6= 100
(b) razovel supor que o gerente queira negar a armao dos empregados.
Assim, podemos estabelecer:
H
0
: 900
H
1
: < 900
(c) .
H
0
: 2
H
1
: < 2
2.
X N(; 225)
n = 25

X N

;
225
25

ou X N (; 9)
CAPTULO 8. TESTES DE HIPTESES 119
(a)
= Pr(X > 43 | X N(40; 9))
= Pr

Z >
43 40
3

= Pr(Z > 1, 00)


= 0, 5 tab(1, 00)
= 0, 15866
= Pr(X 43 | X N(45; 9)
= Pr

Z
43 45
3

= Pr(Z 0, 67)
= Pr(Z 0, 67)
= 0, 5 tab(0, 67)
= 0, 25143
(b) .
= 0, 10
Pr

X > k | X N(40; 9)

= 0, 10
Pr

Z >
k 40
3

= 0, 10
tab

k 40
3

= 0, 40
k 40
3
= 1, 28
k = 43, 84
= Pr(X 43, 84 | X N(45; 9)
= Pr

Z
43.84 45
3

= Pr(Z 0, 39)
= Pr(Z 0, 39)
= 0, 5 tab(0, 39)
= 0, 34827
Lista de Exerccios 2
1.
X N(; 225)
n = 25

X N

;
225
25

ou X N (; 9)
CAPTULO 8. TESTES DE HIPTESES 120
(a) .
= Pr

X < 34 | X N(40; 9)

+ Pr

X > 46 | X N(40; 9)

= Pr

Z <
34 40
3

+ Pr

Z >
46 40
3

= Pr(Z < 2) + Pr(Z > 2)


= 2 Pr(Z > 2)
= 2 [0, 5 tab(2, )]
= 0, 0455
(b) .
Q() = Pr(rejeitar H
0
| )
= Pr

X < 34 | X N(; 9)

+ Pr

X > 46 | X N(; 9)

= Pr

Z <
34
3

+ Pr

Z >
46
3

(c) . Vamos fazer os clculos para = 20, 22, 58, 60.


Q(20) = Pr

Z <
34 20
3

+ Pr

Z >
46 20
3

= Pr(Z < 4, 67) + Pr(Z > 8, 67)


1 + 0 = 1
Q(60) = Pr

Z <
34 60
3

+ Pr

Z >
46 60
3

= Pr(Z < 8, 67) + Pr(Z > 4, 67)


= Pr(Z > 8, 67) + Pr(Z < 4, 67) = Q(20)
Q(22) = Pr

Z <
34 22
3

+ Pr

Z >
46 22
3

= Pr(Z < 4, 00) + Pr(Z > 8, 00)


1 + 0 = 1
Q(58) = Pr

Z <
34 58
3

+ Pr

Z >
46 58
3

= Pr(Z < 8, 00) + Pr(Z > 4, 00)


= Pr(Z > 8, 00) + Pr(Z < 4, 00) = Q(22)
Podemos ver que a funo poder simtrica; assim, s precisamos calcular
Q() para = 20, 22, 24, . . . , 38, 40. Os resultados esto na tabela a seguir
e o grco est na Figura 8.3.
CAPTULO 8. TESTES DE HIPTESES 121
Q() Q()
20 0,99999847 60 0,99999847
22 0,99996833 58 0,99996833
24 0,99957094 56 0,99957094
26 0,99616962 54 0,99616962
28 0,97724987 52 0,97724987
30 0,90878883 50 0,90878883
32 0,74750899 48 0,74750899
34 0,50003167 46 0,50003167
36 0,25292160 44 0,25292160
38 0,09504160 42 0,09504160
40 0,04550026
0,0
0,2
0,4
0,6
0,8
1,0
1,2
0 10 20 30 40 50 60 70
Figura 8.3: Soluo da Lista de Exerccios 1
8.8 Soluo dos Exerccios
1.
X N(; 64)
n = 16

X N

;
64
16

ou X N (; 4)
(a)
= Pr

X > 25, 5 | X N(23; 4)

= Pr

Z >
25, 5 23
2

= Pr(Z > 1, 25)


= 0, 5 tab(1, 25)
= 0, 10565
CAPTULO 8. TESTES DE HIPTESES 122
= Pr(X 25, 5 | X N(28; 4)
= Pr

Z
25, 5 28
2

= Pr(Z 1, 25)
= Pr(Z > 1, 25)
= 0, 10565
(b)
= 0, 05
Pr

X > k | X N(23; 4)

= 0, 05
Pr

Z >
k 23
2

= 0, 05
tab

k 23
2

= 0, 45
k 23
2
= 1, 64
k = 26, 28
= Pr(X 26, 28 | X N(28; 4)
= Pr

Z
26, 28 28
2

= Pr(Z 0, 86)
= Pr(Z 0, 86)
= 0, 5 tab(0, 86)
= 0, 19489
2. X N(; 36) n = 16
X N

;
36
16

ou X N (; 2, 25)
A funo poder do teste
Q() = Pr(rejeitar H
0
|)
= Pr(X < 41, 25|X N(; 1, 5
2
)
= Pr

Z <
41, 25
1, 5

CAPTULO 8. TESTES DE HIPTESES 123


e = Q(45). Na tabela a seguir so dados os valores de Q().
Q() Q()
30 1,0000000 46 0,0007711
31 1,0000000 47 0,0000632
32 1,0000000 48 0,0000034
33 1,0000000 49 0,0000001
34 0,9999993 50 0,0000000
35 0,9999845 51 0,0000000
36 0,9997673 52 0,0000000
37 0,9976967 53 0,0000000
38 0,9848699 54 0,0000000
39 0,9331928 55 0,0000000
40 0,7976717 56 0,0000000
41 0,5661838 57 0,0000000
42 0,3085375 58 0,0000000
43 0,1216726 59 0,0000000
44 0,0333764 60 0,0000000
45 0,0062097
Na Figura 8.4 temos o esboo do grco da funo poder.
0,0
0,2
0,4
0,6
0,8
1,0
1,2
20 25 30 35 40 45 50 55 60 65
Figura 8.4: Funo poder do teste para o Exerccio 2
3. Sabemos que X bin(10; p).
CAPTULO 8. TESTES DE HIPTESES 124
(a)
= Pr(X = 0 | p = 0, 5) + Pr(X = 1 | p = 0, 5) +
Pr(X = 2 | p = 0, 5) + Pr(X = 8 | p = 0, 5) +
Pr(X = 9 | p = 0, 5) + Pr(X = 10 | p = 0, 5)
= 0, 5
10
+

10
1

(0, 5) (0, 5)
9
+

10
2

(0, 5)
2
(0, 5)
8
+

10
8

(0, 5)
8
(0, 5)
2
+

10
9

(0, 5)
9
(0, 5) +

10
10

(0, 5)
10
= 0, 000976563 + 0, 009765625 + 0, 043945313 +
0, 043945313 + 0, 009765625 + 0, 000976563
= 0, 109375
(b)
Q(0, 2) = Pr(X = 0 | p = 0, 2) + Pr(X = 1 | p = 0, 2) +
Pr(X = 2 | p = 0, 2) + Pr(X = 8 | p = 0, 2) +
Pr(X = 9 | p = 0, 2) + Pr(X = 10 | p = 0, 2)
= 0, 8
10
+

10
1

(0, 2) (0, 8)
9
+

10
2

(0, 2)
2
(0, 8)
8
+

10
8

(0, 2)
8
(0, 8)
2
+

10
9

(0, 2)
9
(0, 8) +

10
10

(0, 2)
10
= 0, 107374182 + 0, 268435456 + 0, 301989888
+0, 00007373 + 0, 00000410 + 0, 00000010
= 0, 677877453
Analogamente obtm-se a seguinte tabela:
p Q(p)
0, 1 0,9298095
0, 2 0,6778775
0, 3 0,3843732
0, 4 0,1795843
0, 5 0,1093750
0, 6 0,1795843
0, 7 0,3843732
0, 8 0,6778775
0, 9 0,9298095
Veja a Figura 8.5.
CAPTULO 8. TESTES DE HIPTESES 125
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,2 0,4 0,6 0,8 1,0
Figura 8.5: Funo poder do teste para o Exerccio 3
Captulo 9
Teste de Hiptese: Mdia da
N(;
2
) -
2
Conhecida
Neste captulo iremos aplicar os conceitos bsicos sobre a teoria de teste de hiptese a
uma situao especca. Nosso interesse estar concentrado na mdia de uma populao
normal. Assim como no caso dos intervalos de conana, iremos iniciar nossos estudos
supondo que a varincia dessa populao seja conhecida. Como j dito, essa situao
no muito comum na prtica, mas, em termos didticos, a apresentao dos conceitos
ca simplicada. Entendendo bem a construo de um teste de hiptese para esse caso
particular, a apresentao para as outras situaes bastante semelhante, mudando
apenas a distribuio amostral.
Neste captulo veremos os seguintes conceitos aplicados mdia de uma populao
normal com varincia conhecida:
hipteses nula e alternativa
erros tipo I e II
estatstica de teste
regra de deciso
regio crtica
funo caracterstica de operao
poder do teste
valor P
Vamos apresentar inicialmente trs exemplos que ilustraro as diversas possibilidades
que podem surgir na prtica.
126
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA127
9.1 Exemplo 1
Depois de uma pane geral no sistema de informao de uma empresa, o gerente admin-
istrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma
varivel aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos.
O gerente acredita que a pane no tenha alterado a variabilidade do processo. Uma
amostra de 16 tempos de processamento aps a pane revela uma mdia de 105,5 min-
utos. Ao nvel de signicncia de 5%, qual a concluso sobre a alterao do tempo
mdio de processamento?
9.1.1 Hipteses nula e alternativa
O interesse do gerente comparar os tempos antes e depois da pane. Antes da pane,
o tempo mdio de processamento era de 100 minutos. Como ele no sabe o tipo de
alterao que possa ter ocorrido, ele precisa saber se o tempo mdio depois da pane
diferente do tempo anterior. Isso nos leva s seguintes hipteses nula e alternativa:
H
0
: = 100
H
1
: 6= 100
9.1.2 Estatstica de teste
Seja X a varivel aleatria que representa o tempo de processamento. Ento, pelos dados
do problema, temos que X N(; 100). Antes da pane, = 100. Como a populao
normal, sabemos que a distribuio da mdia amostral tambm normal e como no
deve ter havido alterao na variabilidade do processo, resulta que o desvio padro de
10 minutos em qualquer situao. Logo,
X N

;
100
16

ou equivalentemente,
Z =
X
2, 5
N(0; 1)
9.1.3 Nvel de signicncia e regio crtica
Pelo enunciado do problema, o nvel de signicncia de 5%. Isso signica que a
probabilidade do erro tipo I 0,05. Como visto, o erro tipo I consiste em rejeitar a
hiptese nula quando ela verdadeira. Logo,
= Pr(rejeitar H
0
| H
0
verdadeira) = 0, 05
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA128
Quando H
0
verdadeira, a estatstica de teste tem a seguinte distribuio:
H
0
verdadeira =X N

100;
100
16

ou equivalentemente,
Z
0
=
X 100
q
100
16
N(0; 1)
A nossa regio crtica consiste nos valores de X com probabilidade pequena de ocor-
rerem sob essa hiptese. Ou seja, a regio crtica consiste nos valores de X muito
afastados da mdia suposta de = 100. Como a hiptese alternativa bilateral, muito
afastado signica muito maior ou muito menor do que = 100. Veja a Figura
9.1.
Figura 9.1: Regio crtica para o teste bilateral de H
0
: = 100
Ento, nossa regio crtica
X > 100 +k ou X < 100 k
e isso equivalente a
X 100 > k ou X 100 < k
Usando a funo mdulo, podemos escrever:
RC :

X 100

> k
e o valor da constante k determinado pelo nvel de signicncia:
0, 05 = Pr

X 100

> k | X N(100; 6, 25)

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;


2
) -
2
CONHECIDA129
9.1.4 Determinao da regio crtica
Para determinar a regio crtica, basta encontrar o valor da constante k tal que
Pr

X 100

> k | X N(100; 6, 25)

= 0, 05 =
Pr

X 100 > k | X N(100; 6, 25)

+ Pr

X 100 < k | X N(100; 6, 25)

= 0, 05 =
Pr

Z >
k
2, 5

+ Pr

Z <
k
2, 5

= 0, 05 =
Pr

Z >
k
2, 5

+ Pr

Z >
k
2, 5

= 0, 05 =
Pr

Z >
k
2, 5

= 0, 025 =
tab

k
2, 5

= 0, 475 =
k
2, 5
= 1, 96 =
k = 4, 9
A regio crtica
RC : X > 104, 9 ou X < 95, 1
Como o valor da estatstica de teste para a amostra observada est na regio crtica,
devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam uma alterao
do tempo de processamento da tarefa aps a pane.
9.1.5 Poder
A funo poder do teste denida como
() = Pr(rejeitar H
0
|)
Em termos da nossa regio crtica podemos escrever
() = Pr

X > 104, 9 | X N(; 6, 25)

+ Pr

X < 95, 1 | X N(; 6, 25)

= Pr

Z >
104, 9
2, 5

+ Pr

Z <
95, 1
2, 5

Calculando () para diferentes valores de obtemos o grco exibido na Figura 9.2.


CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA130
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
1,05
85 90 95 100 105 110 115
Figura 9.2: Funo poder - Exemplo 1
9.2 Exemplo 2
Na mesma situao do exemplo anterior, bastante razovel supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Anal, se o tempo
diminuir, isso signica que a tarefa vai ser executada mais rapidamente, o que representa
um ganho. Ento, as duas possibilidades so:
100 OK!
> 100 Problema!
Para denir qual a hiptese nula, vamos usar o seguinte procedimento. Como dito
no captulo anterior, neste curso s trabalharemos com hipteses nulas simples, isto ,
hipteses nulas que envolvam igualdade do parmetro a um determinado valor: =
0
.
Assim, em um teste unilateral, a hiptese alternativa deve ser aquela que no envolve o
sinal de igualdade. No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo
que ser uma hiptese simples, passa a ser = 100, ou seja:
H
0
: = 100
H
1
: > 100
A estatstica de teste continua sendo
X N

;
100
16

O que muda a regio crtica, que agora passa a ser


RC : X > 100 +k
Veja a Figura 9.3.
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA131
Figura 9.3: Regio crtica para o teste de H
0
: = 100 com alternativa unilateral
direita H
1
: > 100
Como o nvel de signicncia 5%, isso signica que
0, 05 = Pr

X > 100 +k | X N(100; 6, 25)

e o valor da constante calculado como


Pr

X > 100 +k | X N(100; 6, 25)

= 0, 05 =
Pr

Z >
100 +k 100
2, 5

= 0, 05 =
tab

k
2, 5

= 0, 45 =
k
2, 5
= 1, 64 =
k = 4, 1
e isso nos leva regio crtica
RC : X > 104, 1
Como no exemplo anterior, temos que rejeitar a hiptese nula de que o tempo de
processamento no se alterou, j que o valor observado da estatstica amostral est na
regio crtica.
A funo poder do teste
() = Pr(X > 104, 1|)
cujo grco encontra-se na Figura 9.4. Note que para valores de menores do que 100
a probabilidade de rejeitar H
0
zero, o que razovel, pois com uma hiptese unilateral
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA132
0,0
0,2
0,4
0,6
0,8
1,0
1,2
80 85 90 95 100 105 110 115
Figura 9.4: Funo poder - Exempo 2
direita, s rejeitamos a hiptese nula para valores muito maiores do que 100. Se o
valor observado da estatstica de teste menor do que 100, claro que no devemos
rejeitar H
0
.
9.3 Exemplo 3
O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o
salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso, ele analisa
uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais. De informaes obtidas
junto ao sindicato patronal, ele sabe que, em nvel nacional, o salrio mdio de 900
reais, com desvio padro de 32 reais. Supondo que seja razovel aproximar a distribuio
dos salrios por uma distribuio normal com o mesmo desvio padro nacional, vamos
construir um teste de hiptese apropriado, com um nvel de signicncia de 10%.
O problema aqui consiste em decidir se os salrios so menores ou no do que a
mdia nacional de 900 reais, ou seja, as situaes de interesse so
< 900
900
Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal
de igualdade. Logo, nossas hipteses so:
H
0
: = 900
H
1
: < 900
e a estatstica de teste
X N

;
32
2
25

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;


2
) -
2
CONHECIDA133
O proprietrio deve rejeitar a hiptese nula se a mdia amostral for muito menor do
que 900, ou seja, a regio crtica
RC : X < 900 k
Veja a Figura 9.5.
Figura 9.5: Regio crtica para o teste de H
0
: = 900 com alternativa unilateral
esquerda H
1
: < 900
O valor de k determinado pelo nvel de signicncia:
Pr

X < 900 k | X N(900; 6, 4


2
)

= 0, 10 =
Pr

Z <
900 k 900
6, 4

= 0, 10 =
Pr

Z <
k
6, 4

= 0, 10 =
Pr

Z >
k
6, 4

= 0, 10 =
tab

k
6, 4

= 0, 40 =
k
6, 4
= 1, 28 =
k = 8, 192
Logo, a regio crtica
RC : X < 891, 808
Veja na Figura 9.6 a funo poder deste teste: para valores maiores do que 900, a
probabilidade de rejeitar a hiptese nula zero.
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA134
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
860 870 880 890 900 910 920 930 940
Figura 9.6: Funo poder - Exemplo 3
9.4 Procedimento geral para construo do teste de
hiptese sobre a mdia de uma N(;
2
) -
2
con-
hecida
Os trs exemplos acima ilustram o procedimento para construo de um teste de hiptese
sobre a mdia de uma populao normal com varincia conhecida. De posse de uma
amostra aleatria simples X
1
, X
2
, . . . , X
n
extrada de uma populao X N(;
2
),
nosso interesse est em testar a hiptese nula
H
0
: =
0
a um nvel de signicncia .
Dependendo do conhecimento sobre o problema, a hiptese alternativa pode tomar
uma das trs formas:
H
1
: 6=
0
H
1
: >
0
H
1
: <
0
Em qualquer dos casos, a estatstica de teste a mdia amostral; se a varincia
2

conhecida, sabemos que


X N

;

2
n

A regra de deciso consiste em rejeitar a hiptese nula se o valor de X estiver


longe do valor
0
. No caso da hiptese alternativa bilateral, estar longe signica ser
muito maior ou muito menor que
0
; para a alternativa unilateral direita, estar longe
signica ser muito maior do que
0
e para a alternativa unilateral esquerda, longe
signica ser muito menor que
0
. As expresses muito menor e muito maior cam
perfeitamente denidas a partir do valor do nvel de signicncia . Veja a Figura
9.7, em que nas partes (a), (b) e (c) ilustra-se a regio crtica para as trs hipteses
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA135
alternativas. Como antes, vamos denotar por z

a abscissa da curva normal padro que


deixa rea (probabilidade) acima dela.
9.4.1 Teste bilateral
Consideremos as hipteses
H
0
: =
0
H
1
: 6=
0
A regio crtica [veja a Figura 9.7-(a)]
RC : X >
0
+k ou X <
0
k
e se a hiptese nula verdadeira,
X N

0
;

2
n

Com nvel de signicncia = Pr(erro I), temos que ter:


Pr(rejeitar H
0
| H
0
verdadeira) = =
Pr

X >
0
+k | X N

0
;

2
n

+ Pr

X <
0
k | X N

0
;

2
n

= =
Pr

Z >

0
+k
0

n
!
+ Pr

Z <

0
k
0

n
!
= =
Pr

Z >
k

n
!
+ Pr

Z <
k

n
!
= =
Pr

Z >
k

n
!
+ Pr

Z >
k

n
!
= =
Pr

Z >
k

n
!
=

2
=
k

n
= z
/2
=
k = z
/2

n
Logo, a regio crtica
X >
0
+z
/2

n
ou X >
0
z
/2

n
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA136
Figura 9.7: Regio crtica para o teste de hiptese sobre a mdia de uma normal com
varincia conhecida (a) teste bilateral (b) teste unilateral direita (c) teste unilateral
esquerda
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA137
9.4.2 Teste unilateral direita
Consideremos as hipteses
H
0
: =
0
H
1
: >
0
A regio crtica [veja a Figura 9.7-(b)]
RC : X >
0
+k
e se a hiptese nula verdadeira,
X N

0
;

2
n

Com nvel de signicncia = Pr(erro I), temos que ter:


Pr(rejeitar H
0
| H
0
verdadeira) = =
Pr

X >
0
+k | X N

0
;

2
n

= =
Pr

Z >

0
+k
0

n
!
= =
Pr

Z >
k

n
!
= =
k

n
= z

=
k = z

n
Logo, a regio crtica
X >
0
+z

n
9.4.3 Teste unilateral esquerda
Consideremos as hipteses
H
0
: =
0
H
1
: <
0
A regio crtica [veja a Figura 9.7-(c)]
RC : X <
0
k
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA138
e se a hiptese nula verdadeira,
X N

0
;

2
n

Com nvel de signicncia = Pr(erro I), temos que ter:


Pr(rejeitar H
0
| H
0
verdadeira) = =
Pr

X <
0
k | X N

0
;

2
n

= =
Pr

Z <

0
k
0

n
!
= =
Pr

Z <
k

n
!
= =
Pr

Z >
k

n
!
= =
k

n
= z

=
k = z

n
Logo, a regio crtica
X <
0
z

n
9.4.4 Teste de hiptese versus intervalo de conana
interessante notar a expresso que aparece na regio crtica para o teste bilateral; ela
a mesma obtida para a margem de erro do intervalo de conana para a mdia de uma
populao normal com varincia conhecida:
= z
/2

n
Podemos ver, assim, que existe uma relao entre os dois procedimentos; na verdade,
em um teste de hiptese bilateral, rejeitamos a hiptese nula H
0
se o valor observado
da estatstica de teste no estiver no intervalo de conana.
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA139
9.5 Valor P
Nos exemplos acima, a determinao da regio crtica foi feita com base no nvel de
signicncia, isto , xado o nvel de signicncia encontramos o valor k que denia
os limites entre valores provveis (aqueles que levam no rejeio de H
0
) e pouco
provveis (aqueles que levam rejeio de H
0
). Um outro procedimento bastante usual,
especialmente quando so utilizados programas computacionais, consiste em calcular a
probabilidade de se obter um valor to ou mais desfavorvel que o valor observado, se
H
0
for verdadeira. Essa probabilidade chamada valor P. Vamos ilustrar esse conceito
considerando novamente os trs exemplos anteriores.
9.5.1 Teste bilateral - Valor P para o Exemplo 1
O valor obtido com os dados amostrais para a estatstica de teste x = 105, 5. Como
o teste bilateral, valores longe de 100 so aqueles muito menores ou muito maiores
que 100. O procedimento visto consistiu em dividir a probabilidade do erro tipo I
igualmente nas duas caudas da distribuio normal e dessa forma identicamos a regio
crtica. Vamos, agora, calcular o valor P para o nosso exemplo; ele a probabilidade de
obtermos um valor to ou mais extremo que o valor observado. Como o valor observado
est direita da mdia, devemos calcular a seguinte probabilidade:
P = Pr(X 105, 5 | H
0
verdadeira)
= Pr

X 105, 5 | X N

100;
100
16

= Pr

Z
105.5 100
2.5

= Pr(Z 2, 2) = 0, 5 tab(2, 2)
= 0, 0139
Vamos analisar a Figura 9.8, onde est ilustrado esse valor. O valor amostral
observado para X x = 105, 5 = 100 + 5, 5. Como o teste bilateral, se tivssemos
obtido o valor x = 100 5, 5, esse valor tambm seria considerado to afastado de 100
quanto 105,5. Assim, para testes bilaterais, temos que considerar a probabilidade nas
duas caudas da distribuio. O que esse resultado est nos dizendo o seguinte: se H
0
for verdadeira, a probabilidade de obtermos um valor distante de 100 por 5,5 unidades
em qualquer direo 2 0, 0139 = 0, 0278. Essa probabilidade chamada valor P.
No exemplo, vemos que o valor P pequeno, o que signica que pouco provvel
obtermos um valor to extremo quando H
0
verdadeira. Logo, razovel supormos que
a hiptese nula no seja verdadeira, a mesma concluso obtida ao trabalharmos com o
nvel de signicncia de 5%. Na verdade, rejeitaramos a hiptese nula para qualquer
nvel de signicncia maior que 0,0278.
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA140
Figura 9.8: Valor P para o teste bilateral do Exemplo 1
9.5.2 Teste unilateral direita - Exemplo 2
Como o teste unilateral direita, valores extremos so aqueles muito maiores que 100.
Como visto acima,
P = 0, 0139
Neste caso no temos que multiplicar por 2, pois o teste unilateral. Como o valor P
muito pequeno, temos evidncia suciente para rejeitar a hiptese nula. Essa mesma
deciso seria tomada para qualquer nvel de signicncia menor que 0,0139.
9.5.3 Teste unilateral esquerda - Exemplo 3
No Exemplo 3, temos um teste bilateral esquerda; logo, o valor P
P = Pr

X 894, 53 | X N(900; 6, 4)

= Pr

Z
894.53 900
6.4

= Pr(Z 0, 85)
= Pr(Z 0, 85)
= 0, 5 tab(0, 85)
= 0, 1977
Essa no uma probabilidade pequena; ou seja, razovel obter um valor to ou mais
extremo que 894,53 quando H
0
verdadeira. Assim, os dados no fornecem evidncia
suciente para rejeitarmos a hiptese nula.
Com base nesses exemplos, podemos concluir o seguinte:
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA141
Devemos rejeitar a hiptese nula H
0
ao nvel de signicncia sempre que o valor
P for menor ou igual a ,ou seja:
Rejeitamos H
0
P
Os programas de estatstica calculam valores P mais exatos do que aqueles obtidos
atravs da tabela. Nas aplicaes e exerccios deste curso devemos arredondar os resul-
tados necessrios para 2 casas decimais para podermos utilizar a tabela da distribuio
normal.
9.6 Exemplo 4
Uma amostra de tamanho n = 25 extrada de uma populao normal com varincia
256, obtendo-se x = 23. Deseja-se testar a hiptese
H
0
: = 18
Determine a regio crtica ao nvel de signicncia de 1% e encontre o valor P quando
1. H
1
: 6= 18
2. H
1
: > 18
Soluo
1. A regio crtica
RC : X > 18 +k ou X < 18 k
Com = 0, 01 temos que ter:
Pr

X > 18 +k | X N

18;
256
25

+ Pr

X < 18 k | X N

18;
256
25

= 0, 01 =
Pr

Z >
18 +k + 18
3, 2

+ Pr

Z <
18 k 18
3, 2

= 0, 01 =
Pr

Z >
k
3, 2

+ Pr

Z <
k
3, 2

= 0, 01 =
Pr

Z >
k
3, 2

+ Pr

Z >
k
3, 2

= 0, 01 =
Pr

Z >
k
3, 2

= 0, 005 =
tab

k
3, 2

= 0, 495 =
k
3, 2
= 2, 58 =
k = 8, 256
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA142
Logo, a regio crtica
X > 26, 256 ou X < 9, 744
O valor P
P = 2 Pr

X 23 | X N

18;
256
25

= 2 Pr

Z
23 18
3, 2

= 2 Pr(Z 1, 56)
= 2 [0, 5 tab(1, 56)]
= 2 [0, 5 0, 4406]
= 0, 1188
Rejeitamos H
0
a qualquer nvel de signicncia 0, 1188. Logo, ao nvel de
signicncia de 1% (ou mesmo 5%) no podemos rejeitar H
0
. Note que o valor da
estatstica de teste, x = 23, est fora da regio crtica.
2. A regio crtica
RC : X > 18 +k
Com = 0, 01 temos que ter:
Pr

X > 18 +k | X N

18;
256
25

= 0, 01 =
Pr

Z >
18 +k + 18
3, 2

= 0, 01 =
Pr

Z >
k
3, 2

= 0, 01 =
tab

k
3, 2

= 0, 49 =
k
3, 2
= 2, 33 =
k = 7, 456
Logo, a regio crtica
X > 25, 456
O valor P
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA143
P = Pr

X 23 | X N

18;
256
25

= Pr

Z
23 18
3, 2

= Pr(Z 1, 56)
= [0, 5 tab(1, 56)]
= [0, 5 0, 4406]
= 0, 0594
Rejeitamos H
0
a qualquer nvel de signicncia 0, 0594. Logo, ao nvel de
signicncia de 1% no podemos rejeitar H
0
. Note que o valor da estatstica de
teste, x = 23, est fora da regio crtica.
9.7 Exerccios
1. Uma amostra aleatria simples de tamanho n = 9 extrada de uma populao
normal com desvio padro 3,1 apresentou mdia igual a x = 13, 35. Deseja-se
testar
H
0
: = 12, 8
H
1
: 6= 12, 8
(a) Determine a regio crtica correspondente ao nvel de signicncia = 0, 02.
(b) Com base na regio crtica encontrada no item anterior, estabelea a con-
cluso, tendo o cuidado de usar um fraseado que no seja puramente tcnico.
(c) Calcule o valor P e interprete o resultado obtido.
(d) Esboce o grco da funo poder, calculando () para os seguintes valores
de :
8 9 10 11 12 13 14 15 16 17 18
2. Uma empresa fabricante de balas arma que o peso mdio de suas balas de pelo
menos 2 gramas. Pela descrio do processo de produo, sabe-se que o peso das
balas distribui-se normalmente com desvio padro de 0,5 grama. Uma amostra de
25 balas apresenta peso mdio de 1,98 gramas. O que se pode concluir sobre a
armao do fabricante? Use um nvel de signicncia de 5%.
3. Em uma linha de produo, peas so produzidas de modo que o comprimento
seja normalmente distribudo com desvio padro de 0,5 cm. Ajustes peridicos so
feitos na mquina para garantir que as peas tenham comprimento apropriado de
15 cm, pois as peas muito curtas no podem ser aproveitadas (as peas longas
podem ser cortadas). A cada hora so extradas 9 peas da produo, medindo-se
seu comprimento. Estabelea uma regra de deciso para denir se o processo est
operando adequadamente. Use o nvel de signicncia de 0,1%.
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA144
4. Depois de desenvolver um algoritmo para acelerar a execuo de determinada
tarefa rotineira em um escritrio de contabilidade, o analista de sistema analisa
uma amostra de 25 tempos, obtendo uma mdia 46,5 segundos. Dos dados pas-
sados, ele sabe que o tempo de execuo aproximadamente normal com mdia
de 48,5 segundos e desvio padro de 5 segundos. Use o mtodo do valor P para
decidir se o algoritmo do analista realmente melhorou o desempenho do sistema.
5. Uma propaganda arma que o consumo mdio de gasolina de determinada marca
de automvel de 12 litros por 100 quilmetros rodados, com desvio padro de 1,0
litro. Um teste com 36 automveis desta marca acusa um consumo mdio de 12,4
litros por 100 quilmetros rodados. O que se pode concluir sobre a propaganda?
9.8 Soluo dos Exerccios
1. X N(; 3, 1
2
) n = 9 x = 13, 35
(a) = 0, 02 =z
/2
= 2, 33
RC : X > 12, 8 +k ou X < 12, 8 k
Pr

X > 12, 8 +k

X < 12, 8 k

| X N

12, 8;
3, 1
2
9

= 0, 02
Pr

Z >
12, 8 +k 12, 8
3,1
3
!
+ Pr

Z <
12, 8 k 12, 8
3,1
3
!
= 0, 02
Pr(Z > 0, 96774k) + Pr(Z < 0, 96774k) = 0, 02
2 Pr(Z > 0, 96774k) = 0, 02
Pr(Z > 0, 96774k) = 0, 01
0, 96774k = 2, 33
k = 2, 41
A regio crtica
X > 15, 21 ou X < 10, 39
(b) O valor observado x = 13, 35 no est na regio crtica. Logo, no h ev-
idncia amostral suciente para rejeitarmos a hiptese de que a mdia da
populao seja 12,8.
(c) .
P = 2 Pr

X 13, 35 | X N

12, 8;
3, 1
2
9

= 2 Pr

Z
13, 35 12, 8
3,1
3
!
= 2 Pr(Z 0, 53)
= 2 [0, 5 tab(0, 53)]
= 0, 4038
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA145
O valor P bastante alto; logo a hiptese nula s seria rejeitada para nveis
de signicncia maiores que 0,40. Isso evidncia de que no se pode rejeitar
a hiptese nula em qualquer nvel de signicncia razovel.
(d)
() = Pr(rejeitar H
0
|)
= Pr

X > 15, 21|X N



;
3, 1
2
9

+ Pr

X < 10, 38|X N



;
3, 1
2
9

Na tabela abaixo temos o valor de () para diferentes valores de (voc


pode obter valores um pouco diferentes, por causa de arredondamentos!).
Veja tambm a Figura 9.9.
()
8 0,98937
9 0,90914
10 0,64347
11 0,27428
12 0,05942
13 0,02184
14 0,12104
15 0,41948
16 0,77772
17 0,95839
18 0,99653
Por exemplo:
(8) = Pr

X > 15, 21|X N



8;
3, 1
2
9

+ Pr

X < 10, 38|X N



8;
3, 1
2
9

= Pr

Z >
15, 21 8
3,1
3
!
+ Pr

Z <
10, 38 8
3,1
3
!
= Pr(Z > 6, 98) + Pr(Z < 2, 30)
= [0, 5 tab(6, 98)] + [0, 5 +tab(2, 30]
= 0, 5 0, 5 + 0, 5 + 0, 4893 = 0, 9893
2. Seja X a varivel aleatria que representa o peso das balas. Ento X N(; 0, 25).
Como n = 25, resulta que
X N(; 0, 01)
A armativa do fabricante 2. Logo, a negao de tal armao < 2.
Como essa ltima expresso no contmo sinal de igualdade, ela se torna a hiptese
alternativa. Ento, nossas hipteses so:
H
0
: = 2
H
1
: < 2
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA146
0,0
0,2
0,4
0,6
0,8
1,0
1,2
0 5 10 15 20
Figura 9.9: Funo poder - Exerccio 1
A regio crtica
RC : X < 2 k
Pr[X < 2 k | X N(2; 0, 01)] = 0, 05 =
Pr

Z <
k
0, 1

= 0, 05 =
Pr

Z >
k
0, 1

= 0, 05 =
tab

k
0, 1

= 0, 45 =
k
0, 1
= 1, 64 =
k = 0, 164
A regio crtica
X < 2 0, 164 = 1, 836
Como o valor observado x = 1, 98 no se encontra na regio crtica, no podemos
rejeitar a hiptese nula. Ou seja, os dados no trazem evidncia de que o fabricante
esteja mentindo.
3. O problema na produo surge quando < 15. Logo, nossas hipteses so:
H
0
: = 15
H
1
: < 15
A regio crtica
RC : X < 15 k
CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;
2
) -
2
CONHECIDA147
Pr

X < 15 k|X N

15;
0, 5
2
9

= 0, 001 =
Pr

Z <
15 k 15
0,5
3
!
= 0, 001 =
Pr(Z > 6k) = 0, 001 =
tab(6k) = 0, 499 =
6k = 3, 09 =
k = 0, 515
Ento se X < 14, 485 o processo deve ser interrompido para um novo ajuste.
4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A
negao dessa armativa 48, 5. Logo, nossas hipteses so:
H
0
: = 48, 5
H
1
: < 48, 5
A estatstica amostral
X N

;
5
5
25

O valor obtido x = 46, 5, que resulta no seguinte valor P :


P = Pr

X < 46, 55|X N



48, 5;
5
5
25

= Pr

Z <
46, 5 48, 5
1

= Pr(Z < 2, 0)
= Pr(Z > 2, 0)
= 0, 5 tab(2, 0)
= 0, 02275
Podemos armar que o tempo de execuo reduziu, a qualquer nvel de signicncia
inferior 2, 275%. Note que rejeitamos a hiptese nula ao nvel de signicncia de
5%, mas no a 1%!
5. Se o consumo for menor ou igual a 12 litros por 100 km, no h problema com a
propaganda. O problema surge se o consumo for superior. Logo, nossas hipteses
so:
H
0
: = 12
H
1
: > 12
Supondo que o consumo X possa ser aproximado por uma distribuio normal,
temos que
X N

;
1
36

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(;


2
) -
2
CONHECIDA148
Vamos calcular o valor P :
P = Pr

X > 12, 4|X N



12;
1
36

= Pr

Z >
12, 4 12
1
6

= Pr(Z > 2, 4)
= 0, 5 tab(2, 4)
= 0, 0082
A propaganda parece ser enganosa, pois a probabilidade de se obter um consumo
mdio de 12,4 litros por 100 km pequena se o consumo realmente for de 12
litros por 100 km. Note que H
0
rejeitada para qualquer nvel de signicncia
0, 82%, o que inclui os nveis de signicncia usuais de 1% e 5%.
Captulo 10
Teste de Hiptese: Propores -
Amostra Grande
No captulo anterior voc aprendeu a construir testes de hipteses sobre a mdia de
uma populao normal com varincia
2
conhecida. O procedimento baseou-se na dis-
tribuio amostral da mdia amostral que, com as hipteses de normalidade e conhec-
imento da varincia populacional, sabemos ser normal com a mesma mdia e varincia

2
n
. Neste captulo iremos fazer uso do Teorema Limite Central para construir testes de
hipteses sobre propores com base em amostras grandes. Vimos que, para amostras
grandes, a distribuio amostral da proporo amostral pode ser aproximada por uma
distribuio normal e, assim, o procedimento de teste de hiptese ser idntico ao estu-
dado no captulo anterior. Veremos, ento, os seguintes conceitos aplicados proporo
populacional:
hipteses nula e alternativa
estatstica de teste
erros tipo I e II
regra de deciso
regio crtica
valor P
10.1 Contexto bsico
O contexto de interesse o seguinte: temos uma populao em que cada elemento
classicado de acordo com a presena ou ausncia de determinada caracterstica. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :
X =

1 se elemento possui a caracterstica de interesse
0 se elemento no possui a caracterstica de interesse
149
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE150
Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p). O parmetro p tambm
a proporo de elementos da populao que possuem a caractersitca de interesse. Em
geral, esse parmetro desconhecido e queremos testar hipteses feitas sobre seu possvel
valor.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X
1
, X
2
, . . . , X
n
com reposio. Vimos que a proporo
b
P de elementos na amostra que
possuem a caracterstica de interesse, denida por
b
P =
S
n
n
=
X
1
+X
2
+ +X
n
n
(10.1)
um estimador no-viesado para p com varincia
p(1p)
n
. Mais precisamente,
E(
b
P) = p
V ar(
b
P) =
p(1 p)
n
Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Central do Limite
nos diz, ento, que a distribuio de
b
P se aproxima de uma nornal com mdia p e
varincia
p(1p)
n
. Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e,
em geral, essas condies so satisfeitas se n 30.
Resumindo, temos o seguinte resultado:
b
P N

p;
p(1 p)
n

ou, equivalentemente:
b
P p
q
p(1p)
n
N(0; 1)
Vamos ver, agora, como usar esse resultado para construir testes de hipteses sobre a
verdadeira proporo populacional p.
10.2 Teste de hipteses sobre propores
A hiptese nula que consideraremos ser uma hiptese simples:
H
0
: p = p
0
As hipteses alternativas possveis so
Bilateral : H
1
: p 6= p
0
Unilateral direita : H
1
: p > p
0
Unilateral esquerda : H
1
: p < p
0
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE151
Como no caso da mdia, a escolha das hipteses nula e alternativa deve ser feita
levando-se em conta que a hiptese nula deve ser uma hiptese simples. Assim, voc
deve traduzir a situao de interesse do problema em desigualdades envolvendo a
proporo p. A hiptese alternativa a desigualdade que no inclui o sinal de =.
A estatstica de teste
Z =
b
P p
q
p(1p)
n
N(0; 1)
Dado um nvel de signicncia , a regio crtica denida como o conjunto de
valores da estatsttca de teste que tm probabilidade pequena de ocorrerem sob a ve-
racidade da hiptese nula. Assim, a regio crtica denida como o conjunto de valores
de
Z
0
=
b
P p
0
r
p
0
(1 p
0
)
n
N(0; 1)
com pequena probabilidade de ocorrncia:
Z
0
> k ou Z
0
< k (teste bilateral)
Z
0
> k (teste unilateral direita)
Z
0
< k (teste unilateral esquerda)
O valor k encontrado impondo-se a condio de a probabilidade do erro tipo I ser
igual a :
Pr (rejeitar H
0
| H
0
verdadeira) =
10.2.1 Teste bilateral
Com nvel de signicncia = Pr(erro I), temos que ter:
Pr(rejeitar H
0
| H
0
verdadeira) = =
Pr [Z
0
> k | Z
0
N(0; 1)] + Pr [Z
0
< k | Z
0
N(0; 1)] = =
Pr [Z
0
> k | Z
0
N(0; 1)] + Pr [Z
0
> k | Z
0
N(0; 1)] = =
Pr [Z
0
> k | Z
0
N(0; 1)] =

2
=
k = z
/2
ou seja, a regio crtica :
Z
0
> z
/2
ou Z
0
< z
/2
(10.2)
Em termos da proporo amostral, temos o seguinte:
Z
0
> z
/2

b
P p
0
r
p
0
(1 p
0
)
n
> z
/2

b
P > p
0
+z
/2
r
p
0
(1 p
0
)
n
Z
0
< z
/2

b
P p
0
r
p
0
(1 p
0
)
n
< z
/2

b
P < p
0
z
/2
r
p
0
(1 p
0
)
n
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE152
ou seja, a regio crtica
b
P > p
0
+z
/2
r
p
0
(1 p
0
)
n
ou
b
P < p
0
z
/2
r
p
0
(1 p
0
)
n
(10.3)
10.2.2 Testes unilaterais
Com desenvolvimento anlogo obtemos as seguintes regies crticas:
Teste unilateral direita: Z
0
> z

ou
b
P > p
0
+z

q
p
0
(1p
0
)
n
Teste unilateral esquerda: Z
0
< z

ou
b
P < p
0
z

q
p
0
(1p
0
)
n
(10.4)
10.3 Valor P
Como j visto no captulo anterior, o valor P a probabilidade de se obter um valor to
ou mais extremo (na direo da hiptese alternativa) que o valor observado da estatstica
de teste. Denotando por z
0
o valor observado da estatstica de teste, temos as seguintes
possibilidades:
P = 2 Pr(Z
0
> | z
0
|) (teste bilateral)
P = Pr(Z
0
> | z
0
|) (teste unilateral direita ou esquerda)
(10.5)
Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer sob a
hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula. A hiptese
nula rejeitada a qualquer nvel de signicncia P.
10.4 Exemplo 1
Uma amostra de 64 elementos usada para testar
H
0
: p = 0, 35
H
1
: p 6= 0, 35
Estabelea a regio crtica para o nvel de signicncia de 1%. Se a proporo amostral
para esta amostra b p = 0, 26, calcule o valor P.
Soluo
Com = 0, 01 e um teste bilateral, resulta que z
0,005
= 2, 59. A estatstica de teste
Z
0
=
b
P 0, 35
q
0,350,65
64
=
e a regio crtica
Z
0
> 2, 58 ou Z
0
< 2, 58
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE153
Em termos da proporo amostral, temos que
Z
0
> 2, 58
b
P 0, 35
q
0,350,65
64
> 2, 58
b
P > 0, 503 82
Z
0
< 2, 58
b
P 0, 35
q
0,350,65
64
< 2, 58
b
P < 0, 19618
e a regio crtica
b
P > 0, 504 ou
b
P < 0, 196
O valor observado da estatstica de teste
z
0
=
0.26 0.35
q
0.350.65
64
= 1, 5095 1, 51
Como o teste bilateral, o valor P calculado como
P = 2 Pr [Z
0
> 1, 51 | Z
0
N(0; 1)]
= 2 [0, 5 tab(1, 51)]
= 2 [0, 5 0, 43448]
= 0, 13104
Como o valor P grande, no se rejeita a hiptese nula, ou seja, a probabilidade de se
obter um valor to extremo quanto o observado alta, se H
0
for verdadeira. A hiptese
nula s seria rejeitada para nveis de signicncia maiores que 13,1%.
10.5 Exemplo 2
Um fabricante arma que no mximo 10% dos seus produtos so defeituosos. Um rgo
de defesa do consumidor testa uma amostra de 81 desses itens, detectando 13,8% de
defeituosos.
1. Encontre a regio crtica para um nvel de signicncia de 5%.
2. Calcule o valor P.
Soluo
A armativa de interesse para o fabricante p 0, 10. A negao de tal armativa
(questionamento do rgo de defesa do conumidor) p > 0, 10. Logo, nossas hipteses
so:
H
0
: p = 0, 10
H
1
: p > 0, 10
Note que todas as propores esto na forma decimal! No trabalhe com percentagens!
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE154
A estatstica de teste
Z
0
=
b
P 0, 10
q
0,100,90
81
=
1. Com = 0, 05 e um teste unilateral, resulta que z
0,05
= 1, 64 e a regio crtica
Z
0
> 1, 64
O valor observado da estatstica de teste
z
0
=
0, 138 0, 10
q
0,100,90
81
= 1, 14
que no pertence regio crtica. Ou seja, os dados no fornecem evidncia contra
o fabricante.
2.
P = Pr [Z
0
> 1, 14 | Z
0
N(0; 1)]
= 0, 5 tab(1, 14)
= 0, 12714
Logo, rejeitamos H
0
apenas para nveis de signicncia maiores que 12,7%. Assim,
aos nveis de signicncia usuais, no devemos rejeitar H
0
, o que uma evidncia
de que o fabricante est dizendo a verdade.
10.6 Resumo do Captulo
Neste captulo voc estudou o procedimento para construo de um teste de hiptese
sobre a proporo de uma populao com base em uma amsotra aleatria simples de
tamanho n grande. Assim, temos uma amostra aleatria simples X
1
, X
2
, . . . , X
n
de uma
populao X Bern(p), com n sucientemente grande.
A hiptese nula, representada por H
0
, a hiptese bsica que queremos testar e
neste contexto sempre ter a forma
H
0
: p = p
0
A hiptese alternativa, representada por H
1
, a hiptese que devemos considerar
no caso de rejeio da hiptese nula. A forma mais geral de H
1
a hiptese
bilateral, mas podemos ter hipteses unilaterais esquerda e hipteses unilaterais
direita:
H
1
: p 6= p
0
H
1
: p < p
0
H
1
: p > p
0
Para denir a hiptese alternativa, escreva, primeiro, as situaes de interesse
do problema em forma de desigualdades. A hiptese alternativa ser sempre a
desigualdade que no envolve o sinal de igualdade.
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE155
A estatstica de teste
Z =
b
P p
r
p(1 p)
n
N(0; 1)
A regra de deciso se baseia no valor da estatstica de teste sob a hiptese nula:
Z
0
=
b
P p
0
r
p
0
(1 p
0
)
n
N(0; 1)
Valores pouco provveis desta estatstica levam rejeio da hiptese nula. Assim,
a regra de deciso rejeitar H
0
para valores na(s) cauda(s) da distribuio normal
padro. Com nvel de signicncia , temos as seguintes possibilidades:
Z
0
> z
/2
ou Z
0
< z
/2
(teste bilateral)
Z
0
> z

(teste unilateral direita)


Z
0
< z

(teste unilateral esquerda)


O valor P a probabilidade de se obter um valor to ou mais extremo (na direo
da hiptese alternativa) que o valor observado da estatstica de teste. Denotando
por z
0
o valor observado da estatstica de teste, temos as seguintes possibilidades:
P = 2 Pr(Z
0
> | z
0
|) (teste bilateral)
P = Pr(Z
0
> | z
0
|) (teste unilateral direita ou esquerda)
Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer
sob a hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula.
A hiptese nula rejeitada a qualquer nvel de signicncia P.
10.7 Exerccios
1. Em uma pesquisa com 800 estudantes universitrios, 385 armaram possuir com-
putador. Teste a hiptese de que pelo menos 50% dos estudantes universitrios
possuem computador. Use = 0, 10.
2. Uma pesquisa entre 700 trabalhadores revela que 12,3% obtiveram seus empregos
atravs de indicaes de amigos ou parentes. Teste a hiptese de que mais de 10%
dos trabalhadores conseguem seus empregos por indicao de amigos ou parentes,
utilizando 5% como nvel de signicncia.
3. O nvel de aprovao da qualidade das refeies servidas em um restaurante uni-
versitrio era de 20%, quando houve uma movimentao geral dos estudantes que
forou a direo do restaurante a fazer mudanas. Feitas as mudanas, sorteia-se
uma amostra de 64 estudantes usurios do restaurante e 25 aprovam a qualidade
da comida. Voc diria, ao nvel de signicncia de 5%, que as mudanas surtiram
efeito?
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE156
4. Deseja-se testar a honestidade de uma moeda. Para isso, lana-se a moeda 200
vezes, obtendo-se 115 caras. Qual a sua concluso sobre a honestidade da moeda?
Para responder a essa questo, calcule e interprete o valor P.
5. A direo de um grande jornal nacional arma que 25% dos seus leitores so da
classe A. Se, em uma amostra de 740 leitores, encontramos 156 da classe A, qual
a concluso que tiraramos sobre a armativa da direo do jornal?
10.8 Soluo dos Exerccios
1. b p =
385
800
= 0, 48125
A armativa de interesse pelo menos 50% dos estudantes possuem computador,
ou seja, p 0, 5. Logo, as hipteses so
H
0
: p = 0, 50
H
1
: p < 0, 50
= 0, 10 =z
0,1
= 1, 28
O valor observado da estatstica de teste
z
0
=
0, 48125 0, 5
q
0,50,5
800
= 1, 0607
e a regio crtica
Z
0
< 1, 28
Como o valor observado no pertence regio crtica, no podemos rejeitar a
hiptese nula. Ou seja, os dados trazemevidncia de que a proporo de estudantes
que possuem computador de pelo menos 50%.
2. A armativa de interesse mais de 10% dos trabalhadores conseguem seus em-
pregos por indicao de amigos ou parentes, ou seja, p > 0, 10, cuja negativa
p 0, 10. Logo, as hipteses so
H
0
: p = 0, 10
H
1
: p > 0, 10
Com = 5% e um teste unilateral, z
0,05
= 1, 64. O valor observado da estatstica
de teste
z
0
=
0, 123 0, 1
q
0,10,9
700
= 2, 0284
e a regio crtica
Z
0
> 1, 64
Como o valor observado da estatstica de teste pertence regio crtica, rejeita-se
a hiptese nula de que 10% ou menos dos trabalhadores conseguem seus empregos
por indicao de parentes ou amigos.
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE157
3. O interesse vericar se p > 0, 20. Logo,
H
0
: p = 0, 20
H
1
: p > 0, 20
Como = 5% e o teste unilateral, resulta que z
0,05
= 1, 64. Logo, a regio crtica

Z
0
> 1, 64
O valor observado da estatstica de teste
z
0
=
25
64
0.20
q
0.20.8
64
= 3, 8125
que est na regio crtica; logo, rejeita-se a hiptese nula, ou seja, as evidncias
amostrais indicam que houve melhora com as mudanas.
4. As hipteses so
H
0
: p = 0, 5
H
1
: p 6= 0, 5
e a estatstica de teste
Z
0
=
b
P 0, 5
q
0,50,5
200
O valor observado da estatstica de teste
Z
0
=
115
200
0, 5
q
0,50,5
200
= 2, 1213 2, 12
e o valor P para o teste bilateral
P = 2 Pr [Z
0
> 2, 12 | Z
0
N(0; 1)]
= 2 [0, 5 tab(2, 12)]
= 0, 034
Como o valor P pequeno, a probabilidade de obtermos 115 caras em 200 lana-
mentos de uma moeda honesta pequena, o que nos leva a suspeitar da honesti-
dade da moeda. A hiptese nula seria rejeitada para qualquer nvel de signicncia
3, 4%.
5. Com as informaes disponveis, nossas hipteses so:
H
0
: p = 0, 25
H
1
: p 6= 0, 25
CAPTULO10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE158
e a estatstica de teste
Z
0
=
b
P 0, 25
q
0,250,75
740
O valor observado da estatstica de teste
Z
0
=
156
740
0, 25
q
0,250,75
740
= 2, 46
e o valor P para o teste bilateral
P = 2 Pr [Z
0
> 2, 46 | Z
0
N(0; 1)]
= 2 [0, 5 tab(2, 46)]
= 0, 0139
Como o valor P bastante pequeno, devemos rejeitar a hiptese nula de que a
proporo de leitores da classe A igual a 25%.
Captulo 11
Teste de Hiptese: Mdia da
N(;
2
) -
2
Desconhecida
Neste captulo voc completar seu estudo bsico de testes de hipteses sobre a mdia de
uma populao, analisando a situao relativa a uma populao normal quando no se
conhece a varincia desta populao. Assim como no caso do intervalo de conana, para
testar hipteses relativas mdia de tal populao, necessrio estimar essa varincia e
isso introduz mais uma fonte de variabilidade no procedimento: com uma nica amostra,
queremos testar hipteses sobre a mdia, mas precisamos tambm estimar a varincia
da populao. O procedimento simples e anlogo aos casos estudados nos catulos
anteriores; o que muda a distribuio amostral da estatstica de teste. Em vez de
usarmos a distribuio normal para determinar os valores crticos, usaremos novamente
a distribuio t de Student.
Veremos, ento, os seguintes conceitos aplicados mdia de uma populao normal
com varincia desconhecida:
hipteses nula e alternativa
estatstica de teste
regra de deciso
regio crtica
valor P
11.1 Contexto bsico
Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia
2
: X N(;
2
). Nosso interesse testar hipteses sobre a mdia a
159
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA160
partir de uma amostra aleatria simples X
1
, X
2
, . . . , X
n
. Como visto anteriormente, se
a varincia
2
no conhecida, ento temos que usar a estatstica
T =

n
X
S
cuja distribuio t de Student com n 1 graus de liberdade.
De posse desta estatstica de teste, o procedimento de construo do teste idntico
ao visto nos trs ltimos captulos: identicadas a hiptese nula (sempre na forma de
uma hiptese simples =
0
) e a hiptese alternativa, a regio crtica formada pelos
valores da estatstica de teste pouco provveis sob H
0
. O nvel de signicncia e o
tipo de hiptese alternativa permitem a identicao precisa do que so valores pouco
provveis: so valores na(s) cauda(s) da distribuio de T quando a hiptese nula
verdadeira.
Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos
de aplicao.
11.2 Procedimento geral para construo do teste
de hiptese sobre a mdia de uma N(;
2
) -
2
desconhecida
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao X cuja dis-
tribuio N(;
2
). Nosso interesse testar alguma hiptese sobre a mdia desta
populao. Em geral, a varincia
2
no conhecida e, portanto, vamos estim-la por
S
2
=
1
n 1
n
P
i=1
(X
i
X)
2
=
1
n 1

n
P
i=1
X
2
i
nX
2

Lembre-se que S
2
um estimador no-viesado de
2
.
11.2.1 Hiptese nula e hiptese alternativa
A hiptese nula que iremos considerar ser
H
0
: =
0
As possveis formas da hiptese alternativa so:
Bilateral : H
1
: 6=
0
Unilateral direita : H
1
: >
0
Unilateral esquerda : H
1
: <
0
Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento
do problema. Se no temos informao alguma sobre a alternativa, temos que usar um
teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA161
ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa
no inclua o sinal de igualdade.
Hipteses do problema Hipteses estatsticas

<
0

0

H
0
: =
0
H
1
: <
0


0
>
0

H
0
: =
0
H
1
: >
0
11.2.2 Estatstica de teste, erros, regra de deciso
Como o teste sobre a mdia de uma populao normal, a estatstica amostral que deve
ser utilizada X. Como a varincia populacional no conhecida, sabemos que
T =
X
S

n
t(n 1)
e essa a nossa estatstica de teste.
O procedimento de deciso denido em termos da hiptese nula H
0
e as decises
possveis so (i) rejeitar ou (ii) no rejeitar H
0
. Conforme j visto, existem duas possi-
bilidades de erro:
Erro tipo I: rejeitar H
0
quando H
0
verdadeira
Erro tipo II: no rejeitar H
0
quando H
0
falsa
A regra de deciso consiste em denir a regio crtica RC como o conjunto de valores
cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H
0
. Logo,
nossa regra de deciso se baseia na estatstica de teste
T
0
=
X
0
S

n
t(n 1)
Como a estatstica de teste segue uma distribuio t de Student, valores com pequena
probabilidade de ocorrncia esto nas caudas da distribuio. Isso equivale a valores de
X distandes de
0
. Assim, a regio crtica para cada tipo de hiptese alternativa
denida como segue:
Alternativa bilateral: T
0
> k ou T
0
< k
Alternativa unilateral direita: T
0
> k
Alternativa unilateral esquerda: T
0
< k
Na Figura 11.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA162
Figura 11.1: Regio crtica para o teste sobre a mdia de uma normal com varincia
desconhecida
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA163
11.2.3 Nvel de signicncia e regio crtica
O procedimento usual de teste de hiptese consiste em se xar o nvel de signicncia
, que, por denio, a probabilidade de se cometer o erro tipo I:
= Pr(erro tipo I) = Pr(rejeitar H
0
|H
0
verdadeira)
Assim, para cada tipo de hiptese alternativa a regio crtica identicada impondo-se
a condio
Pr(T RC|H
0
verdadeira) =
Hiptese bilateral
A regio crtica calculada como:
Pr [T
0
> k | T
0
t(n 1)] + Pr [T
0
< k | T
0
t(n 1)] = =
Pr [T
0
> k | T
0
t(n 1)] + Pr [T
0
> k | T
0
t(n 1)] = =
Pr [T
0
> k | T
0
t(n 1)] =

2
Usando a notao t
n;
para denotar a abscissa da distribuio t de Student com n
graus de liberdade que deixa rea (probabilidade) acima dela, resulta a seguinte regio
crtica para o teste bilateral:
T
0
> t
n1; /2
ou T
0
< t
n1; /2
(11.1)
Essa regio crtica tambm pode ser escrita de outra forma usando a seguinte equiv-
alncia:
T
0
> t
n1; /2

X
0
S

n
> t
n1; /2
X >
0
+t
n1; /2
S

n
T
0
< t
n1; /2

X
0
S

n
< t
n1; /2
X <
0
t
n1; /2
S

n
Teste unilateral direita
A regio crtica calculada como:
Pr [T
0
> k | T
0
t(n 1)] = =
k = t
n1;
ou seja, a regio crtica
T
0
> t
n1;
(11.2)
ou equivalentemente
X >
0
+t
n1;
S

n
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA164
Teste unilateral esquerda
De forma anloga, obtm-se a seguinte regio crtica para o teste unilateral esquerda:
T
0
< t
n1;
(11.3)
ou equivalentemente
X <
0
t
n1;
S

n
11.3 Exemplos
A ttulo de comparao com a situao do penltimo captulo, em que supusemos a var-
incia conhecida, vamos considerar os mesmos exemplos, mas agora tratando a varincia
dada como sendo a varincia amostral S
2
.
11.3.1 Exemplo 1
Depois de uma pane geral no sistema de informao de uma empresa, o gerente admin-
istrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma
varivel aleatria normal com mdia de 100 minutos. Uma amostra de 16 tempos de
processamento aps a pane revela uma mdia x = 105, 5 minutos e um desvio padro
s = 10 minutos. Ao nvel de signicncia de 5%, qual a concluso sobre a alterao
do tempo mdio de processamento?
Soluo
Como visto, as hipteses do problema so
= 100
6= 100
Como a segunda expresso no envolve o sinal de igualdade, ela se torna a hiptese
alternativa:
H
0
: = 100
H
1
: 6= 100
Como a varincia no conhecida, temos que usar a distribuio t de Student com
n1 = 161 = 15 graus de liberdade. Para um teste bilateral com nvel de signicncia
de 5%, a abscissa de interesse aquela que deixa rea de 0,025 acima. Consultando a
Tabela 2 dada no nal desta apostila, resulta
t
15; 0,025
= 2, 131
A estatstica de teste
T
0
=
X 100
10

16
t(15)
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA165
e a regio crtica
T
0
> 2, 131 ou T
0
< 2, 131
O valor observado da estatsitca de teste
t
0
=
105, 5 100
10

16
= 2, 2
Como esse valor pertence regio crtica, rejeitamos a hiptese nula e conclumos que
houve alterao no tempo de processamento aps a pane.
Em termos da mdia amostral, a regio crtica
X > 100 + 2, 131
10

16
ou X < 100 2, 131
10

16
ou
X > 105, 33 ou X < 94, 673
Compare com a regio crtica obtida no caso da normal (Exemplo 23.1):
X > 104, 9 ou X < 95, 1
Com o mesmo nvel de signicncia, a regio crtica no caso de varincia desconhecida
mais extrema, reetindo a maior variabilidade da distribuio t.
11.3.2 Exemplo 2
Na mesma situao do exemplo anterior, vamos considerar o caso em que o gerente esteja
interessado apenas no aumento do tempo de processamento. Neste caso, as hipteses
so:
100 OK!
> 100 Problema!
Para denir qual a hiptese nula, vamos usar o mesmo procedimento. Em um teste
unilateral, a hiptese alternativa deve ser aquela que no envolve o sinal de igualdade.
No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo que ser uma
hiptese simples, passa a ser = 100, ou seja:
H
0
: = 100
H
1
: > 100
Como antes, a estatstica de teste
T
0
=
X 100
10

16
t(15)
mas a regio crtica passa a ser
T
0
> t
15; 0,05
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA166
Consultando a tabela da distribuio t, resulta que
t
15; 0,05
= 1, 753
o que nos leva a regio crtica
T
0
> 1, 753
ou
X > 100 + 1, 753
10

16
= 104, 38
Essa tambm uma regio mais extrema que aquela encontrada para o caso da normal:
X > 104, 1. E novamente rejeitamos a hiptese nula, ou seja, as evidncias amostrais
indicam um aumento do tempo de processamento da tarefa aps a pane.
11.3.3 Exemplo 3
O dono de uma mdia empresa decide investigar a alegao de seus empregados de
que o salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso,
ele analisa uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais e desvio
padro de 32 reais. De informaes obtidas junto ao sindicato patronal, ele sabe que,
em nvel nacional, o salrio mdio de 900 reais. Supondo que seja razovel aproximar
a distribuio dos salrios por uma distribuio normal, vamos construir um teste de
hiptese apropriado, com um nvel de signicncia de 10%.
Soluo
O problema aqui consiste em decidir se os salrios so menores ou no do que a
mdia nacional de 900 reais, ou seja, as situaes de interesse so
< 900
900
Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal
de igualdade. Logo, nossas hipteses so:
H
0
: = 900
H
1
: < 900
A regio crtica denida em termos da estatstica de teste
T
0
=
X 900
32

25
t(24)
como
T
0
< t
24; 0,10
Com nvel de signicncia de 10%, a abscissa de interesse aquela que deixa rea de
10% acima dela em uma distribuio t com 24 graus de liberdade:
t
24;0,10
= 1, 318
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA167
Logo, a regio crtica
T
0
< 1, 318
ou
X < 900 1, 318
32

25
= 891, 56
Como o valor observado de 894,53 reais no est na regio crtica, no rejeitamos H
0
,
ou seja, as evidncias amostrais apontam que os salrios da empresa no so menores
que a mdia nacional.
Comparando com a regio crtica do caso normal, X < 891, 808, vemos, novamente,
que no caso da t a regio mais extrema.
11.4 Poder do teste
A denio da funo poder do teste exatamente a mesma:
() = Pr(rejeitar H
0
|)
O problema aqui que, para calcular (), precisamos de um programa computacional
que calcule probabilidades da distribuio t para qualquer valor da abscissa. A ttulo
de ilustrao, vamos calcular o poder do Exemplo 1 para o valor alternativo = 95 :
(95) = Pr

X > 105, 73 |

16
X 95
10
t(15)

+Pr

X < 94, 673 |

16
X 95
10
t(15)

= Pr

16
X 95
10
>

16
105, 73 95
10

+Pr

16
X 95
10
<

16
94, 673 95
10

= Pr [t(15) > 4, 292] + Pr [t(15) < 0, 1308]


= 0, 00032 + 0, 44884 = 0, 44916
Os valores 0.00032 e 0.44884 foram obtidos com um programa computacional estatstico.
11.5 Valor P
Assim como no caso da funo poder, o clculo do valor P requer programas conm-
putacionais que calculem probabilidades da distribuio t para qualquer abscissa. Mas
a interpretao do valor P continua sendo a mesma: valores pequenos de P indicam
eventos pouco provveis de ocorrerem quando H
0
verdadeira. Assim, continua valendo
a seguinte regra de deciso:
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA168
Devemos rejeitar a hiptese nula H
0
ao nvel de signicncia sempre que o valor
P for menor ou igual a ,ou seja:
Rejeitamos H
0
P
No Exemplo 1, o valor P
P = 2 Pr

X > 105, 5 |

16
X 100
10
t(15)

= 2 Pr

t(15) >

16
105, 5 100
10

= 2 Pr [t(15) > 2, 2]
= 2 0, 02195 = 0, 0439
Como P < 0, 05, rejeitamos H
0
ao nvel de signicncia de 5%.
11.6 Exerccios
1. Uma amostra aleatria simples de tamanho n = 9 extrada de uma populao
normal apresentou mdia igual a x = 13, 35 e desvio padro s = 3, 1. Deseja-se
testar
H
0
: = 12, 8
H
1
: 6= 12, 8
(a) Determine a regio crtica correspondente ao nvel de signicncia = 0, 02.
(b) Com base na regio crtica encontrada no item anterior, estabelea a con-
cluso, tendo o cuidado de usar um fraseado que no seja puramente tcnico.
2. Uma empresa fabricante de balas arma que o peso mdio de suas balas de pelo
menos 2 gramas. Pela descrio do processo de produo, sabe-se que o peso das
balas distribui-se normalmente. Uma amostra de 25 balas apresenta peso mdio
de 1,98 gramas e um desvio padro de 0,5 grama.. O que se pode concluir sobre
a armao do fabricante? Use um nvel de signicncia de 5%.
3. Em uma linha de produo, peas so produzidas de modo que o comprimento seja
normalmente distribudo. Ajustes peridicos so feitos na mquina para garantir
que as peas tenham comprimento apropriado de 15 cm, pois as peas muito curtas
no podem ser aproveitadas (as peas longas podem ser cortadas). A cada hora
so extradas 9 peas da produo, medindo-se seu comprimento. Uma dessas
amostras apresenta comprimento mdio de 14,5 cm e desvio padro de 0,5 cm.
Use o nvel de signicncia de 0,1% para testar a hiptese de que o processo esteja
operando adequadamente.
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA169
4. Depois de desenvolver um algoritmo para acelerar a execuo de determinada
tarefa rotineira em um escritrio de contabilidade, o analista de sistema analisa
uma amostra de 25 tempos, obtendo uma mdia 46,5 segundos e desvio padro
de 5 segundos. Dos dados passados, ele sabe que o tempo de execuo aproxi-
madamente normal com mdia de 48,5 segundos. Use o nvel de signicncia de
5% para decidir se o algoritmo do analista realmente melhorou o desempenho do
sistema.
5. Uma propaganda arma que o consumo mdio de gasolina de determinada marca
de automvel de 12 litros por 100 quilmetros rodados. Um teste com 36 au-
tomveis desta marca acusa um consumo mdio de 12,4 litros por 100 quilmetros
rodados com desvio padro de 1 litro por quilmetro rodado. O que se pode
concluir sobre a propaganda? Use o nvel de signicncia de 10%.
11.7 Soluo dos Exerccios
1. n = 9, = 0, 02 t
8; 0,01
= 2, 896. Logo, a regio crtica
T
0
> +2, 896 ou T
0
< 2, 896
O valor observado da estatstica de teste
t
0
=
13.35 12.8
3.1
3
= 0, 53226
que no pertence regio crtica; logo, no podemos rejeitar H
0
.
2. A armativa do fabricante 2. Logo, a negao de tal armao < 2.
Como essa ltima expresso no contmo sinal de igualdade, ela se torna a hiptese
alternativa. Ento, nossas hipteses so:
H
0
: = 2
H
1
: < 2
n = 25; = 0, 05 =t
24; 0,05
= 1, 711. Logo, a regio crtica
T
0
< 1, 711
O valor observado da estatstica de teste
t
0
=
1.98 2.0
0.5
5
= 0, 2
que no pertence regio crtica; logo, no podemos rejeitar H
0
, ou seja, as ev-
idncias amostrais indicam que as balas pesam pelo menos 2 gramas.
CAPTULO11. TESTEDEHIPTESE: MDIADAN(;
2
) -
2
DESCONHECIDA170
3. O problema na produo surge quando < 15. Logo, nossas hipteses so:
H
0
: = 15
H
1
: < 15
n = 9, = 0, 001 =t
8; 0,001
= 4, 501. A regio crtica
T
0
< 4, 501
e o valor observado desta estatstica de teste
t
0
=
14.5 15
0.5
3
= 3, 0
Como o valor observado t
0
= 3, 0 no est na regio crtica, no podemos re-
jeitar H
0
, ou seja, as evidncias amostrais indicam que o processo est operando
adequadamente.
4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A
negao dessa armativa 48, 5. Logo, nossas hipteses so:
H
0
: = 48, 5
H
1
: < 48, 5
n = 25, = 0, 05 =t
24; 0,05
= 1, 711. Logo, a regio crtica
T
0
< 1, 711
e o valor observado desta estatstica
t
0
=
46.5 48.5
5
5
= 2, 0
Como o valor observado t
0
= 2, 0 pertence regio crtica, devemos rejeitar
H
0
, ou seja, as evidncias amostrais indicam que o analista foi bem-sucedido em
reduzir o tempo de execuo.
5. Se o consumo for menor ou igual a 12 litros por 100 km, no h problema com a
propaganda. O problema surge se o consumo for superior. Logo, nossas hipteses
so:
H
0
: = 12
H
1
: > 12
Supondo que o consumo X possa ser aproximado por uma distribuio normal,
podemos usar a distribuio t(35). Com = 10%, t
35; 0,10
= 1, 306 e a regio crtica

T
0
> 1, 306
O valor observado desta estatstica de teste
t
0
=
12.4 12
1
6
= 2, 4
Como o valor observado t
0
= 2, 4 est na regio crtica, devemos rejeitar H
0
, ou
seja, a propaganda parece ser enganosa.
Captulo 12
Teste de Hiptese: Varincia da
N(;
2
)
Neste captulo completaremos o estudo de teste de hiptese sobre parmetros de uma
populao, analisando o caso da varincia de uma populao normal. Assim como na
construo de intervalos de conana, nossa estatstica de teste tem distribuio qui-
quadrado e a regio crtica, como antes, ser formada pelos valores pouco provveis
desta estatstica de teste sob a hiptese nula.
12.1 Contexto bsico
Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia
2
: X N(;
2
). Nosso interesse testar hipteses sobre a a varincia
2
a partir de uma amostra aleatria simples X
1
, X
2
, . . . , X
n
. Como visto anteriormente, a
estatstica

2
=
(n 1)S
2

2
tem distribuio qui-quadrado com n 1 graus de liberdade.
De posse desta estatstica de teste, o procedimento de construo do teste idntico
ao visto nos ltimos captulos: identicadas a hiptese nula (sempre na forma de uma
hiptese simples
2
=
2
0
) e a hiptese alternativa, a regio crtica formada pelos
valores da estatstica de teste pouco provveis sob H
0
. O nvel de signicncia e o
tipo de hiptese alternativa permitem a identicao precisa do que so valores pouco
provveis: so valores na(s) cauda(s) da distribuio de
2
quando a hiptese nula
verdadeira.
Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos
de aplicao.
171
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 172
12.2 Procedimento geral para construo do teste
de hiptese sobre a varincia de uma N(;
2
)
Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria simples de uma populao X cuja dis-
tribuio N(;
2
). Nosso interesse testar alguma hiptese sobre a varincia
2
,
que estimada por
S
2
=
1
n 1
n
P
i=1
(X
i
X)
2
=
1
n 1

n
P
i=1
X
2
i
nX
2

Lembre-se que S
2
um estimador no-viesado de
2
.
12.2.1 Hiptese nula e hiptese alternativa
A hiptese nula que iremos considerar ser
H
0
:
2
=
2
0
As possveis formas da hiptese alternativa so:
Bilateral : H
1
:
2
6=
2
0
Unilateral direita : H
1
:
2
>
2
0
Unilateral esquerda : H
1
:
2
<
2
0
Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento
do problema. Se no temos informao alguma sobre a alternativa, temos que usar um
teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,
ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa
no inclua o sinal de igualdade.
Hipteses do problema Hipteses estatsticas


2
<
2
0

2

2
0

H
0
:
2
=
2
0
H
1
:
2
<
2
0


2
>
2
0

2

2
0

H
0
:
2
=
2
0
H
1
: >
0
12.2.2 Estatstica de teste, erros, regra de deciso
Como o teste sobre a varincia de uma populao normal, a estatstica amostral a ser
utilizada
(n 1)S
2

2

2
(n 1)
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 173
O procedimento de deciso denido em termos da hiptese nula H
0
e as decises
possveis so (i) rejeitar ou (ii) no rejeitar H
0
. Conforme j visto, existem duas possi-
bilidades de erro:
Erro tipo I: rejeitar H
0
quando H
0
verdadeira
Erro tipo II: no rejeitar H
0
quando H
0
falsa
A regra de deciso consiste em denir a regio crtica RC como o conjunto de valores
cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H
0
. Logo,
nossa regra de deciso se baseia na estatstica de teste
X
2
0
=
(n 1)S
2

2
0

2
(n 1)
Os valores com pequena probabilidade de ocorrncia esto nas caudas da distribuio.
Assim, a regio crtica para cada tipo de hiptese alternativa denida como segue:
Alternativa bilateral: X
2
0
> k
S
ou X
2
0
< k
I
Alternativa unilateral direita: X
2
0
> k
S
Alternativa unilateral esquerda: X
2
0
< k
I
Na Figura 12.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.
12.2.3 Nvel de signicncia e regio crtica
O procedimento usual de teste de hiptese consiste em se xar o nvel de signicncia
, que, por denio, a probabilidade do erro tipo I:
= Pr(erro tipo I) = Pr(rejeitar H
0
|H
0
verdadeira)
Assim, para cada tipo de hiptese alternativa a regio crtica identicada impondo-se
a condio
Pr(X RC|H
0
verdadeira) =
Hiptese bilateral
A regio crtica calculada como:
Pr

X
0
> k
S
| X
0

2
(n 1)

+ Pr

X
0
< k
I
| X
0

2
(n 1)

=
Mesmo a distribuio qui-quadrado no sendo simtrica, prtica usual dividir a prob-
abilidade de erro em partes iguais, ou seja, os limites da regio crtica so denidos de
modo que
Pr

X
0
> k
S
| X
0

2
(n 1)

=

2
Pr

X
0
< k
I
| X
0

2
(n 1)

=

2
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 174
Figura 12.1: Regio crtica para testes de hipteses sobre a varincia de uma N(;
2
)
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 175
Usando a notao
2
n;
para denotar a abscissa da distribuio qui-quadrado com
n graus de liberdade que deixa rea (probabilidade) acima dela, resulta a seguinte
regio crtica para o teste bilateral:
X
2
0
>
2
n1;/2
ou X
2
0
<
2
n1;1/2
(12.1)
Teste unilateral direita
A regio crtica calculada como:
Pr

X
0
> k
S
| X
0

2
(n 1)

= =k
S
=
2
n1;
ou seja, a regio crtica
X
2
0
>
2
n1;
(12.2)
Teste unilateral esquerda
De forma anloga, obtm-se a seguinte regio crtica para o teste unilateral esquerda:
X
2
0
<
2
n1;1
(12.3)
12.3 Exemplo 1
Uma amostra aleatria simples de tamanho n = 16 foi retirada de uma populao
normal, obtendo-se s
2
= 32, 1. Ao nvel de signicncia de 5% pode-se dizer que
2
6= 20?
Soluo
As hipteses so
H
0
:
2
= 20
H
1
:
2
6= 20
Com 15 graus de liberdade, teste bilateral e nvel de signicncia de 5%, os valores
crticos necessrios so

2
15;0,975
= 6, 262

2
15;0,025
= 27, 488
e a regio crtica
X
2
0
> 27, 488 ou X
2
0
< 6, 262
O valor observado da estatstica de teste
x
2
0
=
15 32, 1
20
= 24, 075
que no pertence regio crtica. Logo, no se rejeita a hiptese nula, ou seja, no
podemos armar que
2
6= 20.
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 176
12.4 Exemplo 2 (Bussab&Morettin - Exerccio 40 p.
353)
Um escritrio de investimento acredita que o rendimento das diversas aes movimen-
tadas por ele foi de 24% ao longo dos ltimos anos. Uma nova estratgia implementada
para melhorar o desempenho, bem como garantir uma maior uniformidade nos rendi-
mentos das diversas aes. No passado, o desvio padro do rendimento era da ordem
de 5%. Uma amostra de 8 empresas forneceu os seguinjtes rendimentos (dados em %):
23,6; 22,8; 25,7; 24,8; 26,4; 24,3; 23,9; 25. Quais seriam as concluses? Quais so as
hipteses necessrias para a soluo deste problema?
Soluo
Temos que supor que os rendimentos tm distribuio normal. As hipteses de
interesse so > 24 e
2
< 25. Logo, as hipteses estatsticas so
H
0
: = 24 H
0
:
2
= 25
H
1
: > 24 H
1
:
2
< 25
Os dados fornecem
8
P
i=1
x
i
= 196, 5 e
8
P
i=1
x
2
i
= 4835, 99
x =
196, 5
8
= 24, 5625
s
2
=
1
7
[4835, 99 8 24, 5625] =
9, 45875
7
= 1, 35125
Como o tamanho da amostra pequeno e tanto a mdia como varincia so de-
sconhecidas, as estatsticas de teste so T
0
e X
2
0
. Os valores crticos, para um nvel de
signicncia de 5%, so
t
7;0,05
= 1, 895
7;0,95
= 2, 167
e s regies crticas so
T
0
> 1, 895 X
2
0
< 2, 167
Os valores observados das estatsticas de teste so
t
0
=

8
24, 5625 24

1, 35125
= 1, 3687 < 1, 895
x
2
0
=
7 1, 35125
25
= 0, 37835 < 2, 167
Vemos, ento, que t
0
no pertence regio crtica e, portanto, no podemos dizer que o
rendimento mdio aumentou. Por outro lado, x
2
0
pertence regio crtica e, portanto, os
dados indicam que houve reduo na variabilidade dos rendimentos das aes negociadas
pelo escritrio.
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 177
0 1 2 3 4 5 6 7 8 9
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41309 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 0,49995 0,49995 0,49996 0,49996 0,49996 0,49996 0,49996 0,49996 0,49997 0,49997
4 0,49997 0,49997 0,49997 0,49997 0,49997 0,49997 0,49998 0,49998 0,49998 0,49998
4,1 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49998 0,49999 0,49999
4,2 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999
4,3 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999 0,49999
4,4 0,49999 0,49999 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000
4,5 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000 0,50000
Corpo da tabela d a probabilidade p tal que
Distribuio Normal Padro
Tabela 1
) 0 (
c
Z Z P p < < =
CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;
2
) 178
g.l.
n 0,150 0,100 0,050 0,025 0,010 0,005 0,002 0,001
1 1,963 3,078 6,314 12,706 31,821 63,657 159,153 318,309
2 1,386 1,886 2,920 4,303 6,965 9,925 15,764 22,327
3 1,250 1,638 2,353 3,182 4,541 5,841 8,053 10,215
4 1,190 1,533 2,132 2,776 3,747 4,604 5,951 7,173
5 1,156 1,476 2,015 2,571 3,365 4,032 5,030 5,893
6 1,134 1,440 1,943 2,447 3,143 3,707 4,524 5,208
7 1,119 1,415 1,895 2,365 2,998 3,499 4,207 4,785
8 1,108 1,397 1,860 2,306 2,896 3,355 3,991 4,501
9 1,100 1,383 1,833 2,262 2,821 3,250 3,835 4,297
10 1,093 1,372 1,812 2,228 2,764 3,169 3,716 4,144
11 1,088 1,363 1,796 2,201 2,718 3,106 3,624 4,025
12 1,083 1,356 1,782 2,179 2,681 3,055 3,550 3,930
13 1,079 1,350 1,771 2,160 2,650 3,012 3,489 3,852
14 1,076 1,345 1,761 2,145 2,624 2,977 3,438 3,787
15 1,074 1,341 1,753 2,131 2,602 2,947 3,395 3,733
16 1,071 1,337 1,746 2,120 2,583 2,921 3,358 3,686
17 1,069 1,333 1,740 2,110 2,567 2,898 3,326 3,646
18 1,067 1,330 1,734 2,101 2,552 2,878 3,298 3,610
19 1,066 1,328 1,729 2,093 2,539 2,861 3,273 3,579
20 1,064 1,325 1,725 2,086 2,528 2,845 3,251 3,552
21 1,063 1,323 1,721 2,080 2,518 2,831 3,231 3,527
22 1,061 1,321 1,717 2,074 2,508 2,819 3,214 3,505
23 1,060 1,319 1,714 2,069 2,500 2,807 3,198 3,485
24 1,059 1,318 1,711 2,064 2,492 2,797 3,183 3,467
25 1,058 1,316 1,708 2,060 2,485 2,787 3,170 3,450
26 1,058 1,315 1,706 2,056 2,479 2,779 3,158 3,435
27 1,057 1,314 1,703 2,052 2,473 2,771 3,147 3,421
28 1,056 1,313 1,701 2,048 2,467 2,763 3,136 3,408
29 1,055 1,311 1,699 2,045 2,462 2,756 3,127 3,396
30 1,055 1,310 1,697 2,042 2,457 2,750 3,118 3,385
31 1,054 1,309 1,696 2,040 2,453 2,744 3,109 3,375
32 1,054 1,309 1,694 2,037 2,449 2,738 3,102 3,365
33 1,053 1,308 1,692 2,035 2,445 2,733 3,094 3,356
34 1,052 1,307 1,691 2,032 2,441 2,728 3,088 3,348
35 1,052 1,306 1,690 2,030 2,438 2,724 3,081 3,340
40 1,050 1,303 1,684 2,021 2,423 2,704 3,055 3,307
50 1,047 1,299 1,676 2,009 2,403 2,678 3,018 3,261
rea na cauda superior:
Valores crticos da distribuio t -Student
Tabela 2

= > ) ) ( Pr( t n t

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(;


2
) 179
T abela da Qui- Quadrado
Distribuio qui-quadrado
V alores crticos de c
2
tais que
g . l . =
n 0 , 9 9 0 0 , 9 8 0 0 , 9 7 5 0 , 9 5 0 0 , 9 0 0 0 , 8 0 0 0 , 2 0 0 0 , 1 0 0 0 , 0 5 0 0 , 0 2 5 0 , 0 2 0 0 , 0 1 0
1 0,000 0,001 0,001 0,004 0,016 0,064 1,642 2,706 3,841 5,024 5,412 6,635
2 0,020 0,040 0,051 0,103 0,211 0,446 3,219 4,605 5,991 7,378 7,824 9,210
3 0,115 0,185 0,216 0,352 0,584 1,005 4,642 6,251 7,815 9,348 9,837 11,345
4 0,297 0,429 0,484 0,711 1,064 1,649 5,989 7,779 9,488 11,143 11,668 13,277
5 0,554 0,752 0,831 1,145 1,610 2,343 7,289 9,236 11,070 12,833 13,388 15,086
6 0,872 1,134 1,237 1,635 2,204 3,070 8,558 10,645 12,592 14,449 15,033 16,812
7 1,239 1,564 1,690 2,167 2,833 3,822 9,803 12,017 14,067 16,013 16,622 18,475
8 1,646 2,032 2,180 2,733 3,490 4,594 11,030 13,362 15,507 17,535 18,168 20,090
9 2,088 2,532 2,700 3,325 4,168 5,380 12,242 14,684 16,919 19,023 19,679 21,666
1 0 2,558 3,059 3,247 3,940 4,865 6,179 13,442 15,987 18,307 20,483 21,161 23,209
1 1 3,053 3,609 3,816 4,575 5,578 6,989 14,631 17,275 19,675 21,920 22,618 24,725
1 2 3,571 4,178 4,404 5,226 6,304 7,807 15,812 18,549 21,026 23,337 24,054 26,217
1 3 4,107 4,765 5,009 5,892 7,042 8,634 16,985 19,812 22,362 24,736 25,472 27,688
1 4 4,660 5,368 5,629 6,571 7,790 9,467 18,151 21,064 23,685 26,119 26,873 29,141
1 5 5,229 5,985 6,262 7,261 8,547 10,307 19,311 22,307 24,996 27,488 28,259 30,578
1 6 5,812 6,614 6,908 7,962 9,312 11,152 20,465 23,542 26,296 28,845 29,633 32,000
1 7 6,408 7,255 7,564 8,672 10,085 12,002 21,615 24,769 27,587 30,191 30,995 33,409
1 8 7,015 7,906 8,231 9,390 10,865 12,857 22,760 25,989 28,869 31,526 32,346 34,805
1 9 7,633 8,567 8,907 10,117 11,651 13,716 23,900 27,204 30,144 32,852 33,687 36,191
2 0 8,260 9,237 9,591 10,851 12,443 14,578 25,038 28,412 31,410 34,170 35,020 37,566
2 1 8,897 9,915 10,283 11,591 13,240 15,445 26,171 29,615 32,671 35,479 36,343 38,932
2 2 9,542 10,600 10,982 12,338 14,041 16,314 27,301 30,813 33,924 36,781 37,659 40,289
2 3 10,196 11,293 11,689 13,091 14,848 17,187 28,429 32,007 35,172 38,076 38,968 41,638
2 4 10,856 11,992 12,401 13,848 15,659 18,062 29,553 33,196 36,415 39,364 40,270 42,980
2 5 11,524 12,697 13,120 14,611 16,473 18,940 30,675 34,382 37,652 40,646 41,566 44,314
2 6 12,198 13,409 13,844 15,379 17,292 19,820 31,795 35,563 38,885 41,923 42,856 45,642
2 7 12,879 14,125 14,573 16,151 18,114 20,703 32,912 36,741 40,113 43,195 44,140 46,963
2 8 13,565 14,847 15,308 16,928 18,939 21,588 34,027 37,916 41,337 44,461 45,419 48,278
2 9 14,256 15,574 16,047 17,708 19,768 22,475 35,139 39,087 42,557 45,722 46,693 49,588
3 0 14,953 16,306 16,791 18,493 20,599 23,364 36,250 40,256 43,773 46,979 47,962 50,892
2
;

n
( )

=
2
;
2
Pr
n n

Você também pode gostar