Você está na página 1de 184

i

UNIVERSIDADE FEDERAL FLUMINENSE


INSTITUTO DE MATEMTICA

DEPARTAMENTO DE ESTATSTICA

INFERNCIA ESTATSTICA

Ana Maria Lima de Farias

Outubro 2008

Contedo
1 Inferncia Estatstica - Conceitos Bsicos
1.1 Introduo . . . . . . . . . . . . . . . . . .
1.1.1 Exemplo 1 . . . . . . . . . . . . . .
1.1.2 Exemplo 2 . . . . . . . . . . . . . .
1.2 Populao . . . . . . . . . . . . . . . . . .
1.3 Amostra aleatria simples . . . . . . . . .
1.4 Estatsticas e Parmetros . . . . . . . . . .
1.5 Distribuies Amostrais . . . . . . . . . .
1.6 Propriedades de estimadores . . . . . . . .
1.7 Resumo do Captulo . . . . . . . . . . . .
1.8 Exerccios . . . . . . . . . . . . . . . . . .
1.9 Soluo do Exerccio . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

2 Distribuio Amostral da Mdia


2.1 Mdia e varincia da distribuio amostral da mdia . .
2.2 Distribuio amostral da mdia para populaes normais
2.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Lista de Exerccios 1 . . . . . . . . . . . . . . . .
2.4 Teorema Limite Central . . . . . . . . . . . . . . . . . .
2.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . .
2.5 Distribuio amostral da varincia amostral . . . . . . .
2.6 Resumo do Captulo . . . . . . . . . . . . . . . . . . . .
2.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8 Soluo das Listas de Exerccios . . . . . . . . . . . . . .
2.9 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . .
3 Distribuio Amostral da Proporo
3.1 Aproximao normal da distribuio binomial
3.1.1 Lista de Exerccios 1 . . . . . . . . . .
3.2 A distribuio amostral da proporo . . . . .
3.2.1 Lista de Exerccios 2 . . . . . . . . . .
3.3 Resumo do Captulo . . . . . . . . . . . . . .
3.4 Exerccios . . . . . . . . . . . . . . . . . . . .
3.5 Soluo das Listas de Exerccios . . . . . . . .
3.6 Soluo dos Exerccios . . . . . . . . . . . . .
ii

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

1
1
2
2
3
3
4
5
10
12
13
19

.
.
.
.
.
.
.
.
.
.
.

22
22
23
24
29
29
32
32
33
34
36
37

.
.
.
.
.
.
.
.

43
43
46
48
49
49
50
51
53

CONTEDO

iii

4 Intervalos de Confiana
4.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Intervalo de confiana: mdia da N(; 2 ), 2 conhecida
4.2.1 Notao . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Interpretao do intervalo de confiana para . .
4.2.3 Lista de Exerccios 1 . . . . . . . . . . . . . . . .
4.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . .
4.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . .
4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Soluo das Listas de Exerccios . . . . . . . . . . . . . .
4.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

56
56
59
59
61
63
63
66
66
67
68
69

5 Intervalos de Confiana: Propores - Amostra Grande


5.1 Estimao de uma proporo populacional . . . . . . . . .
5.2 Intervalo de confiana para a proporo populacional . . .
5.3 Determinao do tamanho da amostra . . . . . . . . . . .
5.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . .
5.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.6 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

73
73
74
77
80
81
82

6 Intervalo de Confiana: Mdia da N(; 2 ), 2 Desconhecida


6.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Intervalo de confiana para a mdia de uma populao normal com varincia desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4 Amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5 Resumo comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5.1 IC para a mdia de populaes normais . . . . . . . . . . . . . . .
6.5.2 IC para uma proporo . . . . . . . . . . . . . . . . . . . . . . . .
6.5.3 Intervalo de confiana para a mdia de populaes no-normais amostra grande . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7 Intervalo de Confiana: Varincia da N(; 2 )
7.1 Idias bsicas . . . . . . . . . . . . . . . . . .
7.2 Intervalo de confiana para a varincia de uma
7.3 Exerccios . . . . . . . . . . . . . . . . . . . .
7.4 Soluo dos Exerccios . . . . . . . . . . . . .

. . . . . .
populao
. . . . . .
. . . . . .

. . . . .
normal
. . . . .
. . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

84
84
85
87
87
89
90
90
91
91
94
96
96
96
100
101

8 Testes de Hipteses
102
8.1 Noes bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

CONTEDO

8.2

8.3
8.4
8.5
8.6
8.7
8.8

iv

8.1.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . .
8.1.4 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . .
8.1.5 Exemplo 5 . . . . . . . . . . . . . . . . . . . . . . .
8.1.6 Exemplo 6 . . . . . . . . . . . . . . . . . . . . . . .
8.1.7 Lista de Exerccios 1 . . . . . . . . . . . . . . . . .
Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . .
8.2.1 Hiptese nula . . . . . . . . . . . . . . . . . . . . .
8.2.2 Hiptese alternativa . . . . . . . . . . . . . . . . .
8.2.3 Estatstica de teste, erros e regra de deciso . . . .
8.2.4 Regio crtica e nvel de significncia . . . . . . . .
8.2.5 Funo caracterstica de operao e poder do teste .
Exemplo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemplo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . .
Resumo do Captulo . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . .
Soluo das Listas de Exerccios . . . . . . . . . . . . . . .
Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . .

9 Teste de Hiptese: Mdia da N(; 2 ) - 2 Conhecida


9.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Hipteses nula e alternativa . . . . . . . . . . . .
9.1.2 Estatstica de teste . . . . . . . . . . . . . . . . .
9.1.3 Nvel de significncia e regio crtica . . . . . . .
9.1.4 Determinao da regio crtica . . . . . . . . . . .
9.1.5 Poder . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4 Procedimento geral para construo do teste de hiptese
de uma N(; 2 ) - 2 conhecida . . . . . . . . . . . . . .
9.4.1 Teste bilateral . . . . . . . . . . . . . . . . . . . .
9.4.2 Teste unilateral direita . . . . . . . . . . . . . .
9.4.3 Teste unilateral esquerda . . . . . . . . . . . . .
9.4.4 Teste de hiptese versus intervalo de confiana . .
9.5 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5.1 Teste bilateral - Valor P para o Exemplo 1 . . . .
9.5.2 Teste unilateral direita - Exemplo 2 . . . . . . .
9.5.3 Teste unilateral esquerda - Exemplo 3 . . . . . .
9.6 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
9.8 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

106
107
108
109
109
110
110
111
111
111
112
113
114
115
116
117
118
121

126
. 127
. 127
. 127
. 127
. 129
. 129
. 130
. 132

. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
sobre a mdia
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .

134
135
137
137
138
139
139
140
140
141
143
144

CONTEDO
10 Teste de Hiptese: Propores - Amostra Grande
10.1 Contexto bsico . . . . . . . . . . . . . . . . . . . .
10.2 Teste de hipteses sobre propores . . . . . . . . .
10.2.1 Teste bilateral . . . . . . . . . . . . . . . . .
10.2.2 Testes unilaterais . . . . . . . . . . . . . . .
10.3 Valor P . . . . . . . . . . . . . . . . . . . . . . . .
10.4 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . .
10.5 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . .
10.6 Resumo do Captulo . . . . . . . . . . . . . . . . .
10.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
10.8 Soluo dos Exerccios . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

149
. 149
. 150
. 151
. 152
. 152
. 152
. 153
. 154
. 155
. 156

11 Teste de Hiptese: Mdia da N(; 2 ) - 2 Desconhecida


159
11.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
11.2 Procedimento geral para construo do teste de hiptese sobre a mdia
de uma N(; 2 ) - 2 desconhecida . . . . . . . . . . . . . . . . . . . . . 160
11.2.1 Hiptese nula e hiptese alternativa . . . . . . . . . . . . . . . . . 160
11.2.2 Estatstica de teste, erros, regra de deciso . . . . . . . . . . . . . 161
11.2.3 Nvel de significncia e regio crtica . . . . . . . . . . . . . . . . 163
11.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.3.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.3.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
11.3.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
11.4 Poder do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.5 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
11.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
12 Teste de Hiptese: Varincia da N(; 2 )
171
12.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
12.2 Procedimento geral para construo do teste de hiptese sobre a varincia
de uma N(; 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
12.2.1 Hiptese nula e hiptese alternativa . . . . . . . . . . . . . . . . . 172
12.2.2 Estatstica de teste, erros, regra de deciso . . . . . . . . . . . . . 172
12.2.3 Nvel de significncia e regio crtica . . . . . . . . . . . . . . . . 173
12.3 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
12.4 Exemplo 2 (Bussab&Morettin - Exerccio 40 p. 353) . . . . . . . . . . . . 176

Captulo 1
Inferncia Estatstica - Conceitos
Bsicos
No estudo de mtodos estatsticos, j foi visto como resumir um conjunto de dados
atravs de tabelas de freqncias, grficos e medidas de posio e disperso. Depois,
foram estudados modelos probabilsticos, discretos ou contnuos, para descrever determinados fenmenos. Agora, essas ferramentas sero utilizadas no estudo de um importante
ramo da Estatstica, conhecido como Inferncia Estatstica, que busca mtodos de fazer
afirmaes sobre caractersticas de uma populao, conhecendo-se apenas resultados de
uma amostra.
Neste captulo voc estudar os seguintes conceitos:
populao e amostra
amostra aleatria simples
estatsticas e parmetros
estimador
distribuio amostral de um estimador

1.1

Introduo

No estudo da estatstica descritiva, vimos que populao o conjunto de elementos para


os quais se deseja estudar determinada(s) caracterstica(s). Vimos tambm que uma
amostra um subconjunto da populao. No estudo da inferncia estatstica, o objetivo
principal obter informaes sobre uma populao a partir das informaes de uma
amostra e aqui vamos precisar de definies mais formais de populao e amostra. Para
facilitar a compreenso destes conceitos, iremos apresentar alguns exemplos a ttulo de
ilustrao.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

1.1.1

Exemplo 1

Em um estudo antropomtrico em nvel nacional, uma amostra de 5000 adultos selecionada dentre os adultos brasileiros e uma das variveis de estudo a altura.
Neste exemplo, a populao o conjunto de todos os brasileiros adultos. No entanto, o interesse (um deles, pelo menos) est na altura dos brasileiros. Assim, nesse
estudo, a cada sujeito da populao associamos um nmero correspondente sua altura.
Se determinado sujeito sorteado para entrar na amostra, o que nos interessa esse
nmero, ou seja, sua altura. Como vimos, essa a definio de varivel aleatria: uma
funo que associa a cada ponto do espao amostral um nmero real. Dessa forma, a
nossa populao pode ser representada pela varivel aleatria X = altura do adulto
brasileiro. Como essa uma v.a. contnua, a ela est associada uma funo de densidade de probabilidade f e da literatura, sabemos que razovel supor que essa densidade
seja a densidade normal. Assim, nossa populao, nesse caso, representada por uma
v.a. X N (; 2 ). Conhecendo os valores de e teremos informaes completas
sobre a nossa populao.
Uma forma de obtermos os valores de e medindo as alturas de todos os
brasileiros adultos. Mas esse seria um procedimento caro e demorado. Uma soluo,
ento, retirar uma amostra (subonjunto) da populao e estudar essa amostra. Suponhamos que essa amostra seja retirada com reposio e que os sorteios sejam feitos de
forma independente, isto , o resultado de cada extrao no altera o resultado das demais extraes. Ao sortearmos o primeiro elemento, estamos realizando um experimento
que d origem v.a. X1 =altura do primeiro elemento; o segundo elemento d origem
v.a. X2 =altura do segundo elemento e assim por diante. Como as extraes so
feitas com reposio, todas as v.a. X1 , X2 , . . . tm a mesma distribuio, que reflete
a distribuio da altura de todos os brasileiros adultos. Para uma amostra especfica,
temos os valores observados x1 , x2 , . . . dessas variveis aleatrias.

1.1.2

Exemplo 2

Consideremos, agora, um exemplo baseado em pesquisas eleitorais, em que estamos interessados no resultado do segundo turno de uma eleio presidencial brasileira. Mais
uma vez, nossos sujeitos de pesquisa so pessoas com 16 anos ou mais, aptas a votar. O
interesse final saber a proporo de votos de um e outro candidato. Vamos considerar
uma situao simplificada em que no estamos considerando votos nulos, indecisos, etc.
Ento, cada sujeito de pesquisa d origem a uma varivel aleatria binria, isto , uma
v.a. que assume apenas dois valores. Como visto, podemos representar esses valores por
1 (candidato A) e 0 (candidato B), o que define uma varivel aleatria de Bernoulli, ou
seja, essa populao pode ser representada pela v.a. X Bern(p). O parmetro p representa a probabilidade de um sujeito dessa populao votar no candidato A. Uma outra
interpretao que p representa a proporo populacional de votantes no candidato A.
Para obtermos informao sobre p, retira-se uma amostra da populao e, como
antes, vamos supor que essa amostra seja retirada com reposio. Ao sortearmos o
primeiro elemento, estamos realizando um experimento que d origem v.a. X1 =voto

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

do primeiro elemento; o segundo elemento d origem v.a. X2 =voto do segundo


elemento e assim por diante. Como as extraes so feitas com reposio, todas as
v.a. X1 , X2 , . . . tm a mesma distribuio de Bernoulli populacional, isto , Xi
Bern(p), i = 1, 2, . . . .

1.2

Populao

A inferncia estatstica trata do problema de se obter informao sobre uma populao


a partir de uma amostra. Embora a populao real possa ser constituda de pessoas,
empresas, animais, etc., as pesquisas estatsticas buscam informaes sobre determinadas caractersticas dos sujeitos, caractersticas essas que podem ser representadas por
nmeros. Sendo assim, a cada sujeito da populao est associado um nmero, o que
nos permite apresentar a seguinte definio.
Definio 1.1 A populao de uma pesquisa estatstica pode ser representada por uma
varivel aleatria X que descreve a caracterstica de interesse.
Os mtodos de inferncia nos permitiro obter estimativas dos parmetros de tal
varivel aleatria, que pode ser contnua ou discreta.

1.3

Amostra aleatria simples

Como j dito, bastante comum o emprego da amostragem em pesquisas estatsticas.


Nas pesquisas por amostragem, uma amostra selecionada da populao de interesse e
todas as concluses sero baseadas apenas nessa amostra. Para que seja possvel inferir
resultados para a populao a partir da amostra, necessrio que esta seja representativa da populao.
Embora existam vrios mtodos de seleo de amostras, vamos nos concentrar aqui
no caso mais simples, que a amostragem aleatria simples. Segundo tal mtodo, toda
amostra de mesmo tamanho n tem igual chance (probabilidade) de ser sorteada.
possvel extrair amostras aleatrias simples com e sem reposio. Quando estudamos as
distribuies binomial e hipergeomtrica, vimos que a distribuio binomial correspondia a extraes com reposio e a distribuio hipergeomtrica correspondia a extraes
sem reposio. No entanto, para populaes grandes - ou infinitas - extraes com e
sem reposio no levam a resultados muito diferentes. Assim, no estudo da Inferncia
Estatstica, estaremos lidando sempre com amostragem aleatria simples com reposio.
Este mtodo de seleo atribui a cada elemento da populao a mesma probabilidade
de ser selecionado e esta probabilidade se mantm constante ao longo do processo de seleo da amostra (se as extraes fossem sem reposio isso no aconteceria). No restante
desse curso omitiremos a expresso com reposio, ou seja, o termo amostragem (ou
amostra) aleatria simples sempre se referir amostragem com reposio. Por simplicidade, muitas vezes abreviaremos o termo amostra aleatria simples por aas.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

Uma forma de se obter uma amostra aleatria simples escrever os nmeros ou


nomes dos elementos da populao em cartes iguais, colocar estes cartes em uma urna
misturando-os bem e fazer os sorteios necessrios, tendo o cuidado de colocar cada carto
sorteado na urna antes do prximo sorteio. Na prtica, em geral so usados programas
de computador, uma vez que as populaes tendem a ser muito grandes.
Agora vamos formalizar o processo de seleo de uma amostra aleatria simples, de
forma a relacion-lo com os problemas de inferncia estatstica que iremos estudar.
Seja uma populao representada por uma varivel aleatria X. De tal populao
ser sorteada uma amostra aleatria simples com reposio de tamanho n. Como visto
nos exemplos anteriores, cada sorteio d origem a uma varivel aleatria Xi e, como os
sorteios so com reposio, todas essas variveis tm a mesma distribuio de X. Isso
nos leva seguinte definio.
Definio 1.2 Uma amostra aleatria simples (aas) de tamanho n de uma v.a.
X (populao) um conjunto de n v.a. X1 , X2 , ..., Xn independentes e identicamente
distribudas (i.i.d.).
interessante notar a conveno usual: o valor observado de uma v.a. X representado pela letra minscula correspondente. Assim, depois do sorteio de uma aas de
tamanho n, temos valores observados x1 , x2 , . . . , xn das respectivas variveis aleatrias.

1.4

Estatsticas e Parmetros

Obtida uma aas, possvel calcular diversas caractersticas desta amostra, como, por
exemplo, a mdia, a mediana, a varincia, etc. Qualquer uma destas caractersticas
uma funo de X1 , X2 , ..., Xn e, portanto, o seu valor depende da amostra sorteada.
Sendo assim, cada uma dessas caractersticas ou funes tambm uma v.a. . Por
exemplo, a mdia amostral a v.a. definida por
X=

X1 + X2 + + Xn
n

Temos, ento, a seguinte definio:


Definio 1.3 Uma estatstica amostral ou estimador T qualquer funo da
amostra X1 , X2 , ..., Xn , isto ,
T = g(X1 , X2 , ..., Xn )
onde g uma funo qualquer.
As estatsticas amostrais que estaremos considerando neste curso so

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


mdia amostral

X=

varincia amostral

S2 =

X1 + X2 + + Xn
n
n
2
1 P
Xi X
n 1 i=1

(1.1)

(1.2)

Para uma amostra especfica, o valor obido para o estimador ser denominado estimativa e, em geral, sero representadas por letras minsculas. Por exemplo, temos as
seguintes notaes correspondentes mdia amostral e varincia: x e s2 .
Outras estatsticas possveis so o mnimo amostral, o mximo amostral, a amplitude
amostral, etc.
De forma anloga, temos as caractersticas de interesse da populao. No entanto,
para diferenciar entre as duas situaes (populao e amostra), atribuimos nomes diferentes.
Definio 1.4 Um parmetro uma caracterstica da populao.
Assim, se a populao representada pela v.a. X, alguns parmetros so a esperana
E(X) e a varincia V ar(X) de X.
Com relao s caractersticas mais usuais, vamos usar a seguinte notao:
Caracterstica

Parmetro Estatstica
(populao) (amostra)
Mdia

X
Varincia
2
S2
Nmero de elementos
N
n
Lembre-se que, para uma v.a. discreta (finita) uniforme,
= E(X) =

V ar(X) =

1.5

N
1 P
Xi
N i=1

N
N
N
1 P
1 P
1 P
[Xi E(X)]2 =
[Xi ]2 =
Xi2 2
N i=1
N i=1
N i=1

Distribuies Amostrais

Nos problemas de inferncia, estamos interessados em estimar um parmetro da populao (por exemplo, a mdia populacional) atravs de uma aas X1 , X2 , ..., Xn . Para isso,
usamos uma estatstica T (por exemplo, a mdia amostral) e, com base no valor obtido
para T a partir de uma particular amostra, iremos tomar as decises que o problema
exige. J foi dito que T uma v.a., uma vez que depende da amostra sorteada; amostras
diferentes fornecero diferentes valores para T .

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

Consideremos o seguinte exemplo, onde nossa populao o conjunto {1, 3, 6, 8}, isto
, este o conjunto dos valores da caracterstica de interesse da populao em estudo.
Assim, para esta populao, ou seja, para essa v.a. X temos
E(X) = =

V ar(X) = 2 =
= 7, 25

1
(1 + 3 + 6 + 8) = 4, 5
4

1
(1 4, 5)2 + (3 4, 5)2 + (6 4, 5)2 + (8 4, 5)2
4

Suponha que dessa populao iremos extrair uma aas de tamanho 2 e a estatstica
que iremos calcular a mdia amostral. Algumas possibilidades de amostra so {1,1},
{1,3}, {6,8}, para as quais os valores da mdia amostral so 1, 2 e 7, respectivamente.
Podemos ver, ento, que h uma variabilidade nos valores da estatstica e, assim, seria
interessante que conhecssemos tal variabilidade. Conhecendo tal variabilidade, temos
condies de saber quo infelizes podemos ser no sorteio da amostra. No exemplo
acima, as amostras {1,1} e {8,8} so as que tm mdia amostral mais afastada da
verdadeira mdia populacional. Se esses valores tiverem chance muito mais alta do que
os valores mais prximos de E(X), podemos ter srios problemas.
Para conhecer o comportamento da mdia amostral, teramos que conhecer todos
os possveis valores de X, o que equivaleria a conhecer todas as possveis amostras de
tamanho 2 de tal populao. Nesse exemplo, como s temos 4 elementos na populao,
a obteno de todas as aas de tamanho 2 no difcil.
Lembre-se do nosso estudo de anlise combinatria: como o sorteio feito com
reposio, em cada um dos sorteios temos 4 possibilidades. Logo, o nmero total de
amostras aleatrias simples 4 4 = 16. Por outro lado, em cada sorteio, cada elemento da populao tem a mesma chance de ser sorteado; como so 4 elementos, cada
elemento tem probabilidade 1/4 de ser sorteado. Finalmente, como os sorteios so independentes, para obter a probabilidade de um par de elementos pertencer amostra
basta multiplicar as probabilidades (lembre-se que Pr(A B) = Pr(A) Pr(B) quando
A e B so independentes). A independncia dos sorteios garantida pela reposio de
cada elemento sorteado. Na Tabela 1.1 a seguir listamos todas as possveis amostras,
com suas respectivas probabilidades e para cada uma delas, apresentamos o valor da
mdia amostral.
Analisando esta tabela, podemos ver que os possveis valores X so 1; 2; 3; 3,5; 4,5;
5,5; 6; 7; 8 e podemos construir a sua funo de distribuio de probabilidade, notando,
por exemplo, que o valor 2 pode ser obtido atravs de duas amostras: (1,3) ou (3,1).
Como essas amostras correspondem a eventos mutuamente exclusivos, a probabilidade
de se obter uma mdia amostral igual a 2
Pr(X = 2) = Pr({1, 3} {3, 1})
= Pr({1, 3}) + Pr({3, 1})
1
1
2
=
+
=
16 16
16

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


Amostra
(1, 1)
(1, 3)
(1, 6)
(1, 8)
(3, 1)
(3, 3)
(3, 6)
(3, 8)
(6, 1)
(6, 3)
(6, 6)
(6, 8)
(8, 1)
(8, 3)
(8, 6)
(8, 8)

Probabilidade
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16

Mdia amostral x
(1 + 1)/2 = 1
(1 + 3)/2 = 2
(1 + 6)/2 = 3, 5
(1 + 8)/2 = 4, 5
(3 + 1)/2 = 2
(3 + 3)/2 = 3
(3 + 6)/2 = 4, 5
(3 + 8)/2 = 5, 5
(6 + 1)/2 = 3, 5
(6 + 3)/2 = 4, 5
(6 + 6)/2 = 6
(6 + 8)/2 = 7
(8 + 1)/2 = 4, 5
(8 + 3)/2 = 5, 5
(8 + 6)/2 = 7
(8 + 8)/2 = 8

Tabela 1.1: Distribuio amostral da mdia amostral


Com o mesmo raciocnio, obtemos a seguinte funo de distribuio de probabilidade
para X :
x
1
2
3
3, 5
4, 5
5, 5
6
7
8
Pr(X = x) 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 1/16
Note que a v.a. de interesse aqui X! Da segue que
2
1
2
1
+2
+3
+ 3, 5
+
16
16
16
16
2
1
2
1
5
+ 5, 5
+6
+7
+8
4, 5
16
16
16
16
16
= 4, 5 =

E(X) = 1

e
1
2
1
+ (2 4, 5)2
+ (3 4, 5)2
16
16
16
2
5
2
+(3, 5 4, 5)2
+ (4, 5 4, 5)2
+ (5, 5 4, 5)2
16
16
16
1
2
1
+ (7 4, 5)2
+ (8 4, 5)2
+(6 4, 5)2
16
16
16
2
2
7, 25
=
=
= 3, 625 =
2
2
n

V ar(X) = (1 4, 5)2

Neste exemplo podemos ver que E(X) = e V ar(X) = 2 /2, onde 2 o tamanho
da amostra. Esses resultados esto nos dizendo que, em mdia (esperana), a estatstica

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

X igual mdia da populao e que sua varincia igual varincia da populao


dividida pelo tamanho da amostra. Na Figura 1.1 temos os grficos da funo de
distribuio de probabilidade de X (populao) na parte (a) e de X (amostra) na parte
(b). Podemos ver que a mdia de ambas 4,5 (ambas so simtricas em torno de 4,5)
e que a distribuio de X tem menor disperso em torno dessa mdia. Note que essa
mdia e essa varincia so calculadas ao longo de todas as possveis aas de tamanho 2.

0,4
0,3
0,2
0,1
0
0

(a)
0,4
0,3
0,2
0,1
0
0

(b)

Figura 1.1: Funo de distribuio de probabilidade de X e de X para aas de tamanho


2 tirada da populao {1, 3, 6, 8}
Consideremos, agora, a mesma situao, s que, em vez de estudarmos a mdia
amostral, uma medida de posio, vamos estudar a disperso. Como visto, a varincia
populacional V ar(X) = 7, 25. Para a amostra, vamos trabalhar com dois estimadores.
Um deles vai ser S 2 , definido na Equao (1.2) e o outro vai ser

b2 =

n
2
1P
Xi X
n i=1

(1.3)

Da mesma forma que fizemos para a mdia amostral, vamos calcular o valor
dessas estatsticas para cada uma das amostras. Na Tabela 1.2 temos os resultados
parciais e globais de interesse.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


Amostra

(x1 x)2

(x2 x)2

(1, 1)
(1, 3)
(1, 6)
(1, 8)
(3, 1)
(3, 3)
(3, 6)
(3, 8)
(6, 1)
(6, 3)
(6, 6)
(6, 8)
(8, 1)
(8, 3)
(8, 6)
(8, 8)

1
2
3, 5
4, 5
2
3
4, 5
5, 5
3, 5
4, 5
6
7
4, 5
5, 5
7
8

(1 1)2
(1 2)2
(1 3, 5)2
(1 4, 5)2
(3 2)2
(3 3)2
(3 4, 5)2
(3 5, 5)2
(6 3, 5)2
(6 4, 5)2
(6 6)2
(6 7)2
(8 4, 5)2
(8 5, 5)2
(8 7)2
(8 8)2

(1 1)2
(3 2)2
(6 3, 5)2
(8 4, 5)2
(1 2)2
(3 3)2
(6 4, 5)2
(8 5, 5)2
(1 3, 5)2
(3 4, 5)2
(6 6)2
(8 7)2
(1 4, 5)2
(3 5, 5)2
(6 7)2
(8 8)2

2
P

(xi x)2

S2

i=1

0
2
12, 5
24, 5
2
0
4, 5
12, 5
12, 5
4, 5
0
2
24, 5
12, 5
2
0

b2

0
0
2
1
12, 5 6, 25
24, 5 12, 25
2
1
0
0
4, 5 2, 25
12, 5 6, 25
12, 5 6, 25
4, 5 2, 25
0
0
2
1
24, 5 12, 25
12, 5 6, 25
2
1
0
0

Tabela 1.2: Distribuio amostral de 2 estimadores da varincia


Podemos ver que a funo de distribuio de probabilidade de S 2
s2
0
2
4, 5 12, 5 24, 5
2
2
Pr(S = s ) 4/16 4/16 2/16 4/16 2/16
e a funo de distribuio de probabilidade de
b2

k
0
1
2, 25 6, 25 12, 25
2
Pr(b
= k) 4/16 4/16 2/16 4/16 2/16

Para essas distribuies temos:


E(S 2 ) = 0
=

4
2
4
2
4
+2
+ 4, 5
+ 12, 5
+ 24, 5
16
16
16
16
16

116
= 7, 25 = 2 = V ar(X)
16

e
E(b
2) = 0
=

4
2
4
2
4
+1
+ 2, 25
+ 6, 25
+ 12, 25
16
16
16
16
16

58
= 3, 625
16

Vemos que, em mdia, S 2 igual varincia populacional, o que no ocorre com


b2 .
Estes dois exemplos ilustram o fato de que qualquer estatstica amostral T uma
varivel aleatria, que assume diferentes valores para cada uma das diferentes amostras

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

10

e tais valores, juntamente com a probabilidade de cada amostra, nos forneceriam a


funo de distribuio de probabilidades de T , caso fosse possvel obter todas as aas de
tamanho n da populao. Isso nos leva seguinte definio, que um conceito central
na Inferncia Estatstica.
Definio 1.5 A funo de distribuio amostral de uma estatstica T a funo
de distribuio de probabilidades de T ao longo de todas as possveis amostras de tamanho
n.
Podemos ver que a obteno da distribuio amostral de qualquer estatstica T um
processo to ou mais complicado do que trabalhar com a populao inteira. Na prtica,
o que temos uma nica amostra e com esse resultado que temos que tomar as decises
pertinentes ao problema em estudo. Esta tomada de deciso, no entanto, ser facilitada
se conhecermos resultados tericos sobre o comportamento da distribuio amostral.

1.6

Propriedades de estimadores

No exemplo anterior, relativo varincia amostral, vimos que E(S 2 ) = 2 e E(b


2 ) 6=
2 . Analogamente, vimos tambm que E(X) = . Vamos entender direito o que esses
resultados significam, antes de passar a uma definio formal da propriedade envolvida.
Dada uma populao, existem muitas e muitas aas de tamanho n que podem ser
sorteadas. Cada uma dessas amostras resulta em um valor diferente da estatstica de
interesse (X e S 2 , por exemplo). O que esses resultados esto mostrando como esses
diferentes valores se comportam em relao ao verdadeiro (mas desconhecido) valor do
parmetro.
Considere a Figura 1.2, onde o alvo representa o valor do parmetro e os tiros,
indicados pelos smbolo x, representam os diferentes valores amostrais da estatstica de
interesse.
Nas partes (a) e (b) da figura, os tiros esto em torno do alvo, enquanto nas partes
(c) e (d) isso no acontece. Comparando as partes (a) e (b), podemos ver que na parte
(a) os tiros esto mais concentrados em torno do alvo, isto , tm menor disperso. Isso
reflete uma pontaria mais certeira do atirador em (a). Analogamente, nas partes (c) e
(d), embora ambos os atiradores estejam com a mira deslocada, os tiros do atirador (c)
esto mais concentrados em torno de um alvo; o deslocamento poderia at ser resultado
de um desalinhamento da arma. J o atirador (d), alm de estar com o alvo deslocado,
ele tem os tiros mais espalhados, o que reflete menor preciso.
Traduzindo esta situao para o contexto de estimadores e suas propriedades, temos o
seguinte: nas partes (a) e (b), temos dois estimadores que fornecem estimativas centradas
em torno do verdadeiro valor do parmetro, ou seja, as diferentes amostras fornecem
valores distribudos em torno do verdadeiro valor do parmetro. A diferena que
em (b) esses valores esto mais dispersos e, assim, temos mais chance de obter uma
amostra infeliz, ou seja, uma amostra que fornea um resultado muito afastado do
valor do parmetro. Essas duas propriedades esto associadas esperana e varincia

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

11

Figura 1.2: Propriedades de estimadores


do estimador, que so medidas de centro e disperso, respectivamente. Nas partes (c)
e (d), as estimativas esto centradas em torno de um valor diferente do parmetro de
interesse e na parte (d), a disperso maior.
Temos, assim, ilustrados os seguintes conceitos.
Definio 1.6 Um estimador T dito um estimador no-viesado do parmetro
se E(T ) = .
Como nos exemplos vistos, essa esperana calculada ao longo de todas as possveis
amostras, ou seja, a esperana da distribuio amostral de T. Nas partes (a) e (b) da
Figura 1.2 os estimadores so no-viesados e nas partes (c) e (d), os estimadores so
viesados.
Com relao aos estimadores X, S 2 e
b2 , veremos formalmente que os dois primeiros
so no-viesados para estimar a mdia e a varincia populacionais, respectivamente,
enquanto
b2 viesado para estimar a varincia populacional. Essa a razo para se
usar S 2 , e no
b2 .
Definio 1.7 Se T1 e T2 so dois estimadores no-viesados do parmetro , diz-se que
T1 mais eficiente que T2 se V ar(T1 ) < V ar(T2 ).

Na Figura 1.2, o estimador da parte (a) mais eficiente que o estimador da parte
(b).

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

12

Uma outra propriedade dos estimadores est relacionada idia bastante intuitiva
de que medida que se aumenta o tamanho da amostra, mais perto devemos ficar do
verdadeiro valor do parmetro.
Definio 1.8 Uma seqncia {Tn } de estimadores de um prmetro consistente se,
para todo > 0
lim Pr {|Tn | > } = 0
n

Uma maneira alternativa de verificar se uma seqncia de estimadores consistente


dada a seguir.
Teorema 1.1 Uma seqncia {Tn } de estimadores de um prmetro consistente se
lim E(Tn ) =

lim V ar(Tn ) = 0

1.7

Resumo do Captulo

Ao final deste captulo, voc dever ser capaz de compreender perfeitamente os seguintes
conceitos:
A populao de uma pesquisa estatstica descrita por uma varivel aleatria X,
que descreve a caracterstica de interesse. Essa varivel aleatria pode ser discreta
ou contnua.
O mtodo de amostragem aleatria simples atribui, a cada amostra de tamanho
n, igual probabilidade de ser sorteada. Se os sorteios dos elementos da amostra
so feitos com reposio, cada sujeito da populao tem a mesma probabilidade
de ser sorteado e essa probabilidade se mantm constante. Dessa forma, uma
amostra aleatria simples com reposio (abreviaremos por aas nesse texto) de uma
populao X um conjunto X1 , X2 , . . . , Xn de variveis aleatrias independentes
e identicamente distribudas, todas com a mesma distribuio da populao X.
Uma estatstica ou estimador T qualquer funo de X1 , X2 , . . . , Xn , isto , T =
g(X1 , X2 , . . . , Xn ). Como o estimador depende da amostra sorteada, ele tambm
uma varivel aleatria. Os estimadores descrevem caractersticas da amostra.
Um parmetro uma caracterstica da populao.
As caractersticas que iremos estudar so a mdia ( e X) e a varincia ( 2 e S 2 ).
Como cada estimador uma varivel aleatria, ele pode ser descrito pela sua funo
de distribuio, que chamada distribuio amostral do estimador. A distribuio
amostral de um estimador a distribuio ao longo de todas as possveis amostras
de mesmo tamanho n.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

13

Como sempre, a mdia e a varincia de uma distribuio de probabilidades so


parmetros de posio e disperso. No caso da distribuio amostral de um estimador, esses parmetros referem-se distribuio ao longo de todas as possveis
amostras. Assim, a mdia de uma distribuio amostral refere-se mdia dos possveis valores do estimador ao longo de todas as possveis amostras e a varincia
reflete a disperso desses valores em torno dessa mdia.
Um estimador no-viesado se a sua mdia igual ao parmetro que ele pretende
estimar. Isso significa que os valores do estimador ao longo de todas as possveis
amostras esto centrados no parmetro populacional.
Dados dois estimadores no-viesados de um mesmo parmetro, T1 e T2 , diz-se
que T1 mais eficiente que T2 se sua varincia for menor, ou seja, se V ar(T1 ) >
V ar(T2 ).
Uma seqncia {Tn } de estimadores de um
( parmetro consistente se, para todo
lim E(Tn ) =
n
> 0, lim Pr {|Tn | > } = 0 ou se
lim V ar(Tn ) = 0
n
n

1.8

Exerccios

Para fixar as idias sobre os conceitos apresentados nesta aula, voc ir trabalhar com
amostras aleatrias simples de tamanho 3 retiradas da populao {1, 2, 4, 6, 8}. Pelo
princpio da multiplicao, o nmero total de amostras 5 5 5 = 125 e cada uma
1
dessas amostras tem probabilidade 15 15 15 = 125
. Iremos considerar os seguintes
estimadores para a mdia da populao:
mdia amostral:

X=

X1 + X2 + X3
3

Xp =

X1 + 2X2 + X3
4

mdia amostral ponderada:

ponto mdio
=

min(X1 , X2 , X3 ) + max(X1 , X2 , X3 )
2

O que voc ir mostrar que (i) X e X p so no-viesados e que X mais eficiente


que X p ; (ii) viesado, mas sua varincia menor que a varincia de X e de X p . Para
isso, voc ir seguir os seguintes passos:
1. Calcule a mdia e a varincia 2 da populao.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

14

2. Nas cinco tabelas a seguir, voc tem listadas as 125 amostras. Para cada uma
das amostras, calcule os valores dos estimadores. Para as 6 primeiras amostras os
clculos j esto feitos, a ttulo de ilustrao. Voc no precisa indicar todas as
contas; apenas use a mquina de calcular e anote o resultado obtido.
3. Obtenha a funo de distribuio de probabilidade, explicitando os diferentes valores de cada um dos estimadores e suas respectivas probabilidades
4. Calcule a esperana e a varincia de cada um dos estimadores.
5. Verifique as afirmativas feitas no enunciado do problema.
Amostra
X1 X2 X3
1
1
1
1
1
2
1
1
4
1
1
6
1
1
8
1
2
1
1
2
2
1
2
4
1
2
6
1
2
8
1
4
1
1
4
2
1
4
4
1
4
6
1
4
8
1
6
1
1
6
2
1
6
4
1
6
6
1
6
8
1
8
1
1
8
2
1
8
4
1
8
6
1
8
8

X
1+1+1
=1
3
1+1+2
= 43
3
1+1+4
=2
3
1+1+6
= 83
3
1+1+8
= 10
3
3
1+2+1
4
=
3
3

Estimador
Xp
1+21+1
=1
4
1+21+2
= 54
4
1+21+4
= 74
4
1+21+6
= 94
4
1+21+8
= 11
4
4
1+22+1
6
=
4
4

=1
= 32
= 52
= 72
= 92
= 32

1+1
2
1+2
2
1+4
2
1+6
2
1+8
2
1+2
2

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


Amostra
X1 X2 X3
2
1
1
2
1
2
2
1
4
2
1
6
2
1
8
2
2
1
2
2
2
2
2
4
2
2
6
2
2
8
2
4
1
2
4
2
2
4
4
2
4
6
2
4
8
2
6
1
2
6
2
2
6
4
2
6
6
2
6
8
2
8
1
2
8
2
2
8
4
2
8
6
2
8
8

Estimador
Xp

15

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


Amostra
X1 X2 X3
4
1
1
4
1
2
4
1
4
4
1
6
4
1
8
4
2
1
4
2
2
4
2
4
4
2
6
4
2
8
4
4
1
4
4
2
4
4
4
4
4
6
4
4
8
4
6
1
4
6
2
4
6
4
4
6
6
4
6
8
4
8
1
4
8
2
4
8
4
4
8
6
4
8
8

Estimador
Xp

16

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


Amostra
X1 X2 X3
6
1
1
6
1
2
6
1
4
6
1
6
6
1
8
6
2
1
6
2
2
6
2
4
6
2
6
6
2
8
6
4
1
6
4
2
6
4
4
6
4
6
6
4
8
6
6
1
6
6
2
6
6
4
6
6
6
6
6
8
6
8
1
6
8
2
6
8
4
6
8
6
6
8
8

Estimador
Xp

17

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS


Amostra
X1 X2 X3
8
1
1
8
1
2
8
1
4
8
1
6
8
1
8
8
2
1
8
2
2
8
2
4
8
2
6
8
2
8
8
4
1
8
4
2
8
4
4
8
4
6
8
4
8
8
6
1
8
6
2
8
6
4
8
6
6
8
6
8
8
8
1
8
8
2
8
8
4
8
8
6
8
8
8

Estimador
Xp

18

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

1.9

19

Soluo do Exerccio

Para a populao temos que


1+2+4+6+8
= 4, 2
5
12 + 22 + 42 + 62 + 82
(4, 2)2 = 6, 56
=
5

=
2

Completando-se as tabelas dadas, chegamos s seguintes funes de distribuio de


probabilidade dos estimadores:
X
Pr(X = x) Clculo de E(X) Clculo de V ar(X)
2
x
p
px
E(X )
3/3
1/125
3/375
(3/3)2 (1/125)
4/3
3/125
12/375
(4/3) (3/125)
5/3
3/125
15/375
(5/3) (3/125)
6/3
4/125
24/375
(6/3)2 (4/125)
7/3
6/125
42/375
(7/3)2 (6/125)
8/3
6/125
48/375
(8/3)2 (6/125)
9/3
9/125
81/375
(9/3)2 (9/125)
10/3
9/125
90/375
(10/3)2 (9/125)
11/3
12/125
132/375
(11/3)2 (12/125)
12/3
10/125
120/375
(12/3)2 (10/125)
13/3
9/125
117/375
(13/3)2 (9/125)
14/3
12/125
168/375
(14/3)2 (12/125)
15/3
6/125
90/375
(15/3)2 (6/125)
16/3
12/125
192/375
(16/3)2 (12/125)
17/3
3/125
51/375
(17/3)2 (3/125)
18/3
10/125
180/375
(18/3)2 (10/125)
20/3
6/125
120/375
(20/3)2 (6/125)
22/3
3/125
66/375
(22/3)2 (3/125)
24/3
1/125
24/375
(24/3)2 (1/125)
Soma
1575/375
22305/ (9 125)
Logo,
E(X) =
e
V ar(X) =

1575
= 4, 2 =
375

2
22305
6, 56
(4, 2)2 = 2, 186667 =
=
9 125
3
3

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

X p Pr(X p = x) Clculo de E(X p ) Clculo de V ar(X p )


2
x
p
px
E(X p )
4/4
1/125
4/500
(4/4)2 (1/125)
5/4
2/125
10/500
(5/4)2 (2/125)
6/4
2/125
12/500
(6/4)2 (2/125)
7/4
4/125
28/500
(7/4)2 (4/125)
8/4
3/125
24/500
(8/4)2 (3/125)
9/4
4/125
36/500
(9/4)2 (4/125)
10/4
6/125
60/500
(10/4)2 (6/125)
11/4
6/125
66/500
(11/4)2 (6/125)
12/4
8/125
96/500
(12/4)2 (8/125)
13/4
4/125
52/500
(13/4)2 (4/125)
14/4
10/125
140/500
(14/4)2 (10/125)
15/4
4/125
60/500
(15/4)2 (4/125)
16/4
9/125
144/500
(16/4)2 (9/125)
17/4
4/125
68/500
(17/4)2 (4/125)
18/4
10/125
180/500
(18/4)2 (10/125)
19/4
4/125
76/500
(19/4)2 (4/125)
20/4
8/125
160/500
(20/4)2 (8/125)
21/4
4/125
84/500
(21/4)2 (4/125)
22/4
8/125
176/500
(22/4)2 (8/125)
23/4
2/125
46/500
(23/4)2 (2/125)
24/4
7/125
168/500
(24/4)2 (7/125)
25/4
2/125
50/500
(25/4)2 (2/125)
26/4
6/125
156/500
(26/4)2 (6/125)
28/4
4/125
112/500
(28/4)2 (4/125)
30/4
2/125
60/500
(30/4)2 (2/125)
32/4
1/125
32/500
(32/4)2 (1/125)
Soma
2100/500
40200/(16 125)
Logo,
E(X p ) = 4, 2 =
e
V ar(X p ) =

40200
(4.2)2 = 2, 46
16 125

20

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

21

Pr( = x) Clculo de E() Clculo de V ar()


x
p
px
E(2 )
2/2
1/125
2/250
(2/2)2 (1/125)
3/2
6/125
18/250
(3/2)2 (6/125)
4/2
1/125
4/250
(4/2)2 (1/125)
5/2
12/125
60/250
(5/2)2 (12/125)
6/2
6/125
36/250
(6/2)2 (6/125)
7/2
18/125
126/250
(7/2)2 (18/125)
8/8
13/125
104/250
(8/2)2 (13/125)
9/2
24/125
216/250
(9/2)2 (24/125)
10/2
24/125
240/250
(10/2)2 (24/125)
12/2
13/125
156/250
(12/2)2 (13/125)
14/2
6/125
84/250
(14/2)2 (6/125)
16/2
1/125
16/250
(16/2)2 (1/125)
Soma
1062/250
9952/(4 125)
Logo,
E() =
e

1062
= 4, 248
250

9952
(4, 248)2 = 1, 858496
4 125
Na tabela a seguir apresentamos o resumo dos resultados obtidos.
V ar() =

Parmetro
Estimador
populacional
X
Xp

Mdia
= 4, 2 4, 2000 4, 2000 4, 2480
2
Varincia
= 6, 56 2, 1867 2, 4600 1, 8585
Conclui-se que X e X p so estimadores no-viesados de e que X mais eficiente
que X p , uma vez que V ar(X) < V ar(X p ).
O estimador viesado, pois E() 6= . No entanto, a varincia desse estimador
menor que as varincias dos dois estimadores no-viesados. vezes, na prtica, podemos
trabalhar com estimadores viesados com varincia pequena, desde que o vis no seja
muito grande.

Captulo 2
Distribuio Amostral da Mdia
Neste captulo voc ir aprofundar seus conhecimentos sobre a distribuio amostral da
mdia amostral. No captulo anterior analisamos, atravs de alguns exemplos, o comportamento da mdia amostral; mas naqueles exemplos, a populao era pequena e foi
possvel obter todas as amostras, ou seja, foi possvel obter a distribuio amostral exata. Veremos agora resultados tericos sobre a distribuio amostral da mdia amostral,
que nos permitiro fazer anlises sem ter que listar todas as amostras.
Os principais resultados que estudaremos so:
mdia e varincia da distribuio amostral da mdia
distribuio amostral da mdia para populaes normais
Teorema Limite Central
distribuio amostral da varincia amostral

2.1

Mdia e varincia da distribuio amostral da


mdia

No captulo anterior, vimos, atravs de exemplos, que a mdia amostral X um estimador no-viesado da mdia populacional . Na verdade, temos o seguinte resultado
geral.
Teorema 2.1 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de uma
populao representada pela varivel aleatria X com mdia e varincia 2 . Ento,
E(X) =
2
V ar(X) =
n
Demonstrao:

22

(2.1)
(2.2)

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

23

Por definio de amostra aleatria simples, as Xi so independentes e todas tm


a mesma distribuio da v.a. populacional X; logo, E(Xi ) = e V ar(Xi ) = 2 . Da
independncia resulta que Cov(Xi , Xj ) = 0 i 6= j. Por outro lado, o estudo dos vetores aleatrios, vimos que a esperana da soma de variveis aleatrias a soma das
esperanas. Ento:

1
X1 + X2 + + Xn
= E(X1 + X2 + + Xn )
E(X) = E
n
n
1
[E(X1 ) + E(X2 ) + + E(Xn )]
=
n
1
1
=
( + + + ) = n =
n
n

X1 + X2 + + Xn
n

1
= 2 V ar(X1 + X2 + + Xn )
V ar(X) = V ar
n
"
#
P
1
= 2 V ar(X1 ) + V ar(X2 ) + + V ar(Xn ) + Cov(Xi , Xj )
n
i6=j

1
2
1 2
2
2
2
= 2 + + + + 0 = 2 n =
n
n
n

importante notar que esse resultado se refere a qualquer populao X. O que


ele estabelece que as mdias amostrais das diferentes amostras aleatrias simples de
tamaho n tendem a acertar o alvo da mdia populacional ; lembre-se da Figura 1.2,
partes (a) e (b). Alm disso, medida que o tamanho amostral n aumenta, a disperso
em torno do alvo, medida por V ar(X), vai diminuindo e tende a zero quando n .
Esse teorema nor permite ver que {X n } consistente para estimar a mdia populacional .
O desvio padro da distribuio amostral de qualquer estatstica usualmente chamado
de erro padro. Ento, o erro padro da mdia amostral EP (X) = n .

2.2

Distribuio amostral da mdia para populaes


normais

Na prtica estatstica, vrias populaes podem ser descritas, pelo menos aproximadamente, por uma distribuio normal. Obviamente, o teorema anterior continua valendo
no caso de uma populao normal, mas temos uma caracterstica a mais da distribuio
amostral da mdia: ela tambm normal.
Teorema 2.2 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de
uma populao normal, isto , uma populao representada por uma varivel aleatria

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

24

normal X com mdia e varincia 2 . Ento, a distribuio amostral da mdia amostral


X normal com mdia e varincia 2 /n, ou seja

2
2
X N ; = X N ;
n
Na Figura 2.1 ilustra-se o comportamento da distribuio amostral da mdia amostral
com base em amostras de tamanho n = 4 para uma populao normal com mdia 2 e varincia 9. A ttulo de comparao, apresenta-se a a distribuio populacional. Podemos
ver que ela mais dispersa que a distribuio amostral de X, mas ambas esto centradas
no verdadeiro valor populacional = 2.
0,3

X ~ N (2 ; 9 4 )
0,2

X ~ N ( 2;9 )
0,1

0,0
-8

-6

-4

-2

10

12

Figura 2.1: Distribuio amostral de X com base em aas de tamanho n = 4 de uma


populao N(2; 9)

2.3

Exemplos

Exemplo 2.1 A capacidade mxima de um elevador de 500 kg. Se a distribuio dos


pesos dos usurios N(70; 100), qual a probabilidade de que 7 pessoas ultrapassem este
limite? E de 6 pessoas?
Soluo
Podemos considerar os 7 passageiros como uma amostra aleatria simples da populao de todos os usurios, representada pela v.a. X N(70; 100). Seja, ento,

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

25

X1 , . . . , X7 uma aas de tamanho n = 7. Se o peso mximo 500, para que 7 pessoas


ultrapassem o limite de segurana temos que ter
7
P

i=1

Xi > 500

7
1P
500
Xi >
X > 71, 729
7 i=1
7

Mas, pelo Teorema 2.2, sabemos que

100
X N 70;
7

Logo,

X 70
71, 729 70
q
Pr(X > 71, 729) = Pr q
>
100
7

100
7

= Pr(Z > 0, 46) = 0, 5 tab(0, 46) = 0, 5 0, 17724 = 0, 32276

Com 6 pessoas teramos que ter

83.333 70
500
q
= Pr Z >
Pr X >
6
100
6

= Pr(Z > 3, 27) = 0, 5 tab(3, 27)


= 0.5 0.49946 = 0, 00054

Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoas
ultrapassarem o limite de segurana. J com 6 pessoas, essa probabilidade bastante
pequena. Assim, o nmero mximo de pessoas no elevador deve ser estabelecido como
6 ou menos.
Exemplo 2.2 Uma v.a. X tem distribuio normal com mdia 100 e desvio padro 10.
1. Calcule Pr(90 < X < 110)
2. Se X a mdia de uma amostra aleatria simples de 16 elementos retirados dessa
populao, calcule Pr(90 < X < 110).
3. Construa, num nico sistema de coordenadas, os grficos das distribuies de X e
X.
4. Que tamanho deveria ter a amostra para que Pr(90 < X < 110) = 0, 95?
Soluo
1.
Pr(90 < X < 110) =
=
=
=

110 100
90 100
<Z<
Pr
10
10
Pr(1 < Z < 1)
2 Pr(0 < Z < 1)
2 tab(1, 0) = 0, 68268

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

26

2. Com n = 16, resulta que X N 100; 100


16

90 100
110 100
Pr(90 < X < 110) = Pr q
<Z< q
100
16

100
16

= Pr(4 < Z < 4)


= 2 Pr(0 < Z < 4)
= 2 tab(4, 0) 1, 00

3. Veja a Figura 2.2. Como visto, a distribuio amostral com n = 16 menos


dispersa que a distribuio populacional e a podemos ver que, entre 90 e 110,
temos concentrada praticamente toda a distribuio de X.
0,18
0,16
0,14
0,12

N(100,100/16)

0,10
0,08

N(100,100)

0,06
0,04
0,02
0,00
60

70

80

90

100

110

120

130

140

Figura 2.2: Distribuio amostral de X com base em amostras de tamanho n = 16 de


uma populao N(100; 100)
4. Queremos que Pr(90 < X < 110) = 0, 95, ou seja
Pr(90 < X < 110) = 0, 95

110 100
90 100
<Z< q
Pr q
= 0, 95
100
n

100
n

Pr( n < Z < n) = 0, 95

2 Pr(0 < Z < n) = 0, 95

2 tab( n) = 0, 95

tab( n) = 0, 475

n = 1, 96
n4

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

27

A ttulo de ilustrao, apresentam-se na Figura 2.3 as distribuies amostrais de


X para n = 16 e n = 4.
0,18
0,16
0,14

N(100;100/16)

0,12
0,1
0,08
0,06

N(100;100/4)

0,04
0,02
0
60

70

80

90

100

110

120

130

140

Figura 2.3: Distribuio amostral de X com base em amostras de tamanhos n = 16 e


n = 4 de uma populao N(100; 100)
Exemplo 2.3 A mquina de empacotar um determinado produto o faz segundo uma
distribuio normal, com mdia e desvio padro 10 g.
1. Em quanto deve ser regulado o peso mdio para que apenas 10% dos pacotes
tenham menos do que 500 g?
2. Com a mquina assim regulada, qual a probabilidade de que o peso total de 4
pacotes escolhidos ao acaso seja inferior a 2 kg?
Soluo
1. Seja X a varivel aleatria que representa o peso dos pacotes. Sabemos, ento,
que X N(; 100). Queremos que
Pr(X < 500) = 0, 10

X
500
Pr
<
= 0, 10
10
10

500
= 0, 10
Pr Z <
10
temos que ter
Ento, na densidade normal padro, esquerda da abscissa 500
10
uma rea (probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Us-

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

28

ando a simetria da densidade normal temos as seguintes equivalncias:

500
Pr Z <
= 0, 10
10

500
Pr Z >
= 0, 10
10

500
= 0, 10
Pr Z >
10

500
Pr 0 Z
= 0, 40
10

500
tab
= 0, 40
10
500
= 1, 28
10
= 512, 8 g
Veja a Figura 2.4 onde so ilustradas essas equivalncias.

Figura 2.4: Soluo do Exemplo 3


2. Sejam X1, X2 , X3 , X4 os pesos dos 4 pacotes da amostra. Queremos que

4
P

i=1

Xi <

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

29

2000g. Isso equivalente a X < 500. Logo,

X 512, 8
500 512, 8
q
<
Pr(X < 500) = Pr q
100
4

=
=
=
=
=
=

100
4

Pr(Z < 2, 56)


Pr(Z > 2, 56)
0, 5 Pr(0 Z 2, 56)
0, 5 tab(2, 56)
0, 5 0, 49477
0, 00523

Com a mquina regulada para 512,8g, h uma probabilidade de 0,00523 de que


uma amostra de 4 pacotes apresente peso mdio inferior a 500g. Note que com
um pacote apenas, essa probabilidade de 10%. Por isso, as inspees de controle
de qualidade so sempre feitas com base em amostras de tamanho n > 1.

2.3.1

Lista de Exerccios 1

1. Os comprimentos das peas produzidas por determinada mquina tm distribuio


normal com uma mdia de 172 mm e desvio padro de 5 mm. Calcule a probabilidade de uma amostra aleatria simples de 16 peas ter comprimento mdio
(a) entre 169 mm e 175 mm;
(b) maior que 178 mm;
(c) menor que 165 mm.
2. Qual dever ser o tamanho de uma amostra
aleatria
simples a ser retirada de

uma populao N(150; 13 ) para que Pr( X < 6, 5) = 0, 95?

2.4

Teorema Limite Central

Os resultados vistos anteriormente so vlidos para populaes normais, isto , se uma


populao normal com mdia e varincia 2 , ento a distribuio amostral de X
tambm normal com mdia e varincia 2 /n, onde n o tamanho da amostra. O
teorema limite central que veremos a seguir nos fornece um resultado anlogo para qualquer distribuio populacional, desde que o tamanho da amostra seja suficientemente
grande.

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

30

Teorema 2.3 Teorema Limite Central


Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X tal que
E(X) = e V ar(X) = 2 . Ento, a distribuio de X converge para a distribuio
normal com mdia e varincia 2 /n quando n . Equivalentemente,
X

N(0, 1)

A interpretao prtica do teorema limite central a seguinte: para amostras grandes


de qualquer populao, podemos aproximar a distribuio amostral de X por uma distribuio normal com a mesma mdia populacional e varincia igual varincia populacional dividida pelo tamanho da amostra.
Quo grande deve ser a amostra para se obter uma boa aproximao depende das caractersticas da distribuio populacional. Se a distribuio populacional no se afastar
muito de uma distribuio normal, a aproximao ser boa, mesmo para tamanhos pequenos de amostra. Na Figura 2.5 ilustra-se esse teorema para a distribuio exponencial, ou seja, para uma populao distribuda segundo uma exponencial com parmetro
= 1. O grfico superior representa a distribuio populacional e os histogramas representam a distribuio amostral de X ao longo de 5000 amostras de tamanhos 10, 50, 100
e 250. Assim, podemos ver que, embora a populao seja completamente diferente da
normal, a distribuio amostral de X vai se tornando cada vez mais prxima da normal
medida que n aumenta.
Em termos prticos, esse teorema de extrema importncia, da ser chamado de
teorema central e, em geral, amostras de tamanho n > 30 j fornecem uma aproximao
razovel.
Exemplo 2.4 Uma moeda lanada 50 vezes, com o objetivo de se verificar sua honestidade. Se ocorrem 36 caras nos 50 lanamentos, o que podemos concluir?
Soluo
Neste caso, a populao pode ser representada por uma varivel de Bernoulli X
com parmetro p, isto , X assume o valor 1 com probabilidade p na ocorrncia de
cara e assume o valor 0 com probabilidade 1 p na ocorrncia de coroa. Para uma
varivel Bernoulli, temos que E(X) = p e V ar(X) = p(1 p). Como so feitos 50
lanamentos, o tamanho da amostra 50 (n grande!) e, pelo teorema limite central, X
aproximadamente normal com mdia E(X) = p e varincia V ar(X) = p(1p)
.
50
Suponhamos que a moeda seja honesta, isto , que p = 1/2. Nestas condies,
qual a probabilidade de obtermos 36 caras em 50 lanamentos? Com a hiptese de
honestidade da moeda, o teorema limite central nos diz que
1 1
1 22
;
XN
2 50

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

31

Distribuio exponencial com mdia 1


1,2
1,0
0,8
0,6
0,4
0,2
0,0
0

n=10

n=50

1800

1600

1600

1400

1400

1200

Frequency

Frequency

1200
1000
800

1000
800
600

600
400

400

200

200
0
0,261

0,761

1,261

1,761

0
0,604

2,261

0,804

n=100

1,204

1,404

1,604

n=250

1400

1600

1200

1400
1200

Frequency

1000

Frequency

1,004

800
600

1000
800
600

400
400
200

0
0,690

200

0,790

0,890

0,990

1,090

1,190

1,290

0
0,804

0,854

0,904

0,954

1,004

1,054

1,104

1,154

1,204

Figura 2.5: Ilustrao do Teorema Limite Central para uma populao X exp(1)

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

32

A probabilidade de se obter 36 ou mais caras em 50 lanamentos equivalente


probabilidade de X ser maior ou igual a 36
= 0, 72 e essa probabilidade
50

X 0, 5
0, 72 0, 5
q
Pr(X 0, 72) = Pr

1
200
200

= Pr(Z 3, 11) = 0, 5 Pr(0 Z < 3, 11) =


= 0, 5 tab(3, 11) = 0, 5 0, 49906 = 0, 00094

Note que essa probabilidade bastante pequena, ou seja, h uma pequena probabilidade
de obtermos 36 ou mais caras em um lanamento de uma moeda honesta. Isso pode nos
levar a suspeitar sobre a honestidade da moeda!

2.4.1

Lista de Exerccios 2

1. O fabricante de uma lmpada especial afirma que o seu produto tem vida mdia
de 1600 horas, com desvio padro de 250 horas. O dono de uma empresa compra
100 lmpadas desse fabricante. Qual a probabilidade de que a vida mdia dessas
lmpadas ultrapasse 1650 horas?

2.5

Distribuio amostral da varincia amostral

No captulo anterior, consideramos dois estimadores para a varincia: S 2 e


b2 . Atravs
2
de um exemplo, vimos que
b um estimador viciado. Vamos demonstrar agora que S 2
no viciado para estimar a varincia de uma populao qualquer.

Teorema 2.4 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples extrada de uma populao com N elementos e varincia populacional
2 =

onde =

1
N

N
P

i=1

N
1 P
(Xi )2
N i=1

Xi a mdia (esperana) populacional. Ento S 2 =

um estimador no viesado para estimar 2 .

1
n1

n
P

(Xi X)2

i=1

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

33

Demonstrao
n
P

(Xi X)2 =

i=1

n
P

(Xi + X)2 =

2
P
(Xi ) X

i=1
n
P

(Xi )2 +

i=1
n
P

(Xi )2 + n X 2 X nX n

i=1
n
P

n
P

i=1

i=1

n
2

P
X 2 (Xi ) X
i=1

P
(Xi )2 + n X 2 X
(Xi )
=
i=1
i=1
n

P
P
2
=
(Xi ) + n X 2 X
Xi n

i=1
n
P
i=1

Da segue que

i=1

2
(Xi )2 n X

n
n

2
P
1
1 P
2
2
E(S ) = E
(Xi X) =
(Xi ) n X
E
n 1 i=1
n1
i=1

2
P
1
2
=
E (Xi ) nE X
n 1 i=1

2
Mas como = E(Xi ) = E(X) e E (Xi )2 = V ar(Xi ) = 2 e E X = V ar(X)
resulta que
n

P
1
2
E(S ) =
V ar(Xi ) nV ar(X)
n 1 i=1
n

P 2
1
2
=
n
n 1 i=1
n

1 2
=
n 2
n1
= 2
2

e isso completa a prova.


Teorema 2.5 Se X1 , X2 , . . . , Xn uma amostra aleatria simples extrada de uma populao X N(; 2 ) ento
2 4
V ar(S 2 ) =
n1

2.6

Resumo do Captulo

Neste captulo, foram estudadas propriedades da mdia amostral X e da varincia


amostral S 2 . Ao final, voc dever ser capaz de compreender perfeitamente os seguintes
resultados:

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

34

Dada uma aas (amostra aleatria simples com reposio) X1 , X2 , . . . , Xn de uma


populao X com mdia e varincia 2 , a mdia amostral X um estimador noviesado de com varincia igual varincia populacional dividida pelo tamanho
amostral n, isto :
E(X) =
2
V ar(X) =
n
e a varincia amostral S 2 um estimador no viesado para estimar 2 , isto
E(S 2 ) = 2
O desvio padro da distribuio amostral de qualquer estatstica usualmente
chamado de erro padro. Ento, o erro padro da mdia amostral EP (X) = n
Nas condies anteriores e com a hiptese adicional de a populao X ser normal,
a distribuio amostral de X tambm normal, isto :

2
2
X N ; = X N ;
n
e

V ar(S 2 ) =

2 4
n1

O teorema limite central um dos mais importantes teoremas da teoria inferencial.


Ele nos d informaes sobre a dsitribuio amostral de X para amostras grandes
de qualquer populao. Mais precisamente, se X1 , X2 , . . . , Xn uma amostra
aleatria simples de uma populao X tal que E(X) = e V ar(X) = 2 , ento
a distribuio de X converge para a distribuio normal com mdia e varincia
2 /n quando n . Equivalentemente,
X

ou

2.7

N(0, 1)

X
N(0, 1)
n

Exerccios

1. Uma amostra de tamanho n = 18 extrada de uma populao normal com mdia


15 e desvio padro 2,5. Calcule a probabilidade de que a mdia amostral
(a) esteja entre 14,5 e 16,0;
(b) seja maior que 16,1.

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

35

2. Volte ao Exemplo 17.3. Depois de regulada a mquina, prepara-se uma carta de


controle de qualidade. Uma amostra de 4 pacotes ser sorteada a cada hora. Se
a mdia da amostra for inferior a 497g ou superior a 520g, a produo deve ser
interrompida para ajuste da mquina, isto , ajuste do peso mdio.
(a) Qual a probabilidade de uma parada desnecessria?
(b) Se a mquina se desregulou para = 500g, qual a probabilidade de
continuar-se a produo fora dos padres desejados?
3. Uma empresa produz parafusos em duas mquinas. O comprimento dos parafusos
produzidos em ambas aproximadamente normal com mdia de 20mm na primeira
mquina e 25 mm na segunda mquina e desvio padro comum de 4mm. Uma
caixa com 16 parafusos, sem identificao, encontrada e o gerente de produo
determina que, se o comprimento mdio for maior que 23 mm, ento a caixa ser
identificada como produzida pela mquina 2. Especifique os possveis erros nessa
deciso e calcule as suas probabilidades.
4. Definimos a varivel e = X como sendo o erro amostral da mdia, onde X a
mdia de uma aas de tamanho n de uma populao com mdia e desvio padro
.
(a) Determine E(e) e V ar(e).
(b) Se a populao normal com = 20, que proporo das amostras de tamanho
100 ter erro amostral absoluto maior do que 2 unidades?
(c) Neste caso, qual deve ser o valor de para que Pr(| e | > ) = 0, 01?

(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam inferiores a 1 unidade?
5. Uma fbrica produz parafusos especiais, para atender um determinado cliente,
que devem ter comprimento de 8,5 cm. Como os parafusos grandes podem ser
reaproveitados a um custo muito baixo, a fbrica precisa controlar apenas a proporo de parafusos pequenos. Para que o processo de produo atinja o lucro
mnimo desejvel, necessrio que a proporo de parafusos pequenos seja no
mximo de 5%.
(a) Supondo que a mquina que produz os parafusos o faa de modo que os
comprimentos tenham distribuio normal com mdia e desvio padro de
1,0 cm, em quanto deve ser regulada a mquina para satisfazer as condies
de lucratividade da empresa?
(b) Para manter o processo sob controle, programada uma carta de qualidade.
A cada hora ser sorteada uma amostra de 4 parafusos e, se o comprimento
mdio dessa amostra for menor que 9,0 cm, o processo de produo interrompido para uma nova regulagem da mquina. Qual a probabilidade de
uma parada desnecessria?

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

36

(c) Se a mquina se desregulou de modo que o comprimento mdio passou a ser


9,5 cm, qual a probabilidade de se continuar o processo de produo fora
dos padres desejados?
6. A diviso de inspeo do Departamento de Pesos e Medidas de uma determinada
cidade est interessada em calcular a real quantidade de refrigerante que colocada
em garrafas de 2 litros, no setor de engarrafamento de uma grande empresa de
refrigerantes. O gerente do setor de engarrafamento informou diviso de inspeo
que o desvio padro para garrafas de 2 litros de 0,05 litro. Uma amostra aleatria
de 100 garrafas de 2 litros, obtida deste setor de engarrafamento, indica uma mdia
de 1,985 litro. Qual a probabilidade de se obter uma mdia amostral de 1,985
ou menos, caso a afirmativa do gerente esteja certa? O que se pode concluir?

2.8

Soluo das Listas de Exerccios

Lista de Exerccios 1
1. Seja X = comprimento das peas; ento X N(172; 25) e n = 16
(a)

Pr(169 X 175) = Pr

X 172
169 172
175 172
q
q
q
25
16

25
16

25
16

= Pr(2, 4 Z 2, 4) = 2 Pr(0 Z 2, 4)
= 2 tab(2, 4) = 2 0, 4918 = 0, 9836

(b)

Pr(X > 178) = Pr Z >

= Pr(Z > 4, 8) 0

178 172
q
25
16

(c)

Pr(X < 165) = Pr Z <

165 172
q

= Pr(Z < 5, 6) 0

25
16

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

37

2. Temos que X N(150; 132 ) e queremos determinar n para que Pr( X <
6, 5) = 0, 95.

Pr( X 150 < 6, 5) = 0, 95


Pr(6, 5 < X 150 < 6, 5) = 0, 95
!

6, 5
6, 5
X 150
= 0, 95
Pr 13 <
< 13
13

Pr(0, 5 n < Z < 0, 5 n) = 0, 95

2 Pr(0 < Z < 0, 5 n) = 0, 95

Pr(0 < Z < 0, 5 n) = 0, 475

tab(0, 5 n) = 0, 475

0, 5 n = 1, 96

1, 96
n=
= 3, 92
0, 5
n = (3, 92)2 16
Lista de Exerccios 2

1. Podemos aceitar que as 200 lmpadas compradas sejam uma amostra aleatria
simples da populao referente s lmpadas produzidas por esse fabricante. Como
n = 100 um tamanho suficientemente grande
podemos usar o teo
de amostra,
2502
rema limite central , que nos diz que X N 1600; 100 . Logo

=
=
=
=

2.9

X 1600 1650 1600


q
Pr(X > 1650) = Pr q
>

Pr(Z > 2, 0)
0, 5 Pr(0 Z 2)
0, 5 tab(2, 0)
0, 5 0, 47725 = 0, 02275

Soluo dos Exerccios

2
1. X N 15; 2,5
18

2502
100

2502
100

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

38

(a)

=
=
=
=

14, 5 15
16 15
Pr(14, 5 X 16) = Pr q
Z q
2,52
18

2,52
18

Pr(0, 85 Z 1, 70)
Pr(0, 85 Z 0) + Pr(0 < Z 1, 70)
Pr(0 Z 0, 85) + Pr(0 Z 1, 70)
tab(0, 85) + tab(1, 70) = 0, 75777

(b)

Pr(X > 16, 1) = Pr Z >

= Pr(Z > 1, 87)


= 0, 5 Pr(0 Z 1, 87)
= 0, 5 tab(1, 87) = 0, 03074

16, 1 15
q
2,52
18

2. X N(512, 8; 100)
(a) Parada desnecessria: amostra indica que o processo est fora de controle
(X < 497 ou X > 520), quando, na verdade, o processo est ajustado ( =
512, 8). Neste caso, podemos usar a notao de probabilidade condicional
para auxiliar na soluo do exerccio. Queremos calcular

=
Pr X < 497 X > 520 | X N 512, 8; 100
4

= Pr X < 497 | X N (512, 8; 25) + Pr X > 520 | X N (512, 8; 25)

497 512, 8
520 512, 8
= Pr Z <
+ Pr Z >
5
5
= Pr(Z < 3, 16) + Pr(Z > 1, 44)
= Pr(Z > 3, 16) + Pr(Z > 1, 44)
= [0, 5 Pr(0 Z 3, 16)] + [0, 5 Pr(0 Z 1, 44)]
= 0, 5 tab(3, 16) + 0, 5 tab(1, 44)
= 1, 0 0, 49921 0, 42507
= 0, 07572

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

39

(b) Agora queremos

=
=
=
=
=
=

Pr 497 X 520 | X N(500; 25) =

497 500
520 500
Pr
Z
5
5
Pr(0, 6 Z 4)
Pr(0, 6 Z < 0) + Pr(0 Z 4)
Pr(0 Z 0, 6) + Pr(0 Z 4)
tab(0, 6) + tab(4, 0)
0, 72572

Note que a probabilidade de uma parada desnecessria pequena, s custas


de uma alta probabilidade de se operar fora de controle.
3. Os erros so: E1 : estabelecer que so da mquina 1, quando na verdade foram
produzidos pela mquina 2 ou E2 : estabelecer que so da mquina 2, quando na
verdade foram produzidos pela mquina 1. A regra de deciso a seguinte:
X > 23 = mquina 2
X 23 = mquina 1
Na mquina 1 o comprimento N(20; 16) e na mquina 2, N(25; 16).

Pr(E1 ) =
=
=
=
=
=
=

Pr(E2 ) =
=
=
=
=
=

16
Pr X 23|X N 25;
16

23 25
Pr Z
1
Pr(Z 2)
Pr(Z 2) =
0, 5 tab(2, 0)
0, 5 0, 47725
0, 02275

16
Pr X > 23|X N 20;
16

23 20
Pr Z >
1
Pr(Z > 3)
0, 5 tab(3, 0)
0, 5 0, 49865
0, 00135

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

40

4. Note que e igual a X menos uma constante e sabemos que E(X) = e V ar(X) =
2
.
n
(a) Das propriedades da mdia e da varincia, resulta que
E(e) = E(X) = = 0
2
V ar(e) = V ar(X) =
n
(b) X N(; 202 ) e n = 100. Queremos
Pr(|e| > 2) = Pr(e < 2) + Pr(e > 2)
= Pr(X < 2) + Pr(X > 2)

X
X
2
2
< 20 + Pr
> 20
= Pr
20
20
10

=
=
=
=
=

10

10

10

Pr(Z < 1) + Pr(Z > 1)


2 Pr(Z > 1)
2 [0, 5 Pr(0 Z 1)]
2 [0, 5 tab(1, 0)]
0, 31732

(c)
Pr(|e| > ) = 0, 01
Pr(e < ) + Pr(e > ) = 0, 01
Pr(X < ) + Pr(X > ) = 0, 01

X
X
< 20 + Pr
> 20 = 0, 01
Pr
20
20
10
10
10
10

Pr Z <
+ Pr Z >
= 0, 01
2
2

= 0, 01
2 Pr Z >
2

Pr Z >
= 0, 005
2

= 0, 005
0, 5 Pr 0 Z
2

Pr 0 Z
= 0, 495
2

tab
= 0, 495
2

= 2, 58 = 5, 16
2

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

41

(d)
Pr (|e| < 1) = 0, 95
Pr(1 < X < 1) = 0, 95

!
1
1
Pr 20 < Z < 20 = 0, 95

Pr

1
20

<Z<0

2 Pr 0 Z <

Pr 0 Z <

1
20

1
20

+ Pr 0 Z <

1
20

= 0, 95

= 0, 95

= 0, 475

n
= 1, 96
20

n = 39, 2 n 1537

5. Parafusos pequenos: X < 8, 5, onde X o comprimento do parafuso.


(a) X N(; 1). Como Pr(X < 8, 5) = 0, 05, resulta que 8,5 tem que ser menor
que , ou seja, a abscissa 8, 5 tem que estar no lado negativo da escala
da normal padronizada.
Pr(X < 8, 5) = 0, 05

8, 5
Pr Z <
= 0, 05
1

8, 5
Pr Z >
= 0, 05
1
Pr(0 Z 8, 5) = 0, 45
8, 5 = 1, 64
= 10, 14
(b) Parada desnecessria: amostra indica processo fora de controle (X < 9),

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

42

quando, na verdade, o processo est sob controle ( = 10, 14).

1
Pr X < 9 | X N 10, 14;
4

9 10, 14
= Pr Z <
0, 5
= Pr(Z < 2, 28)
= Pr(Z > 2, 28)
= 0, 5 Pr(0 Z 2, 28)
= 0, 5 tab(2, 28)
= 0, 5 0, 4887 = 0, 0113
(c) Mquina desregulada: X > 9; processo operando sem ajuste: X N (9, 5; 1)

1
Pr X > 9 | X N 9, 5;
4

9 9, 5
= Pr Z >
0, 5
= Pr(Z > 1)
= Pr(1 < Z < 0) + Pr(Z 0)
= Pr(0 < Z < 1) + Pr(Z 0)
= tab(1, 0) + 0, 5
= 0, 841314
6. Afirmativa do gerente: = 2 e = 0,05. Como n = 100, podemos usar o teorema
2
.
limite central . Logo, X N 2; 0,05
100

Pr(X 1, 985) = Pr Z
=
=
=
=

1, 985 2
0,05
10

Pr(Z 3, 0)
Pr(Z 3, 0)
0, 5 tab(3, 0)
0, 5 0, 49865 = 0, 00135

A probabilidade de se obter esse valor nas condies dadas pelo gerente muito
pequena, o que pode nos fazer suspeitar da veracidade das afirmativas. provvel
que, ou a mdia no seja 2 (e, sim, menor que 2), ou o desvio padro no seja 0,05
(e, sim, maior que 0,05). Esboce grficos da normal para compreender melhor esse
comentrio!

Captulo 3
Distribuio Amostral da Proporo
Neste captulo voc ver uma importante aplicao do Teorema Limite Central: iremos
estudar a distribuio amostral de propores. Assim, voc ver os resultados referentes
aproximao da distribuio binomial pela distribuio normal, que nos permitir fazer
inferncia sobre propores.
Voc ver os seguintes resultados:
aproximao da binomial pela normal
correo de continuidade
distribuio amostral da proporo amostral

3.1

Aproximao normal da distribuio binomial

No captulo anterior, vimos o Teorema Limite Central, que trata da distribuio da


mdia amostral X quando n . Esse teorema nos diz que, se X uma populao
com mdia e varincia 2 , ento a distribuio amostral da mdia de uma amostra
aleatria simples de tamanho n se aproxima de uma distribuio normal com mdia
2
e varincia n quando n .
Usando as propriedades da mdia e da varincia, podemos estabelecer esse teorema
n
P
em termos de Sn =
Xi , em vez de X. Como Sn = nX, ento E(Sn ) = nE(X) e
i=1

V ar(Sn ) = n2 V ar(X) e isso nos d o seguinte resultado.

Teorema 3.1 Teorema Central do Limite


Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X tal que
n
P
E(X) = e V ar(X) = 2 . Ento, a distribuio de Sn =
Xi converge para a
i=1

distribuio normal com mdia n e varincia n 2 quando n .


43

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

44

A varivel aleatria binomial foi definida como nmero de sucessos em n repeties


independentes de um experimento de Bernoulli com parmetro p. Ento, uma varivel
binomial a soma de n variveis independentes Bern(p). Pelo teorema acima e usando
o fato de que se X Bern(p) ento E(X) = p e V ar(X) = p(1 p), podemos dizer que
a distribuio binomial com parmetros n e p se aproxima de uma normal com mdia
np e varincia np(1 p) quando n .
Alguns cuidados devem ser tomados na aproximao da binomial pela normal. Um
fato importante a observar que a distribuio binomial discreta, enquanto a varivel
normal contnua. Veja a Figura 3.1. A o histograma representa uma v.a. X com
distribuio binomial com n = 12 e p = 0, 5. OS retngulos, centrados nos possveis
valores de X, tm base 1 e altura igual a Pr(X = k), de modo que a rea de cada
retngulo igual a Pr(X = k). A curva normal a representada de uma v.a. Y com
mdia = 12 0, 5 = 6 e varincia 2 = 12 0, 5 0, 5 = 3.
0,25

0,20

0,15

0,10

0,05

0,00
0

10

11

12

Figura 3.1: Aproximao normal da distribuio binomial


Suponha que queiramos calcular Pr(X 8). Isso equivale a somar as reas dos 4
ltimos retngulos superiores. Pela aproximao normal, no entanto, temos que calcular
a rea (probabilidade) acima do ponto 7,5, de modo a incluir os 4 retngulos. Assim,

Y 6
7, 5 6

Pr(X 8) Pr(Y 7, 5) = Pr
3
3
= Pr(Z 0, 87)
= 0, 5 tab(0, 87)
= 0, 5 0, 30785
= 0, 19215
O valor exato, calculado pela distribuio binomial, Pr(X 8) = 0, 1938.

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

45

Vamos, agora, calcular Pr(X > 10). Isso equivale rea dos 2 retngulos superiores,
centrados em 11 e 12 (este ltimo no visvel, pois Pr(X = 12) = 0, 000244); logo,
pela distribuio normal temos que calcular Pr(Y 10, 5) :

Y 6
10 6

Pr(X > 10) Pr(Y 10, 5) = Pr
3
3
= Pr(Z 2, 31)
= 0, 5 tab(2, 31)
= 0, 5 0, 48956
= 0, 01044
Se queremos Pr(X < 5), isso equivale s reas dos 4 retngulos inferiores e, portanto

Y 6
56

Pr(X < 5) Pr(Y 4, 5) = Pr
3
3
= Pr(Z 0, 58)
= Pr(Z 0, 58)
= 0, 5 tab(0, 58)
= 0, 5 0, 21904
= 0, 28096
Se queremos Pr(4 X < 8), temos a seguinte aproximao:
Pr(4 X < 8) Pr(3, 5 Y 7, 5)

7, 5 6
3, 5 6

Z
= Pr
3
3
= Pr(1, 44 Z 0, 87)
= Pr(1, 44 Z 0) + Pr(0 Z 0, 87)
= Pr(0 Z 1, 44) + Pr(0 Z 0, 87)
= tab(1, 44) + tab(0, 87)
= 0, 42507 + 0, 30785
= 0, 73292
interessante observar que para uma varivel binomial faz sentido calcular Pr(X =
k); no caso da normal, essa probabilidade nula, qualquer que seja k. Para usar a
aproximao normal para calcular, por exemplo, Pr(X = 5), devemos notar que essa
probabilidade equivale rea do retngulo centrado em 5 e, em termos da curva normal,

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

46

temos que calcular a rea compreendida entre 4,5 e 5,5:


Pr(X = 5) Pr(4, 5 Y 5, 5)

4, 5 6
5, 5 6

= Pr
Z
3
3
= Pr(0, 87 Z 0, 29)
= Pr(0, 29 Z 0, 87)
= tab(0, 87) tab(0, 29)
= 0, 30785 0, 11409
= 0, 19376
e o valor exato 0,193359.
Esses procedimentos so chamados de correo de continuidade e na Figura 3.2
ilustra-se o procedimento geral; lembre-se que o centro de cada retngulo o valor da
varivel binomial.
A aproximao dada pelo teorema limite central melhor para valores grandes de n.
Existe a seguinte regra emprica para nos ajudar a decidir o que grande:
A distribuio binomial com parmetros n e p pode ser aproximada por uma distribuio normal com mdia = np e varincia 2 = np(1 p) se so satisfeitas as
seguintes condies:
1. np 5
2. n(1 p) 5

3.1.1

Lista de Exerccios 1

Em cada um dos exerccios abaixo, verifique que as condies para aproximao da binomial pela normal so satisfeitas e calcule a probabilidade pedida usando a aproximao
normal.
1. X bin(18; 0, 4); Pr(X 15) e Pr(X < 2)
2. X bin(40; 0, 3); Pr(X < 10) e Pr(25 < X < 28)
3. X bin(65; 0, 9); Pr(X = 58) e Pr(60 < X 63)
4. X bin(100; 0, 2); Pr(25 X 35)
5. X bin(50; 0, 2); Pr(X > 26) e Pr(5 X < 10)

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

47

Figura 3.2: Correo de continuidade para a aproximao normal da binomial


(a) Pr(X = k) (b) Pr(X k) (c) Pr(X < k) (d) Pr(X k) (e) Pr(X > k)

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

3.2

48

A distribuio amostral da proporo

Considere uma populao em que cada elemento classificado de acordo com a presena
ou ausncia de determinada caracterstica. Por exemplo, podemos pensar em eleitores
escolhendo entre 2 candidatos, pessoas classificadas de acordo com o sexo, trabalhadores
classificados como trabalhador com carteira assinada ou no, e assim por diante. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :

1 se elemento possui a caracterstica de interesse


X=
0 se elemento no possui a caracaterstica de interesse

Vamos denotar por p a proporo de elementos da populao que possuem a caracterstica de interesse. Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p). Em geral,
esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X1 , X2 , . . . , Xn com reposio. Essas n extraes correspondem a n variveis aleatrias
n
P
Xi tem distribuio binomial com
de Bernoulli independentes e, como visto, Sn =
i=1

parmetros n e p. Note que Sn d o nmero total de sucessos nas n repeties, onde


sucesso, neste caso, representa a presena da caracterstica de interesse. Os valores
possveis de Sn so 0, 1, 2, . . . , n. Com relao proporo Pb de elementos na amostra
que possuem a caracterstica de interesse, temos que
X1 + X2 + + Xn
Sn
=
Pb =
n
n

e os valores possveis de Pb so 0, n1 , n2 , . . . , n1
, 1 com
n

k
Pr Pb =
= Pr(Sn = k)
n

(3.1)

(3.2)

Analisando a expresso (3.1), podemos ver que Pb nada mais que a mdia amostral
de Xi Bern(p), i = 1, . . . , n. Logo, o Teorema 2.1 se aplica com E(X) = p e V ar(X) =
p(1 p),ou seja:
E(Pb) = p
p(1 p)
V ar(Pb) =
n

Vemos, ento, que a proporo amostral um estimador no-viesado da proporo


populacional p. A distribuio exata dada pela expresso (3.2).
Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central
nos diz, ento, que a distribuio da proporo amostral se aproxima de uma nornal
com mdia p e varincia p(1p)
. Como essa aproximao uma conseqncia direta da
n
aproximao normal da binomial, as mesmas regras continuam valendo: a aproximao
deve ser feita se np 5 e n(1 p) 5.

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

49

Exemplo 3.1 De um lote de produtos manufaturados, extrai-se uma amostra aleatria


simples de 100 itens. Se 10% dos itens do lote so defeituosos, calcule a probabilidade
de serem sorteados no mximo 12 itens defeituosos.
Soluo
As condies para utilizao da aproximao normal so vlidas: com n = 100 e
p = 0, 1 temos que
100 0, 1 = 10 > 5
100 0, 9 = 9 > 5
Seja X = nmero de itens defeituosos na amostra. Ento, X bin(100; 0, 1) e
X N(10; 9). Queremos calcular Pr(X 12). Usando a correo de continuidade e
denotando por Y uma v.a. N (10; 9), temos que
Pr(X 12) Pr(Y 12, 5)

12, 5 10

= Pr Z
9
= Pr(Z 0, 83)
= 0, 5 + tab(0, 83)
= 0, 79673
O valor exato Pr(X 12) = 0, 802.

3.2.1

Lista de Exerccios 2

A confiabilidade de um componente a probabilidade de que ele funcione sob as condies


desejadas. Uma amostra aleatria simples de 1000 desses componentes extrada e cada
componente testado. Calcule a probabilidade de obtermos pelo menos 30 itens defeituosos supondo que a confiabilidade do item seja
1. 0,995
2. 0,85

3.3

Resumo do Captulo

Neste captulo estudamos dois resultados bsicos sobre a distribuio binomial; o primeiro
envolve a aproximao normal e o segundo, a distribuio amostral de propores
amostrais. Ao final, voc deve compreender os seguintes resultados.
Se X bin(n; p), ento probabilidades desta varivel podem ser aproximadas
pelas probabilidades da distribuio N [np; np(1 p)] , desde que sejam satisfeitas
as seguintes condies:
np 5
n(1 p) 5

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

50

Na aproximao da binomial pela normal, deve ser usada a correo de continuidade, conforme resumido na tabela a seguir, onde X bin(n; p) e Y
N [np; np(1 p)] (veja tambm a Figura 3.2):
Binomial
Pr(X = k)
Pr(X k)
Pr(X < k)
Pr(X k)
Pr(X > k)

Aproximao Normal
Pr(k 0, 5 Y k + 0, 5)
Pr(Y k + 0, 5)
Pr(Y < k + 0, 5)
Pr(Y k 0, 5)
Pr(Y k + 0, 5)

Seja uma populao descrita pela varivel aleatria X Bern(p). Ento, Pr(X =
1) = p, Pr(X = 0) = 1 p, E(X) = p e V ar(X) = p(1 p). Seja X1 , X2 , . . . , Xn
uma aas desta populao. Definindo a proporo amostral

resulta que

X1 + X2 + . . . + Xn
Pb =
n

p(1 p)
b
P N p;
n

e essa aproximao pode ser usada se np 5 e n(1 p) 5.

3.4

Exerccios

1. Use a aproximao normal para calcular as probabilidades pedidas, tendo o cuidado


de verificar que as condies para essa aproximao so realmente satisfeitas.
(a) Pr(X 25) se X bin(50; 0, 7)

(b) Pr(42 < X 56) se X bin(100; 0, 5)


(c) Pr(X > 60) se X bin(100; 0, 5)

(d) Pr(X = 5) se X bin(20; 0, 4)

(e) Pr(X 12) se X bin(30; 0, 3)

(f) Pr(9 < X < 11) se X bin(80; 0, 1)

(g) Pr(12 X 16) se X bin(30; 0, 2)

(h) Pr(X > 18) se X bin(50; 0, 3)


(i) Pr(X = 6) se X bin(28; 0, 2)

(j) Pr(30 X < 48) se X bin(95; 0, 4)


2. Em uma sondagem, perguntou-se a 1002 membros de determinado sindicato se eles
haviam votado na ltima eleio para a direo do sindicato e 701 responderam
afirmativamente. Os registros oficiais obtidos depois da eleio mostram que 61%

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

51

dos membros aptos a votar de fato votaram. Calcule a probabilidade de que,


dentre 1002 membros selecionados aleaoriamente, no mnimo 701 tenham votado,
considerando que a verdadeira taxa de votantes seja de 61%. O que o resultado
sugere?
3. Supondo que meninos e meninas sejam igualmente provveis, qual a probabilidade de nascerem 36 meninas em 64 partos? Em geral, um resultado considerado
no-usual se a sua probabilidade de ocorrncia pequena, digamos, menor que
0,05. no-usual nascerem 36 meninas em 64 partos?
4. Com base em dados histricos, uma companhia area estima em 15% a taxa de
desistncia entre seus clientes, isto , 15% dos passageiros com reserva no aparecem na hora do vo. Para otimizar a ocupao de suas aeronaves, essa companhia
decide aceitar 400 reservas para os vos em aeronaves que comportam apenas 350
passageiros. Calcule a probabilidade de que essa companhia no tenha assentos suficientes em um desses vos. Essa probabilidade alta o suficiente para a
companhia rever sua poltica de reserva?
5. No controle de qualidade de produtos, uma tcnica comumente utilizada a
amostragem de aceitao. Segundo essa tcnica, um lote inteiro rejeitado se
contiver mais do que um nmero determinado de itens defeituosos. A companhia X compra parafusos de uma fbrica em lotes de 5000 e rejeita o lote se uma
amostra aleatria simples de 20 parafusos contiver pelo menos 2 defeituosos. Se o
processo de fabricao tem uma taxa de 10% de defeituosos, qual a probabilidade
de um lote ser rejeitado pela companhia X?

3.5

Soluo das Listas de Exerccios

Lista de Exerccios 1
1. 18 0, 4 = 7, 2 > 5

18 0, 6 = 10, 8 > 5
X N (7, 2; 4, 32)

14, 5 7, 2
Pr(X 15) Pr Z
4, 32
= Pr(Z 3, 51) = 0, 5 0, 49978 = 0, 00022

1, 5 7, 2
Pr(X < 2) Pr Z
4, 32
= Pr(Z 2, 74) = Pr(Z 2, 74)
= 0, 5 0, 49693 = 0, 00307

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO


2. 40 0, 3 = 12 > 5
40 0, 7 = 28 > 5
X N(12; 8. 4)

9, 5 12
Pr(X < 10) = Pr Z
8, 4
= Pr(Z 0, 86) = Pr(Z 0, 86)
= 0, 5 0, 30511 = 0, 19489

27, 5 12
25, 5 12

Z
Pr(25 < X < 28) = Pr
8, 4
8, 4
= Pr(4, 66 Z 5, 35) 0

3. 65 0, 9 = 58, 5 > 5
65 0, 1 = 6, 5 > 5
X N(58, 5; 5, 85)

57, 5 58, 5
58, 5 58, 5

Pr(X = 58) = Pr
Z
5, 85
5, 85
= Pr(0, 41 Z 0) = Pr(0 Z 0, 41) = 0, 15910

60, 5 58, 5
63, 5 58, 5

Pr(60 < X 63) = Pr


Z
5, 85
5, 85
= Pr(0, 83 Z 2, 07) = 0, 48077 0, 29673 = 0, 18404
4. 100 0, 2 = 20, 0 > 5

100 0, 8 = 80, 0 > 5


X N(20; 16)

24, 5 20
35, 5 20
Pr(25 X 35) = Pr
Z
4
4
= Pr(1, 13 Z 3, 88) = 0, 49995 0, 37076 = 0, 12919

5. 50 0, 2 = 10, 0 > 5

50 0, 8 = 40, 0 > 5
X N(10; 8)

26, 5 10

Pr(X > 26) = Pr Z


= Pr(Z 5, 83) 0
8

4, 5 10
9, 5 10

Pr(5 X < 10) = Pr


Z
8
8
= Pr(1, 94 Z 0, 18) = Pr(0, 18 Z 1, 94)
= 0, 47381 0, 07142 = 0, 40239

52

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

53

Lista de Exerccios 2
1. Se a confiabilidade 0,995, ento a probabilidade de um item ser defeituoso
0,005. Seja X = nmero de defeituosos na amostra. Ento, X N(1000
0, 005; 1000 0.005 0.995) ou seja, X N (5; 4, 975). Note que 1000 0, 005 = 5
e 1000 0, 995 = 995, de modo que podemos usar a aproximao normal.

29, 5 5
Pr(X 30) Pr Z
= Pr(Z 10, 98) 0
4, 975
2. 1000 0, 85 = 850 e 1000 0, 15 = 150.
X N(150; 127, 5)

29, 5 150
= Pr(Z 10, 67) 1, 0
Pr(X 30) Pr Z
127, 5

3.6

Soluo dos Exerccios

1. .
(a) np = 35

n(1 p) = 15

X N(35; 10, 5)

25, 5 35
Pr(X 25) = Pr Z
10, 5
= Pr(Z 2, 93) = 0, 5 0, 49831 = 0, 00169

(b) np = 50

n(1 p) = 50

X N(50; 25)

56, 5 50
42, 5 50
Pr(42 < X 56) = Pr
Z
5
5
= Pr(1, 5 Z 1, 3) = 0, 43319 + 0, 40320 = 0, 83639

(c) np = 50

n(1 p) = 50

(d) np = 8

X N(50; 25)

60, 5 50
Pr(X > 60) = Pr Z
5
= Pr(Z 2, 1) = 0, 5 0, 48214 = 0, 01786
n(1 p) = 12

X N(8; 4, 8)

4, 5 8
5, 5 8
Pr(X = 5) = Pr
Z
4, 8
4, 8
= Pr(1, 60 Z 1, 14) = Pr(1, 14 Z 1, 60)
= 0, 44520 0, 37286 = 0, 072 34

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO


(e) np = 9

n(1 p) = 21

(f) np = 8

n(1 p) = 72

(g) np = 6

n(1 p) = 24

54

X N(9; 6, 3)

11, 5 9
Pr(X 12) = Pr Z
= Pr(Z 1)
6, 3
= 0, 5 0, 34134 = 0, 15866

X N(8; 7, 2)

9, 5 8
10, 5 8
Pr(9 < X < 11) = Pr
Z
7, 2
7, 2
= Pr(0, 56 Z 0, 93) = 0, 32381 0, 21226 = 0, 11155

X N(8; 4, 8)

11, 5 8
16, 5 8

Pr(12 X 16) = Pr
Z
4, 8
4, 8
= Pr(1, 60 Z 3, 88) = 0, 49995 0, 44520 = 0, 05475

(h) np = 15

n(1 p) = 35

X N(15; 10, 5)

18, 5 15
Pr(X > 18) = Pr Z
=
10, 5
Pr(Z 1, 08) = 0, 5 0, 35993 = 0, 140 07

(i) np = 5, 6

n(1 p) = 22, 4
X N(5, 6; 4, 48)

5, 5 5, 6
6, 5 5, 6

Pr(X = 6) = Pr
Z
4, 48
4, 48
= Pr(0, 05 Z 0, 43) = 0, 01994 + 0, 16640 = 0, 18634

(j) np = 38

n(1 p) = 57

X N(38; 22, 8)

29, 5 38
47, 5 38

Pr(30 X < 48) = Pr


Z
22, 8
22, 8
= Pr(1, 78 Z 1, 99) = 0, 47670 + 0, 46246 = 0, 93916

2. X = nmero de pessoas que votaram. Ento X bin(1002; 0, 61) e X


N(611, 22; 238, 3758)

!
700.5 611.22
Pr(X 701) Pr Z p
= Pr(Z 5.78) = 0
238.3758)

Se a proporo de votantes de 61%, a probabilidade de encontrarmos 701 ou


mais votantes em uma aas de 1002 muito baixa. Talvez as pessoas entrevistadas
no estejam sendo sinceras, com vergonha de dizer que no votaram...

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

55

3. X = nmero de meninas em 64 partos; X bin(64; 0, 5) e X N(32; 16)

36.5 32
Pr(X > 36) Pr Z
4
= Pr(Z 1.13) = 0.5 0.37076 = 0.12924
Esse um resultado que pode ocorrer por mero acaso, ou seja, no um resultado
no-usual.
4. X = nmero de passageiros que se apresentam para o vo em questo. X
bin(400; 0, 85) e X N(340; 51).

350, 5 340

Pr(X > 350) = Pr Z


51
= Pr(Z 1, 47) = 0, 5 0, 42922 = 0, 070 78
Essa uma probabilidade um pouco alta; talvez valha a pena a companhia rever
a poltica de reservas e aceitar menos que 400 reservas.
5. X = nmero de defeituosos na amostra; X bin(20; 0.1). Note que aqui no
podemos usar a aproximao normal. uma vez que 20 0.1 = 2 < 5. Queremos
Pr(X 2) = 1 Pr(X < 2) = 1 [Pr(X = 0) + Pr(X = 1)]


20
20
0
20
= 1
(0, 1) (0, 9)
(0, 1)(0, 9)19 =
0
1
= 1 0, 39175 = 0, 60825

Captulo 4
Intervalos de Confiana
Neste captulo voc aprender um mtodo muito importante de estimao de parmetros. Vimos anteriormente que a mdia amostral X um bom estimador da mdia
populacional . Mas vimos, tambm, que existe uma variabilidade nos valores de X,
ou seja, cada amostra d origem a um valor diferente do estimador. Uma maneira de
informar sobre esta variabilidade atravs da estimao por intervalos. Sendo assim,
neste captulo voc aprender os seguintes conceitos e mtodos:
intervalo de confiana
margem de erro
nvel de confiana
nvel de seignificncia
intervalo de confiana para a mdia de uma populao N (; 2 ) com varincia
conhecida

4.1

Idias bsicas

O objetivo central da Inferncia Estatstica obter informaes para uma populao a


partir do conhecimento de uma nica amostra. Em geral, a populao representada
por uma varivel aleatria X, com funo de distribuio ou densidade de probabilidade
fX . Dessa populao, ento, extrai-se uma amostra aleatria simples com reposio,
que d origem a um conjunto X1 , X2 , . . . , Xn de n variveis aleatrias independentes
e identicamente distribudas, todas com a mesma distribuio fX . Se fX depende de
um ou mais parmetros, temos que usar a informao obtida a partir da amostra para
estimar esses parmetros, de forma a conhecermos a distribuio. Vimos, por exemplo,
que a mdia amostral X um bom estimador da mdia populacional , no sentido
de que ela tende a acertar o alvo da verdadeira mdia populacional, isto , a mdia
amostral um estimador no-viesado da mdia populacional. Mas vimos, tambm, que
existe uma variabilidade nos valores de X, ou seja, cada amostra d origem a um valor

56

CAPTULO 4. INTERVALOS DE CONFIANA

57

diferente do estimador. Para algumas amostras, X ser maior que , para outras ser
menor e para outras ser igual.
Na prtica, temos apenas uma amostra e, assim, importante que se d alguma informao sobre essa possvel variabilidade do estimador. Ou seja, importante informar
o valor do estimador b
obtido com uma amostra especfica, mas importante informar
tambm que o verdadeiro valor do parmetro poderia estar num determinado intervalo,
digamos, no intervalo [b
,b
+ ]. Dessa forma, estamos informando a nossa margem
de erro no processo de estimao; essa margem de erro conseqncia do processo de
seleo aleatria da amostra.
O que vamos estudar agora como obter esse intervalo, de modo a acertar na
maioria das vezes, isto , queremos um procedimento que garanta que, na maioria
das vezes (ou das amostras possveis), o intervalo obtido conter o verdadeiro valor do
parmetro. A expresso na maioria das vezes ser traduzida como probabilidade
alta. Dessa forma, estaremos lidando com afirmativas do seguinte tipo:
Com probabilidade alta (em geral, indicada por 1), o intervalo [b
erro;
b
+ erro] conter o verdadeiro valor do parmetro .

A interpretao correta de tal afirmativa a seguinte: se 1 = 0, 95, por exemplo,


ento isso significa que o procedimento de construo do intervalo tal que, em 95%
das possveis amostras, o intervalo [b
erro; b
+ erro] obtido conter o verdadeiro valor
do parmetro. Note que cada amostra resulta em um intervalo diferente; mas, em 95%
das amostras, o intervalo contm o verdadeiro valor do parmetro. Veja a Figura 4.1.
A dois dos intervalos no contm o parmetro .
O valor 1 chamado nvel de confiana, enquanto o valor conhecido como
nvel de significncia. O intervalo [b
erro; b
+ erro] chamado de intervalo de confiana
de nvel de confiana 1 .
Tendo clara a interpretao do intervalo de confiana, podemos resumir a frase acima
da seguinte forma:

h
i
Pr b
;b
+
=1

(4.1)

Mais uma vez, a probabilidade se refere probabilidade dentre as diversas possveis


amostras, ou seja, a probabilidade est associada distribuio amostral de b
. Note que
b
os limites do intervalo dependem de , que depende da amostra sorteada, ou seja, os
limites do intervalo de confiana so variveis aleatrias. Cada amostra d origem a um
intervalo diferente, mas o procedimento de obteno dos intervalos garante probabilidade
1 de acerto.

CAPTULO 4. INTERVALOS DE CONFIANA

Figura 4.1: Interpretao dos Intervalos de Confiana

58

CAPTULO 4. INTERVALOS DE CONFIANA

4.2

59

Intervalo de confiana: mdia da N(; 2), 2 conhecida

Vamos agora introduzir os mtodos para obteno do intervalo de confiana para a mdia
de uma populao. Como visto, a mdia populacional um parmetro importante que
pode ser muito bem estimado pela mdia amostral X. Para apresentar as idias bsicas,
vamos considerar um contexto que pouco freqente na prtica. O motivo para isso
que, em termos didticos, a apresentao bastante simples. Como o fundamento o
mesmo para contextos mais gerais, essa abordagem se justifica.
Consideremos uma populao descrita por uma varivel aleatria normal com mdia
e varincia 2 : X N(; 2 ). Vamos supor que o valor de 2 seja conhecido e
que nosso interesse seja estimar a mdia a partir de uma amostra aleatria simples
X1 , X2 , . . . , Xn . Como visto anteriormente, a distribuio amostral de X normal com
2
mdia e varincia n , ou seja

2
2
X N ; = X N ;
n
Da definio de distribuio amostral, isso significa que os diferentes valores de X obtidos
a partir das diferentes possveis amostras se distribuem normalmente em torno de com
2
varincia n .
Das propriedades da distribuio normal, resulta que
X
Z= q
N(0; 1)
2
n

ou equivalentemente,

Z=

4.2.1

X
n
N(0; 1)

(4.2)

Notao

Vamos estabelecer a seguinte notao: vamos indicar por z a abscissa da curva normal
padro que deixa probabilidade (rea) igual a acima dela. Veja a Figura 4.2. Temos,
ento, que Pr(Z > z ) = . Essa abscissa z normalmente chamada de valor crtico.
Consideremos, agora, o valor crtico z/2 ;veja a Figura 4.3. Da podemos ver que,
se Z N(0; 1), ento

Pr z/2 Z z/2 = 1
(4.3)

Note que isso vale para a distribuio normal padro, em geral. Ento, usando os
resultados (4.2) e (4.3), obtemos que

X
z/2 = 1
Pr z/2 n

CAPTULO 4. INTERVALOS DE CONFIANA

Figura 4.2: Ilustrao do valor crtico z

Figura 4.3: Definio do valor crtico z/2

60

CAPTULO 4. INTERVALOS DE CONFIANA

61

Mas isso equivalente a

Pr z/2 X z/2
= 1
n
n

= 1
Pr X z/2 X + z/2
n
n

Pr X z/2 X + z/2
= 1
n
n

(4.4)

Note a ltima expresso; ela nos diz que

=1
Pr X z/2 ; X + z/2
n
n
Mas essa exatamente a forma geral de um intervalo de confiana, conforme explicitado
na equao (4.1). Temos, ento, a seguinte concluso:
Definio 4.1 Intervalo de confiana para a mdia de uma populao normal
com varincia conhecida
Seja X N(; 2 ) uma populao normal com varincia 2 conhecida. Se X1 , X2 , . . . , Xn
uma amostra aleatria simples dessa populao, ento o intervalo de confiana de nvel
de confiana 1 para a mdia populacional dado por

X z/2 ; X + z/2
n
n

4.2.2

Interpretao do intervalo de confiana para

O intervalo de confiana para pode ser escrito na forma [X ; X + ] onde = z/2 n


a margem de erro. Como visto, essa margem de erro est associada ao fato de que
diferentes amostras fornecem diferentes valores de X cuja mdia igual a . As diferentes
amostras fornecem diferentes intervalos de confiana, mas uma proporo de 100 (1
)% desses intervalos ir conter o verdadeiro valor de . Note que aqui fundamental
a interpretao de probabilidade como freqncia relativa: estamos considerando os
diferentes intervalos que seriam obtidos, caso sortessemos todas as possveis amostras.
Assim, o nvel de confiana est associado confiabilidade do processo de obteno do
intervalo: esse processo tal que acertamos (isto , o intervalo contm ) em 100 (1
)% das vezes.
Na prtica, temos apenas uma amostra e o intervalo obtido com essa amostra especfica, ou contm ou no contm o verdadeiro valor de . A afirmativa

Pr X z/2 ; X + z/2
=1
n
n
vlida porque ela envolve a varivel aleatria X, que tem diferentes valores para as
diferentes amostras. Quando substitumos o estimador X por uma estimativa especfica

CAPTULO 4. INTERVALOS DE CONFIANA

62

x obtida a partir de uma amostra particular, temos apenas um intervalo e no faz mais
sentido falar em probabilidade.
Para ajudar na interpretao do intervalo de confiana, suponha que, com uma
amostra de tamanho 25, tenha sido obtido o seguinte intervalo de confiana com nvel
de confiana de 0,95:

2
2
= [4, 216; 5, 784]
5 1, 96 ; 5 + 1, 96
25
25
Esse intervalo especfico contm ou no contm o verdadeiro valor de . O que estamos dizendo que, se repetssemos o mesmo procedimento de sorteio de uma amostra
aleatria simples da populao e conseqente construo do intervalo de confiana, 95%
dos intervalos construdos conteriam o verdadeiro valor de .
Sendo assim, errado dizer que h uma probabilidade de 0,95 de o intervalo especfico
[4, 216; 5, 784] conter o verdadeiro valor de . Mas certo dizer que com probabilidade
0,95 o intervalo

2
2
X 1, 96 ; X + 1, 96
25
25
contm . Note a varivel aleatria X no limite do intervalo.
Exemplo 4.1 Em determinada populao, o peso dos homens adultos distribudo normalmente com um desvio padro de 16 kg. Uma amostra aleatria simples de 36 homens
adultos sorteada desta populao, obtendo-se um peso mdio de 78,2 kg. Construa um
intervalo de confiana de nvel de confiana 0,95 para o peso mdio de todos os homens
adultos dessa populao.
Soluo
Vamos incialmente determinar o valor crtico associado ao nvel de confiana de 0,95.
Como 1 = 0, 95, resulta que = 0, 05 e /2 = 0, 025.
Analisando a Figura 4.3, vemos que nas duas caudas da distribuio normal padro
temos que ter 5% da rea ( = 0, 05); logo, em cada cauda temos que ter 2,5%
(/2 = 0, 025) da rea total. Em termos da nossa tabela da distribuio normal padro
(apresentada novamente ao final da apostila como Tabela 1), isso significa que entre 0
e z0,025 temos que ter (50 2, 5)% = 47, 5% e, assim, temos que procurar no corpo da
tabela o valor de 0,475 para determinar a abscissa z0,025 . Veja a Figura 4.4.
Procurando no corpo da tabela da distribuio normal padro, vemos que o valor
0,475 corresponde abscissa z0,025 = 1, 96. Logo, nosso intervalo de confiana

16
16
78, 2 1, 96 ; 78, 2 + 1, 96
= [72, 9733 ; 83, 4267]
36
36
Esse intervalo contm ou no o verdadeiro valor de , mas o procedimento utilizado
para sua obteno nos garante que h 95% de chance de estarmos certos.

CAPTULO 4. INTERVALOS DE CONFIANA

63

Figura 4.4: Valor crtico associado ao nvel de confiana 1 = 0, 95

4.2.3

Lista de Exerccios 1

1. Encontre os valores crticos da normal padro correspondentes aos seguintes nveis


de confiana 1 = 0, 90; 0, 99; 0, 80.
2. Encontre o nvel de confiana correspondente aos seguintes valores crticos z/2 =
1, 28; 1, 80.
3. De uma populao normal com desvio padro 2, extrai-se uma aas de tamanho 36,
36
P
xi = 1236. Calcule o intervalo de confiana
que fornece o seguinte resultado:
i=1

para a mdia populacional , utilizando o nvel de significncia = 2%.

4.3

Margem de erro

Vamos, agora, analisar a margem de erro do intervalo de confiana para a mdia de uma
populao normal com varincia conhecida. Ela dada por

= z/2
n

(4.5)

Lembrando que o erro padro o desvio padro do estimador, podemos escrever


= z/2 EP (X)

(4.6)

Analisando a equao (4.5), podemos ver que ela depende diretamente do valor crtico
e do desvio padro populacional e inversamente proporcional ao tamanho da amostra.
Na Figura 4.5 ilustra-se a relao de dependncia da margem de erro em relao
ao desvio padro populacional . Temos a duas distribuies amostrais centradas na
mesma mdia e baseadas em amostras de mesmo tamanho. Nas duas distribuies a
rea total das caudas sombreadas , de modo que o intervalo limitado pelas linhas
verticais o intervalo de confiana de nvel de confiana 1 . Para a distribuio mais
dispersa, isto , com maior, o comprimento do intervalo maior. Esse resultado deve

CAPTULO 4. INTERVALOS DE CONFIANA

Figura 4.5: Margem de erro versus sigma: 1 < 2

64

<

ser intuitivo: se h mais variabilidade na populao, a nossa margem de erro tem que ser
maior, mantidas fixas as outras condies (tamanho de amostra e nvel de confiana).
Por outro lado, se mantivermos fixos o tamanho da amostra e o desvio padro populacional, razovel tambm esperar que a margem de erro seja maior para um nvel de
confiana maior. Ou seja, se queremos aumentar a probabilidade de acerto, razovel
que o intervalo seja maior. Aumentar a probabilidade de acerto significa aumentar
o nvel de confiana, o que acarreta em um valor crtico z/2 maior. Veja a Figura
4.6, onde ilustra-se o intervalo de confiana para dois nveis de confiana diferentes:
1 2 > 1 1 . O primeiro intervalo maior, refletindo o maior grau de confiana.

Figura 4.6: Margem de erro versus nvel de confiana: 1 2 > 1 1

>

Finalmente, mantidos o mesmo desvio padro populacional e o mesmo nvel de confiana, quanto maior o tamanho da amostra, mais perto vamos ficando da populao e,
assim, vai diminuindo a nossa margem de erro.
Exemplo 4.2 De uma populao normal com varincia 25 extrai-se uma amostra aleatria

CAPTULO 4. INTERVALOS DE CONFIANA

65

simples de tamanho n com o objetivo de se estimar a mdia populacional com um nvel


de confiana de 90% e margem de erro de 2. Qual deve ser o tamanho da amostra?
Soluo
Para um nvel de confiana 0,90, o valor do nvel de significncia = 0, 10. Ento,
na cauda superior da distribuio normal padro temos que ter uma rea (probabilidade)
de 0,05 e, portanto, para encontrarmos o valor de z0,05 temos que procurar no corpo da
tabela o valor 0,45 (se necessrio, consulte a Figura 4.4). Resulta que z0,05 = 1, 64.
Temos, ento, todos os valores necessrios:

5
1, 64 5
2 = 1, 64 n =
= 4, 1 n = 16, 71
2
n
Como o valor de n tem que ser um inteiro, uma estimativa apropriada n = 17 (devemos
arredondar para cima para garantir um nvel de confiana no mnimo igual ao desejado).
Exemplo 4.3 Na divulgao dos resultados de uma pesquisa, publicou-se o seguinte
texto (dados fictcios): Com o objetivo de se estimar a mdia de uma populao,
estudou-se uma amostra de tamanho n = 45. De estudos anteriores, sabe-se que essa
populao muito bem aproximada por uma distribuio normal com desvio padro 3,
mas acredita-se que a mdia tenha mudado desde esse ltimo estudo. Com os dados
amostrais obteve-se o intervalo de confiana [1, 79; 3, 01], com uma margem de erro de
0,61. Quais so as informaes importantes que no foram divulgadas? Como podemos
obt-las?
Soluo
Quando se divulga um intervalo de confiana para um certo parmetro, costume publicar tambm a estimativa pontual. Nesse caso, temos que informar a mdia
amostral, que pode ser achada observando que o intervalo de confiana simtrico em
torno da mdia. Logo, x o ponto mdio do intervalo:
x=

1, 79 + 3, 01
= 2, 4
2

Outra informao importante o nvel de confiana, que encontrado a partir da abscissa


z/2 :

3
0, 61 45
0, 61 = z/2 z/2 =
= 1, 36
3
45
Consultando a tabela da distribuio normal, vemos que tab(1, 36) = 0, 41308. Veja a
Figura 4.7: o nvel de confiana 2 0, 41308 = 0, 826 16 0, 83.
Como dito no incio do captulo, a situao abordada aqui pouco realista. Na
prtica, em geral no conhecemos o desvio padro da populao. Nos prximos captulos
iremos estudar o caso mais geral em que no conhecido.

CAPTULO 4. INTERVALOS DE CONFIANA

66

Figura 4.7: Clculo do nvel de confiana a partir de , , n

4.3.1

Lista de Exerccios 2

1. Considere os dois intervalos de confiana a seguir, obtidos a partir de uma mesma


amostra de uma populao N(; 16). Sem fazer qualquer clculo, identifique para
qual deles o nvel de confiana maior.
[13, 04; 16, 96]
[12, 42; 17, 58]
2. Obtido um intervalo de confiana para a mdia de uma N (; 25), o que deve ser
feito para se reduzir a margem de erro pela metade se no devemos alterar o nvel
de confiana?

4.4

Resumo do Captulo

Como existe uma variabilidade nos valores de um estimador b


ao longo das possveis
amostras, uma maneira de informar sobre esta variabilidade atravsh da estimao
i
b
b
por intervalos de confiana. Esses intervalos, em geral, tm a forma ; + ,
onde margem de erro.
A obteno de um intervalo de confiana feita de modo que

h
i
Pr b
;b
+
=1

O valor 1 o nvel de confiana, enquanto o valor o nvel de significncia.


A probabilidade se refere probabilidade dentre as diversas possveis amostras, ou
seja, a probabilidade est associada distribuio amostral de b
. Cada amostra d
origem a um intervalo diferente, mas o procedimento de obteno dos intervalos
garante probabilidade 1 de acerto, ou seja, incluso do verdadeiro valor do
parmetro.

CAPTULO 4. INTERVALOS DE CONFIANA

67

A margem de erro do intervalo de confiana para a mdia de uma populao normal


com varincia conhecida

= z/2 = z/2 EP (X)


n
onde z/2 o valor crtico da densidade normal padro que deixa probabilidade
/2 acima dele.

4.5

Exerccios

1. De uma populao N(; 9) extrai-se uma amostra aleatria simples de tamanho


25
P
xi = 60. Desenvolva detalhadamente o intervalo de confiana de
25, obtendo-se
i=1

nvel de confiana 99% para a mdia da populao.

2. Determine o tamanho da amostra necessrio para se estimar a mdia de uma


populao normal com = 4, 2 para que, com confiana de 95%, o erro mximo
de estimao seja 0, 05.
3. O peso X de um certo artigo descrito aproximadamente por uma distribuio
normal com = 0, 58. Uma amostra de tamanho n = 25 resultou em x = 2, 8.
Desenvolva detalhadamente o intervalo de confiana de nvel de confiana 0, 90.
4. De uma populao normal com = 5, retira-se uma amostra aleatria simples de
tamanho 50, obtendo-se x = 42.
(a) Obtenha o intervalo de confiana para a mdia com nvel de significncia de
5%.
(b) Qual o erro de estimao?
(c) Para que o erro seja 1, com probabilidade de acerto de 95%, qual dever
ser o tamanho da amostra?
5. Os valores da venda mensal de determinado artigo tm distribuio aproximadamente normal com desvio padro de R$500,00. O gerente da loja afirma vender,
em mdia, R$34.700,00. O dono da loja, querendo verificar a veracidade de tal afirmativa, seleciona uma amostra aleatria das vendas em determinado ms, obtendo
os seguintes valores:
33840, 00
32940, 00

32960, 00
32115, 00

41815, 00
32740, 00

35060, 00
33590, 00

35050, 00
33010, 00

(a) Obtenha o intervalo de confiana para a venda mdia mensal com nvel de
significncia de 5%.
(b) Obtenha o intervalo de confiana para a venda mdia mensal com nvel de
significncia de 1%.

CAPTULO 4. INTERVALOS DE CONFIANA

68

(c) Em qual dos dois nveis de significncia podemos afirmar que o gerente se
baseou para fazer a afirmativa?
6. Intervalo de confiana com limites assimtricos O tempo de execuo de determinado teste de aptido para ingresso em um estgio normalmente distribudo
com desvio padro de 10 minutos. Uma amostra de 25 candidatos apresentou um
tempo mdio de 55 minutos. Construa um intervalo de confiana de limites L1 e
L2 (L1 < L2 ) de modo que seja observada a seguinte especificao: desconfiana
de que < L1 atribuiremos um nvel de significncia de 5% e desconfiana de
que > L2 atribuiremos o nvel de significncia de 10%.

4.6

Soluo das Listas de Exerccios

Lista de Exerccios 1
1. 1 = 0, 90 = z0,05 = 1, 64

1 = 0, 99 = z0,005 = 2, 58

1 = 0, 80 = z0,10 = 1, 28

2. tab(1, 28) = /2 = 0, 39973 = = 2 0.39973 = 0.79946 0, 80 ou 80%


tab(1, 80) = /2 = 0, 46407 = = 2 0.46407 = 0.92814 0, 93 ou 93%

3. = 2% = 1 = 98% = tab(z0,01 ) = 0, 49 = z0,01 = 2, 33


2
= 2.33 = 0, 7767
36
Como a mdia amostral observada x =

1236
36

= 34.333, o intervalo de confiana

[34.333 0.7767; 34.333 + 0.7767] = [33, 556; 35, 110]


Lista de Exerccios 2
1. Como a amostra a mesma, isso significa que a populao a mesma, bem como
o tamanho de amostra, ou seja, e n so os mesmos. Vimos que um nvel de
confiana maior resulta em um intervalo de confiana maior; logo, o segundo intervalo foi construdo com base em um nvel de confiana maior do que o utilizado
na construo do primeiro.
2. Mantidos fixos o nvel de confiana e o desvio padro populacional, vimos que a
margem de erro inversamente proporcional raiz quadrada
de n. Assim, para
reduzir pela metade a margem de erro, temos que dobrar n, ou seja, temos que
quadruplicar o tamanho amostral n.

CAPTULO 4. INTERVALOS DE CONFIANA

4.7

69

Soluo dos Exerccios

1. dado que X N(; 9). Como n = 25, sabemos que

9
X N ;
25
Com 1 = 0, 99, temos que = 0, 01 e /2 = 0, 005. Assim, temos que procurar
no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 005 = 0, 495,o que
nos d z0,005 = 2, 58. Ento
Pr(2, 58 Z 2, 58) = 0, 99

X
2, 58 = 0, 99
Pr 2, 58 q

Pr 2, 58

9
25

9
X 2, 58
25

9
25

= 0, 99

Pr(1, 548 X 1, 548) = 0, 99


Pr(X 1, 548 X + 1, 548) = 0, 99
= 2, 4 o intervalo de confiana de 99% de
Como a mdia amostral obtida x = 60
25
confiana
[2, 4 1, 548 ; 2, 4 + 1, 548] = [0, 852 ; 3, 948]
2. Queremos | | 0, 05, com = 4, 2 e 1 = 0, 95.
1 = 0, 95 z/2 = 1, 96
Ento
4, 2
1, 96 0, 05
n

1, 96 4, 2
= 164, 64
n
0, 05
n 27106, 3296
Logo, o tamanho mnimo necessrio n = 27107.
3. dado que X N(; 0, 582 ). Como n = 25, sabemos que

0, 582
X N ;
25
Com 1 = 0, 90, temos que = 0, 10 e /2 = 0, 05. Assim, temos que procurar
no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 05 = 0, 45,o que nos

CAPTULO 4. INTERVALOS DE CONFIANA

70

d z0,05 = 1, 64. Ento


Pr(1, 64 Z 1, 64) = 0, 90

X
1, 64 = 0, 90
Pr 1, 64 q
0,582
25

0, 58
0, 58
X 1, 64
= 0, 90
Pr 1, 64
5
5
Pr(0, 19024 X 0, 19024) = 0, 90
Pr(X 0, 19024 X + 0, 19024) = 0, 90

Como a mdia amostral obtida x = 2, 8 o intervalo de confiana de nvel de


confiana 99%
[2, 8 0, 19024 ; 2, 8 + 0, 19024] = [2, 60976 ; 2, 99024]
4. = 0, 05 1 = 0, 95 z0,025 = 1, 96
(a) A margem de erro
5
= 1, 96 = 1, 3859
50
Logo, o intervalo de confiana de nvel de confiana 0,95
[42 1, 385 9 ; 42 + 1, 3859] = [40, 6141 ; 43, 3859]
(b) Como visto em (a) a margem de erro = 1, 3859.
(c) Temos que reduzir a margem de erro; logo, o tamanho da amostra ter que
ser maior que 50.
5
= 1, 96 1
n

n 1, 96 5 = 9, 8
n 9, 82 = 96, 04
Logo, n deve ser no mnimo igual a 97.
5. A mdia amostral x =

343120
10

= 34312.

(a) A margem de erro


500
= 1, 96 = 309, 9
10
Logo, o intervalo de confiana de nvel de confiana 95%
[34312 309, 9 ; 34312 + 309, 9] = [34002, 1 ; 34621, 9]

CAPTULO 4. INTERVALOS DE CONFIANA

71

(b) A margem de erro


500
= 2, 58 = 407, 93
10
Logo, o intervalo de confiana de nvel de confiana 95%
[34312 407, 93 ; 34312 + 407, 93] = [33904, 07 ; 34719, 93]
(c) O gerente deve estar usando o nvel de significncia de 1% (ou nvel de confiana de 99%).
6. Veja a Figura 4.8.

Figura 4.8: Soluo do Exerccio 6 - Intervalo de confiana assimtrico


Temos que ter
Pr(Z < z1 ) = 0, 05 Pr(Z > z1 ) = 0, 05
tab(z1 ) = 0, 45 z1 = 1, 64 z1 = 1, 64
Temos que ter
Pr(Z > z2 ) = 0, 10 tab(z2 ) = 0, 40 z2 = 1, 28
Resulta, ento, que
Pr(1, 64 Z 1, 28) = 0, 85

X
1, 28 = 0, 85
Pr 1, 64 n

= 0, 85
Pr 1, 64 X 1, 28
n
n

Pr X 1, 64 X + 1, 28
= 0, 85
n
n

Pr X 1, 28 X + 1, 64
= 0, 85
n
n

CAPTULO 4. INTERVALOS DE CONFIANA


Com os dados obtidos, o intervalo de confiana assimtrico

10
10
= [52, 44 ; 57, 56
55 1, 28 ; 55 + 1, 28
25
25

72

Captulo 5
Intervalos de Confiana: Propores
- Amostra Grande
No captulo anterior, foram apresentadas as idias bsicas da estimao por intervalos
de confiana. Para ilustrar o princpio utilizado na construo de tais intervalos, consideramos a situao especial de estimao da mdia de uma populao normal com
varincia conhecida. Neste caso, a distribuio amostral da mdia amostral normal e
foi com base nessa distribuio amostral normal que obtivemos o intervalo de confiana.
Neste captulo usaremos o teorema limite central, que garante que a distribuio
amostral da proporo amostral pode ser aproximada por uma distribuio normal,
desde que utilizemos amostras grandes.

5.1

Estimao de uma proporo populacional

O contexto de interesse o seguinte: temos uma populao em que cada elemento


classificado de acordo com a presena ou ausncia de determinada caracterstica. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :

1 se elemento possui a caracterstica de interesse


X=
0 se elemento no possui a caracaterstica de interesse
Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p). O parmetro p tambm
a proporo de elementos da populao que possuem a caractersitca de interesse. Em
geral, esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X1 , X2 , . . . , Xn com reposio. Vimos que a proporo Pb de elementos na amostra que
possuem a caracterstica de interesse, definida por
Sn
X1 + X2 + + Xn
Pb =
=
n
n

73

(5.1)

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE74


um estimador no-viesado para p com varincia

p(1p)
n

. Mais precisamente,

E(Pb) = p
p(1 p)
V ar(Pb) =
n

Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central
nos diz que a distribuio de Pb se aproxima de uma nornal com mdia p e varincia
p(1p)
. Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e, em geral,
n
essas condies so satisfeitas se n 30. Note que, com n = 30, np 5 sempre que
p 0, 1667; logo, essa indicao n 30 em geral funciona, desde que a caracterstica de
interesse no seja extremamente rarefeita na populao (em estatstica, usa-se o termo
populaes raras nos casos em que p muito pequeno). Caso haja suspeitas de que p
seja muito pequeno, deve-se aumentar o tamanho da amostra.
Resumindo, temos o seguinte resultado:

p(1

p)
Pb N p;
n
Usando as propriedades da distribuio normal, temos que
Pb p
q
N(0; 1)
p(1p)
n

ou equivalentemente

Pb p
N(0; 1)
np
p(1 p)

(5.2)

Vamos ver, agora, como usar esse resultado para obter um intervalo de confiana para
a verdadeira proporo populacional p.

5.2

Intervalo de confiana para a proporo populacional

O procedimento de construo do intervalo de confiana para a proporo populacional


totalmente anlogo ao do intervalo de confiana para a mdia de uma populao
normal com varincia conhecida, visto no captulo anterior. Assim, iremos usar a mesma
notao, a saber: vamos representar por z a abscissa da curva normal padro que
deixa probabilidade (rea) acima dela. Como visto, temos o seguinte resultado, onde
Z N(0; 1) :
Pr(z/2 Z z/2 ) = 1
(5.3)
Veja a Figura 5.1.

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE75

Figura 5.1: Definio do valor crtico z/2 da N(0; 1)


Como o resultado (5.3) vale para qualquer varivel aleatria N(0; 1), podemos usar
(5.2) para obter
!

Pb p
z/2 = 1
Pr z/2 n p
p(1 p)

e, portanto

Pr z/2

p(1 p)
Pb p z/2
n

p(1 p)
n

= 1 =

!
r
p(1

p)
p(1

p)
Pr Pb z/2
p Pb + z/2
= 1 =
n
n

!
r
r
p(1

p)
p(1

p)
Pr Pb z/2
p Pb + z/2
= 1
n
n
r

Como no caso da mdia, chegamos a uma expresso do seguinte tipo:

Pr Pb p Pb + = 1

onde = z/2

p(1p)
.
n

Tanto no caso da mdia de uma populao normal com varincia conhecida, quanto
no caso da proporo, a margem de erro tem a forma
= z/2 EP (b
)

onde EP (b
) representa o erro padro do estimador em questo. No caso da mdia,

EP (b
) = EP (X) =
n

(5.4)

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE76


e no caso da proporo,
EP (b
) = EP (Pb) =

p(1 p)
n

(5.5)

Analisando as expresses (5.4) e (5.5), podemos ver uma diferena fundamental: o


erro padro da proporo amostral depende do parmetro desconhecido p. Na prtica,
para construir o intervalo de confiana, temos que substituir esse valor por alguma
estimativa.
Existem 3 abordagens possveis:
1. Usar a prpria proporo amostral observada; nesse caso, o intervalo de confiana
seria
r
pb(1 pb)
Pb z/2
n

2. Usar o intervalo de confiana conservador, ou seja, usar o maior valor possvel


para EP (Pb) para um dado n, o que equivale a obter o intervalo de confiana com
o maior comprimento
possvel. Como o comprimento do intervalo diretamente
p
proporcional a p(1 p) ou equivalentemente, a p(1 p), vamos estudar o comportamento desta funo. Na Figura 5.2, temos o grfico da funo p(1 p) para
valores de p no intervalo de interesse [0, 1]. Vemos que o mximo dessa funo
ocorre quando p = 0, 5. Logo, na falta de uma estimativa melhor para p, podemos
tomar p = 0, 5, que fornece o maior intervalo de confiana possvel, mantidas as
outras condies constantes.

Figura 5.2: Grfico da funo p(1 p) para 0 p 1


Neste caso, o o intervalo de confiana se torna
r
0, 5 0, 5
0, 5
Pb z/2
= Pb z/2
n
n

3. Usar algum valor auxiliar pb0 ou estimativa prvia, obtida de outras fontes ou de
uma amostra piloto:
r
d e = pb0 (1 pb0 )
EP
(5.6)
P
n

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE77


Definio 5.1 Intervalo de confiana para uma proporo populacional
Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao representada
pela varivel X de Bernoulli com
Pr(X = 1) = p
Pr(X = 0) = 1 p
Se o tamanho n da amostra suficientemente grande [em geral, deve-se ter np 5 e
n(1 p) 5], ento o intervalo de confiana aproximado para p de nvel de confiana
1 dado por
"
#
r
r
pb0 (1 pb0 ) b
pb0 (1 pb0 )
Pb z/2
; P + z/2
n
n

onde z/2 abscissa da curva normal padro que deixa rea /2 acima dela e pb0
alguma estimativa para o verdadeiro valor p.

Exemplo 5.1 Um gerente de produo deseja estimar a proporo de peas defeituosas


em uma de suas linhas de produo. Para isso, ele seleciona uma amostra aleatria
simples de 100 peas dessa linha de produo, obtendo 30 defeituosas. Determine o
intervalo de confiana para a verdaeira proporo de peas defeituosas nessa linha de
produo, a um nvel de significncia de 5%.
Soluo
O primeiro fato a observar que a amostra grande, o que nos permite usar a
aproximao normal. Com um nvel de significncia de = 0, 05, o nvel de confiana
1 = 0, 95 e da tabela da normal padro, obtemos que z/2 = 1, 96. Como no temos
estimativa prvia da proporo de defeituosas p, temos que usar a proporo amostral
pb = 0, 30. Assim, a margem de erro
r
0, 3 0, 7
= 1, 96
= 0, 0898
100
e o intervalo de confiana
[0, 30 0, 0898; 0, 30 + 0, 0898] = [0, 2102; 0, 3898]

5.3

Determinao do tamanho da amostra

Uma questo que se coloca freqentemente : qual o tamanho da amostra necessrio


para se estimar uma proporo p com uma margem de erro e nvel de confiana 1 ?
Vamos analisar a expresso da margem de erro:
r
p(1 p)
= z/2
n

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE78


Resolvendo para n, obtemos que

n = z/2
ou

p
p(1 p)

n = [p(1 p)]

/2

Vemos, ento, que n diretamente proporcional a p(1p), ou seja, quanto maior p(1p),
maior ser o tamanho da amostra n. Na prtica, no conhecemos p (na verdade, estamos querendo estimar esse parmetro). Ento, para determinar o tamanho de amostra
necessrio para uma margem de erro e um nvel de confiana dados, podemos considerar
o pior caso, ou seja, podemos tomar o maior valor possvel de p(1 p) e calcular o
tamanho da amostra com base nesse pior caso, que ocorre quando p = 0, 5. claro
que essa uma escolha conservadora, que em alguns casos pode levar a um tamanho de
amostra desnecessariamente grande. Usando esta estimativa para p, obtemos que

z/2 2
n = 0, 5
Exemplo 5.2 Para estudar a viabilidade de lanamento de um novo produto no mercado, o gerente de uma grande empresa contrata uma firma de consultoria estatstica
para estudar a aceitao do produto entre os clientes potenciais. O gerente deseja obter
uma estimativa com um erro mximo de 1% com probabilidade 80% e pede ao consultor
estatstico que fornea o tamanho de amostra necessrio.
1. De posse das informaes dadas, o consultor calcula o tamanho da amostra necessrio
no pior cenrio. O que significa pior cenrio nesse caso? Qual o tamanho de
amostra obtido pelo consultor?
2. O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor
a realizar um estudo piloto com uma amostra de 100 pessoas para obter uma estimativa da verdadeira proporo. O resultado desse estudo piloto uma estimativa
pb = 0, 76 de aceitao do novo produto. Com base nessa estimativa, o consultor
recalcula o tamanho da amostra necessrio. Qual esse tamanho?

3. Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma


proporo de 72% de clientes favorveis ao produto. Construa um intervalo de
confiana para a verdadeira proporo com nvel de confiana de 90%.
Soluo
1. O pior cenrio quando a populao est dividida meio-a-meio em suas preferncias, ou seja, quando p = 0, 5. Com nvel de confiana de 80%, obtemos z0,10 =
1, 28. Nesse caso,
r
0, 5 0, 5
0, 01 = 1, 28
=
n

2
1, 28
n =
0, 25 = 4096
0, 01

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE79


2. Vamos agora utilizar pb = 0, 76 :

0, 76 0, 24
0, 01 = 1, 28
=
n

2
1, 28
n =
0, 76 0, 24 = 2988, 4
0, 01

ou seja, n = 2989
3. 1 = 0, 90 = z0,05 = 1, 64
= 1, 64

0, 72 0, 28
= 0, 0135
2989

e o intervalo de confiana
[0, 72 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335]

Exemplo 5.3 Uma associao de estudantes universitrios de uma grande universidade


deseja saber a opinio dos alunos sobre a proposta da reitoria sobre o preo do bandejo.
Para isso, seleciona aleatoriamente uma amostra de 200 estudantes, dos quais 120 so
favorveis proposta da reitoria.
1. Construa um intervalo de confiana para a verdadeira proporo de alunos favorveis poltica da reitoria, ao nvel de significncia de 2%.
2. Qual a margem de erro em (1)?
3. Qual dever ser o tamanho da amostra para se ter um erro de no mximo 5%,
com nvel de confiana de 98%?
Soluo
1. Com nvel de significncia de 2%, o nvel de confiana 98%, o que resulta em
= 0, 6.
z0,01 = 2, 33. Com 120 estudantes favorveis dentre 200, temos que pb = 120
200
Logo
r
0, 6 0, 4
= 2, 33
= 0, 0807
200
e o intervalo de confiana
[0, 6 0, 0807; 0, 6 + 0, 0807] = [0, 5193; 0, 6807]
2. A margem de erro = 0, 0807.

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE80


3. Queremos, agora, reduzir a margem de erro para 5%, mantendo o mesmo nvel de
confiana. Certamente teremos que aumentar o tamanho da amostra:

2, 33

0, 05

0, 6 0, 4
0, 05
n

2, 33 p
0, 6 0, 4
n
0, 05
2

2.33
0.6 0.4
n
0.05
n 522

Se usssemos o pior cenrio, isto , p = 0, 5 teramos que ter

2
2, 33
n
0, 25
0, 05
n 543

5.4

Resumo do Captulo

No estudo da proporo amostral, a populao descrita por uma varivel aleatria


de Bernoulli X tal que
Pr(X = 1) = p
Pr(X = 0) = 1 p
em que X = 1 representa a presena da caracterstica de interesse.
Dada uma aas X1 , X2 , . . . , Xn de tal populao, a proporo Pb de elementos na
amostra que possuem a caracterstica de interesse
X1 + X2 + + Xn
Sn
=
Pb =
n
n

com as seguintes propriedades:

E(Pb) = p
p(1 p)
V ar(Pb) =
n

Pelo Teorema Limite Central, resulta que

p(1 p)
b
P N p;
n

e essa aproximao s deve ser usada se np 5 e n(1 p) 5.

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE81


A margem de erro do intervalo de confiana para a proporo populacional
r
p(1 p)
= z/2
= z/2 EP (Pb)
n

onde z/2 o valor crtico da densidade normal padro que deixa probabilidade
/2 acima dele.

Como a margem de erro depende do parmetro a ser estimado, uma alternativa


trabalhar com alguma estimativa prvia ou com a prpria estimativa usada na
construo do intervalo de confiana. Assim, o intervalo de confiana estimado
para a proporo populacional p dado por
"
#
r
r
pb0 (1 pb0 )
pb0 (1 pb0 )
pb z/2
; pb + z/2
n
n

Na determinao do tamanho amostral necessrio para se obter determinada margem


de erro ao nvel de confiana 1, podemos usar o pior cenrio, que corresponde a
uma populao dividida ao meio, isto , p = 0, 5. Neste caso, o tamanho amostral
dado por
z 2
z 2
/2
/2
n=
p(1 p) =
2

5.5

Exerccios

1. Construa um intervalo de confiana para a proporo populacional para cada um


dos casos listados a seguir:
(a)
n = 600
= 2%.
Nmero de sucessos na amostra = 128

(b)
n = 1200
= 10%.
Nmero de sucessos na amostra = 710
estimativa prvia pb0 = 55%

2. Uma amostra de 300 habitantes de uma grande cidade revelou que 180 desejavam a
fluorao da gua. Encontre o intervalo de confiana para a verdadeira proporo
dos que no desejam a fluorao da gua para

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE82


(a) um nvel de significncia de 5%;
(b) um nvel de confiana de 96%.
3. Querendo estimar a proporo de peas defeituosas em uma linha de produo,
examinou-se uma amostra de 100 peas, encontrando-se 32 defeituosas. Sabese que o estimador Pb para esse tamanho de amostra tem desvio padro de 3%.
Calcule o intervalo de confiana ao nvel de significncia de 3%.

4. Em uma pesquisa de mercado, 57 das 150 pessoas entrevistadas afirmaram que


comprariam determinado produto sendo lanado por uma empresa. Essa amostra
suficiente para se estimar a verdadeira proporo de futuros compradores, com
uma preciso de 0,08 e uma confiana de 90%? Em caso negativo, calcule o
tamanho de amostra necessrio.

5. Uma amostra aleatria simples de 400 itens forneceu 100 itens correspondentes ao
evento Sucesso.
(a) Qual a estimativa pontual pb para a verdadeira proporo de Sucessos na
populao?

(b) Qual o erro padro estimado de pb?

(c) Calcule o intervalo de confiana para a verdadeira proporo de Sucessos na


populao ao nvel de confiana de 80%.

6. Em uma sondagem, uma estimativa preliminar de Sucessos em uma populao


de 0,35. Que tamanho deve ter uma amostra para fornecer um intervalo de
confiana de 95% com uma margem de erro de 0,05?

5.6

Soluo dos Exerccios

1. .
(a) = 2% 1 = 98% z0,01 = 2, 33
= 0, 213 3
pb = 128
600
r
0, 213 3(1 0, 2133)
= 2, 33
= 0, 03897
600
e o intervalo de confiana
[0, 2133 0, 03897; 0, 2133 + 0, 03897] = [0, 17433; 0, 25227]
(b) = 10% 1 = 90% z0,05 = 1, 64
710
= 0, 591 67 =
pb = 1200
r
0, 55 0, 45
= 1, 64
= 0, 02355
1200

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE83


e o intervalo de confiana
[0, 59167 0, 02355; 0, 59167 + 0, 02355] = [0, 56812; 0, 61522]
2. O problema pede a estimativa para a proporo dos que no querem a fluorao;
logo, pb = 120
= 0, 4
300
(a) = 5% 1 = 95% z0,025 = 1, 96
r
0, 4 0, 6
= 0, 05544
= 1, 96
300
e o intervalo de confiana

[0, 4 0, 05544; 0, 4 + 0, 05544] = [0, 34456; 0, 045544]


(b) 1 = 96% z0,02 = 2, 05
= 2, 05

0, 4 0, 6
= 0, 05798
300

e o intervalo de confiana
[0, 4 0, 05798; 0, 4 + 0, 05798] = [0, 34202; 0, 045798]
3. dado que n = 100, pb = 0, 32 e EP (Pb) = 0, 03.
= 3% z0,015 = 2, 17

= 2, 17 0, 03 = 0, 0651

[0, 32 0, 0651; 0, 32 + 0, 0651] = [0, 2549; 0, 3851]


57
4. pb = 150
= 0, 38. Para uma margem de erro de 0,08 e um nvel de confiana de
90%, o tamanho da amostra teria que ser
2

1, 64
0, 38 0, 62 = 99, 011
n
0, 08

Como o tamanho da amostra 150, essa amostra suficiente.


5. .
(a) pb =

100
400

= 0, 25
q
b
(b) EP (P ) = 0,250,75
= 0, 02651
400
(c) 1 = 0, 80 z0,1 = 1, 28

[0, 25 1, 28 0, 021651; 0, 25 + 1, 28 0, 021651] = [0, 22229; 0, 27771]


6. pb0 = 0, 35
Logo, n 350

1, 96
0, 05

0, 35 0, 65 = 349, 59

Captulo 6
Intervalo de Confiana: Mdia da
N(; 2), 2 Desconhecida
Neste captulo voc completar seu estudo bsico sobre intervalos de confiana para a
mdia de uma populao, analisando o problema de estimao da mdia de uma populao normal quando no se conhece a varincia desta populao. Voc ver que, neste
caso, necessrio estimar essa varincia e isso introduz mais uma fonte de variabilidade
nas nossas estimativas: com uma nica amostra, temos que estimar a mdia e a varincia da populao. O procedimento simples e anlogo aos casos anteriores vistos
nos captulos amteriores; o que muda a distribuio amostral do estimador X. Em
vez de usarmos a distribuio normal para determinar os valores crticos, usaremos a
distribuio t de Student.
Voc ver os seguintes conceitos:
estimao da varincia de uma populao
distribuio amostral da mdia amostral de uma populao normal com varincia
desconhecida
intervalo de confiana para a mdia de uma populao normal com varincia desconhecida

6.1

Idias bsicas

Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia 2 : X N (; 2 ). Nosso interesse estimar a mdia a partir de uma amostra
aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a distribuio amostral de
2
X normal com mdia e varincia n , ou seja

2
2
X N(; ) = X N ;
n
84

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA85


Assim, se o valor de conhecido, resulta que
Z=

X
N(0; 1)
n

(6.1)

e esse resultado foi utilizado na construo do intervalo de confiana para a mdia de


uma populao normal com varincia conhecida, fornecendo o seguinte intervalo:

X z/2 ; X + z/2
n
n
Suponhamos, agora, que a varincia 2 no seja conhecida. Neste caso, temos que
estim-la com os dados amostrais. Foi demonstrado que

n
n
P 2
1 P
1
2
2
2
(Xi X) =
X nX
S =
n 1 i=1
n 1 i=1 i

um estimador no-viesado de 2 . Isso significa que, se calculssemos o valor de S 2 para


cada uma das possveis amostras aleatrias simples de tamanho n, a mdia desses valores
seria igual a 2 . Dessa forma, S 2 um bom estimador de 2 e podemos us-lo como
uma estimativa pontual de 2 . Como o desvio padro a raiz quadrada da varincia,
natural perguntar: S um bom estimador de , ou seja, S um estimador no-viesado
de ? A resposta NO, mas, para grandes amostras, o vis pequeno, de modo que,
em geral, usa-se S como estimador de .
Sendo assim, natural pensarmos em substituir o valor de por S na expresso
(6.1) e utilizarmos a estatstica
X
T = n
S
na construo de intervalos de confiana para . Isso exatamente o que faremos, mas,
ao introduzirmos S no lugar de , a distribuio amostral de T deixa de ser normal e
passa a ser uma distribuio t de Student.
A distribuio t de Student (ou simplesmente distribuio t) foi obtida por William
Gosset (1876-1937), que trabalhava na Cervejaria Guinness na Irlanda. Como a cervejaria no permitia a publicao de resultados de pesquisa obtidos por seus funcionrios,
Gosset publicou, sob o pseudnimo de Student, o artigo The Probable Error of a Mean
na revista Biometrika (vol. 6, no. 1).

6.2

Intervalo de confiana para a mdia de uma populao normal com varincia desconhecida

O intervalo de confiana para a mdia de uma populao normal com varincia desconhecida obtido com base no seguinte resultado:

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA86


Teorema 6.1 Se X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao
X N (; 2 ) , ento
X
T = n
t(n 1)
(6.2)
S

n
n
P
P
2
1
1
(Xi X)2 = n1
Xi2 nX .
onde S 2 = n1
i=1

i=1

O nmero de graus de liberdade gl = n 1 resulta do fato de que, na soma que


define S 2 , h apenas n 1 parcelas independentes, ou seja, dados S 2 e n 1 das parcelas
(Xi X)2 , a nsima parcela fica automaticamente determinada.
Usando a simetria da densidade t, temos o seguinte resultado:

Pr tn; /2 t(n) tn; /2 = 1


(6.3)
Veja a Figura 6.1.

Figura 6.1: Valores crticos da tStudent para construo do intervalo de confiana da


mdia de uma normal com varincia desconhecida
Como o resultado (6.3) vale para qualquer distribuio t, usando o resultado (6.2)
obtemos:

X
Pr tn1; /2 n
tn1; /2 = 1 =
S

S
S
Pr tn1; /2 X tn1; /2
= 1 =
n
n

S
S
=1
Pr X tn1; /2 X + tn1; /2
n
n
Essa ltima expresso o intervalo de confiana para a mdia de uma populao
normal com varincia desconhecida.

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA87


Definio 6.1 Intervalo de confiana para a mdia da N(; 2 ) 2 desconhecida
Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X N (; 2 ) .
O intervalo de confiana para de nvel de confiana 1

S
S
X tn1; /2 ; X + tn1; /2
n
n
onde tn1; /2 o valor crtico da distribuio tStudent com n 1 graus de liberdade
que deixa rea /2 acima dele.

6.3

Margem de erro

Note, mais uma vez, a forma do intervalo de confiana:


X
onde a margem de erro , agora, definida em termos do valor crtico da distribuio t
e do erro padro estimado de X :

onde

6.4

S .
d (X)
= tn1; /2 = tn1; /2 EP
n
d (X) = S
EP
n

(6.4)

(6.5)

Amostras grandes

X
n
S
t(n 1). Mas vimos tambm que, quando o nmero de graus de liberdade grande,
as diferenas entre as distribuies t e N(0; 1) tornam-se desprezveis.
Por outro lado, se a populao no normal, mas tem mdia e varincia 2 , o
X
se aproxima de uma
teorema limite central nos diz que a distribuio de n

N(0; 1) medida que n . Pode-se mostrar que esse resultado continua valendo se
substitumos por seu estimador S.
A concluso dessas duas observaes a seguinte:
Vimos que, para populaes normais, a distribuio exata da estatstica T =

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA88


Definio 6.2 Intervalo de confiana para a mdia - Amostras grandes
Dada uma amostra aleatria simples X1 , X2 , . . . , Xn de uma populao X com mdia
e varincia 2 , ento
X
N(0; 1)
n
S
para n suficientemente grande. Nesse caso, o intervalo de confiana aproximado de
nvel de confiana 1 para

S
S
X z/2 ; X + z/2
n
n
J
Exemplo 6.1 De uma populao normal com mdia e varincia desconhecidas, extraise uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de
confiana para a verdadeira mdia populacional, utilizando o nvel de confiana de 95%.
Soluo
Os seguintes requisitos para o IC para so satisfeitos: a populao normal e
a amostra pequena. Dessa forma, temos que usar a distribuio t com n 1 = 14
graus de liberdade. Como o nvel de confiana de 95%, em cada cauda da distribuio
temos que ter 2,5%. Assim, devemos procurar a abscissa t14;0,025 procurando na linha
correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,025.
Encontramos
t14;0,025 = 2, 145
A margem de erro

7
= 2, 145 = 3, 8769
15

e o intervalo de confiana
[12 3, 8769; 12 + 3, 8769] = [8, 1231; 15, 8769]
Exemplo 6.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
Construa o intervalo de confiana para a mdia populacional, com nvel de significncia
de 10%.
Soluo
Como antes, temos uma amostra pequena de uma populao normal; logo, temos
que usar a distribuio t-Student. Como n = 9, gl = n 1 = 8.
A mdia amostral
P
xi
x =
n
78
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
=
= 8, 6667
=
9
9

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA89


e a varincia amostral
S2

"
P 2#
P
1 P
1
(
xi )
(xi x)2 =
x2i
=
=
n1
n1
n

782
1 2
2
2
2
2
2
2
2
2
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
=
8
9

6084
36
1
712
=
= 4, 5
=
8
9
8

Como o nvel de significncia = 10%, o nvel de confiana 1 = 90%. Em


cauda da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na
linha correspondente a 8 graus de liberdade a abscissa relativa rea superior de 0,05.
Obtemos t8;0,05 = 1, 860. A margem de erro
r
4, 5
= 1, 860
= 1, 395
8
e o intervalo de confiana
[8, 6667 1, 395; 8, 6667 + 1, 395] = [7, 2717; 10, 0617]
Exemplo 6.3 A partir de uma amostra aleatria simples de tamanho n = 100, os
seguintes valores foram obtidos: x = 12, 36 e s2 = 132, 56. Obtenha um intervalo de
confiana de nvel de confiana 90% para a mdia populacional .
Soluo
Como o tamanho amostral grande, podemos usar a aproximao normal. Como
1 = 0, 90, em cada cauda temos que ter 5% e,assim, devemos procurar no corpo da
tabela da distribuio normal o valor mais prximo de 0,45. Resulta que z0,05 = 1, 64, o
que nos d a seguinte margem de erro:
r
132.56
= 1.64
= 1, 8882
100
O intervalo de confiana de 90% de confiana
[12.36 1.8882 ; 12.36 + 1.8882] = [10.472 ; 14.248]

6.5

Resumo comparativo

Para finalizar a parte relativa construo de intervalos de confiana para mdias, vamos
resumir os resultados vistos nos ltimos captulos. importante notar que existem
procedimentos para construo de intervalos de confiana para outros parmetros, tal
como a varincia de uma populao normal, diferena entre mdias, etc. O procedimento
anlogo; o que muda a distribuio amostral.

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA90

6.5.1

IC para a mdia de populaes normais

O contexto bsico analisado o seguinte: de uma populao normal extrai-se uma


amostra aleatria simples X1 , X2 , . . . , Xn com o objetivo de se obter uma estimativa
intervalar para a mdia . Foram consideradas duas situaes: (i) 2 conhecida e (ii) 2
desconhecida. Em ambos os casos, a expresso para o intervalo de confiana de nvel de
confiana 1
X
com a margem de erro assumindo a forma geral
= /2 EP (X)
onde /2 representa o valor crtico de alguma distribuio e EP (X) o erro padro da
mdia amostral.
2 conhecida
/2 = z/2

N(0; 1)

EP (X) =
n
2 desconhecida
/2 = tn1; /2

t(n 1)

S
EP (X) =
n
Quando n > 31, pode-se usar z/2 no lugar de tn1; /2 .

6.5.2

IC para uma proporo

O contexto bsico considerado foi o seguinte: de uma populao representada por uma
varivel aleatria X Bern(p) extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn
com o objetivo de se estimar a proporo populacional p dos elementos que possuem
determinada caracterstica de interesse. Se a amostra suficientemente grande (em
geral, n > 30),o intervalo de confiana para p tem a forma
Pb
com a margem de erro

com

assumindo a forma geral


= z/2 EP (Pb)
r

pb0 (1 pb0 )
n
Aqui, pb0 uma estimativa prvia da proporo populacional p ou a prpria proporo
amostral pb obtida a partir da amostra ou ainda p0 = 0, 5 para o intervalo conservador.
EP (Pb) =

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA91

6.5.3

Intervalo de confiana para a mdia de populaes nonormais - amostra grande

Dada uma aas de tamanho grande de uma populao qualquer com mdia , o intervalo
de confiana de nvel de confiana aproximado 1
S
X z/2
n
Esses resultados esto resumidos na Tabela 6.1 e na Figura 6.2.

Tabela 6.1: Resumo Comparativo dos Resultados sobre Intervalos de Confiana


Parmetro de Interesse
Estatstica Amostral
Margem
e sua Distribuio
de erro
Mdia da

2 conhecida

populao
N(; 2 )
2 desconhecida

X
N (0; 1)
n

= z/2 n

X
n
t(n 1)
S

= tn1; /2 Sn

Proporo

Pb p
N(0; 1)
np
p(1 p)

[mdia Bern(p)]

Mdia de uma

(amostra grande)

populao X

6.6

X
N(0; 1)
n
S

I.C.

= z/2

pe0 (1e
p0 )
n

= z/2 Sn

Pb
X

Exerccios

1. Para uma distribuio t de Student com 12 graus de liberdade, encontre a probabilidade (rea) de cada uma das seguintes regies (esboce um grfico para auxiliar
na soluo do exerccio):
(a) esquerda de 1, 782;
(b) direita de 1, 356;
(c) direita de 2, 681;

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA92

SIM

SIM

= z / 2

~ N (0;1)

NO

varincia
conhecida?

NO

populao
normal?

SIM

amostra
grande?

NO

X
~ t (n 1)
S
S
= t n 1; / 2
n
n

X
N (0;1)
S
s
= z / 2
n
n

X = P

X ~ Bern ( p )
S = P(1 P)

p 0 (1 p 0 )
n

Figura 6.2: Resumo de Intervalos de Confiana para a Mdia

Consulte um estatstico!
No foram estudados
mtodos apropriados
para esta situao!

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA93


(d) entre 1, 083 e 3, 055;
(e) entre 1, 356 e 2, 179.
2. Encontre os seguintes valores crticos da distribuio t de Student:
(a) t15;0,05
(b) t18;0,90
(c) t25;0,975
3. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de
treinamento esto listados abaixo. razovel supor, nesse caso, que essa seja uma
amostra aleatria simples de uma populao normal, ou seja, razovel supor que
a populao de todos os tempos de funcionrios submetidos a esse treinamento seja
aproximadamente normal. Obtenha o intervalo de confiana de nvel de confiana
de 95% para o tempo mdio populacional.
52 44 55 44 45 59 50 54
62 46 54 58 60 62 63
4. Uma amostra aleatria simples de uma populao normal apresenta as seguintes
caractersticas:
n = 25
x = 500
s2 = 900
Construa um intervalo de confiana de nvel de confiana de 98% para a mdia da
populao.
5. Em uma fbrica, uma
(em mm):
10
12
13

amostra de 30 parafusos apresentou os seguintes dimetros


13 14 11 13 14 11 13 14 15
14 15 13 14 12 12 11 15 16
15 14 14 15 15 16 12 10 15

Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo


de confiana para o dimetro mdio de todos os parafusos produzidos nessa fbrica,
usando o nvel de significncia de 2%. Para facilitar a soluo do exerccio, voc
pode usar os seguintes resultados:
30
P

i=1

xi = 401

30
P

i=1

x2i = 5443

6. Repita o exerccio anterior com os seguintes dados de uma amostra de 100 parafusos:
x = 13, 78
s2 = 2, 865

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA94

6.7

Soluo dos Exerccios

1. Temos que usar a Tabela 2, concentrando-nos na linha correspondente a 12 graus


de liberdade. Os valores dados podem ser encontrados no corpo da tabela nesta
linha.
(a) direita de 1, 782 temos uma rea de 0, 05; logo, esquerda de 1, 782 a rea
de 0, 95.
(b) A rea abaixo de 1, 356 igual rea acima de 1, 356, que de 0, 10. Logo,
esquerda de 1, 356 temos uma rea de 0, 10 e direita de 1, 356 temos
uma rea de 0, 90.
(c) direita de 2, 681 a rea 0, 01.
(d) direita de 1, 083 a rea 0, 15; direita de 3, 055 a rea de 0, 005. Logo,
a rea entre 1, 083 e 3, 055 0, 15 0, 005 = 0, 145 .

(e) Como visto no item (b), a rea direita de 1, 356 0, 90. A rea direita
de 2, 179 0, 025. Logo, a rea entre 1, 356 e 2, 179 0, 90 0, 025 = 0, 875

2. .
(a) t15;0,05 = 1, 753
(b) O primeiro fato a observar que t18;0,90 tem que ser negativo, pois direita
dele a rea de 0, 90 > 0, 50. Se direita a rea 0,90, a rea esquerda
0,10. Pela simetria da curva, t18;0,90 = t18;0,10 . Veja a Figura 6.3. Resulta
que
t18;0,90 = t18;0,10 = 1, 33

Figura 6.3: Soluo do Exerccio 2


(c) Analogamente encontra-se que t25;0,975 = 2, 060

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N(; 2 ), 2 DESCONHECIDA95


3. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student
n = 15

1 = 0, 95 t14;0,025 = 2, 145

808
= 53, 8667
15

8082
1
2
44176
= 46, 5524
s =
14
15
r
46, 5524
= 2, 145
= 3, 7788
15
O intervalo de confiana
x =

[53, 8667 3, 7788; 53, 8667 + 3, 7788] = [50, 088; 57, 6455]
4. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student
t24;0,01 = 2, 492
"

500 2, 492

900
; 500 + 2, 492
25

#
900
= [485, 05; 514, 95]
25

5. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student


= 2% t29;0,01 = 2, 462
401
= 13, 367
30

1
4012
=
5443
= 2, 861
29
30

x =
s2

O intervalo de confiana
"
#
r
r
2, 861
2, 861
13, 367 2, 462
; 13, 367 + 2, 462
= [12, 607; 14, 127]
30
30
6. Como n grande, podemos usar a abscissa da distribuio normal z0,01 = 2, 33 (o
valor exato t99;0,01 = 2, 3646),
#
"
r
r
2, 865
2, 865
; 13, 78 + 2, 33
= [13, 386; 14, 174]
13, 78 2, 33
100
100

Captulo 7
Intervalo de Confiana: Varincia
da N(; 2)
Neste captulo voc completar seu estudo bsico sobre intervalos de confiana, analisando o problema de estimao da varincia de uma populao normal. Como antes,
este intervalo se basear na distribuio amostral de um estimador no-viesado para
2 , a saber, S 2 . Como a varincia um nmero no negativo, essa distribuio no
simtrica e est definida apenas para valores no-negativos.
Voc ver os seguintes conceitos:
estimao da varincia de uma populao
intervalo de confiana para a varincia de uma populao normal

7.1

Idias bsicas

O contexto subjacente o seguinte: a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn


retirada de uma populao normal com mdia e varincia 2 queremos construir um
intervalo de confiana para 2 . A hiptese de normalidade da populao fundamental
aqui. Assim como no caso da mdia, temos que usar a distribuio amostral de algum
(n 1)S 2
estimador. Neste caso, o estimador S 2 e o resultado importate o seguinte:
2
tem distribuio qui-quadrado com n 1 graus de liberdade:
(n 1)S 2
2 (n 1)
2

7.2

(7.1)

Intervalo de confiana para a varincia de uma


populao normal

Como no caso da distribuio tStudent, vamos definir o valor crtico 2n; como a
abscissa da distribuio qui-quadrado com n graus de liberdade que deixa probabilidade
acima dela. Veja a Figura 7.1.
96

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(; 2 )

97

Figura 7.1: Valor crtico da distribuio qui-quadrado com n graus de liberdade


Com essa definio, podemos ver que a abscissa 2n;/2 deixa probabilidade /2 acima
dela [veja Figura 7.2-(a)] e a abscissa 2n;1/2 deixa probabilidade /2 abaixo dela
[veja Figura 7.2-(b)]. Logo,

(7.2)
Pr 2n;1/2 2 (n) 2n;/2 = 1
Como o resultado (7.2) vale para qualquer distribuio qui-quadrado, podemos usar
o resultado (7.1) para escrever

(n 1)S 2
2
2
Pr n1;1/2
n1;/2 = 1
2
Da resulta que
!
2n1;/2
1
= 1 =
Pr
2
(n 1)S 2

(n 1)S 2
!

2
(n

1)S
(n 1)S 2
= 1
Pr
2 2
2n1;/2
n1;1/2

2n1;1/2

e esse o intervalo de confiana para a varincia de uma populao normal.


Definio 7.1 Intervalo de confiana para a varincia de uma populao normal
Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X N (; 2 ) .
O intervalo de confiana para 2 de nvel de confiana 1
#
"
(n 1)S 2 (n 1)S 2
;
2n1;/2 2n1;1/2
onde 2n; representa o valor crtico da distribuio qui-quadrado com n graus de liberdade
que deixa probabilidade acima dele.

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(; 2 )

98

Figura 7.2: Valores crticos da distribuio qui-quadrado para construo de intervalos


de confiana

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(; 2 )

99

Note que o intervalo de confiana construdo de tal forma a dividir o nvel de


significncia em duas partes iguais, mesmo a distribuio no sendo simtrica.
Exemplo 7.1 De uma populao normal com mdia e varincia desconhecidas, extraise uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de
confiana para a varincia populacional, utilizando o nvel de confiana de 95%.
Soluo
O requisito para o IC para 2 satisfeito, uma vez que a populao normal. Temos
que usar a distribuio 2 com n1 = 14 graus de liberdade. Como o nvel de confiana
de 95%, em cada cauda da distribuio temos que ter 2,5%. Assim, para a cauda
superior, devemos procurar a abscissa 214;0,025 procurando na linha correspondente a 14
graus de liberdade e na coluna correspondente rea de 0,025. Encontramos
214;0,025 = 26, 119
Para a cauda inferior, devemos procurar a abscissa 214;0,975 procurando na linha correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,975. Encontramos
214;0,975 = 5, 629
O intervalo de confiana

14 49 14 49
;
= [26, 26; 121, 87]
26, 119 5, 629

Exemplo 7.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
Construa o intervalo de confiana para a mdia populacional, com nvel de significncia
de 10%.
Soluo
Temos uma amostra pequena de uma populao normal; logo, podemos usar a distribuio 2 . Como n = 9, gl = n 1 = 8.
A mdia amostral
P
xi
x =
n
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
78
=
=
= 8, 6667
9
9
e a varincia amostral
"
P 2#
P
P
1
1
(
xi )
(xi x)2 =
x2i
=
S2 =
n1
n1
n

782
1 2
2
2
2
2
2
2
2
2
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
=
8
9

6084
36
1
712
=
= 4, 5
=
8
9
8

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(; 2 )

100

Como o nvel de significncia = 10%, o nvel de confiana 1 = 90%. Em cauda


da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na linha
correspondente a 8 graus de liberdade as abscissas relativas rea superior de 0,05 e de
0,95. Obtemos 28;0,05 = 15, 507 e 28;0,95 = 2, 733. O intervalo de confiana

7 4, 5 7 4, 5
;
= [2, 03; 11, 53]
15, 507 2, 733

7.3

Exerccios

1. Seja X uma varivel aleatria com distribuio qui-quadrado com 17 graus de


liberdade. Encontre o valor da abscissa k tal que:
(a) Pr(X > k) = 0, 2
(b) Pr(X < k) = 0, 2
(c) Pr(X < k) = 0, 90
2. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de
treinamento esto listados abaixo. razovel supor, nesse caso, que essa seja uma
amostra aleatria simples de uma populao normal, ou seja, razovel supor que
a populao de todos os tempos de funcionrios submetidos a esse treinamento seja
aproximadamente normal. Obtenha o intervalo de confiana de nvel de confiana
de 95% para a varincia populacional.
52 44 55 44 45 59 50 54
62 46 54 58 60 62 63
3. Uma amostra aleatria simples de uma populao normal apresenta as seguintes
caractersticas:
x = 500
s2 = 900
n = 25
Construa um intervalo de confiana de nvel de confiana de 98% para a mdia da
populao.
4. Em uma fbrica, uma
(em mm):
10
12
13

amostra de 30 parafusos apresentou os seguintes dimetros


13 14 11 13 14 11 13 14 15
14 15 13 14 12 12 11 15 16
15 14 14 15 15 16 12 10 15

Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo


de confiana para o dimetro mdio de todos os parafusos produzidos nessa fbrica,
usando o nvel de significncia de 2%. Para facilitar a soluo do exerccio, voc
pode usar os seguintes resultados:
30
P

i=1

xi = 401

30
P

i=1

x2i = 5443

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N(; 2 )

7.4

101

Soluo dos Exerccios

1. Na linha correspondente a 17 graus de liberdade, devem ser consultadas as seguintes


colunas:
(a) = 0, 2 = k = 21, 615
(b) = 0, 8 = k = 12, 002
(c) = 0, 1 = k = 24, 769
2. Contexto: Populao normal
2
14;0,025 = 26, 119
n = 15
1 = 0, 95
214;0,975 = 5, 629
808
= 53, 8667
15

8082
1
44176
= 46, 5524
=
14
15

x =
s2

Intervalo de confiana:

14 46, 5524 14 46, 5524


;
= [24, 95; 1157, 78]
26, 119
5, 629
3. Contexto: Populao normal
n = 25

s = 900

1 = 0, 98

224;0,01 = 42, 980


224;0,99 = 10, 856

Intervalo de confiana:

24 900 24 900
;
= [502, 56; 1989, 68]
42, 98
10, 856
4. Contexto: Populao normal
n = 30

= 2% 1 = 0, 98

229;0,01 = 49, 588


229;0,99 = 14, 258

401
= 13, 367
30

1
4012
=
5443
= 2, 861
29
30

x =
s2

Intervalo de confiana:

29 2, 861 29 2, 861
;
= [1, 67; 5, 82]
49, 588
14, 258

Captulo 8
Testes de Hipteses
Na teoria de estimao, vimos que possvel, atravs de estatsticas amostrais adequadas, estimar parmetros de uma populao, dentro de um certo intervalo de confiana. Nos testes de hipteses, ao invs de se construir um intervalo de confiana no
qual se espera que o parmetro da populao esteja contido, testa-se a validade de uma
afirmao sobre um parmetro da populao. Ento, num teste de hiptese, procurase tomar decises a respeito de uma populao, com base em informaes obtidas de
amostras desta mesma populao.
Neste captulo voc aprender os seguintes conceitos:
hipteses nula e alternativa
erros tipo I e II
estatstica de teste
regra de deciso
regio crtica
funo caracterstica de operao
poder do teste

8.1

Noes bsicas

Vamos trabalhar com alguns exemplos para ilustrar os conceitos bsicos que precisamos
para construir testes de hipteses estatsticos.

8.1.1

Exemplo 1

Um detetive de polcia encarregado da investigao de um crime. Baseado nas evidncias encontradas, o detetive suspeita inicialmente do mordomo e precisa decidir, ento,
se prende ou libera o mordomo. Por outro lado, o mordomo pode ser culpado ou inocente. Assim, h 4 possibilidades, resumidas no Quadro 1, que podem ocorrer quando
o detetive tomar sua deciso:
102

CAPTULO 8. TESTES DE HIPTESES

103

prender o mordomo, quando, na verdade, o mordomo o assassino deciso


correta
prender o mordomo, quando, na verdade, o mordomo inocente deciso errada
liberar o mordomo, quando, na verdade, o mordomo o assassino deciso
errada
liberar o mordomo, quando, na verdade, o mordomo inocente deciso correta
Quadro 1
Possibilidades sobre a deciso do detetive
Detetive
Prende Libera
Mordomo Inocente Errado
OK
Culpado
OK
Errado
Se o problema do detetive fosse de origem estatstica, a primeira providncia que
ele teria que tomar seria formular uma hiptese nula, que uma afirmao sobre um
parmetro da populao. A hiptese nula, normalmente designada por H0 , uma
afirmao que estabelecida com o objetivo de ser testada; ela pode ser rejeitada ou
no. Normalmente, a hiptese nula formulada de tal forma que o objetivo rejeit-la.
No exemplo, como o detetive suspeita do mordomo, a formulao mais adequada
H0 : mordomo inocente
Se as evidncias so suficientes para se rejeitar a hiptese nula, ento aceita-se a
hiptese alternativa, normalmente designada por H1 , que ser aceita se a hiptese nula
for rejeitada. No exemplo, como s existem 2 possibilidades, temos que
H1 : mordomo culpado
Observe que o mtodo aplicado para se testar a hiptese nula. A hiptese alternativa ser aceita se e somente se a hiptese nula for rejeitada, ou seja, a estratgia
tomar uma deciso com relao hiptese nula.
Depois de examinar todas as evidncias, o detetive deve rejeitar H0 (e concluir que
o mordomo culpado) ou no rejeitar H0 (e concluir que o mordomo inocente). Note
que as concluses so sempre estabelecidas em termos da hiptese nula. Como j visto,
o detetive pode cometer dois tipos de erro:
erro tipo I: rejeitar a hiptese nula quando verdadeira;
erro tipo II: no rejeitar a hiptese nula quando falsa.
No Quadro 2 a seguir temos a ilustrao dessas situaes.

CAPTULO 8. TESTES DE HIPTESES

104

Quadro 2
Possibilidades para a deciso
Deciso
Rejeitar H0 No rejeitar H0
Possibi- H0 verdadeira
Erro I
OK
lidades H0 falsa
OK
Erro II
Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hiptese nula.
No exemplo, isso significa que o detetive nunca cometeria o erro de condenar um homem
inocente. De forma anloga, o erro tipo II pode ser evitado se sempre rejeitarmos a
hiptese nula e, no exemplo, o detetive nunca liberaria um assassino.
A teoria estatstica de testes de hipteses trata de regras de deciso, baseadas em
probabilidades, que tentam balancear esses dois tipos de erro.

8.1.2

Exemplo 2

Uma empresa compra anis de vedao de dois fabricantes. Segundo informaes dos
fabricantes, os anis do fabricante 1 tm dimetro mdio de 14 cm com desvio padro
de 1,2 cm e os anis do fabricante 2 tm dimetro mdio de 15 cm com desvio padro de
2,0 cm. Ambos os processos de produo geram anis com dimetros cuja distribuio
aproximadamente normal.
Uma caixa com 16 anis sem identificao encontrada pelo gerente do almoxarifado.
Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer uma
medio dos anis e basear sua deciso no dimetro mdio da amostra: se o dimetro
mdio for maior que 14,5 cm, ele identificar a caixa como oriunda do fabricante 2; caso
contrrio, ele identificar a caixa como oriunda do fabricante 1.
Esse um problema tpico de deciso empresarial. Vamos analisar esse processo decisrio sob o ponto de vista estatstico, estudando os possveis erros e suas probabilidades
de ocorrncia.
Uma primeira observao que existem apenas duas possibilidades para a origem
dos anis de vedao. Como ele suspeita que a caixa venha do fabricante 1, vamos
estabelecer a hiptese nula de forma que o resultado desejado seja rejeit-la. Definimos,
ento, a hiptese nula como sendo
H0 : anis vm do fabricante 2
e, obviamente, a hiptese alternativa ser
H1 : anis vm do fabricante 1
Se denotamos por X a varivel aleatria que representa o dimetro dos anis, essas
hipteses se traduzem como
H0 : X N(15; 2, 02 )
H1 : X N(14; 1, 22 )

CAPTULO 8. TESTES DE HIPTESES

105

A regra de deciso do gerente baseada na mdia amostral observada para os 16


anis encontrados. Como dito, nossa deciso deve ser expressa sempre em termos de
H0 . Logo, a regra de deciso
x 14, 5 = rejeito H0
x > 14, 5 = no rejeito H0
Os erros associados a essa regra de deciso so:
Erro I: rejeitar H0 quando H0 verdadeira
Erro II: no rejeitar H0 quando H0 falsa
Se H0 verdadeira, a amostra vem de uma populao normal com mdia 15 e desvio
padro 2,0. Nesse caso, a mdia amostral com base em amostra de tamanho 16
tambm normal com mdia 15 e desvio padro 2,0
. Se H0 falsa, a amostra vem de
16
uma populao normal com mdia 14 e desvio padro 1,2. Nesse caso, a mdia amostral
com base em amostra de tamanho 16 tambm normal com mdia 14 e desvio padro
1,2

.
16
Ento, as probabilidades associadas aos erros podem ser expressas em termos de
probabilidade condicional:

2, 02
Pr(Erro I) = Pr X 14, 5|X N 15;
16

1, 22
Pr(Erro II) = Pr X > 14, 5|X N 14;
16
Na Figura 8.1 a probabilidade associada ao erro I corresponde rea sombreada de
cinza claro, enquanto a rea sombreada de cinza escuro corresponde probabilidade do
erro tipo II.
Vamos calcular essas probabilidades. Em geral, a probabilidade do erro tipo I
denotada por e a probabilidade do erro tipo II por . Assim,
= Pr(Erro I) =

2, 02
= Pr X 14, 5|X N 15;
16

14, 5 15
= Pr Z
2
4

=
=
=
=

Pr(Z 1, 00)
Pr(Z 1, 00)
0, 5 tab(1, 00) = 0, 5 0, 34134
0, 15866

CAPTULO 8. TESTES DE HIPTESES

106

Figura 8.1: Probabilidades dos erros I e II para o Exemplo 2


= Pr(Erro II) =

1, 22
= Pr X > 14, 5|X N 14;
16

14, 5 14
= Pr Z >
1.2
4

= Pr(Z > 1, 67)


= 0, 5 tab(1, 67) = 0, 04746

importante voc entender a sutileza da notao. A deciso do gerente tem que


ser tomada em funo do resultado amostral observado; assim, usamos a notao x.
Lembre-se que usamos letras minsculas para representar o valor observado de uma
varivel aleatria. Quando falamos da probabilidade do erro ou mesmo da regra de
deciso em termos gerais, estamos considerando o procedimento decisrio geral. Como
esse procedimento depende da amostra sorteada, temos que expressar as probabilidades
dos erros e a regra de deciso levando em conta as possveis amostras, ou seja, temos que
levar em conta a varivel aleatria X que descreve a mdia amostral de uma possvel
amostra aleatria simples de tamanho n.
No exemplo, a regra de deciso geral : se X > 14, 5 o gerente classifica como
produo do fabricante 2. Assim, se a caixa em questo tiver uma mdia de, por
exemplo, 14,4 o gerente classificar a caixa como produzida pelo fabricante 1.

8.1.3

Exemplo 3

Para resumir os resultados do exemplo anterior, podemos construir o seguinte quadro:

CAPTULO 8. TESTES DE HIPTESES

107

Gerente decide que origem do


Fabricante 1
Fabricante 2
Fabricante 2 Erro I ( = 0, 15866)
OK
Verdadeiro 1
OK
Erro II ( = 0, 04746)
Vemos a que a probabilidade do erro tipo I maior. Analisando a Figura 8.1
podemos ver tambm que, se mudarmos a regra de deciso escolhendo um valor de corte
diferente de 14,5, essas probabilidades se alteraro. Aumentando , diminui e viceversa. Vamos, agora, estabelecer uma nova regra de deciso de modo que a probabilidade
do erro tipo I passe a ser 0,05. A nossa regio de rejeio, ou regio crtica, continua
tendo a forma X k. Pela Figura 8.1, vemos que k tem que ser menor que 14,5.

2
2, 0
Pr X k | X N 15;
16

k 15
Pr Z
2
4

k 15
Pr Z
0, 5

k 15
0, 5 tab
0, 5

k 15
tab
0, 5
k 15

0, 5
k

= 0, 05
= 0, 05
= 0, 05
= 0, 05
= 0, 05
= 0, 45
= 1, 64
= 14, 18

Com essa nova regra de deciso, o erro tipo II passa a ter probabilidade
= Pr(Erro II) =

1, 22
= Pr X > 14, 18|X N 14;
16
!

14, 18 14
= Pr Z >
1,2
4

= Pr(Z > 0, 6)
= 0, 5 tab(0, 6) = 0, 27425

8.1.4

Exemplo 4

Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual a regra
de deciso?

CAPTULO 8. TESTES DE HIPTESES

108

2, 02
1, 22
= Pr X > k | X N 14;

Pr X k | X N 15;
16
16

k 15
k 14
Pr Z 2.0
= Pr Z > 1.2

k 14
k 15
=

0, 5
0, 3
0, 3k 4, 5 0, 5k + 7
0, 8k = 11, 5
k = 14, 375

Neste caso, as probabilidades dos erros tipo I e II so

2, 02
= = Pr X 14, 375 | X N 15;
16

14, 375 15
= Pr Z
0, 5
= Pr(Z 1, 25)
= Pr(Z 1, 25)
= 0, 5 tab(1, 25) = 0, 10565

8.1.5

Exemplo 5

O procedimento de se fixar a probabilidade do erro tipo I o mais utilizado pois,


em geral, na prtica a situao no to simples como a escolha entre duas decises.
Suponha, nos dois exemplos acima, que a empresa compre anis de diversos fabricantes
mas, pelas caractersticas de produo do fabricante 2, os anis produzidos por ele sejam
especiais para a empresa. Assim, importante identificar corretamente a origem, caso
eles sejam oriundos do fabricante 2. Nesta situao, nossas hipteses passariam a ser:
H0 :
H1 :

anis so produzidos pelo fabricante 2


anis no so produzidos pelo fabricante 2

Queremos que a probabilidade seja pequena; assim, podemos fixar como 0,05 ou
mesmo 0,01. De posse do valor dessa probabilidade, poderamos estabelecer a regio
crtica ou regio de rejeio. A diferena fundamental aqui est no clculo da probabilidade do erro tipo II: no existe um nico valor de , j que, sob H1 , a distribuio
pode ter qualquer mdia.

CAPTULO 8. TESTES DE HIPTESES

8.1.6

109

Exemplo 6

Considere a seguinte regra de deciso sobre a honestidade de uma moeda. Se em trs


lanamentos aparecerem 3 coroas, decidimos rejeitar a hiptese de que a moeda honesta. Como devemos estabelecer as hipteses nula e alternativa? Como devemos proceder para calcular e ?
Em termos gerais, a questo que se coloca se a moeda honesta ou no. Como
regra geral, neste curso deveremos sempre definir a hiptese nula de modo que ela
represente um nico valor do parmetro de interesse. Ou seja, a hiptese nula deve
ser uma hiptese simples. Neste exemplo, a distribuio em questo uma binomial
com parmetros n = 3 e p desconhecido. Moeda honesta significa p = 12 . Logo, nossas
hipteses devem ser:
1
2
1
: p 6=
2

H0 : p =
H1

Seja X = nmero de coroas nos trs lanamentos. Ento, X bin(3; p). Nossa regra
de deciso rejeitar H0 se X = 3. A probabilidade do erro tipo I

1
= Pr X = 3|X bin 3;
2
1 1 1 1
=
=
2 2 2 8
No possvel calcular = Pr(no rejeitar H0 |H0 falsa), pois a hiptese alternativa
(aquela que devemos considerar quando H0 no aceita) no estipula um valor nico
para p. Mas neste exemplo simples, podemos obter uma expresso para em funo de
p. Note que
=
=
=
=

8.1.7

Pr [X < 3|X bin(3; p)]


1 Pr [X 3|X bin(3; p)]
1 Pr [X = 3|X bin(3; p)]
1 p3

Lista de Exerccios 1

1. Estabelea as hipteses nula e alternativa para as seguintes situaes:


(a) Depois de uma pane geral no sistema de informao de uma empresa, o
gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada atividade. Antes da pane, o tempo de processamento
podia ser aproximado por uma varivel aleatria normal com mdia de 100
minutos e desvio padro de 10 minutos. O gerente acredita que a pane no
tenha alterado a variabilidade do processo.

CAPTULO 8. TESTES DE HIPTESES

110

(b) O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o salrio mdio na sua empresa menor que o salrio mdio
nacional, que de 900 reais.
(c) Uma empresa fabricante de balas afirma que o peso mdio de suas balas de
pelo menos 2 gramas.
2. Considere uma populao normal com varincia 225, da qual se extrai uma amostra
aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses:
H0 : = 40
H1 : = 45
(a) Se a regio crtica RC : X > 43 calcule as probabilidades dos erros tipo I e
II.
(b) Determine a regio crtica da forma X > k tal que a probabilidade do erro
tipo I seja 0,10. Nesse caso, qual a probabilidade do erro tipo II?

8.2

Conceitos bsicos

O contexto em que se baseia a teoria de teste de hiptese basicamente o mesmo da


teoria de estimao por intervalo de confiana. Temos uma populao representada por
uma varivel aleatria X cuja distribuio de probabilidade depende de algum parmetro
. O interesse agora est em testar a veracidade de alguma afirmativa sobre .

8.2.1

Hiptese nula

A hiptese nula, representada por H0 , a hiptese bsica que queremos testar. Em


geral, definimos a hiptese nula de modo que o nosso objetivo seja rejeitar H0 . Nesse
texto consideraremos apenas hipteses nulas simples, isto , hipteses que estabelecem
que o parmetro de interesse igual a um determinado valor. A forma geral
H0 : = 0
Alguns exemplos so:
H0 : = 6

H0 : p = 0, 5

H0 : 2 = 25

O procedimento de teste de hiptese resultar em uma regra de deciso que nos permitir
rejeitar ou no rejeitar H0 .

CAPTULO 8. TESTES DE HIPTESES

8.2.2

111

Hiptese alternativa

A hiptese alternativa, representada por H1 , a hiptese que devemos considerar no


caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese bilateral
H1 : 6= 0
Em algumas situaes, podemos ter informao que nos permita restringir o domnio
da hitese alternativa. Por exemplo, se uma empresa farmacutica est testando um
novo medicamento para enxaqueca no intuito de reduzir o tempo entre a ingesto do
medicamento e o alvio dos sintomas, uma possvel hiptese alternativa
H1 : < 10
Temos, ento, hipteses unilaterais esquerda
H1 : < 0
e hipteses unilaterais direita:
H1 : > 0
A escolha entre essas formas de hiptese alternativa se faz com base no conhecimento
sobre o problema sendo considerado.

8.2.3

Estatstica de teste, erros e regra de deciso

Assim como na construo dos intervalos de confiana, iremos usar uma estatstica
amostral apropriada para construir o nosso teste de hiptese e nesse contexto, essa
estatstica chamada estatstica de teste. As estatsticas de teste usuais so a mdia
amostral X e a proporo amostral Pb, que sero usadas na construo de testes sobre
a mdia e a proporo populacionais, respectivamente.
O procedimento de deciso definido em termos da hiptese nula H0 : as decises
possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme resumo apresentado no quadro
abaixo, existem duas possibilidades de erro:
Erro tipo I: rejeitar H0 quando H0 verdadeira
Erro tipo II: no rejeitar H0 quando H0 falsa
A deciso sobre a hiptese nula tomada com base em uma regra que estabelece
um conjunto de valores, chamado regio crtica ou regio de rejeio, de modo que se, o
valor observado da estatstica amostral cair nesse regio, rejeitaremos H0 ; caso contrrio,
no rejeitaremos H0 . Vamos denotar por RC a regio crtica.

8.2.4

Regio crtica e nvel de significncia

Em geral, a definio da regio crtica feita da seguinte forma: RC o conjunto de


valores cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 .

CAPTULO 8. TESTES DE HIPTESES

112

Vamos considerar o seguinte exemplo: se, ao lanarmos uma moeda 30 vezes, obtivermos 28 caras, iremos desconfiar da hiptese de honestidade da moeda, porque a
probabilidade de obtermos 28 caras ou mais em 30 lanamentos de uma moeda honesta
0,000000433996, uma probabilidade bastante pequena. claro que o evento 28 caras
ou mais em 30 lanamentos um evento possvel (acertar a sena no jogo da mega-sena
tambm ...) mas, sob o ponto de vista do teste de hiptese, a obteno de tal evento
ser uma evidncia de que a nossa hiptese nula de honestidade da moeda no muito
plausvel. Nesse caso, no diremos que a moeda no honesta (no podemos dizer que
impossvel acertar a sena!); nossa concluso que no h evidncia suficiente para
apoiar a hiptese nula. (Situao anloga ocorre quando um jri diz que o ru no
culpado.)
A definio de probabilidade pequena se faz atravs da escolha do nvel de significncia do teste, que a probabilidade do erro tipo I, isto :
= Pr(erro tipo I) = Pr(rejeitar H0 | H0 verdadeira)
Em geral, o valor de pequeno e as escolhas mais comuns so = 0, 05 e = 0, 01.
Definido o nvel de significncia , podemos estabelecer a regio crtica usando a
distribuio amostral da estatstica de teste.

8.2.5

Funo caracterstica de operao e poder do teste

No procedimento de teste de hiptese, as decises possveis so rejeitar ou no rejeitar


H0 . Definem-se, assim, as seguintes funes em termos das probabilidades de cada uma
delas. A funo caracterstica de operao definida como
() = Pr(no rejeitar H0 | )
Define-se a funo poder do teste como
Q() = 1 () = Pr(rejeitar H0 | )
Estas funes (probabilidades) esto condicionadas ao verdadeiro e desconhecido valor
do parmetro . Se este valor estiver no conjunto de valores definidos pela hiptese alternativa, ento Q() corresponde a uma probabilidade de acerto: ela mede a probabilidade
de se rejeitar H0 quando H0 falsa. Por outro lado, se a hiptese nula H0 : = 0 ,
ento
Q(0 ) =
=
=
=
=

1 (0 )
1 Pr(no rejeitar H0 | 0 )
1 Pr(no rejeitar H0 | H0 verdadeira)
Pr(rejeitar H0 | H0 verdadeira)

CAPTULO 8. TESTES DE HIPTESES

8.3

113

Exemplo 7

Consideremos uma populao representada por uma varivel aleatria normal com mdia
e varincia 400. Deseja-se testar
H0 : = 100
H1 : 6= 100
com base em uma amostra aleatria simples de tamanho n = 16. Para tal, define-se a
seguinte regio crtica:
RC : X < 85 ou X > 115
1. Calcule a probabilidade do erro tipo I.
2. Calcule a funo poder do teste para os seguintes valores de : 75, 80, 85, 90, 95,
100, 105, 110, 115, 120, 125. Quanto vale a funo poder do teste quando = 100?
Soluo
Como queremos fazer um teste sobre a mdia da populao, natural usarmos X
como estatstica de teste. Como a populao normal com mdia e varincia 400,
sabemos que X tambm normal com mdia e varincia 400
= 25.
16
1. Sob a hiptese nula, = 100. Ento,
= Pr(rejeitar H0 | H0 verdadeira)

= Pr X < 85 X > 115 | X N(100; 25)

= Pr X < 85 | X N(100; 25) + Pr X > 115 | X N(100; 25)

85 100
115 100
= Pr Z <
+ Pr Z >
5
5
= Pr(Z < 3) + Pr(Z > 3)
= 2 Pr(Z > 3)
= 2 [0, 5 tab(3)]
= 0, 0027
2. A funo poder dada por
1 () = 1 Pr(no rejeitar H0 | )
= 1 Pr(85 X 115 | )

= 1 Pr 85 X 115 | X N(; 25)

85
115
= 1 Pr
Z
5
5
Vamos ilustrar o clculo para = 75 :
1 (75) = 1 Pr(2 Z 8)
= 1 [tab(8) tab(2)]
= 0, 97725

CAPTULO 8. TESTES DE HIPTESES

114

De forma anloga obtemos a seguinte tabela:

1 ()
75 0,97725
80 0,84134
85 0,50000
90 0,15866
95 0,02278
100 0,00270
105 0,02278
110 0,15866
115 0,50000
120 0,84134
125 0,97725
Observe que, para = 100, valor da hiptese nula, a funo poder igual
probabilidade do erro tipo I (nvel de significncia).
interessante notar tambm que quanto mais distante do valor 0 = 100, maior o
poder do teste, ou seja, h uma probabilidade mais alta de se rejeitar H0 quando
o valor alternativo est bem distante de 0 .

8.4

Exemplo 8

Considere a situao do exemplo anterior, com as seguintes diferenas: o tamanho da


amostra n = 100 e a regio crtica passa a ser
RC : X < 94 ou X > 106
Note que razovel estreitar a regio crtica, j que a amostra maior. Vamos calcular
e a funo poder do teste para os mesmos valores.
Soluo
Como antes, a funo poder dada por
Q() = 1 Pr(no rejeitar H0 | )
= 1 Pr(94 X 106 | )

= 1 Pr 94 X 106 | X N(; 4)

94
106
= 1 Pr
Z
2
2

CAPTULO 8. TESTES DE HIPTESES

115

com os seguintes valores:

75
80
85
90
95
100
105
110
115
120
125

Q()
1,00000
1,00000
0,99999
0,97725
0,30854
0,00270
0,30854
0,97725
0,99999
1,00000
1,00000

Note que esse teste tem o mesmo nvel de significncia do exemplo anterior: =
Q(100) = 0, 0027.
Na Figura 8.2 temos o grfico da funo poder para os dois exemplos. Note que o
poder do teste baseado em uma amostra de tamanho 100 sempre maior que o poder
do teste baseado em uma amostra de tamanho 16.
1,2
1,0

n=100

0,8
0,6

n=16
0,4
0,2
0,0
50

60

70

80

90

100

110

120

130

Figura 8.2: Comparao do poder de dois testes

8.4.1

Lista de Exerccios 2

1. Considere uma populao normal com varincia 225, da qual se extrai uma amostra
aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses:
H0 : = 40
H1 : 6= 40

CAPTULO 8. TESTES DE HIPTESES

116

(a) e para isso define-se a seguinte regio crtica:


RC : X > 46 ou X < 34
(b) Calcule a probabilidade do erro tipo I.
(c) Obtenha a expresso geral para a funo poder do teste.
(d) Calcule o poder do teste para os seguintes valores de : 20, 22, 24, . . . , 56, 58, 60.
(e) Esboce o grfico da funo poder.

8.5

Resumo do Captulo

Neste captulo estudamos os conceitos bsicos da teoria de testes de hipteses, em que o


interesse est em testar a validade de uma afirmao sobre um parmetro da populao.
Ento, num teste de hiptese, procura-se tomar decises a respeito de uma populao,
com base em informaes obtidas de amostras desta mesma populao.
Ao final deste captulo voc deve ser capaz de entender perfeitamente os seguintes
conceitos.
A hiptese nula, representada por H0 , a hiptese bsica que queremos testar.
Nesse texto consideraremos apenas hipteses nulas simples do tipo
H0 : = 0
A hiptese alternativa, representada por H1 , a hiptese que devemos considerar
no caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese
bilateral, mas podemos ter hipteses unilaterais esquerda e hipteses unilaterais
direita:
H1 : < 0
H1 : > 0
H1 : 6= 0
A estatstica de teste a estatstica amostral apropriada para construir o nosso
teste de hiptese. As estatsticas de teste usuais so a mdia amostral X e a
proporo amostral Pb, que sero usadas na construo de testes sobre a mdia e
a proporo populacionais, respectivamente.
O procedimento de deciso definido em termos da hiptese nula H0 , com as
seguintes decises possveis (i) rejeitar H0 ou (ii) no rejeitar H0 .

Os erros possveis no processo de decio baseado em um teste de hiptese so


Erro tipo I: rejeitar H0 quando H0 verdadeira
Erro tipo II: no rejeitar H0 quando H0 falsa
A regio crtica ou regio de rejeio o conjunto de valores da estatstica de teste
que levam rejeio de H0 ; a regio crtica ser denotada por RC .

CAPTULO 8. TESTES DE HIPTESES

117

Em geral, a definio da regio crtica feita fixando-se a probabilidade do erro


tipo I; essa probabilidade chamada nvel de significncia e ser indicada pela
letra grega alfa: .
A funo caracterstica de operao definida como
() = Pr(no rejeitar H0 | )
Para valores de fora da regio crtica, essa probabilidade corresponde probabilidade de um acerto.
A funo poder do teste definida como
Q() = 1 () = Pr(rejeitar H0 | )
Para valores de dentro da regio crtica, essa probabilidade corresponde probabilidade de um acerto.

8.6

Exerccios

1. Considere uma populao normal com varincia 64, da qual se extrai uma amostra
aleatria simples de tamanho 16. Deseja-se testar as seguintes hipteses:
H0 : = 23
H1 : = 28
(a) Se a regio crtica RC : X > 25, 5 calcule as probabilidades dos erros tipo
I e II.
(b) Determine a regio crtica da forma X > k tal que a probabilidade do erro
tipo I seja 0,05. Nesse caso, qual a probabilidade do erro tipo II?
2. Desejando-se testar as hipteses
H0 : = 45
H1 : < 45
sobre a mdia de uma populao normal com varincia 36, estabeleceu-se a
seguinte regio crtica com base em amostra aleatria simples de tamanho n = 16:
RC : X < 41, 25
(a) Calcule a probabilidade do erro tipo I.
(b) Calcule o poder do teste para os seguintes valores de : 30, 31, . . . , 59, 60.
(c) Esboce o grfico da funo poder plotando os pontos (; Q()).

CAPTULO 8. TESTES DE HIPTESES

118

3. Para uma populao representada por uma varivel de Bernoulli com parmetro
p, deseja-se testar a hiptese
H0 : p = 0, 5
H1 : p 6= 0, 5
Com base em uma amostra de tamanho 10, estabelecida a seguinte regio crtica:
RC : X = 0, 1, 2, 8, 9, 10
onde X = nmero de sucessos na amostra.
(a) Determine o nvel de significncia .
(b) Calcule o poder do teste para os seguintes valores de p : 0, 2; 0, 4; 0, 6; 0, 8.
Esboce o grfico da funo poder.

8.7

Soluo das Listas de Exerccios

Lista de Exerccios 1
1. .
(a) Antes da pane: T N(100; 100)
Depois da pane: T N(; 100)
H0 : = 100
H1 : 6= 100
(b) razovel supor que o gerente queira negar a afirmao dos empregados.
Assim, podemos estabelecer:
H0 : 900
H1 : < 900
(c) .
H0 : 2
H1 : < 2
X N(; 225)
2.
n = 25

X N ; 225
ou X N (; 9)
25

CAPTULO 8. TESTES DE HIPTESES


(a)
= Pr(X > 43 | X N (40; 9))

43 40
= Pr Z >
3
= Pr(Z > 1, 00)
= 0, 5 tab(1, 00)
= 0, 15866
= Pr(X 43 | X N(45; 9)

43 45
= Pr Z
3
= Pr(Z 0, 67)
= Pr(Z 0, 67)
= 0, 5 tab(0, 67)
= 0, 25143
(b) .
= 0, 10

Pr X > k | X N(40; 9) = 0, 10

k 40
Pr Z >
= 0, 10
3

k 40
tab
= 0, 40
3
k 40
= 1, 28
3
k = 43, 84
= Pr(X 43, 84 | X N(45; 9)

43.84 45
= Pr Z
3
= Pr(Z 0, 39)
= Pr(Z 0, 39)
= 0, 5 tab(0, 39)
= 0, 34827
Lista de Exerccios 2

X N(; 225)
X N ; 225
ou X N (; 9)
1.
25
n = 25

119

CAPTULO 8. TESTES DE HIPTESES

120

(a) .

= Pr X < 34 | X N(40; 9) + Pr X > 46 | X N(40; 9)

34 40
46 40
= Pr Z <
+ Pr Z >
3
3
= Pr(Z < 2) + Pr(Z > 2)
= 2 Pr(Z > 2)
= 2 [0, 5 tab(2, )]
= 0, 0455
(b) .
Q() = Pr(rejeitar H0 | )

= Pr X < 34 | X N(; 9) + Pr X > 46 | X N(; 9)

34
46
= Pr Z <
+ Pr Z >
3
3
(c) . Vamos fazer os clculos para = 20, 22, 58, 60.

46 20
34 20
+ Pr Z >
Q(20) = Pr Z <
3
3
= Pr(Z < 4, 67) + Pr(Z > 8, 67)
1+0=1

34 60
46 60
Q(60) = Pr Z <
+ Pr Z >
3
3
= Pr(Z < 8, 67) + Pr(Z > 4, 67)
= Pr(Z > 8, 67) + Pr(Z < 4, 67) = Q(20)

46 22
34 22
+ Pr Z >
Q(22) = Pr Z <
3
3
= Pr(Z < 4, 00) + Pr(Z > 8, 00)
1+0=1

34 58
46 58
Q(58) = Pr Z <
+ Pr Z >
3
3
= Pr(Z < 8, 00) + Pr(Z > 4, 00)
= Pr(Z > 8, 00) + Pr(Z < 4, 00) = Q(22)
Podemos ver que a funo poder simtrica; assim, s precisamos calcular
Q() para = 20, 22, 24, . . . , 38, 40. Os resultados esto na tabela a seguir
e o grfico est na Figura 8.3.

CAPTULO 8. TESTES DE HIPTESES

20
22
24
26
28
30
32
34
36
38
40

121

Q()
0,99999847
0,99996833
0,99957094
0,99616962
0,97724987
0,90878883
0,74750899
0,50003167
0,25292160
0,09504160
0,04550026

60
58
56
54
52
50
48
46
44
42

Q()
0,99999847
0,99996833
0,99957094
0,99616962
0,97724987
0,90878883
0,74750899
0,50003167
0,25292160
0,09504160

1,2
1,0
0,8
0,6
0,4
0,2
0,0
0

10

20

30

40

50

60

Figura 8.3: Soluo da Lista de Exerccios 1

8.8

Soluo dos Exerccios

X N(; 64)
1.
n = 16

64
ou X N (; 4)
X N ;
16

(a)

= Pr X > 25, 5 | X N(23; 4)

25, 5 23
= Pr Z >
2
= Pr(Z > 1, 25)
= 0, 5 tab(1, 25)
= 0, 10565

70

CAPTULO 8. TESTES DE HIPTESES


= Pr(X 25, 5 | X N(28; 4)

25, 5 28
= Pr Z
2
= Pr(Z 1, 25)
= Pr(Z > 1, 25)
= 0, 10565
(b)
= 0, 05

Pr X > k | X N(23; 4) = 0, 05

k 23
Pr Z >
= 0, 05
2

k 23
tab
= 0, 45
2
k 23
= 1, 64
2
k = 26, 28
= Pr(X 26, 28 | X N(28; 4)

26, 28 28
= Pr Z
2
= Pr(Z 0, 86)
= Pr(Z 0, 86)
= 0, 5 tab(0, 86)
= 0, 19489
2. X N(; 36)
n = 16
36
X N ; 16 ou X N (; 2, 25)
A funo poder do teste

Q() = Pr(rejeitar H0 |)
= Pr(X < 41, 25|X N(; 1, 52 )

41, 25
= Pr Z <
1, 5

122

CAPTULO 8. TESTES DE HIPTESES

123

e = Q(45). Na tabela a seguir so dados os valores de Q().

30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45

Q()
1,0000000
1,0000000
1,0000000
1,0000000
0,9999993
0,9999845
0,9997673
0,9976967
0,9848699
0,9331928
0,7976717
0,5661838
0,3085375
0,1216726
0,0333764
0,0062097

46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

Q()
0,0007711
0,0000632
0,0000034
0,0000001
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000

Na Figura 8.4 temos o esboo do grfico da funo poder.


1,2
1,0
0,8
0,6
0,4
0,2
0,0
20

25

30

35

40

45

50

55

60

65

Figura 8.4: Funo poder do teste para o Exerccio 2


3. Sabemos que X bin(10; p).

CAPTULO 8. TESTES DE HIPTESES

124

(a)
= Pr(X = 0 | p = 0, 5) + Pr(X = 1 | p = 0, 5) +
Pr(X = 2 | p = 0, 5) + Pr(X = 8 | p = 0, 5) +
Pr(X = 9 | p = 0, 5) + Pr(X = 10 | p = 0, 5)


= 0, 510 + 10
(0, 5) (0, 5)9 + 10
(0, 5)2 (0, 5)8 +
1
2

10

10
8
2
9
10
(0,
5)
+
(0,
5)
+
(0,
5)
(0,
5)
(0, 5)10
8
9
10
= 0, 000976563 + 0, 009765625 + 0, 043945313 +
0, 043945313 + 0, 009765625 + 0, 000976563
= 0, 109375
(b)
Q(0, 2) = Pr(X = 0 | p = 0, 2) + Pr(X = 1 | p = 0, 2) +
Pr(X = 2 | p = 0, 2) + Pr(X = 8 | p = 0, 2) +
Pr(X = 9 | p = 0, 2) + Pr(X = 10 | p = 0, 2)

10
9
+
(0,
2)
(0,
8)
(0, 2)2 (0, 8)8 +
= 0, 810 + 10
1
2
10
10
10
8
2
9
(0,
8)
+
(0,
8)
+
(0,
2)
(0,
2)
(0, 2)10
8
9
10
= 0, 107374182 + 0, 268435456 + 0, 301989888
+0, 00007373 + 0, 00000410 + 0, 00000010
= 0, 677877453
Analogamente obtm-se a seguinte tabela:
p
0, 1
0, 2
0, 3
0, 4
0, 5
0, 6
0, 7
0, 8
0, 9
Veja a Figura 8.5.

Q(p)
0,9298095
0,6778775
0,3843732
0,1795843
0,1093750
0,1795843
0,3843732
0,6778775
0,9298095

CAPTULO 8. TESTES DE HIPTESES

125

1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
0,0

0,2

0,4

0,6

0,8

1,0

Figura 8.5: Funo poder do teste para o Exerccio 3

Captulo 9
Teste de Hiptese: Mdia da
N(; 2) - 2 Conhecida
Neste captulo iremos aplicar os conceitos bsicos sobre a teoria de teste de hiptese a
uma situao especfica. Nosso interesse estar concentrado na mdia de uma populao
normal. Assim como no caso dos intervalos de confiana, iremos iniciar nossos estudos
supondo que a varincia dessa populao seja conhecida. Como j dito, essa situao
no muito comum na prtica, mas, em termos didticos, a apresentao dos conceitos
fica simplificada. Entendendo bem a construo de um teste de hiptese para esse caso
particular, a apresentao para as outras situaes bastante semelhante, mudando
apenas a distribuio amostral.
Neste captulo veremos os seguintes conceitos aplicados mdia de uma populao
normal com varincia conhecida:
hipteses nula e alternativa
erros tipo I e II
estatstica de teste
regra de deciso
regio crtica
funo caracterstica de operao
poder do teste
valor P
Vamos apresentar inicialmente trs exemplos que ilustraro as diversas possibilidades
que podem surgir na prtica.

126

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA127

9.1

Exemplo 1

Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma
varivel aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos.
O gerente acredita que a pane no tenha alterado a variabilidade do processo. Uma
amostra de 16 tempos de processamento aps a pane revela uma mdia de 105,5 minutos. Ao nvel de significncia de 5%, qual a concluso sobre a alterao do tempo
mdio de processamento?

9.1.1

Hipteses nula e alternativa

O interesse do gerente comparar os tempos antes e depois da pane. Antes da pane,


o tempo mdio de processamento era de 100 minutos. Como ele no sabe o tipo de
alterao que possa ter ocorrido, ele precisa saber se o tempo mdio depois da pane
diferente do tempo anterior. Isso nos leva s seguintes hipteses nula e alternativa:
H0 : = 100
H1 : 6= 100

9.1.2

Estatstica de teste

Seja X a varivel aleatria que representa o tempo de processamento. Ento, pelos dados
do problema, temos que X N(; 100). Antes da pane, = 100. Como a populao
normal, sabemos que a distribuio da mdia amostral tambm normal e como no
deve ter havido alterao na variabilidade do processo, resulta que o desvio padro de
10 minutos em qualquer situao. Logo,

100
X N ;
16
ou equivalentemente,
Z=

9.1.3

X
N(0; 1)
2, 5

Nvel de significncia e regio crtica

Pelo enunciado do problema, o nvel de significncia de 5%. Isso significa que a


probabilidade do erro tipo I 0,05. Como visto, o erro tipo I consiste em rejeitar a
hiptese nula quando ela verdadeira. Logo,
= Pr(rejeitar H0 | H0 verdadeira) = 0, 05

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA128


Quando H0 verdadeira, a estatstica de teste tem a seguinte distribuio:

100
H0 verdadeira = X N 100;
16
ou equivalentemente,
Z0 =

X 100
q
N(0; 1)
100
16

A nossa regio crtica consiste nos valores de X com probabilidade pequena de ocorrerem sob essa hiptese. Ou seja, a regio crtica consiste nos valores de X muito
afastados da mdia suposta de = 100. Como a hiptese alternativa bilateral, muito
afastado significa muito maior ou muito menor do que = 100. Veja a Figura
9.1.

Figura 9.1: Regio crtica para o teste bilateral de H0 : = 100


Ento, nossa regio crtica
X > 100 + k

ou

X < 100 k

e isso equivalente a
X 100 > k

ou

X 100 < k

Usando a funo mdulo, podemos escrever:

X 100 > k
RC :

e o valor da constante k determinado pelo nvel de significncia:

0, 05 = Pr X 100 > k | X N(100; 6, 25)

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA129

9.1.4

Determinao da regio crtica

Para determinar a regio crtica, basta encontrar o valor da constante k tal que

Pr X 100 > k | X N(100; 6, 25) = 0, 05 =

Pr X 100 > k | X N(100; 6, 25) + Pr X 100 < k | X N(100; 6, 25) = 0, 05 =

k
k
Pr Z >
+ Pr Z <
= 0, 05 =
2, 5
2, 5

k
k
Pr Z >
+ Pr Z >
= 0, 05 =
2, 5
2, 5

k
= 0, 025 =
Pr Z >
2, 5

k
tab
= 0, 475 =
2, 5
k
= 1, 96 =
2, 5
k = 4, 9
A regio crtica
RC :

X > 104, 9

ou

X < 95, 1

Como o valor da estatstica de teste para a amostra observada est na regio crtica,
devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam uma alterao
do tempo de processamento da tarefa aps a pane.

9.1.5

Poder

A funo poder do teste definida como


() = Pr(rejeitar H0 |)
Em termos da nossa regio crtica podemos escrever

() = Pr X > 104, 9 | X N(; 6, 25) + Pr X < 95, 1 | X N(; 6, 25)

104, 9
95, 1
= Pr Z >
+ Pr Z <
2, 5
2, 5
Calculando () para diferentes valores de obtemos o grfico exibido na Figura 9.2.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA130

1,05
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00

85

90

95

100

105

110

115

Figura 9.2: Funo poder - Exemplo 1

9.2

Exemplo 2

Na mesma situao do exemplo anterior, bastante razovel supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Afinal, se o tempo
diminuir, isso significa que a tarefa vai ser executada mais rapidamente, o que representa
um ganho. Ento, as duas possibilidades so:
100
> 100

OK!
Problema!

Para definir qual a hiptese nula, vamos usar o seguinte procedimento. Como dito
no captulo anterior, neste curso s trabalharemos com hipteses nulas simples, isto ,
hipteses nulas que envolvam igualdade do parmetro a um determinado valor: = 0 .
Assim, em um teste unilateral, a hiptese alternativa deve ser aquela que no envolve o
sinal de igualdade. No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo
que ser uma hiptese simples, passa a ser = 100, ou seja:
H0 : = 100
H1 : > 100
A estatstica de teste continua sendo

100
X N ;
16
O que muda a regio crtica, que agora passa a ser
RC :
Veja a Figura 9.3.

X > 100 + k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA131

Figura 9.3: Regio crtica para o teste de H0 : = 100 com alternativa unilateral
direita H1 : > 100
Como o nvel de significncia 5%, isso significa que

0, 05 = Pr X > 100 + k | X N(100; 6, 25)

e o valor da constante calculado como

Pr X > 100 + k | X N(100; 6, 25) = 0, 05 =

100 + k 100
Pr Z >
= 0, 05 =
2, 5

k
= 0, 45 =
tab
2, 5
k
= 1, 64 =
2, 5
k = 4, 1
e isso nos leva regio crtica
RC :

X > 104, 1

Como no exemplo anterior, temos que rejeitar a hiptese nula de que o tempo de
processamento no se alterou, j que o valor observado da estatstica amostral est na
regio crtica.
A funo poder do teste
() = Pr(X > 104, 1|)
cujo grfico encontra-se na Figura 9.4. Note que para valores de menores do que 100
a probabilidade de rejeitar H0 zero, o que razovel, pois com uma hiptese unilateral

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA132

1,2
1,0
0,8
0,6
0,4
0,2
0,0
80

85

90

95

100

105

110

115

Figura 9.4: Funo poder - Exempo 2


direita, s rejeitamos a hiptese nula para valores muito maiores do que 100. Se o
valor observado da estatstica de teste menor do que 100, claro que no devemos
rejeitar H0 .

9.3

Exemplo 3

O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o
salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso, ele analisa
uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais. De informaes obtidas
junto ao sindicato patronal, ele sabe que, em nvel nacional, o salrio mdio de 900
reais, com desvio padro de 32 reais. Supondo que seja razovel aproximar a distribuio
dos salrios por uma distribuio normal com o mesmo desvio padro nacional, vamos
construir um teste de hiptese apropriado, com um nvel de significncia de 10%.
O problema aqui consiste em decidir se os salrios so menores ou no do que a
mdia nacional de 900 reais, ou seja, as situaes de interesse so
< 900
900
Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal
de igualdade. Logo, nossas hipteses so:
H0 : = 900
H1 : < 900
e a estatstica de teste

322
X N ;
25

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA133


O proprietrio deve rejeitar a hiptese nula se a mdia amostral for muito menor do
que 900, ou seja, a regio crtica
RC :

X < 900 k

Veja a Figura 9.5.

Figura 9.5: Regio crtica para o teste de H0 : = 900 com alternativa unilateral
esquerda H1 : < 900
O valor de k determinado pelo nvel de significncia:

Pr X < 900 k | X N(900; 6, 42 ) = 0, 10 =

900 k 900
Pr Z <
= 0, 10 =
6, 4

k
Pr Z <
= 0, 10 =
6, 4

k
= 0, 10 =
Pr Z >
6, 4

k
tab
= 0, 40 =
6, 4
k
= 1, 28 =
6, 4
k = 8, 192
Logo, a regio crtica
RC :

X < 891, 808

Veja na Figura 9.6 a funo poder deste teste: para valores maiores do que 900, a
probabilidade de rejeitar a hiptese nula zero.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA134

1,1
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
860

870

880

890

900

910

920

930

940

Figura 9.6: Funo poder - Exemplo 3

9.4

Procedimento geral para construo do teste de


hiptese sobre a mdia de uma N(; 2) - 2 conhecida

Os trs exemplos acima ilustram o procedimento para construo de um teste de hiptese


sobre a mdia de uma populao normal com varincia conhecida. De posse de uma
amostra aleatria simples X1 , X2 , . . . , Xn extrada de uma populao X N(; 2 ),
nosso interesse est em testar a hiptese nula
H0 : = 0
a um nvel de significncia .
Dependendo do conhecimento sobre o problema, a hiptese alternativa pode tomar
uma das trs formas:
H1 : 6= 0

H1 : > 0

H1 : < 0

Em qualquer dos casos, a estatstica de teste a mdia amostral; se a varincia 2


conhecida, sabemos que

2
X N ;
n
A regra de deciso consiste em rejeitar a hiptese nula se o valor de X estiver
longe do valor 0 . No caso da hiptese alternativa bilateral, estar longe significa ser
muito maior ou muito menor que 0 ; para a alternativa unilateral direita, estar longe
significa ser muito maior do que 0 e para a alternativa unilateral esquerda, longe
significa ser muito menor que 0 . As expresses muito menor e muito maior ficam
perfeitamente definidas a partir do valor do nvel de significncia . Veja a Figura
9.7, em que nas partes (a), (b) e (c) ilustra-se a regio crtica para as trs hipteses

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA135


alternativas. Como antes, vamos denotar por z a abscissa da curva normal padro que
deixa rea (probabilidade) acima dela.

9.4.1

Teste bilateral

Consideremos as hipteses
H0 : = 0
H1 : 6= 0
A regio crtica [veja a Figura 9.7-(a)]
RC :

ou

X > 0 + k

X < 0 k

e se a hiptese nula verdadeira,

2
X N 0 ;
n
Com nvel de significncia = Pr(erro I), temos que ter:
Pr(rejeitar H0 | H0 verdadeira) = =

2
2
Pr X > 0 + k | X N 0 ;
+ Pr X < 0 k | X N 0 ;
= =
n
n
!

0 k 0
0 + k 0
+ Pr Z <
= =
Pr Z >

Pr Z >

Pr Z >

Pr Z >
k

!
!
!

+ Pr Z <

+ Pr Z >
=

= =

= =

=
2

= z/2 =

k = z/2
n
Logo, a regio crtica

X > 0 + z/2
n

ou

X > 0 z/2
n

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA136

Figura 9.7: Regio crtica para o teste de hiptese sobre a mdia de uma normal com
varincia conhecida (a) teste bilateral (b) teste unilateral direita (c) teste unilateral
esquerda

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA137

9.4.2

Teste unilateral direita

Consideremos as hipteses
H0 : = 0
H1 : > 0
A regio crtica [veja a Figura 9.7-(b)]
RC :

X > 0 + k

e se a hiptese nula verdadeira,

2
X N 0 ;
n
Com nvel de significncia = Pr(erro I), temos que ter:
Pr(rejeitar H0 | H0 verdadeira) = =

2
= =
Pr X > 0 + k | X N 0 ;
n
!

0 + k 0
= =
Pr Z >

Pr Z >
k

= =

= z =

k = z
n
Logo, a regio crtica

9.4.3

X > 0 + z
n

Teste unilateral esquerda

Consideremos as hipteses
H0 : = 0
H1 : < 0
A regio crtica [veja a Figura 9.7-(c)]
RC :

X < 0 k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA138


e se a hiptese nula verdadeira,

2
X N 0 ;
n
Com nvel de significncia = Pr(erro I), temos que ter:
Pr(rejeitar H0 | H0 verdadeira) = =

2
Pr X < 0 k | X N 0 ;
= =
n

!
0 k 0
Pr Z <
= =

Pr Z <

Pr Z >
k

= =

= =

= z =

k = z
n
Logo, a regio crtica

9.4.4

X < 0 z
n

Teste de hiptese versus intervalo de confiana

interessante notar a expresso que aparece na regio crtica para o teste bilateral; ela
a mesma obtida para a margem de erro do intervalo de confiana para a mdia de uma
populao normal com varincia conhecida:

= z/2
n
Podemos ver, assim, que existe uma relao entre os dois procedimentos; na verdade,
em um teste de hiptese bilateral, rejeitamos a hiptese nula H0 se o valor observado
da estatstica de teste no estiver no intervalo de confiana.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA139

9.5

Valor P

Nos exemplos acima, a determinao da regio crtica foi feita com base no nvel de
significncia, isto , fixado o nvel de significncia encontramos o valor k que definia
os limites entre valores provveis (aqueles que levam no rejeio de H0 ) e pouco
provveis (aqueles que levam rejeio de H0 ). Um outro procedimento bastante usual,
especialmente quando so utilizados programas computacionais, consiste em calcular a
probabilidade de se obter um valor to ou mais desfavorvel que o valor observado, se
H0 for verdadeira. Essa probabilidade chamada valor P . Vamos ilustrar esse conceito
considerando novamente os trs exemplos anteriores.

9.5.1

Teste bilateral - Valor P para o Exemplo 1

O valor obtido com os dados amostrais para a estatstica de teste x = 105, 5. Como
o teste bilateral, valores longe de 100 so aqueles muito menores ou muito maiores
que 100. O procedimento visto consistiu em dividir a probabilidade do erro tipo I
igualmente nas duas caudas da distribuio normal e dessa forma identificamos a regio
crtica. Vamos, agora, calcular o valor P para o nosso exemplo; ele a probabilidade de
obtermos um valor to ou mais extremo que o valor observado. Como o valor observado
est direita da mdia, devemos calcular a seguinte probabilidade:
P = Pr(X 105, 5 | H0 verdadeira)

100
= Pr X 105, 5 | X N 100;
16

105.5 100
= Pr(Z 2, 2) = 0, 5 tab(2, 2)
= Pr Z
2.5
= 0, 0139
Vamos analisar a Figura 9.8, onde est ilustrado esse valor. O valor amostral
observado para X x = 105, 5 = 100 + 5, 5. Como o teste bilateral, se tivssemos
obtido o valor x = 100 5, 5, esse valor tambm seria considerado to afastado de 100
quanto 105,5. Assim, para testes bilaterais, temos que considerar a probabilidade nas
duas caudas da distribuio. O que esse resultado est nos dizendo o seguinte: se H0
for verdadeira, a probabilidade de obtermos um valor distante de 100 por 5,5 unidades
em qualquer direo 2 0, 0139 = 0, 0278. Essa probabilidade chamada valor P.
No exemplo, vemos que o valor P pequeno, o que significa que pouco provvel
obtermos um valor to extremo quando H0 verdadeira. Logo, razovel supormos que
a hiptese nula no seja verdadeira, a mesma concluso obtida ao trabalharmos com o
nvel de significncia de 5%. Na verdade, rejeitaramos a hiptese nula para qualquer
nvel de significncia maior que 0,0278.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA140

Figura 9.8: Valor P para o teste bilateral do Exemplo 1

9.5.2

Teste unilateral direita - Exemplo 2

Como o teste unilateral direita, valores extremos so aqueles muito maiores que 100.
Como visto acima,
P = 0, 0139
Neste caso no temos que multiplicar por 2, pois o teste unilateral. Como o valor P
muito pequeno, temos evidncia suficiente para rejeitar a hiptese nula. Essa mesma
deciso seria tomada para qualquer nvel de significncia menor que 0,0139.

9.5.3

Teste unilateral esquerda - Exemplo 3

No Exemplo 3, temos um teste bilateral esquerda; logo, o valor P

P = Pr X 894, 53 | X N(900; 6, 4)

894.53 900
= Pr Z
6.4
= Pr(Z 0, 85)
= Pr(Z 0, 85)
= 0, 5 tab(0, 85)
= 0, 1977
Essa no uma probabilidade pequena; ou seja, razovel obter um valor to ou mais
extremo que 894,53 quando H0 verdadeira. Assim, os dados no fornecem evidncia
suficiente para rejeitarmos a hiptese nula.
Com base nesses exemplos, podemos concluir o seguinte:

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA141


Devemos rejeitar a hiptese nula H0 ao nvel de significncia sempre que o valor
P for menor ou igual a ,ou seja:
Rejeitamos H0 P

Os programas de estatstica calculam valores P mais exatos do que aqueles obtidos


atravs da tabela. Nas aplicaes e exerccios deste curso devemos arredondar os resultados necessrios para 2 casas decimais para podermos utilizar a tabela da distribuio
normal.

9.6

Exemplo 4

Uma amostra de tamanho n = 25 extrada de uma populao normal com varincia


256, obtendo-se x = 23. Deseja-se testar a hiptese
H0 : = 18
Determine a regio crtica ao nvel de significncia de 1% e encontre o valor P quando
1. H1 : 6= 18
2. H1 : > 18
Soluo
1. A regio crtica
RC : X > 18 + k ou X < 18 k

Com = 0, 01 temos que ter:

256
256
+ Pr X < 18 k | X N 18;
= 0, 01 =
Pr X > 18 + k | X N 18;
25
25

18 + k + 18
18 k 18
Pr Z >
+ Pr Z <
= 0, 01 =
3, 2
3, 2

k
k
+ Pr Z <
= 0, 01 =
Pr Z >
3, 2
3, 2

k
k
Pr Z >
+ Pr Z >
= 0, 01 =
3, 2
3, 2

k
Pr Z >
= 0, 005 =
3, 2

k
= 0, 495 =
tab
3, 2
k
= 2, 58 =
3, 2
k = 8, 256

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA142


Logo, a regio crtica
X > 26, 256 ou X < 9, 744
O valor P

P =
=
=
=
=
=

256
2 Pr X 23 | X N 18;
25

23 18
2 Pr Z
3, 2
2 Pr(Z 1, 56)
2 [0, 5 tab(1, 56)]
2 [0, 5 0, 4406]
0, 1188

Rejeitamos H0 a qualquer nvel de significncia 0, 1188. Logo, ao nvel de


significncia de 1% (ou mesmo 5%) no podemos rejeitar H0 . Note que o valor da
estatstica de teste, x = 23, est fora da regio crtica.
2. A regio crtica
RC : X > 18 + k
Com = 0, 01 temos que ter:

256
Pr X > 18 + k | X N 18;
= 0, 01 =
25

18 + k + 18
Pr Z >
= 0, 01 =
3, 2

k
= 0, 01 =
Pr Z >
3, 2

k
tab
= 0, 49 =
3, 2
k
= 2, 33 =
3, 2
k = 7, 456
Logo, a regio crtica
X > 25, 456
O valor P

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA143

P =
=
=
=
=
=

256
Pr X 23 | X N 18;
25

23 18
Pr Z
3, 2
Pr(Z 1, 56)
[0, 5 tab(1, 56)]
[0, 5 0, 4406]
0, 0594

Rejeitamos H0 a qualquer nvel de significncia 0, 0594. Logo, ao nvel de


significncia de 1% no podemos rejeitar H0 . Note que o valor da estatstica de
teste, x = 23, est fora da regio crtica.

9.7

Exerccios

1. Uma amostra aleatria simples de tamanho n = 9 extrada de uma populao


normal com desvio padro 3,1 apresentou mdia igual a x = 13, 35. Deseja-se
testar
H0 : = 12, 8
H1 : 6= 12, 8
(a) Determine a regio crtica correspondente ao nvel de significncia = 0, 02.
(b) Com base na regio crtica encontrada no item anterior, estabelea a concluso, tendo o cuidado de usar um fraseado que no seja puramente tcnico.
(c) Calcule o valor P e interprete o resultado obtido.
(d) Esboce o grfico da funo poder, calculando () para os seguintes valores
de :
8 9 10 11 12 13 14 15 16 17 18
2. Uma empresa fabricante de balas afirma que o peso mdio de suas balas de pelo
menos 2 gramas. Pela descrio do processo de produo, sabe-se que o peso das
balas distribui-se normalmente com desvio padro de 0,5 grama. Uma amostra de
25 balas apresenta peso mdio de 1,98 gramas. O que se pode concluir sobre a
afirmao do fabricante? Use um nvel de significncia de 5%.
3. Em uma linha de produo, peas so produzidas de modo que o comprimento
seja normalmente distribudo com desvio padro de 0,5 cm. Ajustes peridicos so
feitos na mquina para garantir que as peas tenham comprimento apropriado de
15 cm, pois as peas muito curtas no podem ser aproveitadas (as peas longas
podem ser cortadas). A cada hora so extradas 9 peas da produo, medindo-se
seu comprimento. Estabelea uma regra de deciso para definir se o processo est
operando adequadamente. Use o nvel de significncia de 0,1%.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA144


4. Depois de desenvolver um algoritmo para acelerar a execuo de determinada
tarefa rotineira em um escritrio de contabilidade, o analista de sistema analisa
uma amostra de 25 tempos, obtendo uma mdia 46,5 segundos. Dos dados passados, ele sabe que o tempo de execuo aproximadamente normal com mdia
de 48,5 segundos e desvio padro de 5 segundos. Use o mtodo do valor P para
decidir se o algoritmo do analista realmente melhorou o desempenho do sistema.
5. Uma propaganda afirma que o consumo mdio de gasolina de determinada marca
de automvel de 12 litros por 100 quilmetros rodados, com desvio padro de 1,0
litro. Um teste com 36 automveis desta marca acusa um consumo mdio de 12,4
litros por 100 quilmetros rodados. O que se pode concluir sobre a propaganda?

9.8

Soluo dos Exerccios

1. X N(; 3, 12 )

n=9

x = 13, 35

(a) = 0, 02 = z/2 = 2, 33
RC : X > 12, 8 + k ou X < 12, 8 k

3, 12
Pr X > 12, 8 + k X < 12, 8 k | X N 12, 8;
= 0, 02
9
!

12, 8 k 12, 8
12, 8 + k 12, 8
+ Pr Z <
= 0, 02
Pr Z >
3,1
3,1
3

Pr(Z > 0, 96774k) + Pr(Z < 0, 96774k) = 0, 02


2 Pr(Z > 0, 96774k) = 0, 02
Pr(Z > 0, 96774k) = 0, 01
0, 96774k = 2, 33
k = 2, 41
A regio crtica
X > 15, 21 ou X < 10, 39
(b) O valor observado x = 13, 35 no est na regio crtica. Logo, no h evidncia amostral suficiente para rejeitarmos a hiptese de que a mdia da
populao seja 12,8.
(c) .

3, 12
P = 2 Pr X 13, 35 | X N 12, 8;
9
!

13, 35 12, 8
= 2 Pr Z
3,1
3

= 2 Pr(Z 0, 53)
= 2 [0, 5 tab(0, 53)]
= 0, 4038

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA145


O valor P bastante alto; logo a hiptese nula s seria rejeitada para nveis
de significncia maiores que 0,40. Isso evidncia de que no se pode rejeitar
a hiptese nula em qualquer nvel de significncia razovel.
(d)
() = Pr(rejeitar H0 |)

3, 12
3, 12
= Pr X > 15, 21|X N ;
+ Pr X < 10, 38|X N ;
9
9
Na tabela abaixo temos o valor de () para diferentes valores de (voc
pode obter valores um pouco diferentes, por causa de arredondamentos!).
Veja tambm a Figura 9.9.

8
9
10
11
12
13
14
15
16
17
18

()
0,98937
0,90914
0,64347
0,27428
0,05942
0,02184
0,12104
0,41948
0,77772
0,95839
0,99653

Por exemplo:

3, 12
3, 12
(8) = Pr X > 15, 21|X N 8;
+ Pr X < 10, 38|X N 8;
9
9
!

10, 38 8
15, 21 8
+ Pr Z <
= Pr Z >
3,1
3,1
3

= Pr(Z > 6, 98) + Pr(Z < 2, 30)


= [0, 5 tab(6, 98)] + [0, 5 + tab(2, 30]
= 0, 5 0, 5 + 0, 5 + 0, 4893 = 0, 9893
2. Seja X a varivel aleatria que representa o peso das balas. Ento X N(; 0, 25).
Como n = 25, resulta que
X N(; 0, 01)

A afirmativa do fabricante 2. Logo, a negao de tal afirmao < 2.


Como essa ltima expresso no contm o sinal de igualdade, ela se torna a hiptese
alternativa. Ento, nossas hipteses so:
H0 : = 2
H1 : < 2

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA146

1,2
1,0
0,8
0,6
0,4
0,2
0,0
0

10

15

20

Figura 9.9: Funo poder - Exerccio 1


A regio crtica
RC : X < 2 k
Pr[X < 2 k | X N(2; 0, 01)] = 0, 05 =

k
Pr Z <
= 0, 05 =
0, 1

k
= 0, 05 =
Pr Z >
0, 1

k
tab
= 0, 45 =
0, 1
k
= 1, 64 =
0, 1
k = 0, 164
A regio crtica
X < 2 0, 164 = 1, 836
Como o valor observado x = 1, 98 no se encontra na regio crtica, no podemos
rejeitar a hiptese nula. Ou seja, os dados no trazem evidncia de que o fabricante
esteja mentindo.
3. O problema na produo surge quando < 15. Logo, nossas hipteses so:
H0 : = 15
H1 : < 15
A regio crtica
RC : X < 15 k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA147

0, 52
= 0, 001 =
Pr X < 15 k|X N 15;
9
!

15 k 15
= 0, 001 =
Pr Z <
0,5
3

Pr(Z > 6k) = 0, 001 =


tab(6k) = 0, 499 =
6k = 3, 09 =
k = 0, 515
Ento se X < 14, 485 o processo deve ser interrompido para um novo ajuste.
4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A
negao dessa afirmativa 48, 5. Logo, nossas hipteses so:
H0 : = 48, 5
H1 : < 48, 5
A estatstica amostral

55
X N ;
25
O valor obtido x = 46, 5, que resulta no seguinte valor P :

55
P = Pr X < 46, 55|X N 48, 5;
25

46, 5 48, 5
= Pr Z <
1
= Pr(Z < 2, 0)
= Pr(Z > 2, 0)
= 0, 5 tab(2, 0)
= 0, 02275

Podemos afirmar que o tempo de execuo reduziu, a qualquer nvel de significncia


inferior 2, 275%. Note que rejeitamos a hiptese nula ao nvel de significncia de
5%, mas no a 1%!
5. Se o consumo for menor ou igual a 12 litros por 100 km, no h problema com a
propaganda. O problema surge se o consumo for superior. Logo, nossas hipteses
so:
H0 : = 12
H1 : > 12
Supondo que o consumo X possa ser aproximado por uma distribuio normal,
temos que

1
X N ;
36

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 CONHECIDA148


Vamos calcular o valor P :

1
P = Pr X > 12, 4|X N 12;
36

12, 4 12
= Pr Z >
1
6

= Pr(Z > 2, 4)
= 0, 5 tab(2, 4)
= 0, 0082

A propaganda parece ser enganosa, pois a probabilidade de se obter um consumo


mdio de 12,4 litros por 100 km pequena se o consumo realmente for de 12
litros por 100 km. Note que H0 rejeitada para qualquer nvel de significncia
0, 82%, o que inclui os nveis de significncia usuais de 1% e 5%.

Captulo 10
Teste de Hiptese: Propores Amostra Grande
No captulo anterior voc aprendeu a construir testes de hipteses sobre a mdia de
uma populao normal com varincia 2 conhecida. O procedimento baseou-se na distribuio amostral da mdia amostral que, com as hipteses de normalidade e conhecimento da varincia populacional, sabemos ser normal com a mesma mdia e varincia
2
. Neste captulo iremos fazer uso do Teorema Limite Central para construir testes de
n
hipteses sobre propores com base em amostras grandes. Vimos que, para amostras
grandes, a distribuio amostral da proporo amostral pode ser aproximada por uma
distribuio normal e, assim, o procedimento de teste de hiptese ser idntico ao estudado no captulo anterior. Veremos, ento, os seguintes conceitos aplicados proporo
populacional:
hipteses nula e alternativa
estatstica de teste
erros tipo I e II
regra de deciso
regio crtica
valor P

10.1

Contexto bsico

O contexto de interesse o seguinte: temos uma populao em que cada elemento


classificado de acordo com a presena ou ausncia de determinada caracterstica. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :

1 se elemento possui a caracterstica de interesse


X=
0 se elemento no possui a caracterstica de interesse
149

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE150


Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p). O parmetro p tambm
a proporo de elementos da populao que possuem a caractersitca de interesse. Em
geral, esse parmetro desconhecido e queremos testar hipteses feitas sobre seu possvel
valor.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X1 , X2 , . . . , Xn com reposio. Vimos que a proporo Pb de elementos na amostra que
possuem a caracterstica de interesse, definida por
Sn
X1 + X2 + + Xn
Pb =
=
n
n

um estimador no-viesado para p com varincia

p(1p)
n

(10.1)

. Mais precisamente,

E(Pb) = p
p(1 p)
V ar(Pb) =
n

Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Central do Limite
nos diz, ento, que a distribuio de Pb se aproxima de uma nornal com mdia p e
varincia p(1p)
. Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e,
n
em geral, essas condies so satisfeitas se n 30.
Resumindo, temos o seguinte resultado:

p(1 p)
b
P N p;
n
ou, equivalentemente:

Pb p
q
N(0; 1)
p(1p)
n

Vamos ver, agora, como usar esse resultado para construir testes de hipteses sobre a
verdadeira proporo populacional p.

10.2

Teste de hipteses sobre propores

A hiptese nula que consideraremos ser uma hiptese simples:


H0 : p = p0
As hipteses alternativas possveis so
Bilateral :
Unilateral direita :
Unilateral esquerda :

H1 : p 6= p0
H1 : p > p0
H1 : p < p0

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE151


Como no caso da mdia, a escolha das hipteses nula e alternativa deve ser feita
levando-se em conta que a hiptese nula deve ser uma hiptese simples. Assim, voc
deve traduzir a situao de interesse do problema em desigualdades envolvendo a
proporo p. A hiptese alternativa a desigualdade que no inclui o sinal de =.
A estatstica de teste
Pb p
Z=q
N(0; 1)
p(1p)
n

Dado um nvel de significncia , a regio crtica definida como o conjunto de


valores da estatsttca de teste que tm probabilidade pequena de ocorrerem sob a veracidade da hiptese nula. Assim, a regio crtica definida como o conjunto de valores
de
Pb p0
Z0 = r
N(0; 1)
p0 (1 p0 )
n
com pequena probabilidade de ocorrncia:
Z0 > k ou Z0 < k
Z0 > k
Z0 < k

(teste bilateral)
(teste unilateral direita)
(teste unilateral esquerda)

O valor k encontrado impondo-se a condio de a probabilidade do erro tipo I ser


igual a :
Pr (rejeitar H0 | H0 verdadeira) =

10.2.1

Teste bilateral

Com nvel de significncia = Pr(erro I), temos que ter:


Pr(rejeitar H0 | H0 verdadeira) = =
Pr [Z0 > k | Z0 N(0; 1)] + Pr [Z0 < k | Z0 N(0; 1)] = =
Pr [Z0 > k | Z0 N(0; 1)] + Pr [Z0 > k | Z0 N(0; 1)] = =

Pr [Z0 > k | Z0 N(0; 1)] = =


2
k = z/2
ou seja, a regio crtica :
Z0 > z/2

ou

Z0 < z/2

Em termos da proporo amostral, temos o seguinte:


Z0 > z/2 r
Z0 < z/2

Pb p0

> z/2 Pb > p0 + z/2

(10.2)
r

p0 (1 p0 )
n

p0 (1 p0 )
n
r
b
P p0
p0 (1 p0 )
< z/2 Pb < p0 z/2
r
n
p0 (1 p0 )
n

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE152


ou seja, a regio crtica
r
p0 (1 p0 )
Pb > p0 + z/2
n

10.2.2

Pb < p0 z/2

ou

Testes unilaterais

p0 (1 p0 )
n

Com desenvolvimento anlogo obtemos as seguintes regies crticas:


q
0)
b
Teste unilateral direita:
Z0 > z
ou
P > p0 + z p0 (1p
n
Teste unilateral esquerda: Z0 < z

10.3

ou

Valor P

Pb < p0 z

(10.3)

(10.4)

p0 (1p0 )
n

Como j visto no captulo anterior, o valor P a probabilidade de se obter um valor to


ou mais extremo (na direo da hiptese alternativa) que o valor observado da estatstica
de teste. Denotando por z0 o valor observado da estatstica de teste, temos as seguintes
possibilidades:
P = 2 Pr(Z0 > | z0 |) (teste bilateral)
P = Pr(Z0 > | z0 |)
(teste unilateral direita ou esquerda)

(10.5)

Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer sob a
hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula. A hiptese
nula rejeitada a qualquer nvel de significncia P.

10.4

Exemplo 1

Uma amostra de 64 elementos usada para testar


H0 : p = 0, 35
H1 : p 6= 0, 35
Estabelea a regio crtica para o nvel de significncia de 1%. Se a proporo amostral
para esta amostra pb = 0, 26, calcule o valor P.
Soluo
Com = 0, 01 e um teste bilateral, resulta que z0,005 = 2, 59. A estatstica de teste
Pb 0, 35
Z0 = q
=
0,350,65
64

e a regio crtica

Z0 > 2, 58

ou

Z0 < 2, 58

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE153


Em termos da proporo amostral, temos que
Pb 0, 35
Z0 > 2, 58 q
> 2, 58 Pb > 0, 503 82
0,350,65
64

Pb 0, 35
< 2, 58 Pb < 0, 19618
Z0 < 2, 58 q
0,350,65
64

e a regio crtica

Pb > 0, 504

ou

O valor observado da estatstica de teste

Pb < 0, 196

0.26 0.35
z0 = q
= 1, 5095 1, 51
0.350.65
64

Como o teste bilateral, o valor P calculado como


P =
=
=
=

2 Pr [Z0 > 1, 51 | Z0 N(0; 1)]


2 [0, 5 tab(1, 51)]
2 [0, 5 0, 43448]
0, 13104

Como o valor P grande, no se rejeita a hiptese nula, ou seja, a probabilidade de se


obter um valor to extremo quanto o observado alta, se H0 for verdadeira. A hiptese
nula s seria rejeitada para nveis de significncia maiores que 13,1%.

10.5

Exemplo 2

Um fabricante afirma que no mximo 10% dos seus produtos so defeituosos. Um rgo
de defesa do consumidor testa uma amostra de 81 desses itens, detectando 13,8% de
defeituosos.
1. Encontre a regio crtica para um nvel de significncia de 5%.
2. Calcule o valor P.
Soluo
A afirmativa de interesse para o fabricante p 0, 10. A negao de tal afirmativa
(questionamento do rgo de defesa do conumidor) p > 0, 10. Logo, nossas hipteses
so:
H0 : p = 0, 10
H1 : p > 0, 10
Note que todas as propores esto na forma decimal! No trabalhe com percentagens!

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE154


A estatstica de teste

Pb 0, 10
Z0 = q
=
0,100,90
81

1. Com = 0, 05 e um teste unilateral, resulta que z0,05 = 1, 64 e a regio crtica


Z0 > 1, 64
O valor observado da estatstica de teste
0, 138 0, 10
= 1, 14
z0 = q
0,100,90
81

que no pertence regio crtica. Ou seja, os dados no fornecem evidncia contra


o fabricante.
2.
P = Pr [Z0 > 1, 14 | Z0 N(0; 1)]
= 0, 5 tab(1, 14)
= 0, 12714
Logo, rejeitamos H0 apenas para nveis de significncia maiores que 12,7%. Assim,
aos nveis de significncia usuais, no devemos rejeitar H0 , o que uma evidncia
de que o fabricante est dizendo a verdade.

10.6

Resumo do Captulo

Neste captulo voc estudou o procedimento para construo de um teste de hiptese


sobre a proporo de uma populao com base em uma amsotra aleatria simples de
tamanho n grande. Assim, temos uma amostra aleatria simples X1 , X2 , . . . , Xn de uma
populao X Bern(p), com n suficientemente grande.
A hiptese nula, representada por H0 , a hiptese bsica que queremos testar e
neste contexto sempre ter a forma
H0 : p = p0
A hiptese alternativa, representada por H1 , a hiptese que devemos considerar
no caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese
bilateral, mas podemos ter hipteses unilaterais esquerda e hipteses unilaterais
direita:
H1 : p < p0
H1 : p > p0
H1 : p 6= p0
Para definir a hiptese alternativa, escreva, primeiro, as situaes de interesse
do problema em forma de desigualdades. A hiptese alternativa ser sempre a
desigualdade que no envolve o sinal de igualdade.

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE155


A estatstica de teste

Z=r

Pb p

p(1 p)
n

N(0; 1)

A regra de deciso se baseia no valor da estatstica de teste sob a hiptese nula:


Z0 = r

Pb p0

p0 (1 p0 )
n

N(0; 1)

Valores pouco provveis desta estatstica levam rejeio da hiptese nula. Assim,
a regra de deciso rejeitar H0 para valores na(s) cauda(s) da distribuio normal
padro. Com nvel de significncia , temos as seguintes possibilidades:
Z0 > z/2
Z0 > z
Z0 < z

ou

Z0 < z/2

(teste bilateral)
(teste unilateral direita)
(teste unilateral esquerda)

O valor P a probabilidade de se obter um valor to ou mais extremo (na direo


da hiptese alternativa) que o valor observado da estatstica de teste. Denotando
por z0 o valor observado da estatstica de teste, temos as seguintes possibilidades:
P = 2 Pr(Z0 > | z0 |) (teste bilateral)
P = Pr(Z0 > | z0 |)
(teste unilateral direita ou esquerda)
Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer
sob a hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula.
A hiptese nula rejeitada a qualquer nvel de significncia P.

10.7

Exerccios

1. Em uma pesquisa com 800 estudantes universitrios, 385 afirmaram possuir computador. Teste a hiptese de que pelo menos 50% dos estudantes universitrios
possuem computador. Use = 0, 10.
2. Uma pesquisa entre 700 trabalhadores revela que 12,3% obtiveram seus empregos
atravs de indicaes de amigos ou parentes. Teste a hiptese de que mais de 10%
dos trabalhadores conseguem seus empregos por indicao de amigos ou parentes,
utilizando 5% como nvel de significncia.
3. O nvel de aprovao da qualidade das refeies servidas em um restaurante universitrio era de 20%, quando houve uma movimentao geral dos estudantes que
forou a direo do restaurante a fazer mudanas. Feitas as mudanas, sorteia-se
uma amostra de 64 estudantes usurios do restaurante e 25 aprovam a qualidade
da comida. Voc diria, ao nvel de significncia de 5%, que as mudanas surtiram
efeito?

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE156


4. Deseja-se testar a honestidade de uma moeda. Para isso, lana-se a moeda 200
vezes, obtendo-se 115 caras. Qual a sua concluso sobre a honestidade da moeda?
Para responder a essa questo, calcule e interprete o valor P.
5. A direo de um grande jornal nacional afirma que 25% dos seus leitores so da
classe A. Se, em uma amostra de 740 leitores, encontramos 156 da classe A, qual
a concluso que tiraramos sobre a afirmativa da direo do jornal?

10.8
1. pb =

Soluo dos Exerccios


385
800

= 0, 48125

A afirmativa de interesse pelo menos 50% dos estudantes possuem computador,


ou seja, p 0, 5. Logo, as hipteses so
H0 : p = 0, 50
H1 : p < 0, 50
= 0, 10 = z0,1 = 1, 28
O valor observado da estatstica de teste
0, 48125 0, 5
q
= 1, 0607
z0 =
0,50,5
800

e a regio crtica

Z0 < 1, 28

Como o valor observado no pertence regio crtica, no podemos rejeitar a


hiptese nula. Ou seja, os dados trazem evidncia de que a proporo de estudantes
que possuem computador de pelo menos 50%.
2. A afirmativa de interesse mais de 10% dos trabalhadores conseguem seus empregos por indicao de amigos ou parentes, ou seja, p > 0, 10, cuja negativa
p 0, 10. Logo, as hipteses so
H0 : p = 0, 10
H1 : p > 0, 10
Com = 5% e um teste unilateral, z0,05 = 1, 64. O valor observado da estatstica
de teste
0, 123 0, 1
= 2, 0284
z0 = q
0,10,9
700

e a regio crtica

Z0 > 1, 64
Como o valor observado da estatstica de teste pertence regio crtica, rejeita-se
a hiptese nula de que 10% ou menos dos trabalhadores conseguem seus empregos
por indicao de parentes ou amigos.

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE157


3. O interesse verificar se p > 0, 20. Logo,
H0 : p = 0, 20
H1 : p > 0, 20
Como = 5% e o teste unilateral, resulta que z0,05 = 1, 64. Logo, a regio crtica

Z0 > 1, 64
O valor observado da estatstica de teste
25
0.20
q
z0 = 64
= 3, 8125
0.20.8
64

que est na regio crtica; logo, rejeita-se a hiptese nula, ou seja, as evidncias
amostrais indicam que houve melhora com as mudanas.
4. As hipteses so
H0 : p = 0, 5
H1 : p 6= 0, 5
e a estatstica de teste

Pb 0, 5
Z0 = q
0,50,5
200

O valor observado da estatstica de teste


115

q
Z0 = 200

0, 5

0,50,5
200

= 2, 1213 2, 12

e o valor P para o teste bilateral


P = 2 Pr [Z0 > 2, 12 | Z0 N(0; 1)]
= 2 [0, 5 tab(2, 12)]
= 0, 034
Como o valor P pequeno, a probabilidade de obtermos 115 caras em 200 lanamentos de uma moeda honesta pequena, o que nos leva a suspeitar da honestidade da moeda. A hiptese nula seria rejeitada para qualquer nvel de significncia
3, 4%.
5. Com as informaes disponveis, nossas hipteses so:
H0 : p = 0, 25
H1 : p 6= 0, 25

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE158


e a estatstica de teste

Pb 0, 25
Z0 = q

0,250,75
740

O valor observado da estatstica de teste


156
740

Z0 = q

0, 25

0,250,75
740

= 2, 46

e o valor P para o teste bilateral

P = 2 Pr [Z0 > 2, 46 | Z0 N(0; 1)]


= 2 [0, 5 tab(2, 46)]
= 0, 0139
Como o valor P bastante pequeno, devemos rejeitar a hiptese nula de que a
proporo de leitores da classe A igual a 25%.

Captulo 11
Teste de Hiptese: Mdia da
N(; 2) - 2 Desconhecida
Neste captulo voc completar seu estudo bsico de testes de hipteses sobre a mdia de
uma populao, analisando a situao relativa a uma populao normal quando no se
conhece a varincia desta populao. Assim como no caso do intervalo de confiana, para
testar hipteses relativas mdia de tal populao, necessrio estimar essa varincia e
isso introduz mais uma fonte de variabilidade no procedimento: com uma nica amostra,
queremos testar hipteses sobre a mdia, mas precisamos tambm estimar a varincia
da populao. O procedimento simples e anlogo aos casos estudados nos catulos
anteriores; o que muda a distribuio amostral da estatstica de teste. Em vez de
usarmos a distribuio normal para determinar os valores crticos, usaremos novamente
a distribuio t de Student.
Veremos, ento, os seguintes conceitos aplicados mdia de uma populao normal
com varincia desconhecida:
hipteses nula e alternativa
estatstica de teste
regra de deciso
regio crtica
valor P

11.1

Contexto bsico

Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia 2 : X N(; 2 ). Nosso interesse testar hipteses sobre a mdia a

159

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA160


partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, se
a varincia 2 no conhecida, ento temos que usar a estatstica
T =

X
n
S

cuja distribuio t de Student com n 1 graus de liberdade.


De posse desta estatstica de teste, o procedimento de construo do teste idntico
ao visto nos trs ltimos captulos: identificadas a hiptese nula (sempre na forma de
uma hiptese simples = 0 ) e a hiptese alternativa, a regio crtica formada pelos
valores da estatstica de teste pouco provveis sob H0 . O nvel de significncia e o
tipo de hiptese alternativa permitem a identificao precisa do que so valores pouco
provveis: so valores na(s) cauda(s) da distribuio de T quando a hiptese nula
verdadeira.
Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos
de aplicao.

11.2

Procedimento geral para construo do teste


de hiptese sobre a mdia de uma N(; 2) - 2
desconhecida

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X cuja distribuio N(; 2 ). Nosso interesse testar alguma hiptese sobre a mdia desta
populao. Em geral, a varincia 2 no conhecida e, portanto, vamos estim-la por

n
n
P 2
1 P
1
2
2
2
(Xi X) =
X nX
S =
n 1 i=1
n 1 i=1 i
Lembre-se que S 2 um estimador no-viesado de 2 .

11.2.1

Hiptese nula e hiptese alternativa

A hiptese nula que iremos considerar ser


H0 : = 0
As possveis formas da hiptese alternativa so:
Bilateral :
Unilateral direita :
Unilateral esquerda :

H1 : 6= 0
H1 : > 0
H1 : < 0

Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento
do problema. Se no temos informao alguma sobre a alternativa, temos que usar um
teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA161


ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa
no inclua o sinal de igualdade.

11.2.2

Hipteses do problema

Hipteses estatsticas

< 0
0

H0 : = 0
H1 : < 0

0
> 0

H0 : = 0
H1 : > 0

Estatstica de teste, erros, regra de deciso

Como o teste sobre a mdia de uma populao normal, a estatstica amostral que deve
ser utilizada X. Como a varincia populacional no conhecida, sabemos que
T =

X
S
n

t(n 1)

e essa a nossa estatstica de teste.


O procedimento de deciso definido em termos da hiptese nula H0 e as decises
possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme j visto, existem duas possibilidades de erro:
Erro tipo I: rejeitar H0 quando H0 verdadeira
Erro tipo II: no rejeitar H0 quando H0 falsa
A regra de deciso consiste em definir a regio crtica RC como o conjunto de valores
cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 . Logo,
nossa regra de deciso se baseia na estatstica de teste
T0 =

X 0
S
n

t(n 1)

Como a estatstica de teste segue uma distribuio t de Student, valores com pequena
probabilidade de ocorrncia esto nas caudas da distribuio. Isso equivale a valores de
X distandes de 0 . Assim, a regio crtica para cada tipo de hiptese alternativa
definida como segue:
Alternativa bilateral:
Alternativa unilateral direita:
Alternativa unilateral esquerda:

T0 > k ou T0 < k
T0 > k
T0 < k

Na Figura 11.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA162

Figura 11.1: Regio crtica para o teste sobre a mdia de uma normal com varincia
desconhecida

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA163

11.2.3

Nvel de significncia e regio crtica

O procedimento usual de teste de hiptese consiste em se fixar o nvel de significncia


, que, por definio, a probabilidade de se cometer o erro tipo I:
= Pr(erro tipo I) = Pr(rejeitar H0 |H0 verdadeira)
Assim, para cada tipo de hiptese alternativa a regio crtica identificada impondo-se
a condio
Pr(T RC|H0 verdadeira) =
Hiptese bilateral
A regio crtica calculada como:
Pr [T0 > k | T0 t(n 1)] + Pr [T0 < k | T0 t(n 1)] = =
Pr [T0 > k | T0 t(n 1)] + Pr [T0 > k | T0 t(n 1)] = =

Pr [T0 > k | T0 t(n 1)] =


2
Usando a notao tn; para denotar a abscissa da distribuio t de Student com n
graus de liberdade que deixa rea (probabilidade) acima dela, resulta a seguinte regio
crtica para o teste bilateral:
ou

T0 > tn1; /2

T0 < tn1; /2

(11.1)

Essa regio crtica tambm pode ser escrita de outra forma usando a seguinte equivalncia:
X 0
S
T0 > tn1; /2
> tn1; /2 X > 0 + tn1; /2
S
n
n
T0 < tn1; /2

X 0
S
n

S
< tn1; /2 X < 0 tn1; /2
n

Teste unilateral direita


A regio crtica calculada como:
Pr [T0 > k | T0 t(n 1)] = =
k = tn1;
ou seja, a regio crtica
T0 > tn1;
ou equivalentemente
S
X > 0 + tn1;
n

(11.2)

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA164


Teste unilateral esquerda
De forma anloga, obtm-se a seguinte regio crtica para o teste unilateral esquerda:
T0 < tn1;

(11.3)

ou equivalentemente
S
X < 0 tn1;
n

11.3

Exemplos

A ttulo de comparao com a situao do penltimo captulo, em que supusemos a varincia conhecida, vamos considerar os mesmos exemplos, mas agora tratando a varincia
dada como sendo a varincia amostral S 2 .

11.3.1

Exemplo 1

Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma
varivel aleatria normal com mdia de 100 minutos. Uma amostra de 16 tempos de
processamento aps a pane revela uma mdia x = 105, 5 minutos e um desvio padro
s = 10 minutos. Ao nvel de significncia de 5%, qual a concluso sobre a alterao
do tempo mdio de processamento?
Soluo
Como visto, as hipteses do problema so
= 100
6= 100
Como a segunda expresso no envolve o sinal de igualdade, ela se torna a hiptese
alternativa:
H0 : = 100
H1 : 6= 100
Como a varincia no conhecida, temos que usar a distribuio t de Student com
n1 = 161 = 15 graus de liberdade. Para um teste bilateral com nvel de significncia
de 5%, a abscissa de interesse aquela que deixa rea de 0,025 acima. Consultando a
Tabela 2 dada no final desta apostila, resulta
t15; 0,025 = 2, 131
A estatstica de teste
T0 =

X 100
10
16

t(15)

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA165


e a regio crtica
T0 > 2, 131 ou T0 < 2, 131
O valor observado da estatsitca de teste
t0 =

105, 5 100
10
16

= 2, 2

Como esse valor pertence regio crtica, rejeitamos a hiptese nula e conclumos que
houve alterao no tempo de processamento aps a pane.
Em termos da mdia amostral, a regio crtica
10
10
X > 100 + 2, 131 ou X < 100 2, 131
16
16
ou
ou

X > 105, 33

X < 94, 673

Compare com a regio crtica obtida no caso da normal (Exemplo 23.1):


ou

X > 104, 9

X < 95, 1

Com o mesmo nvel de significncia, a regio crtica no caso de varincia desconhecida


mais extrema, refletindo a maior variabilidade da distribuio t.

11.3.2

Exemplo 2

Na mesma situao do exemplo anterior, vamos considerar o caso em que o gerente esteja
interessado apenas no aumento do tempo de processamento. Neste caso, as hipteses
so:
100
> 100

OK!
Problema!

Para definir qual a hiptese nula, vamos usar o mesmo procedimento. Em um teste
unilateral, a hiptese alternativa deve ser aquela que no envolve o sinal de igualdade.
No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo que ser uma
hiptese simples, passa a ser = 100, ou seja:
H0 : = 100
H1 : > 100
Como antes, a estatstica de teste
T0 =

X 100
10
16

t(15)

mas a regio crtica passa a ser


T0 > t15; 0,05

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA166


Consultando a tabela da distribuio t, resulta que
t15; 0,05 = 1, 753
o que nos leva a regio crtica
T0 > 1, 753
ou

10
X > 100 + 1, 753 = 104, 38
16
Essa tambm uma regio mais extrema que aquela encontrada para o caso da normal:
X > 104, 1. E novamente rejeitamos a hiptese nula, ou seja, as evidncias amostrais
indicam um aumento do tempo de processamento da tarefa aps a pane.

11.3.3

Exemplo 3

O dono de uma mdia empresa decide investigar a alegao de seus empregados de


que o salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso,
ele analisa uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais e desvio
padro de 32 reais. De informaes obtidas junto ao sindicato patronal, ele sabe que,
em nvel nacional, o salrio mdio de 900 reais. Supondo que seja razovel aproximar
a distribuio dos salrios por uma distribuio normal, vamos construir um teste de
hiptese apropriado, com um nvel de significncia de 10%.
Soluo
O problema aqui consiste em decidir se os salrios so menores ou no do que a
mdia nacional de 900 reais, ou seja, as situaes de interesse so
< 900
900
Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal
de igualdade. Logo, nossas hipteses so:
H0 : = 900
H1 : < 900
A regio crtica definida em termos da estatstica de teste
T0 =

X 900
32
25

t(24)

como
T0 < t24; 0,10
Com nvel de significncia de 10%, a abscissa de interesse aquela que deixa rea de
10% acima dela em uma distribuio t com 24 graus de liberdade:
t24;0,10 = 1, 318

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA167


Logo, a regio crtica
T0 < 1, 318
ou

32
X < 900 1, 318 = 891, 56
25
Como o valor observado de 894,53 reais no est na regio crtica, no rejeitamos H0 ,
ou seja, as evidncias amostrais apontam que os salrios da empresa no so menores
que a mdia nacional.
Comparando com a regio crtica do caso normal, X < 891, 808, vemos, novamente,
que no caso da t a regio mais extrema.

11.4

Poder do teste

A definio da funo poder do teste exatamente a mesma:


() = Pr(rejeitar H0 |)
O problema aqui que, para calcular (), precisamos de um programa computacional
que calcule probabilidades da distribuio t para qualquer valor da abscissa. A ttulo
de ilustrao, vamos calcular o poder do Exemplo 1 para o valor alternativo = 95 :

(95) =

=
=

X 95
t(15)
Pr X > 105, 73 | 16
10

X 95
t(15)
+ Pr X < 94, 673 | 16
10

X 95 105, 73 95
Pr
> 16
16
10
10

X 95 94, 673 95
< 16
+ Pr
16
10
10
Pr [t(15) > 4, 292] + Pr [t(15) < 0, 1308]
0, 00032 + 0, 44884 = 0, 44916

Os valores 0.00032 e 0.44884 foram obtidos com um programa computacional estatstico.

11.5

Valor P

Assim como no caso da funo poder, o clculo do valor P requer programas conmputacionais que calculem probabilidades da distribuio t para qualquer abscissa. Mas
a interpretao do valor P continua sendo a mesma: valores pequenos de P indicam
eventos pouco provveis de ocorrerem quando H0 verdadeira. Assim, continua valendo
a seguinte regra de deciso:

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA168


Devemos rejeitar a hiptese nula H0 ao nvel de significncia sempre que o valor
P for menor ou igual a ,ou seja:
Rejeitamos H0 P
No Exemplo 1, o valor P
P =
=
=
=

X 100
2 Pr X > 105, 5 | 16
t(15)
10

105, 5 100
2 Pr t(15) > 16
10
2 Pr [t(15) > 2, 2]
2 0, 02195 = 0, 0439

Como P < 0, 05, rejeitamos H0 ao nvel de significncia de 5%.

11.6

Exerccios

1. Uma amostra aleatria simples de tamanho n = 9 extrada de uma populao


normal apresentou mdia igual a x = 13, 35 e desvio padro s = 3, 1. Deseja-se
testar
H0 : = 12, 8
H1 : 6= 12, 8
(a) Determine a regio crtica correspondente ao nvel de significncia = 0, 02.
(b) Com base na regio crtica encontrada no item anterior, estabelea a concluso, tendo o cuidado de usar um fraseado que no seja puramente tcnico.
2. Uma empresa fabricante de balas afirma que o peso mdio de suas balas de pelo
menos 2 gramas. Pela descrio do processo de produo, sabe-se que o peso das
balas distribui-se normalmente. Uma amostra de 25 balas apresenta peso mdio
de 1,98 gramas e um desvio padro de 0,5 grama.. O que se pode concluir sobre
a afirmao do fabricante? Use um nvel de significncia de 5%.
3. Em uma linha de produo, peas so produzidas de modo que o comprimento seja
normalmente distribudo. Ajustes peridicos so feitos na mquina para garantir
que as peas tenham comprimento apropriado de 15 cm, pois as peas muito curtas
no podem ser aproveitadas (as peas longas podem ser cortadas). A cada hora
so extradas 9 peas da produo, medindo-se seu comprimento. Uma dessas
amostras apresenta comprimento mdio de 14,5 cm e desvio padro de 0,5 cm.
Use o nvel de significncia de 0,1% para testar a hiptese de que o processo esteja
operando adequadamente.

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA169


4. Depois de desenvolver um algoritmo para acelerar a execuo de determinada
tarefa rotineira em um escritrio de contabilidade, o analista de sistema analisa
uma amostra de 25 tempos, obtendo uma mdia 46,5 segundos e desvio padro
de 5 segundos. Dos dados passados, ele sabe que o tempo de execuo aproximadamente normal com mdia de 48,5 segundos. Use o nvel de significncia de
5% para decidir se o algoritmo do analista realmente melhorou o desempenho do
sistema.
5. Uma propaganda afirma que o consumo mdio de gasolina de determinada marca
de automvel de 12 litros por 100 quilmetros rodados. Um teste com 36 automveis desta marca acusa um consumo mdio de 12,4 litros por 100 quilmetros
rodados com desvio padro de 1 litro por quilmetro rodado. O que se pode
concluir sobre a propaganda? Use o nvel de significncia de 10%.

11.7

Soluo dos Exerccios

1. n = 9, = 0, 02 t8; 0,01 = 2, 896. Logo, a regio crtica


T0 > +2, 896 ou T0 < 2, 896
O valor observado da estatstica de teste
t0 =

13.35 12.8
3.1
3

= 0, 53226

que no pertence regio crtica; logo, no podemos rejeitar H0 .


2. A afirmativa do fabricante 2. Logo, a negao de tal afirmao < 2.
Como essa ltima expresso no contm o sinal de igualdade, ela se torna a hiptese
alternativa. Ento, nossas hipteses so:
H0 : = 2
H1 : < 2
n = 25; = 0, 05 = t24; 0,05 = 1, 711. Logo, a regio crtica
T0 < 1, 711
O valor observado da estatstica de teste
t0 =

1.98 2.0
0.5
5

= 0, 2

que no pertence regio crtica; logo, no podemos rejeitar H0 , ou seja, as evidncias amostrais indicam que as balas pesam pelo menos 2 gramas.

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N(; 2 ) - 2 DESCONHECIDA170


3. O problema na produo surge quando < 15. Logo, nossas hipteses so:
H0 : = 15
H1 : < 15
n = 9, = 0, 001 = t8; 0,001 = 4, 501. A regio crtica
T0 < 4, 501

e o valor observado desta estatstica de teste


14.5 15
t0 =
= 3, 0
0.5
3

Como o valor observado t0 = 3, 0 no est na regio crtica, no podemos rejeitar H0 , ou seja, as evidncias amostrais indicam que o processo est operando
adequadamente.
4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A
negao dessa afirmativa 48, 5. Logo, nossas hipteses so:
H0 : = 48, 5
H1 : < 48, 5

n = 25, = 0, 05 = t24; 0,05 = 1, 711. Logo, a regio crtica


T0 < 1, 711

e o valor observado desta estatstica


46.5 48.5
t0 =
= 2, 0
5
5

Como o valor observado t0 = 2, 0 pertence regio crtica, devemos rejeitar


H0 , ou seja, as evidncias amostrais indicam que o analista foi bem-sucedido em
reduzir o tempo de execuo.
5. Se o consumo for menor ou igual a 12 litros por 100 km, no h problema com a
propaganda. O problema surge se o consumo for superior. Logo, nossas hipteses
so:
H0 : = 12
H1 : > 12
Supondo que o consumo X possa ser aproximado por uma distribuio normal,
podemos usar a distribuio t(35). Com = 10%, t35; 0,10 = 1, 306 e a regio crtica

T0 > 1, 306
O valor observado desta estatstica de teste
12.4 12
t0 =
= 2, 4
1
6

Como o valor observado t0 = 2, 4 est na regio crtica, devemos rejeitar H0 , ou


seja, a propaganda parece ser enganosa.

Captulo 12
Teste de Hiptese: Varincia da
N(; 2)
Neste captulo completaremos o estudo de teste de hiptese sobre parmetros de uma
populao, analisando o caso da varincia de uma populao normal. Assim como na
construo de intervalos de confiana, nossa estatstica de teste tem distribuio quiquadrado e a regio crtica, como antes, ser formada pelos valores pouco provveis
desta estatstica de teste sob a hiptese nula.

12.1

Contexto bsico

Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia 2 : X N(; 2 ). Nosso interesse testar hipteses sobre a a varincia 2
a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a
estatstica
(n 1)S 2
2 =
2
tem distribuio qui-quadrado com n 1 graus de liberdade.
De posse desta estatstica de teste, o procedimento de construo do teste idntico
ao visto nos ltimos captulos: identificadas a hiptese nula (sempre na forma de uma
hiptese simples 2 = 20 ) e a hiptese alternativa, a regio crtica formada pelos
valores da estatstica de teste pouco provveis sob H0 . O nvel de significncia e o
tipo de hiptese alternativa permitem a identificao precisa do que so valores pouco
provveis: so valores na(s) cauda(s) da distribuio de 2 quando a hiptese nula
verdadeira.
Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos
de aplicao.

171

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

12.2

172

Procedimento geral para construo do teste


de hiptese sobre a varincia de uma N(; 2)

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X cuja distribuio N(; 2 ). Nosso interesse testar alguma hiptese sobre a varincia 2 ,
que estimada por

n
n
P 2
1 P
1
2
2
2
S =
(Xi X) =
X nX
n 1 i=1
n 1 i=1 i

Lembre-se que S 2 um estimador no-viesado de 2 .

12.2.1

Hiptese nula e hiptese alternativa

A hiptese nula que iremos considerar ser


H0 : 2 = 20
As possveis formas da hiptese alternativa so:
H1 : 2 6= 20
H1 : 2 > 20
H1 : 2 < 20

Bilateral :
Unilateral direita :
Unilateral esquerda :

Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento
do problema. Se no temos informao alguma sobre a alternativa, temos que usar um
teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,
ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa
no inclua o sinal de igualdade.

12.2.2

Hipteses do problema

Hipteses estatsticas

2 < 20
2 20

H0 : 2 = 20
H1 : 2 < 20

2 > 20
2 20

H0 : 2 = 20
H1 : > 0

Estatstica de teste, erros, regra de deciso

Como o teste sobre a varincia de uma populao normal, a estatstica amostral a ser
utilizada
(n 1)S 2
2 (n 1)
2

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

173

O procedimento de deciso definido em termos da hiptese nula H0 e as decises


possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme j visto, existem duas possibilidades de erro:
Erro tipo I: rejeitar H0 quando H0 verdadeira
Erro tipo II: no rejeitar H0 quando H0 falsa
A regra de deciso consiste em definir a regio crtica RC como o conjunto de valores
cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 . Logo,
nossa regra de deciso se baseia na estatstica de teste
X02 =

(n 1)S 2
2 (n 1)
2
0

Os valores com pequena probabilidade de ocorrncia esto nas caudas da distribuio.


Assim, a regio crtica para cada tipo de hiptese alternativa definida como segue:
Alternativa bilateral:
Alternativa unilateral direita:
Alternativa unilateral esquerda:

X02 > kS ou X02 < kI


X02 > kS
X02 < kI

Na Figura 12.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.

12.2.3

Nvel de significncia e regio crtica

O procedimento usual de teste de hiptese consiste em se fixar o nvel de significncia


, que, por definio, a probabilidade do erro tipo I:
= Pr(erro tipo I) = Pr(rejeitar H0 |H0 verdadeira)
Assim, para cada tipo de hiptese alternativa a regio crtica identificada impondo-se
a condio
Pr(X RC|H0 verdadeira) =
Hiptese bilateral
A regio crtica calculada como:

Pr X0 > kS | X0 2 (n 1) + Pr X0 < kI | X0 2 (n 1) =

Mesmo a distribuio qui-quadrado no sendo simtrica, prtica usual dividir a probabilidade de erro em partes iguais, ou seja, os limites da regio crtica so definidos de
modo que

Pr X0 > kS | X0 2 (n 1) =
2

2
Pr X0 < kI | X0 (n 1) =
2

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

174

Figura 12.1: Regio crtica para testes de hipteses sobre a varincia de uma N(; 2 )

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

175

Usando a notao 2n; para denotar a abscissa da distribuio qui-quadrado com


n graus de liberdade que deixa rea (probabilidade) acima dela, resulta a seguinte
regio crtica para o teste bilateral:
X02 > 2n1;/2

ou

X02 < 2n1;1/2

(12.1)

Teste unilateral direita


A regio crtica calculada como:

Pr X0 > kS | X0 2 (n 1) = = kS = 2n1;
ou seja, a regio crtica

X02 > 2n1;

(12.2)

Teste unilateral esquerda


De forma anloga, obtm-se a seguinte regio crtica para o teste unilateral esquerda:
X02 < 2n1;1

12.3

(12.3)

Exemplo 1

Uma amostra aleatria simples de tamanho n = 16 foi retirada de uma populao


normal, obtendo-se s2 = 32, 1. Ao nvel de significncia de 5% pode-se dizer que 2 6= 20?
Soluo
As hipteses so
H0 : 2 = 20
H1 : 2 6= 20
Com 15 graus de liberdade, teste bilateral e nvel de significncia de 5%, os valores
crticos necessrios so
215;0,975 = 6, 262
215;0,025 = 27, 488
e a regio crtica
X02 > 27, 488

ou

X02 < 6, 262

O valor observado da estatstica de teste


x20 =

15 32, 1
= 24, 075
20

que no pertence regio crtica. Logo, no se rejeita a hiptese nula, ou seja, no


podemos afirmar que 2 6= 20.

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

12.4

176

Exemplo 2 (Bussab&Morettin - Exerccio 40 p.


353)

Um escritrio de investimento acredita que o rendimento das diversas aes movimentadas por ele foi de 24% ao longo dos ltimos anos. Uma nova estratgia implementada
para melhorar o desempenho, bem como garantir uma maior uniformidade nos rendimentos das diversas aes. No passado, o desvio padro do rendimento era da ordem
de 5%. Uma amostra de 8 empresas forneceu os seguinjtes rendimentos (dados em %):
23,6; 22,8; 25,7; 24,8; 26,4; 24,3; 23,9; 25. Quais seriam as concluses? Quais so as
hipteses necessrias para a soluo deste problema?
Soluo
Temos que supor que os rendimentos tm distribuio normal. As hipteses de
interesse so > 24 e 2 < 25. Logo, as hipteses estatsticas so
H0 : = 24
H1 : > 24
Os dados fornecem

8
P

xi = 196, 5 e

i=1

8
P

i=1

H0 : 2 = 25
H1 : 2 < 25

x2i = 4835, 99

196, 5
= 24, 5625
8
1
9, 45875
=
[4835, 99 8 24, 5625] =
= 1, 35125
7
7

x =
s2

Como o tamanho da amostra pequeno e tanto a mdia como varincia so desconhecidas, as estatsticas de teste so T0 e X02 . Os valores crticos, para um nvel de
significncia de 5%, so
t7;0,05 = 1, 895

7;0,95 = 2, 167

e s regies crticas so
T0 > 1, 895

X02 < 2, 167

Os valores observados das estatsticas de teste so


24, 5625 24
8
= 1, 3687 < 1, 895
1, 35125
7 1, 35125
= 0, 37835 < 2, 167
=
25

t0 =
x20

Vemos, ento, que t0 no pertence regio crtica e, portanto, no podemos dizer que o
rendimento mdio aumentou. Por outro lado, x20 pertence regio crtica e, portanto, os
dados indicam que houve reduo na variabilidade dos rendimentos das aes negociadas
pelo escritrio.

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

177

Tabela 1
Distribuio Normal Padro
Corpo da tabela d a probabilidade p tal que

p = P (0 < Z < Z c )
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4
4,1
4,2
4,3
4,4
4,5

0
0,00000
0,03983
0,07926
0,11791
0,15542
0,19146
0,22575
0,25804
0,28814
0,31594
0,34134
0,36433
0,38493
0,40320
0,41924
0,43319
0,44520
0,45543
0,46407
0,47128
0,47725
0,48214
0,48610
0,48928
0,49180
0,49379
0,49534
0,49653
0,49744
0,49813
0,49865
0,49903
0,49931
0,49952
0,49966
0,49977
0,49984
0,49989
0,49993
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000

1
0,00399
0,04380
0,08317
0,12172
0,15910
0,19497
0,22907
0,26115
0,29103
0,31859
0,34375
0,36650
0,38686
0,40490
0,42073
0,43448
0,44630
0,45637
0,46485
0,47193
0,47778
0,48257
0,48645
0,48956
0,49202
0,49396
0,49547
0,49664
0,49752
0,49819
0,49869
0,49906
0,49934
0,49953
0,49968
0,49978
0,49985
0,49990
0,49993
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000

2
0,00798
0,04776
0,08706
0,12552
0,16276
0,19847
0,23237
0,26424
0,29389
0,32121
0,34614
0,36864
0,38877
0,40658
0,42220
0,43574
0,44738
0,45728
0,46562
0,47257
0,47831
0,48300
0,48679
0,48983
0,49224
0,49413
0,49560
0,49674
0,49760
0,49825
0,49874
0,49910
0,49936
0,49955
0,49969
0,49978
0,49985
0,49990
0,49993
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000

3
0,01197
0,05172
0,09095
0,12930
0,16640
0,20194
0,23565
0,26730
0,29673
0,32381
0,34849
0,37076
0,39065
0,40824
0,42364
0,43699
0,44845
0,45818
0,46638
0,47320
0,47882
0,48341
0,48713
0,49010
0,49245
0,49430
0,49573
0,49683
0,49767
0,49831
0,49878
0,49913
0,49938
0,49957
0,49970
0,49979
0,49986
0,49990
0,49994
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000

4
0,01595
0,05567
0,09483
0,13307
0,17003
0,20540
0,23891
0,27035
0,29955
0,32639
0,35083
0,37286
0,39251
0,40988
0,42507
0,43822
0,44950
0,45907
0,46712
0,47381
0,47932
0,48382
0,48745
0,49036
0,49266
0,49446
0,49585
0,49693
0,49774
0,49836
0,49882
0,49916
0,49940
0,49958
0,49971
0,49980
0,49986
0,49991
0,49994
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000

5
0,01994
0,05962
0,09871
0,13683
0,17364
0,20884
0,24215
0,27337
0,30234
0,32894
0,35314
0,37493
0,39435
0,41149
0,42647
0,43943
0,45053
0,45994
0,46784
0,47441
0,47982
0,48422
0,48778
0,49061
0,49286
0,49461
0,49598
0,49702
0,49781
0,49841
0,49886
0,49918
0,49942
0,49960
0,49972
0,49981
0,49987
0,49991
0,49994
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000

6
0,02392
0,06356
0,10257
0,14058
0,17724
0,21226
0,24537
0,27637
0,30511
0,33147
0,35543
0,37698
0,39617
0,41309
0,42785
0,44062
0,45154
0,46080
0,46856
0,47500
0,48030
0,48461
0,48809
0,49086
0,49305
0,49477
0,49609
0,49711
0,49788
0,49846
0,49889
0,49921
0,49944
0,49961
0,49973
0,49981
0,49987
0,49992
0,49994
0,49996
0,49998
0,49998
0,49999
0,49999
0,50000
0,50000

7
0,02790
0,06749
0,10642
0,14431
0,18082
0,21566
0,24857
0,27935
0,30785
0,33398
0,35769
0,37900
0,39796
0,41466
0,42922
0,44179
0,45254
0,46164
0,46926
0,47558
0,48077
0,48500
0,48840
0,49111
0,49324
0,49492
0,49621
0,49720
0,49795
0,49851
0,49893
0,49924
0,49946
0,49962
0,49974
0,49982
0,49988
0,49992
0,49995
0,49996
0,49998
0,49998
0,49999
0,49999
0,50000
0,50000

8
0,03188
0,07142
0,11026
0,14803
0,18439
0,21904
0,25175
0,28230
0,31057
0,33646
0,35993
0,38100
0,39973
0,41621
0,43056
0,44295
0,45352
0,46246
0,46995
0,47615
0,48124
0,48537
0,48870
0,49134
0,49343
0,49506
0,49632
0,49728
0,49801
0,49856
0,49896
0,49926
0,49948
0,49964
0,49975
0,49983
0,49988
0,49992
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000
0,50000

9
0,03586
0,07535
0,11409
0,15173
0,18793
0,22240
0,25490
0,28524
0,31327
0,33891
0,36214
0,38298
0,40147
0,41774
0,43189
0,44408
0,45449
0,46327
0,47062
0,47670
0,48169
0,48574
0,48899
0,49158
0,49361
0,49520
0,49643
0,49736
0,49807
0,49861
0,49900
0,49929
0,49950
0,49965
0,49976
0,49983
0,49989
0,49992
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000
0,50000

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

178

Tabela 2
Valores crticos da distribuio t -Student

Pr(t (n) > t ) =

g.l.
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
50

0,150
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,054
1,054
1,053
1,052
1,052
1,050
1,047

0,100
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306
1,303
1,299

0,050
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690
1,684
1,676

rea na cauda superior:


0,025
0,010
0,005
12,706
31,821
63,657
4,303
6,965
9,925
3,182
4,541
5,841
2,776
3,747
4,604
2,571
3,365
4,032
2,447
3,143
3,707
2,365
2,998
3,499
2,306
2,896
3,355
2,262
2,821
3,250
2,228
2,764
3,169
2,201
2,718
3,106
2,179
2,681
3,055
2,160
2,650
3,012
2,145
2,624
2,977
2,131
2,602
2,947
2,120
2,583
2,921
2,110
2,567
2,898
2,101
2,552
2,878
2,093
2,539
2,861
2,086
2,528
2,845
2,080
2,518
2,831
2,074
2,508
2,819
2,069
2,500
2,807
2,064
2,492
2,797
2,060
2,485
2,787
2,056
2,479
2,779
2,052
2,473
2,771
2,048
2,467
2,763
2,045
2,462
2,756
2,042
2,457
2,750
2,040
2,453
2,744
2,037
2,449
2,738
2,035
2,445
2,733
2,032
2,441
2,728
2,030
2,438
2,724
2,021
2,423
2,704
2,009
2,403
2,678

0,002
159,153
15,764
8,053
5,951
5,030
4,524
4,207
3,991
3,835
3,716
3,624
3,550
3,489
3,438
3,395
3,358
3,326
3,298
3,273
3,251
3,231
3,214
3,198
3,183
3,170
3,158
3,147
3,136
3,127
3,118
3,109
3,102
3,094
3,088
3,081
3,055
3,018

0,001
318,309
22,327
10,215
7,173
5,893
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,375
3,365
3,356
3,348
3,340
3,307
3,261

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N(; 2 )

179

T a b e la d a Q u i- Q u a d r a d o
D is t r ib u i o q u i- q u a d r a d o
V a lo r e s c r t ic o s d e c 2 t a is q u e

Pr

g .l.
n

2
n

2
n ;

)=

2
n ;

=
0 ,9 9 0

0 ,9 8 0

0 ,9 7 5

0 ,9 5 0

0 ,9 0 0

0 ,8 0 0

0 ,2 0 0

0 ,1 0 0

0 ,0 5 0

0 ,0 2 5

0 ,0 2 0

0 ,0 1 0

0 ,0 0 0

0 ,0 0 1

0 ,0 0 1

0 ,0 0 4

0 ,0 1 6

0 ,0 6 4

1 ,6 4 2

2 ,7 0 6

3 ,8 4 1

5 ,0 2 4

5 ,4 1 2

6 ,6 3 5

0 ,0 2 0

0 ,0 4 0

0 ,0 5 1

0 ,1 0 3

0 ,2 1 1

0 ,4 4 6

3 ,2 1 9

4 ,6 0 5

5 ,9 9 1

7 ,3 7 8

7 ,8 2 4

9 ,2 1 0

0 ,1 1 5

0 ,1 8 5

0 ,2 1 6

0 ,3 5 2

0 ,5 8 4

1 ,0 0 5

4 ,6 4 2

6 ,2 5 1

7 ,8 1 5

9 ,3 4 8

9 ,8 3 7

1 1 ,3 4 5

0 ,2 9 7

0 ,4 2 9

0 ,4 8 4

0 ,7 1 1

1 ,0 6 4

1 ,6 4 9

5 ,9 8 9

7 ,7 7 9

9 ,4 8 8

1 1 ,1 4 3

1 1 ,6 6 8

1 3 ,2 7 7

0 ,5 5 4

0 ,7 5 2

0 ,8 3 1

1 ,1 4 5

1 ,6 1 0

2 ,3 4 3

7 ,2 8 9

9 ,2 3 6

1 1 ,0 7 0

1 2 ,8 3 3

1 3 ,3 8 8

1 5 ,0 8 6

0 ,8 7 2

1 ,1 3 4

1 ,2 3 7

1 ,6 3 5

2 ,2 0 4

3 ,0 7 0

8 ,5 5 8

1 0 ,6 4 5

1 2 ,5 9 2

1 4 ,4 4 9

1 5 ,0 3 3

1 6 ,8 1 2

1 ,2 3 9

1 ,5 6 4

1 ,6 9 0

2 ,1 6 7

2 ,8 3 3

3 ,8 2 2

9 ,8 0 3

1 2 ,0 1 7

1 4 ,0 6 7

1 6 ,0 1 3

1 6 ,6 2 2

1 8 ,4 7 5

1 ,6 4 6

2 ,0 3 2

2 ,1 8 0

2 ,7 3 3

3 ,4 9 0

4 ,5 9 4

1 1 ,0 3 0

1 3 ,3 6 2

1 5 ,5 0 7

1 7 ,5 3 5

1 8 ,1 6 8

2 0 ,0 9 0

2 ,0 8 8

2 ,5 3 2

2 ,7 0 0

3 ,3 2 5

4 ,1 6 8

5 ,3 8 0

1 2 ,2 4 2

1 4 ,6 8 4

1 6 ,9 1 9

1 9 ,0 2 3

1 9 ,6 7 9

2 1 ,6 6 6

10

2 ,5 5 8

3 ,0 5 9

3 ,2 4 7

3 ,9 4 0

4 ,8 6 5

6 ,1 7 9

1 3 ,4 4 2

1 5 ,9 8 7

1 8 ,3 0 7

2 0 ,4 8 3

2 1 ,1 6 1

2 3 ,2 0 9

11

3 ,0 5 3

3 ,6 0 9

3 ,8 1 6

4 ,5 7 5

5 ,5 7 8

6 ,9 8 9

1 4 ,6 3 1

1 7 ,2 7 5

1 9 ,6 7 5

2 1 ,9 2 0

2 2 ,6 1 8

2 4 ,7 2 5

12

3 ,5 7 1

4 ,1 7 8

4 ,4 0 4

5 ,2 2 6

6 ,3 0 4

7 ,8 0 7

1 5 ,8 1 2

1 8 ,5 4 9

2 1 ,0 2 6

2 3 ,3 3 7

2 4 ,0 5 4

2 6 ,2 1 7

13

4 ,1 0 7

4 ,7 6 5

5 ,0 0 9

5 ,8 9 2

7 ,0 4 2

8 ,6 3 4

1 6 ,9 8 5

1 9 ,8 1 2

2 2 ,3 6 2

2 4 ,7 3 6

2 5 ,4 7 2

2 7 ,6 8 8

14

4 ,6 6 0

5 ,3 6 8

5 ,6 2 9

6 ,5 7 1

7 ,7 9 0

9 ,4 6 7

1 8 ,1 5 1

2 1 ,0 6 4

2 3 ,6 8 5

2 6 ,1 1 9

2 6 ,8 7 3

2 9 ,1 4 1

15

5 ,2 2 9

5 ,9 8 5

6 ,2 6 2

7 ,2 6 1

8 ,5 4 7

1 0 ,3 0 7

1 9 ,3 1 1

2 2 ,3 0 7

2 4 ,9 9 6

2 7 ,4 8 8

2 8 ,2 5 9

3 0 ,5 7 8

16

5 ,8 1 2

6 ,6 1 4

6 ,9 0 8

7 ,9 6 2

9 ,3 1 2

1 1 ,1 5 2

2 0 ,4 6 5

2 3 ,5 4 2

2 6 ,2 9 6

2 8 ,8 4 5

2 9 ,6 3 3

3 2 ,0 0 0

17

6 ,4 0 8

7 ,2 5 5

7 ,5 6 4

8 ,6 7 2

1 0 ,0 8 5

1 2 ,0 0 2

2 1 ,6 1 5

2 4 ,7 6 9

2 7 ,5 8 7

3 0 ,1 9 1

3 0 ,9 9 5

3 3 ,4 0 9

18

7 ,0 1 5

7 ,9 0 6

8 ,2 3 1

9 ,3 9 0

1 0 ,8 6 5

1 2 ,8 5 7

2 2 ,7 6 0

2 5 ,9 8 9

2 8 ,8 6 9

3 1 ,5 2 6

3 2 ,3 4 6

3 4 ,8 0 5

19

7 ,6 3 3

8 ,5 6 7

8 ,9 0 7

1 0 ,1 1 7

1 1 ,6 5 1

1 3 ,7 1 6

2 3 ,9 0 0

2 7 ,2 0 4

3 0 ,1 4 4

3 2 ,8 5 2

3 3 ,6 8 7

3 6 ,1 9 1

20

8 ,2 6 0

9 ,2 3 7

9 ,5 9 1

1 0 ,8 5 1

1 2 ,4 4 3

1 4 ,5 7 8

2 5 ,0 3 8

2 8 ,4 1 2

3 1 ,4 1 0

3 4 ,1 7 0

3 5 ,0 2 0

3 7 ,5 6 6

21

8 ,8 9 7

9 ,9 1 5

1 0 ,2 8 3

1 1 ,5 9 1

1 3 ,2 4 0

1 5 ,4 4 5

2 6 ,1 7 1

2 9 ,6 1 5

3 2 ,6 7 1

3 5 ,4 7 9

3 6 ,3 4 3

3 8 ,9 3 2

22

9 ,5 4 2

1 0 ,6 0 0

1 0 ,9 8 2

1 2 ,3 3 8

1 4 ,0 4 1

1 6 ,3 1 4

2 7 ,3 0 1

3 0 ,8 1 3

3 3 ,9 2 4

3 6 ,7 8 1

3 7 ,6 5 9

4 0 ,2 8 9

23

1 0 ,1 9 6

1 1 ,2 9 3

1 1 ,6 8 9

1 3 ,0 9 1

1 4 ,8 4 8

1 7 ,1 8 7

2 8 ,4 2 9

3 2 ,0 0 7

3 5 ,1 7 2

3 8 ,0 7 6

3 8 ,9 6 8

4 1 ,6 3 8

24

1 0 ,8 5 6

1 1 ,9 9 2

1 2 ,4 0 1

1 3 ,8 4 8

1 5 ,6 5 9

1 8 ,0 6 2

2 9 ,5 5 3

3 3 ,1 9 6

3 6 ,4 1 5

3 9 ,3 6 4

4 0 ,2 7 0

4 2 ,9 8 0

25

1 1 ,5 2 4

1 2 ,6 9 7

1 3 ,1 2 0

1 4 ,6 1 1

1 6 ,4 7 3

1 8 ,9 4 0

3 0 ,6 7 5

3 4 ,3 8 2

3 7 ,6 5 2

4 0 ,6 4 6

4 1 ,5 6 6

4 4 ,3 1 4

26

1 2 ,1 9 8

1 3 ,4 0 9

1 3 ,8 4 4

1 5 ,3 7 9

1 7 ,2 9 2

1 9 ,8 2 0

3 1 ,7 9 5

3 5 ,5 6 3

3 8 ,8 8 5

4 1 ,9 2 3

4 2 ,8 5 6

4 5 ,6 4 2

27

1 2 ,8 7 9

1 4 ,1 2 5

1 4 ,5 7 3

1 6 ,1 5 1

1 8 ,1 1 4

2 0 ,7 0 3

3 2 ,9 1 2

3 6 ,7 4 1

4 0 ,1 1 3

4 3 ,1 9 5

4 4 ,1 4 0

4 6 ,9 6 3

28

1 3 ,5 6 5

1 4 ,8 4 7

1 5 ,3 0 8

1 6 ,9 2 8

1 8 ,9 3 9

2 1 ,5 8 8

3 4 ,0 2 7

3 7 ,9 1 6

4 1 ,3 3 7

4 4 ,4 6 1

4 5 ,4 1 9

4 8 ,2 7 8

29

1 4 ,2 5 6

1 5 ,5 7 4

1 6 ,0 4 7

1 7 ,7 0 8

1 9 ,7 6 8

2 2 ,4 7 5

3 5 ,1 3 9

3 9 ,0 8 7

4 2 ,5 5 7

4 5 ,7 2 2

4 6 ,6 9 3

4 9 ,5 8 8

30

1 4 ,9 5 3

1 6 ,3 0 6

1 6 ,7 9 1

1 8 ,4 9 3

2 0 ,5 9 9

2 3 ,3 6 4

3 6 ,2 5 0

4 0 ,2 5 6

4 3 ,7 7 3

4 6 ,9 7 9

4 7 ,9 6 2

5 0 ,8 9 2

Você também pode gostar