Escolar Documentos
Profissional Documentos
Cultura Documentos
DEPARTAMENTO DE ESTATSTICA
INFERNCIA ESTATSTICA
Outubro 2008
Contedo
1 Inferncia Estatstica - Conceitos Bsicos
1.1 Introduo . . . . . . . . . . . . . . . . . .
1.1.1 Exemplo 1 . . . . . . . . . . . . . .
1.1.2 Exemplo 2 . . . . . . . . . . . . . .
1.2 Populao . . . . . . . . . . . . . . . . . .
1.3 Amostra aleatria simples . . . . . . . . .
1.4 Estatsticas e Parmetros . . . . . . . . . .
1.5 Distribuies Amostrais . . . . . . . . . .
1.6 Propriedades de estimadores . . . . . . . .
1.7 Resumo do Captulo . . . . . . . . . . . .
1.8 Exerccios . . . . . . . . . . . . . . . . . .
1.9 Soluo do Exerccio . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
2
3
3
4
5
10
12
13
19
.
.
.
.
.
.
.
.
.
.
.
22
22
23
24
29
29
32
32
33
34
36
37
.
.
.
.
.
.
.
.
43
43
46
48
49
49
50
51
53
CONTEDO
iii
4 Intervalos de Confiana
4.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Intervalo de confiana: mdia da N(; 2 ), 2 conhecida
4.2.1 Notao . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Interpretao do intervalo de confiana para . .
4.2.3 Lista de Exerccios 1 . . . . . . . . . . . . . . . .
4.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . .
4.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . .
4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Soluo das Listas de Exerccios . . . . . . . . . . . . . .
4.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
56
56
59
59
61
63
63
66
66
67
68
69
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
74
77
80
81
82
. . . . . .
populao
. . . . . .
. . . . . .
. . . . .
normal
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
84
84
85
87
87
89
90
90
91
91
94
96
96
96
100
101
8 Testes de Hipteses
102
8.1 Noes bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
CONTEDO
8.2
8.3
8.4
8.5
8.6
8.7
8.8
iv
8.1.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . .
8.1.4 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . .
8.1.5 Exemplo 5 . . . . . . . . . . . . . . . . . . . . . . .
8.1.6 Exemplo 6 . . . . . . . . . . . . . . . . . . . . . . .
8.1.7 Lista de Exerccios 1 . . . . . . . . . . . . . . . . .
Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . .
8.2.1 Hiptese nula . . . . . . . . . . . . . . . . . . . . .
8.2.2 Hiptese alternativa . . . . . . . . . . . . . . . . .
8.2.3 Estatstica de teste, erros e regra de deciso . . . .
8.2.4 Regio crtica e nvel de significncia . . . . . . . .
8.2.5 Funo caracterstica de operao e poder do teste .
Exemplo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exemplo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . .
Resumo do Captulo . . . . . . . . . . . . . . . . . . . . .
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . .
Soluo das Listas de Exerccios . . . . . . . . . . . . . . .
Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
106
107
108
109
109
110
110
111
111
111
112
113
114
115
116
117
118
121
126
. 127
. 127
. 127
. 127
. 129
. 129
. 130
. 132
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
sobre a mdia
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
134
135
137
137
138
139
139
140
140
141
143
144
CONTEDO
10 Teste de Hiptese: Propores - Amostra Grande
10.1 Contexto bsico . . . . . . . . . . . . . . . . . . . .
10.2 Teste de hipteses sobre propores . . . . . . . . .
10.2.1 Teste bilateral . . . . . . . . . . . . . . . . .
10.2.2 Testes unilaterais . . . . . . . . . . . . . . .
10.3 Valor P . . . . . . . . . . . . . . . . . . . . . . . .
10.4 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . .
10.5 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . .
10.6 Resumo do Captulo . . . . . . . . . . . . . . . . .
10.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . .
10.8 Soluo dos Exerccios . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
149
. 149
. 150
. 151
. 152
. 152
. 152
. 153
. 154
. 155
. 156
Captulo 1
Inferncia Estatstica - Conceitos
Bsicos
No estudo de mtodos estatsticos, j foi visto como resumir um conjunto de dados
atravs de tabelas de freqncias, grficos e medidas de posio e disperso. Depois,
foram estudados modelos probabilsticos, discretos ou contnuos, para descrever determinados fenmenos. Agora, essas ferramentas sero utilizadas no estudo de um importante
ramo da Estatstica, conhecido como Inferncia Estatstica, que busca mtodos de fazer
afirmaes sobre caractersticas de uma populao, conhecendo-se apenas resultados de
uma amostra.
Neste captulo voc estudar os seguintes conceitos:
populao e amostra
amostra aleatria simples
estatsticas e parmetros
estimador
distribuio amostral de um estimador
1.1
Introduo
1.1.1
Exemplo 1
Em um estudo antropomtrico em nvel nacional, uma amostra de 5000 adultos selecionada dentre os adultos brasileiros e uma das variveis de estudo a altura.
Neste exemplo, a populao o conjunto de todos os brasileiros adultos. No entanto, o interesse (um deles, pelo menos) est na altura dos brasileiros. Assim, nesse
estudo, a cada sujeito da populao associamos um nmero correspondente sua altura.
Se determinado sujeito sorteado para entrar na amostra, o que nos interessa esse
nmero, ou seja, sua altura. Como vimos, essa a definio de varivel aleatria: uma
funo que associa a cada ponto do espao amostral um nmero real. Dessa forma, a
nossa populao pode ser representada pela varivel aleatria X = altura do adulto
brasileiro. Como essa uma v.a. contnua, a ela est associada uma funo de densidade de probabilidade f e da literatura, sabemos que razovel supor que essa densidade
seja a densidade normal. Assim, nossa populao, nesse caso, representada por uma
v.a. X N (; 2 ). Conhecendo os valores de e teremos informaes completas
sobre a nossa populao.
Uma forma de obtermos os valores de e medindo as alturas de todos os
brasileiros adultos. Mas esse seria um procedimento caro e demorado. Uma soluo,
ento, retirar uma amostra (subonjunto) da populao e estudar essa amostra. Suponhamos que essa amostra seja retirada com reposio e que os sorteios sejam feitos de
forma independente, isto , o resultado de cada extrao no altera o resultado das demais extraes. Ao sortearmos o primeiro elemento, estamos realizando um experimento
que d origem v.a. X1 =altura do primeiro elemento; o segundo elemento d origem
v.a. X2 =altura do segundo elemento e assim por diante. Como as extraes so
feitas com reposio, todas as v.a. X1 , X2 , . . . tm a mesma distribuio, que reflete
a distribuio da altura de todos os brasileiros adultos. Para uma amostra especfica,
temos os valores observados x1 , x2 , . . . dessas variveis aleatrias.
1.1.2
Exemplo 2
Consideremos, agora, um exemplo baseado em pesquisas eleitorais, em que estamos interessados no resultado do segundo turno de uma eleio presidencial brasileira. Mais
uma vez, nossos sujeitos de pesquisa so pessoas com 16 anos ou mais, aptas a votar. O
interesse final saber a proporo de votos de um e outro candidato. Vamos considerar
uma situao simplificada em que no estamos considerando votos nulos, indecisos, etc.
Ento, cada sujeito de pesquisa d origem a uma varivel aleatria binria, isto , uma
v.a. que assume apenas dois valores. Como visto, podemos representar esses valores por
1 (candidato A) e 0 (candidato B), o que define uma varivel aleatria de Bernoulli, ou
seja, essa populao pode ser representada pela v.a. X Bern(p). O parmetro p representa a probabilidade de um sujeito dessa populao votar no candidato A. Uma outra
interpretao que p representa a proporo populacional de votantes no candidato A.
Para obtermos informao sobre p, retira-se uma amostra da populao e, como
antes, vamos supor que essa amostra seja retirada com reposio. Ao sortearmos o
primeiro elemento, estamos realizando um experimento que d origem v.a. X1 =voto
1.2
Populao
1.3
1.4
Estatsticas e Parmetros
Obtida uma aas, possvel calcular diversas caractersticas desta amostra, como, por
exemplo, a mdia, a mediana, a varincia, etc. Qualquer uma destas caractersticas
uma funo de X1 , X2 , ..., Xn e, portanto, o seu valor depende da amostra sorteada.
Sendo assim, cada uma dessas caractersticas ou funes tambm uma v.a. . Por
exemplo, a mdia amostral a v.a. definida por
X=
X1 + X2 + + Xn
n
X=
varincia amostral
S2 =
X1 + X2 + + Xn
n
n
2
1 P
Xi X
n 1 i=1
(1.1)
(1.2)
Para uma amostra especfica, o valor obido para o estimador ser denominado estimativa e, em geral, sero representadas por letras minsculas. Por exemplo, temos as
seguintes notaes correspondentes mdia amostral e varincia: x e s2 .
Outras estatsticas possveis so o mnimo amostral, o mximo amostral, a amplitude
amostral, etc.
De forma anloga, temos as caractersticas de interesse da populao. No entanto,
para diferenciar entre as duas situaes (populao e amostra), atribuimos nomes diferentes.
Definio 1.4 Um parmetro uma caracterstica da populao.
Assim, se a populao representada pela v.a. X, alguns parmetros so a esperana
E(X) e a varincia V ar(X) de X.
Com relao s caractersticas mais usuais, vamos usar a seguinte notao:
Caracterstica
Parmetro Estatstica
(populao) (amostra)
Mdia
X
Varincia
2
S2
Nmero de elementos
N
n
Lembre-se que, para uma v.a. discreta (finita) uniforme,
= E(X) =
V ar(X) =
1.5
N
1 P
Xi
N i=1
N
N
N
1 P
1 P
1 P
[Xi E(X)]2 =
[Xi ]2 =
Xi2 2
N i=1
N i=1
N i=1
Distribuies Amostrais
Nos problemas de inferncia, estamos interessados em estimar um parmetro da populao (por exemplo, a mdia populacional) atravs de uma aas X1 , X2 , ..., Xn . Para isso,
usamos uma estatstica T (por exemplo, a mdia amostral) e, com base no valor obtido
para T a partir de uma particular amostra, iremos tomar as decises que o problema
exige. J foi dito que T uma v.a., uma vez que depende da amostra sorteada; amostras
diferentes fornecero diferentes valores para T .
Consideremos o seguinte exemplo, onde nossa populao o conjunto {1, 3, 6, 8}, isto
, este o conjunto dos valores da caracterstica de interesse da populao em estudo.
Assim, para esta populao, ou seja, para essa v.a. X temos
E(X) = =
V ar(X) = 2 =
= 7, 25
1
(1 + 3 + 6 + 8) = 4, 5
4
1
(1 4, 5)2 + (3 4, 5)2 + (6 4, 5)2 + (8 4, 5)2
4
Suponha que dessa populao iremos extrair uma aas de tamanho 2 e a estatstica
que iremos calcular a mdia amostral. Algumas possibilidades de amostra so {1,1},
{1,3}, {6,8}, para as quais os valores da mdia amostral so 1, 2 e 7, respectivamente.
Podemos ver, ento, que h uma variabilidade nos valores da estatstica e, assim, seria
interessante que conhecssemos tal variabilidade. Conhecendo tal variabilidade, temos
condies de saber quo infelizes podemos ser no sorteio da amostra. No exemplo
acima, as amostras {1,1} e {8,8} so as que tm mdia amostral mais afastada da
verdadeira mdia populacional. Se esses valores tiverem chance muito mais alta do que
os valores mais prximos de E(X), podemos ter srios problemas.
Para conhecer o comportamento da mdia amostral, teramos que conhecer todos
os possveis valores de X, o que equivaleria a conhecer todas as possveis amostras de
tamanho 2 de tal populao. Nesse exemplo, como s temos 4 elementos na populao,
a obteno de todas as aas de tamanho 2 no difcil.
Lembre-se do nosso estudo de anlise combinatria: como o sorteio feito com
reposio, em cada um dos sorteios temos 4 possibilidades. Logo, o nmero total de
amostras aleatrias simples 4 4 = 16. Por outro lado, em cada sorteio, cada elemento da populao tem a mesma chance de ser sorteado; como so 4 elementos, cada
elemento tem probabilidade 1/4 de ser sorteado. Finalmente, como os sorteios so independentes, para obter a probabilidade de um par de elementos pertencer amostra
basta multiplicar as probabilidades (lembre-se que Pr(A B) = Pr(A) Pr(B) quando
A e B so independentes). A independncia dos sorteios garantida pela reposio de
cada elemento sorteado. Na Tabela 1.1 a seguir listamos todas as possveis amostras,
com suas respectivas probabilidades e para cada uma delas, apresentamos o valor da
mdia amostral.
Analisando esta tabela, podemos ver que os possveis valores X so 1; 2; 3; 3,5; 4,5;
5,5; 6; 7; 8 e podemos construir a sua funo de distribuio de probabilidade, notando,
por exemplo, que o valor 2 pode ser obtido atravs de duas amostras: (1,3) ou (3,1).
Como essas amostras correspondem a eventos mutuamente exclusivos, a probabilidade
de se obter uma mdia amostral igual a 2
Pr(X = 2) = Pr({1, 3} {3, 1})
= Pr({1, 3}) + Pr({3, 1})
1
1
2
=
+
=
16 16
16
Probabilidade
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
(1/4) (1/4) = 1/16
Mdia amostral x
(1 + 1)/2 = 1
(1 + 3)/2 = 2
(1 + 6)/2 = 3, 5
(1 + 8)/2 = 4, 5
(3 + 1)/2 = 2
(3 + 3)/2 = 3
(3 + 6)/2 = 4, 5
(3 + 8)/2 = 5, 5
(6 + 1)/2 = 3, 5
(6 + 3)/2 = 4, 5
(6 + 6)/2 = 6
(6 + 8)/2 = 7
(8 + 1)/2 = 4, 5
(8 + 3)/2 = 5, 5
(8 + 6)/2 = 7
(8 + 8)/2 = 8
E(X) = 1
e
1
2
1
+ (2 4, 5)2
+ (3 4, 5)2
16
16
16
2
5
2
+(3, 5 4, 5)2
+ (4, 5 4, 5)2
+ (5, 5 4, 5)2
16
16
16
1
2
1
+ (7 4, 5)2
+ (8 4, 5)2
+(6 4, 5)2
16
16
16
2
2
7, 25
=
=
= 3, 625 =
2
2
n
V ar(X) = (1 4, 5)2
Neste exemplo podemos ver que E(X) = e V ar(X) = 2 /2, onde 2 o tamanho
da amostra. Esses resultados esto nos dizendo que, em mdia (esperana), a estatstica
0,4
0,3
0,2
0,1
0
0
(a)
0,4
0,3
0,2
0,1
0
0
(b)
b2 =
n
2
1P
Xi X
n i=1
(1.3)
Da mesma forma que fizemos para a mdia amostral, vamos calcular o valor
dessas estatsticas para cada uma das amostras. Na Tabela 1.2 temos os resultados
parciais e globais de interesse.
(x1 x)2
(x2 x)2
(1, 1)
(1, 3)
(1, 6)
(1, 8)
(3, 1)
(3, 3)
(3, 6)
(3, 8)
(6, 1)
(6, 3)
(6, 6)
(6, 8)
(8, 1)
(8, 3)
(8, 6)
(8, 8)
1
2
3, 5
4, 5
2
3
4, 5
5, 5
3, 5
4, 5
6
7
4, 5
5, 5
7
8
(1 1)2
(1 2)2
(1 3, 5)2
(1 4, 5)2
(3 2)2
(3 3)2
(3 4, 5)2
(3 5, 5)2
(6 3, 5)2
(6 4, 5)2
(6 6)2
(6 7)2
(8 4, 5)2
(8 5, 5)2
(8 7)2
(8 8)2
(1 1)2
(3 2)2
(6 3, 5)2
(8 4, 5)2
(1 2)2
(3 3)2
(6 4, 5)2
(8 5, 5)2
(1 3, 5)2
(3 4, 5)2
(6 6)2
(8 7)2
(1 4, 5)2
(3 5, 5)2
(6 7)2
(8 8)2
2
P
(xi x)2
S2
i=1
0
2
12, 5
24, 5
2
0
4, 5
12, 5
12, 5
4, 5
0
2
24, 5
12, 5
2
0
b2
0
0
2
1
12, 5 6, 25
24, 5 12, 25
2
1
0
0
4, 5 2, 25
12, 5 6, 25
12, 5 6, 25
4, 5 2, 25
0
0
2
1
24, 5 12, 25
12, 5 6, 25
2
1
0
0
k
0
1
2, 25 6, 25 12, 25
2
Pr(b
= k) 4/16 4/16 2/16 4/16 2/16
4
2
4
2
4
+2
+ 4, 5
+ 12, 5
+ 24, 5
16
16
16
16
16
116
= 7, 25 = 2 = V ar(X)
16
e
E(b
2) = 0
=
4
2
4
2
4
+1
+ 2, 25
+ 6, 25
+ 12, 25
16
16
16
16
16
58
= 3, 625
16
10
1.6
Propriedades de estimadores
11
Na Figura 1.2, o estimador da parte (a) mais eficiente que o estimador da parte
(b).
12
Uma outra propriedade dos estimadores est relacionada idia bastante intuitiva
de que medida que se aumenta o tamanho da amostra, mais perto devemos ficar do
verdadeiro valor do parmetro.
Definio 1.8 Uma seqncia {Tn } de estimadores de um prmetro consistente se,
para todo > 0
lim Pr {|Tn | > } = 0
n
lim V ar(Tn ) = 0
1.7
Resumo do Captulo
Ao final deste captulo, voc dever ser capaz de compreender perfeitamente os seguintes
conceitos:
A populao de uma pesquisa estatstica descrita por uma varivel aleatria X,
que descreve a caracterstica de interesse. Essa varivel aleatria pode ser discreta
ou contnua.
O mtodo de amostragem aleatria simples atribui, a cada amostra de tamanho
n, igual probabilidade de ser sorteada. Se os sorteios dos elementos da amostra
so feitos com reposio, cada sujeito da populao tem a mesma probabilidade
de ser sorteado e essa probabilidade se mantm constante. Dessa forma, uma
amostra aleatria simples com reposio (abreviaremos por aas nesse texto) de uma
populao X um conjunto X1 , X2 , . . . , Xn de variveis aleatrias independentes
e identicamente distribudas, todas com a mesma distribuio da populao X.
Uma estatstica ou estimador T qualquer funo de X1 , X2 , . . . , Xn , isto , T =
g(X1 , X2 , . . . , Xn ). Como o estimador depende da amostra sorteada, ele tambm
uma varivel aleatria. Os estimadores descrevem caractersticas da amostra.
Um parmetro uma caracterstica da populao.
As caractersticas que iremos estudar so a mdia ( e X) e a varincia ( 2 e S 2 ).
Como cada estimador uma varivel aleatria, ele pode ser descrito pela sua funo
de distribuio, que chamada distribuio amostral do estimador. A distribuio
amostral de um estimador a distribuio ao longo de todas as possveis amostras
de mesmo tamanho n.
13
1.8
Exerccios
Para fixar as idias sobre os conceitos apresentados nesta aula, voc ir trabalhar com
amostras aleatrias simples de tamanho 3 retiradas da populao {1, 2, 4, 6, 8}. Pelo
princpio da multiplicao, o nmero total de amostras 5 5 5 = 125 e cada uma
1
dessas amostras tem probabilidade 15 15 15 = 125
. Iremos considerar os seguintes
estimadores para a mdia da populao:
mdia amostral:
X=
X1 + X2 + X3
3
Xp =
X1 + 2X2 + X3
4
ponto mdio
=
min(X1 , X2 , X3 ) + max(X1 , X2 , X3 )
2
14
2. Nas cinco tabelas a seguir, voc tem listadas as 125 amostras. Para cada uma
das amostras, calcule os valores dos estimadores. Para as 6 primeiras amostras os
clculos j esto feitos, a ttulo de ilustrao. Voc no precisa indicar todas as
contas; apenas use a mquina de calcular e anote o resultado obtido.
3. Obtenha a funo de distribuio de probabilidade, explicitando os diferentes valores de cada um dos estimadores e suas respectivas probabilidades
4. Calcule a esperana e a varincia de cada um dos estimadores.
5. Verifique as afirmativas feitas no enunciado do problema.
Amostra
X1 X2 X3
1
1
1
1
1
2
1
1
4
1
1
6
1
1
8
1
2
1
1
2
2
1
2
4
1
2
6
1
2
8
1
4
1
1
4
2
1
4
4
1
4
6
1
4
8
1
6
1
1
6
2
1
6
4
1
6
6
1
6
8
1
8
1
1
8
2
1
8
4
1
8
6
1
8
8
X
1+1+1
=1
3
1+1+2
= 43
3
1+1+4
=2
3
1+1+6
= 83
3
1+1+8
= 10
3
3
1+2+1
4
=
3
3
Estimador
Xp
1+21+1
=1
4
1+21+2
= 54
4
1+21+4
= 74
4
1+21+6
= 94
4
1+21+8
= 11
4
4
1+22+1
6
=
4
4
=1
= 32
= 52
= 72
= 92
= 32
1+1
2
1+2
2
1+4
2
1+6
2
1+8
2
1+2
2
Estimador
Xp
15
Estimador
Xp
16
Estimador
Xp
17
Estimador
Xp
18
1.9
19
Soluo do Exerccio
=
2
1575
= 4, 2 =
375
2
22305
6, 56
(4, 2)2 = 2, 186667 =
=
9 125
3
3
40200
(4.2)2 = 2, 46
16 125
20
21
1062
= 4, 248
250
9952
(4, 248)2 = 1, 858496
4 125
Na tabela a seguir apresentamos o resumo dos resultados obtidos.
V ar() =
Parmetro
Estimador
populacional
X
Xp
Mdia
= 4, 2 4, 2000 4, 2000 4, 2480
2
Varincia
= 6, 56 2, 1867 2, 4600 1, 8585
Conclui-se que X e X p so estimadores no-viesados de e que X mais eficiente
que X p , uma vez que V ar(X) < V ar(X p ).
O estimador viesado, pois E() 6= . No entanto, a varincia desse estimador
menor que as varincias dos dois estimadores no-viesados. vezes, na prtica, podemos
trabalhar com estimadores viesados com varincia pequena, desde que o vis no seja
muito grande.
Captulo 2
Distribuio Amostral da Mdia
Neste captulo voc ir aprofundar seus conhecimentos sobre a distribuio amostral da
mdia amostral. No captulo anterior analisamos, atravs de alguns exemplos, o comportamento da mdia amostral; mas naqueles exemplos, a populao era pequena e foi
possvel obter todas as amostras, ou seja, foi possvel obter a distribuio amostral exata. Veremos agora resultados tericos sobre a distribuio amostral da mdia amostral,
que nos permitiro fazer anlises sem ter que listar todas as amostras.
Os principais resultados que estudaremos so:
mdia e varincia da distribuio amostral da mdia
distribuio amostral da mdia para populaes normais
Teorema Limite Central
distribuio amostral da varincia amostral
2.1
No captulo anterior, vimos, atravs de exemplos, que a mdia amostral X um estimador no-viesado da mdia populacional . Na verdade, temos o seguinte resultado
geral.
Teorema 2.1 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de uma
populao representada pela varivel aleatria X com mdia e varincia 2 . Ento,
E(X) =
2
V ar(X) =
n
Demonstrao:
22
(2.1)
(2.2)
23
1
X1 + X2 + + Xn
= E(X1 + X2 + + Xn )
E(X) = E
n
n
1
[E(X1 ) + E(X2 ) + + E(Xn )]
=
n
1
1
=
( + + + ) = n =
n
n
X1 + X2 + + Xn
n
1
= 2 V ar(X1 + X2 + + Xn )
V ar(X) = V ar
n
"
#
P
1
= 2 V ar(X1 ) + V ar(X2 ) + + V ar(Xn ) + Cov(Xi , Xj )
n
i6=j
1
2
1 2
2
2
2
= 2 + + + + 0 = 2 n =
n
n
n
2.2
Na prtica estatstica, vrias populaes podem ser descritas, pelo menos aproximadamente, por uma distribuio normal. Obviamente, o teorema anterior continua valendo
no caso de uma populao normal, mas temos uma caracterstica a mais da distribuio
amostral da mdia: ela tambm normal.
Teorema 2.2 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de
uma populao normal, isto , uma populao representada por uma varivel aleatria
24
2
2
X N ; = X N ;
n
Na Figura 2.1 ilustra-se o comportamento da distribuio amostral da mdia amostral
com base em amostras de tamanho n = 4 para uma populao normal com mdia 2 e varincia 9. A ttulo de comparao, apresenta-se a a distribuio populacional. Podemos
ver que ela mais dispersa que a distribuio amostral de X, mas ambas esto centradas
no verdadeiro valor populacional = 2.
0,3
X ~ N (2 ; 9 4 )
0,2
X ~ N ( 2;9 )
0,1
0,0
-8
-6
-4
-2
10
12
2.3
Exemplos
25
i=1
Xi > 500
7
1P
500
Xi >
X > 71, 729
7 i=1
7
100
X N 70;
7
Logo,
X 70
71, 729 70
q
Pr(X > 71, 729) = Pr q
>
100
7
100
7
83.333 70
500
q
= Pr Z >
Pr X >
6
100
6
Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoas
ultrapassarem o limite de segurana. J com 6 pessoas, essa probabilidade bastante
pequena. Assim, o nmero mximo de pessoas no elevador deve ser estabelecido como
6 ou menos.
Exemplo 2.2 Uma v.a. X tem distribuio normal com mdia 100 e desvio padro 10.
1. Calcule Pr(90 < X < 110)
2. Se X a mdia de uma amostra aleatria simples de 16 elementos retirados dessa
populao, calcule Pr(90 < X < 110).
3. Construa, num nico sistema de coordenadas, os grficos das distribuies de X e
X.
4. Que tamanho deveria ter a amostra para que Pr(90 < X < 110) = 0, 95?
Soluo
1.
Pr(90 < X < 110) =
=
=
=
110 100
90 100
<Z<
Pr
10
10
Pr(1 < Z < 1)
2 Pr(0 < Z < 1)
2 tab(1, 0) = 0, 68268
26
90 100
110 100
Pr(90 < X < 110) = Pr q
<Z< q
100
16
100
16
N(100,100/16)
0,10
0,08
N(100,100)
0,06
0,04
0,02
0,00
60
70
80
90
100
110
120
130
140
110 100
90 100
<Z< q
Pr q
= 0, 95
100
n
100
n
2 tab( n) = 0, 95
tab( n) = 0, 475
n = 1, 96
n4
27
N(100;100/16)
0,12
0,1
0,08
0,06
N(100;100/4)
0,04
0,02
0
60
70
80
90
100
110
120
130
140
X
500
Pr
<
= 0, 10
10
10
500
= 0, 10
Pr Z <
10
temos que ter
Ento, na densidade normal padro, esquerda da abscissa 500
10
uma rea (probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Us-
28
500
Pr Z <
= 0, 10
10
500
Pr Z >
= 0, 10
10
500
= 0, 10
Pr Z >
10
500
Pr 0 Z
= 0, 40
10
500
tab
= 0, 40
10
500
= 1, 28
10
= 512, 8 g
Veja a Figura 2.4 onde so ilustradas essas equivalncias.
4
P
i=1
Xi <
29
X 512, 8
500 512, 8
q
<
Pr(X < 500) = Pr q
100
4
=
=
=
=
=
=
100
4
2.3.1
Lista de Exerccios 1
2.4
30
N(0, 1)
31
n=10
n=50
1800
1600
1600
1400
1400
1200
Frequency
Frequency
1200
1000
800
1000
800
600
600
400
400
200
200
0
0,261
0,761
1,261
1,761
0
0,604
2,261
0,804
n=100
1,204
1,404
1,604
n=250
1400
1600
1200
1400
1200
Frequency
1000
Frequency
1,004
800
600
1000
800
600
400
400
200
0
0,690
200
0,790
0,890
0,990
1,090
1,190
1,290
0
0,804
0,854
0,904
0,954
1,004
1,054
1,104
1,154
1,204
Figura 2.5: Ilustrao do Teorema Limite Central para uma populao X exp(1)
32
X 0, 5
0, 72 0, 5
q
Pr(X 0, 72) = Pr
1
200
200
Note que essa probabilidade bastante pequena, ou seja, h uma pequena probabilidade
de obtermos 36 ou mais caras em um lanamento de uma moeda honesta. Isso pode nos
levar a suspeitar sobre a honestidade da moeda!
2.4.1
Lista de Exerccios 2
1. O fabricante de uma lmpada especial afirma que o seu produto tem vida mdia
de 1600 horas, com desvio padro de 250 horas. O dono de uma empresa compra
100 lmpadas desse fabricante. Qual a probabilidade de que a vida mdia dessas
lmpadas ultrapasse 1650 horas?
2.5
Teorema 2.4 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples extrada de uma populao com N elementos e varincia populacional
2 =
onde =
1
N
N
P
i=1
N
1 P
(Xi )2
N i=1
1
n1
n
P
(Xi X)2
i=1
33
Demonstrao
n
P
(Xi X)2 =
i=1
n
P
(Xi + X)2 =
2
P
(Xi ) X
i=1
n
P
(Xi )2 +
i=1
n
P
(Xi )2 + n X 2 X nX n
i=1
n
P
n
P
i=1
i=1
n
2
P
X 2 (Xi ) X
i=1
P
(Xi )2 + n X 2 X
(Xi )
=
i=1
i=1
n
P
P
2
=
(Xi ) + n X 2 X
Xi n
i=1
n
P
i=1
Da segue que
i=1
2
(Xi )2 n X
n
n
2
P
1
1 P
2
2
E(S ) = E
(Xi X) =
(Xi ) n X
E
n 1 i=1
n1
i=1
2
P
1
2
=
E (Xi ) nE X
n 1 i=1
2
Mas como = E(Xi ) = E(X) e E (Xi )2 = V ar(Xi ) = 2 e E X = V ar(X)
resulta que
n
P
1
2
E(S ) =
V ar(Xi ) nV ar(X)
n 1 i=1
n
P 2
1
2
=
n
n 1 i=1
n
1 2
=
n 2
n1
= 2
2
2.6
Resumo do Captulo
34
2
2
X N ; = X N ;
n
e
V ar(S 2 ) =
2 4
n1
ou
2.7
N(0, 1)
X
N(0, 1)
n
Exerccios
35
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam inferiores a 1 unidade?
5. Uma fbrica produz parafusos especiais, para atender um determinado cliente,
que devem ter comprimento de 8,5 cm. Como os parafusos grandes podem ser
reaproveitados a um custo muito baixo, a fbrica precisa controlar apenas a proporo de parafusos pequenos. Para que o processo de produo atinja o lucro
mnimo desejvel, necessrio que a proporo de parafusos pequenos seja no
mximo de 5%.
(a) Supondo que a mquina que produz os parafusos o faa de modo que os
comprimentos tenham distribuio normal com mdia e desvio padro de
1,0 cm, em quanto deve ser regulada a mquina para satisfazer as condies
de lucratividade da empresa?
(b) Para manter o processo sob controle, programada uma carta de qualidade.
A cada hora ser sorteada uma amostra de 4 parafusos e, se o comprimento
mdio dessa amostra for menor que 9,0 cm, o processo de produo interrompido para uma nova regulagem da mquina. Qual a probabilidade de
uma parada desnecessria?
36
2.8
Lista de Exerccios 1
1. Seja X = comprimento das peas; ento X N(172; 25) e n = 16
(a)
Pr(169 X 175) = Pr
X 172
169 172
175 172
q
q
q
25
16
25
16
25
16
= Pr(2, 4 Z 2, 4) = 2 Pr(0 Z 2, 4)
= 2 tab(2, 4) = 2 0, 4918 = 0, 9836
(b)
= Pr(Z > 4, 8) 0
178 172
q
25
16
(c)
165 172
q
= Pr(Z < 5, 6) 0
25
16
37
2. Temos que X N(150; 132 ) e queremos determinar n para que Pr( X <
6, 5) = 0, 95.
6, 5
6, 5
X 150
= 0, 95
Pr 13 <
< 13
13
tab(0, 5 n) = 0, 475
0, 5 n = 1, 96
1, 96
n=
= 3, 92
0, 5
n = (3, 92)2 16
Lista de Exerccios 2
1. Podemos aceitar que as 200 lmpadas compradas sejam uma amostra aleatria
simples da populao referente s lmpadas produzidas por esse fabricante. Como
n = 100 um tamanho suficientemente grande
podemos usar o teo
de amostra,
2502
rema limite central , que nos diz que X N 1600; 100 . Logo
=
=
=
=
2.9
Pr(Z > 2, 0)
0, 5 Pr(0 Z 2)
0, 5 tab(2, 0)
0, 5 0, 47725 = 0, 02275
2
1. X N 15; 2,5
18
2502
100
2502
100
38
(a)
=
=
=
=
14, 5 15
16 15
Pr(14, 5 X 16) = Pr q
Z q
2,52
18
2,52
18
Pr(0, 85 Z 1, 70)
Pr(0, 85 Z 0) + Pr(0 < Z 1, 70)
Pr(0 Z 0, 85) + Pr(0 Z 1, 70)
tab(0, 85) + tab(1, 70) = 0, 75777
(b)
16, 1 15
q
2,52
18
2. X N(512, 8; 100)
(a) Parada desnecessria: amostra indica que o processo est fora de controle
(X < 497 ou X > 520), quando, na verdade, o processo est ajustado ( =
512, 8). Neste caso, podemos usar a notao de probabilidade condicional
para auxiliar na soluo do exerccio. Queremos calcular
=
Pr X < 497 X > 520 | X N 512, 8; 100
4
497 512, 8
520 512, 8
= Pr Z <
+ Pr Z >
5
5
= Pr(Z < 3, 16) + Pr(Z > 1, 44)
= Pr(Z > 3, 16) + Pr(Z > 1, 44)
= [0, 5 Pr(0 Z 3, 16)] + [0, 5 Pr(0 Z 1, 44)]
= 0, 5 tab(3, 16) + 0, 5 tab(1, 44)
= 1, 0 0, 49921 0, 42507
= 0, 07572
39
=
=
=
=
=
=
497 500
520 500
Pr
Z
5
5
Pr(0, 6 Z 4)
Pr(0, 6 Z < 0) + Pr(0 Z 4)
Pr(0 Z 0, 6) + Pr(0 Z 4)
tab(0, 6) + tab(4, 0)
0, 72572
Pr(E1 ) =
=
=
=
=
=
=
Pr(E2 ) =
=
=
=
=
=
16
Pr X 23|X N 25;
16
23 25
Pr Z
1
Pr(Z 2)
Pr(Z 2) =
0, 5 tab(2, 0)
0, 5 0, 47725
0, 02275
16
Pr X > 23|X N 20;
16
23 20
Pr Z >
1
Pr(Z > 3)
0, 5 tab(3, 0)
0, 5 0, 49865
0, 00135
40
4. Note que e igual a X menos uma constante e sabemos que E(X) = e V ar(X) =
2
.
n
(a) Das propriedades da mdia e da varincia, resulta que
E(e) = E(X) = = 0
2
V ar(e) = V ar(X) =
n
(b) X N(; 202 ) e n = 100. Queremos
Pr(|e| > 2) = Pr(e < 2) + Pr(e > 2)
= Pr(X < 2) + Pr(X > 2)
X
X
2
2
< 20 + Pr
> 20
= Pr
20
20
10
=
=
=
=
=
10
10
10
(c)
Pr(|e| > ) = 0, 01
Pr(e < ) + Pr(e > ) = 0, 01
Pr(X < ) + Pr(X > ) = 0, 01
X
X
< 20 + Pr
> 20 = 0, 01
Pr
20
20
10
10
10
10
Pr Z <
+ Pr Z >
= 0, 01
2
2
= 0, 01
2 Pr Z >
2
Pr Z >
= 0, 005
2
= 0, 005
0, 5 Pr 0 Z
2
Pr 0 Z
= 0, 495
2
tab
= 0, 495
2
= 2, 58 = 5, 16
2
41
(d)
Pr (|e| < 1) = 0, 95
Pr(1 < X < 1) = 0, 95
!
1
1
Pr 20 < Z < 20 = 0, 95
Pr
1
20
<Z<0
2 Pr 0 Z <
Pr 0 Z <
1
20
1
20
+ Pr 0 Z <
1
20
= 0, 95
= 0, 95
= 0, 475
n
= 1, 96
20
n = 39, 2 n 1537
8, 5
Pr Z <
= 0, 05
1
8, 5
Pr Z >
= 0, 05
1
Pr(0 Z 8, 5) = 0, 45
8, 5 = 1, 64
= 10, 14
(b) Parada desnecessria: amostra indica processo fora de controle (X < 9),
42
1
Pr X < 9 | X N 10, 14;
4
9 10, 14
= Pr Z <
0, 5
= Pr(Z < 2, 28)
= Pr(Z > 2, 28)
= 0, 5 Pr(0 Z 2, 28)
= 0, 5 tab(2, 28)
= 0, 5 0, 4887 = 0, 0113
(c) Mquina desregulada: X > 9; processo operando sem ajuste: X N (9, 5; 1)
1
Pr X > 9 | X N 9, 5;
4
9 9, 5
= Pr Z >
0, 5
= Pr(Z > 1)
= Pr(1 < Z < 0) + Pr(Z 0)
= Pr(0 < Z < 1) + Pr(Z 0)
= tab(1, 0) + 0, 5
= 0, 841314
6. Afirmativa do gerente: = 2 e = 0,05. Como n = 100, podemos usar o teorema
2
.
limite central . Logo, X N 2; 0,05
100
Pr(X 1, 985) = Pr Z
=
=
=
=
1, 985 2
0,05
10
Pr(Z 3, 0)
Pr(Z 3, 0)
0, 5 tab(3, 0)
0, 5 0, 49865 = 0, 00135
A probabilidade de se obter esse valor nas condies dadas pelo gerente muito
pequena, o que pode nos fazer suspeitar da veracidade das afirmativas. provvel
que, ou a mdia no seja 2 (e, sim, menor que 2), ou o desvio padro no seja 0,05
(e, sim, maior que 0,05). Esboce grficos da normal para compreender melhor esse
comentrio!
Captulo 3
Distribuio Amostral da Proporo
Neste captulo voc ver uma importante aplicao do Teorema Limite Central: iremos
estudar a distribuio amostral de propores. Assim, voc ver os resultados referentes
aproximao da distribuio binomial pela distribuio normal, que nos permitir fazer
inferncia sobre propores.
Voc ver os seguintes resultados:
aproximao da binomial pela normal
correo de continuidade
distribuio amostral da proporo amostral
3.1
44
0,20
0,15
0,10
0,05
0,00
0
10
11
12
Y 6
7, 5 6
Pr(X 8) Pr(Y 7, 5) = Pr
3
3
= Pr(Z 0, 87)
= 0, 5 tab(0, 87)
= 0, 5 0, 30785
= 0, 19215
O valor exato, calculado pela distribuio binomial, Pr(X 8) = 0, 1938.
45
Vamos, agora, calcular Pr(X > 10). Isso equivale rea dos 2 retngulos superiores,
centrados em 11 e 12 (este ltimo no visvel, pois Pr(X = 12) = 0, 000244); logo,
pela distribuio normal temos que calcular Pr(Y 10, 5) :
Y 6
10 6
Pr(X > 10) Pr(Y 10, 5) = Pr
3
3
= Pr(Z 2, 31)
= 0, 5 tab(2, 31)
= 0, 5 0, 48956
= 0, 01044
Se queremos Pr(X < 5), isso equivale s reas dos 4 retngulos inferiores e, portanto
Y 6
56
Pr(X < 5) Pr(Y 4, 5) = Pr
3
3
= Pr(Z 0, 58)
= Pr(Z 0, 58)
= 0, 5 tab(0, 58)
= 0, 5 0, 21904
= 0, 28096
Se queremos Pr(4 X < 8), temos a seguinte aproximao:
Pr(4 X < 8) Pr(3, 5 Y 7, 5)
7, 5 6
3, 5 6
Z
= Pr
3
3
= Pr(1, 44 Z 0, 87)
= Pr(1, 44 Z 0) + Pr(0 Z 0, 87)
= Pr(0 Z 1, 44) + Pr(0 Z 0, 87)
= tab(1, 44) + tab(0, 87)
= 0, 42507 + 0, 30785
= 0, 73292
interessante observar que para uma varivel binomial faz sentido calcular Pr(X =
k); no caso da normal, essa probabilidade nula, qualquer que seja k. Para usar a
aproximao normal para calcular, por exemplo, Pr(X = 5), devemos notar que essa
probabilidade equivale rea do retngulo centrado em 5 e, em termos da curva normal,
46
4, 5 6
5, 5 6
= Pr
Z
3
3
= Pr(0, 87 Z 0, 29)
= Pr(0, 29 Z 0, 87)
= tab(0, 87) tab(0, 29)
= 0, 30785 0, 11409
= 0, 19376
e o valor exato 0,193359.
Esses procedimentos so chamados de correo de continuidade e na Figura 3.2
ilustra-se o procedimento geral; lembre-se que o centro de cada retngulo o valor da
varivel binomial.
A aproximao dada pelo teorema limite central melhor para valores grandes de n.
Existe a seguinte regra emprica para nos ajudar a decidir o que grande:
A distribuio binomial com parmetros n e p pode ser aproximada por uma distribuio normal com mdia = np e varincia 2 = np(1 p) se so satisfeitas as
seguintes condies:
1. np 5
2. n(1 p) 5
3.1.1
Lista de Exerccios 1
Em cada um dos exerccios abaixo, verifique que as condies para aproximao da binomial pela normal so satisfeitas e calcule a probabilidade pedida usando a aproximao
normal.
1. X bin(18; 0, 4); Pr(X 15) e Pr(X < 2)
2. X bin(40; 0, 3); Pr(X < 10) e Pr(25 < X < 28)
3. X bin(65; 0, 9); Pr(X = 58) e Pr(60 < X 63)
4. X bin(100; 0, 2); Pr(25 X 35)
5. X bin(50; 0, 2); Pr(X > 26) e Pr(5 X < 10)
47
3.2
48
Considere uma populao em que cada elemento classificado de acordo com a presena
ou ausncia de determinada caracterstica. Por exemplo, podemos pensar em eleitores
escolhendo entre 2 candidatos, pessoas classificadas de acordo com o sexo, trabalhadores
classificados como trabalhador com carteira assinada ou no, e assim por diante. Em
termos de varivel aleatria, essa populao representada por uma v.a. de Bernoulli,
isto :
Vamos denotar por p a proporo de elementos da populao que possuem a caracterstica de interesse. Ento, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 p). Em geral,
esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra.
Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples
X1 , X2 , . . . , Xn com reposio. Essas n extraes correspondem a n variveis aleatrias
n
P
Xi tem distribuio binomial com
de Bernoulli independentes e, como visto, Sn =
i=1
e os valores possveis de Pb so 0, n1 , n2 , . . . , n1
, 1 com
n
k
Pr Pb =
= Pr(Sn = k)
n
(3.1)
(3.2)
Analisando a expresso (3.1), podemos ver que Pb nada mais que a mdia amostral
de Xi Bern(p), i = 1, . . . , n. Logo, o Teorema 2.1 se aplica com E(X) = p e V ar(X) =
p(1 p),ou seja:
E(Pb) = p
p(1 p)
V ar(Pb) =
n
49
12, 5 10
= Pr Z
9
= Pr(Z 0, 83)
= 0, 5 + tab(0, 83)
= 0, 79673
O valor exato Pr(X 12) = 0, 802.
3.2.1
Lista de Exerccios 2
3.3
Resumo do Captulo
Neste captulo estudamos dois resultados bsicos sobre a distribuio binomial; o primeiro
envolve a aproximao normal e o segundo, a distribuio amostral de propores
amostrais. Ao final, voc deve compreender os seguintes resultados.
Se X bin(n; p), ento probabilidades desta varivel podem ser aproximadas
pelas probabilidades da distribuio N [np; np(1 p)] , desde que sejam satisfeitas
as seguintes condies:
np 5
n(1 p) 5
50
Na aproximao da binomial pela normal, deve ser usada a correo de continuidade, conforme resumido na tabela a seguir, onde X bin(n; p) e Y
N [np; np(1 p)] (veja tambm a Figura 3.2):
Binomial
Pr(X = k)
Pr(X k)
Pr(X < k)
Pr(X k)
Pr(X > k)
Aproximao Normal
Pr(k 0, 5 Y k + 0, 5)
Pr(Y k + 0, 5)
Pr(Y < k + 0, 5)
Pr(Y k 0, 5)
Pr(Y k + 0, 5)
Seja uma populao descrita pela varivel aleatria X Bern(p). Ento, Pr(X =
1) = p, Pr(X = 0) = 1 p, E(X) = p e V ar(X) = p(1 p). Seja X1 , X2 , . . . , Xn
uma aas desta populao. Definindo a proporo amostral
resulta que
X1 + X2 + . . . + Xn
Pb =
n
p(1 p)
b
P N p;
n
3.4
Exerccios
51
3.5
Lista de Exerccios 1
1. 18 0, 4 = 7, 2 > 5
18 0, 6 = 10, 8 > 5
X N (7, 2; 4, 32)
14, 5 7, 2
Pr(X 15) Pr Z
4, 32
= Pr(Z 3, 51) = 0, 5 0, 49978 = 0, 00022
1, 5 7, 2
Pr(X < 2) Pr Z
4, 32
= Pr(Z 2, 74) = Pr(Z 2, 74)
= 0, 5 0, 49693 = 0, 00307
9, 5 12
Pr(X < 10) = Pr Z
8, 4
= Pr(Z 0, 86) = Pr(Z 0, 86)
= 0, 5 0, 30511 = 0, 19489
27, 5 12
25, 5 12
Z
Pr(25 < X < 28) = Pr
8, 4
8, 4
= Pr(4, 66 Z 5, 35) 0
3. 65 0, 9 = 58, 5 > 5
65 0, 1 = 6, 5 > 5
X N(58, 5; 5, 85)
57, 5 58, 5
58, 5 58, 5
Pr(X = 58) = Pr
Z
5, 85
5, 85
= Pr(0, 41 Z 0) = Pr(0 Z 0, 41) = 0, 15910
60, 5 58, 5
63, 5 58, 5
24, 5 20
35, 5 20
Pr(25 X 35) = Pr
Z
4
4
= Pr(1, 13 Z 3, 88) = 0, 49995 0, 37076 = 0, 12919
5. 50 0, 2 = 10, 0 > 5
50 0, 8 = 40, 0 > 5
X N(10; 8)
26, 5 10
4, 5 10
9, 5 10
52
53
Lista de Exerccios 2
1. Se a confiabilidade 0,995, ento a probabilidade de um item ser defeituoso
0,005. Seja X = nmero de defeituosos na amostra. Ento, X N(1000
0, 005; 1000 0.005 0.995) ou seja, X N (5; 4, 975). Note que 1000 0, 005 = 5
e 1000 0, 995 = 995, de modo que podemos usar a aproximao normal.
29, 5 5
Pr(X 30) Pr Z
= Pr(Z 10, 98) 0
4, 975
2. 1000 0, 85 = 850 e 1000 0, 15 = 150.
X N(150; 127, 5)
29, 5 150
= Pr(Z 10, 67) 1, 0
Pr(X 30) Pr Z
127, 5
3.6
1. .
(a) np = 35
n(1 p) = 15
X N(35; 10, 5)
25, 5 35
Pr(X 25) = Pr Z
10, 5
= Pr(Z 2, 93) = 0, 5 0, 49831 = 0, 00169
(b) np = 50
n(1 p) = 50
X N(50; 25)
56, 5 50
42, 5 50
Pr(42 < X 56) = Pr
Z
5
5
= Pr(1, 5 Z 1, 3) = 0, 43319 + 0, 40320 = 0, 83639
(c) np = 50
n(1 p) = 50
(d) np = 8
X N(50; 25)
60, 5 50
Pr(X > 60) = Pr Z
5
= Pr(Z 2, 1) = 0, 5 0, 48214 = 0, 01786
n(1 p) = 12
X N(8; 4, 8)
4, 5 8
5, 5 8
Pr(X = 5) = Pr
Z
4, 8
4, 8
= Pr(1, 60 Z 1, 14) = Pr(1, 14 Z 1, 60)
= 0, 44520 0, 37286 = 0, 072 34
n(1 p) = 21
(f) np = 8
n(1 p) = 72
(g) np = 6
n(1 p) = 24
54
X N(9; 6, 3)
11, 5 9
Pr(X 12) = Pr Z
= Pr(Z 1)
6, 3
= 0, 5 0, 34134 = 0, 15866
X N(8; 7, 2)
9, 5 8
10, 5 8
Pr(9 < X < 11) = Pr
Z
7, 2
7, 2
= Pr(0, 56 Z 0, 93) = 0, 32381 0, 21226 = 0, 11155
X N(8; 4, 8)
11, 5 8
16, 5 8
Pr(12 X 16) = Pr
Z
4, 8
4, 8
= Pr(1, 60 Z 3, 88) = 0, 49995 0, 44520 = 0, 05475
(h) np = 15
n(1 p) = 35
X N(15; 10, 5)
18, 5 15
Pr(X > 18) = Pr Z
=
10, 5
Pr(Z 1, 08) = 0, 5 0, 35993 = 0, 140 07
(i) np = 5, 6
n(1 p) = 22, 4
X N(5, 6; 4, 48)
5, 5 5, 6
6, 5 5, 6
Pr(X = 6) = Pr
Z
4, 48
4, 48
= Pr(0, 05 Z 0, 43) = 0, 01994 + 0, 16640 = 0, 18634
(j) np = 38
n(1 p) = 57
X N(38; 22, 8)
29, 5 38
47, 5 38
!
700.5 611.22
Pr(X 701) Pr Z p
= Pr(Z 5.78) = 0
238.3758)
55
36.5 32
Pr(X > 36) Pr Z
4
= Pr(Z 1.13) = 0.5 0.37076 = 0.12924
Esse um resultado que pode ocorrer por mero acaso, ou seja, no um resultado
no-usual.
4. X = nmero de passageiros que se apresentam para o vo em questo. X
bin(400; 0, 85) e X N(340; 51).
350, 5 340
Captulo 4
Intervalos de Confiana
Neste captulo voc aprender um mtodo muito importante de estimao de parmetros. Vimos anteriormente que a mdia amostral X um bom estimador da mdia
populacional . Mas vimos, tambm, que existe uma variabilidade nos valores de X,
ou seja, cada amostra d origem a um valor diferente do estimador. Uma maneira de
informar sobre esta variabilidade atravs da estimao por intervalos. Sendo assim,
neste captulo voc aprender os seguintes conceitos e mtodos:
intervalo de confiana
margem de erro
nvel de confiana
nvel de seignificncia
intervalo de confiana para a mdia de uma populao N (; 2 ) com varincia
conhecida
4.1
Idias bsicas
56
57
diferente do estimador. Para algumas amostras, X ser maior que , para outras ser
menor e para outras ser igual.
Na prtica, temos apenas uma amostra e, assim, importante que se d alguma informao sobre essa possvel variabilidade do estimador. Ou seja, importante informar
o valor do estimador b
obtido com uma amostra especfica, mas importante informar
tambm que o verdadeiro valor do parmetro poderia estar num determinado intervalo,
digamos, no intervalo [b
,b
+ ]. Dessa forma, estamos informando a nossa margem
de erro no processo de estimao; essa margem de erro conseqncia do processo de
seleo aleatria da amostra.
O que vamos estudar agora como obter esse intervalo, de modo a acertar na
maioria das vezes, isto , queremos um procedimento que garanta que, na maioria
das vezes (ou das amostras possveis), o intervalo obtido conter o verdadeiro valor do
parmetro. A expresso na maioria das vezes ser traduzida como probabilidade
alta. Dessa forma, estaremos lidando com afirmativas do seguinte tipo:
Com probabilidade alta (em geral, indicada por 1), o intervalo [b
erro;
b
+ erro] conter o verdadeiro valor do parmetro .
h
i
Pr b
;b
+
=1
(4.1)
58
4.2
59
Vamos agora introduzir os mtodos para obteno do intervalo de confiana para a mdia
de uma populao. Como visto, a mdia populacional um parmetro importante que
pode ser muito bem estimado pela mdia amostral X. Para apresentar as idias bsicas,
vamos considerar um contexto que pouco freqente na prtica. O motivo para isso
que, em termos didticos, a apresentao bastante simples. Como o fundamento o
mesmo para contextos mais gerais, essa abordagem se justifica.
Consideremos uma populao descrita por uma varivel aleatria normal com mdia
e varincia 2 : X N(; 2 ). Vamos supor que o valor de 2 seja conhecido e
que nosso interesse seja estimar a mdia a partir de uma amostra aleatria simples
X1 , X2 , . . . , Xn . Como visto anteriormente, a distribuio amostral de X normal com
2
mdia e varincia n , ou seja
2
2
X N ; = X N ;
n
Da definio de distribuio amostral, isso significa que os diferentes valores de X obtidos
a partir das diferentes possveis amostras se distribuem normalmente em torno de com
2
varincia n .
Das propriedades da distribuio normal, resulta que
X
Z= q
N(0; 1)
2
n
ou equivalentemente,
Z=
4.2.1
X
n
N(0; 1)
(4.2)
Notao
Vamos estabelecer a seguinte notao: vamos indicar por z a abscissa da curva normal
padro que deixa probabilidade (rea) igual a acima dela. Veja a Figura 4.2. Temos,
ento, que Pr(Z > z ) = . Essa abscissa z normalmente chamada de valor crtico.
Consideremos, agora, o valor crtico z/2 ;veja a Figura 4.3. Da podemos ver que,
se Z N(0; 1), ento
Pr z/2 Z z/2 = 1
(4.3)
Note que isso vale para a distribuio normal padro, em geral. Ento, usando os
resultados (4.2) e (4.3), obtemos que
X
z/2 = 1
Pr z/2 n
60
61
Pr z/2 X z/2
= 1
n
n
= 1
Pr X z/2 X + z/2
n
n
Pr X z/2 X + z/2
= 1
n
n
(4.4)
=1
Pr X z/2 ; X + z/2
n
n
Mas essa exatamente a forma geral de um intervalo de confiana, conforme explicitado
na equao (4.1). Temos, ento, a seguinte concluso:
Definio 4.1 Intervalo de confiana para a mdia de uma populao normal
com varincia conhecida
Seja X N(; 2 ) uma populao normal com varincia 2 conhecida. Se X1 , X2 , . . . , Xn
uma amostra aleatria simples dessa populao, ento o intervalo de confiana de nvel
de confiana 1 para a mdia populacional dado por
X z/2 ; X + z/2
n
n
4.2.2
Pr X z/2 ; X + z/2
=1
n
n
vlida porque ela envolve a varivel aleatria X, que tem diferentes valores para as
diferentes amostras. Quando substitumos o estimador X por uma estimativa especfica
62
x obtida a partir de uma amostra particular, temos apenas um intervalo e no faz mais
sentido falar em probabilidade.
Para ajudar na interpretao do intervalo de confiana, suponha que, com uma
amostra de tamanho 25, tenha sido obtido o seguinte intervalo de confiana com nvel
de confiana de 0,95:
2
2
= [4, 216; 5, 784]
5 1, 96 ; 5 + 1, 96
25
25
Esse intervalo especfico contm ou no contm o verdadeiro valor de . O que estamos dizendo que, se repetssemos o mesmo procedimento de sorteio de uma amostra
aleatria simples da populao e conseqente construo do intervalo de confiana, 95%
dos intervalos construdos conteriam o verdadeiro valor de .
Sendo assim, errado dizer que h uma probabilidade de 0,95 de o intervalo especfico
[4, 216; 5, 784] conter o verdadeiro valor de . Mas certo dizer que com probabilidade
0,95 o intervalo
2
2
X 1, 96 ; X + 1, 96
25
25
contm . Note a varivel aleatria X no limite do intervalo.
Exemplo 4.1 Em determinada populao, o peso dos homens adultos distribudo normalmente com um desvio padro de 16 kg. Uma amostra aleatria simples de 36 homens
adultos sorteada desta populao, obtendo-se um peso mdio de 78,2 kg. Construa um
intervalo de confiana de nvel de confiana 0,95 para o peso mdio de todos os homens
adultos dessa populao.
Soluo
Vamos incialmente determinar o valor crtico associado ao nvel de confiana de 0,95.
Como 1 = 0, 95, resulta que = 0, 05 e /2 = 0, 025.
Analisando a Figura 4.3, vemos que nas duas caudas da distribuio normal padro
temos que ter 5% da rea ( = 0, 05); logo, em cada cauda temos que ter 2,5%
(/2 = 0, 025) da rea total. Em termos da nossa tabela da distribuio normal padro
(apresentada novamente ao final da apostila como Tabela 1), isso significa que entre 0
e z0,025 temos que ter (50 2, 5)% = 47, 5% e, assim, temos que procurar no corpo da
tabela o valor de 0,475 para determinar a abscissa z0,025 . Veja a Figura 4.4.
Procurando no corpo da tabela da distribuio normal padro, vemos que o valor
0,475 corresponde abscissa z0,025 = 1, 96. Logo, nosso intervalo de confiana
16
16
78, 2 1, 96 ; 78, 2 + 1, 96
= [72, 9733 ; 83, 4267]
36
36
Esse intervalo contm ou no o verdadeiro valor de , mas o procedimento utilizado
para sua obteno nos garante que h 95% de chance de estarmos certos.
63
4.2.3
Lista de Exerccios 1
4.3
Margem de erro
Vamos, agora, analisar a margem de erro do intervalo de confiana para a mdia de uma
populao normal com varincia conhecida. Ela dada por
= z/2
n
(4.5)
(4.6)
Analisando a equao (4.5), podemos ver que ela depende diretamente do valor crtico
e do desvio padro populacional e inversamente proporcional ao tamanho da amostra.
Na Figura 4.5 ilustra-se a relao de dependncia da margem de erro em relao
ao desvio padro populacional . Temos a duas distribuies amostrais centradas na
mesma mdia e baseadas em amostras de mesmo tamanho. Nas duas distribuies a
rea total das caudas sombreadas , de modo que o intervalo limitado pelas linhas
verticais o intervalo de confiana de nvel de confiana 1 . Para a distribuio mais
dispersa, isto , com maior, o comprimento do intervalo maior. Esse resultado deve
64
<
ser intuitivo: se h mais variabilidade na populao, a nossa margem de erro tem que ser
maior, mantidas fixas as outras condies (tamanho de amostra e nvel de confiana).
Por outro lado, se mantivermos fixos o tamanho da amostra e o desvio padro populacional, razovel tambm esperar que a margem de erro seja maior para um nvel de
confiana maior. Ou seja, se queremos aumentar a probabilidade de acerto, razovel
que o intervalo seja maior. Aumentar a probabilidade de acerto significa aumentar
o nvel de confiana, o que acarreta em um valor crtico z/2 maior. Veja a Figura
4.6, onde ilustra-se o intervalo de confiana para dois nveis de confiana diferentes:
1 2 > 1 1 . O primeiro intervalo maior, refletindo o maior grau de confiana.
>
Finalmente, mantidos o mesmo desvio padro populacional e o mesmo nvel de confiana, quanto maior o tamanho da amostra, mais perto vamos ficando da populao e,
assim, vai diminuindo a nossa margem de erro.
Exemplo 4.2 De uma populao normal com varincia 25 extrai-se uma amostra aleatria
65
5
1, 64 5
2 = 1, 64 n =
= 4, 1 n = 16, 71
2
n
Como o valor de n tem que ser um inteiro, uma estimativa apropriada n = 17 (devemos
arredondar para cima para garantir um nvel de confiana no mnimo igual ao desejado).
Exemplo 4.3 Na divulgao dos resultados de uma pesquisa, publicou-se o seguinte
texto (dados fictcios): Com o objetivo de se estimar a mdia de uma populao,
estudou-se uma amostra de tamanho n = 45. De estudos anteriores, sabe-se que essa
populao muito bem aproximada por uma distribuio normal com desvio padro 3,
mas acredita-se que a mdia tenha mudado desde esse ltimo estudo. Com os dados
amostrais obteve-se o intervalo de confiana [1, 79; 3, 01], com uma margem de erro de
0,61. Quais so as informaes importantes que no foram divulgadas? Como podemos
obt-las?
Soluo
Quando se divulga um intervalo de confiana para um certo parmetro, costume publicar tambm a estimativa pontual. Nesse caso, temos que informar a mdia
amostral, que pode ser achada observando que o intervalo de confiana simtrico em
torno da mdia. Logo, x o ponto mdio do intervalo:
x=
1, 79 + 3, 01
= 2, 4
2
3
0, 61 45
0, 61 = z/2 z/2 =
= 1, 36
3
45
Consultando a tabela da distribuio normal, vemos que tab(1, 36) = 0, 41308. Veja a
Figura 4.7: o nvel de confiana 2 0, 41308 = 0, 826 16 0, 83.
Como dito no incio do captulo, a situao abordada aqui pouco realista. Na
prtica, em geral no conhecemos o desvio padro da populao. Nos prximos captulos
iremos estudar o caso mais geral em que no conhecido.
66
4.3.1
Lista de Exerccios 2
4.4
Resumo do Captulo
h
i
Pr b
;b
+
=1
67
4.5
Exerccios
32960, 00
32115, 00
41815, 00
32740, 00
35060, 00
33590, 00
35050, 00
33010, 00
(a) Obtenha o intervalo de confiana para a venda mdia mensal com nvel de
significncia de 5%.
(b) Obtenha o intervalo de confiana para a venda mdia mensal com nvel de
significncia de 1%.
68
(c) Em qual dos dois nveis de significncia podemos afirmar que o gerente se
baseou para fazer a afirmativa?
6. Intervalo de confiana com limites assimtricos O tempo de execuo de determinado teste de aptido para ingresso em um estgio normalmente distribudo
com desvio padro de 10 minutos. Uma amostra de 25 candidatos apresentou um
tempo mdio de 55 minutos. Construa um intervalo de confiana de limites L1 e
L2 (L1 < L2 ) de modo que seja observada a seguinte especificao: desconfiana
de que < L1 atribuiremos um nvel de significncia de 5% e desconfiana de
que > L2 atribuiremos o nvel de significncia de 10%.
4.6
Lista de Exerccios 1
1. 1 = 0, 90 = z0,05 = 1, 64
1 = 0, 99 = z0,005 = 2, 58
1 = 0, 80 = z0,10 = 1, 28
1236
36
4.7
69
9
X N ;
25
Com 1 = 0, 99, temos que = 0, 01 e /2 = 0, 005. Assim, temos que procurar
no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 005 = 0, 495,o que
nos d z0,005 = 2, 58. Ento
Pr(2, 58 Z 2, 58) = 0, 99
X
2, 58 = 0, 99
Pr 2, 58 q
Pr 2, 58
9
25
9
X 2, 58
25
9
25
= 0, 99
1, 96 4, 2
= 164, 64
n
0, 05
n 27106, 3296
Logo, o tamanho mnimo necessrio n = 27107.
3. dado que X N(; 0, 582 ). Como n = 25, sabemos que
0, 582
X N ;
25
Com 1 = 0, 90, temos que = 0, 10 e /2 = 0, 05. Assim, temos que procurar
no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 05 = 0, 45,o que nos
70
X
1, 64 = 0, 90
Pr 1, 64 q
0,582
25
0, 58
0, 58
X 1, 64
= 0, 90
Pr 1, 64
5
5
Pr(0, 19024 X 0, 19024) = 0, 90
Pr(X 0, 19024 X + 0, 19024) = 0, 90
n 1, 96 5 = 9, 8
n 9, 82 = 96, 04
Logo, n deve ser no mnimo igual a 97.
5. A mdia amostral x =
343120
10
= 34312.
71
X
1, 28 = 0, 85
Pr 1, 64 n
= 0, 85
Pr 1, 64 X 1, 28
n
n
Pr X 1, 64 X + 1, 28
= 0, 85
n
n
Pr X 1, 28 X + 1, 64
= 0, 85
n
n
10
10
= [52, 44 ; 57, 56
55 1, 28 ; 55 + 1, 28
25
25
72
Captulo 5
Intervalos de Confiana: Propores
- Amostra Grande
No captulo anterior, foram apresentadas as idias bsicas da estimao por intervalos
de confiana. Para ilustrar o princpio utilizado na construo de tais intervalos, consideramos a situao especial de estimao da mdia de uma populao normal com
varincia conhecida. Neste caso, a distribuio amostral da mdia amostral normal e
foi com base nessa distribuio amostral normal que obtivemos o intervalo de confiana.
Neste captulo usaremos o teorema limite central, que garante que a distribuio
amostral da proporo amostral pode ser aproximada por uma distribuio normal,
desde que utilizemos amostras grandes.
5.1
73
(5.1)
p(1p)
n
. Mais precisamente,
E(Pb) = p
p(1 p)
V ar(Pb) =
n
Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central
nos diz que a distribuio de Pb se aproxima de uma nornal com mdia p e varincia
p(1p)
. Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e, em geral,
n
essas condies so satisfeitas se n 30. Note que, com n = 30, np 5 sempre que
p 0, 1667; logo, essa indicao n 30 em geral funciona, desde que a caracterstica de
interesse no seja extremamente rarefeita na populao (em estatstica, usa-se o termo
populaes raras nos casos em que p muito pequeno). Caso haja suspeitas de que p
seja muito pequeno, deve-se aumentar o tamanho da amostra.
Resumindo, temos o seguinte resultado:
p(1
p)
Pb N p;
n
Usando as propriedades da distribuio normal, temos que
Pb p
q
N(0; 1)
p(1p)
n
ou equivalentemente
Pb p
N(0; 1)
np
p(1 p)
(5.2)
Vamos ver, agora, como usar esse resultado para obter um intervalo de confiana para
a verdadeira proporo populacional p.
5.2
Pb p
z/2 = 1
Pr z/2 n p
p(1 p)
e, portanto
Pr z/2
p(1 p)
Pb p z/2
n
p(1 p)
n
= 1 =
!
r
p(1
p)
p(1
p)
Pr Pb z/2
p Pb + z/2
= 1 =
n
n
!
r
r
p(1
p)
p(1
p)
Pr Pb z/2
p Pb + z/2
= 1
n
n
r
Pr Pb p Pb + = 1
onde = z/2
p(1p)
.
n
Tanto no caso da mdia de uma populao normal com varincia conhecida, quanto
no caso da proporo, a margem de erro tem a forma
= z/2 EP (b
)
onde EP (b
) representa o erro padro do estimador em questo. No caso da mdia,
EP (b
) = EP (X) =
n
(5.4)
p(1 p)
n
(5.5)
3. Usar algum valor auxiliar pb0 ou estimativa prvia, obtida de outras fontes ou de
uma amostra piloto:
r
d e = pb0 (1 pb0 )
EP
(5.6)
P
n
onde z/2 abscissa da curva normal padro que deixa rea /2 acima dela e pb0
alguma estimativa para o verdadeiro valor p.
5.3
n = z/2
ou
p
p(1 p)
n = [p(1 p)]
/2
Vemos, ento, que n diretamente proporcional a p(1p), ou seja, quanto maior p(1p),
maior ser o tamanho da amostra n. Na prtica, no conhecemos p (na verdade, estamos querendo estimar esse parmetro). Ento, para determinar o tamanho de amostra
necessrio para uma margem de erro e um nvel de confiana dados, podemos considerar
o pior caso, ou seja, podemos tomar o maior valor possvel de p(1 p) e calcular o
tamanho da amostra com base nesse pior caso, que ocorre quando p = 0, 5. claro
que essa uma escolha conservadora, que em alguns casos pode levar a um tamanho de
amostra desnecessariamente grande. Usando esta estimativa para p, obtemos que
z/2 2
n = 0, 5
Exemplo 5.2 Para estudar a viabilidade de lanamento de um novo produto no mercado, o gerente de uma grande empresa contrata uma firma de consultoria estatstica
para estudar a aceitao do produto entre os clientes potenciais. O gerente deseja obter
uma estimativa com um erro mximo de 1% com probabilidade 80% e pede ao consultor
estatstico que fornea o tamanho de amostra necessrio.
1. De posse das informaes dadas, o consultor calcula o tamanho da amostra necessrio
no pior cenrio. O que significa pior cenrio nesse caso? Qual o tamanho de
amostra obtido pelo consultor?
2. O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor
a realizar um estudo piloto com uma amostra de 100 pessoas para obter uma estimativa da verdadeira proporo. O resultado desse estudo piloto uma estimativa
pb = 0, 76 de aceitao do novo produto. Com base nessa estimativa, o consultor
recalcula o tamanho da amostra necessrio. Qual esse tamanho?
2
1, 28
n =
0, 25 = 4096
0, 01
0, 76 0, 24
0, 01 = 1, 28
=
n
2
1, 28
n =
0, 76 0, 24 = 2988, 4
0, 01
ou seja, n = 2989
3. 1 = 0, 90 = z0,05 = 1, 64
= 1, 64
0, 72 0, 28
= 0, 0135
2989
e o intervalo de confiana
[0, 72 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335]
2, 33
0, 05
0, 6 0, 4
0, 05
n
2, 33 p
0, 6 0, 4
n
0, 05
2
2.33
0.6 0.4
n
0.05
n 522
2
2, 33
n
0, 25
0, 05
n 543
5.4
Resumo do Captulo
E(Pb) = p
p(1 p)
V ar(Pb) =
n
p(1 p)
b
P N p;
n
onde z/2 o valor crtico da densidade normal padro que deixa probabilidade
/2 acima dele.
5.5
Exerccios
(b)
n = 1200
= 10%.
Nmero de sucessos na amostra = 710
estimativa prvia pb0 = 55%
2. Uma amostra de 300 habitantes de uma grande cidade revelou que 180 desejavam a
fluorao da gua. Encontre o intervalo de confiana para a verdadeira proporo
dos que no desejam a fluorao da gua para
5. Uma amostra aleatria simples de 400 itens forneceu 100 itens correspondentes ao
evento Sucesso.
(a) Qual a estimativa pontual pb para a verdadeira proporo de Sucessos na
populao?
5.6
1. .
(a) = 2% 1 = 98% z0,01 = 2, 33
= 0, 213 3
pb = 128
600
r
0, 213 3(1 0, 2133)
= 2, 33
= 0, 03897
600
e o intervalo de confiana
[0, 2133 0, 03897; 0, 2133 + 0, 03897] = [0, 17433; 0, 25227]
(b) = 10% 1 = 90% z0,05 = 1, 64
710
= 0, 591 67 =
pb = 1200
r
0, 55 0, 45
= 1, 64
= 0, 02355
1200
0, 4 0, 6
= 0, 05798
300
e o intervalo de confiana
[0, 4 0, 05798; 0, 4 + 0, 05798] = [0, 34202; 0, 045798]
3. dado que n = 100, pb = 0, 32 e EP (Pb) = 0, 03.
= 3% z0,015 = 2, 17
= 2, 17 0, 03 = 0, 0651
1, 64
0, 38 0, 62 = 99, 011
n
0, 08
100
400
= 0, 25
q
b
(b) EP (P ) = 0,250,75
= 0, 02651
400
(c) 1 = 0, 80 z0,1 = 1, 28
1, 96
0, 05
0, 35 0, 65 = 349, 59
Captulo 6
Intervalo de Confiana: Mdia da
N(; 2), 2 Desconhecida
Neste captulo voc completar seu estudo bsico sobre intervalos de confiana para a
mdia de uma populao, analisando o problema de estimao da mdia de uma populao normal quando no se conhece a varincia desta populao. Voc ver que, neste
caso, necessrio estimar essa varincia e isso introduz mais uma fonte de variabilidade
nas nossas estimativas: com uma nica amostra, temos que estimar a mdia e a varincia da populao. O procedimento simples e anlogo aos casos anteriores vistos
nos captulos amteriores; o que muda a distribuio amostral do estimador X. Em
vez de usarmos a distribuio normal para determinar os valores crticos, usaremos a
distribuio t de Student.
Voc ver os seguintes conceitos:
estimao da varincia de uma populao
distribuio amostral da mdia amostral de uma populao normal com varincia
desconhecida
intervalo de confiana para a mdia de uma populao normal com varincia desconhecida
6.1
Idias bsicas
Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia 2 : X N (; 2 ). Nosso interesse estimar a mdia a partir de uma amostra
aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a distribuio amostral de
2
X normal com mdia e varincia n , ou seja
2
2
X N(; ) = X N ;
n
84
X
N(0; 1)
n
(6.1)
X z/2 ; X + z/2
n
n
Suponhamos, agora, que a varincia 2 no seja conhecida. Neste caso, temos que
estim-la com os dados amostrais. Foi demonstrado que
n
n
P 2
1 P
1
2
2
2
(Xi X) =
X nX
S =
n 1 i=1
n 1 i=1 i
6.2
Intervalo de confiana para a mdia de uma populao normal com varincia desconhecida
O intervalo de confiana para a mdia de uma populao normal com varincia desconhecida obtido com base no seguinte resultado:
n
n
P
P
2
1
1
(Xi X)2 = n1
Xi2 nX .
onde S 2 = n1
i=1
i=1
X
Pr tn1; /2 n
tn1; /2 = 1 =
S
S
S
Pr tn1; /2 X tn1; /2
= 1 =
n
n
S
S
=1
Pr X tn1; /2 X + tn1; /2
n
n
Essa ltima expresso o intervalo de confiana para a mdia de uma populao
normal com varincia desconhecida.
S
S
X tn1; /2 ; X + tn1; /2
n
n
onde tn1; /2 o valor crtico da distribuio tStudent com n 1 graus de liberdade
que deixa rea /2 acima dele.
6.3
Margem de erro
onde
6.4
S .
d (X)
= tn1; /2 = tn1; /2 EP
n
d (X) = S
EP
n
(6.4)
(6.5)
Amostras grandes
X
n
S
t(n 1). Mas vimos tambm que, quando o nmero de graus de liberdade grande,
as diferenas entre as distribuies t e N(0; 1) tornam-se desprezveis.
Por outro lado, se a populao no normal, mas tem mdia e varincia 2 , o
X
se aproxima de uma
teorema limite central nos diz que a distribuio de n
N(0; 1) medida que n . Pode-se mostrar que esse resultado continua valendo se
substitumos por seu estimador S.
A concluso dessas duas observaes a seguinte:
Vimos que, para populaes normais, a distribuio exata da estatstica T =
S
S
X z/2 ; X + z/2
n
n
J
Exemplo 6.1 De uma populao normal com mdia e varincia desconhecidas, extraise uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de
confiana para a verdadeira mdia populacional, utilizando o nvel de confiana de 95%.
Soluo
Os seguintes requisitos para o IC para so satisfeitos: a populao normal e
a amostra pequena. Dessa forma, temos que usar a distribuio t com n 1 = 14
graus de liberdade. Como o nvel de confiana de 95%, em cada cauda da distribuio
temos que ter 2,5%. Assim, devemos procurar a abscissa t14;0,025 procurando na linha
correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,025.
Encontramos
t14;0,025 = 2, 145
A margem de erro
7
= 2, 145 = 3, 8769
15
e o intervalo de confiana
[12 3, 8769; 12 + 3, 8769] = [8, 1231; 15, 8769]
Exemplo 6.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
Construa o intervalo de confiana para a mdia populacional, com nvel de significncia
de 10%.
Soluo
Como antes, temos uma amostra pequena de uma populao normal; logo, temos
que usar a distribuio t-Student. Como n = 9, gl = n 1 = 8.
A mdia amostral
P
xi
x =
n
78
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
=
= 8, 6667
=
9
9
"
P 2#
P
1 P
1
(
xi )
(xi x)2 =
x2i
=
=
n1
n1
n
782
1 2
2
2
2
2
2
2
2
2
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
=
8
9
6084
36
1
712
=
= 4, 5
=
8
9
8
6.5
Resumo comparativo
Para finalizar a parte relativa construo de intervalos de confiana para mdias, vamos
resumir os resultados vistos nos ltimos captulos. importante notar que existem
procedimentos para construo de intervalos de confiana para outros parmetros, tal
como a varincia de uma populao normal, diferena entre mdias, etc. O procedimento
anlogo; o que muda a distribuio amostral.
6.5.1
N(0; 1)
EP (X) =
n
2 desconhecida
/2 = tn1; /2
t(n 1)
S
EP (X) =
n
Quando n > 31, pode-se usar z/2 no lugar de tn1; /2 .
6.5.2
O contexto bsico considerado foi o seguinte: de uma populao representada por uma
varivel aleatria X Bern(p) extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn
com o objetivo de se estimar a proporo populacional p dos elementos que possuem
determinada caracterstica de interesse. Se a amostra suficientemente grande (em
geral, n > 30),o intervalo de confiana para p tem a forma
Pb
com a margem de erro
com
pb0 (1 pb0 )
n
Aqui, pb0 uma estimativa prvia da proporo populacional p ou a prpria proporo
amostral pb obtida a partir da amostra ou ainda p0 = 0, 5 para o intervalo conservador.
EP (Pb) =
6.5.3
Dada uma aas de tamanho grande de uma populao qualquer com mdia , o intervalo
de confiana de nvel de confiana aproximado 1
S
X z/2
n
Esses resultados esto resumidos na Tabela 6.1 e na Figura 6.2.
2 conhecida
populao
N(; 2 )
2 desconhecida
X
N (0; 1)
n
= z/2 n
X
n
t(n 1)
S
= tn1; /2 Sn
Proporo
Pb p
N(0; 1)
np
p(1 p)
[mdia Bern(p)]
Mdia de uma
(amostra grande)
populao X
6.6
X
N(0; 1)
n
S
I.C.
= z/2
pe0 (1e
p0 )
n
= z/2 Sn
Pb
X
Exerccios
1. Para uma distribuio t de Student com 12 graus de liberdade, encontre a probabilidade (rea) de cada uma das seguintes regies (esboce um grfico para auxiliar
na soluo do exerccio):
(a) esquerda de 1, 782;
(b) direita de 1, 356;
(c) direita de 2, 681;
SIM
SIM
= z / 2
~ N (0;1)
NO
varincia
conhecida?
NO
populao
normal?
SIM
amostra
grande?
NO
X
~ t (n 1)
S
S
= t n 1; / 2
n
n
X
N (0;1)
S
s
= z / 2
n
n
X = P
X ~ Bern ( p )
S = P(1 P)
p 0 (1 p 0 )
n
Consulte um estatstico!
No foram estudados
mtodos apropriados
para esta situao!
i=1
xi = 401
30
P
i=1
x2i = 5443
6. Repita o exerccio anterior com os seguintes dados de uma amostra de 100 parafusos:
x = 13, 78
s2 = 2, 865
6.7
(e) Como visto no item (b), a rea direita de 1, 356 0, 90. A rea direita
de 2, 179 0, 025. Logo, a rea entre 1, 356 e 2, 179 0, 90 0, 025 = 0, 875
2. .
(a) t15;0,05 = 1, 753
(b) O primeiro fato a observar que t18;0,90 tem que ser negativo, pois direita
dele a rea de 0, 90 > 0, 50. Se direita a rea 0,90, a rea esquerda
0,10. Pela simetria da curva, t18;0,90 = t18;0,10 . Veja a Figura 6.3. Resulta
que
t18;0,90 = t18;0,10 = 1, 33
1 = 0, 95 t14;0,025 = 2, 145
808
= 53, 8667
15
8082
1
2
44176
= 46, 5524
s =
14
15
r
46, 5524
= 2, 145
= 3, 7788
15
O intervalo de confiana
x =
[53, 8667 3, 7788; 53, 8667 + 3, 7788] = [50, 088; 57, 6455]
4. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student
t24;0,01 = 2, 492
"
500 2, 492
900
; 500 + 2, 492
25
#
900
= [485, 05; 514, 95]
25
1
4012
=
5443
= 2, 861
29
30
x =
s2
O intervalo de confiana
"
#
r
r
2, 861
2, 861
13, 367 2, 462
; 13, 367 + 2, 462
= [12, 607; 14, 127]
30
30
6. Como n grande, podemos usar a abscissa da distribuio normal z0,01 = 2, 33 (o
valor exato t99;0,01 = 2, 3646),
#
"
r
r
2, 865
2, 865
; 13, 78 + 2, 33
= [13, 386; 14, 174]
13, 78 2, 33
100
100
Captulo 7
Intervalo de Confiana: Varincia
da N(; 2)
Neste captulo voc completar seu estudo bsico sobre intervalos de confiana, analisando o problema de estimao da varincia de uma populao normal. Como antes,
este intervalo se basear na distribuio amostral de um estimador no-viesado para
2 , a saber, S 2 . Como a varincia um nmero no negativo, essa distribuio no
simtrica e est definida apenas para valores no-negativos.
Voc ver os seguintes conceitos:
estimao da varincia de uma populao
intervalo de confiana para a varincia de uma populao normal
7.1
Idias bsicas
7.2
(7.1)
Como no caso da distribuio tStudent, vamos definir o valor crtico 2n; como a
abscissa da distribuio qui-quadrado com n graus de liberdade que deixa probabilidade
acima dela. Veja a Figura 7.1.
96
97
(7.2)
Pr 2n;1/2 2 (n) 2n;/2 = 1
Como o resultado (7.2) vale para qualquer distribuio qui-quadrado, podemos usar
o resultado (7.1) para escrever
(n 1)S 2
2
2
Pr n1;1/2
n1;/2 = 1
2
Da resulta que
!
2n1;/2
1
= 1 =
Pr
2
(n 1)S 2
(n 1)S 2
!
2
(n
1)S
(n 1)S 2
= 1
Pr
2 2
2n1;/2
n1;1/2
2n1;1/2
98
99
14 49 14 49
;
= [26, 26; 121, 87]
26, 119 5, 629
Exemplo 7.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
Construa o intervalo de confiana para a mdia populacional, com nvel de significncia
de 10%.
Soluo
Temos uma amostra pequena de uma populao normal; logo, podemos usar a distribuio 2 . Como n = 9, gl = n 1 = 8.
A mdia amostral
P
xi
x =
n
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
78
=
=
= 8, 6667
9
9
e a varincia amostral
"
P 2#
P
P
1
1
(
xi )
(xi x)2 =
x2i
=
S2 =
n1
n1
n
782
1 2
2
2
2
2
2
2
2
2
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
=
8
9
6084
36
1
712
=
= 4, 5
=
8
9
8
100
7 4, 5 7 4, 5
;
= [2, 03; 11, 53]
15, 507 2, 733
7.3
Exerccios
i=1
xi = 401
30
P
i=1
x2i = 5443
7.4
101
8082
1
44176
= 46, 5524
=
14
15
x =
s2
Intervalo de confiana:
s = 900
1 = 0, 98
Intervalo de confiana:
24 900 24 900
;
= [502, 56; 1989, 68]
42, 98
10, 856
4. Contexto: Populao normal
n = 30
= 2% 1 = 0, 98
401
= 13, 367
30
1
4012
=
5443
= 2, 861
29
30
x =
s2
Intervalo de confiana:
29 2, 861 29 2, 861
;
= [1, 67; 5, 82]
49, 588
14, 258
Captulo 8
Testes de Hipteses
Na teoria de estimao, vimos que possvel, atravs de estatsticas amostrais adequadas, estimar parmetros de uma populao, dentro de um certo intervalo de confiana. Nos testes de hipteses, ao invs de se construir um intervalo de confiana no
qual se espera que o parmetro da populao esteja contido, testa-se a validade de uma
afirmao sobre um parmetro da populao. Ento, num teste de hiptese, procurase tomar decises a respeito de uma populao, com base em informaes obtidas de
amostras desta mesma populao.
Neste captulo voc aprender os seguintes conceitos:
hipteses nula e alternativa
erros tipo I e II
estatstica de teste
regra de deciso
regio crtica
funo caracterstica de operao
poder do teste
8.1
Noes bsicas
Vamos trabalhar com alguns exemplos para ilustrar os conceitos bsicos que precisamos
para construir testes de hipteses estatsticos.
8.1.1
Exemplo 1
Um detetive de polcia encarregado da investigao de um crime. Baseado nas evidncias encontradas, o detetive suspeita inicialmente do mordomo e precisa decidir, ento,
se prende ou libera o mordomo. Por outro lado, o mordomo pode ser culpado ou inocente. Assim, h 4 possibilidades, resumidas no Quadro 1, que podem ocorrer quando
o detetive tomar sua deciso:
102
103
104
Quadro 2
Possibilidades para a deciso
Deciso
Rejeitar H0 No rejeitar H0
Possibi- H0 verdadeira
Erro I
OK
lidades H0 falsa
OK
Erro II
Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hiptese nula.
No exemplo, isso significa que o detetive nunca cometeria o erro de condenar um homem
inocente. De forma anloga, o erro tipo II pode ser evitado se sempre rejeitarmos a
hiptese nula e, no exemplo, o detetive nunca liberaria um assassino.
A teoria estatstica de testes de hipteses trata de regras de deciso, baseadas em
probabilidades, que tentam balancear esses dois tipos de erro.
8.1.2
Exemplo 2
Uma empresa compra anis de vedao de dois fabricantes. Segundo informaes dos
fabricantes, os anis do fabricante 1 tm dimetro mdio de 14 cm com desvio padro
de 1,2 cm e os anis do fabricante 2 tm dimetro mdio de 15 cm com desvio padro de
2,0 cm. Ambos os processos de produo geram anis com dimetros cuja distribuio
aproximadamente normal.
Uma caixa com 16 anis sem identificao encontrada pelo gerente do almoxarifado.
Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer uma
medio dos anis e basear sua deciso no dimetro mdio da amostra: se o dimetro
mdio for maior que 14,5 cm, ele identificar a caixa como oriunda do fabricante 2; caso
contrrio, ele identificar a caixa como oriunda do fabricante 1.
Esse um problema tpico de deciso empresarial. Vamos analisar esse processo decisrio sob o ponto de vista estatstico, estudando os possveis erros e suas probabilidades
de ocorrncia.
Uma primeira observao que existem apenas duas possibilidades para a origem
dos anis de vedao. Como ele suspeita que a caixa venha do fabricante 1, vamos
estabelecer a hiptese nula de forma que o resultado desejado seja rejeit-la. Definimos,
ento, a hiptese nula como sendo
H0 : anis vm do fabricante 2
e, obviamente, a hiptese alternativa ser
H1 : anis vm do fabricante 1
Se denotamos por X a varivel aleatria que representa o dimetro dos anis, essas
hipteses se traduzem como
H0 : X N(15; 2, 02 )
H1 : X N(14; 1, 22 )
105
.
16
Ento, as probabilidades associadas aos erros podem ser expressas em termos de
probabilidade condicional:
2, 02
Pr(Erro I) = Pr X 14, 5|X N 15;
16
1, 22
Pr(Erro II) = Pr X > 14, 5|X N 14;
16
Na Figura 8.1 a probabilidade associada ao erro I corresponde rea sombreada de
cinza claro, enquanto a rea sombreada de cinza escuro corresponde probabilidade do
erro tipo II.
Vamos calcular essas probabilidades. Em geral, a probabilidade do erro tipo I
denotada por e a probabilidade do erro tipo II por . Assim,
= Pr(Erro I) =
2, 02
= Pr X 14, 5|X N 15;
16
14, 5 15
= Pr Z
2
4
=
=
=
=
Pr(Z 1, 00)
Pr(Z 1, 00)
0, 5 tab(1, 00) = 0, 5 0, 34134
0, 15866
106
1, 22
= Pr X > 14, 5|X N 14;
16
14, 5 14
= Pr Z >
1.2
4
8.1.3
Exemplo 3
107
2
2, 0
Pr X k | X N 15;
16
k 15
Pr Z
2
4
k 15
Pr Z
0, 5
k 15
0, 5 tab
0, 5
k 15
tab
0, 5
k 15
0, 5
k
= 0, 05
= 0, 05
= 0, 05
= 0, 05
= 0, 05
= 0, 45
= 1, 64
= 14, 18
Com essa nova regra de deciso, o erro tipo II passa a ter probabilidade
= Pr(Erro II) =
1, 22
= Pr X > 14, 18|X N 14;
16
!
14, 18 14
= Pr Z >
1,2
4
= Pr(Z > 0, 6)
= 0, 5 tab(0, 6) = 0, 27425
8.1.4
Exemplo 4
Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual a regra
de deciso?
108
2, 02
1, 22
= Pr X > k | X N 14;
Pr X k | X N 15;
16
16
k 15
k 14
Pr Z 2.0
= Pr Z > 1.2
k 14
k 15
=
0, 5
0, 3
0, 3k 4, 5 0, 5k + 7
0, 8k = 11, 5
k = 14, 375
2, 02
= = Pr X 14, 375 | X N 15;
16
14, 375 15
= Pr Z
0, 5
= Pr(Z 1, 25)
= Pr(Z 1, 25)
= 0, 5 tab(1, 25) = 0, 10565
8.1.5
Exemplo 5
Queremos que a probabilidade seja pequena; assim, podemos fixar como 0,05 ou
mesmo 0,01. De posse do valor dessa probabilidade, poderamos estabelecer a regio
crtica ou regio de rejeio. A diferena fundamental aqui est no clculo da probabilidade do erro tipo II: no existe um nico valor de , j que, sob H1 , a distribuio
pode ter qualquer mdia.
8.1.6
109
Exemplo 6
H0 : p =
H1
Seja X = nmero de coroas nos trs lanamentos. Ento, X bin(3; p). Nossa regra
de deciso rejeitar H0 se X = 3. A probabilidade do erro tipo I
1
= Pr X = 3|X bin 3;
2
1 1 1 1
=
=
2 2 2 8
No possvel calcular = Pr(no rejeitar H0 |H0 falsa), pois a hiptese alternativa
(aquela que devemos considerar quando H0 no aceita) no estipula um valor nico
para p. Mas neste exemplo simples, podemos obter uma expresso para em funo de
p. Note que
=
=
=
=
8.1.7
Lista de Exerccios 1
110
(b) O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o salrio mdio na sua empresa menor que o salrio mdio
nacional, que de 900 reais.
(c) Uma empresa fabricante de balas afirma que o peso mdio de suas balas de
pelo menos 2 gramas.
2. Considere uma populao normal com varincia 225, da qual se extrai uma amostra
aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses:
H0 : = 40
H1 : = 45
(a) Se a regio crtica RC : X > 43 calcule as probabilidades dos erros tipo I e
II.
(b) Determine a regio crtica da forma X > k tal que a probabilidade do erro
tipo I seja 0,10. Nesse caso, qual a probabilidade do erro tipo II?
8.2
Conceitos bsicos
8.2.1
Hiptese nula
H0 : p = 0, 5
H0 : 2 = 25
O procedimento de teste de hiptese resultar em uma regra de deciso que nos permitir
rejeitar ou no rejeitar H0 .
8.2.2
111
Hiptese alternativa
8.2.3
Assim como na construo dos intervalos de confiana, iremos usar uma estatstica
amostral apropriada para construir o nosso teste de hiptese e nesse contexto, essa
estatstica chamada estatstica de teste. As estatsticas de teste usuais so a mdia
amostral X e a proporo amostral Pb, que sero usadas na construo de testes sobre
a mdia e a proporo populacionais, respectivamente.
O procedimento de deciso definido em termos da hiptese nula H0 : as decises
possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme resumo apresentado no quadro
abaixo, existem duas possibilidades de erro:
Erro tipo I: rejeitar H0 quando H0 verdadeira
Erro tipo II: no rejeitar H0 quando H0 falsa
A deciso sobre a hiptese nula tomada com base em uma regra que estabelece
um conjunto de valores, chamado regio crtica ou regio de rejeio, de modo que se, o
valor observado da estatstica amostral cair nesse regio, rejeitaremos H0 ; caso contrrio,
no rejeitaremos H0 . Vamos denotar por RC a regio crtica.
8.2.4
112
Vamos considerar o seguinte exemplo: se, ao lanarmos uma moeda 30 vezes, obtivermos 28 caras, iremos desconfiar da hiptese de honestidade da moeda, porque a
probabilidade de obtermos 28 caras ou mais em 30 lanamentos de uma moeda honesta
0,000000433996, uma probabilidade bastante pequena. claro que o evento 28 caras
ou mais em 30 lanamentos um evento possvel (acertar a sena no jogo da mega-sena
tambm ...) mas, sob o ponto de vista do teste de hiptese, a obteno de tal evento
ser uma evidncia de que a nossa hiptese nula de honestidade da moeda no muito
plausvel. Nesse caso, no diremos que a moeda no honesta (no podemos dizer que
impossvel acertar a sena!); nossa concluso que no h evidncia suficiente para
apoiar a hiptese nula. (Situao anloga ocorre quando um jri diz que o ru no
culpado.)
A definio de probabilidade pequena se faz atravs da escolha do nvel de significncia do teste, que a probabilidade do erro tipo I, isto :
= Pr(erro tipo I) = Pr(rejeitar H0 | H0 verdadeira)
Em geral, o valor de pequeno e as escolhas mais comuns so = 0, 05 e = 0, 01.
Definido o nvel de significncia , podemos estabelecer a regio crtica usando a
distribuio amostral da estatstica de teste.
8.2.5
1 (0 )
1 Pr(no rejeitar H0 | 0 )
1 Pr(no rejeitar H0 | H0 verdadeira)
Pr(rejeitar H0 | H0 verdadeira)
8.3
113
Exemplo 7
Consideremos uma populao representada por uma varivel aleatria normal com mdia
e varincia 400. Deseja-se testar
H0 : = 100
H1 : 6= 100
com base em uma amostra aleatria simples de tamanho n = 16. Para tal, define-se a
seguinte regio crtica:
RC : X < 85 ou X > 115
1. Calcule a probabilidade do erro tipo I.
2. Calcule a funo poder do teste para os seguintes valores de : 75, 80, 85, 90, 95,
100, 105, 110, 115, 120, 125. Quanto vale a funo poder do teste quando = 100?
Soluo
Como queremos fazer um teste sobre a mdia da populao, natural usarmos X
como estatstica de teste. Como a populao normal com mdia e varincia 400,
sabemos que X tambm normal com mdia e varincia 400
= 25.
16
1. Sob a hiptese nula, = 100. Ento,
= Pr(rejeitar H0 | H0 verdadeira)
85 100
115 100
= Pr Z <
+ Pr Z >
5
5
= Pr(Z < 3) + Pr(Z > 3)
= 2 Pr(Z > 3)
= 2 [0, 5 tab(3)]
= 0, 0027
2. A funo poder dada por
1 () = 1 Pr(no rejeitar H0 | )
= 1 Pr(85 X 115 | )
85
115
= 1 Pr
Z
5
5
Vamos ilustrar o clculo para = 75 :
1 (75) = 1 Pr(2 Z 8)
= 1 [tab(8) tab(2)]
= 0, 97725
114
1 ()
75 0,97725
80 0,84134
85 0,50000
90 0,15866
95 0,02278
100 0,00270
105 0,02278
110 0,15866
115 0,50000
120 0,84134
125 0,97725
Observe que, para = 100, valor da hiptese nula, a funo poder igual
probabilidade do erro tipo I (nvel de significncia).
interessante notar tambm que quanto mais distante do valor 0 = 100, maior o
poder do teste, ou seja, h uma probabilidade mais alta de se rejeitar H0 quando
o valor alternativo est bem distante de 0 .
8.4
Exemplo 8
= 1 Pr 94 X 106 | X N(; 4)
94
106
= 1 Pr
Z
2
2
115
75
80
85
90
95
100
105
110
115
120
125
Q()
1,00000
1,00000
0,99999
0,97725
0,30854
0,00270
0,30854
0,97725
0,99999
1,00000
1,00000
Note que esse teste tem o mesmo nvel de significncia do exemplo anterior: =
Q(100) = 0, 0027.
Na Figura 8.2 temos o grfico da funo poder para os dois exemplos. Note que o
poder do teste baseado em uma amostra de tamanho 100 sempre maior que o poder
do teste baseado em uma amostra de tamanho 16.
1,2
1,0
n=100
0,8
0,6
n=16
0,4
0,2
0,0
50
60
70
80
90
100
110
120
130
8.4.1
Lista de Exerccios 2
1. Considere uma populao normal com varincia 225, da qual se extrai uma amostra
aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses:
H0 : = 40
H1 : 6= 40
116
8.5
Resumo do Captulo
117
8.6
Exerccios
1. Considere uma populao normal com varincia 64, da qual se extrai uma amostra
aleatria simples de tamanho 16. Deseja-se testar as seguintes hipteses:
H0 : = 23
H1 : = 28
(a) Se a regio crtica RC : X > 25, 5 calcule as probabilidades dos erros tipo
I e II.
(b) Determine a regio crtica da forma X > k tal que a probabilidade do erro
tipo I seja 0,05. Nesse caso, qual a probabilidade do erro tipo II?
2. Desejando-se testar as hipteses
H0 : = 45
H1 : < 45
sobre a mdia de uma populao normal com varincia 36, estabeleceu-se a
seguinte regio crtica com base em amostra aleatria simples de tamanho n = 16:
RC : X < 41, 25
(a) Calcule a probabilidade do erro tipo I.
(b) Calcule o poder do teste para os seguintes valores de : 30, 31, . . . , 59, 60.
(c) Esboce o grfico da funo poder plotando os pontos (; Q()).
118
3. Para uma populao representada por uma varivel de Bernoulli com parmetro
p, deseja-se testar a hiptese
H0 : p = 0, 5
H1 : p 6= 0, 5
Com base em uma amostra de tamanho 10, estabelecida a seguinte regio crtica:
RC : X = 0, 1, 2, 8, 9, 10
onde X = nmero de sucessos na amostra.
(a) Determine o nvel de significncia .
(b) Calcule o poder do teste para os seguintes valores de p : 0, 2; 0, 4; 0, 6; 0, 8.
Esboce o grfico da funo poder.
8.7
Lista de Exerccios 1
1. .
(a) Antes da pane: T N(100; 100)
Depois da pane: T N(; 100)
H0 : = 100
H1 : 6= 100
(b) razovel supor que o gerente queira negar a afirmao dos empregados.
Assim, podemos estabelecer:
H0 : 900
H1 : < 900
(c) .
H0 : 2
H1 : < 2
X N(; 225)
2.
n = 25
X N ; 225
ou X N (; 9)
25
43 40
= Pr Z >
3
= Pr(Z > 1, 00)
= 0, 5 tab(1, 00)
= 0, 15866
= Pr(X 43 | X N(45; 9)
43 45
= Pr Z
3
= Pr(Z 0, 67)
= Pr(Z 0, 67)
= 0, 5 tab(0, 67)
= 0, 25143
(b) .
= 0, 10
Pr X > k | X N(40; 9) = 0, 10
k 40
Pr Z >
= 0, 10
3
k 40
tab
= 0, 40
3
k 40
= 1, 28
3
k = 43, 84
= Pr(X 43, 84 | X N(45; 9)
43.84 45
= Pr Z
3
= Pr(Z 0, 39)
= Pr(Z 0, 39)
= 0, 5 tab(0, 39)
= 0, 34827
Lista de Exerccios 2
X N(; 225)
X N ; 225
ou X N (; 9)
1.
25
n = 25
119
120
(a) .
34 40
46 40
= Pr Z <
+ Pr Z >
3
3
= Pr(Z < 2) + Pr(Z > 2)
= 2 Pr(Z > 2)
= 2 [0, 5 tab(2, )]
= 0, 0455
(b) .
Q() = Pr(rejeitar H0 | )
34
46
= Pr Z <
+ Pr Z >
3
3
(c) . Vamos fazer os clculos para = 20, 22, 58, 60.
46 20
34 20
+ Pr Z >
Q(20) = Pr Z <
3
3
= Pr(Z < 4, 67) + Pr(Z > 8, 67)
1+0=1
34 60
46 60
Q(60) = Pr Z <
+ Pr Z >
3
3
= Pr(Z < 8, 67) + Pr(Z > 4, 67)
= Pr(Z > 8, 67) + Pr(Z < 4, 67) = Q(20)
46 22
34 22
+ Pr Z >
Q(22) = Pr Z <
3
3
= Pr(Z < 4, 00) + Pr(Z > 8, 00)
1+0=1
34 58
46 58
Q(58) = Pr Z <
+ Pr Z >
3
3
= Pr(Z < 8, 00) + Pr(Z > 4, 00)
= Pr(Z > 8, 00) + Pr(Z < 4, 00) = Q(22)
Podemos ver que a funo poder simtrica; assim, s precisamos calcular
Q() para = 20, 22, 24, . . . , 38, 40. Os resultados esto na tabela a seguir
e o grfico est na Figura 8.3.
20
22
24
26
28
30
32
34
36
38
40
121
Q()
0,99999847
0,99996833
0,99957094
0,99616962
0,97724987
0,90878883
0,74750899
0,50003167
0,25292160
0,09504160
0,04550026
60
58
56
54
52
50
48
46
44
42
Q()
0,99999847
0,99996833
0,99957094
0,99616962
0,97724987
0,90878883
0,74750899
0,50003167
0,25292160
0,09504160
1,2
1,0
0,8
0,6
0,4
0,2
0,0
0
10
20
30
40
50
60
8.8
X N(; 64)
1.
n = 16
64
ou X N (; 4)
X N ;
16
(a)
25, 5 23
= Pr Z >
2
= Pr(Z > 1, 25)
= 0, 5 tab(1, 25)
= 0, 10565
70
25, 5 28
= Pr Z
2
= Pr(Z 1, 25)
= Pr(Z > 1, 25)
= 0, 10565
(b)
= 0, 05
Pr X > k | X N(23; 4) = 0, 05
k 23
Pr Z >
= 0, 05
2
k 23
tab
= 0, 45
2
k 23
= 1, 64
2
k = 26, 28
= Pr(X 26, 28 | X N(28; 4)
26, 28 28
= Pr Z
2
= Pr(Z 0, 86)
= Pr(Z 0, 86)
= 0, 5 tab(0, 86)
= 0, 19489
2. X N(; 36)
n = 16
36
X N ; 16 ou X N (; 2, 25)
A funo poder do teste
Q() = Pr(rejeitar H0 |)
= Pr(X < 41, 25|X N(; 1, 52 )
41, 25
= Pr Z <
1, 5
122
123
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
Q()
1,0000000
1,0000000
1,0000000
1,0000000
0,9999993
0,9999845
0,9997673
0,9976967
0,9848699
0,9331928
0,7976717
0,5661838
0,3085375
0,1216726
0,0333764
0,0062097
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
Q()
0,0007711
0,0000632
0,0000034
0,0000001
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
0,0000000
25
30
35
40
45
50
55
60
65
124
(a)
= Pr(X = 0 | p = 0, 5) + Pr(X = 1 | p = 0, 5) +
Pr(X = 2 | p = 0, 5) + Pr(X = 8 | p = 0, 5) +
Pr(X = 9 | p = 0, 5) + Pr(X = 10 | p = 0, 5)
= 0, 510 + 10
(0, 5) (0, 5)9 + 10
(0, 5)2 (0, 5)8 +
1
2
10
10
8
2
9
10
(0,
5)
+
(0,
5)
+
(0,
5)
(0,
5)
(0, 5)10
8
9
10
= 0, 000976563 + 0, 009765625 + 0, 043945313 +
0, 043945313 + 0, 009765625 + 0, 000976563
= 0, 109375
(b)
Q(0, 2) = Pr(X = 0 | p = 0, 2) + Pr(X = 1 | p = 0, 2) +
Pr(X = 2 | p = 0, 2) + Pr(X = 8 | p = 0, 2) +
Pr(X = 9 | p = 0, 2) + Pr(X = 10 | p = 0, 2)
10
9
+
(0,
2)
(0,
8)
(0, 2)2 (0, 8)8 +
= 0, 810 + 10
1
2
10
10
10
8
2
9
(0,
8)
+
(0,
8)
+
(0,
2)
(0,
2)
(0, 2)10
8
9
10
= 0, 107374182 + 0, 268435456 + 0, 301989888
+0, 00007373 + 0, 00000410 + 0, 00000010
= 0, 677877453
Analogamente obtm-se a seguinte tabela:
p
0, 1
0, 2
0, 3
0, 4
0, 5
0, 6
0, 7
0, 8
0, 9
Veja a Figura 8.5.
Q(p)
0,9298095
0,6778775
0,3843732
0,1795843
0,1093750
0,1795843
0,3843732
0,6778775
0,9298095
125
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
0,0
0,2
0,4
0,6
0,8
1,0
Captulo 9
Teste de Hiptese: Mdia da
N(; 2) - 2 Conhecida
Neste captulo iremos aplicar os conceitos bsicos sobre a teoria de teste de hiptese a
uma situao especfica. Nosso interesse estar concentrado na mdia de uma populao
normal. Assim como no caso dos intervalos de confiana, iremos iniciar nossos estudos
supondo que a varincia dessa populao seja conhecida. Como j dito, essa situao
no muito comum na prtica, mas, em termos didticos, a apresentao dos conceitos
fica simplificada. Entendendo bem a construo de um teste de hiptese para esse caso
particular, a apresentao para as outras situaes bastante semelhante, mudando
apenas a distribuio amostral.
Neste captulo veremos os seguintes conceitos aplicados mdia de uma populao
normal com varincia conhecida:
hipteses nula e alternativa
erros tipo I e II
estatstica de teste
regra de deciso
regio crtica
funo caracterstica de operao
poder do teste
valor P
Vamos apresentar inicialmente trs exemplos que ilustraro as diversas possibilidades
que podem surgir na prtica.
126
9.1
Exemplo 1
Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma
varivel aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos.
O gerente acredita que a pane no tenha alterado a variabilidade do processo. Uma
amostra de 16 tempos de processamento aps a pane revela uma mdia de 105,5 minutos. Ao nvel de significncia de 5%, qual a concluso sobre a alterao do tempo
mdio de processamento?
9.1.1
9.1.2
Estatstica de teste
Seja X a varivel aleatria que representa o tempo de processamento. Ento, pelos dados
do problema, temos que X N(; 100). Antes da pane, = 100. Como a populao
normal, sabemos que a distribuio da mdia amostral tambm normal e como no
deve ter havido alterao na variabilidade do processo, resulta que o desvio padro de
10 minutos em qualquer situao. Logo,
100
X N ;
16
ou equivalentemente,
Z=
9.1.3
X
N(0; 1)
2, 5
100
H0 verdadeira = X N 100;
16
ou equivalentemente,
Z0 =
X 100
q
N(0; 1)
100
16
A nossa regio crtica consiste nos valores de X com probabilidade pequena de ocorrerem sob essa hiptese. Ou seja, a regio crtica consiste nos valores de X muito
afastados da mdia suposta de = 100. Como a hiptese alternativa bilateral, muito
afastado significa muito maior ou muito menor do que = 100. Veja a Figura
9.1.
ou
X < 100 k
e isso equivalente a
X 100 > k
ou
X 100 < k
X 100 > k
RC :
9.1.4
Para determinar a regio crtica, basta encontrar o valor da constante k tal que
k
k
Pr Z >
+ Pr Z <
= 0, 05 =
2, 5
2, 5
k
k
Pr Z >
+ Pr Z >
= 0, 05 =
2, 5
2, 5
k
= 0, 025 =
Pr Z >
2, 5
k
tab
= 0, 475 =
2, 5
k
= 1, 96 =
2, 5
k = 4, 9
A regio crtica
RC :
X > 104, 9
ou
X < 95, 1
Como o valor da estatstica de teste para a amostra observada est na regio crtica,
devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam uma alterao
do tempo de processamento da tarefa aps a pane.
9.1.5
Poder
104, 9
95, 1
= Pr Z >
+ Pr Z <
2, 5
2, 5
Calculando () para diferentes valores de obtemos o grfico exibido na Figura 9.2.
1,05
1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
85
90
95
100
105
110
115
9.2
Exemplo 2
Na mesma situao do exemplo anterior, bastante razovel supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Afinal, se o tempo
diminuir, isso significa que a tarefa vai ser executada mais rapidamente, o que representa
um ganho. Ento, as duas possibilidades so:
100
> 100
OK!
Problema!
Para definir qual a hiptese nula, vamos usar o seguinte procedimento. Como dito
no captulo anterior, neste curso s trabalharemos com hipteses nulas simples, isto ,
hipteses nulas que envolvam igualdade do parmetro a um determinado valor: = 0 .
Assim, em um teste unilateral, a hiptese alternativa deve ser aquela que no envolve o
sinal de igualdade. No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo
que ser uma hiptese simples, passa a ser = 100, ou seja:
H0 : = 100
H1 : > 100
A estatstica de teste continua sendo
100
X N ;
16
O que muda a regio crtica, que agora passa a ser
RC :
Veja a Figura 9.3.
X > 100 + k
Figura 9.3: Regio crtica para o teste de H0 : = 100 com alternativa unilateral
direita H1 : > 100
Como o nvel de significncia 5%, isso significa que
100 + k 100
Pr Z >
= 0, 05 =
2, 5
k
= 0, 45 =
tab
2, 5
k
= 1, 64 =
2, 5
k = 4, 1
e isso nos leva regio crtica
RC :
X > 104, 1
Como no exemplo anterior, temos que rejeitar a hiptese nula de que o tempo de
processamento no se alterou, j que o valor observado da estatstica amostral est na
regio crtica.
A funo poder do teste
() = Pr(X > 104, 1|)
cujo grfico encontra-se na Figura 9.4. Note que para valores de menores do que 100
a probabilidade de rejeitar H0 zero, o que razovel, pois com uma hiptese unilateral
1,2
1,0
0,8
0,6
0,4
0,2
0,0
80
85
90
95
100
105
110
115
9.3
Exemplo 3
O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o
salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso, ele analisa
uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais. De informaes obtidas
junto ao sindicato patronal, ele sabe que, em nvel nacional, o salrio mdio de 900
reais, com desvio padro de 32 reais. Supondo que seja razovel aproximar a distribuio
dos salrios por uma distribuio normal com o mesmo desvio padro nacional, vamos
construir um teste de hiptese apropriado, com um nvel de significncia de 10%.
O problema aqui consiste em decidir se os salrios so menores ou no do que a
mdia nacional de 900 reais, ou seja, as situaes de interesse so
< 900
900
Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal
de igualdade. Logo, nossas hipteses so:
H0 : = 900
H1 : < 900
e a estatstica de teste
322
X N ;
25
X < 900 k
Figura 9.5: Regio crtica para o teste de H0 : = 900 com alternativa unilateral
esquerda H1 : < 900
O valor de k determinado pelo nvel de significncia:
900 k 900
Pr Z <
= 0, 10 =
6, 4
k
Pr Z <
= 0, 10 =
6, 4
k
= 0, 10 =
Pr Z >
6, 4
k
tab
= 0, 40 =
6, 4
k
= 1, 28 =
6, 4
k = 8, 192
Logo, a regio crtica
RC :
Veja na Figura 9.6 a funo poder deste teste: para valores maiores do que 900, a
probabilidade de rejeitar a hiptese nula zero.
1,1
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
860
870
880
890
900
910
920
930
940
9.4
H1 : > 0
H1 : < 0
2
X N ;
n
A regra de deciso consiste em rejeitar a hiptese nula se o valor de X estiver
longe do valor 0 . No caso da hiptese alternativa bilateral, estar longe significa ser
muito maior ou muito menor que 0 ; para a alternativa unilateral direita, estar longe
significa ser muito maior do que 0 e para a alternativa unilateral esquerda, longe
significa ser muito menor que 0 . As expresses muito menor e muito maior ficam
perfeitamente definidas a partir do valor do nvel de significncia . Veja a Figura
9.7, em que nas partes (a), (b) e (c) ilustra-se a regio crtica para as trs hipteses
9.4.1
Teste bilateral
Consideremos as hipteses
H0 : = 0
H1 : 6= 0
A regio crtica [veja a Figura 9.7-(a)]
RC :
ou
X > 0 + k
X < 0 k
2
X N 0 ;
n
Com nvel de significncia = Pr(erro I), temos que ter:
Pr(rejeitar H0 | H0 verdadeira) = =
2
2
Pr X > 0 + k | X N 0 ;
+ Pr X < 0 k | X N 0 ;
= =
n
n
!
0 k 0
0 + k 0
+ Pr Z <
= =
Pr Z >
Pr Z >
Pr Z >
Pr Z >
k
!
!
!
+ Pr Z <
+ Pr Z >
=
= =
= =
=
2
= z/2 =
k = z/2
n
Logo, a regio crtica
X > 0 + z/2
n
ou
X > 0 z/2
n
Figura 9.7: Regio crtica para o teste de hiptese sobre a mdia de uma normal com
varincia conhecida (a) teste bilateral (b) teste unilateral direita (c) teste unilateral
esquerda
9.4.2
Consideremos as hipteses
H0 : = 0
H1 : > 0
A regio crtica [veja a Figura 9.7-(b)]
RC :
X > 0 + k
2
X N 0 ;
n
Com nvel de significncia = Pr(erro I), temos que ter:
Pr(rejeitar H0 | H0 verdadeira) = =
2
= =
Pr X > 0 + k | X N 0 ;
n
!
0 + k 0
= =
Pr Z >
Pr Z >
k
= =
= z =
k = z
n
Logo, a regio crtica
9.4.3
X > 0 + z
n
Consideremos as hipteses
H0 : = 0
H1 : < 0
A regio crtica [veja a Figura 9.7-(c)]
RC :
X < 0 k
2
X N 0 ;
n
Com nvel de significncia = Pr(erro I), temos que ter:
Pr(rejeitar H0 | H0 verdadeira) = =
2
Pr X < 0 k | X N 0 ;
= =
n
!
0 k 0
Pr Z <
= =
Pr Z <
Pr Z >
k
= =
= =
= z =
k = z
n
Logo, a regio crtica
9.4.4
X < 0 z
n
interessante notar a expresso que aparece na regio crtica para o teste bilateral; ela
a mesma obtida para a margem de erro do intervalo de confiana para a mdia de uma
populao normal com varincia conhecida:
= z/2
n
Podemos ver, assim, que existe uma relao entre os dois procedimentos; na verdade,
em um teste de hiptese bilateral, rejeitamos a hiptese nula H0 se o valor observado
da estatstica de teste no estiver no intervalo de confiana.
9.5
Valor P
Nos exemplos acima, a determinao da regio crtica foi feita com base no nvel de
significncia, isto , fixado o nvel de significncia encontramos o valor k que definia
os limites entre valores provveis (aqueles que levam no rejeio de H0 ) e pouco
provveis (aqueles que levam rejeio de H0 ). Um outro procedimento bastante usual,
especialmente quando so utilizados programas computacionais, consiste em calcular a
probabilidade de se obter um valor to ou mais desfavorvel que o valor observado, se
H0 for verdadeira. Essa probabilidade chamada valor P . Vamos ilustrar esse conceito
considerando novamente os trs exemplos anteriores.
9.5.1
O valor obtido com os dados amostrais para a estatstica de teste x = 105, 5. Como
o teste bilateral, valores longe de 100 so aqueles muito menores ou muito maiores
que 100. O procedimento visto consistiu em dividir a probabilidade do erro tipo I
igualmente nas duas caudas da distribuio normal e dessa forma identificamos a regio
crtica. Vamos, agora, calcular o valor P para o nosso exemplo; ele a probabilidade de
obtermos um valor to ou mais extremo que o valor observado. Como o valor observado
est direita da mdia, devemos calcular a seguinte probabilidade:
P = Pr(X 105, 5 | H0 verdadeira)
100
= Pr X 105, 5 | X N 100;
16
105.5 100
= Pr(Z 2, 2) = 0, 5 tab(2, 2)
= Pr Z
2.5
= 0, 0139
Vamos analisar a Figura 9.8, onde est ilustrado esse valor. O valor amostral
observado para X x = 105, 5 = 100 + 5, 5. Como o teste bilateral, se tivssemos
obtido o valor x = 100 5, 5, esse valor tambm seria considerado to afastado de 100
quanto 105,5. Assim, para testes bilaterais, temos que considerar a probabilidade nas
duas caudas da distribuio. O que esse resultado est nos dizendo o seguinte: se H0
for verdadeira, a probabilidade de obtermos um valor distante de 100 por 5,5 unidades
em qualquer direo 2 0, 0139 = 0, 0278. Essa probabilidade chamada valor P.
No exemplo, vemos que o valor P pequeno, o que significa que pouco provvel
obtermos um valor to extremo quando H0 verdadeira. Logo, razovel supormos que
a hiptese nula no seja verdadeira, a mesma concluso obtida ao trabalharmos com o
nvel de significncia de 5%. Na verdade, rejeitaramos a hiptese nula para qualquer
nvel de significncia maior que 0,0278.
9.5.2
Como o teste unilateral direita, valores extremos so aqueles muito maiores que 100.
Como visto acima,
P = 0, 0139
Neste caso no temos que multiplicar por 2, pois o teste unilateral. Como o valor P
muito pequeno, temos evidncia suficiente para rejeitar a hiptese nula. Essa mesma
deciso seria tomada para qualquer nvel de significncia menor que 0,0139.
9.5.3
P = Pr X 894, 53 | X N(900; 6, 4)
894.53 900
= Pr Z
6.4
= Pr(Z 0, 85)
= Pr(Z 0, 85)
= 0, 5 tab(0, 85)
= 0, 1977
Essa no uma probabilidade pequena; ou seja, razovel obter um valor to ou mais
extremo que 894,53 quando H0 verdadeira. Assim, os dados no fornecem evidncia
suficiente para rejeitarmos a hiptese nula.
Com base nesses exemplos, podemos concluir o seguinte:
9.6
Exemplo 4
256
256
+ Pr X < 18 k | X N 18;
= 0, 01 =
Pr X > 18 + k | X N 18;
25
25
18 + k + 18
18 k 18
Pr Z >
+ Pr Z <
= 0, 01 =
3, 2
3, 2
k
k
+ Pr Z <
= 0, 01 =
Pr Z >
3, 2
3, 2
k
k
Pr Z >
+ Pr Z >
= 0, 01 =
3, 2
3, 2
k
Pr Z >
= 0, 005 =
3, 2
k
= 0, 495 =
tab
3, 2
k
= 2, 58 =
3, 2
k = 8, 256
P =
=
=
=
=
=
256
2 Pr X 23 | X N 18;
25
23 18
2 Pr Z
3, 2
2 Pr(Z 1, 56)
2 [0, 5 tab(1, 56)]
2 [0, 5 0, 4406]
0, 1188
256
Pr X > 18 + k | X N 18;
= 0, 01 =
25
18 + k + 18
Pr Z >
= 0, 01 =
3, 2
k
= 0, 01 =
Pr Z >
3, 2
k
tab
= 0, 49 =
3, 2
k
= 2, 33 =
3, 2
k = 7, 456
Logo, a regio crtica
X > 25, 456
O valor P
P =
=
=
=
=
=
256
Pr X 23 | X N 18;
25
23 18
Pr Z
3, 2
Pr(Z 1, 56)
[0, 5 tab(1, 56)]
[0, 5 0, 4406]
0, 0594
9.7
Exerccios
9.8
1. X N(; 3, 12 )
n=9
x = 13, 35
(a) = 0, 02 = z/2 = 2, 33
RC : X > 12, 8 + k ou X < 12, 8 k
3, 12
Pr X > 12, 8 + k X < 12, 8 k | X N 12, 8;
= 0, 02
9
!
12, 8 k 12, 8
12, 8 + k 12, 8
+ Pr Z <
= 0, 02
Pr Z >
3,1
3,1
3
3, 12
P = 2 Pr X 13, 35 | X N 12, 8;
9
!
13, 35 12, 8
= 2 Pr Z
3,1
3
= 2 Pr(Z 0, 53)
= 2 [0, 5 tab(0, 53)]
= 0, 4038
3, 12
3, 12
= Pr X > 15, 21|X N ;
+ Pr X < 10, 38|X N ;
9
9
Na tabela abaixo temos o valor de () para diferentes valores de (voc
pode obter valores um pouco diferentes, por causa de arredondamentos!).
Veja tambm a Figura 9.9.
8
9
10
11
12
13
14
15
16
17
18
()
0,98937
0,90914
0,64347
0,27428
0,05942
0,02184
0,12104
0,41948
0,77772
0,95839
0,99653
Por exemplo:
3, 12
3, 12
(8) = Pr X > 15, 21|X N 8;
+ Pr X < 10, 38|X N 8;
9
9
!
10, 38 8
15, 21 8
+ Pr Z <
= Pr Z >
3,1
3,1
3
1,2
1,0
0,8
0,6
0,4
0,2
0,0
0
10
15
20
k
Pr Z <
= 0, 05 =
0, 1
k
= 0, 05 =
Pr Z >
0, 1
k
tab
= 0, 45 =
0, 1
k
= 1, 64 =
0, 1
k = 0, 164
A regio crtica
X < 2 0, 164 = 1, 836
Como o valor observado x = 1, 98 no se encontra na regio crtica, no podemos
rejeitar a hiptese nula. Ou seja, os dados no trazem evidncia de que o fabricante
esteja mentindo.
3. O problema na produo surge quando < 15. Logo, nossas hipteses so:
H0 : = 15
H1 : < 15
A regio crtica
RC : X < 15 k
0, 52
= 0, 001 =
Pr X < 15 k|X N 15;
9
!
15 k 15
= 0, 001 =
Pr Z <
0,5
3
55
X N ;
25
O valor obtido x = 46, 5, que resulta no seguinte valor P :
55
P = Pr X < 46, 55|X N 48, 5;
25
46, 5 48, 5
= Pr Z <
1
= Pr(Z < 2, 0)
= Pr(Z > 2, 0)
= 0, 5 tab(2, 0)
= 0, 02275
1
X N ;
36
1
P = Pr X > 12, 4|X N 12;
36
12, 4 12
= Pr Z >
1
6
= Pr(Z > 2, 4)
= 0, 5 tab(2, 4)
= 0, 0082
Captulo 10
Teste de Hiptese: Propores Amostra Grande
No captulo anterior voc aprendeu a construir testes de hipteses sobre a mdia de
uma populao normal com varincia 2 conhecida. O procedimento baseou-se na distribuio amostral da mdia amostral que, com as hipteses de normalidade e conhecimento da varincia populacional, sabemos ser normal com a mesma mdia e varincia
2
. Neste captulo iremos fazer uso do Teorema Limite Central para construir testes de
n
hipteses sobre propores com base em amostras grandes. Vimos que, para amostras
grandes, a distribuio amostral da proporo amostral pode ser aproximada por uma
distribuio normal e, assim, o procedimento de teste de hiptese ser idntico ao estudado no captulo anterior. Veremos, ento, os seguintes conceitos aplicados proporo
populacional:
hipteses nula e alternativa
estatstica de teste
erros tipo I e II
regra de deciso
regio crtica
valor P
10.1
Contexto bsico
p(1p)
n
(10.1)
. Mais precisamente,
E(Pb) = p
p(1 p)
V ar(Pb) =
n
Como a proporo amostral uma mdia de uma amostra aleatria simples de uma
populao com distribuio de Bernoulli com parmetro p, o Teorema Central do Limite
nos diz, ento, que a distribuio de Pb se aproxima de uma nornal com mdia p e
varincia p(1p)
. Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e,
n
em geral, essas condies so satisfeitas se n 30.
Resumindo, temos o seguinte resultado:
p(1 p)
b
P N p;
n
ou, equivalentemente:
Pb p
q
N(0; 1)
p(1p)
n
Vamos ver, agora, como usar esse resultado para construir testes de hipteses sobre a
verdadeira proporo populacional p.
10.2
H1 : p 6= p0
H1 : p > p0
H1 : p < p0
(teste bilateral)
(teste unilateral direita)
(teste unilateral esquerda)
10.2.1
Teste bilateral
ou
Z0 < z/2
Pb p0
(10.2)
r
p0 (1 p0 )
n
p0 (1 p0 )
n
r
b
P p0
p0 (1 p0 )
< z/2 Pb < p0 z/2
r
n
p0 (1 p0 )
n
10.2.2
Pb < p0 z/2
ou
Testes unilaterais
p0 (1 p0 )
n
10.3
ou
Valor P
Pb < p0 z
(10.3)
(10.4)
p0 (1p0 )
n
(10.5)
Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer sob a
hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula. A hiptese
nula rejeitada a qualquer nvel de significncia P.
10.4
Exemplo 1
e a regio crtica
Z0 > 2, 58
ou
Z0 < 2, 58
Pb 0, 35
< 2, 58 Pb < 0, 19618
Z0 < 2, 58 q
0,350,65
64
e a regio crtica
Pb > 0, 504
ou
Pb < 0, 196
0.26 0.35
z0 = q
= 1, 5095 1, 51
0.350.65
64
10.5
Exemplo 2
Um fabricante afirma que no mximo 10% dos seus produtos so defeituosos. Um rgo
de defesa do consumidor testa uma amostra de 81 desses itens, detectando 13,8% de
defeituosos.
1. Encontre a regio crtica para um nvel de significncia de 5%.
2. Calcule o valor P.
Soluo
A afirmativa de interesse para o fabricante p 0, 10. A negao de tal afirmativa
(questionamento do rgo de defesa do conumidor) p > 0, 10. Logo, nossas hipteses
so:
H0 : p = 0, 10
H1 : p > 0, 10
Note que todas as propores esto na forma decimal! No trabalhe com percentagens!
Pb 0, 10
Z0 = q
=
0,100,90
81
10.6
Resumo do Captulo
Z=r
Pb p
p(1 p)
n
N(0; 1)
Pb p0
p0 (1 p0 )
n
N(0; 1)
Valores pouco provveis desta estatstica levam rejeio da hiptese nula. Assim,
a regra de deciso rejeitar H0 para valores na(s) cauda(s) da distribuio normal
padro. Com nvel de significncia , temos as seguintes possibilidades:
Z0 > z/2
Z0 > z
Z0 < z
ou
Z0 < z/2
(teste bilateral)
(teste unilateral direita)
(teste unilateral esquerda)
10.7
Exerccios
1. Em uma pesquisa com 800 estudantes universitrios, 385 afirmaram possuir computador. Teste a hiptese de que pelo menos 50% dos estudantes universitrios
possuem computador. Use = 0, 10.
2. Uma pesquisa entre 700 trabalhadores revela que 12,3% obtiveram seus empregos
atravs de indicaes de amigos ou parentes. Teste a hiptese de que mais de 10%
dos trabalhadores conseguem seus empregos por indicao de amigos ou parentes,
utilizando 5% como nvel de significncia.
3. O nvel de aprovao da qualidade das refeies servidas em um restaurante universitrio era de 20%, quando houve uma movimentao geral dos estudantes que
forou a direo do restaurante a fazer mudanas. Feitas as mudanas, sorteia-se
uma amostra de 64 estudantes usurios do restaurante e 25 aprovam a qualidade
da comida. Voc diria, ao nvel de significncia de 5%, que as mudanas surtiram
efeito?
10.8
1. pb =
= 0, 48125
e a regio crtica
Z0 < 1, 28
e a regio crtica
Z0 > 1, 64
Como o valor observado da estatstica de teste pertence regio crtica, rejeita-se
a hiptese nula de que 10% ou menos dos trabalhadores conseguem seus empregos
por indicao de parentes ou amigos.
Z0 > 1, 64
O valor observado da estatstica de teste
25
0.20
q
z0 = 64
= 3, 8125
0.20.8
64
que est na regio crtica; logo, rejeita-se a hiptese nula, ou seja, as evidncias
amostrais indicam que houve melhora com as mudanas.
4. As hipteses so
H0 : p = 0, 5
H1 : p 6= 0, 5
e a estatstica de teste
Pb 0, 5
Z0 = q
0,50,5
200
q
Z0 = 200
0, 5
0,50,5
200
= 2, 1213 2, 12
Pb 0, 25
Z0 = q
0,250,75
740
Z0 = q
0, 25
0,250,75
740
= 2, 46
Captulo 11
Teste de Hiptese: Mdia da
N(; 2) - 2 Desconhecida
Neste captulo voc completar seu estudo bsico de testes de hipteses sobre a mdia de
uma populao, analisando a situao relativa a uma populao normal quando no se
conhece a varincia desta populao. Assim como no caso do intervalo de confiana, para
testar hipteses relativas mdia de tal populao, necessrio estimar essa varincia e
isso introduz mais uma fonte de variabilidade no procedimento: com uma nica amostra,
queremos testar hipteses sobre a mdia, mas precisamos tambm estimar a varincia
da populao. O procedimento simples e anlogo aos casos estudados nos catulos
anteriores; o que muda a distribuio amostral da estatstica de teste. Em vez de
usarmos a distribuio normal para determinar os valores crticos, usaremos novamente
a distribuio t de Student.
Veremos, ento, os seguintes conceitos aplicados mdia de uma populao normal
com varincia desconhecida:
hipteses nula e alternativa
estatstica de teste
regra de deciso
regio crtica
valor P
11.1
Contexto bsico
Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia 2 : X N(; 2 ). Nosso interesse testar hipteses sobre a mdia a
159
X
n
S
11.2
Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X cuja distribuio N(; 2 ). Nosso interesse testar alguma hiptese sobre a mdia desta
populao. Em geral, a varincia 2 no conhecida e, portanto, vamos estim-la por
n
n
P 2
1 P
1
2
2
2
(Xi X) =
X nX
S =
n 1 i=1
n 1 i=1 i
Lembre-se que S 2 um estimador no-viesado de 2 .
11.2.1
H1 : 6= 0
H1 : > 0
H1 : < 0
Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento
do problema. Se no temos informao alguma sobre a alternativa, temos que usar um
teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,
11.2.2
Hipteses do problema
Hipteses estatsticas
< 0
0
H0 : = 0
H1 : < 0
0
> 0
H0 : = 0
H1 : > 0
Como o teste sobre a mdia de uma populao normal, a estatstica amostral que deve
ser utilizada X. Como a varincia populacional no conhecida, sabemos que
T =
X
S
n
t(n 1)
X 0
S
n
t(n 1)
Como a estatstica de teste segue uma distribuio t de Student, valores com pequena
probabilidade de ocorrncia esto nas caudas da distribuio. Isso equivale a valores de
X distandes de 0 . Assim, a regio crtica para cada tipo de hiptese alternativa
definida como segue:
Alternativa bilateral:
Alternativa unilateral direita:
Alternativa unilateral esquerda:
T0 > k ou T0 < k
T0 > k
T0 < k
Na Figura 11.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.
Figura 11.1: Regio crtica para o teste sobre a mdia de uma normal com varincia
desconhecida
11.2.3
T0 > tn1; /2
T0 < tn1; /2
(11.1)
Essa regio crtica tambm pode ser escrita de outra forma usando a seguinte equivalncia:
X 0
S
T0 > tn1; /2
> tn1; /2 X > 0 + tn1; /2
S
n
n
T0 < tn1; /2
X 0
S
n
S
< tn1; /2 X < 0 tn1; /2
n
(11.2)
(11.3)
ou equivalentemente
S
X < 0 tn1;
n
11.3
Exemplos
A ttulo de comparao com a situao do penltimo captulo, em que supusemos a varincia conhecida, vamos considerar os mesmos exemplos, mas agora tratando a varincia
dada como sendo a varincia amostral S 2 .
11.3.1
Exemplo 1
Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma
varivel aleatria normal com mdia de 100 minutos. Uma amostra de 16 tempos de
processamento aps a pane revela uma mdia x = 105, 5 minutos e um desvio padro
s = 10 minutos. Ao nvel de significncia de 5%, qual a concluso sobre a alterao
do tempo mdio de processamento?
Soluo
Como visto, as hipteses do problema so
= 100
6= 100
Como a segunda expresso no envolve o sinal de igualdade, ela se torna a hiptese
alternativa:
H0 : = 100
H1 : 6= 100
Como a varincia no conhecida, temos que usar a distribuio t de Student com
n1 = 161 = 15 graus de liberdade. Para um teste bilateral com nvel de significncia
de 5%, a abscissa de interesse aquela que deixa rea de 0,025 acima. Consultando a
Tabela 2 dada no final desta apostila, resulta
t15; 0,025 = 2, 131
A estatstica de teste
T0 =
X 100
10
16
t(15)
105, 5 100
10
16
= 2, 2
Como esse valor pertence regio crtica, rejeitamos a hiptese nula e conclumos que
houve alterao no tempo de processamento aps a pane.
Em termos da mdia amostral, a regio crtica
10
10
X > 100 + 2, 131 ou X < 100 2, 131
16
16
ou
ou
X > 105, 33
X > 104, 9
X < 95, 1
11.3.2
Exemplo 2
Na mesma situao do exemplo anterior, vamos considerar o caso em que o gerente esteja
interessado apenas no aumento do tempo de processamento. Neste caso, as hipteses
so:
100
> 100
OK!
Problema!
Para definir qual a hiptese nula, vamos usar o mesmo procedimento. Em um teste
unilateral, a hiptese alternativa deve ser aquela que no envolve o sinal de igualdade.
No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo que ser uma
hiptese simples, passa a ser = 100, ou seja:
H0 : = 100
H1 : > 100
Como antes, a estatstica de teste
T0 =
X 100
10
16
t(15)
10
X > 100 + 1, 753 = 104, 38
16
Essa tambm uma regio mais extrema que aquela encontrada para o caso da normal:
X > 104, 1. E novamente rejeitamos a hiptese nula, ou seja, as evidncias amostrais
indicam um aumento do tempo de processamento da tarefa aps a pane.
11.3.3
Exemplo 3
X 900
32
25
t(24)
como
T0 < t24; 0,10
Com nvel de significncia de 10%, a abscissa de interesse aquela que deixa rea de
10% acima dela em uma distribuio t com 24 graus de liberdade:
t24;0,10 = 1, 318
32
X < 900 1, 318 = 891, 56
25
Como o valor observado de 894,53 reais no est na regio crtica, no rejeitamos H0 ,
ou seja, as evidncias amostrais apontam que os salrios da empresa no so menores
que a mdia nacional.
Comparando com a regio crtica do caso normal, X < 891, 808, vemos, novamente,
que no caso da t a regio mais extrema.
11.4
Poder do teste
(95) =
=
=
X 95
t(15)
Pr X > 105, 73 | 16
10
X 95
t(15)
+ Pr X < 94, 673 | 16
10
X 95 105, 73 95
Pr
> 16
16
10
10
X 95 94, 673 95
< 16
+ Pr
16
10
10
Pr [t(15) > 4, 292] + Pr [t(15) < 0, 1308]
0, 00032 + 0, 44884 = 0, 44916
11.5
Valor P
Assim como no caso da funo poder, o clculo do valor P requer programas conmputacionais que calculem probabilidades da distribuio t para qualquer abscissa. Mas
a interpretao do valor P continua sendo a mesma: valores pequenos de P indicam
eventos pouco provveis de ocorrerem quando H0 verdadeira. Assim, continua valendo
a seguinte regra de deciso:
X 100
2 Pr X > 105, 5 | 16
t(15)
10
105, 5 100
2 Pr t(15) > 16
10
2 Pr [t(15) > 2, 2]
2 0, 02195 = 0, 0439
11.6
Exerccios
11.7
13.35 12.8
3.1
3
= 0, 53226
1.98 2.0
0.5
5
= 0, 2
que no pertence regio crtica; logo, no podemos rejeitar H0 , ou seja, as evidncias amostrais indicam que as balas pesam pelo menos 2 gramas.
Como o valor observado t0 = 3, 0 no est na regio crtica, no podemos rejeitar H0 , ou seja, as evidncias amostrais indicam que o processo est operando
adequadamente.
4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A
negao dessa afirmativa 48, 5. Logo, nossas hipteses so:
H0 : = 48, 5
H1 : < 48, 5
T0 > 1, 306
O valor observado desta estatstica de teste
12.4 12
t0 =
= 2, 4
1
6
Captulo 12
Teste de Hiptese: Varincia da
N(; 2)
Neste captulo completaremos o estudo de teste de hiptese sobre parmetros de uma
populao, analisando o caso da varincia de uma populao normal. Assim como na
construo de intervalos de confiana, nossa estatstica de teste tem distribuio quiquadrado e a regio crtica, como antes, ser formada pelos valores pouco provveis
desta estatstica de teste sob a hiptese nula.
12.1
Contexto bsico
Considere uma populao descrita por uma varivel aleatria normal com mdia e
varincia 2 : X N(; 2 ). Nosso interesse testar hipteses sobre a a varincia 2
a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a
estatstica
(n 1)S 2
2 =
2
tem distribuio qui-quadrado com n 1 graus de liberdade.
De posse desta estatstica de teste, o procedimento de construo do teste idntico
ao visto nos ltimos captulos: identificadas a hiptese nula (sempre na forma de uma
hiptese simples 2 = 20 ) e a hiptese alternativa, a regio crtica formada pelos
valores da estatstica de teste pouco provveis sob H0 . O nvel de significncia e o
tipo de hiptese alternativa permitem a identificao precisa do que so valores pouco
provveis: so valores na(s) cauda(s) da distribuio de 2 quando a hiptese nula
verdadeira.
Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos
de aplicao.
171
12.2
172
Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X cuja distribuio N(; 2 ). Nosso interesse testar alguma hiptese sobre a varincia 2 ,
que estimada por
n
n
P 2
1 P
1
2
2
2
S =
(Xi X) =
X nX
n 1 i=1
n 1 i=1 i
12.2.1
Bilateral :
Unilateral direita :
Unilateral esquerda :
Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento
do problema. Se no temos informao alguma sobre a alternativa, temos que usar um
teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,
ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa
no inclua o sinal de igualdade.
12.2.2
Hipteses do problema
Hipteses estatsticas
2 < 20
2 20
H0 : 2 = 20
H1 : 2 < 20
2 > 20
2 20
H0 : 2 = 20
H1 : > 0
Como o teste sobre a varincia de uma populao normal, a estatstica amostral a ser
utilizada
(n 1)S 2
2 (n 1)
2
173
(n 1)S 2
2 (n 1)
2
0
Na Figura 12.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.
12.2.3
Pr X0 > kS | X0 2 (n 1) + Pr X0 < kI | X0 2 (n 1) =
Mesmo a distribuio qui-quadrado no sendo simtrica, prtica usual dividir a probabilidade de erro em partes iguais, ou seja, os limites da regio crtica so definidos de
modo que
Pr X0 > kS | X0 2 (n 1) =
2
2
Pr X0 < kI | X0 (n 1) =
2
174
Figura 12.1: Regio crtica para testes de hipteses sobre a varincia de uma N(; 2 )
175
ou
(12.1)
Pr X0 > kS | X0 2 (n 1) = = kS = 2n1;
ou seja, a regio crtica
(12.2)
12.3
(12.3)
Exemplo 1
ou
15 32, 1
= 24, 075
20
12.4
176
Um escritrio de investimento acredita que o rendimento das diversas aes movimentadas por ele foi de 24% ao longo dos ltimos anos. Uma nova estratgia implementada
para melhorar o desempenho, bem como garantir uma maior uniformidade nos rendimentos das diversas aes. No passado, o desvio padro do rendimento era da ordem
de 5%. Uma amostra de 8 empresas forneceu os seguinjtes rendimentos (dados em %):
23,6; 22,8; 25,7; 24,8; 26,4; 24,3; 23,9; 25. Quais seriam as concluses? Quais so as
hipteses necessrias para a soluo deste problema?
Soluo
Temos que supor que os rendimentos tm distribuio normal. As hipteses de
interesse so > 24 e 2 < 25. Logo, as hipteses estatsticas so
H0 : = 24
H1 : > 24
Os dados fornecem
8
P
xi = 196, 5 e
i=1
8
P
i=1
H0 : 2 = 25
H1 : 2 < 25
x2i = 4835, 99
196, 5
= 24, 5625
8
1
9, 45875
=
[4835, 99 8 24, 5625] =
= 1, 35125
7
7
x =
s2
Como o tamanho da amostra pequeno e tanto a mdia como varincia so desconhecidas, as estatsticas de teste so T0 e X02 . Os valores crticos, para um nvel de
significncia de 5%, so
t7;0,05 = 1, 895
7;0,95 = 2, 167
e s regies crticas so
T0 > 1, 895
t0 =
x20
Vemos, ento, que t0 no pertence regio crtica e, portanto, no podemos dizer que o
rendimento mdio aumentou. Por outro lado, x20 pertence regio crtica e, portanto, os
dados indicam que houve reduo na variabilidade dos rendimentos das aes negociadas
pelo escritrio.
177
Tabela 1
Distribuio Normal Padro
Corpo da tabela d a probabilidade p tal que
p = P (0 < Z < Z c )
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4
4,1
4,2
4,3
4,4
4,5
0
0,00000
0,03983
0,07926
0,11791
0,15542
0,19146
0,22575
0,25804
0,28814
0,31594
0,34134
0,36433
0,38493
0,40320
0,41924
0,43319
0,44520
0,45543
0,46407
0,47128
0,47725
0,48214
0,48610
0,48928
0,49180
0,49379
0,49534
0,49653
0,49744
0,49813
0,49865
0,49903
0,49931
0,49952
0,49966
0,49977
0,49984
0,49989
0,49993
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000
1
0,00399
0,04380
0,08317
0,12172
0,15910
0,19497
0,22907
0,26115
0,29103
0,31859
0,34375
0,36650
0,38686
0,40490
0,42073
0,43448
0,44630
0,45637
0,46485
0,47193
0,47778
0,48257
0,48645
0,48956
0,49202
0,49396
0,49547
0,49664
0,49752
0,49819
0,49869
0,49906
0,49934
0,49953
0,49968
0,49978
0,49985
0,49990
0,49993
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000
2
0,00798
0,04776
0,08706
0,12552
0,16276
0,19847
0,23237
0,26424
0,29389
0,32121
0,34614
0,36864
0,38877
0,40658
0,42220
0,43574
0,44738
0,45728
0,46562
0,47257
0,47831
0,48300
0,48679
0,48983
0,49224
0,49413
0,49560
0,49674
0,49760
0,49825
0,49874
0,49910
0,49936
0,49955
0,49969
0,49978
0,49985
0,49990
0,49993
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000
3
0,01197
0,05172
0,09095
0,12930
0,16640
0,20194
0,23565
0,26730
0,29673
0,32381
0,34849
0,37076
0,39065
0,40824
0,42364
0,43699
0,44845
0,45818
0,46638
0,47320
0,47882
0,48341
0,48713
0,49010
0,49245
0,49430
0,49573
0,49683
0,49767
0,49831
0,49878
0,49913
0,49938
0,49957
0,49970
0,49979
0,49986
0,49990
0,49994
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000
4
0,01595
0,05567
0,09483
0,13307
0,17003
0,20540
0,23891
0,27035
0,29955
0,32639
0,35083
0,37286
0,39251
0,40988
0,42507
0,43822
0,44950
0,45907
0,46712
0,47381
0,47932
0,48382
0,48745
0,49036
0,49266
0,49446
0,49585
0,49693
0,49774
0,49836
0,49882
0,49916
0,49940
0,49958
0,49971
0,49980
0,49986
0,49991
0,49994
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000
5
0,01994
0,05962
0,09871
0,13683
0,17364
0,20884
0,24215
0,27337
0,30234
0,32894
0,35314
0,37493
0,39435
0,41149
0,42647
0,43943
0,45053
0,45994
0,46784
0,47441
0,47982
0,48422
0,48778
0,49061
0,49286
0,49461
0,49598
0,49702
0,49781
0,49841
0,49886
0,49918
0,49942
0,49960
0,49972
0,49981
0,49987
0,49991
0,49994
0,49996
0,49997
0,49998
0,49999
0,49999
0,50000
0,50000
6
0,02392
0,06356
0,10257
0,14058
0,17724
0,21226
0,24537
0,27637
0,30511
0,33147
0,35543
0,37698
0,39617
0,41309
0,42785
0,44062
0,45154
0,46080
0,46856
0,47500
0,48030
0,48461
0,48809
0,49086
0,49305
0,49477
0,49609
0,49711
0,49788
0,49846
0,49889
0,49921
0,49944
0,49961
0,49973
0,49981
0,49987
0,49992
0,49994
0,49996
0,49998
0,49998
0,49999
0,49999
0,50000
0,50000
7
0,02790
0,06749
0,10642
0,14431
0,18082
0,21566
0,24857
0,27935
0,30785
0,33398
0,35769
0,37900
0,39796
0,41466
0,42922
0,44179
0,45254
0,46164
0,46926
0,47558
0,48077
0,48500
0,48840
0,49111
0,49324
0,49492
0,49621
0,49720
0,49795
0,49851
0,49893
0,49924
0,49946
0,49962
0,49974
0,49982
0,49988
0,49992
0,49995
0,49996
0,49998
0,49998
0,49999
0,49999
0,50000
0,50000
8
0,03188
0,07142
0,11026
0,14803
0,18439
0,21904
0,25175
0,28230
0,31057
0,33646
0,35993
0,38100
0,39973
0,41621
0,43056
0,44295
0,45352
0,46246
0,46995
0,47615
0,48124
0,48537
0,48870
0,49134
0,49343
0,49506
0,49632
0,49728
0,49801
0,49856
0,49896
0,49926
0,49948
0,49964
0,49975
0,49983
0,49988
0,49992
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000
0,50000
9
0,03586
0,07535
0,11409
0,15173
0,18793
0,22240
0,25490
0,28524
0,31327
0,33891
0,36214
0,38298
0,40147
0,41774
0,43189
0,44408
0,45449
0,46327
0,47062
0,47670
0,48169
0,48574
0,48899
0,49158
0,49361
0,49520
0,49643
0,49736
0,49807
0,49861
0,49900
0,49929
0,49950
0,49965
0,49976
0,49983
0,49989
0,49992
0,49995
0,49997
0,49998
0,49999
0,49999
0,49999
0,50000
0,50000
178
Tabela 2
Valores crticos da distribuio t -Student
g.l.
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
50
0,150
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,054
1,054
1,053
1,052
1,052
1,050
1,047
0,100
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306
1,303
1,299
0,050
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690
1,684
1,676
0,002
159,153
15,764
8,053
5,951
5,030
4,524
4,207
3,991
3,835
3,716
3,624
3,550
3,489
3,438
3,395
3,358
3,326
3,298
3,273
3,251
3,231
3,214
3,198
3,183
3,170
3,158
3,147
3,136
3,127
3,118
3,109
3,102
3,094
3,088
3,081
3,055
3,018
0,001
318,309
22,327
10,215
7,173
5,893
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,375
3,365
3,356
3,348
3,340
3,307
3,261
179
T a b e la d a Q u i- Q u a d r a d o
D is t r ib u i o q u i- q u a d r a d o
V a lo r e s c r t ic o s d e c 2 t a is q u e
Pr
g .l.
n
2
n
2
n ;
)=
2
n ;
=
0 ,9 9 0
0 ,9 8 0
0 ,9 7 5
0 ,9 5 0
0 ,9 0 0
0 ,8 0 0
0 ,2 0 0
0 ,1 0 0
0 ,0 5 0
0 ,0 2 5
0 ,0 2 0
0 ,0 1 0
0 ,0 0 0
0 ,0 0 1
0 ,0 0 1
0 ,0 0 4
0 ,0 1 6
0 ,0 6 4
1 ,6 4 2
2 ,7 0 6
3 ,8 4 1
5 ,0 2 4
5 ,4 1 2
6 ,6 3 5
0 ,0 2 0
0 ,0 4 0
0 ,0 5 1
0 ,1 0 3
0 ,2 1 1
0 ,4 4 6
3 ,2 1 9
4 ,6 0 5
5 ,9 9 1
7 ,3 7 8
7 ,8 2 4
9 ,2 1 0
0 ,1 1 5
0 ,1 8 5
0 ,2 1 6
0 ,3 5 2
0 ,5 8 4
1 ,0 0 5
4 ,6 4 2
6 ,2 5 1
7 ,8 1 5
9 ,3 4 8
9 ,8 3 7
1 1 ,3 4 5
0 ,2 9 7
0 ,4 2 9
0 ,4 8 4
0 ,7 1 1
1 ,0 6 4
1 ,6 4 9
5 ,9 8 9
7 ,7 7 9
9 ,4 8 8
1 1 ,1 4 3
1 1 ,6 6 8
1 3 ,2 7 7
0 ,5 5 4
0 ,7 5 2
0 ,8 3 1
1 ,1 4 5
1 ,6 1 0
2 ,3 4 3
7 ,2 8 9
9 ,2 3 6
1 1 ,0 7 0
1 2 ,8 3 3
1 3 ,3 8 8
1 5 ,0 8 6
0 ,8 7 2
1 ,1 3 4
1 ,2 3 7
1 ,6 3 5
2 ,2 0 4
3 ,0 7 0
8 ,5 5 8
1 0 ,6 4 5
1 2 ,5 9 2
1 4 ,4 4 9
1 5 ,0 3 3
1 6 ,8 1 2
1 ,2 3 9
1 ,5 6 4
1 ,6 9 0
2 ,1 6 7
2 ,8 3 3
3 ,8 2 2
9 ,8 0 3
1 2 ,0 1 7
1 4 ,0 6 7
1 6 ,0 1 3
1 6 ,6 2 2
1 8 ,4 7 5
1 ,6 4 6
2 ,0 3 2
2 ,1 8 0
2 ,7 3 3
3 ,4 9 0
4 ,5 9 4
1 1 ,0 3 0
1 3 ,3 6 2
1 5 ,5 0 7
1 7 ,5 3 5
1 8 ,1 6 8
2 0 ,0 9 0
2 ,0 8 8
2 ,5 3 2
2 ,7 0 0
3 ,3 2 5
4 ,1 6 8
5 ,3 8 0
1 2 ,2 4 2
1 4 ,6 8 4
1 6 ,9 1 9
1 9 ,0 2 3
1 9 ,6 7 9
2 1 ,6 6 6
10
2 ,5 5 8
3 ,0 5 9
3 ,2 4 7
3 ,9 4 0
4 ,8 6 5
6 ,1 7 9
1 3 ,4 4 2
1 5 ,9 8 7
1 8 ,3 0 7
2 0 ,4 8 3
2 1 ,1 6 1
2 3 ,2 0 9
11
3 ,0 5 3
3 ,6 0 9
3 ,8 1 6
4 ,5 7 5
5 ,5 7 8
6 ,9 8 9
1 4 ,6 3 1
1 7 ,2 7 5
1 9 ,6 7 5
2 1 ,9 2 0
2 2 ,6 1 8
2 4 ,7 2 5
12
3 ,5 7 1
4 ,1 7 8
4 ,4 0 4
5 ,2 2 6
6 ,3 0 4
7 ,8 0 7
1 5 ,8 1 2
1 8 ,5 4 9
2 1 ,0 2 6
2 3 ,3 3 7
2 4 ,0 5 4
2 6 ,2 1 7
13
4 ,1 0 7
4 ,7 6 5
5 ,0 0 9
5 ,8 9 2
7 ,0 4 2
8 ,6 3 4
1 6 ,9 8 5
1 9 ,8 1 2
2 2 ,3 6 2
2 4 ,7 3 6
2 5 ,4 7 2
2 7 ,6 8 8
14
4 ,6 6 0
5 ,3 6 8
5 ,6 2 9
6 ,5 7 1
7 ,7 9 0
9 ,4 6 7
1 8 ,1 5 1
2 1 ,0 6 4
2 3 ,6 8 5
2 6 ,1 1 9
2 6 ,8 7 3
2 9 ,1 4 1
15
5 ,2 2 9
5 ,9 8 5
6 ,2 6 2
7 ,2 6 1
8 ,5 4 7
1 0 ,3 0 7
1 9 ,3 1 1
2 2 ,3 0 7
2 4 ,9 9 6
2 7 ,4 8 8
2 8 ,2 5 9
3 0 ,5 7 8
16
5 ,8 1 2
6 ,6 1 4
6 ,9 0 8
7 ,9 6 2
9 ,3 1 2
1 1 ,1 5 2
2 0 ,4 6 5
2 3 ,5 4 2
2 6 ,2 9 6
2 8 ,8 4 5
2 9 ,6 3 3
3 2 ,0 0 0
17
6 ,4 0 8
7 ,2 5 5
7 ,5 6 4
8 ,6 7 2
1 0 ,0 8 5
1 2 ,0 0 2
2 1 ,6 1 5
2 4 ,7 6 9
2 7 ,5 8 7
3 0 ,1 9 1
3 0 ,9 9 5
3 3 ,4 0 9
18
7 ,0 1 5
7 ,9 0 6
8 ,2 3 1
9 ,3 9 0
1 0 ,8 6 5
1 2 ,8 5 7
2 2 ,7 6 0
2 5 ,9 8 9
2 8 ,8 6 9
3 1 ,5 2 6
3 2 ,3 4 6
3 4 ,8 0 5
19
7 ,6 3 3
8 ,5 6 7
8 ,9 0 7
1 0 ,1 1 7
1 1 ,6 5 1
1 3 ,7 1 6
2 3 ,9 0 0
2 7 ,2 0 4
3 0 ,1 4 4
3 2 ,8 5 2
3 3 ,6 8 7
3 6 ,1 9 1
20
8 ,2 6 0
9 ,2 3 7
9 ,5 9 1
1 0 ,8 5 1
1 2 ,4 4 3
1 4 ,5 7 8
2 5 ,0 3 8
2 8 ,4 1 2
3 1 ,4 1 0
3 4 ,1 7 0
3 5 ,0 2 0
3 7 ,5 6 6
21
8 ,8 9 7
9 ,9 1 5
1 0 ,2 8 3
1 1 ,5 9 1
1 3 ,2 4 0
1 5 ,4 4 5
2 6 ,1 7 1
2 9 ,6 1 5
3 2 ,6 7 1
3 5 ,4 7 9
3 6 ,3 4 3
3 8 ,9 3 2
22
9 ,5 4 2
1 0 ,6 0 0
1 0 ,9 8 2
1 2 ,3 3 8
1 4 ,0 4 1
1 6 ,3 1 4
2 7 ,3 0 1
3 0 ,8 1 3
3 3 ,9 2 4
3 6 ,7 8 1
3 7 ,6 5 9
4 0 ,2 8 9
23
1 0 ,1 9 6
1 1 ,2 9 3
1 1 ,6 8 9
1 3 ,0 9 1
1 4 ,8 4 8
1 7 ,1 8 7
2 8 ,4 2 9
3 2 ,0 0 7
3 5 ,1 7 2
3 8 ,0 7 6
3 8 ,9 6 8
4 1 ,6 3 8
24
1 0 ,8 5 6
1 1 ,9 9 2
1 2 ,4 0 1
1 3 ,8 4 8
1 5 ,6 5 9
1 8 ,0 6 2
2 9 ,5 5 3
3 3 ,1 9 6
3 6 ,4 1 5
3 9 ,3 6 4
4 0 ,2 7 0
4 2 ,9 8 0
25
1 1 ,5 2 4
1 2 ,6 9 7
1 3 ,1 2 0
1 4 ,6 1 1
1 6 ,4 7 3
1 8 ,9 4 0
3 0 ,6 7 5
3 4 ,3 8 2
3 7 ,6 5 2
4 0 ,6 4 6
4 1 ,5 6 6
4 4 ,3 1 4
26
1 2 ,1 9 8
1 3 ,4 0 9
1 3 ,8 4 4
1 5 ,3 7 9
1 7 ,2 9 2
1 9 ,8 2 0
3 1 ,7 9 5
3 5 ,5 6 3
3 8 ,8 8 5
4 1 ,9 2 3
4 2 ,8 5 6
4 5 ,6 4 2
27
1 2 ,8 7 9
1 4 ,1 2 5
1 4 ,5 7 3
1 6 ,1 5 1
1 8 ,1 1 4
2 0 ,7 0 3
3 2 ,9 1 2
3 6 ,7 4 1
4 0 ,1 1 3
4 3 ,1 9 5
4 4 ,1 4 0
4 6 ,9 6 3
28
1 3 ,5 6 5
1 4 ,8 4 7
1 5 ,3 0 8
1 6 ,9 2 8
1 8 ,9 3 9
2 1 ,5 8 8
3 4 ,0 2 7
3 7 ,9 1 6
4 1 ,3 3 7
4 4 ,4 6 1
4 5 ,4 1 9
4 8 ,2 7 8
29
1 4 ,2 5 6
1 5 ,5 7 4
1 6 ,0 4 7
1 7 ,7 0 8
1 9 ,7 6 8
2 2 ,4 7 5
3 5 ,1 3 9
3 9 ,0 8 7
4 2 ,5 5 7
4 5 ,7 2 2
4 6 ,6 9 3
4 9 ,5 8 8
30
1 4 ,9 5 3
1 6 ,3 0 6
1 6 ,7 9 1
1 8 ,4 9 3
2 0 ,5 9 9
2 3 ,3 6 4
3 6 ,2 5 0
4 0 ,2 5 6
4 3 ,7 7 3
4 6 ,9 7 9
4 7 ,9 6 2
5 0 ,8 9 2