Você está na página 1de 90

Universidade Federal Fluminense

Instituto de Matemtica e Estatstica

Fundamentos de Estatstica Aplicada


Mdulo IV: Introduo Inferncia Estatstica

Ana Maria Lima de Farias


Departamento de Estatstica
Contedo

1 Inferncia Estatstica Conceitos Bsicos 1

1.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Populao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Amostra Aleatria Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4 Estatsticas e Parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.5 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.6 Propriedades de Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 Distribuio amostral da mdia 13

2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2 Mdia e Varincia da Distribuio Amostral da Mdia . . . . . . . . . . . . . . . 13

2.3 Distribuio Amostral da Mdia Para Populaes Normais . . . . . . . . . . . . 14

2.4 Teorema Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.5 Distribuio amostral da proporo . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3 Intervalos de confiana baseados na distribuio normal 27

3.1 Ideias bsicas sobre intervalos de confiana . . . . . . . . . . . . . . . . . . . . . 27

3.1.1 Valores crticos da distribuio normal padro . . . . . . . . . . . . . . . 29

3.2 Intervalo de confiana para a mdia de uma populao normal com varincia
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.1 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Intervalo de confiana para uma proporo . . . . . . . . . . . . . . . . . . . . . 36

i
CONTEDO

3.3.1 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.4 Determinao do tamanho da amostra . . . . . . . . . . . . . . . . . . . . . . . . 39

3.5 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4 Testes de Hipteses: Conceitos bsicos 43

4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.2 Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2.1 Hipteses nula e alternativa . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2.2 Estatstica de Teste, Erros e Regra de Deciso . . . . . . . . . . . . . . . 51

4.2.3 Regio crtica e nvel de significncia . . . . . . . . . . . . . . . . . . . . 51

5 Testes de hipteses baseados na distribuio normal 53

5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.2 Teste de hiptese sobre a mdia de uma N(; 2 ): procedimento geral para 2
conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.3 Teste de hiptese sobre uma proporo populacional: procedimento geral para
grandes amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.4 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5.4.1 Procedimento geral para obteno do valor P . . . . . . . . . . . . . . . 65

5.4.2 Valor P e nvel de significncia . . . . . . . . . . . . . . . . . . . . . . . . 66

6 Inferncia sobre a mdia da N(; 2 ), 2 desconhecida 69

6.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6.2 A distribuio t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6.3 Tabela da t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

6.4 Intervalo de confiana para a mdia de uma populao normal com varincia
desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.4.1 Margem de Erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.4.2 Amostras Grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

Departamento de Estatstica - Ana Maria Farias ii


CONTEDO

6.5 Teste de hiptese sobre a mdia de uma populao normal com varincia
desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6.6 Resumo Comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.6.1 IC para a mdia de populaes normais . . . . . . . . . . . . . . . . . . . 79

6.6.2 IC para uma proporo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

6.6.3 IC para a mdia de populaes no-normais - amostra grande . . . . . 80

A Tabela da Distribuio Normal 83

Departamento de Estatstica - Ana Maria Farias iii


Captulo 1

Inferncia Estatstica Conceitos Bsicos

1.1 Introduo

No estudo da estatstica descritiva na primeira parte do curso, vimos que populao o con-
junto de elementos para os quais se deseja estudar determinada(s) caracterstica(s). Vimos
tambm que uma amostra um subconjunto da populao.

No estudo da inferncia estatstica, o objetivo principal obter informaes sobre uma


populao a partir das informaes de uma amostra e aqui vamos precisar de definies
mais formais de populao e amostra. Para facilitar a compreenso desses conceitos, iremos
apresentar alguns exemplos a ttulo de ilustrao.

EXEMPLO 1.1

Em um estudo antropomtrico em nvel nacional, uma amostra de 5000 adultos sele-


cionada dentre os adultos brasileiros e uma das variveis de estudo a altura.

Neste exemplo, a populao o conjunto de todos os brasileiros adultos. No entanto, o


interesse (um deles, pelo menos) est na altura dos brasileiros. Assim, nesse estudo, a cada
sujeito da populao associamos um nmero correspondente sua altura. Se determinado
sujeito sorteado para entrar na amostra, o que nos interessa esse nmero, ou seja, sua
altura.

Como vimos, essa a definio de varivel aleatria: uma funo que associa a cada
ponto do espao amostral um nmero real. Dessa forma, a nossa populao pode ser re-
presentada pela varivel aleatria X = altura do adulto brasileiro. Como essa uma v.a.
contnua, a ela est associada uma funo densidade de probabilidade f e da literatura,
sabemos que razovel supor que essa densidade seja a densidade  normal. Assim, nossa
populao, nesse caso, representada por uma v.a. X N ; 2 . Conhecendo os valores
de e , teremos informaes completas sobre a nossa populao.
CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

Uma forma de obtermos os valores de e medindo as alturas de todos os brasileiros


adultos. Mas esse seria um procedimento caro e demorado. Uma soluo, ento, estimar
esses parmetros a partir de uma amostra (subconjunto) da populao.

Suponhamos que essa amostra seja retirada com reposio e que os sorteios sejam
feitos de forma independente, isto , o resultado de cada extrao no altera o resultado das
demais extraes. Ao sortearmos o primeiro elemento, estamos realizando um experimento
que d origem v.a. X1 = altura do primeiro elemento; o segundo elemento d origem
v.a. X2 = altura do segundo elemento e assim por diante. Como as extraes so feitas
com reposio, todas as v.a. X1 , X2 , . . . tm a mesma distribuio, que reflete a distribuio
da altura de todos os brasileiros adultos. Para uma amostra especfica, temos os valores
observados x1 , x2 , . . . dessas variveis aleatrias. 

EXEMPLO 1.2

Consideremos, agora, um exemplo baseado em pesquisas eleitorais, em que estamos


interessados no resultado do segundo turno de uma eleio presidencial brasileira. Mais
uma vez, nossos sujeitos de pesquisa so pessoas com 16 anos ou mais, aptas a votar. O
interesse final saber a proporo de votos de um e outro candidato.

Vamos considerar uma situao simplificada em que no estamos considerando votos


nulos, indecisos etc. Ento, cada sujeito de pesquisa d origem a uma varivel aleatria
binria, isto , uma v.a. que assume apenas dois valores. Como visto, podemos representar
esses valores por 1 (candidato A) e 0 (candidato B), o que define uma varivel aleatria de
Bernoulli, ou seja, essa populao pode ser representada pela v.a. X Bern(p). O parmetro
p representa a probabilidade de um sujeito dessa populao votar no candidato A. Uma outra
interpretao que p representa a proporo populacional de votantes no candidato A.

Para obtermos informao sobre p, retira-se uma amostra da populao e, como an-
tes, vamos supor que essa amostra seja retirada com reposio. Ao sortearmos o primeiro
elemento, estamos realizando um experimento que d origem v.a. X1 = voto do primeiro
elemento; o segundo elemento d origem v.a. X2 = voto do segundo elemento e assim
por diante. Como as extraes so feitas com reposio, todas as v.a. X1 , X2 , . . . tm a mesma
distribuio de Bernoulli populacional, isto , Xi Bern(p), i = 1, 2, . . .. 

1.2 Populao

A inferncia estatstica trata do problema de se obter informao sobre uma populao a


partir de uma amostra. Embora a populao real possa ser constituda de pessoas, empresas,
animais etc. as pesquisas estatsticas buscam informaes sobre determinadas caracters-
ticas dos sujeitos, caractersticas essas que podem ser representadas por nmeros. Sendo
assim, a cada sujeito da populao est associado um nmero, o que nos permite apresentar
a seguinte definio.

Departamento de Estatstica - Ana Maria Farias 2


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

DEFINIO Populao

A populao de uma pesquisa estatstica pode ser representada por uma


varivel aleatria X que descreve a caracterstica de interesse.

Os mtodos de inferncia nos permitiro obter estimativas dos parmetros da distri-


buio de tal varivel aleatria, que pode ser contnua ou discreta.

1.3 Amostra Aleatria Simples

Como j dito, bastante comum o emprego da amostragem em pesquisas estatsticas. Nas


pesquisas por amostragem, uma amostra selecionada da populao de interesse e todas
as concluses sero baseadas apenas nessa amostra. Para que seja possvel inferir resul-
tados para a populao a partir da amostra, necessrio que esta seja representativa da
populao.

Embora existam vrios mtodos de seleo de amostras, vamos nos concentrar, aqui, no
caso mais simples, que a amostragem aleatria simples. Segundo tal mtodo, toda amostra
de mesmo tamanho n tem igual chance (probabilidade) de ser sorteada. possvel extrair
amostras aleatrias simples com e sem reposio. No entanto, para populaes grandes
ou infinitas extraes com e sem reposio levam a resultados muito semelhantes. Assim,
no estudo da Inferncia Estatstica, vamos sempre lidar com amostragem aleatria simples
com reposio. Esse mtodo de seleo atribui a cada elemento da populao a mesma
probabilidade de ser selecionado e esta probabilidade se mantm constante ao longo do
processo de seleo da amostra (se as extraes fossem sem reposio isso no aconteceria).

No restante desse curso, vamos omitir a expresso com reposio, ou seja, o termo
amostragem (ou amostra) aleatria simples sempre se referir amostragem com reposio.
Por simplicidade, muitas vezes abreviaremos o termo amostra aleatria simples por a.a.s..

Uma forma de se obter uma amostra aleatria simples escrever os nmeros ou no-
mes dos elementos da populao em cartes iguais, colocar esses cartes em uma urna
misturando-os bem e fazer os sorteios necessrios, tendo o cuidado de colocar cada carto
sorteado na urna antes do prximo sorteio. Na prtica, em geral, so usados programas de
computador, uma vez que as populaes tendem a ser muito grandes.

Agora vamos formalizar o processo de seleo de uma amostra aleatria simples, de


forma a relacion-lo com os problemas de inferncia estatstica que voc vai estudar.

Seja uma populao representada por uma varivel aleatria X . De tal populao
ser sorteada uma amostra aleatria simples com reposio de tamanho n. Como visto nos
exemplos anteriores, cada sorteio d origem a uma varivel aleatria Xi e, como os sorteios

Departamento de Estatstica - Ana Maria Farias 3


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

so com reposio, todas essas variveis tm a mesma distribuio de X . Isso nos leva
seguinte definio.

DEFINIO Amostra Aleatria Simples

Uma amostra aleatria simples (a.a.s.) de tamanho n de uma v.a. X (popu-


lao) um conjunto de n v.a. X1 , X2 , ..., Xn independentes e identicamente
distribudas (i.i.d.).

interessante notar a conveno usual: o valor observado de uma v.a. X representado


pela letra minscula correspondente. Assim, depois do sorteio de uma a.a.s. de tamanho n,
temos valores observados x1 , x2 , . . . , xn das respectivas variveis aleatrias.

1.4 Estatsticas e Parmetros

Obtida uma a.a.s., possvel calcular diversas caractersticas desta amostra, como, por exem-
plo, a mdia, a mediana, a varincia etc. Qualquer uma destas caractersticas uma funo
de X1 , X2 , ..., Xn e, portanto, o seu valor depende da amostra sorteada. Sendo assim, cada
uma dessas caractersticas ou funes tambm uma v.a. Por exemplo, a mdia amostral
a v.a. definida por
X1 + X2 + + Xn
X=
n
Isso nos leva seguinte definio.

DEFINIO Estimador

Uma estatstica amostral ou estimador T qualquer funo da amostra


X1 , X2 , ..., Xn , isto ,
T = g(X1 , X2 , ..., Xn )
onde g uma funo qualquer.

As estatsticas amostrais que consideraremos neste curso so:

mdia amostral
X1 + X2 + + Xn
X= (1.1)
n

Departamento de Estatstica - Ana Maria Farias 4


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

varincia amostral n
1 X 2
S =
2
Xi X (1.2)
n 1 i=1

Outras estatsticas possveis so o mnimo amostral, o mximo amostral, a amplitude


amostral etc.

Para uma amostra especfica, o valor obtido para o estimador ser denominado estima-
tiva e eesas estimativas, em geral, sero representadas por letras minsculas. Por exemplo,
temos as seguintes notaes correspondentes mdia e varincia amostrais: x e s2 .

De forma anloga, temos as caractersticas de interesse da populao. No entanto,


para diferenciar as duas situaes (populao e amostra), atribumos nomes diferentes.

DEFINIO Parmetro

Parmetro uma caracterstica da populao.

Assim, se a populao representada pela v.a. X, alguns parmetros so a esperana


E(X ) e a varincia V ar(X ) de X .

Com relao s caractersticas mais usuais, vamos usar a seguinte notao:

Caracterstica Populao Amostra

Mdia X
Varincia 2 S2
Nmero de elementos N n

1.5 Distribuies Amostrais

Nos problemas de inferncia, estamos interessados em estimar um parmetro da populao


por meio de uma a.a.s. X1 , X2 , ..., Xn . Para isso, usamos uma estatstica T (por exemplo, a
mdia amostral) e, com base no valor obtido para T , a partir de uma amostra particular,
iremos tomar as decises que o problema exige. J foi dito que T uma v.a., uma vez que
depende da amostra sorteada; amostras diferentes fornecero diferentes valores para T .

EXEMPLO 1.3

Departamento de Estatstica - Ana Maria Farias 5


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

Consideremos a populao {1, 3, 6, 8}, isto , este o conjunto dos valores da caracte-
rstica de interesse da populao em estudo. Assim, para esta populao, ou seja, para essa
v.a. X , temos

1
E(X ) = = (1 + 3 + 6 + 8) = 4, 5
4
1h i
V ar(X ) = 2 = (1 4, 5)2 + (3 4, 5)2 + (6 4, 5)2 + (8 4, 5)2 = 7, 25
4

Suponha que o objetivo do estudo seja estimar a mdia populacional a partir de uma
a.a.s. de tamanho dois. Para isso, usaremos a estatstica mdia amostral X .

Algumas possibilidades de amostra so {1,1}, {1,3}, {6,8}, para as quais os valores da


mdia amostral so 1, 2 e 7, respectivamente. Podemos ver, ento, que h uma variabilidade
nos valores da estatstica e, assim, seria interessante que conhecssemos tal variabilidade.
Conhecendo tal variabilidade, teremos condies de saber quo infelizes podemos ser no
sorteio da amostra.

No exemplo acima, as amostras {1,1} e {8,8} so as que tm mdia amostral mais


afastada da verdadeira mdia populacional. Se esses valores tiverem chance muito mais alta
do que os valores mais prximos de E(X ), podemos ter srios problemas.

Para conhecer o comportamento da mdia amostral, teramos que conhecer todos os


possveis valores de X , o que equivaleria a conhecer todas as possveis amostras de tamanho
dois de tal populao. Nesse exemplo, como s temos quatro elementos na populao, a
obteno de todas as a.a.s. de tamanho dois no difcil.

Como o sorteio feito com reposio, em cada um dos sorteios temos quatro possibili-
dades. Logo, o nmero total de amostras aleatrias simples 4 4 = 16. Por outro lado, em
cada sorteio, cada elemento da populao tem a mesma chance de ser sorteado; como so
quatro elementos, cada elemento tem probabilidade 1/4 de ser sorteado. Finalmente, como
os sorteios so independentes, para obter a probabilidade de um par de elementos pertencer
amostra, basta multiplicar as probabilidades (lembre-se que P(A B) = P(A) P(B) quando
A e B so independentes).

Na tabela a seguir, listamos todas as possveis amostras, com suas respectivas proba-
bilidades e para cada uma delas, apresentamos o valor da mdia amostral.

Departamento de Estatstica - Ana Maria Farias 6


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

Amostra Probabilidade Mdia amostral x


(1, 1) (1/4) (1/4) = 1/16 (1 + 1)/2 = 1
(1, 3) (1/4) (1/4) = 1/16 (1 + 3)/2 = 2
(1, 6) (1/4) (1/4) = 1/16 (1 + 6)/2 = 3, 5
(1, 8) (1/4) (1/4) = 1/16 (1 + 8)/2 = 4, 5
(3, 1) (1/4) (1/4) = 1/16 (3 + 1)/2 = 2
(3, 3) (1/4) (1/4) = 1/16 (3 + 3)/2 = 3
(3, 6) (1/4) (1/4) = 1/16 (3 + 6)/2 = 4, 5
(3, 8) (1/4) (1/4) = 1/16 (3 + 8)/2 = 5, 5
(6, 1) (1/4) (1/4) = 1/16 (6 + 1)/2 = 3, 5
(6, 3) (1/4) (1/4) = 1/16 (6 + 3)/2 = 4, 5
(6, 6) (1/4) (1/4) = 1/16 (6 + 6)/2 = 6
(6, 8) (1/4) (1/4) = 1/16 (6 + 8)/2 = 7
(8, 1) (1/4) (1/4) = 1/16 (8 + 1)/2 = 4, 5
(8, 3) (1/4) (1/4) = 1/16 (8 + 3)/2 = 5, 5
(8, 6) (1/4) (1/4) = 1/16 (8 + 6)/2 = 7
(8, 8) (1/4) (1/4) = 1/16 (8 + 8)/2 = 8

Analisando esta tabela, podemos ver que os possveis valores de X so 1; 2; 3; 3,5;


4,5; 5,5; 6; 7; 8 e podemos construir a sua distribuio de probabilidade, notando, por
exemplo, que o valor 2 pode ser obtido por meio de duas amostras: (1,3) ou (3,1). Como
essas amostras correspondem a eventos mutuamente exclusivos, a probabilidade de se obter
uma mdia amostral igual a 2

P(X = 2) = P({1, 3} {3, 1})


= P({1, 3}) + P({3, 1})
1 1 2
= + =
16 16 16
Com o mesmo raciocnio, obtemos a seguinte distribuio de probabilidade para X :

x 1 2 3 3, 5 4, 5 5, 5 6 7 8
P(X = x) 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 1/16

Note que a v.a. de interesse aqui X ! Da segue que

1 2 1 2
E(X ) = 1 +2 +3 + 3, 5 +
16 16 16 16
5 2 1 2 1
+4, 5 + 5, 5 +6 +7 +8
16 16 16 16 16

= 4, 5 =

Departamento de Estatstica - Ana Maria Farias 7


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

1 2 1
Var(X ) = (1 4, 5)2 + (2 4, 5)2 + (3 4, 5)2 +
16 16 16
2 5 2
+(3, 5 4, 5)2 + (4, 5 4, 5)2 + (5, 5 4, 5)2 +
16 16 16
1 2 1
+(6 4, 5)2 + (7 4, 5)2 + (8 4, 5)2
16 16 16
7, 25 2 2
= 3, 625 = = =
2 2 n

Neste exemplo, podemos ver que E(X ) = e Var(X ) = 2 , onde 2 o tamanho da


2

amostra. Esses resultados esto nos dizendo que a mdia (esperana) da estatstica X
igual mdia da populao e que sua varincia igual varincia da populao dividida
pelo tamanho da amostra.

Nas Figuraa 1.1 e 1.2, temos os grficos da funo de distribuio de probabilidade de


X (populao) e de X (amostra), respectivamente. Podemos ver que a mdia de ambas 4,5
(ambas so simtricas em torno de 4,5) e que a distribuio de X tem menor disperso em
torno dessa mdia. Note que essa mdia e essa varincia so calculadas ao longo de todas
as possveis a.a.s. de tamanho 2. 

Figura 1.1 Populao {1, 3, 6, 8} - Figura 1.2 Populao {1, 3, 6, 8} -


Distribuio de X Distribuio de X

EXEMPLO 1.4

Consideremos, agora, a situao em que se deseja estimar a varincia populacional, uma


medida de disperso. Como j visto, a varincia populacional V ar(X ) = 7, 25. Vamos
considerar dois estimadores:
n
1X 2
b 2 = Xi X (1.3)
n i=1
n
1 X 2
S2 = Xi X (1.4)
n 1 i=1

Departamento de Estatstica - Ana Maria Farias 8


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

Da mesma forma que fizemos para a mdia amostral, vamos calcular o valor dessas
estatsticas para cada uma das amostras.

Na tabela abaixo, temos os resultados parciais e globais de interesse.

2
P
Amostra x (x1 x)2 (x2 x)2 (xi x)2 S2 b 2
i=1
(1, 1) 1 (1 1)2 (1 1)2 0 0 0
(1, 3) 2 (1 2)2 (3 2)2 2 2 1
(1, 6) 3, 5 (1 3, 5)2 (6 3, 5)2 12, 5 12, 5 6, 25
(1, 8) 4, 5 (1 4, 5)2 (8 4, 5)2 24, 5 24, 5 12, 25
(3, 1) 2 (3 2)2 (1 2)2 2 2 1
(3, 3) 3 (3 3)2 (3 3)2 0 0 0
(3, 6) 4, 5 (3 4, 5)2 (6 4, 5)2 4, 5 4, 5 2, 25
(3, 8) 5, 5 (3 5, 5)2 (8 5, 5)2 12, 5 12, 5 6, 25
(6, 1) 3, 5 (6 3, 5)2 (1 3, 5)2 12, 5 12, 5 6, 25
(6, 3) 4, 5 (6 4, 5)2 (3 4, 5)2 4, 5 4, 5 2, 25
(6, 6) 6 (6 6)2 (6 6)2 0 0 0
(6, 8) 7 (6 7)2 (8 7)2 2 2 1
(8, 1) 4, 5 (8 4, 5)2 (1 4, 5)2 24, 5 24, 5 12, 25
(8, 3) 5, 5 (8 5, 5)2 (3 5, 5)2 12, 5 12, 5 6, 25
(8, 6) 7 (8 7)2 (6 7)2 2 2 1
(8, 8) 8 (8 8)2 (8 8)2 0 0 0

Podemos ver que a funo de distribuio de probabilidade de S 2 :

s2 0 2 4, 5 12, 5 24, 5
P(S 2 = s2 ) 4/16 4/16 2/16 4/16 2/16

e a funo de distribuio de probabilidade de b 2 :


k 0 1 2, 25 6, 25 12, 25
2 = k)
P(b 4/16 4/16 2/16 4/16 2/16

Para essas distribuies, temos:


4 4 2 4 2
E(S 2 ) = 0 +2 + 4, 5 + 12, 5 + 24, 5
16 16 16 16 16
116
= = 7, 25 = 2 = V ar(X )
16
4 4 2 4 2
2) = 0
E(b +1 + 2, 25 + 6, 25 + 12, 25
16 16 16 16 16
58
= = 3, 625
16
Departamento de Estatstica - Ana Maria Farias 9
CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

Vemos, ento que a mdia de S 2 igual varincia populacional, o que no ocorre com
b .
2


Estes dois exemplos ilustram o fato de que qualquer estatstica amostral T uma
varivel aleatria, que assume diferentes valores para cada uma das diferentes amostras.
Tais valores nos forneceriam, juntamente com a probabilidade de cada amostra, a funo de
distribuio de probabilidades de T , caso fosse possvel obter todas as a.a.s. de tamanho n
da populao.

Isso nos leva seguinte definio, que um conceito central na Inferncia Estatstica.

DEFINIO Distribuio amostral de um estimador

A distribuio amostral de um estimador T a distribuio de probabili-


dades de T ao longo de todas as possveis amostras de tamanho n.

Podemos ver que a obteno da distribuio amostral de qualquer estatstica T um


processo to ou mais complicado do que se trabalhar com a populao inteira. Na prtica,
o que temos uma nica amostra e com esse resultado que temos de tomar as decises
pertinentes ao problema em estudo. Esta tomada de deciso, no entanto, ser facilitada se
conhecermos resultados tericos sobre o comportamento da distribuio amostral.

1.6 Propriedades de Estimadores

No exemplo anterior, relativo varincia amostral, vimos que E(S 2 ) = 2 e E(b


2 ) 6= 2 .
Analogamente, vimos tambm que E(X ) = . Vamos entender direito o que esses resultados
significam, antes de passar definio formal da propriedade envolvida.

Dada uma populao, existem vrias a.a.s. de tamanho n que podem ser sorteadas.
Cada uma dessas amostras resulta em um valor diferente da estatstica de interesse (X e
S 2 , por exemplo). O que esses resultados esto mostrando como esses diferentes valores
se comportam em relao ao verdadeiro (mas desconhecido) valor do parmetro.

Considere a Figura 1.3, em que o alvo representa o valor do parmetro e os tiros,


indicados pelo smbolo x, representam os diferentes valores amostrais da estatstica de in-
teresse.

Nas partes (a) e (b) da figura, os tiros esto distribudas em torno do alvo, enquanto
nas partes (c) e (d) isso no acontece. Comparando as partes (a) e (b), podemos ver que na
parte (b), os tiros esto mais concentrados em torno do alvo, isto , tm menor disperso.
Isso reflete uma pontaria mais certeira do atirador em (b).

Departamento de Estatstica - Ana Maria Farias 10


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

(a) (b)

(c) (d)

Figura 1.3 Propriedades de estimadores

Analogamente, nas partes (c) e (d), embora ambos os atiradores estejam com a mira
deslocada, os tiros do atirador (d) esto mais concentrados em torno de um alvo; o desloca-
mento poderia at ser resultado de um desalinhamento da arma. J o atirador (c), alm de
estar com o alvo deslocado, ele tem os tiros mais espalhados, o que reflete menor preciso.

Traduzindo esta situao para o contexto de estimadores e suas propriedades, temos o


seguinte:

Nas partes (a) e (b), temos dois estimadores que fornecem estimativas centradas em
torno do verdadeiro valor do parmetro, ou seja, as diferentes amostras fornecem valores
distribudos em torno do verdadeiro valor do parmetro. A diferena que em (a) esses
valores esto mais dispersos e, assim, temos mais chance de obter uma amostra infeliz,
ou seja, uma amostra que fornea um resultado muito afastado do valor do parmetro.
Essas duas propriedades esto associadas esperana e varincia do estimador, que
so medidas de centro e disperso, respectivamente.

Nas partes (c) e (d), as estimativas esto centradas em torno de um valor diferente do
parmetro de interesse e, na parte (c), a disperso maior.

Temos, assim, ilustrados os seguintes conceitos.

Departamento de Estatstica - Ana Maria Farias 11


CAPTULO 1. INFERNCIA ESTATSTICA CONCEITOS BSICOS

DEFINIO Estimador no-viesado

Um estimador T dito um estimador no-viesado do parmetro , se


E(T ) = .

Como nos exemplos vistos, essa esperana calculada ao longo de todas as possveis
amostras, ou seja, a esperana da distribuio amostral de T . Nas partes (a) e (b) da Figura
1.3 os estimadores so no-viesados e nas partes (c) e (d), os estimadores so viesados.

Com relao aos estimadores X , S 2 e b 2 , temos que os dois primeiros so no-viesados


para estimar a mdia e a varincia populacionais, respectivamente, enquanto b 2 viesado
para estimar a varincia populacional. Essa a razo para se usar S 2 , e no b 2 .

DEFINIO Eficincia de um estimador

Se T1 e T2 so dois estimadores no-viesados do parmetro , diz-se que


T1 mais eficiente que T2 , se Var(T1 ) < Var(T2 ).

Na Figura 1.3, o estimador da parte (b) mais eficiente que o estimador da parte (a).

Departamento de Estatstica - Ana Maria Farias 12


Captulo 2

Distribuio amostral da mdia

2.1 Introduo

Na Inferncia Estatstica, o objetivo obter informao sobre uma populao a partir de uma
amostra. Vimos, no captulo anterior, que uma populao estatstica representada por uma
varivel aleatria X e, assim, um dos parmetros de interesse a mdia (ou esperana) dessa
varivel. Neste captulo estudaremos as propriedades da mdia amostral X como estimador
da mdia populacional . Como visto anteriormente, tais propriedades so definidas a partir
da distribuio amostral de X , que a distribuio de probabilidade ao longo de todas as
possveis amostras aleatrias simples de tamanho n.

2.2 Mdia e Varincia da Distribuio Amostral da Mdia

No captulo anterior, vimos, por meio de exemplos, que a mdia amostral X um estimador
no-viesado da mdia populacional . Na verdade, temos o seguinte resultado geral.

! Mdia e Varincia de X

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de uma


populao representada pela varivel aleatria X com mdia e varincia
2 . Ento,

E(X ) = (2.1)
2
Var(X ) = (2.2)
n
CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

importante notar que esse resultado se refere a qualquer populao X . O que ele
estabelece que as mdias amostrais das diferentes amostras aleatrias simples de tamanho
n tendem a acertar o alvo da mdia populacional ; lembre-se da Figura 1.3, partes (a) e
(b). Alm disso, medida que o tamanho amostral n aumenta, a disperso em torno do alvo,
medida por V ar(X ), vai diminuindo e tende a zero quando n .

O desvio-padro da distribuio amostral de qualquer estatstica usualmente cha-



mado de erro-padro. Ento, o erro-padro da mdia amostral EP(X ) = .
n

2.3 Distribuio Amostral da Mdia Para Populaes Nor-


mais

Na prtica estatstica, vrias populaes podem ser descritas, aproximadamente, por uma
distribuio normal. Obviamente, o teorema anterior continua valendo no caso de uma po-
pulao normal, mas temos uma caracterstica a mais da distribuio amostral da mdia: ela
tambm normal.

! Distrbuio amostral de X para populaes normais

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de uma


populao normal, isto , uma populao representada por uma varivel
aleatria normal X com mdia e varincia 2 . Ento, a distribuio
amostral da mdia amostral X normal com mdia e varincia 2 /n, ou
seja,  
 2
X N ; = X N ;
2
(2.3)
n

Na Figura 2.1 ilustra-se o comportamento da distribuio amostral de X com base


em amostras de tamanho n = 4 retiradas de uma populao X N(2; 32 ). A ttulo de
comparao, apresenta-se tambm a distribuio populacional. Podemos ver que ela mais
dispersa que a distribuio amostral de X , mas ambas esto centradas no verdadeiro valor
populacional = 2.

EXEMPLO 2.1 Carga de elevador

A capacidade mxima de um elevador de 500kg. Se a distribuio dos pesos dos


usurios N(70; 100), qual a probabilidade de que sete pessoas ultrapassem este limite?
E de seis pessoas?

Departamento de Estatstica - Ana Maria Farias 14


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

Figura 2.1 Distribuio amostral de X com base em aas de tamanho n = 2 de uma


populao N(2; 9).

Soluo

Podemos considerar os sete passageiros como uma amostra aleatria simples da po-
pulao de todos os usurios, representada pela v.a. X N(70; 100). Seja, ento, X1 , . . . , X7
uma aas de tamanho n = 7. Se o peso mximo 500kg, para que sete pessoas ultrapassem
o limite de segurana temos de ter
7
X 7
1X 500
Xi > 500 Xi > X > 71, 729
i=1
7 i=1 7

Mas, por (2.3), sabemos que  


100
X N 70;
7
Logo,

X 70 71, 729 70
Pr(X > 71, 729) = Pr q > q
100 100
7 7
= Pr(Z > 0, 46) = 0, 5 tab(0, 46)
= 0, 5 0, 17724 = 0, 32276

Departamento de Estatstica - Ana Maria Farias 15


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

Com seis pessoas teramos de ter



 
500 83, 333 70
Pr X > = Pr Z > q
6 100
7
= Pr(Z > 3, 53) = 0, 5 tab(3, 53)
= 0, 5 0, 49979 = 0, 00021

Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de sete pessoas
ultrapassarem o limite de segurana. J com seis pessoas, essa probabilidade bastante
pequena. Assim, o nmero mximo de pessoas no elevador deve ser estabelecido como seis

ou menos.

EXEMPLO 2.2

Considere uma populao representada por X N(100, 102 ).

(a) Calcule P(90 < X < 110).

(b) Se X a mdia de uma amostra aleatria simples de 16 elementos retirados dessa


populao, calcule P(90 < X < 110).

(c) Construa, em um nico sistema de coordenadas, os grficos das distribuies de X e X .

(d) Que tamanho deveria ter a amostra para que P(90 < X < 110) = 0, 95?

Soluo

(a)
 
90 100 110 100
P(90 < X < 110) = P <Z < = P(1 < Z < 1)
10 10
= 2 P(0 < Z < 1) = 2 tab(1, 0) = 0, 68268

(b) Com n = 16, resulta que X N 100; 100
16

90 100 110 100
P(90 < X < 110) = P q <Z < q
100 100
16 16
= P(4 < Z < 4) = 2 P(0 < Z < 4) = 2 tab(4, 0) 1, 00

Departamento de Estatstica - Ana Maria Farias 16


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

Figura 2.2 Distribuio amostral de X com base em aas de tamanho n = 16 de uma


populao N(100; 100).

(c) Veja a Figura 2.2. Como visto, a distribuio amostral com n = 16 menos dispersa que
a distribuio populacional e, ento, podemos ver que, entre 90 e 110, temos concentrada
praticamente toda a distribuio de X .
(d)

P(90 < X < 110) = 0, 95



90 100 110 100
P q <Z < q = 0, 95
100 100
n n

P( n < Z < n) = 0, 95

2 P(0 < Z < n) = 0, 95

2 tab( n) = 0, 95

tab( n) = 0, 475Leftrightarrow

n = 1, 96 n 4

A ttulo de ilustrao, apresentam-se na Figura 2.3 as distribuies amostrais de X para


n = 16 e n = 4, juntamente com a distribuio populacional.


EXEMPLO 2.3 Regulagem de mquinas

A mquina de empacotar um determinado produto o faz segundo uma distribuio nor-


mal, com mdia e desvio padro 10g.

Departamento de Estatstica - Ana Maria Farias 17


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

Figura 2.3 Distribuio amostral de X com base em aas de tamanho n = 16 e n = 4 de


uma populao N(100; 100).

(a) Em quanto deve ser regulado o peso mdio para que apenas 10% dos pacotes tenham
menos do que 500g?

(b) Com a mquina assim regulada, qual a probabilidade de que o peso total de quatro
pacotes escolhidos ao acaso seja inferior a 2kg?

Soluo

(a) Seja X a varivel aleatria que representa o peso dos pacotes. Sabemos, ento, que
X N(; 100). Queremos que

P(X < 500) = 0, 10


 
X 500
P < = 0, 10
10 10
 
500
P Z < = 0, 10
10

Ento, na densidade normal padro, esquerda da abscissa 500


10
temos que ter uma rea
(probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Usando a simetria da
densidade normal, temos as seguintes equivalncias:

Departamento de Estatstica - Ana Maria Farias 18


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

 
500
P Z< = 0, 10
10
 
500
P Z > = 0, 10
10
 
500
P Z> = 0, 10
10
 
500
P 0Z = 0, 40
10
 
500
tab = 0, 40
10
500
= 1, 28 = 512, 8 g
10

Veja a Figura 2.4 onde so ilustradas essas equivalncias.

Figura 2.4 Soluo do Exemplo 2.3

4
P
(b) Sejam X1, X2 , X3 , X4 os pesos dos 4 pacotes da amostra. Queremos que Xi < 2000g.
i=1
Isso equivalente a X < 500. Logo,

Departamento de Estatstica - Ana Maria Farias 19


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA


X 512, 8 500 512, 8
P(X < 500) = P q < q
100 100
4 4
= P(Z < 2, 56) = P(Z > 2, 56)
= 0, 5 P(0 Z 2, 56)
= 0, 5 tab(2, 56)
= 0, 5 0, 49477 = 0, 00523
Com a mquina regulada para 512,8g, h uma probabilidade de 0,00523 de que uma
amostra de 4 pacotes apresente peso mdio inferior a 500g. Note que com um pacote
apenas, essa probabilidade de 10%. Por isso, as inspees de controle de qualidade
so sempre feitas com base em amostras de tamanho n > 1.


EXEMPLO 2.4 Regulagem de mquinas continuao

Volte ao Exemplo 2.3. Depois de regulada a mquina, prepara-se uma carta de controle de
qualidade. Uma amostra de 4 pacotes ser sorteada a cada hora. Se a mdia da amostra for
inferior a 497g ou superior a 520g, a produo deve ser interrompida para ajuste da mquina,
isto , ajuste do peso mdio.

(a) Qual a probabilidade de uma parada desnecessria?


(b) Se a mquina se desregulou para = 500g, qual a probabilidade de se continuar a
produo fora dos padres desejados?

Soluo

Com a mquina regulada, temos que X N(512, 8; 100)

(a) Parada desnecessria: amostra indica que o processo est fora de controle (X < 497 ou
X > 520), quando, na verdade, o processo est ajustado ( = 512, 8). Neste caso, pode-
mos usar a notao de probabilidade condicional para auxiliar na soluo do exerccio.
Queremos calcular
   
P X < 497 X > 520 | X N 512, 8; 100 4
   
= P X < 497 | X N (512, 8; 25) + P X > 520 | X N (512, 8; 25)
   
497 512, 8 520 512, 8
= P Z < +P Z >
5 5
= P(Z < 3, 16) + P(Z > 1, 44)
= P(Z > 3, 16) + Pr(Z > 1, 44)
= [0, 5 tab(3, 16)] + [0, 5 tab(1, 44)]
= 1, 0 0, 49921 0, 42507
= 0, 07572

Departamento de Estatstica - Ana Maria Farias 20


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

(b) Agora queremos


 
P 497 X 520 | X N(500; 25)
 
497 500 520 500
= P Z
5 5
= P(0, 6 Z 4)
= P(0, 6 Z < 0) + Pr(0 Z 4)
= P(0 Z 0, 6) + Pr(0 Z 4)
= tab(0, 6) + tab(4, 0)
= 0, 72572

Note que a probabilidade de uma parada desnecessria pequena, custa de uma alta
probabilidade de se operar fora de controle.

2.4 Teorema Limite Central

Os resultados vistos anteriormente so vlidos para populaes normais, isto , se uma


populao normal com mdia e varincia 2 , ento a distribuio amostral de X tambm
normal com mdia e varincia 2 /n, onde n o tamanho da amostra. O Teorema Limite
Central, que veremos a seguir, nos fornece um resultado anlogo para qualquer distribuio
populacional, desde que o tamanho da amostra seja suficientemente grande.

! Teorema Limite Central

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X


tal que E(X ) = e Var(X ) = 2 . Ento, a distribuio de X converge
para a distribuio normal com mdia e varincia 2 /n quando n .
Equivalentemente,
X
N(0, 1) (2.4)

n

A interpretao prtica do Teorema Limite Central a seguinte: para amostras gran-


des de qualquer populao, podemos aproximar a distribuio amostral de X por uma dis-
tribuio normal com a mesma mdia populacional e varincia igual varincia populacional
dividida pelo tamanho da amostra.

Quo grande deve ser a amostra para se obter uma boa aproximao depende das
caractersticas da distribuio populacional. Se a distribuio populacional no se afastar

Departamento de Estatstica - Ana Maria Farias 21


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

muito de uma distribuio normal, a aproximao ser boa, mesmo para tamanhos pequenos
de amostra. Na Figura 2.5 ilustra-se esse teorema para uma distribuio exponencial com
parmetro = 1 (essa distribuio faz parte de uma outra famlia de distribuies contnuas).
O grfico superior representa a distribuio populacional e os histogramas representam a
distribuio amostral de X ao longo de 5.000 amostras de tamanhos 10, 50, 100 e 5000.
Assim, podemos ver que, embora a populao seja completamente diferente da normal, a
distribuio amostral de X vai se tornando cada vez mais prxima da normal medida que
n aumenta.

Figura 2.5 Ilustrao do Teorema Limite Central para uma populao X exp(1)

Em termos prticos, esse teorema de extrema importncia, por isso chamado teorema
central e, em geral, amostras de tamanho n > 30 j fornecem uma aproximao razovel.

EXEMPLO 2.5 Honestidade de uma moeda

Uma moeda lanada 50 vezes, com o objetivo de se verificar sua honestidade. Se


ocorrem 36 caras nos 50 lanamentos, o que podemos concluir?

Soluo

Neste caso, a populao pode ser representada por uma varivel de Bernoulli X com
parmetro p, isto , X assume o valor 1 com probabilidade p na ocorrncia de cara e assume
o valor 0 com probabilidade 1 p na ocorrncia de coroa. Para uma varivel de Bernoulli,
temos que E(X ) = p e Var(X ) = p(1 p). Como so feitos 50 lanamentos, o tamanho da
amostra 50 (n grande!) e, pelo Teorema Limite Central, X aproximadamente normal com
mdia E(X ) = p e varincia Var(X ) = p(1p)
50
.

Departamento de Estatstica - Ana Maria Farias 22


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

Suponhamos que a moeda seja honesta, isto , que p = 1/2. Nessas condies, qual
a probabilidade de obtermos 36 caras em 50 lanamentos? Com a hiptese de honestidade
da moeda, o Teorema Limite Central nos diz que
!
1 12 21
X N ;
2 50
A probabilidade de se obter 36 ou mais caras em 50 lanamentos equivalente probabili-
dade de X ser maior ou igual a 50
36
= 0, 72 e essa probabilidade

X 0, 5 0, 72 0, 5
P(X 0, 72) = P q q
1 1
200 200
= P(Z 3, 11) = 0, 5 Pr(0 Z < 3, 11) =
= 0, 5 tab(3, 11) = 0, 5 0, 49906 = 0, 00094

Note que essa probabilidade bastante pequena, ou seja, h uma pequena probabili-
dade de obtermos 36 ou mais caras em 50 lanamentos de uma moeda honesta. Isso pode
nos levar a suspeitar sobre a honestidade da moeda! 

EXEMPLO 2.6 Garrafas de refrigerante

A diviso de inspeo do Departamento de Pesos e Medidas de uma determinada cidade


est interessada em calcular a real quantidade de refrigerante que colocada em garrafas de
dois litros, no setor de engarrafamento de uma grande empresa de refrigerantes. O gerente
do setor de engarrafamento informou diviso de inspeo que o desvio padro para garrafas
de dois litros de 0,05 litro. Uma amostra aleatria de 100 garrafas de dois litros, obtida
deste setor de engarrafamento, indica uma mdia de 1,985 litro. Qual a probabilidade de
se obter uma mdia amostral de 1,985 ou menos, caso a afirmativa do gerente esteja certa?
O que se pode concluir?

Soluo

Afirmativa do gerente:  = 2 e  = 0, 05. Como n = 100, podemos usar o Teorema


0, 052
Limite Central. Logo, X N 2; .
100
!
1, 985 2
P(X 1, 985) = P Z 0,05
10
= P(Z 3, 0) = P(Z 3, 0)
= 0, 5 tab(3, 0) = 0, 5 0, 49865 = 0, 00135

A probabilidade de se obter esse valor nas condies dadas pelo gerente muito
pequena, o que pode nos fazer suspeitar da veracidade das afirmativas. provvel que ou a
mdia no seja 2 (e, sim, menor que 2), ou o desvio-padro no seja 0,05 (e, sim, maior que
0,05). 

Departamento de Estatstica - Ana Maria Farias 23


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

2.5 Distribuio amostral da proporo

Consideremos, agora, uma populao em que cada elemento classificado de acordo com
a presena ou ausncia de determinada caracterstica. Por exemplo, podemos pensar em
eleitores escolhendo entre dois candidatos, pessoas classificadas de acordo com o sexo,
trabalhadores classificados como trabalhador com carteira assinada ou no, e assim por
diante. Em termos de varivel aleatria, essa populao representada por uma varivel de
Bernoulli, isto :

X=
1, se elemento possui a caracterstica de interesse
0, se elemento no possui a caracaterstica de interesse

Vamos denotar por p a proporo de elementos da populao que possuem a caracte-


rstica de interesse. Ento,

P(X = 1) = p
E(X ) = p
Var(X ) = p(1 p)

Em geral, o parmetro p desconhecido e precisamos estim-lo a partir de uma amostra,


da mesma forma como fizemos no caso da mdia de uma populao normal. Ento, seja
X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X Bern(p). Sabemos que

E(X ) = E(X ) = p
Var(X ) p(1 p)
Var(X ) = =
n n
Mas, note que X nada mais que a proporo dos elementos da amostra que possuem
a caracterstica de interesse, ou seja, X a proporo amostral, que denotaremos por P.
b
Resulta, ento, que Pb um estimador no-viesado para a proporo populacional p.

Pelo Teorema Limite Central, se n for suficientemente grande, ento


 
p(1 p)
X N p;
n

A aproximao dada pelo Teorema Limite Central ser melhor para valores grandes de n.
Existe uma seguinte regra emprica para nos ajudar a decidir o que grande, conforme
explicado a seguir.

Departamento de Estatstica - Ana Maria Farias 24


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

! Distribuio amostral da proporo amostral

Seja X1 , X2 , , Xn uma amostra aleatria simples de uma populao


X Bern(p). Para n suficientemente grande, a distribuio da proporo
amostral pode ser aproximada pela distribuio normal com mdia = p
p(1 p)
e varincia 2 = , isto ,
n
 
p(1 p)
P N p;
b (2.5)
n

Essa aproximao pode ser usada se as seguintes condies forem satis-


feitas:

1. np 10

2. n(1 p) 10

EXEMPLO 2.7 Itens defeituosos num lote

De um grande lote de produtos manufaturados, extrai-se uma amostra aleatria simples


de 200 itens. Se 10% dos itens do lote so defeituosos, calcule a probabilidade de serem
sorteados no mximo 24 itens defeituosos.

Soluo

As condies para utilizao da aproximao normal so vlidas, pois com n = 200 e


p = 0, 1 temos que:
200 0, 1 = 20 > 10
200 0, 9 = 180 > 10
Ter no mximo 24 itens defeituosos na amostra equivale a ter uma proporo amostral de,
no mximo, 0,12. Ento, o problema pede

b 0, 12) = P rP 0, 1 r 0, 12 0, 1
b
P(P 0, 1 0, 9

0, 1 0, 9
200 200
P(Z 0, 9428) = 0, 5 + tab(0, 94) = 0, 8264

O valor exato Pr(X 24) = 0, 855106. 

EXEMPLO 2.8 Confiabilidade de componentes

Departamento de Estatstica - Ana Maria Farias 25


CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

A confiabilidade de um componente a probabilidade de que ele funcione sob as con-


dies desejadas. Uma amostra aleatria simples de 2500 desses componentes extrada e
cada componente testado. Calcule a probabilidade de obtermos pelo menos 75 itens defei-
tuosos supondo que a confiabilidade do item seja:

(a) 0,995

(b) 0,85

Soluo

Ter pelo menos 75 defeituosos equivalente a ter uma proporo de defeituosos de


pelo menos 0,03.

(a) Se a confiabilidade 0,995, ento a probabilidade de o item ser defeituoso 0,005.


Note que 2500 0, 005 = 12, 5 e 2500 0, 995 = 2487, 5 de modo que podemos usar a
aproximao normal.

b 0, 03) = P r P 0, 005 0, 03 0, 005


b
P(P 0, 005 0, 9995 r
0, 005 0, 995
2500 25000
P(Z 17, 7) 0

(b) Se a confiabilidade 0,85, ento a probabilidade de o item ser defeituoso 0,15. Note
que 2500 0, 15 = 375 e 1.000 0, 85 = 2125, de modo que podemos usar a aproximao
normal.

b 0, 03) = P r P 0, 15 0, 03 0, 15
b
P(P 0, 15 0, 85 r 0, 15 0, 85

2500 2500
P(Z 16, 8) 1


Departamento de Estatstica - Ana Maria Farias 26


Captulo 3

Intervalos de confiana baseados na


distribuio normal

3.1 Ideias bsicas sobre intervalos de confiana

O objetivo central da Inferncia Estatstica obter informaes para uma populao a partir
do conhecimento de uma nica amostra. Em geral, a populao representada por uma
varivel aleatria X , com funo de distribuio ou densidade de probabilidade fX .

Dessa populao, ento, extrai-se uma amostra aleatria simples com reposio, que d
origem a um conjunto X1 , X2 , . . . , Xn de n variveis aleatrias independentes e identicamente
distribudas, todas com a mesma distribuio fX . Se fX depende de um ou mais parmetros,
temos de usar a informao obtida a partir da amostra para estimar esses parmetros, de
forma a conhecermos a distribuio.

Nos captulos anteriores, por exemplo, vimos que a mdia amostral X um bom esti-
mador da mdia populacional , no sentido de que ela tende a acertar o alvo da verdadeira
mdia populacional. Mas vimos, tambm, que existe uma variabilidade nos valores de X , ou
seja, cada possvel amostra d origem a um valor diferente do estimador.

Na prtica, temos apenas uma amostra e, assim, importante que se d alguma in-
formao sobre essa possvel variabilidade do estimador. Ou seja, importante informar o
valor do estimador b obtido com uma amostra especfica, mas importante informar tambm
que o verdadeiro valor do parmetro poderia estar em um determinado intervalo, digamos,
no intervalo [
b ,
b + ]. Dessa forma, informamos a nossa margem de erro no processo
de estimao; essa margem de erro consequncia do processo de seleo aleatria da
amostra.

O que vamos estudar agora como obter esse intervalo, de modo a acertar na maioria
das vezes, isto , queremos um procedimento que garanta que, na maioria das vezes (ou das
amostras possveis), o intervalo obtido conter o verdadeiro valor do parmetro. A expresso
CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

na maioria das vezes ser traduzida como probabilidade alta. Veja a Figura 3.1: a os
intervalos so representados pelas linhas horizontais e podemos ver que 2 deles no acertam
o alvo, no sentido de no conterem o verdadeiro valor do parmetro , representado pela
linha vertical.


Figura 3.1 Interpretao dos intervalos de confiana

! Intervalo de confiana

Com probabilidade alta (em geral, indicada por 1 ), o intervalo


h i
erro; + erro
b b

conter o verdadeiro valor do parmetro , ou seja, o procedimento de


construo garante uma alta probabilidade (1) de se obter um intervalo
que contenha o verdadeiro valor do parmetro.
1 chamado nvel de confiana,henquanto o valor i conhecido como
nvel de significncia. O intervalo erro; + erro chamado de in-
b b
tervalo de confiana de nvel 1 .

Tendo clara a interpretao do intervalo de confiana, podemos resumir a frase acima


da seguinte forma:

Departamento de Estatstica - Ana Maria Farias 28


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

 h i
P b ;
b+ =1 (3.1)

Mais uma vez, a probabilidade se refere probabilidade dentre as diversas possveis amos-
tras, ou seja, a probabilidade est associada distribuio amostral de .
b Note que os
limites do intervalo dependem de ,
b que depende da amostra sorteada, ou seja, os limites
do intervalo de confiana so variveis aleatrias. Cada amostra d origem a um intervalo
diferente, mas o procedimento de obteno dos intervalos garante probabilidade 1 de
acerto.

EXEMPLO 3.1 Interpretando um intervalo de confiana

Em um estudo sobre o ndice de Massa Corporal (IMC), foi reportado o seguinte intervalo de
confiana de 95% para o IMC mdio de determinada populao, com base em uma amostra
de 650 mulheres: [26, 8 0, 6; 26, 8 + 0, 6]. O que podemos dizer e o que no podemos dizer
com base nesse intervalo?

Soluo

O que definitivamente no podemos dizer que h uma probabilidade de 0,95 de ,


o verdadeiro IMC mdio populacional, estar no intervalo dado. Note que o intervalo dado
um nico intervalo ou est no intervalo ou no est no intervalo e no temos como
saber qual verdade. O que interessa que apenas uma dessas afirmativas verdadeira
com probabilidade 1 e a outra, portanto, no pode acontecer.

O que podemos dizer sobre o intervalo dado que ele foi gerado a partir de uma
amostra especfica com um mtodo que tem 95% de chance de gerar intervalos anlogos,
baseados em outras amostras, que contero o parmetro populacional .


3.1.1 Valores crticos da distribuio normal padro

No estudo da Inferncia Estatstica, comum a utilizao de abscissas de distribuies


de probabilidade que delimitam eventos com pequena probabilidade de ocorrncia. Tais
abscissas recebem o nome especial de valor crtico, cuja definio para o caso da distribuio
normal, ilustrada na Figura 3.2, dada a seguir.

Departamento de Estatstica - Ana Maria Farias 29


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

DEFINIO Valor crtico da distribuio normal

O valor crtico da distribuio normal referente ao nvel de significncia


a abscissa z que deixa probabilidade (rea) acima dela, isto :

P(Z > z ) = (3.2)

Figura 3.2 Valor crtico z da N(0; 1)

3.2 Intervalo de confiana para a mdia de uma populao


normal com varincia conhecida

Vamos agora, introduzir os mtodos para obteno do intervalo de confiana para a mdia
de uma populao. Como visto, a mdia populacional um parmetro importante, que pode
ser muito bem estimado pela mdia amostral X . Para apresentar as ideias bsicas, vamos
considerar um contexto que pouco frequente na prtica. O motivo para isso que, em
termos didticos, a apresentao bastante simples. Como o fundamento o mesmo para
contextos mais gerais, essa abordagem se justifica.

Consideremos, ento, uma populao descrita por uma varivel aleatria normal com
mdia e varincia 2 : X N(; 2 ). Vamos supor que o valor de 2 seja conhecido
e que nosso interesse seja estimar a mdia a partir de uma amostra aleatria simples
X1 , X2 , . . . , Xn . Como visto no Captulo 6.1, a distribuio amostral de X normal com mdia
e varincia n , ou seja
2

 
 2
X N ; = X N ;
2
n

Departamento de Estatstica - Ana Maria Farias 30


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Da definio de distribuio amostral, isso significa que os diferentes valores de X obtidos


a partir das diferentes possveis amostras se distribuem normalmente em torno de com
varincia n .
2

Das propriedades da distribuio normal, resulta que


X
Z= q N(0; 1)
2
n

ou equivalentemente,
X
Z= n N(0; 1) (3.3)

Consideremos, agora, o valor crtico z/2 , conforme ilustrado na Figura 3.3. Da podemos
ver que, se Z N(0; 1), ento
P (z/2 Z z/2 ) = 1 (3.4)

Figura 3.3 Valor crtico z/2 da N(0; 1)

Note que isso vale para a distribuio normal padro, em geral. Ento, usando os
resultados das Equaes 3.3 e 3.4, obtemos que

X
 
P z/2 n z/2 = 1

Mas isso equivalente a


 

P z/2 X z/2 = 1
n n
 

P X z/2 X + z/2 = 1
n n
 

P X z/2 X + z/2 = 1 (3.5)
n n

Departamento de Estatstica - Ana Maria Farias 31


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Note a ltima expresso; ela nos diz que


  

P X z/2 ; X + z/2 =1
n n

Mas essa exatamente a forma geral de um intervalo de confiana, conforme explicitado


na Equao 3.1. Temos, ento, a seguinte concluso:

DEFINIO Intervalo de confiana para a mdia de uma populao


normal com varincia conhecida

Seja X N(; 2 ) uma populao, tal que a varincia 2 conhecida.


Se X1 , X2 , . . . , Xn uma amostra aleatria simples dessa populao, en-
to o intervalo de confiana de nvel de confiana 1 para a mdia
populacional dado por
 

X z/2 ; X + z/2 (3.6)
n n

O intervalo de confiana para pode ser escrito na forma [X ; X +] onde = z/2 n


a margem de erro. Como visto, essa margem de erro est associada ao fato de que diferentes
amostras fornecem diferentes valores de X cuja mdia igual a . As diferentes amostras
fornecem diferentes intervalos de confiana, mas uma proporo de 100 (1 )% desses
intervalos ir conter o verdadeiro valor de . Note que aqui fundamental a interpretao de
probabilidade como freqncia relativa: estamos considerando os diferentes intervalos que
seriam obtidos, caso sortessemos todas as possveis amostras. Assim, o nvel de confiana
est associado confiabilidade do processo de obteno do intervalo: esse processo tal
que acertamos (isto , o intervalo contm ) em 100 (1 )% das vezes.

Na prtica, temos apenas uma amostra e o intervalo obtido com essa amostra especfica,
ou contm ou no contm o verdadeiro valor de . A afirmativa
  

P X z/2 ; X + z/2 =1
n n
vlida porque ela envolve a varivel aleatria X , que tem diferentes valores para as dife-
rentes amostras. Quando substitumos o estimador X por uma estimativa especfica x obtida
a partir de uma amostra particular, temos apenas um intervalo e no faz mais sentido falar
em probabilidade.

EXEMPLO 3.2 Pesos de homens adultos

Departamento de Estatstica - Ana Maria Farias 32


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Em determinada populao, o peso dos homens adultos distribudo normalmente com


um desvio-padro de 16kg. Uma amostra aleatria simples de 36 homens adultos sorteada
desta populao, obtendo-se um peso mdio de 78,2kg. Construa um intervalo de confiana
de nvel de confiana 0,95 para o peso mdio de todos os homens adultos dessa populao.

Soluo

Vamos incialmente determinar o valor crtico associado ao nvel de confiana de 0,95.


Como 1 = 0, 95, resulta que = 0, 05 e /2 = 0, 025.

Analisando a Figura 3.3, vemos que nas duas caudas da distribuio normal padro
temos de ter 5% da rea; logo, em cada cauda temos de ter 2,5% da rea total. Em termos
da Tabela 1 da distribuio normal padro, isso significa que entre 0 e z0,025 temos de ter
(50 2, 5)% = 47, 5% e, assim, temos de procurar no corpo da tabela o valor de 0,475 para
determinar a abscissa z0,025 . Veja a Figura 3.4.

Figura 3.4 Valor crtico z0,025 da N(0; 1)

Procurando no corpo da tabela da distribuio normal padro, vemos que o valor 0,475
corresponde abscissa z0,025 = 1, 96. Logo, nosso intervalo de confiana
 
78, 2 1, 96 ; 78, 2 + 1, 96
16 16
= [72, 9733 ; 83, 4267]
36 36

Esse intervalo contm ou no o verdadeiro valor de , mas o procedimento utilizado


para sua obteno nos garante que h 95% de chance de estarmos certos. 

3.2.1 Margem de erro

Vamos, agora, analisar a margem de erro do intervalo de confiana para a mdia de uma
populao normal com varincia conhecida. Ela dada por

= z/2 (3.7)
n

Departamento de Estatstica - Ana Maria Farias 33


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Lembrando que o erro-padro o desvio-padro do estimador, podemos escrever

= z/2 EPX (3.8)

Analisando a equao (3.7), vemos que a margem de erro depende diretamente do valor
crtico e do desvio-padro populacional e inversamente proporcional raiz quadrado do
tamanho da amostra.

Na Figura 3.5 ilustra-se a relao de dependncia da margem de erro com o desvio-


padro populacional . Temos duas distribuies amostrais centradas na mesma mdia e
baseadas em amostras de mesmo tamanho. Nas duas distribuies, a rea total das caudas
sombreadas , de modo que o intervalo limitado pelas linhas verticais o intervalo de
confiana de nvel 1 , ou seja, a rea central em ambas distribuies 1 . Para a
distribuio mais dispersa, isto , com maior, o comprimento do intervalo maior. Esse
resultado deve ser intuitivo: se h mais variabilidade na populao, a nossa margem de
erro tem de ser maior, mantidas fixas as outras condies (tamanho de amostra e nvel de
confiana).

Figura 3.5 Margem de erro versus disperso populacional: 1 < 2 1 < 2

Por outro lado, se mantivermos fixos o tamanho da amostra e o desvio-padro popu-


lacional, razovel, tambm, que a margem de erro seja maior para um nvel de confiana
maior. Ou seja, se queremos aumentar a probabilidade de acerto, razovel que o intervalo
seja maior. Aumentar a probabilidade de acerto significa aumentar o nvel de confiana, o
que acarreta em um valor crtico z/2 maior. Veja a Figura 3.6, onde ilustra-se o intervalo
de confiana para dois nveis de confiana diferentes: 1 1 > 1 2 . O primeiro intervalo
maior, refletindo o maior grau de confiana.

Finalmente, mantidos o mesmo desvio-padro populacional e o mesmo nvel de confi-


da amostra, menor ser a margem de erro, mas a reduo da
ana, quanto maior o tamanho
margem de erro depende de n; assim, para reduzir a margem de erro pela metade, teremos

Departamento de Estatstica - Ana Maria Farias 34


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Figura 3.6 Margem de erro versus nvel de confiana: 1 < 2 (1 1 ) > (1 2 )


1 > 2

que quadruplicar o tamanho da amostra:


0 = = n0 = 2 n n0 = 4n
1 1 1
2 n 0 2 n

EXEMPLO 3.3 Resultados de pesquisa

Na divulgao dos resultados de uma pesquisa, publicou-se o seguinte texto (dados


fictcios):

Com o objetivo de se estimar a mdia de uma populao, estudou-se uma amostra


de tamanho n = 45. De estudos anteriores, sabe-se que essa populao muito
bem aproximada por uma distribuio normal com desvio-padro 3, mas acredita-
se que a mdia tenha mudado desde esse ltimo estudo. Com os dados amostrais
obteve-se o intervalo de confiana [1, 79; 3, 01],.

Quais so o as informaes importantes que no foram divulgadas? Como podemos


obt-las?

Soluo

Quando se divulga um intervalo de confiana para um certo parmetro, costume


publicar tambm a estimativa pontual. Nesse caso, temos que informar a mdia amostral x,

Departamento de Estatstica - Ana Maria Farias 35


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

que pode ser achada observando-se que o intervalo de confiana simtrico em torno de x.
Logo, x o ponto mdio do intervalo:
1, 79 + 3, 01
x= = 2, 4
2
Da conclui-se que a margem de erro = 2, 4 1, 79 = 0, 61. Outra informao importante
o nvel de confiana, que deve ser encontrado a partir da abscissa z/2 na margem de erro:

0, 61 45
0, 61 = z/2 z/2 =
3
= 1, 36
45 3
Consultando a tabela da distribuio normal, vemos que tab(1, 36) = 0, 4131. Logo, o nvel
de confiana 2 0, 4131 = 0, 8262 0, 83. Veja a Figura 3.7.

Figura 3.7 Determinao do nvel de confiana




3.3 Intervalo de confiana para uma proporo

O procedimento de construo do intervalo de confiana para a proporo populacional


totalmente anlogo ao do intervalo de confiana para a mdia de uma populao normal com
varincia conhecida, visto anteriormente.

No Captulo 2, vimos que, para amostras grandes,


 
p(1 p)
P N p;
b
n
Sendo assim, verdade que

P p
b
P z/2 q z/2 1
p(1p)
n

Departamento de Estatstica - Ana Maria Farias 36


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

e, portanto
r r !
p(1 p) p(1 p)
P z/2 P
b p z/2 = 1 =
n n
r r !
p(1 p) p(1 p)
P P
b z/2 p P
b + z/2 = 1 =
n n
r r !
p(1 p) p(1 p)
P Pb z/2 pP b + z/2 = 1
n n

Como no caso da mdia, chegamos a uma expresso do seguinte tipo:


 
Pr P p P + = 1
b b

que a expresso de um intervalo de confiana de nvel de confiana 1 para a proporo


populacional. Mas note que a margem de erro, neste caso,
r
p(1 p)
= z/2
n
e depende de p, o parmetro de interesse. Sendo assim, temos de obter alguma estimativa
para p para podermos construir o intervalo de confiana; essa estimativa pode vir de estu-
dos anteriores, de informaes de especialistas ou, ento, da prpria amostra usada para
construir o intervalo de confiana. Vamos denotar essa estimativa por p
b0 .

DEFINIO Intervalo de confiana para uma proporo populacional

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao


X Bern(p). Para n suficientemente grande, o intervalo de confiana
aproximado para p de nvel de confiana 1 dado por
" r r #
p
b (1 p
b ) p
b (1 p
b )
P
b z/2 ; P
b + z/2
0 0 0 0
n n

onde pb0 uma estimativa de p e z/2 o valor crtico da distribuio


normal associado ao nvel de significncia .
Essa aproximao pode ser usada se o nmero de sucessos e o nmero de
fracassos na amostra forem ambos maiores ou iguais a 15.

EXEMPLO 3.4 Linha de produo

Departamento de Estatstica - Ana Maria Farias 37


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Um gerente de produo deseja estimar a proporo de peas defeituosas em uma de suas


linhas de produo. Para isso, ele seleciona uma amostra aleatria simples de 100 pe-
as dessa linha de produo, obtendo 30 defeituosas. Determine o intervalo de confiana
para a verdadeira proporo de peas defeituosas nessa linha de produo a um nvel de
significncia de 5%.

Soluo

O primeiro fato a observar que a amostra grande, com sucessos e fracassos sufici-
entes. Com um nvel de significncia de = 0, 05, o nvel de confiana 1 = 0, 95 e,
da tabela da normal padro, obtemos que z/2 = 1, 96. Como no temos estimativa prvia da
proporo de defeituosas p, temos de usar a proporo amostral p b = 0, 30. Assim, a margem
de erro r
0, 3 0, 7
= 1, 96 = 0, 0898
100
e o intervalo de confiana

[0, 30 0, 0898; 0, 30 + 0, 0898] = [0, 2102; 0, 3898]



3.3.1 Margem de erro

Assim como no caso da mdia da populao normal, a margem de erro do intervalo de


confiana para uma proporo populacional pode ser escrita como

= z/2 EP
cb
P

A diferena fundamental aqui que temos de estimar o erro-padro como


r
cb = p b0 (1 p
b0 )
EP P
n
enquanto no contexto da populao normal com varincia conhecida, o erro-padro era co-
nhecido e igual a

EPX =
n
Mas em ambos os casos, a margem de erro ser maior para nveis de confiana maiores e
para populaes mais dispersas e pode ser diminuda aumentando-se o tamanho da amostra.

Na Figura 3.8 temos o grfico da funo f(p) = p(1 p) para p [0, 1]. Note que
o mximo da funo atingido quando p = 0, 5; ento, mantidos o nvel de confiana e o
tamanho da amostra fixos, a margem de erro ser mxima quando p = 0, 5 e, nesse caso,
teremos o maior intervalo de confiana possvel. Essa uma abordagem conservadora, que
pode ser usada quando no se tem qualquer conhecimento sobre o valor p para gerar uma
estimativa razovel p
b0 .

Departamento de Estatstica - Ana Maria Farias 38


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Figura 3.8 grfico de f(p) = p(1 p)

3.4 Determinao do tamanho da amostra

No planejamento de pesquisas, importante ter-se uma ideia do tamanho de amostra ne-


cessrio. Nos contextos abordados aqui, isso pode ser feito especificando-se a margem de
erro e o nvel de confiana desejados.

Para estimao da mdia de uma populao nomal com varincia conhecida, temos
 2
= z/2 = n = z/2 = n = z/2 (3.9)
n

Para estimao de uma proporo populacional, temos


p p p !2
p
b0 (1 p
b0 ) p
b0 (1 p
b0 ) p
b0 (1 p
b0 )
= z/2 = n = z/2 = n = z/2 (3.10)
n

Trabalhando com o pior cenrio, isto , com p = 0, 5, essa frmula se simplifica para
 2  z 2
0, 5 /2
n = z/2 = n = (3.11)
2

EXEMPLO 3.5 Tamanho de amostra

De uma populao normal com varincia 25 extrai-se uma amostra aleatria simples de
tamanho n com o objetivo de se estimar a mdia populacional com um nvel de confiana
de 90% e margem de erro de 2. Qual deve ser o tamanho da amostra?

Soluo

Para um nvel de confiana 0,90, o valor do nvel de significncia = 0, 10. Ento,


na cauda superior da distribuio normal padro temos que ter uma rea (probabilidade) de

Departamento de Estatstica - Ana Maria Farias 39


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

0,05 e, portanto, para encontrarmos o valor de z0,05 temos que procurar no corpo da tabela
o valor 0,45 (se necessrio, consulte a Figura 3.4). Resulta que z0,05 = 1, 64. Temos, ento,
todos os valores necessrios:
1, 64 5
2 = 1, 64 n =
5
= 4, 1 n = 16, 71
n 2
Como o valor de n tem de ser um inteiro, uma estimativa apropriada n = 17 (devemos
arredondar para cima para garantir um nvel de confiana no mnimo igual ao desejado). 

EXEMPLO 3.6 Lanamento de um novo produto

Para estudar a viabilidade de lanamento de um novo produto no mercado, o gerente de


uma grande empresa contrata uma firma de consultoria estatstica para estudar a aceitao
do produto entre os clientes potenciais. O gerente deseja obter uma estimativa com erro
mximo de 1% com probabilidade de 80% e pede ao consultor estatstico que fornea o
tamanho de amostra necessrio.

(a) De posse das informaes dadas, o consultor calcula o tamanho da amostra necessrio
no pior cenrio. O que significa pior cenrio nesse caso? Qual o tamanho de amostra
obtido pelo consultor?
(b) O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a
realizar um estudo piloto com uma amostra de 100 pessoas para obter uma estimativa
da verdadeira proporo. O resultado desse estudo piloto uma estimativa p
b = 0, 76 de
aceitao do novo produto. Com base nessa estimativa, o consultor recalcula o tamanho
da amostra necessrio. Qual esse tamanho?
(c) Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporo
de 72% de clientes favorveis ao produto. Construa um intervalo de confiana para a
verdadeira proporo com nvel de confiana de 90%.

Soluo

(a) O pior cenrio quando a populao est dividida meio-a-meio em suas preferncias,
ou seja, quando p = 0, 5. Com nvel de confiana de 80%, obtemos z0,10 = 1, 28 essa
abscissa deixa 10% em cada cauda da distribuio normal padro. Nesse caso,
r  2
0, 5 0, 5 1, 28
0, 01 = 1, 28 = n = 0, 25 = 4096
n 0, 01

(b) Vamos agora utilizar p


b = 0, 76 :
r  2
0, 76 0, 24 1, 28
0, 01 = 1, 28 = n = 0, 76 0, 24 = 2988, 4
n 0, 01
ou seja, n = 2989.

Departamento de Estatstica - Ana Maria Farias 40


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

(c) 1 = 0, 90 = z0,05 = 1, 64 essa abscissa deixa 5% em cada cauda da distribuio


normal padro. r
0, 72 0, 28
= 1, 64 = 0, 0135
2989
e o intervalo de confiana

[0, 72 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335]




3.5 Resumo

Vamos, agora, apresentar um resumo baseado nos resultados que sero fornecidos na prova,
a saber:

E(X ) = 
2

Populao X N(; ) = 2
= X N ;
n
Var(X ) = 2


E(X ) = p  
Populao X Bern(p) = b N p; p
= P
b0 (1 p
b0 )
n
Var(X ) = p(1 p) p
b0 (1 p

b0 )

Essas so as duas situaes estudadas: a primeira se refere a alguma varivel quantitativa


descrita por uma populao normal e segunda se refere a alguma varivel qualitativa descrita
por uma distribuio de Bernoulli. No primeiro caso, o interesse estimar a mdia , e no
segundo caso, a proporo p. Os estimadores no-viesados so, respectivamente, a mdia
amostral e a proporo amostral. Os intervalos de confiana so centrados na estimativa
obtida a partir da amostra, seja ela x ou p
b, isto :

[x ; x + ] = [x z/2 EPX ; x + z/2 EPX ]


h i
p
b z/2 EP
db
P ; p
b + z/2 EP
db
P

e a margem de erro em ambos os casos o produto do valor crtico da distribuio normal


associado ao nvel de confiana desejado pelo erro-padro do estimador, que nada mais
que o desvio-padro da distribuio do estimador. Logo, os intervalos de confiana so
" r r #  
2 2
x z/2 ; x + z/2 = x z/2 ; x + z/2
n n n n
" r r #
p
b0 (1 p
b0 ) p
b0 (1 p
b0 )
p
b z/2 ; pb + z/2
n n

Departamento de Estatstica - Ana Maria Farias 41


CAPTULO 3. INTERVALOS DE CONFIANA BASEADOS NA DISTRIBUIO NORMAL

Entendendo a lgica da construo do intervalo de confiana, no ser necessrio


decorar frmulas, uma vez que as informaes sobre as populaes sero fornecidas na
prova.

Departamento de Estatstica - Ana Maria Farias 42


Captulo 4

Testes de Hipteses: Conceitos bsicos

4.1 Introduo

Na teoria de estimao, vimos que possvel, por meio de estatsticas amostrais adequadas,
estimar parmetros de uma populao, dentro de um certo intervalo de confiana.

Nos testes de hipteses, em vez de se construir um intervalo de confiana no qual se


espera que o parmetro da populao esteja contido, testa-se a validade de uma afirmao
sobre um parmetro da populao.

Ento, em um teste de hiptese, procura-se tomar decises a respeito de uma populao


com base em informaes obtidas de amostras desta mesma populao.

Vamos trabalhar com alguns exemplos para ilustrar os conceitos bsicos de que preci-
samos para construir testes de hipteses estatsticos.

EXEMPLO 4.1 Amostra de anis de vedao - parte 1

Uma empresa compra anis de vedao de dois fabricantes. Segundo informaes dos
fabricantes, os anis do fabricante 1 tm dimetro mdio de 14 cm com desvio padro de
1,2 cm e os anis do fabricante 2 tm dimetro mdio de 15 cm com desvio padro de
2,0 cm. Ambos os processos de produo geram anis com dimetros cuja distribuio
aproximadamente normal.

Uma caixa com 16 anis sem identificao encontrada pelo gerente do almoxarifado.
Embora ele suspeite que a caixa seja oriunda do fabricante 1, decide fazer uma medio dos
anis e basear sua deciso no dimetro mdio da amostra: se o dimetro mdio for maior que
14,5 cm, ele identificar a caixa como oriunda do fabricante 2; caso contrrio, ele identificar
a caixa como oriunda do fabricante 1.

Esse um problema tpico de deciso empresarial. Vamos analis-lo sob o ponto de


vista estatstico, estudando os possveis erros e suas probabilidades de ocorrncia. Para
CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

isso, precisamos formular uma hiptese nula, que uma afirmao sobre um parmetro da
populao.

A hiptese nula, normalmente designada por H0 , uma afirmao que estabelecida


com o objetivo de ser testada; ela pode ser rejeitada ou no. Geralmente, a hiptese nula
formulada de tal forma que o objetivo rejeit-la.1

Neste exemplo, existem apenas duas possibilidades para a origem dos anis de vedao.
Como o gerente suspeita que a caixa venha do fabricante 1, vamos estabelecer a hiptese
nula de forma que o resultado desejado seja rejeit-la. Definimos, ento, a hiptese nula
como sendo
H0 : anis vm do fabricante 2
e, obviamente, a hiptese alternativa ser

H1 : anis vm do fabricante 1

Se denotamos por X a varivel aleatria que representa o dimetro dos anis, essas hipteses
se traduzem como

H0 : X N(15; 2, 02 )
H1 : X N(14; 1, 22 )

A regra de deciso do gerente baseada na mdia amostral observada para os 16 anis


encontrados. Como dito, nossa deciso deve ser expressa sempre em termos de H0 . Logo, a
regra de deciso

x 14, 5 = rejeito H0
x > 14, 5 = no rejeito H0

Os erros associados a essa regra de deciso so:

Erro I: rejeitar H0 quando H0 verdadeira


Erro II: no rejeitar H0 quando H0 falsa

Se H0 verdadeira, a amostra vem de uma populao normal com mdia 15 e desvio


padro 2,0. Nesse caso, a mdia amostral com base em uma amostra de tamanho 16
tambm normal com mdia 15 e desvio padro 2,0
16
.

Se H0 falsa, a amostra vem de uma populao normal com mdia 14 e desvio padro
1,2. Nesse caso, a mdia amostral com base em amostra de tamanho 16 tambm normal
com mdia 14 e desvio padro 1,2
16
.
1
Mais adiante, veremos um procedimento objetivo para estabelecimento das hipteses nula e alternativa em
contextos mais complexos.

Departamento de Estatstica - Ana Maria Farias 44


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

Ento, as probabilidades associadas aos erros podem ser expressas em termos de


probabilidade condicional:
  
2, 02
P(Erro I) = P X 14, 5|X N 15;
16
  
1, 22
P(Erro II) = P X > 14, 5|X N 14;
16

Na Figura 4.1, a probabilidade associada ao erro I corresponde rea sombreada de


cinza-claro, enquanto a rea sombreada de cinza-escuro corresponde probabilidade do
erro tipo II.

Figura 4.1 Probabilidades dos Essos tipo I e II para o Exemplo 4.1

Vamos calcular essas probabilidades. Em geral, a probabilidade do erro tipo I deno-


tada por e a probabilidade do erro tipo II por . Assim,
   !
2, 02
14, 5 15
= P(Erro I) = P X 14, 5|X N 15; =P Z 2
16 4
= P(Z 1, 00) = P(Z 1, 00) = 0, 5 tab(1, 00) = 0, 5 0, 34134 = 0, 15866

   !
1, 22 14, 5 14
= P(Erro II) = P X > 14, 5|X N 14; =P Z > 1.2
16 4
= P(Z > 1, 67) = 0, 5 tab(1, 67) = 0, 04746



Departamento de Estatstica - Ana Maria Farias 45


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

importante voc entender a sutileza da notao. A deciso do gerente tem de ser


tomada em funo do resultado amostral observado; assim, usamos a notao x. Lembre-
se de que usamos letras minsculas para representar o valor observado de uma varivel
aleatria.

Quando falamos da probabilidade do erro ou mesmo da regra de deciso em termos


gerais, estamos considerando o procedimento decisrio geral. Como esse procedimento de-
pende da amostra sorteada, temos de expressar as probabilidades dos erros e a regra de
deciso levando em conta as possveis amostras, ou seja, temos de levar em conta a varivel
aleatria X que descreve a mdia amostral de uma possvel amostra aleatria simples de
tamanho n.

No exemplo, a regra de deciso geral : se X > 14, 5, o gerente classifica como


produo do fabricante 2. Assim, se a caixa em questo tiver uma mdia de, por exemplo,
14,4, o gerente classificar a caixa como produzida pelo fabricante 1.

EXEMPLO 4.2 Amostra de anis de vedao - parte 2

Para resumir os resultados do exemplo anterior, podemos construir o seguinte quadro:

Gerente decide que origem do


Fabricante 1 Fabricante 2
Fabricante 2 Erro I ( = 0, 15866) OK
Verdadeiro 1 OK Erro II ( = 0, 04746)

Vemos a que a probabilidade do erro tipo I maior. Analisando a Figura 4.1, podemos
ver tambm que, se mudarmos a regra de deciso escolhendo um valor de corte diferente de
14,5, essas probabilidades se alteraro. Aumentando , diminui e vice-versa.

Vamos, agora, estabelecer uma nova regra de deciso de modo que a probabilidade do
erro tipo I passe a ser 0,05. A nossa regio de rejeio, ou regio crtica, continua tendo a
forma X k. Pela Figura 4.1, vemos que k tem de ser menor que 14,5.
  
2, 02
= 0, 05 P X k | X N 15; = 0, 05
16
!  
k 15 k 15
P Z 2
= 0, 05 P Z = 0, 05
4
0, 5
   
k 15 k 15
0, 5 tab = 0, 05 tab = 0, 45
0, 5 0, 5
k 15
= 1, 64 k = 14, 18
0, 5

Com essa nova regra de deciso, o erro tipo II passa a ter probabilidade

Departamento de Estatstica - Ana Maria Farias 46


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

  
1, 22
= P(Erro II) = P X > 14, 18|X N 14;
16
!
14, 18 14
= P Z > 1,2
= P(Z > 0, 6)
4
= 0, 5 tab(0, 6) = 0, 27425



EXEMPLO 4.3 Amostra de anis de vedao - parte 3

Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual a regra
de deciso?
=
     
2, 02 1, 22
P X k | X N 15; = P X > k | X N 14;
16 16
! !
k 15 k 14 k 15 k 14
P Z 2.0 = P Z > 1.2 =
4 4
0, 5 0, 3
0, 3k 4, 5 = 0, 5k + 7 0, 8k = 11, 5 k = 14, 375

Neste caso, as probabilidades dos erros tipo I e II so


  
2, 02
= = P X 14, 375 | X N 15;
16
 
14, 375 15
= P Z
0, 5
= P(Z 1, 25) = P(Z 1, 25) = 0, 5 tab(1, 25) = 0, 10565



EXEMPLO 4.4 Amostra de anis de vedao - parte 4

O procedimento de se fixar a probabilidade do erro tipo I o mais utilizado pois, em


geral, na prtica a situao no to simples como a escolha entre duas decises.

Suponha, nos dois exemplos anteriores, que a empresa compre anis de diversos fabri-
cantes mas, pelas caractersticas de produo do fabricante 2, os anis produzidos por ele
sejam especiais para a empresa. Assim, importante identificar corretamente a origem, caso
eles sejam oriundos do fabricante 2. Nesta situao, nossas hipteses passariam a ser:
H0 : anis so produzidos pelo fabricante 2
H1 : anis no so produzidos pelo fabricante 2

Departamento de Estatstica - Ana Maria Farias 47


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

Queremos que a probabilidade seja pequena; assim, podemos fixar como 0,05 ou mesmo
0,01. De posse do valor dessa probabilidade, poderamos estabelecer a regio crtica ou
regio de rejeio. A diferena fundamental aqui est no clculo da probabilidade do erro
tipo II: no existe um nico valor de , j que, sob H1 , a distribuio pode ter qualquer mdia.


EXEMPLO 4.5 Honestidade de uma moeda

Considere a seguinte regra de deciso sobre a honestidade de uma moeda. Se em trs


lanamentos aparecerem 3 coroas, rejeitamos a hiptese de que a moeda seja honesta. Como
devemos estabelecer as hipteses nula e alternativa? Como devemos proceder para calcular
e ?

Em termos gerais, a questo que se coloca se a moeda honesta ou no. Como


regra geral, neste curso sempre iremos definir a hiptese nula de modo que ela represente
um nico valor do parmetro de interesse, ou seja, a hiptese nula deve ser uma hiptese
simples.

Neste exemplo, a distribuio em questo uma binomial com parmetros n = 3 e p


desconhecido. Moeda honesta significa p = 21 . Logo, nossas hipteses devem ser:
1
H0 : p =
2
1
H1 : p 6=
2

Seja X = nmero de coroas nos trs lanamentos. Ento, X bin(3; p). Nossa regra
de deciso rejeitar H0 se X = 3. A probabilidade do erro tipo I :
  
1
= P X = 3|X bin 3;
2
1 1 1 1
= =
2 2 2 8

No possvel calcular = P(no rejeitar H0 |H0 falsa), pois a hiptese alternativa


(aquela que devemos considerar quando H0 no aceita) no estipula um valor nico para
p. Mas neste exemplo simples, podemos obter uma expresso para em funo de p. Note
que

= P [X < 3|X bin(3; p)]


= 1 P [X 3|X bin(3; p)]
= 1 P [X = 3|X bin(3; p)]
= 1 p3



Departamento de Estatstica - Ana Maria Farias 48


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

4.2 Conceitos bsicos

O contexto em que se baseia a teoria de teste de hiptese basicamente o mesmo da


teoria de estimao por intervalo de confiana. Temos uma populao representada por uma
varivel aleatria X cuja distribuio de probabilidade depende de algum parmetro . O
interesse agora est em testar a veracidade de alguma afirmativa sobre .

4.2.1 Hipteses nula e alternativa

A hiptese nula, representada por H0 , a hiptese bsica que queremos testar. Nesse texto
consideraremos apenas hipteses nulas simples, isto , hipteses que estabelecem que o
parmetro de interesse igual a um determinado valor. A forma geral :
H 0 : = 0
Alguns exemplos so:
H0 : = 6 H0 : p = 0, 5 H0 : 2 = 25
O procedimento de teste de hiptese resultar em uma regra de deciso que nos permitir
rejeitar ou no rejeitar H0 .

A hiptese alternativa, representada por H1 , a hiptese que devemos considerar no


caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese bilateral
H1 : 6= 0

Em algumas situaes, podemos ter informao que nos permita restringir o domnio
da hiptese alternativa. Por exemplo, se uma empresa farmacutica est testando um novo
medicamento para enxaqueca no intuito de reduzir o tempo entre a ingesto do medicamento
e o alvio dos sintomas, uma possvel hiptese alternativa
H1 : < 10

Temos, ento, hipteses unilaterais esquerda


H1 : < 0
e hipteses unilaterais direita:
H1 : > 0

A escolha entre essas formas de hiptese alternativa se faz com base no conhecimento
sobre o problema sendo considerado.

Nesse texto consideraremos o seguinte procedimento prtico para determinao das


hipteses nula e alternativa.

Departamento de Estatstica - Ana Maria Farias 49


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

Traduza a afirmao do problema para desigualdade. Faa o mesmo para a


afirmao que o seu complementar. A desigualdade que no envolve o sinal de
= ser a hiptese alternativa e a hiptese nula sempre do tipo = 0 .

EXEMPLO 4.6 Determinao de H0 e H1

Considerando as seguintes afirmativas como parte de um problema de teste de hipteses,


determine as hipteses nula e alternativa apropriadas.

(a) O tempo mdio de, no mximo, 15 minutos

(b) H, em mdia, pelo menos 15 clientes.

(c) A proporo de clientes tem que ser pelo menos 60%.

(d) A proporo de defeituosos tem que ser menor que 5%.

Soluo

(a)
Afirmativa dada: 15
Complementar: > 15
A desigualdade que no contm o sinal de = ( > 15) torna-se a hiptese alternativa:

H0 : = 15
H1 : > 15

(b)
Afirmativa dada: 15
Complementar: < 15

H0 : = 15
H1 : < 15

(c)
Afirmativa dada: p 60%
Complementar: p < 60%

H0 : p = 0, 6
H1 : p < 0, 6

Departamento de Estatstica - Ana Maria Farias 50


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

(d)
Afirmativa dada: p < 5%
Complementar: p 5%

H0 : p = 0, 05
H1 : p < 0, 05



4.2.2 Estatstica de Teste, Erros e Regra de Deciso

Assim como na construo dos intervalos de confiana, usaremos uma estatstica amostral
apropriada para construir o nosso teste de hiptese, e, nesse contexto, essa estatstica
chamada estatstica de teste. As estatsticas de teste que consideraremos aqui so a mdia
amostral X e a proporo amostral P, b que sero usadas na construo de testes sobre a
mdia e a proporo populacionais, respectivamente.

O procedimento de deciso ser definido em termos da hiptese nula H0 , com duas


decises possveis: (i) rejeitar H0 ou (ii) no rejeitar H0 . No quadro a seguir, resumimos as
situaes possiveis.

Deciso
Rejeitar H0 No rejeitar H0
Possibi- H0 verdadeira Erro I OK
lidades H0 falsa OK Erro II

Vemos, a, que existem duas possibilidades de erro:

Erro tipo I: rejeitar H0 quando H0 verdadeira


Erro tipo II: no rejeitar H0 quando H0 falsa

A deciso sobre a hiptese nula tomada com base em uma regra que estabelece um
conjunto de valores, chamado regio crtica ou regio de rejeio, de modo que, se o valor
observado da estatstica amostral cair nessa regio, rejeitaremos H0 ; caso contrrio, no
rejeitaremos H0 . Vamos denotar por RC a regio crtica.

4.2.3 Regio crtica e nvel de significncia

Em geral, a definio da regio crtica feita da seguinte forma: RC o conjunto de valores


cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 .

Departamento de Estatstica - Ana Maria Farias 51


CAPTULO 4. TESTES DE HIPTESES: CONCEITOS BSICOS

Vamos considerar o seguinte exemplo: se, ao lanarmos uma moeda 30 vezes, obtivermos
28 caras, iremos desconfiar da hiptese de honestidade da moeda, porque a probabilidade de
obtermos 28 caras ou mais em 30 lanamentos de uma moeda honesta de 0,000000433996,
uma probabilidade bastante pequena. claro que o evento 28 caras ou mais em 30 lana-
mentos um evento possvel (acertar a sena no jogo da mega-sena tambm ...), mas, sob o
ponto de vista do teste de hiptese, a obteno de tal evento ser uma evidncia de que a
nossa hiptese nula de honestidade da moeda no muito plausvel.

Nesse caso, no diremos que a moeda no honesta (no podemos dizer que im-
possvel acertar a sena!); nossa concluso que no h evidncia suficiente para apoiar a
hiptese nula. (Situao anloga ocorre quando um jri diz que o ru no-culpado.)

A definio de probabilidade pequena se faz por meio da escolha do nvel de signifi-


cncia do teste, que a probabilidade do erro tipo I, isto :

= P(erro tipo I) = P(rejeitar H0 | H0 verdadeira)

Em geral, o valor de pequeno e as escolhas mais comuns so = 0, 05 e = 0, 01.

Definido o nvel de significncia , podemos estabelecer a regio crtica usando a


distribuio amostral da estatstica de teste.

Departamento de Estatstica - Ana Maria Farias 52


Captulo 5

Testes de hipteses baseados na


distribuio normal

5.1 Introduo

Neste captulo, aplicaremos os conceitos bsicos sobre a teoria de teste de hiptese situa-
o especfica em que a estatstica de teste tem, pelo menos aproximadamente, distribuio
normal. Veremos inicialmente testes para a mdia de uma populao normal e, depois, testes
para uma proporo populacional baseados em grandes amostras.

Vamos apresentar, inicialmente, alguns exemplos que ilustraro diversas possibilidades


que podem surgir na prtica.

EXEMPLO 5.1 Tempo de processamento - parte 1

Depois de uma pane geral no sistema de informao de uma empresa, o gerente ad-
ministrativo deseja saber se houve alterao no tempo de processamento de determinada
atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma varivel
aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos. O gerente acre-
dita que a pane no tenha alterado a variabilidade do processo. Uma amostra de 16 tempos
de processamento aps a pane revela uma mdia de 105,5 minutos. Ao nvel de significncia
de 5%, qual a concluso sobre a alterao do tempo mdio de processamento?

Soluo

Seja T a varivel aletaria que representa o tempo de processamento. Do enunciado,


sabemos que T N(, 102 ) e sabemos, tambm, que antes da pane, = 10.

Hipteses Nula e Alternativa


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

O interesse do gerente comparar os tempos antes e depois da pane. Antes da pane,


o tempo mdio de processamento era de 100 minutos. Como ele no sabe o tipo de
alterao que pode ter ocorrido, precisa saber se o tempo mdio depois da pane
diferente do tempo anterior. Temos, assim, as seguintes afirmativas = 100 e 6= 100,
que nos levam s seguintes hipteses nula e alternativa:

H0 : = 100
H1 : 6= 100

Estatstica de teste
Como a populao normal, sabemos que a distribuio da mdia amostral tambm
normal, e como no deve ter havido alterao na variabilidade do processo, resulta que
o desvio padro de 10 minutos em qualquer situao.
Logo,  
100 X
X N ; N(0; 1)
16 2, 5

Assim, nossa estatistica de teste ser

X
Z= N(0; 1)
2, 5
Nvel de significncia e regio crtica
Pelo enunciado do problema, o nvel de significncia de 5%. Isso significa que a
probabilidade de erro tipo I 0,05. Como visto, o erro tipo I consiste em rejeitar a
hiptese nula quando ela verdadeira. Logo,

= Pr(rejeitar H0 | H0 verdadeira) = 0, 05

Quando H0 verdadeira, = 100 e, portanto,

X 100
H0 verdadeira = Z0 = N(0; 1)
2, 5

A lgica do processo de deciso em um teste de hiptese a seguinte: temos a distri-


buio da estatistica de teste, supondo H0 verdadeira. Nesse caso, nossa estatsitica
de teste Z0 e a distribuio sob H0 a normal padro. Valores observados de Z0
com pequena probabilidade de ocorrncia sob essa hiptese so indicativos de que a
hiptese no verdadeira. Assim, a regio crtica consiste nos valores de Z0 nas caudas
da distribuio N(0, 1), que so as regies de pequena probabilidade. Para delimitar
essas regies de pequena probabilidade, usamos o nvel de significncia e a hiptese
alternativa. Como nesse exemplo a hiptese alternativa bilateral, temos que tomar
valores nas duas caudas da distribuio, distribuindo igualmente a probabilidade de
erro, que 5%. Veja a Figura 5.1:

Departamento de Estatstica - Ana Maria Farias 54


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Figura 5.1 Regio crtica para o Exemplo 5.1

Ento, nossa regio crtica consiste em valores observados da estatsitica de teste Z0


que caem na rea sombreada da Figura 5.1. Essa rea sombreada delimitada pelo
valor crtico da N(0, 1) que deixa 2,5% acima dele, ou seja,

RC : Z0 > z0,025 ou Z0 < z0,025

Olhando na tabela da distribuio normal, resulta

RC : Z0 > 1, 96 ou Z0 < 1, 96

Deciso e concluso
Os dados observados fornecem o valor x = 105, 5 minutos, que resulta no seguinte
valor da estatstica de teste:
105, 5 100
z0 = = 2, 2 > 1, 96
2, 5

Como o valor da estatstica de teste para a amostra observada est na regio cr-
tica, devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam uma
alterao do tempo de processamento da tarefa aps a pane. 

EXEMPLO 5.2 Tempo de processamento - parte 2

Na mesma situao do exemplo anterior, bastante razovel supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Afinal, se o tempo
diminuir, isso significa que a tarefa vai ser executada mais rapidamente, o que representa
um ganho.

Soluo

Departamento de Estatstica - Ana Maria Farias 55


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Hipteses Nula e Alternativa


As duas possibilidades so:

100 OK!
> 100 Problema!

Seguindo nosso procedimento, temos a seguinte situao:

H0 : = 100
H1 : > 100

Estatistica de teste
A estatstica de teste continua sendo
X 100
Z0 = N(0; 1)
2, 5

Nvel de significncia e regio crtica


O nvel de significncia , ainda, 5%. Como antes, valores observados de Z0 com pequena
probabilidade de ocorrncia sob H0 so indicativos de que a hiptese no verdadeira.
Assim, a regio crtica consiste nos valores de Z0 na cauda da distribuio N(0, 1), na
direo da hiptese alternativa. Agora, a hiptese alternativa unilateral direita e,
portanto, a regio crtica consiste nos valores na cauda superior que respondem pela
probabilidade de 5% do erro tipo I. Veja a Figura 5.2:

Figura 5.2 Regio crtica para o Exemplo 5.2

Ento, nossa regio crtica consiste em valores observados da estatsitica de teste Z0


que caem na rea sombreada da Figura 5.2. Essa rea sombreada delimitada pelo
valor crtico da N(0, 1) que deixa 5% acima dele, ou seja,

RC : Z0 > z0,05

Departamento de Estatstica - Ana Maria Farias 56


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Olhando na tabela da distribuio normal, resulta


RC : Z0 > 1, 64

Deciso e concluso
O valor da estatstica de teste no se altera:
105, 5 100
z0 = = 2, 2 > 1, 64
2, 5

e como antes, devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam
um aumento do tempo de processamento da tarefa aps a pane. 

EXEMPLO 5.3 Proporo de alunos

Uma pesquisa foi realizada com alunos da UFF visando, entre outras coisas, estimar a
proporo dos alunos que tm conhecimento do Regulamento dos Cursos de Graduao dessa
universidade (dados fictcios). Foram entrevistados 952 alunos, selecionados aleatoriamente,
dos quais 132 afirmaram ter lido o Regulamento dos Cursos de Graduao. Suponha que
a universidade decida lanar uma campanha de esclarecimento se a verdadeira proporo
de alunos que conhecem o regulamento for inferior a 15%. H razo para se lanar essa
campanha? Justifique sua resposta atravs de um teste de hiptese com nvel de significncia
de 5%.

Soluo

Nosso problema agora fazer um reste de hiptese sobre uma proporo populacional.
Vimos que a proporo amostral um bom estimador da proporo populacional e, para
amostras grandes,  
p(1 p)
P N p,
b
n

Hipteses nula e alternativa


Afirmativa dada: p < 0, 15
Complementar: p 0, 15
Isso nos leva s seguintes hipteses:
H0 : p = 0, 15
H1 : p < 0, 15

Estatistica de teste
Sob a hiptese de que H0 verdadeira,

P
b 0, 15
Z0 = q N(0, 1)
0,15(10,15)
952

Departamento de Estatstica - Ana Maria Farias 57


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Nvel de significncia e regio crtica


O nvel de significncia 5%. Como antes, valores observados de Z0 com pequena
probabilidade de ocorrncia sob H0 so indicativos de que a hiptese no verdadeira.
Assim, a regio crtica consiste nos valores de Z0 na cauda da distribuio N(0, 1), na
direo da hiptese alternativa. Agora, a hiptese alternativa unilateral esquerda
e, portanto, a regio crtica consiste nos valores na cauda inferior que respondem pela
probabildiade de 5% do erro tipo I. Veja a Figura 5.3:

Figura 5.3 Regio crtica para o Exemplo 5.3

Ento, nossa regio crtica consiste em valores observados da estatsitica de teste Z0


que caem na rea sombreada da Figura 5.2. Essa rea sombreada delimitada pelo
valor crtico da N(0, 1) que deixa 5% abaixo dele, ou seja,

RC : Z0 < z0,05

Olhando na tabela da distribuio normal, resulta

RC : Z0 < 1, 64

Deciso e concluso
O valor da estatstica de teste
132
0, 15
z0 = q
952 = 0, 9803 1, 64
0,15(10,15)
952

O valor observado da estatstica de teste no est na regio crtica; logo, deixamos de


rejeitar a hiptese nula, ou seja, no h razo para se lanar a campanha de esclare-
cimento. 

Departamento de Estatstica - Ana Maria Farias 58


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

5.2 Teste de hiptese sobre a mdia de uma N(; 2): proce-


dimento geral para 2 conhecida

Os dois primeiros exemplos anteriores ilustram o procedimento para construo de um teste


de hiptese sobre a mdia de uma populao normal com varincia conhecida. De posse de
uma amostra aleatria simples X1 , X2 , . . . , Xn extrada de uma populao X N(; 2 ), nosso
interesse est em testar a hiptese nula

H 0 : = 0

a um nvel de significncia .

Dependendo do conhecimento sobre o problema, a hiptese alternativa pode tomar uma


das trs formas:
H1 : 6= 0 H1 : > 0 H1 : < 0

Em qualquer dos casos, a estatstica de teste baseia-se na mdia amostral; se a vari-


ncia 2 conhecida, sabemos que

X
Z= q N(0, 1)
2
n

A regio crtica estabelecida em funo do nvel de significncia, que a probabilidade


do erro tipo I:
= P(rejeitar H0 | H0 verdadeira)
Quando H0 verdadeira, = 0 e, portanto,

X 0
Z0 = q N(0, 1)
2
n

Valores observados de Z0 com pequena probabilidade de ocorrncia sob H0 so indi-


cativos de que a hiptese no verdadeira. Assim, a regio crtica consiste nos valores de
Z0 na(s) cauda(s) da distribuio N(0, 1), na direo da hiptese alternativa.

A seguir apresentamos os resultados para cada uma das possiveis hipteses alternati-
vas.

Departamento de Estatstica - Ana Maria Farias 59


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Teste bilateral

H0 : = 0
H1 : 6= 0

X 0
Z0 = n N(0, 1)

Regio crtica:
Z0 < z/2 ou Z0 > z/2

Teste unilateral direita

H 0 : = 0
H1 : > 0

X 0
Z0 = n N(0, 1)

Regio crtica:
Z0 > z

Teste unilateral esquerda

H 0 : = 0
H1 : < 0

X 0
Z0 = n N(0, 1)

Regio crtica:
Z0 < z

Departamento de Estatstica - Ana Maria Farias 60


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

5.3 Teste de hiptese sobre uma proporo populacional: pro-


cedimento geral para grandes amostras

O Exemplo 5.3 acima ilustra o procedimento para construo de um teste de hiptese so-
bre uma proporo populacional p. De posse de uma grande amostra aleatria simples
X1 , X2 , . . . , Xn extrada de uma populao X Bern(p), nosso interesse est em testar a
hiptese nula
H0 : p = p0
a um nvel de significncia .

Dependendo do conhecimento sobre o problema, a hiptese alternativa pode tomar uma


das trs formas:
H1 : p 6= p0 H1 : p > p0 H1 : p < p0

Em qualquer dos casos, a estatstica de teste baseia-se na proporo amostral; para


grandes amostras, sabemos que

P
b p
Z=q N(0, 1)
p(1p)
n

A regio crtica estabelecida em funo do nvel de significncia, que a probabilidade


do erro tipo I:
= P(rejeitar H0 | H0 verdadeira)
Quando H0 verdadeira, p = p0 e, portanto,

Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n

Valores observados de Z0 com pequena probabilidade de ocorrncia sob H0 so indi-


cativos de que a hiptese no verdadeira. Assim, a regio crtica consiste nos valores de
Z0 na(s) cauda(s) da distribuio N(0, 1), na direo da hiptese alternativa.

A seguir apresentamos os resultados para cada uma das possiveis hipteses alternati-
vas.

Departamento de Estatstica - Ana Maria Farias 61


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Teste bilateral

H0 : p = p0
H1 : p 6= p0

Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n

Regio crtica:
Z0 < z/2 ou Z0 > z/2

Teste unilateral direita

H0 : p = p0
H1 : p > p0

Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n

Regio crtica:
Z0 > z

Teste unilateral esquerda

H0 : p = p0
H1 : p < p0

Pb p0
Z0 = q N(0, 1)
p0 (1p0 )
n

Regio crtica:
Z0 < z

5.4 Valor P

Nos exemplos anteriores, a determinao da regio crtica foi feita com base no nvel de
significncia, isto , fixado o nvel de significncia, encontramos o valor crtico que definia os

Departamento de Estatstica - Ana Maria Farias 62


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

limites entre valores provveis (aqueles que levam no-rejeio de H0 ) e pouco provveis
(aqueles que levam rejeio de H0 ).

Um outro procedimento bastante usual, especialmente quando so utilizados programas


computacionais, consiste em calcular a probabilidade de se obter um valor to ou mais
extremo que o valor observado, se H0 for verdadeira. To ou mais extremo sempre no
sentido da hiptese alternativa, ou seja, no sentido de se rejeitar a hiptese nula. Essa
probabilidade chamada valor P. Vamos ilustrar esse conceito considerando novamente os
trs exemplos anteriores.

EXEMPLO 5.4 Valor P para o Exemplo 5.1

O valor observado da estatistica de teste z0 = 2, 2 e a hiptese alternativa bilateral.


Ento, consideramos igualmente extremo o valor simtrico 2, 2, ou seja, to ou mais extremo
significa ser maior que 2, 2, ou menor que 2, 2 e o valor P

P = P(Z > 2, 2) + P(Z < 2, 2) = 2 P(Z > 2, 2) = 2 [0, 5 tab(2, 2)] = 0, 0278

Na Figura 5.4 ilustra-se esse valor. O que esse resultado est nos dizendo o seguinte:
se H0 for verdadeira, a probabilidade de obtermos um valor to extremo quanto 2,2 na direo
da hiptese altervativa, ou seja, em qualquer direo, j que H1 bilateral, 0, 0278. Essa
uma probabilidade pequena, o que significa que pouco provvel obtermos um valor to
extremo quando H0 verdadeira. Logo, razovel supormos que a hiptese nula no seja
verdadeira, a mesma concluso obtida ao trabalharmos com o nvel de significncia de 5%.

Na verdade, rejeitaramos a hiptese nula para qualquer nvel de significncia maior


que 0,0278. Note que tais nveis de significncia implicariam em valores crticos menores do
que o valor observado z0 e, portanto, levariam rejeio de H0 .

Figura 5.4 Valor P para o Exemplo 5.1




Departamento de Estatstica - Ana Maria Farias 63


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

EXEMPLO 5.5 Valor P para o Exemplo 5.2

Como antes, o valor observado da estatistica de teste z0 = 2, 2, mas agora a hiptese


alternativa unilateral direita. Ento, valores to ou mais extremos so aqueles maiores
que 2, 2 e o valor P

P = P(Z > 2, 2) = 0, 5 tab(2, 2) = 0, 0139

Na Figura 5.5 ilustra-se esse valor. O que esse resultado est nos dizendo o seguinte:
se H0 for verdadeira, a probabilidade de obtermos um valor to oui mais extremo que 2,2
0, 0139. Novamente, essa uma probabilidade pequena, o que significa que pouco provvel
obtermos um valor to extremo quando H0 verdadeira. Logo, razovel supormos que a
hiptese nula no seja verdadeira, a mesma concluso obtida ao trabalharmos com o nvel
de significncia de 5%. Como antes, rejeitaramos a hiptese nula para qualquer nvel de
significncia maior que 0,0139.

Figura 5.5 Valor P para o Exemplo 5.2




EXEMPLO 5.6 Valor P para o Exemplo 5.3

O valor observado da estatistica de teste z0 = 0, 9803, e a hiptese alternativa


unilateral esquerda. Ento, valores to ou mais extremos so aqueles menores que
0, 9803 e o valor P

P = P(Z < 0, 9803) = P(Z > 0, 9803) = 0, 5 tab(0, 98) = 0, 1635

Na Figura 5.6 ilustra-se esse valor. O que esse resultado est nos dizendo o seguinte:
se H0 for verdadeira, h uma probabilidade alta de obtermos um valor to ou mais extremo
que 0, 9803. Assim, no h evidncia que indique que H0 seja falsa.


Departamento de Estatstica - Ana Maria Farias 64


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Figura 5.6 Valor P para o Exemplo 5.3

5.4.1 Procedimento geral para obteno do valor P

Os exemplos acima ilustram o procedimento para obteno do valor P quando a estatistica


de teste tem distribuio normal. Como essa uma distribuio simtrica, podemos sempre
calcular o valor P trabalhando na cauda superior da distribuio normal padro; para isso,
basta usar o valor absoluto |z0 | do valor observado da estatstica de teste.

Teste bilateral

H0 : = 0
H1 : 6= 0

P = P(Z < |z0 |) + P(Z > |z0 |)

P = 2 P(Z > |z0 |)

Teste unilateral direita


Podemos supor que z0 > 0. Caso contrrio, o valor P ser maior que 0, 5, o que leva
no rejeio de H0 para qualquer nvel de significncia razovel.

Departamento de Estatstica - Ana Maria Farias 65


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

H0 : = 0
H1 : > 0

P = P(Z > z0 )

P = P(Z > |z0 |)

Teste unilateral esquerda


Podemos supor que z0 < 0. Caso contrrio, o valor P ser maior que 0, 5, o que leva
no rejeio de H0 para qualquer nvel de significncia razovel.

H0 : = 0
H1 : < 0

P = P(Z < z0 ) = P(Z < |z0 |)

P = P(Z > |z0 |)

5.4.2 Valor P e nvel de significncia

Vimos que o nvel de significncia a probabilidade do erro tipo I e o valor crtico cor-
respondente delimita a regio de rejeio, ou seja, valores da estatistica de teste que caem
na regio crtica levam rejeio de H0 . O valor P, por sua vez, a probabilidade de se
obter valores to estremos quanto o observado e essa probabilidade, sendo pequena, leva
rejeio da hiptese nula.

Como podemos, ento, relacionar o valor P e o nvel de significncia em termos do


processo decisrio? Veja a Figura 5.7, onde ilustramos a situao para um teste unilateral
direita. Qualquer valor z0 maior que z leva rejeio de H0 . Mas tais valores correspon-
dem a probabilidades menores na cauda da distribuio, ou seja, correspondem a valores P
menores que . Isso nos leva seguinte observao:

Departamento de Estatstica - Ana Maria Farias 66


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

! Valor P versus nvel de significncia

O valor P o menor nvel de significncia para o qual a hiptese nula H0


rejeitada, ou seja,
rejeitamos H0 P

Figura 5.7 Valor P versus nvel de significncia

EXEMPLO 5.7 Peso de bala

Uma empresa fabricante de balas afirma que o peso mdio de suas balas de pelo menos 2
gramas. Pela descrio do processo de produo, sabe-se que o peso das balas distribui-se
normalmente com desvio padro de 0,5 grama. Uma amostra de 25 balas apresenta peso
mdio de 1,81 gramas. O que se pode concluir sobre a afirmao do fabricante? Estabelea
sua concluso usando um nvel de significncia de 5% e tambm o valor P.

Soluo

Seja X a varivel aleatria que representa o peso das balas. Ento, X N(; 0, 25).
Como n = 25, resulta que
X
Z= q N(0, 1)
0,25
25

A afirmativa do fabricante 2. Logo, a negao de tal afirmao < 2. Como


essa ltima expresso no contm o sinal de igualdade, ela se torna a hiptese alternativa.

Departamento de Estatstica - Ana Maria Farias 67


CAPTULO 5. TESTES DE HIPTESES BASEADOS NA DISTRIBUIO NORMAL

Ento, nossas hipteses so:

H0 : = 2
H1 : < 2

Para = 0, 05, a regio crtica

RC : Z0 < z0,05 = 1, 64

O valor observado da estatstica de teste


1, 81 2, 00
z0 = q = 1, 9 < 1, 64
0,25
25

Como o valor observado da estatistica de teste est na regio crtica, rejeita-se a


hiptese nula, ou seja, h evidncia de que o peso mdio seja menor que 2 gramas.

Temos tambm que

P = P(Z > | 1, 9|) = 0, 5 tab(1, 9) = 0, 0287

Assim, rejeitaramos H0 para qualquer nvel de significncia maior que 2,87%, o que inclui

5%.

Departamento de Estatstica - Ana Maria Farias 68


Captulo 6

Inferncia sobre a mdia da N(; 2), 2


desconhecida

6.1 Introduo

Neste captulo, completaremos o estudo bsico sobre inferncia estatstica, analisando a


situao em que nosso interesse est na mdia de uma populao normal, para a qual no
se conhece a varincia. Neste caso, necessrio estimar essa varincia e isso introduz
mais uma fonte de variabilidade nas nossas estimativas: com uma nica amostra, temos que
estimar a mdia e a varincia da populao. Como antes, usaremos uma estatstica baseada
na mdia amostral X , s que, nesse novo contexto, ela no tem mais a distribuio normal
e, sim, a distribuo t de Student.

Considere, ento, uma populao descrita por uma varivel aleatria normal com mdia
e varincia 2 : X N(; 2 ). Nosso interesse estimar a mdia a partir de uma amostra
aleatria simples X1 , X2 , . . . , Xn . Como visto no Captulo 2, a distribuio amostral de X
normal com mdia e varincia n , ou seja
2

 
2
X N(; ) = X N ;
2
n
Assim, se o valor de conhecido, resulta que
X
Z= n N(0; 1)

e esse resultado foi utilizado na construo de intervalos de confiana e testes de hipteses
sobre a mdia de uma populao normal com varincia conhecida.

Suponha, agora, que a varincia 2 no seja conhecida. Neste caso, temos que estim-
la com os dados amostrais. No Captulo 1, vimos, atravs de um exemplo numrico, que
n
" n #
1 X 1 X
S2 = (Xi X )2 = X 2 nX
2
n 1 i=1 n 1 i=1 i
CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

um estimador no-viesado de 2 . Isso significa que se calculssemos o valor de S 2 para


cada uma das possveis amostras aleatrias simples de tamanho n, a mdia desses valores
seria igual a 2 . Dessa forma, S 2 um bom estimador de 2 e podemos us-lo como uma
estimativa pontual de 2 . Sendo assim, natural pensarmos em substituir o valor de por
S na expresso (6.1) e utilizar a estatstica

X
T = n
S
na construo de intervalos de confiana e testes de hipteses para . Isso exatamente o
que faremos, mas, ao introduzirmos S no lugar de , a distribuio amostral de T deixa de
ser normal e passa a ser uma distribuio t de Student.

A distribuio t de Student (ou simplesmente distribuio t) foi obtida por William


Gosset (1876-1937), que trabalhava na Cervejaria Guinness na Irlanda. Como a cervejaria
no permitia a publicao de resultados de pesquisa obtidos por seus funcionrios, Gosset
publicou, sob o pseudnimo de Student, o artigo The Probable Error of a Mean na revista
Biometrika (vol. 6, no. 1).

6.2 A distribuio t de Student

A distribuio t de Student uma distribuio contnua, cuja funo de densidade de pro-


babilidade dada por

 +1
+1
 
x2 2

1
f(x) = 2
, < x <
2
1 +

R
onde () = 0
ex x 1 dx.

Essa expresso, certamente, assustadora! Mas eis uma boa notcia: no precisaremos
dela para calcular probabilidades! No entanto, interessante notar duas caractersticas b-
sicas dessa expresso: o argumento x da funo aparece elevado ao quadrado e a expresso
de f(x) depende de um parmetro representado pela letra grega ni: .

Da primeira observao resulta o fato de que f(x) simtrica em torno de zero, ou seja
f(x) = f(x).

O parmetro chamado graus de liberdade (s vezes abreviado por gl) e est as-
sociado ao nmero de parcelas independentes em uma soma. Para entender esse conceito,
considere o seguinte exemplo: se conhecemos a mdia de um conjunto de n dados, podemos
atribuir valores livremente a apenas n 1 desses dados, ou seja, conhecida a mdia e conhe-
cidos n 1 dos valores, o n-simo valor fica automaticamente determinado. Suponha n = 10
e x = 80; se conhecemos os valores de x1 , . . . , x9 o valor de x10 obtido pela expresso
P9
10 80 xi . Dizemos, ento, que h 9 graus de liberdade.
i=1

Departamento de Estatstica - Ana Maria Farias 70


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

Cada nmero de graus de liberdade d origem a uma distribuio t diferente. No


entanto, pela simetria da curva, todas as distribuies t tm mdia 0. Alm disso, o grfico
da funo de densidade da t tambm tem forma de sino, como a distribuio normal.

Nas Figuras 6.1 a 6.4 comparam-se as distribuies t (em vermelho) com = 1, 2, 10, 30
com a distribuio normal padro. Nos dois grficos superiores ( = 1, 2) fica mais ntido o
fato de a distribuio t ter maior disperso (consequncia do fato de substituirmos pela
sua estimativa s). Nos dois grficos inferiores ( = 10, 30), o que chama a ateno a quase
coincidncia da densidade t com a densidade N(0; 1).

Esse um resultado importante: medida que o nmero de graus de liberdade aumenta,


a distribuio t de Student aproxima-se da N(0; 1). A varincia da distribuio t com graus

de liberdade igual a 2 ( > 2) e podemos ver que essa varincia converge a 1, que a
varincia da N(0; 1), quando . Vamos representar por t() a distribuio t de Student
com graus de liberdade.

Figura 6.1 Comparao das distribui- Figura 6.2 Comparao das distribui-
es N(0, 1) e t(1) es N(0, 1) e t(2)

Figura 6.3 Comparao das distribui- Figura 6.4 Comparao das distribui-
es N(0, 1) e t(10) es N(0, 1) e t(30)

6.3 Tabela da t-Student

Ao contrrio da distribuio normal, no existe uma relao entre as diferentes distribuies


t; assim, seria necessria uma tabela para cada valor de . Os programas computacionais
de estatstica calculam probabilidades associadas a qualquer distribuio t, mas nos livros

Departamento de Estatstica - Ana Maria Farias 71


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

didticos comum apresentar uma tabela com os valores crticos de diferentes distribuies
t. A razo para isso que a maioria das aplicaes da distribuio t envolve a construo
de intervalos de confiana ou de testes de hipteses.

Nessas aplicaes, nosso interesse est no valor crtico associado a um nvel de sig-
nificncia que, como visto, o valor da abscissa que deixa probabilidade (rea) acima
dela. Vamos representar por t; o valor crtico da distribuio t(). Veja a Figura 6.5.

Figura 6.5 Valor crtico t(, ) da distribuio t()


A Tabela 3, apresentada no Apndice, uma apresentao usual dos valores crticos da
distribuio t. Cada linha corresponde a um nmero diferente de graus de liberdade e cada
coluna corresponde a uma rea na cauda superior. No corpo da tabela temos a abscissa
t que deixa a rea acima dela, ou seja:

P(t(3) > t3, ) =

Vamos ver, agora, exemplos de utilizao da Tabela 3.

EXEMPLO 6.1 Valores crticos da t

(a) Na distribuio t(15) encontre a abscissa t15;0,05 .


(b) Na distribuio t(23) encontre a abscissa t tal que P(|t(23)| > t) = 0, 05.
(c) Na distribuio t(12) encontre a abscissa t tal que P(|t(12)| t) = 0, 90.

Soluo

(a) Como o nmero de graus de liberdade 15, temos de nos concentrar na linha correspon-
dente a gl = 15. A abscissa t0,05 deixa rea 0,05 acima dela; logo, t15;0,05 = 1, 753.

Departamento de Estatstica - Ana Maria Farias 72


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

(b) Usando as propriedades da funo mdulo, temos a seguinte equivalncia:


P(|t(23)| > t) = 0, 05
P(t(23) < t) + P(t(23) > t) = 0, 05
Pela simetria da densidade t, P(t(23) < t) = P(t(23) > t). Substituindo:
P(t(23) > t) + P(t(23) > t) = 0, 05
P(t(23) > t) = 0, 025
t = 2, 069
Esse ltimo valor foi encontrado na Tabela 3, consultando-se a linha correspondente a
23 graus de liberdade e coluna correspondente rea superior de 0,025. Veja a Figura
6.6.
(c) Das propriedades da funo mdulo e da simetria da densidade t resultam as seguintes
equivalncias. Veja a Figura 6.7.
P(|t(12)| t) = 0, 90
P(t t(12) t) = 0, 90
P(t t(12) < 0) + P(0 t(12) t) = 0, 90
2 P(0 t(12) t) = 0, 90
P(0 t(12) t) = 0, 45
P(t(12) > t) = 0, 05
t = 1, 782

Figura 6.6 P(|t(23)| > t) = 0, 05 Figura 6.7 P(|t(15)| t) = 0, 90 

6.4 Intervalo de confiana para a mdia de uma populao


normal com varincia desconhecida

O intervalo de confiana para a mdia de uma populao normal com varincia desconhecida
obtido com base no seguinte resultado:

Departamento de Estatstica - Ana Maria Farias 73


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

! Distribuio Amostral da Mdia Amostral - Populao Normal com


Varincia Desconhecida

Se X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X


N ; 2 , ento
X
T = n t(n 1) (6.1)
S
n
n 
P P 2
onde S = n1 (Xi X ) = n1 Xi nX .
2 1 2 1 2

i=1 i=1

Para qualquer distribuio t(), vlido o seguinte resultado, consequncia imediata


da simetria da distribuio e da definio do valor crtico (veja a Figura 6.8):

P (t; /2 t() t; /2 ) = 1 (6.2)

Figura 6.8 Valores crticos da t-Student para construo do intervalo de confiana da


mdia de uma normal com varincia desconhecida

Como o resultado (6.2) vale para qualquer distribuio t, usando o resultado (6.1),
obtemos:
X
 
P tn1; /2 n tn1; /2 = 1 =
S
 
S S
P tn1; /2 X tn1; /2 = 1 =
n n
 
S S
P X tn1; /2 X + tn1; /2 =1
n n

Departamento de Estatstica - Ana Maria Farias 74


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

Essa ltima expresso o intervalo de confiana para a mdia de uma populao


normal com varincia desconhecida.

! Intervalo de Confiana para a Mdia da N(; 2 ) 2 Desconhecida

Seja X1 ,X2 , . . . , Xn uma amostra aleatria simples de uma populao X


N ; 2 . O intervalo de confiana para de nvel de confiana 1
 
S S
X tn1; /2 ; X + tn1; /2
n n

onde tn1; /2 o valor crtico da distribuio t-Student com n 1 graus


de liberdade que deixa rea /2 acima dele.

6.4.1 Margem de Erro

Note, mais uma vez, a forma do intervalo de confiana:

onde a margem de erro , agora, definida em termos do valor crtico da distribuio t e do


erro- padro estimado de X :
S .
= tn1; /2 = tn1; /2 EP(X
d ) (6.3)
n
onde
d ) = S
EP(X (6.4)
n

6.4.2 Amostras Grandes

X
Vimos que, para populaes normais, a distribuio exata da estatstica T = n
S
t(n 1). Mas vimos tambm que, quando o nmero de graus de liberdade grande, a
diferena entre as distribuies t e N(0; 1) torna-se desprezvel.

Por outro lado, se a populao no normal, mas tem mdia e varincia 2 , o Teorema
X
Limite Central nos diz que a distribuio de n se aproxima de uma N(0; 1) medida

que n . Pode-se mostrar que esse resultado continua valendo se substituirmos por
seu estimador S.

A concluso dessas duas observaes a seguinte:

Departamento de Estatstica - Ana Maria Farias 75


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

! Intervalo de confiana baseado em grandes amostras

Dada uma amostra aleatria simples X1 , X2 , . . . , Xn de uma populao X


com mdia e varincia 2 , ento

X
n N(0; 1)
S
para n suficientemente grande. Nesse caso, o intervalo de confiana apro-
ximado de nvel de confiana 1 para
 
S S
X z/2 ; X + z/2
n n

EXEMPLO 6.2

De uma populao normal com mdia e varincia desconhecidas, extrai-se uma amostra
de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de confiana para a
verdadeira mdia populacional, utilizando o nvel de confiana de 95%.

Soluo

Os seguintes requisitos para o IC para so satisfeitos: a populao normal e a


amostra pequena. Dessa forma, temos que usar a distribuio t com n 1 = 14 graus de
liberdade. Como o nvel de confiana de 95%, em cada cauda da distribuio temos que
ter 2,5%. Assim, devemos procurar a abscissa t14;0,025 procurando na linha correspondente a
14 graus de liberdade e na coluna correspondente rea de 0,025. Encontramos

t14;0,025 = 2, 145
A margem de erro
= 2, 145 = 3, 8769
7
15
e o intervalo de confiana, [12 3, 8769; 12 + 3, 8769] = [8, 1231; 15, 8769] 

EXEMPLO 6.3

A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa
o intervalo de confiana para a mdia populacional, com nvel de significncia de 10%.

Soluo

Departamento de Estatstica - Ana Maria Farias 76


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

Como antes, temos uma amostra pequena de uma populao normal; logo, temos que
usar a distribuio t-Student. Como n = 9, gl = n 1 = 8.

A mdia amostral
P
xi
x =
n
6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 78
= = = 8, 667
9 9
e a varincia amostral
" P 2#
1 X 1 X ( xi )
S2 = (xi x)2 = xi2 =
n1 n1 n
 
1 2 782
= 6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12
2 2 2 2 2 2 2 2
8 9
 
1 6084 36
= 712 = = 4, 5
8 9 8
Como o nvel de significncia = 10%, o nvel de confiana 1 = 90%. Em cada
cauda da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na linha
correspondente a 8 graus de liberdade a abscissa relativa rea superior de 0,05. Obtemos
t8;0,05 = 1, 860. A margem de erro
r
4, 5
= 1, 860 = 1, 395
8
e o intervalo de confiana [8, 667 1, 395; 8, 667 + 1, 395] = [7, 272; 10, 062] 

EXEMPLO 6.4

A partir de uma amostra aleatria simples de tamanho n = 100, os seguintes valores foram
obtidos: x = 12, 36 e S 2 = 132, 56. Obtenha um intervalo de confiana de nvel de confiana
90% para a mdia populacional .

Soluo

Como o tamanho amostral grande, podemos usar a aproximao normal. Como 1 =


0, 90, em cada cauda temos que ter 5% e, assim, devemos procurar no corpo da tabela da
distribuio normal o valor mais prximo de 0,45. Resulta que z0,05 = 1, 64,, o que nos d a
seguinte margem de erro: r
132.56
= 1.64 = 1, 8882
100
O intervalo de confiana de 90% de confiana [12.36 1.8882 ; 12.36 + 1.8882] =
[10.472 ; 14.248] 

Departamento de Estatstica - Ana Maria Farias 77


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

6.5 Teste de hiptese sobre a mdia de uma populao nor-


mal com varincia desconhecida

O procedimento de teste de hipteses sobre a mdia de uma populao normal quando a


varincia no conhecida absolutamente anlogo ao caso em que conhecemos 2 . A
mudana diz respeito estatistica de teste e sua distribuio, que agora passam a ser

X 0
T0 = n t(n 1)
S
A seguir apresentamos os resultados pertinentes para cada um dos tipos de hiptese alter-
nativa.

Teste bilateral

H0 : = 0
H1 : 6= 0

X 0
T0 = n t(n 1)
S

Regio crtica:
T0 < tn1,/2 ou T0 > tn1,/2

Teste unilateral direita

H0 : = 0
H1 : > 0

X 0
T0 = n t(n 1)
S

Regio crtica:
T0 > tn1,

Teste unilateral esquerda

Departamento de Estatstica - Ana Maria Farias 78


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

H0 : = 0
H1 : < 0

X 0
T0 = n t(n 1)
S

Regio crtica:
T0 < tn1,

6.6 Resumo Comparativo

Para finalizar a parte relativa construo de intervalos de confiana que veremos neste
curso, vamos resumir os resultados vistos anteriormente. importante notar que existem
procedimentos para construo de intervalos de confiana para outros parmetros, tal como
a varincia de uma populao normal. O procedimento anlogo; o que muda a distribuio
amostral.

6.6.1 IC para a mdia de populaes normais

O contexto bsico analisado na seo 3.2 e neste captulo o seguinte: de uma populao
normal extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn com o objetivo de se obter uma
estimativa intervalar para a mdia . Foram consideradas duas situaes: (i) 2 conhecida e
(ii) 2 desconhecida. Em ambos os casos, a expresso para o intervalo de confiana de nvel
de confiana 1
X
com a margem de erro assumindo a forma geral

= /2 EP(X )

onde /2 representa o valor crtico de alguma distribuio e EP(X ) o erro-padro da mdia


amostral.

2 conhecida

/2 = z/2 N(0; 1)


EP(X ) =
n

Departamento de Estatstica - Ana Maria Farias 79


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

2 desconhecida

/2 = tn1; /2 t(n 1)

S
EP(X ) =
n

Quando n > 31, pode-se usar z/2 no lugar de tn1; /2 .

6.6.2 IC para uma proporo

O contexto bsico considerado na Seo 3.3 foi o seguinte: de uma populao representada por
uma varivel aleatria X Bern(p) extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn
com o objetivo de se estimar a proporo populacional p dos elementos que possuem de-
terminada caracterstica de interesse. Se a amostra suficientemente grande (em geral,
n > 30), o intervalo de confiana para p tem a forma

P
b

com a margem de erro assumindo a forma geral

= z/2 EP(P)
b

com r
p
b0 (1 p
b0 )
EP(P)
b =
n
Aqui, p
b0 uma estimativa prvia da proporo populacional p ou a prpria proporo amostral
p
b obtida a partir da amostra.

6.6.3 IC para a mdia de populaes no-normais - amostra grande

Dada uma aas de tamanho grande de uma populao qualquer com mdia , o intervalo de
confiana de nvel de confiana aproximado 1

S
X z/2
n

Departamento de Estatstica - Ana Maria Farias 80


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

Esses resultados esto resumidos na Tabela 6.1 e na Figura 6.9.

Tabela 6.1 Resumo Comparativo dos Resultados sobre Intervalos de Confiana

Parmetro de Interesse Estatstica Amostral Margem I.C.


e sua Distribuio de erro

X
Mdia da 2 conhecida n N(0; 1) = z/2 n

populao X
N(; )
2

X
2 desconhecida n t(n 1) = tn1; /2 Sn
S

Proporo
Pb p q
[ mdia Bern(p)] np N(0; 1) = z/2 pb0 (1b
n
p0 )
P
b
p(1 p)

X
Mdia de uma (amostra grande) n N(0; 1) = z/2 Sn X
S
populao X

Departamento de Estatstica - Ana Maria Farias 81


CAPTULO 6. INFERNCIA SOBRE A MDIA DA N(; 2 ), 2 DESCONHECIDA

Figura 6.9 Resumo dos procedimentos para construo de intervalos de confiana

Departamento de Estatstica - Ana Maria Farias 82


Apndice A

Tabela da Distribuio Normal

Tabela 1: Tabela da normal padro p = P(0 Z z)

Tabela 2: Tabela da distribuio acumulada da normal padro (z) = P(Z z), z 0

Tabela 3: Valores crticos da distribuio t

83
APNDICE A. TABELA DA DISTRIBUIO NORMAL

Tabela 1
Distribuio normal padro
p = P(0 Z z)

Casa inteira 2a. decimal


e 1a. Decimal 0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
4,0 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Para abscissas maiores que 4,09, use a probabilidade 0,5000

Departamento de Estatstica - Ana Maria Farias 84


APNDICE A. TABELA DA DISTRIBUIO NORMAL

Tabela 2
Distribuio acumulada da normal padro
p = P(Z z)

Casa inteira 2a. decimal


e 1a. Decimal 0 1 2 3 4 5 6 7 8 9
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
4,0 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Para abscissas maiores que 4,09, use a probabilidade 1,0000

Departamento de Estatstica - Ana Maria Farias 85


APNDICE A. TABELA DA DISTRIBUIO NORMAL

Tabela 3
Valores crticos da t-Student
p = P(T > tp )

g.l. Area p na cauda superior


n 0,150 0,100 0,060 0,050 0,040 0,030 0,025 0,020 0,010 0,005 0,0025 0,002 0,001
1 1,963 3,078 5,242 6,314 7,916 10,579 12,706 15,895 31,821 63,657 127,321 159,153 318,309
2 1,386 1,886 2,620 2,920 3,320 3,896 4,303 4,849 6,965 9,925 14,089 15,764 22,327
3 1,250 1,638 2,156 2,353 2,605 2,951 3,182 3,482 4,541 5,841 7,453 8,053 10,215
4 1,190 1,533 1,971 2,132 2,333 2,601 2,776 2,999 3,747 4,604 5,598 5,951 7,173
5 1,156 1,476 1,873 2,015 2,191 2,422 2,571 2,757 3,365 4,032 4,773 5,030 5,893
6 1,134 1,440 1,812 1,943 2,104 2,313 2,447 2,612 3,143 3,707 4,317 4,524 5,208
7 1,119 1,415 1,770 1,895 2,046 2,241 2,365 2,517 2,998 3,499 4,029 4,207 4,785
8 1,108 1,397 1,740 1,860 2,004 2,189 2,306 2,449 2,896 3,355 3,833 3,991 4,501
9 1,100 1,383 1,718 1,833 1,973 2,150 2,262 2,398 2,821 3,250 3,690 3,835 4,297
10 1,093 1,372 1,700 1,812 1,948 2,120 2,228 2,359 2,764 3,169 3,581 3,716 4,144
11 1,088 1,363 1,686 1,796 1,928 2,096 2,201 2,328 2,718 3,106 3,497 3,624 4,025
12 1,083 1,356 1,674 1,782 1,912 2,076 2,179 2,303 2,681 3,055 3,428 3,550 3,930
13 1,079 1,350 1,664 1,771 1,899 2,060 2,160 2,282 2,650 3,012 3,372 3,489 3,852
14 1,076 1,345 1,656 1,761 1,887 2,046 2,145 2,264 2,624 2,977 3,326 3,438 3,787
15 1,074 1,341 1,649 1,753 1,878 2,034 2,131 2,249 2,602 2,947 3,286 3,395 3,733
16 1,071 1,337 1,642 1,746 1,869 2,024 2,120 2,235 2,583 2,921 3,252 3,358 3,686
17 1,069 1,333 1,637 1,740 1,862 2,015 2,110 2,224 2,567 2,898 3,222 3,326 3,646
18 1,067 1,330 1,632 1,734 1,855 2,007 2,101 2,214 2,552 2,878 3,197 3,298 3,610
19 1,066 1,328 1,628 1,729 1,850 2,000 2,093 2,205 2,539 2,861 3,174 3,273 3,579
20 1,064 1,325 1,624 1,725 1,844 1,994 2,086 2,197 2,528 2,845 3,153 3,251 3,552
21 1,063 1,323 1,621 1,721 1,840 1,988 2,080 2,189 2,518 2,831 3,135 3,231 3,527
22 1,061 1,321 1,618 1,717 1,835 1,983 2,074 2,183 2,508 2,819 3,119 3,214 3,505
23 1,060 1,319 1,615 1,714 1,832 1,978 2,069 2,177 2,500 2,807 3,104 3,198 3,485
24 1,059 1,318 1,612 1,711 1,828 1,974 2,064 2,172 2,492 2,797 3,091 3,183 3,467
25 1,058 1,316 1,610 1,708 1,825 1,970 2,060 2,167 2,485 2,787 3,078 3,170 3,450
26 1,058 1,315 1,608 1,706 1,822 1,967 2,056 2,162 2,479 2,779 3,067 3,158 3,435
27 1,057 1,314 1,606 1,703 1,819 1,963 2,052 2,158 2,473 2,771 3,057 3,147 3,421
28 1,056 1,313 1,604 1,701 1,817 1,960 2,048 2,154 2,467 2,763 3,047 3,136 3,408
29 1,055 1,311 1,602 1,699 1,814 1,957 2,045 2,150 2,462 2,756 3,038 3,127 3,396
30 1,055 1,310 1,600 1,697 1,812 1,955 2,042 2,147 2,457 2,750 3,030 3,118 3,385
31 1,054 1,309 1,599 1,696 1,810 1,952 2,040 2,144 2,453 2,744 3,022 3,109 3,375
32 1,054 1,309 1,597 1,694 1,808 1,950 2,037 2,141 2,449 2,738 3,015 3,102 3,365
33 1,053 1,308 1,596 1,692 1,806 1,948 2,035 2,138 2,445 2,733 3,008 3,094 3,356
34 1,052 1,307 1,595 1,691 1,805 1,946 2,032 2,136 2,441 2,728 3,002 3,088 3,348
35 1,052 1,306 1,594 1,690 1,803 1,944 2,030 2,133 2,438 2,724 2,996 3,081 3,340

Departamento de Estatstica - Ana Maria Farias 86

Você também pode gostar