Você está na página 1de 67

Capítulo 1

Inferência Estatística

1.1 Introdução

Considere-se que o resultado de um experimento qualquer é a observação  de uma


variável aleatória  , discreta ou continua. Esta variável é caracterizada por uma distribuição de
probabilidade pertencendo a alguma família    de distribuições especificada na qual um
número finito de parâmetros   (  , . . .,  ) é, em geral, desconhecido. Seja  ( ;  ) a
função de probabilidade ou densidade de  dado .
Aqui  ( ; ) é escrito indiferentemente para distribuições univariadas discretas ou
contínuas. Admite-se que temos  observações   ( , . . .,  ) - rea1izações da variável
aleatória  - geradas repetindo-se o experimento.
A teoria de probabilidade trata do problema da distribuição de  quando esta é
completamente definida (i.é, todos os parâmetros  's são conhecidos). Entretanto, se a
distribuição de  não está completamente definida e podemos apenas supor que a sua
distribuição pertence a família   ), o problema passa a ser de inferência estatística. O
interesse é então, a partir das observações , ter alguma informação sobre  e assim determinar
completamente a distribuição   ) de  .
¸~ das alturas dos brasileiros adultos possa ser
´ supor que a distribuicao
Parece razoavel
representada por uma distribuição Normal. Mas esta afirmacao ¸~ nao~ e´ suficiente para
determinar qual a distribuicao ¸~ Normal correspondente; precisariamos ´ conhecer os
^
parametros, media ^
´ e variancia, desta Normal.
´
Se pudessemos ´
medir as alturas de todos os brasileiros adultos, teriamos meios de
^
obter os verdadeiros valores dos parametros ¸~ Normal exata.
e, assim, produzir a distribuicao
^
Contudo, fazer inferencia ´ ou
´ dos dados populacionais nem sempre e´ possivel
atraves
´
viavel.

´
 Considere um experimento estatistico ~ valores assumidos
cujos resultados,  , sao
´ .
´ aleatoria
por uma variavel

¸~ de probabilidade de  onde  é desconhecido e


 Seja  (  ) a distribuicao
denominado PARÂMETRO.
´
 e´ uma caracteristica ´
numerica desconhecida que determina completamente a
distribuição de probabilidade  (  ).

1
Exemplos:   pode representar a chegada de navios no porto:    , com parâmetro 
onde
Media ^
´ Populacional    e Variancia Populacional   

2)   altura das pessoas de uma cidade, usualmente      , com parâmetros 


e  , onde
´ Populacional    e Variancia
Media ^ Populacional   

3   temperatura em cada mê do ano      com parâmetro de forma  e


parâmetro de escala  , onde
   e   

4   tempo de falha de um componente eletrônico     ou     

 Na pratica,
´ ~ sera´ completamente conhecida, isto e,
 (  ) nao ´ um ou mais
^
parametros ~ desconhecidos.
 serao

´
 O objetivo do estatistico ^
e´ estimar estes parametros desconhecidos ou testar a
¸~
validade de certas afirmacoes sobre eles.

Definição: O conjunto  de todos os possíveis valores que um parâmetro  (de uma f.d.p
 (  ) pode assumir é chamado Espaço Paramétrico.

Exemplos:  No primeiro exemplo acima, temos     , logo    .

2) No segundo, temos    e   0, então:       e


  (          e    .

Se  é conhecido, então          .

3) No terceiro exemplo, temos 0 e   0, então   ,  e


  (  ,      0 e   0  .

4) Seja  ~   com  desconhecido, então    e         .

2
1.2 Amostra Aleatória

Para o estatístico estimar os parâmetros da distribuição de probabilidade  (   ) ele


então observa n valores  , . . .,  assumidos pela v.a. . Cada i pode ser considerado
como o valor assumido por uma v.a.  , i  , . . ., , onde  , . . ., n sao ~ v.a's.
independentes com f.d.p comum  (  ).

Definição: Seja  uma v.a. com f.d.p  (  )


¸~  ,  , . . . ,  formam uma AMOSTRA ALEATORIA
As observacoes ´ (a.a.)
¸~
de tamanho n da v.a.  , se elas resultam de selecoes independentes e cada  tem a mesma
¸~ de  (da populacao).
distribuicao ¸~

¸~ e´ muito importante que o tempo gasto numa


Exemplo: Numa linha de producao,
¸~ nao
determinada operacao ~ varie muito de empregado para empregado.
¸~
11 empregados apresentam os tempos abaixo para realizar essa operacao

125 135 115 120 150 130 125 145 125 140 130

QUESTÕES: 1) Qual distribuição de probabilidade  (  ) melhor representaria a


¸~  baseada nesses dados?
população   tempo gasto na operacao

2) Uma vez reconhecida a distribuição (ou a melhor distribuição dentre várias


possíveis)  (  ), para os dados acima, como estimar o(s) parâmetro(s)  .

~ o objetivo do estatistico
Entao, ´ e´ decidir, com base numa amostra adequadamente
selecionada, que membro ou membros da familia´ { (   ),   } pode representar a f.d.p
de  .
~ chamados problemas de Inferencia
Problemas deste tipo sao ^ ´
Estatistica e sera´ o
objeto de estudo destas notas.

3
1.3 Histograma: estimador da 'forma' da distribuição de 

Suponhamos que temos uma populacao ¸~ cuja distribuicao


¸~ desconhecemos.
Extraimos uma amostra de tamanho  dessa populacao. ¸~
Com esta informacao ¸~ queremos ter uma ideia ¸~
´ da forma da distribuicao
desconhecida, ou seja, queremos estimar a funcao ¸~ densidade (no caso de variavel ´
´ continua)
¸~ de probabilidades (no caso de variavel
ou a distribuicao ´ discreta).
No caso de v.a. discreta, o problema a ser investigado geralmente já sugere a
distribuição de probabilidade a ser adotada, contudo, para uma v.a. contínua, pode existir
várias distribuições a ser utilizada no problema.

^
Exemplo: Numa central telefonica chegam 300 telefonemas por hora.
~ haja nenhum chamado.
Qual a probabilidade de que num minuto nao

Sol: Seja X: número de chamadas por minuto.


X ~ Poisson() onde E(X) = .

300
´ de chamadas por minuto e´  =
O número medio 60 =5

e-5 . 50
Portanto, P{X = 0} = 0! = 0,006738

´
Exemplo: Os dados abaixo referem-se aos montantes (em milhares de dolares) de 32
´
emprestimos pessoais em uma companhia financeira.

6.0 0.0 2.0 6.5 5.0 3.5 4.0 7.0 8.0 7.0 8.5 6.0 4.5 0.0 6.5 6.0
2.0 5.0 5.5 5.0 7.0 1.5 5.0 5.0 4.0 4.5 4.0 1.0 5.5 3.5 2.5 4.5
Com os dados da tabela construimos o histograma dado abaixo.

h=hist(X)
xhist=c(min(h$breaks),h$breaks)
yhist=c(0,h$density,0)
xfit=seq(min(X),max(X) ,length=85)
yfit=dnorm(xfit,5,1.8)
plot(xhist,yhist,type="s",ylim=c(0,max(yhist,yfit)))
lines(xfit,yfit,col="red")

4
0.20
0.15
yhist

0.10
0.05
0.00

0 2 4 6 8 10

xhist

A curva suavizada da figura da´ uma ideia ¸~ da


´ da verdadeira forma da distribuicao
´ momentante de empréstimos.
variavel
Uma comparacao¸~ visual permite-nos concluir que a distribuicao
¸~ obtida aproxima-se
¸~ Normal, i.é,      .
razoavelmente de uma Distribuicao
Podemos checar a Normalidade dos dados pelo Teste  .
Existem vários métodos (gráficos e testes) para checarmos o ajustamento dos dados
(a.a.) a uma distribuição de probabilidade conhecida.

´
1.4 Estatistica
~o: Seja  ,  , . . . ,  uma a.a. de uma v.a.  , e sejam  ,  , . . . ,  os
Definiça      
valores tomados pela amostra.
Definimos ESTATISTICA ´ ¸~  ( ,  , . . . ,  ), que tome o valor
à uma funcao
   ( ,  , . . . ,  ).

´
Obs: 1) Uma Estatistica ¸~ de valor numerico
e´ uma funcao ´ ¸~ amostrais.
das observacoes
Qualquer função da amostra que não depende de parâmetros desconhecidos é uma
estatística.

5
´
2) Os valores de uma estatistica possuem uma variabilidade, pois dependem da
´
amostra, portanto a estatistica e´ uma v.a..

´
As seguintes estatisticas ~ de grande interesse:
sao


_  
1
´
i) Media Amostral  

n _ 
 Xi - X
^
ii) Variancia Amostral S = i=1
n-1

´
iii) Minimo da Amostra ´ (X , . . ., Xn )
K = min

´
iv) Maximo da Amostra ´ (X , . . ., Xn )
M = max

n _ _
(i )(i )
i=1
v) Correlação Amostral  n _ n _
(i ) (i )

i=1 i=1

Exemplo: Seja  ~      , onde  é conhecido mas  é desconhecido.


Seja  , . . .,  uma amostra de 
De acordo com a definição,

 
 não é uma estatística
=1

¸ ~ Amostral de uma Estatistica


1.5 Distribuicao ´
_
´
Lembremos que estatisticas ~ variaveis
amostrais, p.ex, X, S , e outras, sao ´ ´
aleatorias,
^
enquanto os parametros populacionais ,  sao ~ constantes fixadas que podem ser
desconhecidas.

~o: A distribuicao
Definiça ¸~ de probabilidade de uma estatistica
´ e´ chamada sua
~
DISTRIBUICAO¸ AMOSTRAL.

Naturalmente, há muitas outras estatística importantes que encontraremos, mas


certamente aquelas mencionadas acima desempenham importante papel em muitas
aplicações estatísticas. Enunciaremos agora (e demonstraremos) alguns teoremas referentes
às estatísticas acima.

6
1.5.1 Média Amostral

Teorema: Seja  uma v.a. qualquer com media ^


´  e variancia  .
Seja 
_  , . . . ,  uma amostra aleatória. _ _
~ E(X) =  
Seja  =   . . .  a Media
´ Amostral, entao e var(X) = n

_ E(X ) + E(X ) + . . . + E(Xn ) ++...+ n.


prova: i) E(X) = n = n = n = .

´
ii) Pelo fato das variaveis serem independentes, vem

_ var(X ) + var(X ) + . . . + var(Xn )  +  + . . . +  n. 


var(X) = n = n = n = n . 

Exemplo: Seja uma populacao ¸~ consistindo de 3 residencias;


^ ´ 2
sendo que uma delas contem
^
comodos, outra contem ^
´ 3 comodos ^
e a terceira residencia ^
´ 4 comodos.
contem
^
Seja a v.a. X: no. de comodos em cada residencias. ^
Sup. que selecionamos aleatoriamente uma amostra de duas residencia ^ com
~
reposicao.
¸
_
A distribuicao
¸~ amostral de X e´ dada por,
--------------------------------------------
_
Valor de X Probabilidade
---------------------------------------------
2.0 1/9
2.5 2/9
3.0 3/9
3.5 2/9
4.0 1/9
-------------------------------------------

Calculando a media ^
´ populacional e a variancia populacional, encontraremos:

(2 - 3) + (3 - 3) + (3 - 4)


= 2+3+4
3 =3 e  = 3 = 0.67
_ _ _
¸~ de probabilidade da v.a. X podemos calcular E(X) e var(X), como
Pela distribuicao
segue:
_ 5 _ _ _
E(X) =  Xi .P(Xi = xi ) = 2x 19 + 2.5x 29 + 3x 39 + 3.5x 29 + 4x 19 = 27
9 =3
i=1

_ 5 _ _ _
E(X ) =  Xi .P(Xi =x) = 4x 19 + 6.25x 29 + 9x 39 + 12.25x 29 + 16x 19 = 84
9 = 9.33
i=1

_ _ _ 
var(X) = E(X ) - E(X) = 9.333 - 9 = 0.3333

7
_ _

Portanto, E(X) =  e var(X) = n ,

o que comprova o resultado do Teorema. 

_
Ja´ determinamos a media
´ ^
e a variancia ~ de X. Para obtermos as
da distribuicao
¸
_
demais propriedades de X, bastaria agora determinar qual a forma da curva referente à
_ _
¸~ de X , ou seja qual o modelo probabilistico
distribuicao ´ de X.
¸~ Normal, a
Para amostras casuais simples X , . . . , Xn , retiradas de uma populacao
_
¸~ amostral da media
distribuicao ´ X sera´ Normal.

Teorema: Seja  uma v.a. com distribuição normal      .


_
~     ,  
Seja  , . . . ,  uma amostra aleatória, entao 

_
´
prova: Com o proposito ¸~ densidade de X, considere sua funcao
de encontrar a funcao ¸~
´
geratriz de momentos. Dai,

_
MX_ (t) = Eet.X  = Eet.(X +X + . . . +Xn )/n  = Eet.X /n . Eet.X /n  . . . Eet.Xn /n  =
=  Eet.Xi/n  =  MXi (t/n). Ou seja,
MX_ (t) =  MXi (t/n).

~ MX (t) = exp.t +  .t


Sabemos que se Xi ~ N( ,  ) entao i 2 .
n

  .t  .t
´ MX_ (t) =  exp . t +
Dai,  n
t
2 . n   = exp n.t + 2.n  = exp.t + 2.n 

¸~ geratriz de momentos da variavel


Logo, MX_ (t) e´ a funcao ´ e
´ normal com media
^
variancia  /n. 

8
Exemplo: Numa urna tem-se 5 tiras de papel numeradas 1, 3, 5, 5, e 7.
¸~
Seja a v.a. X = valor assumido pelo elemento na populacao.
¸~ de X e´ dada por
A distribuicao

--------------------------------------------------------
x 1 3 5 7
--------- ----------------------------------------------
p(X=x) 1/5 1/5 2/5 1/5
--------------------------------------------------------

Uma tira de papel e´ sorteada e recolocada na urna; entao ~ uma segunda tira e´
sorteada.
Sejam X e X , respectivamente, o primeiro e o segundo números sorteados.
_
´
Tabela: Possiveis valores de X.
(X , X ) (1,1) (1,3) (1,5) (1,5) (1,7) (3,1) (3,3) (3,5) (3,5) (3,7) (5,1) (5,3)
-----------------------------------------------------------------------------------------------------
_
X= X +X
2

1 2 3 3 4 2 3 4 4 5 3 4

(5,5) (5,5) (5,7) (5,1) (5,3) (5,5) (5,5) (5,7) (7,1) (7,3) (7,5) (7,5) (7,7)
--------------------------------------------------------------------------------------------------
5 5 6 3 4 5 5 6 4 5 6 6 7
_
¸~ amostral de X p/ n=2 e´ dada por,
Assim, a distribuicao
_
x_ _ 1 2 3 4 5 6 7
P{X = x} 1/25 2/25 5/25 6/25 6/25 4/25 1/25

9
Exemplo: Digamos que a v.a. X represente o peso real de pacotes de cafe, ´ enchidos
¸~ Normal N(500, 81). Sorteamos 9 pacotes
automaticamente. Sabe-se que X tem distribuicao
e medimos seus pesos. Assim, se a maquina ´ estiver regulada, a probabilidade de
´ de 9 pacotes diferindo de 500 com menos de 6 gramas sera?
encontrarmos a media ´

_ _ _
 500 X  500 506  500
Sol: P X - 500   6  P{494  X  506}  P 4949/3  9/3  9/3  

~ 95%
 P{  2  Z  2} =

~ uma media
Ou seja, dificilmente 9 pacotes terao ´ fora do intervalo [498, 502]. Caso
9 pacotes apresentem uma media ´ fora desse intervalo, sera´ razoavel
´ desconfiar que a
´
maquina esteja desregulada. 

´
Como a maioria das variaveis ¸~ que nao
de interesse possuem distribuicoes ~ sao
~ nem
mesmo aproximadamente normais, e´ importante sabermos se as propriedades anteriores de
_
~ aproximadamente satisfeitas quando a amostragem e´ realizada a partir de uma
X sao
¸~ nao-normal.
distribuicao ~

Teorema: Seja        uma amostra aleatória de uma distribuição de Poisson com



média  Então   tem distribuição de Poisson com parâmetro n.

_ 
n 
Daí, P            para k = 0, 1, 2, ...
 

que fornece a distribuição exata da média amostral para uma amostra de uma distribuição
de Poisson.

10
Teorema: Se X , . . . , Xn é uma amostra aleatória de   () , com fdp dada por
_
~   ( , ).
 ()   I (, entao

prova: Veja Mood, Graybill e Boes.

Exemplo: Um dispositivo eletrônico tem uma duração de vida  , a qual é


exponencialmente distribuída, com parâmetro   0,001; quer dizer, sua fdp é
 ()  0,0010,001 . Suponha-se que 100 desses dispositivos constituem uma a.a.,
fornecendo os valores observados 1 , . . .,  . Qual é a probabilidade de que
_
950    1.100?

_
Sol: No caso presente, poderemos realmente obter a distribuição exata de   Pelo Teorema
acima

  99! (0,001) 99 0,001 

_
onde  é a fdp de 1  . . .   . Daí, a fdp de  será dada por

_ _ _
  99 0,01
  99! (0,01)   .

_
Portanto,  tem uma distribuição gama com parâmetros 0,1 e 100. Logo,

_ 1100 _ _
 950    1.100  950   ...... 

A figura abaixo sugere-nos que, quando o tamanho da amostra aumenta,


_
independendo da distribuicao¸~ da populacao
¸~ original, a distribuicao
¸~ amostral de X aproxima-
se cada vez mais de uma de uma distribuicao ¸~ normal. Este resultado, fundamental na teoria
^
de Inferencia ´
Estatistica, e´ conhecido como Teorema do Limite Central.

TEOREMA DO LIMITE CENTRAL TLC:

Seja X uma v.a. qualquer com media ^


´  e variancia  .
_
~     , 
Seja  , . . . ,  uma amostra aleatória, entao 

quando  e´ grande.

prova: Ver Meyer pgs. 293 e 294.

11
NOTA: Independente de a distribuicao¸~ populacional ser continua,
´ ´
discreta, simetrica ou
´
assimetrica, ^
o TLC estabelece que se a variancia ~ a distribuicao
populacional e´ finita, entao, ¸~
_
´ amostral X e´ aproximadamente Normal se o tamanho da amostra for grande.
da media

^
A rapidez dessa convergencia ¸~ da populacao
depende da distribuicao ¸~ da qual a
¸~ original e´ proxima
amostra e´ retirada. Se a populacao ´ ^
da Normal, sua convergencia e´
´
rapida; ~
´ se a distribuicao
ja, ~ ^
¸ tem a forma de um V, essa convergencia e´ mais
¸ da populacao
demorada.

12
Para introduzirmos os conceitos, neste curso, assumiremos que para amostras com
mais de 30 elementos a aproximacao ¸~ por uma uma distribuição Normal ja´ pode ser
´
considerada muito boa. Na pratica, ´
isto precisa ser checado antes de qualquer analise
apresentada.

Exemplo: Queremos investigar a duracao ¸~ de vida de um novo tipo de lampada,


^ pois
acreditamos que ela tenha uma duracao¸~ maior do que as fabricadas atualmente. Cem
^
lampadas ~ deixadas acesas ate´ queimarem. A duracao
do novo tipo sao ¸~ em horas de cada
^
lampada e´ registrada.
¸~ tenha media
Supor que a populacao ^
´  = 82 e variancia  = 144.
´ de tamanho n = 64 e´ selecionada, qual e´ a probabilidade
i) Se uma amostra aleatoria
´ amostral estar entre 80.8 e 83.2?
da media
_
ii) Com n = 100, calcular P{80.8  X  83.2}.

_
Sol: i) Com  = 82 e _ = 144 _e como n = 64 e´ grande, o TLC estabelece que X a~
N(,  ). Portanto, Z = X  = X1.5
82 a ´
~ N(0, 1). Dai,
n

_ _
P{80.8  X  83.2}  P 80.81.5 82  X  82
1.5  83.2  82
1.5   P{-0.8  Z  0.8} 
 0.7881  0.2119  0.5762

 12
ii) Com n = 100, temos n = 100 = 1.2. Portanto

_ _
P{80.8  X  83.2} = P 80.81.2 82  X  82
1.2  83.2  82
1.2  = P{-1  Z  1
= 0.8413 -0.1587 = 06826. 

NOTAS 1) Incidentalmente, no exemplo anterior, o modelo geralmente adotado e´ o


´ o conhecimento do problema fisico
exponencial, i.e, ´ ¸~ do modelo
sugere a adocao
exponencial para a duracao¸~ das lampadas.
^ ~ soubéssemos a distribuicao
Se nao ¸~ da media
´
amostral para um modelo exponencial utilizaríamos o TLC, por se tratar de uma amostra
grande.
2) Observem que, nos exemplos, consideramos sempre uma populacao ¸~ com media
´ e
^
variancia conhecidas, cujo interesse e´ obter a probabilidade da media
´ estar dentro de um
´
intervalo fixado. Isto na pratica ´
nem sempre e´ possivel, pois desconhecemos tais valores. O
que faremos e,´ com base nos resultados apresentados, obter intervalos que contenham estes
^
parametros, ´ resultante da amostra.
para uma probabilidade fixada e media

13
1.5.2 Variância Amostral

Teorema: Suponhamos que (X , . . . , Xn ) constitua uma amostra casual simples de uma
¸~ Normal com media
populacao ^
´  e variancia  .
Seja
n _
 (Xi  X)
S = i=1
n1
^
a Variancia ~
Amostral. Entao:
i) E(S ) =  ;
_
~ v.a's. independentes;
ii) X e S sao
(n  1).S
´
iii) a estatistica  ¸~ Qui-Quadrado com n  1 graus de
tem uma distribuicao
liberdade.

prova: i) Escrevamos:
n _ n _ n _ _
(Xi  X) =  (Xi   +   X) =  (Xi  ) + 2.(  X)(Xi  ) + (  X) =
i=1 i=1 i=1

n _ n _
 (Xi  ) + 2.(  X).(Xi  ) + n.(  X) =
i=1 i=1
n _ _ n _
= (Xi  )  2.n.(  X) + n.(  X) = (Xi  )  n.(X  ) .
i=1 i=1
n _
 (Xi  X)

Portanto, E(S ) = E i=1
n1 =
1
n  1 .n.

 n. n  = 

´
NOTA: Se tivessemos ^
dividido por n em vez de faze-lo por (n  1) ao definir S , a
~ ´
propriedade acima nao seria valida.

ii) Prova Omitida.


  
iii) Vemos inicialmente que a soma  X    +  X    + . . . +  Xn   

Xi  
¸~  (n) , pois cada
tem distribuicao  ¸~ N(0 , 1). Agora,
tem distribuicao

n n _ _ n _ _ _ _
(Xi  ) = (Xi  X + X  ) =  (Xi  X) + 2(Xi  X)(X  ) + (X  )  =
i=1 i=1 i=1

n _ _ n _ _
=  (Xi  X) + 2.(X  ). (Xi  X) + n.(X  ) ,
i=1 i=1

n _ n _ n n _ _
e do fato de  (Xi  X) =  Xi  n.X = 0 , vem  (Xi  ) =  (Xi  X) + n.(X 
i=1 i=1 i=1 i=1
) .

14
Dividindo ambos os membros por  , e reescrevendo convenientemente, teremos:
n  n _  _ 
  Xi    =   Xi  X  +  X 

 . (*)
  / n
i=1 i=1

~ (*) tem distribuicao


O primeiro membro da expressao ¸~  (n) e a última expressao
~ do
¸~  (1), pois
segundo membro tem distribuicao
_
X
/n
n _ 
¸~ N(0 , 1). Do ´item ii) deste teorema pode-se provar que   i  
X X
tem distribuicao e
i=1
_ 
 ~ v.a. independentes. Pelo Teorema 3 da Distribuicao
 X/ n
 sao ¸~  , podemos concluir
que
n _ 
  Xi  X 

i=1
¸~  (n - 1). Com isso, observamos imediatamente que a v.a.
tem distribuicao

(n  1).S (n  1)
n _ n _ 
1    Xi  X
 =  . n1 . (Xi  X) =   
i=1 i=1
¸~  (n - 1).
tem distribuicao 

NOTA: Muito embora S seja definida como a soma de quadrado de n variaveis,


´ estas n
´
variaveis ~ ~  ´ somente n  1 variaveis
nao sao independentes. S contem ´ independentes por
´
ser a soma das variaveis nula.
n _
 (Xi  X) = 0
i=1

¸~ linear entre estas n variaveis,


Por isso, existe uma relacao ´ ~
o que significa que tao
logo quaisquer n  1 delas sejam conhecidas a n-a ficara´ determinada.

2
Corolário: var(S ) = n-1 .

~ var(X) = 2..
prova: Vimos que se X ~  () entao

Do ´item iii) do Teorema acima, tem-se (n 1).S


~  (n - 1)
´
Dai,

var (n 1).S
  = 2.(n  1)


 n  1  .var(S ) = 2.(n  1)

2
Logo, var(S ) = n-1 . 

15
_
^
A inferencia ´ amostral X vista anteriormente dependeu inteiramente do
sobre a media
^
fato de que a variancia populacional  era conhecida.
Quando nao ~ se conhecer  , uma situacao¸~_ muito comum na pratica,
´ ~ sera´
nao

´ calcular a variancia
possivel ^ ´ amostral, var(X) = n .
da media
~ necessario
Sera´ entao ¸~ exata da media,
´ obter uma distribuicao ´ ~ envolve o
a qual nao
^
parametro  .

Teorema: Se       é uma a.a. de uma distribuição     , com media


´  e
^
variancia  ~ ´
 desconhecidas. Entao, a estatistica
_

    


~  da
prova: Inicialmente dividamos numerador e denominador pelo desvio-padrao
¸~ e teremos
populacao, _
 X/n / S .

_
X
O numerador Z =  ¸~ N(0 , 1), como ja´ foi visto.
.n tem distribuicao
O quadrado do denominador pode ser escrito como

(n  1).S Y
 /(n  1) = n1 ,


onde Y = (n 1).S

´
. Mas como foi visto, se os Xi forem normalmente distribuidos, Y tem
~ 
¸  (n - 1).
distribuicao
_
~ independentes, pois X e S sao
Observe que Z e Y sao ~ independentes.
_
X
Logo, por teorema T= S  t(n - 1). 
n

Observaça~o: O teorema vale mesmo no caso de amostras extraidas de populacoes


¸~ nao
~
¸~ em forma de sino, como a distribuicao
Normais, mas que tenham distribuicoes ¸~ Normal.

TEOREMA: Sejam X , X , . . ., XN uma populacao ¸~ qualquer com media


´ . Suponhamos
¸~ Entao,
que uma a.a. (X , . . . , Xn ) seja selecionada dessa populacao. ~

_
X-
Z= S ~ N(0, 1) quando n e´ grande
n

16
Teorema: Se       e       são amostras aleatórias independentes obtidas das

distribuições      e      , respectivamente, então:
_ _
Y   
     
 

~     
        
 


Em particular, se    , então
_ _
Y  
 
 
 ~     


Teorema: Seja 1 , . . .,  uma a.a. de tamanho  de uma distribuição     .

Seja        uma a.a. de tamanho  de uma distribuição      .
Se as duas amostras são independentes, então:





  

   


 _  _
      

onde   
 e   
 

 
Se, em particular,    então  ~       .

Todos os resultados desta seção só se aplicam a populações normais. De fato, pode


ser demonstrado que para nenhuma outra distribuição:
(i) a média amostral e a variância amostral são independentementes distribuídas ou
(ii) a média amostral tem uma distribuição normal exata.

1.5.3 Estatísticas de Ordem

As variáveis aleatórias  ,   1,     são denominadas Estatísticas de Ordem


associadas com a amostra aleatória  , . . .,  . Neste caso,

1  2  . . .   .


Os valores extremos de amostra ( e  ) são freqüentemente de considerável
interesse. Por exemplo, na construção de diques para controle de enchentes, a maior altura
da água que um rio particular tenha atingido nos últimos 50 anos pode ser muito
importante.

17
Teorema: Seja  uma variável aleatória continua com fdp  e fd  . Seja 1 , . . .,  uma
amostra aleatória de  e sejam  e  o mínimo e o máximo da amostra, respectivamente.
Então,
(a) A fdp de  será dada por ()  [ ()]  ().
(b) A fdp de  será dada por  ( )  [1   ( )]  ( ).

prova: Seja ()      a fd de  .


Ora,    é equivalente ao evento   , para todo . Logo, visto que os
 são independentes, encontramos

()                [ ()] .


Por isso,
()   ()  [ ()]  ().

A dedução da fdp de  será deixada como exercício.

Exemplo: Um dispositivo eletrônico tem uma duração de vida  , a qual é


exponencialmente distribuída, com parâmetro   0,001; quer dizer, sua fdp é
 ()  0,0010,001 . Suponha-se que 100 desses dispositivos sejam ensaiados, fornecendo
os valores observados 1 , . . .,  .
(a) Qual é a probabilidade de que o maior valor observado ultrapasse 7.200 horas?

Sol: Pede-se que    7.200  1     7.200.


Ora, o valor máximo será menor que 7.200 se, e somente se, todo valor amostral for
menor que 7.200. Daí,
   7.200  1  [ (7.200)]100 .

Para calcular  (7.200), recordemos que para a variável aleatória exponencialmente


distribuída com parâmetro 0,001,  ()  1  0,001  Portanto,

 (7.200)  1  0,0017200)  0,99925.

Por conseguinte, a probabilidade pedida é 1  (0,99925)100  0,071.

(b) Qual é a probabilidade de que a menor duração até falhar seja menor do que 10
horas? Exigiremos que    10       10.

18
Ora, o mínimo da amostra será maior do ou igual que 10, se, e somente se, todo
valor amostral for maior do ou igual que 10. Portanto,

   0  1  [   (0)]100 .

Empregando a expressão de  dada em (a), acima, teremos


0,0010) 0,01
1   (10)  1     0,99005.
Daí,
   0  1  [0,99005]100  0,63. 

1.5.4 Correlação Amostral

Quando temos duas variáveis aleatórias bidimensionais ( ,  ) que dão origern a


uma amostra aleatória ( ,  ), . . ., ( , Y ), um dos parâmetros importantes, associado a
uma variável alestória bidimensional é o coeficiente de correlação  .
A estimativa geralmente empregada para  é o coeficiente de correlação amostral,
assim definido:
n _ _
(i )(i )
i=1
r n _ n _
(i ) (i )

i=1 i=1

Exemplo: Os dados reunidos na Tabela abaixo representarn a velocidade (km/seg) e a


altitude (km) do meteoro N." 1.242, como relatado em "Smithsonian Contributions to
Astrophysics", dos Proceedings of the Symposium on Astronomy and Physics of Meteors,
Cambridge, Mass., ago. 28-set., 1, 1961.

Tabela:
---------------------------------------------------------------------------------
X(velocidade, km/seg) 11,93 11,81 11,48 10,49 10,13 8,87
---------------------------------------------------------------------------------
Y(alt.itude, km) 62,56 57,78 53,10 48,61 44,38 40,57
---------------------------------------------------------------------------------

Um cálculo direto fornece r = 0,94. 

19
^
1.5.5 Inferencia ¸~ amostral p^
sobre a proporcao

¸~ de unidades que possuem uma dada caracteristica


Seja p a proporcao ´ numa
¸~
populacao.
¸~ pode ser considerada como a variavel
Assim, a populacao ´ X tal que

´
1 se o individuo ´
tem a dada caracteristica
X=
´
0 se o individuo ~ tem a dada caracteristica
nao ´

Logo,  = E(X) = p e  = var(X) = p.(1  p)

¸~ dessa
Retirada uma amostra casual simples (X , . . . , Xn ), com reposicao,
¸~ e se indicarmos por Sn o total de unidades que possuem a dada caracteristica
populacao, ´ na
amostra, ou seja
n
Sn =  Xi
i=1

onde Xi = 1 se a i-a unidade na amostra tem a dada caracteristica


´
0 se a i-a unidade na amostra tem a dada caracteristica
´

~
entao Sn ~ b(n , p)

¸~ de unidades que possuem a dada caracteristica


Definindo como ^p a proporcao ´ na
´
amostra, i.e.,
p^ = Sn n

temos que P{Sn = k} = P Snn = k


n  = P^p = k
n 

¸~ amostral de ^p e´ obtida da distribuicao


ou seja, a distribuicao ¸~ de Sn .

Propriedades de p^:

^ =p ^ = p.(1  p)
i) E(p) e var(p) n

¸~ de probabilidade para ^p pode ser escrita explicitamente por:


ii) a funcao

20
^ = n^ .pn.p^ .(1  p)n.(1-p)
f(p) ^
, ^p = 0 , 1
, 2
, . . . .1
 np  n n

¸~ Amostral de Sn e ^p para n = 3 e p = 1
Figura: Distribuicao 2

_
¸~ amostral ^p e´ um caso especial da media
iii) A proporcao ´ amostral X.

^ = E Sn  = E(Sn ) n.p
prova: i) E(p) n n = n = p

^ = var(Sn ) n.p.(1  p) p.(1  p)


var(p) n = n = n

_
Sn X + X + . . . + Xn
iii) ^p = n = n =X

¸~ amostral de
TEOREMA: Para n suficientemente grande, podemos considerar a distribuicao
^p do seguinte modo:
^p ~ N p , p.(1 - p)  , quando n  +
n

^p - p
´
i.e, a~ N(0, 1)
p(1-p)
 n

prova: Vimos que Sn ~ b(n , p)

_
Podemos escrever Sn = n.X ,

_
¸~ aproximadamente normal, com
mas pelo Teorema do Limite Central, X tera´ distribuicao
^ p.(1  p)
´ p e variancia
media n ,
_
X ~ Np , p.(1n p) 

21
¸~ aproximada
Logo, a transformada Sn tera´ a distribuicao

Sn ~ Nn.p , n.p.(1  p).

_
Observe que X, na propriedade (iii), e´ a propria ´ ´
variavel ^p; assim, para n
¸~ amostral de ^p do seguinte modo:
suficientemente grande, podemos considerar a distribuicao
p^ ~ Np , p.(1  p) . n

NOTA 1) Esta aproximacao ¸~ e´ bastante satisfatoria ¸~ p nao


´ quando a proporcao ~ esta´ proxima
´
de 0 ou de 1, e n e´ suficientemente grande; em geral quando n.p  5 e n.(1 - p)  5.

#
2) Para uma boa aproximacao ¸~ a normalidade usar uma correcao¸~ de continuidade
¸~ binomial.
(somar e subtrair 21 para cada valor de uma v.a. p com distribuicao

Exemplo: Constata-se que 2% das pecas ´


¸ fabricadas por determinada maquina ~
sao
defeituosas. Qual a probabilidade de, em um lote de 400 de tais pecas,
¸ 3% ou mais serem
defeituosas?

Sol: De acordo com as propriedades anteriores, tem-se:

^ = p = 0.02 ^ = p.(1 - p) 0.02x0.98 0.0196


E(p) e var (p) n = 400 = 400 = 0.000049

^
^  0.03} = P p - 0.02  0.03 - 0.02
Portanto, P{3% ou mais} = P{p 0.007 0.007 .

¸~ pela Normal, i.e,


Como n = 400 e´ um valor grande, utilizamos a aproximacao ´

^
P p0.007
- 0.02
 0.03 - 0.02
0.007  = P{Z  1.428} = 0.5 - 0.4236 = 0.0764.

1.6 Normalidade dos dados

Observaremos que a distribuição normal representa um papel muito importante na


Estatística. De fato, o Teorema do Limite Central por si só assegura isto, mas há outras
razões igualmente importantes.
Em primeiro lugar, muitas populações encontradas na prática nas diversas áreas do
conhecimento parecem ter uma distribuição aproximadamente normal.

22
Outra consideração em favor da distribuição normal é o fato que distribuições
amostrais baseadas numa distribuição aparentemente normal são facilmente manipuladas
analiticamente.
Assim, o problema matemático de obter distribuições para as várias funções da
amostra é freqüentemente mais fácil para amostras de uma população normal que de
qualquer outra, e esta seção será dedicada ao problema de se obter as distribuições de
várias funções diferentes de uma amostra aleatória de uma população normalmente
distribuída. Para aplicar os métodos estatísticos baseados na distribuição normal, o
pesquisador tem que saber, pelo menos aproximadamente, a forma geral da função de
distribuição que os seus dados seguem. Se for normal, pode usar os métodos diretamente;
se não for, pode, às vezes, transformar os dados de modo que as observações transformadas
sigam uma distribuição normal. Quando o pesquisador não sabe a forma da distribuição de
sua população, então ele pode usar outros métodos mais gerais mas normalmente menos
poderosos de análise chamados métodos de não-paramétricos.

^
1.7 Inferencia ´
Estatistica
´
Na disciplina Estatistica Descritiva, vimos como resumir descritivamente um conjunto
o
de dados e no 1- semestre de Probabilidade e Estatística vê-se como construir modelos
´
probabilisticos ^
para descrever alguns fenomenos.
^
O estudo da Inferencia ´
Estatistica ´
tem como objetivo estudar os metodos que permitam
~ ^
tirar conclusoes sobre os parametros ~
desconhecidos da populacao ´
¸ a partir da analise dos dados
amostrais.
^
As inferencias ~ baseadas em informacoes
de interesse sao ¸~ ou quantidades obtidas de uma
¸~
amostra selecionada da populacao.
^
Tais inferencias podem ser de dois tipos:

~ ^
I) ESTIMACAO¸ : quando usamos os dados amostrais para produzir estimativas do parametro
populacional.

¸~ dos parametros
A estimacao ^ pode ser feita de duas maneiras:
~
a) ESTIMACAO¸ PONTUAL

- quando a partir da amostra procuramos obter um único valor para representar o


^
parametro populacional.

_
^
Exemplo: X e´ um estimador pontual do parametro populacional .

23
~
b) ESTIMACAO
¸ POR INTERVALO

- quando a partir da amostra procuramos construir um intervalo ^    ^ para


um certo coeficiente de confianca¸ 1  , fixado a priori. Em 100.(1  )% das vezes que o
^
experimento for realizado, este intervalo contera´ o verdadeiro parametro populacional  .

¸~ Normal, i.e,
Exemplo: Se  tem uma distribuicao ´

f( ; , ) = 1
2 exp  12     ,
^
onde o parametro  = ( ,  ) e´ desconhecido.

i) se e´ desejavel
´ estimar a media ~
´  = , entao

n
_ Xi
´
a estatistica ( ) = X = i=1 ´ estimador de  .
e´ um possivel
~ n

_ _
ii) e (X  1.96S /n ; X  1.96S /n ) e´ um possivel
´ estimador intervalar de  .

II) TESTES DE HIPOTESES´ ´


: quando usamos os dados amostrais para testarmos possiveis
^
valores de certos parametros ¸~ ou mesmo tratarmos da natureza da populacao.
da populacao, ¸~

´
Quanto aos testes de hipoteses eles podem ser de dois tipos:

´
a) PARAMETRICOS ´
: quando formulamos hipoteses com respeito ao valor de um
^
parametro populacional.

´ o    1,65.
´ populacional da altura dos brasileiros e´ 1,65 m, i.e.,
Exemplo: 1) a media

¸~ de brasileiros com a doenca


2) a proporcao ¸ X e´ 40%, ou seja, o    0,40.

~ ´ #
b) NAO-PARAMETRICOS ´
: quando formulamos hipoteses com respeito a natureza
¸~ da populacao,
da distribuicao ¸~ independencia
^ ´
de amostras, variaveis qualitativas.

¸~ da populacao
Exemplo:  o : A distribuicao ¸~ e´ N 1 , 0.2 .

2) Deseja-se verificar se existe dependência entre a renda (variável A) e o número de


filhos em famílias (variável B) de uma cidade, i.é, o : A e B são variáveis independentes

3)  :         o modelo é linear

24
Capítulo 2
Estimação Pontual

21 Introdução

Vamos assumir que a distribuição da variável aleatória  pertence a certa família de


distribuições em que um particular elemento é especificado, quando o valor do parâmetro 
é especificado.
No caso de um problema de estimação, o objetivo é procurar, segundo algum
critério especificado, valores que representem adequadamente os parâmetros
desconhecidos.
Neste capítulo o conceito de estimador são introduzidos. Critérios para a
comparação de estimadores são também considerados.

Definição: Qualquer estatística   ( , . . .,   que assuma valores em  é um


estimador para .

O estimadador da´ ideia ´ valor do parametro.


´ de um possivel ^

Exemplo: 1) Seja  , . . .,  uma a.a. de   onde  não é conhecido.


_  
 2 
Então (~ )      é um estimador de , e também (
~) (n+1)  
 
Na verdade, qualquer (
~ )   é um estimador de .

Exemplo: 2) Seja  , . . .,  uma a.a. de   onde  é desconhecido.


_ 
Então      é um estimador de 

  
Alguns outros estimadores são (
~ )   , (
~ )   e (
~)   

Nosso interesse é conhecer aproximadamente  com base na amostra  , . . ., 


¸~ (X)
disponível, i.é, determinar uma funcao ¸~ que represente o verdadeiro
~ dessas observacoes
^
valor do parametro .

Em muitas situações, o interesse é estimar uma função  ( ).

^
Exemplo: 3) Seja    onde o parametro  e´ desconhecido Se e´ desejavel
´ estimar
 
´
a media, ´    , então ()     
i.e,

25
Exemplo: 4)   Weibull,   e função de confiabilidade    ()       ,
para  fixo, então (~)           .

^
NOTAÇÃO: O estimador (
~ ) de  é usualmente denotado por 

Um dos grandes problemas da Estatística é o de encontrar um estimador razoável


para o parâmetro desconhecido  ou para uma função  ().

2.2 Propriedades de Estimadores


~o: Diz-se que o estimador ^ e´ um Estimador Nao-Viciado
Definiça ~ ^
do parametro  se:

E(^) =  , para todo 

Exemplo: Sejam  , . . . ,  uma amostra aleatória da v.a.  com  [ ]   e


[ ]   . Temos, então, que

_ E(X ) + E(X ) + . . . + E(Xn ) ++...+ n.


i) E(X) = n = n = n = ,
´
e pelo fato das variaveis serem independentes, vem

_ var(X ) + var(X ) + . . . + var(Xn )  +  + . . . +  n. 


var(X) = n = n = n = n

_
Portanto X é um estimador não-viciado para .

Exemplo: Suponha-se que desejemos um estimador não-viciado da variância  de uma


variável aleatória, baseada em uma amostra  , . . . ,  .
Muito embora intuitivamente pudéssemos considerar o estimador

n _
^ 
 1  (Xi  X) ,
n
i=1
 (n1) 
^ )
verifica-se que este estimador tem um valor esperado E( n  . De fato,

n _ n _ _
^  ) = E 1  (Xi  X)   1 E (Xi  X)  n(X  )  =
E( n n
i=1 i=1
n _ _
1
 n E(Xi  X)  E(X  ) .
i=1

_ _
Lembrando que  = E(Xi  ) e var(X) = E(X  ) , temos

26
_
^  ) = 1 n  var(X) =  
E(  (n1) 
n n = n  .


^ é viciado para  , mas é assintóticamente não viciado, ou seja, à
Portanto 
medida que o tamanho da amostra aumenta, o vício diminui.

Por isso, um estimador não-viciado de  é dado pela variância amostral


n _
1 
    (Xi  X) . 
i=1

Interpretação: "Não-viciado" significa, essencialmente, que o valor médio do estimador


será próximo do verdadeiro valor do parâmetro. Por exemplo, se o mesmo estimador for
empregado repetidamente e fizermos a média desses valores, esperaríamos que essa média
fosse próxima do verdadeiro valor do parâmetro (Veja exemplo no cap 1). Muito embora
seja desejável que um estimador seja não-viciado, haverá ocasiões em que poderemos
preferir estimador viciado (veja abaixo). É possível (e na verdade muito facilmente feito)
encontrar mais de um estimador não-viciado para um parâmetro desconhecido. A fim de
realizar uma escolha plausível em tais situações, introduziremos o seguinte conceito.

~o: O Erro Quadrático Médio (EQM) de um estimador ^ do parâmetro  é dado por


Definiça

 (^)  ^   .


Pode-se mostrar que
 (^)  ^   ício(^).

onde  ício(^)=[ (^)   é o vicío do estimador ^.

No caso em que ^ é um estimador não viciado para  , temos que

 (^)  ^ ,

ou seja, o erro quadrático médio de ^ se reduz à sua variância.

Exemplo: Sejam  , . . . ,  uma amostra aleatória da variável aleatória    (  .


n _
Conforme visto no anterior  ^   1  (Xi  X) é um estimador viciado para  .
n
i=1
n _
Também vimos que    1  (Xi  X) é um estimador não viciado para  .

i=1
Por outro lado, temos que
2
 [  ]  [  ]  

27
e que
^] 
 [  2 
    .

^  , apesar de viciado, apresenta um  menor que o  do


Notemos que 
estimador   . 

~o: Seja ^ um estimador não-viciado de .


Definiça
Diremos que ^ é um estimatidor não-viciado, de variância mínima de  , se para
todas os estimadores ^* tais que  (^*)  , tivermos

(^)  (^*) para todo .

Isto é, dentre todas os estimadores não-viciados de  , ^ tem a menor variância de


todos.

~o: Sejam ^ e ^  dois estimadores nao-viciados


Definiça ~ ^
de um mesmo parametro  . Diz-se
^ ^
que  e´ Mais Eficiente do que   se:

(^)  (^  )

NOTA: A variância de uma variável aleatória mede a variabilidade da variável aleatória em


torno de seu valor esperado. Por isso, exigir que um estimador não-viciado tenha variância
pequena é intuitivamente com preensível, pois se a variância for pequena, então o valor da
variável aleatória tende a ser próximo de sua média, o que no caso de um estimador não-
viciado significa próximo do verdadeiro valor do parâmetro.

Exemplo: Sejam ^ , ^ , ^ e ^ estimadores de , cuja f.d.p. esta´ esbocada
¸ na figura
abaixo.

´
Presumivelmente prefeririamos ^ a ^ . Ambos estimadores sao
~ nao
~ viciados e
 
var(^ )  var(^ ).

28
No caso dos estimadores ^ e ^ , a decisão não é tão evidente (Fig. 14.2), porque ^3
é não-viciado, enquanto ^4 não o é. Todavia, (^ )  (^ ). Isso significa que,
enquanto em média ^ será próximo de , sua grande variância revela que desvios

consideráveis em relação a  não serão de surpreender. ^ por sua vez, tende a ser um tanto
maior do que , em média, e no entanto, poderá ser mais próximo de  do que ^ (veja a 
Figura acima).

Exemplo: Sejam  ,  ,  uma amostra aleatória da variável aleatória  com  [ ]  


e [ ]  1. Consideremos os estimadores

_
^    X X X
e ^   X  4 X2  4 X3 .
 

Então,  [^ ]     e [^ ]  


n  
3

Temos também que


Então,  [^ ]    
2 e [^2 ]   14  1
6  1
6 

 6
16

Como ^ e ^2 são ambos não viciados, segue que ^ é melhor que ^2 , pois
[^ ]  [ ^ ], para todo .

Exemplo: Outro interessante exemplo é dado no livro do Meyer (Exemplo 14.2 pg 336).

NOTA: Existem algumas técnicas gerais para encontrar estimadores não-viciados de


variância mínima. Contudo, não estamos capacitados a explicar isso aqui. Faremos uso
deste conceito principalmente com a finalidade de escolher entre dois ou mais estimadores
não-viciados disponíveis. Quer dizer, se ^ e ^ forem ambos estimadores não-viciados de
 
, e se (^ )  (^ ), preferiremos ^ .

29
1-a Lista de Exercicios
´ ´
de Probabilidade e Estatistica

1) Em uma populacao ¸~ em que N = 6, tal que X = {1, 3, 4, 7, 8, 11}, calcular a media´


´
amostral para todas as possiveis amostras de tamanho 2.
_
^
´ amostral X e da variancia
a) Verificar as propriedades da media amostral S . Use o
¸~
processo com e sem reposicao.
¸~ amostral destas duas estatisticas.
b) Determinar a distribuicao ´

2) Sabe-se que 20% das pecas ¸ de um lote sao ~ defeituosas. Sorteiam-se 8 pecas,¸ com
¸~ e calcula-se a proporcao
reposicao, ¸~ ^p de pecas
¸ defeituosas na amostra.
~
¸ exata de ^p (use a tabua
a) Construa a distribuicao ´ ¸~ binomial)
da distribuicao
#
b) Construa a aproximacao¸~ normal a binomial
¸~ e´ uma boa aproximacao
c) Voce^ acha que a segunda distribuicao ¸~ da primeira?
#
d) Ja´ sabemos que, para dado p fixo, a aproximacao ¸~ melhora a medida que n
¸~ e´ melhor?
aumenta. Agora, se n e´ fixo, para qual valor de p a aproximacao

´
3) Uma amostra simples ao acaso de 30 domicilios foi selecionada em uma zona urbana que
contem ´
´ 15000 domicilios. ´
O número de pessoas de cada um dos domicilios que integram a
amostra e´ o seguinte:
5 6 3 3 2 3 3 3 4 4 3 2 7 4 3
5 4 4 3 3 4 3 3 1 2 4 3 4 2 4
Estimar o número total de pessoas que vivem nesta zona.

_
´ e = X   como sendo o erro amostral da media.
4) Definimos a variavel ´ Suponha que a
^
variancia ´
dos salarios ~
de uma certa regiao seja 400 unidades ao quadrado.
a) Determine E(e) e var(e)
¸~ das amostras de tamanho 25 terao
b) Que proporcao ~ erro amostral absoluto maior
do que 2 unidades?
¸~ das amostras de tamanho 100?
c) E que proporcao
d) Neste último caso, qual o valor de d, tal que Pe  d = 1%?
e) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos
sejam inferiores a uma unidade?

~ de 60 horas.
´ de determinado ser vivo e´ de 2000 horas, com desvio-padrao
5) A vida media
´ de 10 desses seres vivos, determine a probabilidade de o
Escolhida uma amostra aleatoria
~ amostral nao
desvio-padrao ~ exceder 50 horas.

30
¸~ Normal, com media
6) Uma v.a. X tem distribuicao ~ 10.
´ 100 e desvio-padrao
a) Qual a P{90  X  110} ?
_
b) se X e´ a media
_
´ ¸~
de uma amostra de 16 elementos retirados dessa populacao,
calcule P{90  X  110}.
_
´
c) Desenhe, num grafico, ¸~ de X e X.
as distribuicoes
_
d) Que tamanho deveria ter a amostra para que P{90  X  110} = 95% ?

´
7) A maquina de empacotar um determinado produto o faz segundo uma distribuicao ¸~
´  e desvio-padrao
normal, com media ~ 10g.
a) Em quanto deve ser regulado o peso medio´  para que apenas 10% dos pacotes
tenham menos do que 500g?
´
b) Com a maquina assim regulada, qual a probabilidade de que o peso total de 4
pacotes escolhidos ao acaso seja inferior a 2 kg?

8) Um procedimento de controle de qualidade foi planejado para garantir um maximo ´ de


¸~ Supondo que a producao
10% de ´itens defeituosos na producao. ¸~ esteja sob controle e que
os ´itens sejam vendidos em caixas com 100, qual a probabilidade de que uma caixa :
a) tenha mais do que 10% de defeituosos?
b) Tenha nenhum defeituoso?
´
c) Se um cliente encontrar mais do que 18 defeituosos ele recebe uma caixa gratis.
Qual a proporcao ~
¸ esperada de clientes bonificados?

¸~ dos comprimentos dos elos de corrente de bicicleta e´ normal, com media


9) A distribuicao ´ 2
^ #
cm e variancia igual a 0,01 cm . Para que uma corrente se ajuste a bicicleta, deve ter
comprimento total entre 58 e 61 cm. Qual a probabilidade de uma corrente com 30 elos nao~
#
se ajustar a bicicleta?

¸~ um psicologista avaliou que seu desvio-padrao


10) Ao medir o tempo de reacao, ~ era de
#
¸~ para
0.05 segundos. De que tamanho deve ser tomada uma amostra destinada as medicoes,
´
que se possa estar 99% confiante de que o erro da estimativa do tempo medio ¸~
de reacao
~ exceda a 0.01 segundos?
nao

11) Em um parque existe uma populacao ¸~ muito grande de esquilos. Em uma amostra
´
aleatoria, ~ infetados com o bacilo da peste. De que
40 destes esquilos achou-se que estao
¸~ com um erro nao
tamanho deveria ser tomada a amostra para estimar a dita proporcao ~
maior de 5%, com uma probabilidade de acerto de 99%?

31
Capítulo 3
Intervalos de Confiança

¸~
3.1 Introducao

Suponhamos que o modelo de probabilidade f(x , ) para um experimento envolve


^
um parametro desconhecido .
´ de uma amostra aleatoria
Atraves ´ (X , . . . , Xn ) , desejamos obter alguma
¸~
informacao sobre o verdadeiro valor 0 do ^
parametro ¸~ .
 da populacao
Uma maneira de se ter uma ideia ´ do verdadeiro valor 0 de  e´ atraves ´ dos
estimadores pontuais; estes especificam um único valor para o estimador.
_
´
Por exemplo, a media X obtida da amostra e´ uma estimativa da media ´ real  da
~
populacao.
¸ ~ ´
Este procedimento nao permite julgar qual a possivel magnitude do erro que
estamos cometendo.
´ surge a ideia
Dai, ´ de construir Intervalos de Confianca ¸ que, nos casos estudados
~ baseados na distribuicao
neste curso, sao ¸~ amostral do estimador pontual.

Desse modo, se ^ e´ um estimador de , e conhecida a distribuicao ^


¸~ amostral de  ,
geralmente podemos obter dois valores A0 e B0 , tais que
P{A0    B0 } = 

onde  e´ denominado Coeficiente de Confianca.


¸
¸ e´ dado por dois limites numericos
Portanto, o intervalo de confianca ´ A0 e B0 entre
^
os quais supomos estar o verdadeiro parametro, com um coeficiente de confianca ¸ 
especificado.
~ valores dentro do intervalo (A0 , B0 ) seriam melhores estimadores de  do
Entao,
que valores fora do intervalo.
Agora, se (A0 , B0 ) e´ um intervalo de confianca ¸ para  com um coeficiente de
¸  podemos esperar encontrar, ou estar confiantes em encontrar  no intervalo (A0
confianca
, B0 ) em cerca de  das vezes que o experimento for realizado.
Ou seja,  sera´ a probabilidade de obter um intervalo que inclua o valor exato, e
^
desconhecido, do parametro.
Por exemplo, se escolhermos  = 95%, podemos esperar que cerca de 95% das
amostras que podemos obter fornecerao ~ intervalos que incluem o valor de  , enquanto os
~
restantes 5% nao incluem. Dessa maneira a afirmacao¸~ "o intervalo inclui" sera´ correta em
cerca de 475 casos dentre 500 casos, enquanto que nos restantes sera´ falsa.
~
¸ e´ escolhido a priori, e dependera´ do grau de precisao
O coeficiente de confianca
com que desejamos obter a estimativa, sendo os coeficiente de confianca
¸ mais comuns os
#
que correspondem as probabilidades 95% e 90%.
¸ exigido para o intervalo, maior sera´ a
Quanto maior o coeficiente de confianca
amplitude deste.

32
¸~ do IC
3.2 Interpretacao
¸~ do experimento com  fixado, por exemplo,  =
´ de repeticoes
Imaginemos uma serie
0 . Alem
´ disso, imaginemos que um intervalo de confianca ¸ (A , B) com coeficiente de
¸  seja calculado atraves
confianca ´ dos dados do mesmo modo para cada repeticao.¸~
¸~ do
Devido à variabilidade dos dados, o intervalo (A , B) variaria em cada repeticao
experimento.
¸~ do que seja um intervalo de confianca
A interpretacao ¸ para  com coeficiente de
¸  e a seguinte:
confianca ´
- construindo 100 intervalos, correspondentes a 100 amostras de tamanho n,  deles
~ o valor 0 .
conterao
´
Graficamente, teriamos ¸~ da figura a seguir.
a situacao

´
Um IC 95% incluiria o verdadeiro valor parametrico ¸~ do
0 em 95% das repeticoes
experimento com  fixado.

33
NOTA: 1) Exceto em casos especiais, nao ~ e´ correto concluir que um particular intervalo de
confianca¸ 95% (A0 , B0 ) tenha uma probabilidade de 95% de conter o verdadeiro valor 0
^
do parametro. Pode acontecer que (A0 , B0 ) contenha todos os possiveis ´ valores de  com
~
probabilidade 100% ou nao contenha nenhum. O coeficiente de confianca ¸ 95% e´ uma media
´
´
teorica ^
figurada que refere-se a uma sequencia imaginaria ¸~
´ de repeticoes do experimento.
Logo, poderemos dizer que em 95% das vezes, o intervalo contem ´ o verdadeiro
~
valor de . Isto nao e´ o mesmo que afirmar que 95% e´ a probabilidade do parametro ^  cair
^
dentro do intervalo, o que constituira´ um erro, pois  e´ um parametro ~
( nao e´ uma variavel
´
´
aleatoria) ~
e ele esta´ ou nao no intervalo.

´
2) Na pratica, tem-se um particular conjunto de dados observados e desejamos obter
¸~
informacao sobre o valor de . Se os intervalos de confianca ~ suficientes numa pesquisa,
¸ sao
´
eles devem ser construidos de modo que um único intervalo observado (A0 , B0 )
¸~
proporcione informacoes. Valores dentro do intervalo seriam de algum modo melhores
estimadores de  do que valores fora do intervalo.

Comumente os intervalos de confianca¸ que mais nos interessam relacionam-se ou


^ ^
´ populacional  ou com o parametro p (probabilidade de ocorrencia
com a media do evento)
¸~
na Distribuicao Binomial ou ^
variancia populacional  
.

3.3 Intervalo de Confianca ´ 


¸ para a media
No caso da estimativa de , atraves
´ do intervalo de confianca,
¸ temos dois casos a
considerar que dependem do tamanho da amostra, amostra pequena ou grande, ou do fato
~ conhecimento do valor da variancia
de termos ou nao ^ ¸~
 da populacao.

¸~ Normal
´ de uma populacao
Teorema: Seja (X , X , . . . , Xn ) uma amostra aleatoria N( ,
 ) com  conhecido.
~
Entao,
_ _
X   n .z 2 , X +  n .z 2 

¸ 100.(1  )% bicaudal para .


e´ um Intervalo de Confianca

~
prova: Suponhamos que (A , B) seja o intervalo procurado, entao:
P{A    B} = 1 - 
_
X ´
Sabemos que Z =  ~ N(0 , 1). Dai,
n

_ _ _
XB X XA
P      =1  
n n n

34
Pela tabela da Normal, temos P  z 2  Z  z 2  = 1   onde Z ~ N(0 ,
1).

_ _
XB 
Logo,  =  z 2  B = X + n .z 2

n

_ _
XA 
 = z 2  A= X  n .z 2

n

_ _
 
Portanto, X  n .z 2
 ,X+ n .z 2
  e´ um IC 100.(1  )% para , supondo
 conhecido.

´
Exemplo: Uma maquina ^
enche pacotes de cafe´ com uma variancia igual a 100 g . Ela
^
estava regulada para enche-los ´
com 500 g, em media. Agora ela se desregulou, e queremos
´ . Uma amostra de 25 pacotes apresentou uma media
saber qual a nova media ´ igual a 485
g. Construir um intervalo 95% de confianca
¸ para  .
_
Sol:  = 100 n = 25  30 e X = 485

_
 10
A=X  n .z 2
 = 485  25 .1.96 = 481
_
 10
B=X+ n .z 2
 = 485 + 25 .1.96 = 489

Logo, o IC 95% bicaudal para , com  conhecido, e´ (481 , 489).

35
#
Exercício: Obter um IC 100.(1  )% unicaudal a direita para , supondo   conhecido.

~
Sol: Suponhamos que (A, +) seja o intervalo procurado, entao:
P{A  } = 1  
_
X  ´
Sabemos que Z =  ~ N(0 , 1). Dai,
n

_ _
X  X A
P    =1-
n n

Pela tabela da Normal, temos P{Z  z } = 1   onde Z ~ N(0 , 1).


_ _
X A
Logo,  = z  A = X   n .z
n

_

Portanto, X  n .z , + e´ um IC 100.(1  )% unicaudal para ,
supondo  conhecido.

¸~ Normal N( ,
´ de uma populacao
Teorema: Seja (X , X , . . . , Xn ) uma amostra aleatoria
 
 ) com  desconhecio.
~
Entao,
_ _
X  S n .t 2 , X + S n .t 2 

¸ 100.(1  )% bicaudal para .


e´ um Intervalo de Confianca
n _
(Xi  X)
prova: Neste caso precisamos calcular o estimador S = i=1 ^
do parametro  e
n1
utilizando o resultado _
t = X S  ~ t(n-1) .
n

´
procedemos de forma analoga ao caso anterior.

Exemplo: A seguinte amostra:


9 8 12 7 9 6 11 6 10 9

36
foi extraida
_ ¸~ Normal. Construir um IC 95% para .
´ de uma populacao

Sol: X = 8.7 e S = 4.0  S = 2
g.l. = n  1 = 9

_
S
A=X  n .t 2
 = 7.27
_
S
B=X+ n .t 2
 = 10.13

Logo, o IC 95% bicaudal para , com  desconhecido, e´ (7.27 , 10.13).

Exercício: Selecione, segundo uma a.c.s com reposicao ¸~ (use a Tabua


´ de N-o Aleatorios),
´
uma amostra de tamanho 35 da populacao ~ ~
¸ de quarteiroes listada na tabela anexa com N =
270.
Yi = n-o de residencias
^ ~ i.
alugadas no quarteirao
Sabemos que  = 16.9 e  = 428.07

´ :
Construa um IC 95% para a media a) com  conhecido;
b) supondo  desconhecido.

¸~ Normal,
NOTA: Pelo Teorema do Limite Central, independente de X ter distribuicao
temos _
Z = X   a~ N(0 , 1) para n grande.
n

¸~ de X, um intervalo de confianca
Assim, qualquer que seja a distribuicao ¸ 100.(1 
)% para , considerando-se amostras grandes e´ dado por:

i) se  e´ conhecido
_ _
 
X  n .z 2
 ,X+ n .z 2
 

onde z 2 e´ dado pela tabela da Normal.

ii) se  e´ desconhecido
_ _
S S
X  n .z 2
 ,X+ n .z 2
 

37
n _
(Xi  X)
onde S = i=1
n  1 .

¸~ da vida de uma peca


Exemplo: Seja X a duracao ¸ de equipamento.
_ Admita-se que 100 pecas
¸
foram ensaiadas fornecendo uma duracao ~ ~
´ de X = 500 horas e desvio-padrao
¸ de vida media
´ .
S = 5 horas. Deseja-se obter um intervalo de 95% para a media

¸~ do tempo de vida de um equipamento nao


Sol: Sabemos que a distribuicao ~ e´ Normal,
~
´ n = 100. Podemos entao utilizar o TLC.
porem,

_
´ A= X 
Dai, S
n .z 2 = 499.02

e _
S
B= X+ n .z 2
 = 500.98

Portanto, 499.02 , 500.98  e´ um IC 95% para .

3.4 Intervalo de Confianca ^


¸ para a variancia 

´ extraida
Teorema: Seja (X , X , . . . , Xn ) uma amostra aleatoria ¸~ com
´ de uma populacao
¸~ Normal N(,  ), onde  e´ desconhecido. Entao
distribuicao   ~


(n  1).S
 (n 1).S

, 1-  
2 2
e´ um IC 100.(1  )% para  .

~
prova: Suponhamos que (A , B) seja o IC 100.(1  )% para  . Entao,
P{A    B} = 1  
n _
(Xi  X)

(n  1).S ~
Sabemos que  ~ (n-) , onde S = i=1
n1 , entao:


(n  1).S (n  1).S
P (n B1).S    A =1  

38
P{1-      } = 1   onde  ~ (n-1)
2 2

(n  1).S (n  1).S
Logo, B = 1-   B= 1- 
2
2
e
(n  1).S (n  1).S
 = A  A= 
2
2


(n  1).S
Portanto,  (n 1).S

, 1-   e´ um IC 100.(1  )% para  .
2 2

¸~ Normal, construir o intervalo de confianca


Exemplo: Supondo populacao ^
¸ para a variancia
´ de 90% para a amostra:
populacional ao nivel

9 8 12 7 9 6 11 6 10 9

Sol: Temos n = 10 , S = 4 , g.l. = 9 ,  = 10%

~ A= (n  1).S (n  1).S
Entao:  = 2.13 e B= 1-  = 10.81
2 2

Portanto, o IC 100(1  )% bicaudal para  e´ (2.13 , 10.81).

39
3.5 Intervalo de Confianca ~ 
¸ para o desvio-padrao
A partir do IC 100.(1  )% para a variancia ^  , podemos obter o IC para o
~  , bastando para isto extrair a raiz quadrada do intervalo para a variancia,
desvio-padrao ^
obtendo dessa maneira aproximadamente um intervalo para  . Assim,

n1
S.   , S.  n


1

2 1- 2

e´ um IC 100.(1  )% para  .

3.6 Intervalo de Confianca ¸~ p


¸ para a proporcao

¸~ de "sucessos" em uma amostra de tamanho n (n:grande)


Teorema: Seja ^p a proporcao
¸~ binomial em que p e´ a proporcao
´ de uma populacao
extraida ¸~ populacional de sucessos.
Suponhamos que n.p  5 e n.(1  p)  5. Entao,~

^ ^ ^ ^
 p^  z 2 .  p.(1n p) , p^ + z 2 .  p.(1n p) 

e´ um IC 100.(1  )% bicaudal para p.

~
prova; Suponhamos que seja (A , B) o intervalo procurado, entao:
P{A  p  B} = 1  

p^  p
Sabemos que Z = ~ N(0 , 1) , considerando-se n grande e n.p  5 e n.(1
 p.(1n p)
´
 p)  5. Dai,
^p  B ^p  p p^  A
P   =1  
 p.(1n p)  p.(1n p)  p.(1n p)

~ conhecemos p, usamos ^p como estimador de p. Entao


Como nao ~ o intervalo fica,

^p  B ^p  p p^  A
P   =1  
 ^p.(1  ^p)  ^p.(1  ^p)  ^p.(1  ^p)
n n n

Pela tabela da Normal, temos P  z 2  Z  z 2  = 1   onde Z ~ N(0 ,


1).

40
^p  B ^ ^
Logo, =  z 2  B = p^ + z 2 .  p.(1n p)
 ^p.(1  ^p)
n

e
^p  A ^ ^
= z 2  A = ^p  z 2 .  p.(1n p)
 ^p.(1  ^p)
n

^ ^ ^ ^
Portanto,  ^p  z 2 .  p.(1n p) , ^p + z 2 .  p.(1n p)  e´ um IC 100.(1 
)% , bicaudal, para p.

^
Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferencias eleitorais, 260
´
mostraram-se favoraveis ao candidato Y. Calcular um intervalo de confianca ´
¸ ao nivel de
´
90% para a porcentagem dos eleitores favoraveis a Y.

Sol: Pelos dados do problema, verificamos que n = 500 x = 260 1   = 90% e

^p = x
= 260
= 0.52
n 500

O IC 100.(1  )% para p e´ dado por

^ p) ^ ^ ^
p^ - z 2 . p.(1
n , p^ + z 2 . p.(1n p) .

Substituindo os dados do problema no intervalo acima e utilizando-se os valores da


tabela da Normal.

0.52.(10.52) 0.52)
tem-se 0.52  1.64. 500 , 0.52 + 1.64. 0.52.(1
500 .

Logo, o IC 90% para p e´ dado por: (0.488 , 0.552)

41
´
2a. Lista de Probabilidade e Estatistica
´
1) De 50.000 valvulas fabricadas por uma companhia retira-se uma amostra de 400
´
valvulas, ´
e obtem-se ~ de 100 horas.
´ de 800 horas e o desvio-padrao
a vida media
a) Qual o intervalo de confianca
¸ de 99% para a vida media ¸~
´ da populacao?
b) Com que confianca ´ e´ 800  0,98?
¸ dir-se ia que a vida media
c) Que tamanho deve ter a amostra para que seja de 95% a confianca
¸ na estimativa
800  7,84?

´ de 625 donas-de-casa revela que 70% delas preferem a marca X


2) Uma amostra aleatoria
de detergente. Construir um intervalo de confianca ¸~ populacional das
¸ para a proporcao
donas-de-casa que preferem X com coeficiente de confianca
¸ 90%.

3) Antes de uma eleicao,¸~ um determinado partido esta´ interessado em estimar a proporcao


¸~
´
p de eleitores favoraveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que
´
60% dos eleitores eram favoraveis ~
ao candidato em questao.
a) Determine o tamanho da amostra necessario ´ para que o erro cometido na
¸~
estimacao seja de, no ´
maximo, 0.01 com probabilidade de 80%.
b) Se na amostra final, com tamanho igual ao obtido em (a), observou-se que 55%
´
dos eleitores eram favoraveis ~ construa um intervalo de confianca
ao candidato em questao, ¸
~
¸ p. (Utilize  = 0,95.)
para a proporcao

4) Numa linha de producao, ¸~ e´ muito importante que o tempo gasto numa determinada
¸~ nao
operacao ~ varie muito de empregado para empregado.
^
a) Que parametro ´
estatistico ^
poderia ser usado para avaliar esse fato? Por que?
b) Se 11 empregados apresentam os tempos abaixo para realizar essa operacao, ¸~ qual
^
seria a estimativa para o parametro acima?
125 135 115 120 150 130 125 145 125 140 130
c) Determine um intervalo de confianca ^
¸ 90% para o parametro.

5) Um pesquisador esta´ estudando a resistencia^ de um determinado material sob


~
determinadas condicoes.
¸ Ele sabe que essa variavel ´ com desvio-
´ e´ normalmente distribuida
~ de 2 unidades.
padrao
a) Utilizando os valores 4.9 , 7.0 , 8.1 , 4.5 , 5.6 , 6.8 , 7.2 , 5.7 , 6.2 unidades,
obtidos de uma amostra de tamanho 9, determine o intervalo de confianca ^
¸ para a resistencia
´ com um coeficiente de confianca
media ¸  = 0,90.
b) Qual o tamanho da amostra necessario´ para que o erro cometido, ao estimarmos
^ ´
a resistencia media, ~
nao seja superior a 0,01 unidades com probabilidade 0,90?
c) Suponha que no ´item (a) nao ~ fosse conhecido o desvio-padrao.~ Como voce^
procederia para determinar o intervalo de confianca, ~
¸ e que suposicoes
¸ ^
voce faria para isso?

42
6) Suponha que X tenha uma distribuicao ¸~ uniforme no intervalo (0 ,  ), onde  e´
desconhecido. Uma amostra de n observacoes ¸~ e´ escolhida. Suponha que n seja
suficientemente grande para _que o Teorema do Limite Central se aplique e se possa
¸~ de X por uma Normal N( ,  /n). Obtenha um intervalo de
aproximar a distribuicao
¸ para , com coeficiente de confianca
confianca ¸ 90%.

43
Capítulo 4
Testes de hipóteses

¸~
4.1 Introducao

´
Testes de Hipoteses ~ procedimentos estatisticos
sao ´ que nos permitem aceitar ou
´
rejeitar uma hipotese H0 com base nos dados amostrais.

´
Em testes estatisticos, ´ matematica
copiamos a estrategia ´ ¸~
de provar por contradicao.
Comecando
¸ com uma hipotese ´ H0 que se quer rejeitar, supomos que H0 e´ verdadeira e
desenvolvendo argumentos de forma correta, se chegarmos a uma contradicao, ¸~ entao~ a
´
hipotese H0 deve ser falsa.
´
Em estatistica, ¸~
copiamos este enfoque, mas em vez de atingir uma contradicao,
observamos um resultado improvavel.´

¸~ e´ relacionada a um fato baseado na amostra, a negacao


Quando uma investigacao ¸~
deste fato e´ considerado como a hipotese
´ H0 e o fato a ser comprovado pelos dados e´
´
considerado como a hipotese alternativa H .

´
O objetivo do teste de hipotese e´ dizer, atraves ´
´ de uma estatistica ^ obtida de uma
´
amostra, se a hipotese ~ aceitavel.
H0 e´ ou nao ´ Operacionalmente, isto e´ conseguido atraves
´
~ critica
de uma regiao ´ ´
RC. Caso o valor da estatistica pertenca ~ rejeitamos H0 ;
¸ a esta regiao,
´
caso contrario, ~ rejeitamos H0 . Esta regiao
nao ´ de modo que P{^  RC | H0 e´
~ e´ construida
verdadeira} seja igual a , um n-o fixado.

´
Os testes de hipoteses podem ser de dois tipos:
´
i) Testes Parametricos
~ ´
ii) Testes Nao-Parametricos ^
: Aderencia, ^
Independencia, Homogeneidade e etc.

´
4.2 Hipotese ´
Nula e Hipotese Alternativa

´
H0 : Hipotese Nula e´ a hipotese
´ a ser testada.
´
H : Hipotese Alternativa.

44
¸~ de H0 implica a aceitacao
A rejeicao ¸~ de H , e a aceitacao
¸~ de H0 implica a rejeicao
¸~
de H .

´
Exemplos: Para o caso dos testes parametricos podemos ter:

1) Teste Bicaudal H0 :  = 100


H :   100

#
2) Teste Unicaudal a Direita H0 :  = 0.01
H :   0.01

#
3) Teste Unicaudal a Esquerda H0 : p = 0.4
H : p  0.4

¸~ para verificar se uma hipotese


NOTA: 1) A informacao ´ e´ verdadeira ou falsa e´ obtida da
¸~
amostra da populacao.

2) Durante o curso abordaremos a hipotese ´ ´


nula somente como uma hipotese
´
estatistica ¸~ e´ completamente especificada.
simples, onde a distribuicao
^
Admitindo que H0 seja verdadeira, estamos admitindo conhecidos os parametros
¸~ da estatistica
que definem a distribuicao ´ usada no teste.

´
4.3 Estatistica do Teste
´
A Estatistica ´
do Teste e´ uma estatistica ~
T cujo valor serve para determinar a decisao
a ser tomada.

NOTA: Assim como ocorreu para o desenvolvimento da estimacao ¸~ por intervalo, os testes
´
de hipotese ~ baseados nas distribuicoes
´ sao
tambem ¸~ dos estimadores. _
¸~ de probabilidade da media
Dessa maneira, as distribuicoes ^
´ amostral X; da variancia
¸~ amostral ^p, serao
amostral S ; da proporcao ~ utilizadas para os respectivos testes sobre a
^
´ , a variancia
media ¸~ p.
 e a proporcao

4.4 Erros Tipo I e Tipo II


~ sobre a hipotese
Quando tomamos uma decisao ´ proposta corremos o risco de
~
tomarmos uma decisao errada.

45
´
Associado a um teste de hipoteses ´
temos dois erros possiveis:

´
i) Erro Tipo I: a hipotese ~ de que H0
H0 e´ verdadeira mas o teste leva a conclusao
deve ser rejeitada.

# ~ de que H0 nao
~
´
ii) Erro Tipo II: a hipotese H0 e´ falsa mas o teste leva a conclusao
deve ser rejeitada.

A tabela a seguir apresenta as possibilidades de cometermos os erros tipo I e tipo II.


------------------------------------------------------------------
Aceitar H0 Rejeitar H0
-------------------------------------------------------------------
H0 e´ verdadeira Decisao ~ Correta Erro Tipo I
H0 e´ falsa Erro Tipo II ~ Correta
Decisao
--------------------------------------------------------------------

Designaremos
 = P{cometer erro tipo I} = P{Rejeitar H0 | H0 e´ verdadeira}
e
 = P{cometer erro tipo II} = P{Aceitar H0 | H0 e´ falsa}

Exemplo: H0 :  = 0
H :   0

~ e´ possivel
NOTA: A probabilidade do erro do tipo II,  , na maioria dos casos, nao ´ calcular,
~ especifica uma única possibilidade, mas uma familia
pois usualmente nao ´ de possibilidades
alternativas.

46
~ Critica
4.5 Regiao ´ do Teste
~ Critica
A Regiao ´ ~ de rejeicao
(RC) do Teste e´ a regiao ¸~ da hipotese
´ H0 .

NOTA: 1) Normalmente, temos que determinar um valor critico ´ ´


Tc da estatistica T, que nos
´
permite escolher entre H0 e H . Este valor critico ~ critica.
Tc delimitara´ a regiao ´
2) Observem que  determina a regiao ~ critica
´ do teste.

´
4.6 Escolha da Hipotese Nula

Qual sera´ a hipotese


´ nula H0 ?
¸~ da hipotese
_ A formulacao ´ nula a ser testada depende de qual e´ o erro mais grave.

´
A teoria Classica ´
do teste de hipotese considera que o erro do tipo I e´ muito mais
grave que o erro tipo II. Ou seja, e´ muito mais grave rejeitar H0 quando ela e´ verdadeira do
que aceita-la ^
´ quando e´ falsa. Isto significa que se deve ter muita evidencia de que H0 e´ falsa
´
antes de rejeita-la.
Consideraremos, portanto, H0 a hipotese´ ¸~ implicaria num erro tipo I
cuja rejeicao
mais grave.

Exemplo: Suponhamos que uma vacina contra uma doenca ¸ vai ser testada em um grupo de
pessoas, enquanto que um grupo de controle recebe apenas soro. Apos ´ algum tempo
verificamos quais pessoas adquiriram a doenca ~
¸ (afetados) e quais nao adquiriram (nao~
afetados), obtendo-se a tabela abaixo:

Afetados ~
Nao-Afetados
---------------------------------------------------------------
Receberam n  n 
Vacinas
---------------------------------------------------------------
Receberam n  n 
Soro
---------------------------------------------------------------

Assim, n  pessoas foram vacinadas e nao ~ ficaram doentes, enquanto que n



pessoas receberam apenas soro e ficaram doentes, . . .

47
´
Suponhamos que queremos escolher uma das seguintes hipoteses nulas.

H' : a vacina e´ eficiente.


H'' : a vacina e´ inocua.
´

´ a vacina
-Se H0 = H' , o erro tipo I consiste em rejeitar H' sendo ela verdadeira, i.e,
e´ eficiente, mas a consideramos inocua.
´

´ a vacina e´
-Se H0 = H'' , o erro tipo I consiste rejeitar H'' sendo ela verdadeira, i.e,
´
inocua, mas a consideramos eficiente.

´
Tomamos H'' como hipotese nula, pois o erro tipo I decorrente nos parece ser o
mais grave.

4.7 Mecanismo dos Erros

Para o entendimento do relacionamento entre as probabilidades  e  , vamos


idealizar um exemplo.

~ do tipo certo-errado. Ele


Exemplo: Um professor aplica um teste envolvendo 10 questoes
´
quer testar a hipotese "o estudante esta´ adivinhando".

Sol: Designemos por p, a probabilidade do estudante responder corretamente a uma


~
questao.
´
A hipotese que iremos testar sera´ H0 : p = 21 .
¸~ independentes do
O teste sera´ baseado no número de sucessos nas n = 10 repeticoes
~
´ no número de acertos nas 10 questoes.
experimento, i.e,

~
Seja X: número de respostas certas em 10 questoes
Portanto X ~ b10 , 12  onde X = 0, 1, 2, 3, 4, 5, . . . , 10 .

Se H0 for verdadeira, o número de acertos devera´ estar proximo


´ de E(X) = n.p =
1
10. 2 =5

~ critica
i) Seja RC = {8, 9, 10} a regiao ´ ´
do teste, i.e,
~ corretas, o estudante nao
"Se oito ou mais respostas estao ~ esta´ adivinhando, caso
´ diremos que o estudante esta´ adivinhando."
contrario

48
H0 sera´ rejeitada se X = 8 ou X = 9 ou X = 10.
´
Dai,

 = P{Rej. H0 | H0 e´ verd.} = P{X = 8 ou X = 9 ou X = 10 | p = 0.5} =

=  10 8
8 .0,5 .0,5
10-8
+  10 9
9 .0,5 .0,5
10-9
+  10 10
10 .0,5 .0,5
10-10
= 0.054

1
´
Suponhamos, que na realidade, a hipotese testada H0 :p = 2 seja falsa, ou seja que p
= 0.8. Calculemos o valor de  .

 = P{Aceit. H0 | H0 e´ falsa} = P{X = 0 ou X = 1 ou . . . ou X = 7 | p = 0.8} =

=  10 0
0 .0,8 .0,8
10-0
+  10 1
1 .0,8 .0,8
10-1
+ . . . +  10 7
7 .0,8 .0,8
10-7
= 0.322

~
ii) Agora, seja RC = {9, 10}, entao,

 = P{Rej. H0 | H0 e´ verd.} = P{X = 9 ou X = 10 | p = 0.5} =

=  10 9
7 .0,5 .0,5
10-9
+  10 10
7 .0,5 .0,5
10-10
= 0.01

 = P{Aceit. H0 | H0 e´ falsa} = P{X = 0 ou X = 1 ou . . . ou X = 8 | p = 0.8} =

=  10 0
0 .0,8 .0,8
10-0
+  10 1
1 .0,8 .0,8
10-1
+ . . . +  10 8
8 .0,8 .0,8
10-8
= 0.624

~  = ? e  = ? (Exercicio)
iii) Agora, seja RC = {7, 8, 9, 10}, entao, ´

~ o seguinte quadro:
Obtemos, entao,

RC  
------------------------------------------------------
{7, 8, 9, 10} 0.17 0.121
{8, 9, 10} 0.054 0.322
{9, 10} 0.01 0.624
------------------------------------------------------

Portanto, diminuindo ,  aumenta.

49
NOTA: Um teste ideal e´ dado quando  e  tem os menores valores possiveis. ´
´ para o tamanho da amostra n fixado, vimos no exemplo acima que quanto
Porem,
menor for o valor de , maior sera´ o valor de  . Ou seja, nao ~ e´ possivel
´ tomar  e  que
´
sejam minimos ´
possiveis.
¸~ fixa-se um valor para  e toma-se o menor  possivel.
Como solucao, ´ A justificativa
de fixar  e´ dada pelo fato que, em geral, o erro tipo I e´ mais grave do que o erro tipo II.

¸~ do teste de hipoteses,
Portanto, na construcao ´ procuramos controlar o erro tipo I,
^ ~ critica
fixando-se a sua probabilidade de ocorrencia. Uma vez fixado esse valor, a regiao ´ e´
construida de modo que P{  RC | H0 e´ verdadeira} seja igual ao valor fixado .

´ de Significancia
4.8 Nivel ^ do Teste
~o: A probabilidade  de cometer um erro tipo I e´ um valor arbitrario
Definiça ´ e recebe o
´ de Significancia
nome de Nivel ^ do teste.
O resultado da amostra e´ cada vez mais significante para rejeitar H0 quanto menor
´ .
for esse nivel

Interpretaça~o: Se escolhermos um nivel


´ ^
de significancia de 5%, significa que em 100
¸~ do experimento cerca de 5 vezes rejeitariamos
realizacoes ´ H0 quando ela devesse ser aceita,
ou seja podemos ter 95% de confianca ~ correta.
¸ de termos tomado a decisao

~ de aceitacao
De modo geral, a regiao ¸~ de um teste de hipoteses
´ H0 :  = 0 vs H : 
´
 0 , com nivel ^
de significancia , corresponde a um intervalo de confianca¸ bicaudal
100.(1  )% para .

´
Na pratica, ´ de significancia
costuma-se adotar um nivel ^ de 0,05 ou 0,01.

´
4.9 Procedimentos para se efetuar um Teste de Hipoteses

¸~ deste teste pode ser resumido nos seguintes


O procedimento para a realizacao
passos:
´
1- Identificar as hipoteses H0 e H .
´ de significancia).
2- Fixar o limite de erro  (nivel ^
´
3- Identificar a estatistica do teste.
´
4- Calcular o valor da estatistica do teste a partir dos dados da amostra selecionada.
~ ´
5- Determinar a regiao critica do teste.

50
~ de rejeicao
6- Verificar se o valor calculado em 4) esta´ incluido na regiao ¸~ ou nao,
~ e
¸~ ou rejeicao
concluir pela aceitacao ¸~ de H0 .

´
Procuraremos, sempre que fizermos teste de hipoteses, distinguir bem estes passos.

¸~ Normal
Exemplo: Consideremos uma amostra de 16 elementos retirada de uma populacao
N(,  ), onde  = 16, dada por
20 18 19 17 24 18 17 26 21 17 19 3 21 20 21 21
´ de significancia
Desejamos testar H0 :  = 20 com nivel ^  = 5%.
H :   20

Sol: Se fixarmos os riscos de cometer o erro tipo I, ou seja a probabilidade , obteremos


~ critica
a regiao ´ para o teste sujeito a este erro. _
´ X-
Sabemos que a Estatistica do Teste e: ´ Z =  ~ N(0 , 1).
n

Como H indica que a media´ populacional deve ser maior do que 20, teremos um
# #
¸~
teste unicaudal a direita, concentrando-se o risco  na cauda a direita da distribuicao.
Assim:

_
Determinemos o valor de xc da seguinte forma,

_ _ _ _ _ _
X - 20 xc - 20 xc - 20
P{X  xc } = 0.05  P 4  4  = 0.05  4 = 1.64  xc =
 16  16  16

21.64
~ para aceitacao
Logo, a regra de decisao ¸~ ou rejeicao
¸~ de H0 : = 20, para  = 0.05
´
sera:
_
~ Critica
Regiao ´ (RC): Rejeita-se H0 quando X  21,64
_
~ de Aceitacao
Regiao ¸~ (RA): Aceita-se H0 quando X  21,64
_
~ O valor observado da estatistica
Conclusao: ´ e´ X = 18.88, i.e,
´ a media
´ obtida da
_
amostra. Como X = 18.88  xc = 21,64 aceitamos H0 .

51
NOTA: 1) A critica ´ ´
a este procedimento e´ que, em muitos casos, a escolha do nivel de
^
significancia e´ completamente arbitraria.
´
´ disso, nos casos em que a distribuicao
Alem ¸~ sob H0 e´ discreta, o nivel
´ de
^
significancia escolhido pode nem mesmo ser atingido.

Exemplo: Um praticante de tiro ao alvo vai comprar um lote muito grande de municao ¸~ e o
´
vendedor garante que a porcentagem de projeteis em bom estado e´ 90%.
^
No entanto, o comprador decide fazer uma experiencia para testar a veracidade da
¸~ do vendedor. Ele escolhe 10 projeteis
afirmacao ´ ~ bons.
e vai verificar quantos sao
~ comprar o lote se X = número de bons na amostra for muito
Ele decide nao
pequeno.

Sol: X e´ uma v.a. t.q. X ~ b(10 , p) e X = 0, 1, 2, . . . , 10, onde p = proporcao¸~ de bons


´
projeteis no lote.
´
A hipotese a ser testada e´ H0 : p = 0,9.
Suponhamos que para cada suposta regiao ~ critica
´ ele calcula a probabilidade  .
Dado que p = 0.9, temos (ver tabelas):
P{X = 0} = P{X = 1} = P{X = 2} = P{X = 3} = P{X = 4} ~
= 0,
P{X = 5} = 0.001
P{X = 6} = 0.011
P{X = 7} = 0.057

~
Portanto, se RC = {0, 1, 2, 3, 4, 5} entao
 = P{Rej. H0 | H0 verd.} = P{X=0 ou X=1 ou X=2 . . . ou X=5 | p = 0.9} = 0.001,

~
Se RC = {0, 1, 2, 3, 4, 5, 6} entao
 = P{Rej. H0 | H0 verd.} = P{X=0 ou X=1 ou X=2 . . . ou X=6 | p=0.9} = 0.012,

~
Se RC = {0, 1, 2, 3, 4, 5, 6, 7} entao
 = P{Rej. H0 | H0 verd.} = P{X=0 ou X=1 ou X=2 . . . ou X=7 | p = 0.9} = 0.069,

´
Logo, se tivessimos ~ haveria nenhuma regiao
fixado  = 2,5% nao ~ critica
´ RC para
qual  = 2,5%.

52
´
2) Um teste de hipotese que empregue apenas o erro , nao ~ pode ser tratado como
´
´ inequivoco.
um teste decisorio ¸~ de H0 pode acarretar erro  e, em decorrencia,
A aceitacao ^
~ erroneas.
problemas de decisoes ^
´
Apesar de o teste de hipotese ¸~ generalizado, esta
ser um instrumento de aplicacao
¸~ deve sempre estar presente nas decisoes
restricao ~ efetuadas, quando de sua aplicacao,¸~
¸~ do teste e´ a aceitacao
particularmente quando a indicacao ¸~ de H0 .

53
3-a Lista de Exercicios
´ ´
de Probabilidade e Estatistica

¸~ abaixo, escolha como hipotese


1) Na situacao ´ nula, H0 , aquela que para voce leva a um
´ mais importante. Descreva quais os dois erros em cada caso.
erro de primeira especie

a) O trabalho de um operador de radar e´ detectar aeronaves inimigas. Quando surge alguma


´
coisa estranha na tela, ele deve decidir entre as hipoteses:
- esta´ comecando
¸ um ataque;
^
- tudo bem, apenas uma leve interferencia.

´
b) Num juri, um individuo esta´ sendo julgado por um crime. As hipoteses
´ sujeitas ao juri
~
sao:
- o acusado e´ inocente;
- o acusado e´ culpado.

c) Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele ira´ conduzir
uma pesquisa de laboratorio ¸~ De acordo com o
´ para verificar a veracidade da afirmacao.
¸ ´ ou nao
resultado, ele lancara ~ a vacina no mercado. As hipoteses
´ ~
que pode testar sao:
- a vacina e´ boa;
~ e´ boa.
- a vacina nao

2) Fazendo o teste
H0 :  = 155 ( = 20) H :  = 145 ( = 12),

~ critica:
e n = 25 , estabeleceu-se a seguinte regiao ´
RC = {y  R | y  150}.
a) qual a probabilidade  de rejeitar H0 quando verdadeira?
b) qual a probabilidade  de aceitar H0 quando H e´ verdadeira?

3) Se, ao lancarmos
¸ ´
3 vezes uma moeda, aparecerem 3 coroas, decidimos rejeitar a hipotese
de que a moeda e´ "honesta". Quais as probabilidades de erro I e erro II?

~ da seguinte informacao:
4) Suponha o leitor que dispoe ¸~
H0 : p = 35% H : p  35%
¸~
a) Explique por que a probabilidade de um erro tipo II e´ zero se a proporcao
populacional e´ 35%.

54
b) Explique por que a probabilidade de um erro tipo I e´ zero se a proporcao ¸~
populacional e´ diferente de 35%.
5) Para decidirmos se os habitantes de uma ilha sao ~ descendentes da civilizacao
¸~ A ou B,
iremos proceder do seguinte modo:
i) selecionamos uma amostra de 100 moradores adultos da ilha, e determinamos a
´ deles;
altura media
´ for superior a 176, diremos que sao
ii) se essa altura media ~ descendentes de B; caso
´
contrario, ~ descendentes de A.
sao
^
Os parametros ¸~ sao:
das alturas das duas civilizacoes ~
A:  = 175 e  = 10.
B:  = 177 e  = 10.
Definamos:
Erro I - dizer que os habitantes da ilha sao~ descendentes de B quando, na realidade,
~ de A.
sao
~ de A quando, na realidade, sao
Erro II - dizer que sao ~ de B.
a) Qual a probabilidade do erro I? E o erro II?
b) Qual deve ser a regra de decisao~ se quisermos fixar a probabilidade do erro I em
5%? Qual a probabilidade do erro II, nesse caso?
c) Se A = 5, como ficariam as respostas de (b)?
¸~ da questao
d) Quais as probabilidades do erro II, nas condicoes ~ (b), se a media
´ B =
178? E B = 180? E B = 181?
´
Coloque num grafico os pares B , P(erro II / B ) .

55
Capítulo 5
Testes **********

´ 
5.1 Teste para a media
~ temos um único valor para a hipotese
Em geral nao ´ H .
¸~ inicial podemos realizar o teste dos seguintes modos:
Dependendo da informacao

a) H :  = 0 b) H :  = 0 c) H :  = 0
H :   0 H :   0 H :   0

´ de significancia
com nivel ^  onde 0 e´ um valor suposto conhecido.
´
Para delinear os procedimentos em um teste de hipoteses ´
sobre a media de uma
~
populacao,
¸ ~
devemos nos basear na distribuicao ´ populacional
¸ do estimador da media
_ _
X X
Z= /n ~ N(0,1) t= t
S/n ~ (n-)

^
conforme a variancia ~
 seja conhecida ou nao.

5.1.1 CASO I:  conhecido

~es: Suponhamos uma amostra X , X , . . . ,Xn da populacao


Suposiço ¸~ N( ,  ).

_
X
Estatística do Teste: Z =  ~ N(0 , 1).
n

Procedimento:
_
X - 0
i) Calcular: Zobs =  onde 0 e´ o valor dado na hipotese
´ nula.
n

ii) Determinar a RA e a RC do teste

56
a) b) c)

~ os valores criticos
onde z 2 ou z sao ´ dados pela Tabela da Normal.

~
iii) Conclusoes:
a) se zobs   z entao ~ rejeita-se H .
~ aceita-se H .
b) se  z 2  zobs  z 2 entao
~ rejeita-se H .
c) se zobs  z entao

~es:
Observaço
1) Evidentemente, se o valor de zobs estiver fora dos intervalos indicados acima, a
~
decisao sera´ contraria.
´

~ e´ aumentar
2) Se zobs = z , nos casos b) e c), ou zobs = z 2 , no caso a), a sugestao
o tamanho da amostra.

Exemplo 1) O representante de um grupo comunitario ´ informa a uma pessoa, que esta´


interessado em estabelecer um centro comercial e que a renda media´ ´
familiar na area e´ de
_
$15.000. Para uma amostra aleatoria ´
´ de n = 15 familias, ´
a renda media familiar foi X =
´
$14.000. Testar a hipotese ´ de significancia
nula de que  = $15.000, utilizando um nivel ^ de
5%.
¸~ Normal com  = $1500.
Supor que a renda familiar tem distribuicao

´ populacao
Sol: Dados do problema: n = 15, porem
_ ¸~ e´ normal com  = 1500 conhecido,
 = 5% e X = 14.000.
Utilizaremos primeiramente um teste bicaudal, ou seja, desejamos testar:
H :  = 15000
H :   15000 com  = 5%
_
X  0 14000  15000
´
i) Calculo de Zobs =  = 1500 =  2,582
n  15

57
¸~ das RA e a RC do teste.
ii) Determinacao

~
iii) Conclusao:
Como zobs =  2,582   z 2 =  1,96 entao ~ rejeita-se H .

¸~ do representante da comunidade, de que a renda


Logo, deve-se rejeitar a afirmacao
¸~ seja de $15000, a um nivel
´ familiar da populacao
media ´ de significancia
^ de 5%.

^
Exemplo 2): Com referencia ´
ao exemplo 1, uma vez que a hipotese foi rejeitada, ou seja,
que rejeitamos que  = 15000 contra   15000, sera´ que podemos aceitar que  
´ para isto.
´ amostral nos da´ um forte indicio
15000, pois a media

Sol: Desejamos testar: H :  = 15000


H :   15000 com  = 5%
¸~ das RA e a RC do teste.
ii) Determinacao

~
iii) Conclusao:

~ rejeita-se H .
Como zobs = - 2.582  - z = - 1,64 entao
´ aceitamos a hipotese
Dai, ´ ´
de que a renda media ¸~ deve ser
familiar da populacao
´ de significancia
menor do que $15000, a um nivel ^ de 5%.

Exercício: Selecione, segundo uma a.c.s com reposicao ¸~ (use a Tabua


´ de N-o Aleatorios),
´
uma amostra de tamanho 35 da populacao ¸~ de quarteiroes
~ listada na tabela anexa com N =
270.
Yi = n-o de residencias
^ ~ i.
alugadas no quarteirao

58
Sabemos que  = 16.9 e  = 428.07
´
Testar a hipotese ´ de significancia
de que  = 16.9 para um nivel ^ de 10%.

5.1.2 CASO II:  desconhecido


n _
(Xi - X)
Neste caso precisamos calcular o estimador S = i=1 ^
do parametro  e
n-1
´
utilizar a variavel, _
X-
t= S ~ t (n-1)
n

´
como a estatistica do_teste.
i) Calcular: tobs = X -S 0 onde 0 e´ o valor dado na hipotese
´ nula.
n

ii) Determinar a RA e a RC do teste

a) b) c)

~ valores criticos
onde t 2 e t sao ´ dados pela Tabela da t de Student.

~
iii) Conclusoes:

a) se zobs  - t entao ~ rejeita-se H .


~ aceita-se H .
b) se - t 2  zobs  t 2 entao
c) se zobs  t entao ~ rejeita-se H .

´
Exemplo: Os registros dos últimos anos de um colegio atestam para os calouros admitidos
´
a nota media ´
115. Para testar a hipotese ´
de que a media de uma nova turma e´ a mesma,
tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se media´ ~ 20.
118 e desvio-padrao
Admitir que  = 0.05 para efetuar o teste.

~
Sol: Entao, H :  = 115
H :   115 com  = 5%
_
X - 0 118 - 115
´
i) Calculo de tobs = S = 20 = 0,67
n  20

59
¸~ das RA e a RC do teste.
ii) Determinacao

~
iii) Conclusao:

Como  2,093  tobs = 0,67  2,093 entao ~ aceita-se H .


´ aceitamos a hipotese
Dai, ´ ´ da nova turma e´ a mesma da turma
de que a nota media
´ de significancia
passada, a um nivel ^ de 5%.

´
Exercício: No exemplo 1), testar as hipotese
H :  = 15000
H :   15000 com  = 5%

supondo  desconhecido com S = $1500.

NOTA: Pelo Teorema do Limite Central, independente de X ter distribuicao¸~ Normal,


´
um teste de hipoteses ´
para , com nivel ^
de significancia , considerando-se amostras
´
grandes, por exemplo n  30, tera´ como estatistica do teste:

i) se  e´ conhecido _
X - a~ N(0 , 1)
Z=  para n  30.
n

ii) se  e´ desconhecido _
X - a~ N(0 , 1)
Z= S para n  30,
n
n _
(Xi - X)
onde S = i=1
n-1 .

^
Exemplo: Uma indústria de eletricidade faz lampadas cujo tempo de vida medio ´ e´ 800
horas e  = 40 horas. Testar a hipotese
´ de que  = 800 horas contra a alternativa   800
horas se uma amostra aleatoria ^
´ de 30 lampadas ´
tem um tempo medio de vida de 788 horas.
Adotar  = 0,04.

60
¸~ nao-normal
Sol: Dados do problema: n = 30, para uma populacao
_
~ com  = 40 conhecido, 
= 5% e X = 788.
Desejamos testar: H :  = 800
H :   800 com  = 5%
_
X - 0 788 - 800
´
i) Calculo de Zobs =  = 40 = -1,643
n  30

¸~ das RA e a RC do teste.
ii) Determinacao

~
iii) Conclusao:

~ aceita-se H .
Como - z 2 = - 2,054  zobs = - 1,643  z 2 = 2,054, entao
´
Logo, concluimos que o tempo medio ^
de vida das lampadas produzidas e´ mesmo de
´ de significancia
800 horas, a um nivel ^ de 5%.

¸~ p
5.2 Teste para a proporcao

Problema: Tem-se uma populacao ¸~ e uma hipotese´ ¸~ p de individuos


sobre a proporcao ´
´
portadores de uma certa caracteristica. ´
Esta hipotese ¸~ e´ igual a
afirma que essa proporcao
um certo número p0 .

Hipóteses:

a) H : p = p0 b) H : p = p0 c) H : p = p0
H : p  p0 H : p  p0 H : p  p 0

´ de significancia
com nivel ^  e p0 e´ um valor suposto conhecido.

61
~es:
Suposiço

¸~ dicotomica,
´ X , X , . . . ,Xn de uma populacao
i) Suponhamos uma amostra aleatoria ^ sendo
´
X o número de unidades na amostra que possuem a dada caracteristica.

¸~ da Binomial pela
ii) n.p0  5 e n.(1  p0 )  5 para garantir uma boa aproximacao
Normal.

Estatística do Teste:

´ ^p - p
A Estatistica ´ Z=
do Teste sera: ~ N(0 , 1), onde ^p = x
n .
 p.(1n p)

Procedimento do Teste:

^p - p0
´
i) Calculo do valor observado: Zobs =
 p0.(1n- p0)

onde p0 e´ o valor dado na hipotese


´ nula.

ii) Determinar a RA e a RC do teste

a) b) c)

~ os valores criticos
onde z 2 ou z sao ´ dados pela Tabela da Normal.

~
iii) Conclusoes:

a) se zobs  - z entao ~ rejeita-se H .


~ aceita-se H .
b) se - z 2  zobs  z 2 entao
c) se zobs  z entao ~ rejeita-se H .

62
Exemplo: Uma estacao ¸~ de televisao
~ afirma que 60% dos televisores estavam ligados no seu
programa especial da última 2-a feira. Uma rede competidora deseja contestar essa
¸~ e decide, para isso, usar uma amostra de 200 familias.
afirmacao, ´
Admitamos que, do trabalho de campo, entrevistando as 200 familias´ sorteadas,
~
obtivemos 104 respostas afirmativas. Testar a veracidade da afirmacao ´
¸ da emissora ao nivel
^
de significancia  = 0.05.

Sol: Desejamos testar: H : p = 0.60


H : p  0.60 com  = 5%

Observemos que n.p0 = 200.(0,60) = 120  5 e n.(1 - p0 ) = 200.(0,40) = 80  5

^p - p0 0,52 - 0,60
´
i) Calculo do valor observado: Zobs = = = -2,31
 p0.(1n- p0)  0,6.(1
200
- 0,6)

onde ^p = x
n = 104
200 = 0.52

¸~ das RA e a RC do teste
ii) Determinacao

~
iii) Conclusao:

Como zobs = - 2.31  - z = - 1,64 entao ~ rejeita-se H .


^
Ou seja, ha´ evidencias ^
de que a audiencia do programa de 2-a feira nao
~ foi de 60% e
sim inferior a este número.

^
5.3 Teste para a variancia 

´ da media
Alem ´ ^
populacional, muitas vezes temos interesse em fazer inferencias
sobre a variabilidade populacional.
´ de qualidade
Por exemplo, podemos ter interesse na uniformidade como um criterio
¸~ (controle de qualidade).
para uma linha de producao

63
~es :
Suposiço

¸~ Normal N(
´ X , X , . . . ,Xn de uma populacao
Suponhamos uma amostra aleatoria
,  ).

Hipóteses:

a) H :  = 0 b) H :  = 0 c) H :  = 0


H :   0 H :   0 H :   0

´ de significancia
com nivel ^  e 0 e´ um valor suposto conhecido.

(n - 1).S
Estatística do Teste :  ~ (n-1)
Procedimento para o teste :

(n - 1.) S
´
i) Calculo do valor observado: obs = 0
n _
 ( Xi X )
onde 0 e´ o valor dado na hipotese
´ nula e S = i=1 ^
variancia amostral.
n-1

ii) Determinar a RA e a RC do teste

a) b) c)

~ os valores criticos
onde  ou  sao ´ dados pela Tabela da Qui-Quadrado.
2

~
iii) Conclusoes:

a) Se 2obs  2-  rejeita-se H


b) Se 2obs  -  ou obs 
  rejeita-se H
2 2

64
c) Se 2obs   rejeita-se H

Exemplo : Uma das maneiras de manter sob controle a qualidade de um produto e´ controlar
^
sua variancia. ´
Uma maquina ^
de encher pacotes de cafe´ esta´ regulada para enche-los com
um desvio padrao ~ de 10 g e media ´ de 500 g. O peso X de cada pacote segue uma
~ 
¸ N (  ,  ). Selecionou-se uma amostra aleatoria
distribuicao ´ de 16 pacotes e observou-se
^
uma variancia S = 169 g . Com esse resultado, voce^ diria que a maquina
´ esta´ desregulada
#
¸~ a variancia?
em relacao ^

´ de significancia
Sol: Fixado o nivel ^ , por exemplo  = 5%, desejamos testar:

H :  = 100
H :   100

(n - 1).S
´
i) Calculo do valor observado: obs = 0 = 15x169
100 = 25,35
onde n=16 , S = 169 e 0 = 100 dados no problema.

¸~ das RA e a RC do teste
ii) Determinacao

Pela tabela da Qui-Quadrado, 0,975 (15) = 6,262 e 0,025



(15) = 27,448

~
iii) Conclusao:

Como 0,975 (15)  obs  0,025



(15) , aceita-se H .
# ^
´
Ou seja, a maquina esta´ sob controle quanto a variancia.

65
4-a Lista de Exercicios
´ ´
de Probabilidade e Estatistica

¸~ pluviometrica
1) A precipitacao ´ anual numa certa regiao~ tem desvio padrao
~  =3.1 e media
´
desconhecida. Para os últimos 9 anos foram obtidos os seguintes resultados:
30.5 34.1 27.9 35.0 26.9 30.2 28.3 31.7 25.8
a) Construir um teste de hipoteses ´ para saber se a media´ ¸~
de precipitacao
´
pluviometrica ´ de significancia
anual e´ maior que 30.0. Utilize um nivel ^ de 5%.
b) Discuta o mesmo problema, considerando  desconhecido.
c) Supondo que, na realidade,  = 33.0, qual a probabilidade de tirarmos uma
~ errada?
conclusao

´
2) Um fabricante garante que 90% dos equipamentos que fornece a uma fabrica ~ de
estao
¸~ exigidas. O exame de uma amostra de 200 pecas
acordo com as especificacoes ¸ desse
´
equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, aos niveis de 5% e
1%.

~ pretendem modifica-lo
3) Os produtores de um programa de televisao ´ se for assistido
regularmente por menos de um quarto dos possuidores de televisao. ~ Uma pesquisa
´
encomendada a uma empresa especializada mostrou que, de 400 familias entrevistadas, 80
assistem ao programa regularmente. Baseado nos dados, qual deve ser a decisao ~ dos
produtores?

4) O custo X de manutencao ¸~ de teares segue uma distribuicao¸~ normal, X ~ N( , 400).


^
Durante muito tempo, o parametro  tem sido adotado como igual a 200. Suspeita-se de
^
que este parametro ^
aumentou, e so´ nos interessa saber se o novo o parametro aumentou, e
^
so´ nos interessa saber se o novo parametro for superior a 210. Assim, queremos planejar
um teste em que  = 5% (quando  = 200) e  = 10% (quando  = 210).
a) Qual deve ser o tamanho da amostra?
b) Qual a RC neste caso?

~ retiradas de uma formacao #


5) Alguns tipos de rochas sao ¸~ geologica
´ ´
e submetidas a analises
´
quimicas ´ de cobre. Apos
para determinar a porcentagem media ´ analisar 25 rochas, a media
´
e o desvio-padrao ~ encontrados sao~ iguais #a 10,2 e 3,1, respectivamente. Supor que a
¸~ comercial deste mineral sera´ economicamente
extracao ^ ´
viavel ´
se a porcentagem media do
mineral e´ de pelo menos 8%.
¸~ comercial? (testar com  =0.05).
i) Os dados sugerem viabilidade da extracao

66
ii) Um indicador da qualidade do mineral e´ dada pela uniformidade do conteúdo
mineral nas rochas. Supor que a qualidade do conteúdo do mineral e´ satisfatoria
´ se o
~ ~
´ nao e´ maior do que 4.
desvio-padrao da porcentagem media

6) Sabe-se que o consumo mensal per capita de um determinado produto tem distribuicao ¸~
normal, com desvio-padrao ~ 2 Kg. A diretoria de uma firma que fabrica esse produto
¸~ se a media
resolveu que retiraria o produto da linha de producao ´ de consumo per capita
´
fosse menor que 8 Kg. Caso contrario, ´
continuaria a fabrica-lo. Foi realizada uma pesquisa
25
´
de mercado, tomando-se uma amostra de 25 individuos, e verificou-se que  Xi = 180 Kg,
i=1
´
onde Xi representa o consumo mensal do i-esimo ´
individuo da amostra.
´
a) Construa um teste de hipotese adequado, utilizando  = 0,05, e com base na
~
amostra colhida determine a decisao a ser tomada pela diretoria.
b) Qual a probabilidade  de se tomar uma decisao~ errada se, na realidade, a media
´
populacional e´  = 7.8 Kg?
~ seria a mesma? (Justifique sua
c) Se a diretoria tivesse fixado  = 0.01, a decisao
resposta).
~ da populacao
d) Se o desvio-padrao ¸~ fosse 4 Kg, qual seria a decisao?
~ (Justifique sua
resposta).

67

Você também pode gostar