Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila - Inferência Estatística PDF
Apostila - Inferência Estatística PDF
Inferência Estatística
1.1 Introdução
´
Considere um experimento estatistico ~ valores assumidos
cujos resultados, , sao
´ .
´ aleatoria
por uma variavel
1
Exemplos: pode representar a chegada de navios no porto: , com parâmetro
onde
Media ^
´ Populacional e Variancia Populacional
Na pratica,
´ ~ sera´ completamente conhecida, isto e,
( ) nao ´ um ou mais
^
parametros ~ desconhecidos.
serao
´
O objetivo do estatistico ^
e´ estimar estes parametros desconhecidos ou testar a
¸~
validade de certas afirmacoes sobre eles.
Definição: O conjunto de todos os possíveis valores que um parâmetro (de uma f.d.p
( ) pode assumir é chamado Espaço Paramétrico.
2
1.2 Amostra Aleatória
125 135 115 120 150 130 125 145 125 140 130
~ o objetivo do estatistico
Entao, ´ e´ decidir, com base numa amostra adequadamente
selecionada, que membro ou membros da familia´ { ( ), } pode representar a f.d.p
de .
~ chamados problemas de Inferencia
Problemas deste tipo sao ^ ´
Estatistica e sera´ o
objeto de estudo destas notas.
3
1.3 Histograma: estimador da 'forma' da distribuição de
^
Exemplo: Numa central telefonica chegam 300 telefonemas por hora.
~ haja nenhum chamado.
Qual a probabilidade de que num minuto nao
300
´ de chamadas por minuto e´ =
O número medio 60 =5
e-5 . 50
Portanto, P{X = 0} = 0! = 0,006738
´
Exemplo: Os dados abaixo referem-se aos montantes (em milhares de dolares) de 32
´
emprestimos pessoais em uma companhia financeira.
6.0 0.0 2.0 6.5 5.0 3.5 4.0 7.0 8.0 7.0 8.5 6.0 4.5 0.0 6.5 6.0
2.0 5.0 5.5 5.0 7.0 1.5 5.0 5.0 4.0 4.5 4.0 1.0 5.5 3.5 2.5 4.5
Com os dados da tabela construimos o histograma dado abaixo.
h=hist(X)
xhist=c(min(h$breaks),h$breaks)
yhist=c(0,h$density,0)
xfit=seq(min(X),max(X) ,length=85)
yfit=dnorm(xfit,5,1.8)
plot(xhist,yhist,type="s",ylim=c(0,max(yhist,yfit)))
lines(xfit,yfit,col="red")
4
0.20
0.15
yhist
0.10
0.05
0.00
0 2 4 6 8 10
xhist
´
1.4 Estatistica
~o: Seja , , . . . , uma a.a. de uma v.a. , e sejam , , . . . , os
Definiça
valores tomados pela amostra.
Definimos ESTATISTICA ´ ¸~ ( , , . . . , ), que tome o valor
à uma funcao
( , , . . . , ).
´
Obs: 1) Uma Estatistica ¸~ de valor numerico
e´ uma funcao ´ ¸~ amostrais.
das observacoes
Qualquer função da amostra que não depende de parâmetros desconhecidos é uma
estatística.
5
´
2) Os valores de uma estatistica possuem uma variabilidade, pois dependem da
´
amostra, portanto a estatistica e´ uma v.a..
´
As seguintes estatisticas ~ de grande interesse:
sao
_
1
´
i) Media Amostral
n _
Xi - X
^
ii) Variancia Amostral S = i=1
n-1
´
iii) Minimo da Amostra ´ (X , . . ., Xn )
K = min
´
iv) Maximo da Amostra ´ (X , . . ., Xn )
M = max
n _ _
(i )(i )
i=1
v) Correlação Amostral n _ n _
(i ) (i )
i=1 i=1
~o: A distribuicao
Definiça ¸~ de probabilidade de uma estatistica
´ e´ chamada sua
~
DISTRIBUICAO¸ AMOSTRAL.
6
1.5.1 Média Amostral
´
ii) Pelo fato das variaveis serem independentes, vem
Calculando a media ^
´ populacional e a variancia populacional, encontraremos:
_ 5 _ _ _
E(X ) = Xi .P(Xi =x) = 4x 19 + 6.25x 29 + 9x 39 + 12.25x 29 + 16x 19 = 84
9 = 9.33
i=1
_ _ _
var(X) = E(X ) - E(X) = 9.333 - 9 = 0.3333
7
_ _
Portanto, E(X) = e var(X) = n ,
_
Ja´ determinamos a media
´ ^
e a variancia ~ de X. Para obtermos as
da distribuicao
¸
_
demais propriedades de X, bastaria agora determinar qual a forma da curva referente à
_ _
¸~ de X , ou seja qual o modelo probabilistico
distribuicao ´ de X.
¸~ Normal, a
Para amostras casuais simples X , . . . , Xn , retiradas de uma populacao
_
¸~ amostral da media
distribuicao ´ X sera´ Normal.
_
´
prova: Com o proposito ¸~ densidade de X, considere sua funcao
de encontrar a funcao ¸~
´
geratriz de momentos. Dai,
_
MX_ (t) = Eet.X = Eet.(X +X + . . . +Xn )/n = Eet.X /n . Eet.X /n . . . Eet.Xn /n =
= Eet.Xi/n = MXi (t/n). Ou seja,
MX_ (t) = MXi (t/n).
8
Exemplo: Numa urna tem-se 5 tiras de papel numeradas 1, 3, 5, 5, e 7.
¸~
Seja a v.a. X = valor assumido pelo elemento na populacao.
¸~ de X e´ dada por
A distribuicao
--------------------------------------------------------
x 1 3 5 7
--------- ----------------------------------------------
p(X=x) 1/5 1/5 2/5 1/5
--------------------------------------------------------
Uma tira de papel e´ sorteada e recolocada na urna; entao ~ uma segunda tira e´
sorteada.
Sejam X e X , respectivamente, o primeiro e o segundo números sorteados.
_
´
Tabela: Possiveis valores de X.
(X , X ) (1,1) (1,3) (1,5) (1,5) (1,7) (3,1) (3,3) (3,5) (3,5) (3,7) (5,1) (5,3)
-----------------------------------------------------------------------------------------------------
_
X= X +X
2
1 2 3 3 4 2 3 4 4 5 3 4
(5,5) (5,5) (5,7) (5,1) (5,3) (5,5) (5,5) (5,7) (7,1) (7,3) (7,5) (7,5) (7,7)
--------------------------------------------------------------------------------------------------
5 5 6 3 4 5 5 6 4 5 6 6 7
_
¸~ amostral de X p/ n=2 e´ dada por,
Assim, a distribuicao
_
x_ _ 1 2 3 4 5 6 7
P{X = x} 1/25 2/25 5/25 6/25 6/25 4/25 1/25
9
Exemplo: Digamos que a v.a. X represente o peso real de pacotes de cafe, ´ enchidos
¸~ Normal N(500, 81). Sorteamos 9 pacotes
automaticamente. Sabe-se que X tem distribuicao
e medimos seus pesos. Assim, se a maquina ´ estiver regulada, a probabilidade de
´ de 9 pacotes diferindo de 500 com menos de 6 gramas sera?
encontrarmos a media ´
_ _ _
500 X 500 506 500
Sol: P X - 500 6 P{494 X 506} P 4949/3 9/3 9/3
~ 95%
P{ 2 Z 2} =
~ uma media
Ou seja, dificilmente 9 pacotes terao ´ fora do intervalo [498, 502]. Caso
9 pacotes apresentem uma media ´ fora desse intervalo, sera´ razoavel
´ desconfiar que a
´
maquina esteja desregulada.
´
Como a maioria das variaveis ¸~ que nao
de interesse possuem distribuicoes ~ sao
~ nem
mesmo aproximadamente normais, e´ importante sabermos se as propriedades anteriores de
_
~ aproximadamente satisfeitas quando a amostragem e´ realizada a partir de uma
X sao
¸~ nao-normal.
distribuicao ~
10
Teorema: Se X , . . . , Xn é uma amostra aleatória de () , com fdp dada por
_
~ ( , ).
() I (, entao
_
Sol: No caso presente, poderemos realmente obter a distribuição exata de Pelo Teorema
acima
99! (0,001) 99 0,001
_
onde é a fdp de 1 . . . . Daí, a fdp de será dada por
_ _ _
99 0,01
99! (0,01) .
_
Portanto, tem uma distribuição gama com parâmetros 0,1 e 100. Logo,
_ 1100 _ _
950 1.100 950 ......
quando e´ grande.
11
NOTA: Independente de a distribuicao¸~ populacional ser continua,
´ ´
discreta, simetrica ou
´
assimetrica, ^
o TLC estabelece que se a variancia ~ a distribuicao
populacional e´ finita, entao, ¸~
_
´ amostral X e´ aproximadamente Normal se o tamanho da amostra for grande.
da media
^
A rapidez dessa convergencia ¸~ da populacao
depende da distribuicao ¸~ da qual a
¸~ original e´ proxima
amostra e´ retirada. Se a populacao ´ ^
da Normal, sua convergencia e´
´
rapida; ~
´ se a distribuicao
ja, ~ ^
¸ tem a forma de um V, essa convergencia e´ mais
¸ da populacao
demorada.
12
Para introduzirmos os conceitos, neste curso, assumiremos que para amostras com
mais de 30 elementos a aproximacao ¸~ por uma uma distribuição Normal ja´ pode ser
´
considerada muito boa. Na pratica, ´
isto precisa ser checado antes de qualquer analise
apresentada.
_
Sol: i) Com = 82 e _ = 144 _e como n = 64 e´ grande, o TLC estabelece que X a~
N(, ). Portanto, Z = X = X1.5
82 a ´
~ N(0, 1). Dai,
n
_ _
P{80.8 X 83.2} P 80.81.5 82 X 82
1.5 83.2 82
1.5 P{-0.8 Z 0.8}
0.7881 0.2119 0.5762
12
ii) Com n = 100, temos n = 100 = 1.2. Portanto
_ _
P{80.8 X 83.2} = P 80.81.2 82 X 82
1.2 83.2 82
1.2 = P{-1 Z 1
= 0.8413 -0.1587 = 06826.
13
1.5.2 Variância Amostral
Teorema: Suponhamos que (X , . . . , Xn ) constitua uma amostra casual simples de uma
¸~ Normal com media
populacao ^
´ e variancia .
Seja
n _
(Xi X)
S = i=1
n1
^
a Variancia ~
Amostral. Entao:
i) E(S ) = ;
_
~ v.a's. independentes;
ii) X e S sao
(n 1).S
´
iii) a estatistica ¸~ Qui-Quadrado com n 1 graus de
tem uma distribuicao
liberdade.
prova: i) Escrevamos:
n _ n _ n _ _
(Xi X) = (Xi + X) = (Xi ) + 2.( X)(Xi ) + ( X) =
i=1 i=1 i=1
n _ n _
(Xi ) + 2.( X).(Xi ) + n.( X) =
i=1 i=1
n _ _ n _
= (Xi ) 2.n.( X) + n.( X) = (Xi ) n.(X ) .
i=1 i=1
n _
(Xi X)
Portanto, E(S ) = E i=1
n1 =
1
n 1 .n.
n. n =
´
NOTA: Se tivessemos ^
dividido por n em vez de faze-lo por (n 1) ao definir S , a
~ ´
propriedade acima nao seria valida.
Xi
¸~ (n) , pois cada
tem distribuicao ¸~ N(0 , 1). Agora,
tem distribuicao
n n _ _ n _ _ _ _
(Xi ) = (Xi X + X ) = (Xi X) + 2(Xi X)(X ) + (X ) =
i=1 i=1 i=1
n _ _ n _ _
= (Xi X) + 2.(X ). (Xi X) + n.(X ) ,
i=1 i=1
n _ n _ n n _ _
e do fato de (Xi X) = Xi n.X = 0 , vem (Xi ) = (Xi X) + n.(X
i=1 i=1 i=1 i=1
) .
14
Dividindo ambos os membros por , e reescrevendo convenientemente, teremos:
n n _ _
Xi = Xi X + X
. (*)
/ n
i=1 i=1
(n 1).S (n 1)
n _ n _
1 Xi X
= . n1 . (Xi X) =
i=1 i=1
¸~ (n - 1).
tem distribuicao
2
Corolário: var(S ) = n-1 .
~ var(X) = 2..
prova: Vimos que se X ~ () entao
Do ´item iii) do Teorema acima, tem-se (n 1).S
~ (n - 1)
´
Dai,
var (n 1).S
= 2.(n 1)
n 1 .var(S ) = 2.(n 1)
2
Logo, var(S ) = n-1 .
15
_
^
A inferencia ´ amostral X vista anteriormente dependeu inteiramente do
sobre a media
^
fato de que a variancia populacional era conhecida.
Quando nao ~ se conhecer , uma situacao¸~_ muito comum na pratica,
´ ~ sera´
nao
´ calcular a variancia
possivel ^ ´ amostral, var(X) = n .
da media
~ necessario
Sera´ entao ¸~ exata da media,
´ obter uma distribuicao ´ ~ envolve o
a qual nao
^
parametro .
~ da
prova: Inicialmente dividamos numerador e denominador pelo desvio-padrao
¸~ e teremos
populacao, _
X/n / S .
_
X
O numerador Z = ¸~ N(0 , 1), como ja´ foi visto.
.n tem distribuicao
O quadrado do denominador pode ser escrito como
(n 1).S Y
/(n 1) = n1 ,
onde Y = (n 1).S
´
. Mas como foi visto, se os Xi forem normalmente distribuidos, Y tem
~
¸ (n - 1).
distribuicao
_
~ independentes, pois X e S sao
Observe que Z e Y sao ~ independentes.
_
X
Logo, por teorema T= S t(n - 1).
n
_
X-
Z= S ~ N(0, 1) quando n e´ grande
n
16
Teorema: Se e são amostras aleatórias independentes obtidas das
distribuições e , respectivamente, então:
_ _
Y
~
Em particular, se , então
_ _
Y
~
Teorema: Seja 1 , . . ., uma a.a. de tamanho de uma distribuição .
Seja uma a.a. de tamanho de uma distribuição .
Se as duas amostras são independentes, então:
_ _
onde
e
Se, em particular, então ~ .
17
Teorema: Seja uma variável aleatória continua com fdp e fd . Seja 1 , . . ., uma
amostra aleatória de e sejam e o mínimo e o máximo da amostra, respectivamente.
Então,
(a) A fdp de será dada por () [ ()] ().
(b) A fdp de será dada por ( ) [1 ( )] ( ).
(b) Qual é a probabilidade de que a menor duração até falhar seja menor do que 10
horas? Exigiremos que 10 10.
18
Ora, o mínimo da amostra será maior do ou igual que 10, se, e somente se, todo
valor amostral for maior do ou igual que 10. Portanto,
0 1 [ (0)]100 .
Tabela:
---------------------------------------------------------------------------------
X(velocidade, km/seg) 11,93 11,81 11,48 10,49 10,13 8,87
---------------------------------------------------------------------------------
Y(alt.itude, km) 62,56 57,78 53,10 48,61 44,38 40,57
---------------------------------------------------------------------------------
19
^
1.5.5 Inferencia ¸~ amostral p^
sobre a proporcao
´
1 se o individuo ´
tem a dada caracteristica
X=
´
0 se o individuo ~ tem a dada caracteristica
nao ´
¸~ dessa
Retirada uma amostra casual simples (X , . . . , Xn ), com reposicao,
¸~ e se indicarmos por Sn o total de unidades que possuem a dada caracteristica
populacao, ´ na
amostra, ou seja
n
Sn = Xi
i=1
~
entao Sn ~ b(n , p)
Propriedades de p^:
^ =p ^ = p.(1 p)
i) E(p) e var(p) n
20
^ = n^ .pn.p^ .(1 p)n.(1-p)
f(p) ^
, ^p = 0 , 1
, 2
, . . . .1
np n n
¸~ Amostral de Sn e ^p para n = 3 e p = 1
Figura: Distribuicao 2
_
¸~ amostral ^p e´ um caso especial da media
iii) A proporcao ´ amostral X.
^ = E Sn = E(Sn ) n.p
prova: i) E(p) n n = n = p
_
Sn X + X + . . . + Xn
iii) ^p = n = n =X
¸~ amostral de
TEOREMA: Para n suficientemente grande, podemos considerar a distribuicao
^p do seguinte modo:
^p ~ N p , p.(1 - p) , quando n +
n
^p - p
´
i.e, a~ N(0, 1)
p(1-p)
n
_
Podemos escrever Sn = n.X ,
_
¸~ aproximadamente normal, com
mas pelo Teorema do Limite Central, X tera´ distribuicao
^ p.(1 p)
´ p e variancia
media n ,
_
X ~ Np , p.(1n p)
21
¸~ aproximada
Logo, a transformada Sn tera´ a distribuicao
_
Observe que X, na propriedade (iii), e´ a propria ´ ´
variavel ^p; assim, para n
¸~ amostral de ^p do seguinte modo:
suficientemente grande, podemos considerar a distribuicao
p^ ~ Np , p.(1 p) . n
#
2) Para uma boa aproximacao ¸~ a normalidade usar uma correcao¸~ de continuidade
¸~ binomial.
(somar e subtrair 21 para cada valor de uma v.a. p com distribuicao
^
^ 0.03} = P p - 0.02 0.03 - 0.02
Portanto, P{3% ou mais} = P{p 0.007 0.007 .
^
P p0.007
- 0.02
0.03 - 0.02
0.007 = P{Z 1.428} = 0.5 - 0.4236 = 0.0764.
22
Outra consideração em favor da distribuição normal é o fato que distribuições
amostrais baseadas numa distribuição aparentemente normal são facilmente manipuladas
analiticamente.
Assim, o problema matemático de obter distribuições para as várias funções da
amostra é freqüentemente mais fácil para amostras de uma população normal que de
qualquer outra, e esta seção será dedicada ao problema de se obter as distribuições de
várias funções diferentes de uma amostra aleatória de uma população normalmente
distribuída. Para aplicar os métodos estatísticos baseados na distribuição normal, o
pesquisador tem que saber, pelo menos aproximadamente, a forma geral da função de
distribuição que os seus dados seguem. Se for normal, pode usar os métodos diretamente;
se não for, pode, às vezes, transformar os dados de modo que as observações transformadas
sigam uma distribuição normal. Quando o pesquisador não sabe a forma da distribuição de
sua população, então ele pode usar outros métodos mais gerais mas normalmente menos
poderosos de análise chamados métodos de não-paramétricos.
^
1.7 Inferencia ´
Estatistica
´
Na disciplina Estatistica Descritiva, vimos como resumir descritivamente um conjunto
o
de dados e no 1- semestre de Probabilidade e Estatística vê-se como construir modelos
´
probabilisticos ^
para descrever alguns fenomenos.
^
O estudo da Inferencia ´
Estatistica ´
tem como objetivo estudar os metodos que permitam
~ ^
tirar conclusoes sobre os parametros ~
desconhecidos da populacao ´
¸ a partir da analise dos dados
amostrais.
^
As inferencias ~ baseadas em informacoes
de interesse sao ¸~ ou quantidades obtidas de uma
¸~
amostra selecionada da populacao.
^
Tais inferencias podem ser de dois tipos:
~ ^
I) ESTIMACAO¸ : quando usamos os dados amostrais para produzir estimativas do parametro
populacional.
¸~ dos parametros
A estimacao ^ pode ser feita de duas maneiras:
~
a) ESTIMACAO¸ PONTUAL
_
^
Exemplo: X e´ um estimador pontual do parametro populacional .
23
~
b) ESTIMACAO
¸ POR INTERVALO
¸~ Normal, i.e,
Exemplo: Se tem uma distribuicao ´
f( ; , ) = 1
2 exp 12 ,
^
onde o parametro = ( , ) e´ desconhecido.
i) se e´ desejavel
´ estimar a media ~
´ = , entao
n
_ Xi
´
a estatistica ( ) = X = i=1 ´ estimador de .
e´ um possivel
~ n
_ _
ii) e (X 1.96S /n ; X 1.96S /n ) e´ um possivel
´ estimador intervalar de .
´
Quanto aos testes de hipoteses eles podem ser de dois tipos:
´
a) PARAMETRICOS ´
: quando formulamos hipoteses com respeito ao valor de um
^
parametro populacional.
´ o 1,65.
´ populacional da altura dos brasileiros e´ 1,65 m, i.e.,
Exemplo: 1) a media
~ ´ #
b) NAO-PARAMETRICOS ´
: quando formulamos hipoteses com respeito a natureza
¸~ da populacao,
da distribuicao ¸~ independencia
^ ´
de amostras, variaveis qualitativas.
¸~ da populacao
Exemplo: o : A distribuicao ¸~ e´ N 1 , 0.2 .
24
Capítulo 2
Estimação Pontual
21 Introdução
^
Exemplo: 3) Seja onde o parametro e´ desconhecido Se e´ desejavel
´ estimar
´
a media, ´ , então ()
i.e,
25
Exemplo: 4) Weibull, e função de confiabilidade () ,
para fixo, então (~) .
^
NOTAÇÃO: O estimador (
~ ) de é usualmente denotado por
_
Portanto X é um estimador não-viciado para .
n _
^
1 (Xi X) ,
n
i=1
(n1)
^ )
verifica-se que este estimador tem um valor esperado E( n . De fato,
n _ n _ _
^ ) = E 1 (Xi X) 1 E (Xi X) n(X ) =
E( n n
i=1 i=1
n _ _
1
n E(Xi X) E(X ) .
i=1
_ _
Lembrando que = E(Xi ) e var(X) = E(X ) , temos
26
_
^ ) = 1 n var(X) =
E( (n1)
n n = n .
^ é viciado para , mas é assintóticamente não viciado, ou seja, à
Portanto
medida que o tamanho da amostra aumenta, o vício diminui.
27
e que
^]
[ 2
.
(^) (^ )
Exemplo: Sejam ^ , ^ , ^ e ^ estimadores de , cuja f.d.p. esta´ esbocada
¸ na figura
abaixo.
´
Presumivelmente prefeririamos ^ a ^ . Ambos estimadores sao
~ nao
~ viciados e
var(^ ) var(^ ).
28
No caso dos estimadores ^ e ^ , a decisão não é tão evidente (Fig. 14.2), porque ^3
é não-viciado, enquanto ^4 não o é. Todavia, (^ ) (^ ). Isso significa que,
enquanto em média ^ será próximo de , sua grande variância revela que desvios
consideráveis em relação a não serão de surpreender. ^ por sua vez, tende a ser um tanto
maior do que , em média, e no entanto, poderá ser mais próximo de do que ^ (veja a
Figura acima).
_
^ X X X
e ^ X 4 X2 4 X3 .
Como ^ e ^2 são ambos não viciados, segue que ^ é melhor que ^2 , pois
[^ ] [ ^ ], para todo .
Exemplo: Outro interessante exemplo é dado no livro do Meyer (Exemplo 14.2 pg 336).
29
1-a Lista de Exercicios
´ ´
de Probabilidade e Estatistica
2) Sabe-se que 20% das pecas ¸ de um lote sao ~ defeituosas. Sorteiam-se 8 pecas,¸ com
¸~ e calcula-se a proporcao
reposicao, ¸~ ^p de pecas
¸ defeituosas na amostra.
~
¸ exata de ^p (use a tabua
a) Construa a distribuicao ´ ¸~ binomial)
da distribuicao
#
b) Construa a aproximacao¸~ normal a binomial
¸~ e´ uma boa aproximacao
c) Voce^ acha que a segunda distribuicao ¸~ da primeira?
#
d) Ja´ sabemos que, para dado p fixo, a aproximacao ¸~ melhora a medida que n
¸~ e´ melhor?
aumenta. Agora, se n e´ fixo, para qual valor de p a aproximacao
´
3) Uma amostra simples ao acaso de 30 domicilios foi selecionada em uma zona urbana que
contem ´
´ 15000 domicilios. ´
O número de pessoas de cada um dos domicilios que integram a
amostra e´ o seguinte:
5 6 3 3 2 3 3 3 4 4 3 2 7 4 3
5 4 4 3 3 4 3 3 1 2 4 3 4 2 4
Estimar o número total de pessoas que vivem nesta zona.
_
´ e = X como sendo o erro amostral da media.
4) Definimos a variavel ´ Suponha que a
^
variancia ´
dos salarios ~
de uma certa regiao seja 400 unidades ao quadrado.
a) Determine E(e) e var(e)
¸~ das amostras de tamanho 25 terao
b) Que proporcao ~ erro amostral absoluto maior
do que 2 unidades?
¸~ das amostras de tamanho 100?
c) E que proporcao
d) Neste último caso, qual o valor de d, tal que Pe d = 1%?
e) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos
sejam inferiores a uma unidade?
~ de 60 horas.
´ de determinado ser vivo e´ de 2000 horas, com desvio-padrao
5) A vida media
´ de 10 desses seres vivos, determine a probabilidade de o
Escolhida uma amostra aleatoria
~ amostral nao
desvio-padrao ~ exceder 50 horas.
30
¸~ Normal, com media
6) Uma v.a. X tem distribuicao ~ 10.
´ 100 e desvio-padrao
a) Qual a P{90 X 110} ?
_
b) se X e´ a media
_
´ ¸~
de uma amostra de 16 elementos retirados dessa populacao,
calcule P{90 X 110}.
_
´
c) Desenhe, num grafico, ¸~ de X e X.
as distribuicoes
_
d) Que tamanho deveria ter a amostra para que P{90 X 110} = 95% ?
´
7) A maquina de empacotar um determinado produto o faz segundo uma distribuicao ¸~
´ e desvio-padrao
normal, com media ~ 10g.
a) Em quanto deve ser regulado o peso medio´ para que apenas 10% dos pacotes
tenham menos do que 500g?
´
b) Com a maquina assim regulada, qual a probabilidade de que o peso total de 4
pacotes escolhidos ao acaso seja inferior a 2 kg?
11) Em um parque existe uma populacao ¸~ muito grande de esquilos. Em uma amostra
´
aleatoria, ~ infetados com o bacilo da peste. De que
40 destes esquilos achou-se que estao
¸~ com um erro nao
tamanho deveria ser tomada a amostra para estimar a dita proporcao ~
maior de 5%, com uma probabilidade de acerto de 99%?
31
Capítulo 3
Intervalos de Confiança
¸~
3.1 Introducao
32
¸~ do IC
3.2 Interpretacao
¸~ do experimento com fixado, por exemplo, =
´ de repeticoes
Imaginemos uma serie
0 . Alem
´ disso, imaginemos que um intervalo de confianca ¸ (A , B) com coeficiente de
¸ seja calculado atraves
confianca ´ dos dados do mesmo modo para cada repeticao.¸~
¸~ do
Devido à variabilidade dos dados, o intervalo (A , B) variaria em cada repeticao
experimento.
¸~ do que seja um intervalo de confianca
A interpretacao ¸ para com coeficiente de
¸ e a seguinte:
confianca ´
- construindo 100 intervalos, correspondentes a 100 amostras de tamanho n, deles
~ o valor 0 .
conterao
´
Graficamente, teriamos ¸~ da figura a seguir.
a situacao
´
Um IC 95% incluiria o verdadeiro valor parametrico ¸~ do
0 em 95% das repeticoes
experimento com fixado.
33
NOTA: 1) Exceto em casos especiais, nao ~ e´ correto concluir que um particular intervalo de
confianca¸ 95% (A0 , B0 ) tenha uma probabilidade de 95% de conter o verdadeiro valor 0
^
do parametro. Pode acontecer que (A0 , B0 ) contenha todos os possiveis ´ valores de com
~
probabilidade 100% ou nao contenha nenhum. O coeficiente de confianca ¸ 95% e´ uma media
´
´
teorica ^
figurada que refere-se a uma sequencia imaginaria ¸~
´ de repeticoes do experimento.
Logo, poderemos dizer que em 95% das vezes, o intervalo contem ´ o verdadeiro
~
valor de . Isto nao e´ o mesmo que afirmar que 95% e´ a probabilidade do parametro ^ cair
^
dentro do intervalo, o que constituira´ um erro, pois e´ um parametro ~
( nao e´ uma variavel
´
´
aleatoria) ~
e ele esta´ ou nao no intervalo.
´
2) Na pratica, tem-se um particular conjunto de dados observados e desejamos obter
¸~
informacao sobre o valor de . Se os intervalos de confianca ~ suficientes numa pesquisa,
¸ sao
´
eles devem ser construidos de modo que um único intervalo observado (A0 , B0 )
¸~
proporcione informacoes. Valores dentro do intervalo seriam de algum modo melhores
estimadores de do que valores fora do intervalo.
¸~ Normal
´ de uma populacao
Teorema: Seja (X , X , . . . , Xn ) uma amostra aleatoria N( ,
) com conhecido.
~
Entao,
_ _
X n .z 2 , X + n .z 2
~
prova: Suponhamos que (A , B) seja o intervalo procurado, entao:
P{A B} = 1 -
_
X ´
Sabemos que Z = ~ N(0 , 1). Dai,
n
_ _ _
XB X XA
P =1
n n n
34
Pela tabela da Normal, temos P z 2 Z z 2 = 1 onde Z ~ N(0 ,
1).
_ _
XB
Logo, = z 2 B = X + n .z 2
n
_ _
XA
= z 2 A= X n .z 2
n
_ _
Portanto, X n .z 2
,X+ n .z 2
e´ um IC 100.(1 )% para , supondo
conhecido.
´
Exemplo: Uma maquina ^
enche pacotes de cafe´ com uma variancia igual a 100 g . Ela
^
estava regulada para enche-los ´
com 500 g, em media. Agora ela se desregulou, e queremos
´ . Uma amostra de 25 pacotes apresentou uma media
saber qual a nova media ´ igual a 485
g. Construir um intervalo 95% de confianca
¸ para .
_
Sol: = 100 n = 25 30 e X = 485
_
10
A=X n .z 2
= 485 25 .1.96 = 481
_
10
B=X+ n .z 2
= 485 + 25 .1.96 = 489
35
#
Exercício: Obter um IC 100.(1 )% unicaudal a direita para , supondo conhecido.
~
Sol: Suponhamos que (A, +) seja o intervalo procurado, entao:
P{A } = 1
_
X ´
Sabemos que Z = ~ N(0 , 1). Dai,
n
_ _
X X A
P =1-
n n
_
Portanto, X n .z , + e´ um IC 100.(1 )% unicaudal para ,
supondo conhecido.
¸~ Normal N( ,
´ de uma populacao
Teorema: Seja (X , X , . . . , Xn ) uma amostra aleatoria
) com desconhecio.
~
Entao,
_ _
X S n .t 2 , X + S n .t 2
´
procedemos de forma analoga ao caso anterior.
36
foi extraida
_ ¸~ Normal. Construir um IC 95% para .
´ de uma populacao
Sol: X = 8.7 e S = 4.0 S = 2
g.l. = n 1 = 9
_
S
A=X n .t 2
= 7.27
_
S
B=X+ n .t 2
= 10.13
´ :
Construa um IC 95% para a media a) com conhecido;
b) supondo desconhecido.
¸~ Normal,
NOTA: Pelo Teorema do Limite Central, independente de X ter distribuicao
temos _
Z = X a~ N(0 , 1) para n grande.
n
¸~ de X, um intervalo de confianca
Assim, qualquer que seja a distribuicao ¸ 100.(1
)% para , considerando-se amostras grandes e´ dado por:
i) se e´ conhecido
_ _
X n .z 2
,X+ n .z 2
ii) se e´ desconhecido
_ _
S S
X n .z 2
,X+ n .z 2
37
n _
(Xi X)
onde S = i=1
n 1 .
_
´ A= X
Dai, S
n .z 2 = 499.02
e _
S
B= X+ n .z 2
= 500.98
´ extraida
Teorema: Seja (X , X , . . . , Xn ) uma amostra aleatoria ¸~ com
´ de uma populacao
¸~ Normal N(, ), onde e´ desconhecido. Entao
distribuicao ~
(n 1).S
(n 1).S
, 1-
2 2
e´ um IC 100.(1 )% para .
~
prova: Suponhamos que (A , B) seja o IC 100.(1 )% para . Entao,
P{A B} = 1
n _
(Xi X)
(n 1).S ~
Sabemos que ~ (n-) , onde S = i=1
n1 , entao:
(n 1).S (n 1).S
P (n B1).S A =1
38
P{1- } = 1 onde ~ (n-1)
2 2
(n 1).S (n 1).S
Logo, B = 1- B= 1-
2
2
e
(n 1).S (n 1).S
= A A=
2
2
(n 1).S
Portanto, (n 1).S
, 1- e´ um IC 100.(1 )% para .
2 2
9 8 12 7 9 6 11 6 10 9
~ A= (n 1).S (n 1).S
Entao: = 2.13 e B= 1- = 10.81
2 2
39
3.5 Intervalo de Confianca ~
¸ para o desvio-padrao
A partir do IC 100.(1 )% para a variancia ^ , podemos obter o IC para o
~ , bastando para isto extrair a raiz quadrada do intervalo para a variancia,
desvio-padrao ^
obtendo dessa maneira aproximadamente um intervalo para . Assim,
n1
S. , S. n
1
2 1- 2
^ ^ ^ ^
p^ z 2 . p.(1n p) , p^ + z 2 . p.(1n p)
~
prova; Suponhamos que seja (A , B) o intervalo procurado, entao:
P{A p B} = 1
p^ p
Sabemos que Z = ~ N(0 , 1) , considerando-se n grande e n.p 5 e n.(1
p.(1n p)
´
p) 5. Dai,
^p B ^p p p^ A
P =1
p.(1n p) p.(1n p) p.(1n p)
^p B ^p p p^ A
P =1
^p.(1 ^p) ^p.(1 ^p) ^p.(1 ^p)
n n n
40
^p B ^ ^
Logo, = z 2 B = p^ + z 2 . p.(1n p)
^p.(1 ^p)
n
e
^p A ^ ^
= z 2 A = ^p z 2 . p.(1n p)
^p.(1 ^p)
n
^ ^ ^ ^
Portanto, ^p z 2 . p.(1n p) , ^p + z 2 . p.(1n p) e´ um IC 100.(1
)% , bicaudal, para p.
^
Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferencias eleitorais, 260
´
mostraram-se favoraveis ao candidato Y. Calcular um intervalo de confianca ´
¸ ao nivel de
´
90% para a porcentagem dos eleitores favoraveis a Y.
^p = x
= 260
= 0.52
n 500
^ p) ^ ^ ^
p^ - z 2 . p.(1
n , p^ + z 2 . p.(1n p) .
0.52.(10.52) 0.52)
tem-se 0.52 1.64. 500 , 0.52 + 1.64. 0.52.(1
500 .
41
´
2a. Lista de Probabilidade e Estatistica
´
1) De 50.000 valvulas fabricadas por uma companhia retira-se uma amostra de 400
´
valvulas, ´
e obtem-se ~ de 100 horas.
´ de 800 horas e o desvio-padrao
a vida media
a) Qual o intervalo de confianca
¸ de 99% para a vida media ¸~
´ da populacao?
b) Com que confianca ´ e´ 800 0,98?
¸ dir-se ia que a vida media
c) Que tamanho deve ter a amostra para que seja de 95% a confianca
¸ na estimativa
800 7,84?
4) Numa linha de producao, ¸~ e´ muito importante que o tempo gasto numa determinada
¸~ nao
operacao ~ varie muito de empregado para empregado.
^
a) Que parametro ´
estatistico ^
poderia ser usado para avaliar esse fato? Por que?
b) Se 11 empregados apresentam os tempos abaixo para realizar essa operacao, ¸~ qual
^
seria a estimativa para o parametro acima?
125 135 115 120 150 130 125 145 125 140 130
c) Determine um intervalo de confianca ^
¸ 90% para o parametro.
42
6) Suponha que X tenha uma distribuicao ¸~ uniforme no intervalo (0 , ), onde e´
desconhecido. Uma amostra de n observacoes ¸~ e´ escolhida. Suponha que n seja
suficientemente grande para _que o Teorema do Limite Central se aplique e se possa
¸~ de X por uma Normal N( , /n). Obtenha um intervalo de
aproximar a distribuicao
¸ para , com coeficiente de confianca
confianca ¸ 90%.
43
Capítulo 4
Testes de hipóteses
¸~
4.1 Introducao
´
Testes de Hipoteses ~ procedimentos estatisticos
sao ´ que nos permitem aceitar ou
´
rejeitar uma hipotese H0 com base nos dados amostrais.
´
Em testes estatisticos, ´ matematica
copiamos a estrategia ´ ¸~
de provar por contradicao.
Comecando
¸ com uma hipotese ´ H0 que se quer rejeitar, supomos que H0 e´ verdadeira e
desenvolvendo argumentos de forma correta, se chegarmos a uma contradicao, ¸~ entao~ a
´
hipotese H0 deve ser falsa.
´
Em estatistica, ¸~
copiamos este enfoque, mas em vez de atingir uma contradicao,
observamos um resultado improvavel.´
´
O objetivo do teste de hipotese e´ dizer, atraves ´
´ de uma estatistica ^ obtida de uma
´
amostra, se a hipotese ~ aceitavel.
H0 e´ ou nao ´ Operacionalmente, isto e´ conseguido atraves
´
~ critica
de uma regiao ´ ´
RC. Caso o valor da estatistica pertenca ~ rejeitamos H0 ;
¸ a esta regiao,
´
caso contrario, ~ rejeitamos H0 . Esta regiao
nao ´ de modo que P{^ RC | H0 e´
~ e´ construida
verdadeira} seja igual a , um n-o fixado.
´
Os testes de hipoteses podem ser de dois tipos:
´
i) Testes Parametricos
~ ´
ii) Testes Nao-Parametricos ^
: Aderencia, ^
Independencia, Homogeneidade e etc.
´
4.2 Hipotese ´
Nula e Hipotese Alternativa
´
H0 : Hipotese Nula e´ a hipotese
´ a ser testada.
´
H : Hipotese Alternativa.
44
¸~ de H0 implica a aceitacao
A rejeicao ¸~ de H , e a aceitacao
¸~ de H0 implica a rejeicao
¸~
de H .
´
Exemplos: Para o caso dos testes parametricos podemos ter:
#
2) Teste Unicaudal a Direita H0 : = 0.01
H : 0.01
#
3) Teste Unicaudal a Esquerda H0 : p = 0.4
H : p 0.4
´
4.3 Estatistica do Teste
´
A Estatistica ´
do Teste e´ uma estatistica ~
T cujo valor serve para determinar a decisao
a ser tomada.
NOTA: Assim como ocorreu para o desenvolvimento da estimacao ¸~ por intervalo, os testes
´
de hipotese ~ baseados nas distribuicoes
´ sao
tambem ¸~ dos estimadores. _
¸~ de probabilidade da media
Dessa maneira, as distribuicoes ^
´ amostral X; da variancia
¸~ amostral ^p, serao
amostral S ; da proporcao ~ utilizadas para os respectivos testes sobre a
^
´ , a variancia
media ¸~ p.
e a proporcao
45
´
Associado a um teste de hipoteses ´
temos dois erros possiveis:
´
i) Erro Tipo I: a hipotese ~ de que H0
H0 e´ verdadeira mas o teste leva a conclusao
deve ser rejeitada.
# ~ de que H0 nao
~
´
ii) Erro Tipo II: a hipotese H0 e´ falsa mas o teste leva a conclusao
deve ser rejeitada.
Designaremos
= P{cometer erro tipo I} = P{Rejeitar H0 | H0 e´ verdadeira}
e
= P{cometer erro tipo II} = P{Aceitar H0 | H0 e´ falsa}
Exemplo: H0 : = 0
H : 0
~ e´ possivel
NOTA: A probabilidade do erro do tipo II, , na maioria dos casos, nao ´ calcular,
~ especifica uma única possibilidade, mas uma familia
pois usualmente nao ´ de possibilidades
alternativas.
46
~ Critica
4.5 Regiao ´ do Teste
~ Critica
A Regiao ´ ~ de rejeicao
(RC) do Teste e´ a regiao ¸~ da hipotese
´ H0 .
´
4.6 Escolha da Hipotese Nula
´
A teoria Classica ´
do teste de hipotese considera que o erro do tipo I e´ muito mais
grave que o erro tipo II. Ou seja, e´ muito mais grave rejeitar H0 quando ela e´ verdadeira do
que aceita-la ^
´ quando e´ falsa. Isto significa que se deve ter muita evidencia de que H0 e´ falsa
´
antes de rejeita-la.
Consideraremos, portanto, H0 a hipotese´ ¸~ implicaria num erro tipo I
cuja rejeicao
mais grave.
Exemplo: Suponhamos que uma vacina contra uma doenca ¸ vai ser testada em um grupo de
pessoas, enquanto que um grupo de controle recebe apenas soro. Apos ´ algum tempo
verificamos quais pessoas adquiriram a doenca ~
¸ (afetados) e quais nao adquiriram (nao~
afetados), obtendo-se a tabela abaixo:
Afetados ~
Nao-Afetados
---------------------------------------------------------------
Receberam n n
Vacinas
---------------------------------------------------------------
Receberam n n
Soro
---------------------------------------------------------------
47
´
Suponhamos que queremos escolher uma das seguintes hipoteses nulas.
´ a vacina
-Se H0 = H' , o erro tipo I consiste em rejeitar H' sendo ela verdadeira, i.e,
e´ eficiente, mas a consideramos inocua.
´
´ a vacina e´
-Se H0 = H'' , o erro tipo I consiste rejeitar H'' sendo ela verdadeira, i.e,
´
inocua, mas a consideramos eficiente.
´
Tomamos H'' como hipotese nula, pois o erro tipo I decorrente nos parece ser o
mais grave.
~
Seja X: número de respostas certas em 10 questoes
Portanto X ~ b10 , 12 onde X = 0, 1, 2, 3, 4, 5, . . . , 10 .
~ critica
i) Seja RC = {8, 9, 10} a regiao ´ ´
do teste, i.e,
~ corretas, o estudante nao
"Se oito ou mais respostas estao ~ esta´ adivinhando, caso
´ diremos que o estudante esta´ adivinhando."
contrario
48
H0 sera´ rejeitada se X = 8 ou X = 9 ou X = 10.
´
Dai,
= 10 8
8 .0,5 .0,5
10-8
+ 10 9
9 .0,5 .0,5
10-9
+ 10 10
10 .0,5 .0,5
10-10
= 0.054
1
´
Suponhamos, que na realidade, a hipotese testada H0 :p = 2 seja falsa, ou seja que p
= 0.8. Calculemos o valor de .
= 10 0
0 .0,8 .0,8
10-0
+ 10 1
1 .0,8 .0,8
10-1
+ . . . + 10 7
7 .0,8 .0,8
10-7
= 0.322
~
ii) Agora, seja RC = {9, 10}, entao,
= 10 9
7 .0,5 .0,5
10-9
+ 10 10
7 .0,5 .0,5
10-10
= 0.01
= 10 0
0 .0,8 .0,8
10-0
+ 10 1
1 .0,8 .0,8
10-1
+ . . . + 10 8
8 .0,8 .0,8
10-8
= 0.624
~ = ? e = ? (Exercicio)
iii) Agora, seja RC = {7, 8, 9, 10}, entao, ´
~ o seguinte quadro:
Obtemos, entao,
RC
------------------------------------------------------
{7, 8, 9, 10} 0.17 0.121
{8, 9, 10} 0.054 0.322
{9, 10} 0.01 0.624
------------------------------------------------------
49
NOTA: Um teste ideal e´ dado quando e tem os menores valores possiveis. ´
´ para o tamanho da amostra n fixado, vimos no exemplo acima que quanto
Porem,
menor for o valor de , maior sera´ o valor de . Ou seja, nao ~ e´ possivel
´ tomar e que
´
sejam minimos ´
possiveis.
¸~ fixa-se um valor para e toma-se o menor possivel.
Como solucao, ´ A justificativa
de fixar e´ dada pelo fato que, em geral, o erro tipo I e´ mais grave do que o erro tipo II.
¸~ do teste de hipoteses,
Portanto, na construcao ´ procuramos controlar o erro tipo I,
^ ~ critica
fixando-se a sua probabilidade de ocorrencia. Uma vez fixado esse valor, a regiao ´ e´
construida de modo que P{ RC | H0 e´ verdadeira} seja igual ao valor fixado .
´ de Significancia
4.8 Nivel ^ do Teste
~o: A probabilidade de cometer um erro tipo I e´ um valor arbitrario
Definiça ´ e recebe o
´ de Significancia
nome de Nivel ^ do teste.
O resultado da amostra e´ cada vez mais significante para rejeitar H0 quanto menor
´ .
for esse nivel
~ de aceitacao
De modo geral, a regiao ¸~ de um teste de hipoteses
´ H0 : = 0 vs H :
´
0 , com nivel ^
de significancia , corresponde a um intervalo de confianca¸ bicaudal
100.(1 )% para .
´
Na pratica, ´ de significancia
costuma-se adotar um nivel ^ de 0,05 ou 0,01.
´
4.9 Procedimentos para se efetuar um Teste de Hipoteses
50
~ de rejeicao
6- Verificar se o valor calculado em 4) esta´ incluido na regiao ¸~ ou nao,
~ e
¸~ ou rejeicao
concluir pela aceitacao ¸~ de H0 .
´
Procuraremos, sempre que fizermos teste de hipoteses, distinguir bem estes passos.
¸~ Normal
Exemplo: Consideremos uma amostra de 16 elementos retirada de uma populacao
N(, ), onde = 16, dada por
20 18 19 17 24 18 17 26 21 17 19 3 21 20 21 21
´ de significancia
Desejamos testar H0 : = 20 com nivel ^ = 5%.
H : 20
Como H indica que a media´ populacional deve ser maior do que 20, teremos um
# #
¸~
teste unicaudal a direita, concentrando-se o risco na cauda a direita da distribuicao.
Assim:
_
Determinemos o valor de xc da seguinte forma,
_ _ _ _ _ _
X - 20 xc - 20 xc - 20
P{X xc } = 0.05 P 4 4 = 0.05 4 = 1.64 xc =
16 16 16
21.64
~ para aceitacao
Logo, a regra de decisao ¸~ ou rejeicao
¸~ de H0 : = 20, para = 0.05
´
sera:
_
~ Critica
Regiao ´ (RC): Rejeita-se H0 quando X 21,64
_
~ de Aceitacao
Regiao ¸~ (RA): Aceita-se H0 quando X 21,64
_
~ O valor observado da estatistica
Conclusao: ´ e´ X = 18.88, i.e,
´ a media
´ obtida da
_
amostra. Como X = 18.88 xc = 21,64 aceitamos H0 .
51
NOTA: 1) A critica ´ ´
a este procedimento e´ que, em muitos casos, a escolha do nivel de
^
significancia e´ completamente arbitraria.
´
´ disso, nos casos em que a distribuicao
Alem ¸~ sob H0 e´ discreta, o nivel
´ de
^
significancia escolhido pode nem mesmo ser atingido.
Exemplo: Um praticante de tiro ao alvo vai comprar um lote muito grande de municao ¸~ e o
´
vendedor garante que a porcentagem de projeteis em bom estado e´ 90%.
^
No entanto, o comprador decide fazer uma experiencia para testar a veracidade da
¸~ do vendedor. Ele escolhe 10 projeteis
afirmacao ´ ~ bons.
e vai verificar quantos sao
~ comprar o lote se X = número de bons na amostra for muito
Ele decide nao
pequeno.
~
Portanto, se RC = {0, 1, 2, 3, 4, 5} entao
= P{Rej. H0 | H0 verd.} = P{X=0 ou X=1 ou X=2 . . . ou X=5 | p = 0.9} = 0.001,
~
Se RC = {0, 1, 2, 3, 4, 5, 6} entao
= P{Rej. H0 | H0 verd.} = P{X=0 ou X=1 ou X=2 . . . ou X=6 | p=0.9} = 0.012,
~
Se RC = {0, 1, 2, 3, 4, 5, 6, 7} entao
= P{Rej. H0 | H0 verd.} = P{X=0 ou X=1 ou X=2 . . . ou X=7 | p = 0.9} = 0.069,
´
Logo, se tivessimos ~ haveria nenhuma regiao
fixado = 2,5% nao ~ critica
´ RC para
qual = 2,5%.
52
´
2) Um teste de hipotese que empregue apenas o erro , nao ~ pode ser tratado como
´
´ inequivoco.
um teste decisorio ¸~ de H0 pode acarretar erro e, em decorrencia,
A aceitacao ^
~ erroneas.
problemas de decisoes ^
´
Apesar de o teste de hipotese ¸~ generalizado, esta
ser um instrumento de aplicacao
¸~ deve sempre estar presente nas decisoes
restricao ~ efetuadas, quando de sua aplicacao,¸~
¸~ do teste e´ a aceitacao
particularmente quando a indicacao ¸~ de H0 .
53
3-a Lista de Exercicios
´ ´
de Probabilidade e Estatistica
´
b) Num juri, um individuo esta´ sendo julgado por um crime. As hipoteses
´ sujeitas ao juri
~
sao:
- o acusado e´ inocente;
- o acusado e´ culpado.
c) Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele ira´ conduzir
uma pesquisa de laboratorio ¸~ De acordo com o
´ para verificar a veracidade da afirmacao.
¸ ´ ou nao
resultado, ele lancara ~ a vacina no mercado. As hipoteses
´ ~
que pode testar sao:
- a vacina e´ boa;
~ e´ boa.
- a vacina nao
2) Fazendo o teste
H0 : = 155 ( = 20) H : = 145 ( = 12),
~ critica:
e n = 25 , estabeleceu-se a seguinte regiao ´
RC = {y R | y 150}.
a) qual a probabilidade de rejeitar H0 quando verdadeira?
b) qual a probabilidade de aceitar H0 quando H e´ verdadeira?
3) Se, ao lancarmos
¸ ´
3 vezes uma moeda, aparecerem 3 coroas, decidimos rejeitar a hipotese
de que a moeda e´ "honesta". Quais as probabilidades de erro I e erro II?
~ da seguinte informacao:
4) Suponha o leitor que dispoe ¸~
H0 : p = 35% H : p 35%
¸~
a) Explique por que a probabilidade de um erro tipo II e´ zero se a proporcao
populacional e´ 35%.
54
b) Explique por que a probabilidade de um erro tipo I e´ zero se a proporcao ¸~
populacional e´ diferente de 35%.
5) Para decidirmos se os habitantes de uma ilha sao ~ descendentes da civilizacao
¸~ A ou B,
iremos proceder do seguinte modo:
i) selecionamos uma amostra de 100 moradores adultos da ilha, e determinamos a
´ deles;
altura media
´ for superior a 176, diremos que sao
ii) se essa altura media ~ descendentes de B; caso
´
contrario, ~ descendentes de A.
sao
^
Os parametros ¸~ sao:
das alturas das duas civilizacoes ~
A: = 175 e = 10.
B: = 177 e = 10.
Definamos:
Erro I - dizer que os habitantes da ilha sao~ descendentes de B quando, na realidade,
~ de A.
sao
~ de A quando, na realidade, sao
Erro II - dizer que sao ~ de B.
a) Qual a probabilidade do erro I? E o erro II?
b) Qual deve ser a regra de decisao~ se quisermos fixar a probabilidade do erro I em
5%? Qual a probabilidade do erro II, nesse caso?
c) Se A = 5, como ficariam as respostas de (b)?
¸~ da questao
d) Quais as probabilidades do erro II, nas condicoes ~ (b), se a media
´ B =
178? E B = 180? E B = 181?
´
Coloque num grafico os pares B , P(erro II / B ) .
55
Capítulo 5
Testes **********
´
5.1 Teste para a media
~ temos um único valor para a hipotese
Em geral nao ´ H .
¸~ inicial podemos realizar o teste dos seguintes modos:
Dependendo da informacao
a) H : = 0 b) H : = 0 c) H : = 0
H : 0 H : 0 H : 0
´ de significancia
com nivel ^ onde 0 e´ um valor suposto conhecido.
´
Para delinear os procedimentos em um teste de hipoteses ´
sobre a media de uma
~
populacao,
¸ ~
devemos nos basear na distribuicao ´ populacional
¸ do estimador da media
_ _
X X
Z= /n ~ N(0,1) t= t
S/n ~ (n-)
^
conforme a variancia ~
seja conhecida ou nao.
_
X
Estatística do Teste: Z = ~ N(0 , 1).
n
Procedimento:
_
X - 0
i) Calcular: Zobs = onde 0 e´ o valor dado na hipotese
´ nula.
n
56
a) b) c)
~ os valores criticos
onde z 2 ou z sao ´ dados pela Tabela da Normal.
~
iii) Conclusoes:
a) se zobs z entao ~ rejeita-se H .
~ aceita-se H .
b) se z 2 zobs z 2 entao
~ rejeita-se H .
c) se zobs z entao
~es:
Observaço
1) Evidentemente, se o valor de zobs estiver fora dos intervalos indicados acima, a
~
decisao sera´ contraria.
´
~ e´ aumentar
2) Se zobs = z , nos casos b) e c), ou zobs = z 2 , no caso a), a sugestao
o tamanho da amostra.
´ populacao
Sol: Dados do problema: n = 15, porem
_ ¸~ e´ normal com = 1500 conhecido,
= 5% e X = 14.000.
Utilizaremos primeiramente um teste bicaudal, ou seja, desejamos testar:
H : = 15000
H : 15000 com = 5%
_
X 0 14000 15000
´
i) Calculo de Zobs = = 1500 = 2,582
n 15
57
¸~ das RA e a RC do teste.
ii) Determinacao
~
iii) Conclusao:
Como zobs = 2,582 z 2 = 1,96 entao ~ rejeita-se H .
^
Exemplo 2): Com referencia ´
ao exemplo 1, uma vez que a hipotese foi rejeitada, ou seja,
que rejeitamos que = 15000 contra 15000, sera´ que podemos aceitar que
´ para isto.
´ amostral nos da´ um forte indicio
15000, pois a media
~
iii) Conclusao:
~ rejeita-se H .
Como zobs = - 2.582 - z = - 1,64 entao
´ aceitamos a hipotese
Dai, ´ ´
de que a renda media ¸~ deve ser
familiar da populacao
´ de significancia
menor do que $15000, a um nivel ^ de 5%.
58
Sabemos que = 16.9 e = 428.07
´
Testar a hipotese ´ de significancia
de que = 16.9 para um nivel ^ de 10%.
´
como a estatistica do_teste.
i) Calcular: tobs = X -S 0 onde 0 e´ o valor dado na hipotese
´ nula.
n
a) b) c)
~ valores criticos
onde t 2 e t sao ´ dados pela Tabela da t de Student.
~
iii) Conclusoes:
´
Exemplo: Os registros dos últimos anos de um colegio atestam para os calouros admitidos
´
a nota media ´
115. Para testar a hipotese ´
de que a media de uma nova turma e´ a mesma,
tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se media´ ~ 20.
118 e desvio-padrao
Admitir que = 0.05 para efetuar o teste.
~
Sol: Entao, H : = 115
H : 115 com = 5%
_
X - 0 118 - 115
´
i) Calculo de tobs = S = 20 = 0,67
n 20
59
¸~ das RA e a RC do teste.
ii) Determinacao
~
iii) Conclusao:
´
Exercício: No exemplo 1), testar as hipotese
H : = 15000
H : 15000 com = 5%
i) se e´ conhecido _
X - a~ N(0 , 1)
Z= para n 30.
n
ii) se e´ desconhecido _
X - a~ N(0 , 1)
Z= S para n 30,
n
n _
(Xi - X)
onde S = i=1
n-1 .
^
Exemplo: Uma indústria de eletricidade faz lampadas cujo tempo de vida medio ´ e´ 800
horas e = 40 horas. Testar a hipotese
´ de que = 800 horas contra a alternativa 800
horas se uma amostra aleatoria ^
´ de 30 lampadas ´
tem um tempo medio de vida de 788 horas.
Adotar = 0,04.
60
¸~ nao-normal
Sol: Dados do problema: n = 30, para uma populacao
_
~ com = 40 conhecido,
= 5% e X = 788.
Desejamos testar: H : = 800
H : 800 com = 5%
_
X - 0 788 - 800
´
i) Calculo de Zobs = = 40 = -1,643
n 30
¸~ das RA e a RC do teste.
ii) Determinacao
~
iii) Conclusao:
~ aceita-se H .
Como - z 2 = - 2,054 zobs = - 1,643 z 2 = 2,054, entao
´
Logo, concluimos que o tempo medio ^
de vida das lampadas produzidas e´ mesmo de
´ de significancia
800 horas, a um nivel ^ de 5%.
¸~ p
5.2 Teste para a proporcao
Hipóteses:
a) H : p = p0 b) H : p = p0 c) H : p = p0
H : p p0 H : p p0 H : p p 0
´ de significancia
com nivel ^ e p0 e´ um valor suposto conhecido.
61
~es:
Suposiço
¸~ dicotomica,
´ X , X , . . . ,Xn de uma populacao
i) Suponhamos uma amostra aleatoria ^ sendo
´
X o número de unidades na amostra que possuem a dada caracteristica.
¸~ da Binomial pela
ii) n.p0 5 e n.(1 p0 ) 5 para garantir uma boa aproximacao
Normal.
Estatística do Teste:
´ ^p - p
A Estatistica ´ Z=
do Teste sera: ~ N(0 , 1), onde ^p = x
n .
p.(1n p)
Procedimento do Teste:
^p - p0
´
i) Calculo do valor observado: Zobs =
p0.(1n- p0)
a) b) c)
~ os valores criticos
onde z 2 ou z sao ´ dados pela Tabela da Normal.
~
iii) Conclusoes:
62
Exemplo: Uma estacao ¸~ de televisao
~ afirma que 60% dos televisores estavam ligados no seu
programa especial da última 2-a feira. Uma rede competidora deseja contestar essa
¸~ e decide, para isso, usar uma amostra de 200 familias.
afirmacao, ´
Admitamos que, do trabalho de campo, entrevistando as 200 familias´ sorteadas,
~
obtivemos 104 respostas afirmativas. Testar a veracidade da afirmacao ´
¸ da emissora ao nivel
^
de significancia = 0.05.
^p - p0 0,52 - 0,60
´
i) Calculo do valor observado: Zobs = = = -2,31
p0.(1n- p0) 0,6.(1
200
- 0,6)
onde ^p = x
n = 104
200 = 0.52
¸~ das RA e a RC do teste
ii) Determinacao
~
iii) Conclusao:
^
5.3 Teste para a variancia
´ da media
Alem ´ ^
populacional, muitas vezes temos interesse em fazer inferencias
sobre a variabilidade populacional.
´ de qualidade
Por exemplo, podemos ter interesse na uniformidade como um criterio
¸~ (controle de qualidade).
para uma linha de producao
63
~es :
Suposiço
¸~ Normal N(
´ X , X , . . . ,Xn de uma populacao
Suponhamos uma amostra aleatoria
, ).
Hipóteses:
´ de significancia
com nivel ^ e 0 e´ um valor suposto conhecido.
(n - 1).S
Estatística do Teste : ~ (n-1)
Procedimento para o teste :
(n - 1.) S
´
i) Calculo do valor observado: obs = 0
n _
( Xi X )
onde 0 e´ o valor dado na hipotese
´ nula e S = i=1 ^
variancia amostral.
n-1
a) b) c)
~ os valores criticos
onde ou sao ´ dados pela Tabela da Qui-Quadrado.
2
~
iii) Conclusoes:
64
c) Se 2obs rejeita-se H
Exemplo : Uma das maneiras de manter sob controle a qualidade de um produto e´ controlar
^
sua variancia. ´
Uma maquina ^
de encher pacotes de cafe´ esta´ regulada para enche-los com
um desvio padrao ~ de 10 g e media ´ de 500 g. O peso X de cada pacote segue uma
~
¸ N ( , ). Selecionou-se uma amostra aleatoria
distribuicao ´ de 16 pacotes e observou-se
^
uma variancia S = 169 g . Com esse resultado, voce^ diria que a maquina
´ esta´ desregulada
#
¸~ a variancia?
em relacao ^
´ de significancia
Sol: Fixado o nivel ^ , por exemplo = 5%, desejamos testar:
H : = 100
H : 100
(n - 1).S
´
i) Calculo do valor observado: obs = 0 = 15x169
100 = 25,35
onde n=16 , S = 169 e 0 = 100 dados no problema.
¸~ das RA e a RC do teste
ii) Determinacao
~
iii) Conclusao:
65
4-a Lista de Exercicios
´ ´
de Probabilidade e Estatistica
¸~ pluviometrica
1) A precipitacao ´ anual numa certa regiao~ tem desvio padrao
~ =3.1 e media
´
desconhecida. Para os últimos 9 anos foram obtidos os seguintes resultados:
30.5 34.1 27.9 35.0 26.9 30.2 28.3 31.7 25.8
a) Construir um teste de hipoteses ´ para saber se a media´ ¸~
de precipitacao
´
pluviometrica ´ de significancia
anual e´ maior que 30.0. Utilize um nivel ^ de 5%.
b) Discuta o mesmo problema, considerando desconhecido.
c) Supondo que, na realidade, = 33.0, qual a probabilidade de tirarmos uma
~ errada?
conclusao
´
2) Um fabricante garante que 90% dos equipamentos que fornece a uma fabrica ~ de
estao
¸~ exigidas. O exame de uma amostra de 200 pecas
acordo com as especificacoes ¸ desse
´
equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, aos niveis de 5% e
1%.
~ pretendem modifica-lo
3) Os produtores de um programa de televisao ´ se for assistido
regularmente por menos de um quarto dos possuidores de televisao. ~ Uma pesquisa
´
encomendada a uma empresa especializada mostrou que, de 400 familias entrevistadas, 80
assistem ao programa regularmente. Baseado nos dados, qual deve ser a decisao ~ dos
produtores?
66
ii) Um indicador da qualidade do mineral e´ dada pela uniformidade do conteúdo
mineral nas rochas. Supor que a qualidade do conteúdo do mineral e´ satisfatoria
´ se o
~ ~
´ nao e´ maior do que 4.
desvio-padrao da porcentagem media
6) Sabe-se que o consumo mensal per capita de um determinado produto tem distribuicao ¸~
normal, com desvio-padrao ~ 2 Kg. A diretoria de uma firma que fabrica esse produto
¸~ se a media
resolveu que retiraria o produto da linha de producao ´ de consumo per capita
´
fosse menor que 8 Kg. Caso contrario, ´
continuaria a fabrica-lo. Foi realizada uma pesquisa
25
´
de mercado, tomando-se uma amostra de 25 individuos, e verificou-se que Xi = 180 Kg,
i=1
´
onde Xi representa o consumo mensal do i-esimo ´
individuo da amostra.
´
a) Construa um teste de hipotese adequado, utilizando = 0,05, e com base na
~
amostra colhida determine a decisao a ser tomada pela diretoria.
b) Qual a probabilidade de se tomar uma decisao~ errada se, na realidade, a media
´
populacional e´ = 7.8 Kg?
~ seria a mesma? (Justifique sua
c) Se a diretoria tivesse fixado = 0.01, a decisao
resposta).
~ da populacao
d) Se o desvio-padrao ¸~ fosse 4 Kg, qual seria a decisao?
~ (Justifique sua
resposta).
67