Morettin
INTRODUÇÃO À
ESTATÍSTICA
PREFÄCIO
Pedro A . Morettin
CAPITULO 1 - PRELIMINARES SOBRE PROBABILIDADES . . 11.1
Modelo Probabilístico .
1 . 2 Algumas Propriedades 2
1 . 3 Probabilidade co ndicional g
Independên cia . 6 Problemas
para o Capítulo 1 . 9
CAPITULO2 VARIÁVEIS ALEATÚRIAS . 13
2 . 1 O Conceito de Variável 13
Aleatória . 2 . 2 - Valor
Esperado de uma Variável
Aleató-
ria. 15
2 . 3 Mais de uma Variável 21
Aleatória .
2.4 Representações Gráficas para Variáveis 27
Problemas para o Cap{tulö 2. 30
3 .4 Variáveis Aleatórias
Cont£nuas Prob'lemas para
o Capítulo 3.
CAPITULO4 INTRODUÇÃO A INFERÊNCIA 62
ESTATISTICA.
.
- Probabilidade e
Estatística . 62
4. 2 - Modelos Estat£sticos .64 .
Problemas para o Cap£tulo 4. 68
CAPITULO 5 ESTIMAÇÃO : PRIMEIRAS
IDEIAS . . 70 5 . 1 - Um
Estimador por Ponto de p .70
5. 2 - A Lei dos Grandes Números .
Estimação de p por Intervalo .
Problemas para c Cap£tulo 5 .80
-2-
2
a probabilidade de se obter uma bola branca
será PCB)
3
a probabilidade da se obter uma bola
vermelha será P CV)
Aqui, -
Exemplo 1.2 - Suponha que lançamos uma moeda duas
vezes . Se C indica cara e R indica coroa.
então um espaço amostra 1 se
-3-
1
que a probabilidade de cara ou coroa é
Podemos dar a seguinte explicação em
termos de freqüência relativa . Conside re 10
lançamentos da moeda; sa obtemos 6 caras ,
então é a freqÜência relativa de ocorrência
de caras nestes IO Ian çamentos . Suponha que
aumentemos progressivamente o número de
lançamentos , e para cada um deles calculemos
a freqÜÉncia
relativa . Esta variará de prova para prova mas
a medida que aumentamos o numero de lançamentos
ela tenderá a se estabi-
lizar ao redor dg um numero, que sera a
probabilidade de "ca
1
ra"' esta numero sera se a moeda for honesta'
Esta interpretação fraqÜenciaI poderá ser útil ao leitor, se quizer
verificar heuristicamente as propriedades que passamos a considerar, em
especial a regra de adição . Em particular, como toda
fraqÜência relativa é um número entre
O e I , vemos que para qualquer evento A. Para efeito
dB completividaöe , será útil considerarmos o espaço to do e o conjunto vazio,
Õ, como eventos . O primeiro ã dano minado evento certo e p
(Q) - I , enquanto que á o evento .im— possivet e
TOTAIS . . 115
85 200
Tabela 1 .1
30
n á logos. Desta maneira vemos que 200 ao passo que
115
200 •
Dado os eventos A e H podemos
considerar. dois novos eventos :
AUH, chamado e reuniao de A e H, que ocorre quando pelo
me-
nos um dos eventos ocorre;
AnH, chamado a intersecçao da A a H, que ocorre
quando A e H
ocorrem simultaneamente .
15
É fácil ver que P(AnH) , pois o aluno
esco200
1h ido terá que ser ao mesmo tempo .
matriculado no curso de matemática aplicada
g ser homem.
30115
Vemos que P (A) 200 200 ; suponha que nos
SO Cá I CUI O para P CAUH) fosse
30 115 145
Aqui, AnCaØ P
-1.
Em geral , vamos indicar por A o
complementar de um evento A e teremos ,
então ,
-6-
1 .3 - PROBAB IL IDADE COND IC IONAL E I NDEPENDÊNC IA
30
10 1
Estat£stica . a probabilidade dele ser
mulherIsto porque do total de 30 alunos que
eStudam estatística , 10 são
mulheres . Escrevemos
1
P (mulher estatística)
P (AnB)
RESULTADOS PROBABILIDADES
SOMA
Exemplo 1 . 5 - Imagine, agora, que as duas
extraçÕgs são fei tas da urna, mas a
primeira bola á reposta na urna antes da
extraçäo da segunda bola . Nestas
condiçÕas,aa extrações são independentes,
no sentido que o resultado da cada
extração não tam influência no resultado
da outra . Obtemos a situação a seguir.
RESULTADOS PROBABILIDADES
SOMA
VBB
SOMA
60/60 • 1
Observe
-3-
1
que a probabilidade de cara ou coroa é
Podemos dar a seguinte explicação em termos de
freqüãncia relativa . Conside re IO lançamentos da
moeda; se obtemos 6 caras , então +õx o, s á a
freqÜência relativa de ocorrência de caras
nestes IO Ian çamentos . Suponha que
aumentemos progressivamente o numero de
lançamentos , e para cada um deles calculemos a freqÜ6ncia
relativa . Esta variará de prova para prova
mas a medida qua aumentamos o numero de
lançamentos ela tenderá a se estabilizar ao
redor de um numero , que sera a probabilidade
da "ca
1
Te este número sera se a moeda for " honesta "
Esta interpretação freqÜencial poderá ser útil ao leitor, se quizer verificar
heuristicamente as propriedades que passamos a considerar, em
especial a regra de adição . Em particular , como toda
freqÜência relativa um número entre O e 1 , vemos que
para qualquer evento A . Para efeito de completividaäB,
será útil considerarmos o espaça to do Q e o conjunto vazio , Õ , como
eventos . O prima Iro ã dano minado evento certo e P ( n )
-1 , enquanto que Ø é o evento .im— p088£veL g P (D -O .
Exemplo 1 .3 - Suponha que o sagu inte quadro
representa uma poss£vel divisão dos
alunos matriculados em dado Instituto de
matemática, num dado ano . (Vide quadro na
pág. seguinte).
Vamos indicar por P a evento que ocorre
quando , es colhendo-se ao acaso um aluno do
instituto , ela for um astu dante da matemática
pura. A, E, C, H a M têm significados a
HOMENS MULHERES TOTAIS
TOTAIS . . 115
85 200
Tabela 1 . 1
n á logos. Desta maneira vemos que P
CE) 20030 ao
passo qua
115
200 •
30
10 1
Estat£stica , a probabilidade dele ser
mulher éIsto porque do total de 30 alunos
que estudam estatística , 10 são
mulheres . Escrevemos
1
P (mulher estatística)
P (AnB)
Para o exemplo mencionado , se B e A
indicam, respectlvamente, os eventos *aluno
matriculado em Estat£8tIca" e aluno mulher",
então P (Ana ) = 10/200, P (B) 30/280 e,por
tanto.
10/200 1
SOMA
Exemplo 1 .5 — Imagine, agora, que as duas
extraçÕBs são fai tas da urna, mas a
primeira bola reposta na urna antes da
extração da segunda bola . Nestas
condiçÕes.aa extrações são independentes,
no sentido que o resultado dB cada
extração não tem influência no resultado
da outra . Obtemos a situação a seguir.
RESULTADOS PROBABILIDADES
SOMA
Observe que. aqui .
P (branca na 2 â I branca na 19) P (branca
na 29) ,
Ou seda, se dois eventos A e B são independentes ,
A I B) P CA) e P (B IA) - P CB) . Se assim
é, a relação fica para A e B independentes
:
PtAnB)
A fórmula ( l . B) pode ser tomada como
definição de independência : A e B são
Independentes se B somente se (1 . 8) é vá
Ilda.
Exemplo 1 .6 - Considere. a Inda, a mesma
urna dos exemplos anteriores , mas vamos
fazer três extrações sem reposição . Ob
temos o esquema abaixo.
RESULTADOS PROBABILIDADES
VBB
VVB
SOMA
60/60 1
Observe
N a
elementos
O, 0.1
A 0 , 04 OS 0
0,
0 , 08 0 , 82
90
0 . 12 0 , 86 1.
00
1. Suponha uma população da Qualquer errando
ordenado a i bolos é chamada uma amostra
ordenada de tamanho n axtra{da da
população . Considere o s£mbolo (N) n como
sig
nt ficando Suponha n Mostre
qua a xis tem N n amostras com reposição (um
mesmo elemento po de ser retirado mais de uma
vez) e (N) n amostras sem reposição (um
elemento quando escolhido á removido da
população, não havando pois repetição na
amostra) .
P (A I B ) P
(B )
Este resultado é denominado fórmula de Bayes e é útil em muitas aplicaçÕes .
- 13
VARIÃVEIS ALEATORIAS
Em todas as situações de interesse prático que con sideramos queremos
estudar o comportamento de uma ou mais va riäveis . Assim. podemos estar
interessados em estudar a dis tribuição das alturas e pesos de pessoas de uma dada
popula çao . Escolhida uma pessoa ao acaso desta população, obtemos o seu peso e a
sua altura e estamos, pois , considerando duas variaveis . Em muitas situações, como a
descrita , a associaçäo de nÚmeros a resultados de experimentos e natural . Em ou tras
, a associação pode ser arbitrária . Por exemplo , considere o caso de um questiona rio ,
em que uma pessoa é indaga da a respeito de uma Certa proposição e as respostas
poss£veis são "SIM" ou "NÃO" . Podemos definir uma variável que to me dois valores, 1
ou O, por exemplo , correspondentes as res postas "SIM" ou "NÃO, respectivamente .
Teremos ocasião de es tudar com pormenores este tipo de variável .
2/4
3 3 6
de 1 0 1 0 pois x z 1 se e somente se ocorrem os result ados BV ou V a, que são
mutuamente exclusivos; finalmente.
3
x a 2 com probabilidade pois se e somente se ocorrem duas
bolas vermelhas nas duas extraçöes . A notação que usaramos
será P (X = O) , P (X = 1 ) , etc. Temos, pois que
1
6
P (BV ou vaj
3
10 •
No quadro a seguir, esquematizamos a
distribuição de probabilidades da v. a. X, que consiste nos
possíveis valores de X. com as respectivas probabilidades .
Usaremos a notação ) isto ã , designare
RESULTADOS PROBABILIDADES
Temos, então :
16
A distribuição de probabilidades Y
está indi cada abaixo .
1 6 3 12
1,2.
10 10 10 10
1 1 1 1 21
3,5.
Os valores da v . a .
probabilidades respectivas são iguais a 1/6 . De fato ,
1 etc .
Então .
1 91
2
Calculemos ECV)
Por exemp.lo ,
P C2V=4 )
18
Então ,
enquanto que
Observe as distribuiçÕes de V e 2 V;
dizemos que eIas s ao simétricas ao redor de
O; a média será , obviamente, o ponto de
simetria . (Veia Fig .
Observe, também, que E (V 2
1/5
-2 - 1 o 1 2
Figura 2 . 1
se c é uma constante , o que decorre imediatamente da defi niçäo 1 2
.1).
Observando o gráfico da figura 2 . 1 , vemos que E (V) é uma
medida de posição central da distribuiçãc de V .
2 V pode ser representada pelo gráfico da fi
gura 2 . 2 .
p
-4 -3-2 -1 o 1 2 3 4
Figura 2 . 2
As variáveis alaatórias V e 2 V têm a mesma média. z ara, mas notamos
que 2 V á "mais espalhada" ao redor de O do que V . Uma medida da dispersão de uma v
. a . ao redor de sua média á dada pela variancia da v . a .
Se X ã uma v . a . com média E ( X ) , então a variância
de X ã definida por
- 20 -
Var(X)
1 2 2
p
1 2 2 40 - 8
,
5
Var(2V)
(4+5+3*7+8 ) x 5
2 [ 16+25+36*49-641 x 1 190 38 ,
5
Var (X ) .
A relação (2 .6) expressa o fato
intuitivo que, ao transladarmos todos os
- 22 -
valores de X por uma constante c . a
mádie será transladada pela mesma
constante, ao passo que
(2 . 7 ) expressa o fato que a variabilidade
não muda, pois a posição relativa dos novos
valores em relação a nova média
ã a mesma que antas .
As fórmulas (2 . 2) , (2 .6) e
(2 . 7 ) podem ser combinadas para se
obter:
E (aX+b)
Var(aX + b)
sendo e B b constantes .
Exemplo 2.8 - Suponha que temos uma urna contendo 3 bolas nu meradas l
. 2 a 3 . Retiramos duas delas . sem reposição J sede
- 23 -
X o nÚmaro da primeira bola Y o número da segunda bola re
tirada .
RESULTADOS PROBABILIDADES x
2
1/6 2
1 1
1/6
1 3 1 3
2 2
1 1
2 3 2 3
3 1/6 3
1 1
3 2 3 2
x 2 3 1 2 3
1
p 1/3 1/3p 1/3 1/3
O quadro seguinte representa a chamada distribui—
- 24 -
ção conåunta de X e Y, onde P (X=x. Y* y) denota a probabilidade do
evento {X=x e Y=y}
Por exemplo,
As distribuiçÕes serao :
3 4 5 2 3
p 1/3 p 1/3 1/3
Calculemos E (X) , e E (X Y ) . Temos :.
1
4
2 3 S 11
Portanto.
Var(X) Var (Y) - * - 2 2 2
A distribuição de
2 3 4 5 6
156
9
de modo ou e
12 4
9 9 Var(X) + Va r (Y) .
Este resultado também ã geral para v. a. independen
tes :
Figura 2 .3
Podamos obter, também, um gráfico para a distribuição
conjun-
ta de X 9 Y . como na figura 2 . 4 .
Figure 2.4
um outro tipo de gráfico bastante útil na análise da
dependência entre v . a . é o gráfico de dispersão , que con
sista em colocar, num gráfico cartesiano , os possíveis pon-
tos (x , y ) . Para o caso em questão obtemos a figura 2 . 5 , ondg os
círculos duplos indicam os pontos com probabilidade
0 1 2 3 x
34
Figura 2. 5
Este tipo de gráfico pode nos mostrar, por exemplo:
que medida que x cresce, y também cresce J ou a medida que x cresce, y decresce, etc .
Obtenha E (V) e V ar
3
2
O 1 2 3
• Cov iY ,X ) ;
Var (X) ;
Var(X) + Var(Y)
+2
são
independentes ,
ccv (X . Y)
- 39 -
3 2
- 41 -
p • q, de modo que
3p2 •q.
uma característica importante dos experimentos que estamos
considerando qua estamos interessados apena g no nÚmero totai de
sucessos, a não na ordem am que ales ocorrem. Podemos construir a
tabela qua segue, para lançementos da moeda . (Vide tabela na página
seguinte) .
Vamos designar por b ( k B n, p) a probabilidade de se
obter k sucessos am n provas da Bernoulli, sendo p a probabllidade
de sucesso am ceda uma dalas. No exemplo dado.
1 3
NÚMERO DE PROaABILIDADE
SUCESSOS
0 q
2
1 3pq
3/8
2 3p2q
3
3 p 1/8
enquanto que
3p2q .
Note qua q S +3pq 2 +3p 2 q•p 3 (q+p) 3 1, pois P+q - 1 .
Em termos da v. a . . se Sindica o número total da
n sucessos am n provas de
Bernoulli, então P (S = k) • b (kJ n. p ) .
É claro qua os possíveis valoras da S são O , 1 , 2 . .
paras constituam a chamada distribuição bino—
miai. Para o exemplo com obtemos O I gráfico da fi gura 3.1 .
3/8
O 1 2 3
Figura 3 . 1
- 46
Em uma seqüência de n provas, uma seqÜência qual-
quer com k sucessos e n-k fracassos, ou , o que e o mesmo , u ma
seqÜência de k uns a n -k zeros , terá probabi lidade
Ainda no exemplo
2 3 2
= 3pq 1 pq .
3
para k = O,
Para se obter uma f Órmula geral , basta saber quantas
saqÜências com k sucessos e n-k fracassos podemos formar.
cada uma tendo probabilidade dede por ( 3 . 1 ) . É fácil
Utilizando (3. 3) ,
1010
1 10 1 91
b(10J 10, 10 10
10 10 10
2
o, se na segunda prova ocorra fracasso
- 48 -
É imediato que
ao passo que
2 2 2
do que decorre
Var(X ) p2
pela. generalização da propriedade (2 . 12) ,
- 0 , 1 2 b (2; 1 . 000;
O, 0001) 0 , 004 5 . 2 1.
np,
V ar (X)
5 10 1 5 20
Figura 3.3
As médias agora sio 1, 25; 2. 5 e 5 e as
Figura 3 . 4
A distribuição normal difere das distribuiçÕes
apresentadas até agora no sentido que á uma distribuição
variável contínua, ou sej a, através desta distribuição asso-
ciamos probabilidades a intervalos de numeros reais . Por examplo,
se ascolhamos ao acaso um individuo dB uma população e medimos
sua altura, podemos supor que ao resultado do
47
b x
Figura 3 . 5
na figura 3 .4 .
Na realidade, não temos uma distribuição normal, mas
- 6
( b)
Figura
( c )
3. 6
Algumas observaçoes sobre as curvas :
a ) Para um mesmo (u = O) , a curva e mais achatada e mais
espalhada para um maior;
b as curvas s ao simétricas em relação ao ponto u;
c ) praticamente toda a area está concentrada entre os
pontos u -30 e u +35.
Figura
60
c
Assim , se z 0 , 4 582 .
D . 4S82 0 , 27 74 .
Figura
3.8
Figura
62
P ( 2SXS5 )
Figura 3 . 9
Portanto , a probabi lidade que X estej a entre 2 8 5
é i g Lia I à probabilidade que Z estej a entre
ti lizando a tabela 2, vemos que
0 , 09870 , 19 1 50 , 2902
OU sej a ,
0 , 2902 .
Figura 3. 10
ara a do retangulo de base unitária a
altu
64
- 10 x 1
variäncia a2
np
Ver figura 3. 11 .
Suponha , agora, que X sej a uma v . a . com distribui-
ção normal de m5dia u e variância a 2 . que indicaremos N (u ,02 ).
Então , a v . a . Z , tal que
Var ( Z ) Var
ou seja ,
0 , 2902 .
10
Figura 3 . 10
area do retãngulo de base unitária
e altu
ra Igual P (Y -7) , B assim por diante. logo P
(Y 27) e a soma das áreas dos retãngulos
hachurados na figura 3. 10 . A idáia 5
aproximar tal área pela área, sob a curva
53
normal, direi ta de 6, 5. Qual curva normal?
Aquela de média
np - 10 x 1 variãncia a2
Ver figura 3 . 11 .
-
Figura 3 . 11
Chamando X tal v. a. normal ,
P (Y 27 ) P
P (Z 0, 94)0 , 1736 .
A vardadBira probabilidade 0, 172.
Vamos calcular
54
Figura 3 . 12
Vamos, atraväs da figura 3. 12, que a aproximação
a
ser falta deve sar
P C 3<YS6) 5SXS6 . 5)
3. 5 56 , 5 5
szs
1, 58 1, 58
0 , 6 528 ,
ao passo que a probabilidade verdadeira é 0 , 656 .
A Justificativa formal de tal aproximação é dada pelo chamado
Teorema de De Moivre-LapIace, que e caso parti cular do chamado
Teorema do Limite Central . Ver Apêndice 2 .
Vimos até agora , com exceção da normal, varia veis aleatórias que têm
infinito) de numeros .
Quando isto nao acontece, necessitamos de veis
que podem tomar valores em um contínuo de pontos , de tal
sorte que a "massa" em um particular ponto seja O . sã
terá sentido, para uma variável aleat6ria cont£nua X , falar na
probabilidade da X pertencer a um certo intervalo
Para uma v . a . discreta Y falamos na probabilidade de Y
assu mir um valor y isto é, P (Y = y ) .
A maneira de caracter'izar uma v . a . cont£nua
través de uma função f ( • ) , que sej a não negativa e dg
tal modo que a área total sob a curva representativa de f (
• ) se ja unitária . Deste modo, definimos [figura 3 . 13)
P (a'XSb) - area sob f ( • ) desde
a at ã b
53
-
Figura 3 . 11
Chamando X tal v. a . normal ,
o 1 2 3 4 5 6 7 8 9 10
54
Figura 3 . 12
6.55
ssxss 1, 58 szs 1. 58
0 , 6 528 .
ao passo que a probabilidade verdadeira ã 0, 656 .
A j ustificativa formal de tal aproximação é dada pelo chamado Teorema
de De Moivre-Laplace, que e caso parti cular do chamado Teorema do Limite
Central . Ver Apêndice 2.
Vimos até agora, com exceção da normal, variáveis aleatÓrias que têm
distribuiçÕes discretas, ou seja, os valores da v. a . pertencern a um conjunto enumerável (
finito ou infinito ) de numero s .
a b x
Figura 3. 13
A função f ( • ) á chamada funçao densidade de X .
Exemplo 3.2 2 x, para D' x SI e zero fora das ta in
t erva 10, vemos que f (x) 20, V x e a área sob f ( • ) E unitária.
(Figura 3. 14) .
56
x
Figura 3.14
Se queremos calcular P vemos que esta pro-
1
babilidade é igual a área do triângulo de base — e altura I 2
hachurado na figura 3. 14, Ioga a probabilidade em questão e
1/2x1
1
57
1
4
Figura 3 . 15
1
Observe que Pã' que é a área do ra tang
Formalmente,
b
Figura 3. 16
b
Figura 3. 13
A função f ( • ) é chamada função densidade de X .
Figura 3. 14
Se queremos calcular P (OSX<—) , vemos que esta pro-
1
babilidade é igual a área do triângulo de base — e altura I 2
hachurado na figura 3. 14, logo a probabilidade em questão e
1/2x1
1 /4 .
2
x
Figura 3 . 1 5
a
Se queremos calcular a média dB uma v . a . X com fun
ção densidade f ( x) , podamos pensar da seguinte maneira. Pri mel
ramente, observe que f ( x) não é uma probabilidade, mas sa
h ã pequeno, (figura 3. 16) .
Figura 3 . 16
57
Figura 3. 17
Defina a Y que assume os valoras x
1
(3.16) temos, por exemplo ,
3 3 3 3
Desta maneira ,
0a fina, então,
lim E
..,n-l,
portanto,
vem
b x f ( x) dx .
a
com
u e Va r (X)
b) u:ta são dois pontos de inflexão da curva;
1
c) 0 ponto máximo de f ( x ) ;
d) lim f [ x) o .
x
57 -
Figura 3 . 1 B
Temos, na realidade . uma famí lia de densi
dades normais , variando eõ.
Figura 3. 17
Defina a Y que assume os valores
( 3 . 16 ) temos , por exemplo,
Desta maneira ,
Defina, então,
58 -
quando
b x f (x) dx.
a
com
d ) lim f ( x) o .
Figura 3 . 1 ô
Temos, na rea lidade , uma famí lia de densi
xè0
Figura 3 . 1 9
3 . 1 Obtenha b ( k ; n , p) para :
k=10.
3.2 se x 6 uma a . binomial com par;metro -5 p ã, 1
ob tenha :
d)
61
3.3 Num teste tipo certo -errado , com 50 questÕes, qua1 é a
probabilidade que um aluno acerte 809; das questões, su
pondo que ele as responde ao acaso?
3 . 4 Mesmo problema, com 5 alternativas para cada questão
.
3 . 5 Numa partida de 20 rádios foram escolhidas , ao acaso ,
5 unidades para serem inspecionadas . Sabe-se que há
de rádios defeituosos . Calcular as probabilidades
abaixo, nos dois caos :
a) extração com reposiçao;
b) extração sem reposição :
1) probabilidade que a amostra seja formada só por rádios com defeito;
b) P (Yè7)
b)
c)
d)
desconhecido.
Suponha qua um comprador tem que tomar uma decisão sobre
um lote com N peças . Ele pode, como no exemplo 4 . 1 , es tar interessado
em estimar r, baseado no valor observado de
X. Ou então, pode tomar a decisão de comprar o lote, menor ou igual a um
determinado valor e devolver o lote se k E maior que este úalor.
67
Exemplo 4.3 - Suponha que temos uma esfera de aço e medimos o
seu diâmetro, obtendo-se o valor d . Se D representa o ver dadeiro
valor do diâmetro, então podemos estabelecer a mode
10
q 2 /2
onde q = e a proporeao de gens que causam daltonismo na
população .
O objetivo, pois, e testar se os dados obtidos sao consistentes com o
modelo genético proposto . Ver problema
4.5,
Outras vezes, podemos querer testar a independência
entre dois atributos, dada uma tabela do tipo acima.
Tais tabelas são chamadas tabelas de contingeneia.
Nos exemplos 4 .4 e 4 . 5, temos casos em que o experi mento tem mais
de dois resultados poss£veis . A distribuiçao apropriada para descrever tais
experimentos é chamada distribuiçao multinomiat (ver exercícios) , que tem papel re
levante na obtenção dos testes mencionados nos dois exemp 10s anteriores (os
chamados testes do qui—quadrado) .
PROBLEMAS PARA O CAP r TOLO
Prova que
n
k
onde n. Esta é chamada distribuiçao mu t
tino— mia Z de probabilidades .
4 . 5 Justifique as probabilidades teóricas dadas no exemplo 4
. 5 tendo em vista o seguinte . O daltonismo 5 uma
característica genética ligada ao sexo. Cada pessoa a
presenta um par de cromossomas sexuais , sendo que
homem este par 5 denominado X Y e, na mulher. XX . O
dal tonismo caracterizado por um par de gansa
que chama remos D e d, sendo que, no homem, O ou d
só podem estar localizados no cromossoma X, ao passo
que na mu1 her podem estar localizados nos dois
cromossomas X .
NormalNormal
Daltanica
Oaltônico
HOMEM MULHER
n n
Então, se s - k, Isto é, valor
observamos o
n k da
obtemos p - k/ n como uma p .
estimativa de Embora
não
n
n vamos enfatizar esta diferença, observe
que dado por (5 . I) e uma v . a. , ao passo que
k/ n é um numero, isto é, um valor da v. a . Por
exemplo, se 300 pessoas responderam "SIM" à per
300 gunta, então p = = 0,6 e
dizemos que 0, 6 uma estimativa 500 da
proporção dâ pessoas na população favorável à
iniciativa
da Prefeitura .
Vej amos algumas propriedades de Como
e Va r (S ) segue-se que
n
p,
_ neq _
2
n n
- 76
Para n fixo, a função atinge seu máxin n
mo para p = 1/2, logo
1
4n •
1/2 1 p
Figura 5 . 1
No exemplo dado, var(ñ) S = o, 0005; e claro 2 . 000 que Va
r (ã) tende a decrescer quando n aumenta. Em particular, devido a ( 5
. 3) , Var(ñ) + O quando n Esta propriedade, juntamente com (5 .2) nos
diz que é um estimador con sis tente de p .
O estimador p á também chamado nao viciado ,
pelo fa to de ( 5 . 2) ser válida; ela nos diz que, em média, "
acerte p" , ou seja, se escolhermos várias amostras, e para
cada uma calculamos p, a média destes valores estará
próxima de p . Esta qualidade de um estimador ã desej
ável , mas n ao e su fi ciente , como veremos depois . Pode
acontecer que para uma particular amostra p estej a bem
distante de p .
- 77
O estimador dado por ( 5 . 1 ) chamada estimador por ponto, pois
obtemos um Único numero que escolhemos como re-
-
tivamente . De fato,
s
3
n
n
- 78
Figura 5 .2
Temos que
1
1 1 3 2 3 1 1
x x
Ver figura
79
5 2 -A LE I GRANDES NOMEROS
Portanto.
1-
onde ô =
Como nao conhecemos p , usamos o fato que
p( l-p) s logo , basta tomar o numero de provas n tal que
1
- 0 , 95 ,
Portanto ,
0,95
p{ l s -np l so , 05n} Y.
onde S = numero de fumantes na amostra. Portanto , devemos
n tar n
= 400 .
0. 95 ,
83
ou sej a ,
pq 1 96} 0 , 95 .
do qua segue
ô- 1 , 96/ÃÑ.
1
84
ou seda, 0 , 649 ] .
y O/ Ãñ S p s y o/ v'G,
onde yo 6 obtido da tabela 2 tal que P { -y o S Y s y D)
te intervalo chamado pelos estatísticos de conservativo,
pois sa p não for igual a 1/2 e estiver pr6ximo de O ou de
1, então (5 . 13) fornece um intervalo de amplitude desneces-
sari amente grande, pois substitui mos pelo valor máximo
pq
1/4. A mamos que 1/2, podemos usar o intervalo do exem-
plo a seguir.
isto é ,
85
[2 , ô ] - L 0, 167; 0, 233] .
Usando (5. 13) obtemos
ou seja ,
A 6
n
4
S
3
s 1
Figura 5 . 3
6 . 1 - H I PÕTESE ESTATTSTI CA
1
ro de sucessos devera estar práximo de 10 x 5 .
s 9 ,1 0 ) .
A hipótese H será rejeitada se observamos os valo-
res X = 8, X = 9 ou X = IO . Estes valores constituem a chamada
regiao cr;tica ou regiao de reäeiçao do teste, que será indi
56 7
seguir.
Exemplo 6.2 - Dois quadros de futebol estão aguardando o j uiz lançar uma moeda
para ver quem dará a saída . Um dos ca pitães dá ao Juiz uma moeda . Como o árbitro tem
conhecimentos de testes de hip6teses e quer saber se a moeda e honesta, ele vai lançá-la
5 vezes; ele decide que a moeda e considerada viciada se sair 5 caras ou 5 coroas . Nos
outros ca sos a moeda será considerada " honesta '
Se p = P (cara) , queremos testar
H : p 1/2 .
1 2 3 4 5 x
1 1
16 •
Exemplo 6. 3 — Um praticante de tiro ao alvo
vai comprar um lote muito grande de munição e o
vendedor garante que a por centagem de
projéteis em bom estado ê 90% . No entanto, o
com prado r decide fazer uma experiência para
testar a veracidade da afirmação do vendedor.
Ele escolheu 10 proj éteis e vai verificar
quantos são bons . Ele decide nao comprar o
se X = numero de sucessos na amostra C n Úmero de e mui-
0 , 9 ,
que
onde p = proporção de bons prod äteis no eEntão,
lote . Suponha
Ia decide manter abaixo de isto é,
para obter os valores cri ticos (que levarao• a rejeição de
H) ele calcula algumas probabilidades :
Portanto ,
0 , 069 .
Portanto. a região crítica escolhida
S pois
incluindo-se o ponto 7 obtemos a > o. 025 .
s s
Temos (ver tabela I
erro de tipo II ,
ACEITAR pro-
K
Decisaocorreta
babilidade
Vamos ver o que acontece quando tentamos
diminuir um dos erros, digamos a. Suponha que
tomamos por região tica o conjunto S 'O -•{9,
10} . Então, vimos que a.
O valor correspondente da
ou . . . -
0,624 .
Portanto, diminuindo a , ß aumenta. Se a
região cri
tica ã S õ - z 0, 121 ( ca lcu le '. ) .
POdemos, pois, obter o quadro seguinte :
REGIÃO
CRITICA
0 ,
17 0 ,
322
0,01
A situação que ocorre 6 qua, para n fixado
a prio-
100
regi ao hachurada
n 10
1/ 2
media
regi ao hachurada —
n 10
101
np
a B.
Figuva S . 3
rg'caberam n
soro 22
21
Assim, n pessoas foram vacinadas e n ao ficaram
12
doentes, enquanto que n pessoas receberam apenas soro e 21
ficaram doentes, etc.
Suponha que queremos escolher uma das seguintes
pó teses como hipótese nula .
contra a alternativa
Se X designa o numero de consumidores
na amostra que preferem A, então rej
eitaremos H para "valores peque-
nos" de X .
x
Em termos depodemos dizer que rejeitaremos H
se o valor observado de for menor que um certo p
tal que
P (ô < ã I H verdadeira) a
probabilidade P (Ô < ô I H )
envolve o conhecimento da distribuição de
ô. No exemplo 5 . 2, do capítulo
anterior,
vimos a distribuição de para o caso particular de n = 3 e p
= 1/2 . Aqui, não seria prático obter a distribuição de
quando H verdadeira, pois n E grande g p pode assumir qual-
quer valor maior ou igual a 0, 7 .
Felizmente, ã possivel obter um
taste aproximado, utilizando-se uma
aproximação para a distribuição de Ô,
quan do n grande .
Não teremos ocasião de tratar deste problema
nestas notas, mas o exemplo serve para ilustrar a
importância de obtermos o que chamamos a distribuiçao
amostrai de um es timador, no caso ô. Desta maneira podemos
obter o valor cri tico, , e conseqäantemente, a região
critica do teste . Ve remos algumas noçÕBs sobre este
assunto no pr5ximo capitula•
95
Exemplo
Exemplo
Exemplo
Exemplo
1 )
2 )
3 )
Figura 6 . 4
ou x: 10) = 0, 0123,
menor do que O. 025, mas
0 , 0548 .
que e maior do que 0 , 025 , logo a região cr£tica direita é
tos do segmento AB indicam aceitação da hipótese p - po' enquanto que pontos abaixo de
A e acima de B indicam rejeição o ' Os pontos limites são 0, 26 e 0, 88, de modo que
re deitamos H : p = p O contra K: p O para p < 0,26 e p > O, BB e aceitamos H para 0, 26 S
p S O, 88 .
{o; 0,9;
A região entre as curvas é chamada regiao de con—
fiançg e as curvas são as curt'as limites da região .
No Apêndice I apresentamos regiÕes de confiança pa
ra alguns valores de n e para a < < 10% .
Voltemos ao caso n - IO acima e a < 0, 05. Suponha
qua obtemos ô = 0, 6 . Então, o intervalo encontrado acima, [0,
26; 0, 88] será um intervalo de confiança para p, com
coeficien— te confiança de pelo menos 0, 95 . Este intervalo
correspon a região da aceitação da hipÓtesa, ao nivel de 0, 05
.
se obtemos õ • O, 6. nos não rejeitaremos a hipótese p - po. para 0, 26 s p s o,
ee .
Oe modo geral, a região de aceitação de um teste do
tipo acima, da nível a. corresponda a • um intervalo da confiança
para p, com coeficiente de confiançe Y - l- a.
111
-
pois, testar
0, 025 para podermos utilizar o gráfico
H:p reta horizontal por p = intercepta a re
-0 , 5
113
Portanto, podamos concluir que rejeitamos a idäia de uma
diferença substancial na produção a favar do fertili zante A. Se
não tivéssemos, baseados nos dados. razão para esperar maior
numero de " do que poder{amos utilizar -
H : p
contra
passo
ANTES 121 130 127 125 140 121 132 135 124 136
DEPOIS 123 127 132 132 135 122 138 176 127 138
116
HOMENS
127 118 131 120 128 123 128 133 141 124
pR03.
bem como a analogia de X com o valor esperado dB X,
Var (X)
- 119
max (X n
Então , são as estat£sticas de or-
1 2n
dem da amostra CX , X ) . Uma particular e importante es-
1 tat{stica de ordem é a mediana , denotada por Y Ordena-
dos os valores amostrais , Y 6 0 valor central se n á im1/2 par e é a média
aritmética dos dois valores centrais se n
Então :
x 1 7,4,
2 2 2
2 1 8,3.
As estatísticas de ordem são :
= 12 .
1 2 3 1/245
5 e Y = 16 , a mediana seria 6
1
12,5.
1/2 2
Var (X) 2 Quando consideramos E (X) e Var(X) , será que há alguma ralação entre
estes valores e u, 0 2 ? Isto é o que ve remos na próxima secção.
2
3
e a variância da população
20 , 667 .
2
x
1 -1 1
2
3 1 1
6 2
Retiramos todas as poss£vais amostras .com reposiçäo ) da
tamanho n O número de amostras será Nn - 3 2
cada amostra tem a mesma probabilidade , de ser se lecionada . Obtemos o quadro
seguinte .
VALORES
AMOSTRA
AMOSTRAIS
PROBABILIDADE
por
quanto s
Portanto ,
enquanto que
4 , 333
do que segue
Var(ž) 0 , 333 -
1/3 1/3
1/9 1/9
O 1 2 3 x 1 2 3 x
Figura 7 . 1
Quanto maior for o tamanho da amostra, n , menor se
Var (X ) rá a
variância de X , devido ao fato qua Var (X ) to indica que a
distribuição de X será mais concentrada ao redor de sua média, E A
figura 7 . 2 ilustra esta fato . pa ra o caso em que X tem distribuição
normal N t U , a 2 ) .
x x
População
x
n.30
Figura 7 . 2
113
exerc£cios .
n-30
Figura 7 .4
A d ustlficatlva teórica do que ocorre é baseada no que chamado o
Teorema do Limite Centra Z . Quando aproxima-
mos uma distribuição binomial por uma normal , estamos utili
P (Zèz) ,
onde Z é a v . a . N (0 . 1) . Ver Apêndice 2 .
Como X S / n vem
buição N ( 0 . 1 ) .
e então. X -X
7.4 Considere uma população de tamanho N - 4 e a v . a . X ten do os valoras 2, 3, 5
, S sobre os elementos desta população .
a) Calcule E (X) e Var (X) .
b) Considere amostras da tamanho n = 2 , com reposição, da
população . Obtenha a distribuição amostra I de i,
2
-3 -2 -1 o 1 2 3
11 e -
> 1 03 )
8 • IDEIAS GERAIS SOBRE INFERÊNCIA ESTATISTICA
Figura 8 . 1
Mas a situação pode não ser essa, como indica a fi gura 8 . 2 .
Figura 8.2
Para alguns valores da e. R (T , 9) < R (T ,9) ,
acontecendo o oposto para outros valores de 9.
O qua se faz , então, é tentar restringir a classe de
estimadores a usar.
uma possibilidade á considerar a classe dos estima dores nao viciados de e,
isto ã, se T é um membro desta classe,
tas notas .
Exemplo 8.1 - X é um estimador não viciado da média de uma v . a . X. De fato ,
Var(i ) 2 o
que mostra qua {i } á consistente .
8 .2 - ESTIMADORES DE M FN IMOS QUADRADOS E EST IMADORES
DE MÁXIMA VEROSSIMILHANCA
erros a i • Como
vemos que
n
141
que uma função de D, g (D) digamos. Se queremos determinar o
m£nimo desta função, temos
n
(dl -Ô) O,
do que decorra
xn
e tomando logaritmo ,
• constante + log N.
-
N-k
contra
H : u = 20
-
Exempla 8.4 :
1 1.111
Exemplo 8.5 :
11
Vamos analisar detidamente o exemplo 8 . 4 . Aqui , o
parâmetro que está sando testado uma média desconhecida .
O conjunto de todos os valores poss£veis de 1.1 é cha mado
o espaço do parâmetro e á indicado pela letra e. Podemos supor aqui
que
-9-9
1
149
Em termos dos conjuntos acima , a
formulação (8 .25) é equivalente a
1
No exemplo 8 .4 , podar {amas estar
interessados em testar a hipótese que a
média 5 20, contra a alternativa que
a média é 23 .
150
Lembremos que ao testar uma hipótese
podemos tomar uma decisão errada em duas
situações :
C i ) reåeitando-se H, quando ela
verdadeira : erro de tipo I;
(ii) aceitando-se H, quando ela é falsa : erro de ti—
po 11.
a rejeitar H quando 2 c 5
a aceitar H (redei tar K) quando * < c.
Lembremos que. sendo imposs£vel minimizar a e si
multaneamente. fixamos um valor para a a tentamos encontrar.
dentre todos os testes com nível de significância a, aquele que minimiza B .
Qualquer procedimento que utilizemos nos levará a
encontrar uma estat£stica T , que é uma função das observa-
0 , 025 " .
A região cr£tica será da forma
P<i H verdadeira )
5- = 5 é o desvio padrão de X . Portanto ,
x
-50
154
c
- 1 , 96 ,
5
Figura e . 4
simples. ou seja ,
155
1
Como vimos . nós controlamos o nível de significäncia, e tentamos
minimizar a probabilidade do erro de tipo 11, B . Sa existe uma região cr£tica que tenha
nível e que minimiza ß dentre todas as regiões críticas de nível no máximo esta será a
melhor região critica de n;veL a. Obtemos, então , um meZhor teste .
Suponha que temos uma amostra CX uma v . a .
X que tenha distribuição dependendo de um parâmetro e que pode assumir
somente os valores e Fixemos
Designemos por L ( 9 ; x função de verossimi-
lhança correspondente à amostra x , isto é, a proba-
n bilidade P (X = x n n sendo que destacamos a depen-
u=P
(rejeitar H
l e=È)
Portanto,
200 i-l
ou ainda .
Como obtemos
k)a
2
isto é ,
144 -
n
guinte modelo :
i' onde e ß são
constantes a serem determinadas são erros (variáveis
aleatÓrias) . Obtenha os estimado res de m£nimos quadrados
para e isto é , aqueles valores â e ß que minimizam
os estimadores Y
8 . 7 No exemplo 8 . 3, considera o caso em que temos a função
de veros similhança dada por (8 .21 ) , isto e, o modelo ã a
distribuição hipergeométrica. Para se obter o estimador
de máxima veross±milhança de N, N, considera a razão
(N-n)
Aplique o resultado
148 -
REFERENCIAS
APÊNDICE 1
-
TABELA- PROBABILIDADES BINOMIAIS
9
LU
8.
Tabelas
PROBABILIDADES
TABELA 1 (continuação )
- 150 -
PROBABILIDADES
a
3
aaR
8.
151 -
PROBABILIDADES
ТАВЕ[-А BINOMIAIS (continua;50 )
- 152 -
PROBABILIDADES
ТАЗЕЦА BINDMIAIS (conc1Us50)
153 -
PROBABILIDADES
- 154
TABELA 2 - AREAS SOB A CURVA NORMAL PADRÃO
Exemplo :
2 3 46 8 9
01192 02790 03'aa 00
05172 01 S9S 01994 067*9
04380 I '026
03983
07926 063' 7 • 09095
12930
05567
09483
05%2 10642
'4803 03586
0477s 09871 07535
11791 12172 13307 1 1409
a 20194 21904
15910 '7003
5642 19097 20834
'6276 23565 20*0 24857 2St'S
as 22901 issu 26730 2421 ngas 28230
22240
2389 30785
aas75
29103
23237 8673 27035 27337
17724 33393 31057 25490
0.8 2*04 32381 29955 2C234 35769 28524
21226 35993
0.9 agat4 34375 32121 34850 32639 353t4
1.0 21594 36650 34624 350a3 24sa' 29796
3atoa 36214
34134 3749:1
38586 37286 27637 399'3
40824 39435 42922
36433 38877
1.3 38493 42364 42647
aas43 35543
40320 42220 0699 45254
1.5 41924 43B22
46164
44545 45052 asg-
43319 44738 458 'g 94 39617 4Eg26
4S6J7 45907 assa
44520 4S4as 45728 '5528 48077
46562 41320 46712
47193 44062
46407 47982
47978 47882 agsoo 2.1
41 '23 07831
48822 48840 48537 2,2
46257 46080 48310 485ra
za 48645 48679 48745 4905' 46856 49324 49134 0899 2.3
48214 49010
23 4881 n 0955 4924S
49036 0286 48030 49492 49343 49361
49224 49266 49S0ô
48928 49202 *9520
25 49180 agS9a 48461 4962 t
49720 063Z
2.6 49379 49560 4993 49585 49702 08809
49729
4964a
49547 49574 49693 4978' 0795 49736
49757 49205 2.9
28 49534 4gs54
4973) 4983' 49774 4984 t 49477
49851 agass 49807
3.0
2.9 49653 49752 0892 49897 49-861
49825 09836
49744 '9--819 49900
3.0 49874 49B82 a9öœ
49813 49913 0-918 3.2
49946 49948 49929
11 49855
49906 49910 49916
49950 aggž2 49964 os '9950 3.3
49925 499'0
12 49903
49953 49958
49972 49974 75 49965 3.4
3.3 49969 4997' 3.5
49968 49922 49088 '9983
49966 49978
0938
49977 49985
49985 0983 4998' 0992
a9•E0 499-9 s
49993 a9994 4999S
egggg 49993 4953 49996 49997
49995 43995 0996 4§987
4999 Y 49997 4999'
49999 ossa 49990
SEGUNDA E TERCEIRA OECIMAIS OE
65
15 25 35 75 85
- 155
00199 cas78 04974
0418Œ 08902
OSS' 2 02*9
1270 11600
' 5726 .164S3 IS3SR 02
19322
18SOJ 0.3
za741 2069 220'3
2X72 zuoa
2899 26270 aa68 21 '35 25333 25647
28669
8246 26883 30921 31192
31990
3251 t 3¥22 08
15 as 75 85 96 0.9
9tO't
8
♀
PESO SWO
tZE
BZVD
IZO'Z OtO'Z
8
89·1
059 - SSZ'a
•
gso•
•
S
'Z
tgl t
•
9gffZ
'Zt o ZZL'O
•
9GËO
I o
•
90'
69G2 07
0B02
- Z
-
tZVD
09'0 ICO
1
Stt z
•
gtS'O
ESC'
69C2
8to I t80'-
·
•
9'8'0
t9t 1
8-
•
、
at"O gel D
•
691't
9
t
tLSZ 9 L'
Z8t't 1
·90
C96·-
·
9C9
9
§
-
•
t"'O
0
0
-
9
·
0
0t 0 9t 't—> )d ·0t·0 9 · 1<
冖
冖
d
一 (X 0tdua×
一
154
8
15 6
-2-2
. Var (X) ,
o que prova (A . 2. 1 ) .
Em particular, t A . 2 . 1) á aqui valente a
p ( lx-u l èca ) s —z
onda c > 0-. Baste tomar k-ca. Ou • einda ,
o ISB -
1
c
3
Isto á, para qualquer v. a. X, com variância finita, pelo me
nos 3/4 da massa está compreendida no intervalo C u -25
.1.1+20].
Se X 5 normal , com média u e variância a 2 , sabemos
que z 0 , 95 . portanto o limite inferior dado
por (A . 2 .4 ) é bastante impreciso . Todavia, como nada se pres
supÕe a respeito de distribuição de X , a não ser que tenha
variSncia finita, a desigualdade (A . 2 . 1 ) á bastante úti l .
A .2.2 - LE I DOS GRANDES NOMEROS
Var(k/n) n
(sucesso) .
X -np
Então, quando
P (Y žz) + P (Zèz)
,
onda Z a v . a . N (0, 1) a z á constante.
Ou seda , para n grande, a distribuição de Y pode ser
aproximada por uma distribuiç_äo normal padrão .
Este teorema, para X binomial, um caso especial de um
resultado mais geral, chamado Teorema do Limite Cen— trat, que
apresentamos na forma seguinte.
Seda {X } uma saqÜ;ncia de v. a. independentes a com
a mesma distribuição, E (X ) = 1.1 e Var(X )
1 2 n
onde Z 5 a v . a . N (0 . 1 ) .
O teorema pode ser generalizado. por exemplo, para o caso
em que {X } são independentes, mas não têm a mesma distribuição.
- 161
A. 2 .4 - H I PÕTESES COMPOSTAS
K : eee
como apresentado no Capítulo B , seja L
te,)' n a função de veros similhança para uma amostra (X
razão de veros similhança generalizada é definida por
Se , am CA . 2 . 9) substituímos as observaçÕes (x
. . . x ) palas v . a . correspondentes, escrevemos h para À, pois
a razão será uma v . a .
0<5 2 <œ} .
(A. 2.10)
(A . 2 . 14 )
isto é ,
Substituindo (A . 2 . 15 ) (A . 2 . 14 ) , obtemos :
(A. 2 . 16)
Portanto ,
-c c
Por exemplo. se queremos testar
= - 0 , 33 .
Como, para 0.05, c = 2,120. vemos que a região da rejeição é I t t >
2 , 120 . No caso , aceitamos H.
Nam sempre é possível obter de maneira fácil a dis tribuição da estatística a ser
usada no teste. Sob determinadas condiçÕes, poda-se demonstrar que 2 log tem uma
distribuição limite, que ã chamada distribuição do qui—qua— arado . Esta distribuição, como
a distribuição t , e caracterizada por um parâmetro, chamado também nÚmero de graus de
171 -
Liberdade. No caso em questão , a distribuição limite tem
TT7ŽT( 21 1
(A . 2.20)
x e dx,
o x
172 -
Esta distribulçäo í tabelada para
diferentes valores de V. mas não
apresentamos uma tal tabela no apêndice.
-