Você está na página 1de 237

Pedro Alberto

Morettin
INTRODUÇÃO À
ESTATÍSTICA
PREFÄCIO

O obäetivo destas notas ã fornecer 8 ubs£diòg para


um primeiro curso de Estat{8tica. Não hã requisito prévio,
exceto um curso de ãtgebra elementar. Somente em raras oca—
Bioes fazemos uso de noçÕeg de Limite e integra Z.
São Õbvias as dificuldades encontradas ao se eecre
ver um Livro em nivei elementar. Em primeiro Lugar, hã de se
decidir "quao elementar deve ser o Livro. Depois, hã o pro b
tema do que deve ser incl.u{do. Quanto ao primeiro aspec—
to, devo frisar que estas notas nao constituem um conjunto de
métodos matemáticos da B 8 tatistica, mas sim uma aborda—
gem inicia t, na maior parte das vezes heur£3tica, dos prin—
cipios da Bstat£stica. Dada a eæigiidade de tempo, nao in—
etu{mos tópicos que pretend{amos abordar: a Lguns testes de
hip5teses usuais para distribuições normais e uma introdu—
çao ao enfoque bayes¿ano.

Ênfase foi dada distribuição binomial, para in—


troduziz• as idãias básicas de estimação e testes de hip5te— se
s. A tguns tópicos mais dif{ceis ou especializados estão no
apêndice.
Finalmente, gostaria de agradecer a Comigsao Orga—
nizadora do 1 OQ co t5quio Brasileiro de Matemática, por ter nos convidado papa ministrar
este curso, a CZðvis de A. Pe— res, pop tep tido os originais e apresentado várias suges—
tõeg e ao Sr. João Bapti8ta Esteves de O tive ira, peto exce— Lente trabalho de datilografia.
São Pauto, maio de 1975

Pedro A . Morettin
CAPITULO 1 - PRELIMINARES SOBRE PROBABILIDADES . . 11.1
Modelo Probabilístico .
1 . 2 Algumas Propriedades 2
1 . 3 Probabilidade co ndicional g
Independên cia . 6 Problemas
para o Capítulo 1 . 9
CAPITULO2 VARIÁVEIS ALEATÚRIAS . 13

2 . 1 O Conceito de Variável 13
Aleatória . 2 . 2 - Valor
Esperado de uma Variável
Aleató-
ria. 15
2 . 3 Mais de uma Variável 21
Aleatória .
2.4 Representações Gráficas para Variáveis 27
Problemas para o Cap{tulö 2. 30

CAPITULO3 - ALGUNS MODELOS PROBABILISTICOS 34

3.1 A Distribuição Binomial .


3 . 2 A Distribuição 42
Hipergeométrica
3 . 3 A Distribuição Normal . 44

3 .4 Variáveis Aleatórias
Cont£nuas Prob'lemas para
o Capítulo 3.
CAPITULO4 INTRODUÇÃO A INFERÊNCIA 62
ESTATISTICA.
.
- Probabilidade e
Estatística . 62
4. 2 - Modelos Estat£sticos .64 .
Problemas para o Cap£tulo 4. 68
CAPITULO 5 ESTIMAÇÃO : PRIMEIRAS
IDEIAS . . 70 5 . 1 - Um
Estimador por Ponto de p .70
5. 2 - A Lei dos Grandes Números .
Estimação de p por Intervalo .
Problemas para c Cap£tulo 5 .80

CAPITULO 6 - TESTES OE HIPÚTESES : PRIMEIRAS IDEIAS


. .
6. 1 Hipótese Estatística . 82
6 . 2 - Teste da ume Hipótese para p 84
6 . 3Hipótese Alternativa . Um outro
Tipo de
88
iv -

6. 4 - Relação entre Intervalo de


Confiança e
Teste de Hipótese . 95
6 . uma Aplicação : Teste de 100
5 Sinal . 102
Problemas para o Capítulo 6
.
CAPITULO DISTRIBUIÇÃO AMOSTRAIS 105
7. 1 Estat£sticas .105
7. 2 DistribuiçÕes Amostrais . 109
Problemas para o Cap{tulo 7 . 116
CAPITULO 8 IDEIAS GERAIS SOBRE INFERÊNCIA ESTATISTI
CA 119
8. 1 Propriedades dos Estimadores .
119 8 . 2 - Estimadores da Mínimos
Quadrados e Estimadores de Máxima
Veros similhança . 124 8 . 3 - O Problema
Geral do Teste de HipÓtese . 129 - O
Teste da Razão de Verossimilhança .
136
Problemas para o Capítulo B. . 143
REFERËNCIAS . 146
APÊNDICE 1 . .
147 APÊNDICE
2 . . 157

1PRELIMINARES SOBRE PROBABILIDADES

Neste capítulo vamos introduzir alguns conceitos


básicos de probabilidades de maneira simples a utilizando vã
rios exemplos. Vamos nos restringir ao caso de espaços amos
trais discretos, pois pretendemos introduzir as tas prin ci pais de estimação e testes dB
hipÓteses par.a parâmetros da uma distribuição discreta dB
probabilidades.

1 . 1 - MODELO PROBAB I LTSTtCO

Todo experimento ou fan6meno qua envolva um elemen


to casual ficará especificado no momento que estabelecemos : um espaço amostrai, n,
que consiste, no caso discreto , da enumeração (finita ou infinita) de

todos os resulta dos possíveis do experimento em questão :

Os elementos são os pontos amostrai8 3


( i i ) uma probabilidade para cada ponto
amostra I , de tal sorte que seja poss£vel
encontrar a probabilidade P (A) de qualquer
subconjunto A de n. isto é, a probabilidade
do que chamaremos um evento.
Exemplo 1 .1 — Uma urna contém duas bolas brancas
(B) e três bolas vermelhas CV) . Retirando-se
uma bola ao acaso da urna.

-2-
2
a probabilidade de se obter uma bola branca
será PCB)
3
a probabilidade da se obter uma bola
vermelha será P CV)
Aqui, -
Exemplo 1.2 - Suponha que lançamos uma moeda duas
vezes . Se C indica cara e R indica coroa.
então um espaço amostra 1 se

U)4 = (R, R) . É razoável supor que cada


ponto t» tem probabili-
1
dada se a moeda ã perfeitamente simétrica e
homogênea. Se A é o evento que consiste na
obtenção de faces iguais nos dois lançamentos
, então
11 1
De um modo geral , se A ã um evento , então

onde a soma ã estendida a todos os e,A .

Vale, aqui , uma observação sobre


espaços amostrais. Para um mesmo experimento
podemos ter vários espaços amostrais, dependendo
do objetivo do problema que se quer estudar.
Por exemplo, suponha que lancemos uma moeda 5
vezes . Se estamos interessados apenas na
seqÜência da caras a coroas obtida, um espaço
amostra I ã
-1, 5} . Mas se estamos interessados no número de ca ras obtidas , então um
espaço amostra I mais conveniente ã
1,2,
1 .2 - ALGUMAS PROPRI EDADES
Suponha que lencemoe uma moeda J costumamos
dizer

-3-
1
que a probabilidade de cara ou coroa é
Podemos dar a seguinte explicação em
termos de freqüência relativa . Conside re 10
lançamentos da moeda; sa obtemos 6 caras ,
então é a freqÜência relativa de ocorrência
de caras nestes IO Ian çamentos . Suponha que
aumentemos progressivamente o número de
lançamentos , e para cada um deles calculemos
a freqÜÉncia
relativa . Esta variará de prova para prova mas
a medida que aumentamos o numero de lançamentos
ela tenderá a se estabi-
lizar ao redor dg um numero, que sera a
probabilidade de "ca
1
ra"' esta numero sera se a moeda for honesta'
Esta interpretação fraqÜenciaI poderá ser útil ao leitor, se quizer
verificar heuristicamente as propriedades que passamos a considerar, em
especial a regra de adição . Em particular, como toda
fraqÜência relativa é um número entre
O e I , vemos que para qualquer evento A. Para efeito
dB completividaöe , será útil considerarmos o espaço to do e o conjunto vazio,
Õ, como eventos . O primeiro ã dano minado evento certo e p
(Q) - I , enquanto que á o evento .im— possivet e

Exemplo 1.3 - Suponha que o seguinte quadro


represente uma poss{vel divisão dog alunos
matriculados em dado instituto da
matemática, num dado ano . (Vide quadro na
pág . seguinte).
Vamos indicar por P c evento que ocorre
quando, es colhendo-se ao acaso um aluno do
instituto . ele for um astu dante dB matemática
pura. A, E, C, H e M têm significados a
HOMENS MULHERES TOTAIS
MATEMÁTICA PURA . 70 40 110
MATEMÁTICA
APLICADA 15 15 30
ESTATtSTICAe . 10 20 30
. . • • 20 10 30
COMPUTAÇÃO.

TOTAIS . . 115
85 200
Tabela 1 .1
30
n á logos. Desta maneira vemos que 200 ao passo que
115

200 •
Dado os eventos A e H podemos
considerar. dois novos eventos :
AUH, chamado e reuniao de A e H, que ocorre quando pelo
me-
nos um dos eventos ocorre;
AnH, chamado a intersecçao da A a H, que ocorre
quando A e H
ocorrem simultaneamente .
15
É fácil ver que P(AnH) , pois o aluno
esco200
1h ido terá que ser ao mesmo tempo .
matriculado no curso de matemática aplicada
g ser homem.
30115
Vemos que P (A) 200 200 ; suponha que nos
SO Cá I CUI O para P CAUH) fosse
30 115 145

200 200 200 •

Se assim. o fizéssemos, estaríamos contando duas ve


zes os alunos que são homens e estão matriculados no curso da
matemática aplicada. como está destacado na tabela I . 1.
Portanto, a resposta correta
-s-
P (AnH)
30 115 15 130
200 200 200 200 •

No entanto, considerando-se os eventos A e C


, ve-
3030
mos que P (A)
200200
Neste caso , os eventos A e C são disjuntos ou mutuamente ea
c Lugivog , pois se A ocorre então C não ocorre e vice-versa .

Aqui, AnCaØ P

Portanto, se M e N são dois eventos


quaisquer temos a chamada regra da adição
de probabilidadee
P (MnN) ,
que se reduz a

sa M a N são eventos mutuamente exclusivos .


Suponha, agora, que estamos somente interes
sado s
em saber se um estudante escolhido ao acaso está matriculado como aluno de
matemática pura . aplicada , estat£stica ou computação, não
interessando saber se é homem ou mulher. Um espaço amostra
1 é n a {P . A, E, C} . Os eventos A e B
são chamados complementares e são tais que
30 110 30 30 170
Vemos que P (A) a200 ' enquanto P 200 200. 200 - 200 , isto é,

-1.
Em geral , vamos indicar por A o
complementar de um evento A e teremos ,
então ,

-6-
1 .3 - PROBAB IL IDADE COND IC IONAL E I NDEPENDÊNC IA

Voltemos ao quadro do exemplo 1 . 3 . Dado que um


es-
tudante. escolhido ao acaso , este da matriculado no curso de

30
10 1
Estat£stica . a probabilidade dele ser
mulherIsto porque do total de 30 alunos que
eStudam estatística , 10 são
mulheres . Escrevemos
1
P (mulher estatística)

Para dois eventos quaisquer A B B, sendo P


(B) > O.
definimos a probabilidade condicionai de A,
dado 8, P CA I B) como sando

P (AnB)

Para o exemplo mencionado , se B e A indicam,


respectlvamente, os eventos • aluno
matriculado em Estatística" B aluno mulher".
então P (Ana ) 10/200, P (B) 30/280 e,por
tanto,
10/200 1
30/200 como hav£amos obtido .
Da relação (1 . 3) obtemos a chamada
regra do produ— to de probabiZidade8s
P (AnB)

Exemplo 1 .4 - Retomemos a urna do exemplo 1 .1 mas


suponha a gora qua extraímos duas bolas ao
acaso, sem repoaiçao . Isto significa que
escolhemos a primeira bola. verificamos a sua
cor e nao a devolvemos a urna, misturamos
as bolas restantes e retiramos a segunda
bola . O diagrama em árvore abaixo ilustra
as possibilidades . Em cada "galho " da
árvore estão indicadas as probabilidades
da ocorrência , sando que , as segundas
bolas temos probabilidades condicionais .
A probabilidade do resultado conjunto ã ,
então, dada por ( 1 . 7 ) .

RESULTADOS PROBABILIDADES

SOMA
Exemplo 1 . 5 - Imagine, agora, que as duas
extraçÕgs são fei tas da urna, mas a
primeira bola á reposta na urna antes da
extraçäo da segunda bola . Nestas
condiçÕas,aa extrações são independentes,
no sentido que o resultado da cada
extração não tam influência no resultado
da outra . Obtemos a situação a seguir.

RESULTADOS PROBABILIDADES

SOMA

Observe que, aqui .


P (branca na 2 â I branca na 1 e ) PC branca
na 2 e ) ,
Ou seja, se dois eventos A e B são independentes,

- P (A) e P (B IA) P Se assim é, a relação fica


para A B independentes :
P (AnB) = P (A) 'PCB) .
A f Órmula (1 .8) poda ser tomada como
definição de independência : A e B são
independentes se B somente se (1 .8) á válida .
Exemplo 1 .6 - Considere. a Inda, a mesma
urna dos exemplos anteriores, mas vamos
fazer trag axtraçÕes sem reposição . Ob
temos o esquema abaixo.
RESULTADOS PROBABILIOADES

VBB

SOMA
60/60 • 1
Observe

De modo geral , dados 3 eventos M, N S R. temos


que
-g-
P(MnNnR)

PROBLEMAS PARA O CAP r TULO


1 . 1 Duas moedas são lançadas . Dê dois
poss£vels espaços a mostrais para esta
experimento . Represente um destes
como o produto cartesiano de dois
outros espaços amos trais .

1 . 2 - Uma moeda e um dado são lançados , Dê um


espaço amostral do experimento a depois
represente-o como produto cartesiano dos
dois espaços amostrais corresponden te aos
experimentos considerados individualmente
.
1 . 3 - No exerc£cio 1 . 1 , liste os eventos :
a ) pelo menos uma cara;
b duas caras J
c ) o complementar de b) .
1 . 4 - Considere o lançamento de dois dados.
Considere os eventos A : soma dos números
obtidos igual a 9 e B; número no primeiro
dado maior ou igual a 4 . Enumere os
c
elementos da A e B. Obtenha AUB, Ana e A .
1 . 5 - Obtenha as probabilidades dos eventos que
aparecem nos problemas 1 .3 a 1 .4 .
- Considere uma urna contendo 3 bolas
pretas e 5 bolas vermelhas. Retire duas
bolas da urna, sem reposição . Obtenha os
resultados poss{veis e es respectivas
probabilldades. Mesmo problema , para
extraçÕes com rapo-

1 . 7 - No problema anterior, calcula as


probabilidades dos e ventos ;
a ) bola preta na primeira e segunda
extraçÕes;
b bola preta na segunda extração;
c ) bola branca na primeira extração .
1 . 8 Se A e B são
independentes,
mostra que também
são inc c
dependentes :

1 . 9 - As probabilidades que dois eventos


Independentes ocor
ram são p e q, respectivamente . Qual
a probabilidade :
a) que nenhum destes eventos ocorra?
b) pelo menos um destes eventos ocorra?
1 . Na tabela abaixo , os números que
aparecem säc probabi lidadas
relacionadas com a ocorrência de A , B,
A e B, etc . Assim, P ( A ) = 0, 1 , enquanto
qua P (AnB) = 0 , 04 .
ri fique se A e B são independentes .
0, 0.1
A 0 , 04
03 0
c 0,
A 0 , 08
90
0 . 12 0 , 86 1.
00
1. Suponha uma população de N elementos a
Qualquer arrendo ordenado a i bolos é
chamada uma amos tra ordenada de
tamanho n traída da população .
Considere o s£mbolo (N) n como sig nt
ficando N (N (N-n+l ) . Suponha n Mostre
qua e xis tem N n amostras com repogiçao
(um mesmo elemento po de ser retirado
mais de uma vez) e (N) n amostras sem
reposição (um elemanto quando escolhido
5 removido da população , não havendo
pois repatiçäo na amostra) .
1 . 12 - uma amostra de tamanho n extra £ da de
uma população com N elementos diz-se
casuai (ou ateat5r¿a) sa todas as
possíveis amostras têm a masma
probabilidade de sarem escolhidas; esta
probabilidade será 1/Nn se a amostra

-3-
1
que a probabilidade de cara ou coroa é
Podemos dar a seguinte explicação em termos de
freqüãncia relativa . Conside re IO lançamentos da
moeda; se obtemos 6 caras , então +õx o, s á a
freqÜência relativa de ocorrência de caras
nestes IO Ian çamentos . Suponha que
aumentemos progressivamente o numero de
lançamentos , e para cada um deles calculemos a freqÜ6ncia
relativa . Esta variará de prova para prova
mas a medida qua aumentamos o numero de
lançamentos ela tenderá a se estabilizar ao
redor de um numero , que sera a probabilidade
da "ca
1
Te este número sera se a moeda for " honesta "
Esta interpretação freqÜencial poderá ser útil ao leitor, se quizer verificar
heuristicamente as propriedades que passamos a considerar, em
especial a regra de adição . Em particular , como toda
freqÜência relativa um número entre O e 1 , vemos que
para qualquer evento A . Para efeito de completividaäB,
será útil considerarmos o espaça to do Q e o conjunto vazio , Õ , como
eventos . O prima Iro ã dano minado evento certo e P ( n )
-1 , enquanto que Ø é o evento .im— p088£veL g P (D -O .
Exemplo 1 .3 - Suponha que o sagu inte quadro
representa uma poss£vel divisão dos
alunos matriculados em dado Instituto de
matemática, num dado ano . (Vide quadro na
pág. seguinte).
Vamos indicar por P a evento que ocorre
quando , es colhendo-se ao acaso um aluno do
instituto , ela for um astu dante da matemática
pura. A, E, C, H a M têm significados a
HOMENS MULHERES TOTAIS

MATEMÁTICA PURA . 70 40 110


MATEMÁTICA
APLICADA 15 15 30
ESTATfSTICAe . 10 20 30
. . • • 20 10 30
COMPUTAÇÃO.

TOTAIS . . 115
85 200

Tabela 1 . 1
n á logos. Desta maneira vemos que P
CE) 20030 ao
passo qua
115

200 •

Dado os eventos A e H podemos


considerar dois novos eventos :
AuH, chamado a reuniao de A e H, que ocorre quando
pelo me-
nos um dos eventos ocorre;

AnH, chamado a intersecçao de A e H, que


ocorre quando A e H
ocorrem simultaneamente .
15
É fácil ver que P CAnH) pois o aluno
esco200
1h ido terá que ser ao mesmo tempo ,
matriculado no curso de matemática
aplicada e ser homem.
ao 115 ; suponha que
Vamos que P (A) nos
200 200
so cálculo para P (AuH)
fosse
30 115
P 145
(AUH) •
200 200 200
Se assim. o fizéssemos , estaríamos contando duas ve

z es os alunos que são homens e estão


matriculados no curso
da matemática aplicada, como está destacado na
tabela 1 . 1 .
Portanto, a resposta correta
) 30 mos qua P
(A) 200
P (A) (H) - P (AnH)
30 115 15 130
No entanto, 200 200 200 200 •
considerando- 30

se os eventos A e 200 200


C,
Neste caso , os eventos A e C são disjuntos ou mutuamente ec c tugivog : pois se A ocorre
então C não ocorre e vice-versa .

Aqui, AnC=Ø e P (AnC) -O .


Portanto, se M a N são dois eventos
quaisquer temos a chamada regra da adição de
probabilidades
- P (MnN) ,
que se reduz a
P (MUN)
se M a N são eventos mutuamente
exclusivos .
Suponha , agora, que estamos somente int er
as sado g em saber se um estudante escolhido ao
acaso está matriculado como aluno de matemática
pura . aplicada, estat£stica ou computação, não
interessando saber se é homem ou mulher. Um
espaço amostra 1 ã Q = {P , A, E, C} . Os eventos
são chamados complementares e são
tais que AnB • Ø.
110 30 30 170
Vemos que P (A) "+, enquanto P (B) a200 200.200 - —,isto 200 é,
-1.
Em geral , vamos indicar por A o
complementar de um evento A a teremos. então.
c

1 .3 - PROBAB IL IDADE CONDI C IONAL E I NDEPENDÊNC IA

Voltemos ao quadro do exemplo 1 . 3 . Dado que um


es-
tudantB, escolhido ao acaso , estega matriculado no curso de

30
10 1
Estat£stica , a probabilidade dele ser
mulher éIsto porque do total de 30 alunos
que estudam estatística , 10 são
mulheres . Escrevemos
1
P (mulher estatística)

Para dois eventos quatequar A B a, sendo P


CB) > O.
definimos a probabitidade condicionai de A,

dado B, P (A I B) , como sendo

P (AnB)
Para o exemplo mencionado , se B e A
indicam, respectlvamente, os eventos *aluno
matriculado em Estat£8tIca" e aluno mulher",
então P (Ana ) = 10/200, P (B) 30/280 e,por
tanto.
10/200 1

30/200 como hav£amos obtido .


Da relação (1 . 6) obtemos a chamada
regra do produ— to de probabiZidade8,
P (AnB)P CB) 'P (M B) .
Exemplo 1 .4 - Retomamos a urna do exemplo 1 .
1 mas suponha a gora qua extra£mos duas bolas
ao acaso, sem repoaiçao . Isto significa que
escolhemos a primeira bola, verificamos ã sua
cor e nao a devolvemos urna , misturamos
as bolas restantes e retiramos a segunda
bola. O diagrama em arvore abaixo ilustra
as possibilidades . Em cada "galho t' da
árvore estão indicadas as probabilidades
de ocorrência , sendo que, as segundas
bolas temos probabilidades condicionais .
A probabilidade do resultado conjunto á ,
então, dada por (1 . 7 ) .
RESULTADOS PROBABILIOADES

SOMA
Exemplo 1 .5 — Imagine, agora, que as duas
extraçÕBs são fai tas da urna, mas a
primeira bola reposta na urna antes da
extração da segunda bola . Nestas
condiçÕes.aa extrações são independentes,
no sentido que o resultado dB cada
extração não tem influência no resultado
da outra . Obtemos a situação a seguir.

RESULTADOS PROBABILIDADES

SOMA
Observe que. aqui .
P (branca na 2 â I branca na 19) P (branca
na 29) ,
Ou seda, se dois eventos A e B são independentes ,
A I B) P CA) e P (B IA) - P CB) . Se assim
é, a relação fica para A e B independentes
:
PtAnB)
A fórmula ( l . B) pode ser tomada como
definição de independência : A e B são
Independentes se B somente se (1 . 8) é vá
Ilda.
Exemplo 1 .6 - Considere. a Inda, a mesma
urna dos exemplos anteriores , mas vamos
fazer três extrações sem reposição . Ob
temos o esquema abaixo.
RESULTADOS PROBABILIDADES

VBB

VVB
SOMA
60/60 1
Observe

De modo geral . dados 3 aventas M, N e R , temos


que
P(MnNnR)

PROBLEMAS PARA O CAP r TULO 1

1.1 Duas moedas são lançadas . Dê dois


possíveis espaços a mostrais para este
experimento . Represente um destes como o
produto cartesiano de dois outros espaços
amos trais .

1 . 2 - Uma moeda e um dado são lançados , Dã um


espaço amostral do experimento a depois
represente-o como produto cartesiano dos
dois espaços amostrais corresponden te aos
experimentos considerados individualmente
.
1.3 No exercício 1 . 1 , liste os eventos :
a ) pelo menos uma cara;
b duas caras;
c ) o complementar de b) .
1 . 4 - Considere o lançamento de dois dados .
Considere os aventos A: soma dos números
obtidos igual a 9 e B: número no primeiro
dado maior ou igual a 4. Enumere os c
elemantos de A e B. Obtenha AUB, Ana e A .
1 . 5 - Obtenha as probabilidades dos eventos que
aparecem nos problemas 1 .3 s 1 .4 .
- Considere uma urna contendo 3 bolas
pretas e 5 bolas vermelhas. Retire duas
bolas da urna, sem reposição. Obtenha
os resultados poss£veis e as
respectivas probabllldadas . Mesmo
problema, para axtrações com reposlçäo .

- No problema anterior. calcule as


probabilidades dos e ventos :
- 10

a ) bola preta na primeira e segunda


extraçÕes ;
b) bola preta na segunda extração ;
c ) bola branca na primeira extraçäo.
Se A e B são independentes, mostre que também
são in-
ccc c
dependentes : A e B

1.9 As probabilidades que dois eventos


independentes ocor ram são p e q,
respectivamente . Qual a probabilidade
:
a) que nenhum destes eventos ocorra?
b) ) pelo menos um destes eventos ocorra?
1 . Na tabela abaixo , os numeros que
aparecem são probabi lidadas
relacionadas com a ocorrência de A, B, A e B, etc .
Assim, P (A ) enquanto que P (Ana ) - 0
, 04 .
ri fique se A e B são independentes.

N a
elementos

O, 0.1
A 0 , 04 OS 0
0,
0 , 08 0 , 82
90
0 . 12 0 , 86 1.
00
1. Suponha uma população da Qualquer errando
ordenado a i bolos é chamada uma amostra
ordenada de tamanho n axtra{da da
população . Considere o s£mbolo (N) n como
sig
nt ficando Suponha n Mostre
qua a xis tem N n amostras com reposição (um
mesmo elemento po de ser retirado mais de uma
vez) e (N) n amostras sem reposição (um
elemento quando escolhido á removido da
população, não havando pois repetição na
amostra) .

1 . 12- Uma amostra de tamanho n extra £ da de uma


população com N elementos diz-se casuai
(ou ateat5ria) se todas as poss£veis
amostras têm a masma probabilidade de
sarem escolhidesJ esta probabilidade será
1/Nn se a amostra
- 11 -

for com reposição e I/ (N) se for sem reposição.


n
Uma amostra casual de tamanho n com reposição extraí da
de uma população com N elementos . Encontre a proba
bilidade de não haver repetição na amostra .
1 . 1 3- Considere os aniversários de n pessoas como constituindo uma amostra de
tamanho n da população dos 365 dias do ano . Aplique o resultado do
problema anterior para encontrar a probabilidade que todos os n aniversãrios
caiam sm dias diferentes .

1 . 1 4 - Denote por . Considere a situação do problema 1


. 11 . mas na qual não Levamos em con— ta a ordem do conjunto a i I , a 12 " •
• n . Mostre que e xis tem amostras sem reposição .
n
1 . 15- Suponha que {B B B } é um conjunto da eventos mu
tuamente exclusivos e exaustivos , ou seja. quaisquer
dois eventos B e B não podem ocorrer ao mesmo tempo e um
deles deve ocorrer. Simbolicamente, B na
n. Seda A um evento qualquer. Se A o
corra, então A deve ocorrer juntamente com um dos B ,
(Ver figura) . Prove que
m

Faça um diagrama em árvore .


12
1 . 1 6 - Utilize o resultado anterior para resolver este prob lema . Uma companhia
produz rádios em 3 fábricas A. a e C . A fábrica A produz dos rádios,
enquanto Be C produzem cada uma . As probabilidadés que um rádio
produzido por estas fábricas não funcione s ao 0 , 0 1 , 0. 04 e 0, 03,
respectivamente. Escolhido um rádio da produção conjunta das três
fábricas , qual a probabili dade do mesmo não funcionar?

1 . 17- Considere a situação do problema anterior, mas


suponha agora que um rádio á escolhido ao acaso e
ele ê de feituoso . Determinar qual a probabilidade de
ter sido fabricado por A. No caso geral referido em 1 .
15 , queremos obter P (B IA)} para j = 1 . . , m. Verificar
que se chega a
P (A I B )

P (A I B ) P
(B )
Este resultado é denominado fórmula de Bayes e é útil em muitas aplicaçÕes .

1 . 1 B- O colégio A tem de rapazes , o colégio a tem e o colégio C tem 1 0'; . De


um colégio selecionado ao aca so são escolhidos 8 alunos , com reposição . Se
obtemos (R para rapaz e M para moça) RRRMMMMM , qual a probabi 1 idade
de ter sido selecionado o colégio C?

- 13

VARIÃVEIS ALEATORIAS
Em todas as situações de interesse prático que con sideramos queremos
estudar o comportamento de uma ou mais va riäveis . Assim. podemos estar
interessados em estudar a dis tribuição das alturas e pesos de pessoas de uma dada
popula çao . Escolhida uma pessoa ao acaso desta população, obtemos o seu peso e a
sua altura e estamos, pois , considerando duas variaveis . Em muitas situações, como a
descrita , a associaçäo de nÚmeros a resultados de experimentos e natural . Em ou tras
, a associação pode ser arbitrária . Por exemplo , considere o caso de um questiona rio ,
em que uma pessoa é indaga da a respeito de uma Certa proposição e as respostas
poss£veis são "SIM" ou "NÃO" . Podemos definir uma variável que to me dois valores, 1
ou O, por exemplo , correspondentes as res postas "SIM" ou "NÃO, respectivamente .
Teremos ocasião de es tudar com pormenores este tipo de variável .

2 . 1 - O CONCE ITO DE VAR IÁVEL ALEATOR IA

Exemplo 2 . 1 — Consideremos a situação do exemplo 1 . 4 . em que


consideramos duas extrações , sem reposição , de uma urna con
tendo 2 bolas brancas e 3 bolas vermelhas . Definamos a variá
- -

vel X igual número de bolas vermelhas obtidas nas duas ex-


traçÕes . Obtemos o seguinte esquema.
1/4
RESULTADOS PROBABILIDADES x
aa
14
B
VB 1
1
2

2/4

Vemos, pois, que a cada resultado do experimento


está associado um valor da variável aleatÓria (v . a . ) X; estes
valores são O,

Dizemos que X = O, com probabilidade 1/10, pois X = O


se e somente se ocorre o resultado BB; X = I com probabilida-

3 3 6
de 1 0 1 0 pois x z 1 se e somente se ocorrem os result ados BV ou V a, que são
mutuamente exclusivos; finalmente.
3
x a 2 com probabilidade pois se e somente se ocorrem duas
bolas vermelhas nas duas extraçöes . A notação que usaramos
será P (X = O) , P (X = 1 ) , etc. Temos, pois que
1

6
P (BV ou vaj
3

10 •
No quadro a seguir, esquematizamos a
distribuição de probabilidades da v. a. X, que consiste nos
possíveis valores de X. com as respectivas probabilidades .
Usaremos a notação ) isto ã , designare

mos por letras minúsculas x os valores da X e por as


respectivas probabilidades ,

Exemplo 2 .2 - Retomemos o exemplo 1 . 2 , em


que consideramos o lançamento de uma moeda duas
vezes . Definamos a v . a . Y número de 'caras
" obtidas nos dois lançamentos .

RESULTADOS PROBABILIDADES

Temos, então :
16
A distribuição de probabilidades Y
está indi cada abaixo .

- VALOR ESPERADO UMA VARIÁVEL ALEATÕRIA

são os possíveis valores v . a .

são as respectivas probabilidades, então o va— Zor esperado (ou esperança


ou média) de X é definido como

Exemplo 2 .3 — Para a distribuição da v . a . X do exemplo 2 . 1 temos que

1 6 3 12
1,2.
10 10 10 10

Para a distribuição da v . a . Y do exemplo 2 . 2 .


1 1 1
1.
Exemplo 2 .4 - Consideremos o lançamento de um a v . a . que dado e seja X
representa o numero obtido na face cima . Então , X toma os
valores l , 2 , voltada para
6 com
probabi
lidadas todas iguais a 1/6 . Calculemos E ( X ) e

1 1 1 1 21
3,5.
Os valores da v . a .
probabilidades respectivas são iguais a 1/6 . De fato ,
1 etc .

Então .
1 91
2

Exemplo 2 .5 - Considere a v . a . V com a distribuição dada


pe
1a tabela abaixo :

Calculemos ECV)

Obtemos . depois , as distri bui ç.Ões de

Por exemp.lo ,

P C2V=4 )
18

Então ,

enquanto que

Observe as distribuiçÕes de V e 2 V;
dizemos que eIas s ao simétricas ao redor de
O; a média será , obviamente, o ponto de
simetria . (Veia Fig .
Observe, também, que E (V 2

entanto , é fáci l ver que


19 -

1/5

-2 - 1 o 1 2

Figura 2 . 1
se c é uma constante , o que decorre imediatamente da defi niçäo 1 2
.1).
Observando o gráfico da figura 2 . 1 , vemos que E (V) é uma
medida de posição central da distribuiçãc de V .
2 V pode ser representada pelo gráfico da fi
gura 2 . 2 .
p

-4 -3-2 -1 o 1 2 3 4

Figura 2 . 2
As variáveis alaatórias V e 2 V têm a mesma média. z ara, mas notamos
que 2 V á "mais espalhada" ao redor de O do que V . Uma medida da dispersão de uma v
. a . ao redor de sua média á dada pela variancia da v . a .
Se X ã uma v . a . com média E ( X ) , então a variância
de X ã definida por
- 20 -

Var(X)

e á fácil ver que


2
Va r (X ) - [EOO 1 2 .

Exemplo 2 .6 - Para a v . a . V do exemplo


anterior,

2- 2 , logo Var (V)


Vimos que E (2V) Vejamos a
distribui ção de (2V) 2 ã aquela abaixo :
2 O 4 16

1 2 2
p

1 2 2 40 - 8
,
5

do que segue qua Var(2V)usando ( 2 . 4 ) .


Notamos qua

Var(2V)

De modo gera l , utilizando (2 . 3 )


, vemos que
- 21 -
Var (cX)
se c ã uma constante .

Exemplo 2.7 - Considere a v . a . V do exemplo 2 . 5 e seja


W•V+6.
Então, a distribuição de dada por :
w 4 5 7 8

p 1/5 1/5 1/5


Segue-se que

(4+5+3*7+8 ) x 5

2 [ 16+25+36*49-641 x 1 190 38 ,
5

do que decorre que

Var(W) 38 — 38-36 2 var (V) .

Genericamente. uma constante,

Var (X ) .
A relação (2 .6) expressa o fato
intuitivo que, ao transladarmos todos os
- 22 -
valores de X por uma constante c . a
mádie será transladada pela mesma
constante, ao passo que
(2 . 7 ) expressa o fato que a variabilidade
não muda, pois a posição relativa dos novos
valores em relação a nova média
ã a mesma que antas .
As fórmulas (2 . 2) , (2 .6) e
(2 . 7 ) podem ser combinadas para se
obter:
E (aX+b)

Var(aX + b)
sendo e B b constantes .

O desvio padrão dB X á definido como a raiz quadra


da positiva da Var (X) e será Indicado por a (X) ou a variäncla
da X também á denotada por a 2 (X) ou a x'2 A relação
(2 . 9) fica, para a
a(aX+b)

2 .3 - MAI S DE UMA VARIÁVEL ALEATORIA

Exemplo 2.8 - Suponha que temos uma urna contendo 3 bolas nu meradas l
. 2 a 3 . Retiramos duas delas . sem reposição J sede
- 23 -
X o nÚmaro da primeira bola Y o número da segunda bola re
tirada .
RESULTADOS PROBABILIDADES x

2
1/6 2
1 1
1/6
1 3 1 3
2 2
1 1
2 3 2 3
3 1/6 3
1 1
3 2 3 2

Temos, então. duas variáveis al eatórias . Y. cu


3as distribuiçÕes de probabilidades são :

x 2 3 1 2 3
1
p 1/3 1/3p 1/3 1/3
O quadro seguinte representa a chamada distribui—
- 24 -
ção conåunta de X e Y, onde P (X=x. Y* y) denota a probabilidade do
evento {X=x e Y=y}

Lembremos como P (X -x , Y -y) é calculada; de acordo


com a fórmula (1 .7 ) ,

Por exemplo,

Uma maneira mais cÖmoda a usual da se representar


a distribuição conjunta de X e Y através de uma tabela de
dupla entrada , como a seguir;
A vantagem desta tabela é que, tendo-se a
distribuiçäo conjunta de X e Y podemos obter as distribuições
de X a Y (a recíproca não é verdadeira, em geral spor que?) que
são chamadas distribuições marginais. Assim, a primeira e a
última coluna da tabela dão a distribuição de Y, ao passo
que a primeira g a Última linha dão a distribuição de X .
Dada a distribuição de X e Y acima, podemos
considerar, por exemplo, a v . a . Y. ou a v . a. X Y . A soma
X + Y é definida de moda natural : a cada resultado do
experimento e
1a associa a soma dos valoras de X e Y.
Podemos, pois, obter a tabela seguinte:
PROBABILIDADES
- 26 -

As distribuiçÕes serao :

3 4 5 2 3
p 1/3 p 1/3 1/3
Calculemos E (X) , e E (X Y ) . Temos :.
1
4

2 3 S 11

De modo geral , verdade que

pera quaisquer v . mas não ã verdade que


• E (X) • E (Y) J isto só acontece num caso particular que veremos a
seguir.

Exemplo 2 .9 - Considere a situação do exemplo 2.8 , mas onde


as extrações são feitas com reposição, isto é , a primeira
bola ã reposta antes da SB retirar a segunda bola . Nestas
condiçÖes, a P , isto á, o valor assumido
por X não tem influência nenhuma no valor que Y vai assumir.
A situação é descrita a seguir.
RESULTADOS PROBABILIDADES x

A distribuição conjunta de X a Y ã dada abaixo,


duntamente com as marginais da X e de Y.
- 28 -
Observe que, embora as distribuições marginais de
X e Y sejam as mesmas que no exemplo anterior, a
distribui9äo conjunta é diferente. A ralação (_2.1.1) ficará,
neste caso,

para todos os possíveis pares (x . y) , x 2,3; y-l .2, 3


.
Dizemos que X e Y são independentes .
Ainda temos, aqui , E (X) ( 2 . 12 ) conti-
nua válida . A distribuição de X Y será :
2 3 4 6 9

p 1/9 2/9 2/9 1/9


de modo que E (X Y) 4, que é igual
aE Então, obtemos o fato importante :
"Se X 9 Y são v. a . independentes,

XY) - E (X) 'E


Uma observação importante á a seguinte ; para que X e Y sejam
independentes ã necessário que (2. 13) estada verificada para todos
os pares ( x . y ) . Basta que ela não se verifique pa ra um par para
que X e Y não sejam independentes . Neste caso diremos que X g Y
são dependentes . A pergunta que pode surgir á : pode (2 .14) va ler
para v . a . dependentes? Ver exar c£clos . para a resposta .
Exemplo 2.10 - Vamos calcular Var (X ) , Var (Y) a Var(X+Y) para o
exemplo 2.9 .
Vimos que E (X ) também
14

Portanto.
Var(X) Var (Y) - * - 2 2 2
A distribuição de
2 3 4 5 6

p 1/9 2/9 3/9 1/9


logo E (X + Y)

156
9

de modo ou e

12 4
9 9 Var(X) + Va r (Y) .
Este resultado também ã geral para v. a. independen
tes :

"Se X e Y são independentes , então

Var(X+Y) Var(X) + Var (Y) . •


Esta relação pode não sar verdadeira se X e Y são
dependentes . Para um exemplo, ver exerc£cios .
- 30 -
2 .4 - REPRESENTAÇÕES GRÁFI CAS PARA VARIÄVE IS

No exemplo 2. 5 vimos um tipo de representação


gráfica para uma v . a . , V, naquele caso . Outro t Ipo de gráfico
qua pode sar usado é o histograma .
Exemplo 2 .11 — Considaremos o lançamento da 3 moedes jam
as v , a . X B Y definidas como segUg : X é o número de "ca ras "
que aparecem e Y o número de "seqÜêncies" onde ume se
qÜÔncia é um conjunto (uma ou mais) de letras iguais .
RESULTADO

A distribuição condunta dB X e Y obtida facilmente, bem co


mo as marginais .

Na figura 2 .3 temos representações gráficas as


distribuições de X e Y na forma dB gráfico em barra e his
togrames .
32

Figura 2 .3
Podamos obter, também, um gráfico para a distribuição
conjun-
ta de X 9 Y . como na figura 2 . 4 .
Figure 2.4
um outro tipo de gráfico bastante útil na análise da
dependência entre v . a . é o gráfico de dispersão , que con
sista em colocar, num gráfico cartesiano , os possíveis pon-
tos (x , y ) . Para o caso em questão obtemos a figura 2 . 5 , ondg os
círculos duplos indicam os pontos com probabilidade

0 1 2 3 x
34

Figura 2. 5
Este tipo de gráfico pode nos mostrar, por exemplo:
que medida que x cresce, y também cresce J ou a medida que x cresce, y decresce, etc .

PROBLEMAS PARA O CAP r TULO 2

2. 1 - Considere uma urna contendo 3 bolas vermelhas e 5


boIas pretas . Retire três bolas, sem reposição e defina e v
. a . X igual ao número de bolas pratas. Obtenha a
distribulçäo de X, e X 2.
2.2 - Repita o problema anterior, mas agora considerando
ex traçãas com reposição.
- 35 -

2 . 3 Considere o lançamento de t rãs moedas . Se ocorre o'


evento CCC dizemos que temo g uma seqüência, ao passo
que se ocorre CRC temos tres seqüências . Defina as v .
X igual ao número de caras obtidas e Y Igual ao nú
mero de seqÜências, isto para cada resultado poss£veL
Assim, X (CRR) 1 e Y [CRR) 2 . Obtenha as
distribuiçõas de X, Y , X* Y, I X -Y l . Faça o gráfico de
dispersão das v . a . X B X
2 . Obtenha : E CX) e Var (3X) , para o problema 2 . 1 '
4
E E CX+Y) .Var (X+Y) para o problema 2 .3 .
2. Suponha que a
5 tem e distribuição seguinte :
v o 1
p q

Obtenha E (V) e V ar

2 . 6 - Lance uma moeda e defina a v. a . VaO se ocorre cara V


= I se ocorra coroa e seda q P (cara) . Lance agora , n
vezes a para cada lançemento defina a v . a . V como acima.
ia 1, •
a) qual o significado da W?
b) obtenha a distribuição dg W • 1
c) ) obtenha E (W) e Var(W) .
2 . 7 Utilizando a fórmula (1 .3) prove que e variäncia de X pode
ser obtida pela fórmula (2 .4) .
- 36 -

2 . 8 Verifique se as v . a . X e Y definidas no problame


2.2 são Independentes .
2 . 9 No problema 2 . 2 , calcule E (XY) , E (X/ Y) a E
tX+Y) .
2 . IO- Verifique, para o problema 2 . 2, se E (X Y)
Utilizando a resposta do problema 2 . 8 . o que você
pode concluir? Verifique se E (X/ Y) •
2. Calcule ' Ver (X + Y ) , Var(X) e Var(Y) para as v . a . do
pro b lema 2 . 2 . É verdade que Var(X+Y) Var (X) +
Var (Y) ?
2 . 12- Se X é uma v . a . e x é um número rea l qualquer
denominamos função de distribuição acumulada de X à função

Obtenha F ( x) para a v . a . X com distribuição dada por


x -2 -1 1 2

p 1/5 1/5 1/5


Faça o gráfico de F (x) e verifique que ã uma em
escada" não decrescente e tal que

2 . 13- Para a função F (x) do problema anterior. obtenha F ( -5 ) F


F (0,.5) e F (556) . Qual o valor de F (1 ) -F de F
-F
2 . 14- O diagrama de dispersão entre as variáveis LJ B V ã do
abaixo. Obter e distribuição conjunta e as distribuiç5es
- 37 -

marginais de U e V' somente -pelo exame do grá fico,


obter E (U) .
5 v

3
2

O 1 2 3

2 . 15- Sede X com distribuição dade abaixo .


X o 1 2

p 1/2 1/4 1/4


Calcule E (X) . Considere a a celcule E (X -a ) 2
1/2, 3/4. 1 .0btenha o grifico da g Para qual
valor de a , g (a ) m£nimo?

2 . 16 - Obtenha formalmente o resultado de 2 . 15 , utilizando


o fato que X -a
2 . 17 - se E (X) -a covariancia entra X e Y
definida como
Mostra b) cov cx,X)
que :
d ) Cov CX ,Y )
a) Se X e Y
- 38 -

• Cov iY ,X ) ;
Var (X) ;
Var(X) + Var(Y)
+2

são
independentes ,
ccv (X . Y)
- 39 -

3 • ALGUNS MODELOS PROBABILISTICOS

Vamos apresentar, neste capítulo , alguns modelos que se adequam a


uma série de problemas práticos . Estes modelos envolvem certos parametros , cujo
conhecimento é indispensável quando queremos calcular certas probabilidades . Na
maio ria dos problemas reais, estas parâmetros são desconhecidos B há necessidade de
fazer algum tipo de inferência sobre eies; este assunto sará abordado em capítulos
seguintes .

3 . 1 -A D I STR I BU I ÇÃO B I NOMIAL


Muitos experimentos são tais que os resultados pos s £ vais apresentam ou
não uma determinada característica .

( 1 ) Uma moeda ã lançada ; o resultado ou é "cara " ou não ã


(coroa) ;
(2) Um dado ã lançado ; ou ocorre face 5 ou não (acarrando

então , uma das asta p aça ã defeituosa


faces l , 2, (4) Uma pessoa asco 1h Ida ac acaso não do
(3) uma p aça é sexo masculino '
escolhida ao (5) Um Ilvro á escolhido ao acaso
acaso peças;
- 40 -

de um Iota ; dentre 1 .000 pessoas ã ou


contendo 500
ou não defeituosa da uma biblioteca; esta li
v ro e ou não um livro de Matemática .
Em todos estes casos , estamos interessados na ocor rência de um sucesso
(ocorrência de cara. face 5, peça defeituosa, etc . ) ou fracas 80 (ocorrência de coroa ,
face dl fe
rente de 5 , peça boa , etc . ) . Esta terminologia será usada
freqÜentemente.
Podemos, para cada experimento acima, definir uma que tem apenas
dois valares ; o valor 1, digamos , se ocorre sucesso e o valor O se ocorre fracasso . Se
indicamos P ( sucesso) . então a distribuição de probabilidades
dBdada
X por
é
x 1
p
Os experimentos são chamados engai0B de Ber
noutti B a v . a . X tem uma distribuição de Bernoutii.
Imagine, agora , que repetimos um ensaio de
Bernoul li n vezes, ou , como se diz t ambém, obtemos uma
amostra de tamanho n de uma distribuição de Bernoulli .
Suponha , ainda, que as rapetiçÕes sejam independentes, isto
6, resultado de um ensaio não tem influência nenhuma no

3 2
- 41 -

resultado de outro qualquer ensaio . Uma amostra particular


será constitu£

da de uma seqÜência de O e l , tal como (O, 1 , qui . nt:


5. A probabilidade de uma tal amostra gerš
42 -

O nÚmero de sucessos nesta amostra igual a 3,


sendo 2 0 nú
mero de fracassos .
Podemos, considerar , pois as situações :

( I ' ) uma moeda é lançada três vezes;


qual a probabilidade de se obter
exatamente duas caras?
um dado é lançado cinco vazes; qual a
probabilidade de se obter face 5 no
máximo 3 vezes?
10 peças são extra £ das ao acaso .
com reposição, de um lote contendo
500 peças idênticas; qual a
probabilidade que todas sadarn
defeituosas , sabendo-se que das
peças são defeituosas?
(4 ' ) Qual a probabilidade que , dentre 5
pessoas escolhidas ao acaso dentra 1 . 000
pessoas. duas sejam do sexo masculino?
( 5 ' ) Escolhemos ao acaso 3 livros de uma
biblioteca contendo 10 .000 volumes; qual a
probabilidade de que 2 sejam de Matemática,
sabendo-se que a biblioteca possui 1.000
livros da Matemática?
Observa que nos exemplos e o fato dB as
termos extraindo os objetos dB um condunto
multo grande, im plica que podemos supor
que as extraçöeg sedam praticamente
lhdependentes.
Vamos resolver o problema supondo-se que
a moeda é *honesta i', isto í, P (sucesso) P
(cera) indiquemos sucesso (cara) por S e
fracasso (coroe) por F. Então.
estamos interessadas na probabilidade do evento
A {SSF , SFS , Fss} ,

ou. em termos da notação anterior, na probabilidade de obter


as amostras (l , 1 , 0) , ( 1 , o.
q e P (A) P (SSF) + P (SSF) + P (SFS) P (FSS) e. devido à in
dependãncia ,
1
1 1 1 P
ISSF)

Portanto . P (A) 3/8 .


1
Se a moeda não tiver P (S) — e asta for igual e p,
- 44 -

09<1 , então. sando q

p • q, de modo que

3p2 •q.
uma característica importante dos experimentos que estamos
considerando qua estamos interessados apena g no nÚmero totai de
sucessos, a não na ordem am que ales ocorrem. Podemos construir a
tabela qua segue, para lançementos da moeda . (Vide tabela na página
seguinte) .
Vamos designar por b ( k B n, p) a probabilidade de se
obter k sucessos am n provas da Bernoulli, sendo p a probabllidade
de sucesso am ceda uma dalas. No exemplo dado.
1 3

NÚMERO DE PROaABILIDADE
SUCESSOS

0 q
2

1 3pq
3/8
2 3p2q
3
3 p 1/8
enquanto que

3p2q .
Note qua q S +3pq 2 +3p 2 q•p 3 (q+p) 3 1, pois P+q - 1 .
Em termos da v. a . . se Sindica o número total da
n sucessos am n provas de
Bernoulli, então P (S = k) • b (kJ n. p ) .
É claro qua os possíveis valoras da S são O , 1 , 2 . .
paras constituam a chamada distribuição bino—
miai. Para o exemplo com obtemos O I gráfico da fi gura 3.1 .

3/8

O 1 2 3

Figura 3 . 1
- 46
Em uma seqüência de n provas, uma seqÜência qual-
quer com k sucessos e n-k fracassos, ou , o que e o mesmo , u ma
seqÜência de k uns a n -k zeros , terá probabi lidade

Esta função. para esta seqÜSncia de resultados , en carada como


função da p , ã chamada funçao de ver088imiLhan—

Ainda no exemplo

2 3 2
= 3pq 1 pq .
3

Para n = 3, podamos escrever, pois ,

para k = O,
Para se obter uma f Órmula geral , basta saber quantas
saqÜências com k sucessos e n-k fracassos podemos formar.
cada uma tendo probabilidade dede por ( 3 . 1 ) . É fácil

var que existem tais seqÜãncias. de


modo que
Vamos considerar, agora, o problema ( 3 ' ) . Aqui ,
temos na IO provas da Bernoul li . cade uma com P (sucesso)
1gual a P (peça defeituosa) • p 0, 1 . Queremos
1
10) b (10; 10
10

Utilizando (3. 3) ,
1010
1 10 1 91
b(10J 10, 10 10
10 10 10

A variável aleatória S pode ser pensada como a so


ma de n variáveis aleatórias, definidas do seguinte modo :
1 , se na primeira prova ocorre SUCBSSO
x
1
o, se na prima ira prova ocorra fracasso
1 , se na sagunda prova ocorre sucesso x

2
o, se na segunda prova ocorra fracasso
- 48 -

1 , se na i -és ima prova ocorre sucesso x


O, se na i -éstma prova ocorre fracasso
1 , na n-ãslma prova ocorre sucesso x
o, se na n-ásima prova ocorra fracasso

Portanto, s . ObsBrve qua todas


nn
X têm os mesmos valores (O ou l ) . com
variáveis X x
n as mesmas probabilidades, isto é,
P CX • l) — p. P (X a O) -q=l-p.
Devido independêncie das provas, as v . a . X X n são In
pendentes. Dizemos que eles säo independentee e identicamen
te distribuddag ( i . i . d . ) •

É imediato que
ao passo que
2 2 2

do que decorre

Var(X ) p2
pela. generalização da propriedade (2 . 12) ,

enquanto que, pela independência e usando uma generalização


imediata dB ( 2 . 15 ) ,
Var (S ) n
Para o exemplo (3 ' ) ,
1
10) 10 x 10
Enquanto foi relativamente fácil obter pa ra o
exemplo não geria imediato obter, por exemplo,

Felizmente, existem tabelas que dão as probabilida


des (3 .3) para um grande número de valores de n e p .
Utilizando a tabela I do Apêndice 1 , vemos qua a
probabilidade a cima é dada por 0, 19 .
Para n grande (maiores que IO , ae p não está muito
próximo de O ou i) veremos uma maneira de aproximar b ( kl n, p).
50

Sa n grande e p está prÓximo de O, podemos usar a aproximação


-np

e uma tabela da função do segundo membro de ( 3 . 8 )


encontrase no Apêndice 1 (tabela 4 ) .
Por exemplo,

- 0 , 1 2 b (2; 1 . 000;
O, 0001) 0 , 004 5 . 2 1.

3 . 2 - A D I STR I BU I ÇÃO H I PERGEOMÉTR I CA


Este modelo é adequado quando consideramos
extrações casuais faltas de uma população, considerada
dividida em dois atributos, e estas extraçaes são feitas sem
reposiçao. Para ilustrar, considera uma população de N
ob„ietos . r dos qual s são defeituosos e N -r são não
defeituosos . Um grupa de n elementos e escolhido ao acaso.
Vamos calcular a probabilidada da qua este grupo contenha k
defeituosos . Observe que
[JSR fácil ver que asta probabilidade é dada por
r N-r
n
Os paras ( k, p ) constituem a di8tribuição hipergeo
me trica.
Se definimos a v. a. X igual ao número de defeituo-
sos na amostra, então P (X = k) dada por ( 3. 9 ) .
Exemplo 3 . 1 - Em problemas de controle de qualidade , lotes com N e lementos são
examinados . O número de elementos com defeito, r, desconhecido. Colhemos
uma amostra de n elementos e determinamos k . Somente para i lustrar, suponha
que num lote de N = 100 peças , r= 10 são defeituosos . Escolhendo-se n = 5 peças ao
acaso , a probabi lidade de não se obter peças defeituosas a

enquanto que a probabilidade de se obter pelo menos uma defeituosa

Pode sar demonstrado que v . a . X definida acima tem mEdia


a variância dadas por

np,

V ar (X)

onda p E a probabilidade de se obter uma peça defeituosa


em uma Única extraçao . grande quando comparado
com n, então extraçôes com ou sam reposição serao
praticamente e-

quivalentes , dB modo que as probabilidades dadas por ( 3 . 9)


serão quase iguais as dadas pela fórmula ( 3 . 3) , isto
Do mesmo modo, os resultados ( 3 . 10) e ( 3 . 1
1 ) serao praticamente iguais aos valores correspondentes
distribuição binomial

3 . 3 - A D I STRI BUI ÇÃO NORMAL


Vamos considerar a distribuição binomia l para p = e n variável , digamos
n = 5 , 10 e 20 . Obtemos os histogramas da figura 3 . 2 .
Figura 3 . 2

( * ) Formalmente, considere limites para com ——p fixo.


Dado que p = 1/2, as distribuiçÕes serao simétricas
5
ao redor das respectivas médias,
1
Vejamos , agora. os histogramas para o
caso p os mesmos valores de n acima, isto
é, 5 , e 20 (Fig . 3 . 3 ).
0
.
2

5 10 1 5 20

Figura 3.3
As médias agora sio 1, 25; 2. 5 e 5 e as

distribuições não são simétricas ao redor destas médias

Observando as figuras podemos observar


os seguin-
tes fatos:
1
a) para p ã, por exemplo, à medida que n
cresce, a distribuiçäo mova-se para a
direita, torna-se mais acha

tada e mais espalhada;


1 b) para p=—, quando n cresce, a
distribuição vai "perden 4 do a sua assimetria"
(observa o histograma para n = 2 [I
Vimos que. quando n ã grande, é difícil ca lcular as

probabilidades b ( k; n, p) . A idéia é obtermos aproximações pa


ra estas probabilidades . Observando os histogramas acima, ve mos
que uma sugestão é aproximar a area do histograma area sob
uma curva contínua. Tal curva ã chamada curva nor—
ma Z . E aproximaremos probabilidades relativas a uma
binomial por probabilidades relativas a uma distribuiçao norma
t . CV e
1
5a figura 3. 4, para n=10.
0 8

Figura 3 . 4
A distribuição normal difere das distribuiçÕes
apresentadas até agora no sentido que á uma distribuição
variável contínua, ou sej a, através desta distribuição asso-
ciamos probabilidades a intervalos de numeros reais . Por examplo,
se ascolhamos ao acaso um individuo dB uma população e medimos
sua altura, podemos supor que ao resultado do

47

experimento associamos uma v. a. X que assume valores em um


certo intervalo de numeras reais, por exemplo, toman do o
metro como unidade . É claro que esta e uma aproximaçao
conveniente da realidade, pois a medida da altura do indiví duo
dependerá da precisão do instrumento de medida . Assim, se
dizemos que a altura encontrada E 1, 75 m, na realidade esta sera
um valor qualquer entre 1, 745 m e I , 755 m.
Na seção seguinte daremos algumas i dê ias sobre dis
tribuiçoes de varia veis can t {nuas; para uma tal v. a. X a pro
babilidade de X estar num certo intervalo, [ a , b] digamos, a
calculada como sendo a area, entre a e b, sob uma curva, que
é chamada função de densidade de X . Tal função sarasempre
nao negativa e a area total sob a curva será igual à unidade.
Compare com um histograma, cuja area total também é uni
tária . (Ver figura 3 . 5) .

b x

Figura 3 . 5

A distribuição normal a caracterizada por uma


funçao densidade. a o gráfico desta função tem a forma
vista
58

na figura 3 .4 .
Na realidade, não temos uma distribuição normal, mas

uma familia de distribuiçães normais, que são caracteri

zadas por dois parâmetros, que chamaremos u e


5, e 0>0. Variando u e a teremos os
diversos membros da lia.

Nos gráficos da figura 3 . 6 temos


três exemplos :
a) curva normal com u = O e a = 1;
b) curva normal com u = O e 0=2;
c ) curva normal com u -2 e a = I .

- 6

( b)

Figura
( c )
3. 6
Algumas observaçoes sobre as curvas :
a ) Para um mesmo (u = O) , a curva e mais achatada e mais
espalhada para um maior;
b as curvas s ao simétricas em relação ao ponto u;
c ) praticamente toda a area está concentrada entre os
pontos u -30 e u +35.

O que pode ser demonstrado é que os parâmetros e


correspondem a média e ao desvio padrão da distribuição; portanto a 2
e a variância da v . a . em questão .
Para calcularmos probabilidades sob uma curva nor-
mal necessário, antes, sabermos calcular probabilidades sob
uma particular normal, chamada normal reduzida ou nor— mat
padrao, que e caracterizadas pelos valores u = D e a = 1 . Di
zemos, também, que temos uma "normal 0, 1" e escrevemos :
N ( 0 , 1) . Ver figura 3.6 ( a ) . A tabela 2 do Apêndice I dá as
probabilidades sob uma curva normal padrão, que nada mais

Figura
60

são do que as correspondentes areas sob a curva . A tabala em


questão fornece a probabilidade de que a variável Z, normal

padrão , este 5 a entre O e um valor, z


P ( OSZ<z
) .

c
Assim , se z 0 , 4 582 .

Observe que ( fi gura 3 . 8 ) :


p [ — 1 . 73SZSO) P [ OÉZS1 , 73) 0 , 4 5 82 . devido sime-
tria da curva .
2) P ( OSZS1 , 73) 0 , 04 1 6,
pois P C Zž0) p ( zso ) .
3) 0 , 041 B .
4)

D . 4S82 0 , 27 74 .

Figura
3.8

Figura
62

Suponha , agora , que X se 5a uma v . a . com distribui-


ção normal da média u e variância a 2 , que indicaremos N (u,02).
Então . a v . a . Z , tal que

terá distribuição normal com média O e variância l , como e fácil ver


( O fato que Z é norma l não sera- provado aqui).
De fato ,

Por exemplo . calculemos P


to é , u = 3, a 2 = 16 . Utilizando ( 3 . 12) ,

P ( 2SXS5 )

Figura 3 . 9
Portanto , a probabi lidade que X estej a entre 2 8 5
é i g Lia I à probabilidade que Z estej a entre
ti lizando a tabela 2, vemos que
0 , 09870 , 19 1 50 , 2902

OU sej a ,

0 , 2902 .

Vejamos, agora, como podemos aproximar


probabilida des binomiais através da normal .
Suponha que a v. a. Y tem distribuição
binomial com
1
— e queremos calcular P (Y 27) . Vemos que (
fig . 3 .10)
2

Figura 3. 10
ara a do retangulo de base unitária a
altu
64

ra Igual P (Y -7 ) , e assim por diante,


logo P (Y 27 ) é a soma das áreas dos
retãngulos hachurados na figura 3. 10 . A
Idáia aproximar tal área pela área, sob a
curva normal, a direi ta de 6, 5. Qual curva
normal? Aquela dB média

- 10 x 1
variäncia a2
np

Ver figura 3. 11 .
Suponha , agora, que X sej a uma v . a . com distribui-
ção normal de m5dia u e variância a 2 . que indicaremos N (u ,02 ).
Então , a v . a . Z , tal que

terá distribuição normal com média O e variãncia 1 , como e fácil


ver ( O fato que Z é norma l não será provado aqui).
De fato ,

Var ( Z ) Var

Por exemplo , calculemos P ( 2 'X ÉS ) se X é N ( 3, 16 ) , is


to á, u = 3, a 2 = 16 . Utilizando ( 3 . 12) ,
Figura 3 . 9
Portanto , a probabi lidade que X estej a entre 2 a 5
igual à probabi lidade que Z estej a entre -0 , 2 S B 0 , 5 ,
52
ti lizando a tabela 2 , vemos que

0 , 09870, 191 s0 , 2 902

ou seja ,

0 , 2902 .

Vejamos, agora, como podemos aproximar


probabilida des binomiais através da normal .
Suponha que a v . a . Y tem
distribuição binomial com n=10 e pe— B
queremos calcular P (Y à 7) . Vemos que
C fig . 3 . 10)

10

Figura 3 . 10
area do retãngulo de base unitária
e altu
ra Igual P (Y -7) , B assim por diante. logo P
(Y 27) e a soma das áreas dos retãngulos
hachurados na figura 3. 10 . A idáia 5
aproximar tal área pela área, sob a curva
53
normal, direi ta de 6, 5. Qual curva normal?
Aquela de média

np - 10 x 1 variãncia a2

Ver figura 3 . 11 .
-

Figura 3 . 11
Chamando X tal v. a. normal ,

P (Y 27 ) P

P (Z 0, 94)0 , 1736 .
A vardadBira probabilidade 0, 172.
Vamos calcular
54

Figura 3 . 12
Vamos, atraväs da figura 3. 12, que a aproximação
a
ser falta deve sar
P C 3<YS6) 5SXS6 . 5)

3. 5 56 , 5 5
szs
1, 58 1, 58
0 , 6 528 ,
ao passo que a probabilidade verdadeira é 0 , 656 .
A Justificativa formal de tal aproximação é dada pelo chamado
Teorema de De Moivre-LapIace, que e caso parti cular do chamado
Teorema do Limite Central . Ver Apêndice 2 .

3 . 4 - VARIÁVE I S ALEATÖRI AS CONTTNUAS

Vimos até agora , com exceção da normal, varia veis aleatórias que têm

distribuiçÕes discretas , ou sej a , os valores da v . a . pertencem a um conjunto


enumerável (finito ou
55

infinito) de numeros .
Quando isto nao acontece, necessitamos de veis
que podem tomar valores em um contínuo de pontos , de tal
sorte que a "massa" em um particular ponto seja O . sã
terá sentido, para uma variável aleat6ria cont£nua X , falar na
probabilidade da X pertencer a um certo intervalo
Para uma v . a . discreta Y falamos na probabilidade de Y
assu mir um valor y isto é, P (Y = y ) .
A maneira de caracter'izar uma v . a . cont£nua
través de uma função f ( • ) , que sej a não negativa e dg
tal modo que a área total sob a curva representativa de f (
• ) se ja unitária . Deste modo, definimos [figura 3 . 13)
P (a'XSb) - area sob f ( • ) desde
a at ã b
53
-

Figura 3 . 11
Chamando X tal v. a . normal ,

P(z 0, 94) 0, 1736 .

A verdadeira probabilidade 0 , 172 .


Vamos calcular

o 1 2 3 4 5 6 7 8 9 10
54
Figura 3 . 12

Vemos, at ravas da figura 3. 12, que a aproximação a


ser feita deva ser

6.55
ssxss 1, 58 szs 1. 58

0 , 6 528 .
ao passo que a probabilidade verdadeira ã 0, 656 .
A j ustificativa formal de tal aproximação é dada pelo chamado Teorema
de De Moivre-Laplace, que e caso parti cular do chamado Teorema do Limite
Central . Ver Apêndice 2.

3 . 4 - VAR IÁVE I S ALEATÖRI AS CONTTNUAS

Vimos até agora, com exceção da normal, variáveis aleatÓrias que têm
distribuiçÕes discretas, ou seja, os valores da v. a . pertencern a um conjunto enumerável (
finito ou infinito ) de numero s .

Quando isto não acontece, necessitamos de


variáveis que podem tomar valores em um contínuo da
pontos, de tal sorte qua a "massa" em um particular ponto
seja O . só terá sentido, para uma variável aleatÓria
cont£nua X. falar na probabilidade dB X pertencer a um certo
intervalo ta, b] . Para uma v . a . discreta Y falamos na
probabilidade de Y assu
55
mir um valor Y isto á, P (Y -y ) . j
'
A maneira de caracterizar uma v. a . cont£nua X é através
de uma função f ( • ) , que seja não negativa e de tal modo que
a área total sob a curva representativa de f ( • ) se á a unitária .
Desta modo, definimos (figura 3. 13)
P (a'XSb) ara a sob f ( • ) desde a atá b

a b x

Figura 3. 13
A função f ( • ) á chamada funçao densidade de X .
Exemplo 3.2 2 x, para D' x SI e zero fora das ta in
t erva 10, vemos que f (x) 20, V x e a área sob f ( • ) E unitária.
(Figura 3. 14) .
56

x
Figura 3.14
Se queremos calcular P vemos que esta pro-
1
babilidade é igual a área do triângulo de base — e altura I 2
hachurado na figura 3. 14, Ioga a probabilidade em questão e
1/2x1

Exemplo 3 . 3 — A chamada distribuiçao uniforme sobre o in tar valo


[O, 1] á aquela cuda função densidade á dada por:

1
57

1
4

Figura 3 . 15
1
Observe que Pã' que é a área do ra tang

ulo de lados 1 e 3/4 1/4 2/4 1/2 da figura 3 . 15 ,

Formalmente,
b

Se queremos calcular a média da uma v . a . X com fun


ção densidade f ( x ) . podemos pensar da seguinte maneira. Pri mel
ramente. observe que f ( x) não é uma probabilidade , mas se h á
pequeno, (figura 3. 16) .

Figura 3. 16
b

Figura 3. 13
A função f ( • ) é chamada função densidade de X .

Exemplo 3 . 2 - 2 x, para OS x SI e zero fora


deste in ter valo, vemos que f ( x) à O, V x e a área sob f
( • ) ã unitária .
(Figura 3 . 1 4 ) .

Figura 3. 14
Se queremos calcular P (OSX<—) , vemos que esta pro-
1
babilidade é igual a área do triângulo de base — e altura I 2
hachurado na figura 3. 14, logo a probabilidade em questão e
1/2x1
1 /4 .
2

Exemplo 3 . 3 — A chamada distribuiçao uniforme sobre o inter valo


[O, 1] á aquela cuda função densidade á dada por:

x
Figura 3 . 1 5

Observe que P que e a área do


tang ulo de lados 1 e 3/4 1/4 - 2/4 1/2 da figura 3 . 15 '
Formalmente,

a
Se queremos calcular a média dB uma v . a . X com fun
ção densidade f ( x) , podamos pensar da seguinte maneira. Pri mel
ramente, observe que f ( x) não é uma probabilidade, mas sa
h ã pequeno, (figura 3. 16) .

Figura 3 . 16
57

Portanto, dividamos o intervalo Ca, b] onde


em n partes da amplitudes iguais a h = ( figura 3 . 17) .
n

Figura 3. 17
Defina a Y que assume os valoras x
1
(3.16) temos, por exemplo ,

3 3 3 3

Desta maneira ,

0a fina, então,
lim E

Para o exemplo 3 . 2 , cada intervalo


terá amplitude

..,n-l,
portanto,

quando claro que, da definição de integral , de


-
58

vem

b x f ( x) dx .
a

Exemplo 3 .4 - A função de densidade norma L é dada por

com

Para uma v . a . com densidade ( 3 . 20) temos :


2

u e Va r (X)
b) u:ta são dois pontos de inflexão da curva;

1
c) 0 ponto máximo de f ( x ) ;
d) lim f [ x) o .

x
57 -

Figura 3 . 1 B
Temos, na realidade . uma famí lia de densi
dades normais , variando eõ.

Exempo 3 . 5 Dizemos que X tem distribuiçao ezvonenciaL


se
Portanto, dividamos o intervala Ca, b] onde em n
partes de amplitudes iguais a h = (figura 3 . 17)
n

Figura 3. 17
Defina a Y que assume os valores
( 3 . 16 ) temos , por exemplo,

Desta maneira ,

Defina, então,
58 -

Para o exemplo 3 . 2, cada intervalo terá


amplitude
, portanto,

quando

claro qua, da definição de integral ,


vem

b x f (x) dx.
a

Exemplo 3 .4 — A função de densidade normal ã dada por

com

Para uma cam densidade ( 3 . 20 ) temos :


V ar (X) 2
b) 1.1±0 são dois pontos de inflexão da curva ;
1
c) e o ponto máximo de f ( x ) ;
59 -

d ) lim f ( x) o .

Figura 3 . 1 ô
Temos, na rea lidade , uma famí lia de densi

dades normais , variando ea.

Exempo 3.5 Dizemos que tem distribuiçao exponencial se


60
a densidade x e dada por
-ax

xè0

Figura 3 . 1 9

fácil ver que E (X) 1 e Var( X ) 1


xerc{cios) .

PROBLEMAS PARA O CAPITULO 3

3 . 1 Obtenha b ( k ; n , p) para :

k=10.
3.2 se x 6 uma a . binomial com par;metro -5 p ã, 1
ob tenha :

d)
61
3.3 Num teste tipo certo -errado , com 50 questÕes, qua1 é a
probabilidade que um aluno acerte 809; das questões, su
pondo que ele as responde ao acaso?
3 . 4 Mesmo problema, com 5 alternativas para cada questão
.
3 . 5 Numa partida de 20 rádios foram escolhidas , ao acaso ,
5 unidades para serem inspecionadas . Sabe-se que há
de rádios defeituosos . Calcular as probabilidades
abaixo, nos dois caos :
a) extração com reposiçao;
b) extração sem reposição :
1) probabilidade que a amostra seja formada só por rádios com defeito;

2) probabilidade que haja apenas um com defeito ;


3) probabilidade que todos sedam bons .
Em um experimento binomial com 3 provas, a probabilidade de
exatamente Ž sucessos é 12 vezes a probabilidada de 3
sucessos . Encontre p .

Em uma pesquisa de opinião p Ública , 3 dentre 4


pessoas entrevistadas são favoráveis a uma certa
proposi Em uma amostra de IO pessoas entrevistadas,
qual a probabilidade que pelo menos 3 sejam
favoráveis?
3 . 8 Prove que
62
Y . ã uma v . a . binomial com n=10 e p Determine a a

pra xi mação normal para :

b) P (Yè7)

3 . 1 0- Se uma moeda é lançada 500 vezes, e P ( cara) ter


a probabilidade de ocorrerem 285 caras .
3 . 1 1- Vimos que, para n grande e p pequeno, as
probabilidades binomiais b ( k; n , p) podam ser
aproximadas pelas pro
babilidades de Pois son
-np

Suponha que um processo de fabricaçao produza itens dos quais 2 em 1 .000


são defeituosos . Em um lote de 500 itens , qual a probabilidade que
nenhum dos itens sej a defeituoso?

3 . 12- Sej a X com distribuição normal com média u = IO e variancia


a 2 =4 . Calcular:
a
)

b)
c)
d)

3 . 13- As vendas de um determinado produto têm distribuição


aproximadamente normal com média 500 e desvio padrão
63
50 . Se a empresa decide fabricar 600 unidades no mês em
estudo , qual é a probabilidade qua não possa atender a
todos os pedidos deste mês, por estar com a pro duçäo
asgotada?
3 . 14- Encontre a mãdia a a variância das v . a . cujas densida des
são :

3 . 15- Obtenha E (X) a Var(x) para X com distribuição normal


dada por ( 3 . 2) do texto .
3 . 16- Idem, para X com distribuição exponencial dada
por
(3.21) do texto .
• INTRODUÇÃO INFERÊNCIA ESTATISTICA

"O cidadão comum pensa em "estatísticas" como sando colunas de


numeros em páginas de esportas ou em seçÕes e conÔmicas de j ornais , ilustradas com
gráficos em zig-zag, pi lhas de moedas e linhas de pessoas . Mas o estat£stico de ho
jenão compila tabelas de dados e os ilustra graficamente . Ie trabalha em tarefas
científicas e profissionais que s ao interessantes e complicadas . Seu trabalho é o de aj
udar a planejar experimentos, interpretar dados obtidos de observa çoes e
apresentar os resultados de maneira a facilitar a to mada de decisoes razoáveis . "
64
- PROBAB IL IDADE E ESTATÍST I CA

O trecho acima, extraído do • folheto "Carreiras em


Estatística " , publicado pelo Comi tê de Presidentes das
Sociedades Estatísticas Americanas, pode tentar descrever o
campo de açäo da Estatística .
O obdetivo da Teoria das Probabilidades ã constitu ir
um modelo matemático para uma situação física e, a par tir
desta modelo, deduzir propriedades da situação.
A matéria prima da Estatística e um conjunto da da
dos . A grosso modo, podemos dizer que a Estatística se
preo c upa em coleta r, analisar e fazer inferências a partir
de
dados .
Portanto, a Inferência Estatística, que se baseia na Teoria das Probabilidades,
uma parte apenas do campo de ação da Estatística . O obj etivo da Inferência Estatisti-
ca e o de inferirpropriedades de um agregado maior (a po— de
pulação) a partir um conj unto menor (a amostra) .
de dacisoes " razoaveis " mencionada acima,
A tomada
será feita , pois , ç ao a a partir de dados, que fornecem informauma
respeito de dada caracteristica da população.na
qual estamos interessados . Esta característica pode ser representada por uma variável
aleatória, e os dados são , então, valores desta variavel . Se tivéssemos informaçao comp
leta a respeito da distribuição de X, isto é, s g conheces-

semos os pares de valores (x . ,bem como os parama1 t ros


da distribuição (n e p, no caso da binomial, por exemp 10) , então não
haveria necessidade de colher uma amostra da X. Normalmente, nossa
65
informação a respeito da X á parcia 1 , ou mesmo nada conhecemos .
Podamos, por exemplo, saber que a distribuição de X binomial, mas
desconhecemos os pa rãmetros que a caracterizam, ou podemos ter uma
idáia da mã dia e da variância de uma distribuição e não sabemos qual a
sua forma .
4 . 2 - MODELOS ESTATÍST I COS

Vamos apresentar alguns exemplos simples, que nos


darão uma i dá ia do tipo de problemas com os quais um estatis
tico pode lidar.

Exemplo 4 .1 — No exemplo do capítulo 3, tinhamos um ex perimento


envolvendo uma distribuição binomial, na qual s U -
1
pomos que p=—. Conhecendo-se n , podemos calcular b ( k; n , p ) , 2
para qualquer k = 0 , 1 , . . . , n . Suponha, agora, que lançamos uma moeda n - 50 vezes e
obtemos 40 "caras' (sucessos) . Com esta informação (nÚmero de sucessos) queremos
estimar o valor de
p = P (sucesso) . Temos, um problema estatístico .
aqui , seria um bom
estimador de p? numero Por outro lado, observando-se o
de caras obtidas , 40, podemos suspeitar da "
honesti-
dade " da moeda usada, isto é, podemos querer testar a hip5—
1
tese que p Com os dados obtidos, podemos ser levados a aceitar ou rejeitar a hipótese
formulada. Temos, então, dois problemas básicos da Estatística: o primeiro diz-se um
pro— b Lema de estimaçao , enquanto que o segundo é um problema de teste de
66
hip5teses . Os dois capítulos seguintes tratarão cm pormenores estes problemas para o
caso específico do parame

tro p de uma binomial .

Exemplo 4.2 - Consideremos, novamente, o problema da inspe-

ção dB qualidade do cap£tulo anterior. Lotes de N objetos são


suj eitos ao controla de qualidade, mas suponha que o nu

mero da peças defeituosas, r , seja desconhecido . Uma amostra de tamanho n e escolhida


ao acaso e o nÚmero de peças defeituosas, k, e deterfrlinado . O modelo para a situação
sera

onde X = numero de defeituosos na amostra. A diferença entre

esta situaçao e a descrita no capítulo 3, e que agora

desconhecido.
Suponha qua um comprador tem que tomar uma decisão sobre
um lote com N peças . Ele pode, como no exemplo 4 . 1 , es tar interessado
em estimar r, baseado no valor observado de
X. Ou então, pode tomar a decisão de comprar o lote, menor ou igual a um
determinado valor e devolver o lote se k E maior que este úalor.
67
Exemplo 4.3 - Suponha que temos uma esfera de aço e medimos o
seu diâmetro, obtendo-se o valor d . Se D representa o ver dadeiro
valor do diâmetro, então podemos estabelecer a mode

10

de -mensuração . Se efetuarmos va-


onde e representa o erro
rias medidas, d d podemos escrever,
d do diâmetro,
1' 2' m
do mesmo modo,
-

d e uma porque e sera uma v . a. O pro b lema que sa apresenta 0


de estimar D. ou testar hipóteses a respeito a de D, baseando-nos nas m observações d
1 ' d2'
Normalmente, várias suposições são feitas a respai m to da distribuição das
variáveis aleatÓrias e . . Ver capitu-
1
Io 8 para a SOIUÇSO deste problema.
Exemplo 4.4 - Um dado é lançado 300 vezes, com os seguintes
resultados :
OCORRÊNCIA 2 3 4 5 6
1
68
FREQOÊNCIA
Com estes dados, qua remos saber se o dado é "hones to " , isto E, a
probabilidade de ocorrência de qualquer face seja 1/6 . Isto á, queremos testar a
hipÓtese que p 1 = p2

onde p -P (face i ) , i Este é um ti po


de tes 6 te bastante comum na prática, chamado teste de
aderencia ou
ajus tamento.

Exemplo 4 . 5 - Podemos estar interessados em mais de uma


categoria em um teste da aderência.
Considere a tabela abaixo, em que I 'DOO indivíduos
foram classificados de acordo com o sexo a de acordo com o fato
de saram ou não daltõnicas:
HOMENS MULHERES

NORMAIS 442 514


DALTONICOS 38 6

Temos, pois , duas categorias (ou atributos ) . Oe cordo com um modelo


genético, estes numeras deveriam ser consistentes com

q 2 /2
onde q = e a proporeao de gens que causam daltonismo na
população .
O objetivo, pois, e testar se os dados obtidos sao consistentes com o
modelo genético proposto . Ver problema

4.5,
Outras vezes, podemos querer testar a independência
entre dois atributos, dada uma tabela do tipo acima.
Tais tabelas são chamadas tabelas de contingeneia.
Nos exemplos 4 .4 e 4 . 5, temos casos em que o experi mento tem mais
de dois resultados poss£veis . A distribuiçao apropriada para descrever tais
experimentos é chamada distribuiçao multinomiat (ver exercícios) , que tem papel re
levante na obtenção dos testes mencionados nos dois exemp 10s anteriores (os
chamados testes do qui—quadrado) .
PROBLEMAS PARA O CAP r TOLO

4 . 1Suponha que temos n provas de Bernoul li com


P ( sucesso ) p e sej a X igual
ao numero de sucessos obtidos . Qual é um estimador
razoável de p?
4 . 2 Obtenha E (õ) e V ar onde e o
estimador que v oce encontrou em 4 . 1 .
4 . 3 Suponha que capturamos, marcamos e
depois soltamos r animais de uma
população com N animais, sendo N desco
nhecido. Depois da algum tempo,
capturamos n animais , dos quais
constatamos que são marcados . Descreva
um modelo para a situação em dois casos :
a) supondo que n e suficientemente pequeno,
comparado com N, de modo que a amostragem
poda ser considera da com reposição;
b) amostragem sem reposição .
No caso b, qual um limite
inferior para o valor de
4 . 4Suponha que quando realizamos um experimento,

mante um dos eventos A , A ocorre . Ou sej a ,


A
1 '
A constituem uma partiçao do espaço
amostra I Seda p = P (A ) e suponha qua
p . permaneça constante durante as
repetiçÕes do experimento . Defina as v .
a .
x X como segue :
71

x numero de vezes que A ocorre


dentre as n rapetiçÕes do
experimento,

Prova que
n
k
onde n. Esta é chamada distribuiçao mu t
tino— mia Z de probabilidades .
4 . 5 Justifique as probabilidades teóricas dadas no exemplo 4
. 5 tendo em vista o seguinte . O daltonismo 5 uma
característica genética ligada ao sexo. Cada pessoa a
presenta um par de cromossomas sexuais , sendo que
homem este par 5 denominado X Y e, na mulher. XX . O
dal tonismo caracterizado por um par de gansa
que chama remos D e d, sendo que, no homem, O ou d
só podem estar localizados no cromossoma X, ao passo
que na mu1 her podem estar localizados nos dois
cromossomas X .

NormalNormal

Daltanica
Oaltônico

HOMEM MULHER

A situação e a esquematizada acima e, no exemplo 4.5,


isto d é o gen que ocasiona o
daltonismo. Vemos que se, na mulher, aparece o par OD ou
a pessoa e normal, ao passo que se aparece dcl, a
Óessaa é daltônica . Suponha que a probabilidade de ho
mem ou mulher na população seja 1/2 . Em genética, q e
chamado freqÜencia genica do gen para daltonismo .
73
-

• ESTIMAÇÃO: PRIMEIRAS IDEIAS

Neste capítulo vamos considerar tão somente o prob lema de estimar o


parâmetro desconhecido, p , de uma distri buiçäo binomial . Esta caso particular servirá
para introduzir alguns conceitos importantes .

5 1 - UM ESTIMADOR POR PONTO DE p

Vamos considerar o seguinte


Exemplo 5.1 - Uma amostra de n = 500 pessoas da uma cidade ã
escolhida e a cada pessoa da amostra ã feita uma pergunta a respeito
de um dado problema municipal, para o qual foi presentada uma
solução pela Prefeitura . A resposta à pergun ta poderá ser "SIM"
(favorável à solução) ou " NÃO " (contrário à solução) . Deseja-se
estimar a proporção de pessoas na cidade favorável a solução
apresentada .
Como na capitulo 3, definimos as v. a . x x
1'2'
X onda
- 74
1 . se a i -'sima pessoa na amostra responda "SIM" , se a i -
ésima pessoa na amostra responda "NAO " ,
-

e sej a p = P ( sucesso) , onde aqui "sucesso " significa que


a pessoa responde SIM à questão formulada .

Logo, se S xi , S tem distribuição binomial

n n
Então, se s - k, Isto é, valor
observamos o
n k da
obtemos p - k/ n como uma p .
estimativa de Embora
não

com e p e o problema consiste em


parâmetros n
estimar p, a uma pessoa
probabilidade
de escolhida ao acaso da
responder "SIM" . população,
- 75
É claro que S representa o numero de pes

soas da amostra que "SIM" logo possível


responderam timadop de p é . um es—

n
n vamos enfatizar esta diferença, observe
que dado por (5 . I) e uma v . a. , ao passo que
k/ n é um numero, isto é, um valor da v. a . Por
exemplo, se 300 pessoas responderam "SIM" à per
300 gunta, então p = = 0,6 e
dizemos que 0, 6 uma estimativa 500 da
proporção dâ pessoas na população favorável à
iniciativa
da Prefeitura .
Vej amos algumas propriedades de Como

e Va r (S ) segue-se que
n
p,

_ neq _
2
n n
- 76
Para n fixo, a função atinge seu máxin n
mo para p = 1/2, logo
1

4n •

1/2 1 p

Figura 5 . 1
No exemplo dado, var(ñ) S = o, 0005; e claro 2 . 000 que Va
r (ã) tende a decrescer quando n aumenta. Em particular, devido a ( 5
. 3) , Var(ñ) + O quando n Esta propriedade, juntamente com (5 .2) nos
diz que é um estimador con sis tente de p .
O estimador p á também chamado nao viciado ,
pelo fa to de ( 5 . 2) ser válida; ela nos diz que, em média, "
acerte p" , ou seja, se escolhermos várias amostras, e para
cada uma calculamos p, a média destes valores estará
próxima de p . Esta qualidade de um estimador ã desej
ável , mas n ao e su fi ciente , como veremos depois . Pode
acontecer que para uma particular amostra p estej a bem
distante de p .
- 77
O estimador dado por ( 5 . 1 ) chamada estimador por ponto, pois
obtemos um Único numero que escolhemos como re-
-

presentante do verdadeiro valor de p, que desconhecido .


Exemplo 5.2 - Somente a título de ilustração , vejamos a
distribuição de num caso particular, no qual supomos p
conhecido e igual a 1/2 . Considere n - 3. Portanto ,
sume os valores O, I , e 3 com probabilidades 1/8 , 3/8, 3/8
e 1/8 , respectivamente ( ver capítulo 3) . S sn
3
Os valores possíveis de s ao o , 1/3, com
probabilidades 1/8. 3/8 , 3/8 respec-

tivamente . De fato,

/ 3=2/3) P (S 3=2) 3/8, etc

s
3
n

n
- 78
Figura 5 .2
Temos que
1

1 1 3 2 3 1 1
x x
Ver figura
79

5 2 -A LE I GRANDES NOMEROS

No capítulo I mencionamos que uma maneira de olhar


para a probabilidade de um evento A de maneira intuitiva e a A um
repetir o experimento que dá origem certo numero n
de vezes e contar quantas vezes. o evento A ocorre nes-
k
tas n repetiçÕes . Para n grande,
Podemos formalizar esta idEia intuitiva para o caso em que temos
n provas de Bernoulli cam probabilidade
de sucesso . O fato de, para n grande,estar suficientemen n te
proximo de p e posto nos seguintes termos : para qualquer
numero

ou, de modo equivalente,

O resultado ( 5 . 5 ) (ou ( 5 . 6 ) ) á chamado tei dos gran


deg numeros para provas de Bernoulli . A prova deste resu lta
do, embora simples, será omitida . (Ver Apêndice 2) .
A relação ( 5 . 6 ) implica que, para todo numero e >
O, k - p l, quando n -> œ.
Podemos formular a seguints questão :
quantas repe-
tições do experimento, n, devemos realizar a fim de que k/ n
80
difira de p de menos de E, com probabilidade maior ou igual

Isto e , qual deve ser o valor de n para que tenhamos

Portanto.

1-
onde ô =
Como nao conhecemos p , usamos o fato que
p( l-p) s logo , basta tomar o numero de provas n tal que
1

Exemplo 5 .3 - Quantos ensaios com probabilidade p de SUces-

so devemos realizar sa queremos E = 0, 01 e Y Portanto ,


queremos n tal que

I -Y = 0. 05 portanto basta tomar 24


• (0, 05) CO. 01)
50 . 000 .

Para alguns valores da e os respectivos valores de n


estão dados na tabela abaixo, para a 0, 95
81
0 . 01 0 , 05
n 50 . 000 2 . 000 soo 125
Estes valores de n são desnecessariamente grandes . Utilizan do a
aproximação normal, sabemos que

- 0 , 95 ,

lembrando que o numero esperado de sucessos e e o desvio padrão é

Portanto ,
0,95

e chamando vemos que n = 2 Novamente , como


pq 1/4 , basta tomar n - 1 / e no máximo. Obtemos a nova
tabela abaixo,
0,0 0,
1 05
10 400 100 25
.
00
n 0
Exemplo 5 .4 - A uma dada
proporção de fumantes população
de ã p, desconhecida.
com um
Queremos determinar p
erro de, no
máximo, 0, 05 . Qual
da amostra
deveria ser o tamanho
n, a ser
82
escolhida com reposição, se Y = 0.95? Devemos ter

p{ l s -np l so , 05n} Y.
onde S = numero de fumantes na amostra. Portanto , devemos
n tar n
= 400 .

5 . 3 - EST IMAÇÃO DE p POR I NTERVALO

Vamos considerar. agora , o caso em que queremos


construir um intervalo de confiança para p, isto é, um Int erva Io
[E, p] que contenha p com uma dada probabilidade , cha

mada coeficiente de confiança . Fixado este coeficiente,

devemos ter que a P {p p} s - np


n
Sabemos que npq tem distribuição aproximadamente normal
padrão . Chamando Y este quociente, temos que

Assim, se Y - 0, 96, temos. consultando a tabela 2

0. 95 ,
83
ou sej a ,

pq 1 96} 0 , 95 .

Portanto, com probabilidade o, g 5 temos que

do qua segue

Novamente, como não conhecemos p * usamos o fato

que pq logo obtendo-se

ô- 1 , 96/ÃÑ.

Dizemos que [ô -1,96/ um intervalo


de confiança para p com coeficiente da confiança da 95% .
-

Exemplo 5.5 - Numa pesquisa de mercado, n 400 pessoas foram


entrevistadas sobre um determinado produto e destas pessoas
preferiram a marca A . Aqui, 3 - 0 , 6, e um intervalo de
confiança para p, com Y = 0, 95 sera

1
84
ou seda, 0 , 649 ] .

Para um coeficiente de confiança qualquer Y, temos


que (5. 12) fica

y O/ Ãñ S p s y o/ v'G,
onde yo 6 obtido da tabela 2 tal que P { -y o S Y s y D)
te intervalo chamado pelos estatísticos de conservativo,
pois sa p não for igual a 1/2 e estiver pr6ximo de O ou de
1, então (5 . 13) fornece um intervalo de amplitude desneces-
sari amente grande, pois substitui mos pelo valor máximo

pq
1/4. A mamos que 1/2, podemos usar o intervalo do exem-
plo a seguir.

Exemplo 5.6 - ( "Enfoque o ti mista " ) . Suponha que em n • 400


provas obtemos k • 80 sucessos . Vamos obter um intervalo de
confiança para p com Y 0.90. Para tanto, usamos ôq como es ti
mador de pq a então ( 5 . 11) fica .com y O no lugar dB 1, 96)

No nosso caso, p = k/ n 80/400 • =0,8.

Portanto, o intervalo sera

isto é ,
85
[2 , ô ] - L 0, 167; 0, 233] .
Usando (5. 13) obtemos

ou seja ,

Observe que o primeiro intervalo tem amplitude menor


que o segundo.

Outra observação importante E a seguinte . Usando (5 . 13)


, para um Y fixo, os intervalos que podemos obter em sucessivas
amostras terão todos a mesma amplitude, dada por 2y / 'G. Por outro
lado, usando-se ( 5 . 14) , a amplitude do intervalo sari 2y
que variavel dg amostra para a mostra, pois (e conseqÜentemente ã)
variará de amostra pa ra amostra.
Em qualquer caso, a interpretação do qua seda um
intervalo de confiança para p com coeficiente dB confiança Y é
a seguinte : construindo 100 intervalos , correspondentes a 100
amostras de tamanho n, 100Y* deles conterão o valor p.
Graficamente, ter £ amos a situação da figura 5.3, supondo in tervalos
dados por ( 5 . 13) , isto é , de amplitudes constantes.

A 6
n
4
S
3

s 1

Figura 5 . 3

PROBLEMAS PARA O CAPTTULO 5

5 . 1 - Obtenha a distribuição de p quando p = 0. 2 n - 5 . Obtenha E


(ô) e V ar
5 . 2 Deseja-se usar p como estimador de p, com probabilida de
0, 975, ou mais, que difira 0, 05 de p . Quão granda
deve ser n?
5.3 Encontre o máximo para Var(ñ) quando n = 10 , 25 , 400 .
5 . 4 Encontre os intervalos de confiança para p se com coeficiente confiança 95% .
Utilize os dois enfo ques. conservativo e otimista .
87
5 . 5 - Utilizando a relação ( 5 . 13) do texto, encontre um
intervalo de confiança para p, sabendo-se que n 100 .
a que a amplitude do intervalo deve ser igual
0 , 096

5 . 6 Dê uma interpretação gráfica análoga da figura 5 . 3


para intervalos dados por ( 5 . 14) .
Uma amostra casual de 625 donas de casa revela que 70 por
cento delas preferem a marca X de detergente . Cons t ruir
um intervalo de confiança para p, a proporção da
população de donas de casa que preferem a marca X, com
coeficiente de confiança de g
Suponha que X seja uma v . a. com mádia variância
2 finitas . Se c um numero positivo , então
p ( l x-u l >ca) s 1/0 2 .
Utilizando asta desigualdade, prove a Lei dos Grandes
NÚmeros ( 5 . 5) . A desigualdade ( chamada Desiguat—
dade de Chebyshev .

5 .9 Suponha que X tenha distribuição


x o 1 2 3
p 1/4
Obtenha e compare com o limite superior dada
pela desigualdade ) de ( 5 . 8 ) .
88
0

6 • TESTES DE HIPOTESES: PRIMEIRAS IDEIAS

Como no capitulo anterior, vamos considerar aqui

somente o caso de testes de hip6teses a respeito do parametro

p de uma distribuição binomial . Em particular, veremos a

conexão entre intervalos de confiança e testes de hipÓteses .

6 . 1 - H I PÕTESE ESTATTSTI CA

Consideremos uma populaçao CLI Ó OS


elementos podem ser classificados segundo
dois atributos somente, que chama remos
"sucesso" e "fracasso" . Por exemplo, podamos
ter N ob dos quais alguns são defeituosos a
os restantes nao defeitüosos . Se designarmos
por p a proporção dg sucessos na população,
então o objetivo fazer algum tipo de
inferância sobre p . Vimos, no capítulo 5, como
estimar p. Neste capitulo, estamos interessados
em testar alguma hipÓtese so bra p.
89
Entenderemos por hip5tese estat{8tica a
qualquer afirmação que se faça sobre o
parâmetro desconhecido p . aasaados em uma
amoetra da população vamos estabelecer uma re
gra de decisao, segundo a qual rejeitaremos ou
aceitaremos
-

a hipÕtese proposta. Uma tal regra de decisão 5 chamada tes te .


Acima usamos vagamente os termos população e amostra , se
bem que no capitulo 1 (ver exercícios) introduzimos j á algumas noçÕes
sobre amostras .
Entenderemos por população a qualquer conj unto de
observações, enquanto que uma amostra é qualquer subconjunto
prÓprio da população. Por exemplo :
1 ) todos os poss£veis lançamentos de uma moeda constituam
uma população, enquanto que cinco lançamentos desta moeda
constituem uma amostra;
2 ) as alturas de todos os estudantes de uma escola cons tituem uma população; as
alturas dos estudantes de U ma particular classe da escola constituem uma amos-

3 ) os artigos produzidos por uma certa máquina em um da do


dia constituem uma população; se escolhermos dez desses
artigos para inspeçäo, teremos uma amostra de tamanho dez .
90
Somente consideraremos amostras ateatopiag, tal co mo foi definida no
capítulo 1 (problema 1 . 13) . Note que no exemplo 2 acima não temos uma amostra
aleatória .
Escolhida uma amostra de tamanho n, definimos
a.x nÚmaro de sucessos na amostra e consideramos
x n que
sera a proporção de sucessos na
amostra.
Basicamente , nossa regra de decisao uti lizara p
pa ra decidir sobre a rejeição ou não rejeição da hipótese
esti pulada para p .
6. 2 - TESTE DE UMA H I PÕTESE PARA p

Exemplo 6 . 1 - Um professor aplica um teste envolvendo IO


quæ tães do tipo certo -errado . Ele quer testar a hipótese
"o es tudante estã adivinhando . "

Vamos designar por p a


probabilidade do estudante responder
corretam'ente a uma questão . Então, a
hipótese
1
ser testada pode ser expressa na forma p =
É comum designa r -se a hi pá tese
formulada por H . Então queremos por a pro
va
1
O teste de H será baseado no " numero de sucessos nas n
repetiçÕes independentes do experimento" temos
n = IO repetiçÕes do e independência
experimento que acertar significa influência
uma questão não tem na resposta dada
a uma outra questão qualquer. O

numero de acertos . É claro que,


numero de sucessos
sera o se H for
verdadeira, o numa
05

1
ro de sucessos devera estar práximo de 10 x 5 .

Suponha que o professor adote a


seguinte regra de
decisao :
"Se oito ou mais resposta estão corretas, o estudante nao

está adivinhando, enquanto que se menos do


que oito tães estão corretas , o estudante
está adivinhando . "
Vamos indicar por X o numero de respostas certas por

S o espaço amostra 1 dos valores de X. Neste caso,

s 9 ,1 0 ) .
A hipótese H será rejeitada se observamos os valo-
res X = 8, X = 9 ou X = IO . Estes valores constituem a chamada
regiao cr;tica ou regiao de reäeiçao do teste, que será indi

cada por S 10} . A região de aceitgçao (ou de nao

rejeição) do teste será S 1 1 , 6 , 7 }. Um


gráfico ilustrativo e o que segue, onda indicamos por pontos
cheios os valores de X que pertencem região critica .

O professor sabe, no entanto, que é


possível que um estudante estej a
adivinhando e ainda assim ele acerta 8 ou
mais questÕes . Isto ã , H verdadeira,
mas sera rejeitada . O professor quer,
certamente, que a probabilidade deste
evento seda pequena. É fácil calculá-la :

56 7

O significado desta probabi lidade 6 0 seguinte :


o teste pudesse ser aplicado 128 vezes , o professor esperaria rejeitar H ( "o al uno estã
advinhando " ) , 7 vezes . A pro-
7
babilidade é chamada n {vel de s ignificäncia do teste e 12 8
será indicada por a . Temos, acima , um teste do tipo uni tate pat (à
direita , no caso ) porque so valores "de um lado espaço amostra 1 "
foram usados como pontos críticos .
Podemos ter testes bi—Zaterais , como ilustramos a

seguir.
Exemplo 6.2 - Dois quadros de futebol estão aguardando o j uiz lançar uma moeda
para ver quem dará a saída . Um dos ca pitães dá ao Juiz uma moeda . Como o árbitro tem
conhecimentos de testes de hip6teses e quer saber se a moeda e honesta, ele vai lançá-la
5 vezes; ele decide que a moeda e considerada viciada se sair 5 caras ou 5 coroas . Nos
outros ca sos a moeda será considerada " honesta '
Se p = P (cara) , queremos testar

H : p 1/2 .

sendo. novamente, numero de caras nos 5 lançamentos .


87

1 2 3 4 5 x

O n {vel de significância do teste e


5 5

1 1
16 •
Exemplo 6. 3 — Um praticante de tiro ao alvo
vai comprar um lote muito grande de munição e o
vendedor garante que a por centagem de
projéteis em bom estado ê 90% . No entanto, o
com prado r decide fazer uma experiência para
testar a veracidade da afirmação do vendedor.
Ele escolheu 10 proj éteis e vai verificar
quantos são bons . Ele decide nao comprar o
se X = numero de sucessos na amostra C n Úmero de e mui-

bons) to pequeno . A hi pá tese a ser testada

0 , 9 ,
que
onde p = proporção de bons prod äteis no eEntão,
lote . Suponha
Ia decide manter abaixo de isto é,
para obter os valores cri ticos (que levarao• a rejeição de
H) ele calcula algumas probabilidades :

Dado que p = 0 , 9 , temos (ver


tabelas ) :

Portanto ,
0 , 069 .
Portanto. a região crítica escolhida
S pois
incluindo-se o ponto 7 obtemos a > o. 025 .

Se , por exemplo, o comprador encontrou


B projéteis bons, ele não rejeitarã H .

6. 3 - H I PÕTESE ALTERNAT IVA - UM OUTRO T I PO DE


ERRO

Exemplo 6 .4 - Retomemos o exemplo 6 . 1 , no qual estamos tes-


1 1
tando a hip6tese H ; p - Um valor de p
maior do que — 2 indi cara que o estudante
não está simplesmente adivinhando . Va-
mos fixar aproximadamente igual a 0,05 .
A hipÓtese H acima e comumente chamada
hip5tese nuta. Vimos na seção ante-
1 enquanto que
1 1
- 0 , 01 , logo decidimos usar a
região crítica S = { B , g, 10} probabilidade, u, de
. A
rejeitambém chamada
tar uma hip6tese probabilidade
verdadeira, e
do erro de tipo r. aluno acertou apenas 6
Suponha, agora, quesrejeitar H e di r
que o tães . Então, {amos que o
não há razão para
aluno está adivinhando . Mas , e poss£vel que o aluno nao
esteja adivinhando Cisto é, p e no entanto acertou apenas
6 questões . Portanto. há um outro erro que . está envolvido neste processo decisório :
aceitar uma hipõtese H, sendo eta falsa. Suponha que na realidade , p Podemos
pensar o pro

b lama em termos de testar

contra a hip5teee alternativa

Vamos calcular a probabilidade, de aceitar


7
quando K verdadeira, para 128 ou seja, a re-
g ião crítica acima, s

s s
Temos (ver tabela I

- 0 + 0 + 0 + 0, 001 + 0, 006 + 0 , 026 + 0, 088 + 0 , 20 1 0 , 322 .

Este erro, aceitar uma hipÓtese falsa, denominado


erro do tipo II e ã a probabilidade do erro de tipo II,
Podemos descrever os erros que cometemos e as deci sões que podemos
tomar através do quadro seguinte:
DECISÃO - 0 , 8
ACEITAR erro de tipo I ,
Decisao correta
H probabilidade (1

erro de tipo II ,
ACEITAR pro-
K
Decisaocorreta
babilidade
Vamos ver o que acontece quando tentamos
diminuir um dos erros, digamos a. Suponha que
tomamos por região tica o conjunto S 'O -•{9,
10} . Então, vimos que a.
O valor correspondente da

probabilidade do erro de tipo II sera

ou . . . -
0,624 .
Portanto, diminuindo a , ß aumenta. Se a
região cri
tica ã S õ - z 0, 121 ( ca lcu le '. ) .
POdemos, pois, obter o quadro seguinte :
REGIÃO
CRITICA
0 ,
17 0 ,
322
0,01
A situação que ocorre 6 qua, para n fixado
a prio-
100

ri, não possivel tomar e a nossa vontade; gostaríamos


que a e B fossem pequenos, mas devido ao fato acima á costu-

me um valor para a; valores comumente usados para


fixar
são O, 01 e 0 , 05 .
Para afeito de ilustração, consideremos o caso em

que a = 0, 054 e (figuras 6 .1 e 6 . 2 ) .

regi ao hachurada
n 10

1/ 2
media

regi ao hachurada —

n 10
101

np

Utilizando "aproximaç5es cont{nuas" para os gráficos das


figuras 6. 1 e 6.2 obtemos a figura 6.3, onde estão destacados

a B.
Figuva S . 3

A d usti fi cativa de fixar a ã dada -pelo fato que es


colhemos a hipótese nula que forneca o erro de primeira
esp5cie mais grave. Para exemplificar, suponhamos que uma
vacina contra uma doença vai ser testada em um grupo de
pessoas, enquanto que um grupo de controle recebe apenas
soro. Após algum tempo verificamos quàls pessoas adquiriram
a doença (afetados) a quais não adquiriram (não afetados) . Ob
temos uma tabela como aquela que segue,
102

AFETADOS NÃO AFETAOOS


receberam n
vacina 12
11

rg'caberam n
soro 22
21
Assim, n pessoas foram vacinadas e n ao ficaram
12
doentes, enquanto que n pessoas receberam apenas soro e 21
ficaram doentes, etc.
Suponha que queremos escolher uma das seguintes
pó teses como hipótese nula .

H a vacina tem efeito positivo


a vacina e inoqua .
o erro de tipo I consiste em rejeitar 1 '1 sendo ela
verdadeira. isto a vacina é eficiente, mas a consideramos in5qua.
o erro de tipo I consiste em considerar 2 ' a vacina eficiente,
quando ela é inÓqua . Tomamos H 2 como hi pó tese nula, pois o erro de I decorrente nos
parece o mais grave .

Exemplo 6.5 - Um fabricante de dois produtos similares, A e a, tem


motivos para acreditar que pelo menos das consumi dores preferem
A. Uma pesquisa de mercado revelou que, em uma amostra de 625
pessoas, dos elementos preferiam A , restante, B.
103

Se indicarmos por p a proporção (desconhecida) dos


consumidores da população que preferem A, podemos pensar no
problema como um teste da forma

contra a alternativa
Se X designa o numero de consumidores
na amostra que preferem A, então rej
eitaremos H para "valores peque-
nos" de X .
x
Em termos depodemos dizer que rejeitaremos H
se o valor observado de for menor que um certo p

tal que
P (ô < ã I H verdadeira) a

, a sendo o nível de signific;ncia do teste

probabilidade P (Ô < ô I H )
envolve o conhecimento da distribuição de
ô. No exemplo 5 . 2, do capítulo
anterior,
vimos a distribuição de para o caso particular de n = 3 e p
= 1/2 . Aqui, não seria prático obter a distribuição de
quando H verdadeira, pois n E grande g p pode assumir qual-
quer valor maior ou igual a 0, 7 .
Felizmente, ã possivel obter um
taste aproximado, utilizando-se uma
aproximação para a distribuição de Ô,
quan do n grande .
Não teremos ocasião de tratar deste problema
nestas notas, mas o exemplo serve para ilustrar a
importância de obtermos o que chamamos a distribuiçao
amostrai de um es timador, no caso ô. Desta maneira podemos
obter o valor cri tico, , e conseqäantemente, a região
critica do teste . Ve remos algumas noçÕBs sobre este
assunto no pr5ximo capitula•
95

Os exemplos até agora sugerem os


vistos tipos de testes que seguintes encontrar
podemos :

Exemplo

Exemplo

Exemplo

Exemplo

De um modo bastante geral temos as 3 situaçÕes se-


guintes :

1 )

2 )

3 )

6 .4 - RELACAO ENTRE I NTERVALO DE CONFIANÇA E


TESTE DE H l PÕTESES
Podemos testar hipÓteses referentes ao
parâmetro p
96

de uma binomial utilizando determinados gráficos prontos, para diversos valores de p,


diversos valores de n e diversos n £ veis de significância. Vejamos como tais gráficos são
construídos .
Para fixar idéias , seja n - 10 e suponha que quere-
mos testar H : p = po contra o' de modo que temos um teste bilateral. Vamos

fixar os níveis das regiÕes criticas

laterais, e menores ou iguais a O, 025 Vamos


2 ' tomar, para valores de po'
1 . O gráfico da figura 6 .4 ilustra, para cadaos valores cri ticos como pontos cheios e os
restantes como cír culos abertos .

Figura 6 . 4

Por exemplo, para p = 0 . 4 ,

0, 006, menor da que 0, 025 enquanto que

0, 006 + 0 , 0403 0, 0409 ,

que 6 maior que 0 , 025 . Portanto, a região cr£tica a esquer-


Analogamente,

ou x: 10) = 0, 0123,
menor do que O. 025, mas

0 , 0548 .
que e maior do que 0 , 025 , logo a região cr£tica direita é

10} . modo análogo obtemos as demais regiÕes críticas.


De obtemos sucessos, basta olhar a coluna cora X -2 e a
linha correspondente a p - 0, 4; encon-
Se
respondente
tramos um círculo aberto, portanto aceitamos H .
Mas se queremos testar H : p = 0, 25 versus K : p - 0 25, não podemos usar
este quadro.

Teríamos que acrescentar novos valores de p; mas


podemos ter uma idáia do que vai acontecer; para um dado va lor de
X, olhando a coluna correspondente, de baixo para ci ma, notaremos
a sgqÙÔncia : pontos cheios — cl CUIOS — pontos cheios, de modo
que podemos saber, aproximadamente, para

quais valores de p rejeitaremos H e para quais valores de p


aceitaremos H, para aquele dado X .
Para n = 10 elementos amostrais obtemos o gráfico da figura 6 . 5 , com n{vel
de significância menor que subs ti tu indo X por X/ n = ô .
Figura 6.5
Por exemplo, se X/ n = 0, 6, a reta vertical passando por 0, 6
intercepta as duas curvas nos pontos A a BJ os pon-
110

tos do segmento AB indicam aceitação da hipótese p - po' enquanto que pontos abaixo de
A e acima de B indicam rejeição o ' Os pontos limites são 0, 26 e 0, 88, de modo que
re deitamos H : p = p O contra K: p O para p < 0,26 e p > O, BB e aceitamos H para 0, 26 S
p S O, 88 .

Por outro lado, se queremos testar H : p con


considere a reta horizontal passando por 0, 5;
esta intercepta as duas curvas nos pontos C/ e D; estes correspondem os valores O e 0, 1,
esquerda, e 0,9 e I , à direi ta, de modo que rejeitamos H para X/ n pertencente a

{o; 0,9;
A região entre as curvas é chamada regiao de con—
fiançg e as curvas são as curt'as limites da região .
No Apêndice I apresentamos regiÕes de confiança pa
ra alguns valores de n e para a < < 10% .
Voltemos ao caso n - IO acima e a < 0, 05. Suponha
qua obtemos ô = 0, 6 . Então, o intervalo encontrado acima, [0,
26; 0, 88] será um intervalo de confiança para p, com
coeficien— te confiança de pelo menos 0, 95 . Este intervalo
correspon a região da aceitação da hipÓtesa, ao nivel de 0, 05
.
se obtemos õ • O, 6. nos não rejeitaremos a hipótese p - po. para 0, 26 s p s o,
ee .
Oe modo geral, a região de aceitação de um teste do
tipo acima, da nível a. corresponda a • um intervalo da confiança
para p, com coeficiente de confiançe Y - l- a.
111
-

6.5 - UMA APL I CAÇÃO: TESTE DO S I NAL

Exemplo 6.6 - Dois fertilizantes A e B são comparados escolhendo-se 10 pares de


canteiros de testes semelhantes e aplicando-se A a um canteiro de cada par e B ao outro
cantei ro. As produçães obtidas estão abaixo . A questão de interes se e: podemos
concluir que a produção decorrente do uso de A é maior do que a produção decorrente-
do uso de B? Castas produçÕes serão indicadas tambêm por A e B) .
20 19 23 17 18 20 24 19 21 19
18 16 21 20 17 18 20 18 23 20
SINAL
DE

Vemos qua a diferença A -B E positiva para 7 dentre


10 pares de canteiros; ou seja, em 7 pares de canteiros, a produção decorrente da
aplicação de A meio r do que a produção decorrente do uso da B.
Se não há diferença entre as produçÕes de A e B po
demos pensar no problema como um experimento binomial
com onde p = P (A-3 > 0) (justifique a
independência necessária ao modelo binomial) .
SB X indica o número de sinais temos que
x 7
-0,7.
10
Podemos, contra

Estamos que temos alguma sinais


112
Suponh
a do Apêndice 1 . A
utilizando uma região critica direita por razão para esperar
- mais sinais do que

pois, testar
0, 025 para podermos utilizar o gráfico
H:p reta horizontal por p = intercepta a re

ta vertical por p = 0, 7 dentro da região de confiança,


portanto não rejeitamos H .

-0 , 5
113
Portanto, podamos concluir que rejeitamos a idäia de uma
diferença substancial na produção a favar do fertili zante A. Se
não tivéssemos, baseados nos dados. razão para esperar maior
numero de " do que poder{amos utilizar -

um teste b i -lateral, isto é, considerar

H : p
contra

Ainda assim não rejeitaríamos H ao


nível de (Ve
ri fique) .
Observe que, para o caso de região crítica direi

ta os valores críticos são ou X = 10, ao

passo

que para região crítica bi-lateral < 596 ) os valores criti


cos são ou X = 1 ou X = 9 ou x= 10 .

PROBLEMAS PARA O CAPITULO 6

6 . 1 Temos que tomar uma decisão sobre se uma moeda e


viciada ou não baseados em 6 lançamentos da moeda. A
moe da será considerada viciada se o resultado for :
a) O ou 6 caras;
b) O caras;
114
c) 6 caras .
Construa os testes correspondentes, especificando : as
hipätesas H e K, a região cr£tica. a região de aceita
ção, o gráfico da região o valor de
crítica a a .
6
. - Para = 0, 02, encontre o no problema
2 valor de ante
rior.
6 . 3 - Utilizando a figura 6 a 4 resolva
:
a ) encontrar os valores para os quais
H :
deitada, usando um teste b i
- lateral;
b mesma questão de usando um testa uni -lateral;
- 115

c a amostra de IO elementos contém 4 sucessos; quais hipÓteses não são


reáeitadas, num teste
d em uma amostra de tamanho IO, quais hipÕteses s ao rej eitadas? Usa :
teste uni -lateral esquerda;
teste uni - lateral à direita; teste bi- lateral .
6.4 Em uma população temos p = 0 , 45 . Uma amostra com X s 1
ou X 9 supostamente contradizp = 0, 45 . Qual a proba
bilidade de rejeitar p = 0, 45?

6.5 Queremos testar H : - 10 e X = 9, a hi pá tese á rej eitada? Se H : O,


n = IO e X -O, a hipótese re s eitada?

6 . 6 Utilizando a figura 6 . 5 , n = IO, resolva :


a) qual a região crítica de um teste bi- lateral - 0 , 42? e para H : p = 0,
76?
b) para um teste uni - lateral à direita , quais valores de p
são rej eitados se p =
Um estudo feito para determinar a proporção de fam£ lias em
uma comunidade que têm telefone . Uma amostra de IO
fam£lias é escolhida ao acaso e 8 têm telefone . SB a s 0, 05,
qual a conclusão pode ser tirada sobre a população?
6 . 8 Um médico examina aumentos na pressão sanguínea usanuma
certa droga. Ele mede a pressão de 20 homens an-

ANTES 121 130 127 125 140 121 132 135 124 136
DEPOIS 123 127 132 132 135 122 138 176 127 138
116

HOMENS

127 118 131 120 128 123 128 133 141 124

tes a depois de administrar a droga. A tabela na pági na


anterior fornece os resultados . Existe razão suficiente
para concluir que a pressão sanguínea em homens
aumenta com o uso da droga? as
6 . 9 Encontre o numero de sucessos, em uma amostra de 10 , para o qual p - 0,2 e p =
0, 7 são ambos rejeitados usan do um teste b i -lateral . Tome B
10% .

6 . 10- Suponha que estamos testando H : p = 0, 5 contra a alter nativa, K: p * 0, 5.


Suponha que para uma amostra de tamanha n = 10, decidimos pela região crítica
s
Determine o n{vel de significância, a. Denomina-se po dep
do teste à probabilidade de rejeitar a hipótese H quando
ela é falsa. Assim, para p : 0,6, o poder
Calcule o poder para p = 0, 2, p -
Faça um gráfico da função obtida ( chamada funçao po— der do
teste) . Qual o podar do testa para p
6 . 1 1- Para testar se um dado é honesto, ele á lançado 1 . 000 vezes e
considerado viciado se números pares ocorre rem mais do que 510 ou menos do
que 490 vezes . Qual o nível de significância do teste? Se a probabilidade de
ocorrer numero par é 0, 51, qual o poder do teste?
-
- 117
7 • DISTRIBUIÇÕES AMOSTRAIS

Frisamos, no capítulo anterior, a importância de se


obter aquilo que denominamos distribuição amostra 1 de um
estimador, pois dela necessitamos para efetuar testes da hi hipóteses . Neste capítulo
iremos introduzir algumas noções sobre este assunto. Em particular, estudaremos com
algum pormenor a distribuição amostra I da mádla amostra 1 .
7 . 1 - ESTATTST I CAS

Já temos i dá ia do que seja uma amostra aleatória . Suponha


que X represente uma característica de interesse dB uma dada. população .
Por exemplo , podemos estar interessados na distribuição das medidas das
alturas dos indivíduos de u ma dada cidade . Dizemos que a distribuição dB
X é a distribulção da população . Normalmente não temos conhecimento
das ta distribuição. Para termos uma 1 dá ia da forma desta distribuição.
bem como estimarmos alguns Êárêmetros da mesma, extra {mos uma
amostra aleatória de X .
Suponha que os valores da variável X nos alamentos da população
sedam X1 ' x Escolhendo-se uma amostra de tamanho n ,
podemos obter valores repetidos; suponha
que obtemos n valores iguais a X , n2 valores iguais a X
, n N valores iguais a X onde n * n + +n
Obtemos a chamada distribuição de freqüências dos
valores observados:
FREQÜËNCIA
VALOR DE X
Definimos, então a média amostrai
,

Observe a correspondência entre a distribuição dB


freqÜências acima e a distribuição de probabilidades da v
.

pR03.
bem como a analogia de X com o valor esperado dB X,

Podemos, também. definir- a variância amostra t


que corresponde à variância de X ,

Var (X)
- 119

Dizemos que X e S 2 são estatisticas, isto é , fun-

ções dos valores amostrais . Os valores


correspondentes da
população são chamados parâmetros. como E
(X) e Var (X) .
Vamos indicar uma amostra de tamanha n
por (X

. . . X ) ; como X , X2 , , X são observações da mesma


variável
X , dizemos que XI , X têm a mesma
distribuição que X; e são, além disso,
Independentes, devido ao fato de termos
ma amostra aleatÓria (com• reposição ) .
Uma estatística , T, se
rá uma função de X, , X ) . Considere

11 por exemplo . Para diversas


amostras escolhidas obteremos di versos
valores de X; esta será também uma variável
aleató-
ria . O mesmo acontece. com S2 . Outras astat£stices que

podem ser consideradas são :


amplitude total da
amostra
o maior valor da amostra
min (X , , X ) : o manor valor da
amostra . n 1

que a amostraobtida y Ysão duas estatisticas


ordenemos min (X : de ordem; suponha
1
1n
segunda maior em ardam crescente
2

max (X n
Então , são as estat£sticas de or-
1 2n
dem da amostra CX , X ) . Uma particular e importante es-
1 tat{stica de ordem é a mediana , denotada por Y Ordena-
dos os valores amostrais , Y 6 0 valor central se n á im1/2 par e é a média
aritmética dos dois valores centrais se n

Exemplo 7 . 1 — Os va lores obtidos em uma amostra 1


foram :
12 x 3=3 . x = 12 . x = 5 (lembre-se que os valores de 5 ,
uma são denotados por letras minÚscuIas) .
- 121

Então :

x 1 7,4,
2 2 2
2 1 8,3.
As estatísticas de ordem são :

= 12 .
1 2 3 1/245

5 e Y = 16 , a mediana seria 6
1
12,5.
1/2 2

Como toda estatística á uma v . a. tem sentido


em con siderar a distribuiçao desta estat{8tica, bem
como conside-
rar a média ou a variância dela .
Consideremos , em especial , X . Suponha que a "popu-

isto a v . a . X, tem média e variância


122

Var (X) 2 Quando consideramos E (X) e Var(X) , será que há alguma ralação entre
estes valores e u, 0 2 ? Isto é o que ve remos na próxima secção.

7 . 2 - D I STRI BU I ÇÕES AMOSTRAI S

Denominaremos distribuição amostrai à distribuição de


uma estatística determinada a partir de uma amostra. Para efeito de
ilustração, consideremos uma população de tama n ho N = 3 e a v . a.
X tendo os valares l , 2 e 3 sabre os alementos desta população .
A média da população ã

2
3

e a variância da população

20 , 667 .

2
x

1 -1 1
2
3 1 1

6 2
Retiramos todas as poss£vais amostras .com reposiçäo ) da
tamanho n O número de amostras será Nn - 3 2
cada amostra tem a mesma probabilidade , de ser se lecionada . Obtemos o quadro
seguinte .

VALORES
AMOSTRA
AMOSTRAIS
PROBABILIDADE

por
quanto s

A distribuição amostrai de será, então :

Portanto ,

enquanto que
4 , 333

do que segue

Var (ÿ, ) 4 , 333 0 , 333 .


Var(X)
É fácil ver que Ver (X)
Então :

Var(ž) 0 , 333 -

Da mesma forma obtemos a distribuição amostra 1

e a distribuição amostra 1 de S (o desvio padrão amostra l ) ,

É fácil ver que


Vamos comparar as distribuições de X e da X; obser va que ambas
possuem a mesma média, 2, mas as variâncias sa
112

diferentes; Var [X) 2 0 , 6 67 , enquanto que Var (X ) n


0,333 (figura 7 . 1 ) .

1/3 1/3
1/9 1/9

O 1 2 3 x 1 2 3 x

Figura 7 . 1
Quanto maior for o tamanho da amostra, n , menor se
Var (X ) rá a
variância de X , devido ao fato qua Var (X ) to indica que a
distribuição de X será mais concentrada ao redor de sua média, E A
figura 7 . 2 ilustra esta fato . pa ra o caso em que X tem distribuição
normal N t U , a 2 ) .
x x

População

x
n.30
Figura 7 . 2
113

Outra observação que podemos fazer do que foi ax-


posto á b que E (R) = u B E (S 2 ) = a 2 . Estas relações são válidas

em g aral e não só para o exemplo visto . Mas E IS ) * a . Dizemos que X e S 2 são


estimadores nao viciados de e a2 respectivament.e, ao passo que S é um
estimador viciado de a .
Voltaremos a assunto no cap£tu•lo seguil,nte .
2

Para demonstrar que E (R ) = u e - ã relati-

vamente fácil , bastando utilizar as propriedades da média e da variäncia; a

demonstração de que E (S 2 ) = a 2 é um pouco mais trabalhosa . Ver

exerc£cios .

Para as figuras 7 . 2 . no caso em que X á normal , per cebe-


se claramente qua a distribuição de X também é normal; este é um
resultado importante e decorre da seguinte pro— priedade
reprodutiva da norma t : se X e uma v . a.
e X 2 é uma v . a . N (u2 , 52 ) ,.2 com X e X 2 independentes , então X
será uma v . a . * u 2 ,a 2 +5 2 ) . Esta propriedade esten de -se a
um número finito de v . a . normais independentes , bem como para
uma combinação linear da v . a . normais independen-
tes . Em particular, como 1 ' xn
são normais , sague-se que X será normal . Um fato importante é o
seguinte . Mesmo que a população não seja normal . medi da que n
cresce, a distribuição de X vai-se aproximando de uma normal .

No exemplo dado , a população é uniforme sobre os in te iros 1 , 2 e


3 a mesmo para n = 2 dá vemos qua a distribui-
çäo de X tem uma forma qua lembra a normal (figura 7 . 3) .
Figura 7 . 3
As figuras 7 .4 dão uma idšia do que acontece quando n
cresce, partindo da uma população que tem distribuição do tipo
acima , isto é , "uniforme " num certo interva lo .

n-30
Figura 7 .4
A d ustlficatlva teórica do que ocorre é baseada no que chamado o
Teorema do Limite Centra Z . Quando aproxima-
mos uma distribuição binomial por uma normal , estamos utili

zando um caso deste teorema . Este teorema afirma o


especial X são v . a . independentes , com u -
seguinte: se X x
1' ,
ma distribuição de média e variância a2 então a v
comum, .
a.
s
n 1 2 n
á tal que , para cada valor fixo z e para n*E,

P (Zèz) ,
onde Z é a v . a . N (0 . 1) . Ver Apêndice 2 .
Como X S / n vem

portanto , na prática , para n grande, tem distribuiçäo aproximada


normal padrão .
Oevido a sua importância, vamos repetir o que foi
dito a respeito da distribuição amostra 1 de
Fato: Seda X uma v . a . ( "população ") com média E (X) a u e
variäncia Var (X) . Seja X a média amostrai de uma amostra
aleatória da tamanho n . Então :
( ) E OO • u .
(ii) Var(i) 2

(iii ) Para n grande, tem, aproximadamente, distri

buição N ( 0 . 1 ) .

PROBLEMAS CAP r TULO 7

- Para o exemplo discutido na seção 7 . 2 , obtenha a di s


tribuiçäo do mínimo Y1 = min (X , X ) e do máximo Y2
max (X1 .X2) . Calcule E (Y ) B E (Y ) .
7 . 2 - Prova que Var (i) / n se a variäncia de X é 2
7.3 Prove qua E (S 2 ) 2 Para isso escreva
2

e então. X -X
7.4 Considere uma população de tamanho N - 4 e a v . a . X ten do os valoras 2, 3, 5
, S sobre os elementos desta população .
a) Calcule E (X) e Var (X) .
b) Considere amostras da tamanho n = 2 , com reposição, da
população . Obtenha a distribuição amostra I de i,
2

7 . 5 Correção para populações finitas. Vimos que Var ae


extraímos amostrag com reposição da população . Na prática,
utilizamos amostragem sem reposição. Se a po pulação
infinita, a fórmula acima ainda 5 válida , mas sa e população á
finita . então pode-se demonstrar que a 2 N-
n
N-n
sendo N o
tamanho da população . SB n«N,
Considere uma população de tamanho N e os valores
X -O, X 2-3, X 3-2, X 4-3. Retira amostras de tamanha
- -

n = 2 , sem reposição . Obtenha a distribuição amostra 1 de


X e calcule E (i) e . Verifique que E e Var (i) á
dada por ( * ) •
- Dada uma população normal com média PB 600 e desvio pa dräo a-16
, se uma amostra de tamanho n = 64 é escolhida , com reposição ,
desta população, calcular :
a) p (i > 302) b) p (R > 610)
c ) P (602 s i s 610) d) > SIO) .
- Vimos que , se a população é normal com média u e variäncia a2 então
Z = (i -u)/ (a/ PG) tem distribuição : N (0 , 1 ) . Suponha que a seda
desconhecido e usamos ;

no g eu lugar . Sabemos que S á um estimador viciado de a e para valoras


pequenos de n , o quociente

não tem distribuição normal ; para n grande a distribuiçäo deste


quociant9 é aproximadamente normal . qualquer modo , para
qualquer valor de n . a distribui çäo de (i -p)/ (S/ rã) ã conhecida
como di8tFibuição t de Student e se parece bastante com a N ( 0 , 1
) . sendo que para n pequeno, ela apresenta uma maior
disparsäo que a N ( 0 , 1 ) .
133

-3 -2 -1 o 1 2 3
11 e -

A distribuição de t = (R -u depende do valor de n e


para n > 30 a distribuição de t é praticamente nor mal
padrão. A tabela 3 do Apêndice 1 fornece probabiI idades
) , para valores de v - n -1 , que é chama do
nÚmero de graus de Liberdade.
Por exemplo , n 1 = 24 e 1 ,711 ) = 0 05.
Calcular :
a ) n = 24 . 1 , 319 )
b -2 , 060 )
> 1 . 96 )
V de tal sorte que P (t

7 .8 Suponha que de uma população normal com média


11=-100 e variância desconhecida , uma amostra de tamanho n
16 forneceu S2 = 2 . 25 . Obter :
105)

> 1 03 )
8 • IDEIAS GERAIS SOBRE INFERÊNCIA ESTATISTICA

Para introduzir os conceitos de estimação e testes de hipóteses utilizamos


apenas a distribuição binomial : obtivemos estimadores para p e testamos hi pá teses
relativas a p . Vamos , agora , ver algumas noções gerais , aplicáveis a um grande numero
de situações . Trataremos , em particular , do chamado princípio de máxima
verossimilhança .

8 . 1 - PROPR I EDADES DOS ESTIMADORES

Vimos que a Inferência Estat£stica tem por obdetivo fazer


generalizações sobre uma população com base em dados de uma
amostra .
Consideremos uma amostra (X x 1 '
n
v . a . X. que descreve uma
caracter£stica de interesse da população .
Sabemos que um estimador é qualquer função das
observações Xx . Uma estimativa é um valor
particular do estimador, para uma amostra particular.
Q problema da estimação ã, então, com base em uma
amostra. determinar uma função T = f CX n
"prÓxima "do parâmetro populacional de interessa.
135
-

Podemos ter vários estimadores de um mesmo


parametro e . Necessitamos, então, ter critérios que nos
permitam
escolher o "melhor" estimador de e. Por exemplo , a média a-
mostra 1 X e a mediana amostra 1 Y são dois estimadoras da 1/2
média populacional I.E = E (X) .

o erro amostra l . Ao valor


2 2

denominamos erro quadrático mádio ou risco do estimador T ,


e será indicado por R (T, B) . Poderíamos, então, tentar deter
minar T qua minimizasse o risco (8 .2) . para todo e . Isto não é
possível, em geral.
Se temos dois estimadores T 2 do pa-
1 rêmetro e,
para todo e , então TI seria preferível
a T Var figura 8. 1.
136

Figura 8 . 1
Mas a situação pode não ser essa, como indica a fi gura 8 . 2 .

Figura 8.2
Para alguns valores da e. R (T , 9) < R (T ,9) ,
acontecendo o oposto para outros valores de 9.
O qua se faz , então, é tentar restringir a classe de
estimadores a usar.
uma possibilidade á considerar a classe dos estima dores nao viciados de e,
isto ã, se T é um membro desta classe,

para todo Se esta condição está verificada, sn tão


137
que ã a variância de T . Escolher. pois , um estimador na clas
se dos estimadoras não viciados do parâmetro e, que
minimiza o risco. significa escolher um estimador que
minimiza a variância (B. 4) . Se existe tal estimador, dizemos
que gle ã um estimador nao viciado de variância minima de
9 . Para al-
g umas situações é poss£vel encontrar o estimador não viciado de variãncia m{nima de
um parâmetro e . Mas para isso ê ne cessário recorrer a conceitos que estão fora do
alcance des

tas notas .
Exemplo 8.1 - X é um estimador não viciado da média de uma v . a . X. De fato ,

Como cada X tem a mesma distribuição que X ,


logo
n
1

Do mesmo modo, num experimento binomial , mero de sucessos. P


(sucesso ) = p , ô = X/ n é um estimador não viciado da p , como já vimos .

Vejamos , agora, um outro critério . Considere, por


exemplo . X calculado para diversos tamanhos de amostras; ob
138
temos, na realidade , uma seqÜência de estimadores {X n=l ,
n
2
buiçäo de Suponha que a v . a . X é normal N (u ,5 ) . A distri-
2
çäo de X
Ä medida que n cresce , a distribui-
torna-se mais concentrada ao redor da Ver figu

Dizemos que {i ) é uma seqÜãncia consistente de es


timadoras de u . Formalmente , uma seqüência {T ) de estimado
res da um parâmetro e é consistente se . para todo e > O
Figura

É fácil ver que esta condição está satisfeita para


{X } , utilizando-se a desigualdade de Chebyghev, que afirma:
se X á uma v. a . com E (X) = u e Var(X) = a 2 , então
140
para todo número E > O. Ver Apêndice 2 .

Usando (8 . 6) . vemos que

Var(i ) 2 o
que mostra qua {i } á consistente .
8 .2 - ESTIMADORES DE M FN IMOS QUADRADOS E EST IMADORES

DE MÁXIMA VEROSSIMILHANCA

Retomamos o exemplo 4 . 3 , em que tínhamos o modelo

Queremos estimar D com base nas n observações d


. O método dos m£nimos quadrados consiste em esco-
n
1 her o estimador D, da O, que minimiza a soma dos quadrados dos

erros a i • Como

vemos que
n
141
que uma função de D, g (D) digamos. Se queremos determinar o
m£nimo desta função, temos
n
(dl -Ô) O,

do que decorra

isto é, o chamado estimador de mdnimos quadrados de D


é a
média amostra I dos d . .
1
Se queremos obter um intervalo de confiança para D
ou testar hipÓteses a respeito de D ã necessário fazer algu
mas hipóteses a respeito da distribuição dos erros e Normal
mente, as suposições que se fazem são ;
( i ) e é uma v . a . com média O, ou é simétrica
ao rador de O; e é uma v . a . normal ;
(iii ) a variância de a ã constante.
A situação geral é aquela em que queremos
estimar um parämetro vetorial e = te e ) a as
observações satis fazem ao modelo
142
x
Escolhemos o estimar e que minimiza
n

Outro método de estimação que é bastante


utilizado é o chamado mátodo de mãzima vero
88imiZhança.
O princípio de máxima verossimilhançe
afirma o se-
guinte : devemos escolher aquele valor de B que maximiza a
probabilidade de obter a amostra observada , na ordem parti cular na
qual os itens da amostra apareceram.

Exemplo 8 . 2 — Suponha que temos n provas de Bernoulli com P (


sucesso ) número de sucessos . Devemos tomar como
estimador aquele valor de p que torna a amostra observada a mais
provável de ocorrer.
Suponha que n = 3 e obtemos 2 sucessos a 1 fracasso.
A função de veros simithança é
2
P ( 2 sucessos e I frecasso )

Maximizando esta função , obtemos :


p2 p (2-3p) O, do que seguem p e p - 2/3 . É
fácil ver que o ponto de máximo 5 = 2/3 que o estimador de máxima veros
similhança de p .
143
De modo geral , o estimador de máxima verossimilhan
ça do parâmetro p de uma binomial . com X sucessos em n pro-
va e

xn

Observe que este é o estimador que temos usado cons


tantemente, Para se chegar ao resultado (8 . 16) observamos que a
função de verossimilhançe neste caso e
x
-

e que o máximo desta função ocorre no mesmo ponto que


log L
Portanto , sendo

log L (p) x log p + (n -x) log (1 -p )


temos

Exemplo 8 .3 - Em muitos problemas biológicos . tem importância o


problema da estimação do tamanho de populaçães animais ou
vegetais . ImplicaçÕes práticas referem-se ao contro le de insetos e
manutenção de suprimentos de alimentos .
Suponha que capturamos, marcamos e depois soltamos r
animais de uma população total de N animais, sando N
144
desconhecido. Quando os animais marcados tiverem se dispersado
entre os não marcados, nós capturamos n animais Cisto é, colhemos
uma amostra da tamanho n da população de N animais) dos quais k
são marcados . Vamos supor, primeiramente, que n ã
suficientemente pequeno, comparado com N, para que possamos
ignorar complicações com a amostragem sem reposição .
A função de veros similhança será

e tomando logaritmo ,

• constante + log N.
-

Se bem que N seda discreto, será conveniente tra-


t á -10 como se fosse contínuo , da modo
que

N-k

Donde, o estimador de máxima veros similhança


de N

Se capturamos, por exemplo, 100 animais


a os marca mos e após algum tempo efetuamos nova
145
captura de 100 animais a vemos que IO dentre
eles são marcados. então uma as-
IOOx100
timativa de N será N 1.000 animais .
10
Utilizando a distribuição
hipergeomãtrica. no caso em que a suposição
acima feita , sobre a relação entre n e N não
está satisfeita, temos que a função de
verossimilhança

Como N-r è n -k, vemos que podemos ter, de in£clo. que

No exemplo numérico acima . N è 190. Por


exemplo, podemos tas tar a hipótese
-

contra

É fácil ver que rejeitamos H, bastando calcular a probabili dada de se


obter 10 marcados dentre os 100 escolhidos, para Na 190. Esta
probabilidade será bem pequena. Para obter o es ti mador de máxima
146
verossimilhança. neste caso. o trabalho é mais complicado . Poda-se
demonstrar que o estimador 6 dado por

onde [y] indica o maior inteiro contido em y. No exemplo acima.


Ñ 1 oox10010 1 . 000, que é o mesmo estimador obtido antes.
(Ver problemas) .

8 .3 - O PROBLEMA GERAL DO TESTE DE HI POTESES

No cap£tulö 6 Introduzimos as primeiras id5ias sobre teste


da hipóteses B tratamos extensivamente do caso em que queremos
por ã prova afirmaçÕes sobre o parâmetro p de uma distribuição
binomial .
Vamos considerar os seguintes exemplos .
Exemplo - Há uma certa variabilidade no tempo necessário
para que uma máquina complete dada tarefa . Deseja-se tes tar
a validade da afirmação :

"A máquina leva, em média, 20 minutos para efetuar a fan .


Exemplo 8. 5 — Um gerente de vendas deseja testar dois esque mas de promoção de

vendas, I e II digamos . Especificamente, ele quer testar a hipÓtese :


147
"Ambos os esquemas são semelhantes , no sentido que as quant
idades do produto vertdidas. decorrentes do uso de sao as
mesmas.
Cada afirmação acima á uma hipótese esta t {g tica. Pa
ra testar cada uma delas, teremos que usar algum processo ou
regra de decisão que envolva :
a ) escolher uma amostra aleat6ria;
b ) encontrar uma estatística conveniente;
c) usar a distribuição amostra I da estatística para
tomar uma decisão .
Estes três passas constituem um teste da hipótese em
questão . De maneira um pouco mais formal diremos que uma
hipÓtese estatística é uma afirmação sobre o valor de um pa rämetro
desconhecido da distribuição de uma variável aleatÓ ria. que
representa uma cara ter£stiea de interesse da uma população .
Denotando por H cada afirmação dos exemplos citados, poderemos
escrever, em uma notação concisa ,

H : u = 20
-

para os exemplos 8 .4 e 8. 5, respectivamente. No primeiro ca soa


o tempo necessário para completar a tarefa á uma v. a. cu da
distribuição desconhecida . totalmente ou parcialmente.
e representa a média desta distribuição . Interpretação se
melhante para o segundo caso .
148
Chamaremos H de hipðtege nuta; para cada hipãtese nula
formulada teremos uma hipótese alternativa e que pode tomar
formas diferentes , dependendo do problema . Denotandose por K
uma hipótese alternativa , podemos tar para os exem p 10s dados :

Exempla 8.4 :

1 1.111
Exemplo 8.5 :
11
Vamos analisar detidamente o exemplo 8 . 4 . Aqui , o
parâmetro que está sando testado uma média desconhecida .
O conjunto de todos os valores poss£veis de 1.1 é cha mado
o espaço do parâmetro e á indicado pela letra e. Podemos supor aqui
que

dá que a variável em questão tampo .


Sob a hipótese nula, - 20 e sob a hipótese alternativa, u * 20
. Estas duas hipóteses, H e K, definem dois sub conduntos da e;
- -

-9-9
1
149
Em termos dos conjuntos acima , a
formulação (8 .25) é equivalente a

Esta formulação de um problema de testa de hipÓteses

é a mais geral poss£vel e semnr. e pode ser feita .

Dizemos que uma hipótes:- (ou K) é simples se 90 (ou


9 ) reduz-se a um ponto , isto e, se especifacamos
completamente o valor do parâmetro . No exemplo 8 .4 , H
: u = 20 uma hipótese simples Uma hipótese H (ou K) diz-
se com— posta se 9 (ou 9 ) possui mais que um ponto. A hi pá
tese K : u do mesmo exemplo composta .
A situação mais fácil de ser estudada
é quando temos uma hipótese simples contra
uma alternativa simples :

1
No exemplo 8 .4 , podar {amas estar
interessados em testar a hipótese que a
média 5 20, contra a alternativa que

( * ) Estamos supondo aqui que u e o único parâmetro desconhe


c ido .

a média é 23 .
150
Lembremos que ao testar uma hipótese
podemos tomar uma decisão errada em duas
situações :
C i ) reåeitando-se H, quando ela
verdadeira : erro de tipo I;
(ii) aceitando-se H, quando ela é falsa : erro de ti—
po 11.

Designamos por e 3, respectivamente,


as probabilidades de cada tipo de erro .
Para a situação (8 .31 ) , o quadro
abaixo resume possibilidades que podem
ocorrer.
"ESTADO DA NATUREZA"
DECISÃO
1
decisao incorre
ACEITAR ta :
decisao correta
H
ERRO DE TIPO 1
decisao incorreta
ACEITAR : decisao
K ERRO DE TIPO 11 correta
Por B estado da natureza " entendemos o
verdadeiro valor do parâmetro 9.
Vimos qua o primeiro passo para testar H
contra K á dispor de observaçÖag (X ) da
população . Constru£mos, então , uma função de
151
decisão , que é uma função definida no espeço de
todas as amostres de tamanho n (o espaço a—

mostrai ) e com valares no que chamaremos espaço das açoes .

Designando-se estes espaços por S e respectivamente, por d uma tal


função de decisão . então d : S + A é uma funçäo tal que a todo ponto
(XX ) e S corresponda uma ação a e A : a = d [X . . . X ) .
No caso de um teste de hipóteses, o espaço A consiste apenas da duas ações ,
digamos , com:

ação de rejeitar H (e aceitar K) ;


a ação de redei tar K (e aceitar H) .
Portanto, A = {a . a } . O conjunto S ficará, automa-
ticamsnte, particionado em dois subconjuntos , S e s 1 ' dis-
juntos e complementaras, tais que :
s conjunto da todos os pontos (X tais que

somos levados a tomar a ação a rejeitar H;


s conjunto de todos os pontos (X ) tais que
1 X
somos levados a tomar a ação a rejeitar K;

condunto SO ã a regiao cz£tica do testa , ou o con


junto (ou região) de redeição da hipótese nula H.
Usualmente, o conjunto SO é determinado em termos da
estatistica usada no teste . Por exemplo, suponha que vamos basear
152
nossa decisão em aceitar ou rejeitar H: 20, na estatistica X, isto é, na
média amostra l . Então , a região
crítica poderá ser da forma S onde
c uma constante a ser determinada convenientemente. Neste
- -

caso, as açÕas a e a seriam:

a rejeitar H quando 2 c 5
a aceitar H (redei tar K) quando * < c.
Lembremos que. sendo imposs£vel minimizar a e si
multaneamente. fixamos um valor para a a tentamos encontrar.
dentre todos os testes com nível de significância a, aquele que minimiza B .
Qualquer procedimento que utilizemos nos levará a
encontrar uma estat£stica T , que é uma função das observa-

çÕes, T CX . . . X ) , que gera- utilizada no teste. Normalmenn te, teremos


que determinar um vator crítico, T da estat£s c tica , que nos permite
escolher entre H e K. Este valor cr£tico delimitará a região cr£tica, qua sará
da forma
n n
ou

Exemplo 8 .6 - Suponha que guaramos testar


H: 50
153
contra a alternativa
onde á a média de uma normal N (u, 900) . Suponha que a ragra de decisão seja a seguinte:

"Extra£da uma amostra de tamanho n 36, rejeite H se i < ic '


onde X é o valor crítico de X , determinado de tal sorte
c

0 , 025 " .
A região cr£tica será da forma

Se a população ã N (u , 900) , então X tem distribui ção


(distribuição amostra I de X) normal . com média u e va-
900 goo
ri ancia n 36

P<i H verdadeira )
5- = 5 é o desvio padrão de X . Portanto ,
x

onde Y tem distribuição normal N ( 0 . 1 ) . Como a = 0 , 025 , a


relação (8 . 35 ) implica (ver tabela 2 e figura 8 .4 )

-50
154

c
- 1 , 96 ,
5

ou sej a , - 40 , 2 . Logo , as regras de decisão a


serao:
ca rej eitar H se X < 40 ,2; a rejeitar K se X 40 , 2 .

8 .4 - O TESTE DA RAZÃO DE VEROSS I M I LHANÇA

Vamos considerar, nesta seção . apenas o caso em que

Figura e . 4

queremos testar uma hipótese simples contra uma alternativa

simples. ou seja ,
155

1
Como vimos . nós controlamos o nível de significäncia, e tentamos
minimizar a probabilidade do erro de tipo 11, B . Sa existe uma região cr£tica que tenha
nível e que minimiza ß dentre todas as regiões críticas de nível no máximo esta será a
melhor região critica de n;veL a. Obtemos, então , um meZhor teste .
Suponha que temos uma amostra CX uma v . a .
X que tenha distribuição dependendo de um parâmetro e que pode assumir
somente os valores e Fixemos
Designemos por L ( 9 ; x função de verossimi-
lhança correspondente à amostra x , isto é, a proba-
n bilidade P (X = x n n sendo que destacamos a depen-
u=P
(rejeitar H
l e=È)

se e se 0,2099 , então se não existe constante C e região crítica S


satis fazendo às condiçÕes estipuladas . Na prática, mudamos o valor de a para o qual o
testa pode ser encontrado, ou então usamos um procedimento chamado aleatorizaçao, que
permite obter um teste da nível exatamente igual ao valor fixado .

Mas esta assunto não será discutido aqui .


Exemplo 8.8 - Suponha que queiramos testar

onde e > e e e á a média desconhecida de uma normal N (8, (5 2 ),


onde a 2 á conhecido .
Aqui, para uma amostra de tamanho n, onde a denotado
por axp{y},

Portanto,
200 i-l

Segue-se que X s k é equivalente a exp

ou ainda .

Como obtemos

k)a
2

isto é ,

Portanto , a região cr£tica é

144 -

é não viciado e de variância m£nlma?


-
8.4 Suponha que obtemos uma amostra (X , . X ) da distri
n
buição de uma v . a . X que tem densidade
x20.
Obtenha o estimador de máxima veros similhança da a.
A v . a . Y é observada para cada um dos n n £ veis X
X de uma variável fixa X , estabelecendo-se o se-

n
guinte modelo :
i' onde e ß são
constantes a serem determinadas são erros (variáveis
aleatÓrias) . Obtenha os estimado res de m£nimos quadrados
para e isto é , aqueles valores â e ß que minimizam

8 . 6 - Suponha que os valores observados de Y. para os valores X


= O, X 2 = 1, X 3=2, X = 3 e X 5-4 são, respectivamente ,

os estimadores Y
8 . 7 No exemplo 8 . 3, considera o caso em que temos a função
de veros similhança dada por (8 .21 ) , isto e, o modelo ã a
distribuição hipergeométrica. Para se obter o estimador
de máxima veross±milhança de N, N, considera a razão
(N-n)

Veda o que acontece quando


Queremos, testar H: contra a alternativa K :
se X uma v . a . discreta assumindo os valoreso. 1 ,2 ,
145

3,4 e 5 . Suponha que fazemos uma só observação , X . Na tabela abaixo damos as


distribuições de X sob H e K .
x 2 3 4 5
1
0,
0, 01 0 ,03 0, 04 0,38 0 , 50
04
0, 0, 0, 0, 0, 0,
1
04 05 010 010 40 31
Fixe o n £ vel de significância a = 0 , 04 . Determine as pos s £ veis regiões c r £
ticas e o erro de tipo II , 3, asso ciado a cada uma delas . Encontre o melhor teste de
n £ vel

8 . 9 Para o exemplo 8 . 8 , encontre o erro de tipo II , B.

e . 10- Para o mesmo exemplo determine o valor de n que nos dê


valores fixados de e precisamente,

8 . 1 1 - No exemplo 8 . 8, vimos qua o taste C 8 .46) é uniformamente melhor


para testar H: 9=90 contra K : Supo nha , agora, que queremos testar
H : contra K Usando considerações de simetria. explique porque
não esperamos obter um melhor teste, uniformemente, quando o valor
alternativo de e pode ser maior ou menor

8 . 12- Oatarminar o teste da razão de verossimilhança testar

onda a média desconhecida de uma distribuição de


-
Poissan ,

Aplique o resultado
148 -

REFERENCIAS

Bailey , N .T . J . ; ON ESTIMATING THE SIZE DF MOBILE


POPU LAT IONS FROM RECAPTURE DATA . Biometrika ,
vol . 38 ,
. pp . 293-306 .
Blackwell o . : ESTATISTICA BÃSICA . Ed . McGraw-Hil l do
Brasil ,

Feller . w. : AN INTRODUCTION TO PROBABILITY


THEORY AND ITS APPLICATIONS . J . Wiley g
Sons,3ë edição ,
- Fernandez , P . a . : INTRODUÇÄO TEORIA OAS
PROBABILIDADES . Livros Técnicos e Cient£ficas S .A .
,

Lindgren , B. : ELEMENTS OF DECISION THEORY . The


Mac Mil Ian Company, 1971 ;
INTRODUCTORY PROBABILITY AND
STATISTICAL APPLICATIONS . Addlson Wesley,
1965 .
Mostel ler , Rourke g Thomas : PROBABILITY WITH
STATISTI CAL APPLICATIONS , 2ž ediçäo , Addison
Wesley, 1970 . Noether ,G . ; INTRODUCTION TO
STATISTICS . A FRESH APPROACH . Houghton Mifflin
,
-147-

APÊNDICE 1
-
TABELA- PROBABILIDADES BINOMIAIS
9

LU

8.
Tabelas

reproduzidas de "TABUAS DE ESTATISTICA E MATEMÄTICA" de W. 0


. Bussab e J . S .C . Pereira, sob permissao da Editora Brasi
liënse S.A. (Tabelas ,
- 148

ТАВЕ|-А 1 - PROBABILIDADES BINOMIAIS (continuaG50 )


149 -

PROBABILIDADES
TABELA 1 (continuação )
- 150 -

PROBABILIDADES
a

3
aaR
8.
151 -

PROBABILIDADES
ТАВЕ[-А BINOMIAIS (continua;50 )
- 152 -

PROBABILIDADES
ТАЗЕЦА BINDMIAIS (conc1Us50)
153 -

PROBABILIDADES
- 154
TABELA 2 - AREAS SOB A CURVA NORMAL PADRÃO

Exemplo :

0 , 5-0 , 38493 = o , 11507


ira • SEGUNDA
imdr DECIMAL
ximeir•

2 3 46 8 9
01192 02790 03'aa 00
05172 01 S9S 01994 067*9
04380 I '026
03983
07926 063' 7 • 09095
12930
05567
09483
05%2 10642
'4803 03586
0477s 09871 07535
11791 12172 13307 1 1409
a 20194 21904
15910 '7003
5642 19097 20834
'6276 23565 20*0 24857 2St'S
as 22901 issu 26730 2421 ngas 28230
22240
2389 30785
aas75
29103
23237 8673 27035 27337
17724 33393 31057 25490
0.8 2*04 32381 29955 2C234 35769 28524
21226 35993
0.9 agat4 34375 32121 34850 32639 353t4
1.0 21594 36650 34624 350a3 24sa' 29796
3atoa 36214
34134 3749:1
38586 37286 27637 399'3
40824 39435 42922
36433 38877
1.3 38493 42364 42647
aas43 35543
40320 42220 0699 45254
1.5 41924 43B22
46164
44545 45052 asg-
43319 44738 458 'g 94 39617 4Eg26
4S6J7 45907 assa
44520 4S4as 45728 '5528 48077
46562 41320 46712
47193 44062
46407 47982
47978 47882 agsoo 2.1
41 '23 07831
48822 48840 48537 2,2
46257 46080 48310 485ra
za 48645 48679 48745 4905' 46856 49324 49134 0899 2.3
48214 49010
23 4881 n 0955 4924S
49036 0286 48030 49492 49343 49361
49224 49266 49S0ô
48928 49202 *9520
25 49180 agS9a 48461 4962 t
49720 063Z
2.6 49379 49560 4993 49585 49702 08809
49729
4964a
49547 49574 49693 4978' 0795 49736
49757 49205 2.9
28 49534 4gs54
4973) 4983' 49774 4984 t 49477
49851 agass 49807
3.0
2.9 49653 49752 0892 49897 49-861
49825 09836
49744 '9--819 49900
3.0 49874 49B82 a9öœ
49813 49913 0-918 3.2
49946 49948 49929
11 49855
49906 49910 49916
49950 aggž2 49964 os '9950 3.3
49925 499'0
12 49903
49953 49958
49972 49974 75 49965 3.4
3.3 49969 4997' 3.5
49968 49922 49088 '9983
49966 49978
0938
49977 49985
49985 0983 4998' 0992
a9•E0 499-9 s
49993 a9994 4999S
egggg 49993 4953 49996 49997
49995 43995 0996 4§987
4999 Y 49997 4999'
49999 ossa 49990
SEGUNDA E TERCEIRA OECIMAIS OE
65
15 25 35 75 85
- 155
00199 cas78 04974
0418Π08902
OSS' 2 02*9
1270 11600
' 5726 .164S3 IS3SR 02
19322
18SOJ 0.3
za741 2069 220'3
2X72 zuoa
2899 26270 aa68 21 '35 25333 25647
28669
8246 26883 30921 31192
31990
3251 t 3¥22 08
15 as 75 85 96 0.9
9tO't
8


PESO SWO
tZE
BZVD
IZO'Z OtO'Z

8
89·1
059 - SSZ'a

gso•

S
'Z
tgl t

9gffZ
'Zt o ZZL'O


9GËO
I o


90'
69G2 07
0B02
- Z

-
tZVD
09'0 ICO
1
Stt z


gtS'O
ESC'
69C2
8to I t80'-
·


9'8'0
t9t 1
8-



at"O gel D


691't
9
t
tLSZ 9 L'
Z8t't 1
·90
C96·-
·
9C9

9
§
-


t"'O
0
0
-
9
·
0
0t 0 9t 't—> )d ·0t·0 9 · 1<


d
一 (X 0tdua×


154

ТАВЕ'А - PROBAB l L l DADES PO l SSON:

8
15 6

REG IÕES DE CONFIANÇA PARA p (a s 0 ,10)


157 APÊNDICE 2

. 1 - DES IGUALDÅDE DE CHEBYSHEV


Seja X uma v . a . com E (X) * 1.1 e Va r (X) 52 finita . En tão. para todo k >
O, temos

p ( lx-u l èk) Var (X)


DEMONSTRAÇÃO :
p ( lx-u l èk) .
onde p (x ) ) e a soma ã estendida a todos os x tais que l
x -u l Èk. Como l x. -u l èk se e somente mos
que
-2

-2-2

. Var (X) ,
o que prova (A . 2. 1 ) .
Em particular, t A . 2 . 1) á aqui valente a

p ( lx-u l èca ) s —z
onda c > 0-. Baste tomar k-ca. Ou • einda ,
o ISB -

1
c

Para c - 2 , (A. 2 .3) nos diz que

p ( 'x-u l<2a) è —34


ou seda ,

3
Isto á, para qualquer v. a. X, com variância finita, pelo me
nos 3/4 da massa está compreendida no intervalo C u -25
.1.1+20].
Se X 5 normal , com média u e variância a 2 , sabemos
que z 0 , 95 . portanto o limite inferior dado
por (A . 2 .4 ) é bastante impreciso . Todavia, como nada se pres
supÕe a respeito de distribuição de X , a não ser que tenha
variSncia finita, a desigualdade (A . 2 . 1 ) á bastante úti l .
A .2.2 - LE I DOS GRANDES NOMEROS

Consideremos n provas de Bernoulli com p = P (sucess o) e seda k o nÚmero


de sucessos nas n provas . Então , a Lei dos Grandes Números afirma que, para todo 00,

DEMONSTRAÇÃO : Utilizando (A. 2. 1) para a v. a .

Var(k/n) n

Mas, sabemos que Var(k/n) P ( l -p) , do que decorre


n

Vemos que (A. 2.5) equivalente a

É claro que (A . 2.5) também implica


, voo.
A Lai dos Grandes Números afirma que. para n gran-
de, a proporção de sucessos k/ n está próxima de p = P

(sucesso) .

No caso geral , é uma seqü;ncta dg


a . independentes com uma distribuição comum, e se E CX )
existe . então, para todo

A. 2 .3 - TEOREMA DO LIMITE CENTRAL

No Cap£tulo 3 discutimos a aproximação de uma bino mial


por uma normal . A justificativa teórica é dada pelo cha mado
Teorema de De que afirma o seguinte.
Sejam X x, X variáveis binomiais, Isto ã, o número de
sucessos em n provas de Bernoulli . P (suces
so ) Seja ;
- 160 -

X -np

Então, quando
P (Y žz) + P (Zèz)
,
onda Z a v . a . N (0, 1) a z á constante.
Ou seda , para n grande, a distribuição de Y pode ser
aproximada por uma distribuiç_äo normal padrão .
Este teorema, para X binomial, um caso especial de um
resultado mais geral, chamado Teorema do Limite Cen— trat, que
apresentamos na forma seguinte.
Seda {X } uma saqÜ;ncia de v. a. independentes a com
a mesma distribuição, E (X ) = 1.1 e Var(X )
1 2 n

Então, . para z fixo , quando


Y -nu

onde Z 5 a v . a . N (0 . 1 ) .
O teorema pode ser generalizado. por exemplo, para o caso
em que {X } são independentes, mas não têm a mesma distribuição.
- 161

A. 2 .4 - H I PÕTESES COMPOSTAS

No Capítulo B vimos como testar uma hipótese sim-


ples contra uma alternativa simples . Vimos, também, para um caso especial , como

testar uma hipótese composta contra uma

alternativa composta . Para outros casos mais gerais temos que


usar o teste da razão de verossimiZhança generalizado, que
passamos a discutir.
Suponhamos o teste
H : gee

K : eee
como apresentado no Capítulo B , seja L
te,)' n a função de veros similhança para uma amostra (X
razão de veros similhança generalizada é definida por

O princípio do testa da de verogsimilhènça


razão onde ã
generalizado afirma que rejeitamos H sa 0' uma o. teste
tenha n£vel
constante a ser determinada de modo que

Se , am CA . 2 . 9) substituímos as observaçÕes (x
. . . x ) palas v . a . correspondentes, escrevemos h para À, pois
a razão será uma v . a .

EXEMPLO - Vamos testar

uma amostra aleatória de uma distribuição


normal N (u , a 2 ) , onde e a 2 são desconhecidos .
O espaço do parâmetro é

0<5 2 <œ} .

A função de veros similhança é

Vamos determinar sup L para (u , a 2 ) e 9. Tomando o log


L e derivando em relação a u e a 0 2 obtemos
do que decorrem

(A. 2.10)

Logo. es estat£sticas que maximizam L são os estimadores de


máxima verossimllhança de u e a • Portanto, cha-

mando L* o • temos que

Agora. vamos determinar sup L para (u, a 2 ) ee , isto


B a 2 » O, Portanto. temos que maximizar

Derivando log L em relação a 0 2 obtemos


portanto. sendo L , vem que

A razão da verossimllhançe CA. 2. 9) fica

(A . 2 . 14 )

Como x vemos facilmente que

isto é ,

Substituindo (A . 2 . 15 ) (A . 2 . 14 ) , obtemos :

(A. 2 . 16)

Portanto ,

O que pode ser demonstrado é que a v . a .


tem ume 'distribuição t com n -1 graus de liberdade .
Como (A . 2 . 17 ) é eqüivalente a
170 -
-

a constante c é determinada pela condição que nível do


teste. usando a tabela 3.

-c c
Por exemplo. se queremos testar

ao n £ vel a = 0, 05, e obtemos - 2,25 a partir de u ma


amostra de tamanho n = 17, então o valor de
10

= - 0 , 33 .
Como, para 0.05, c = 2,120. vemos que a região da rejeição é I t t >
2 , 120 . No caso , aceitamos H.
Nam sempre é possível obter de maneira fácil a dis tribuição da estatística a ser
usada no teste. Sob determinadas condiçÕes, poda-se demonstrar que 2 log tem uma
distribuição limite, que ã chamada distribuição do qui—qua— arado . Esta distribuição, como
a distribuição t , e caracterizada por um parâmetro, chamado também nÚmero de graus de
171 -
Liberdade. No caso em questão , a distribuição limite tem

V - VI -V 2 graus de liberdade, onde V1 = número


de parâmetros
Independentes em e B V = número dB parâmetros
Independentes 2 em e No
exemplo da normal acima . V
1 tribuiçäo limite uma
distribuição do q ui -quadrado com 1

grau de liberdade, que denotamos X2 Da modo geral


, uma dis tribuiçäo qui-quadrado com V graus de 1
iberdade tem função densidade

TT7ŽT( 21 1
(A . 2.20)

Aqui, r i . ) a função gama , definida por

x e dx,

para p > O real . O gráfico de (A. 2.20)


tem a forma da figura abaixo , para v > 2.

o x
172 -
Esta distribulçäo í tabelada para
diferentes valores de V. mas não
apresentamos uma tal tabela no apêndice.
-

Quando falamos em di\strlbuiçäo limite, estamos con


siderando n grande . Portanto , a aproximação só é razoável
para amostras grandes . Não discutiremos, aqui, pormenores
sobre esta aproximação, bem como a utilização da mesma em
alguns testes (os chamados teatee do qui—quadrado).

Você também pode gostar