2011 09 08 NotasApoioPE EdRevistaSetembro2011 SeccaoFolhas

Notas de apoio da disciplina de
Probabilidades e Estatstica
(Licenciaturas e Mestrados Integrados em Engenharia)
Manuel Cabral Morais
Lisboa, 8 de Setembro de 2011
Indice
1 Nota introdutoria 1
1.1 Enquadramento da disciplina de Probabilidades e Estatstica nas
licenciaturas e mestrados integrados em Engenharia . . . . . . . . . . . . . 1
1.2 Objectivos operacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Nocoes basicas de probabilidade 8
2.1 Experiencias aleat orias. Espaco de resultados. Acontecimentos. . . . . . . 9
2.2 No c ao de probabilidade. Interpreta c oes de Laplace, frequencista e
subjectivista. Axiomas e teoremas decorrentes. . . . . . . . . . . . . . . . . 14
2.3 Probabilidade condicionada. . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Leis das probabilidades compostas e da probabilidade total. Teorema de
Bayes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Acontecimentos independentes. . . . . . . . . . . . . . . . . . . . . . . . . 32
3 Variaveis aleat orias e distribuicoes discretas 35
3.1 Variaveis aleat orias discretas. . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Func ao de probabilidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3 Func ao de distribuic ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.4 Valor esperado, vari ancia e algumas das suas propriedades. Moda e quantis. 46
3.5 Distribui c ao uniforme discreta. . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6 Distribui c ao binomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.7 Distribui c ao geometrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.8 Distribui c ao hipergeometrica. . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.9 Distribui c ao de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.10 Algumas notas sobre analise combinat oria . . . . . . . . . . . . . . . . . . 77
4 Variaveis aleat orias e distribuicoes contnuas 78
4.1 Variaveis aleat orias contnuas. . . . . . . . . . . . . . . . . . . . . . . . . . 78
2
4.2 Func ao de densidade de probabilidade. . . . . . . . . . . . . . . . . . . . . 80
4.3 Func ao de distribuic ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.4 Valor esperado, vari ancia e algumas das suas propriedades. Moda e quantis. 86
4.5 Distribui c ao uniforme contnua. . . . . . . . . . . . . . . . . . . . . . . . . 91
4.6 Distribui c ao normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.7 Distribui c ao exponencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5 Distribuicoes conjuntas de probabilidade e complementos 110
5.1 Duas vari aveis aleat orias discretas. Distribui c oes conjuntas, marginais e
condicionais. Independencia. . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2 Duas variaveis aleat orias contnuas. Distribui c oes conjuntas, marginais e
condicionais. Independencia. . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.3 Covariancia e correla c ao. Propriedades. . . . . . . . . . . . . . . . . . . . . 137
5.4 Combinacoes lineares de variaveis aleat orias. . . . . . . . . . . . . . . . . . 147
5.5 Desigualdade de Chebychev. . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.6 Teorema do Limite Central. Aplica c oes às distribuic oes binomial e de Poisson.158
6 Estima cao pontual 174
6.1 Inferencia Estatstica. Amostragem aleat oria. . . . . . . . . . . . . . . . . 174
6.2 Estimadores e suas propriedades. . . . . . . . . . . . . . . . . . . . . . . . 181
6.3 Metodo da m axima verosimilhan ca. . . . . . . . . . . . . . . . . . . . . . . 190
6.4 Distribui c oes amostrais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6.5 Distribui c oes amostrais de medias. . . . . . . . . . . . . . . . . . . . . . . 205
7 Estima cao por intervalos 207
7.1 No c oes basicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
7.2 Intervalos de conan ca para o valor esperado, variancia conhecida. . . . . . 212
7.3 Intervalos de conan ca para a diferenca de dois valores esperados,
vari ancias conhecidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.4 Intervalos de conan ca para o valor esperado, variancia desconhecida. . . . 226
7.5 Intervalos de conan ca para a diferenca de dois valores esperados,
vari ancias desconhecidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
7.6 Intervalo de conan ca para a vari ancia de uma popula cao normal. . . . . . 242
7.7 Intervalos de conan ca para uma probabilidade de sucesso e outros
par ametros de popula c oes n ao normais uniparametricas . . . . . . . . . . . 245
3
8 Testes de hip oteses 252
8.1 No c oes basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
8.2 Testes de hip oteses para o valor esperado, variancia conhecida. . . . . . . . 262
8.3 Testes de hip oteses sobre a igualdade de dois valores esperados, variancias
conhecidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
8.4 Func ao potencia de um teste . . . . . . . . . . . . . . . . . . . . . . . . . . 270
8.5 Testes de hip oteses para o valor esperado, variancia desconhecida. . . . . . 273
8.6 Um metodo alternativo de decisao em testes de hip oteses: calculo do p-value279
8.7 Testes de hip oteses sobre a igualdade de valores esperados de duas
popula c oes, variancias desconhecidas. . . . . . . . . . . . . . . . . . . . . . 283
8.8 Testes de hip oteses para a vari ancia de uma popula c ao normal. . . . . . . . 288
8.9 Outro metodo alternativo de decisao em testes de hip oteses: rela c ao entre
intervalos de conan ca e testes bilaterais. . . . . . . . . . . . . . . . . . . . 290
8.10 Testes de hip oteses para par ametros de popula coes n ao normais
uniparametricas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
8.11 Teste de ajustamento do qui-quadrado de Pearson. . . . . . . . . . . . . . 297
8.11.1 Ajustamento de uma distribuicao discreta . . . . . . . . . . . . . . 299
8.11.2 Ajustamento de uma famlia de distribuicoes discretas . . . . . . . . 304
8.11.3 Agrupamento de classes . . . . . . . . . . . . . . . . . . . . . . . . 306
8.11.4 Dados contnuos hip otese simples/composta . . . . . . . . . . . . 309
8.11.5 Classes equiprov aveis e dados contnuos . . . . . . . . . . . . . . . . 314
8.12 Teste de independencia do qui-quadrado de Pearson em tabelas de
contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
9 Introducao à regressao linear simples 321
9.1 Modelos de regress ao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
9.2 Metodos dos mnimos quadrados e da m axima verosimilhan ca em regressao
linear simples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
9.2.1 Estima cao de
0
e
1
metodo dos mnimos quadrados . . . . . . 325
9.2.2 Estima cao de
0
e
1
metodo da MV . . . . . . . . . . . . . . . 329
9.2.3 Recta de regress ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
9.3 Propriedades dos estimadores dos mnimos quadrados e estimacao da
vari ancia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
9.4 Alguns abusos do modelo de regress ao. . . . . . . . . . . . . . . . . . . . . 335
9.5 Intervalos de conan ca para
0
,
1
e para o valor esperado da resposta. . . 338
9.6 Testes de hip oteses sobre
0
,
1
e o valor esperado da resposta. . . . . . . . 344
4
9.7 Coeciente de determina c ao e an alise de resduos na avalia cao do modelo . 355
Referencias e formulario 377
i
Captulo 1
Nota introdut oria
1.1 Enquadramento da disciplina de Probabilidades
e Estatstica nas licenciaturas e mestrados
integrados em Engenharia
A import ancia da disciplina de Probabilidades e Estatstica na forma c ao de alunas/os
de Engenharia do IST e inegavel. Basta pensar que, no seu plano curricular, elas/es
estudar ao fenomenos de natureza aleat oria e ter ao que avaliar o desempenho de sistemas
regidos por leis nao determinsticas. Nao surpreende pois que se trate de uma disciplina
de nvel b asico e obrigat oria nas licenciaturas em Engenharia do IST h a varias decadas
e que ela tenha sobrevivido ao Processo de Bolonha, constando da lista de disciplinas
estruturantes de Matematica de todas as licenciaturas e mestrados integrados do IST.
Ao presumir que os programas das disciplinas de Matem atica do Ensino Secund ario sao
cumpridos, a disciplina de Probabilidades e Estatstica proporciona aquele que e segundo
contacto com esta area.
A disciplina de Probabilidades e Estatstica tem car acter semestral e e introduzida
no plano curricular no primeiro ou no segundo semestre do segundo ano lectivo. Esta
introduc ao aparentemente tardia da disciplina no plano curricular das licenciaturas e
mestrados integrados em Engenharia do IST encontra justicac ao no facto de o conte udo
program atico da disciplina exigir que as/os alunas/os que a frequentam possuam alguma
forma c ao em Calculo Diferencial e Integral, em particular, que estejam familiarizadas/os
com:
sucessoes, func oes reais de variavel real, diferenciabilidade, primitiva c ao, c alculo
integral em IR, f ormulas de integra c ao por partes e por substituic ao, func oes
1
transcendentes elementares, series numericas;
diferenciabilidade, derivadas parciais, estudo de extremos, integrais duplos.
Com efeito estabelece-se como desejavel que as/os alunas/os tenham obtido aprova cao às
disciplinas de C alculo Diferencial e Integral I e II de cujos programas se plasmaram os
dois blocos de topicos listados acima.
1
Posto isto, o facto de a disciplina poder ser introduzida no primeiro semestre do
segundo ano de algumas licenciaturas e de as/os alunas/os poderem ainda n ao ter obtido
aprova c ao ` a disciplina de C alculo Diferencial e Integral II requer alguns cuidados especiais
na leccionac ao de alguns topicos, nomeadamente pares aleat orios contnuos.
Importa referir que a disciplina de Probabilidades e Estatstica e a primeira e ultima
disciplina da area leccionada pela Sec cao de Probabilidades e Estatstica em licenciaturas
e mestrados integrados em Engenharia do IST, salvo rarssimas excep coes.
Realce-se que a disciplina de Probabilidades e Estatstica e os conceitos nela
apreendidos abrem, no entanto, as portas a outras disciplinas que surgem posteriormente
no plano curricular das licenciaturas e mestrados integrados do IST e que podem ter
car acter complementar na area de Probabilidades e Estatstica ou estarem directamente
ligadas a aplica c oes especcas em Engenharia. A ttulo meramente exemplicativo ocorre
nomear
uma disciplina cujo programa assenta em area de Analise Multivariada,
outras duas mais especializadas e de cujos programas constam cadeias de Markov
e simulac ao estoc astica e de Monte Carlo, num dos casos, processos estoc asticos,
probabilidades de erro e canais gaussianos, noutro caso.
S ao elas as disciplinas de:
Analise de Dados e Avaliacao da area de especializac ao em Transportes, Sistemas e
Infra-Estruturas do Mestrado Integrado em Engenharia Civil (5o. ano, 1o. semestre);
Modelac ao e Simulac ao e Fundamentos de Telecomunicac oes, ambas do Mestrado
Integrado em Eng. Electrotecnica e de Computadores (3o. ano, 2o. semestre).
1
Estes t opicos sao aqui mencionados pela ordem em surgem naqueles programas e n ao pela ordem em
que sao necessarios na disciplina de Probabilidades e Estatstica.
2
1.2 Objectivos operacionais
A disciplina de Probabilidades e Estatstica tem por objectivo a iniciac ao ao estudo da
teoria das probabilidades e inferencia estatstica, tendo em vista a compreensao e aplicac ao
dos seus principais conceitos e metodos.
2
Ap os a aprova cao ` a disciplina as/os alunas/os devem ser capazes de:
identicar eventos e calcular as respectivas probabilidades por recurso a resultados
como as leis da probabilidade composta e da probabilidade total e o teorema de
Bayes; averiguar a (in)dependencia de eventos;
destrincar as variaveis aleat orias discretas das contnuas; identicar as diversas
distribuic oes discretas e contnuas e as circunstancias em que devem ser usadas;
calcular probabilidades de eventos e momentos que lhes digam respeito; averiguar a
(in)dependencia de vari aveis aleat orias e avaliar a associac ao entre elas;
identicar as distribuic oes exactas ou aproximadas de combina coes lineares de
vari aveis aleat orias, tirando partido das propriedades de fecho de algumas famlias
de distribuic oes e do teorema do limite central;
obter estimadores de parametros desconhecidos pelo metodo da maxima
verosimilhan ca e avaliar as suas propriedades; obter uma variavel fulcral para um
par ametro desconhecido, como o valor esperado, e a partir dela uma estatstica de
teste sobre esse mesmo par ametro nos mais variados contextos distribucionais;
construir um intervalo de conan ca e efectuar testes de hip oteses sobre um
par ametro desconhecido em diversas situa c oes distribuicionais; averiguar a
adequa c ao de uma distribuicao ou de uma famlia de distribuic oes a um conjunto
de dados; efectuar testes de hip oteses, recorrendo ao procedimento geral ou, em
alternativa, por recurso ao p-value;
estimar os diversos par ametros desconhecidos do modelo de regress ao linear simples;
obter intervalos de conanca e efectuar testes de hip oteses sobre tais par ametros;
avaliar a qualidade do ajustamento da recta de regress ao ao conjunto de dados.
De modo a atingir plenamente estes objectivos operacionais parece-nos essencial que a
estrutura de apresenta cao dos captulos destas notas de apoio respeite a losoa aprender
2
Ver, por exemplo, o link da disciplina de Probabilidades e Estatstica no plano curricular do Mestrado
integrado em Eng. Electrotecnica e de Computadores.
3
por exemplos e fazendo. Assim, a materia e motivada, os resultados sao enunciados,
raramente demonstrados mas sempre ilustrados com exemplos ou exerccios trabalhados
em conjunto com as/os alunas/os, como os que se seguem.
Exemplo 1.1 Eventos e probabilidades
Um sistema de comunica c ao bin aria transmite zeros e uns com probabilidade 0.5
em qualquer dos casos. Devido ao rudo existente no canal de comunicac ao h a erros na
recepc ao: transmitido um um ele pode ser recebido como um zero com probabilidade
0.1, ao passo que um zero pode ser recebido como um um com probabilidade 0.05.
Determine a probabilidade de se receber um zero.
Quadro de eventos e probabilidades
Evento Probabilidade
TZ = transmitir um zero P(TZ) = 0.5
TZ = transmitir um um P(TZ) = 0.5
RZ = receber um zero P(RZ) =?
RZ|TZ = receber um zero dado que foi transmitido um um P(RZ|TZ) = 0.1
RZ|TZ = receber um um dado que foi transmitido um zero P(RZ|TZ) = 0.05
Prob. pedida
Aplicando o teorema da probabilidade total, tem-se
P(RZ) = P(RZ|TZ) P(TZ) +P(RZ|TZ) P(TZ)
= [1 P(RZ|TZ)] P(TZ) +P(RZ|TZ)P(TZ)
= (1 0.05) 0.5 + 0.1 0.5
= 0.525.
4
Exemplo 1.2 Duas variaveis aleat orias discretas
Um computador possui um n umero elevado de componentes de um mesmo tipo que falham
de modo independente. O n umero de componentes desse tipo que falham por mes e uma
vari avel aleat oria com distribuicao de Poisson com variancia igual a um. Admita que o
computador so falha se pelo menos doze dessas componentes falharem.
Calcule a probabilidade de o computador n ao ter falhado ao m de um ano.
Variavel aleat oria
X
1
= n umero de componentes que falham em um mes
Distribuicao de X
1
X
1
Poisson()
Parametro
: V (X) = 1
= 1
Nova variavel aleatoria
X
12
= n umero de componentes que falham num ano (12 meses)
Distribuicao de X
12
Tirando partido do facto de as componentes falharem de modo independente e
recorrendo ` a propriedade reprodutiva da distribuic ao de Poisson, pode concluir-se
que:
X
12
Poisson(
12
= 12 = 12)
Fun cao de probabilidade de X
12
P(X
12
= x) =
e
12
12
x
x!
, x = 0, 1, 2, . . .
Probabilidade pedida
P(comp. nao falhar num ano) = P(X
12
11)
= F
Poisson(12)
(11)
tabela
0.4616.
5
Exemplo 1.3 Duas variaveis aleat orias contnuas
A resistencia electrica
3
(X) de um objecto e a sua condutancia electrica
4
(Y ) est ao
relacionadas do seguinte modo: Y = X
1
.
Assuma que
P(X x) =
_
_
0, x < 900
x900
200
, 900 x 1100
1, x > 1100
e determine a probabilidade de a condut ancia electrica exceder 10
3
mho.
Variavel aleat oria
X = resistencia electrica
Nova variavel aleatoria
Y = X
1
= condut ancia electrica
P(Y > 10
3
mho) = P
_
1
X
> 10
3
_
= P
_
X < 10
3
_
=
1000 900
200
=
1
2
.
Importa fazer um reparo sobre a resolu cao dos exemplos/exerccios das notas de
apoio. Ela e apresentada em pequenas seccoes com cabecalho logo tem um caracter
aparentemente repetitivo que se tem revelado, por sinal, util para que as/os alunas/os
aprendam a estruturar devidamente a resolucao de qualquer exerccio da disciplina de
Probabilidades e Estatstica.
3
A resistencia electrica e a capacidade de um corpo qualquer se opor à passagem de corrente eletrica
pelo mesmo; de acordo com o Sistema Internacional de Unidades (SI), a resistencia electrica e medida
em ohm (http://pt.wikipedia.org/wiki/Resistencia eletrica).
4
A condut ancia electrica mede a facilidade com que a corrente electrica ui atraves de uma componente
electrica, logo trata-se do recproco da resistencia electrica; de acordo com o SI, a condut ancia electrica
e medida em siemens ou mho (http://pt.wikipedia.org/wiki/Condut ancia eletrica).
6
Estas notas de apoio constituem tambem um manual para a/o aluna/o desejosa/o
de um r apido progresso na aprendizagem de Probabilidades e Estatstica e disposta/o a
estudar sozinha/o e capaz de combinar o material que aqui encontra com outro proveniente
de fontes tao importantes como o livro de texto recomendado para a disciplina.
Expresso desde ja os meus agradecimentos às/aos minhas/meus varias/os colegas da
Secc ao de Probabilidades e Estatstica do Departamento de Matematica do Instituto
Superior Tecnico que leccionaram a disciplina de Probabilidades e Estatstica (das
licenciaturas e mestrados integrados em Engenharia) e da ent ao disciplina de Estatstica
(da licenciatura em Matem atica Aplicada e Computac ao), por terem directa ou
indirectamente contribudo para estas notas de apoio.
Os erros e imprecisoes eventualmente existentes nestas notas sao, naturalmente,
aleat orios muitas das vezes fruto de opera c oes de copy/paste e da inteira
responsabilidade do autor, que muito agradece que eles lhe sejam comunicados por e-
mail para maj@math.ist.utl.pt.
Boa leitura e bom trabalho.
Manuel Cabral Morais
Lisboa, 8 de Setembro de 2011
7
Captulo 2
No coes basicas de probabilidade
Palavras como
prov avel (provavelmente)
probabilidade
acaso
sorte
pertencem ao vocabulario corrente e s ao utilizadas com extrema frequencia por todos,
em parte por termos a convicc ao de que a natureza e mutavel e incerta, de que o futuro
encerra em si in umeras possibilidades e de que o acaso governa o mundo.
Na formaliza cao matematica actual, a probabilidade e um termo medindo o grau de
possibilidade ou de credibilidade de ocorrencia de um acontecimento.
8
2.1 Experiencias aleat orias. Espaco de resultados.
Acontecimentos.
A formaliza c ao moderna de Probabilidade assenta nas nocoes de
experiencia aleat oria e seus possveis resultados e de
acontecimento.
Denicao 2.1 Experiencia aleat oria (E.A.)
Experiencia cujo resultado exacto nao pode ser predito antes da realiza cao da mesma
devido à intervencao do acaso.
Nota 2.2 Experiencia aleat oria
No caso de a experiencia aleat oria poder ser repetida um grande n umero de vezes,
em condicoes mais ou menos semelhantes, os resultados globais apresentam certa
regularidade estatstica...
Exemplo 2.3 Experiencias aleat orias
Designacao Experiencia aleatoria
E1 Registo do n umero de viaturas que atingem os 100Km/h em menos
de 6 segundos, em 7 viaturas testadas
E2 Contagem do n umero anual de acidentes de autom ovel na A1
E3 Medi cao da resistencia de uma mola da suspensao de uma viatura
Denicao 2.4 Espaco de resultados

Conjunto de todos os resultados possveis de uma E.A.

E conhecido antes de a E.A. se
realizar e e usualmente representado pela letra grega .
Nota 2.5 Espaco de resultados
diz-se:
discreto caso # seja nito ou innito numeravel;
contnuo se # for innito n ao numeravel.
9
Exemplo 2.6 Espacos de resultados
Na tabela seguinte guram os espacos de resultados das tres e.a. apresentadas no Exemplo
2.3:
E.A. Espa co de resultados () Classica cao de
E1 {0, 1, 2, 3, 4, 5, 6, 7} Discreto (nito)
E2 {0, 1, 2, . . .} Discreto (innito numeravel)
E3 IR
+
Contnuo (innito n ao numer avel)
Denicao 2.7 Evento (acontecimento)

Designa c ao dada a qualquer subconjunto do espaco de resultados.
Nota 2.8 Evento
Em rela cao a uma dada E.A. diz-se que o evento A ocorreu sse o resultado da E.A.
pertencer a A.
Exemplo 2.9 Eventos
De seguida apresentam-se alguns eventos associados ` as tres e.a. descritas no Exemplo 2.3:
E.A. Evento
E1 A = nenhuma das 7 viaturas testadas atingiu os 100Km/h
em menos de 6 segundos
= {0}
B = pelo menos 4 das 7 viaturas testadas atingiu os 100Km/h
em menos de 6 segundos
= {4, 5, 6, 7}
E2 C = registo de mais de 5 acidentes anuais na A1
= {6, 7, . . .}
E3 D = resistencia superior a 8 unidades
= (8, +)
10
Nota 2.10 Classica cao de eventos
O evento A diz-se:
elementar quando constitudo por um unico elemento de , i.e., #A = 1;
certo se A = ;
impossvel caso A = .
Denicao 2.11 Eventos disjuntos
Os eventos A e B dizem-se disjuntos (ou mutuamente exclusivos, ou incompatveis) sse
A B = , (2.1)
i.e., se a realiza c ao simultanea de A e B for impossvel.
Denicao 2.12 Inclusao de eventos
Quando o evento A est a contido (incluso) em B A B verica-se:
Realiza c ao de A Realiza c ao de B (2.2)
Realiza c ao de A Realiza c ao de B, (2.3)
i.e., a realiza cao de A implica a de B mas a implicac ao no sentido contr ario n ao e
necessariamente verdadeira.
Uma vez que os eventos n ao passam de (sub)conjuntos e possvel efectuar
opera coes sobre eventos j a nossas conhecidas como s ao o caso da intersecc ao, da
reuni ao, etc. Descreveremos o seu signicado em termos de realiza c oes de eventos quer
verbalmente, quer ` a custa de um diagrama de Venn.
Sejam
o espa co de resultados de uma E.A. e
A e B dois eventos.
Ent ao podemos efectuar as seguintes opera c oes sobre A e B:
11
Opera cao Notacao Descri cao verbal Diagrama de Venn
Interseccao A B Realizacao simult anea de A e de B
Reuni ao A B Realizacao de A ou de B, i.e.,
de pelo menos um dos dois eventos
Diferen ca B\A Realizacao de B sem que se realize A
(B excepto A)
A\B Realizacao de A sem que se realize B
(A excepto B)
Complementar A N ao realizacao de A
12
As opera c oes sobre eventos gozam de propriedades bem conhecidas como a
associatividade, comutatividade, etc., que convem recordar:
Propriedade Descricao matematica
Associatividade (A B) C = A (B C)
(A B) C = A (B C)
Comutatividade A B = B A
A B = B A
Distributividade (A B) C = (A C) (B C)
(A B) C = (A C) (B C)
Idempotencia A A = A
A A = A
Absorcao A B A B = A
A B A B = B
Modulares A = A
A =
A =
A = A
Leis de De Morgan A B = A B
A B = A B
Dupla negacao A = A
13
2.2 No cao de probabilidade. Interpreta coes de
Laplace, frequencista e subjectivista. Axiomas
e teoremas decorrentes.
A probabilidade e um conceito extraordinariamente complexo e, como teremos ocasiao
de ver daqui a pouco, somos capazes de adiantar algumas no c oes de probabilidade que se
revelar ao insatisfat orias devido a limita coes a elas subjacentes.
Denicao 2.13 Probabilidade classica de Laplace
Considere-se uma E.A. com espaco de resultados com as seguintes particularidades:
e constitudo por
n eventos elementares (# = n)
distintos
igualmente prov aveis
1
e em
n umero nito.
Considere-se ainda que a realiza cao do evento A passa pela ocorrencia de m dos n eventos
elementares, i.e., #A = m. Ent ao a probabilidade de realiza cao de A e dada por:
P(A) =
n umero de casos favor aveis à ocorrencia de A
n umero de casos possveis
=
#A
#
=
m
n
. (2.4)
Nota 2.14 Limita c oes da probabilidade classica de Laplace

Esta denic ao s o e valida quando
# < + (ou seja, o n umero de eventos elementares e nito) e
e constitudo por eventos elementares igualmente prov aveis,
pressupostos estes frequentemente violados na pratica.
1
Nada leva a crer que a ocorrencia de algum dos eventos e privilegiada em relacao à dos restantes.
14
Exemplo 2.15 Probabilidade classica de Laplace
Admita que num stand se encontram 353 viaturas de somente duas marcas (A e B).
Destas:
201 sao da marca A;
57 possuem direcc ao assistida;
37 sao da marca A e possuem direcc ao assistida.
Calcule a probabilidade de uma viatura seleccionada ao acaso ser da marca A.
Evento
A = viatura seleccionada ao acaso ser da marca A
No. casos favoraveis
m = 201
No. casos possveis
n = 353
P(A) =
m
n
=
201
353
.
Antes de passarmos a uma outra no c ao de probabilidade e conveniente adiantarmos a

denic ao de frequencia relativa de um evento bem como as propriedades algebricas dessa
mesma frequencia.
Denicao 2.16 Frequencia relativa
Sejam:
N o n umero de realiza c oes (nas mesmas condi c oes) de certa E.A.;
n
N
(A) o n umero de vezes que o evento A ocorreu nas N realiza c oes da E.A. (i.e.,
representa a frequencia absoluta do evento A).
Ent ao a frequencia relativa do evento A e dada por
f
N
(A) =
n
N
(A)
N
. (2.5)
15
Nota 2.17 Propriedades algebricas
A frequencia relativa satisfaz as seguintes propriedades:
0 f
N
(A) 1;
f
N
() = 1;
f
N
(A B) = f
N
(A) +f
N
(B), se A B = ;
f
N
(A) estabiliza ` a medida que N aumenta.
N ao surpreende pois a seguinte no c ao de probabilidade.
Denicao 2.18 Probabilidade frequencista
A probabilidade do evento A e igual ao limite da frequencia relativa da ocorrencia do
evento A:
P(A) = lim
N+
n
N
(A)
N
= lim
N+
f
N
(A). (2.6)
Exemplo 2.19 Probabilidade frequencista

Foram registados os resultados respeitantes a um total de 100 lancamentos de uma moeda
equilibrada. Assim, nas colunas da tabela abaixo podem encontrar-se
o n umero do lan camento (N),
o resultado do Nesimo lan camento (0 = coroa, 1 = cara) e
a frequencia relativa do evento A = sair cara ate ao Nesimo lan camento (f
N
(A)),
respectivamente.
N (0=coroa, 1=cara) fN(A) N (0=coroa, 1=cara) fN(A)
1 1
1
1
91 1
46
91
2 0
1
2
92 1
47
92
3 1
2
3
93 0
47
93

10 1
2
5
100 0
49
100
16
A esta tabela segue-se o correspondente gr aco da frequencia relativa f
N
(A) (` a
esquerda) e o deste e de outros dois conjuntos de 100 lan camentos (` a direita). Em ambos
e evidente a estabiliza cao da frequencia relativa em torno de 0.5 ` a medida que o n umero
total de lan camentos (N) aumenta.
Nota 2.20 Limita c oes da probabilidade frequencista

Esta no c ao de probabilidade n ao e razo avel caso a E.A. nao possa ser realizada mais do
que uma vez ou quando ela e hipotetica (por exemplo, uma ida a Marte).
Denicao 2.21 Probabilidade subjectiva
Uma pessoa pode atribuir a um evento um n umero real no intervalo [0, 1] a que se dar a
o nome de probabilidade do evento e que expressa um grau de credibilidade pessoal na
ocorrencia do evento.
Exemplo 2.22 Probabilidade subjectiva
Ao perguntar-se qual a probabilidade de visitar-se o planeta Marte antes do ano 2030
obteve-se as seguintes respostas de duas pessoas:
funcion ario da NASA 0.5;
taxista 0.
Este exemplo leva a considerar uma outra no c ao de probabilidade que dever a ser
precedida pela apresenta cao da no c ao de algebra de eventos.
17
Denicao 2.23 algebra de eventos
Trata-se de uma colecc ao nao vazia de eventos (probabiliz aveis), A, que verica as
seguintes propriedades:
1. A;
2. A A A A;
3.

+
i=1
A
i
A para qualquer colec cao cont avel de eventos de A, seja ela
{A
1
, A
2
, . . .}.
Exemplo 2.24 algebra de eventos
A
1
= {, };
A
2
= IP() que representa as partes de , i.e., a colecc ao de todos os subconjuntos
de .
Denicao 2.25 Fun cao de probabilidade (no sentido de Kolmogorov)
Funcao que possui por domnio a algebra de eventos e por contradomnio o intervalo
[0, 1] i.e.,
P : A [0, 1] (2.7)
e com a particularidade de respeitar os seguintes...
Axiomas
1. P() = 1.
2. 0 P(A) 1, A A.
3. Seja {A
1
, A
2
, . . .} uma colecc ao cont avel de eventos mutuamente exclusivos de
A (i.e. A
i
A
j
= , i = j). Ent ao
P
_
+
_
i=1
A
i
_
=
+
i=1
P(A
i
). (2.8)
18
Proposicao 2.26 Consequencias elementares dos axiomas
Os axiomas n ao nos ensinam a calcular probabilidades mas estabelecem regras para o seu
c alculo muito em particular algumas das suas seguintes consequencias elementares:
1. P() = 0;
2. P(A) = 1 P(A);
3. A B P(A) P(B);
4. P(B\A) = P(B) P(A B).
Exerccio 2.27 Demonstre as consequencias elementares dos axiomas.
Exemplo 2.28 Consequencias elementares dos axiomas
Uma companhia de telecomunica coes classica as chamadas como sendo do tipo:
V , caso haja transmissao de voz;
D, caso haja transmissao de dados (por modem ou fax).
Com base em informa c ao da companhia pode adiantar-se que:
V = transmissao de voz P(V ) = 0.7
D = transmissao de dados P(D) = 0.5
V D = transmissao simult anea de voz e dados P(V D) = 0.2
(a) Calcule a probabilidade de a transmiss ao n ao ser de voz.
Evento
V = transmiss ao nao ser de voz
P(V ) = 1 P(V )
= 1 0.7
= 0.3.
19
(b) Obtenha a probabilidade de haver exclusivamente transmiss ao de voz.
Evento
V \D = transmiss ao exclusiva de voz
P(V \D) = P(V ) P(V D)
= 0.7 0.2
= 0.5.
Nota 2.29 Um evento pode ainda ser classicado de:

quase-certo se P(A) = 1 no entanto A = ;
quase-impossvel caso P(A) = 0 mas A = .
Exerccio 2.30 De exemplos de eventos quase-certos e quase-impossveis.
De seguida s ao enunciados dois resultados que permitir ao o calculo da probabilidade
da reuniao de dois e de tres eventos.
Proposicao 2.31 Reuniao de dois eventos
P(A B) = P(A) +P(B) P(A B). (2.9)
Demonstra c ao:
P(A B) = P [(A\B) (A B) (B\A)]
= P(A\B) +P(A B) +P(B\A)
= [P(A) P(A B)] +P(A B) + [P(B) P(A B)]
= P(A) +P(B) P(A B). (2.10)
Proposicao 2.32 Reuniao de tres eventos

P(A B C) = P(A) +P(B) +P(C)
P(A B) P(A C) P(B C)
+P(A B C). (2.11)
Exerccio 2.33 Demonstre a regra de adi c ao (2.11).

20
Exemplo 2.34 Regras de adicao
Retome o Exemplo 2.15 respeitante ao stand com 353 viaturas.
(a) Organize um quadro com os eventos j a descritos e com as respectivas probabilidades.
Evento Casos favor. Casos poss. Probabilidade
A = viat. marca A 201 353 P(A) =
201
353
D = viat. com dir. assist. 57 353 P(D) =
57
353
A D = viat. marca A com dir. assist. 37 353 P(A D) =
37
353
(b) Obtenha a probabilidade de uma viatura seleccionada ao acaso ser da marca A ou
possuir direccao assistida.
Evento
A D
P(A D) = P(A) +P(D) P(A D)
=
201
353
+
57
353

37
353
=
221
353
.
21
2.3 Probabilidade condicionada.
Motiva cao 2.35 Probabilidade condicionada
Suponha que dispomos de um baralho de 52 cartas (13 de cada naipe) do qual extramos
uma carta ao acaso.
(a) Qual a probabilidade de ter sado o rei de copas? 1/52
(b) Qual a probabilidade de ter sado o rei de copas sabendo à partida que a carta
extrada e uma carta de paus? 0
(c) E se soubessemos de antem ao que a carta e de copas? 1/13
Nota 2.36 Probabilidade condicionada
Como pudemos ver, a probabilidade do evento sair o rei de copas foi sucessivamente
avaliada ` a medida que nos foi adiantada informacao.
A questao que se coloca naturalmente e: de que forma a obten c ao de informa cao
adicional (correspondente à ocorrencia de eventos) pode vir a inuenciar a calculo de
probabilidades?
Denicao 2.37 Probabilidade condicionada
Sejam:
o espa co de resultados;
P a func ao de probabilidade.
Ent ao a probabilidade do evento A condicionada pela ocorrencia do evento B e dada por
P(A|B) =
P(A B)
P(B)
, (2.12)
desde que P(B) > 0.
Esta probabilidade tambem pode ler-se do seguinte modo probabilidade de A dado B ou
probabilidade de A sabendo que B ocorreu e representa uma reavalia c ao da probabilidade
de A face ao facto de B ter ocorrido.
22
Exemplo 2.39 Probabilidade condicionada (cont.)
Qual a probabilidade de a carta seleccionada ao acaso ser o rei de copas sabendo à partida
que se trata de uma carta de copas?
A = Sair o rei de copas P(A) =
1
52
B = Sair uma carta de copas P(B) =
13
52
Evento
A|B
Prob. pedida
P(A|B) =
P(A B)
P(B)
=
P(A)
P(B)
=
1/52
13/52
=
1
13
. (2.13)

P(. . . |B) e uma func ao de probabilidade (no sentido de Kolmogorov), como tal respeita
os tres axiomas seguintes:
1. P(|B) = 1.
2. 0 P(A|B) 1, A A.
3. Seja {A
1
, A
2
, . . .} uma colec cao contavel de eventos mutuamente exclusivos de A
(i.e. A
i
A
j
= , i = j). Ent ao
P
__
+
_
i=1
A
i
_
B
_
=
+
i=1
P(A
i
|B). (2.14)
Para alem disso, verica as consequencias elementares destes mesmos axiomas enunciadas
na Proposicao 2.26.
23
Exemplo 2.41 Um grupo de alunos do 1o. ano de Mecanica elaborou 100 programas.
Constatou-se que
20% possuem erros de Sintaxe (S),
30% possuem erros de Acesso ` a Mem oria (AM) e
10% possuem erros de Sintaxe e de Acesso ` a Memoria.
Admitamos que foi escolhido ao acaso um programa e que este possua erros de Sintaxe.
Neste caso qual a probabilidade do programa possuir (tambem) erros de Acesso à
Memoria?
S = programa com erros de Sintaxe P(S) = 0.2
AM = programa com erros de Acesso à Memoria P(AM) = 0.3
S AM = programa com erros de Sintaxe e de Acesso à Memoria P(S AM) = 0.1
Evento
AM|S
Prob. pedida
P(AM|S) =
P(S AM)
P(S)
=
0.1
0.2
=
1
2
(2.15)
24
2.4 Leis das probabilidades compostas e da
probabilidade total. Teorema de Bayes.
Motiva cao 2.42 Lei das probabilidades compostas
Suponha que se conhece P(A|B) e P(B). Ser a que podemos calcular P(A B)? A
resposta e armativa:
P(A B) = P(B)P(A|B). (2.16)
A generaliza c ao deste resultado para a intersecc ao de n eventos constitui a lei das
probabilidades compostas (uma de duas regras da multiplica c ao).
Proposicao 2.43 Lei das probabilidades compostas
Considere-se uma colec cao de n eventos {A
i
}
i=1,...,n
tal que P(A
i
) > 0 e
P(A
1
A
2
. . . A
n1
) > 0. Ent ao
P(A
1
A
2
. . . A
n1
A
n
) = P(A
1
) P(A
2
|A
1
) P[A
3
|(A
1
A
2
)]
. . . P[A
n
|(A
1
A
2
. . . A
n1
)]. (2.17)
Exerccio 2.44 Demonstre a lei das prob. compostas enunciada na Prop. 2.43.
Com o exemplo que se segue, veremos que a lei das probabilidades compostas e
de extrema utilidade especialmente quando pretendemos calcular a probabilidade de
sequencias de eventos em experiencias aleat orias.
Exemplo 2.45 Lei das probabilidades compostas
Considere-se um lote de 100 molas do sistema de suspensao de autom ovel. Destas, 20
s ao consideradas defeituosas (D) por violarem a lei de Hooke quando se aplica uma for ca
superior a 35 10
4
N.
Responda ` as questoes seguintes sabendo que foram recolhidas 3 molas ao acaso e sem
reposic ao deste lote.
(a) Qual a probabilidade das 3 molas nao serem defeituosas?
Evento
D
1
D
2
D
3
= 1a., 2a. e 3a. molas nao defeituosas
25
Prob. pedida
P(D
1
D
2
D
3
)
lei prob. comp.
= P(D
1
) P(D
2
|D
1
) P[D
3
|(D
1
D
2
)]
=
80
100

80 1
100 1

80 1 1
100 1 1
=
80
100

79
99

78
98
.
(b) Qual a probabilidade de, nessa mesma recolha, obtermos uma mola defeituosa
somente ` a 3a. extrac c ao?
Evento
D
1
D
2
D
3
= 1a. e 2a. molas n ao defeituosas e 3a. mola defeituosa
Prob. pedida
P(D
1
D
2
D
3
)
lei prob. comp.
= P(D
1
) P(D
2
|D
1
) P[D
3
|(D
1
D
2
)]
=
80
100

80 1
100 1

20
100 1 1
=
80
100

79
99

20
98
.
A no cao de parti cao do espaco de resultados enunciada ja a seguir e necessaria para

enunciar nao so a lei da probabilidade total nesta seccao como o Teorema de Bayes
enunciado ainda neste captulo.
Denicao 2.46 Particao de
A colecc ao de n eventos P
= {A
i
}
i=1,...,n
diz-se uma parti cao de sse:
A
i
A
j
= , i = j (eventos disjuntos dois a dois);

n
i=1
A
i
= ;
P(A
i
) > 0, i = 1, . . . , n.
2
2
As parti coes com que lidaremos sao de um modo geral constitudas por um n umero nito de eventos.
Estes tambem podem ser em n umero innito numeravel. No ambito desta disciplina n ao se considerar ao
parti coes com um n umero innito n ao numeravel de eventos, da a nota cao.
26
Exemplo 2.47 Particao de
E.A. Registo do n umero de acidentes na A1 durante um ano
= {0, 1, 2, . . .}
P
= {{i}}
i=0,1,2,...
, parti c ao constituda por todos os eventos elementares de
P
= {{0, 2, 4, 6, . . .}, {1, 3, 5, . . .}}, parti c ao constituda pelos eventos registo de

n umero par e registo de n umero mpar.
Proposicao 2.48 Lei da probabilidade total
Sejam:
B um evento;
P
= {A
i
}
i=1,...,n
uma parti c ao de .
Ent ao
P(B) =
n
i=1
P(B|A
i
)P(A
i
). (2.18)
Nota 2.49 Lei da probabilidade total

Este resultado reveste-se de grande import ancia por permitir calcular a probabilidade de
um evento B quando se disp oe das probabilidades do evento B condicionado a eventos A
i
(que constituem uma parti c ao de ) e das probabilidades destes eventos que condicionam
B.
Exerccio 2.50 Lei da probabilidade total
Prove a lei da probabilidade total enunciada anteriormente na Proposi cao 2.48.
Exemplo 2.51 Lei da probabilidade total
3
Com o objectivo de aumentar a seguran ca de crian cas em autom oveis, est ao a ser testados
dois dispositivos de retenc ao A e B. As simula c oes mostraram que, em caso de acidente
grave, o dispositivo A (resp. B) e ecaz em 95% (resp. 96%) dos casos. Admita
que no mercado s o passar ao a existir estes dois dispositivos, instalados em automoveis
exactamente na mesma propor cao.
Qual a probabilidade do dispositivo de retenc ao instalado num autom ovel seleccionado ao
acaso vir a ser ecaz em caso de acidente grave?
3
Adaptado do Exame de 1a.

Epoca, 24 de Junho de 2006.
27
A = dispositivo do tipo A P(A) = 0.5
B = dispositivo do tipo B P(B) = 0.5
E = dispositivo ecaz em caso de acidente grave P(E) = ?
E|A = dispositivo ecaz... dado que e do tipo A P(E|A) = 0.95
E|B = dispositivo ecaz... dado que e do tipo B P(E|B) = 0.96
Evento
E = dispositivo ecaz em caso de acidente grave
Prob. pedida
P(E)
lei prob. total
= P(E|A) P(A) +P(E|B) P(B)
= 0.95 0.5 + 0.96 0.5
= 0.955.
(Por que razao P(E) e igual à media aritmetica de P(E|A) e P(E|B)?)
Motiva cao 2.52 Teorema de Bayes
Uma vez conhecida a probabilidade P(B|A) podera avaliar-se
P(A|B)? A resposta a esta quest ao e armativa
P(A|B) = P(B|A)
P(A)
P(B)
(2.19)
e e enunciada no teorema que se segue.
Teorema 2.53 Teorema de Bayes
Sejam:
B um evento tal que P(B) > 0;
P
= {A
1
, . . . , A
n
} uma parti c ao de .
Ent ao
P(A
i
|B) =
P(B|A
i
)P(A
i
)
P(B)
. (2.20)
28
Recorrendo à lei da probabilidade total pode adiantar-se que
P(A
i
|B) =
P(B|A
i
)P(A
i
)
n
j=1
P(B|A
j
)P(A
j
)
. (2.21)
Nota 2.54 Este resultado permite que a reavalia cao das probabilidades se faca tanto
num sentido como noutro:
A
i
sabendo B e
B sabendo A
i
.
Exemplo 2.55 Teorema de Bayes
4
Retome o Exemplo 2.51 e calcule agora a probabilidade de o dispositivo ser do tipo A
sabendo que foi ecaz em caso de acidente grave.
Evento
A|E = dispositivo do tipo A dado que foi ecaz em caso de acidente grave
Prob. pedida
P(A|E)
teorema Bayes
=
P(E|A) P(A)
P(E)
=
0.95 0.5
0.955
= 0.4974.
Exemplo 2.56 Lei da probabilidade total e teorema de Bayes

5
Quatro instrumentos de corte, um de cada uma das marcas M
1
, M
2
, M
3
e M
4
, funcionam
satisfatoriamente com probabilidade 0.9, 0.8, 0.6, 0.4, respectivamente para cada marca.
(a) Determine a probabilidade de um instrumento, seleccionado ao acaso desses quatro,
funcionar satisfatoriamente.
4

Epoca, 24 de Junho de 2006.
5
Exame de

Epoca Especial, 8 de Setembro de 2004.
29
Mi = instrum. ser da marca i P(Mi) = 0.25, i = 1, 2, 3, 4
S = instrum. func. satisf. P(S) = ?
S|Mi = instrum. func. satisf. dado que e da marca i P(S|Mi) =
_
_
0.9, i = 1
0.8, i = 2
0.6, i = 3
0.4, i = 4
Evento
S = instrum. seleccionado funcionar satisfatoriamente
Prob. pedida
P(S)
lei prob. total
=
4
i=1
P(S|M
i
) P(M
i
)
= (0.9 + 0.8 + 0.6 + 0.4) 0.25
= 0.675.
(b) Sabendo que o instrumento seleccionado ao acaso n ao funciona satisfatoriamente,
qual a probabilidade de se ter selecionado um dos dois instrumentos menos aveis?
Evento
(M
3
M
4
)|S = instrum. seleccionado ser das duas marcas menos aveis dado
que nao funcionou satisfatoriamente
Prob. pedida
P[(M
3
M
4
)|S] = P(M
3
|S) +P(M
4
|S)
teorema Bayes
=
P(S|M
3
) P(M
3
)
P(S)
+
P(S|M
4
) P(M
4
)
P(S)
=
[1 P(S|M
3
)] P(M
3
)
1 P(S)
+
[1 P(S|M
4
)] P(M
4
)
1 P(S)
=
(1 0.6) 0.25
1 0.675
+
(1 0.4) 0.25
1 0.675
= 0.769.
30
Importante
De real car que:
P[(M
3
M
4
)|S] = 1 P(M
3
|S) +P(M
4
|S).
Com efeito, tem-se aplicando mais uma vez o teorema de Bayes:
1 P[(M
3
M
4
)|S] = 1 [P(M
3
|S) +P(M
4
|S)]
= 1
_
P(S|M
3
) P(M
3
)
P(S)
+
P(S|M
4
) P(M
4
)
P(S)
_
= 1
_
0.6 0.25
0.675
+
0.4 0.25
0.675
_
0.630.
31
2.5 Acontecimentos independentes.
Denicao 2.57 Eventos independentes
Os eventos A e B dizem-se independentes sse
P(A B) = P(A) P(B), (2.22)
Neste caso e usual escrever-se AB.
Exemplo 2.58 Lei da probabilidade total; eventos independentes
6
75% da popula c ao de Nicosia (Chipre) e grega e 25% turca. Apurou-se tambem que 20%
dos gregos e 10% dos turcos falam ingles.
(a) Qual a percentagem da popula cao de Nicosia que fala ingles?
G = habitante grego P(G) = 0.75
T = habitante turco P(T) = 0.25
I = habitante falar ingles P(I) = ?
I|G = habitante falar ingles dado que e grego P(I|G) = 0.20
I|T = habitante falar ingles dado que e turco P(I|T) = 0.10
Evento
I = habitante falar ingles
Prob. pedida
P(I)
lei prob. total
= P(I|G) P(G) +P(I|T) P(T)
= 0.20 0.75 + 0.10 0.25
= 0.175.
6
Adaptado do Teste A, 22 de Abril de 2006.
32
(b) Serao os eventos ser grego e falar ingles eventos independentes?
Averigua cao de independencia
P(G I) = P(I|G) P(G)
= 0.20 0.75
= 0.15
=
P(G) P(I) = 0.75 0.175
= 0.13125.
J a que P(G I) = P(G) P(I) pode armar-se que G e I n ao sao eventos
independentes como, alias, seria de esperar.
Proposicao 2.59 Consequencias
1. Sejam A e B eventos independentes tais que P(A) > 0 e P(B) > 0. Ent ao:
P(A|B) = P(A);
P(B|A) = P(B).
Isto e, o conhecimento de B n ao afecta a reavalia c ao da probabilidade de A, e
vice-versa.
2. Sejam A e B dois eventos tais que:
A B = (eventos disjuntos);
P(A) > 0 e P(B) > 0.
Ent ao AB, i.e., A e B n ao s ao independentes.
3. Tem-se, para qualquer evento A:
A;
A.
4. Sejam A e B dois eventos independentes. Ent ao:
AB;
AB;
AB.
33
Exerccio 2.60 Eventos independentes
Demonstre a Proposic ao 2.59.
Nota 2.61 Independencia completa (tres eventos)
Os eventos A, B e C dizem-se completamente independentes sse
P(A B) = P(A) P(B);
P(A C) = P(A) P(C);
P(B C) = P(B) P(C);
P(A B C) = P(A) P(B) P(C).
Nota 2.62 Independencia completa (n eventos)
Os eventos A
1
, . . . , A
n
dizem-se completamente independentes sse o forem dois a dois, tres
a tres, . . ., n a n.
34
Captulo 3
Variaveis aleat orias e distribui c oes
discretas
Em algumas situa c oes os resultados das e.a. s ao numericos, como e o caso de medic oes,
contagens, etc. Noutras os resultados possveis constituem um espaco n ao numerico.
1
Basta pensar na classicac ao de 2 artigos, seleccionados da produc ao de uma f abrica,
quanto a serem defeituosos ou nao defeituosos.
Ao realizar esta e outras e.a. e frequente nao estarmos interessados nos resultados
detalhados da mesma
2
mas somente numa quantidade numerica determinada pelo
resultado da e.a., por exemplo, o n umero de artigos defeituosos. Neste caso atribui-
se um n umero a cada resultado da e.a., sendo que tal atribui c ao pode ser puramente
convencional...
Passemos ` a deni cao (informal) de vari avel aleat oria: a de fun cao com
caractersticas especiais que transforma eventos em n umeros ou, mais genericamente,
em vectores.
Denicao 3.1 Variavel aleatoria
A funcao X diz-se uma variavel aleat oria (v.a.) se possuir
domnio ,
contradomnio IR
X
contido em IR
n
e tiver a particularidade de vericar uma condicao de mensurabilidade.
3
Assim,
1
Leia-se: n ao e um subconjunto de IR
n
.
2
Neste caso particular os resultados sao pares ordenados: (D1, D2), (D1, D2), etc., onde Di (Di)
representa a classicacao do artigo i de defeituoso (n ao defeituoso, respectivamente).
3
Esta condi cao sera explicitada dentro em breve.
35
X : IR
X
IR
n
, (3.1)
i.e., a imagem de um evento e um vector X() IR
X
IR
n
.
Nota 3.2 Tipos de variaveis aleatorias
Dependendo do valor da constante n estaremos a lidar com v.a.s com caracteres distintos:
se n = 1, a v.a. diz-se unidimensional;
se n = 2, a v.a. diz-se bidimensional;
se n > 2, a v.a. diz-se multidimensional.
No ambito desta disciplina debrucar-nos-emos em particular nos casos unidimensional e
bidimensional.
Dependendo do cardinal do conjunto de valores possveis da v.a. estaremos a lidar
grosso modo com os seguintes tipos de v.a.:
se #IR
X
= #IN (ou seja, IR
X
e nito ou innito numeravel), a v.a. diz-se discreta;
se #IR
X
= #IR (i.e., innito nao numer avel) e..., a v.a. diz-se contnua.
Nota 3.3 Condicao de mensurabilidade
Considere-se que uma e.a. possui espaco de resultados associado à algebra A. E seja
X uma v.a. unidimensional.
A condi c ao de mensurabilidade prende-se neste caso com a existencia de imagem
inversa (segundo X) de qualquer intervalo do tipo (, x] na algebra A:
x IR, X
1
((, x]) A,
onde X
1
((, x]) = { : X() x}.
36
3.1 Variaveis aleatorias discretas.
Denicao 3.4 V.a. discreta
A v.a. X diz-se discreta, caso tome valores em IR
X
= {x
1
, x
2
, . . .}, em n umero nito ou
innito numer avel, e
P(X IR
X
) = P(X {x
1
, x
2
, . . .}) = 1. (3.2)
Exemplo 3.5 Variavel aleat oria discreta

Considere-se um teste americano com 3 quest oes, cujas respostas s ao dadas de forma
independente. A resposta a cada questao pode estar correcta (C) com probabilidade
P(C) = 0.5, ou incorrecta (C) com probabilidade P(C) = 0.5.
(a) Identique a e.a. e o respectivo espaco de resultados.
E.a.
Classicac ao de 3 quest oes em teste americano
Eventos-chave
C =quest ao classicada como correcta
C =quest ao classicada como incorrecta
Espaco de resultados
= {CCC, CCC, CCC, CCC, CCC, CCC, CCC, CCC}.
Este espaco de resultados e constitudo por 8 eventos elementares.
Por exemplo, CCC representa de forma abreviada a classicac ao das 3 questoes
como incorrectas e CCC a classicac ao da segunda quest ao como correcta e as
restantes como incorrectas.
(b) Dena uma v.a. que considere pertinente e determine o conjunto dos seus valores
possveis (i.e., o seu contradomnio). Represente a v.a. esquematicamente enquanto
func ao que transforma eventos em n umeros reais.
V.a.
X = n umero de respostas correctas no teste americano
Contradomnio e representa cao esquematica de X
IR
X
= {0, 1, 2, 3}
37
X(CCC) = 0
X(CCC) = X(CCC) = X(CCC) = 1, etc.
38
3.2 Fun cao de probabilidade.
A denic ao de uma v.a. discreta so ca completa a partir do momento em que se dene a
probabilidade de ocorrencia de cada um dos elementos de IR
X
, i.e., a partir do momento
em que se dene a func ao de probabilidade (ou func ao massa de probabilidade) da v.a.
discreta X.
Denicao 3.6 Funcao de probabilidade
Seja X uma v.a. discreta com contradomnio IR
X
= {x
1
, x
2
, . . .} (necessariamente nito
ou innito numeravel). Entao a funcao de probabilidade (f.p.) de X e dada por
P(X = x) = P({ : X() = x}) =
_
_
_
P(X = x
i
), se x = x
i
IR
X
0, c.c.
(3.3)
e satisfaz:
P(X = x) > 0, x IR
X
;

xIR
P(X = x) =

xIRX
P(X = x) =

i
P(X = x
i
) = 1.
Exemplo/Exerccio 3.7 Funcao de probabilidade
Retome o Exemplo 3.5 e dena a f.p. da v.a. X e desenhe o respectivo graco.
V.a.
F.p. de X
P(X = 0) = P(CCC)
= P(C
1
C
2
C
3
)
ev. indep
= P(C
1
) P(C
2
) P(C
3
)
ev. equiprov.
= P(C) P(C) P(C)
= (1/2)
3
P(X = 1) = P(CCC) +P(CCC) +P(CCC)
= . . .
= 3 (1/2)
3
39
P(X = 2) = P(CCC) +P(CCC) +P(CCC)
= . . .
= 3 (1/2)
3
P(X = 3) = P(CCC)
= . . .
= (1/2)
3
.
Ou de forma resumida
P(X = x) =
_
_
1/8, x = 0, 3
3/8, x = 1, 2
0, outros valores de x.
Graco da f.p. de X
De notar que esta func ao possui 4 pontos de descontinuidade, tantos quantos o
n umero de valores possveis da v.a. X.
40
3.3 Fun cao de distribuicao.
Motiva cao 3.8

E usual falar-se na probabilidade da v.a. X tomar valores nao
superiores a um n umero real arbitr ario x.

E com o objectivo de obter tal probabilidade
que deniremos a func ao de distribui cao da v.a. discreta X.
Denicao 3.9 Funcao de distribuicao
A funcao de distribuic ao (f.d.) de uma v.a. X e dada por
F
X
(x) = P(X x), x IR, (3.4)
independentemente do seu caracter ser discreto ou contnuo.
Nota 3.10 Funcao de distribuicao
Relembre-se que, por tratar-se da probabilidade da v.a. X atribuir valores menores ou
iguais ao real arbitr ario x, tem-se
F
X
(x) = P({ : X() x}), x IR, (3.5)
ou seja, F
X
(x) e igual à probabilidade da colec cao de todos os eventos (da algebra de
) aos quais a v.a. X atribui valores no intervalo (, x].
Denicao 3.11 Funcao de distribuicao de v.a. discreta
A f.d. da v.a. discreta X (com contradomnio IR
X
= {x
1
, x
2
, . . .}) pode escrever-se à custa
da f.p. de X:
F
X
(x) = P(X x) =
xix
P(X = x
i
), x IR. (3.6)
Nota 3.12 Fun cao de distribuicao

Retenha-se tambem que a f.d. possui domnio real e toma valores no intervalo [0, 1] ja que
se trata de uma probabilidade, ou seja:
F
X
: IR [0, 1], (3.7)
quer X seja uma v.a. discreta ou contnua.
Esta e uma de diversas propriedades satisfeitas pela f.d. de qualquer v.a. discreta,
tambem patente na resolu c ao do exerccio que se segue.
41
Exerccio 3.13 Fun cao de distribuicao de v.a. discreta
Determine a f.d. da v.a. X denida no Exemplo 3.5 e desenhe o gr aco de F
X
(x) e nomeie
algumas caractersticas desta func ao.
V.a.
F.p. de X
P(X = x) =
_
_
1/8, x = 0
3/8, x = 1
3/8, x = 2
1/8, x = 3
F.d. de X
Comece-se por preencher a tabela abaixo de forma justicada com alguns
valores da f.d. de X.
x FX(x) = P(X x) =

xix
P(X = xi) Obs.
-0.5 FX(0.5) = P(X 0.5) = 0
0 FX(0) = P(X 0) = P(X = 0) = 1/8
0.3 FX(0.3) = P(X 0.3) = P(X = 0) = 1/8
1 FX(1) = P(X 1) = P(X = 0) +P(X = 1) = 1/8 + 3/8 = 1/2
1.4 FX(1.4) = P(X 1.4) = . . .
2 FX(2) = . . .
2.8 FX(2.8) = . . .
3 FX(3) = . . .
10.5 FX(10.5) = . . .
Pode ent ao concluir-se que:
F
X
(x) = P(X x)
=
xix
P(X = x
i
)
42
=
_
_
0, x < 0
1/8, 0 x < 1
1/8 + 3/8 = 1/2, 1 x < 2
1/8 + 3/8 + 3/8 = 7/8, 2 x < 3
1/8 + 3/8 + 3/8 + 1/8 = 1, x 3.
Graco da f.d. de X
(Procure identicar gracamente os diversos valores da f.p. de X.)
Algumas propriedades da f.d. de X
Funcao em escada;
Funcao mon otona nao decrescente (ou crescente em sentido lato); etc.
Proposicao 3.14 Propriedades da f.d. de v.a. discreta
A f.d. da v.a. discreta X, F
X
(x), e uma:
1. Func ao em escada que possui tantos pontos de descontinuidade quantos os valores
distintos de IR
X
;
2. Func ao contnua ` a direita;
4
3. Func ao monotona n ao decrescente de x.
5
Entre outras propriedades da f.d. de uma v.a discreta X destaque-se tambem:
4. 0 F
X
(x) 1;
4
Ou seja, FX(x) = FX(x
+
), x IR, onde FX(x
+
) representa o limite à direita da f.d., num ponto
real x arbitr ario. Recorde-se que este limite e denido por FX(x
+
) = limh0 FX(x +h), h > 0. Note-se
tambem que este limite nem sempre e igual ao limite à esquerda no ponto x, FX(x
) = limh0 FX(x
h), h > 0, caso se esteja a lidar com uma v.a. discreta.
5
I.e., FX(x) FX(x +h), h > 0, x IR.
43
5. F
X
() = lim
x
F
X
(x) = 0;
6. F
X
(+) = lim
x+
F
X
(x) = 1;
7. P(X < x) = F
X
(x
) = lim
h0
F
X
(x h), h > 0;
8. P(X > x) = 1 F
X
(x);
9. P(X x) = 1 F
X
(x
);
e ainda, para a < b,
10. P(a < X b) = F
X
(b) F
X
(a),
11. P(a < X < b) = F
X
(b
) F
X
(a),
12. P(a X < b) = F
X
(b
) F
X
(a
),
13. P(a X b) = F
X
(b) F
X
(a
).
Rera-se por m que, a f.p. da v.a. discreta X, P(X = x) pode escrever-se ` a custa da f.d.
de X:
P(X = x) = F
X
(x) F
X
(x
), (3.8)
que corresponde ao salto da f.d. de X no ponto x.
Importa notar que todas as propriedades aqui referidas ` a excep cao de 1. sao
partilhadas pela f.d. de qualquer v.a. contnua. Rera-se tambem que algumas destas
propriedades serao rescritas de modo a reectir o car acter contnuo da v.a.
44
Exemplo 3.15 Rela cao entre a fun cao de probabilidade e a fun cao de
distribuicao
Retome o Exemplo 3.5.
(a) Obtenha a f.p. da v.a. X que representa o n umero de quest oes correctas no teste
americano à custa da f.d. desta v.a.
F.p. de X
P(X = 0) = F
X
(0) F
X
(0
) = 1/8 0 = 1/8
P(X = 1) = F
X
(1) F
X
(1
) = F
X
(1) F
X
(0) = 1/2 1/8 = 3/8
P(X = 2) = F
X
(2) F
X
(2
) = F
X
(2) F
X
(1) = 7/8 1/2 = 3/8
P(X = 3) = F
X
(3) F
X
(3
) = F
X
(3) F
X
(2) = 1 7/8 = 1/8.
(b) Determine P(0 < X < 3) recorrendo quer ` a f.p. de X, quer ` a f.d. de X.
P(0 < X < 3) = P(X = 1) +P(X = 2) = 3/8 + 3/8 = 3/4
P(0 < X < 3) = F
X
(3
) F
X
(0) = F
X
(2) F
X
(0) = 7/8 1/8 = 3/4.
Como se pode constatar os resultados sao iguais.
45
3.4 Valor esperado, variancia e algumas das suas
propriedades. Moda e quantis.
Para descrever completamente o comportamento probabilstico de uma v.a. X e necessario
recorrer à funcao de distribui cao. Caso X seja uma v.a. discreta, pode recorrer-se em
alternativa ` a funcao de probabilidade.
Pode, no entanto, optar-se por uma caracteriza cao parcial da v.a. X.
Denicao 3.16 Parametro
Um par ametro n ao passa de um indicador ou medida sum aria capaz de caracterizar
embora parcialmente algum aspecto de uma v.a. X. Entre eles destacaremos os:
Par ametros de localiza c ao central
valor esperado
moda
mediana;
Par ametros de localiza c ao nao central
quantil de probabilidade (ou quantil de ordem) p;
Par ametros de dispers ao
vari ancia
desvio-padr ao
coeciente de varia c ao.
Motiva cao 3.17 Valor esperado de v.a. discreta
O conceito de valor esperado teve a sua origem nos jogos de acaso e ao que parece a sua
introduc ao deve-se a Christiaan Huygens (162995).
O valor esperado de X corresponde ao seu centro de gravidade. Esta analogia fsica
tem a sua raz ao de ser: para tal basta pensar num sistema de corpos com
massas m
i
posic oes x
i
,
46
cujo centro de massa e dado por
i
xi mi
i
mi
. Assim, o valor esperado de X mais nao e que o
centro de massa de probabilidade desta v.a.
Denicao 3.18 Valor esperado de v.a. discreta
O valor esperado da v.a. discreta X e dado por
E(X) =
x
x P(X = x). (3.9)
Nota 3.19 Valor esperado de v.a. discreta

1. E(X) =

xIR
x P(X = x) =

xIRX
x P(X = x).
2. E(X) existe sse

xIRX
|x| P(X = x), i.e., sse a serie for absolutamente convergente.
3. De um modo geral E(X) IR
X
, i.e., o valor esperado de X n ao pertence ao conjunto
de valores possveis de X, caso X seja uma v.a. discreta.
4.

E usual escolher E(X) como o valor representativo da v.a. X, em particular se X
possuir distribuic ao com tendencia central uma vez que neste caso e em torno desse
ponto que mais se concentram as probabilidades.
5. O valor esperado de X e tambem representado/designado por ,
X
, media, valor
medio, esperan ca matem atica, etc.
Proposicao 3.20 Propriedades do valor esperado
O valor esperado da v.a. X satisfaz as seguintes propriedades.
1. E(b) = b, b IR.
2. E(aX +b) = aE(X) +b, a, b IR, ou seja, o valor esperado e um operador linear.
3. Seja Y = (X) uma v.a. func ao (mensuravel) de X. Ent ao
E(Y ) = E[(X)] =
x
(x) P(X = x), (3.10)
caso X seja uma v.a. discreta.
4. De um modo geral
E[(X)] = [E(X)]. (3.11)
47
5. Seja X uma v.a. inteira n ao negativa, i.e., IR
X
= IN
0
= {0, 1, 2, . . .}. Ent ao
E(X) =
+
x=0
P(X > x) =
+
x=0
[1 F
X
(x)]. (3.12)
Exerccio 3.21 Demonstre a Proposi cao 3.20.

Exemplo 3.22 Valor esperado de v.a. discreta
(a) Calcule o valor esperado do n umero de respostas correctas no teste americano
descrito no Exemplo 3.5.
V.a.
F.p. de X
P(X = x) =
_
_
1/8, x = 0, 3
3/8, x = 1, 2
Valor esperado de X
E(X) =
3
x=0
x P(X = x)
= 0 1/8 + 1 3/8 + 2 3/8 + 3 1/8
= 1.5.
Importa notar que E(X) coincide, neste caso, com o ponto de simetria da f.p.
de X.
(b) O n umero de neutrinos registados em intervalos de 12 segundos, aquando da primeira
observa cao da supernova S1987a por astronomos, e bem modelado pela v.a. X com
f.p.
P(X = x) =
_
_
_
e
0.8
0.8
x
x!
, x = 0, 1, 2, . . .
Obtenha o valor esperado de X.
6
6
Adaptado do Teste A, 22 de Abril de 2006.
48
V.a.
X = n umero de neutrinos registados num intervalo de 12 segundos
F.p. de X
P(X = x) =
_
_
_
e
0.8
0.8
x
x!
, x = 0, 1, 2, . . .
Valor esperado de X
E(X) =
+
x=0
x P(X = x)
=
+
x=0
x
e
0.8
0.8
x
x!
=
+
x=1
e
0.8
0.8
x
(x 1)!
= 0.8 e
0.8
+
x=0
0.8
x
x!
= 0.8.
Aqui temos outro exemplo de um valor esperado que n ao pertence ao conjunto
de valores possveis da v.a. X.
Denicao 3.23 Moda de v.a. discreta
E importante saber qual o valor da v.a. X que ocorre com mais frequencia. Este valor
ser a designado por mo = mo(X) e corresponde ao ponto de m aximo da f.p. de X, i.e.,
mo : P(X = mo) = max
x
P(X = x), (3.13)
ou, equivalentemente, mo = arg max
x
P(X = x).
Nota 3.24 Moda de v.a. discreta
A moda de uma v.a. nem sempre e unica como ilustra o exemplo seguinte e j a agora
rera-se que
X se diz bimodal se possuir duas modas.
49
Exemplo 3.25 Moda de v.a. discreta
Obtenha a moda do:
(a) N umero de respostas correctas no teste americano (Exemplo 3.5).
V.a.
F.p. de X
P(X = x) =
_
_
1/8, x = 0, 3
3/8, x = 1, 2
Moda de X
mo = mo(X) = 1 e 2 j a que P(X = 1) = P(X = 2) = max
x
P(X = x).
Logo a v.a. X e bimodal.
(b) N umero de neutrinos registado num intervalo de 12 segundos (Exemplo 3.22).
V.a.
X = n umero de neutrinos registados num intervalo de 12 segundos
F.p. de X
P(X = x) =
_
_
_
e
0.8
0.8
x
x!
, x = 0, 1, 2, . . .
Moda de X
A obten c ao do ponto de m aximo de uma f.p. nao passa pela determina c ao de
um ponto de estacionaridade (de uma func ao contnua e diferenciavel) mas sim
pela determina c ao de
mo = mo(X) IR
X
:
_
_
_
P(X = mo) P(X = mo 1)
P(X = mo) P(X = mo + 1)
_
_
_
P(X=mo)
P(X=mo1)
1
P(X=mo+1)
P(X=mo)
1.
(3.14)
Ao substituir-se a f.p. de X nas duas desigualdades acima, conclui-se que
mo = mo(X) IR
X
:
_
_
_
0.8
mo
1
0.8
mo+1
1,
i.e., mo = mo(X) = 0.
50
Motiva cao 3.26 Mediana de v.a. discreta
A mediana da v.a. X, me = me(X), tem a particularidade de vericar
_
_
_
P(X me)
1
2
P(X me)
1
2
,
(3.15)
pelo que a probabilidade de registarmos valores da v.a. X n ao superiores (n ao inferiores)
` a mediana e de pelo menos 50%.
Denicao 3.27 Mediana de v.a. discreta
A mediana da v.a. discreta X, me = me(X),
7
verica a dupla desigualdade
me :
1
2
F
X
(me)
1
2
+P(X = me), (3.16)
por sinal equivalente a (3.15) e ja agora equivalente a F
X
(me
)
1
2
F
X
(me).
8
Nota 3.28 Mediana de v.a. discreta

Ao lidarmos com v.a. discretas a mediana pode n ao ser unica, passando nesse caso a
falar-se em classe mediana.
9
Exemplo 3.29 Mediana de v.a. discreta

Determine a mediana do n umero de respostas correctas no teste americano (Exemplo 3.5).
V.a.
F.d. de X
Esta func ao foi determinada previamente e e igual a:
F
X
(x) = P(X x)
=
_
_
0, x < 0
1/8, 0 x < 1
1/8 + 3/8 = 1/2, 1 x < 2
1/8 + 3/8 + 3/8 = 7/8, 2 x < 3
1/8 + 3/8 + 3/8 + 1/8 = 1, x 3.
7
me e tambem representada por F
1
X
(1/2).
8
Esta talvez seja a forma mais expedita de identicar a(s) mediana(s) de uma v.a. discreta.
9
Ou, de acordo com alguns autores, considera-se que a mediana corresponde ao menor dos valores da
classe mediana.
51
Mediana de X
Tirando partido da expressao de F
X
(x) e da denic ao de mediana de uma
v.a. discreta pode construir-se a seguinte tabela que servir a para identicar a(s)
mediana(s) de X:
Candidato a me
1
2
FX(me)
1
2
+P(X = me) Obs.
1
1
2
FX(1) =
1
2

1
2
+P(X = 1) =
1
2
+
3
8
=
7
8
Prop. verd.
1.5
1
2
FX(1.5) =
1
2

1
2
+P(X = 1.5) =
1
2
+ 0 =
1
2
Prop. verd.
2
1
2
FX(2) =
7
8

1
2
+P(X = 2) =
1
2
+
3
8
=
7
8
Prop. verd.
2.1
1
2
FX(2.1) =
7
8

1
2
+P(X = 2.1) =
1
2
+ 0 =
1
2
Prop. FALSA.
Deste modo conclui-se que mediana da v.a. X n ao e unica e que qualquer valor no
intervalo [1, 2] e mediana de X. Nao surpreende neste caso que se designe o intervalo
[1, 2] de classe mediana.
Mais, ao notar-se que me : F
X
(me
) 1/2 F
X
(me) evita-se o recurso ` a f.p.
de X e identica(m)-se a(s) mediana(s) desta v.a. discreta de uma forma expedita.
(Averigue...)
Motiva cao 3.30 Quantil de probabilidade p de v.a. discreta
A mediana e um caso particular de um outro par ametro de localizacao nao central mais
generico, o quantil de probabilidade (ou quantil de ordem) p (0 < p < 1),
p
, que verica
_
_
_
P(X
p
) p
P(X
p
) 1 p.
(3.17)
Assim sendo a probabilidade de registarmos valores da v.a. X n ao superiores (nao
inferiores, resp.) ao quantil de probabilidade p e de pelo menos p100% ((1p) 100%,
resp.).
Denicao 3.31 Quantil de probabilidade p de v.a. discreta
O quantil de probabilidade p (0 < p < 1) da v.a. X,
p
,
10
satisfaz
p
: p F
X
(
p
) p +P(X =
p
), (3.18)
obviamente equivalente a (3.17) e a F
X
(
p
) p F
X
(
p
).
10
p e tambem representado por F
1
X
(p).
52
Nota 3.32 Quantil de probabilidade p de v.a. discreta
A mediana da v.a. X corresponde a
1/2
= F
1
X
(1/2). Outros quantis importantes:

1/4
= F
1
X
(1/4) = 1o. quartil;

3/4
= F
1
X
(3/4) = 3o. quartil;

1/100
= F
1
X
(1/100) = 1o. percentil;

n/100
= F
1
X
(n/100) = nesimo percentil, n = 1, 2, . . . , 99;

0.1
= F
1
X
(1/10) = 1o. decil.
Exemplo 3.33 Quantil de ordem p de v.a. discreta
O n umero de navios que chegam diariamente a um porto (X) e uma v.a. com f.p.
P(X = x) = e
2
2
x
x!
, x = 0, 1, 2, . . .
As condi c oes do porto impedem que atraquem mais de 3 navios por dia, sendo os restantes
navios reencaminhados para outro porto.
11
(a) Qual a probabilidade de serem reencaminhados um ou mais navios para o outro
porto (num dia escolhido arbitrariamente)?
V.a.
X = n umero de navios que chegam diariamente ao porto
F.p. de X
P(X = x) = e
2
2
x
x!
, x = 0, 1, 2, . . .
Seja R o evento que representa o reencaminhamento de um ou mais navios
para o outro porto. Ent ao
P(R) = P(X > 3)
= 1 P(X 3)
= 1
3
x=0
P(X = x)
= 1
3
x=0
e
2
2
x
x!
= 1 0.8571
= 0.1429.
11
Adaptado de Exame de

Epoca Especial, 13 de Setembro de 2002.
53
(b) Qual deve ser a capacidade mnima do porto de modo que o reencaminhamento de
um ou mais navios ocorra no m aximo em 5% dos dias?
Obten cao da capacidade mnima (c
)
c
e o menor inteiro c que verica P(reencaminhamento navios) 0.05, i.e.,

c : P(X > c) 0.05
1 P(X c) 0.05
1 F
X
(c) 0.05
F
X
(c) 0.95
c F
1
X
(0.95),
onde F
1
X
(0.95) representa o quantil de ordem 0.95 da v.a. X e, como seria de
esperar, a capacidade mnima c
.
A obten cao de c
passa pela determina c ao de F

X
(c) para varios valores de c.
Ora, tirando partido do resultado da alnea anterior (F
X
(3) = 0.8571 e da
monotonia n ao decrescente de qualquer f.d., bastar a considerar valores de c
maiores que 3, tal como ilustramos na tabela seguinte:
12
c FX(c) =
c
x=0
e
2
2
x
x!
FX(c) 0.95 ?
4 FX(4) = FX(3) +P(X = 4) = 0.8571 +e
2
2
4
4!
= 0.9473 Nao
5 FX(5) = FX(4) +P(X = 5) = 0.9473 +e
2
2
5
5!
= 0.9834 SIM
Deste modo, conclui-se que c
= F
1
X
(0.95) = 5.
12
Veremos mais tarde que a obten cao de c
poderia fazer-se por recurso às tabelas da f.d. daquilo que

chamaremos de v.a. de Poisson.
54
Motiva cao 3.34 Variancia
E necessario denir um par ametro que de ideia da dispersao dos valores da v.a. em torno
do centro de gravidade da mesma.
Este par ametro corresponde, sicamente, ao momento de inercia de um sistema em
rela c ao a um eixo perpendicular ao eixo das abcissas e passando pelo centro de gravidade
(Murteira (1990, p. 184)).
Denicao 3.35 Variancia
A vari ancia da v.a. X e dada por
V (X) = E(X
2
) E
2
(X), (3.19)
independentemente do car acter da v.a. ser discreto ou contnuo. Contudo se X
for uma v.a. discreta entao V (X) obtem-se recorrendo ao facto de neste caso
E(X
2
) =

x
x
2
P(X = x) e E
2
(X) = [
x
xP(X = x)]
2
.
Nota 3.36 Variancia
1. A vari ancia da v.a. X e igual ao seguinte valor esperado E {[X E(X)]
2
}. No
entanto, esta f ormula e de longe muito menos conveniente, pelo que faremos muito
pouco uso da mesma.
2. V (X) e por vezes representado por
2
,
2
X
, V ar(X), etc.
Exerccio 3.37 Variancia
Prove que:
V (X) = E
_
[X E(X)]
2
_
= E(X
2
) E
2
(X);
E(X
2
) = V (X) +E
2
(X).
Proposicao 3.38 Propriedades da variancia
A vari ancia de uma v.a. quer discreta, quer contnua, goza das propriedades:
1. V (b) = 0, b IR;
2. V (X) 0, qualquer que seja a v.a. X;
3. V (aX +b) = a
2
V (X), a, b IR.
55
Exerccio 3.39 Propriedades da variancia
Exemplo 3.40 Variancia de uma v.a. discreta
Retome o Exemplo 3.33 e assuma que por cada navio que chega diariamente ao porto a
administra c ao do mesmo factura 1200 Euros. Determine o valor esperado e a variancia
da factura c ao di aria.
V.a.
X = n umero de navios que chegam diariamente ao porto
F.p. de X
P(X = x) = e
2
2
x
x!
, x = 0, 1, 2, . . .
Valor esperado de X
E(X) =
+
x=0
x P(X = x)
=
+
x=0
x
e
2
2
x
x!
=
+
x=1
e
2
2
x
(x 1)!
= 2 e
2
x=0
2
x
x!
= 2
Variancia de X
Tendo em conta que
V (X) = E(X
2
) E
2
(X), (3.20)
onde
E(X
2
) =
+
x=0
x
2
P(X = x)
=
+
x=0
x
2
e
2
2
x
x!
=
+
x=1
x[(x 1) + 1]
e
2
2
x
x!
56
=
+
x=2
e
2
2
x
(x 2)!
+
+
x=0
x
e
2
2
x
x!
= 2
2
e
2
x=0
2
x
x!
+E(X)
= 2
2
+ 2,
conclui-se que
V (X) = 2
2
+ 2 2
2
= 2
= E(X).
Nova v.a.
Y = 1200 X = factura cao di aria.
Para a obten cao de E(Y ) e V (Y ) tiraremos partido do facto de Y ser uma func ao
linear de X e de algumas propriedades do valor esperado e da vari ancia.
Valor esperado de Y
E(Y ) = E(1200 X)
= 1200 E(X)
= 1200 2
= 2400
Variancia de Y
V (Y ) = V (1200 X)
= 1200
2
V (X)
= 1200
2
2.
Motiva cao 3.41 Desvio-padrao
A variancia n ao e expressa nas mesmas unidades que a v.a. X, pelo que e costume recorrer
a outra medida de dispersao absoluta. Trata-se do desvio-padr ao denido a seguir.
Denicao 3.42 Desvio-padrao
O desvio-padrao da v.a. X e a raiz quadrada positiva da vari ancia de X:
DP(X) = +
_
V (X), (3.21)
independentemente de X ser uma v.a. discreta ou contnua.
57
Motiva cao 3.43 Coeciente de variacao
Quer a variancia, quer do desvio-padr ao sao medidas de dispers ao absoluta que tem em
conta a ordem de grandeza dos valores que X toma. E parece-nos obvio que um desvio-
padr ao igual a 10 unidades tenha necessariamente signicado distinto caso os valores de
X sejam da ordem das dezenas ou da ordem das dezenas de milhar. Uma sada possvel
ser a optar pela medida de dispersao relativa que se dene imediatamente a seguir.
Denicao 3.44 Coeciente de variacao
O coeciente de varia cao e igual a
CV (X) =
DP(X)
|E(X)|
, (3.22)
quer X seja uma v.a. discreta, quer seja contnua, desde que E(X) = 0.
Exemplo 3.45 Coeciente de varia cao de uma v.a. discreta
Obtenha o coeciente de varia cao da factura cao di aria denida no Exemplo 3.40.
V.a.
Y = 1200 X = factura cao di aria.
Coeciente de varia cao de Y
CV (Y ) =
DP(Y )
|E(Y )|
=
_
V (1200 X)
|E(1200 X)|
=
_
1200
2
V (X)
1200 |E(X)|
=
DP(X)
|E(X)|
= CV (X)
=
2
2
.
Este exemplo permite armar que o coeciente de varia cao de um m ultiplo de X e
igual ao coeciente de varia cao de X,
CV (aX) = CV (X), a = 0,
i.e., que o coeciente de varia c ao e invariante a dilata c oes e contrac coes de v.a.
Importa notar que esta propriedade n ao e satisfeita por qualquer das duas medidas de
dispersao absoluta ate agora consideradas, a variancia e o desvio-padrao.
58
3.5 Distribuicao uniforme discreta.
De salientar que a apresenta cao desta distribuic ao e das que se seguem respeitar a um
mesmo gurino: em primeiro lugar, alude-se à nota cao utilizada para representar a
distribuic ao, de seguida, s ao referido(s), por esta ordem: o(s) par ametro(s) da distribuic ao;
o contradomnio da v.a. (i.e., os valores possveis da v.a.); a func ao de probabilidade; o
valor esperado; e a variancia da v.a. Toda esta informa cao ser a condensada numa tabela.
Motiva cao 3.46 Distribuicao uniforme discreta
Esta distribuicao e razo avel quando a v.a. discreta toma n valores distintos, todos com
a mesma probabilidade. Sem perda de generalidade considere-se que esta v.a. toma n
valores distintos, x
1
, x
2
, . . . , x
n
, em que x
1
< x
2
< . . . < x
n
.
Denicao 3.47 Distribuicao uniforme discreta
A v.a. discreta X diz-se ter distribuic ao uniforme discreta no conjunto {x
1
, x
2
, . . . , x
n
},
caso a sua f.p. seja igual a
P(X = x) =
_
_
_
1
n
, x = x
1
, x
2
, . . . , x
n
0, c.c.
(3.23)
Neste caso escreve-se
X uniforme discreta({x
1
, x
2
, . . . , x
n
}), (3.24)
onde X . . . se le, naturalmente, X tem distribuic ao....
Uniforme discreta
Notacao X uniforme discreta({x1, x2, . . . , xn})
Par ametro {x1, x2, . . . , xn} (xi IR, i = 1, . . . , n)
Contradomnio {x1, x2, . . . , xn}
F.p. P(X = x) =
_
_
_
1
n
, x = x1, x2, . . . , xn
0, c.c.
Valor esperado E(X) =
1
n
n
i=1
xi
Vari ancia V (X) =
_
1
n
n
i=1
x
2
i
_
_
1
n
n
i=1
xi
_
2
59
Exemplo 3.48 Distribuicao uniforme discreta
Um conjunto de n amostras de solo das quais so uma esta contaminada por uma
perigosa subst ancia qumica chega a um laborat orio. Admita ainda que a amostra de
solo contaminado n ao foi etiquetada previamente. Considere agora a v.a. X que representa
o n umero total de amostras inspeccionadas sem reposi cao ate ser identicada a amostra
de solo contaminado.
(a) Identique a distribuic ao de X e desenhe o gr aco da f.p. desta v.a.
V.a.
X = n umero de amostras inspeccionadas sem reposic ao ate ` a detecc ao da
amostra contaminada
Contradomnio de X
IR
X
= {1, 2, . . . , n}
F.p. de X
P(X = 1) =
1
n
P(X = 2) =
n1
n

1
n1
=
1
n
P(X = 3) =
n1
n

n2
n1

1
n2
=
1
n
.
.
.
P(X = x) =
_
_
_
1
n
, x = 1, 2, . . . , n
0, c.c.
De notar que se teve em considera c ao que a inspecc ao e feita sem reposic ao e
que:
X = 1 se a 1a. amostra inspeccionada estiver contaminada;
X = 2 se a 1a. amostra inspeccionada nao estiver contaminada mas a 2a.
o estiver;
e assim por diante.
Distribuicao de X
X uniforme discreta({1, 2, . . . , n})
Graco da f.p. de X
60
(b) Obtenha a f.d. de X e esboce o respectivo gr aco.
F.d. de X
F
X
(x) = P(X x)
=
_
_
0, x < 1
1
n
, 1 x < 2
2
n
, 2 x < 3
.
.
.
n1
n
, n 1 x < n
1, x n
=
_
_
0, x < 1
[x]
n
, 1 x < n
1, x n,
onde [x] representa a parte inteira do real x.
Graco da f.d. de X
(c) Calcule o valor esperado e a vari ancia desta v.a.
Nota
Relembra-se para o efeito que:
n
x=1
x =
n(n + 1)
2
;
n
x=1
x
2
=
n(n + 1)(2n + 1)
6
.
Valor esperado de X
E(X) =
n
x=1
x P(X = x)
=
n
x=1
x
n
=
n(n + 1)/2
n
=
n + 1
2
61
Variancia de X
V (X) = E(X
2
) E
2
(X)
=
n
x=1
x
2
n

_
n + 1
2
_
2
=
n(n + 1)(2n + 1)/6
n

(n + 1)
2
4
=
n + 1
2
_
2n + 1
3

n + 1
2
_
=
n + 1
2
4n + 2 3n 3
6
=
n
2
1
12
Dada a simplicidade da distribuic ao uniforme discreta a sua f.p., o seu valor esperado
e a sua vari ancia n ao se encontram no formulario disponvel no nal destas notas de apoio,
ao contr ario do que acontece com qualquer das distribuic oes apresentadas j a de seguida.
62
3.6 Distribuicao binomial.
Antes de passar à apresenta cao da distribuic ao binomial e necessario denir prova de
Bernoulli.
13
Denicao 3.49 Prova de Bernoulli
Uma e.a. diz-se uma prova de Bernoulli se possuir apenas dois resultados possveis:
um sucesso, que ocorre com probabilidade p (0 p 1);
um insucesso, que ocorre com probabilidade 1 p.
Denicao 3.50 Distribuicao de Bernoulli
A v.a.
X = n umero de sucessos numa prova de Bernoulli
diz-se com distribui cao de Bernoulli com par ametro p e possui f.p. dada por
P(X = x) =
_
_
_
p
x
(1 p)
1x
, x = 0, 1
0, c.c.
(3.25)
Bernoulli
Notacao X Bernoulli(p)
Par ametro p = P(sucesso) (p [0, 1])
Contradomnio {0, 1}
F.p. P(X = x) =
_
_
_
p
x
(1 p)
1x
, x = 0, 1
0, c.c.
Valor esperado E(X) = p
Vari ancia V (X) = p (1 p)
Exerccio 3.51 Prove que E(X) = p e V (X) = p (1 p) quando X

Bernoulli(p).
13
Jacques Bernoulli (16541705).
63
Motiva cao 3.52 Distribuicao binomial
A distribui cao binomial e particularmente util na caracteriza c ao probabilstica do
n umero de sucessos em n provas de Bernoulli realizadas de forma independente e com
probabilidade de sucesso comum p.
Denicao 3.53 Distribuicao binomial
A v.a.
X = n umero de sucessos num conjunto de n provas de Bernoulli independentes com
probabilidade de sucesso comum e igual a p
diz-se com distribuicao binomial de par ametros (n, p) e possui f.p. igual a
P(X = x) =
_
_
_
_
n
x
_
p
x
(1 p)
nx
, x = 0, 1, 2, . . . , n
0, c.c.,
(3.26)
onde
_
n
x
_
=
n!
x!(nx)!
representa as combina c oes de n elementos tomados x a x.
Binomial
Notacao X binomial(n, p)
Par ametros n =n umero de provas de Bernoulli (n IN)
p = P(sucesso) (p [0, 1])
Contradomnio {0, 1, 2, . . . , n}
F.p. P(X = x) =
_
_
_
_
n
x
_
p
x
(1 p)
nx
, x = 0, 1, 2, . . . , n
0, c.c.
Valor esperado E(X) = np
Vari ancia V (X) = np (1 p)
A v.a. X binomial(n, p) esta tambem associada à contagem do n umero de elementos

com determinada caracterstica (sucesso), num total de n elementos extrados ao acaso e
com reposic ao. Pode tambem ser entendida como a generaliza cao natural da distribuic ao
de Bernoulli.
Exerccio 3.54 Procure justicar a expressao da f.p. da v.a. com distribui cao
binomial(n, p) e demonstre que o valor esperado e a vari ancia desta v.a. s ao iguais a
E(X) = np e V (X) = np (1 p).
64
Nota 3.55 F.d. da v.a. binomial
A f.d. da v.a. X binomial(n, p) e dada por
F
X
(x) = P(X x) =
_
_
0, x < 0
[x]
i=0
_
n
i
_
p
i
(1 p)
ni
, 0 x < n
1, x n,
(3.27)
onde [x] representa a parte inteira do real x.
14
Esta func ao esta tabelada para alguns pares de valores de n e p; rera-se que os
valores de n e p n ao excedem (nas tabelas disponveis para esta disciplina) 20 e 0.5,
respectivamente.
Exemplo 3.56 Utiliza cao das tabelas da f.d. da v.a. binomial
V.a. x Valor tabelado de FX(x) = P(X x)
X binomial(n = 5, p = 0.05) 0 FX(0) = 0.7738
X binomial(n = 9, p = 0.1) 4 FX(4) = 0.9991
X binomial(n = 10, p = 0.4) 8 FX(8) = 0.9983
X binomial(n = 20, p = 0.5) 11 FX(11) = 0.7483
Exemplo 3.57 Distribuicao binomial

A probabilidade de as leis de Kirchho virem a ser violadas, durante um teste laboratorial
a que se submete certo tipo de indutor, e igual a 0.1.
Qual a probabilidade de esta lei vir a ser violada mais de 4 vezes em 9 destes testes
laboratoriais?
V.a.
X = n umero de viola coes das leis de Kirchho em 9 testes laboratoriais
Distribuicao de X
X binomial(n, p)
Parametros
n = 9 testes
p = P(viola c ao leis Kirchho em teste laboratorial) = 0.1
14
Relembre-se que a parte inteira do real x corresponde ao maior inteiro menor ou igual a x. Assim,
[0.3] = 0, [2.8] = 2, [0.7] = 1.
65
F.p. de X
P(X = x) =
_
9
x
_
0.1
x
(1 0.1)
9x
, x = 0, 1, 2, . . . , 9
P(X > 4) = 1 P(X 4)
= 1 F
X
(4)
= 1 F
binomial(9,0.1)
(4)
tabela
= 1 0.9991
= 0.0009.
Exerccio 3.58 Represente gracamente a f.d. da v.a. X binomial(4, 0.1),

recorrendo às tabelas disponveis, e obtenha a f.p. desta v.a. ` a custa dos valores obtidos
para a f.d.
Proposicao 3.59 Distribuicao binomial
Seja X o n umero de sucessos em n provas de Bernoulli independentes com probabilidade
de sucesso p, i.e., X binomial(n, p). Ent ao o n umero de insucessos nessas mesmas n
provas de Bernoulli, Y , verica:
Y = n X binomial(n, 1 p);
F
Y
(y) = 1 F
X
(n y 1).
Exerccio 3.60 Demonstre a segunda das propriedades da Proposicao 3.59 e ilustre
a sua utiliza c ao na obten c ao de valores da f.d. de v.a. binomiais com probabilidade de
sucesso superior a 0.5, fazendo uso das tabelas disponveis.
V.a.
X binomial(n, p)
Nova v.a.
Y = n X
66
Demonstra cao da 2a. propriedade
F
Y
(y) = P(Y y)
= P(n X y)
= P(X n y)
= 1 P(X n y 1)
= 1 F
X
(n y 1)
Ilustra cao da 2a. propriedade
V.a. y FY (y) = P(X n y 1)
Y bin(5, 0.95) 4 FY (4) = 1 F
bin(5,10.95)
(5 4 1) = 1 0.7738 = 0.2262
Y bin(10, 0.6) 1 FY (1) = 1 F
bin(10,10.6)
(10 1 1) = 1 0.9983 = 0.0017
67
3.7 Distribuicao geometrica.
Motiva cao 3.61 Distribuicao geometrica
A distribuicao binomial(n, p) est a associada ` a contagem do n umero de sucessos em n
provas de Bernoulli independentes que possuem em qualquer dos casos probabilidade de
sucesso igual a p. Caso estejamos interessados em contabilizar o
o n umero total de provas de Bernoulli realizadas ate ao registo do primeiro sucesso,
passamos a lidar com uma v.a. discreta com distribuicao distinta da binomial.
Denicao 3.62 Distribuicao geometrica
Seja
X = n umero de provas de Bernoulli (independentes com probabilidade de sucesso
comum e igual a p) realizadas ate à ocorrencia do primeiro sucesso.
Ent ao a v.a. X diz-se com distribuic ao geometrica com par ametro p e a sua f.p. e dada
por
P(X = x) =
_
_
_
(1 p)
x1
p, x = 1, 2, 3, . . .
0, c.c.
(3.28)
Geometrica
Notacao X geometrica(p)
Par ametro p = P(sucesso) (p [0, 1])
Contradomnio IN = {1, 2, 3, . . .}
F.p. P(X = x) =
_
_
_
(1 p)
x1
p, x = 1, 2, 3, . . .
0, c.c.
1
p
Vari ancia V (X) =
1p
p
2
A distribui cao geometrica e por vezes designada por distribuicao discreta do tempo de
espera pelo primeiro sucesso.
68
Nota 3.63 F.d. da v.a. geometrica
A f.d. da v.a. X geometrica(p) n ao est a tabelada pois obtem-se sem grande diculdade,
por estar a lidar-se com uma serie geometrica. Com efeito,
F
X
(x) = P(X x) =
_
_
_
0, x < 1
[x]
i=1
(1 p)
i1
p = 1 (1 p)
[x]
, x 1,
(3.29)
onde [x] representa novamente a parte inteira do real x.
Exerccio 3.64 Justique as expressoes da f.p. e da f.d. desta v.a. Obtenha tambem
o seu valor esperado e a sua vari ancia.
Exemplo 3.65 Distribuicao geometrica
Estudos preliminares indicaram que a probabilidade de ser detectada a presenca de alto
teor de metais pesados numa amostra de solo proveniente de certo local e de 0.01.
15
(a) Obtenha o valor esperado do n umero total de amostras seleccionadas ao acaso ate
que seja detectada a primeira amostra de solo com alto teor de metais pesados.
V.a.
X = n umero total de amostras seleccionadas ate que seja detectada a primeira
amostra de solo com alto teor de metais pesados
Distribuicao de X
X geometrica(p)
Parametro
p = 0.01
F.p. de X
P(X = x) = (1 0.01)
x1
0.01, x = 1, 2, 3, . . .
Valor esperado de X
E(X)
form.
=
1
p
=
1
0.01
= 100 amostras.
15

Epoca, 4 de Fevereiro de 2003.
69
(b) Determine a probabilidade de serem inspeccionadas mais de 100+50 amostras ate ` a
detecc ao da primeira amostra de solo com alto teor de metais pesados, sabendo que
j a foram inspeccionadas mais de 100 amostras sem que semelhante detecc ao tivesse
ocorrido.
Tirando partido da expressao geral da f.d. da v.a. geometrica tem-se
sucessivamente:
P(X > 100 + 50|X > 100) =
P(X > 100 + 50, X > 100)
P(X > 100)
=
P(X > 100 + 50)
P(X > 100)
=
1 P(X 100 + 50)
1 P(X 100)
=
1 [1 (1 0.01)
100+50
]
1 [1 (1 0.01)
100
]
=
(1 0.01)
100+50
(1 0.01)
100
= (1 0.01)
50
= P(X > 50).
Este resultado deve-se a uma propriedade desta distribuic ao que ser a enunciada
de seguida.
Proposicao 3.66 Falta de mem oria da distribuicao geometrica
Seja X geometrica(p). Ent ao
P(X > k +x|X > k) = P(X > x), k, x IN, (3.30)
Equivalentemente, a v.a. X k|X > k, que representa o n umero de provas de Bernoulli
adicionais sabendo que j a foram efectuadas mais de k provas, tambem possui distribuic ao
geometrica com par ametro p:
X k|X > k geometrica(p), k IN. (3.31)
Esta propriedade e denominada de falta de memoria uma vez que (3.31) sugere um
recomeco probabilstico.
70
3.8 Distribuicao hipergeometrica.
Motiva cao 3.67 Distribuicao hipergeometrica
A distribui cao binomial(n, p) est a associada ` a contagem do n umero de sucessos, em n
extrac c oes ao acaso com reposi cao. Ao considerar-se um
processo de extrac c ao casual sem reposic ao,
passamos a lidar com uma v.a. discreta com distribuicao distinta da binomial.
Denicao 3.68 Distribuicao hipergeometrica
Considerem-se:
N = n umero total de elementos de uma popula cao (dimensao da pop.);
M = n umero de elementos dessa popula c ao que possuem certa caracterstica
(sucesso);
n = n umero de extrac coes sem reposi cao.
Ent ao a v.a.
X = n umero de elementos com certa caracterstica (sucesso), em n extrados ao
acaso sem reposi c ao da popula cao acima
diz-se com distribuic ao hipergeometrica com parametros (N, M, n) e a sua f.p. pode
encontrar-se na tabela abaixo a par de outras caractersticas desta distribuic ao.
Hipergeometrica
Notacao X hipergeometrica(N, M, n)
Par ametros N (N IN)
M (M IN, M N)
n (n IN, n N)
Contradomnio {max{0, n (N M)}, . . . , min{n, M}}
F.p. P(X = x) =
_
_
_
M
x
_ _
NM
nx
_
/
_
N
n
_
,
x = max{0, n (N M)}, . . . , min{n, M}
0, c.c.
Valor esperado E(X) = n
M
N
Vari ancia V (X) = n
M
N
_
1
M
N
_
Nn
N1
71
Nota 3.69 Distribuicao hipergeometrica
X corresponde ao n umero de sucessos num conjunto de n provas de Bernoulli
dependentes com probabilidade de sucesso comum e igual a p = M/N.
E(X) e V (X) fazem lembrar o valor esperado e a vari ancia da distribuic ao binomial
(n, p) com factores de correc c ao que se devem à nao reposi cao das extrac c oes. Com efeito,
sob certas condi coes, a (f.p./f.d. da) v.a. hipergeometrica(N, M, n) pode ser aproximada
pela (f.p./f.d. d)a v.a. binomial(n,
M
N
), como veremos mais tarde.
Exemplo 3.70 Distribuicao hipergeometrica
Justique a express ao geral da f.p., bem como o contradomnio da v.a. hipergeometrica.
Na fase de concepc ao de um sistema de controlo de qualidade do fabrico, foram
escolhidos 100 cabos dos quais apenas dois apresentavam desvios superiores a 9.8 mcrons.
Se desses 100 cabos forem seleccionados 10 ao acaso e sem reposi c ao, qual e a probabilidade
de mais do que um ter um desvio superior a 9.8 mcrons? Indique tambem o valor esperado
do n umero de cabos, entre esses 10, com um desvio superior a 9.8 mcrons.
16
V.a.
X = n umero de cabos com um desvio superior a 9.8 mcrons, em 10 cabos
seleccionados sem reposic ao (de lote de 100 cabos dos quais apenas dois apresentam
desvios superiores a 9.8 mcrons)
Distribuicao de X
X hipergeometrica(N, M, n)
Parametros
N = 100
M = 2
n = 10
F.p. de X
P(X = x) =
(
2
x
) (
1002
10x
)
(
100
10
)
, x = 0, 1, 2
16
Adaptado do Teste A, 11 de Novembro de 2006.
72
P(X > 1) = P(X = 2)
=
_
2
2
_ _
1002
102
_
_
100
10
_
=
1
110
Valor esperado de X
E(X)
form.
= n
M
N
= 10
2
100
= 0.2
73
3.9 Distribuicao de Poisson.
Motiva cao 3.71 Distribuicao de Poisson
A distribuicao de Poisson e frequentemente usada na contagem de ocorrencias de certo tipo
de evento em perodos xos de tempo,
17
eventos tais como: chegadas, partidas, acidentes,
falhas de equipamento, testemunhos verdadeiros em tribunal, n umero de excedencias de
nveis elevados de pluviosidade/ondas/mares, n umero de colisoes de detritos espaciais
com di ametro superior a 1cm num satelite numa regiao orbital abaixo dos 2.000Km de
altitude, etc.
A distribuic ao de Poisson foi originalmente introduzida em 1837 por Simeon Dennis
Poisson (17811840) como distribuic ao limite da distribuic ao binomial. Anos mais tarde
von Bortkiewicz (1898) recorre à distribui cao de Poisson para descrever o comportamento
probabilstico do n umero de mortes por coices de cavalo no exercito prussiano.
Denicao 3.72 Distribuicao de Poisson
A v.a. X com distribui cao tem a particularidade de possuir o valor esperado e a vari ancia
iguais ao par ametro que dene a distribuic ao, , e f.p. na tabela abaixo
Poisson
Notacao X Poisson()
Par ametro ( IR
+
)
Contradomnio IN0
F.p. P(X = x) =
_
_
_
e

x
x!
, x = 0, 1, 2, . . .
0, c.c.
Vari ancia V (X) =
Nota 3.73 F.d. da v.a. de Poisson

A f.d. da v.a. X Poisson(p),
F
X
(x) = P(X x) =
_
_
_
0, x < 0
[x]
i=0
e

i
i!
, x 0
(3.32)
(onde [x] e a parte inteira do real x), esta tabelada para alguns valores de .
17
Ou mesmo em areas ou volumes.
74
Exemplo 3.74 Utiliza cao das tabelas da f.d. da v.a. de Poisson
V.a. x Valor tabelado de FX(x) = P(X x)
X Poisson( = 0.05) 0 FX(0) = 0.9512
X Poisson( = 3) 1 FX(1) = 0.1991
X Poisson( = 12) 1 FX(1) = 0.0001
X Poisson( = 20) 14 FX(14) = 0.1049
Exemplo 3.75 Distribuicao de Poisson

A procura semanal de uma luxuosa marca de autom ovel segue uma lei de Poisson. Sabe-se
ainda que a probabilidade de numa semana n ao existir procura e igual a e
3
.
18
(a) Determine a probabilidade de a procura semanal exceder pelo menos 2 autom oveis.
V.a.
X = procura semanal de autom oveis da referida marca
Distribuicao de X
X Poisson()
F.p. de X
P(X = x) = e

x
x!
, x = 0, 1, 2, . . .
Parametro
: P(X = 0) = e
3
e

0
0!
= e
3
= 3
P(X 2) = 1 P(X < 2)
= 1 P(X 1)
= 1 F
Poisson(3)
(1)
tabela
= 1 0.1991
= 0.8009.
18

Epoca, 21 de Julho de 2001.
75
(b) Qual a probabilidade de a procura em 4 semanas ser de pelo menos 2 autom oveis?
V.a.
Y = procura de automoveis da referida marca em 4 semanas
Distribuicao de Y
Y Poisson(4 )
F.p. de Y
P(Y = y) = e
12 12
y
y!
, y = 0, 1, 2, . . .
P(Y 2) = 1 F
Poisson(12)
(1)
tabela
= 1 0.0001
= 0.9999.
Esta alnea ilustra a propriedade reprodutiva da v.a. de Poisson (ver Cap. 5).
76
3.10 Algumas notas sobre analise combinat oria
Permuta c oes de n elementos (n!)
N umero de formas distintas de preenchimento de caixa com n compartimentos,
dispondo de n elementos e n ao havendo a possibilidade de repeticao no
preenchimento.
Sequencias de n elementos distintos...
Arranjos com repeticao de n elementos tomados x a x (n
x
)
N umero de formas distintas de preenchimento de caixa com x compartimentos,
dispondo de n elementos e havendo a possibilidade de repeticao no preenchimento.
Sequencias de x elementos...
Arranjos sem repeticao de n elementos tomados x a x
_
n!
(nx)!
_
N umero de formas distintas de preenchimento de caixa com x compartimentos,
dispondo de n elementos e n ao havendo a possibilidade de repeticao no
preenchimento.
Sequencias de x elementos distintos...
Combina c oes de n elementos tomados x a x
__
n
x
_
=
n!
x!(nx)!
_
N umero de conjuntos de cardinal x (logo com elementos distintos) que podem ser
formados com n elementos.
Conjuntos de cardinal x...
Permuta coes de n elementos de k tipos distintos
_
n!
n1! n2! ... nk!
_
N umero de formas distintas de preenchimento de caixa com n compartimentos,
dispondo de n elementos de k tipos distintos, onde n
i
representa o n umero de
elementos do tipo i, i = 1, 2, . . . , k, e

k
i=1
n
i
= n.
Sequencias de n elementos de k tipos...
Bin omio de Newton
(a +b)
n
=

n
x=1
_
n
x
_
a
x
b
nx
.
77
Captulo 4
Variaveis aleat orias e distribui c oes
contnuas
4.1 Variaveis aleatorias contnuas.
Motiva cao 4.1 V.a. contnua
Muitas quantidades de interesse s ao expressas por valores numericos. Sao disso exemplo
a vibra c ao produzida por um motor (em hertz por unidade de tempo), a deex ao
de uma mola (em metros), o tempo de repara cao de pe ca mecanica,
a intensidade da corrente electrica em certa zona de um circuito (em amperes), a
imped ancia de um sistema (em ohm),
a temperatura, o volume da voz, a concentra cao de um poluente, etc.
Em qualquer dos casos e perfeitamente razo avel assumir que
o conjunto de valores possveis e innito nao numer avel,
por exemplo, um intervalo real [a, b], ou IR, ou IR
+
.
O facto de o contradomnio da v.a. X ser innito nao numer avel e manifestamente
insuciente para descrever rigorosamente uma v.a. contnua como veremos ja de seguida.
78
Denicao 4.2 V.a. contnua
A v.a. X diz-se contnua, caso
possua f.d. F
X
(x) = P(X x) contnua em IR
e exista uma func ao real de vari avel real, f
X
(x), que verique:
f
X
(x) 0, x IR
F
X
(x) = P(X x) =
_
x
f
X
(t)dt.
A func ao f
X
(x) e denominada de fun cao densidade de probabilidade e goza de um
conjunto de propriedades descritas na secc ao seguinte.
79
4.2 Fun cao de densidade de probabilidade.
Motiva cao 4.3 Funcao de densidade de probabilidade
Ao lidarmos com uma v.a. discreta podemos calcular a f.p. P(X = x). No entanto, tal
c alculo n ao faz qualquer sentido ao lidar-se com a v.a. contnua X.

E razo avel sim
calcular a probabilidade de X pertencer a um intervalo
e denir o an alogo contnua da f.p., a func ao de densidade de probabilidade (f.d.p.).
Proposicao 4.4 Funcao de densidade de probabilidade
Tendo em conta as propriedades da f.d. e a rela c ao entre esta funcao e a f.d.p., deduzem-se
as seguintes propriedades para f
X
(x). Para alem de vericar
f
X
(x) 0, x IR
F
X
(x) = P(X x) =
_
x
f
X
(t)dt,
a f.d.p. satisfaz
_
+
f
X
(x)dx = 1
_
b
a
f
X
(x)dx = P(a < X b), a < b.
Nota 4.5 F.d.p.
Para v.a. contnuas tem-se:
P(X = x) = 0, x IR, i.e., a probabilidade de a v.a. tomar o valor real x e nula
(o evento e quase-impossvel!)
P(a < X b) = P(a < X < b) = P(a X b) = P(a X < b)
=
_
b
a
f
X
(x)dx = F
X
(b) F
X
(a), a < b,
correspondendo à area sob o graco da f.d.p. entre a e b (gr aco!).
Nota 4.6 Interpreta cao geometrica da f.d.p.
De notar que
P
_
a

2
< X a +

2
_
=
_
a+
2
a
2
f
X
(x) dx
f
X
(a). (4.1)
f
X
(a) d a, portanto, uma ideia da possibilidade de ocorrencia de valores proximos do
ponto a.
1
1
Que nunca deve confundir-se com a probabilidade de ocorrer {X = a}, probabilidade que se sabe ser
nula para v.a. contnuas.
80
4.3 Fun cao de distribuicao.
Motiva cao 4.7 F.d. de v.a. contnua
Tal como no caso discreto justica-se o calculo de probabilidades do tipo
P(X x), para qualquer x IR, ou seja, e pertinente denir a f.d. da v.a. contnua
X.
Denicao 4.8 F.d. de v.a. contnua
Seja X uma v.a. contnua. Entao a sua f.d. e dada por
F
X
(x) = P(X x)
=
_
x
f
X
(t)dt, x IR (4.2)
=

Area sob o gr aco da f.d.p. de X entre e x.
Exemplo 4.9 F.d. de v.a. contnua

Assuma que o tempo (em anos) entre duas colis oes consecutivas de detritos espaciais com
di ametro maior que 1mm num satelite em MEO
2
e uma v.a. contnua com f.d.p.
f
X
(x) =
_
_
_
0, x < 0
0.4 e
0.4x
, x 0.
(4.3)
(a) Ap os ter feito o graco da f.d.p. de X, calcule a probabilidade do tempo entre duas
colis oes consecutivas exceder 1 ano e tres meses.
V.a.
X = tempo entre duas colis oes consecutivas... (em anos)
F.d.p. de X
f
X
(x) =
_
_
_
0, x < 0
0.4 e
0.4x
, x 0.
Graco da f.d.p. de X
2
Medium Earth Orbit, associada a altitudes entre 2.000Km e 34.786Km.
81
P(X > 1.25) =
_
+
1.25
f
X
(x) dx
=
_
+
1.25
0.4 e
0.4x
dx
= e
0.4x
+
1.25
= 0 +e
0.41.25
= e
0.5
.
(b) Determine a f.d. de X e esboce o respectivo gr aco.
F.d. de X
Tal como no caso discreto talvez n ao seja m a ideia comecar-se por preencher
a tabela abaixo com alguns valores da f.d. de X para depois determinar-se a
expressao geral da f.d. de X.
x FX(x) = P(X x) =
_
x
fX(t)dt Esquema
-1.5 FX(1.5) =
_
1.5
fX(t)dt
=
_
1.5
0 dt
= 0
1.25 FX(1.25) =
_
1.25
fX(t)dt
=
_
0
0 dt +
_
1.25
0
0.4 e
0.4t
dt
= e
0.4t
1.25
0
= 1 e
0.5
x > 0 FX(x) =
_
x
fX(t)dt
=
_
0
0 dt +
_
x
0
0.4 e
0.4t
dt
= e
0.4t
x
0
= 1 e
0.4 x
Deste modo conclui-se que:
F
X
(x) =
_
_
_
0, x < 0
1 e
0.4x
, x 0.
Graco da f.d. de X
82
Proposicao 4.10 Propriedades da f.d. de v.a. contnua
A f.d. da v.a. contnua X, F
X
(x), e uma:
1. Func ao contnua, logo contnua quer ` a direita,
3
quer ` a esquerda, ou seja, F
X
(x) =
F
X
(x
+
) = F
X
(x
), x IR;
2. Func ao monotona n ao decrescente de x.
A f.d. de uma v.a contnua X verica tambem:
3. 0 F
X
(x) 1;
4. F
X
() = lim
x
F
X
(x) = 0;
5. F
X
(+) = lim
x+
F
X
(x) = 1;
6. P(X x) = P(X < x) = F
X
(x);
7. P(X > x) = 1 F
X
(x);
e ainda, para a < b,
8. P(a < X b) = P(a < X < b) = P(a X b) = P(a X < b)
=
_
b
a
f
X
(x)dx = F
X
(b) F
X
(a), a < b,
como, alias, j a se tinha referido.
Nota 4.11 Rela cao entre a f.d.p. e a f.d.
E possvel obter a f.d.p. derivando a f.d.:

f
X
(x) =
d F
X
(x)
dx
. (4.4)
3
Tal como acontece com a f.d. de qualquer v.a. discreta.
83
Exemplo 4.12 F.d. de v.a. contnua (e n ao so)
O tempo que uma viatura de uma luxuosa marca leva a atingir 100 Km/h (em segundos)
e uma vari avel aleat oria X com f.d.p.
4
f
X
(x) =
_
_
_
24.5
2
x
3
, x 4.5
0, c.c.
(a) Determine a probabilidade de uma viatura seleccionada ao acaso atingir 100 Km/h
em mais de 7 segundos e como tal necessitar de uma ana cao.
V.a.
X = tempo (em segundos) que uma viatura leva a atingir 100Km/h
F.d.p. de X
f
X
(x) =
_
_
_
24.5
2
x
3
, x 4.5
0, c.c.
P(X > 7) =
_
+
7
f
X
(x) dx
=
_
+
7
2 4.5
2
x
3
dx
=
4.5
2
x
2
+
7
=
4.5
2
49
0.4133.
(b) Qual a probabilidade de pelo menos duas viaturas necessitarem de ana cao, de entre
um conjunto de 10 seleccionadas ao acaso da produc ao di aria?
Nova v.a.
Y = n umero de viaturas que necessitam de ana c ao, em 10 seleccionadas ao
acaso
5
Distribuicao de Y
Y binomial(n, p)
4
Adaptado do Teste A, 22 de Maio de 2006.
5
Admitindo independencia entre os tempos a as diferentes viaturas atingem os 100Km/h.
84
Parametros
n =10 viaturas
p = P(viatura necessitar de ana cao) = P(X > 7) 0.4133
F.p. de Y
P(Y = y) =
_
10
y
_
0.4133
y
(1 0.4133)
10y
, y = 0, 1, 2, . . . , 10
P(Y 2) = 1 P(Y 1)
= 1
1
y=0
_
10
y
_
0.4133
y
(1 0.4133)
10y
= 1
_
(1 0.4133)
10
+ 10 0.4133 (1 0.4133)
9
_
)
= 0.9612.
Uma vez que a probabilidade obtida e elevadssima, alerta-se para a necessidade
de uma melhoria do processo de producao, de modo a diminuir o n umero
esperado de viaturas que necessitam de ana c ao E(Y ) = np = 10 0.4133 =
4.133 viaturas.
85
4.4 Valor esperado, variancia e algumas das suas
propriedades. Moda e quantis.
Motiva cao 4.13 Parametros
Tal como no caso das v.a. discretas e importante calcular medidas sum arias de
Localiza c ao central
Localiza c ao n ao central
Dispersao
capazes de caracterizar embora parcialmente algum aspecto de uma v.a. X contnua.
A denic ao de qualquer destes par ametros e an aloga ao caso discreto: onde tnhamos

xIR
ou P(X = x)
passamos a ter
_
+
dx ou f
X
(x), respectivamente.
Ao invocar esta analogia escusar-nos-emos a fazer qualquer tipo de motiva c ao adicional
a estes par ametros ou repetir coment arios ja efectuados sobre estes par ametros no captulo
anterior.
Denicao 4.14 Valor esperado de v.a. contnua
O valor esperado da v.a. contnua X e igual a
E(X) =
_
+
x f
X
(x) dx. (4.5)
Nota 4.15 Valor esperado de v.a. contnua

1. E(X) =
_
+
x f
X
(x) dx =
_
xIRX
x f
X
(x) dx.
2. E(X) existe sse
_
+
|x| f
X
(x) dx, i.e., sse o integral for absolutamente convergente.
3. Ao lidarmos com v.a. contnuas E(X) IR
X
, i.e., o valor esperado de X pertence,
de um modo geral, ao conjunto de valores possveis de X.
6
6
Ha eventuais excep coes: basta pensar numa v.a. contnua que tome valores nos intervalos disjuntos
[0, 10] e [20, 30] e possua f.d.p. constante e igual a
1
20
em qualquer dos dois intervalos.
86
Proposicao 4.16 Propriedades do valor esperado de v.a. contnua
Tal como no caso discreto, o valor esperado da v.a. contnua X goza das duas seguintes
propriedades:
1. E(b) = b, b IR;
2. E(aX +b) = aE(X) +b, a, b IR (operador linear).
E para alem disso satisfaz as propriedades:
3. Seja Y = (X) uma v.a. func ao (mensuravel) de X. Ent ao
E(Y ) = E[(X)] =
_
+
(x) f
X
(x) dx. (4.6)
4. Seja X uma v.a. real n ao negativa (resp. positiva), i.e., IR
X
= IR
+
0
= [0, +) (resp.
IR
X
= IR
+
= (0, +)). Ent ao
E(X) =
_
+
0
P(X > x) dx =
_
+
0
[1 F
X
(x)] dx. (4.7)
Exemplo 4.17 Valor esperado de v.a. contnua

Calcule o valor esperado do tempo entre duas colis oes consecutivas, denido no Exemplo
4.9.
V.a.
X =tempo (em anos) entre duas colisoes consecutivas...
F.d.p. de X
f
X
(x) =
_
_
_
0, x < 0
0.4 e
0.4x
, x 0.
Valor esperado de X
Integrando por partes
7
obtem-se:
7
_
u = x
v
= 0.4 e
0.4x
_
u
= 1
v = e
0.4x
87
E(X) =
_
+
x f
X
(x) dx
=
_
0
0 dx +
_
+
0
x 0.4 e
0.4x
dx
= x e
0.4x
+
0
+
_
+
0
e
0.4x
dx
= 0
e
0.4x
0.4
+
0
=
1
0.4
= 2.5 anos.
Denicao 4.18 Moda de v.a. contnua
A moda da v.a. contnua X, mo, esta associada ao ponto de m aximo da f.d.p. de X, ou
seja,
mo : f
X
(mo) = max
x
f
X
(x). (4.8)
Nota 4.19 Moda de v.a. contnua

De referir que:
tal como no caso das v.a. discretas, a moda de uma v.a. contnua pode nao ser unica
como e o caso das v.a. denidas em intervalos nitos e com f.d.p. constante nesses
mesmos intervalos;
a moda de uma v.a. contnua obtem-se recorrendo de um modo geral ` as tecnicas de
maximiza c ao de fun coes:
mo :
_
_
_
dfX(x)
dx
x=mo
= 0 (ponto de estacionaridade)
d
2
fX(x)
dx
2
x=mo
< 0 (ponto de m aximo).
(4.9)
Denicao 4.20 Mediana de v.a. contnua

Tal como acontece no caso discreto, a mediana da v.a. contnua X, me, verica a dupla
desigualdade
1
2
F
X
(me)
1
2
+ P(X = me). Mas como P(X = me) = 0 no caso
contnuo a mediana e denida por
me : F
X
(me) =
1
2
. (4.10)
88
Denicao 4.21 Quantil de probabilidade p de v.a. contnua
Analogamente, o quantil de probabilidade (ou quantil de ordem) p (0 < p < 1) da
v.a. contnua X,
p
, dene-se ` a custa da equa c ao
p
: F
X
(
p
) = p. (4.11)
Exemplo 4.22 Moda, mediana e terceiro quartil de v.a. contnua

Retome o Exemplo 4.9 e obtenha a moda, a mediana e o terceiro quartil do tempo entre
colis oes consecutivas de detritos espaciais num satelite em MEO.
V.a.
X = tempo entre duas colis oes consecutivas... (em anos)
F.d.p. de X
f
X
(x) =
_
_
_
0, x < 0
0.4 e
0.4x
, x 0.
Moda de X
mo = mo(X) = 0 j a que f
X
(x) e uma funcao decrescente em IR
+
0
.
Mediana de X
Tirando partido do facto da f.d. de X ser igual a
F
X
(x) =
_
_
_
0, x < 0
1 e
0.4x
, x 0
logo se conclui que a mediana da v.a. X e dada por
me : F
X
(me) = 1/2
1 e
0.4 me
= 1/2
me =
1
0.4
ln(1 1/2)
1.73 anos.
Terceiro quartil de X
Designe-se este quartil por F
1
X
(3/4). Ent ao
F
1
X
(3/4) : F
X
[F
1
X
(3/4)] = 3/4
F
1
X
(3/4) =
1
0.4
ln(1 3/4)
3.47 anos
e note-se que P[X F
1
X
(3/4)] = 3/4 e P[X F
1
X
(3/4)] = 1/4.
89
Denicao 4.23 Variancia de v.a. contnua
A vari ancia da v.a. contnua X e igual a
V (X) = E(X
2
) E
2
(X), (4.12)
onde E(X
2
) =
_
+
x
2
f
X
(x) dx e E
2
(X) = [
_
+
x f
X
(x) dx]
2
.
Nota 4.24 Propriedades da variancia
Relembre-se que a vari ancia de uma v.a. quer discreta, quer contnua, goza das
propriedades:
1. V (b) = 0, b IR
2. V (X) 0, qualquer que seja a v.a. X
3. V (aX +b) = a
2
V (X), a, b IR.
Denicao 4.25 Desvio-padrao de v.a. contnua
Escusado sera dizer que o desvio-padrao da v.a. contnua X e a raiz quadrada positiva da
vari ancia de X:
DP(X) = +
_
V (X). (4.13)
Denicao 4.26 Coeciente de varia cao

Relembre-se tambem que o coeciente de dispers ao e igual a
CV (X) =
DP(X)
|E(X)|
, (4.14)
caso X seja uma v.a. contnua, desde que E(X) = 0.
Exerccio 4.27 Retome o Exerccio 4.9 e prove que a variancia, o desvio-padr ao e o
coeciente de varia cao do tempo entre colisoes consecutivas sao iguais a 1/0.4
2
, 1/0.4 e 1
respectivamente.
90
4.5 Distribuicao uniforme contnua.
Motiva cao 4.28 Distribuicao uniforme contnua
Esta distribui cao e o an alogo contnuo da distribuic ao uniforme discreta, tal como sugere
o seu nome. N ao surpreende pois que se trate de distribuic ao adequada a descrever o
comportamento probabilstico de v.a. cujos valores possveis se cre terem todos o mesmo
peso, para alem de constituirem um conjunto conhecido e limitado (quer ` a esquerda,
quer à direita).
Denicao 4.29 Distribuicao uniforme contnua
A v.a. contnua X possui distribuic ao uniforme contnua no intervalo [a, b] (onde a < b),
caso a sua f.d.p. seja dada por
f
X
(x) =
_
_
_
1
ba
, a x b
0, c.c.
(4.15)
Uniforme
Notacao X uniforme(a, b)
Par ametros a (extremo inferior do intervalo; a IR)
b (extremo superior do intervalo; b IR)
Contradomnio [a, b]
F.d.p. fX(x) =
_
_
_
1
ba
, a x b
0, c.c.
a+b
2
Vari ancia V (X) =
(ba)
2
12
Exerccio 4.30 Distribuicao uniforme contnua

Esboce o gr aco da f.d.p. da v.a. X uniforme(a, b) e deduza o seu valor esperado e a
sua vari ancia.
91
Nota 4.31 F.d. da v.a. uniforme contnua
A f.d. da v.a. X uniforme(a, b) possui tres tro cos e e igual a
F
X
(x) = P(X x)
=
_
x
f
X
(t)dt
=
_
_
0, x < a
xa
ba
, a x b
1, x > b.
(4.16)
Gra cas ` a simplicidade desta func ao, ela n ao se encontra tabelada, ` a semelhanca do que
acontece com a da distribuic ao uniforme discreta.
Exemplo 4.32 Distribuicao uniforme contnua
O di ametro mnimo e m aximo de pist oes fornecidos a certo fabricante autom ovel e de
18mm e 22mm, respectivamente.
Um dispositivo de controlo, que mede o diametro de um pist ao fornecido de 2 em 2 horas,
alerta o operador assim que se registe um di ametro superior a 21.5mm.
8
(a) Qual a probabilidade de o operador ser alertado aquando de uma medic ao,
assumindo que o di ametro dos pist oes se distribui uniformemente?
V.a.
X = di ametro do pist ao (em mm)
Distribuicao de X
X uniforme(a, b)
Parametros
a = di ametro mnimo = 18mm
b = di ametro maximo = 22mm
F.d.p. de X
f
X
(x) =
_
_
_
1
2218
=
1
4
, 18 x 22
0, c.c.
8
Adaptado do Teste A, 11 de Maio de 2002.
92
Seja A o evento que representa a emissao de alerta aquando de uma medicao.
Ent ao
P(A) = P(X > 21.5)
=
_
+
21.5
f
X
(x)dx
=
_
22
21.5
1
4
dx +
_
+
22
0 dx
=
x
4
22
21.5
=
1
8
.
(b) Calcule a probabilidade de o primeiro alerta n ao ser emitido por nenhuma das 15
primeiras medic oes de di ametros.
Nova v.a.
Y =n umero de medic oes ate à emissao de um alerta
Distribuicao de Y
Y geometrica(p)
Parametro
p = P(A) = 1/8
F.p. de Y
P(Y = y) = (1 p)
y1
p = (1 1/8)
y1
1/8, y = 1, 2, . . .
Uma vez que as medic oes sao efectuadas de 2 em 2 horas a probabilidade pedida
mais nao e que
P(Y > 15) = 1 P(Y 15)
= 1
15
y=1
(1 p)
y1
p
= 1 p
1 (1 p)
15
1 (1 p)
= (1 p)
15
0.135.
93
Proposicao 4.33 Distribuicao uniforme contnua
Considere-se que X uniforme(a, b). Ent ao os intervalos com a mesma amplitude
desde que contidos em [a, b] s ao equiprov aveis. Assim,
P(c < X c +) = P(d < X d +) =

b a
, (4.17)
para c, c +, d, d + [a, b].
94
4.6 Distribuicao normal.
Motiva cao 4.34 Distribuicao normal
Esta distribuic ao surge associada ` a modela cao de observa coes relativas a medic oes de
temperaturas, de velocidades, de erros, de volumes de rudo, etc. Surge tambem como
distribuic ao aproximada, nomeadamente de algumas distribuicoes discretas
9
ou ainda de
medias aritmeticas ou somas de v.a.
10
O recurso ` a distribui cao normal nestes casos prende-
se com alguma evidencia emprica e matem atica, respectivamente. Importa referir que
o uso desta distribui cao deve ser evitado ou deve fazer-se com muita cautela quando a
v.a. tem car acter (acentuadamente) assimetrico pois como teremos oportunidade de ver
j a de seguida esta v.a. tem f.d.p. simetrica.
A utiliza cao da distribui c ao normal no domnio da Inferencia Estatstica
11
reveste-se
de extrema import ancia e deve-se a uma serie de propriedades matematicas interessantes
desta distribuic ao.
Nota 4.35 Distribuicao normal (nota hist orica)
A distribui cao normal foi introduzida pelo matem atico frances Abraham de Moivre (1667
1754) em 1733 e foi utilizada para aproximar probabilidades de eventos respeitantes a v.a.
binomiais.
12
E e curioso notar que o trabalho de de Moivre esteve perdido por algum
tempo, tendo Karl Friedrich Gauss (17771855) derivado a distribuic ao normal de forma
independente cerca de 100 anos mais tarde, e que o nome alternativo mais usual para esta
distribuic ao e distribui cao gaussiana.
Denicao 4.36 Distribuicao normal
A v.a. contnua X diz-se com distribui cao normal de par ametros e
2
se a sua f.d.p. for
igual a
f
X
(x) =
1
2
e
(x)
2
22
, < x < +. (4.18)
9
Como poderemos ver no pr oximo captulo.
10
Gra cas ao Teorema do Limite Central, como teremos ocasiao de descrever de forma mais detalhada
no pr oximo captulo.
11
Assunto de que falaremos a partir do Captulo 6.
12
Este resultado foi posteriormente estendido por Pierre Simon Laplace (17491827) a outras v.a., no
seculo XIX.
95
Normal
Notacao X normal(,
2
)
Par ametros ( IR)
2
(
2
IR
+
)
Contradomnio IR
F.d.p. fX(x) =
1
2
e
(x)
2
22
, < x < +
Vari ancia V (X) =
2
Nota 4.37 F.d.p. da v.a. normal

A f.d.p. da distribuic ao normal e simetrica em torno de e tem a forma de sino.
13
E
devido a estes dois factos que a mediana e igual ` a moda e ao valor esperado, i.e.,
me = mo = E(X) = .
Para alem disso, o valor de
2
determina o achatamento da f.d.p. desta v.a. ou nao se
tratasse
2
de uma medida de dispersao (absoluta):

2
muito pequeno, f.d.p. muito alongada;

2
muito grande, f.d.p. muito achatada.
Exerccio 4.38 Esboce e compare os gr acos das f.d.p. das v.a.:
X normal(5, 0.5
2
);
X normal(10, 0.5
2
);
X normal(10, 3
2
).
Nota 4.39 F.d. da v.a. normal
A f.d. da v.a. X normal(,
2
) e dada por
F
X
(x) =
_
x
2
e
(t)
2
22
dt, < x < +. (4.19)
13
J a agora adiante-se que a f.d.p. da v.a. normal(,
2
) possui dois pontos de inex ao em .
96
No entanto, F
X
(x) n ao possui expressao fechada, pelo que s o pode ser obtida
numericamente ou por consulta de tabelas existentes. A consulta destas tabelas encontra
justicac ao nos seguintes resultados.
Proposicao 4.40 Normal padrao (ou normal reduzida, ou normal standard)
Seja X normal(,
2
). Ent ao a v.a. Z =
XE(X)
V (X)
=
X
diz-se com distribui cao normal

padrao. Alias,
X normal(,
2
) Z =
X
normal(0, 1). (4.20)

Para alem disso, Z possui f.d. dada por
F
Z
(z) = P(Z z) =
_
z
2
e
t
2
2
dt = (z). (4.21)
A func ao (z) est a por sinal tabelada para um grande n umero de valores de z como
se ilustra no exemplo seguinte.
Exemplo 4.41 Consulta das tabelas da distribuicao normal padrao
(2.53) =
(0) =
(1.0) = .
Proposicao 4.42 F.d. da v.a. normal
A f.d. da v.a. Z =
X
normal(0, 1) encontra-se tabelada e, como vimos, e usualmente

representada por .

E à custa desta f.d. e invocando a Proposic ao 4.40 que se obtem a
f.d. da v.a. X normal(,
2
), para quaisquer valores admissveis de e de
2
. Com
efeito:
F
X
(x) = P(X x)
= P
_
X
_
= P
_
Z
x
_
=
_
x
_
. (4.22)
97
Nota 4.43 Consulta das tabelas da distribuicao normal (cont.)
Importa notar que n ao constam valores de (z) para z > 0 nas tabelas disponibilizadas
para esta disciplina. No entanto, gra cas ` a simetria da f.d.p. da normal padr ao em torno
da origem pode concluir-se que
(z) = 1 (z), < z < +. (4.23)
Por exemplo:
(2.53) = 1 (2.53) = .
Convem notar tambem que das tabelas disponibilizadas s o constam valores de para
z = 0.00 4.09 (0.01). Contudo, ao tirar-se partido do facto de a f.d. de qualquer v.a. ser
mon otona n ao decrescente, conclui-se, por exemplo, que
(5.15) > (4.09) = 0.999978 1.0000
ou que
(5.15) < (4.09) = 1 (4.09) = 1 0.999978 0.0000.
Exemplo 4.44 Distribuicao normal
Uma componente mec anica e constituda por uma biela e uma manivela. Esta componente
possui massa total com distribui cao normal com valor esperado 1.8Kg e variancia
0.0049Kg
2
.
Calcule a probabilidade desta componente nao respeitar as seguintes especicac oes:
1.8 0.075Kg.
V.a.
X =massa total da componente
Distribuicao de X
X normal(,
2
)
Parametros
= E(X) = 1.8Kg
2
= V (X) = 0.0049Kg
2
98
Sejam D o evento que representa respeitar-se as especicacoes e Z =
XE(X)
V (X)
a v.a.
normal padr ao (i.e., Z normal(0, 1)). Assim, a probabilidade pedida e igual a
P(D) = 1 P(D)
= 1 P(1.8 0.075 X 1.8 + 0.075)
= 1 P
_
(1.8 0.075) E(X)
_
V (X)

X E(X)
_
V (X)

(1.8 + 0.075) E(X)
_
V (X)
_
= 1 P
_
(1.8 0.075) 1.8
0.0049
Z
(1.8 + 0.075) 1.8
0.0049
_
= 1 P
_
0.075
0.07
Z
0.075
0.07
_
1 P (1.07 Z 1.07)
= 1 [(1.07) (1.07)]
= 1 {(1.07) [1 (1.07)]}
= 2 [1 (1.07)]
tabela
= 2 (1 0.8577)
= 0.2846.
Rera-se que a probabilidade de a componente mecanica n ao respeitar as
especicac oes e elevada, pelo que e necessario melhor o processo de produc ao,
nomeadamente, diminuir a vari ancia da massa desta componente.
Nota 4.45 Mais curiosidades acerca da distribuicao normal
Adiante-se que
Intervalo Probabilidade
P( < X +) = (1) (1) = 0.8413 (1 0.8413) = 0.6826
2 P( 2 < X + 2) = . . . = 0.9544
3 P( 3 < X + 3) = . . . = 0.9973
1.9600 P( 1.9600 < X + 1.9600) = . . . = 0.9500
2.5758 P( 2.5758 < X + 2.5758) = . . . = 0.9900
independentemente dos valores do valor esperado () e do desviopadr ao () da
distribuic ao normal.
De real car que, embora o contradomnio da distribuicao normal seja (, +), ao
considerar-se valores positivos para sucientemente grandes quando comparados com
99
o valor de (e.g. / >> 3) a probabilidade de registar-se valores negativos e irrisoria.
Por exemplo, caso X normal(40, 10
2
), tem-se
P(X < 0) = [(0 40)/10]
= (4.00)
= 1 (4.00)
0.000000. (4.24)
Justica-se assim a utiliza c ao da distribuic ao normal na modela c ao de quantidades
numericas intrinsecamente positivas como e o caso de tempos, volumes de rudos, alturas,
pesos, etc., caso estas v.a. tenham, bem entendido, caracter simetrico.
A distribuic ao normal satisfaz uma serie de outras propriedades mas para j a
enunciemos a seguinte da qual a Proposi cao 4.40 e um caso particular.
Proposicao 4.46 Fecho da distribuicao normal para fun coes lineares
Seja X normal(,
2
). Ent ao qualquer sua func ao linear Y = aX +b verica:
Y = aX +b normal(a +b, a
2
2
), (4.25)
onde a e b s ao reais arbitr arios.
Veremos mais tarde que a soma de v.a. normais independentes ainda e uma
v.a. normal...
Exerccio 4.47 Fecho da distribuicao normal para fun coes lineares
Prove a Proposi cao 4.46.
E frequente pretender-se resposta a questoes como esta:

Ao considerar-se que X representa o peso de um indivduo, quantos Kg se calcula
que metade da popula cao nao exceder a?
A resposta para esta questao e claramente a mediana, me = F
1
X
(0.5), j a que
P(X me) = 0.5. Ali as, a quest ao poderia ser reformulada e passar-se a solicitar
um quantil de probabilidade p.
100
Nota 4.48 Quantis da distribuicao normal padrao
Foi tambem disponibilizada uma tabela de quantis da distribuic ao normal padr ao, i.e.,
respeitantes ` a v.a. Z normal(0, 1). A consulta da mesma faz-se sem grande diculdade.
Sen ao vejamos alguns exemplos de quantis de probabilidade p, com 0.500 p 1.000,
da distribuic ao normal padr ao:
F
1
Z
(0.975) =
1
(0.975) = 1.9600

1
(0.974) = 1.9431.
Mas atente-se que os quantis de probabilidade p < 0.500 sao negativos:
14

1
(0.023) =
1
(1 0.023) = 1.9954.
Exemplo 4.49 Quantis da distribuicao normal
As especica coes sobre o diametro de um certo tipo de cabo admitem um desvio m aximo,
face ao valor de referencia, de 10 mcrons. Contudo, no seu fabrico apenas se consegue
garantir que esse desvio tem distribuic ao normal de valor esperado igual a zero mcrons.
Que valor deve ter a vari ancia para se poder garantir que em 95% dos cabos produzidos
os desvios est ao entre 9.8 mcrons?
15
V.a.
X = desvio (em mcrons) do di ametro de um certo tipo de cabo face ao valor de
referencia
Distribuicao de X
X normal(,
2
)
Parametros
= E(X) = 0
2
= V (X) =?
14
Basta pensar que a f.d.p. da distribui cao normal padr ao e simetrica em relacao à origem e como tal
P(Z 0) = 0.5.
15
Adaptado do Teste A de 11 de Novembro de 2006.
101
Obten cao da variancia
Ao considerar-se a v.a. Z normal(0, 1), tem-se
2
: P(9.8 X 9.8) = 0.95
P
_
_
9.8 E(X)
_
V (X)
X E(X)
_
V (X)
9.8 E(X)
_
V (X)
_
_
= 0.95
P
_
9.8 0
Z
9.8 0
_
= 0.95
_
9.8
9.8
_
= 0.95
2
_
9.8
_
1 = 0.95
9.8
=
1
(0.975)
tabela
=
9.8
1.96
2
= 25.
Ilustra-se assim a utilidade dos quantis na obten c ao de um par ametro da distribuic ao
normal.
Exerccio 4.50 Quantis da distribuicao normal padrao
Prove que o quantil de probabilidade p de uma v.a.
X normal(,
2
) se escreve do seguinte modo ` a custa do quantil de probabilidade p da
normal padrao,
1
(p): F
1
normal(,
2
)
(p) = +
1
(p).
102
4.7 Distribuicao exponencial.
Motiva cao 4.51 Distribuicao exponencial
Trata-se certamente da distribui c ao contnua mais utilizada na caracteriza c ao da dura c ao
de equipamento, por exemplo, electr onico, naquilo que usualmente se designa de testes de
vida. Esta distribuic ao surge tambem na pr atica no contexto da modela c ao dos tempos
entre ocorrencias consecutivas de eventos do mesmo tipo, e.g. chegadas de clientes a um
sistema, falhas mecanicas, colisoes, etc.
Constate-se que a popularidade da distribuic ao exponencial prende-se essencialmente
com a simplicidade do modelo (e das inferencias sobre este modelo), algumas das suas
propriedades e alguma evidencia emprica.
Denicao 4.52 Distribuicao exponencial
Lidaremos com uma v.a. X com distribuic ao exponencial de par ametro , caso
f
X
(x) =
_
_
_
e
x
, x 0
0, c.c.
(4.26)
Exponencial
Notacao X exponencial()
Par ametro ( IR
+
)
Contradomnio IR
+
0
= [0, +)
F.d.p. fX(x) =
_
_
_
e
x
, x 0
0, c.c.
1
Vari ancia V (X) =

1
Exerccio 4.53 F.d. da v.a. exponencial

Esboce o gr aco da f.d.p. da v.a. X exponencial() e verique que a f.d. de X e dada
por
F
X
(x) =
_
_
_
0, x < 0
1 e
x
, x 0,
(4.27)
que por sinal tambem n ao esta tabelada devido ` a simplicidade da sua expressao geral.
103
Exemplo 4.54 Distribuicao exponencial
Os turbofan jet engines comecaram a ser usados h a mais de 20 anos como meio de
propuls ao de aeronaves comerciais: constituem o que se considera uma forma econ omica
e segura de transportar carga e passageiros.
O tempo entre falhas consecutivas (em horas) por parte de certo tipo destes motores
possui distribuicao exponencial de valor esperado igual a 500 horas.
(a) Obtenha a probabilidade do tempo entre falhas consecutivas exceder E(X) = 500
horas. Comente.
V.a.
X = tempo entre falhas consecutivas (em horas)
Distribuicao de X
X exponencial()
Parametro
: E(X) = 500
1
= 500
= 0.002
F.d.p. de X
f
X
(x) =
_
_
_
0, x < 0
e
x
, x 0.
F.d. de X
F
X
(x) =
_
_
_
0, x < 0
1 e
x
, x 0.
P[X > E(X) = 500] = 1 F
X
[E(X)]
= 1 F
X
(1/)
= 1
_
1 e
_
= e
1
e constante para qualquer valor (positivo, e claro) do par ametro . Mais,
F
1
Exp()
(1 e
1
) = E(X) = 1/.
(b) Sabendo que decorreram mais de 800 horas desde o registo da ultima falha, calcule
a probabilidade de virmos a aguardar adicionalmente mais de 500 horas ate que
ocorra a pr oxima falha. Compare o valor desta probabilidade com o obtido em (a).
104
P(X > 800 + 500|X > 800) =
P(X > 800 + 500, X > 800)
P(X > 800)
=
P(X > 800 + 500)
P(X > 800)
=
1 F
X
(800 + 500)
1 F
X
(800)
=
1
_
1 e
(800+500)
_
1 (1 e
800
)
= e
500
= e
1
= P(X > 500).
O valor desta probabilidade condicionada coincide com a probabilidade
calculada na alnea anterior, ilustrando assim uma propriedade que se enuncia
j a de seguida.
Proposicao 4.55 Falta de mem oria da distribuicao exponencial
Considere-se que X exponencial(). Ent ao
P(X > t +x|X > t) = P(X > x), t, x IR
+
0
. (4.28)
Equivalentemente,
(X t|X > t) exponencial(), t IR
+
0
. (4.29)
Assim sendo, ao considerar-se que X representa a vida de um vida de um item e que X
tem distribuic ao exponencial(), a vida residual no instante t, (X t|X > t), possuir a
exactamente a mesma distribuicao e o mesmo par ametro. Recorde-se que esta propriedade
e denominada de falta de mem oria.
Nota 4.56 Falta de mem oria da distribuicao exponencial
A distribui cao exponencial e a unica distribuicao contnua que satisfaz a propriedade de
falta de mem oria, como alias acontece com a distribuic ao geometrica entre as distribuic oes
discretas. Por este facto a distribuicao exponencial pode ser considerada o an alogo
contnuo da distribuicao geometrica.
Importa referir que falta de mem oria da distribuic ao exponencial torna-a inadequada
para modelar tempos de vida de equipamento sujeito a envelhecimento ou desgaste.
105
Denicao 4.57 Processo de Poisson
Seja
N
t
o n umero de ocorrencias de um evento no intervalo (0, t],
onde t > 0.
16
Ent ao a colecc ao de v.a. {N
t
, t > 0} diz-se um processo de Poisson de taxa
caso possua as seguintes propriedades:
o n umero de ocorrencias de eventos em intervalos disjuntos sao v.a. independentes;
17
os n umeros de ocorrencias de eventos em intervalos com a mesma amplitude sao
v.a. com a mesma distribuic ao;
18
N
t
Poisson( t), t > 0.
Proposicao 4.58 Rela cao entre as distribuicoes exponencial e de Poisson
Seja
N
t
o n umero de ocorrencias de um evento no intervalo (0, t], t > 0.
X
i
o tempo entre as ocorrencias consecutivas (i 1) e i do evento, i IN.
Caso a colecc ao de v.a. {N
t
, t > 0} seja um processo de Poisson de taxa , e sabido que
N
t
Poisson( t) e pode concluir-se que
X
i
i.i.d.
exponencial(), i IN. (4.30)
Exerccio 4.59 Prove que a v.a. X exponencial() possui outra propriedade

curiosa: tem coeciente de varia cao unit ario para qualquer valor de .
Exemplo 4.60 Rela cao entre as distribuicoes exponencial e de Poisson
Admita que as chegadas de mensagens electr onicas a um computador s ao regidas por um
processo de Poisson caracterizado por intervalos de tempo entre chegadas consecutivas
com distribuic ao exponencial com valor esperado igual a 2 minutos.
Determine a probabilidade de chegarem mais de 10 mensagens em meia-hora.
16
Considera-se, naturalmente, que N0 = 0.
17
Neste caso e habitual dizer-se que o processo possui incrementos independentes, i.e., Nt1
, Nt2
Nt1
,
Nt3
Nt2
, . . ., Ntn
Ntn1
sao v.a. independentes, ao considerar-se 0 < t1 < . . . < tn e n 2.
18
Nesta situa cao e costume armar-se que o processo possui incrementos estacionarios, ou seja, N(t2 +
s) N(t1 +s) N(t2) N(t1), para s > 0 e 0 t1 < t2.
106
V.a.
X = tempo (em minutos) entre chegadas consecutivas de mensagens electr onicas
Distribuicao de X
X exponencial()
Parametro
: E(X) = 2
1
= 2
= 0.5 (mensagens/minuto)
Nova v.a.
N
t
= N
30
= n umero de mensagens chegadas em 30 minutos
Distribuicao de N
30
Uma vez que se admite que as chegadas de mensagens electr onicas sao regidas por
um processo de Poisson, pode invocar-se a Proposicao 4.58 e armar que
N
30
Poisson( t = 0.5 30 = 15).
F.p. de N
30
P(N
30
= y) = e
15 15
y
y!
, y = 0, 1, 2, . . .
P(N
30
> 10) = 1 P(N
30
10)
= 1 F
Poisson(15)
(10)
tabela
= 1 0.1185
= 0.8815.
Exemplo 4.61 Teste B de 10 de Novembro de 2007

Durante a hora de ponta dos dias uteis, o n umero de autocarros que passam por hora em
certo local tem distribuic ao de Poisson.
(a) Calcule o valor esperado dessa distribuic ao, sabendo que a probabilidade de n ao
passar nenhum autocarro nesse local durante 20 minutos e igual a e
15
.
107
V.a.
N
1
= n umero de autocarros que passam em uma hora
N
1/3
= n umero de autocarros que passam em 20 min. (i.e., em 1/3 de hora)
Distribuicoes de N
1
e N
1/3
N
1
Poisson()
N
1/3
Poisson(/3)
F.p. de N
1
e N
1/3
P(N
1
= y)
form
= e

y
y!
, y = 0, 1, 2, . . .
P(N
1/3
= y) = e
/3 (/3)
y
y!
, y = 0, 1, 2, . . .
Parametros
: P(N
1/3
= 0) = e
15
e
/3 (/3)
0
0!
= e
15
/3 = 15
= 45
Valor esperado pedido
E(N
1
)
form
= = 45
(b) Qual e a probabilidade do intervalo de tempo entre a passagem de dois autocarros
por esse local exceder 5 minutos?
Nova v.a.
N
1/12
= n umero de autocarros que passam em 5 min. (i.e., em 1/12 de hora)
Distribuicao de N
1/12
N
1/12
Poisson(/12 = 3.75)
F.p. de N
1/12
P(N
1/12
= y) = e
3.75 3.75
y
y!
, y = 0, 1, 2, . . .
A probabilidade de o tempo entre duas passagens consecutivas de dois
autocarros por esse local exceder 5 minutos e exactamente igual a
P(N
1/12
= 0) = e
3.75
3.75
0
0!
= e
3.75
0.0235.
Ao admitir que as passagens de autocarros sao regidas por um processo de Poisson,
somos capazes de adiantar uma resoluc ao alternativa recorrendo à Proposic ao 4.30
que traduz a rela c ao entre as distribuic oes exponencial e de Poisson.
108
Nova v.a.
X = tempo (em horas) entre duas passagens consecutivas de autocarros
Distribuicao de X
Uma vez que N
1
Poisson() pode concluir-se que
X exponencial( = 45).
F.d.p. de X
f
X
(x) =
_
_
_
0, x < 0
45 e
45x
, x 0.
P(X > 1/12h = 5min) =
_
+
1/12
f
X
(x)dx
=
_
+
1/12
45 e
45x
dx
= e
45x
+
1/12
= e
45/12
0.0235.
109
Captulo 5
Distribui c oes conjuntas de
probabilidade e complementos
Motiva cao 5.1 Pares aleat orios
Ao realizar-se uma experiencia aleat oria e comum estarmos interessados em estudar mais
do que uma v.a., nomeadamente, pares de v.a. ou pares aleat orios.
E tambem frequente estarmos preocupados em saber que rela cao existe entre esse
par de v.a., em particular de que modo o conhecimento de uma v.a. pode inuenciar o
comportamento probabilstico da outra v.a. do par aleat orio.
Nota 5.2 Pares aleat orios
E usual representar um par aleat orio ou v.a. bidimensional por (X, Y ).

Exemplo 5.3 Pares aleat orios
O n umero de sinais emitidos (X) por um aparelho e o n umero desses sinais que
foram recebidos (Y ) por um aparelho receptor par de v.a. discretas.
A classicac ao do sinal transmitido (X) pelo aparelho emissor e a do sinal recebido
(Y ) pelo receptor, quanto ` a sua intensidade (alta, media, baixa) par de
v.a. discretas (qualitativas ordinais).
A resistencia de uma peca (X) e o n umero de manchas ` a sua superfcie (Y ) par
com uma v.a. contnua e uma v.a. discreta.
A distancia (X) de um ponto de impacto ao centro de um alvo e o angulo (Y ) com
o eixo das abcissas par de v.a. contnuas.
110
O n umero de clientes (X) que encontramos ` a chegada a um sistema e o nosso tempo
de permanencia em la de espera (Y ) par com uma v.a. discreta e uma v.a. com
car acter misto.
A denicao de par aleat orio ou v.a. bidimensional e an aloga ` a de v.a. unidimensional:
estamos a lidar mais uma vez com uma func ao com caractersticas especiais que
transforma, neste caso, eventos em pares ordenados (vectores bidimensionais).
Denicao 5.4 Par aleat orio
A funcao (X, Y ) diz-se um par aleat orio se possuir
domnio ,
contradomnio IR
X,Y
contido em IR
2
e tiver a particularidade de vericar uma condic ao de mensurabilidade explicitada j a a
seguir na Nota 5.5. Assim,
(X, Y ) : IR
X,Y
IR
2
, (5.1)
i.e., a imagem de um evento e um vector bidimensional (X, Y )() =
(X(), Y ()) IR
X,Y
IR
n
.
Nota 5.5 Mensurabilidade
Considere-se uma e.a., que possui espaco de resultados associado à algebra A, e
ainda um par aleat orio (X, Y ).
A condicao de mensurabilidade prende-se, no caso bidimensional, com a existencia de
imagem inversa segundo (X, Y ) de qualquer regi ao do tipo (, x] (, y] na
algebra A. Deste modo,
(x, y) IR
2
, (X, Y )
1
((, x] (, y]) A.
De notar que, ao considerar-se (X, Y )() = (X(), Y ()), a imagem inversa a que nos
referimos e dada por
(X, Y )
1
((, x] (, y]) = { : X() x, Y () y},
i.e., trata-se da coleccao de todos os eventos de aos quais a primeira componente do
par aleat orio, X, atribui valores no intervalo (, x] e, simultaneamente, a segunda
componente do par aleat orio, Y , atribui valores no intervalo (, y].
111
5.1 Duas variaveis aleat orias discretas. Distribuicoes
conjuntas, marginais e condicionais.
Independencia.
Denicao 5.6 Par aleat orio discreto
A par aleat orio (X, Y ) diz-se discreto, caso tome valores exclusivamente num conjunto de
valores nito ou innito numeravel, IR
X,Y
= {(x
i
, y
j
)}
i=1,2,...; j=1,2,...
, tal que
P[(X, Y ) IR
X,Y
] =
j
P(X = x
i
, Y = y
j
) = 1 (5.2)
P(X = x
i
, Y = y
j
) > 0, (x
i
, y
j
) IR
X,Y
. (5.3)
Motiva cao 5.7 Funcao de probabilidade conjunta

A caracteriza c ao probabilstica de um par aleat orio (X, Y ) e usualmente feita ` a custa da
respectiva func ao de probabilidade conjunta, tal como a de uma v.a. discreta e feita ` a
custa da fun cao de probabilidade.
Denicao 5.8 Fun cao de probabilidade conjunta
Seja (X, Y ) um par aleat orio discreto com contradomnio IR
X,Y
(naturalmente nito ou
innito numer avel). Ent ao a f.p. conjunta de (X, Y ) e denida por
P(X = x, Y = y) =
_
_
_
P(X = x
i
, Y = y
j
), se (x, y) = (x
i
, y
j
) IR
X,Y
0, c.c.
(5.4)
e
1
satisfaz:
P(X = x, Y = y) > 0, (x, y) IR
X,Y
P(X = x, Y = y) 0, (x, y) IR
2

(x,y)IR
2 P(X = x, Y = y) =

(x,y)IRX,Y
P(X = x, Y = y) = 1
P[(X, Y ) A] =

(x,y)AIRX,Y
P(X = x, Y = y), A IR
2
.
Nota 5.9 F.p. conjunta
A f.p. conjunta de um par aleatorio e raramente representada gracamente. Quando o
contradomnio do par aleatorio (X, Y ) e nito e n ao muito numeroso e.g. com n m
valores e costume organizar a f.p. conjunta numa tabela do tipo
1
Note-se que P(X = x, Y = y) = P({ : X() = x, Y () = y}).
112
Y
X
y1 . . . yj . . . ym
x1 p11 . . . p1j . . . p1m
.
.
.
.
.
.
.
.
. . . .
.
.
.
.
.
.
xi
.
.
. . . . pij . . .
.
.
.
.
.
.
.
.
.
.
.
. . . .
.
.
.
.
.
.
xn pn1 . . . pnj . . . pnm
onde p
ij
= P(X = x
i
, Y = y
j
), i = 1, . . . , n, j = 1, . . . , m, tal como teremos oportunidade
de ver no exemplo que se seguir a.
Exemplo 5.10 F.p. conjunta
Volte a considerar um teste americano com 3 quest oes, cujas respostas s ao dadas de forma
independente. A resposta a cada questao pode estar correcta (C) com probabilidade
P(C) = 0.5, ou incorrecta (C) com probabilidade P(C) = 0.5. Considere o par aleat orio
(X, Y ), onde X e Y representam o n umero de respostas correctas e incorrectas no teste,
respectivamente.
(a) Conrme que o conjunto de valores possveis de (X, Y ) e {(0, 3), (1, 2),
(2, 1), (3, 0)}.
Par aleat orio (X, Y )
X = n umero de respostas correctas neste teste americano
Y = n umero de respostas incorrectas no mesmo
Contradomnio de (X, Y )
O conjunto de valores possveis do par aleat orio (X, Y ) obtem-se identicando
os valores de X e Y associados a cada evento elementar:
Eventos elementares X Y
CCC = C1 C2 C3 0 3
CCC 1 2
CCC 1 2
CCC 1 2
CCC 2 1
CCC 2 1
CCC 2 1
CCC 3 0
onde C
i
= resposta correcta à quest ao i, i = 1, 2, 3.
Assim, conrma-se que IR
X,Y
= {(0, 3), (1, 2), (2, 1), (3, 0)}.
113
(b) Dena a f.p. conjunta do par aleat orio (X, Y ).
F.p. conjunta de (X, Y )
Notando que a v.a. Y e uma func ao am de X (Y = 3X) depressa se conclui
que
P(X = 0, Y = 3) = P(CCC)
= P(X = 0)
=
1
8
P(X = 1, Y = 2) = P(CCC) +P(CCC) +P(CCC)
= P(X = 1)
=
3
8
P(X = 2, Y = 1) = P(CCC) +P(CCC) +P(CCC)
= P(X = 2)
=
3
8
P(X = 3, Y = 0) = P(CCC)
= P(X = 3)
=
1
8
,
ou de forma resumida
P(X = x, Y = y) =
_
_
1/8, (x, y) = (0, 3), (3, 0)
3/8, (x, y) = (1, 2), (2, 1)
0, outros pares de valores de (x, y),
ou ainda sob a forma de uma tabela
Y
X
0 1 2 3
0 0 0 0
1
8
1 0 0
3
8
0
2 0
3
8
0 0
3
1
8
0 0 0
114
Denicao 5.11 Funcao de distribuicao conjunta (caso discreto)
A f.d. conjunta do par aleatorio discreto (X, Y ) pode ser obtida ` a custa da f.p. conjunta:
2
F
X,Y
(x, y) = P(X x, Y y)
=
xix
yjy
P(X = x
i
, Y = y
j
), (x, y) IR
2
. (5.5)
Depois de um exemplo intencionalmente trivial considere-se um par aleat orio um pouco

mais rebuscado para ilustrar o calculo da f.d. conjunta.
Exemplo 5.12 F.d. conjunta (caso discreto)
Na transmissao de informa c ao digital por certo equipamento a probabilidade de um bit
possuir distor c ao alta, moderada e baixa e de 0.01, 0.04 e 0.95, respectivamente. Suponha
que s ao transmitidos 3 bits de modo independente e que X e Y representam o n umero
de bits com distor c ao alta e moderada, respectivamente.
3
(a) Complete, justicando, as entradas assinaladas com a, b e c, na seguinte tabela da
f.p. conjunta do par aleat orio (X, Y ).
Y
X
0 1 2 3
0 a 0.108300 0.004560 0.000064
1 0.027075 0.002280 0.000048 c
2 0.000285 b 0 0
3 0.000001 0 0 0
X = n umero de bits com distor c ao alta, em 3 bits emitidos
Y = n umero de bits com distor c ao moderada, em 3 bits emitidos
Obten cao das constantes a, b, c
Para obter as constantes a e b e necessario ter em conta que por um lado
X binomial(3, 0.01) i.e.,
P(X = x) =
_
3
x
_
0.01
x
(1 0.01)
3x
, x = 0, 1, 2, 3
e que por outro P(X = x) =

3
y=0
P(X = x, Y = y), x = 0, 1, 2, 3. Deste
modo:
2
As propriedades desta fun cao serao descritas na seccao seguinte.
3
Adaptado do Exame de 13 de Julho de 2002.
115
a = P(X = 0, Y = 0)
= P(X = 0)
3
y=1
P(X = 0, Y = y)
= (1 0.01)
3
(0.108300 + 0.004560 + 0.000064)
= 0.857375
b = P(X = 2, Y = 1)
= P(X = 2)
_
_
1
y=0
P(X = 2, Y = y) +P(X = 2, Y = 3)
_
_
=
3!
2!(3 2)!
0.01
2
(1 0.01)
1
(0.000285 + 0 + 0)
= 0.000012
c = P(X = 1, Y = 3)
= P()
= 0.
Nota
Comece-se por considerar que a v.a. Z = 3 X Y representa o
n umero bits com distor cao baixa, em 3 bits emitidos e rera-se que
Z binomial(3, 0.95). Entao importa notar que, embora os eventos {X =
0, Y = 0} e {Z = 3} sejam equivalentes, os eventos {X = 2, Y = 1} e {Z = 0}
n ao o sao, pelo que
a = P(X = 0, Y = 0)
= P(3 bits com distor c ao baixa)
= P(Z = 3)
= 0.95
3
= 0.857375
e, no entanto,
b = P(X = 2, Y = 1)
= P(0 bits com distor c ao baixa)
= P(Z = 0)
= (1 0.95)
3
= 0.000125.
116
Ali as, h a quatro situa c oes em que ocorre {Z = 0}, sao elas
{X = 0, Y = 3}, {X = 1, Y = 2}, {X = 2, Y = 1} e {X = 3, Y = 0}.
P(Z = 0) = P(0 bits com distor c ao baixa)
= (1 0.95)
3
= 0.000125
= P(X = 0, Y = 3) +P(X = 1, Y = 2)
+P(X = 2, Y = 1) +P(X = 3, Y = 0)
= 0.000064 + 0.000048 + 0.000012 + 0.000001
= 0.000125.
(b) Determine a probabilidade de registar-se a transmissao de nao mais de dois bits
com distor c ao alta e quando muito um bit com distor cao moderada.
P(X 2, Y 1) = F
X,Y
(2, 1)
=
2
x=0
1
y=0
P(X = x, Y = y)
= 0.857375 + 0.108300 + 0.027075 + 0.002280
+0.000285 + 0.000012
= 0.995327.
Exemplo 5.13 F.p. conjunta (e algo mais)
Um painel met alico e classicado de acordo com:
X = n umero de defeitos que possui (0,1,2,3 defeitos)
Y = n umero da f abrica que o produz (Fab.1 e Fab.2).
Estudos levados a cabo levam a crer que a f.p. conjunta de (X, Y ) e dada pela seguinte
tabela:
Y
X
1 2
0
1
8
1
16
1
1
16
1
16
2
3
16
1
8
3
1
8
1
4
Calcule a probabilidade de um painel met atico seleccionado ao acaso:
117
(a) possuir 2 defeitos e ter sido produzido pela Fab.1;
X = n umero de defeitos que o painel possui
Y = n umero da f abrica que o produz
P(X = 2, Y = 1) =
3
16
.
(b) possuir somente 2 defeitos;
P(X = 2) = P(X = 2, Y = 1) +P(X = 2, Y = 2)
=
3
16
+
1
8
=
5
16
.
(c) ser produzido pela Fab.1.
P(Y = 1) =
3
x=0
P(X = x, Y = 1)
=
1
8
+
1
16
+
3
16
+
1
8
=
1
2
.
As alneas (b) e (c) do Exemplo 5.13 sugerem a denic ao das f.p. de X e de Y , que se
dir ao f.p. marginais.
Denicao 5.14 F.p. marginais de X e de Y
A f.p. marginal de X dene-se à custa da f.p. conjunta do par aleat orio (X, Y ):
4
P(X = x) =
y
P(X = x, Y = y). (5.6)
A f.p. marginal de Y obtem-se de modo analogo:
5
P(Y = y) =
x
P(X = x, Y = y). (5.7)
4
Caso a f.p. conjunta esteja organizada numa tabela como as duas descritas acima, a f.p. marginal de
X obtem-se somando linha a linha.
5
Do mesmo modo a f.p. marginal de Y obtem-se somando coluna a coluna ao lidar-se com tabelas
como as duas anteriores.
118
Exerccio 5.15 F.p. marginais
Retome o Exemplo 5.13 e obtenha as f.p. marginais de X e de Y .
Nota 5.16

E recorrendo ` as f.p. marginais da v.a. X e a da v.a. Y que se obtem
F
X
(x), E(X), V (X), etc.
F
Y
(y), E(Y ), V (Y ), etc.
Denicao 5.17 F.d. marginais de X e de Y (caso discreto)
Pode obter-se as f.d. marginais de X e de Y quer ` a custa das f.p. destas
v.a. unidimensionais, quer recorrendo ` a f.p. conjunta:
F
X
(x) = P(X x)
=
xix
P(X = x
i
)
=
xix
y
P(X = x
i
, Y = y), x IR (5.8)
F
Y
(y) = P(Y y)
=
yjy
P(Y = y
j
)
=
yjy
x
P(X = x, Y = y
j
), y IR. (5.9)
Motiva cao 5.18 F.p. condicionais
E importante averiguar de que modo o registo de uma observa cao de uma das v.a. do par
aleat orio podera vir a inuenciar o comportamento probabilstico da outra v.a. Para o
efeito sera necessario denir f.p. condicionais.
Denicao 5.19 F.p. condicionais
F.p. de X condicional a Y = y
P(X = x|Y = y) =
P(X = x, Y = y)
P(Y = y)
, se P(Y = y) > 0. (5.10)
F.p. de Y condicional a X = x
P(Y = y|X = x) =
P(X = x, Y = y)
P(X = x)
, se P(X = x) > 0. (5.11)
119
Nota 5.20 V.a. condicionais
Ao efectuar semelhantes condicionamentos passamos a lidar com duas v.a. unidimensionais
X|Y = y e Y |X = x , pelo que faz sentido calcular f.d., valores esperados, variancias,
etc., em todo o caso ditas/os condicionais.
Denicao 5.21 F.d. condicionais (caso discreto)
F.d. de X condicional a Y = y
6
F
X|Y =y
(x) = P(X x|Y = y)
=
xix
P(X = x
i
|Y = y)
=
xix
P(X = x
i
, Y = y)
P(Y = y)
, x IR (5.12)
F.d. de Y condicional a X = x
7
F
Y |X=x
(y) = P(Y y|X = x)
=
yjy
P(Y = y
j
|X = x)
=
yjy
P(X = x, Y = y
j
)
P(X = x)
, y IR. (5.13)
Exemplo 5.22 F.p. e f.d. condicionais (caso discreto)

Responda às seguintes questoes que dizem respeito ao Exemplo 5.13.
(a) Determine a probabilidade de um painel met alico possuir um defeito sabendo que
foi produzido pela Fab.2.
X = n umero de defeitos que o painel possui
Y = n umero da f abrica que o produz
Convem recordar que esta func ao pode ser condensada na seguinte tabela:
6
E necessario que P(Y = y) > 0 para denir esta fun cao.
7
Analogamente, esta f.d. so faz sentido se P(X = x) > 0.
120
Y
X
1 2
0
1
8
1
16
1
1
16
1
16
2
3
16
1
8
3
1
8
1
4
P(X = 1|Y = 2) =
P(X = 1, Y = 2)
P(Y = 2)
=
1/16
1/16 + 1/16 + 1/8 + 1/4
=
1/16
1/2
=
1
8
.
(b) Calcule a probabilidade de um painel met alico possuir quanto muito um defeito,
quando se sabe de antemao que foi produzido pela Fab.2.
P(X 1|Y = 2) = F
X|Y =2
(1)
=
1
x=0
P(X = x|Y = 2) =
1
x=0
P(X = x, Y = 2)
P(Y = 2)
=
1/16
1/2
+
1/16
1/2
=
1
4
.
Denicao 5.23 Valores esperados condicionais (caso discreto)

Valor esperado de X condicional a Y = y
E(X|Y = y) =
x
x P(X = x|Y = y) (5.14)
Valor esperado de Y condicional a X = x
E(Y |X = x) =
y
y P(Y = y|X = x). (5.15)
121
Denicao 5.24 Variancias condicionais (caso discreto)
Variancia de X condicional a Y = y
V (X|Y = y) = E(X
2
|Y = y) E
2
(X|Y = y)
=
x
x
2
P(X = x|Y = y)
_
x
x P(X = x|Y = y)
_
2
(5.16)
Variancia de Y condicional a X = x
V (Y |X = x) = E(Y
2
|X = x) E
2
(Y |X = x)
=
y
y
2
P(Y = y|X = x)
_
y
y P(Y = y|X = x)
_
2
. (5.17)
Exemplo 5.25 Valor esperado condicional (e nao so)

Uma rma envia dois tipos de faxes. O primeiro tipo de fax requer 40 segundos para a
transmiss ao de cada pagina ao passo que o segundo tipo requer 60 segundos para essa
transmiss ao.
Considere que a v.a. X representa o n umero de p aginas de cada fax e Y a dura c ao
da transmiss ao de todo o fax. Apos um estudo detalhado, baseado em centenas de
transmiss oes de fax, a rma e da opini ao que a func ao de probabilidade conjunta do
par aleat orio (X, Y ) e igual a:
Y
X
40 60 80 120 180
1 0.15 0.10 0 0 0
2 0 0 0.30 0.35 0
3 0 0 0 0 0.10
Compare o valor esperado da dura cao da transmissao de um fax e a dura cao esperada
da transmissao de um fax sabendo que tem 2 paginas. O que conclui?
8
X = n umero de p aginas de cada fax
Y = dura cao (em segundos) da transmiss ao do fax
8
Adaptado do Exame de 17 de Janeiro de 2004.
122
F.p. marginal de Y
Obtem-se somando as entradas da tabela da f.p. conjunta de (X, Y ), coluna a coluna:
P(Y = y) =
3
x=1
P(X = x, Y = y)
=
_
_
0.15, y = 40
0.10, y = 60
0.30, y = 80
0.35, y = 120
0.10, y = 180
0, outros valores de y
Valor esperado de Y
E(Y ) =
y
y P(Y = y)
= 40 0.15 + 60 0.10 + 80 0.30 + 120 0.35 + 160 0.10
= 96 segundos
Nova v.a.
Y |X = 2 = dura c ao da transmiss ao do fax sabendo que tem 2 p aginas
F.p. de Y condicional a {X = 2}
Ao notar que P(X = 2) =

y
P(X = 2, Y = y) = 0 + 0 + 0.30 + 0.35 + 0 = 0.65 e
que os valores possveis para a dura c ao da transmiss ao de fax com 2 paginas s ao 80
e 120 segundos, segue-se:
P(Y = y|X = 2) =
P(X = 2, Y = y)
P(X = 2)
=
_
_
0.30
0.65
=
6
13
, y = 80
0.35
0.65
=
7
13
, y = 120
Valor esperado de Y condicional a {X = 2}
E(Y |X = 2) =
y
y P(Y = y|X = 2)
= 80
6
13
+ 120
7
13
=
1320
13
101.54 segundos
123
Conclusao Como E(Y ) = E(Y |X = 2) pode adiantar-se que o conhecimento
do n umero de paginas do fax altera a dura c ao esperada da transmissao do mesmo.
Logo as v.a. X e Y inuenciam-se uma ` a outra; ou por outras palavras: X e Y n ao
s ao v.a. independentes.
Exerccio 5.26 Retomemos os dados do Exemplo 5.13.
(a) Prove que o n umero esperado de defeitos de um painel metalico que se sabe ter sido
produzido pela Fab.2, E(X|Y = 2), e igual a
17
8
.
(b) Compare o valor esperado condicional obtido em (a) com E(X) (por sinal igual a
15
8
). Comente.
Motiva cao 5.27 (In)Dependencia
De um modo geral as v.a. que constituem um par aleat orio inuenciam-se mutuamente
como no exemplo anterior, ou seja, sao dependentes. Outras h a em que tal n ao acontece.
Com efeito o conceito de independencia entre (dois) eventos pode ser estendido a (pares
de) v.a.
Denicao 5.28 Independencia (caso discreto)
As v.a. discretas X e Y dizem-se independentes escrevendo-se neste caso X Y se
P(X = x, Y = y) = P(X = x) P(Y = y), (x, y) IR
2
, (5.18)
i.e., caso seja possvel escrever a f.p. conjunta do par aleat orio discreto (X, Y ) ` a custa do
produto das f.p. marginais de X e de Y .
Nota 5.29 Independencia (caso discreto)
A Equa cao (5.18), que dene independencia entre as v.a. discretas X e Y , e equivalente a
F
X,Y
(x, y) = F
X
(x) F
Y
(y), (x, y) IR
2
. (5.19)
Ou seja, se X Y e tambem possvel escrever a f.d. conjunta do par aleat orio discreto
(X, Y ) ` a custa do produto das f.d. marginais de X e de Y . Para alem disso, caso X Y ,
segue-se:
P(X = x|Y = y) = P(X = x), (x, y) IR
2
E(X|Y = y) = E(X), y IR
V (X|Y = y) = V (X), y IR, etc.,
como tal o conhecimento de Y n ao vem inuenciar o comportamento probabilstico de X.
Analogamente, P(Y = y|X = x) = P(Y = y), (x, y) IR
2
, etc., caso X Y .
124
Exemplo/Exerccio 5.30 Independencia (caso discreto)
O n umero de portateis (X) e PCs (Y ) vendidos diariamente numa loja de material
inform atico tem func ao de probabilidade conjunta dada parcialmente pela tabela abaixo:
9
Y
X
0 1 2
0 0.1 0.1 0.3
1 0.2 0.1 0.1
2 0 0.1 a
(a) Complete a tabela e prove que X e Y s ao v.a. dependentes.
X = n umero de port ateis vendidos diariamente
Y = n umero de PCs vendidos diariamente
Obten cao de a
a :
2
x=0
2
y=0
P(X = x, Y = y) = 1
0.1 + 0.1 + 0.3 + 0.2 + 0.1 + 0.1 + 0 + 0.1 +a = 1
a = 0
Dependencia entre X e Y
Se por um lado
P(X = 0, Y = 0) = 0.1,
por outro
P(X = 0) P(Y = 0) =
2
y=0
P(X = 0, Y = y)
x=0
P(X = x, Y = 0)
= (0.1 + 0.1 + 0.3) (0.1 + 0.2 + 0)
= 0.15.
Deste modo conclui-se que
P(X = 0, Y = 0) = P(X = 0) P(Y = 0),
pelo que X e Y s ao v.a. dependentes.
9
Adaptado do Teste B de 22 de Abril de 2006.
125
(b) Calcule V (X|Y 1).
Nova v.a.
X|Y 1 = n umero de port ateis vendidos em certo dia, sabendo que ocorreu
venda de PCs
F.p. de X condicional a {Y 1}
Uma vez que
P(Y 1) = P(Y = 1) +P(Y = 2)
=
2
x=0
P(X = x, Y = 1) +
2
x=0
P(X = x, Y = 2)
= (0.1 + 0.1 + 0.1) + (0.3 + 0.1 + 0)
= 0.7,
tem-se
P(X = x|Y 1) =
P(X = x, Y 1)
P(Y 1)
=
P(X = x, Y = 1) +P(X = x, Y = 2)
P(Y 1)
=
_
_
0.1+0.3
0.7
=
4
7
, x = 0
0.1+0.1
0.7
=
2
7
, x = 1
0.1+0
0.7
=
1
7
, x = 2
0, restantes valores de x
Valor esperado de X|Y 1
E(X|Y 1) =
2
x=0
x P(X = x|Y 1)
= 0
4
7
+ 1
2
7
+ 2
1
7
=
4
7
2o. momento de X|Y 1
E(X
2
|Y 1) =
2
x=0
x
2
P(X = x|Y 1)
= 0
2
4
7
+ 1
2
2
7
+ 2
2
1
7
=
6
7
126
Variancia de X|Y 1
V (X|Y 1) = E(X
2
|Y 1) E
2
(X|Y 1)
=
6
7

_
4
7
_
2
=
26
49
.
(c) Obtenha o valor esperado do n umero de port ateis vendidos diariamente, tirando
partido do facto de
E(X) =
xIRX
x P(X = x)
=
xIRX
x
_
_

yIRY
P(X = x, Y = y)
_
_
=
xIRX
x
_
_

yIRY
P(X = x|Y = y) P(Y = y)
_
_
=
yIRY
_
_

xIRX
x P(X = x|Y = y)
_
_
P(Y = y)
=
yIRY
E(X|Y = y) P(Y = y)
= E[E(X|Y )].
Note que a v.a. E(X|Y ) toma os valores E(X|Y = y) com probabilidade P(Y = y),
para y IR
Y
.
127
5.2 Duas variaveis aleatorias contnuas.
Distribuic oes conjuntas, marginais e
condicionais. Independencia.
Motiva cao 5.31 F.d.p. conjunta
A caracteriza cao probabilstica de uma v.a. unidimensional contnua faz-se recorrendo
` a f.d.p. N ao surpreende pois que ao lidar com um par aleat orio (X, Y ) contnuo seja
necessario denir f.d.p. conjunta.
Denicao 5.32 Par aleat orio contnuo e f.d.p. conjunta
A par aleat orio (X, Y ) diz-se contnuo, se tomar valores num conjunto de valores innito
n ao numer avel, IR
X,Y
IR
2
, e existir uma func ao denominada de f.d.p. conjunta,
f
X,Y
(x, y), satisfazendo as propriedades seguintes:
f
X,Y
(x, y) 0, (x, y) IR
2
_
+
_
+
f
X,Y
(x, y)dydx = 1
P[(X, Y ) A] =
_ _
A
f
X,Y
(x, y)dydx, A IR
2
.
Exemplo 5.33 F.d.p. conjunta
O par aleat orio (X, Y ) representa os tempos de vida, em milhares de horas, de duas
componentes principais (A e B) de um sistema de controlo e possui f.d.p. conjunta dada
por
f
X,Y
(x, y) =
_
_
_
1, 0 < x < 1, 0 < y < 1
0, c.c.
(5.20)
Calcule a probabilidade de X e de Y excederem 0.50 e 0.75, respectivamente.
Par aleat orio
X = tempo de vida da componente A (em 10
3
h)
Y = tempo de vida da componente B (em 10
3
h)
F.d.p. de (X, Y )
f
X,Y
(x, y) =
_
_
_
1, 0 < x < 1, 0 < y < 1
0, c.c.
128
P(X > 0.5, Y > 0.75) =
_
+
0.5
_
+
0.75
f
X,Y
(x, y)dy dx
=
_
1
0.5
_
1
0.75
dy dx
=
_
1
0.5
y|
1
0.75
dx
=
_
1
0.5
0.25 dx
= 0.125
Importa notar que
P(X > 0.5, Y > 0.75) = 1 P(X 0.5, Y 0.75).
Denicao 5.34 F.d. conjunta (caso contnuo)

A f.d. conjunta do par aleat orio contnuo (X, Y ) dene-se ` a custa da sua f.d.p. conjunta:
F
X,Y
(x, y) = P(X x, Y y)
=
_
x
_
y
f
X,Y
(u, v)dvdu, (x, y) IR
2
, (5.21)
que corresponde, obviamente, ao volume sob a superfcie da f.d.p. conjunta na regi ao
(, x] (, y].
Proposicao 5.35 Propriedades da f.d. conjunta de par aleatorio (discreto ou
contnuo)
A f.d. conjunta de um par aleat orio (X, Y ) satisfaz as propriedades quer no caso discreto,
quer no caso contnuo.

E uma:
1. funcao contnua à direita (no caso discreto) e contnua ` a direita e ` a esquerda (no
caso contnuo)
2. funcao mon otona n ao decrescente em qualquer das vari aveis x e y.
Para alem disso verica:
3. 0 F
X,Y
(x, y) 1
4. F
X,Y
(, ) = 0
F
X,Y
(+, +) = 1
129
5. F
X,Y
(x, +) = F
X
(x), x IR
F
X,Y
(+, y) = F
Y
(y), y IR.
Por seu lado, ao considerar-se a regi ao
A = {(x, y) IR
2
: a < x b, c < y d}
(onde a < b e c < d), tem-se:
6. P[(X, Y ) A] = F
X,Y
(b, d) F
X,Y
(b, c) F
X,Y
(a, d) +F
X,Y
(a, c).
Exerccio 5.36 Demonstre a propriedade 6. da Proposic ao 5.35 recorrendo a gr acos
e à avalia cao sucessiva da f.d. conjunta.
Exemplo/Exerccio 5.37 F.d. conjunta (caso contnuo)
Sejam X e Y v.a. que representam, respectivamente, a largura (em dm) e o comprimento
(em dm) de uma peca rectangular. Admita que a f.d.p. conjunta de (X, Y ) e dada por
f
X,Y
(x, y) =
_
_
_
2, 0 < x < y < 1
0, c.c.
(5.22)
(a) Represente gracamente o contradomnio e a f.d.p. conjunta do par aleat orio.
Par aleat orio
X = largura da peca rectangular (em dm)
Y = comprimento da peca rectangular (em dm)
Representa cao graca do contradomnio de (X, Y )
Graco da f.d.p. de (X, Y )
130
(b) Obtenha a probabilidade de a largura e o comprimento da peca n ao excederem 5cm
e 7.5cm, respectivamente.
P(X 0.5, Y 0.75) = F
X,Y
(0.5, 0.75)
=
_
0.5
_
0.75
f
X,Y
(u, v)dv du
=
_
0.5
0
_
0.75
u
2 dv du
=
_
0.5
0
2v|
0.75
u
du
= 2
_
0.5
0
(0.75 u) du
= 2
_
0.75u
u
2
2
_
0.5
0
= 0.5.
(c) Verique que a f.d. conjunta deste par aleat orio e dada por
F
X,Y
(x, y) =
_
_
0, x < 0 ou y < 0
2x
_
y
x
2
_
, 0 < x < y < 1
2x
_
1
x
2
_
, 0 < x < 1, y > 1
y
2
, 0 < y < x < 1 ou 0 < y < 1 < x
1, x > 1, y > 1.
Como seria de esperar a apresenta cao que se segue muito se assemelha ` a da sec cao
anterior. Ha uma diferenca obvia: ao inves de se somar, integrar-se-a, anal estamos a
lidar com pares aleat orios contnuos.
Denicao 5.38 F.d.p. marginais de X e de Y
As f.d.p. marginais de X e de Y obtem-se à custa da f.d.p. conjunta do par aleat orio
contnuo (X, Y ):
f
X
(x) =
_
+
f
X,Y
(x, y)dy (5.23)
f
Y
(y) =
_
+
f
X,Y
(x, y)dx. (5.24)
131
Denicao 5.39 F.d. marginais de X e de Y (caso contnuo)
As f.d. marginais de X e de Y calculam-se quer à custa das f.d.p. marginais destas
v.a. unidimensionais, quer por recurso à f.d.p. conjunta ou ` a f.d. conjunta:
F
X
(x) = P(X x)
=
_
x
f
X
(u)du
=
_
x
_
+
f
X,Y
(u, y)dydu = F
X,Y
(x, +), x IR (5.25)
F
Y
(y) = P(Y y)
=
_
y
f
Y
(v)dv
=
_
y
_
+
f
X,Y
(x, y)dxdu = F
X,Y
(+, y), y IR. (5.26)
Exemplo/Exerccio 5.40 F.d.p. marginais de X e de Y

Retome o Exemplo/Exerccio 5.37.
(a) Verique que
f
X
(x) =
_
_
_
2(1 x), 0 < x < 1
0, c.c.
(5.27)
f
Y
(y) =
_
_
_
2y, 0 < y < 1
0, c.c.
(5.28)
Par aleat orio
F.d.p. conjunta de (X, Y )
f
X,Y
(x, y) =
_
_
_
2, 0 < x < y < 1
0, c.c.,
F.d.p. marginal de X
f
X
(x) =
_
+
f
X,Y
(x, y)dy
=
_
_
_
_
1
x
2 dy = 2(1 x), 0 < x < 1
0, c.c.
132
F.d.p. marginal de Y
f
Y
(y) =
_
+
f
X,Y
(x, y)dx
=
_
_
_
_
y
0
2 dx = 2y, 0 < y < 1
0, c.c.
(b) Certique-se que a probabilidade da largura da pe ca exceder 8cm e igual a 0.04.
Denicao 5.41 F.d.p., f.d., valores esperados e variancias condicionais (caso
contnuo)
F.d.p. de X condicional a Y = y
f
X|Y =y
(x) =
f
X,Y
(x, y)
f
Y
(y)
, se f
Y
(y) > 0 (5.29)
F.d. de X condicional a Y = y
F
X|Y =y
(x) = P(X x|Y = y)
=
_
x
f
X|Y =y
(u)du, x IR (5.30)
Valor esperado de X condicional a Y = y
E(X|Y = y) =
_
+
x f
X|Y =y
(x)dx (5.31)
Variancia de X condicional a Y = y
V (X|Y = y) = E(X
2
|Y = y) E
2
(X|Y = y)
=
_
+
x
2
f
X|Y =y
(x)dx
__
+
x f
X|Y =y
(x)dx
_
2
. (5.32)
Estas funcoes e parametros denem-se do mesmo modo para Y condicional a X = x.
Exemplo 5.42 Valores esperados condicionais (caso contnuo)
Responda às seguintes questoes referentes ao Exemplo/Exerccio 5.37.
(a) Vericou-se que o comprimento da peca e igual a 7.5cm. Obtenha a probabilidade
da largura exceder 5cm.
Par aleat orio
133
f
X,Y
(x, y) =
_
_
_
2, 0 < x < y < 1
0, c.c.,
f
Y
(y) =
_
_
_
2y, 0 < y < 1
0, c.c.
Nova v.a.
X|Y = 0.75
F.d.p. de X condicional a {Y = 0.75}
f
X|Y =0.75
(x) =
f
X,Y
(x, 0.75)
f
Y
(0.75)
=
_
_
_
2
2y
=
1
0.75
, 0 < x < y = 0.75
0, c.c.
P(X > 0.5|Y = 0.75) = 1 P(X 0.5|Y = 0.75)
= 1 F
X|Y =0.75
(0.5)
= 1
_
0.5
f
X|Y =0.75
(u) du
= 1
_
0.5
0
1
0.75
du
=
1
3
.
(b) Calcule a largura esperada sabendo que o registo do comprimento foi de 8cm.
Compare o valor obtido com a largura esperada e comente.
Nova v.a.
X|Y = 0.8
F.d.p. de X condicional a {Y = 0.8}
f
X|Y =0.8
(x) =
_
_
_
1
0.8
, 0 < x < y = 0.8
0, c.c.
134
Valor esperado de X condicional a {Y = 0.8}
E(X|Y = 0.8) =
_
+
x f
X|Y =0.8
(x) dx
=
_
0.8
0
x
1
0.8
dx
=
x
2
0.8 2
0.8
0
= 0.4
Valor esperado de X
E(X) =
_
+
x f
X
(x) dx
=
_
1
0
x 2(1 x) dx
= 2
_
x
2
2

x
3
3
_
1
0
=
1
3
= E(X|Y = 0.8)
Comentario O conhecimento do comprimento do comprimento da peca
inuencia claramente o valor esperado da respectiva largura. Pode concluir-se
que X e Y s ao v.a. dependentes.
Denicao 5.43 Independencia (caso contnuo)
As v.a. contnuas X e Y dizem-se independentes, caso
f
X,Y
(x, y) = f
X
(x) f
Y
(y), (x, y) IR
2
, (5.33)
i.e., se formos capazes de escrever a f.d.p. conjunta do par aleat orio contnuo (X, Y ) como o
produto das f.d.p. marginais de X e de Y . Equivalentemente, X Y se pudermos factorizar
a f.d. conjunta de (X, Y ) no produto das f.d. marginais de X e de Y :
F
X,Y
(x, y) = F
X
(x) F
Y
(y), (x, y) IR
2
. (5.34)
135
Exemplo/Exerccio 5.44 (In)dependencia (caso contnuo)
(a) Prove que as v.a. comprimento e a largura denidas no Exemplo/Exerccio 5.37 s ao
dependentes recorrendo para o efeito à equa c ao (5.33).
Averigua cao da (in)dependencia entre X e Y
Se por um lado
f
X,Y
(x, y) =
_
_
_
2, 0 < x < y < 1
0, c.c.,
por outro lado
f
X
(x) f
Y
(y) =
_
_
_
2(1 x) 2y, 0 < x < 1, 0 < y < 1
0, c.c.
Logo
f
X,Y
(x, y) = f
X
(x) f
Y
(y)),
i.e., X e Y s ao v.a. dependentes.
(b) Reescreva a Nota 5.29
10
para o caso contnuo.
10
Nesta nota podem encontrar-se algumas consequencias da independencia entre as v.a. X e Y .
136
5.3 Covariancia e correla cao. Propriedades.
Motiva cao 5.45 Covariancia e correla cao
E crucial obter medidas que avaliem a associac ao entre duas v.a. Esta avalia c ao pode
efectuar-se quer em termos
absolutos, calculando a covari ancia entre X e Y , quer em termos
relativos, determinando a correla cao entre X e Y .
Denicao 5.46 Covariancia
Representa-se usualmente por cov(X, Y )
11
e e denida por
cov(X, Y ) = E{[X E(X)] [Y E(Y )]}
= E(XY ) E(X)E(Y ), (5.35)
que no caso discreto se escreve
cov(X, Y ) =
y
x y P(X = x, Y = y)
x
x P(X = x)
y
y P(Y = y) (5.36)
e no caso contnuo
cov(X, Y ) =
_
+
_
+
x y f
X,Y
(x, y) dydx
_
+
x f
X
(x) dx
_
+
y f
Y
(y) dy. (5.37)
Proposicao 5.47 Propriedades da covariancia

Se X e Y forem v.a. independentes entao a covari ancia entre X e Y e nula. No entanto,
a implicac ao no sentido inverso nao e necessariamente verdadeira. Para alem disso, se a
covariancia entre X e Y for n ao nula pode concluir-se imediatamente que X e Y s ao v.a.
dependentes. Estes resultados s ao algumas das propriedades da covari ancia enunciadas
j a de seguida:
1. X Y cov(X, Y ) = 0
2. cov(X, Y ) = 0 X Y
11
Ou por XY .
137
3. cov(X, Y ) = 0 X Y
4. cov(X, Y ) = cov(Y, X)
5. cov(X, X) = V (X)
6. cov(aX +b, Y ) = a cov(X, Y )
7. cov(X +Z, Y ) = cov(X, Y ) +cov(Z, Y )
8. cov
_
n
i=1
X
i
,
n
j=1
Y
j
_
=

n
i=1
n
j=1
cov(X
i
, Y
j
)
9. cov
_
n
i=1
X
i
,
n
j=1
X
j
_
=

n
i=1
V (X
i
) + 2
n
i=1
n
j=i+1
cov(X
i
, X
j
).
Exerccio 5.48 Obtenha a covari ancia entre as v.a. que constituem os pares aleat orios
denidos nos Exerccios 5.13 e 5.37.
Motiva cao 5.49 Correla cao
A covari ancia entre X e Y e uma medida absoluta de associac ao entre estas duas v.a.,
como tal com algumas desvantagens:
n ao e adimensional; e
o seu valor absoluto deve ser interpretado com alguma cautela j a que a covari ancia
pode ser alterada de modo arbitr ario ao efectuar-se, por exemplo, uma mudan ca de
escala como se p ode ver na propriedade 6 da Proposic ao 5.47.
H a pois a necessidade de quanticar em termos relativos
12
a associac ao entre X e Y ` a
custa de uma medida adimensional e passvel de interpreta c ao.
Denicao 5.50 Correla cao
Ser a representada por corr(X, Y )
13
e e igual a
corr(X, Y ) =
cov(X, Y )
_
V (X) V (Y )
. (5.38)
Caso corr(X, Y ) = 0 (resp. corr(X, Y ) = 0) as v.a. dizem-se correlacionadas (resp. n ao
correlacionadas).
12
Por exemplo, pondo de parte a dispersao de X e Y .
13
Ou por X,Y =
XY
XY
138
Proposicao 5.51 Propriedades da correla cao
Dada a forma como a correla c ao foi denida ` a custa da covari ancia n ao surpreende que
aquela medida de associa cao relativa herde algumas propriedades da covari ancia ja
enunciadas:
1. X Y corr(X, Y ) = 0
2. corr(X, Y ) = 0 X Y
3. corr(X, Y ) = 0 X Y
4. corr(X, Y ) = corr(Y, X).
Importa ainda assinalar que:
5. corr(X, X) = 1
6. corr(aX +b, Y ) = corr(X, Y )
7. 1 corr(X, Y ) 1, para qualquer par de v.a.
8. corr(X, Y ) = 1 Y = aX +b, a < 0
9. corr(X, Y ) = 1 Y = aX +b, a > 0.
Nota 5.52 Interpreta cao (do sinal) da correla cao
As propriedades 6 e 7 da Proposic ao 5.51 sugerem que armemos que
a correla c ao quantica a associac ao linear entre X e Y .
Assim, se o valor absoluto de corr(X, Y ) estiver pr oximo de 1 pode dizer-se que a
associac ao entre X e Y e praticamente linear.
Por seu lado, o sinal da correlacao entre X e Y deve ser interpretado do seguinte
modo:
caso corr(X, Y ) > 0 (resp. corr(X, Y ) < 0), pode armar-se que
se X cresce ent ao Y tem tendencia a crescer (resp. decrescer).
S ao de evitar, no entanto, interpreta c oes abusivas desta medida relativa de associac ao
pois a existencia de correla cao entre duas v.a. n ao implica necessariamente uma rela c ao
de causa e efeito entre as mesmas. Basta pensar no n umero de ninhos de cegonhas e o
n umero de nascimentos em cidades escandinavas, ou o n umero de refrigerantes vendidos
e o n umeros de internamentos por desidrata c ao, etc.
139
Exemplo 5.53 Correla cao (caso discreto)
Retome o Exemplo 5.30 e determine o coeciente de correla cao entre X e Y . Comente.
X = n umero de port ateis vendidos diariamente
Y = n umero de PCs vendidos diariamente
Uma vez que se pretende calcular
corr(X, Y ) =
cov(X, Y )
_
V (X) V (Y )
,
onde cov(X, Y ) = E(XY ) E(X)E(Y ), serao necessarios alguns c alculos auxiliares.
F.p. marginal de X
P(X = x) =
2
y=0
P(X = x, Y = y)
=
_
_
(0.1 + 0.1 + 0.3) = 0.5, x = 0
(0.2 + 0.1 + 0.1) = 0.4, x = 1
(0 + 0.1 + 0) = 0.1, x = 2
0, outros valores de x
Valor esperado de X
E(X) =
2
x=0
x P(X = x)
= 0 0.5 + 1 0.4 + 2 0.1
= 0.6
2o. momento de X
E(X
2
) =
2
x=0
x
2
P(X = x)
= 0
2
0.5 + 1
2
0.4 + 2
2
0.1
= 0.8
Variancia de X
V (X) = E(X
2
) E
2
(X)
= 0.8 0.6
2
= 0.44
140
F.p. marginal de Y
P(Y = y) =
2
x=0
P(X = x, Y = y)
=
_
_
(0.1 + 0.2 + 0) = 0.3, y = 0
(0.1 + 0.1 + 0.1) = 0.3, y = 1
(0.3 + 0.1 + 0) = 0.4, y = 2
Valor esperado de Y
E(Y ) =
2
y=0
y P(Y = y)
= 0 0.3 + 1 0.3 + 2 0.4
= 1.1
2o. momento de Y
E(Y
2
) =
2
y=0
y
2
P(Y = y)
= 0
2
0.3 + 1
2
0.3 + 2
2
0.4
= 1.9
Variancia de Y
V (Y ) = E(Y
2
) E
2
(Y )
= 1.9 1.1
2
= 0.69
Y
X
0 1 2
0 0.1 0.1 0.3
1 0.2 0.1 0.1
2 0 0.1 0
141
Momento cruzado de X e Y de ordem (1, 1)
E(XY ) =
2
x=0
2
y=0
xy P(X = x, Y = y)
= 0 0 0.1 +. . . + 2 2 0
= 1 1 0.1 + 1 2 0.1 + 2 1 0.1 + 2 2 0
= 0.5
Covariancia entre X e Y
cov(X, Y ) = E(XY ) E(X)E(Y )
= 0.5 0.6 1.1
= 0.16
Correla cao entre X e Y
corr(X, Y ) =
cov(X, Y )
_
V (X)V (Y )
=
0.16
0.44 0.69
0.29
Comentario Visto que corr(X, Y ) 0.29 = 0 pode concluir-se que as v.a. sao
dependentes.
Para alem disso importa notar que corr(X, Y ) < 0, pelo que as v.a. est ao
negativamente correlacionadas e apresentam tendencia para variarem em sentidos
opostos.
Estando o valor de |corr(X, Y )| afastado de 1, pode adiantar-se que as v.a. n ao
est ao linearmente correlacionadas.
142
Exemplo 5.54 Correla cao (caso contnuo)
Na ana cao de um aparelho e possvel controlar duas vari aveis contnuas X e Y . No
entanto, estas variaveis s o podem ser controladas em simult aneo e n ao individualmente.
Com efeito, quando o aparelho esta anado, o par aleat orio contnuo (X, Y ) tem func ao
densidade de probabilidade conjunta constante no tri angulo 0 < x < 1, 0 < y < x e nula
no resto do plano, i.e.,
f
X,Y
(x, y) =
_
_
_
k, 0 < x < 1, 0 < y < x
0, outros pares (x, y).
Ap os ter mostrado que k = 2, obtenha o coeciente de correla c ao entre X e Y e comente
o valor obtido.
14
Obten cao de k
k :
_
_
_
f
X,Y
(x, y) 0
_
+
_
+
f
X,Y
(x, y)dy dx = 1
_
_
_
k 0
_
1
0
_
x
0
kdy dx = 1
. . .
k = 2
F.d.p. marginal de X
f
X
(x) =
_
+
f
X,Y
(x, y)dy
=
_
_
_
_
x
0
2 dy = 2x, 0 < x < 1
0, c.c.
Valor esperado de X
E(X) =
_
+
x f
X
(x) dx
=
_
1
0
x 2x dx
=
2x
3
3
1
0
=
2
3
14
Adaptado do Exame de 24 de Junho de 2006.
143
2o. momento de X
E(X
2
) =
_
+
x
2
f
X
(x) dx
=
_
1
0
x
2
2x dx
=
2x
4
4
1
0
=
1
2
Variancia de X
V (X) = E(X
2
) E
2
(X)
=
1
2

_
2
3
_
2
=
1
18
f
Y
(y) =
_
+
f
X,Y
(x, y)dx
=
_
_
_
_
1
y
2 dy = 2(1 y), 0 < y < 1
0, c.c.
Valor esperado de Y
E(Y ) =
_
+
y f
Y
(y) dy
=
_
1
0
y 2(1 y) dy
=
_
y
2
2y
3
3
_
1
0
=
1
3
2o. momento de Y
E(Y
2
) =
_
+
y
2
f
Y
(y) dy
=
_
1
0
y
2
2(1 y) dy
=
_
2y
3
3

2y
4
4
_
1
0
=
1
6
144
Variancia de Y
V (Y ) = E(Y
2
) E
2
(Y )
=
1
6

_
1
3
_
2
=
1
18
f
X,Y
(x, y) =
_
_
_
2, 0 < x < 1, 0 < y < x
0, outros pares (x, y).
Momento cruzado de X e Y de ordem (1, 1)
E(XY ) =
_
+
_
+
xy f
X,Y
(x, y) dydx
=
_
1
0
_
x
0
xy 2 dy dx
=
_
1
0
xy
2
x
0
dx
=
_
1
0
x
3
dx
=
1
4
cov(X, Y ) = E(XY ) E(X)E(Y )
=
1
4

1
2

1
3
=
1
36
Correla cao entre X e Y
corr(X, Y ) =
cov(X, Y )
_
V (X)V (Y )
=
1/36
_
1/18 1/18
=
1
2
145
Comentario Dado que corr(X, Y ) =
1
2
> 0 pode concluir-se que as v.a. s ao
dependentes e estao positivamente correlacionadas pelo que apresentam tendencia
para variarem no mesmo sentido.
Mais, como o valor de corr(X, Y ) nao est a pr oximo de 1, as v.a. n ao estao
linearmente correlacionadas.
Exerccio 5.55 Determine e interprete a correla cao entre as v.a. que constituem os
pares aleat orios denidos no Exemplo 5.13 e no Exemplo/Exerccio 5.37.
146
5.4 Combina c oes lineares de variaveis aleat orias.
Motiva cao 5.56 Combina c oes lineares de v.a.
E frequente estarmos interessados em estudar o comportamento probabilstico de

somas (totais)
medias (eventualmente ponderadas)
envolvendo diversas v.a. Tratam-se de exemplos daquilo que usualmente se designa de
combina coes lineares de v.a.
Denicao 5.57 Combina c oes lineares de v.a.
Sejam X
1
, . . . , X
n
v.a. e c
1
, . . . , c
n
constantes reais. Ent ao a v.a.
Y =
n
i=1
c
i
X
i
(5.39)
diz-se uma combina c ao linear das v.a. X
1
, . . . , X
n
.
Exemplo 5.58 Combina c oes lineares de v.a.
X
i
= n umero de pecas defeituosas em n
i
seleccionadas no turno hor ario i (i =
1, . . . , 24)
24
i=1
X
i
= n umero de pecas defeituosas em

24
i=1
n
i
seleccionadas em 24 turnos
hor arios (um dia)
X
i
= consumo de electricidade no dia i (i = 1, . . . , 30)
30
i=1
X
i
= consumo mensal de electricidade
1
30
30
i=1
X
i
= consumo medio di ario de electricidade.
A obten c ao da f.(d.)p. de uma combina c ao linear nem sempre e tarefa f acil. Pode, no
entanto, adiantar-se o valor esperado de qualquer combina c ao linear de v.a. e a variancia
de combina c oes lineares em situa c oes particulares.
Proposicao 5.59 Valor esperado de combina cao linear de v.a.
E
_
n
i=1
c
i
X
i
_
=
n
i=1
c
i
E(X
i
). (5.40)
Em particular, se c
i
= 1, para i = 1, . . . , n, tem-se
E
_
n
i=1
X
i
_
=
n
i=1
E(X
i
). (5.41)
147
Embora o valor esperado de uma combina c ao linear de v.a. seja igual ` a combina c ao
linear dos valores esperados o mesmo est a longe de acontecer com a vari ancia de uma
combina cao linear.
Proposicao 5.60 Variancia de algumas combina coes lineares de v.a.
V (c
1
X
1
+c
2
X
2
) = c
2
1
V (X
1
) +c
2
2
V (X
2
) + 2c
1
c
2
cov(X
1
, X
2
) (5.42)
V (X
1
+X
2
) = V (X
1
) +V (X
2
) + 2cov(X
1
, X
2
) (5.43)
V (X
1
X
2
) = V (X
1
) +V (X
2
) 2cov(X
1
, X
2
) (5.44)
V
_
n
i=1
c
i
X
i
_
=
n
i=1
c
2
i
V (X
i
) + 2
n
i=1
n
j=i+1
c
i
c
j
cov(X
i
, X
j
). (5.45)
Ao lidar-se com v.a. n ao correlacionadas duas a duas i.e., se cov(X
i
, X
j
) = 0, i = j
ou com v.a. independentes duas a duas ou seja, X
i
X
j
, i = j , tem-se:
V
_
n
i=1
c
i
X
i
_
=
n
i=1
c
2
i
V (X
i
). (5.46)
E se, para alem de nao correlacionadas ou independentes duas a duas, tivermos c
i
= 1,
para i = 1, . . . , n, segue-se
V
_
n
i=1
X
i
_
=
n
i=1
V (X
i
). (5.47)
Exemplo 5.61 Combina c oes lineares de v.a. (e nao so)

Uma componente mec anica e constituda por uma biela e uma manivela cujas massas s ao
normalmente distribudas com par ametros na tabela seguinte:
Massas
Peca
Valor esperado Desvio-Padr ao
biela 1 0.02
manivela 0.8 0.05
Calcule a covari ancia entre as massas da biela e da manivela, sabendo que a vari ancia da
massa total da componente mecanica e de 0.0049Kg
2
.
15
X = massa da biela
Y = massa da manivela
15
Adaptado do Teste B de 11 de Maio de 2002.
148
Distribuicoes de X e Y
X normal(
X
,
2
X
)
Y normal(
Y
,
2
Y
)
Parametros
X
= 1,
2
X
= 0.02
2
Y
= 0.8,
2
Y
= 0.05
2
Nova v.a.
Z = X +Y = massa total da componente mecanica
Variancia de Z
V (Z) = 0.0049Kg
2
V (Z) = V (X) +V (Y ) + 2 cov(X, Y )
0.0049 = 0.02
2
+ 0.05
2
+ 2 cov(X, Y )
cov(X, Y ) =
0.0049 0.02
2
0.05
2
2
Assim, conclui-se que cov(X, Y ) = 0.0001.
Exerccio 5.62 Combina c oes lineares de v.a.
Sejam X
1
, . . . , X
n
v.a. independentes e identicamente distribudas (i.i.d.) à v.a. X i.e.,
X
i

i.i.d.
X, i = 1, . . . , n tais que
E(X
i
) = E(X) = (5.48)
V (X
i
) = V (X) =
2
, (5.49)
para i = 1, . . . , n. Demonstre que
Combina cao linear Valor esperado Vari ancia
Total

n
i=1
Xi n n
2
Media aritmetica
1
n
n
i=1
Xi

2
n
149
Motiva cao 5.63 Casos especiais de somas de v.a. independentes
Vimos ate agora que e possvel adiantar o valor esperado e a variancia de somas de
v.a. Resta saber se somos capazes de identicar a distribui cao dessas mesmas somas. A
resposta e armativa nalguns casos especiais de somas de v.a. independentes que passamos
a descrever na proposic ao seguinte.
Proposicao 5.64 Casos especiais de somas de v.a. independentes; mudan ca
de escala
V.a. Combina cao linear Obs.
Xi indep binomial(ni, p), i = 1, . . . , k
k
i=1
Xi binomial
_
k
i=1
ni, p
_
(1)
Xi indep Poisson(i), i = 1, . . . , n
n
i=1
Xi Poisson (
n
i=1
i) (2)
Xi indep. normal(i,
2
i
), i = 1, . . . , n
n
i=1
Xi normal
_
n
i=1
i,
n
i=1
2
i
_
(3)
n
i=1
ci Xi normal
_
n
i=1
ci i,
n
i=1
c
2
i

2
i
_
(4)
X exponencial() cX exponencial
_
c
_
(5)
A tabela traduz o fecho de algumas famlias de distribuic oes para opera c oes como a soma,
as combina c oes lineares ou a mudan ca de escala:
(1) Propriedade reprodutiva da distribuicao binomial, ao lidar-se com v.a. binomiais
independentes com probabilidade de sucesso comum;
(2) Propriedade reprodutiva da distribuic ao de Poisson, ao lidar-se com v.a. de Poisson
independentes;
(3) Propriedade reprodutiva da distribuic ao normal, ao lidar-se com v.a. normais
independentes;
(4) A combina c ao linear de normais independentes mas n ao necessariamente
identicamente distribudas ainda tem distribuic ao normal;
(5) Mudanca de escala da distribuicao exponencial.
150
Exemplo 5.65 Casos especiais de somas de v.a. discretas independentes
Os n umeros de kits de teste vendidos semanalmente por duas sucursais de uma empresa
de biotecnologia s ao duas v.a. independentes com distribuic ao de Poisson cujas vari ancias
s ao iguais a 10 e 15, respectivamente.
16
(a) Obtenha o valor exacto para a probabilidade de o n umero total de kitsde teste
vendidos semanalmente pelas duas sucursais da empresa exceder 25 unidades.
V.a.
X
i
= n umero de kitsvendidos semanalmente pela sucursal i (i = 1, 2)
Distribuicao de X
i
X
i
indep
Poisson(
i
), i = 1, 2
Parametros
1
= E(X
1
) = V (X
1
) = 10
2
= E(X
2
) = V (X
2
) = 15
Nova v.a.
Y = X
1
+ X
2
= n umero total de kits de teste vendidos semanalmente pelas
duas sucursais
Distribuicao de Y
Tratando-se da soma de duas v.a. independentes com distribuicao de Poisson,
pode armar-se que
Y Poisson(E(Y )).
Parametro
E(Y ) = E(X
1
) +E(X
2
) = 10 + 15 = 25
P(Y > 25) = 1 P(Y 25)
= 1 F
Poisson(25)
(25)
tabela
= 1 0.5529
= 0.4471.
16
Adaptado do Exame de 4 de Fevereiro de 2003.
151
(b) Admita que as sucursais facturam 200 e 225 Euros (respectivamente) por cada kit
de teste vendido e determine o valor esperado e o desvio-padr ao da factura c ao total
semanal das duas sucursais desta empresa.
Nova v.a.
F = 200 X
1
+ 225 X
2
=factura c ao total semanal das duas sucursais
Valor esperado de F
E(F) = 200 E(X
1
) + 225 E(X
2
) = 200 10 + 225 15 = 5375
Variancia de F
V (F) = 200
2
V (X
1
) + 225
2
V (X
2
) = 200
2
10 + 225
2
15 = 1159375
Desvio-padrao de F
DP(F) = +
_
V (F) = +
1159375 1076.74.
Exemplo 5.66 Casos especiais de somas de v.a. contnuas independentes
Engenheiros acreditam que um tro co de uma ponte e capaz de suportar W = 200 toneladas
sem que sejam causados danos estruturais. Para alem disso, estudos levados a cabo
apontam para que a massa (em tonelada) dos carros que por ela circulam seja bem
modelada por uma v.a. com distribuic ao normal de valor esperado 1.5 e desvio-padr ao
0.15.
17
(a) Qual a probabilidade de ocorrerem danos estruturais caso estejam 130 carros nesse
tro co?
V.a.
X
i
= massa do i esimo carro, i = 1, . . . , 130
Distribuicao de X
i
X
i
i.i.d.
normal(,
2
), i = 1, . . . , 130
Parametros
= E(X
i
) = 1.5
2
= V (X
i
) = 0.15
2
Nova v.a.
Y =

130
i=1
X
i
= massa total dos 130 carros
17
152
Distribuicao de Y
Tratando-se Y de uma soma de v.a. i.i.d. com distribuic ao normal, tem-se
Y normal(E(Y ), V (Y )).
Parametros
E(Y ) = E
_
130
i=1
X
i
_
= 130 = 195
V (Y ) = V
_
130
i=1
X
i
_
= 130
2
= 2.925
P(Y > W = 200) = 1 P(Y 200)
= 1
_
_
200 E(Y )
_
V (Y )
_
_
1 (2.92)
tabela
= 1 0.9982
= 0.0018.
(b) Assuma agora que W e tambem uma v.a. com distribuic ao normal com valor
esperado 200 e desvio-padrao 20. Demonstre que, caso o n umero de carros que
est ao nesse tro co da ponte seja igual a 140, a probabilidade de ocorrencia de danos
estruturais e de pelo menos 0.1?
Novas v.a.
T =

140
i=1
X
i
= massa total dos 140 carros
W = carga m axima
Importa notar que a probabilidade pedida e P(T > W) = P(T W > 0)
pelo que e conveniente lidar com a v.a. T W, que nao passa de uma
combina cao linear de duas v.a. independentes com distribui cao normal logo
tambem normalmente distribuda.
Distribuicoes de T, W e T W
T normal(E(T), V (T))
W normal(E(W), V (W))
T W normal(E(T W), V (T W))
Parametros
E(T) = E
_
140
i=1
X
i
_
= 140 = 210
V (T) = V
_
140
i=1
X
i
_
= 140
2
= 3.15
153
E(W) = 200
V (W) = 20
2
E(T W) = E(T) E(W) = 210 200 = 10
V (T W) = V (T) +V (W) = 3.15 + 20
2
= 403.15
P(T > W) = 1 P(T W 0)
= 1
_
_
0 E(T W)
_
V (T W)
_
_
1 (0.50)
= (0.50)
tabela
= 0.6915.
Exemplo 5.67 A carga m axima de um elevador e de 350Kg. Admita que a massa

de um passageiro e uma v.a. X normal(75, 10
2
). Obtenha a probabilidade de a massa
total de 5 passageiros exceder a carga maxima.
V.a.
X
i
= massa do i esimo passageiro, i = 1, . . . , 5
Distribuicao de X
i
X
i
i.i.d.
normal(,
2
), i = 1, . . . , 5
Parametros
= E(X
i
) = 75
2
= V (X
i
) = 10
2
Nova v.a.
Y =

5
i=1
X
i
= massa total dos 5 passageiros
Distribuicao de Y
J a que Y e uma soma de v.a. i.i.d. com distribuic ao normal,
Y normal(E(Y ), V (Y )).
154
Parametros
E(Y ) = E
_
5
i=1
X
i
_
= 5 = 375
V (Y )
Xi indep
= V
_
5
i=1
X
i
_
= 5
2
= 500
P(Y > 350) = 1
_
_
350 E(Y )
_
V (Y )
_
_
1 (1.12)
(1.12)
tabela
= 0.8686.
Comentario
Esta probabilidade e elevadssima, pelo que n ao e recomendavel que o elevador
transporte 5 passageiros.
155
5.5 Desigualdade de Chebychev.
Motiva cao 5.68 Desigualdade de Chebychev
A desigualdade de Chebychev
18
permite adiantar limites superiores ou inferiores para
probabilidades de eventos que digam respeito a uma v.a. discreta ou contnua X, bastando
para tal conhecer o seu valor esperado e a sua vari ancia. Este resultado e particularmente
conveniente quando n ao somos capazes de identicar a distribui cao, por exemplo, de uma
soma de v.a.
Proposicao 5.69 Desigualdade de Chebychev
Seja X uma v.a. (discreta ou contnua) tal que
E(X) =
V (X) =
2
.
Ent ao
P(|X | c )
1
c
2
. (5.50)
Nota 5.70 Desigualdade de Chebychev

Esta desigualdade s o faz sentido para c > 0 e s o e util caso c > 1.
Exemplo 5.71 Desigualdade de Chebychev
Retome o Exerccio 5.67.
(a) Determine um limite para P(45 < X < 105) admitindo que desconhece a
distribuic ao da massa X de um passageiro mas que o valor esperado e o desvio-
padr ao s ao conhecidos e iguais a 75Kg e 10Kg, respectivamente.
V.a.
X =massa do passageiro
Distribuicao de X
desconhecida
Valor esperado
= E(X) = 75Kg
18
Pafnuty Lvovich Chebychev (18211894).
156
Desvio-padrao
=
_
V (X) = 10Kg
Limite para P(45 < X < 105)
Comece-se por notar que
P(45 < X < 105) = P(|X 75| < 30)
= 1 P(|X | 3)
Ora recorrendo ` a desigualdade de Chebychev segue-se
P(|X | 3)
1
3
2
1 P(|X | 3) 1
1
3
2
P(45 < X < 105)
8
9
.
(b) Compare o limite que obteve em (a) com o verdadeiro valor da probabilidade,
caso tivesse assumido que a massa de um passageiro e normalmente
distribuda.
Distribuicao de X
X normal( = 75,
2
= 10
2
)
Valor exacto de P(45 < X < 105)
P(45 < X < 105) =
_
105 75
10
_
_
45 75
10
_
= (3) (3)
= 2 (3) 1
= 0.9973
>
8
9
Comentario O limite inferior obtido usando a desigualdade de Chebychev
subestima o valor da probabilidade em
|8/9 0.9973|
0.9973
100% 10.87%,
caso a verdadeira distribuic ao da massa de um passageiro seja
normal(75, 10
2
).
157
5.6 Teorema do Limite Central. Aplica coes às
distribuic oes binomial e de Poisson.
Motiva cao 5.72 Teorema do Limite Central
Nem todas as distribuicoes gozam da propriedade reprodutiva das distribui coes binomial,
de Poisson e normal, pelo que e crucial arranjar formas de obter valores aproximados de
probabilidades de eventos envolvendo
Somas (
n
i=1
X
i
)
Medias aritmeticas
_
1
n
n
i=1
X
i
_
de v.a. independentes e identicamente distribudas (i.i.d.). A resposta pode encontrar-se
no Teorema do Limite Central (TLC).
Teorema 5.73 Teorema do Limite Central
Considere-se que, para todo o inteiro positivo n, as v.a. X
1
, . . . , X
n
s ao i.i.d. com valor
esperado e vari ancia nita
2
. Considere-se ainda
S
n
=

n
i=1
X
i
(soma)
X
n
=
1
n
n
i=1
X
i
(media aritmetica).
Ent ao
lim
n+
P
_
_
S
n
E(S
n
)
_
V (S
n
)
z
_
_
= lim
n+
P
_
S
n
n
n
2
z
_
= (z). (5.51)
Equivalentemente,
lim
n+
P
_
_
X
n
E(X
n
)
_
V (X
n
)
z
_
_
= lim
n+
P
_
_
X
n
2
/n
z
_
_
= (z). (5.52)
158
Nota 5.74 Interesse pratico do Teorema do Limite Central
Ao lidarmos com
n v.a. i.i.d. (E(X
i
) = , V (X
i
) =
2
< +) e
n sucientemente grande
19
podemos
aproximar a f.d. da soma ou da media aritmetica dos X
i
s (S
n
e X
n
, resp.)
devidamente padronizadas
pela
f.d. de v.a. normal padr ao.
Com efeito, pelo facto de o TLC permitir armar que
S
n
n
n
2
a
normal(0, 1) (5.53)
X
n
2
/n
a
normal(0, 1) (5.54)
(onde
a
se le tem distribui cao aproximadamente...), tem-se
P(S
n
s) = P
_
S
n
n
n
2
s n
n
2
_
TLC

_
s n
n
2
_
(5.55)
P(X
n
x) = P
_
_
X
n
2
/n
x
_
2
/n
_
_
TLC

_
_
x
_
2
/n
_
_
. (5.56)
Nota 5.75 Teorema do Limite Central

O TLC e valido para somas e medias aritmeticas de v.a. quer discretas, quer contnuas.
Este teorema justica tambem as aproxima c oes normais das distribuic oes binomial e
de Poisson que descreveremos ainda nesta seccao. Para tal basta considerar:
X
i

i.i.d.
Bernoulli(p), i = 1, . . . , n S
n
=

n
i=1
X
i
binomial(n, p)
X
i

i.i.d.
Poisson(/n), i = 1, . . . , n S
n
=

n
i=1
X
i
Poisson().
19
n sucientemente grande signica, de um modo geral, n 30.
159
Exemplo 5.76 Teorema do Limite Central (v.a. discretas)
Considere um modelo simples para o trafego na world wide web em que o n umero de
pacotes necessarios para a transmissao de uma p agina na net distribui-se uniformemente
em {1, . . . , 50}. Calcule um valor aproximado para a probabilidade do n umero de pacotes
necessarios ` a transmissao de 100 p aginas exceder 3000.
20
Nota:

n
x=1
x =
n(n+1)
2
e

n
x=1
x
2
=
n(n+1)(2n+1)
6
.
V.a.
X
i
= n umero de pacotes necessarios para a transmissao da pagina i, i = 1, . . . , 100
Distribuicao de X
i
X
i
i.i.d.
uniforme discreta({1, 2, . . . , 50}), i = 1, . . . , 100
F.p. de X
i
P(X
i
= x) =
_
_
_
1
50
, x = 1, 2, . . . , 50
0, c.c.
Valor esperado de X
i
= E(X
i
)
=
50
x=1
x
1
50
=
1
50

50 (50 + 1)
2
= 25.5
2o. momento de X
i
E(X
2
i
) =
50
x=1
x
2
1
50
=
1
50

50 (50 + 1)(2 50 + 1)
6
= 858.5
Variancia de X
i
2
= V (X
i
)
= E(X
2
i
) E
2
(X
i
)
= 858.5 25.5
2
= 208.25
20
160
Nova v.a.
Y =

100
i=1
X
i
= n umero total de pacotes necessarios para a transmiss ao 100 p aginas
Valor esperado de Y
E(Y ) = 100 = 2550
Variancia de Y
V (Y ) = 100
2
= 20825
Distribuicao aproximada de Y
De acordo com o TLC pode adiantar-se que
Y E(Y )
_
V (Y )
a
normal(0, 1).
Valor aproximado da probabilidade pedida
P(Y > 3000) = 1 P(Y 3000)
TLC
1
_
3000 2550
20825
_
1 (3.12)
tabela
= 1 0.9991
= 0.0009.
Exemplo/Exerccio 5.77 Teorema do Limite Central (v.a. contnuas)

Suponha-se que, ao adicionar n umeros reais, cada n umero e arredondado previamente
para o inteiro mais pr oximo. Admita-se que os erros de arredondamento s ao v.a. i.i.d. com
distribui c ao comum
uniforme(0.5, 0.5). (5.57)
(a) Obtenha um valor aproximado para a probabilidade de o valor absoluto do erro da
soma exceder 15 unidades ao adicionarmos 1500 n umeros.
V.a.
X
i
= erro de arredondamento da parcela i, i = 1, . . . , 1500
161
Distribuicao de X
i
X
i
i.i.d.
uniforme(0.5, 0.5), i = 1, . . . , 1500
F.d.p. de X
i
f
Xi
(x)
form
=
_
_
_
1
0.5(0.5)
= 1, 0.5 x 0.5
0, c.c.
Valor esperado de X
i
= E(X
i
)
form
=
0.5 + (0.5)
2
= 0
Variancia de X
i
2
= V (X
i
)
form
=
[0.5 (0.5)]
2
12
=
1
12
Nova v.a.
Y =

1500
i=1
X
i
=erro de arredondamento da soma de 1500 parcelas
Valor esperado de Y
E(Y ) = 1500 = 0
Variancia de Y
V (Y ) = 1500
2
=
1500
12
Distribuicao aproximada de Y
Pelo TLC pode escrever-se
Y E(Y )
_
V (Y )
a
normal(0, 1).
P(|Y | > 15) = 1 P(15 Y 15)
TLC
1
_
_
_
_
15 0
_
1500
12
_
_
_
_
15 0
_
1500
12
_
_
_
_
1 [(1.34) (1.34)]
= 2 [1 (1.34)]
tabela
= 2 (1 0.9099)
= 0.1802.
162
(b) Compare este valor aproximado com o limite inferior obtido por recurso à desigualdade
de Chebychev.
Motiva cao 5.78 Aproxima c oes de distribuicoes
Nem sempre e possvel calcular a probabilidade de certos eventos recorrendo às
tabelas disponveis ou de uma outra forma expedita sem recurso a uma calculadora
ou a um computador. Basta considerar-se o calculo de P(X 40) onde
X binomial(100, 0.1).
N ao s o as tabelas disponveis n ao contemplam valores de n superiores a 20 como a
obten c ao de
P(X 40) =
40
x=0
100!
x! (100 x)!
0.1
x
(1 0.1)
100x
pressup oe o c alculo de 41 parcelas.
N ao surpreende que nestas e noutras situa c oes similares seja frequente recorrer ao que
usualmente se denomina de
aproxima coes distribucionais
entre elas as duas que constam do ttulo a secc ao.
Importa referir o caracter emprico das aproxima coes das distribui coes que se seguem e
o facto de as condi coes em que se deve efectuar qualquer das 4 aproxima c oes que veremos
j a de seguida nao serem rgidas e variarem de livro de texto para livro de texto.
163
Nota 5.79 4 aproxima c oes de distribuicoes
V.a. original V.a. aproximativa Condi coes de aproximacao Obs.
1. X hipergeometrica(N, M, n)

X binomial(n, M/N) n < 0.1N (1)
2. X binomial(n, p)

X Poisson(np) n > 20 e p < 0.1 (2)
3. X binomial(n, p)

X normal(np, np(1 p)) np > 5 e n(1 p) > 5 (3)
4. X Poisson()

X normal(, ) > 5 (4)
(1) Fazer ou nao reposicao deixa de ser relevante quando a dimensao da amostra e muito
pequena quando comparada com a dimensao da popula cao.
(2) Nao estao disponveis tabelas para a f.d. da binomial com n > 20.
(3) Por estarmos a aproximar uma v.a. discreta por uma contnua e por forma a melhorar
a aproxima c ao recomenda-se a efectuac ao do que se designa por correcc ao de
continuidade que descreveremos daqui a pouco.
21
(4) Pelos mesmos motivos apontados acima e recomendavel efectuar a correcc ao de
continuidade. Atente-se que existem tabelas da f.d. da v.a. X Poisson() para
diversos valores de > 5, e nesses casos n ao ha qualquer necessidade de efectuar a
aproxima cao.
22
Nota 5.80 4 aproxima c oes de distribuicoes

As 4 aproxima c oes de distribuic oes encontram justicac ao em resultados de convergencia:
1. X hipergeometrica(N, M, n) aproximada por

X binomial(n, p = M/N).
Para n e M/N = p xos, tem-se:
lim
N +
n xo
M/N = p xo
_
M
x
__
NM
nx
_
_
N
n
_ =
_
n
x
_
p
x
(1 p)
nx
. (5.58)
2. X binomial(n, p) aproximada por

X Poisson( = np).
Para np = xo, segue-se:
lim
n +
p 0
np = xo
_
n
x
_
p
x
(1 p)
nx
= e
x
x!
. (5.59)
21
A aplica cao de correccao de continuidade n ao e obrigat oria a menos que a solicitemos.
22
E muito menos a correccao de continuidade.
164
3./4. X binomial(n, p) aproximada por

X normal( = np,
2
= np(1 p)).
X Poisson() aproximada por

X normal( = ,
2
= ).
Estas duas aproxima coes encontram justicac ao no Teorema do Limite Central.
Rera-se ainda que as 4 aproxima c oes de distribuic oes preservam o valor esperado da
v.a. original e a variancia nos casos 3. e 4. Com efeito temos: E(X) = E(

X), em qualquer
dos 4 casos; V (X) V (

X), para as duas primeiras 4 aproxima coes de distribuic oes (1. e
2.); e V (X) = V (

X), para as restantes duas aproxima c oes (3. e 4.).
Exemplo 5.81 A aproxima cao binomial da distribuicao hipergeometrica
Para avaliar a correccao da composic ao anunciada de certo produto alimentar foram
analisadas 10000 embalagens desse produto. Vericou-se que em 100 delas o produto
n ao correspondia ao anunciado.
Indique uma expressao e um valor aproximado para a probabilidade de pelo menos duas
embalagens do produto nao corresponderem ao anunciado, caso tenham sido seleccionadas
500 embalagens ao acaso sem reposicao daquelas 10000 embalagens do produto.
23
V.a. original
X = n umero de embalagens que n ao correspondem ao anunciado, numa amostra de
500 embalagens seleccionadas ao acaso sem reposicao de entre 10000 embalagens
do produto das quais 100 n ao correspondem ao anunciado
Distribuicao de X
X hipergeometrica(N, M, n)
Parametros
N = 10000 embalagens do produto
M = 100 embalagens do produto que nao correspondem ao anunciado
n = 500 embalagens seleccionadas
F.p. de X
P(X = x) =
_
_
(
100
x
) (
10000100
500x
)
(
10000
500
)
, x = 0, . . . , 100
0, c.c.
23
165
Expressao da probabilidade pedida
P(X 2) = 1 P(X 1)
= 1
1
x=0
_
100
x
_ _
10000100
500x
_
_
10000
500
_ .
V.a. aproximativa

X
Dado que n = 500 < 0.1N = 1000 pode aproximar-se a f.p. da v.a.
X hipergeometrica(N = 10000, M = 100, n = 500) pela f.p. da v.a.
X binomial(n = 500, p = M/N = 0.01).

F.p. de

X
P(

X = x) =
_
500
x
_
0.01
x
(1 0.01)
500x
, x = 0, 1, . . . , 500
P(X 2) = 1 P(X 1)
1 P(

X 1)
= 1
1
x=0
_
500
x
_
0.01
x
(1 0.01)
500x
= 1
_
0.99
500
+ 500 0.01 0.99
499
_
= 0.9602.
Exemplo/Exerccio 5.82 A aproxima cao de Poisson da distribuicao

binomial
Um fabricante de computadores garante a substituic ao de todos os computadores que
avariem durante o primeiro ano apos a data de compra ou da substituicao. Admite-se
que os tempos de vida destes computadores sao v.a. independentes e que seguem uma
distribuic ao normal com valor esperado 3.526 anos e desvio padr ao 0.85 anos.
24
(a) Calcule a propor c ao de computadores que o fabricante pode ter que substituir.
V.a.
X = tempo de vida de computador...
24
166
Distribuicao de X
X normal(,
2
)
Parametros
= E(X) = 3.526 anos
2
= V (X) = 0.85
2
anos
2
Seja S o evento que representa a substituic ao devido a avaria durante o primeiro
ano. Ent ao
P(S) = P(X < 1)
= P
_
_
X E(X)
_
V (X)
<
1 E(X)
_
V (X)
_
_
=
_
_
1 E(X)
_
V (X)
_
_
=
_
1 3.516
0.85
_
(2.96)
= 1 (2.96)
tabela
= 0.0015.
(b) Se uma rma adquirir 100 computadores àquele fabricante, qual a probabilidade de
3 ou mais desses computadores serem substitudos?
Nova v.a. original
Y = n umero de computadores que serao substitudos de entre 100
Distribuicao de Y
Y binomial(n, p)
Parametros
n = 100
p = P(S) = 0.0015
F.p. de Y
P(Y = y) =
_
100
y
_
0.0015
y
(1 0.0015)
100y
, y = 0, 1, . . . , 100
167
V.a. aproximativa

Y
Dado que n > 20 e p < 0.1 pode aproximar-se a f.p. da v.a. Y binomial(n =
100, p = 0.0015) pela f.p. da v.a.
Y Poisson( = np = 0.15).
F.p. de

Y
P(
Y = y) = e
0.15
0.15
y
y!
, y = 0, 1, 2, . . .
P(Y 3) = 1 P(Y 2)
1 P(
Y 2)
= 1 F
Poisson(0.15)
(2)
tabela
= 1 0.9995
= 0.0005.
(c) Determine o valor exacto de P(Y 3) e calcule o erro relativo associado ao valor
aproximado calculado na alnea anterior.
Motiva cao 5.83 Correccao de continuidade
A correccao de continuidade deve ser efectuada uma vez que, de um modo geral, vem
melhorar a qualidade da aproxima cao de uma v.a. discreta (neste caso com distribuic ao
binomial ou de Poisson) por uma v.a. contnua com distribuicao normal.
Para alem disso, n ao faria sentido aproximar P(X = x) por P(

X = x), uma vez que
P(

X = x) = 0 pois

X e uma v.a. contnua.
Nota 5.84 Correccao de continuidade
Seja X uma v.a. discreta que toma valores de em .
25
Seja ainda

X a v.a. aproximativa
contnua.
26
Ent ao tem-se, para = 1 e quaisquer valores admissveis x, a, b da v.a. X:
P(X = x) P(x 1/2 <

X x + 1/2);
P(a < X b) P(a + 1/2 <

X b + 1/2);
P(X < x) = P(X x 1) P[

X (x 1) + 1/2].
25
No caso das distribui coes binomial e de Poisson tem-se = 1, que e, ali as, o valor mais comum de
.
26
V.a. esta com distribui cao normal.
168
Exemplo 5.85 Correccao de continuidade
Considere-se X binomial(30, 0.4). Uma vez que
n = 30 > 20
np = 30 0.4 = 12 > 5 e
n(1 p) = 30 (1 0.4) = 18 > 5,
pode aproximar-se a f.p. P(X = x) por P(x 1/2 <

X x + 1/2) onde
X normal( = np = 30 0.4 = 12,

2
= np(1 p) = 30 0.4 (1 0.4) = 7.2).
valor exacto valor aproximado
x P(X = x) P(x 1/2 <

X x + 1/2) erro relativo
0 0.000000 0.000008 3297.714%
1 0.000004 0.000036 724.420%
2 0.000043 0.000154 260.716%
3 0.000266 0.000568 113.712%
4 0.001197 0.001826 52.599%
5 0.004149 0.005115 23.285%
6 0.011524 0.012486 8.349%
7 0.026341 0.026571 0.872%
8 0.050487 0.049287 2.377%
9 0.082275 0.079694 3.138%
10 0.115185 0.112328 2.481%
11 0.139619 0.138014 1.149%
12 0.147375 0.147821 0.303%
13 0.136039 0.138014 1.452%
14 0.110127 0.112328 1.999%
15 0.078312 0.079694 1.764%
16 0.048945 0.049287 0.698%
17 0.026872 0.026571 1.120%
18 0.012938 0.012486 3.493%
19 0.005448 0.005115 6.112%
20 0.002000 0.001826 8.574%
21 0.000634 0.000568 10.372%
22 0.000173 0.000154 10.853%
23 0.000040 0.000036 9.105%
24 0.000008 0.000007 3.671%
25 0.000001 0.000001 8.127%
26 0.000000 0.000000 32.009%
27 0.000000 0.000000 82.321%
28 0.000000 0.000000 203.425%
29 0.000000 0.000000 583.648%
30 0.000000 0.000000 2677.075%
169
Ao faze-lo obtemos a tabela anterior,
27
onde pode encontrar-se tambem o valor do erro
relativo da aproxima c ao,
_
1
P(x 1/2 <

X x + 1/2)
P(X = x)
_
100%.
De notar que a qualidade da aproxima cao e tanto melhor quanto mais proximo estiver o
valor de x de E(X) = np = 12.
Exerccio 5.86 Repita o Exemplo 5.85 considerando desta feita
X Poisson(22.5) e confrontando os valores exactos e aproximados da f.d. desta
v.a. discreta.
Exemplo 5.87 A aproxima cao normal da distribuicao binomial
Um professor tenta lan car o sumario da sua aula te orica no FENIX no pr oprio dia e
nos dias seguintes, fazendo uma unica tentativa por dia. Contudo, a probabilidade de
numa tentativa conseguir aceder ao sistema e de apenas 0.6, independentemente do dia
considerado.
Durante um semestre (52 aulas) quantos sum arios e de esperar que possam ser lancados
no pr oprio dia? Indique um valor aproximado (com correcc ao de continuidade) para a
probabilidade desse n umero exceder 30.
28
V.a.
X = n umero de sum arios lan cados no pr oprio dia, em 52 sumarios
Distribuicao de X
X binomial(n, p)
Parametros
n = 52
p = 0.6
F.p. de X
P(X = x) =
_
52
x
_
0.6
x
(1 0.6)
52x
, x = 0, 1, . . . , 52
27
Os valores exactos e aproximados foram aproximados ate à 6a. casa decimal e obtidos recorrendo ao
Mathematica.
28
170
Valor esperado de X
E(X) = np = 52 0.6 = 31.2
Variancia de X
V (X) = np (1 p) = 52 0.6 (1 0.6) = 12.48
V.a. aproximativa

X
Dado que np = 31.2 > 5 e n(1 p) = 20.8 > 5 pode aproximar-se a f.d. da v.a.
X binomial(n = 52, p = 0.6) pela f.d. da v.a.
X normal( = np = 31.2,
2
= np(1 p) = 12.48).
com uma correc cao de continuidade.
P(X > 30) = 1 P(X 30)
1 P(

X 30 + 1/2)
= 1
_
_
30 + 1/2 E(

X)
_
V (

X)
_
_
1 (0.03)
(0.03)
tabela
= 0.5120.
Exemplo 5.88 A aproxima cao normal da distribuicao de Poisson

O n umero de neutrinos registados em intervalos de 12 segundos, aquando da primeira
observa cao da supernova S1987a por astr onomos, e bem modelado por uma distribui c ao
de Poisson com vari ancia igual a 0.8.
Confronte o valor exacto e o aproximado (com correc cao de continuidade) da
probabilidade de o n umero de neutrinos registados em 10 minutos exceder 40.
29
V.a.
X = n umero de neutrinos registados em intervalos de 12 segundos
Distribuicao de X
X Poisson()
29
Adaptado do Teste A de 22 de Abril de 2006.
171
Parametro
= E(X) = V (X) = 0.8 neutrinos (em intervalos de 12 segundos)
F.p. de X
P(X = x) =
_
_
_
e
0.8
0.8
x
x!
, x = 0, 1, 2, . . .
Nova v.a.
Y = de neutrinos registados em intervalos de 10 minutos
Distribuicao de Y
Y Poisson(
)
30
Parametros
=
1060
12
0.8 = 40 (em intervalos de 10 minutos)
F.p. de Y
P(Y = y) =
_
_
_
e
40
40
y
y!
, y = 0, 1, 2, . . .
0, outros valores de y.
Valor exacto da probabilidade pedida
P(Y > 40) = 1 P(Y 40)
= 1 F
Poisson(40)
(40)
tabela
= 1 0.5419
= 0.4581
V.a. aproximativa

Y
Dado que
= 40 > 5 pode aproximar-se a f.d. da v.a. Y Poisson(
= 40) pela
f.d. da v.a.
Y normal( =
= 40,
2
=
= 40).
com correc c ao de continuidade.
30
Este resultado deve-se à propriedade reprodutiva da distribui cao de Poisson.
172
P(Y > 40) = 1 P(Y 40)
1 P(
Y 40 + 1/2)
= 1
_
_
40 + 1/2 E(
Y )
_
V (
Y )
_
_
1 (0.08)
tabela
= 1 0.5319
= 0.4681,
valor este associado a um erro relativo igual a
|0.4681 0.4581|
0.4581
100% = 2.18%.
Rera-se tambem que h a vantagem em efectuar correcc ao de continuidade uma vez
que ao n ao efectua-la o valor aproximado da probabilidade pedida e igual a 0.5 e o
erro relativo associado da ordem de 9.15%.
173
Captulo 6
Estima cao pontual
A Teoria das Probabilidades compreende o estudo dos modelos matem aticos capazes
de descrever o comportamento de fenomenos aleat orios, modelos esses que se dizem
probabilsticos.
Foi sobre o estudo de tais modelos que nos debruc amos nos captulos 2 a 5.

E altura
de falarmos sobre Estatstica, ramo da Matematica Aplicada que compreende tecnicas
quantitativas para recolher, apresentar e interpretar dados relativos a fenomenos aleat orios
visando a caracteriza cao da variabilidade desses mesmos fenomenos.
6.1 Inferencia Estatstica. Amostragem aleat oria.
O estudo da Estatstica assenta em alguns conceitos b asicos que introduziremos
informalmente j a de seguida.
Denicao informal 6.1 V.a. ou caracterstica de interesse
N ao passa de uma caracterstica crucial para o conhecimento do fen onemo aleat orio em
estudo.
Exemplos:
a resistencia de certo tipo de mola;
o tempo ate falha de pa de certo motor a jacto;
o n umero de colisoes de detritos em satelite em MEO no espa co de um ano.
174
Popula cao e unidade estatstica
Conjunto de todos os objectos/indivduos/etc. que tem em comum pelo menos uma
caracterstica de interesse. A cada elemento da popula c ao d a-se o nome de unidade
estatstica.
Exemplos:
todas as molas produzidas do referido tipo;
todas as p as de tais motores a jacto;
todos os satelites em MEO.
Amostra e dado estatstico
Dada a impossibilidade de observar toda uma popula c ao ou devido ao facto de ser
innita, ou por implicar a sua destrui cao, ou por raz oes de economia, comodidade, ou
tempo e fundamental recolher um subconjunto que se pretende representativo da
popula c ao; este subconjunto e denominado de amostra.
A cada resultado observado relativo ` a caracterstica de interesse e respeitante a cada
unidade estatstica pertencente ` a amostra damos o nome de dado estatstico.
Exemplos:
recolher a 2a., 12a., 22a., 32a. e 42a. mola da produc ao di aria;
seleccionar completamente ao acaso 5 p as da produc ao semanal;
seleccionar ao acaso um satelite chines em MEO, um russo e tres americanos.
Em qualquer dos casos anteriores as amostras possuem dimensao 5.
Amostragem
Trata-se de um vasto conjunto de procedimentos estatsticos que encontra motiva c ao na
necessidade de obtencao de amostras, i.e.,imagens ` a escala da popula c ao.
1
Exemplos:
amostragem sistematica;
2
1
E justica so por si uma ou mais disciplinas dedicadas ao seu estudo em licenciaturas como a
licenciatura em Matematica Aplicada e Computa cao no IST.
2
Uma amostra sistematica de tamanho n de uma popula cao (numerada) de N unidades obtem-
se xando (ou seleccionando aleatoriamente) um n umero k do conjunto {1, 2, . . . , N}, extraindo
aleatoriamente uma unidade das primeiras k, que designamos por jk, e tomando por sistema as unidades
jk + i k, i = 1, 2, 3, . . ., ate se recolher um total de n elementos ou se percorrer toda a populacao. No
exemplo N = 50, k = 10, jk = 2
175
amostragem aleat oria simples;
3
amostragem estraticada.
4
Estatstica descritiva
Com a recolha da amostra obtem-se um conjunto de dados, com um aspecto ca otico,
cuja mera leitura depressa se reconhece nada contribuir para a compreens ao do fenonemo
aleat orio em estudo. A Estatstica Descritiva resolve (parcialmente) esta diculdade ao
consistir numa bateria de metodos gr acos e numericos que permitem patentear de forma
sum aria a informa c ao relevante contida nos dados.
Denicao informal 6.2 Inferencia estatstica
A Inferencia Estatstica compreende um amplo conjunto de metodos que tem por objectivo
usar a informa cao (dados/amostra) de modo a responder a quest oes especcas sobre a
popula c ao muito em especial sobre aspectos relativos ao car acter aleatorio da(s) v.a.(s)
de interesse sob estudo. Pretende-se, por exemplo:
adiantar valores ou intervalos de valores razo aveis para par ametros desconhecidos
como ,
2
, etc. estimac ao pontual (Cap. 6) ou estimacao intervalar (Cap. 7);
averiguar a razoabilidade de
conjecturas (hip oteses) sobre par ametros desconhecidos ou de distribuic oes (ou
famlias de distribuic oes) para explicar a variabilidade da v.a. de interesse
testes de hip oteses (Cap. 8) ou
modelos de regress ao que expliquem a rela cao entre um par de variaveis
regress ao linear simples (Cap. 9).
A Inferencia Estatstica parte, assim, do particular (amostra) para o geral (popula c ao),
da designar-se tambem de Inferencia Indutiva.
3
O termo aleatorio signica que a seleccao e aleatoria, pelo que todos os elementos da popula cao tem a
mesma probabilidade de serem escolhidos e de virem a fazer parte da amostra com dimensao previamente
xada.
4
Este tipo de amostragem passa pela divis ao da popula cao em classes mais homogeneas (estratos) de
cada uma das quais se extrai uma amostra aleatoria de tamanho especicado.
176
Nota 6.3 A forma como interagem aqueles conceitos e a Inferencia Estatstica pode
ser representada no seguinte esquema:
Amostragem

Populacao
Caracterstica de interesse
fX(x), , etc.
Amostra
Estatstica descritiva
histograma, x, etc.

Inferencia Estatstica
Estimacao, testes, etc.
Motiva cao 6.4 Amostragem aleatoria

Para que as inferencias sejam rigorosas
5
e natural exigir que o processo de recolha de
informa c ao seja baseado (total ou parcialmente) na intervenc ao do acaso.
Denicao 6.5 Amostra aleatoria
Sejam:
X uma v.a. de interesse;
X
1
, . . . , X
n
v.a. independentes e identicamente distribudas (i.i.d.) a X, i.e.,
X
i

i.i.d.
X, i = 1, . . . , n (n IN).
Ent ao o vector aleat orio
X = (X
1
, . . . , X
n
) diz-se uma amostra aleat oria (a.a.) de dimensao n proveniente
da popula cao X.
6
Denicao 6.6 Amostra

`
A observa c ao particular da a.a. X = (X
1
, . . . , X
n
) d a-se o nome de amostra e representa-se
por x = (x
1
, . . . , x
n
).
5
Ou por outra: para que às inferencias esteja associado um pequeno grau de incerteza, incerteza
esta que sera quanticada probabilisticamente.
6
Talvez fosse mais razoavel designar-se por amostra aleatoria (a.a.) de dimensao n respeitante à v.a.
de interesse X. H a, no entanto, autores que designam X indistintamente de popula cao e de v.a. de
interesse.
177
Nota 6.7 Amostra aleat oria e amostra
Convem recordar que a a.a. X = (X
1
, . . . , X
n
) e um vector aleat orio ndimensional e o
que mesmo n ao acontece com a amostra x = (x
1
, . . . , x
n
) que n ao passa de um vector de
IR
n
.
Proposicao 6.8 Caracteriza cao da amostra aleatoria
Pelo facto de a a.a. ser constituda por n v.a. i.i.d. a X, a caracteriza cao probabilstica da
a.a. X = (X
1
, . . . , X
n
) faz-se sem grande diculdade. Com efeito, tem-se para os casos:
discreto f.p. conjunta de X
P(X = x) = P(X
1
= x
1
, . . . , X
n
= x
n
)
Xi indep.
= P(X
1
= x
1
) . . . P(X
n
= x
n
)
=
n
i=1
P(X
i
= x
i
)
XiX
=
n
i=1
P(X = x
i
) (6.1)
contnuo f.d.p. conjunta de X
f
X
(x) = f
X1,...,Xn
(x
1
, . . . , x
n
)
Xi indep.
= f
X1
(x
1
) . . . f
Xn
(x
n
)
=
n
i=1
f
Xi
(x
i
)
XiX
=
n
i=1
f
X
(x
i
). (6.2)
Motiva cao 6.9 Estatstica
E fundamental e conveniente condensar/sumariar a amostra (os dados) em medidas

sum arias como a media, o desvio-padr ao da amostra ou outras medidas ja estudadas
em Estatstica Descritiva. Estas medidas mais n ao s ao que valores particulares de v.a.,
denidas à custa da a.a. e denominadas de estatsticas.
Denicao 6.10 Estatstica
Seja X = (X
1
, . . . , X
n
) uma a.a. de dimens ao n proveniente da popula c ao X. Neste caso
T diz-se uma estatstica se se tratar de uma func ao exclusiva da a.a., i.e., se
T = T(X).
178
Nota 6.11 Estatstica
Uma estatstica T = T(X) nao depende de qualquer par ametro desconhecido.
Exemplo 6.12 Estatsticas
Estatstica Valor observado da estatstica
Mnimo da a.a. X
(1)
= mini=1,...,n Xi mnimo da amostra x
(1)
= mini=1,...,n xi
M aximo da a.a. X
(n)
= maxi=1,...,n Xi maximo da amostra x
(n)
= maxi=1,...,n xi
Amplitude da a.a. R = X
(n)
X
(1)
amplitude da amostra r = x
(n)
x
(1)
Media da a.a.

X =
1
n
n
i=1
Xi media da amostra x =
1
n
n
i=1
xi
Var. corrigida da a.a. S
2
=
1
n1
n
i=1
(Xi

X)
2
var. corrigida da am. s
2
=
1
n1
n
i=1
(xi x)
2
Var. n ao corrig. da a.a. (S
)
2
=
1
n
n
i=1
(Xi

X)
2
var. n ao corrig. da am. (s
)
2
=
1
n
n
i=1
(xi x)
2
Na tabela acima condensamos alguns exemplos de estatsticas, seus valores particulares e
respectivas designa c oes.
Nota 6.13 F ormula alternativa da variancia corrigida (nao corrigida) da
amostra
Uma vez que
n
i=1
(x
i
x)
2
=
_
n
i=1
x
2
i
_
n( x)
2
, (6.3)
a variancia corrigida da amostra e a vari ancia n ao corrigida da amostra podem escrever-se
do seguinte modo:
s
2
=
1
n 1
n
i=1
(x
i
x)
2
=
1
n 1
_
n
i=1
x
2
i
_
n
n 1
( x)
2
(6.4)
(s
)
2
=
1
n
n
i=1
(x
i
x)
2
=
1
n
_
n
i=1
x
2
i
_
( x)
2
(6.5)
=
n 1
n
s
2
,
respectivamente.
Escusado ser a dizer que estas f ormulas alternativas poupam opera c oes aritmeticas e
poupam-nos a alguns erros de arredondamento.
179
Exemplo/Exerccio 6.14 Formula alternativa da variancia corrigida (nao
corrigida) da amostra
- Demonstre o resultado (6.3).
Desenvolvendo o quadrado e tirando partido do facto de

n
i=1
x
i
= n x, tem-se
sucessivamente:
n
i=1
(x
i
x)
2
=
n
i=1
(x
2
i
2x
i
x + x
2
)
=
n
i=1
x
2
i
2 x
n
i=1
x
i
+n( x)
2
=
n
i=1
x
2
i
2 x n x +n( x)
2
=
_
n
i=1
x
2
i
_
n( x)
2
.
180
6.2 Estimadores e suas propriedades.
O objectivo principal da Estatstica e efectuar inferencias sobre caractersticas da v.a. de
interesse com base na amostra recolhida. Considera-se, em geral, que a distribuic ao de X
e ou parcial, ou totalmente desconhecida.
Parcialmente desconhecida, caso o tipo distribucional de X seja considerado
conhecido (e.g., binomial, Poisson, exponencial, etc.) a menos de um ou mais
par ametros desconhecidos (e.g. ,
2
, etc.).
7
Nesta situa c ao as inferencias que
possamos fazer dizem-se do tipo parametrico.
Totalmente desconhecida, se o tipo distribucional de X for especicado de modo
vago (e.g., distribuic ao discreta, etc.). Neste caso as inferencias dizem-se n ao
parametricas.
Nota 6.15 Parametro desconhecido
Um par ametro desconhecido unidimensional (resp.multidimensional) ser a de um modo
geral representado por (resp. ).
Denicao informal 6.16 Espaco parametrico
Corresponde ao conjunto de todos os valores possveis para o par ametro desconhecido
e e frequentemente representado por .
Modelo parametrico
Famlia de distribuic oes possveis para a v.a. de interesse X.
8
Esta famlia e usualmente
representada por { : } onde no espa co em branco se colocar a indistintamente
a express ao geral da f.(d.)p. de X ou o nome da distribuic ao de X, dependentes em todo
o caso do par ametro .
Motiva cao 6.17 Estimadores
E fundamental adiantar valores razo aveis para par ametros desconhecidos que caracterizem
a distribuicao da nossa v.a. de interesse. Para tal iremos recorrer a estatsticas com
caractersticas especiais que denominaremos de estimadores.
Denicao 6.18 Estimador
A estatstica T = T(X) diz-se um estimador do par ametro desconhecido , caso T = T(X)
tome valores exclusivamente no espaco parametrico .
7
Considera-se em todo o caso que o n umero de par ametros desconhecidos e nito.
8
Paulino (1994) dene modelo parametrico à custa de X.
181
Denicao 6.19 Estimativa
Ao valor observado do estimador T = T(X) do par ametro desconhecido , t = T(x),
damos o nome de estimativa de . Trata-se naturalmente de um valor razo avel para j a
que t = T(x) .
Exemplo 6.20 Modelo e espa co parametricos; estimador e estimativa
Admita que vai inquirir n condutores/as quanto ` a sua preferencia (ou n ao) por motores
a gasoleo e que as respostas possveis (admissveis) neste inquerito s ao:
Sim (1), prero motor a gasoleo;
N ao (0), prero motor a gasolina.
Procure identicar: a v.a. de interesse; a respectiva distribuic ao; o par ametro
desconhecido; o modelo e o espaco parametricos; uma estimativa e um estimador do
par ametro desconhecido.
V.a. de interesse
X = resposta de condutor/a inquirido/a
=
_
_
_
1 (resposta armativa), com probabilidade
0 (resposta negativa), com probabilidade (1 )
Distribuicao de X
X Bernoulli()
Parametro desconhecido
= P(X = 1) = P(resposta armativa)
Espaco parametrico
= [0, 1]
Modelo parametrico
{Bernoulli(), } ou alternativamente {
x
(1 )
1x
, }
A.a.
X = (X
1
, . . . , X
n
) a.a. de dimens ao n proveniente da popula c ao X
Amostra
x = (x
1
, . . . , x
n
) onde x {0, 1}
n
182
Estimativa de
Candidata: um valor razo avel para e
T(x) =
1
n
n
i=1
x
i
= x
= propor cao observada de sims
Estimador de
Candidato:
T(X) =
1
n
n
i=1
X
i
Verica c oes:
1. T(X) so depende de X
2. T(X) toma valores em {0,
1
n
,
2
n
, . . . ,
n1
n
, 1} = [0, 1]
Conclus ao:
T(X) e estimador de .
Motiva cao 6.21 Propriedades dos estimadores
Um estimador conduzir a a inferencias/estimativas mais rigorosas se gozar de algumas das
propriedades descritas ja de seguida.
Denicao 6.22 Estimador centrado
O estimador T diz-se um estimador centrado de
9
se
E[T(X)] = , , (6.6)
i.e., o centro de gravidade do estimador e igual a independentemente do valor que este
par ametro desconhecido possa assumir.
Denicao 6.23 Estimador enviesado
O estimador T diz-se um estimador enviesado de
10
se
: E[T(X)] = . (6.7)
9
Ou um estimador n ao enviesado de .
10
Ou um estimador n ao centrado de .
183
Denicao 6.24 Enviesamento de um estimador
O estimador de , T, possui enviesamento
11
dado por
bias
[T(X)] = E[T(X)] . (6.8)

Como seria de esperar um estimador centrado (enviesado, resp.) de possui enviesamento
nulo (n ao nulo, resp.).
Nota 6.25 Enviesamento
Escusado sera dizer que h a a possibilidade de adiantar mais que um estimador para um
par ametro desconhecido. Um estimador de ser a tanto melhor quanto menor for o seu
enviesamento.
Exemplo/Exerccio 6.26 Estimadores centrados de e
2
Considere que X e uma v.a. de interesse com distribuic ao arbitr aria, valor esperado e
vari ancia
2
.
(a) Prove que
a media da a.a.
X =
1
n
n
i=1
X
i
e a variancia corrigida da a.a.
S
2
=
1
n1
n
i=1
(X
i

X)
2
=
1
n1
_
n
i=1
X
2
i
n(

X)
2
_
s ao estimadores centrados de e
2
, respectivamente.
V.a.
X
i
i.i.d.
X,
E(X
i
) = E(X) = ,
V (X
i
) = V (X) =
2
, i = 1, . . . , n
Estimador de
X =
1
n
n
i=1
X
i
11
O termo anglo-sax onico para enviesamento ou vies e bias.
184
Estimador centrado de ?
Trata-se de facto de um estimador centrado de j a que
E(

X) = E
_
1
n
n
i=1
X
i
_
=
1
n
n
i=1
E(X
i
)
XiX
=
1
n
n
i=1
E(X)
=
1
n
n
=
Estimador de
2
S
2
=
1
n1
n
i=1
(X
i

X)
2
=
1
n1
_
(
n
i=1
X
2
i
) n(

X)
2
_
Estimador centrado de
2
?
De facto, ao tirar-se partido da f ormula alternativa de S
2
e ao notar que
E(Z
2
) = V (Z) +E
2
(Z), E(

X) = e V (

X) =
2
/n, segue-se
E(S
2
) = E
_
1
n 1
n
i=1
(X
i

X)
2
_
=
1
n 1
E
__
n
i=1
X
2
i
_
n(

X)
2
_
=
1
n 1
_
n
i=1
E(X
2
i
) nE[(

X)
2
]
_
=
1
n 1
_
n
i=1
[V (X
i
) +E
2
(X
i
)] n [V (

X) +E
2
(

X)]
_
=
1
n 1
_
n
i=1
(
2
+
2
) n (
2
/n +
2
)
_
=
1
n 1
(n
2
+n
2
2
n
2
)
=
1
n 1
(n 1)
2
=
2
.
Assim, conclui-se que S
2
e efectivamente um estimador centrado de
2
.
185
(b) Demonstre tambem que a
a vari ancia n ao corrigida da a.a.
(S
)
2
=
1
n
n
i=1
(X
i

X)
2
=
1
n
(
n
i=1
X
2
i
) n(

X)
2
=
n1
n
S
2
e um estimador enviesado de
2
e calcule o respectivo enviesamento.
Outro estimador de
2
(S
)
2
=
1
n
n
i=1
(X
i

X)
2
=
n1
n
S
2
Estimador centrado de
2
?
Tendo em conta que (S
)
2
=
n1
n
S
2
rapidamente se conclui que
E
_
(S
)
2
_
= E
_
n 1
n
S
2
_
=
n 1
n
E
_
S
2
_
=
n 1
n

2
=
2
,
pelo que (S
)
2
n ao e um estimador centrado de
2
.
Enviesamento de (S
)
2
bias
2[(S
)
2
] = E[(S
)
2
]
2
=
n 1
n

2
2
=
1
n

2
< 0,
donde se possa concluir que (S
)
2
subestima (em valor esperado)
2
.
Nota 6.27 Variancia (resp. nao) corrigida
E pelo facto de S
2
(resp. (S
)
2
) ser um estimador centrado (resp. enviesado) de
2
que se
denomina este estimador de vari ancia corrigida (resp. n ao corrigida) da a.a..
Motiva cao 6.28 Erro quadratico medio
N ao basta que um estimador de seja centrado para garantir estimativas rigorosas. Estas
ser ao tanto mais rigorosas quanto menos o estimador se dispersar em torno do verdadeiro
valor do par ametro desconhecido .
186
Denicao 6.29 Erro quadratico medio
O erro quadr atico medio (EQM)
12
do estimador de , T = T(X), e dado por
EQM
[T(X)] = E
_
[T(X) ]
2
_
= V [T(X)] + {E[T(X)] }
2
= V [T(X)] + {bias
[T(X)]}
2
. (6.9)
Exerccio 6.30 Demonstre o resultado (6.9).

Nota 6.31 Erro quadratico medio
Uma vez denido o erro quadr atico medio, escusado ser a dizer que:
1. EQM quantica a dispers ao esperada do estimador em torno do verdadeiro valor do
par ametro desconhecido .
2. Um estimador ser a tanto melhor quanto menor for o seu EQM. Assim, ao lidarmos
com dois estimadores de devemos optar por aquele que possuir o menor EQM,
j a que conduzir a a estimativas mais rigorosas de . Deste modo estaremos a optar
pelo estimador mais ecientede .
Denicao 6.32 Eciencia relativa de estimadores
Sejam T
1
= T
1
(X) e T
2
= T
2
(X) dois estimadores do par ametro desconhecido . Ent ao a
eciencia de T
1
com respeito a T
2
na estimac ao de e dada por
e
[T
1
(X), T
2
(X)] =
EQM
[T
2
(X)]
EQM
[T
1
(X)]
. (6.10)
Assim sendo, se
e
[T
1
(X), T
2
(X)] > 1 EQM
[T
2
(X)] > EQM
[T
1
(X)], (6.11)
diremos que o estimador T
1
(X) e mais eciente que T
2
(X) na estima cao de .
12
A designacao anglo-sax onica e mean square error (MSE).
187
Exemplo 6.33 Eciencia relativa de estimadores
Num estudo previo ao lan camento no mercado de uma nova pilha de pacemaker
foram postas algumas questoes acerca da sua dura cao (em milhares de dias) a
um engenheiro. Estudos anteriores (embora com outros tipos de pilhas) levam a
crer que tal v.a. possui distribuic ao uniforme(0, ), onde o par ametro e positivo,
desconhecido e representa a idade maxima da pilha.
Calcule a eciencia relativa de X
(n)
com respeito a 2

X no que se refere ` a estimac ao do
par ametro . Para o efeito, atente que E[X
(n)
] =
n
n+1
e V [X
(n)
] =
n
(n+2)(n+1)
2

2
. Diga
qual dos dois estimadores e mais eciente.
V.a.
X
i
= dura cao da pilha i, i = 1, . . . , n
X
i
i.i.d.
X, i = 1, . . . , n
Distribuicao
X uniforme(0, )
Parametro
desconhecido ( > 0)
Estimador de
X
(n)
= max
i=1,...,n
X
i
Erro quadratico medio de X
(n)
EQM
[X
(n)
] = V [X
(n)
] +
_
bias
[X
(n)
]
_
2
= V [X
(n)
] +
_
E[X
(n)
]
_
2
=
n
(n + 2)(n + 1)
2

2
+
_
n
n + 1

_
2
=
2
(n + 2)(n + 1)

2
Outro estimador de
2

X
188
Erro quadratico medio de 2

X
Se se tiver em considera c ao que E(

X) = E(X), V (

X) =
V (X)
n
, E(X)
form.
=

2
e
V (X)
form.
=

2
12
tem-se
EQM
(2

X) = V (2

X) +
_
bias
(2

X)
_
2
= V (2

X) +
_
E(2

X)
_
2
=
2
2
n
V (X) + [2E(X) ]
2
=
2
2
n
2
12
+
_
2

2

_
2
=
1
3n

2
Eciencia relativa de X
(n)
com respeito a 2

X
e
[X
(n)
, 2

X] =
EQM
(2

X)
EQM
(X
(n)
)
=
1
3n

2
2
(n+2)(n+1)

2
=
(n + 2)(n + 1)
6n
que constitui o termo geral de uma sucessao mon otona n ao decrescente cujos dois
primeiros termos s ao iguais a 1.
Comentario
Tendo em conta a expressao de e
[X
(n)
, 2

X] pode armar-se que
X
(n)
e 2

X s ao igualmente ecientes, para n = 1, 2,
no entanto,
X
(n)
e mais eciente que 2

X, para n > 2.
Curiosamente, X
(n)
n ao e estimador centrado de ao contr ario de 2

X.
189
6.3 Metodo da maxima verosimilhan ca.
Ate ao momento introduzimos estimadores cujas concretiza coes constituem valores
razo aveis para parametros desconhecidos. Apresent amos tambem propriedades desejaveis
para esses mesmos estimadores por forma a que conduzam a estimativas rigorosas
desses par ametros. Resta adiantar um metodo de obten c ao sistem atica de estimadores
de par ametros desconhecidos e j a agora averiguar se tais estimadores possuem boas
propriedades.
Motiva cao 6.34 Metodo da maxima verosimilhan ca
O metodo da m axima verosimilhan ca (MV) permite obter o valor mais plausvel/ verosmil
de um par ametro desconhecido de entre todos os valores possveis para esse mesmo
par ametro , tendo em conta a amostra x = (x
1
, . . . , x
n
) de que dispomos.
Por forma a descrever o metodo da MV e necessario denir a funcao de verosimilhan ca.
Denicao 6.35 Fun cao de verosimilhan ca
A func ao de verosimilhan ca
13
e representada por L(|x), d a ideia de quao plausvel e o
valor para o par ametro desconhecido, caso se tenha recolhido a amostra x, e dene-se
do seguinte modo:
Caso discreto
L(|x) = P(X = x|)
=
n
i=1
P(X = x
i
|), , (6.12)
Caso contnuo
L(|x) = f
X
(x|)
=
n
i=1
f
X
(x
i
|), , (6.13)
onde P(|) e f
X
(|) representam a f.p. e a f.d.p. (resp.) da v.a. de interesse X tendo
em conta que e o verdadeiro valor do parametro desconhecido.
13
Na literatura anglo-sax onica likelihood function.
190
Nota 6.36 Funcao de verosimilhanca
1. Por tradi cao quer o par ametro desconhecido, quer o valor que se lhe possa atribuir
s ao representados por .
2. L(|x) : IR, i.e., a func ao de verosimilhan ca tem como argumento (exclusivo)
, possui como domnio o espaco parametrico e toma valores em IR, para cada
valor xo da amostra x.
14
Denicao 6.37 Estimativa de maxima verosimilhan ca

Obtida a amostra x = (x
1
, . . . , x
n
), a estimativa de m axima verosimilhan ca do
par ametro desconhecido corresponde ao ponto de maximo da funcao de verosimilhan ca
ou, equivalentemente, ao ponto de m aximo do logaritmo da funcao de verosimilhan ca.
15
Esta estimativa e representada por

e verica
L(
|x) = max
L(|x) (6.14)
ou, equivalentemente,
ln L(
|x) = max
ln L(|x), (6.15)
onde a fun cao ln L(
|x) e usualmente designada de log-verosimilhan ca.

Nota 6.38 Estimativa de maxima verosimilhan ca
1.

E analiticamente mais conveniente obter o ponto de maximo da fun cao log-
verosimilhan ca (uma soma de logaritmos) que o ponto de m aximo da funcao de
verosimilhan ca (um produto).
2. Quando o espaco parametrico e um conjunto discreto ( = {
1
, . . . ,
m
}) o ponto de
m aximo da func ao de (log-)verosimilhan ca obtem-se por pesquisa ponto por ponto.
3. No caso em que o espa co parametrico e contnuo recorre-se ao procedimento usual
de maximiza c ao comeca-se por obter o ponto de estacionaridade para de seguida
averiguar se tal ponto e efectivamente um ponto de m aximo.
14
Na verdade L(|x) toma valores no intervalo [0, 1], no caso discreto, e em IR
+
, no caso contnuo.
15
Na verdade seria mais correcto denir a estimativa de MV como um ponto de supremo.
191
Ao lidar-se com um unico par ametro desconhecido tem-se:
16
:
d ln L(|x)
d
= 0 (ponto de estacionaridade) (6.16)

d
2
ln L(|x)
d
2
< 0 (ponto de m aximo). (6.17)

Ao lidar-se com um vector de p (p > 1) par ametros desconhecidos, = (
1
, . . . ,
p
),
a estimativa de MV,

= (
1
, . . . ,

p
) nao s o verica
ln L[(
1
, . . . ,
p
)|x]
= 0, j = 1, . . . , p (6.18)
como a matriz hessiana
H() =
2
ln L[(
1
, . . . ,
p
)|x] = [h
ij
()]
i,j=1,...,p
(6.19)
onde h
ij
() =

2
ln L[(1,...,p)|x]
ij
seja denida negativa quando avaliada em

, quando
p > 1.
Caso p = 2,

= (
1
,

2
) satisfaz nao s o (6.18) mas tambem as duas seguintes
condi c oes (Casella e Berger, 2002, p. 322):
(a)
_
2
ln L[(1,2)|x]
2
1
< 0 ou
2
ln L[(1,2)|x]
2
2
< 0;
(b) o determinante da matriz hessiana [h
ij
()]
i,j=1,2
e positivo quando avaliado em
=

, i.e.
h
11
(
) h
22
(
) h
12
(
) h
21
(
) > 0.
4. As equa c oes (6.18) denominam-se equa coes de verosimilhan ca.
5. A estimativa de MV e, naturalmente, uma funcao da amostra, i.e.,
= g(x). (6.20)
Para alem disso n ao se trata de uma v.a. mas da concretiza c ao de uma v.a. com um
nome particular: estimador.
16
A satisfa cao da equa cao (6.16) e condi cao necessaria mas n ao suciente para que se obtenha um
ponto de maximo (eventualmente local). Para que tal aconteca e fundamental que se verique tambem
a continuidade das segundas derivadas numa vizinhan ca do ponto de maximo e que a segunda derivada
seja negativa.
192
Denicao 6.39 Estimador de maxima verosimilhan ca
O estimador de MV de obtem-se por substituic ao de x = (x
1
, . . . , x
n
) por X =
(X
1
, . . . , X
n
) na express ao geral da estimativa de MV,

= g(x), obtendo-se
EMV() = g(X). (6.21)
Trata-se de uma v.a. exclusivamente dependente da a.a. X, logo uma estatstica.
Exemplo 6.40 Estimador e estimativa de MV (caso discreto)
Um inquerito recente feito a 1000 habitantes de uma regi ao rural revelou que 448 pessoas
apoiam a aplica cao de penas de prisao pesadas em crimes de fogo posto.
Deduza a estimativa de maxima verosimilhan ca da probabilidade (p) de uma pessoa
escolhida ao acaso em tal regi ao ser favor avel ` a aplica c ao da referida pena. Verique que
o estimador associado e centrado.
V.a. de interesse
X = resposta ao inquerito
Distribuicao
X Bernoulli(p)
p = P(X = 1), 0 p 1
F.p.
P(X = x)
form
= p
x
(1 p)
1x
, x = 0, 1
Amostra
x = (x
1
, . . . , x
n
) amostra de dimensao n proveniente da popula cao X onde x
i
=
resposta da i esima pessoa
x : n = 1000
x =
448
1000
= 0.448 = 44.8% respostas armativas
193
Obten cao da estimativa de MV de p
Passo 1 Funcao de verosimilhan ca
L(p|x) =
n
i=1
P(X = x
i
)
=
n
i=1
_
p
xi
(1 p)
1xi
_
= p
n
i=1
xi
(1 p)
n
n
i=1
xi
Passo 2 Funcao de log-verosimilhan ca
ln L(p|x) = ln
_
p
n
i=1
xi
(1 p)
n
n
i=1
xi
_
= ln(p)
n
i=1
x
i
+ ln(1 p)
_
n
n
i=1
x
i
_
Passo 3 Maximiza cao
A estimativa de MV de p, p, obtem-se resolvendo
p :
_
_
d ln L(p|x)
dp
p= p
d
2
ln L(p|x)
dp
2
p= p
< 0 (ponto de maximo)
Tendo em conta a func ao log-verosimilhan ca e relembrando que 0 p 1,
17
tem-se
sucessivamente
p :
_
_
d[ln(p)
n
i=1
xi+ln(1p) (n
n
i=1
xi)]
dp
p= p
d
2
[ln(p)
n
i=1
xi+ln(1p) (n
n
i=1
xi)]
dp
2
p= p
_
_
_
n
i=1
xi
p

n
n
i=1
xi
1p
_
p= p
= 0
n
i=1
xi
p
2

n
n
i=1
xi
(1p)
2
p= p
< 0
_
n
i=1
xi
p

n
n
i=1
xi
1 p
= 0
n
i=1
xi
p
2

n
n
i=1
xi
(1 p)
2
< 0
17
Aqui e ali sera necessario admitir que p = 0, 1.
194
_
_
(1 p)

n
i=1
x
i
p (n
n
i=1
x
i
) = 0
n
i=1
xi
p
2

n
n
i=1
xi
(1 p)
2
< 0
_
_
p =
1
n
n
i=1
x
i
Proposic ao verdadeira j a que 0 p 1
Passo 4 Concretiza cao
Para este inquerito tem-se:
p =
1
n
n
i=1
x
i
( p = x = media da amostra)
=
no. obs. de respostas armativas
no. pessoas inquiridas
= 0.448
Estimador de MV de p
Ser a representado pela v.a. EMV (p) =
1
n
n
i=1
X
i
=

X (i.e., pela media da a.a.)
e possui valor esperado igual a E(

X) = E(X) = p. Deste modo conclui-se que o
estimador de MV de p e centrado.
Exemplo 6.41 Estimador e estimativa de MV (caso contnuo)
Os tempos observados (em anos) ate ` a primeira colis ao de detritos espaciais com diametro
inferior a 1mm em 4 satelites em MEO foram de 1.2, 1.5, 1.8, 1.4.
Admita que tal tempo possui distribui cao pertencente ao modelo exponencial de
par ametro . Obtenha o estimador e a estimativa de MV de .
V.a. de interesse
X = tempo ate primeira colis ao de detritos espaciais (em anos)
Distribuicao
X exponencial()
( > 0)
195
F.d.p.
f
X
(x)
form
=
_
_
_
e
x
, x 0
0, c.c.,
Amostra
x = (x
1
, . . . , x
n
) amostra de dimens ao n proveniente da popula c ao X
x : n = 4
x =
1
4
(1.2 + 1.5 + 1.8 + 1.4) = 1.475
Obten cao da estimativa de MV de
L(|x) =
n
i=1
f
X
(x
i
)
=
n
i=1
_
e
xi
_
=
n
e
n
i=1
xi
ln L(|x) = ln
_
n
e
n
i=1
xi
_
= n ln()
n
i=1
x
i
A estimativa de MV de e aqui representada por

e
:
_
_
d ln L(|x)
d
d
2
ln L(|x)
d
2

Substituindo a func ao log-verosimilhan ca nas expressoes acima e tendo em conta
que > 0, obtem-se
:
_
_
_
n
n
i=1
x
i
_
= 0
< 0
196
_
_
n
n
i=1
x
i
= 0
2
< 0
_
=
n
n
i=1
xi
Proposi c ao verdadeira j a que > 0
Para esta amostra tem-se:
= ( x)
1
= inverso da media da amostra
= 1.475
1
0.678
Estimador de MV de
Ser a representado pela v.a. EMV () = (

X)
1
(i.e, inverso da media da a.a.). Por
sinal nao se trata de estimador centrado de .
O estimador de MV nem sempre e unico e nem sempre e centrado. No entanto, os
estimadores de MV gozam de v arias propriedades importantes, das quais destacamos tres
que enunciaremos informalmente ja de seguida.
Nota 6.42 Propriedades dos estimadores de MV
1. Invariancia
Sejam:

a estimativa de MV de
EMV() o estimador de MV de
h() uma fun cao bijectiva de .
18
Ent ao a estimativa de MV de h() e dada por
18
Exigir que h() seja uma fun cao bijectiva de pode parecer demasiado restritivo. Com efeito, trata-
se de uma condi cao suciente mas n ao necessaria para que seja satisfeita a invari ancia. De acordo com
Rohatgi e Saleh (2001, p. 418) basta que a fun cao h() : IR
p
IR
m
(m p) transforme conjuntos abertos
de IR
p
em abertos de IR
m
.
197
h() = h(
) (6.22)
e o estimador de MV de h() dado por
EMV(h()) = h[EMV()]. (6.23)
2. Suciencia
A suciencia pode ser descrita informalmente do seguinte modo: as estimativas de
MV condensam em geral toda a informa c ao relevante, contida na amostra, sobre o
par ametro desconhecido.
3. Consistencia
Esta propriedade, que de um modo geral os estimadores de MV possuem, pode ser
informalmente traduzida no seguinte comportamento probabilstico: ` a medida que
aumentamos a dimensao da a.a. (n), o EMV() dispersa-se cada vez menos em torno
do verdadeiro valor de (i.e., as inferencias tornam-se cada vez mais rigorosas).
Exemplo 6.43 Propriedade da invariancia dos estimadores de MV
Com o objectivo de estudar o tempo ate falha de certo equipamento electronico (em
dezenas de milhar de horas), uma engenheira recolheu um total de 50 observa coes que
conduziram à media geometrica amostral m
g
=
_
50
i=1
x
i
_
1/50
= 4.2427.
Conrmada a adequa cao do modelo {Pareto(2.5, ), > 0}, cuja f.d.p. e dada por
f
X
(x) =
_
_
_
2.5
x
(+1)
, x 2.5
0, c.c.,
aquela mesma engenheira passou para a fase de estimac ao pontual do par ametro
desconhecido e de uma sua funcao.
19
(a) Prove que a estimativa de m axima verosimilhan ca de e igual a
= [ln(m
g
) ln(2.5)]
1
.
V.a. de interesse
X = tempo ate falha de certo equipamento electr onico (em 10
4
horas)
Distribuicao
X Pareto(2.5, )
19
198
( > 0)
F.d.p.
f
X
(x) =
_
_
_
2.5
x
(+1)
, x 2.5
0, c.c.,
Amostra
x = (x
1
, . . . , x
n
) e uma amostra de dimens ao n proveniente da popula cao X
tal que
n = 50
m
g
=
_
50
i=1
x
i
_1/50
= 4.2427
Obten cao da estimativa de MV de
L(|x) =
n
i=1
f
X
(x
i
)
=
n
i=1
_
2.5
x
(+1)
i
_
=
n
2.5
n
_
n
i=1
x
i
_
(+1)
ln L(|x) = ln
_
_
n
2.5
n
_
n
i=1
x
i
_
(+1)
_
_
= n ln() +nln(2.5) ( + 1)
n
i=1
ln(x
i
)
= n ln() +nln(2.5) n( + 1) ln(m
g
)
Representar-se- a a estimativa de MV de por

e e sabido que
:
_
_
d ln L(|x)
d
d
2
ln L(|x)
d
2
< 0 (ponto de maximo).

199
Tirando partido da express ao da func ao log-verosimilhan ca e do facto de > 0,
segue-se
:
_
_
_
n
+n ln(2.5) n ln(m
g
) = 0
2
< 0
_
_
_
=
1
ln(mg)ln(2.5)
Proposic ao verdadeira j a que > 0
Particularizando para a amostra recolhida obtem-se:
= [ln(m
g
) ln(2.5)]
1
= [ln(4.2427) ln(2.5)]
1
1.8907.
(b) Obtenha a estimativa de MV da probabilidade de a dura c ao do equipamento exceder
um perodo de 35.000 horas.
Outro parametro desconhecido
h() = P(X > 3.5)
=
_
+
3.5
2.5
x
(+1)
dx
= 2.5
x
(+1)+1
( + 1) + 1
+
3.5
=
_
2.5
3.5
_
Estimativa de MV de h()
Uma vez que h() e uma fun cao bijectiva de pode invocar-se a propriedade
da invariancia dos estimadores de MV e concluir que a estimativa de MV de
h() e
h() = h(
) =
_
2.5
3.5
_
=
_
2.5
3.5
_
1.8907
0.5293.
200
6.4 Distribuic oes amostrais.
Motiva cao 6.44 Distribuicao amostral
A caracteriza cao probabilstica de estatsticas, de estimadores ou de suas func oes revela-se
crucial para
avaliar as propriedades dos estimadores (enviesamento, EQM, eciencia relativa,
etc.) e
obter estimativas intervalares de par ametros desconhecidos (intervalos de conanca
Cap. 7).
Denicao 6.45 Distribuicao amostral
A distribui cao de uma estatstica, estimador ou sua func ao e denominada de distribui c ao
amostral (ou distribuicao por amostragem).
Proposicao 6.46 Duas distribuicoes amostrais
Seja X = (X
1
, . . . , X
n
) uma a.a. de dimensao n proveniente da popula c ao X com f.d.
F
X
(x). Ent ao
Estatstica Distribui cao amostral
X
(1)
= mini=1,...,n Xi FX(1)
(x) = 1 [1 FX(x)]
n
X
(n)
= maxi=1,...,n Xi FX(n)
(x) = [FX(x)]
n
Nota 6.47 Duas distribuic oes amostrais

Os resultados da Proposi c ao 6.46 sao v alidos para qualquer v.a. de interesse,
independentemente da sua distribuicao ou do seu car acter ser discreto ou contnuo.
Para alem disso, caso X
i
represente a dura cao da iesima componente de um sistema
constitudo por n componentes, tem-se que:
X
(1)
= min
i=1,...,n
X
i
representa a dura c ao de um sistema em serie;
X
(n)
= max
i=1,...,n
X
i
representa a dura cao de um sistema em paralelo.
201
Exemplo/Exerccio 6.48 Duas distribuicoes amostrais
V.a.
X
i
i.i.d.
X, i = 1, . . . , n
F.d. de X
F
X
(x) = P(X x), < x < +
Nova v.a.
X
(1)
= min
i=1,...,n
X
i
Distribuicao amostral de X
(1)
F
X(1)
(x) = P[X
(1)
x]
= 1 P[X
(1)
> x]
= 1 P(X
i
> x, i = 1, . . . , n)
Xi indep
= 1
n
i=1
P(X
i
> x)
XiX
= 1
n
i=1
P(X > x)
= 1 [P(X > x)]
n
= 1 [1 F
X
(x)]
n
Outra v.a.
X
(n)
= max
i=1,...,n
X
i
Distribuicao amostral de X
(n)
F
X(n)
(x) = P[X
(n)
x]
= P(X
i
x, i = 1, . . . , n)
Xi indep
=
n
i=1
P(X
i
x)
XiX
=
n
i=1
P(X x)
= [P(X x)]
n
= [F
X
(x)]
n
.
202
Exerccio 6.49 Distribuic oes amostrais
Considere que um sistema mec anico e composto por 5 componentes cujos tempos ate falha
s ao i.i.d. a X exponencial() e valor esperado comum igual 1000 horas.
(a) Calcule a probabilidade de o tempo ate falha do sistema exceder 2500 horas ao
admitir que as componentes foram colocadas em paralelo.
V.a.
X
i
= dura cao da componente i, i = 1, . . . , 5
X
i
i.i.d.
X, i = 1, . . . , 5
Distribuicao de X
X exponencial()
Parametro
: E(X) = 1000
1
= 1000
= 0.001
F.d. de X
F
X
(x) =
_
_
_
0, x < 0
1 e
0.001x
, x 0
Dura cao do sistema em paralelo
X
(5)
= max
i=1,...,5
X
i
F.d. de X
(5)
F
X(5)
(x) = [F
X
(x)]
5
=
_
1 e
0.001x
_
5
, x 0
P[X
(5)
> 2500] = 1 F
X(5)
(2500)
= 1
_
1 e
0.0012500
_
5
= 0.348353.
203
(b) Volte a calcular a probabilidade solicitada em (a) admitindo que as componentes
foram colocadas em serie.
Dura cao do sistema em serie
X
(1)
= min
i=1,...,5
X
i
F.d. de X
(1)
F
X(1)
(x) = 1 [1 F
X
(x)]
5
= 1 [1 (1 e
0.001x
)]
5
= 1 e
50.001x
= F
exp(50.001)
(x), x 0
Nota
X
i
i.i.d.
exponencial(), i = 1, . . . , n
X
(1)
= min
i=1,...,n
X
i
exponencial(n ).
P[X
(1)
> 2500] = 1 F
X(1)
(2500)
= 1 (1 e
50.0012500
)
3.7 10
6
(c) Comente os valores obtidos em (a) e (b).
Comentario Constata-se que
P[X
(1)
> 2500] << P[X
(5)
> 2500], (6.24)
conrmando um facto j a bem conhecido: os sistemas em serie tem dura c ao
(estocasticamente) menor que os sistemas em paralelo.
204
6.5 Distribuic oes amostrais de medias.
Motiva cao 6.50 Distribuic oes amostrais da media
A media e de um modo geral o estimador de MV do valor esperado de qualquer v.a. de
interesse,
20
pelo que e fundamental saber qual a sua distribuic ao exacta que, rera-se,
nem sempre e de f acil obten c ao.
Proposicao 6.51 Duas distribuicoes amostrais da media
Seja X = (X
1
, . . . , X
n
) uma a.a. de dimensao n proveniente da popula c ao X. Ent ao
Popula cao Distribui cao amostral da media
X normal(,
2
)

X normal(,
2
/n)

X
/
n
normal(0, 1)
X com distrib. arbitr aria (n ao normal),

X
/
n
a
TLC normal(0, 1)
E(X) = , V (X) =
2
< +, n grande
Nota 6.52 Duas distribuic oes amostrais da media

O primeiro dos dois resultados da Proposicao 6.51 e um resultado exacto e deve-se ao
facto de a combina c ao linear de v.a. independentes e com distribuic oes normais ainda
possuir distribuicao normal.
O segundo resultado e aproximado, deve-se ao Teorema do Limite Central e s o deve
ser aplicado quando a v.a. de interesse n ao possui distribuic ao normal e a dimens ao da
amostra e sucientemente grande.
Exemplo 6.53 Uma distribuicao amostral (aproximada) da media da a.a.
Admita que o desvio absoluto de uma medi cao instrumental em rela c ao a uma norma e
uma v.a. X com distribuic ao exponencial com parametro desconhecido.
Calcule E(

X) e V (

X), onde

X representa, naturalmente, a media de uma amostra
aleat oria de dimensao n proveniente da popula c ao X. Tirando partido dos resultados
anteriores mostre que, para n sucientemente grande, se tem
21
Z = (

X 1)
n
a
normal(0, 1).
20
Ou esta de algum modo relacionada com esse estimador.
21
205
V.a.
X =desvio absoluto de uma medic ao instrumental em rela c ao a uma norma
Distribuicao
X exponencial()
Parametro
desconhecido ( > 0)
Nova v.a.
Z = (

X 1)
n
Distribuicao aproximada de Z
Comece-se por notar que neste caso E(X) = 1/ e V (X) = 1/
2
, pelo que
E(

X) = E(X)
=
1
V (

X) =
V (X)
n
=
1
n
2
< +.
Ent ao, de acordo com o TLC, pode armar-se que, para n sucientemente grande
(n = 40 > 30),
Z =
X E(

X)
_
V (

X)
=
X
1
_
1
n
2
= (

X 1)
n
a
normal(0, 1).
Teremos ocasiao de estudar outras distribuicoes amostrais da media da a.a. que ser ao
oportunamente introduzidas à medida que forem necessarias no captulo seguinte.
206
Captulo 7
Estima cao por intervalos
7.1 No coes basicas.
Motiva cao 7.1 Intervalos de conan ca
Para alem de uma estimativa pontual para o par ametro desconhecido, e importante
adiantar um intervalo que de uma ideia da conan ca que se pode depositar na estimativa
pontual.
Este intervalo ou estimativa intervalar e, de um modo geral, denominado de intervalo
de conan ca. E os valores mais usuais para o grau de conan ca s ao: 90%, 95% e 99%.
Exemplo 7.2 Intervalo de conan ca
Admita que a resistencia de uma componente electr onica (em ohm, ) e uma v.a. X
normal(,
2
), onde e desconhecido e e conhecido e igual a 4.
Para obter-se informa cao sobre o valor esperado da resistencia da componente, ,
recolheu-se uma amostra de dimensao n = 4, tendo-se registado o seguinte conjunto de
observa coes: x = (5.0, 8.5, 12.0, 15.0).
(a) Obtenha a estimativa de MV de .
= x =
1
4
(5.0 + 8.5 + 12.0 + 15.0) = 10.125 .
(b) Obtenha um intervalo de conan ca a 95% para .
E sabido que EMV () =

X. Mais ainda, que
Z =
X
/
n
normal(0, 1). (7.1)
207
Importa notar que a v.a. Z depende de
EMV () =

X
,
no entanto, possui distribuic ao independente de . Assim sendo, pode calcular-se,
por exemplo, a seguinte probabilidade:
P(1.96 Z +1.96) = (1.96) (1.96)
= (1.96) [1 (1.96)]
= 0.9750 0.0250
= 0.9500. (7.2)
Equivalentemente,
P
_
1.96

X
/
n
+1.96
_
= 0.9500
P
_
1.96

n

X +1.96

n
_
= 0.9500
P
_

X 1.96

n

X + 1.96

n
_
= 0.9500.
(7.3)
Importa notar que:
1. O intervalo de extremos aleat orios
_

X 1.96

n
,

X + 1.96

n
_
(7.4)
contem {} com probabilidade 0.9500.
2. A concretiza c ao deste intervalo para a nossa amostra x = (5.0, 8.5,
12.0, 15.0) e dada por:
_
x 1.96

n
, x + 1.96

n
_
=
_
10.125 1.96
4
4
, 10.125 + 1.96
4
4
_
= [6.205, 14.045].
(7.5)
3. pertence ao intervalo [6.205, 14.045] ou com probabilidade 1 (um) ou com
probabilidade 0 (zero), i.e., pertence ou nao ao intervalo e nada mais podemos
adiantar por desconhecimento do verdadeiro valor de .
208
4. Caso recolhessemos um grande n umero de amostras de dimens ao n = 4 e
obtivessemos os correspondentes intervalos
_
x 1.96

n
, x + 1.96

n
_
, (7.6)
a propor c ao destes intervalos aos quais pertenceria o verdadeiro valor de seria
de aproximadamente 95%. (Esquema...)

E esta a interpreta cao frequencista
da expressao conanca a 95%.
Denicao informal 7.3 Intervalo de conan ca (IC)
Um IC para o par ametro e do tipo [l, u], onde l e u representam os respectivos limites
inferior (lower) e superior (upper), respectivamente. Estes limites tem ainda a
particularidade de serem fun coes:
da amostra x, em particular de uma estimativa pontual de ;
dos quantis de probabilidade respeitantes ` a distribuicao de uma v.a. que, apesar de
depender de e de um estimador de , possui distribuic ao nao dependente de .
1
A este intervalo est a associado um grau de conan ca, usualmente representado
por (1 ) 100%, cujos valores mais usuais sao 90%, 95% e 99%, i.e.,
= 0.1, 0.05, 0.01.
Motiva cao 7.4 Metodo de obten cao de intervalos de conan ca
E necessario adiantar um metodo de obtencao sistematica de intervalos de conan ca para

um par ametro desconhecido .
Denicao 7.5 Metodo da v.a. fulcral
Antes de mais e necessario descrever a situa c ao com que lidamos, em particular convem
identicar:
a v.a. de interesse X e a respectiva distribui cao;
o par ametro desconhecido para o qual se pretende obter um IC;
outro eventual par ametro (conhecido ou desconhecido) da distribui cao de X.
1
Esta deni cao de IC esta claramente associada ao metodo de obten cao de intervalos de conan ca
descrito j a de seguida. Para mais metodos de obten cao de IC, recomenda-se a leitura de Rohatgi e Saleh
(2001, p. 532559).
209
Posto isto, o metodo da v.a. fulcral compreende 4 passos:
Passo 1 Seleccao da v.a. fulcral para
E necessario identicar uma v.a. exclusivamente dependente da a.a. X e do

par ametro desconhecido , doravante representada por
Z = Z(X, ), (7.7)
que, no entanto, possui distribuic ao exacta (ou aproximada) independente de .
Esta v.a. e, por regra, uma funcao trivial do estimador de MV de , consta, de
um modo geral, do formul ario da disciplina e e usualmente designada de v.a. fulcral
para .
Escusado sera dizer que a v.a. fulcral para , Z, n ao depende de mais nenhum
par ametro desconhecido senao de .
Passo 2 Obten cao dos quantis de probabilidade
Identicada que foi a v.a. fulcral para e a respectiva distribuic ao exacta (ou
aproximada), deve proceder-se à obtencao de um par de quantis dependentes do
grau de conan ca e, por isso mesmo, representados por a
e b
. Assim:
(a
, b
) :
_
_
_
P(a
Z b
) = 1
P(Z < a
) = P(Z > b
) = /2.
(7.8)
(Esquema...) Deste modo, conclui-se que
_
_
_
a
= F
1
Z
(/2)
b
= F
1
Z
(1 /2),
(7.9)
onde F
1
Z
(p) representa o quantil de ordem p da distribui cao exacta (ou aproximada)
da v.a. fulcral para .
2
Passo 3 Inversao da desigualdade a
Z b
De modo a obter um intervalo com extremos aleat orios que contenha {} com
probabilidade (1 ) e crucial inverter a dupla desigualdade a
Z b
em
ordem a :
P(a
Z b
) = 1
.
.
.
P [T
1
(X) T
2
(X)] = 1 ,
(7.10)
2
Pela forma como estes quantis estao denidos eles dizem quantis equilibrados. Rera-se ainda que a
primeira equacao do sistema (7.8) e redundante, pelo que sera doravante omitida.
210
onde T
1
(X) e T
2
(X) sao os extremos aleat orios ha pouco referidos, n ao s o
dependentes da a.a. X mas tambem dos quantis de probabilidade a
e b
.
Neste passo limitamo-nos a substituir, nas expressoes de T
1
(X) e T
2
(X),
X
1
, . . . , X
n
(7.11)
pelas respectivas observa c oes,
x
1
, . . . , x
n
, (7.12)
obtendo-se deste modo o IC a (1 ) 100% para :
IC
(1)100%
() = [T
1
(x), T
2
(x)]. (7.13)
211
7.2 Intervalos de conan ca para o valor esperado,
variancia conhecida.
Nesta seccao, à semelhanca do que acontecera com as seguintes, serao apresentados
intervalos de conan ca para par ametros de interesse. Esta apresenta cao obedecera um
gurino que passa pela identica c ao da distribuic ao da nossa v.a. de interesse (popula cao)
e dos par ametros conhecidos e desconhecidos, muito em particular aquele para o qual
pretendemos obter um IC. A esta identica c ao seguem-se a aplica c ao do metodo da v.a.
fulcral e alguns reparos que entendamos pertinentes.
Na obten cao de intervalos de conan ca para o valor esperado de uma populacao com
vari ancia conhecida, distinguiremos dois casos:
1. Popula c ao normal
2. Popula c ao com distribuic ao arbitr aria e dimens ao da amostra sucientemente
grande.
CASO 1 IC para o valor esperado de popula cao normal com variancia
conhecida
Situa cao
X normal(,
2
)
desconhecido
3
2
conhecido.
Nunca ser a de mais salientar que a v.a. fulcral para encontra-se no formulario e
ser a seleccionada tendo sempre presente que deve depender de (e de mais nenhum
outro par ametro desconhecido) e de um estimador de e deve possuir distribui cao
exacta com par ametros conhecidos, logo independente de . Assim:
Z =
X
/
n
normal(0, 1). (7.14)
(Ver formulario.)
3
A palavra desconhecidoesta intencionalmente em letras mai usculas para chamar aten cao para o
facto de ser este o par ametro para o qual pretendemos calcular o IC.
212
(a
, b
) :
_
_
_
P(Z < a
) = /2
P(Z > b
) = /2
_
_
_
a
=
1
(/2) =
1
(1 /2)
b
=
1
(1 /2).
(7.15)
Os quantis de probabilidade a
e b
s ao simetricos pois a f.d.p. da distribuic ao

normal(0, 1) e simetrica em rela c ao ` a origem.
a
e b
obtem-se por consulta da tabela de quantis da p agina 8 do conjunto de

tabelas disponibilizadas para esta disciplina.
Z b
P(a
Z b
) = 1
P
_
a

X
/
n
b
_
= 1
P
_

X b
n

X a
n
_
= 1
P
_

X
1
(1 /2)

n

X +
1
(1 /2)

n
_
= 1 .
IC
(1)100%
()
=
_
x
1
(1 /2)

n
, x +
1
(1 /2)

n
_
.
(7.16)
Exemplo 7.6 IC para o valor esperado de popula cao normal com variancia
conhecida
Retome o Exemplo 7.2 e obtenha agora um intervalo de conan ca a 90% para o valor
esperado da resistencia da componente electronica. Recorra ao metodo da v.a. fulcral,
passo a passo.
V.a.
X = resistencia da componente electr onica (em )
Situa cao
X normal(,
2
)
desconhecido
2
conhecido.
213
Z =
X
/
n
normal(0, 1).
j a que pretendemos um IC para o valor esperado de popula c ao normal com variancia
conhecida. (Ver formulario.)
Dado que o nvel de conan ca e igual a (1 ) 100% = 90% (i.e. = 0.1),
lidaremos com os quantis
_
_
_
a
=
1
(1 /2) =
1
(0.95)
tabela
= 1.6449
b
=
1
(1 /2) =
1
(0.95) = 1.6449.
Z b
P(a
Z b
) = 1
.
.
.
P
_

X
1
(1 /2)

n

X +
1
(1 /2)

n
_
= 1 .
Ao notar-se que
IC
(1)100%
() =
_
x
1
(1 /2)

n
, x +
1
(1 /2)

n
_
,
onde
n = 4
x = 10.125
1
(1 /2) = 1.6449
= 4
tem-se
IC
90%
() =
_
10.125 1.6449
4
4
, 10.125 + 1.6449
4
4
_
= [6.8352, 13.4148].
214
CASO 2 IC aproximado para o valor esperado de popula cao arbitraria com
variancia conhecida
Situa cao
X com distribuic ao arbitr aria (nao normal): E(X) = , V (X) =
2
desconhecido
2
conhecido
n sucientemente grande para justicar o recurso ao Teorema do Limite Central
(TLC).
Ao aplicar o TLC conclui-se que
Z =
X
/
n
a
normal(0, 1). (7.17)
Uma vez que s o conhecemos a distribuic ao aproximada de v.a. fulcral para ,
Z, os quantis a
e b
denidos abaixo enquadram esta v.a. com probabilidade

aproximadamente igual a (1 ). Com efeito,
_
_
_
a
=
1
(1 /2)
b
=
1
(1 /2).
_
_
_
P(Z < a
) /2
P(Z > b
) /2
(7.18)
Z b
P(a
Z b
) 1
.
.
.
P
_

X
1
(1 /2)

n

X +
1
(1 /2)

n
_
1
O IC
IC() =
_
x
1
(1 /2)

n
, x +
1
(1 /2)

n
_
(7.19)
possui grau de conan ca aproximadamente igual a (1 ) 100% ja que s o se
conhece a distribui c ao aproximada da v.a. fulcral de .
4
N ao surpreende pois que
este intervalo seja denominado de IC aproximado para .
4
Da ter-se retirado o ndice (1 ) 100% de IC.
215
Exemplo 7.7 IC aproximado para o valor esperado de popula cao arbitraria
com variancia conhecida
Ao estudar-se a densidade de constru cao (X) num projecto de urbaniza c ao foi recolhida
uma amostra de 50 lotes desse projecto, tendo-se obtido

50
i=1
x
i
= 227.2.
5
(a) Assumindo que o desvio-padrao de X e igual a 4, obtenha um intervalo de conan ca
aproximadamente igual a 95% para o valor esperado da densidade de constru cao.
V.a.
X = densidade de constru c ao em projecto de urbaniza c ao
Situa cao
2
desconhecido
2
conhecido
n = 50 > 30, pelo que a dimensao da amostra e sucientemente grande.
Deve usar a seguinte v.a. fulcral para
Z =
X
/
n
a
TLC
normal(0, 1)
dado que foi solicitado um IC aproximado para o valor esperado de popula c ao
arbitr aria com vari ancia conhecida e a dimensao da amostra (n = 50) e
sucientemente grande para justicar o recurso ao TLC.
Ao considerar-se um nvel de conan ca aproximadamente igual a
(1 ) 100% = 95% (i.e., = 0.05), faremos uso dos quantis
_
_
_
a
=
1
(1 /2) =
1
(0.975)
tabela
= 1.9600
b
=
1
(1 /2) =
1
(0.975) = 1.9600.
Z b
P(a
Z b
) 1
.
.
.
P
_

X
1
(1 /2)

n

X +
1
(1 /2)

n
_
1
5
216
Tendo em conta que a expressao do IC aproximado a (1 ) 100% e
IC() =
_
x
1
(1 /2)

n
, x +
1
(1 /2)

n
_
,
onde
n = 50
x =
1
50
50
i=1
x
i
= 227.2/50 = 4.544
1
(1 /2) = 1.9600
= 4,
segue-se
IC() =
_
4.544 1.9600
4
50
, 4.544 + 1.9600
4
50
_
= [3.435, 5.653].
(b) Que dimensao deveria ter a amostra para que a amplitude do intervalo aproximado
fosse reduzida para metade?
Obten cao da nova dimensao da amostra
Em primeiro lugar note-se que a amplitude de um intervalo de conan ca
aproximadamente igual a (1 ) 100% e dada por
_
x +
1
(1 /2)

n
_
_
x
1
(1 /2)

n
_
= 2
1
(1 /2)

n
,
ao recorrer-se a uma amostra de dimens ao n.
Seja n
a nova dimensao de amostra que reduz tal amplitude para metade.

Ent ao
n
: 2
1
(1 /2)

=
1
2

_
2
1
(1 /2)

n
_
1
=
1
2

1
n
n
= 4n
n
= 200.
E necessario quadruplicar a dimensao da amostra para que a amplitude do

intervalo aproximado seja reduzida para metade.
217
Nota 7.8 Intervalos de conan ca
1. A amplitude do IC est a relacionada com a precisao das estimativas pontual e
intervalar. Com efeito, quanto menor a amplitude do IC (com (1 ) 100%
xo) mais precisas s ao estas estimativas.
2. Ao aumentarmos a dimensao da amostra, mantendo o grau de conan ca
(1 ) 100% xo, diminuimos a amplitude do IC e aumentamos a precis ao destas
estimativas.
3. Ao aumentarmos (1 ) 100%, mantendo a dimens ao da amostra n xa,
aumentamos a amplitude do IC, logo diminuimos a precis ao das estimativas.
4. N ao faz sentido considerar (1 ) 100% = 100% (i.e., = 0) por este valor
conduzir a um intervalo de conan ca absolutamente in util: IC = .
218
7.3 Intervalos de conan ca para a diferenca de dois
valores esperados, variancias conhecidas.
Motiva cao 7.9 IC para a diferenca de valores esperados
E frequente desejar confrontar os valores esperados dos desempenhos de duas m aquinas ou

de dois metodos, etc.
6
A obten c ao de um IC para a diferenca entre esses valores esperados
revelar-se-a de extrema utilidade, nomeadamente, para inferir da superioridade (ou nao)
de desempenho de um/a metodo/m aquina.
Tal como aconteceu na secc ao anterior, distinguiremos dois casos, desta vez
1. Duas popula c oes independentes, com distribuic oes normais
2. Duas popula c oes independentes, com distribuic oes arbitr arias e dimensoes das duas
amostras sucientemente grandes,
sendo que as vari ancias sao, em qualquer dos dois casos, conhecidas.
CASO 1 IC para a diferenca de valores esperados de duas popula c oes
normais independentes com variancias conhecidas
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
e
2
2
conhecidos.
Obs. Admita-se que

X
i
representa a media da a.a. i de dimensao n
i
respeitante
` a v.a. de interesse/popula c ao X
i
(i = 1, 2).
Passo 1 Seleccao da v.a. fulcral para (
1
2
)
A v.a. fulcral para (
1

2
) encontra-se no formul ario e tem a particularidade de
depender de (
1
2
) (e de mais nenhum outro par ametro desconhecido) e de um
estimador de (
1

2
), (

X
1

X
2
). Para alem disso, possui distribuic ao exacta
conhecida e independente de (
1
2
). Assim, lidaremos com
Z =
(

X
1

X
2
) (
1
2
)
_
2
1
n1
+

2
2
n2
normal(0, 1) (7.20)
6
Passamos pois a lidar com duas vari aveis de interesse/popula coes.
219
j a que

X
i

indep.
normal(
i
,
2
i
/n
i
), i = 1, 2.
7
(Ver formulario.)
_
_
_
a
=
1
(1 /2)
b
=
1
(1 /2).
(7.21)
Z b
A invers ao faz-se de modo an alogo...

P
_
_
a

(

X1
X2)(12)
_
2
1
n
1
+
2
2
n
2
b
_
_
= 1

P
_
(

X
1

X
2
)
1
(1 /2)
_
2
1
n1
+

2
2
n2

1
2
(

X
1

X
2
) +
1
(1 /2)
_
2
1
n1
+

2
2
n2
_
= 1
IC
(1)100%
(
1
2
) =
_
( x
1
x
2
)
1
(1 /2)
_
2
1
n1
+

2
2
n2
,
( x
1
x
2
) +
1
(1 /2)
_
2
1
n1
+

2
2
n2
_
.
(7.22)
Nota 7.10 IC para o valor esperado ou a diferenca de valores esperados
Dado que a distribui cao normal possui f.d.p. simetrica em rela cao ` a origem, minizaremos
a amplitude esperada do IC logo aumentaremos a precisao do IC ao tomarmos
quantis simetricos. Ali as, e por isso que temos considerado ate ao momento quantis de
probabilidade simetricos/equilibrados.
7
Para justicar estes resultados basta notar que:

Xi e uma combina cao linear de v.a. normais
independentes, logo tambem com distribui cao normal;

X1 e

X2 sao independentes uma vez que assumimos
que as duas a.a. tambem o sao. Por m, resta invocar o fecho da distribui cao normal para somas/diferencas
de v.a. independentes para concluir que (

X1

X2) tambem tem distribui cao normal, com valor esperado
E(

X1

X2) = E(

X1) E(

X2) = 1 2 e vari ancia V (

X1

X2) = V (

X1) +V (

X2) =

2
1
n1
+

2
2
n2
.
220
Exemplo 7.11 IC para a diferenca de valores esperados de duas popula c oes
normais independentes com variancias conhecidas
Uma amostra de 10 peixes foi recolhida de um lago e medidas as concentracoes de PCB.
Os resultados em ppm (partes por milhao) foram para o Lago 1: 11.5, 10.8, 11.6, 9.4,
12.4, 11.4, 12.2, 11.0, 10.6, 10.8.
Por outro lado, foi recolhida uma amostra de 8 peixes de outro lago e medidas tambem
as concentra coes de PCB, tendo-se obtido os valores seguintes para o Lago 2: 11.8, 12.6,
12.2, 12.5, 11.7, 12.1, 10.4, 12.6.
Considere que estes dois grupos de medic oes sao concretizacoes de duas a.a.
independentes provenientes de distribuic oes normais com valores esperados desconhecidos
1
e
2
e vari ancias
2
1
= 0.09 e
2
2
= 0.06, respectivamente.
Obtenha um IC a 99% para a diferenca dos valores esperados das concentra c oes de
PCB nestes dois lagos. Comente.
8
V.a.
X
i
= concentra cao de PCB no lago i (i = 1, 2)
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
e
2
2
conhecidos.
1
2
)
Uma vez que se tem em vista a obten c ao de IC para a diferenca de valores esperados
de duas popula c oes normais independentes com variancias conhecidas, faremos uso
da seguinte v.a. fulcral para (
1
2
):
Z =
(

X
1

X
2
) (
1
2
)
_
2
1
n1
+

2
2
n2
normal(0, 1).
(Ver formulario.)
Dado que o nvel de conan ca e igual a (1 ) 100% = 99% (i.e., = 0.01),
utilizaremos os quantis
8
221
_
_
_
a
=
1
(1 /2) =
1
(0.995)
tabela
= 2.5758
b
=
1
(1 /2) =
1
(0.995) = 2.5758.
Z b
Omite-se este passo...

Ao ter em conta que a express ao geral deste IC para (
1
2
) e
IC
(1)100%
(
1
2
) =
_
( x
1
x
2
)
1
(1 /2)
_
2
1
n1
+

2
2
n2
,
( x
1
x
2
) +
1
(1 /2)
_
2
1
n1
+

2
2
n2
_
.
e o facto de
n
1
= 10, x
1
= 11.17,
2
1
= 0.09
n
2
= 8, x
2
= 11.9875,
2
2
= 0.06
1
(1 /2) = 2.5758
conclui-se que
IC
99%
(
1
2
) =
_
_
(11.17 11.9875) 2.5758
0.09
10
+
0.06
8
,
(11.17 11.9875) + 2.5758
0.09
10
+
0.06
8
_
_
= [1.1484, 0.4866].
Comentario A estimativa de MV de (
1
2
) e igual a
x
1
x
2
= 0.8175 = 0.
Mais,
IC
99%
(
1
2
) {0},
pelo que o zeron ao e um dos valores razo aveis para (
1

2
). Ora, se tivermos
em conta tudo isto e ainda o facto de
2
= 0
1
=
2
,
n ao parece disparatado armar que as concentra coes de PCB diferem de um lago
para outro.
222
CASO 2 IC aproximado para a diferenca de valores esperados de duas
popula coes arbitrarias (nao normais) independentes com variancias conhecidas
Situa cao
X
1
X
2
, com distribuic oes arbitr arias (n ao normais): E(X
i
) =
i
, V (X
i
) =
2
i
, i =
1, 2
(
1
2
) desconhecido
2
1
e
2
2
conhecidos
n
1
e n
2
sucientemente grandes.
1
2
)
Recorrendo ao TLC obtem-se a v.a. fulcral para (
1

2
) que por sinal n ao se
encontra no formulario por tratar-se de uma variante da v.a. fulcral usada no caso
anterior. Escusado ser a dizer que depende de (
1

2
) e de um estimador de
(
1

2
), para alem de possuir distribuic ao aproximadamente normal padr ao e
como tal independente de
1
2
.
Z =
(

X
1

X
2
) (
1
2
)
_
2
1
n1
+

2
2
n2
a
normal(0, 1). (7.23)
Os quantis
_
_
_
a
=
1
(1 /2)
b
=
1
(1 /2)
(7.24)
enquadram a v.a. fulcral para (
1
2
) com probabilidade aproximadamente igual
a (1 ).
Z b
A invers ao da desigualdade e an aloga...

IC(
1
2
) =
_
( x
1
x
2
)
1
(1 /2)
_
2
1
n1
+

2
2
n2
,
( x
1
x
2
) +
1
(1 /2)
_
2
1
n1
+

2
2
n2
_
(7.25)
possui grau de conan ca aproximadamente igual a (1 ) 100%.
223
Exemplo 7.12 IC aproximado para a diferenca de valores esperados de duas
popula coes arbitrarias (nao normais) independentes com variancias conhecidas
Foram efectuados estudos em Los Angeles e Nova York com o objectivo de determinar a
concentra cao de mon oxido de carbono (CO) perto de vias r apidas. Para o efeito foram
recolhidas amostras de ar para as quais se determinou a respectiva concentra c ao de CO
em ppm (partes por milh ao).
(a) Obtenha um IC aproximado a 95% para a diferenca dos valores esperados das
concentra coes de CO nestas duas cidades tendo em conta a seguinte informa cao:
Los Angeles n1 = 40 x1 = 117.77
2
1
= 10
Nova York n2 = 50 x2 = 97.14
2
2
= 32
V.a.
X
1
= concentra c ao de CO perto de vias r apidas em Los Angeles
X
2
= concentra c ao de CO perto de vias r apidas em Nova York
Situa cao
X
1
X
2
, com distribui coes arbitr arias (n ao normais):
E(X
i
) =
i
, V (X
i
) =
2
i
, i = 1, 2
(
1
2
) desconhecido
2
1
e
2
2
conhecidos
n
1
= 40 > 30 e n
2
= 50 > 30 logo amostras s ao sucientemente grandes.
1
2
)
J a que se pretende IC aproximado para a diferenca de valores esperados de duas
popula c oes arbitrarias (n ao normais) independentes com vari ancias conhecidas
e as dimens oes das amostras justicam o recurso ao TLC, usar-se-a a seguinte
v.a. fulcral:
Z =
(

X
1

X
2
) (
1
2
)
_
2
1
n1
+

2
2
n2
a
normal(0, 1).
O seguinte par de quantis enquadra a v.a. fulcral Z com probabilidade
aproximadamente igual a (1 ) = 0.95 (i.e., = 0.05):
_
_
_
a
=
1
(1 /2) =
1
(0.975)
tabela
= 1.9600
b
=
1
(1 /2) =
1
(0.975) = 1.9600.
224
Z b

Tirando partido do facto de a express ao geral do IC aproximado a
(1 ) 100% ser
IC(
1
2
) =
_
( x
1
x
2
)
1
(1 /2)
_
2
1
n1
+

2
2
n2
,
( x
1
x
2
) +
1
(1 /2)
_
2
1
n1
+

2
2
n2
_
e de
n
1
= 40, x
1
= 117.77,
2
1
= 10
n
2
= 50, x
2
= 97.14,
2
2
= 32
1
(1 /2) = 1.9600,
obtem-se
IC(
1
2
) =
_
_
(117.77 97.14) 1.9600
10
40
+
32
50
,
(117.77 97.14) + 1.9600
10
40
+
32
50
_
_
= [18.7809, 22.4791].
(b) Num programa televisivo em que se debatiam quest oes ambientais, o presidente da
c amara de Nova York armou que: A concentra cao esperada de CO em Nova York
n ao difere da concentra c ao esperada em Los Angeles.Comente esta arma c ao.
Comentario A estimativa de MV de (
1
2
) e superior a 0. Com efeito,
x
1
x
2
= 20.63
e para alem disso
IC(
1
2
) {0},
pelo que o presidente da camara de Nova York deveria ter armado que
a concentra cao esperada de CO em Los Angeles e superior ` a concentra c ao
esperada em New York.
225
7.4 Intervalos de conan ca para o valor esperado,
variancia desconhecida.
Motiva cao 7.13 IC para o valor esperado com variancia desconhecida
Na maior parte das situa c oes desconhecemos quer o valor esperado, quer a variancia da
nossa v.a. de interesse. Neste caso

X
/
n
normal(0, 1) deixa de ser uma v.a. fulcral para
j a que depende de e este par ametro e desconhecido.
Por forma a adiantar uma v.a. fulcral para quando lidamos com uma popula cao
normal com vari ancia desconhecida, ser a preciso enunciar alguns resultados auxiliares que
condensaremos na seguinte proposi cao.
Proposicao 7.14 Distribuicoes do qui-quadrado e de t-Student
Considere-se X
i

i.i.d.
normal(,
2
), i = 1, . . . , n. Ent ao:
1.
_
Xi
_
2
i.i.d.

2
(1)
, i = 1, . . . , n
9
2.

n
i=1
_
Xi
_
2

2
(n)
10
3.
(n1)S
2
2
=
(n1)
2

1
n1
n
i=1
(X
i

X)
2

2
(n1)
4.

X
/
n

(n1)S
2
2
Sejam W normal(0, 1) e Y
2
()
duas v.a. independentes (WY ). Ent ao:
5.
W
Y/
t
()
11
6.

X
S/
n
=
X
/
n
_
(n1)S2
2
n1
d
=
normal(0,1)
_
2
(n1)
n1
t
(n1)
, ja que o numerador e uma v.a.
independente do denominador.
Nota 7.15 Distribuic oes do qui-quadrado e de t-Student
Os quantis de probabilidade das distribui coes do qui-quadrado e de t-Student constam
das paginas 9 e 10 das tabelas disponibilizadas nesta disciplina.
9
Leia-se: a v.a. ... possui distribui cao do qui-quadrado com um grau de liberdade.
10
Leia-se: a v.a. ... possui distribui cao do qui-quadrado com n grau de liberdade. Trata-se de uma
consequencia da propriedade reprodutiva da v.a. do qui-quadrado.
11
Leia-se: a v.a. ... possui distribui cao de t-Student com grau de liberdade
226
CASO 1 IC para o valor esperado de popula cao normal com variancia
desconhecida
Situa cao
X normal(,
2
)
desconhecido
2
desconhecido.
Recorrendo à Proposic ao 7.14 podemos adiantar uma v.a. fulcral para :
Z =
X
S/
n
t
(n1)
. (7.26)
(Ver formulario.) Com efeito, esta v.a. depende de mas nao do par ametro
desconhecido , para alem de depender de um estimador de ,

X, e de um de
, S. Mais, possui distribuic ao exacta conhecida e independente de e de
2
.
Uma vez que a distribui cao de t-Student com (n1) graus de liberdade e igualmente
simetrica em rela c ao ` a origem, minimizaremos a amplitude esperada do IC ao
escolher quantis de probabilidade simetricos:
_
_
_
a
= F
1
t(n1)
(1 /2)
b
= F
1
t(n1)
(1 /2).
(7.27)
(Esquema e consulta de tabelas...)
Z b
Similar à da obten c ao de IC para com conhecido.

IC
(1)100%
()
=
_
x F
1
t(n1)
(1 /2)
s
n
, x +F
1
t(n1)
(1 /2)
s
n
_
,
(7.28)
onde, recorde-se, s
2
=
1
n1
n
i=1
(x
i
x)
2
=
1
n1
[(
n
i=1
x
2
i
) n( x)
2
].
227
Nota 7.16 IC para o valor esperado de popula cao normal, com variancia
desconhecida
O IC em (7.28) e similar ao obtido para com conhecido em (7.16). De facto ocorreram
as seguintes substituicoes:

1
(1 /2) F
1
t(n1)
(1 /2);
s.
E mais uma vez temos um IC do tipo:
estimativa pontual quantil concretiza c ao do denominador da v.a. fulcral.
Exemplo 7.17 IC para o valor esperado de popula cao normal com variancia
desconhecida
A dura c ao (em horas) de certa marca de pilha para m aquinas fotogr acas digitais possui
distribuic ao que se admite normal com valor esperado e vari ancia
2
desconhecidos.
Um revendedor seleccionou ao acaso 10 pilhas de um lote, tendo obtido o seguinte
conjunto de dados: x = (251, 238, 236, 229, 252, 253, 245, 242, 235, 230). Tire partido do
facto de

10
i=1
x
i
= 2411 e

10
i=1
x
2
i
= 582009 e obtenha um intervalo de conan ca a 99%
para .
V.a.
X = dura cao (em horas) de certa marca de pilha
Situa cao
X normal(,
2
)
desconhecido
2
desconhecido.
Z =
X
S/
n
t
(n1)
dado que se pretende IC para o valor esperado de popula c ao normal com vari ancia
desconhecida. (Ver formulario.)
228
Como n = 10 e (1 ) 100% = 99% (ou seja, = 0.01), far-se-a uso dos quantis
_
_
_
a
= F
1
t(n1)
(1 /2) = F
1
t(9)
(0.995)
tabela
= 3.250
b
= F
1
t(n1)
(1 /2) = F
1
t(9)
(0.995) = 3.250
Z b
Omite-se novamente este passo...

Ora, e sabido que neste caso
IC
(1)100%
() =
_
x F
1
t(n1)
(1 /2)
s
n
,
x +F
1
t(n1)
(1 /2)
s
n
_
,
onde
n = 10
x =
1
n
n
i=1
x
i
=
2411
10
= 241.1
s
2
=
1
n1
[(
n
i=1
x
2
i
) n( x)
2
]
=
1
101
(582009 10 241.1
2
)
= 79.66
F
1
t(n1)
(1 /2) = 3.250.
Deste modo conclui-se que
IC
99%
() =
_
_
241.1 3.250
79.66
10
, 241.1 + 3.250
79.66
10
_
_
= [231.927, 250.273].
229
CASO 2 IC aproximado para o valor esperado de popula cao arbitraria com
variancia desconhecida
Situa cao
2
desconhecido
2
desconhecido
n sucientemente grande.
A v.a. fulcral a utilizar nesta situa cao encontra-se no formul ario e muito se
assemelha a

X
S/
n
t
(n1)
, usada quando a v.a. de interesse possui distribui c ao
normal com ambos os parametros desconhecidos. De facto tem a mesma expressao
mas distribuic oes distintas:
Z =
X
S/
n
a
normal(0, 1). (7.29)
Para a utiliza cao desta v.a. e fundamental que a dimensao da amostra seja
sucientemente grande ja que este resultado distribucional assenta na aplica c ao do
TLC e do Teorema de Slutsky (Rohatgi e Saleh (2001, p. 270)).
Os quantis de probabilidade simetricos a utilizar dizem respeito à distribuicao
aproximada da v.a. fulcral para :
_
_
_
a
=
1
(1 /2)
b
=
1
(1 /2).
(7.30)
Z b
An aloga ` a obten c ao de IC para o valor esperado de popula cao normal com

desconhecido.
O IC aproximado e, neste caso, dado por:
IC() =
_
x
1
(1 /2)
s
n
, x +
1
(1 /2)
s
n
_
. (7.31)
230
com variancia desconhecida
Uma m aquina autom atica e usada para encher e selar latas de um litro de um produto
lquido. Na sequencia de algumas queixas acerca do facto de as latas se encontrarem
demasiado cheias, foi medido o conte udo de 100 latas seleccionadas ao acaso do fabrico
di ario, tendo-se obtido

100
i=1
x
i
= 108.983 e

100
i=1
x
2
i
= 120.238.
Deduza um intervalo aproximado de conan ca a 95% para o valor esperado do
conte udo das latas.
12
V.a.
X = conte udo de lata de um litro de um produto lquido
Situa cao
2
desconhecido
2
desconhecido
n = 100 > 30 (sucientemente grande).
Z =
X
S/
n
a
normal(0, 1)
pois pretende-se IC aproximado para o valor esperado de populacao com distribuic ao
arbitr aria com vari ancia desconhecida e estamos a lidar com amostra sucientemente
grande que justica invocarmos o TLC e o Teorema de Slutsky. (Ver formul ario.)
Uma vez que o grau de conan ca e aproximadamente de (1 ) 100% = 95% (ou
seja, = 0.05) iremos usar os quantis simetricos seguintes:
_
_
_
a
=
1
(1 /2) =
1
(0.975)
tabela
= 1.9600
b
=
1
(1 /2) =
1
(0.975) = 1.9600.
Estes quantis dizem respeito à distribuic ao aproximada da v.a. fulcral para e
enquandram-na com probabilidade aproximadamente igual a (1 ) = 0.95.
12
231
Z b
Tal como nos exemplos anteriores omite-se este passo...

O IC aproximado a (1 ) 100% para e dado por
IC() =
_
x
1
(1 /2)
s
n
, x +
1
(1 /2)
s
n
_
,
onde
n = 100
x =
1
n
n
i=1
x
i
=
108.983
100
= 1.08983
s
2
=
1
n1
[(
n
i=1
x
2
i
) n( x)
2
]
=
1
1001
(120.238 100 1.08983
2
)
= 0.0147945
1
(1 /2) = 1.9600.
Assim sendo
IC() =
_
_
1.08983 1.9600
0.0147945
100
,
1.08983 + 1.9600
0.0147945
100
_
_
= [1.06599, 1.11367].
Antes de prosseguirmos para a secc ao seguinte convinha real car que em certas situa c oes
lidamos com uma v.a. de interesse cuja distribui cao depende de um unico parametro
desconhecido e que quer o valor esperado, quer a vari ancia dependem desse mesmo
par ametro.
Entre essas situa c oes, considere-se, para ja, aquela em que, ao invocar o TLC, obtem-
se uma v.a. fulcral para o valor esperado cuja expressao e de tal modo simplicada que
n ao e sequer necessario estimar V (X) à custa da vari ancia da a.a. e como tal nao e preciso
invocar o Teorema de Slutsky.
Ilustraremos esta situa cao com um exemplo paradigm atico em que
X exponencial( = 1/).
232
com variancia desconhecida dependente do valor esperado mas que nao carece
de estima cao...
Admita que o tempo entre falhas consecutivas de certo equipamento electrico e
caracterizado por ter a seguinte f.d.p.:
f
X
(x) =
_
_
_
e
x/
, x 0
0, c.c.,
onde > 0. Admita ainda que recolheu uma amostra de dimens ao n = 35 desta popula c ao,
tendo obtido

35
i=1
x
i
= 77.349 e

35
i=1
x
2
i
= 293.452.
Justique que
n
_

X
1
_
a
normal(0, 1),
onde

X e o estimador de MV de . Tire partido deste resultado e da amostra para
construir um intervalo de conan ca aproximado a 90% para o valor esperado E(X) = .
13
V.a.
X = tempo entre falhas consecutivas de certo equipamento electrico
Situa cao
X com distribuic ao n ao normal...
X exponencial( = 1/), = E(X) = ,
2
= V (X) =
2
desconhecido
2
desconhecido
n = 35 > 30 (sucientemente grande).
De acordo com o TLC, pode armar-se que:
Z =
X E(

X)
_
V (

X)
=
X E(X)
_
V (X)
n
=
X
_
2
n
=
n
_

X
1
_
a
normal(0, 1).
13
233
Ao pretendermos IC aproximado a (1 ) 100% = 90% (ou seja, = 0.1) e
suposto usar os quantis
_
_
_
a
=
1
(1 /2) =
1
(0.95)
tabela
= 1.6449
b
=
1
(1 /2) =
1
(0.95) = 1.6449,
que enquadram a v.a. fulcral para com probabilidade aproximadamente igual a
(1 ) = 0.90.
Z b
Uma vez que a v.a. fulcral tem expressao em nada semelhantes às anteriores n ao se
omitir a este passo:
P(a
Z b
) 1
P
_
a
n
_

X
1
_
b
_
1
P
_
1 +
a
n

X
1 +
b
n
_
1
P
_

X
1+
b
n

X
1+
a
n
_
1
P
_

X
1+
1(1/2)
n

X
1
1(1/2)
n
_
1 .
O IC aproximado a (1 ) 100% para possui expressao geral dada por
IC() =
_
_
x
1 +

1
(1/2)
n
,
x
1

1
(1/2)
n
_
_
,
com
n = 35
x =
1
n
n
i=1
x
i
=
77.349
35
= 2.20997
1
(1 /2) = 1.6449.
Deste modo o IC aproximado pretendido e igual a
IC() =
_
_
2.20997
1 +
1.6449
35
,
2.20997
1
1.6449
35
_
_
= [1.72919, 3.06106].
234
7.5 Intervalos de conan ca para a diferenca de dois
valores esperados, variancias desconhecidas.
Escusado sera dizer que na apresenta cao que se segue considerar-se-ao dois casos.
1. Lida-se com duas popula c oes normais independentes: X
1
normal(
1
,
2
1
) e X
2

normal(
2
,
2
2
), onde
2
1
e
2
2
s ao desconhecidos mas que se assume serem iguais.
Para alem disso, as dimensoes das amostrais nao s ao sucientemente grandes que
justiquem o recurso a um resultado assint otico.
2. Desta feita as duas popula c oes s ao independentes, com distribuic oes arbitr arias
(possivelmente normais) e valores esperados e vari ancias iguais a
i
e
2
i
, i = 1, 2,
onde
2
1
e
2
2
s ao desconhecidos mas nao necessariamente iguais. Mais, as dimensoes
das duas amostras, n
1
e n
2
, s ao sucientemente grandes para invocar o TLC e o
Teorema de Slutsky.
CASO 1 IC para a diferenca de valores esperados de duas popula c oes
normais independentes, com variancias desconhecidas mas que se assume
serem iguais
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
e
2
2
desconhecidos, no entanto, assume-se que serem iguais:
2
1
=
2
2
=
2
n
1
30 ou n
2
30.
1
2
)
Desta feita e suposto utilizarmos:
Z =
(

X
1

X
2
) (
1
2
)
_
(n11)S
2
1
+(n21)S
2
2
n1+n22

_
1
n1
+
1
n2
_
t
(n1+n22)
, (7.32)
onde
(n11)S
2
1
+(n21)S
2
2
n1+n22
e um estimador razo avel para a vari ancia comum das
popula c oes X
1
e X
2
,
2
1
=
2
2
=
2
. (Ver formul ario.)
235
Para justicar este resultado distribucional basta reescrever a v.a. fulcral, ter
presente a forma como e derivada a distribuic ao t-Student e notar que se assumiu
que
2
1
=
2
2
=
2
. Assim, temos:
Z =
(

X1
X2)(12)
_
2
n
1
+
2
n
2
(n
1
1)S
2
1
2
+
(n
2
1)S
2
2
2
n1+n22
d
=
normal(0, 1)
_
2
(n
1
+n
2
2)
n1+n22
t
(n1+n22)
. (7.33)
_
_
_
a
= F
1
t(n
1
+n
2
2)
(1 /2)
b
= F
t(n
1
+n
2
2)
(1 /2).
(7.34)
Z b
A invers ao e analoga...
IC
(1)100%
(
1
2
)
=
_
( x
1
x
2
) F
1
t(n
1
+n
2
2)
(1 /2)
_
(n11)s
2
1
+(n21)s
2
2
n1+n22
(
1
n1
+
1
n2
),
( x
1
x
2
) +F
1
t(n
1
+n
2
2)
(1 /2)
_
(n11)s
2
1
+(n21)s
2
2
n1+n22
(
1
n1
+
1
n2
)
_
.
(7.35)
Exemplo 7.20 IC para a diferenca de valores esperados de duas popula c oes
normais independentes, com variancias desconhecidas mas que se assume
serem iguais
Para efectuar uma analise comparativa entre duas marcas de computadores pessoais,
an alise essa baseada no tempo (em meses) ate ` a necessidade da primeira repara c ao,
recolheram-se observa coes que conduziram aos resultados
Amostra 1:

20
i=1
x
i 1
= 248,

20
i=1
x
2
i 1
= 3560
Amostra 2:

12
i=1
x
i 2
= 152,

12
i=1
x
2
i 2
= 2730.
Admitindo que os tempos sao independentes e tem, para ambas as marcas, distribuic oes
normais com vari ancias desconhecidas mas iguais, determine um intervalo de conan ca a
90% para a diferenca dos respectivos valores esperados.
14
14
236
V.a.
X
i
= tempo ate 1a. repara c ao de computador pessoal da marca i, i = 1, 2
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
e
2
2
desconhecidos mas que se assume serem iguais:
2
1
=
2
2
=
2
n
1
= 20 30 ou n
2
= 12 30.
1
2
)
Z =
(

X
1

X
2
) (
1
2
)
_
(n11)S
2
1
+(n21)S
2
2
n1+n22

_
1
n1
+
1
n2
_
t
(n1+n22)
uma vez que e suposto determinar um IC exacto para a diferenca de valores
esperados de duas popula c oes normais independentes, com vari ancias desconhecidas
mas que se assume serem iguais. (Ver formulario.)
Ao ter em conta que, neste caso, n
1
= 20, n
2
= 12 e (1 ) 100% = 90%
i.e., = 0.1, usaremos os quantis de probabilidade:
_
_
_
a
= F
1
t(n
1
+n
2
2)
(1 /2) = F
1
t(30)
(0.95)
tabela
= 1.697
b
= F
t(n
1
+n
2
2)
(1 /2) = F
1
t(30)
(0.95) = 1.697.
Z b
Este passo e mais uma vez omitido...

Ao notar que
IC
(1)100%
(
1
2
)
=
_
( x
1
x
2
) F
1
t(n
1
+n
2
2)
(1 /2)
_
(n11)s
2
1
+(n21)s
2
2
n1+n22
(
1
n1
+
1
n2
),
( x
1
x
2
) +F
1
t(n
1
+n
2
2)
(1 /2)
_
(n11)s
2
1
+(n21)s
2
2
n1+n22
(
1
n1
+
1
n2
)
_
,
237
onde
n
1
= 20, x
1
= 12.4, s
2
1
= 25.516
n
2
= 12, x
2
= 12.67, s
2
2
= 73.152
F
1
t(n
1
+n
2
2)
(1 /2) = 1.697,
segue-se
IC
90%
(
1
2
)
=
_
(12.4 12.67) 1.697
_
(201)25.516+(121)73.152
20+122
(
1
20
+
1
12
),
(12.4 12.67) + 1.697
_
(201)25.516+(121)73.152
20+122
(
1
20
+
1
12
)
_
= [4.33254, 3.79254].
Motiva cao 7.21 IC aproximado para a diferenca de valores esperados de

popula coes arbitrarias independentes com variancias desconhecidas
Nem sempre e razo avel admitir que
2
1
=
2
2
=
2
, muito em particular quando as
estimativas de
2
1
e
2
2
s ao bem distintas. Contudo, ao lidarmos com n
1
30 e n
2
30,
n ao podemos adiantar uma solu cao satisfatoria no ambito desta disciplina.
Mas a situa cao muda totalmente de gura caso n
1
> 30 e n
2
> 30, ja que nesta
situa c ao podemos invocar dois resultados assint oticos, nomeadamente, o TLC e o Teorema
de Slutsky, e deixamos de necessitar de assumir que as duas popula c oes sao normais e que
2
1
=
2
2
=
2
.
CASO 2 IC aproximado para a diferenca de valores esperados de duas
popula coes arbitrarias independentes com variancias desconhecidas
Situa cao
X
1
X
2
, com distribuicoes arbitr arias (possivelmente normais): E(X
i
) =
i
, V (X
i
) =
2
i
, i = 1, 2
(
1
2
) desconhecido
2
1
e
2
2
desconhecidos mas n ao necessariamente iguais
n
1
> 30 e n
2
> 30, i.e., ambas as amostras sao sucientemente grandes.
238
1
2
)
Recorrendo ao TLC e ao Teorema de Slutsky obtem-se a v.a. fulcral para
1

2
que pode encontrar-se no formul ario. Trata-se de uma variante da v.a. fulcral usada
no caso em que se pretendia IC para a diferenca de valores esperados de populacoes
normais com variancias conhecidas.
Z =
(

X
1

X
2
) (
1
2
)
_
S
2
1
n1
+
S
2
2
n2
a
normal(0, 1). (7.36)
(Ver formulario.)
_
_
_
a
=
1
(1 /2)
b
=
1
(1 /2).
(7.37)
Z b
A invers ao e analoga...
O IC e dado por
IC(
1
2
) =
_
( x
1
x
2
)
1
(1 /2)
_
s
2
1
n1
+
s
2
2
n2
,
( x
1
x
2
) +
1
(1 /2)
_
s
2
1
n1
+
s
2
2
n2
_
(7.38)
e possui grau de conan ca aproximadamente igual a (1 ) 100%.
Exemplo/Exerccio 7.22 IC aproximado para a diferenca de valores
esperados de duas popula coes arbitrarias independentes com variancias
desconhecidas
Para comparar a resistencia ao uso de dois tipos de materiais cer amicos usados em
pavimentos, foram colocados 81 mosaicos do primeiro tipo e 121 do segundo tipo num
corredor movimentado de uma superfcie comercial.
Ap os um ano o seu desgaste foi medido numa escala conveniente. Para os mosaicos
do primeiro tipo obteve-se x
1
= 290 e s
1
= 12, enquanto que para os do segundo tipo os
resultados foram x
2
= 321 e s
2
= 14.
239
Assuma que, em ambos os casos, a distribuic ao do desgaste e normal e que os desgastes
em mosaicos de tipo diferente sao independentes. Construa um intervalo de conan ca a
95% para a diferen ca entre os valores esperados do desgaste dos dois tipos de materiais,
assumindo que
(a) as variancias sao desconhecidas mas n ao s ao necessariamente iguais;
15
V.a.
X
i
= desgaste do material do tipo i, i = 1, 2
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
e
2
2
desconhecidos, no entanto, assume-se que n ao s ao iguais
n
1
= 81 >> 30, n
2
= 121 >> 30 (sucientemente grandes)
1
2
)
Uma vez que as dimens oes das amostras s ao sucientemente grandes podemos
obter um IC aproximado para a diferenca de valores esperados de duas
popula c oes arbitr arias
16
independentes, com vari ancias desconhecidas mas que
se assume serem iguais, devemos utilizar a seguinte v.a. fulcral para (
1
2
):
Z =
(

X
1

X
2
) (
1
2
)
_
S
2
1
n1
+
S
2
2
n2
a
normal(0, 1).
(Ver formulario.)
Como o nvel aproximado de conan ca e de (1 ) 100% = 95% (i.e.,
= 0.05), recorre-se aos quantis
_
_
_
a
=
1
(1 /2) =
1
(0.975)
tabela
= 1.9600
b
=
1
(1 /2) =
1
(0.975)
tabela
= 1.9600
e e sabido que enquadram a v.a. fulcral Z com probabilidade aproximada (1
).
Z b
Omitimos este passo...

15
16
Por sinal estas popula coes sao normais neste caso.
240
Neste caso o IC aproximado e dado por
IC(
1
2
) =
_
( x
1
x
2
)
1
(1 /2)
_
s
2
1
n1
+
s
2
2
n2
,
( x
1
x
2
) +
1
(1 /2)
_
s
2
1
n1
+
s
2
2
n2
_
,
onde
n
1
= 81, x
1
= 290, s
2
1
= 12
2
n
2
= 121, x
2
= 321, s
2
2
= 14
2
1
(1 /2) = 1.9600.
Logo obtem-se
IC(
1
2
) =
_
_
(290 321) 1.9600
12
2
81
+
14
2
121
,
(290 321) + 1.9600
12
2
81
+
14
2
121
_
_
= [34.6128, 27.3872].
(b) as variancias sao desconhecidas e iguais.
Neste caso podemos obter IC exacto, bastando para o efeito usarmos a v.a. fulcral
para (
1
2
)
Z =
(

X
1

X
2
) (
1
2
)
_
(n11)S
2
1
+(n21)S
2
2
n1+n22

_
1
n1
+
1
n2
_
t
(n1+n22)
.
241
7.6 Intervalo de conan ca para a variancia de uma
popula cao normal.
Motiva cao 7.23 IC para a variancia de popula cao normal
Ate ao momento so adiant amos IC para valores esperados ou diferencas de valores
esperados.

E altura de deduzir uma estimativa intervalar para a vari ancia, par ametro
este usualmente desconhecido a par do valor esperado da popula c ao. Consideraremos a
situa c ao em que estamos a lidar com uma v.a. de interesse normalmente distribuda com
valor esperado desconhecido.
17
Considere-se ent ao uma popula c ao X normal(,

2
), onde quer , quer
2
s ao
desconhecidos.
Situa cao
X normal(,
2
)
desconhecido
2
desconhecido.
2
De notar que a v.a. fulcral para
2
se encontra no formul ario e depende de
2
(mas nao de ) e, naturalmente, de um estimador de
2
, neste caso S
2
. Adiante-
se ainda que esta v.a. possui distribui cao exacta com par ametros conhecidos, logo
independente de
2
. Trata-se de:
Z =
(n 1)S
2
2

2
(n1)
. (7.39)
(Ver formulario.)
Pelo facto da f.d.p. da v.a. do qui-quadrado n ao ser simetrica em rela cao à origem e
possuir suporte igual a IR
+
, lidamos efectivamente com dois quantis nao so distintos
como nao simetricos:
17
Ao considerar-se o valor esperado conhecido, o procedimento descrito a seguir sofre ligeirssimas
alteracoes, em particular, o n umero de graus de liberdade da distribui cao do qui-quadrado passa a ser
igual a n.
242
(a
, b
) :
_
_
_
P(Z < a
) = /2
P(Z > b
) = /2
_
_
a
= F
1
2
(n1)
(/2)
b
= F
1
2
(n1)
(1 /2).
(7.40)
(Esquema...)
Escusado ser a dizer que este par de quantis se encontra tabelado. (Consulta da
tabela...)
Z b
P(a
Z b
) = 1
P
_
a

(n1)S
2
2
b
_
= 1
P
_
1
b

2
(n1)S
2

1
a
_
= 1
P
_
(n1)S
2
b

2
(n1)S
2
a
_
= 1 .
IC
(1)100%
(
2
) =
_
_
(n 1)s
2
F
1
2
(n1)
(1 /2)
,
(n 1)s
2
F
1
2
(n1)
(/2)
_
_. (7.41)
Exemplo 7.24 IC para a variancia de popula cao normal
Retome o Exemplo 7.20 e obtenha um intervalo de conan ca a 90% para a vari ancia do
tempo ate à primeira repara c ao de computadores da marca 1.
18
V.a.
X = tempo ate 1a. repara c ao de computador pessoal da marca 1
Situa cao
X normal(,
2
)
desconhecido
2
desconhecido.
18
243
2
Por pretendermos um IC para a variancia de popula c ao normal faremos uso de:
Z =
(n 1)S
2
2

2
(n1)
.
(Ver formulario.)
Ao ter-se em considera c ao que n = n
1
= 20 e (1 ) 100% = 90% far-se-a uso
dos quantis nao simetricos:
_
_
a
= F
1
2
(n1)
(/2) = F
1
2
(19)
(0.05)
tabela
= 10.12
b
= F
1
2
(n1)
(1 /2) = F
1
2
(19)
(0.95)
tabela
= 30.14.
Z b

Ora, como a express ao geral do IC para
2
e
IC
(1)100%
(
2
) =
_
_
(n 1)s
2
F
1
2
(n1)
(1 /2)
,
(n 1)s
2
F
1
2
(n1)
(/2)
_
_,
onde, para este exemplo, se tem
n = n
1
= 20
s
2
=
1
n1
[(
n
i=1
x
2
i
) n( x)
2
] =
1
201
(3560 20 12.4
2
) = 25.516
F
1
2
(n1)
(/2) = 10.12
F
1
2
(n1)
(1 /2) = 30.14,
conclui-se que
IC
90%
(
2
) =
_
(20 1) 25.516
30.14
,
(20 1) 25.516
10.12
_
= [16.085, 47.905].
Nota 7.25 IC para a variancia de popula cao arbitraria (nao normal)
Ao deixarmos de assumir que a popula cao tem distribui cao normal, nada se pode adiantar
no que diz respeito à estima c ao intervalar da variancia no ambito desta disciplina.
244
7.7 Intervalos de conan ca para uma probabilidade
de sucesso e outros parametros de popula coes nao
normais uniparametricas
Motiva cao 7.26 IC aproximado para uma probabilidade
E tambem altura de fornecer uma estimativa intervalar para a probabilidade de sucesso

de uma prova de Bernoulli.
Consideremos popula c ao X Bernoulli(p), onde a probabilidade de sucesso p e
desconhecida. No ambito desta disciplina consideraremos somente o caso em que dispomos
de um grande n umero de observa coes (bin arias...).
Situa cao
X Bernoulli(p)
p desconhecido
n sucientemente grande (n > 30).
Passo 1 Seleccao da v.a. fulcral para p
Neste caso devemos recorrer a:
Z =
X p
_

X(1
X)
n
a
normal(0, 1). (7.42)
Esta v.a. fulcral possui distribuic ao que decorre do TLC e do Teorema de Slustky.
Importa notar que Z depende de p e de um estimador deste mesmo par ametro,
X, a propor c ao de sucessos na a.a. Note-se ainda que E(

X) = E(X) = p e
V (

X) =
V (X)
n
=
p(1p)
n
. Deste modo, ao aplicar-se o TLC, obteramos a seguinte
v.a. fulcral para p:
X p
_
p(1p)
n
a
normal(0, 1). (7.43)
Contudo, a utiliza c ao desta v.a. fulcral torna a invers ao da desigualdade do Passo 3
muito difcil uma vez que p gura em numerador e em denominador (neste ultimo
caso sob o sinal de uma raz).
A v.a. fulcral para p, Z =

Xp
_
X(1 X)
n
, e de longe muito mais conveniente na referida
invers ao. A respectiva distribuic ao aproximada decorre da aplica c ao do TLC e do
Teorema de Slutsky.
245
_
_
_
a
=
1
(/2) =
1
(1 /2)
b
=
1
(1 /2).
(7.44)
Z b
P(a
Z b
) 1
P
_
_
a

Xp
_
X(1 X)
n
b
_
_
1
P
_

X b
_

X(1
X)
n
p

X a
_

X(1
X)
n
_
1
P
_

X
1
(1 /2)
_

X(1
X)
n
p

X +
1
(1 /2)
_

X(1
X)
n
_
1 .
O IC seguinte possui grau de conan ca aproximadamente igual a (1 ) 100%:
IC(p) =
_
x
1
(1 /2)
_
x(1 x)
n
, x +
1
(1 /2)
_
x(1 x)
n
_
. (7.45)
Exemplo/Exerccio 7.27 IC aproximado para uma probabilidade
Um inquerito recente feito a 1000 habitantes de uma regi ao rural revelou que 448 apoiam
a aplica c ao de penas de pris ao pesadas em crimes de fogo posto.
(a) Construa um intervalo de conan ca aproximado a 95% para a probabilidade (p) de
uma pessoa escolhida ao acaso na referida regiao ser favor avel à aplica cao da referida
pena.
19
V.a.
X
i
= resposta da i esima ao inquerito, i = 1, . . . , n
X
i
i.i.d.
X
Situa cao
X Bernoulli(p)
p desconhecido
n = 1000 >> 30 (sucientemente grande).
19
Adaptado do Exame de 6 de Setembro de 2006.
246
Passo 1 Seleccao da v.a. fulcral para p
Z =
X p
_

X(1
X)
n
a
normal(0, 1).
uma vez que nos foi solicitada a determina c ao de um IC aproximado para uma
probabilidade e a dimensao da amostra justica a aplica cao do TLC e do Teorema
de Slutsky.
Os quantis a utilizar s ao
_
_
_
a
=
1
(1 /2) =
1
(0.975)
tabela
= 1.9600
b
=
1
(1 /2) =
1
(0.975) = 1.9600.
Estes enquadram a v.a. fulcral para p com probabilidade aproximadamente igual
a (1 ).
Z b
Omite-se novamente este passo...

Ao ter-se em considera c ao que
n = 1000
x =
1
n
n
i=1
x
i
=
448
1000
= propor c ao observada de respostas armativas
1
(1 /2) = 1.9600
conclui-se que o IC aproximado a 95% para p e dado por
IC(p) =
_
_
x
1
(1 /2)
x(1 x)
n
,
x +
1
(1 /2)
x(1 x)
n
_
_
=
_
_
0.448 1.9600
0.448 (1 0.448)
1000
,
0.448 + 1.9600
0.448 (1 0.448)
1000
_
_
= [0.417178, 0.478822].
247
(b) Obtenha o IC aproximado para p
2n x + [
1
(1 /2)]
2
1
(1 /2)
_
4n x + [
1
(1 /2)]
2
4n x
2
2
_
n + [
1
(1 /2)]
2
_
que se obtem ao recorrer-se ` a v.a. fulcral

Xp
p(1p)/n
a
normal(0, 1), de acordo com
Murteira (1990, Vol. II, p. 233).
E curioso notar que, recorrendo a um procedimento an alogo ao acabado de descrever,

tambem se pode obter um IC aproximado para um outro valor esperado, o da v.a. de
Poisson, como ilustra o exemplo seguinte.
Exemplo 7.28 IC aproximado para o valor esperado de popula cao de
Poisson
Na famosa experiencia realizada pelo fsico Rutherford (em 1910), sobre a emissao de
partculas por uma fonte radioactiva, foi observado que em 2612 intervalos de 1/8 de
minuto foram emitidas no total 9318 partculas. Admita que a variavel aleat oria X, que
representa o n umero de partculas emitidas por essa fonte radioactiva num intervalo de
1/8 de minuto, possui distribuic ao de Poisson com par ametro .
Obtenha um intervalo de conan ca aproximado a 90% para o valor esperado de X.
20
V.a.
X = n umero de partculas emitidas em intervalo de 1/8 de minuto
Situa cao
X Poisson()
= E(X) = V (X) desconhecido
n >> 30 (sucientemente grande).
Ao recorrermos ao TLC podemos armar que
X E(

X)
_
V (

X)
=
X E(X)
_
V (X)
n
=
X
_
n
a
normal(0, 1).
20
248
No entanto, esta v.a. fulcral nao s o n ao consta do formul ario, como torna a inversao
da desigualdade do Passo 3 muito difcil uma vez que gura em numerador e em
denominador (neste ultimo caso sob o sinal de uma raz).
Posto isto invocaremos o TLC e do Teorema de Slutsky que garantem que
Z =
X
_

X
n
a
normal(0, 1),
onde

X e o estimador de MV de . Escusado ser a dizer que esta v.a. fulcral para
e mais conveniente na referida invers ao.
Usaremos os quantis
_
_
_
a
=
1
(1 /2) =
1
(0.95)
tabela
= 1.6449
b
=
1
(1 /2) =
1
(0.95) = 1.6449
pois enquadram a v.a. fulcral para com probabilidade aproximadamente igual a
0.90.
Z b

Uma vez que
n = 2612
x =
1
n
n
i=1
x
i
=
9318
2612
= 3.5674
1
(1 /2) = 1.6449
segue-se o IC aproximado a 90% para e
IC() =
_
_
x
1
(1 /2)
x
n
, x +
1
(1 /2)
x
n
_
_
=
_
_
3.5674 1.6449
3.5674
2612
, 3.5674 + 1.6449
3.5674
2612
_
_
= [3.5066, 3.6282].
249
A seguir apresenta-se um quadro que nos parece extremamente util dado condensar
todos os intervalos de conan ca que constam deste captulo. Este quadro possui cinco
colunas onde podemos encontrar:
o par ametro para o qual se destina o IC;
em que circunst ancias podemos recorrer a semelhante IC;
uma estimativa pontual do referido par ametro;
a v.a. fulcral a usar nesta situa c ao;
e, por m, o IC, que poder a ser exacto ou aproximado.
21
21
Esta destrin ca e deixada à aten cao do leitor/a mas basta relembrar que os intervalos aproximados
estao associados à utiliza cao de uma v.a. fulcral com distribui cao aproximada e, como tal, ap os a expressao
da v.a. segue-se o sinal
a
.
250
Q
u
a
d
r
o
-
r
e
s
u
m
o
1
:
A
l
g
u
n
s
i
n
t
e
r
v
a
l
o
s
d
e
c
o
n
a
n
c
a
.
P
a
r
a
m
e
t
r
o
S
i
t
u
a
c
a
o
E
s
t
i
m
a
t
i
v
a
V
.
a
.
f
u
l
c
r
a
l
I
n
t
e
r
v
a
l
o
d
e
c
o
n
a
n
c
a
p
o
n
t
u
a
l
n
o
r
m
a
l
(
2
)
2
c
o
n
h
e
c
i
d
o
x
n
o
r
m
a
l
(
0
,
1
)
_
x
1
(
1
/
2
)
n
,
x
+
1
(
1
/
2
)
X
c
o
m
d
i
s
t
r
i
b
u
i
c
a
o
a
r
b
i
t
r
a
r
i
a
(
n
a
o
n
o
r
m
a
l
)
:
E
(
X
)
=
,
V
(
X
)
=
2
c
o
n
h
e
c
i
d
o
n
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
x
n
a
n
o
r
m
a
l
(
0
,
1
)
_
x
1
(
1
/
2
)
n
,
x
+
1
(
1
/
2
)
2
)
X
1
n
o
r
m
a
l
(
1
,
2 1
)
X
2
n
o
r
m
a
l
(
2
,
2 2
)
2 1
,
2 2
c
o
n
h
e
c
i
d
o
s
(
x
1
x
2
)
(
X
1
X
2
)
2
)
_
2 1
n
1
+
2 2
n
2
n
o
r
m
a
l
(
0
,
1
)
_
(
x
1
x
2
)
1
(
1
/
2
)
2 1
n
1
+
2 2
n
2
,
(
x
1
x
2
)
+
1
(
1
/
2
)
2 1
n
1
+
2 2
n
2
_
(
2
)
X
1
X
2
,
c
o
m
d
i
s
t
r
i
b
u
i
c
o
e
s
a
r
b
i
t
r
a
r
i
a
s
(
n
a
o
n
o
r
m
a
i
s
)
:
E
(
X
i
)
=
i
,
V
(
X
i
)
=
2 i
,
i
=
1
,
2
2 1
,
2 2
c
o
n
h
e
c
i
d
o
s
n
1
,
n
2
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
s
(
x
1
x
2
)
(
X
1
X
2
)
2
)
_
2 1
n
1
+
2 2
n
2
a
n
o
r
m
a
l
(
0
,
1
)
_
(
x
1
x
2
)
1
(
1
/
2
)
2 1
n
1
+
2 2
n
2
,
(
x
1
x
2
)
+
1
(
1
/
2
)
2 1
n
1
+
2 2
n
2
_
n
o
r
m
a
l
(
2
)
2
d
e
s
c
o
n
h
e
c
i
d
o
x
S
/
t
(
n
1
)
_
x
1
t
(
n
1
)
(
1
/
2
)
n
,
x
+
F
1
t
(
n
1
)
(
1
/
2
)
n
_
X
c
o
m
d
i
s
t
r
i
b
u
i
c
a
o
a
r
b
i
t
r
a
r
i
a
:
E
(
X
)
=
,
V
(
X
)
=
2
d
e
s
c
o
n
h
e
c
i
d
o
n
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
x
S
/
n
a
n
o
r
m
a
l
(
0
,
1
)
_
x
1
(
1
/
2
)
n
,
x
+
1
(
1
/
2
)
2
)
X
1
n
o
r
m
a
l
(
1
,
2 1
)
X
2
n
o
r
m
a
l
(
2
,
2 2
)
2 1
,
2 2
d
e
s
c
o
n
h
e
c
i
d
o
s
m
a
s
I
G
U
A
I
S
n
1
3
0
o
u
n
2
3
0
(
x
1
x
2
)
(
X
1
X
2
)
2
)
_
(
n
1
1
)
S
2 1
+
(
n
2
1
)
S
2 2
n
1
+
n
2
_
1
n
1
+
1
n
2
_
t
(
n
1
+
n
2
2
)
_
(
x
1
x
2
)
1
t
(
n
1
+
n
2
2
)
(
1
/
2
)
_
(
n
1
1
)
s
2 1
+
(
n
2
1
)
s
2 2
n
1
+
n
2
_
1
n
1
+
1
n
2
_
,
(
x
1
x
2
)
+
F
1
t
(
n
1
+
n
2
2
)
(
1
/
2
)
_
(
n
1
1
)
s
2 1
+
(
n
2
1
)
s
2 2
n
1
+
n
2
_
1
n
1
+
1
n
2
_
_
(
2
)
X
1
X
2
c
o
m
d
i
s
t
r
i
b
u
i
c
o
e
s
a
r
b
i
t
r
a
r
i
a
s
(
p
o
s
s
i
v
e
l
m
e
n
t
e
n
o
r
m
a
i
s
)
:
E
(
X
i
)
=
i
,
V
(
X
i
)
=
2 i
,
i
=
1
,
2
2 1
,
2 2
d
e
s
c
o
n
h
e
c
i
d
o
s
m
a
s
n
a
o
n
e
c
e
s
s
a
r
i
a
m
e
n
t
e
i
g
u
a
i
s
n
1
>
3
0
e
n
2
>
3
0
(
x
1
x
2
)
(
X
1
X
2
)
2
)
_
S
2 1
n
1
+
S
2 2
n
2
a
n
o
r
m
a
l
(
0
,
1
)
_
(
x
1
x
2
)
1
(
1
/
2
)
_
s
2 1
n
1
+
s
2 2
n
2
,
(
x
1
x
2
)
+
1
(
1
/
2
)
_
s
2 1
n
1
+
s
2 2
n
2
_
2
X
n
o
r
m
a
l
(
2
)
d
e
s
c
o
n
h
e
c
i
d
o
s
2
(
n
1
)
S
2
2 (
n
1
)
_
(
n
1
)
S
2
F
2 (
n
1
)
(
1
/
2
)
,
(
n
1
)
S
2
F
2 (
n
1
)
(
/
2
)
_
p
X
B
e
r
n
o
u
l
l
i
(
p
)
n
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
(
n
>
3
0
)
x
p
_
X
(
1
X
)
n
a
n
o
r
m
a
l
(
0
,
1
)
_
x
1
(
1
/
2
)
_
x
(
1
x
)
n
,
x
+
1
(
1
/
2
)
_
x
(
1
x
)
n
_
251
Captulo 8
Testes de hip oteses
Motiva cao 8.1 Testes de hipoteses
Ate ao momento procuramos adiantar um valor razo avel ou um intervalo de valores
razo aveis para um par ametro desconhecido de interesse, tirando partido da informa cao
amostral de que dispomos.
E altura de tirarmos partido dessa mesma informa c ao para nos pronunciarmos sobre
arma c oes relativas a esse mesmo parametro desconhecido ou a outros aspectos da nossa
v.a. de interesse.
N ao se trata de um mero exerccio academico mas sim de uma resposta
a uma necessidade decorrente da pr atica. Basta pensarmos na averigua cao da
veracidade/razoabilidade de uma arma c ao de:
um fabricante de autom oveis quanto ao valor esperado da quantidade de combustvel
consumida por cada 100Km por certo modelo fabricado;
uma produtora de um f armaco no que diz respeito ` a percentagem de pacientes que
consideram ter havido melhoras do seu estado de sa ude ap os a administra cao do
f armaco.
A exposi cao da materia deste captulo muito se assemelha ` a do captulo anterior: ao
inves de falarmos de intervalos de conan ca para par ametros de interesse, apresentamos
testes de hip oteses para esses mesmos par ametros. Mais, a ordem de apresenta cao dos
testes de hip oteses respeita a do captulo anterior.
Para alem de testes sobre par ametros, ser a apresentado o teste de ajustamento do
qui-quadrado, bem como o teste de independencia do qui-quadrado, pese embora o facto
de este ultimo teste nem sempre gurar no programa da disciplina.
252
8.1 No coes basicas
Antes de prosseguirmos e crucial adiantarmos algumas no c oes fundamentais no ambito
dos testes de hip oteses, muito em particular o que se entende por hip otese estatstica.
Denicao informal 8.2 Hipotese estatstica
Qualquer arma c ao/conjectura acerca de
um par ametro desconhecido ou
da distribuic ao da v.a. de interesse, etc.
ser a denominada de hipotese estatstica.
Denicao 8.3 Hipotese parametrica
Trata-se de conjectura respeitante a um par ametro desconhecido, assumindo que se
conhece a distribuic ao da v.a. de interesse (a menos de um ou mais par ametros
desconhecidos).
Exemplo 8.4 Hipotese parametrica
E usual que os fabricantes fa cam arma c oes acerca dos seus produtos. Por exemplo, um
fabricante de baterias de 12V, para alem de assumir que a dura c ao das mesmas (v.a. de
interesse) possui distribuic ao normal, pretende convencer um seu grande cliente que o
valor esperado da dura cao das mesmas e de 1000 dias:
V.a. de interesse
X = dura cao (em dias) de bateria de 12V
Situa cao
X normal(,
2
)
= E(X) desconhecido
Hipotese
= 1000 dias
E essencialmente com este tipo de hip oteses que iremos lidar ao longo deste captulo,
pelo que omitiremos o adjectivo parametrica sempre que nos parecer desnecessario.
Ao lidar-se com hip oteses parametricas, assumir-se-a que o conjunto de valores
considerados possveis/razo aveis para o par ametro desconhecido i.e., o espaco de
par ametro possui pelo menos dois valores.
253
Denicao informal 8.5 Hipotese nula/alternativa
De um modo geral confrontamos duas hip oteses parametricas:
a hip otese mais relevante, usualmente designada de hipotese nula e representada por
H
0
;
uma hipotese dita alternativa, representada por H
1
.
Estas duas hipoteses parametricas estao associadas a dois sub-espacos disjuntos de : H
0
atribui ao par ametro valores em
0
e H
1
em
1
= \
0
.
Exemplo 8.6 Hipotese nula/alternativa
H a v arias possibilidades de hipotese alternativa para a hipotese nula do Exemplo 8.4:
H
0
: =
0
= 1000 dias (hipotese nula)
H
1
:=
_
_
=
1
= 800 dias (ponto de vista do consumidor)
<
0
= 1000 dias (ponto de vista do consumidor)
>
0
= 1000 dias (ponto de vista do fabricante)
=
0
= 1000 dias (compromisso entre ambos)
Se assumirmos que a vari ancia da dura c ao das baterias de 12V e conhecida estaremos a
lidar com os seguintes espacos e sub-espa cos de par ametro:
Espaco de parametro Hip. Nula 0 Hip. Alternativa 1 = \0
= {800, 1000} H0 : = 1000 0 = {1000} H1 : = 800 1 = {800}
= (0, 1000] H0 : = 1000 0 = {1000} H1 : < 1000 1 = (0, 1000)
= [1000, +) H0 : = 1000 0 = {1000} H1 : > 1000 1 = (1000, +)
= (0, +) H0 : = 1000 0 = {1000} H1 : = 1000 1 = (0, +)\{1000}
Convem ainda referir que os valores especicados nas hip oteses nula e alternativa nada
tem a ver com valores observados na amostra, muito em particular com a estimativa (de
MV) do par ametro desconhecido , x.
H a v arias possibilidades de classicar as hipoteses nula e alternativa, nomeadamente
no que diz respeito à cardinalidade do sub-espa co de par ametro a elas associado...
254
Denicao 8.7 Hipotese simples/composta
Uma hipotese parametrica H
i
(i = 0, 1) diz-se:
simples, caso especique um unico valor para o par ametro desconhecido que
corresponde a um unico ponto no espa co parametrico, i.e., caso #
i
= 1 (i = 0, 1);
composta, caso contrario.
Exemplo 8.8 Hipotese simples/composta
Retome-se o Exemplo 8.4. Ao assumir-se que a v.a. de interesse possui distribuicao normal
com valor esperado desconhecido e vari ancia conhecida tem-se:
H
0
: =
0
= 1000 dias hip otese simples (
0
= {1000});
H
1
: <
0
= 1000 dias hip otese composta (
1
= (0, 1000)).
Note-se, no entanto, que, caso se assuma que a variancia e igualmente desconhecida,
n ao s o passamos a lidar com um espaco de par ametro ligeiramente diferente, como H
0
passa a ser tambem uma hip otese composta. Com efeito, = {(,
2
) : ,
2
> 0} =
IR
+
IR
+
e a hip otese H
0
: =
0
= 1000 dias est a associada ao sub-espaco
0
=
{1000} IR
+
, que por sinal n ao e um conjunto singular.
Denicao informal 8.9 Hipotese alternativa unilateral/bilateral
E costume ir alem na classicacao da hip otese alternativa. Esta classicac ao depende

tambem da hip otese nula com que estejamos a lidar. H
1
e, em geral, de um dos tres
seguintes tipos:
unilateral inferior, caso possua um sinal de menor (e.g., H
0
: = 1000 dias e
H
1
: < 1000 dias);
1
unilateral superior, se possuir um sinal de maior (e.g., H
0
: = 1000 dias e H
1
:
> 1000 dias);
2
bilateral, caso H
1
tenha um sinal de diferente (e.g., H
0
: = 1000 dias e H
1
: =
1000 dias).
1
Ou atribua um valor inferior ao conjecturado em H0, e.g., H1 : = 800 dias.
2
Ou atribua um valor superior ao conjecturado em H0, e.g., H1 : = 1200 dias.
255
Denicao informal 8.10 Teste de hipoteses
Um teste de hip oteses n ao passa de um procedimento estatstico que conduz a uma
decisao acerca das hip otese nula e alternativa, tendo em conta a informa c ao amostral
que recolhemos.
Nota 8.11 Decis oes em testes de hip oteses
De acordo com a informa c ao recolhida tomamos (de um modo geral) uma de duas decisoes:
rejeitar H
0
;
n ao rejeitar H
0
.
Denicao informal 8.12 Erros de 1a. e 2a. especie
As decisoes em testes de hip oteses podem ou n ao ser correctas. Sen ao vejamos:
Situa cao real
Decisao H
0
Verdadeira H
0
Falsa
Rejeitar H
0
Erro de 1a. Especie Decisao Correcta
N ao rejeitar H
0
Decisao Correcta Erro de 2a. Especie
Denicao 8.13 Probabilidade de erro de 1a. e de 2a. especie
E habitual delinear o teste de hip oteses de modo a minimizar as probabilidades de

ocorrencia de erros de 1a. e 2a. especie. Estas probabilidades costumam ser representadas
por e , respectivamente, e denem-se do seguinte modo:
= P(Erro de 1a. especie) = P(Rejeitar H
0
| H
0
e Verdadeira) (8.1)
= P(Erro de 2a. especie) = P(N ao rejeitar H
0
| H
0
e Falsa). (8.2)
Qualquer destas probabilidades depender a, como veremos mais tarde, do verdadeiro

valor do par ametro.
Denicao 8.14 Nvel de signicancia
E habitual estabelecer um limite superior para a probabilidade de ocorrencia de erro de

1a. especie. Este limite e usualmente designado de nvel de signicancia (n.s.) do teste e
representado doravante por
0
(
0
(0, 1)). O teste de hip oteses ser a delineado de modo
que
256
P(Rejeitar H
0
| H
0
e Verdadeira)
0
.
Os valores mais comuns do n.s. do teste s ao 10%, 5% e 1%.
Qualquer decisao pela rejeic ao ou nao de H
0
dever a basear-se na informa c ao recolhida,
muito em particular no
valor observado daquilo que chamaremos de uma estatstica de teste e designaremos
por T.
Denicao informal 8.15 Estatstica de teste
Uma estatstica de teste a utilizar no confronto de um par de hip oteses que digam
respeito ao par ametro desconhecido possui as seguintes caractersticas:
reecte a discrep ancia entre o estimador de e o valor conjecturado para em H
0
(
0
);
obtem-se, de um modo geral, ` a custa da v.a. fulcral Z que usaramos na
constru c ao de um intervalo de conan ca para , substituindo por
0
na expressao
de Z;
tem distribuic ao (exacta ou aproximada) conhecida, sob a validade de H
0
.
Exemplo 8.16 Estatstica de teste
Retomemos o Exemplo 8.4 e consideremos:
V.a. de interesse
X = dura cao de bateria de 12V
Situa cao
X normal(,
2
)
= E(X) desconhecido
2
= V (X) conhecida
Hipoteses
H
0
: =
0
= 1000 dias vs. H
1
: =
0
Nvel de signicancia
0
= 5%
257
Note-se que, caso pretendessemos construir um IC para , deveramos utilizar a seguinte
V.a. fulcral para
Z =

X
/
n
normal(0, 1).
E e substituindo por
0
na expressao de Z que obtemos a...
Estatstica de teste
T =

X0
/
n

H0
normal(0, 1),
onde
H0
. . .deve ler-se tem distribui cao . . . sob a validade de H
0
.
Decidir pela rejeicao ou n ao de H
0
pressupoe tambem que se identique:
o conjunto de valores considerados crticos para a estatstica de teste T que dever ao
conduzir à rejeic ao de H
0
.
Este conjunto e, por isso mesmo, denominado de regi ao crtica ou de rejeic ao de H
0
(para
valores da estatstica de teste).
Denicao informal 8.17 Regiao de rejeicao de H
0
(para valores da estatstica
de teste)
Representamo-la por W e escolhemo-la de modo que:
P(Rejeitar H
0
| H
0
e Verdadeira) =
0
(
0
).
seja um intervalo real (ou uma reuniao de intervalos reais) que depende de quantil(is)
de probabilidade relacionada com
0
e respeitantes à distribuic ao (exacta ou
aproximada) da estatstica de teste sob H
0
;
o seu aspecto dependa da hip otese alternativa H
1
e do que signicaobter valores
inconsistentes com H
0
.
Exemplo 8.18 Regiao de rejeicao de H
0
(para valores da estatstica de teste)
No Exemplo 8.16 conclumos rapidamente que quanto mais se distingue a estimativa de ,
x, do valor conjecturado para ,
0
= 1000 dias, menos consistente e H
0
: =
0
= 1000
dias com os dados e mais consistente e H
1
: =
0
com os mesmos.
Efectivamente, quando, por exemplo, x = 750 dias ( x = 1300 dias, resp.) de-
vemos, em princpio, rejeitar H
0
. Ora, nestes casos temos x <<
0
( x >>
0
, resp.).
Equivalentemente,
258
t =
x0
/
n
<< 0 (t =
x0
/
n
>> 0, resp.).
Assim, a regiao de rejei cao de H
0
(para valores da estatstica de teste) e uma reuni ao de
intervalos um à esquerda (t << 0) e outro ` a direita (t >> 0) ou seja
W = (, c) (c, +),
onde o valor crtico c e escolhido de modo que
P(Rejeitar H
0
| H
0
e Verdadeira) =
0
P(T < c ou T > c | H
0
) =
0
.
Assim, à semelhan ca do que acontecia com os intervalos de conan ca lidaremos com o
seguinte quantil de probabilidade, para
0
= 5%:
c =
1
(1
0
/2) =
1
(1 0.05/2)
tabela
= 1.9600.
Uma vez escolhida a estatstica de teste e identicada a regi ao de rejeic ao de H
0
para
a mesma, estamos em condic oes de poder tomar uma decisao.
Proposicao 8.19 Decisao
Para decidir pela rejeic ao ou n ao de H
0
e necessario calcular
t = valor observado da estatstica de teste.
Deve tomar-se uma de duas decisoes:
Rejeitar H
0
ao n.s.
0
, se t W;
N ao rejeitar H
0
ao n.s.
0
, se t W.
Nota 8.20 Decisao
Armar que
H
0
n ao foi rejeitada ao n.s.
0
n ao signica que
H
0
seja verdadeira.
Analogamente, concluir que
H
0
foi rejeitada ao n.s.
0
n ao signica que
259
H
0
seja falsa.
Signica sim que
H
0
n ao e consistente com os dados ao n.s.
0
.
Podemos rejeitar H
0
ao n.s.
0
e nao rejeitar esta hip otese a outro n.s. e vice-versa.
Em suma, a decisao de rejeitar ou n ao H
0
depende crucialmente do nvel de
signic ancia considerado.
Apresentadas que foram as no coes fundamentais em testes de hip oteses e altura de
apresentar o seu procedimento geral.
Denicao informal 8.21 Procedimento geral de testes de hipoteses
A efectuac ao de um teste de hip oteses compreende os 7 passos seguintes:
1. V.a. de interesse
Identicar a v.a. de interesse (X).
2. Situa cao
Identicar a distribui cao da v.a. de interesse, o par ametro desconhecido que esta a
ser testado, bem como averiguar se a distribuic ao de X depende de mais parametros
e se estes sao conhecidos ou desconhecidos.
3. Hipoteses
Especicar as hip oteses nula (H
0
) e alternativa (H
1
).
4. Nvel de signicancia
Escolher o nvel de signicancia (
0
).
5. Estatstica de teste
Escolher a estatstica de teste adequada (T) e identicar a sua distribuic ao (exacta
ou aproximada) sob a validade de H
0
.
6. Regiao de rejeicao de H
0
Obter a regiao de rejeicao de H
0
para valores da estatstica de teste (W), tendo em
conta o nvel de signicancia e a hip otese alternativa.
260
7. Decisao
Calcular o valor observado da estatstica de teste (t) e decidir pela rejeic ao ou n ao
de H
0
ao n.s.
0
.
As secc oes que se seguem consistem essencialmente na apresenta cao de um ou dois
exemplos ilustrativos do teste que d a por ttulo a seccao. Note-se, no entanto, que, de um
modo geral, em qualquer das secc oes ser a introduzido um conceito novo no ambito dos
testes de hip oteses pelo que se recomenda a leitura integral de todas elas.
261
8.2 Testes de hip oteses para o valor esperado,
variancia conhecida.
Tal como na obten c ao de IC para o valor esperado de uma populacao com variancia
conhecida, distinguiremos dois casos:
2. Popula c ao com distribuic ao arbitr aria e dimensao da amostra sucientemente
grande.
Ilustraremos a efectua cao destes dois testes com exemplos.
Exemplo 8.22 (caso 1) Teste sobre valor esperado de popula cao normal,
variancia conhecida
Um fabricante de baterias de 12V para alem de assumir que a dura cao das mesmas
(v.a. de interesse) possui distribuic ao normal com desvio-padr ao conhecido e igual a 50
dias pretende convencer um seu grande cliente que o valor esperado da dura c ao das
mesmas e de 1000 dias.
Averigue a razoabilidade desta arma c ao do fabricante de baterias ao nvel de
signic ancia de 5% e tendo em conta que a media da dura c ao de 4 baterias testadas
foi de 930 dias.
V.a. de interesse
Situa cao
X normal(,
2
)
desconhecido
2
= 50
2
dias
2
conhecido
Hipoteses
H
0
: =
0
= 1000 dias vs. H
1
: =
0
= 1000 dias
Nvel de signicancia
0
= 5%
262
Estatstica de teste
T =
X
0
/
n

H0
normal(0, 1) (8.3)
pois estamos a efectuar um teste sobre o valor esperado de uma popula cao normal
com vari ancia conhecida.
Regiao de rejeicao de H
0
Por estarmos a lidar com teste bilateral, a regi ao de rejeic ao de H
0
, escrita para
valores da estatstica de teste, e uma reuni ao de intervalos do tipo
W = (, c) (c, +), (8.4)
onde c : P(Rejeitar H
0
|H
0
) =
0
, i.e.,
c =
1
(1
0
/2) =
1
(1 0.05/2)
tabela
= 1.9600. (8.5)
Decisao
Uma vez que o valor observado da estatstica de teste e igual a
t =
x
0
/
n
=
930 1000
50/
4
= 2.8
W = (, 1.9600) (1.9600, +), (8.6)
conclui-se que devemos rejeitar H
0
ao n.s. de 5%, pelo que o cliente tem razoes para
desconar do fabricante.
263
Exemplo 8.23 (caso 2) Teste sobre valor esperado de popula cao com
distribuicao arbitraria e dimensao da amostra sucientemente grande,
variancia conhecida
Ao estudar-se a densidade de constru cao (X) num projecto de urbaniza c ao foi recolhida
uma amostra de 50 lotes desse projecto, tendo-se obtido

50
i=1
x
i
= 227.2.
3
Ate que ponto e razo avel armar que valor esperado da densidade de constru c ao e
igual a 5, assumindo que o desvio-padr ao de X e igual a 4 e um n.s. de 10%?
V.a. de interesse
X = densidade de constru c ao em projecto de urbaniza c ao
Situa cao
X com distribui c ao arbitr aria (nao normal): E(X) = , V (X) =
2
desconhecido
2
= 4
2
conhecido
n sucientemente grande (n = 50 > 30)
Hipoteses
H
0
: =
0
= 5 vs. H
1
: =
0
Nvel de signicancia
0
= 10%
V.a. fulcral para e estatstica de teste
De acordo com o TLC, pode armar-se que:
Z =
X E(

X)
_
V (

X)
=
X
/
n
a
normal(0, 1).
Substituindo por
0
na expressao desta v.a. fulcral, obtemos a seguinte estatstica
de teste com distribui c ao aproximada conhecida sob H
0
:
T =
X
0
/
n
a
H0
normal(0, 1). (8.7)
0
O teste e bilateral, logo a regi ao de rejeic ao de H
0
de teste) e uma reuniao de intervalos do tipo W = (, c) (c, +), onde
c : P(Rejeitar H
0
|H
0
)
0
, i.e.,
3
264
c =
1
(1
0
/2) =
1
(1 0.10/2)
tabela
= 1.6449. (8.8)
Decisao
Como o valor observado da estatstica de teste e igual a
t =
x
0
/
n
=
4.544 5
4/
50
= 0.81
W = (, 1.6449) (1.6449, +), (8.9)
deve armar-se que n ao devemos rejeitar H
0
ao n.s. de 10%.
265
8.3 Testes de hipoteses sobre a igualdade de dois
valores esperados, variancias conhecidas.
Motiva cao 8.24 Testes de hipoteses sobre a igualdade de dois valores
esperados, variancias conhecidas
Ao confrontar duas popula c oes independentes representando, por exemplo, os
desempenhos de dois tipos de artigos (resistencia, dura c ao, etc.) e usual testar a
igualdade dos seus valores esperados, sejam eles
1
e
2
. E importa notar que a hip otese
de igualdade de valores esperados,
H
0
:
1
=
2
(8.10)
e equivalente a
H
0
:
1
2
=
0
= 0. (8.11)
Distinguiremos novamente dois casos:

1. Duas popula coes independentes, com distribuic oes normais com vari ancias
conhecidas
2. Duas popula c oes independentes, com distribuic oes arbitr arias com vari ancias
conhecidas, e dimensoes das duas amostras sucientemente grandes.
Exemplo 8.25 (caso 1) Teste sobre a igualdade de valores esperados de duas
popula coes normais, variancias conhecidas
Um fabricante produz dois tipos de pl astico e pretende saber se as suas resistencias
possuem valores esperados iguais. Com objectivo de esclarecer esta d uvida, recolheu
duas amostras, tendo registado as seguintes observa c oes:
Tipo 1 x
1
= (26, 24, 22, 30)
Tipo 2 x
2
= (25, 31, 33, 29).
Assumindo que as resistencias de Tipo 1 e 2 s ao v.a. independentes com distribuic ao
normal e desvios-padrao iguais a
1
= 7 e
2
= 3, respectivamente, teste
a hipotese de igualdade dos valores esperados das resistencias
contra
266
a hip otese do valor esperado da resistencia do plastico de Tipo 1 ser inferior ` a do
Tipo 2.
Considere para o efeito o n.s. de 5%.
V.a. de interesse
X
1
= resistencia do pl astico de Tipo 1
X
2
= resistencia do pl astico de Tipo 2
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
= 7
2
e
2
2
= 3
2
(conhecidos)
Hipoteses
H
0
:
1
2
=
0
= 0 (
1
=
2
) vs. H
1
:
1
2
<
0
= 0 (
1
<
2
)
Nvel de signicancia
0
= 5%
Estatstica de teste
T =
(

X
1

X
2
)
0
_
2
1
n1
+

2
2
n2
H0
normal(0, 1) (8.12)
uma vez que pretendemos efectuar teste sobre a igualdade de valores esperados de
duas popula coes independentes com distribuic ao normal e vari ancias conhecidas.
0
Tratando-se de
um teste unilateral inferior (H
1
:
1
2
<
0
= 0),
conclumos que, quanto menor for a estimativa de MV de (
1
2
), ( x
1
x
2
), mais
raz oes temos para rejeitar H
0
. Assim, a regi ao de rejeic ao de H
0
(para valores da
estatstica de teste) e um intervalo ` a esquerda
W = (, c), (8.13)
onde
c =
1
(
0
) =
1
(1
0
) =
1
(1 0.05)
tabela
= 1.6449. (8.14)
267
Decisao
Uma vez que n
1
= n
2
= 4 e as medias das duas amostras s ao iguais a x
1
= 25.5 e
x
2
= 29.5, o valor observado da estatstica de teste e dado por
t =
( x
1
x
2
)
0
_
2
1
n1
+

2
2
n2
=
(25.5 29.5) 0
_
7
2
4
+
3
2
4
= 1.05
W = (, 1.6449). (8.15)
Deste modo, conclumos que nao devemos rejeitar a hip otese de igualdade dos valores
esperados das resistencias dos dois tipos de pl astico (H
0
) ao n.s. de 5%. (Fa ca um
coment ario que entender pertinente...)
Nota 8.26 Decisao a diversos nveis de signicancia
E curioso notar que no Exemplo 9.4 n ao se rejeita H

0
a qualquer nvel de signicancia
menor ou igual a 5% pois
1.05
_
_
W
5%
= (, 1.6449)
W
2.5%
= (, 1.9600)
W
1%
= (, 2.3263)
(8.16)
sugerindo que enunciemos os seguintes resultados.
Proposicao 8.27 Decisao a diversos nveis de signicancia
E crucial ter presente os seguintes resultados:

N ao rejeitar H
0
ao n.s.
0
N ao rejeitar H
0
a qualquer n.s.
0

0
;
Rejeitar H
0
ao n.s.
0
Rejeitar H
0
a qualquer n.s.
0

0
.
(Justique elaborando um esquema!)
268
Exerccio 8.28 (caso 2) Teste sobre a igualdade de valores esperados de
popula coes independentes com distribuicao arbitraria e dimensao da amostra
sucientemente grande, variancias conhecidas
Conceba um enunciado de um teste de hipoteses para o caso 2 e complete os passos
seguintes do procedimento geral de hipoteses:
V.a. de interesse
Situa cao
X
1
X
2
, com distribuic oes arbitr arias (n ao normais): E(X
i
) =
i
, V (X
i
) =
2
i
, i =
1, 2
(
1
2
) desconhecido
2
1
e
2
2
conhecidos
n
1
e n
2
sucientemente grandes.
Hipoteses
Nvel de signicancia
Estatstica de teste
(

X
1

X
2
)
0
_
2
1
n1
+

2
2
n2
a
H0
normal(0, 1) (8.17)
0
Decisao
269
8.4 Fun cao potencia de um teste
Motiva cao 8.29 Fun cao potencia de um teste
Ao efectuar-se um teste e usual saber qual a probabilidade de rejeitar H
0
quando esta
hip otese e verdadeira.

E igualmente importante determinar a probabilidade de tomar a
seguinte decisao acertada: rejeitar H
0
quando H
0
e falsa.
Comecemos por relembrar que, ao denirmos as hip oteses nula (H
0
) e alternativa
(H
1
) sobre o par ametro desconhecido , subdividimos o espaco de par ametro em dois
sub-espacos
0
e
1
, respectivamente. Para alem disso, recorde-se que a probabilidade
de cometer erros de 1a. e 2a. especie s ao fun coes de denidas por
= ()
= P(Rejeitar H
0
| H
0
e verdadeira)
= P(T W | ),
0
(8.18)
= ()
= P(N ao rejeitar H
0
| H
0
e falsa)
= P(T W | ),
1
. (8.19)
Denicao 8.30 Fun cao potencia de um teste
A fun cao potencia de um teste corresponde à probabilidade de rejeic ao da hipotese nula
(quer esta seja verdadeira, quer seja falsa):
p() = P(Rejeitar H
0
| )
= P(T W | ),
=
_
_
_
(),
0
1 (),
1
.
(8.20)
Caso H
0
seja uma hip otese nula simples, o sub-espaco
0
e singular e temos
p() =
_
_
_
(
0
),
0
= {
0
}
1 (),
1
.
(8.21)
270
Exemplo 8.31 Funcao potencia de um teste
Para denir a funcao potencia do teste descrito no Exemplo 8.22, e necessario relembrar
o seguinte:
V.a. de interesse
Situa cao
X normal(,
2
)
desconhecido
2
= 50
2
dias conhecido
n = 4
Hipoteses
H
0
: =
0
= 1000 dias vs. H
1
: =
0
dias
Nvel de signicancia
0
= 5%
Estatstica de teste
T =
X
0
/
n

H0
normal(0, 1) (8.22)
0
W = (, 1.9600) (1.9600, +).
Assim sendo, segue-se:
Espaco e sub-espa cos de parametro
= (0, +)
0
= {
0
}
1
= \{
0
}
271
Fun cao potencia do teste
p() = P(Rejeitar H
0
| )
= P(T W | )
= P
_

X
0
/
n
< 1.9600 ou
X
0
/
n
> 1.9600 |
_
= P
_

X +
0
/
n
< 1.9600 |
_
+P
_

X +
0
/
n
> 1.9600 |
_
= P
_

X
/
n
< 1.9600 +

0
n
|
_
+P
_

X
/
n
> 1.9600 +

0
n
|
_
=
_
1.9600 +

0
n
_
+ 1
_
1.9600 +

0
n
_
, . (8.23)
Concretiza c oes
Note-se, por exemplo, que:
=
0
= 1000 dias
p(
0
) = (1.9600) + 1 (1.9600) = 2 [1 (1.9600)] = 0.05 =
0
;
=
1
= 1025 dias
p(
1
) = (1.9600 1) + 1 (1.9600 1) = [1 (2.9600)] + [1
(0.9600)]
tabela
= (1 0.9985) + (1 0.8315) = 0.1700.
A interpreta cao do ultimo destes resultados passa por armar que, caso o verdadeiro
valor esperado da dura cao das baterias de 12V seja igual a =
1
= 1025 dias, o
teste e capaz de rejeitar H
0
em 17% das vezes.
Exerccio 8.32 Fun cao potencia de um teste
(a) Recorra a um software que lhe seja familiar para elaborar o gr aco da funcao
potencia do teste descrito no Exemplo 8.31. Comente.
(b) Elabore tambem o gr aco da funcao potencia de teste quando se confrontam as
hip oteses H
0
: =
0
e H
1
: =
0
mas se utiliza a regiao de rejeicao W =
(, 1.96). Comente este graco e compare-o com o que obteve na alnea (a).
272
8.5 Testes de hip oteses para o valor esperado,
variancia desconhecida.
E de longe mais realista efectuar um teste sobre assumindo que

2
e igualmente
desconhecido. Mais, tal como na Secc ao 8.2, sera necessario fazer a destrinca entre os
dois casos seguintes:
2. Popula c ao com distribuic ao arbitr aria e dimensao da amostra sucientemente
grande.
Exemplo 8.33 (caso 1) Teste sobre o valor esperado de popula cao normal,
variancia desconhecida
A dura c ao (em horas de uso) de certa marca de pilha para m aquinas fotogr acas
digitais possui distribuic ao que se admite normal com valor esperado e vari ancia
2
desconhecidos. Um revendedor dessas baterias adquiriu recentemente um grande
lote e seleccionou uma amostra de 10 baterias, tendo obtido as seguintes dura c oes
x = (251, 238, 236, 229, 252, 253, 245, 242, 235, 230). De notar que a esta amostra estao
associados

10
i=1
x
i
= 2411 e

10
i=1
x
2
i
= 582009.
O revendedor pretende averiguar se o valor esperado da dura cao e de 250 horas. Teste
esta hip otese ao nvel de signicancia de 10%, contra a hipotese alternativa defendida pelo
produtor que defende que tal valor esperado e superior a 250 horas.
V.a. de interesse
X = dura cao (em horas de uso) de certa marca de pilha
Situa cao
X normal(,
2
)
desconhecido
2
desconhecido
Hipoteses
H
0
: =
0
= 250 horas vs. H
1
: >
0
= 250 horas
Nvel de signicancia
0
= 10%
273
Estatstica de teste
T =
X
0
S/
n

H0
t
(n1)
(8.24)
dado que pretendemos efectuar teste sobre o valor esperado de uma popula cao
normal com vari ancia desconhecida.
0
Estamos a lidar com
um teste unilateral superior (H
1
: >
0
),
pelo que, quanto maior for a estimativa de MV de , x, mais nos devemos inclinar
para a rejei cao H
0
. Assim sendo, a regiao de rejeicao de H
0
(para valores da
estatstica de teste) e um intervalo ` a direita
W = (c, +), (8.25)
onde c : P(RejeitarH
0
|H
0
) =
0
, i.e.,
c = F
1
t(n1)
(1
0
) = F
1
t(101)
(1 0.10)
tabela
= 1.383. (8.26)
Decisao
Tendo em conta que n = 10 e a media e a variancia corrigida da amostra sao iguais
a
x =
1
n
n
i=1
x
i
=
2411
10
= 241.1 (8.27)
s
2
=
1
n 1
__
n
i=1
x
2
i
_
n( x)
2
_
=
1
10 1
[582009 10 (241.1)
2
]
= 79.66 (8.28)
(respectivamente), o valor observado da estatstica de teste e dado por
t =
x
0
s/
n
=
241.1 250
_
79.66/10
= 3.15
W = (1.383, +). (8.29)
274
Deste modo, conclumos que n ao devemos rejeitar H
0
ao n.s. de 10% nem a qualquer
outro n.s. menor que 10%.
4
Exemplo 8.34 (caso 2) Teste sobre o valor esperado de popula cao com
distribuicao arbitraria, variancia desconhecida
Retome o Exemplo 8.33 e desta feita assuma que o revendedor desconhece a distribuic ao
da dura c ao dessas baterias, adquiriu um grande lote e seleccionou uma amostra nao de
10 mas sim de 50 baterias, tendo obtido x = 241.1 e s
2
= 398.3.
Volte a testar as hip oteses nula e alternativa consideradas anteriormente ao n.s. de
10%.
V.a. de interesse
X = dura cao (em horas de uso) de certa marca de pilha
Situa cao
X distribuic ao arbitr aria
= E(X) desconhecido
2
= V (X) desconhecido
Hipoteses
H
0
: =
0
= 250 horas vs. H
1
: >
0
= 250 horas
Nvel de signicancia
0
= 10%
Estatstica de teste
T =
X
0
S/
n
a
H0
normal(0, 1) (8.30)
porque pretendemos efectuar teste sobre o valor esperado de uma popula c ao
com distribuic ao arbitr aria e variancia desconhecida e a dimensao da amostra e
sucientemente grande e justica o recurso a um resultado limite.
4
E curioso notar que caso estivessemos a testar H0 : = 0 = 250 horas vs. H1 : < 0 rejeitaramos
H0 ao referido n.s. (Justique...)
275
0
Tratando-se de um teste unilateral superior (H
1
: >
0
), a regi ao de rejei cao de
H
0
(para valores da estatstica de teste) e ` a mesma um intervalo ` a direita
W = (c, +),
onde agora c : P(RejeitarH
0
|H
0
)
0
, pelo que
c =
1
(1
0
) =
1
(1 0.10)
tabela
= 1.6449.
Decisao
Uma vez que n = 50, x = 241.1 e s
2
= 398.3 tem-se:
t =
x
0
s/
n
=
241.1 250
_
398.3/50
= 3.15
W = (1.6449, +). (8.31)
Pode ent ao armar-se que n ao devemos rejeitar H
0
a qualquer outro n.s. menor ou
igual a 10%.
Terminamos esta secc ao apresentando um exemplo similar ao apresentado no nal da
secc ao 7.4. Diz respeito a um teste sobre o valor esperado de uma v.a. de interesse X cuja
distribuic ao depende de um unico par ametro desconhecido e que, embora o valor esperado
E(X) e a vari ancia V (X) dependam desse mesmo par ametro, o TLC s o por si basta para
obter uma v.a. fulcral (logo uma estatstica de teste para o valor esperado sem que seja
necessario estimar V (X).
276
Exemplo/Exerccio 8.35 Teste sobre valor esperado de popula cao com
distribuicao arbitraria e dimensao da amostra sucientemente grande,
variancia desconhecida mas que nao carece de estima cao...
Admita que o desvio absoluto de uma medi cao instrumental em rela c ao a uma norma e
uma v.a. X com distribuic ao exponencial com parametro desconhecido.
5
(a) Calcule E(

X) e V (

X), onde

X representa, naturalmente, a media de uma amostra
aleat oria de dimens ao n proveniente da popula c ao X. Tirando partido dos resultados
anteriores mostre que, para n sucientemente grande, se tem
Z = (

X 1)
n
a
normal(0, 1).
(b) Tendo em conta a v.a. fulcral Z, teste a hip otese H
0
: =
0
= 1 contra a alternativa
bilateral H
1
: =
0
, ao nvel de signic ancia de
0
= 10% e ` a luz do facto da soma
dos desvios absolutos da amostra x = (x
1
, . . . , x
40
) ser igual a

40
i=1
x
i
= 47.5408.
V.a. de interesse
X = desvio absoluto de uma medic ao instrumental em rela cao a uma norma
Situa cao
X exponencial()
desconhecido
Hipoteses
H
0
: =
0
= 1 vs. H
1
: =
0
Nvel de signicancia
0
= 10%
V.a. fulcral para e estatstica de teste
Comece-se por notar que:
E(

X) = E(X) =
1
V (

X) =
V (X)
n
=
1
n
2
< +.
5
277
Ent ao, de acordo com o TLC, pode armar-se que
Z =
X E(

X)
_
V (

X)
=
X
1
_
1
n
2
= (

X 1)
n
a
normal(0, 1). (8.32)
Substituindo por
0
na expressao desta v.a. fulcral, obtemos a seguinte estatstica
de teste com distribuic ao aproximada conhecida sob H
0
:
T = (
0

X 1)
n
a
H0
normal(0, 1). (8.33)
0
Tratando-se de um teste bilateral, a regiao de rejei cao de H
0
(para valores da
estatstica de teste) e uma reuniao de intervalos do tipo W = (, c) (c, +),
0
|H
0
)
0
, i.e.,
c =
1
(1
0
/2) =
1
(1 0.10/2)
tabela
= 1.6449.
Decisao
Dado que o valor observado da estatstica de teste e igual a
t = (
0
x 1)
n
= (1 47.5408/40 1)
40
= 1.192
W = (, 1.6449) (1.6449, +),
conclui-se que n ao devemos rejeitar H
0
ao n.s. de 10%, nem a qualquer outro n.s.
menor que 10%.
278
8.6 Um metodo alternativo de decisao em testes de
hip oteses: calculo do p-value
Motiva cao 8.36 Calculo do p-value
A decisao pela rejei cao ou n ao de H
0
depende crucialmente do nvel de signic ancia
0
que tenhamos considerado.
Ora, em vez de xarmos o n.s. do teste, de identicarmos a regi ao de rejei cao de H
0
e de vericarmos se o valor observado da estatstica de teste (t) pertence ou n ao a tal
regi ao, podemos proceder do seguinte modo:
tomar o valor de t
e averiguar
para que nveis de signicancia se decide pela rejeic ao de H
0
e
para que nveis de signicancia se decide pela n ao rejeic ao de H
0
.
Passemos agora a um exemplo por forma a continuar a motivar o calculo do que
designaremos por p-value.
Exemplo 8.37 Calculo do p-value
Retomemos o problema do fabricante de baterias de 12V, descrito no Exemplo 8.22.
Recordemos que temos:
V.a. de interesse
Situa cao
X normal(,
2
)
desconhecido
2
= 50
2
dias
2
conhecido.
Hipoteses
H
0
: =
0
= 1000 dias vs. H
1
: =
0
= 1000 dias
Nvel de signicancia
Desta feita consideremos um n.s. arbitr ario
0
.
279
Estatstica de teste
T =
X
0
/
n

H0
normal(0, 1) (8.34)
0
Sabemos que se trata de uma reuni ao de intervalos do tipo W
0
= (, c
0
)
(c
0
, +), onde
c
0
=
1
(1
0
/2). (8.35)
Decisao
Ora, j a vimos que o valor observado da estatstica de teste e igual a t = 2.8. Logo,
consultando a tabela de quantis da distribui cao normal(0, 1) conclui-se que:
por um lado,
t = 2.8 W0
=
_
_
(, 1.6449) (1.6449, +), para 0 = 10%
(, 1.9600) (1.9600, +), para 0 = 5%
(, 2.5758) (2.5758, +), para 0 = 1%
(, 2.7478) (2.7478, +), para 0 = 0.6%,
(8.36)
devendo rejeitar-se H
0
a qualquer n.s.
0
0.6%;
por outro lado,
t = 2.8 W0
=
_
_
(, 2.8782) (2.8782, +), para 0 = 0.4%
(, 3.0902) (3.0902, +), para 0 = 0.2%
. . . ,
(8.37)
e neste caso n ao se deve rejeitar H
0
a qualquer n.s.
0
0.4%.
Importa ainda notar que, caso o ponto crtico que dene a regiao de rejeic ao de H
0
fosse
c = |t|, (8.38)
teramos a seguinte regi ao de rejeic ao de H
0
W = (, |t|) (|t|, +), (8.39)
com nvel de signic ancia associado igual a (Esquema...)
280
P(T < |t| ou T > |t| | H
0
) = 2 [1 (|t|)]
= 2 [1 (2.8)]
= 2 [1 0.9974]
= 0.0052
= 0.52%. (8.40)
Para alem disso,
t = 2.8 W
0.52%
= (, 2.8) (2.8, +) (8.41)
donde
n ao rejeitaramos H
0
ao n.s. de 0.52% nem a qualquer n.s. menor que 0.52%;
rejeitaramos H
0
a qualquer n.s. maior que 0.52%.
0.52% e, neste exemplo, o ponto de viragem da nossa decisao pela rejei cao ou nao
de H
0
. Este ponto e genericamente designado de...
Denicao informal 8.38 P-value
Dado o valor observado da estatstica de teste
o p value e o maior nvel de signicancia que leva à n ao rejei cao de H
0
.
Para alem disso, devemos agir do seguinte modo:
n ao rejeitar H
0
0
p value;
rejeitar H
0
0
> p value.
6
E quanto menor for o p value, maior e a evidencia contra H
0
.
6
Posto isto, podemos acrescentar que o p value e o menor (aqui com as devidas aspas) nvel de
signic ancia que leva à rejei cao de H0.
281
Nota 8.39 P-value
O calculo do p value depende do aspecto da regi ao de rejeic ao de H
0
(para valores da
estatstica de teste:
W Teste P-value Esquema...
(, c) unilateral inferior P(T < t | H0) = F
T|H0
(t)
(c, +) unilateral superior P(T > t | H0) = 1 F
T|H0
(t)
(, c) (c, +) bilateral e T|H0 com P(T < |t| ou T > |t| | H0)
distrib. simetrica em = 2 [1 F
T|H0
(|t|)]
relacao à origem
282
8.7 Testes de hipoteses sobre a igualdade de
valores esperados de duas popula coes, variancias
desconhecidas.
No ambito desta disciplina, caso pretendamos confrontar os valores esperados de duas
popula c oes normais independentes com variancias desconhecidas e estejamos a lidar com
amostras de dimensoes que n ao s ao sucientemente grandes que justiquem o recurso a
um resultado assint otico, teremos que assumir que as vari ancias s ao iguais, alias, tal como
aconteceu no captulo anterior.
Exemplo 8.40 (caso 1) Teste sobre a igualdade de valores esperados de
popula coes normais, variancias desconhecidas
Foram efectuados estudos em Los Angeles e New York com o objectivo de determinar a
concentra cao de monoxido de carbono (CO) perto de vias r apidas. Para isso recolheram-se
amostras de ar para as quais se determinou a respectiva concentra cao de CO (usando para
tal um espect ometro). Os resultados das medic oes em ppm (partes por milh ao) foram no
perodo de uma semana:
Los Angeles x
1
= (112.2, 118.4, 114.1)
New York x
2
= (101.1, 102.2, 100.4, 98.6, 88.2).
Posteriormente, num programa televisivo em que se debatiam questoes ambientais, o
presidente da c amara de New York armou que: A media da concentra cao de CO em
Los Angeles e superior ou igual ` a de New York.
Diga se esta arma cao e consistente com os dados, determinando para o efeito um
intervalo para o p value.
V.a. de interesse
X
1
= concentra c ao de CO em Los Angeles
X
2
= concentra c ao de CO em New York
Situa cao
X
1
normal(
1
,
2
1
) X
2
normal(
2
,
2
2
)
(
1
2
) desconhecido
2
1
e
2
2
desconhecidos, no entanto, assume-se que s ao IGUAIS:
2
1
=
2
2
=
2
n
1
30 ou n
2
30
283
Hipoteses
H
0
:
1
2

0
= 0 vs. H
1
:
1
2
<
0
Nvel de signicancia
0
com valor arbitr ario
Estatstica de teste
T =
(

X
1

X
2
)
0
_
(n11)S
2
1
+(n21)S
2
2
n1+n22
(
1
n1
+
1
n2
)
12=0
t
(n1+n22)
(8.42)
pois estamos a efectuar teste sobre a igualdade dos valores esperados de duas
popula c oes independentes com distribui coes normais, cujas vari ancias, embora
desconhecidas, se assume serem iguais.
0
Tratando-se de
um teste unilateral inferior (H
1
:
1
2
<
0
= 0),
conclumos que a regi ao de rejei cao de H
0
(para valores da estatstica de teste) e
um intervalo à esquerda do tipo W = (, c), onde c : P(Rejeitar H
0
|
1

2
=
0
) =
0
, ou seja,
c = F
1
t(n
1
+n
2
2)
(
0
) = F
1
t(n
1
+n
2
2)
(1
0
). (8.43)
Decisao
Ora,
n
1
= 3, x
1
= 114.9 e s
2
1
= 10.09
n
2
= 5, x
2
= 98.1 e s
2
2
= 32.34,
logo o valor observado da estatstica de teste e igual a
t =
( x
1
x
2
)
0
_
(n11)s
2
1
+(n21)s
2
2
n1+n22
(
1
n1
+
1
n2
)
=
(114.9 98.1) 0
_
(31)10.09+(51)32.34
3+52
(
1
3
+
1
5
)
= 3.237. (8.44)
284
Uma vez que este teste esta associado a uma regi ao de rejeic ao de H
0
que e um
intervalo ` a esquerda temos:
p value = P(T < t |
1
2
=
0
)
= F
T|12=0
(t)
= F
t(3+52)
(3.237)
maq.
= 0.991123. (8.45)
Recorrendo às tabelas de quantis da distribui cao de t-student com 6 graus de
liberdade podemos adiantar um intervalo para o pvalue deste teste. Com efeito, ao
enquadrarmos convenientemente t = 3.237 por dois quantis, obtemos sucessivamente
F
1
t(3+52)
(0.99) = 3.143 < t = 3.237 < 3.707 = F
1
t(3+52)
(0.995)
0.99 < p value = F
t(3+52)
(3.237) < 0.995. (8.46)
Deste modo, o intervalo aproximado para o p value e (0.99,0.995), pelo que
n ao devemos rejeitar H
0
a qualquer n.s.
0
99%;
rejeitar H
0
a qualquer n.s.
0
99.5%.
Mais, pela ordem de grandeza do p value, a hip otese defendida pelo presidente da
c amara de New York (H
0
) agura-se altamente consistente com os dados obtidos.
Ainda a prop osito do exemplo anterior, note-se que, pelo facto das amostras possuirem
dimens ao 3 e 5, n ao seria lcito recorrer a qualquer resultado assintotico, pelo que a
soluc ao satisfatoria no ambito desta disciplina passa por assumir que as vari ancias, embora
desconhecidas, s ao iguais. Acrescente-se, no entanto, que um teste previo de igualdade
das mesmas permite-nos concluir que esta hipotese n ao deve ser rejeitada a qualquer dos
nveis usuais de signic ancia.
Mas nem sempre e razo avel admitir que
2
1
=
2
2
=
2
, muito em particular quando
as estimativas de
2
1
e
2
2
s ao bem distintas. Recorde-se que, caso n
1
> 30 e n
2
> 30,
podemos invocar dois resultados assint oticos, nomeadamente, o TLC e o Teorema de
Slutsky, e deixa de ser necessario assumir que as duas popula c oes s ao normais e que as
vari ancias, embora desconhecidas, s ao iguais.
285
Exemplo 8.41 (caso 2) Teste sobre a igualdade de valores esperados
de popula c oes independentes com distribuicao arbitraria e amostras
sucientemente grandes, variancias desconhecidas
Para comparar a resistencia ao uso de dois tipos de materiais cer amicos usados em
pavimentos, foram instalados 81 mosaicos do primeiro tipo e 121 do segundo tipo num
corredor movimentado de uma superfcie comercial. Apos um ano o seu desgaste foi
medido numa escala conveniente. Para os mosaicos do primeiro tipo obteve-se x
1
= 290
e s
1
= 12, enquanto que para os do segundo tipo os resultados foram x
2
= 321 e s
2
= 14.
O fabricante do primeiro tipo de material arma que o valor esperado do desgaste dos
seus mosaicos e inferior ao dos mosaicos do segundo tipo de material. Efectue um teste
de hipoteses que entender razo avel, assumindo que os desgastes em mosaicos diferentes
s ao v.a. independentes e um nvel de signic ancia de 1%.
7
V.a. de interesse
X
1
= desgaste dos mosaicos do primeiro tipo de material
X
2
= desgaste dos mosaicos do segundo tipo de material
Situa cao
X
1
X
2
, com distribuicoes arbitr arias (possivelmente normais):
E(X
i
) =
i
, V (X
i
) =
2
i
, i = 1, 2
(
1
2
) desconhecido
2
1
e
2
2
desconhecidos mas n ao necessariamente iguais
n
1
> 30 e n
2
> 30, i.e., ambas as amostras sao sucientemente grandes
Hipoteses
H
0
:
1

2
=
0
= 0 vs. H
1
:
1

2
<
0
= 0 (pretens ao do fabricante do
primeiro tipo de material)
Nvel de signicancia
0
= 1%
Estatstica de teste
T =
(

X
1

X
2
)
0
_
S
2
1
n1
+
S
2
2
n2
a
H0
normal(0, 1) (8.47)
7
286
por tratar-se de teste sobre a igualdade dos valores esperados de duas populacoes
independentes com distribuic ao arbitr aria com vari ancias desconhecidas e estarmos
a lidar com amostras sucientemente grandes.
0
Lidamos novamente com um teste unilateral inferior (H
1
:
1

2
<
0
= 0), logo
a regi ao de rejeicao de H
0
(para valores da estatstica de teste) e um intervalo ` a
esquerda W = (, c), onde c : P(Rejeitar H
0
|H
0
)
0
, i.e.,
c =
1
(
0
) =
1
(1
0
) =
1
(0.99) = 2.3263. (8.48)
Decisao
Uma vez que
n
1
= 81, x
1
= 290 e s
1
= 12
n
2
= 121, x
2
= 321 e s
2
= 14,
o valor observado da estatstica de teste e igual a
t =
( x
1
x
2
)
0
_
s
2
1
n1
+
s
2
2
n2
=
(290 321) 0
_
12
2
81
+
14
2
121
= 16.82
W = (, 2.3263). (8.49)
Assim sendo, devemos rejeitar H
0
a qualquer n.s.
0
1%. Posto isto podemos
armar que a pretensao do fabricante do primeiro tipo de material (desgaste
esperado menor) e consistente com os dados aos nveis usuais de signic ancia.
287
8.8 Testes de hipoteses para a variancia de uma
popula cao normal.
E tambem costume especular sobre a vari ancia de uma v.a. de interesse. Caso esta v.a.
possua distribuic ao normal, podemos adiantar uma estatstica de teste com distribui cao
exacta do qui-quadrado sob a validade de H
0
.
Exemplo/Exerccio 8.42 Teste de hipoteses sobre a variancia de uma
popula cao normal
(a) Admita que a resistencia ` a tens ao de uma bra textil (em psi) possui distribuicao
normal, com valor esperado desconhecido, e averigue se a vari ancia e igual a
2
0
= 50 psi
2
ou se pelo contr ario e superior a este valor, ` a luz da amostra x =
(1018, 982, 1007, 1015, 978) e ao n.s. de 5%.
V.a. de interesse
X = resistencia à tensao de uma bra textil (em psi)
Situa cao
X normal(,
2
)
desconhecido
2
desconhecido.
Hipoteses
H
0
:
2
=
2
0
= 50 psi
2
vs. H
1
:
2
>
2
0
Nvel de signicancia
0
= 5%
Estatstica de teste
T =
(n 1) S
2
2
0
H0

2
(n1)
(8.50)
pois pretendemos efectuar um teste sobre a vari ancia de uma popula c ao normal
com valor esperado desconhecido.
0
Tratando-se de um teste unilateral superior (H
1
:
2
>
2
0
), a regi ao de rejeic ao
de H
0
(para valores da estatstica de teste) e um intervalo ` a direita do tipo
W = (c, +), onde c : P(Rejeitar H
0
|H
0
) =
0
, ou seja,
c = F
1
2
(n1)
(1
0
) = F
1
2
(51)
(1 0.05)
tabela
= 9.488. (8.51)
288
Decisao
O valor observado da estatstica e igual a
t =
(n 1) s
2
2
0
=
(5 1) 351.5
50
= 28.12
W = (9.488, +). (8.52)
Deste modo devemos rejeitar H
0
ao n.s. de 5% ou a qualquer outro n.s. maior
que 5%.
(b) Fa ca uso de uma m aquina (resp. das tabelas) para determinar um valor (resp. um
intervalo) para o p value do teste da alnea anterior. Que decisoes dever a tomar ao
recorrer ao valor do (resp. intervalo para o) p value?
289
8.9 Outro metodo alternativo de decisao em testes de
hip oteses: rela cao entre intervalos de conan ca e
testes bilaterais.
Existe ainda uma outra alternativa de efectuac ao de testes de hip oteses que passa por
invocar uma analogia entre intervalos de conan ca e testes, nomeadamente bilaterais,
como se pode ver na proposic ao que se segue.
Proposicao 8.43 Rela cao entre intervalos de conan ca e testes de hip oteses
bilaterais
Seja
IC
(10)100%
() = [l, u]
um intervalo de conan ca para . Ent ao este IC leva à
rejeic ao de H
0
: =
0
ao nvel de signic ancia
0
8
a favor da hip otese alternativa bilateral H
1
: =
0
, caso

0
IC
(10)100%
().
Este resultado faz todo o sentido uma vez que, caso o valor conjecturado para ,
0
,
n ao pertenca ao conjunto de valores razo aveis para associados ao grau de conan ca
(1
0
) 100%, faz todo o sentido rejeitar H
0
ao n.s. de
0
.
Nota 8.44 Rela cao entre intervalos de conan ca e testes bilaterais
Para invocar esta analogia, e necessario que a estatstica de teste tenha sido obtida ` a
custa da v.a. fulcral para que usada na constru c ao de IC
(10)100%
().
8
Ou a qualquer outro n.s. superior a 0.
290
Exemplo 8.45 Rela cao entre intervalos de conan ca e testes bilaterais
Retomemos o Exemplo 8.42, construamos um IC a 95% para
2
e averiguemos a
razoabilidade de H
0
:
2
=
2
0
= 50psi
2
contra a hipotese alternativa bilateral H
1
:
2
=
2
0
ao nvel de signic ancia de
0
= 5%.
2
Z =
(n 1)S
2
2

2
(n1)
(8.53)
j a que estamos a obter um IC para a vari ancia de uma popula c ao normal com valor
esperado desconhecido.
_
_
a
0
= F
1
2
(n1)
(
0
/2) = F
1
2
(4)
(0.025)
tabela
= 0.484
b
0
= F
1
2
(n1)
(1
0
/2) = F
1
2
(4)
(0.975)
tabela
= 11.14.
(8.54)
0
Z b
0
[TPC]
IC
(10)100%
(
2
) =
_
_
(n 1)s
2
F
1
2
(n1)
(1
0
/2)
,
(n 1)s
2
F
1
2
(n1)
(
0
/2)
_
_
=
_
(5 1)351.5
11.14
,
(5 1)351.5
0.484
_
= [126.212, 2904.959]. (8.55)
Hipoteses
H
0
:
2
=
2
0
= 50psi
2
vs. H
1
:
2
=
2
0
Decisao
Invocando a rela cao entre intervalos de conan ca e testes de hipoteses, pode concluir-
se que, pelo facto de
2
0
= 50 IC
95%
(
2
) = [126.212, 2904.959], (8.56)
devemos rejeitar H
0
ao n.s. de 5% (a favor de H
1
:
2
=
2
0
) ou a qualquer outro
n.s. maior que 5%.
291
8.10 Testes de hip oteses para parametros de
popula coes nao normais uniparametricas.
No ambito desta disciplina aprenderemos, por exemplo, a efectuar testes assint oticos sobre
uma probabilidade de sucesso desconhecida. Vejamos um exemplo.
Exemplo 8.46 Teste sobre uma probabilidade de sucesso
Um fabricante de cerveja arma que a sua bebida tem a preferencia de 40% dos
apreciadores de cerveja. Recolhida uma amostra, constatou-se que 54 de 150 apreciadores
preferem tal marca. Averigue a razoabilidade da arma cao do fabricante ao nvel de
signic ancia de 4%.
9
V.a. de interesse
Neste caso estamos a lidar com a seguinte v.a. de interesse:
X =
_
_
_
1, se o indivduo prefere a marca de cerveja
0, c.c.
(8.57)
Situa cao
X Bernoulli(p)
p desconhecido
n sucientemente grande (n = 150 >> 30)
Hipoteses
H
0
: p = p
0
= 0.40 vs. H
1
: p = p
0
Nvel de signicancia
0
= 4%
Estatstica de teste
Sabe-se que o estimador de MV de p e
X =
1
n
n
i=1
X
i
, (8.58)
onde X
i

i.i.d.
X. Para alem disso,
9
292
E(

X) = E(X) = p (8.59)
V (

X) =
1
n
V (X) =
p(1 p)
n
< +. (8.60)
Ent ao pelo TLC pode armar-se que
Z
X E(

X)
_
V (

X)
=
X p
_
p(1p)
n
a
normal(0, 1), (8.61)
pelo que a estatstica de teste e
T =
X p
0
_
p0(1p0)
n
a
H0
normal(0, 1). (8.62)
De notar que esta estatstica de teste, ao contrario das que usamos ate ao momento,
n ao foi obtida à custa da v.a. fulcral
Z =
X p
_

X(1
X)
n
a
normal(0, 1), (8.63)
que teramos utilizado para obter um IC assint otico para o par ametro p. Esta
decisao prende-se essencialmente com o facto de n ao ser necessaria qualquer invers ao
de duplas desigualdades do tipo c Z c no ambito dos testes de hip oteses.
10
0
Tratando-se de um teste bilateral, a regi ao de rejeic ao de H
0
, escrita para
valores da estatstica de teste, e do tipo W = (, c) (c, +), onde c :
P(Rejeitar H
0
|H
0
)
0
, ou seja,
c =
1
(1
0
/2) =
1
(1 0.04/2)
tabela
= 2.0537. (8.64)
Decisao
Dado que o valor observado da estatstica de teste e igual a
t =
x p
0
_
p0(1p0)
n
10
Relembre-se que a utiliza cao da v.a. fulcral para p, Z
, foi evitada pois tornava a inversao da

desigualdade do Passo 3 da obten cao de ICs extraordinariamente difcil uma vez que p gura em
numerador e em denominador (neste ultimo caso sob o sinal de uma raz).
293
=
54
150
0.4
_
0.4(10.4)
150
=
.36 0.4
0.04
= 1
W = (, 2.0537) (2.0537, +),
conclui-se que n ao devemos rejeitar H
0
ao n.s. de 4%. Deste modo, pode dizer-se
que a arma c ao do fabricante e consistente com os dados ao n.s. de 4%, bem como
a qualquer outro n.s. menor que 4%.
Exerccio 8.47 P-value de teste sobre uma probabilidade de sucesso
Prove que o valor aproximado para o p value do teste assint otico efectuado no
Exemplo 8.46 e igual a 2 [1 (| 1|)] = 0.3174.
Rera-se ainda que a seguir podem encontrar-se dois quadros-resumo que sistematizam
os testes de hip oteses parametricas aqui leccionados considerando em qualquer dos casos
um nvel de signic ancia de
0
. Nas suas cinco colunas constam:
as circunstancias em que estamos a efectuar o teste de hipoteses;
a hipotese nula (H
0
);
a estatstica de teste a utilizar nesta situa cao (T);
a hipotese alternativa (H
1
);
a regiao de rejeic ao de H
0
escrita para valores da estatstica de teste (W).
294
Q
u
a
d
r
o
-
r
e
s
u
m
o
2
a
:
A
l
g
u
n
s
t
e
s
t
e
s
d
e
h
i
p
o
t
e
s
e
s
p
a
r
a
m
e
t
r
i
c
a
s
.
S
i
t
u
a
c
a
o
H
i
p
o
t
e
s
e
n
u
l
a
E
s
t
a
t
s
t
i
c
a
d
e
t
e
s
t
e
H
i
p
o
t
e
s
e
a
l
t
e
r
n
a
t
i
v
a
R
e
g
i
a
o
d
e
R
e
j
e
i
c
a
o
X
n
o
r
m
a
l
(
2
)
2
c
o
n
h
e
c
i
d
o
H
0
:
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
>
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
<
0
(
,
c
)
,
c
=
1
(
1
0
)
X
c
o
m
d
i
s
t
r
i
b
u
i
c
a
o
a
r
b
i
t
r
a
r
i
a
(
n
a
o
n
o
r
m
a
l
)
:
E
(
X
)
=
,
V
(
X
)
=
2
c
o
n
h
e
c
i
d
o
n
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
H
0
:
n
a
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
>
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
<
0
(
,
c
)
,
c
=
1
(
1
0
)
X
1
n
o
r
m
a
l
(
1
,
2 1
)
X
2
n
o
r
m
a
l
(
2
,
2 2
)
2 1
,
2 2
c
o
n
h
e
c
i
d
o
s
H
0
:
2
=
0
(
X
1
X
2
)
0
_
2 1
n
1
+
2 2
n
2
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
2
=
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
2
>
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
2
<
0
(
,
c
)
,
c
=
1
(
1
0
)
X
1
X
2
,
c
o
m
d
i
s
t
r
i
b
u
i
c
o
e
s
a
r
b
i
t
r
a
r
i
a
s
(
n
a
o
n
o
r
m
a
i
s
)
:
E
(
X
i
)
=
i
,
V
(
X
i
)
=
2 i
,
i
=
1
,
2
2 1
,
2 2
c
o
n
h
e
c
i
d
o
s
n
1
,
n
2
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
s
H
0
:
2
=
0
(
X
1
X
2
)
0
_
2 1
n
1
+
2 2
n
2
a
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
2
=
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
2
>
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
2
<
0
(
,
c
)
,
c
=
1
(
1
0
)
X
n
o
r
m
a
l
(
2
)
2
d
e
s
c
o
n
h
e
c
i
d
o
H
0
:
0
S
/
H
0
t
(
n
1
)
H
1
:
0
(
c
)
(
c
,
+
)
,
c
=
F
1
t
(
n
1
)
(
1
0
/
2
)
H
1
:
>
0
(
c
,
+
)
,
c
=
F
1
t
(
n
1
)
(
1
0
)
H
1
:
<
0
(
,
c
)
,
c
=
1
t
(
n
1
)
(
1
0
)
X
c
o
m
d
i
s
t
r
i
b
u
i
c
a
o
a
r
b
i
t
r
a
r
i
a
:
E
(
X
)
=
,
V
(
X
)
=
2
d
e
s
c
o
n
h
e
c
i
d
o
n
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
H
0
:
0
S
/
n
a
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
>
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
<
0
(
,
c
)
,
c
=
1
(
1
0
)
295
Q
u
a
d
r
o
-
r
e
s
u
m
o
2
b
:
A
l
g
u
n
s
t
e
s
t
e
s
d
e
h
i
p
o
t
e
s
e
s
p
a
r
a
m
e
t
r
i
c
a
s
(
c
o
n
t
.
)
.
S
i
t
u
a
c
a
o
H
i
p
o
t
e
s
e
n
u
l
a
E
s
t
a
t
s
t
i
c
a
d
e
t
e
s
t
e
H
i
p
o
t
e
s
e
a
l
t
e
r
n
a
t
i
v
a
R
e
g
i
a
o
d
e
R
e
j
e
i
c
a
o
X
1
n
o
r
m
a
l
(
1
,
2 1
)
X
2
n
o
r
m
a
l
(
2
,
2 2
)
2 1
,
2 2
d
e
s
c
o
n
h
e
c
i
d
o
s
m
a
s
I
G
U
A
I
S
n
1
3
0
o
u
n
2
3
0
H
0
:
2
=
0
(
X
1
X
2
)
0
_
(
n
1
1
)
S
2 1
+
(
n
2
1
)
S
2 2
n
1
+
n
2
_
1
n
1
+
1
n
2
_
H
0
t
(
n
1
+
n
2
2
)
H
1
:
2
=
0
(
c
)
(
c
,
+
)
,
c
=
F
1
t
(
n
1
+
n
2
2
)
(
1
0
/
2
)
H
1
:
2
>
0
(
c
,
+
)
,
c
=
F
1
t
(
n
1
+
n
2
2
)
(
1
0
)
H
1
:
2
<
0
(
,
c
)
,
c
=
1
t
(
n
1
+
n
2
2
)
(
1
0
)
X
1
X
2
c
o
m
d
i
s
t
r
i
b
u
i
c
o
e
s
a
r
b
i
t
r
a
r
i
a
s
(
p
o
s
s
i
v
e
l
m
e
n
t
e
n
o
r
m
a
i
s
)
:
E
(
X
i
)
=
i
,
V
(
X
i
)
=
2 i
,
i
=
1
,
2
2 1
,
2 2
d
e
s
c
o
n
h
e
c
i
d
o
s
m
a
s
n
a
o
n
e
c
e
s
s
a
r
i
a
m
e
n
t
e
i
g
u
a
i
s
n
1
>
3
0
e
n
2
>
3
0
H
0
:
2
=
0
(
X
1
X
2
)
0
_
S
2 1
n
1
+
S
2 2
n
2
a
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
2
=
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
2
>
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
2
<
0
(
,
c
)
,
c
=
1
(
1
0
)
X
n
o
r
m
a
l
(
2
)
d
e
s
c
o
n
h
e
c
i
d
o
H
0
:
2
=
2 0
(
n
1
)
S
2
2 0
H
0
2 (
n
1
)
H
1
:
2
=
2 0
(
0
,
a
)
(
b
,
+
)
,
a
=
F
(
n
1
)
(
0
/
2
)
,
b
=
F
(
n
1
)
(
1
0
/
2
)
H
1
:
2
>
2 0
(
c
,
+
)
,
c
=
F
(
n
1
)
(
1
0
)
H
1
:
2
<
2 0
(
0
,
c
)
,
c
=
F
(
n
1
)
(
0
)
X
B
e
r
n
o
u
l
l
i
(
p
)
n
s
u
c
i
e
n
t
e
m
e
n
t
e
g
r
a
n
d
e
(
n
>
3
0
)
H
0
:
p
=
p
0
p
0
_
p
0
(
1
p
0
)
n
a
H
0
n
o
r
m
a
l
(
0
,
1
)
H
1
:
p
=
p
0
(
c
)
(
c
,
+
)
,
c
=
1
(
1
0
/
2
)
H
1
:
p
>
p
0
(
c
,
+
)
,
c
=
1
(
1
0
)
H
1
:
p
<
p
0
(
,
c
)
,
c
=
1
(
1
0
)
296
8.11 Teste de ajustamento do qui-quadrado de
Pearson.
O teste de ajustamento do qui-quadrado permite averiguar a adequa c ao de
uma distribui cao com todos os par ametros conhecidos (hipotese simples
subsecc oes 8.11.1 e 8.11.4) ou de
uma distribui cao com pelo menos um par ametro desconhecido, i.e., uma famlia de
distribuic oes (hipotese composta subsecc oes 8.11.2 e 8.11.4)
a um conjunto de dados referente a
uma v.a. de interesse do tipo discreto ou contnuo.
Este teste exige, no entanto,
um grande n umero de observa c oes (uma vez que se baseia num resultado assint otico)
e pressupoe que
os dados estejam organizados em classes e disponhamos de uma tabela de
frequencias.
De notar que estas classes devem n ao s o ser disjuntas, como cobrir todo o contradomnio
da v.a. de interesse.
A apresenta c ao deste mesmo teste far-se-a essencialmente à custa de exemplos.
Contudo importa referir que recorreremos ao procedimento geral de testes de hipoteses e
que lidaremos com uma estatstica de teste cujo valor observado reecte as
discrep ancias (relativas)
entre
as frequencias absolutas observadas das classes da tabela de frequencias e
as frequencias esperadas (ou suas estimativas) dessas mesmas classes sob a validade
da hipotese nula.
Esta estatstica de teste possui distribuic ao assint otica do qui-quadrado, sob a validade
de H
0
. Acrescente-se tambem que o n umero de graus de liberdade desta distribui cao do
qui-quadrado depende do n umero de:
297
classes em que est ao organizados os dados da tabela de frequencias;
par ametros nao especicados em H
0
e que, consequentemente, e necessario estimar.
Convem ainda referir que no decurso do teste de ajustamento do qui-quadrado e por
vezes necessaria o agrupamento de classes adjacentes e refazer parcialmente os c alculos.
Recorreremos mais uma vez a um exemplo para ilustrar esta situa c ao, na sub-secc ao
8.11.3.
Por m, ilustrar-se- a o recurso a classes equiprov aveis no teste de ajustamento de
qui-quadrado, na sub-seccao 8.11.5.
11
11
Ainda à laia de conclusao rera-se que h a outros testes de ajustamento que n ao requerem tantas
observacoes como e o caso do teste de ajustamento de Kolmogorov-Smirnov que n ao faz parte do programa
da disciplina.
298
8.11.1 Ajustamento de uma distribuicao discreta
E curioso notar que a frequencia observada da classe i e a concretiza c ao da v.a.

O
i
binomial(n, p
i
), (8.65)
onde n representa o total de observa coes e p
i
a probabilidade de uma observacao escolhida
ao acaso pertencer ` a classe i (justica c ao!).
Caso a hipotese nula seja simples, somos capazes de calcular o valor da probabilidade p
i
sob a validade de H
0
, valor esse que ser a doravante representado por p
0
i
. Somos igualmente
capazes de calcular o valor esperado de O
i
sob H
0
, pelo que igualaremos a frequencia
esperada sob H
0
da classe i, E
i
, a este valor esperado. Assim,
E
i
= E(O
i
|H
0
) = E[binomial(n, p
0
i
)] = n p
0
i
. (8.66)
Exemplo 8.48 Teste de ajustamento do qui-quadrado: dados discretos
(hipotese simples uniforme discreta)
Um dado e lan cado 1000 vezes tendo conduzido à tabela de frequencias observadas a
seguir.
Resultado Freq. Obs.
1 174
2 174
3 154
4 179
5 154
6 165
Coloca-se, naturalmente, a quest ao: Sera o dado equilibrado/perfeito? Resta-nos
responder a esta questao, considerando para o efeito um nvel de signic ancia de, por
exemplo, 5%.
V.a. de interesse
X = resultado do lan camento do dado
Hipoteses
H
0
: X uniforme discreta({1, . . . , 6}) vs.
H
1
: X uniforme discreta({1, . . . , 6})
12
12
A hip otese nula e simples dado que em H0 se conjectura uma unica distribui cao completamente
denida.
299
Importa notar que, ao considerarmos p
i
= P(X = i), i = 1, . . . , 6, as hipoteses nula
e alternativa podem reescrever-se do seguinte modo:
H
0
: p
i
= p
0
i
= 1/6, i = 1, . . . , 6 vs.
H
1
: i : p
i
= p
0
i
.
Nvel de signicancia
0
= 5%
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
(8.67)
onde:
k = No. de classes em que estao organizados os dados da tabela de frequencias
= 6
O
i
= Frequencia absoluta observ avel da classe i
E
i
= Frequencia absoluta esperada, sob H
0
, da classe i
= E(O
i
|H
0
) = np
0
i
13
= No. de parametros a estimar = 0.
14
Escusado ser a dizer que as frequencias absolutas esperadas sob H
0
ser ao iguais ao
valor esperado de O
i
sob H
0
. Com efeito,
E
i
= n p
0
i
= 1000 1/6, i = 1, . . . , 6. (8.68)
De referir que estas frequencias s ao dependentes de i, salvo em rarssimas excep coes
como e o caso deste exemplo. O exemplo seguinte ilustrar a tal facto.
0
(para valores de T)
Quanto maior a discrepancia entre a frequencia absoluta observada da classe i (o
i
)
e o valor conhecido da frequencia absoluta esperada sob H
0
da classe i (E
i
), menos
consistente e a hip otese H
0
com os dados recolhidos. Logo a regi ao de rejeic ao de
H
0
(para valores de T) e um intervalo ` a direita
13
Estas frequencias absolutas esperadas serao igualadas a n p
0
i
, onde p
0
i
= 1/6 uma vez que estamos
a averiguar o ajustamento da distribui cao uniforme discreta com espa co de resultados {1, . . . , 6}.
14
Uma vez que H0 e uma hip otese simples n ao e necessario estimar qualquer par ametro desconhecido.
300
W = (c, +), (8.69)
0
|H
0
)
0
, i.e.,
c = F
1
2
(k1)
(1
0
) = F
1
2
(601)
(1 0.05) = 11.07. (8.70)
Decisao
Para calcular o valor observado da estatstica de teste e necessario construir
uma tabela de frequencias onde dever ao constar, entre muitos outros valores, as
frequencias absolutas observadas e os valores conhecidos das frequencias absolutas
esperadas sob H
0
.
Classe i Freq. abs. observada Freq. abs. esperada sob H0 Parcelas valor obs. estat. teste
i oi Ei = n p
0
i
(oiEi)
2
Ei
1 {1} 174 1000
1
6
= 166.(6)
[174166.(6)]
2
166.(6)
= 0.322
2 {2} 174 0.322
3 {3} 154 0.963
4 {4} 179 0.912
5 {5} 154 0.963
6 {6} 165
[165166.(6)]
2
166.(6)
= 0.017
k
i=1
oi = n
k
i=1
Ei = n t =
k
i=1
(oiEi)
2
Ei
= 1000 = 1000.00 = 3.499
Ent ao o valor observado da estatstica de teste e igual a
t =
k
i=1
(o
i
E
i
)
2
E
i
= 0.322 + 0.322 + 0.963 + 0.912 + 0.963 + 0.017
= 3.499
W = (11.07, +). (8.71)
Consequentemente nao devemos rejeitar a hipotese de estarmos a lidar com um dado
equilibrado, ao n.s. 5%, nem a qualquer outro n.s. menor que 5%.
301
(hipotese simples distribuicao de Poisson)
O departamento de defesa pretende saber qual a distribuic ao de probabilidade do n umero
de avarias, durante uma dada missao, ocorridas numa determinada zona de um submarino.
Com esse objectivo foram recolhidos dados relativos a 500 destas miss oes condensados na
tabela abaixo.
No. de falhas por missao 0 1 2 3 4
No. de missoes (com tal no. de falhas) 185 180 95 30 10
Teste ao nvel de signic ancia de 5% a hipotese de os dados seguirem uma distribuic ao de
Poisson com valor esperado igual a 1.
V.a. de interesse
X = n umero de falhas em uma miss ao do submarino
Hipoteses
H
0
: X Poisson(1) vs. H
1
: X Poisson(1)
15
Nvel de signicancia
0
= 5%
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
, (8.72)
onde:
k = No. de classes = 5
O
i
E
i
0
, da classe i
16
= No. de par ametros a estimar = 0.
17
15
A hip otese nula e simples j a que em H0 se conjectura uma unica distribui cao e n ao uma famlia de
distribui coes como seria o caso de H0 : X Poisson() onde e desconhecido.
16
Estas frequencias serao igualadas a valores de f acil calculo j a que estamos a averiguar o ajustamento
da distribui cao de Poisson com valor esperado igual a 1.
17
Dado que a distribui cao conjecturada em H0 esta completamente especicada, i.e., H0 e uma hip otese
simples.
302
0
(para valores de T)
Pelo mesmo motivo apontado no exemplo anterior, a regi ao de rejeic ao de H
0
escrita
para valores de T e um intervalo ` a direita W = (c, +), onde
c = F
1
2
(k1)
(1
0
) = F
1
2
(501)
(1 0.05) = 9.488. (8.73)
Decisao
O c alculo do valor observado da estatstica de teste pressupoe, como anteriormente,
a constru c ao de uma tabela auxiliar de frequencias de vario tipo.
Classe i Freq. abs. obs. Freq. abs. esper. sob H0 Parcelas valor obs. estat. teste
i oi Ei = n p
0
i
(oiEi)
2
Ei
1 {0} 185 500 0.3679 = 183.95
(185183.95)
2
183.95
= 0.0060
2 {1} 180 500 0.3679 = 183.95 0.0848
3 {2} 95 500 0.1839 = 91.95 0.1012
4 {3} 30 500 0.0613 = 30.65 0.0138
5 {4, 5, . . .} 10 500 0.0190 = 9.50 0.0263
k
i=1
oi = n
k
i=1
Ei = n t =
k
i=1
(oiEi)
2
Ei
= 500 = 500.00 = 0.2321
Note-se que
E
i
= n p
0
i
= n P(X Classe i | H
0
)
= n P[X Classe i | X Poisson(1)]
= n
_
_
_
P[X = i 1 | X Poisson(1)], i = 1, 2, 3, 4
P[X 4 | X Poisson(1)], i = 5
= n
_
_
_
e
i1
(i1)!
=
e
1
1
i1
(i1)!
, i = 1, 2, 3, 4
1 (p
0
1
+. . . p
0
4
), i = 5.
(8.74)
Assim, temos
t =
k
i=1
(o
i
E
i
)
2
E
i
= 0.0060 + 0.0848 + 0.1012 + 0.0138 + 0.0263
= 0.2321
W = (9.488, +), (8.75)
pelo que n ao devemos rejeitar a hip otese de os dados serem provenientes de uma
popula c ao com distribui cao de Poisson com par ametro conhecido e igual a 1, a
qualquer nvel de signic ancia menor ou igual que 5%.
303
8.11.2 Ajustamento de uma famlia de distribuicoes discretas
E altura de considerar o caso em que se conjectura n ao uma distribuic ao especca para

a nossa v.a. de interesse mas sim um modelo ou famlia de distribuic oes. Basta pensar,
por exemplo, no modelo de Poisson de par ametro desconhecido .
Tratando-se H
0
de uma hip otese composta, so podemos adiantar uma express ao para
np
0
i
, expressao essa que depende de par ametro(s) desconhecido(s). Assim sendo, np
0
i
n ao pode gurar na expressao da estatstica de teste,
18
pelo que so nos resta considerar
que E
i
passe a ser um estimador de n p
0
i
.
19
Retomaremos o Exemplo 8.49 por forma a deixar claras as diferencas entre os testes
de ajustamento do qui-quadrado com hipoteses nulas simples e composta.
(hipotese composta modelo de Poisson)
Voltemos a considerar o problema do n umero de avarias durante missoes do submarino
do Exemplo 8.49 e testemos agora a adequa cao do modelo de Poisson famlia de todas
as distribuic oes de Poisson a este mesmo conjunto de dados e ao mesmo nvel de
signic ancia, 5%.
Hipoteses
H
0
: X Poisson() vs. H
1
: X Poisson()
H
0
e uma hipotese composta dado que e uma constante positiva desconhecida.
Nvel de signicancia
0
= 5%
18
As estatsticas, por deni cao, n ao podem depender de quaisquer par ametros desconhecidos.
19
Convem referir que esta substitui cao conduz a uma alteracao da distribui cao assint otica da estatstica
de teste. Caso as estimativas de MV do(s) par ametro(s) desconhecido(s) seja(m) calculada(s), como
com base nos dados agrupados em classes, a estatstica de teste possui distribui cao do qui-quadrado com
k 1 graus de liberdade. Caso as estimativas de MV do(s) parametro(s) desconhecido(s) seja(m)
calculada(s), como, ali as, e costume, com base nos dados originais e n ao nos dados agrupados em classes,
a cauda direita da f.d.p. assint otica da estatstica de teste esta entre as caudas direitas das f.d.p. das
distribui coes do qui-quadrado com k 1 e k 1 graus de liberdade. No entanto, iremos considerar
(incorrectamente) que, em qualquer dos dois casos, a distribui cao assint otica da estatstica de teste e do
qui-quadrado com k 1 graus de liberdade; ao faze-lo, estamos a lidar com um teste que conduzir a
a uma percentagem superior de rejei coes indevidas de H0 no primeir dos dois casos. Para mais detalhes
recomenda-se a leitura de Paulino (1992, pp. 5456).
304
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
. (8.76)
Assinale-se somente o que distingue esta estatstica de teste daquela que gura em
(8.72):
E
i
= Estimador da frequencia absoluta esperada, sob H
0
, da classe i
20
Estima cao de
A estimativa de MV de e dada por
=
185 0 + 180 1 + 95 2 + 30 3 + 10 4
500
= 1, (8.77)
por sinal igual ao valor considerado no Exemplo 8.49.
0
(para valores de T)
Desta feita lidamos com o intervalo à direita W = (c, +), onde
c = F
1
2
(k1)
(1
0
) = F
1
2
(511)
(1 0.05) = 7.815. (8.78)
Decisao
Como e desconhecido o mesmo acontece com p
0
i
e com a frequencia absoluta
esperada, sob H
0
, da classe i,
n p
0
i
= n
_
_
_
e
i1
(i1)!
, i = 1, 2, 3, 4
1 (p
0
1
+. . . p
0
4
), i = 5.
(8.79)
Mas uma vez que

= 1 as estimativas das frequencias absolutas esperadas sob H
0
s ao iguais a
e
i
= n p
0
i
= n
_
_
_
e

i1
(i1)!
=
e
1
1
i1
(i1)!
, i = 1, 2, 3, 4
1 ( p
0
1
+. . . p
0
4
), i = 5.
(8.80)
De real car que estes dados foram claramente manipulados por forma a evitar mais
c alculos na obten cao do habitual quadro usado no c alculo do valor observado da
estatstica de teste. Mas atente-se a algumas diferencas subtis e certo (identique-
as!) entre o quadro que se segue e o do Exemplo 8.49.
20
E necessario estimar para efectuar este teste.
305
Classe i Freq. abs. obs. Estim. freq. abs. esp. sob H0 Parcelas valor obs. estat. teste
i oi ei = n p
0
i
(oiei)
2
ei
1 {0} 185 500 0.3679 = 183.95
(185183.95)
2
183.95
= 0.0060
2 {1} 180 500 0.3679 = 183.95 0.0848
3 {2} 95 500 0.1839 = 91.95 0.1012
4 {3} 30 500 0.0613 = 30.65 0.0138
5 {4, 5, . . .} 10 500 0.0190 = 9.50 0.0263
k
i=1
oi = n
k
i=1
ei = n t =
k
i=1
(oiei)
2
ei
= 500 = 500.00 = 0.2321
Posto isto, obtemos o mesmo valor observado da estatstica de teste:
t =
k
i=1
(o
i
e
i
)
2
e
i
= 0.2321 W = (7.815, +). (8.81)
Conclui-se ent ao que a hip otese dos dados serem provenientes de uma popula cao
com distribuic ao pertencente ao modelo de Poisson e razo avel a qualquer nvel de
signic ancia menor ou igual a 5%.
8.11.3 Agrupamento de classes
Uma vez que o teste de ajustamento do qui-quadrado se baseia na convergencia em
distribuic ao de binomiais (O
i
) para normais agura-se razo avel exigir que as frequencias
esperadas sob H
0
, E
i
, nao sejam demasiado pequenas, em particular exigir que sejam
superiores ou iguais a 5.
21
Deste modo, se registarmos, para algum i,
E
i
< 5
devemos agrupar esta classe ` a classe adjacente com menor frequencia absoluta esperada
sob H
0
.
N ao ha, contudo, uma base te orica para tal regra, havendo mesmo estudos que indicam
que pode registar-se uma ou duas frequencias esperadas sob H
0
inferiores a 5, sem que
seja violada a distribuic ao assintotica, como refere Paulino (1992, p. 52). Com efeito, ha
autores que sugerem que nao h a a necessidade de qualquer agrupamento de classes se:
21
Recorde-se que: e suposto aproximar a v.a. X binomial(n, p) pela v.a.

X normal(np, np(1 p))
quando np > 5 e n(1 p) > 5; o quadrado de uma normal-padr ao tem distribui cao do qui-quadrado...
306
em pelo menos 80% das classes se vericar E
i
5 e
nas restantes classes E
i
1.
E sera este o criterio que usaremos doravante para n ao agrupar classes.
Aproveitaremos um exemplo de Montgomery e Runger (2003, pp. 3168) para ilustrar
n ao s o o agrupamento de classes no teste de ajustamento do qui-quadrado mas tambem
o calculo de intervalo aproximado para o p-value no referido teste. A apresenta cao deste
exemplo sera acompanhada por poucos comentarios j a que este exemplo e similar ao
Exemplo 8.50.
(hipotese composta, agrupamento de classes, p-value)
Alguns estudos previos levam a crer que o n umero de defeitos em circuitos de determinado
tipo possui uma distribuic ao de Poisson. Os resultados na tabela seguinte dizem respeito
a uma amostra de 60 circuitos.
No. defeitos Freq. Obs.
0 32
1 15
2 9
3 4
Testemos a adequa c ao do modelo de Poisson a este conjunto de dados calculando para
o efeito um intervalo (aproximado) para o p-value.
V.a. de interesse
X = n umero de defeitos em circuitos de determinado tipo
Hipoteses
H
0
: X Poisson() vs. H
1
: X Poisson()
22
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
. (8.82)
Estima cao de
A estimativa de MV de e igual a
=
32 0 + 15 1 + 9 2 + 4 3
60
= 0.75. (8.83)
22
H0 e uma hip otese composta dado que e uma constante positiva desconhecida.
307
Estima cao das probabilidades de perten ca e das frequencias absolutas
esperadas sob H
0
As estimativas das probabilidade de pertenca a cada uma das classes sob H
0
s ao
dadas por:
p
0
1
=

P(X = 0|H
0
) =
e
0
0!
= 0.472
p
0
2
=

P(X = 1|H
0
) =
e
1
1!
= 0.354
p
0
3
=

P(X = 2|H
0
) =
e
2
2!
= 0.133
p
0
4
=

P(X 3|H
0
) = 1 ( p
0
1
+ p
0
2
+ p
0
3
) = 0.041.
Consequentemente, obtemos as seguintes estimativas das frequencias absolutas
esperadas sob H
0
:
e
1
= n p
0
1
= 28.32
e
2
= n p
0
2
= 21.24
e
3
= n p
0
3
= 7.98
e
4
= n p
0
4
= 2.46.
Agrupamento de classes e decisao
Tendo em conta que a 4a. das 4 classes possui e
i
< 5 e como tal menos de 80%
das classes possuem e
i
5 deve proceder-se ao agrupamento da 4a. classe ` aquela
que e a sua unica classe adjacente, a 3a. classe. Passamos a
dispor de k = 3 classes ({0}, {1}, {2, 3, . . .})
ao inves das 4 iniciais e a lidar com o seguinte quadro de frequencias:
Classe i Freq. abs. obs. Estim. freq. abs. esp. sob H0 Parcelas valor obs. estat. teste
i oi ei = n p
0
i
(oiei)
2
ei
1 {0} 32 28.32
(3228.32)
2
28.32
= 0.478
2 {1} 15 21.24
(1521.24)
2
21.24
= 1.833
3 {2, 3, . . .} 9+4 = 13 7.98+2.46 = 10.44
(1310.44)
2
10.44
= 0.628
k
i=1
oi = n
k
i=1
ei = n t =
k
i=1
(oiei)
2
ei
= 60 = 60 = 2.939
308
Intervalo aproximado para o p-value
Tratando-se de teste associado a uma regiao de rejeic ao de H
0
que e um intervalo ` a
direita temos:
p value = P(T > t | H
0
)
= 1 F
T|H0
(t)
1 F
2
(311)
(2.939). (8.84)
Recorrendo às tabelas de quantis da distribuic ao do qui-quadrado com um grau
de liberdade podemos obter um intervalo (aproximado) para o p-value deste teste.
Para tal basta enquadrar convenientemente t = 2.939 por dois quantis, obtendo-se
sucessivamente
F
1
2
(1)
(0.900) = 2.706 < t = 2.939 < 3.170 = F
1
2
(1)
(0.925)
0.900 < F
2
(1)
(2.939) < 0.925
1 0.925 < 1 F
2
(1)
(2.939) < 1 0.900
e por m o intervalo aproximado para o p-value: (0.075,0.10). Deste modo, conclui-
se que:
0
a qualquer n.s.
0
7.5%;
rejeitar H
0
a qualquer n.s.
0
10%.
8.11.4 Dados contnuos hip otese simples/composta
Para v.a. contnuas o procedimento de teste e an alogo: as observa c oes devem ser
previamente organizadas em classes, i.e., em intervalos disjuntos que cubram todo o
contradomnio da v.a. de interesse.
Por exemplo, caso estivessemos a testar a adequa cao da distribui cao normal(0,1) as
classes seriam do tipo:
Classe 1 (, a
1
]
Classe 2 (a
1
, a
2
]
. . .
Classe k (a
k1
, +).
309
Exemplo 8.52 Teste de ajustamento do qui-quadrado: dados contnuos
(hipotese simples/composta)
(a) Um engenheiro admite que a dura cao de certa marca de l ampadas electricas e uma v.a.
com distribui cao exponencial de par ametro = 0.05. Numa experiencia laboratorial
envolvendo 100 dessas l ampadas obtiveram-se as seguintes dura coes resumidas abaixo:
Classe [0, 10) [10, 20) [20, 30) [30, +)
Frequencia 30 27 23 20
Com base nos dados fornecidos, teste a hip otese considerada pelo engenheiro ao nvel
de signic ancia de 5%. Obtenha e discuta o intervalo aproximado para o valorp
associado à amostra considerada.
23
Hipoteses
H
0
: X exponencial(0.05) vs. H
1
: X exponencial(0.05)
Nvel de signicancia
0
= 5%
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
,
onde:
O
i
E
i
0
, da classe i
0
(para valores de T)
E um intervalo à direita W = (c, +), onde

c = F
1
2
(k1)
(1
0
) = F
1
2
(401)
(1 0.05) = 7.815.
23
310
Decisao
Tirando partido do facto de
F
X|H0
(x) = P[X x | exponencial(0.05)]
= 1 e
0.05x
, x 0,
conclui-se que as frequencias absolutas esperadas sob H
0
s ao iguais a
p
0
1
= P(0 X < 10|H
0
)
= F
X|H0
(10) F
X|H0
(0) = 0.39347 0 = 0.39347
p
0
2
= P(10 X < 20|H
0
)
= F
X|H0
(20) F
X|H0
(10) = 0.63212 0.39347 = 0.23865
p
0
3
= P(20 X < 30|H
0
)
= F
X|H0
(30) F
X|H0
(20) = 0.77687 0.63212 = 0.14475
p
0
4
= P(X 30|H
0
)
= 1 F
X|H0
(30) = 1 0.77687 = 0.22313
Consequentemente, obtemos o seguinte quadro
i oi Ei = n p
0
i
(oiEi)
2
Ei
1 [0, 10) 30 100 0.39347 = 39.347
(3039.347)
2
39.347
= 2.2204
2 [10, 20) 27 100 0.23865 = 23.865 0.4118
3 [20, 30) 23 100 0.14475 = 14.475 5.0208
4 [30, +) 20 100 0.22313 = 22.313 0.2398
k
i=1
oi = n
k
i=1
Ei = n t =
k
i=1
(oiEi)
2
Ei
= 100 = 100.00 = 7.8928
e o valor observado da estatstica de teste e igual a
t = 7.8928
W = (7.815, +),
pelo que devemos rejeitar a hip otese de ajustamento da distribuicao de
exponencial com par ametro 0.05 ao conjunto de dados, a qualquer nvel de
signic ancia maior ou igual que 5%.
Intervalo aproximado para o p-value
Uma vez que a regi ao de rejeic ao de H
0
e um intervalo ` a direita segue-se:
p value = P(T > t | H
0
)
= 1 F
T|H0
(t)
1 F
2
(401)
(7.8928).
311
Ora, ao recorrer às tabelas de quantis da distribuic ao do qui-quadrado com tres
graus de liberdade podemos obter um intervalo (aproximado) para o p-value
deste teste enquadrando convenientemente t = 7.8928 por dois quantis:
F
1
2
(3)
(0.95) = 7.815 < t = 7.8928 < 9.348 = F
1
2
(3)
(0.975)
0.95 < F
2
(3)
(7.8928) < 0.975
1 0.975 < 1 F
2
(3)
(7.8928) < 1 0.95.
Deste modo conclui-se que o intervalo aproximado para o p-value e (0.025,0.05)
e que:
0
a qualquer n.s.
0
2.5%;
rejeitar H
0
a qualquer n.s.
0
5%.
(b) Um engenheiro admite que a dura cao de certa marca de l ampadas electricas e uma
v.a. com distribui cao pertencente ao modelo {Exponencial(), IR
+
}. Numa
experiencia laboratorial envolvendo 100 dessas l ampadas obtiveram-se as seguintes
dura c oes resumidas abaixo:
Classe [0, 10) [10, 20) [20, 30) [30, +)
Frequencia 30 27 23 20
Com base nos dados fornecidos, teste a hip otese considerada pelo engenheiro ao nvel
de signicancia de 5%, sabendo que a estimativa de MV calculada numericamente
com base nos dados agrupados e igual a 0.047094.
Hipoteses
H
0
: X Exponencial(), > 0 desconhecido vs. H
1
: X
Exponencial()
24
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
O
i
E
i
= Estimador da frequencia absoluta esperada, sob H
0
, da classe i
24
A hip otese nula e composta j a que em H0 se conjectura uma famlia de distribuicoes.
312
Calculo das estimativas das frequencias absolutas observadas sob H
0
Como e desconhecido o mesmo acontece com
F
X|H0
(x) = P[X x | Exponencial()] = 1 e
x
, x 0,
com p
0
i
e com a frequencia absoluta esperada, sob H
0
, da classe i,
n p
0
i
= n
_
_
P(0 < X 10|H
0
) = F
X|H0
(10) F
X|H0
(0), i = 1
P(10 < X 20|H
0
) = F
X|H0
(20) F
X|H0
(10), i = 2
P(20 < X 30|H
0
) = F
X|H0
(30) F
X|H0
(20), i = 3
P(X > 30|H
0
) = 1 F
X|H0
(30), i = 4
=
_
_
1 e
10
, i = 1
e
10
e
20
, i = 2
e
20
e
30
, i = 3
e
30
, i = 4.
Mas uma vez que a estimativa de MV de foi avaliada numericamente com base
na amostra agrupada e e igual a

= 0.047094, podemos obter as estimativas das
frequencias absolutas esperadas sob H
0
, tirando partido das express oes acima e
da propriedade de invariancia dos estimadores de MV:
e
i
= n p
0
i
= n
_
_
1 e
10

= 1 e
100.047094
, i = 1
e
10

e
20
= e
100.047094
e
200.047094
, i = 2
e
20

e
30
= e
200.047094
e
300.047094
, i = 3
e
30

= e
300.047094
, i = 4.
=
_
_
100 0.375587 = 37.5587, i = 1
100 0.234521 = 23.4521, i = 2
100 0.146438 = 14.6438, i = 3
100 0.243454 = 24.3454, i = 4.
Constata-se que nao e necessario agrupar qualquer classe ja que em pelo menos
80% delas e
i
5 e nas restantes e
i
1.
0
(para valores de T)
Lidamos com um intervalo ` a direita W = (c, +), onde
c = F
1
2
(k1)
(1
0
) = F
1
2
(411)
(1 0.05) = F
1
2
(2)
(0.95)
tabela
= 5.991.
Decisao
Tendo em conta que
313
i oi ei = n p
0
i
(oiei)
2
ei
1 (0, 10] 30 100 0.375587 = 37.5587
(3037.5587)
2
37.5587
= 1.52119
2 (10, 20] 27 100 0.234521 = 23.4521 0.536724
3 (20, 30] 23 100 0.146438 = 14.6438 4.76827
4 (30, +) 20 100 0.243454 = 24.3454 0.775594
k
i=1
oi = n
k
i=1
ei = n t =
k
i=1
(oiei)
2
ei
= 100 = 100.00 = 7.60177
o valor observado da estatstica de teste e dado por
t = 7.60177
W = (9.488, +),
pelo que devemos rejeitar a hip otese de os dados serem provenientes do modelo
exponencial, a qualquer nvel de signic ancia maior ou igual que 5%.
Terminamos esta sub-secc ao recomendando a leitura do Exemplo 9.13 de Montgomery
e Runger (2003, pp. 318319) e remetendo o/a leitor/a para a sub-secc ao seguinte onde
se encontra um exerccio com dados contnuos.
8.11.5 Classes equiprovaveis e dados contnuos
Ao lidarmos com dados contnuos, e costume tirar partido do agrupamento efectuado na
an alise descritiva, usualmente com classes com a mesma amplitude. Este procedimento
pode conduzir ao agrupamento de classes adjacentes.
Por forma a evitar este inconveniente e sistematizar a escolha de classes, deve adoptar-
se o que usualmente se designa por classes equiprov aveis sob H
0
, i.e., os extremos das k
classes sao escolhidos de forma que
p
0
i
= P(X Classe i | H
0
) = 1/k, i = 1, . . . , k, (8.85)
onde k : n p
0
i
=
n
k
5, i.e., o n umero de classes dever a satisfazer k
n
5
. Para tal basta
que se considere os seguintes extremos:
a
0
= limite inferior do contradomnio da distribuic ao conjecturada em H
0
para a
v.a. X;
a
i
= F
1
X|H0
(i/k) = quantil de probabilidade i/k da distribuic ao conjecturada em H
0
para a v.a. de interesse X, i = 1, . . . , k 1;
314
a
k
= limite superior do contradomnio da distribuicao conjecturada em H
0
para a
v.a. X.
Este procedimento tem ainda a particularidade de simplicar o calculo do valor
observado da estatstica de teste dado que, neste caso, E
i
= n/k e, consequentemente, a
estatstica passa a escrever-se
T =
k
i=1
(O
i
n/k)
2
n/k
=
k
n
k
i=1
O
2
i
n. (8.86)
Com efeito:
T =
k
i=1
(O
i
n/k)
2
n/k
=
k
n
k
i=1
_
O
2
i
2
n
k
O
i
+
_
n
k
_
2
_
=
k
n
_
k
i=1
O
2
i
2
n
k
k
i=1
O
i
+
k
i=1
_
n
k
_
2
_
=
k
n
_
k
i=1
O
2
i
2
n
k
n +k
_
n
k
_
2
_
=
k
n
k
i=1
O
2
i
2n +n
=
k
n
k
i=1
O
2
i
n.
315
Exemplo 8.53 Teste de ajustamento do qui-quadrado: dados contnuos
(hipotese simples, classes equiprovaveis)
Com o objectivo de estudar o tempo ate falha de certo equipamento electronico (em
milhares de horas), X, foram recolhidas e ordenadas 50 observa c oes na tabela seguinte.
Dada a natureza dos dados e alguns estudos previos, suspeita-se que as observa c oes sejam
provenientes de uma popula c ao X com distribuicao de Pareto com par ametros 2.001 e
2.822, i.e., com f.d.
1
2.001
2.822
x
2.822
, x 2.001.
2.001 2.007 2.017 2.026 2.036 2.075 2.077 2.082 2.101 2.137
2.156 2.161 2.181 2.196 2.214 2.227 2.320 2.367 2.424 2.443
2.444 2.449 2.478 2.520 2.579 2.581 2.598 2.637 2.691 2.715
2.720 2.825 2.863 2.867 3.016 3.176 3.360 3.413 3.567 3.721
3.727 3.769 3.803 4.329 4.420 4.795 6.009 6.281 6.784 8.305
(a) Prove que as classes [2.001, 2.1656], (2.1656, 2.3981], (2.3981, 2.7686],
(2.7686, 3.5394] e (3.5394, +) sao equiprov aveis sob a hipotese
H
0
: X Pareto(2.001, 2.822). De facto, para i = 1, . . . , k e k = 5:
p
0
1
= P(X [2.001, 2.1656] | H
0
)
= F
X|H0
(2.1656) F
X|H0
(2.001)
=
_
1
2.001
2.822
2.1656
2.822
_
_
1
2.001
2.822
2.001
2.822
_
= 0.2000 (8.87)
=
1
k
(8.88)
.
.
.
(b) Averigue a adequa c ao da distribuicao de Pareto com os referidos par ametros ao
conjunto de dados, ao nvel de signic ancia de 10%.
Hipoteses
H
0
: X Pareto(2.001, 2.822) vs. H
1
: X Pareto(2.001, 2.822)
Nvel de signicancia
0
= 10%
316
Estatstica de Teste
T =
k
i=1
(O
i
E
i
)
2
E
i
a
H0

2
(k1)
, (8.89)
onde:
O
i
E
i
0
, da classe i = n/k = 10
0
(para valores de T)
E um intervalo à direita W = (c, +), onde

c = F
1
2
(k1)
(1
0
) = F
1
2
(501)
(1 0.1) = 7.779. (8.90)
Decisao
Ao lidarmos com classes equiprovaveis sob H
0
basta recorrer a (8.86) para
obter o valor observado da estatstica de teste. Assim sendo, h a somente a
necessidade de determinar as frequencias absolutas observadas das 5 classes.
Ora, da consulta da tabela com as n = 50 observa c oes conclui-se que sao iguais
a: 12, 6, 13, 7, 12. Logo
t =
k
i=1
(o
i
n/k)
2
n/k
=
k
n
k
i=1
o
2
i
n
=
5
50
(12
2
+ 6
2
+ 13
2
+ 7
2
+ 12
2
) 50
= 4.2
W = (7.779, +), (8.91)
pelo que nao devemos rejeitar a hip otese de os dados serem provenientes de
uma popula cao com distribuic ao de Pareto com par ametros 2.001 e 2.822, a
qualquer nvel de signic ancia menor ou igual que 10%.
317
8.12 Teste de independencia do qui-quadrado de
Pearson em tabelas de contingencia.
Dada a pertinencia do teste de independencia do qui-quadrado em tabelas de contigencia
decidimos acrescenta-lo neste captulo. Limitamo-nos, no entanto, a apresentar um
exemplo. Para mais detalhes e considera c oes teoricas acerca deste teste de hip oteses,
25
remetemos o/a leitor/a mais interessado para Montgomery e Runger (2003, pp. 315-320).
Exemplo 8.54 Teste de independencia do qui-quadrado em tabelas de
contingencia
Num estudo clnico seleccionaram-se aleatoriamente n = 1000 indivduos que foram
classicados segundo o genero e a presenca ou ausencia de daltonismo, obtendo-se os
seguintes resultados:
Masculino Feminino
Daltonic@s 39 6
Nao Daltonic@s 461 494
Par aleat orio de interesse
Neste exemplo estamos a lidar com uma tabela de contigencia e duas v.a. de
interesse. A saber:
X =
_
_
_
1 se o indivduo for dalt onico
2 c.c.
(8.92)
Y =
_
_
_
1 se o indivduo for do genero masculino
2 c.c.
(8.93)
Situa cao
Considere-se, para i = 1, . . . , r e j = 1, . . . , s (r, s = 2):
p
ij
= P(X = i, Y = j) desconhecido;
p
i.
= P(X = i) =

s
j=1
p
ij
desconhecido;
p
.j
= P(Y = j) =

r
i=1
p
ij
desconhecido.
25
Por sinal tambem ele assint otico e como tal requerendo um n umero sucientemente grande de
observacoes.
318
Hipoteses
H
0
: p
ij
= p
i.
p
.j
, i, j = 1, 2
26
vs. H
1
: (i, j) : p
ij
= p
i.
p
.j
Nvel de signicancia
0
= 10%
Estatstica de teste
T =
r
i=1
s
j=1
(O
ij
E
ij
)
2
E
ij
=
r
i=1
s
j=1
_
O
ij
Oi.O.j
n
_
2
Oi.O.j
n
a
H0

2
(r1)(s1)
, (8.94)
onde, para i = 1, . . . , r e j = 1, . . . , s:
O
ij
= Frequencia absoluta observavel da celula (i, j) da tabela de contingencia
O
ij
binomial(n, p
ij
);
O
i.
=

s
j=1
O
ij
= Frequencia absoluta observavel da linha i da tabela de
contingencia
O
i.
binomial(n, p
i.
);
O
.j
=

r
i=1
O
ij
= Frequencia absoluta observavel da coluna j da tabela de
contingencia
O
.j
binomial(n, p
.j
)
E
ij
=
Oi.O.j
n
= Estimador de E(O
ij
| H
0
).
27
0
Quanto maior for a discrep ancia entre as frequencias das celulas da tabela de
frequencias (o
ij
) e a estimativa da frequencia absoluta esperada dessa mesma celula
sob a validade da hipotese de independencia (o
i.
o
.j
/n), mais inconsistente ser a H
0
com os dados. Logo a regi ao de rejeic ao de H
0
e um intervalo ` a direita da distribuic ao assintotica de T sob H
0
, i.e., W = (c, +),
onde
26
Recorde-se que duas v.a. discretas X e Y sao independentes caso a f.p. conjunta de (X, Y ) se escrevear
à custa do produtos das f.p. marginais de X e de Y .
27
De notar que E(Oij | H0) = E[binomial(n, pij) | H0] = n pi. p.j, pelo que o estimador natural desta
quantidade e, efectivamente, n
Oi.
n

O.j
n
=
Oi.O.j
n
.
319
c = F
1
2
(r1)(s1)
(1
0
) = F
1
2
(21)(21)
(1 0.1) = 2.706. (8.95)
Decisao
Tendo em considera c ao que
oij Masculino Feminino oi.
Daltonic@s 39 6 45
Nao Daltonic@s 461 494 955
o.j 500 500 n = 1000
o valor observado da estatstica de teste e igual a
t =
r
i=1
s
j=1
(o
ij
e
ij
)
2
e
ij
=
r
i=1
s
j=1
(o
ij
o
i.
o
.j
/n)
2
o
i.
o
.j
/n
=
_
39
45500
1000
_
2
45500
1000
+
_
6
45500
1000
_
2
45500
1000
+
_
461
955500
1000
_
2
955500
1000
+
_
494
955500
1000
_
2
955500
1000
=
(39 22.5)
2
22.5
+
(6 22.5)
2
22.5
+
(461 477.5)
2
477.5
+
(494 477.5)
2
477.5
= 25.34
W = (2.706, +). (8.96)
A presen ca de daltonismo num indivduo parece depender do respectivo genero a
qualquer n.s. superior ou igual a 10%.
320
Captulo 9
Introducao à regressao linear simples
9.1 Modelos de regressao.
Motiva cao 9.1 Modelos de regressao
Em engenharia e frequente estarmos interessados em estabelecer uma rela cao entre
uma vari avel dependente, Y , e
uma (ou mais) variavel(is) independente(s), x (ou (x
1
, . . . , x
k
)) .
Esta rela c ao e, de um modo geral, traduzida por um
modelo de regress ao.
Exemplo 9.2 Modelos de regressao
Considere as variaveis
Y = pressao atmosferica (variavel dependente ou resposta)
x = altitude (vari avel independente ou explicativa ou regressora).
H a v arias possibilidades de modelos de regress ao, entre elas:
1. Modelo determinstico
Y =
0
+
1
x (9.1)
2. Modelo de regressao linear simples (RLS)
Y =
0
+
1
x +, (9.2)
onde se assume que e um erro aleatorio tal que E() = 0.
321
3. Modelo de regressao linear m ultipla
Y =
0
+
1
x
1
+
2
x
2
+, (9.3)
onde x
1
e x
2
representam a altitude e a temperatura (resp.).
A obten c ao de informa c ao no ambito da RLS passa pela recolha de uma amostra de
n pontos
(x
i
, y
i
), i = 1, . . . , n, (9.4)
onde podemos entender que
x
i
representa o estmulo a que e submetido o indivduo i e
y
i
representa a resposta do indivduo i a esse mesmo estmulo.
Nota 9.3 Representa cao graca
E crucial representar gracamente os pontos (x

i
, y
i
), i = 1, . . . , n, para averiguar se a
rela c ao entre a vari avel independente/explicativa x e a vari avel resposta Y e de facto do
tipo linear ou se h a a necessidade de uma transforma cao dos dados para que tal ocorra.
Exemplo 9.4 Regressao linear simples
Pretende estudar-se a rela c ao entre a resistencia de um determinado tipo de pl astico (Y )
e o tempo (em horas) que decorre a partir da conclusao do processo de moldagem ate
ao momento de medic ao da resistencia (x). Para tal foram testadas 12 pecas construdas
com esse pl astico e obtidas as seguintes observa c oes:
i 1 2 3 4 5 6 7 8 9 10 11 12
Tempo (xi) 16 24 32 40 48 48 48 48 56 64 72 80
Resistencia (yi) 199 214 230 248 255 262 279 267 305 298 323 359
322
Apesar de nenhuma curva simples passar exactamente por todos os pontos, h a forte
indicac ao no sentido de os pontos do gr aco se dispersarem aleatoriamente em torno de
uma recta.
9.2 Metodos dos mnimos quadrados e da maxima
verosimilhan ca em regressao linear simples.
Comecemos por uma ilustra c ao e pela denic ao informal do modelo de regressao linear
simples (RLS).
Exemplo 9.5 Regressao linear simples
Pretende averiguar-se se a rela cao entre a percentagem de hidrocarbonetos presentes no
condensador principal de uma unidade de destilac ao (x) e a pureza do oxigenio produzido
(Y ) e do tipo linear, tendo sido recolhidas para o efeito as 20 observa c oes que constam de
Montgomery e Runger (2003, pp. 373374):
i 1 2 3 4 5 6 7 8 9 10
%Hidrocarbonetos 0.99 1.02 1.15 1.29 1.46 1.36 0.87 1.23 1.55 1.4
%Pureza 90.01 89.05 91.43 93.74 96.73 94.45 87.59 91.77 99.42 93.65
i 11 12 13 14 15 16 17 18 19 20
%Hidrocarbonetos 1.19 1.15 0.98 1.01 1.11 1.2 1.26 1.32 1.43 0.95
%Pureza 93.54 92.52 90.56 89.54 89.85 90.39 93.25 93.41 94.98 87.33
Tal como no Exemplo 9.4, o graco parece apontar no sentido de os pontos se
dispersarem aleatoriamente em torno de uma recta.
323
Denicao informal 9.6 Modelo de RLS
O modelo de RLS e denido por
Y
i
=
0
+
1
x
i
+
i
, i = 1, . . . , n, (9.5)
onde:
Y
i
= resposta aleat oria do indivduo i (variavel dependente aleat oria)
x
i
= i observa cao da vari avel independente
1

0
= ordenada na origem (constante desconhecida)

1
= declive (constante desconhecida)
2

i
= erro aleat orio associado ` a observa c ao da resposta do indivduo i.
A esta denic ao informal e necessario acrescentar dois sub-conjuntos de hipoteses de
trabalho fundamentais quer para a estima c ao pontual, quer para outro tipo de inferencias
sobre os par ametros do modelo tais como a ordenada na origem e o declive.
Nota 9.7 Hipoteses de trabalho do modelo de RLS
E costume assumir que os erros aleat orios

i
s ao v.a. n ao correlacionadas
3
tais que
E(
i
) = 0
V (
i
) =
2
(constante desconhecida).
Nota 9.8 Consequencias
`
A luz destas hip oteses de trabalho e da equa c ao do modelo de RLS (9.5) segue-se, para
i = 1, . . . , n:
E(Y
i
) =
0
+
1
x
i
+E(
i
) =
0
+
1
x
i
V (Y
i
) = V (
i
) =
2
.
1
E habitual assumir que se trata de vari avel n ao aleatoria ou por tomar valor xo, ou por tratar-se
de medicao sem erro ou com erro desprez vel
2
Na verdade 0 e 1 sao a ordenada na origem e o declive do valor esperado da resposta,
respectivamente (ver nota 9.8).
3
I.e., corr(i, j) = 0, i = j.
324
9.2.1 Estima cao de
0
e
1
metodo dos mnimos quadrados
O ponto de partida para a estima cao pontual dos par ametros
0
e
1
e o conjunto de
dados:
(x
i
, y
i
), i = 1, . . . , n.
Motiva cao 9.9 Metodo dos mnimos quadrados
A obten c ao das estimativas dos mnimos quadrados de
0
e
1
passa pela minimiza cao
das discrepancias entre o que e esperado pelo modelo de RLS E(Y
i
) =
0
+
1
x
i

e o que e efectivamente observado y
i
. (Esquema...)
Com efeito, pretendemos encontrar estimativas de
0
e
1
que minimizem a soma dos
quadrados dos desvios verticais entre y
i
e
0
+
1
x
i
, soma essa igual a
Q =
n
i=1
[y
i
(
0
+
1
x
i
)]
2
. (9.6)
Proposicao 9.10 Estimativas de mnimos quadrados

As estimativas de mnimos quadrados de
0
e
1
representadas doravante por

0
e

1
sao a solucao do seguinte sistema de duas equa c oes lineares:
(
0
,

1
) :
_
_
Q
0
0=
0,1=
1
= 0
Q
1
0=
0,1=
1
= 0
(9.7)
i.e.
0
= y

1
x (9.8)
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
. (9.9)
Proposicao 9.11 Estimadores de mnimos quadrados

Os estimadores de mnimos quadrados de
0
e
1
ser ao igualmente representados por

0
e

1
,
4
encontram-se no formul ario da disciplina e s ao dados por:
0
form
=

Y

1
x (9.10)
1
form
=
n
i=1
x
i
Y
i
n x

Y
n
i=1
x
2
i
n x
2
. (9.11)
4
Neste captulo n ao faremos a destrin ca entre estimador e estimativa, em termos notacionais, por mera
conveniencia.
325
Nota 9.12 Estimativas de mnimos quadrados
O sistema (9.7) e equivalente a
(
0
,

1
) :
_
_
_
2
n
i=1
[y
i
(
0
+

1
x
i
)] = 0
2
n
i=1
x
i
[y
i
(
0
+

1
x
i
)] = 0
(9.12)
_
_
_
n

0
+

n
i=1
x
i
=

n
i=1
y
i
n
i=1
x
i
+

n
i=1
x
2
i
=

n
i=1
x
i
y
i
(9.13)
_
_
_
n

0
+

n
i=1
x
i
=

n
i=1
y
i
n
i=1
x
i
+

n
i=1
x
2
i
=

n
i=1
x
i
y
i
(9.14)
_
_
_
0
= y

1
x
( y

1
x)
n
i=1
x
i
+

n
i=1
x
2
i
=

n
i=1
x
i
y
i
(9.15)
_
_
_
0
= y

1
x
1
(
n
i=1
x
2
i
n x
2
) =

n
i=1
x
i
y
i
n x y.
(9.16)
Convem real car que o sistema (9.7) possui soluc ao sse
n
i=1
x
2
i
n x
2
= 0, (9.17)
i.e., sse na amostra existirem pelo menos dois valores distintos da vari avel explicativa
x.
Acrescente-se ainda que pode mostrar-se que a matriz hessiana de Q e semi-denida
positiva, pelo que, caso exista solucao (
0
,

1
), ela corresponder a a um mnimo.
As diferencas e
i
= y
i
(
0
+
1
x
i
) s ao denominadas de resduos. E sera à custa destes
resduos que obteremos uma estimativa da vari ancia
2
. A sua analise (emprica)
permitir a avaliar a adequa cao do modelo de RLS e sera abordada na ultima secc ao
deste captulo.
Nota 9.13 F ormula alternativa de

E frequente encontrar a seguinte f ormula alternativa de

1
na literatura. Esta formula e,
por sinal, menos pratica que a da Proposic ao 9.10 e e dada por:
n
i=1
(x
i
x)(y
i
y)
n
i=1
(x
i
x)
2
. (9.18)
326
Exemplo 9.14 Estimativas de mnimos quadrados
O custo de manutencao (em euros) de tractores parece aumentar com a idade (em anos)
do tractor. Para vericar esta suposic ao, obtiveram-se os seguintes dados:
i 1 2 3 4 5 6 7 8 9
Idade (em anos) 0.5 0.5 1.0 1.0 1.0 4.0 4.0 4.0 4.5
Custo (em euros) 163 182 978 466 549 495 723 681 619
i 10 11 12 13 14 15 16 17
Idade (em anos) 4.5 4.5 5.0 5.0 5.0 5.5 6.0 6.0
Custo (em euros) 1049 1033 890 1522 1194 987 764 1373
Considerando um modelo de RLS, obtenha e interprete as estimativas de mnimos
quadrados de
0
e
1
.
Estimativas de mnimos quadrados
Tirando partido das expressoes das estimativas de mnimos quadrados de
0
e
1
e
do facto de n = 17 e de
n
i=1
x
i
= 62
x = 3.647058824
n
i=1
x
2
i
= 289.5
n
i=1
x
2
i
n x
2
= 63.38235294
n
i=1
y
i
= 13668
y = 804
n
i=1
y
2
i
= 13294114
n
i=1
y
2
i
n y
2
= 2305042
5
n
i=1
x
i
y
i
= 58196.5
n
i=1
x
i
y
i
n x y = 8348.5,
obtem-se:
5
Embora estas quantidades sejam desnecessarias no curso deste exemplo, o seu calculo e mais que
recomendavel ja que o valor de

n
i=1
y
2
i
e muito em particular o de

n
i=1
y
2
i
n y
2
e usado em outros
tipos de inferencias que faremos sobre os par ametros do modelo.
327
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
58196.5 17 3.647058824 804
289.5 17 3.647058824
2
=
8348.5
63.38235294
= 131.7164733 (Euro/ano) (9.19)
0
= y

1
x
= 804 131.7164733 3.647058824
= 323.6222738 (Euro). (9.20)
Interpreta cao das estimativas de mnimos quadrados
0
323.6
Estima-se que o valor esperado do custo de manutenc ao de um tractor novo (com
idade igual a 0 anos) seja de aproximadamente 323.6 Euros.
1
131.72
Por cada ano que passa, o valor esperado do custo de manutenc ao aumenta
aproximadamente 131.72 Euros.
Nota 9.15 Estimativas de mnimos quadrados
Recomenda-se o uso do maximo de algarismos possveis nos passos intermedios da
obten c ao das estimativas de mnimos quadrados, por forma a evitar a acumula c ao de
erros de arredondamento.
Recomenda-se tambem que os arredondamentos s o sejam efectuados aquando da
apresenta cao dos valores das referidas estimativas.
328
9.2.2 Estima cao de
0
e
1
metodo da MV
Para obter as estimativas de MV de
0
e
1
s ao necess arias hip oteses de trabalho adicionais
que dizem mais uma vez respeito aos erros aleat orios. Estas hip oteses de trabalho
adicionais possuem implica coes distribuicionais que nos permitir ao efectuar inferencias
de vario tipo, nomeadamente, obter intervalos de conan ca e efectuar testes de hip oteses
sobre
0
e
1
e outros par ametros de interesse.
Nota 9.16 Hip oteses de trabalho adicionais do modelo de RLS
Adicionalmente, assuma-se que
i

i.i.d.
normal(0,
2
), i = 1, . . . , n. (9.21)
Nota 9.17 Consequencias

Ao lidar com erros aleat orios
i
i.i.d. e normalmente distribudos conclui-se que as seguintes
func oes am destes erros
Y
i
=
0
+
1
x
i
+
i

indep
normal(
0
+
1
x
i
,
2
), i = 1, . . . , n, (9.22)
i.e.,
f
Yi|0,1
(y
i
) = (2
2
)
1/2
exp
_
1
2
2
[y
i
(
0
+
1
x
i
)]
2
_
, i = 1, . . . , n. (9.23)
Proposicao 9.18 Estimativas de MV

Pode adiantar-se que as estimativas de MV de
0
e
1
coincidem com as estimativas de
mnimos quadrados deste par de parametros. Assim, n ao s o s ao representadas por

0
e
1
, como s ao iguais a
0
= y

1
x (9.24)
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
. (9.25)
Nota 9.19 Deducao das estimativas de MV

Funcao de verosimilhan ca
A funcao de verosimilhan ca e dada por
329
L(
0
,
1
|y) =
n
i=1
f
Yi|0,1
(y
i
)
=
n
i=1
(2
2
)
1/2
exp
_
1
2
2
[y
i
(
0
+
1
x
i
)]
2
_
= (2
2
)
n/2
exp
_
1
2
2
n
i=1
[y
i
(
0
+
1
x
i
)]
2
_
. (9.26)
Log-verosimilhan ca
Por seu lado o logaritmo da fun cao de verosimilhan ca e
ln L(
0
,
1
|y) =
1
2
ln(2
2
)
1
2
2
n
i=1
[y
i
(
0
+
1
x
i
)]
2
=
1
2
ln(2
2
)
1
2
2
Q, (9.27)
onde, recorde-se, Q e denido por (9.6).
Maximiza cao
Tratando-se ln L(
0
,
1
|y) de uma func ao proporcional a Q, a sua maximiza c ao no
que diz respeito a
0
e
1
e equivalente à minimiza cao de Q que conduziu, como se
sabe, ` as estimativas seguintes:
0
= y

1
x (9.28)
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
. (9.29)
Nota 9.20 Nota cao alternativa

Em alguns livros de texto pode encontrar-se a seguinte nota cao:
S
XX
=
n
i=1
(x
i
x)
2
=
n
i=1
x
2
i
n x
2
(9.30)
S
XY
=
n
i=1
(x
i
x)(y
i
y)
=
n
i=1
x
i
(y
i
y)
=
n
i=1
y
i
(x
i
x)
=
n
i=1
x
i
y
i
n x y. (9.31)
330
Posto isto,
0
= y
S
XY
S
XX
x (9.32)
1
=
S
XY
S
XX
. (9.33)
9.2.3 Recta de regressao
E usual estimar o valor esperado da resposta associada a um valor arbitr ario x da variavel
explicativa. A estimativa pontual de E(Y |x) =
0
+
1
x e igual a
y =

E(Y |x)
=

0
+

1
x (9.34)
e e habitual dar-se-lhe o nome de tted value.
A recta denida por
0
+

1
x, para x [x
(1)
, x
(n)
]
(onde x
(1)
= min
i=1,...,n
x
i
e x
(n)
= max
i=1,...,n
x
i
), e usualmente designada de recta de
regress ao, recta estimada ou recta ajustada.
Exemplo 9.21 Recta de regressao
Retome o Exemplo 9.4 (resistencia do pl astico) e obtenha uma estimativa para o valor
esperado da resistencia de uma peca de plastico que seja testada 20 horas ap os a sua
moldagem.
Estimativas de
0
e
1
Note-se que n = 12 e
n
i=1
x
i
= 576
x = 48
n
i=1
x
2
i
= 31488
n
i=1
x
2
i
n x
2
= 3840
n
i=1
y
i
= 3239
y = 269.9166667
n
i=1
y
2
i
= 897639
n
i=1
y
2
i
n y
2
= 23378.91667
331
n
i=1
x
i
y
i
= 164752
n
i=1
x
i
y
i
n x y = 9280.
Logo
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
164752 12 48 269.9166667
31488 12 48
2
=
9280
3840
= 2.416666667 (9.35)
0
= y

1
x
= 269.9166667 2.416666667 48
= 153.9166667 (9.36)
Recta de regressao
A estimativa do valor esperado da resistencia de uma peca de plastico que seja
testada x horas apos a sua moldagem e igual a
y =

E(Y |x)
=

0
+

1
x
= 153.9166667 + 2.416666667 x. (9.37)
E esta a equa c ao da recta de regressao. Ora, para x = 20, obtem-se
E(Y |x = 20) = 153.9166667 + 2.416666667 20

= 202.25. (9.38)
Exerccio 9.22 Recta de regressao

Trace a recta de regressao sobre o graco do Exemplo 9.4 (resistencia do pl astico) e
obtenha alguns resduos (e
i
= y
i
(
0
+

1
x
i
)) à sua escolha.
332
9.3 Propriedades dos estimadores dos mnimos
quadrados e estima cao da variancia.
E possvel adiantar o valor esperado e a variancia dos estimadores de mnimos quadrados

de
0
e
1
, bem como a covari ancia entre estes dois estimadores.
Proposicao 9.23 Propriedades dos estimadores dos mnimos quadrados
Parametro Estimador Valor esperado Variancia
0

0 =

Y

1 x 0
2
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
_
1

1 =
n
i=1
xiYin x

Y
n
i=1
x
2
i
n x
2
1
n
i=1
x
2
i
n x
2
cov(
0,

1) =

2
x
2
n
i=1
x
2
i
n x
2
Convem salientar que:
0
e

1
s ao estimadores centrados de
0
e
1
;
0
e

1
s ao v.a. dependentes correlacionadas negativamente.
6
Motiva cao 9.24 Estima cao de

2
Para alem de
0
e
1
e necessario estimar um outro parametro desconhecido:
V (
i
) = V (Y
i
) =
2
.
Tal como se teve ocasi ao de referir a estimativa de
2
obtem-se ` a custa dos resduos,
tal como podemos ver na proposic ao que se segue.
Proposicao 9.25 Estimativa de
2
A estimativa de
2
representar-se- a por
2
e e igual a

2
=
1
n 2
n
i=1
(y
i
y
i
)
2
=
1
n 2
n
i=1
[y
i
(
0
+

1
x
i
)]
2
=
1
n 2
__
n
i=1
y
2
i
n y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
, (9.39)
6
Este facto e obvio j a que

0 depende de

1 atraves de uma sua fun cao decrescente,

0 = y

1 x.
333
sendo que a ultima expressao e a mais conveniente para o c alculo desta estimativa ja que
tira partido de quantidades previamente obtidas aquando da determina cao de

0
e

1
.
Proposicao 9.26 Estimador de
2
e uma sua propriedade
O estimador de
2
consta do formulario e e denido por

2
form
=
1
n 2
__
n
i=1
Y
2
i
n

Y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
, (9.40)
Rera-se tambem que se trata de um estimador centrado de
2
.
7
Exemplo 9.27 Estimativa de

2
Retome mais uma vez o Exemplo 9.4 (resistencia do pl astico) e obtenha a estimativa da
vari ancia da resistencia.
A estimativa de
2
e, neste caso, igual a

2
=
1
n 2
__
n
i=1
y
2
i
n y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
=
1
12 2
__
897639 12 269.9166667
2
_
2.416666667
2
_
31488 12 48
2
__
=
1
12 2
_
23378.91667 2.416666667
2
3840
_
= 95.225. (9.41)
Exerccio 9.28 Estimativas das variancias dos estimadores de

0
e
1
Retome o Exemplo 9.27 e obtenha estimativas das vari ancias dos estimadores de
0
e
1
,
i.e., determine estimativas de
2
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
_
e de

2
n
i=1
x
2
i
n x
2
, resp.
7
Embora n ao se trate do estimador de MV de
2
sob a hip otese de trabalho de erros aleatorios i.i.d.
normalmente distribudos.
Mais uma vez representamos do mesmo modo quer a estimativa, quer o estimador de um par ametro
desconhecido, neste caso
2
.
334
9.4 Alguns abusos do modelo de regressao.
Escusado sera dizer que a tenta cao de estabelecer uma rela c ao entre uma vari avel resposta
e uma ou mais vari aveis explicativas e de estimar o valor esperado da resposta para valores
arbitr arios da vari avel explicativa pode conduzir a abusos na utiliza cao de modelos de
regress ao. Entre eles destacaramos dois. A saber:
Escolha incorrecta das variaveis explicativas
Uma escolha incorrecta das vari aveis explicativas pode levar a conclusoes absurdas
j a que uma associa c ao estatstica n ao implica necessariamente uma rela cao de causa
e efeito.
Erro de extrapola cao
A rela c ao traduzida pelo modelo de RLS s o e v alida para a gama de valores
observados da vari avel explicativa x,
[x
(1)
, x
(n)
],
onde, recorde-se, x
(1)
= min
i=1,...,n
x
i
e x
(n)
= max
i=1,...,n
x
i
.
Caso se obtenha um tted value
y =

0
+

1
x, para x [x
(1)
, x
(n)
],
estamos a cometer aquilo que se designa por
erro de extrapolacao. (Esquema...)
Exemplo 9.29 Erro de extrapola cao
Tendo em vista o teste de uma nova soluc ao de insulina foram administradas 3 doses
diferentes dessa mesma soluc ao a coelhos e registadas as quedas na quantidade de a c ucar
no sangue depois de um perodo xo de tempo.
As observa coes referentes ao logaritmo da dose (x) e à queda da quantidade de ac ucar
no sangue (Y ) encontram-se na tabela abaixo.
i 1 2 3 4 5 6 7 8 9 10 11 12
LnDose (xi) 0.36 0.36 0.36 0.36 0.56 0.56 0.56 0.56 0.76 0.76 0.76 0.76
Queda ac ucar (yi) 17 21 49 54 64 48 34 63 62 72 61 91
335
(a) Obtenha a recta de regressao e uma estimativa do valor esperado da queda da
quantidade de a c ucar no sangue quando o logaritmo da dose e unit ario, tendo em
conta que

n
i=1
x
i
= 6.72,

n
i=1
x
2
i
= 4.0832,

n
i=1
y
i
= 636,

n
i=1
y
2
i
= 38602 e
n
i=1
x
i
y
i
= 385.16.
Se por um lado o logaritmo da dose administrada n ao e uma v.a. (por ser
perfeitamente control avel), por outro lado a resposta, queda da quantidade de a c ucar
no sangue, e claramente uma v.a. Ent ao, faz sentido recorrer ` a partida ao modelo
de RLS.
Recta de regressao
Dado que x =
6.72
12
= 0.56 e y =
636
12
= 53 as estimativas de
0
e
1
s ao iguais a:
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
385.16 12 0.56 53
4.0832 12 0.56
2
=
29
0.32
= 90.625 (9.42)
0
= y

1
x
= 53 90.625 0.56
= 2.25. (9.43)
Logo a recta de regressao e dada por:
y =

E(Y |x)
=

0
+

1
x
= 2.25 + 90.625 x. (9.44)
Estimativa de E(Y |x = 1)
A estimativa do valor esperado da queda da quantidade de a c ucar no sangue
quando o logaritmo da dose e unit ario e y = 2.25 +90.625 1 = 92.875. Note-
se, no entanto, que esta estimativa foi obtida por extrapolac ao uma vez
que a gama de valores da vari avel explicativa e [0.36, 0.76].
Assim, esta estimativa deve ser usada com muito cautela ou, melhor ainda,
n ao deve ser utilizada.
336
(b) Calcule o logaritmo da dose a administrar de forma a obter uma estimativa do valor
esperado da queda da quantidade de a c ucar no sangue igual a 70.
Obten cao da dose a administrar
Pretende-se a abcissa x tal que

E(Y |x) = 70. Ora,
0
+

1
x = 70 x =
70

1
x =
70 2.25
90.625
x = 0.7476 (9.45)
e o logaritmo da dose a administrar de modo a obter queda esperada da
quantidade de a c ucar no sangue igual a 70.
337
9.5 Intervalos de conan ca para
0
,
1
e para o valor
esperado da resposta.
Motiva cao 9.30 Intervalos de conan ca para
0
,
1
e E(Y |x
0
) =
0
+
1
x
0
Para alem das estimativas pontuais, e de extrema utilidade adiantar intervalos de valores
razo aveis para os par ametros desconhecidos
0
e
1
, bem como para o valor esperado da
resposta quando a vari avel explicativa toma o valor x
0
,
E(Y |x
0
) =
0
+
1
x
0
.
Para construir intervalos de conan ca (e ja agora efectuar testes de hipoteses) para
0
e
1
ou outros par ametros de interesse no ambito do modelo de RLS e crucial assumir
que
i

i.i.d.
normal(0,
2
), i = 1, . . . , n, (9.46)
j a que nessa situa cao obtemos os seguintes resultados distribuicionais.
Proposicao 9.31 Distribuicao dos estimadores de MV de
0
,
1
e
0
+
1
x
0
Sob a validade de (9.46) temos Y
i

indep
normal(
0
+
1
x
i
,
2
), i = 1, . . . , n, donde:
Parametro Estimador Distribuicao
0

0 normal
_
0,
2
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
__
1

1 normal
_
1,

2
n
i=1
x
2
i
n x
2
_
0 +1x0

0 +

1x0 normal
_
0 +1x0,
2
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
__
Proposicao 9.32 V.a. fulcral para

2
Tambem sob a validade de (9.46) temos:
Parametro V.a. fulcral para
2
Distribuicao
2 (n2)
2
2
2
(n2)
338
E exactamente por

0
e

1
terem distribuicoes normais e serem independentes da v.a.
fulcral para
2
que seremos capazes de adiantar v.a. fulcrais para
0
,
1
e E(Y |x
0
) =
0
+
1
x
0
. Elas possuem, em qualquer dos casos, distribuic ao tStudent ja que
(n2)
2
2
tem distribuic ao do qui-quadrado.
Com efeito, ao reduzir os tres estimadores da Proposic ao 9.31 e ao substituir
2
pelo
seu estimador, obtemos as seguintes v.a. fulcrais que, por sinal, tambem constam do
formul ario. As concretiza coes dos intervalos aleat orios de conan ca foram acrescentadas
` a tabela seguinte e obtem-se sem grande diculdade.
Proposicao 9.33 V.a. fulcrais para
0
,
1
e
0
+
1
x
0
Os IC para estes tres par ametros de interesse obtem-se, sob a validade de
i

i.i.d.
normal(0,
2
), i = 1, . . . , n, à custa das seguintes v.a. fulcrais:
Parametro V.a. fulcral IC(1)100%
0
00
2
_
1
n
+
x2
n
i=1
x2
i
n x2
_
t(n2)
_
0 F
1
t
(n2)
(1 /2)
2
_
1
n
+
x2
n
i=1
x2
i
n x2
_
_
1
11
_
2
n
i=1
x2
i
n x2
t(n2)
_
1 F
1
t
(n2)
(1 /2)
_
2
n
i=1
x2
i
n x2
_
0 + 1x0
( 0+ 1x0)(0+1x0)
2
_
1
n
+
(x0 x)2
n
i=1
x2
i
n x2
_
t(n2)
_
( 0 + 1x0) F
1
t
(n2)
(1 /2)
2
_
1
n
+
(x0 x)2
n
i=1
x2
i
n x2
_
_
Nota 9.34 Intervalos de conan ca para

0
,
1
e E(Y |x
0
) =
0
+
1
x
0
Estes tres intervalos de conan ca sao do tipo
estimativa centrada do par ametro
quantil
estimativa da vari ancia do estimador do parametro.

A amplitude de IC
(1)100%
(
0
+
1
x
0
) aumenta à medida que nos afastamos de
x (i.e., torna-se menos precisa), reectindo, assim, os perigos da extrapola cao.
(Esquema...)
339
Exemplo 9.35 Intervalo de conan ca para E(Y |x) =
0
+
1
x
0
Um astr onomo resolveu estudar a rela c ao entre a dist ancia e a velocidade de recessao
entre nebulosas. Com esse objectivo registou para 24 nebulosas as distancias a partir da
terra (x, em megaparsecs) e as respectivas velocidades de recessao (y, em Km/s), tendo
obtido
24
i=1
x
i
= 21.873,

24
i=1
y
i
= 8955,

24
i=1
x
2
i
= 29.5178,

24
i=1
y
2
i
= 6511425,
24
i=1
x
i
y
i
= 12513.7
e min(x
1
, . . . , x
24
) = 0.032 e max(x
1
, . . . , x
24
) = 2.
8
Obtenha um intervalo de conan ca a 90% para o valor esperado da velocidade de recessao
de uma nebulosa a uma dist ancia da terra de 0.55 megaparsecs, assumindo que o modelo
de RLS e apropriado.
9
Estimativas de MV
Assumindo que
i

i.i.d.
normal(0,
2
), i = 1, . . . , n, e tirando partido do facto de
n
i=1
x
i
= 21.873
x = 0.911375
n
i=1
x
2
i
= 29.5178
n
i=1
x
2
i
n x
2
= 9.583294625
n
i=1
y
i
= 8955
y = 373.125
n
i=1
y
2
i
= 6511425
n
i=1
y
2
i
n y
2
= 3170090.625
n
i=1
x
i
y
i
= 12513.7,
n
i=1
x
i
y
i
n x y = 4352.336875,
obtem-se
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
4352.336875
9.583294625
= 454.1587 (9.47)
8
1 parsec = 3.26 anos luz.
9
340
0
= y

1
x
= 373.125 454.1587 0.911375
= 40.7839. (9.48)
Estimativa de MV de E(Y |x
0
= 0.55)
E igual a
E(Y |x
0
) =

0
+

1
x
0
= 40.7839 + 454.1587 0.55
= 209.0034. (9.49)
Estimativa de
2
E, neste caso, dada por

2
=
1
n 2
__
n
i=1
y
2
i
n y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
=
1
24 2
_
3170090.625 454.1587
2
9.583294625
_
= 54247.1805. (9.50)
IC a 90% para E(Y |x
0
)
Passo 1 V.a. fulcral para E(Y |x
0
) =
0
+
1
x
0
Z =
(
0
+

1
x
0
) (
0
+
1
x
0
)
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
_
t
(n2)
(9.51)
Passo 2 Quantis de probabilidade
J a que (1 ) 100% = 90% temos = 0.10 e lidaremos com os dois quantis
simetricos:
F
1
t(n2)
(1 /2) = F
1
t(242)
(1 0.10/2)
tabela
= 1.717. (9.52)
Z b
Omitmo-lo...
341
E dado por
IC
(1)100%
(
0
+
1
x
0
)
=
_
(
0
+

1
x
0
) F
1
t(n2)
(1 /2)
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
_
_
=
_
209.0039 1.717
_
54247.1805
_
1
24
+
(0.550.911375)
2
9.583294625
_
_
= [209.0039 1.717 54.7678]
= [209.0039 94.0336]
= [114.967, 303.0398].
Exemplo 9.36 Intervalos de conan ca para

0
e
1
Determine IC para os coecientes do modelo de RLS do Exemplo 9.35.
IC a 90% para
0
Passo 1 V.a. fulcral para
0
Da consulta do formul ario segue-se
Z =
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
_
t
(n2)
J a que (1 ) 100% = 90% temos = 0.10 e lidaremos com os dois quantis
simetricos:
F
1
t(n2)
(1 /2) = F
1
t(242)
(1 0.10/2)
tabela
= 1.717.
Z b
Omitmo-lo...
E dado por
IC
(1)100%
(
0
) =
_
_
0
F
1
t(n2)
(1 /2)
_

2
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
_
_
_
.
342
Ora, tirando partido dos resultados do Exemplo 9.35, segue-se:
IC
90%
(
0
) =
_
_
40.7839 1.717
_
54247.1805
_
1
24
+
0.911375
2
9.583294625
_
_
_
= [184.045, 102.477].
IC a 90% para
1
Passo 1 V.a. fulcral para
1
Consultando mais uma vez o formul ario segue-se
Z =
1
_

2
n
i=1
x
2
i
n x
2
t
(n2)
Lidaremos novamente com os dois quantis simetricos:
F
1
t(n2)
(1 /2) = F
1
t(242)
(1 0.10/2)
tabela
= 1.717.
Z b
Omitmo-lo...
E dado por
IC
(1)100%
(
1
) =
_
_
1
F
1
t(n2)
(1 /2)
_

2
n
i=1
x
2
i
n x
2
_
_
.
Recorrendo de novo aos resultados do Exemplo 9.35, temos:
IC
90%
(
0
) =
_
_
454.1587 1.717
54247.1805
9.583294625
_
_
= [324.982, 583.336].
343
9.6 Testes de hip oteses sobre
0
,
1
e o valor esperado
da resposta.
Escusado sera dizer que e a partir das v.a. fulcrais introduzidas na secc ao anterior
que obteremos estatsticas de teste para o confronto de hipoteses sobre
0
,
1
e
E(Y |x
0
) =
0
+
1
x
0
.
Proposicao 9.37 Estatsticas de teste para
0
e
1
Mais uma vez sob a validade de
i

i.i.d.
normal(0,
2
), i = 1, . . . , n, temos
Hipotese nula Estatstica de teste
H0 : 0 = 0,0
00,0
_
1
n
+
x2
n
i=1
x
2
i
n x2
_
H0
t
(n2)
H0 : 1 = 1,0
11,0
_
2
n
i=1
x
2
i
n x2
H0
t
(n2)
H0 : E(Y |x0) = 0 +1x0 = E0(Y |x0)
(
0+
1x0)E0(Y |x0)
_
1
n
+
(x
0
x)2
n
i=1
x
2
i
n x2
_
H0
t
(n2)
Nota 9.38 Testes de hipoteses sobre

1
De entre os testes de hipoteses no ambito do modelo de RLS destaque-se um teste de
especial import ancia por vezes denominado de
teste de signic ancia da regress ao.
A hipotese nula deste teste e
H
0
:
1
=
1,0
= 0.
Esta hipotese e sin onimo de inexistencia de associac ao linear entre a vari avel resposta Y
e a variavel explicativa j a que sob a validade de H
0
temos Y
i
=
0
+
i
, i = 1, . . . , n.
344
Exemplo 9.39 Testes de hipoteses sobre
1
Considere o conjunto de dados do Exemplo 9.35 e teste a hip otese de a velocidade de
recessao das nebulosas nao ser inuenciada pela respectiva dist ancia a partir da terra ao
nvel de signic ancia de 10%.
Hipoteses
H
0
:
1
=
1,0
= 0 vs. H
1
:
1
= 0
Nvel de signicancia
0
= 10%
Estatstica de teste
T =
1,0
_

2
n
i=1
x
2
i
n x
2
H0
t
(n2)
(9.53)
0
Estamos a lidar com
um teste bilateral (H
1
:
1
= 0),
pelo que, quanto maior for o valor absoluto da estimativa de MV de
1
,

1
, mais nos
devemos inclinar para a rejei cao H
0
. Logo a regi ao de rejeic ao de H
0
(para valores
da estatstica de teste) e uma reuni ao de intervalos do tipo
W = (, c) (c, +), (9.54)
0
|H
0
) =
0
, i.e.,
c = F
1
t(n2)
(1
0
/2) = F
1
t(242)
(1 0.10/2)
tabela
= 1.717. (9.55)
Decisao
Tendo em conta que, de acordo com o Exemplo 9.35,
1
= 454.1587

2
= 54247.1805
n
i=1
x
2
i
n x
2
= 9.583294625,
345
t =
1,0
_

2
n
i=1
x
2
i
n x
2
=
454.1587 0
_
54247.1805
9.583294625
= 6.036378628
W = (, 1.717) (1.717, +). (9.56)
Deste modo, concluimos que devemos rejeitar a hip otese de a velocidade de recessao
das nebulosas n ao ser inuenciada pela respectiva dist ancia a partir da terra, ao n.s.
de 10% bem como a qualquer outro n.s. maior que 10%.
1
Retome o conjunto de dados do Exemplo 9.4 (resistencia do plastico) e teste a hipotese
de o tempo que decorre a partir da conclus ao do processo de moldagem ate ao momento
de medi cao da resistencia n ao inuenciar a resistencia do pl astico ao nvel de signic ancia
de 5%.
Hipoteses
H
0
:
1
=
1,0
= 0 vs. H
1
:
1
= 0
Nvel de signicancia
0
= 5%
Estatstica de teste
T =
1,0
_

2
n
i=1
x
2
i
n x
2
H0
t
(n2)
(9.57)
0
Estamos a lidar com
um teste bilateral (H
1
:
1
= 0),
pelo que, quanto maior for o valor absoluto da estimativa de MV de
1
,

1
, mais nos
devemos inclinar para a rejei cao H
0
. Logo a regi ao de rejeic ao de H
0
(para valores
da estatstica de teste) e uma reuni ao de intervalos do tipo
W = (, c) (c, +), (9.58)
onde
c = F
1
t(n2)
(1
0
/2) = F
1
t(122)
(1 0.05/2) =
tabela
2.228. (9.59)
346
Decisao
Tendo em conta os seguintes resultados j a obtidos anteriormente
n
i=1
x
i
= 576
x = 48
n
i=1
x
2
i
= 31488
n
i=1
x
2
i
n x
2
= 3840
n
i=1
y
i
= 3239
y = 269.9166667
n
i=1
y
2
i
= 897639
n
i=1
y
2
i
n y
2
= 23378.91667
n
i=1
x
i
y
i
= 164752
n
i=1
x
i
y
i
n x y = 9280.
1
=
n
i=1
xiyin x y
n
i=1
x
2
i
n x
2
=
9280
3840
= 2.416666667
0
= y

1
x = 269.9166667 2.416666667 48 = 153.9166667

2
=
1
n2
_
(
n
i=1
y
2
i
n y
2
) (
1
)
2
(
n
i=1
x
2
i
n x
2
)
_
=
1
122
(23378.91667 2.416666667
2
3840) = 95.225,
conclui-se que o valor observado da estatstica de teste e dado por
t =
1,0
_

2
n
i=1
x
2
i
n x
2
=
2.416666667 0
_
95.225
3840
= 15.3464
W = (, 2.228) (2.228, +). (9.60)
Deste modo, concluimos que devemos rejeitar a hip otese de a resistencia do pl astico
n ao ser inuenciada pelo tempo que decorre a partir da conclus ao do processo de
moldagem ate ao momento de medi cao da resistencia, ao n.s. de 5% bem como a
qualquer outro n.s. maior que 5%.
347
1
Teste a signic ancia da regressao para o conjunto de dados do Exemplo 9.5
(hidrocarbonetos), calculando para o efeito um intervalo para o p value.
Hipoteses
H
0
:
1
=
1,0
= 0 vs. H
1
:
1
= 0
Nvel de signicancia
0
Estatstica de teste
T =
1,0
_

2
n
i=1
x
2
i
n x
2
H0
t
(n2)
(9.61)
0
A regi ao de rejei cao de H
0
(para valores da estatstica de teste) e uma reuniao de
intervalos do tipo W = (, c) (c, +), onde c = F
1
t(n2)
(1
0
/2).
Decisao
Tendo em conta os seguintes resultados j a obtidos anteriormente
n
i=1
x
i
= 23.92
x = 1.196
n
i=1
x
2
i
= 29.2892
n
i=1
x
2
i
n x
2
= 0.68088
n
i=1
y
i
= 1843.21
y = 92.1605
n
i=1
y
2
i
= 170044.5321
n
i=1
y
2
i
n y
2
= 173.376895
n
i=1
x
i
y
i
= 2214.6566
n
i=1
x
i
y
i
n x y = 10.17744.
1
=
n
i=1
xiyin x y
n
i=1
x
2
i
n x
2
=
10.17744
0.68088
= 14.94747973
348
0
= y

1
x = 92.1605 14.94747973 1.196 = 74.28331424

2
=
1
n2
_
(
n
i=1
y
2
i
n y
2
) (
1
)
2
(
n
i=1
x
2
i
n x
2
)
_
=
1
202
(173.376895 14.94747973
2
0.68088) = 1.18055,
conclui-se que o valor observado da estatstica de teste e dado por
t =
1,0
_

2
n
i=1
x
2
i
n x
2
=
14.94747973 0
_
1.18055
0.68088
= 11.3517. (9.62)
Intervalo para o p-value
Tratando-se de teste associado a uma regiao de rejeicao de H
0
que e uma reuniao
de intervalos simetricos temos:
p value = 2 P(T > t | H
0
)
= 2 [1 F
T|H0
(t)]
= 2 [1 F
t(202)
(11.3517)]. (9.63)
Recorrendo ` as tabelas de quantis da distribuic ao do qui-quadrado com 18 graus de
liberdade podemos obter um intervalo para o p-value deste teste. Para tal basta
enquadrar convenientemente t = 11.3517 por dois quantis. No entanto, as tabelas
disponveis s o permitem armar que
F
1
t(18)
(0.9995) = 3.992 < t = 11.3517
0.9995 < F
t(18)
(11.3517)
2 [1 F
t(18)
(11.3517)] < 2 (1 0.9995)
e por m o intervalo para o p-value e (0,0.001).
Deste modo, conclui-se que devemos rejeitar H
0
(hip otese de a pureza do oxigenio
produzido nao ser inuenciada pela percentagem de hidrocarbonetos) a qualquer
n.s.
0
0.1%.
349
0
e E(Y |x
0
) =
0
+
1
x
0
Com o objectivo de estimar a constante de elasticidade (
1
)
1
(em Newton/metro) de
certo tipo de mola, foram seleccionadas 10 dessas molas, todas com o mesmo comprimento
em repouso
0
(em metros). Foi obtido o seguinte conjunto de resultados, apos se ter
suspendido ` a mola i (i = 1, . . . , 10) um corpo com peso x
i
(em Newton) e medido o
comprimento da mola ap os tal suspens ao y
i
:
i 1 2 3 4 5 6 7 8 9 10
xi 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50
yi 0.206 0.212 0.218 0.225 0.239 0.237 0.245 0.251 0.257 0.263
10
i=1
xi = 13.75

10
i=1
x
2
i
n x
2
= 5.15625

10
i=1
yi = 2.353

10
i=1
y
2
i
n y
2
= 0.0034021
10
i=1
xiyi n x y = 0.131375.
Admita a validade do modelo de regress ao linear simples Y
i
=
0
+
1
x
i
+
i
(i = 1, . . . , 10)
para este conjunto de dados e responda às quest oes que se seguem:
10
(a) Obtenha estimativas de maxima verosimilhan ca do declive da recta, da constante de
elasticidade (
1
)
1
e do valor esperado do comprimento da mola ao sujeita-la a uma
for ca de 3.0 Newton. Comente esta ultima estimativa.
Estimativa de MV do declive da recta (
1
)
Ao tomar como hip otese de trabalho
i

i.i.d.
normal(0,
2
), i = 1, . . . , n, e ao
ter considera c ao que n = 10 e
n
i=1
x
i
= 13.75
x = 1.375
n
i=1
x
2
i
n x
2
= 5.15625
n
i=1
y
i
= 2.353
y = 0.2353
n
i=1
y
2
i
n y
2
= 0.0034021
n
i=1
x
i
y
i
n x y = 0.131375,
depressa se conclui que
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
0.131375
5.15625
= 0.0254788.
10
350
Estimativa de MV da constante de elasticidade (
1
)
1
Ao invocar-se a propriedade de invari ancia dos estimadores de MV pode adiantar-
se que a estimativa de MV da constante de elasticidade,
h(
1
) = (
1
)
1
,
e dada por
h(
1
) = h(
1
)
= (
1
)
1
=
1
0.0254788
= 39.2483.
Estimativa de MV de E(Y |x
0
= 3)
Invocando novamente a propriedade de invariancia dos estimadores de MV e
tirando partido quer de

1
= 0.0254788 quer de
0
= y

1
x
= 0.2353 0.0254788 1.375
= 0.200267,
pode adiantar-se que
E(Y |x
0
) =

0
+

1
x
0
= 0.200267 + 0.0254788 3
= 0.276703.
Comentario
A estimativa de MV do valor esperado do comprimento de uma mola ap os a
suspensao de peso x
0
= 3.0 deve ser usada com toda alguma cautela uma vez que
foi obtida por extrapolac ao. Com efeito, x
0
= 3.0 [x
(1)
, x
(n)
] = [0.5, 2.5],
ou seja o valor de x
0
n ao pertence ` a gama de pesos considerados para a obten c ao
da recta de regress ao.
(b) Teste a hip otese de o comprimento em repouso comum às 10 molas
0
(em metros)
ser igual a 0.2m ao nvel de signic ancia de 5%.
Hipoteses
H
0
:
0
=
0,0
= 0.2 vs. H
1
:
0
= 0.2
351
Nvel de signicancia
0
= 5%
Estatstica de teste
0,0
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
_

H0
t
(n2)
0
Dado que
o teste e bilateral (H
1
:
0
= 0.2),
a regiao de rejeic ao de H
0
(para valores da estatstica de teste) e a reuniao de
intervalos
W = (, c) (c, +),
0
|H
0
) =
0
, ou seja,
c = F
1
t(n2)
(1
0
/2) = F
1
t(102)
(1 0.05/2)
tabela
= 2.306.
Decisao
Tendo em conta os calculos anteriores bem como o facto de a estimativa centrada
de
2
ser igual a

2
=
1
n 2
__
n
i=1
y
2
i
n y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
=
1
10 2
_
0.0034021 0.0254788
2
5.15625
_
= 0.00000685263,
tem-se o seguinte valor observado da estatstica de teste:
t =
0,0
_
1
n
+
x
2
n
i=1
x
2
i
n x
2
_
=
0.200267 0.2
_
0.00000685263
_
1
10
+
1.375
2
5.15625
_
= 0.149307
W = (, 2.306) (2.306, +).
Logo n ao se deve rejeitar a hip otese de o comprimento em repouso das molas
(
0
) ser igual a 20cm ao n.s. de 5% nem a qualquer outro n.s. menor que 5%.
352
(c) Teste agora a hip otese de o comprimento esperado ap os suspens ao de um peso de
x
0
= 2 ser igual a 0.25m ao nvel de signic ancia de 10%.
Hipoteses
H
0
: E(Y |x
0
= 2) = E
0
(Y |x
0
= 2) = 0.25 vs.
H
1
: E(Y |x
0
= 2) = E
0
(Y |x
0
= 2)
Nvel de signicancia
0
= 10%
Estatstica de teste
(
0
+

1
x
0
) E
0
(Y |x
0
)
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
_

H0
t
(n2)
0
A regi ao de rejeic ao de H
0
e a reuniao de intervalos W = (, c) (c, +),
onde
c = F
1
t(n2)
(1
0
/2) = F
1
t(102)
(1 0.10/2)
tabela
= 1.860,
j a que o teste e bilateral (H
1
: E(Y |x
0
= 2) = E
0
(Y |x
0
= 2)).
Decisao
Capitalizando nos c alculos das alneas anteriores obtem-se o seguinte valor
observado da estatstica de teste
t =
(
0
+

1
x
0
) E
0
(Y |x
0
)
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
_
=
(0.200267 + 0.0254788 2) 0.25
_
0.00000685263
_
1
10
+
(2.01.375)
2
5.15625
_
= 1.11586
W = (, 1.860) (1.860, +).
Assim sendo, nao se deve rejeitar a hip otese de o comprimento esperado de mola
ap os suspens ao de peso de 2 Newton ser igual a 0.25m a qualquer n.s. menor ou
igual a 10%.
353
9.7 Coeciente de determina cao e analise de resduos
na avalia cao do modelo
Motiva cao 9.43 Coeciente de determina cao
Para alem de averiguarmos se a variavel resposta (Y ) depende linearmente da variavel
explicativa (x), e fundamental vericar se a recta de regressao se ajusta bem ao conjunto de
dados. Para o efeito limitar-nos-emos, no ambito desta disciplina, a calcular o coeciente
de determina c ao.
Denicao informal 9.44 Coeciente de determina cao
Trata-se de coeciente que d a ideia aproximada do ajustamento da recta de regressao aos
dados.

E denido por
r
2
=
n
i=1
( y
i
y)
2
n
i=1
(y
i
y)
2
=
(
n
i=1
x
i
y
i
n x y)
2
(
n
i=1
x
2
i
n x
2
) (
n
i=1
y
2
i
n y
2
)
. (9.64)
Assim, r
2
100% corresponde ` a
percentagem da varia cao total (
n
i=1
(y
i
y)
2
) explicada pela variavel regressora x
(
n
i=1
( y
i
y)
2
).
Nota 9.45 Coeciente de determina cao
Escusado ser a dizer que a segunda f ormula do coeciente de determina cao que gura na
denic ao informal 9.44 e de longe a mais conveniente exactamente por tirar partido de
quantidades previamente calculadas.
11
Importa notar ainda que:
r
2
[0, 1]
r
2
= 1 y
i
= y
i
, i = 1, . . . , n modelo RLS muito bom.
Com efeito, caso y
i
= y
i
, i = 1, . . . , n, todos os pontos est ao sobre a recta de
regress ao, pelo que o modelo de regress ao explica toda a variabilidade observada
na vari avel resposta Y . O modelo de RLS e muito bom.
11
Esta f ormula leva-nos a armar que o coeciente de determinacao corresponde ao quadrado do
coeciente de correla cao emprica entre as variaveis x e y.
354
r
2
= 0 y
i
= y, i = 1, . . . , n modelo RLS muito mau.
De facto, caso y
i
= y, i = 1, . . . , n, o modelo de regress ao e incapaz de explicar a
variabilidade observada na variavel resposta Y . O modelo de RLS e muito mau.
Exemplo 9.46 Coeciente de determina cao
Retome o Exemplo 9.35 (velocidade de recessao de nebulosas). Calcule e comente o valor
do coeciente de determina cao.
Coeciente de determina cao
E dado por
r
2
=
(
n
i=1
x
i
y
i
n x y)
2
(
n
i=1
x
2
i
n x
2
) (
n
i=1
y
2
i
n y
2
)
=
(12513.7 24 0.911375 373.125)
2
(29.5178 24 0.911375
2
) (6511425 24 373.125
2
)
=
4352.336875
2
9.58329 3170090.625
= 0.6235. (9.65)
A recta de regress ao explica 62.35% da varia c ao total da variavel resposta Y .
Assim, havendo cerca de 40% de varia cao nao explicada, pode armar-se que a
recta estimada se ajusta razoavelmente ao nosso conjunto de dados.
Exerccio 9.47 Coeciente de determina cao
Certique-se que o coeciente de determina cao do Exemplo 9.4 (resistencia do plastico) e
ligeiramente inferior a 96%, podendo concluir-se que a recta estimada se ajusta muito bem
aos dados, o que ja era bem visvel pelo gr aco que acompanhava este mesmo exemplo.
Nota 9.48 Analise emprica de resduos
Por forma a averiguar a adequa c ao do modelo de RLS e a razoabilidade das hipoteses de
trabalho deve elaborar-se um gr aco em cujas
abcissas devem constar os tted values ( y
i
=

0
+

1
x
i
)
e cujas
ordenadas correspondem aos resduos (e
i
= y
i
y
i
).
355
Caso as hip oteses de trabalho sobre os erros aleat orios (
i

i.i.d.
normal(0,
2
)) nao estejam
a ser violadas:
o gr aco acabado de descrever deve ter o aspecto de uma mancha de pontos dispersos
aleatoriamente numa faixa horizontal (Esquema...) e
o histograma dos resduos deve ter um aspecto simetrico e semelhante ` a f.d.p. da
v.a normal.
Exemplo 9.49 Analise emprica de resduos
De seguida obtem-se o graco de resduos (e
i
= y
i
y
i
) vs. tted values ( y
i
), para os
dados da resistencia do pl astico do Exemplo 9.4.
Este gr aco assemelha-se a uma mancha de pontos dispersos ao acaso numa faixa
horizontal, pelo que se pode concluir que a recta estimada se ajusta muito bem aos dados,
o que, ali as, se coaduna quer com o graco dos dados (ver Exemplo 9.4), quer com o valor
elevado do coeciente de determina cao (ver Exerccio 9.47).
Nota 9.50 Analise emprica de resduos
Dependendo do aspecto do gr aco de resduos (e
i
= y
i
y
i
) vs. tted values ( y
i
),
podemos ser levados a concluir que estamos a lidar com
um modelo de regressao linear com erros aleat orios independente com vari ancia
constante
ou ent ao com
356
um modelo de regress ao n ao linear
erros aleat orios com vari ancia nao constante
observa coes discordantes
falta de independencia. (Esquemas...)
357
Exemplo 9.51 Exame de 9 de Janeiro de 2007
Numa dada regi ao pretende determinar-se se existe uma rela cao entre as despesas basicas
anuais das famlias (Y ) e o seu rendimento anual (x).
A recolha de uma amostra de 10 famlias conduziu aos seguintes resultados, em
milhares de euros:
i 1 2 3 4 5 6 7 8 9 10
Rendimento (xi) 22 26 45 37 28 50 56 34 60 40
Despesas b asicas anuais (yi) 16 17 26 24 22 21 32 18 30 20
10
i=1
xi = 398

10
i=1
x
2
i
= 17330

10
i=1
yi = 226

10
i=1
y
2
i
= 5370

10
i=1
xiyi = 9522.
Admita a validade do modelo de regress ao linear simples Y
i
=
0
+
1
x
i
+
i
(i = 1, . . . , 10)
para este conjunto de dados e responda às seguintes quest oes:
(a) Estime a recta de regress ao.
Estimativas de
0
e
1
Tendo em conta que n = 10 e
n
i=1
x
i
= 398
x = 39.8
n
i=1
x
2
i
= 17330
n
i=1
x
2
i
n x
2
= 1489.6
n
i=1
y
i
= 226
y = 22.6
n
i=1
y
2
i
= 5370
n
i=1
y
2
i
n y
2
= 262.4
n
i=1
x
i
y
i
= 9522,
n
i=1
x
i
y
i
n x y = 527.2,
obtem-se
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
527.2
1489.6
= 0.35392
0
= y

1
x
= 22.6 0.35392 39.8
= 8.5196.
358
Recta de regressao
y =

E(Y |x) =

0
+

1
x = 8.5196 + 0.35392 x, para x [22, 60].
(b) Calcule o coeciente de determina cao e comente o valor que obteve.
Tirando partido dos c alculos auxiliares da alnea anterior tem-se:
r
2
=
(
n
i=1
x
i
y
i
n x y)
2
(
n
i=1
x
2
i
n x
2
) (
n
i=1
y
2
i
n y
2
)
=
527.2
2
1489.6 262.4
= 0.711.
71.1% da varia cao total nas despesas b asicas anuais das famlias (Y ) e explicada
pelo rendimento anual (x), pelo que a recta estimada se ajusta razoavelmente
ao conjunto de dados.
(c) Sera que a amostra de que disp oe permite concluir ao nvel de signic ancia de
5% que h a rela c ao linear positiva entre as despesas basicas anuais e o rendimento
anual?
Hipoteses
H
0
:
1
=
1,0
= 0 vs. H
1
:
1
> 0
Nvel de signicancia
0
= 5%
Estatstica de teste
T =
1,0
_

2
n
i=1
x
2
i
n x
2
H0
t
(n2)
0
Ao lidar com
um teste unilateral ` a direita (H
1
:
1
> 0),
quanto maior for o valor da estimativa de MV de
1
,

1
, mais raz oes temos
para rejeitar H
0
, pelo que a regiao de rejeic ao de H
0
de teste) e um intervalo à direita
W = (c, +),
359
onde
c = F
1
t(n2)
(1
0
) = F
1
t(102)
(1 0.05)
tabela
= 1.86.
Decisao
Ora,
1
= 0.35392

2
=
1
n2
_
(
n
i=1
y
2
i
n y
2
) (
1
)
2
(
n
i=1
x
2
i
n x
2
)
_
=
1
102
(262.4 0.35392
2
1489.6)
= 9.47671
n
i=1
x
2
i
n x
2
= 1489.6
logo o valor observado da estatstica de teste e igual a
t =
1,0
_

2
n
i=1
x
2
i
n x
2
=
0.35392 0
_
9.47671
1489.6
= 4.437
W = (1.86, +).
Conclui-se que devemos rejeitar a hip otese de as despesas b asicas anuais n ao
serem inuenciadas pelo rendimento anual a favor de uma rela c ao ser do tipo
linear positivo entre estas vari aveis, ao n.s. de 5% bem como a qualquer outro
n.s. maior que 5%.
Exemplo 9.52 Exame de 25 de Janeiro de 2007
Num processo de fabrico suspeita-se que o n umero de artigos defeituosos produzidos por
uma m aquina (Y ) dependa da velocidade a que essa mesma m aquina est a a operar (x).
Abaixo encontram-se 12 registos do n umero de defeituosos e da velocidade associada.
i 1 2 3 4 5 6 7 8 9 10 11 12
xi 200 400 300 400 200 300 300 400 200 400 200 300
yi 28 75 37 53 22 58 40 96 46 52 30 69
12
i=1
xi = 3600,

12
i=1
x
2
i
= 1160000,

12
i=1
yi = 606,

12
i=1
y
2
i
= 35732,

12
i=1
xiyi = 196800.
(a) Admitindo a validade do modelo de regressao linear simples (Y
i
=
0
+
1
x
i
+
i
, i =
1, . . . , 12), obtenha estimativas pontuais de
0
e do aumento esperado no n umero de
artigos defeituosos produzidos caso a velocidade duplique de 200 para 400 unidades.
360
Estimativa de
0
Como n = 12 e
n
i=1
x
i
= 3600
x = 300
n
i=1
x
2
i
= 1160000
n
i=1
x
2
i
n x
2
= 80000
n
i=1
y
i
= 606
y = 50.5
n
i=1
y
2
i
= 35732
n
i=1
y
2
i
n y
2
= 5129
n
i=1
x
i
y
i
= 196800,
n
i=1
x
i
y
i
n x y = 15000,
1
=
n
i=1
xiyin x y
n
i=1
x
2
i
n x
2
=
15000
80000
= 0.1875
conclui-se que
0
= y

1
x
= 50.5 0.1875 300
= 5.75.
Estimativa do aumento esperado quando...
O aumento esperado no n umero de artigos defeituosos produzidos caso a
velocidade duplique de 200 para 400 unidades e dado por
E(Y |x = 400) E(Y |x = 200) = (
0
+
1
400) (
0
+
1
200)
= 200
1
.
Assim sendo a estimativa deste aumento e igual a
200

1
= 200 0.1875
= 37.5 artigos defeituosos.
361
(b) Determine um intervalo de conan ca a 95% para o valor esperado do n umero de
artigos defeituosos produzidos quando a velocidade da m aquina e de 450 unidades.
Comente esta estimativa intervalar.
Estimativa de E(Y |x
0
)
Ao considerar-se que a velocidade da m aquina e de 450 unidades, estima-se que
o valor esperado do n umero de artigos defeituosos produzidos seja igual a
E(Y |x
0
) =

0
+

1
x
0
= 5.75 + 0.1875 450
= 78.625 artigos defeituosos.
IC a 95% para E(Y |x
0
)
Passo 1 Seleccao da v.a. fulcral para E(Y |x
0
) =
0
+
1
x
0
Z =
(
0
+

1
x
0
) (
0
+
1
x
0
)
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
_
t
(n2)
Tendo em conta que (1 ) 100% = 95% temos = 0.05 e usaremos com
os quantis simetricos:
F
1
t(n2)
(1 /2) = F
1
t(122)
(1 0.05/2)
tabela
= 2.228.
Z b
Omitimos este passo...

Como a expressao geral do IC a (1 ) 100% para
0
+
1
x
0
IC
(1)100%
(
0
+
1
x
0
)
=
_
(
0
+

1
x
0
) F
1
t(n2)
(1 /2)
_
1
n
+
(x0 x)
2
n
i=1
x
2
i
n x
2
_
_
e
n = 10
x
0
= 450
0
+

1
x
0
= 78.625
F
1
t(n2)
(1 /2) = 2.228

2
=
1
n2
_
(
n
i=1
y
2
i
n y
2
) (
1
)
2
(
n
i=1
x
2
i
n x
2
)
_
=
1
122
(5129 0.1875
2
80000)
= 231.65
362
x = 300
tem-se
=
_
78.625 2.228
_
231.65
_
1
12
+
(450300)
2
80000
_
_
= [78.625 2.228 9.18998]
= [58.1497, 99.1003].
Comentario Como
x
0
= 450 [x
(1)
, x
(n)
] = [ min
i=1,...,n
x
i
, max
i=1,...,n
x
i
] = [200, 400],
i.e., x
0
= 450 n ao pertence ` a gama de valores da vari avel explicativa, estamos
a cometer um erro de extrapolac ao, pelo que as estimativas pontual e
intervalar de E(Y |x
0
= 450) devem ser usadas com muita cautela.
(c) Calcule o coeciente de determina cao e comente o valor obtido.
Tirando mais uma vez partido dos c alculos auxiliares da alnea (a) obtem-se:
r
2
=
(
n
i=1
x
i
y
i
n x y)
2
(
n
i=1
x
2
i
n x
2
) (
n
i=1
y
2
i
n y
2
)
=
15000
2
80000 5129
0.548.
Apenas 54.8% da varia c ao total no n umero de artigos defeituosos (Y ) e explicada
pela velocidade a que a m aquina esta a operar (x), pelo que a recta estimada se
ajusta de forma nada razo avel ao conjunto de dados.
Mais uma raz ao para ter cautela com as estimativas pontual e intervalar obtidas
na alnea (b).
363
Exemplo 9.53 (Exerccio 9.1, colectanea de exerccios) Regressao linear simples;
estima cao pontual de MQ; recta de regressao; coeciente de determina cao;
teste à signicancia da regressao; intervalo de conan ca para o valor esperado
da resposta; erro de extrapola cao
Interessa estudar a rela c ao entre a resistencia de um determinado tipo de plastico (Y ) e
o tempo que decorre a partir da conclusao do processo de moldagem ate ao momento de
medic ao da resistencia (x) (em horas). As observa coes que se seguem foram efectuadas
em 12 pecas construdas com este plastico, escolhidas aleatoriamente.
i 1 2 3 4 5 6 7 8 9 10 11 12
Tempo (xi) 16 24 32 40 48 48 48 48 56 64 72 80
Resistencia (yi) 199 214 230 248 255 262 279 267 305 298 323 359
i
xi = 576,

i
x
2
i
= 31488,

i
yi = 3239,

i
y
2
i
= 897639,

i
xiyi = 164752.
(a) Represente gracamente as observa c oes e desenhe a recta que, no seu entender, melhor
se a justa ` as observa coes.
Representa cao graca dos dados
30 40 50 60 70 80
250
300
350
Apesar de nenhuma curva simples passar exactamente por todos os pontos, ha
forte indicacao no sentido de os pontos do gr aco se dispersarem aleatoriamente
em torno de uma recta.
364
(b) Considere um modelo de regressao linear simples para explicar as observa c oes.
Obtenha a estimativa dos mnimos quadrados dos coecientes da recta de regress ao
e desenhe-a no gr aco.
Modelo de RLS
Y
i
=
0
+
1
x
i
+
i
Y
i
= resistencia do pl astico da peca i
0
= ordenada na origem (constante desconhecida)
1
= declive (constante desconhecida)
x
i
= tempo decorrido entre a conclus ao da moldagem e a medi cao da resistencia da
peca i
i
= erro aleat orio associado à medic ao da resistencia da peca i
Hipoteses de trabalho
i
s ao v.a.
n ao correlacionadas
12
tais que
E(
i
) = 0
V (
i
) =
2
(constante desconhecida).
Estimativas de
0
e
1
Uma vez que n = 12 e

n
i=1
x
i
= 576
x = 48
n
i=1
x
2
i
= 31488
n
i=1
x
2
i
n x
2
= 3840

n
i=1
y
i
= 3239
y = 269.9166667
n
i=1
y
2
i
= 897639
n
i=1
y
2
i
n y
2
= 23378.91667

n
i=1
x
i
y
i
= 164752
n
i=1
x
i
y
i
n x y = 9280,
12
I.e., corr(i, j) = 0, i = j.
365
tem-se
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n x
2
=
164752 12 48 269.9166667
31488 12 48
2
=
9280
3840
= 2.416666667
0
= y

1
x
= 269.9166667 2.416666667 48
= 153.9166667
Recta de regressao
A estimativa do valor esperado da resistencia de uma peca de pl astico que seja
testada x horas apos a sua moldagem e igual a
y =

E(Y |x)
=

0
+

1
x
= 153.9166667 + 2.416666667 x.
Representa cao graca dos dados e da recta de regressao
20 40 60 80 100
200
250
300
350
400
Muito bom ajuste!
366
(c) Calcule o coeciente de determina cao e comente o valor obtido.
Tirando partido dos valores obtidos anteriormente, tem-se
r
2
=
(
n
i=1
x
i
y
i
n x y)
2
(
n
i=1
x
2
i
n x
2
) (
n
i=1
y
2
i
n y
2
)
=
(9280)
2
3840 23378.91667
= 0.959269.
Logo pode armar-se cerca de 95.93% da varia cao total dos dados referentes ` a
vari avel resposta Y e explicada pelo modelo de regressao, o que indicia um muito
bom ajustamento da recta estimada ao nosso conjunto de dados, tal como j a se
tinha constatado na alnea anterior.
(d) Proceda ao teste da hip otese O coeciente angular e nulo, indicando e comentando
o valor-p do teste. Qual o interesse desta hipotese? Relacione-o com o resultado
obtido em (c).
Hipotese de trabalho
i

i.i.d.
Normal(0,
2
), i = 1, . . . , n (hip otese de trabalho)
0
= ordenada na origem de E(Y
i
|x
i
) =
0
+
1
x
i
(desconhecido)
1
= declive de E(Y
i
|x
i
) =
0
+
1
x
i
(desconhecido)
2
(desconhecido)
Hipoteses
H
0
:
1
=
1,0
= 0 vs. H
1
:
1
=
1,0
Estatstica de teste
T =
1,0
_

2
n
i=1
x
2
i
n x
2
H0
t
(n2)
0
Estamos a lidar com um teste bilateral (H
1
:
1
=
1,0
), pelo que a regiao de
rejeic ao de H
0
e do tipo W = (, c) (c, +).
367
Decisao (com base em intervalo para o p-value)
Atendendo a que a estimativa de
2
e igual a

2
=
1
n 2
__
n
i=1
y
2
i
n y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
=
1
12 2
_
23378.91667 2.416666667
2
3840
_
= 95.225
e tendo em conta que
1
= 2.416666667
n
i=1
x
2
i
n x
2
= 3840,
t =
1,0
_

2
n
i=1
x
2
i
n x
2
=
2.416666667 0
_
95.225
3840
15.346413.
Uma vez que este teste e bilateral
13
temos:
p value = P(|T| > |t| | H
0
)
= 2 P(T > |t| | H
0
)
= 2 P(T > 15.346413 | H
0
)
= 2
_
1 F
t(10)
(15.346413)
_
.
Recorrendo ` as tabelas de quantis da distribuic ao de t-student podemos adiantar
um intervalo para o p-value deste teste. Com efeito, ao enquadrarmos
convenientemente |t| = 15.346413, obtemos sucessivamente
F
1
t(10)
(0.9995) = 4.587 < 15.346413
1 F
t(10)
(15.35) < 1 0.9995
2
_
1 F
t(10)
(15.35)
_
< 2 (1 0.9995)
p value < 0.001.
Consequentemente, devemos rejeitar H
0
a qualquer n.s.
0
0.1%, por exemplo,
a qualquer dos nveis usuais de signicancia (1%, 5%, 10%), resultado este que se
13
E a f.d.p. da estatstica de teste e, sob H0, simetrica em relacao à origem.
368
coaduna com o muito bom ajustamento do modelo ao conjunto de dados, como
tivemos ocasiao de referir na alnea (c).
Decisao (com base no valor do p-value)
Ao recorrer à m aquina de calcular obteramos p value 2.8 10
8
, logo
deveramos rejeitar H
0
a qualquer n.s.
0
> 2.810
6
, nomeadamente a qualquer
dos nveis usuais de signic ancia (1%, 5%, 10%), resultado este, que como se
referiu acima, se coaduna com o muito bom ajustamento do modelo ao conjunto
de dados.
Interesse da hip otese nula
Rejeitar H
0
:
1
=
1,0
= 0 e sin onimo de rejeitar a hip otese de inexistencia de
rela c ao linear entre a resistencia da peca (Y ) e o tempo (x) que decorre entre
a conclus ao da moldagem e a medi cao da resistencia da pe ca, i.e., signica n ao
rejeitar a hip otese de existencia de rela cao linear entre Y e x.
(e) Calcule o intervalo de conan ca a 95% para o valor esperado da resistencia obtida 48
horas depois de concluda a moldagem. Acha legtimo usar o mesmo procedimento
tratando-se de um perodo de 10 horas em vez de 48 horas? Justique a sua resposta.
E(Y |x
0
) =
0
+
1
x
0
, valor esperado da resistencia obtida x
0
horas depois de
concluda a moldagem.
0
) =
0
+
1
x
0
Z =
(
0
+

1
x
0
) (
0
+
1
x
0
)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_
t
(n2)
J a que (1 ) 100% = 95% temos = 0.05 e lidaremos com dois quantis
simetricos a
= b
iguais a:
F
1
t(n2)
(1 /2) = F
1
t(122)
(1 0.05/2)
tabela
= 2.228.
369
Z b
P(a
Z b
) = 1
. . .
P
_
(
0
+

1
x
0
) F
1
t(n2)
(1 /2)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_

0
+
1
x
0
(
0
+

1
x
0
) +F
1
t(n2)
(1 /2)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_
_
= 1
A expressao geral do intervalo e
IC
(1)100%
(
0
+
1
x
0
)
=
_
(
0
+

1
x
0
) F
1
t(n2)
(1 /2)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_
_
,
e a sua concretiza c ao para (1 ) 100% = 95% e x
0
= 48 igual a
IC
95%
(
0
+
1
48)
(a)
= [(153.9166667 + 2.416666667 48)
2.228
_
95.225
_
1
12
+
(48 48)
2
3840
_
_
_
= [269.9166667 2.228
7.935416]
= [263.640419, 276.192914].
Comentario
x
0
= 10 nao pertence ` a gama de valores da variavel explicativa, [x
(1)
, x
(12)
] =
[16, 80], pelo que nao seria legtimo recorrer ao mesmo procedimento para obter
uma estimativa intervalar de E(Y |x
0
= 10) estaramos a cometer um erro
de extrapolac ao...
370
Exemplo 9.54 (Exerccio 9.2, colectanea de exerccios) Regressao linear simples;
estimativa pontual (e intervalar) de valor esperado da resposta; coeciente de
determina cao; teste à signicancia da regressao
Um estudo sobre a inuencia da velocidade do vento (x), em m/s, na quantidade de agua
(Y ) que se evapora por dia, em centenas de litros, na albufeira de certa barragem, a
temperaturas constantes, conduziu a:
xi 20 50 30 100 70
yi 3 5 3 10 8
(a) Adoptando um modelo de regressao linear simples, estime a recta de regressao de Y
sobre x e obtenha uma estimativa da quantidade media de agua evaporada quando
a velocidade do vento e igual a 90m/s. Fa ca uso dos seguintes valores:

i
x
i
= 270,
i
x
2
i
= 18700,

i
y
i
= 29,

i
y
2
i
= 207,

i
x
i
y
i
= 1960.
Modelo de RLS
Y
i
=
0
+
1
x
i
+
i
Y
i
= quantidade de agua que se evapora no dia i
x
i
= velocidade do vento no dia i
i
= erro aleat orio associado ` a medi cao da quantidade de agua que se evapora
no dia i
Hipoteses de trabalho
i

i.i.d.
Normal(0,
2
), i = 1, . . . , n (hip otese de trabalho)
0
= ordenada na origem de E(Y
i
|x
i
) =
0
+
1
x
i
(desconhecido)
1
= declive de E(Y
i
|x
i
) =
0
+
1
x
i
(desconhecido)
2
(desconhecido)
Estimativas de MV de
0
e
1
Atendendo a que
n = 5
n
i=1
x
i
= 270
x =
270
5
= 54
n
i=1
x
2
i
= 18700
n
i=1
x
2
i
n( x)
2
= 18700 5 54
2
= 4120
371
n
i=1
y
i
= 29
y =
29
5
= 5.8
n
i=1
y
2
i
= 207
n
i=1
y
2
i
n( y)
2
= 207 5 5.8
2
= 38.8
n
i=1
x
i
y
i
= 1960
n
i=1
x
i
y
i
n x y = 1960 5 54 5.8 = 394,
as estimativas de MV para este modelo s ao iguais a:
1
=
n
i=1
x
i
y
i
n x y
n
i=1
x
2
i
n( x)
2
=
394
4120
= 0.095631
0
= y

1
x
= 5.8 0.095631 54
= 0.635922
Recta de regressao
Para x [x
(1)
, x
(n)
] = [20, 100], tem-se
E(Y |x) =

0
+

1
x = 0.635922 + 0.095631 x;
logo a estimativa do valor esperado da quantidade de agua evaporada quando a
velocidade do vento e igual a x = 90m/s e dada por
E(Y |x = 90) =

0
+

1
90 = 0.635922 + 0.095631 90 = 9.242712.
(b) Calcule o coeciente de determina cao do modelo estimado.
Tirando partido dos valores obtidos anteriormente, tem-se
r
2
=
(
n
i=1
x
i
y
i
n x y)
2
(
n
i=1
x
2
i
n x
2
) (
n
i=1
y
2
i
n y
2
)
=
(394)
2
4120 38.8
= 0.971099,
372
i.e., cerca de 97.11% da varia c ao total dos dados referentes à vari avel resposta
Y e explicada pelo modelo de regressao, o que indicia um excelente ajustamento
da recta estimada ao nosso conjunto de dados.
(c) Teste a signic ancia da regress ao. Indique o valor-p desse teste e comente o resultado
face ao valor obtido na alnea anterior. (Exame 5 Fev 2002)
Hipoteses
H
0
:
1
=
1,0
= 0 (i.e. nao existe associacao linear entre Y e x) vs. H
1
:
1
=
1,0
Estatstica de teste
T =
1,0
_

2
n
i=1
x
2
i
n x
2
H0
t
(n2)
0
Estamos a lidar com um teste bilateral (H
1
:
1
=
1,0
), pelo que a regiao de
rejeic ao de H
0
e do tipo W = (, c) (c, +).
Decisao (com base em intervalo para o p-value)
Atendendo a que a estimativa de
2
e igual a

2
=
1
n 2
__
n
i=1
y
2
i
n y
2
_
(
1
)
2
_
n
i=1
x
2
i
n x
2
__
=
1
5 2
_
38.8 0.095631
2
4120
_
= 0.373804
e tendo em conta que
1
= 0.095631
n
i=1
x
2
i
n x
2
= 4120,
t =
1,0
_

2
n
i=1
x
2
i
n x
2
=
0.095631 0
_
0.373804
4120
= 10.039806.
373
Uma vez que este teste e bilateral
14
temos:
p value = P(|T| > |t| | H
0
)
= 2 P(T > |t| | H
0
)
= 2 P(T > 10.039806 | H
0
)
= 2
_
1 F
t(3)
(10.039806)
_
.
Recorrendo ` as tabelas de quantis da distribuic ao de t-student podemos adiantar
um intervalo para o p-value deste teste. Com efeito, ao enquadrarmos
convenientemente |t| = 10.039806, obtemos sucessivamente
F
1
t(8)
(0.995) = 5.841 < 10.039806 < 10.21 = F
1
t(3)
(0.999)
0.002 = 2 (1 0.999) < p value < 2 (1 0.995) = 0.010.
Consequentemente
0
a qualquer n.s.
0
0.2%;
devemos rejeitar H
0
a qualquer n.s.
0
1.0%, por exemplo, a qualquer dos
nveis usuais de signicancia (1%, 5%, 10%), resultado este que se coaduna
com o excelente ajustamento do modela ao conjunto de dados, como tivemos
ocasiao de referir na alnea anterior.
Obs. Recorrendo àm aquina de calcular obtemos p value = 0.002103. Deste
modo: nao devemos rejeitar H
0
a qualquer n.s.
0
0.2%; devemos rejeitar
H
0
a qualquer n.s.
0
> 0.2%, nomeadamente a qualquer dos nveis usuais de
signic ancia (1%, 5%, 10%).
(a)
Obtenha um intervalo de conan ca a 95% para o valor esperado da quantidade de

agua evaporada quando a velocidade do vento e igual a x = 90m/s.
E(Y |x
0
) =
0
+
1
x
0
, valor esperado da quantidade de agua evaporada quando
a velocidade do vento e igual a x
0
= 90m/s.
0
) =
0
+
1
x
0
Z =
(
0
+

1
x
0
) (
0
+
1
x
0
)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_
t
(n2)
14
E a f.d.p. da estatstica de teste e, sob H0, simetrica em relacao à origem.
374
J a que (1 ) 100% = 95% temos = 0.05 e lidaremos com dois quantis
simetricos a
= b
iguais a:
F
1
t(n2)
(1 /2) = F
1
t(52)
(1 0.05/2)
tabela
= 3.182.
Z b
P(a
Z b
) = 1
. . .
P
_
(
0
+

1
x
0
) F
1
t(n2)
(1 /2)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_

0
+
1
x
0
(
0
+

1
x
0
) +F
1
t(n2)
(1 /2)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_
_
= 1
A expressao geral do intervalo e
IC
(1)100%
(
0
+
1
x
0
)
=
_
(
0
+

1
x
0
) F
1
t(n2)
(1 /2)
_
1
n
+
( xx0)
2
n
i=1
x
2
i
n x
2
_
_
,
e a sua concretiza c ao para (1 ) 100% = 95% e x
0
= 90 igual a
IC
95%
(
0
+
1
90)
(a)
=
_
_
9.242712 3.182
_
0.373804
_
1
5
+
(54 90)
2
4120
_
_
_
= [9.242712 3.182
0.192346]
= [7.847173, 10.638249].
375
Referencias
Casella, G. e Berger, R.L. (2002). Statistical inference. Duxbury Thomson Learning.
Montgomery, D.C. e Runger, G.C. (2003). Applied Statistics and Probability for
Engineers. John Wiley & Sons, New York. 3a. Edicao.
Murteira, B.J.F. (1990). Probabilidades e à Estatstica, Vols. I e II (2a. Edi cao).
McGraw-Hill, Lisboa.
Paulino, C.D. (1994). Notas de An alise Preliminar de Dados Univariados. Reprograa
do IST, Lisboa.
Pestana, D.D. e Velosa, S.F. (2002). Introdu cao à Probabilidade e à Estatstica.
Funda c ao Calouste Gulbenkian, Lisboa.
Rohatgi, V.K. e Saleh, A.K.Md.E. (2001). An Introduction to Probability and Statistics.
John Wiley & Sons, Inc.
376
Formulario
P(X = x) =
_
n
x
_
p
x
(1 p)
nx
P(X = x) =
e
x
x!
P(X = x) = p(1 p)
x1
x = 0, 1, . . . , n x = 0, 1, . . . x = 1, 2, . . .
E(X) = np V ar(X) = np(1 p) E(X) = V ar(X) = E(X) =
1
p
V ar(X) =
(1 p)
p
2
P(X = x) =
_
M
x
__
N M
n x
___
N
n
_
fX(x) =
1
b a
, a x b
x = max {0, n N +M} , . . . , min {n, M} E(X) =
b +a
2
V ar(X) =
(b a)
2
12
E(X) = n
M
N
V ar(X) = n
M
N
N M
N
N n
N 1
fX(x) =
1
2
2
exp
_
(x )
2
2
2
_
, x IR fX(x) = e
x
, x 0
E(X) = V ar(X) =
2
E(X) =
1
V ar(X) =
1
X
/
n
N(0, 1)
X
S/
n
t(n1)
(n 1)S
2
2

2
(n1)
_

X1

X2
_
(1 2)
_
2
1
n1
+

2
2
n2
N(0, 1)
S
2
=
n
i=1
_
Xi

X
_
2
n 1
_

X1

X2
_
(1 2)
_
S
2
1
n1
+
S
2
2
n2
a
N(0, 1)
_

X1

X2
_
(1 2)
_
(n11)S
2
1
+(n21)S
2
2
n1+n22
_
1
n1
+
1
n2
_
t(n1+n22)
k
i=1
(Oi Ei)
2
Ei
a
H0
2
(km1)
r
i=1
s
j=1
(Oij Eij)
2
Eij
a
H0
2
(r1)(s1)
Yi = 0 +1xi +i

0 =

Y

1 x

1 =
n
i=1
xiYi n x
Y
n
i=1
x
2
i
n x
2

2
=
1
n 2
n
i=1
_
Yi

Yi
_
2
,

Yi =

0 +

1xi
2
=
1
n 2
__
n
i=1
Y
2
i
n
Y
2
_
1
_
2
_
n
i=1
x
2
i
n x
2
__
0 0
_
1
n
+
x
2
x
2
i
n x
2
_

2
t(n2)
1 1
_

2
x
2
i
n x
2
t(n2)
_
0 +

1x0
_
(0 +1x0)
_
1
n
+
( xx0)
2
x
2
i
n x
2
_

2
t(n2)
R
2
=
_
n
i=1
xiYi n x
Y
_
2
_
n
i=1
x
2
i
n x
2
_
_
n
i=1
Y
2
i
n
Y
2
_

2011 09 08 NotasApoioPE EdRevistaSetembro2011 SeccaoFolhas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2011 09 08 NotasApoioPE EdRevistaSetembro2011 SeccaoFolhas

Enviado por

Direitos autorais:

Formatos disponíveis

Notas de apoio da disciplina de

Denicao 2.4 Espaco de resultados

Denicao 2.7 Evento (acontecimento)

Nota 2.14 Limita c oes da probabilidade classica de Laplace

Antes de passarmos a uma outra no c ao de probabilidade e conveniente adiantarmos a

Exemplo 2.19 Probabilidade frequencista

Nota 2.20 Limita c oes da probabilidade frequencista

Nota 2.29 Um evento pode ainda ser classicado de:

Proposicao 2.32 Reuniao de tres eventos

Exerccio 2.33 Demonstre a regra de adi c ao (2.11).

Nota 2.40 Probabilidade condicionada

A no cao de parti cao do espaco de resultados enunciada ja a seguir e necessaria para

= {{0, 2, 4, 6, . . .}, {1, 3, 5, . . .}}, parti c ao constituda pelos eventos registo de

Nota 2.49 Lei da probabilidade total

Exemplo 2.56 Lei da probabilidade total e teorema de Bayes

Exemplo 3.5 Variavel aleat oria discreta

Nota 3.12 Fun cao de distribuicao

Nota 3.19 Valor esperado de v.a. discreta

Exerccio 3.21 Demonstre a Proposi cao 3.20.

Nota 3.28 Mediana de v.a. discreta

Exemplo 3.29 Mediana de v.a. discreta

e o menor inteiro c que verica P(reencaminhamento navios) 0.05, i.e.,

passa pela determina c ao de F

poderia fazer-se por recurso `as tabelas da f.d. daquilo que

Exerccio 3.51 Prove que E(X) = p e V (X) = p (1 p) quando X

A v.a. X binomial(n, p) esta tambem associada `a contagem do n umero de elementos

Exemplo 3.57 Distribuicao binomial

Exerccio 3.58 Represente gracamente a f.d. da v.a. X binomial(4, 0.1),

Nota 3.73 F.d. da v.a. de Poisson

Exemplo 3.75 Distribuicao de Poisson

Exemplo 4.9 F.d. de v.a. contnua

E possvel obter a f.d.p. derivando a f.d.:

Nota 4.15 Valor esperado de v.a. contnua

Exemplo 4.17 Valor esperado de v.a. contnua

Nota 4.19 Moda de v.a. contnua

Denicao 4.20 Mediana de v.a. contnua

Exemplo 4.22 Moda, mediana e terceiro quartil de v.a. contnua

Denicao 4.26 Coeciente de varia cao

Exerccio 4.30 Distribuicao uniforme contnua

Nota 4.37 F.d.p. da v.a. normal

diz-se com distribui cao normal

normal(0, 1). (4.20)

normal(0, 1) encontra-se tabelada e, como vimos, e usualmente

E frequente pretender-se resposta a questoes como esta:

Vari ancia V (X) =

Exerccio 4.53 F.d. da v.a. exponencial

Exerccio 4.59 Prove que a v.a. X exponencial() possui outra propriedade

Exemplo 4.61 Teste B de 10 de Novembro de 2007

E usual representar um par aleat orio ou v.a. bidimensional por (X, Y ).

Motiva cao 5.7 Funcao de probabilidade conjunta

Depois de um exemplo intencionalmente trivial considere-se um par aleat orio um pouco

Motiva cao 5.18 F.p. condicionais

Exemplo 5.22 F.p. e f.d. condicionais (caso discreto)

Denicao 5.23 Valores esperados condicionais (caso discreto)

Exemplo 5.25 Valor esperado condicional (e nao so)

Denicao 5.34 F.d. conjunta (caso contnuo)

Exemplo/Exerccio 5.40 F.d.p. marginais de X e de Y

Proposicao 5.47 Propriedades da covariancia

E frequente estarmos interessados em estudar o comportamento probabilstico de

Exemplo 5.61 Combina c oes lineares de v.a. (e nao so)

Exemplo 5.67 A carga m axima de um elevador e de 350Kg. Admita que a massa

Nota 5.70 Desigualdade de Chebychev

Nota 5.75 Teorema do Limite Central