Você está na página 1de 165

MINISTRIO DA CINCIA E TECNOLOGIA

INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS


ESTATSTICA - CURSO 1
Dra. Corina da Costa Freitas
MSc. Camilo Daleles Renn
MSc. Manoel Arajo Sousa Jnior
Material de referncia para o curso 1 de estatstica.
INPE
So Jos dos Campos
Maro de 2003
SUMRIO
Pg.
LISTA DE FIGURAS
LISTA DE TABELAS
CAPTULO 1 INTRODUO . . . . . . . . . . . . . . . . . . . . . 11
1.1 O que Estatstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Conceitos de Populao e Amostra . . . . . . . . . . . . . . . . . . . . 12
1.3 Tipos de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Distribuies de Freqncia . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1 Freqncias e freqncias relativas . . . . . . . . . . . . . . . . . . . 14
1.5 Distribuio de freqncias e sua representao grca para variveis
quantitativas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6 Distribuio de freqncias e sua representao grca para variveis
quantitativas contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6.1 Curvas de Freqncia . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.7 Medidas de Tendncia Central . . . . . . . . . . . . . . . . . . . . . . . 20
1.7.1 Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.8 Medidas de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.8.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.8.2 Desvio Mdio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.8.3 Coeciente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.8.4 Varincia (
2
) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.8.5 Desvio Padro () . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.9 Momentos, Assimetria e Curtose . . . . . . . . . . . . . . . . . . . . . 24
1.9.1 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.9.2 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.9.3 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
CAPTULO 2 PROBABILIDADE . . . . . . . . . . . . . . . . . . 27
2.1 Denio de Probabilidade utilizando Freqncia Relativa . . . . . . . 27
2.2 Experimentos aleatrios . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 Espao Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5 Classe dos Eventos Aleatrios . . . . . . . . . . . . . . . . . . . . . . . 30
2.6 Denio Clssica de Probabilidade . . . . . . . . . . . . . . . . . . . . 30
2.7 Operaes com Eventos Aleatrios - Teoria dos Conjuntos . . . . . . . 32
2.7.1 Unio de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7.2 Interseco de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7.3 Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.7.4 Eventos Mutuamente Exclusivos ou Disjuntos . . . . . . . . . . . . . 34
2.8 Denio Axiomtica de Probabilidade . . . . . . . . . . . . . . . . . . 35
2.9 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.10 Anlise Combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.10.1 Permutao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.10.2 Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.11 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.12 Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.13 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.13.1 Teoria de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
CAPTULO 3 VARIVEIS ALEATRIAS E DISTRIBUIES 47
3.1 Varivel Aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Tipos de Variveis Aleatrias, Funo de Probabilidade e Funo
Densidade de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Funo de Distribuio Acumulada . . . . . . . . . . . . . . . . . . . . 50
3.4 Distribuies Bivariadas . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4.1 Distribuies Conjuntas Discretas . . . . . . . . . . . . . . . . . . . . 52
3.4.2 Distribuies Conjuntas Contnuas . . . . . . . . . . . . . . . . . . . 54
3.5 Distribuies Marginais . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.6 Esperana de Uma Varivel Aleatria . . . . . . . . . . . . . . . . . . . 58
3.6.1 Distribuies Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.6.2 Distribuies Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6.3 Propriedades da Esperana . . . . . . . . . . . . . . . . . . . . . . . 59
3.7 Varincia de uma Varivel Aleatria . . . . . . . . . . . . . . . . . . . 61
3.7.1 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . . 61
3.7.2 Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . . 62
3.7.3 Propriedades da Varincia . . . . . . . . . . . . . . . . . . . . . . . . 62
3.8 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.8.1 Momentos Centrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.8.2 Funo Geratriz de Momentos . . . . . . . . . . . . . . . . . . . . . . 64
3.8.3 Propriedades das Funes Geradoras de Momentos . . . . . . . . . . 65
3.9 Funes de uma Varivel Aleatria . . . . . . . . . . . . . . . . . . . . 66
3.9.1 Varivel com Distribuio Discreta . . . . . . . . . . . . . . . . . . . 66
3.9.2 Varivel com Distribuio Contnua . . . . . . . . . . . . . . . . . . . 67
3.10 Algumas Distribuies Discretas . . . . . . . . . . . . . . . . . . . . . . 69
3.10.1 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.10.2 Distribuio Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . 74
3.10.3 Distribuio Binomial Negativa . . . . . . . . . . . . . . . . . . . . . 75
3.10.4 Distribuio Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.10.5 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.11 Algumas Distribuies Contnuas Importantes . . . . . . . . . . . . . . 81
3.11.1 Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.11.2 Distribuio Normal Padro . . . . . . . . . . . . . . . . . . . . . . . 82
3.11.3 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . 87
3.11.4 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.11.5 Distribuio Exponencial . . . . . . . . . . . . . . . . . . . . . . . . 92
3.11.6 Distribuio Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.11.7 Distribuio Normal Bivariada . . . . . . . . . . . . . . . . . . . . . 94
3.11.8 Distribuio Normal Multivariada . . . . . . . . . . . . . . . . . . . . 95
CAPTULO 4 INFERNCIA ESTATSTICA . . . . . . . . . . . . 97
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.1 Parmetros de uma distribuio . . . . . . . . . . . . . . . . . . . . . 97
4.1.2 Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.3 Estimao Pontual e por Intervalo . . . . . . . . . . . . . . . . . . . 97
4.2 Estimao Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.2.1 Mtodo dos Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.2.2 Mtodo da Mxima Verossimilhana . . . . . . . . . . . . . . . . . . 99
4.3 Estimadores No Tendenciosos . . . . . . . . . . . . . . . . . . . . . . 101
4.4 A Distribuio
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.5 A Distribuio t-student . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.5.1 Distribuio da Mdia Amostral . . . . . . . . . . . . . . . . . . . . . 105
4.5.2 Distribuio da diferena de mdias amostrais . . . . . . . . . . . . . 106
4.6 Distribuio F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.6.1 Distribuio da Razo entre duas Varincias Amostrais . . . . . . . . 107
4.7 Estimao por Intervalos - Intervalos de Conana . . . . . . . . . . . 108
4.7.1 Intervalo de Conana para a Mdia Populacional . . . . . . . . . 108
4.7.2 Intervalo de Conana para a Varincia Populacional
2
. . . . . . . 111
4.7.3 Intervalo de Conana para a diferena de mdias de duas Populaes 112
4.7.4 Intervalo de Conana para Razo das Varincias
2
1
/
2
2
. . . . . . . 114
4.7.5 Intervalo de Conana para uma Proporo . . . . . . . . . . . . . . 114
4.7.6 Intervalo de Conana para Diferena de Propores . . . . . . . . . 115
CAPTULO 5 TESTES DE HIPTESES . . . . . . . . . . . . . . 117
5.1 Hiptese Nula e Hiptese Alternativa . . . . . . . . . . . . . . . . . . . 117
5.2 Regio Crtica do Teste . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.3 Erros do Tipo I e Erros do tipo II . . . . . . . . . . . . . . . . . . . . . 118
5.4 Teste da hiptese de que a mdia populacional tem um valor especco 118
5.4.1 conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.4.2 desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.5 Controlando o erro tipo II () . . . . . . . . . . . . . . . . . . . . . . . 122
5.6 Teste da hiptese de que a varincia populacional tem um valor especco 123
5.7 Teste da razo de varincias . . . . . . . . . . . . . . . . . . . . . . . . 125
5.8 Teste da hiptese da igualdade de duas mdias . . . . . . . . . . . . . . 127
5.8.1
2
1
e
2
2
conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
5.8.2
2
1
e
2
2
desconhecidas, mas
2
1
=
2
2
. . . . . . . . . . . . . . . . . . . 127
5.8.3
2
1
e
2
2
desconhecidas, mas
2
1
=
2
2
. . . . . . . . . . . . . . . . . . . 128
5.9 Teste para proporo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.9.1 Diferena entre propores . . . . . . . . . . . . . . . . . . . . . . . . 133
5.10 Teste
2
da independncia . . . . . . . . . . . . . . . . . . . . . . . . . 134
CAPTULO 6 ANLISE DE VARINCIA . . . . . . . . . . . . . . 139
6.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.2 Anlise de Varincia de Um Fator . . . . . . . . . . . . . . . . . . . . . 140
6.3 Teste para Igualdade de Vrias Varincias . . . . . . . . . . . . . . . . 150
6.4 Anlise de Varincia de Dois Fatores . . . . . . . . . . . . . . . . . . . 152
6.5 Anlise de Varincia de Dois Fatores - Vrias observaes por cela . . . 157
6.5.1 Identidade da Soma de Quadrados . . . . . . . . . . . . . . . . . . . 161
LISTA DE FIGURAS
Pg.
1.1 Figura tirada de : Costa Neto, P. L. de O. - Estatstica, Ed. Edgard
Blcher Ltda - 1977 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Histograma de freqncia . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3 Histograma de freqncias relativas . . . . . . . . . . . . . . . . . . . . 17
1.4 Histograma de freqncias relativas acumuladas . . . . . . . . . . . . . 18
1.5 Histograma e Poligono de freqncia . . . . . . . . . . . . . . . . . . . 19
1.6 Histograma freqncia acumulada . . . . . . . . . . . . . . . . . . . . . 20
1.7 Histograma freqncia acumulada . . . . . . . . . . . . . . . . . . . . . 21
1.8 Exemplos de curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1 Unio dos conjuntos A e B . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2 Interseco dos conjuntos A e B . . . . . . . . . . . . . . . . . . . . . . 33
2.3 Complemento do conjunto A . . . . . . . . . . . . . . . . . . . . . . . . 34
2.4 A probabilidade a priori nas f.d.p. das classes . . . . . . . . . . . . . . 45
3.1 Grco de P(x) para dois dados . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Grco de fdp de f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3 Grco F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4 Meyer, pgina 75. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.5 Degroot, pgina 93. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.6 Degroot, pgina 95. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7 Grco de f(x) de uma funo uniforme . . . . . . . . . . . . . . . . . 90
3.8 Probabilidade de uma varivel aleatria uniforme . . . . . . . . . . . . 90
6.1 Distribuies normais com mesma varincia (
2
) para todas as populaes 142
6.2 Distribuies normais com mesma mdia () para todas as populaes 142
6.3 Efeitos de fertilizantes e variedades de trigo, sem interao . . . . . . . 157
6.4 Efeitos de fertilizantes e variedades de trigo, sem interao . . . . . . . 158
LISTA DE TABELAS
Pg.
1.1 Nmero de lhos dos 50 funcionrios da empresa Fictcia S.A. . . . . . 15
1.2 Freqncias, freqncias relativas e freqncias relativas acumuladas . . 17
1.3 Altura (cm) dos 50 funcionrios da empresa Fictcia S.A. . . . . . . . . 18
1.4 Altura (cm) dos funcionrios da Fictcia S.A. . . . . . . . . . . . . . . 20
5.1 Representao do erros do tipo I e II . . . . . . . . . . . . . . . . . . . 118
5.2 Canditados selecionados . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.3 Valores da

E
ij
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
CAPTULO 1
INTRODUO
1.1 O que Estatstica?
Estatstica a cincia que investiga os processos de obteno, organizao e anlise
de dados sobre uma populao, e os mtodos de tirar concluses ou fazer predies
com base nesses dados.
Este conceito tem um signicado mais amplo do que aquele que usualmente se
d palavra "estatstica", isto , o resultado de contagens sobre a ocorrncia de
determinados eventos e a sua representao atravs de grcos e tabelas, como,
por exemplo, as estatsticas de ocorrncia de chuvas numa certa poca do ano; as
estatsticas sobre os ganhadores de prmios de loteria; as estatsticas de renda mdia
por regio etc.
Em geral, este conceito mais popular de estatstica corresponde somente
organizao e descrio dos dados relativos a um determinado experimento ou
situao e no trata da anlise e interpretao desses dados. Ele est associado
parte da Estatstica que denominamos de Estatstica Descritiva. A Estatstica
Descritiva, portanto, a parte da Estatstica que se preocupa com a organizao e
descrio de dados experimentais.
Alm da Estatstica Descritiva h a Estatstica Indutiva ou Estatstica Inferencial
que consiste, fundamentalmente, das tcnicas de anlise e interpretao dos dados. A
partir de um conjunto restrito de dados, chamado de amostra, organizado e descrito
pela Estatstica Descritiva, a Estatstica Indutiva procura fazer inferncias ou, em
outras palavras, tirar concluses sobre a natureza desses dados e estender essas
concluses a conjuntos maiores de dados, chamados de populaes.
evidente que, para que a Estatstica Indutiva possa deduzir concluses vlidas,
necessrio que se tomem alguns cuidados para a escolha da amostra a ser utilizada.
Esses cuidados, mais propriamente chamados de critrios, so estabelecidos por uma
tcnica chamada de amostragem.
Contudo, para permitir que a Estatstica Indutiva proporcione concluses vlidas
no basta utilizar as tcnicas de organizao e descrio dos dados da Estatstica
11
Descritiva e as tcnicas corretas de amostragem. Fica ainda faltando uma ltima
ferramenta que o clculo de probabilidades. O clculo de probabilidades um
conjunto de tcnicas matemticas que visa determinar as chances de ocorrncia de
eventos regidos pelas leis do acaso.
A Figura 1.1 abaixo interrelaciona os conceitos citados:
Fig. 1.1 Figura tirada de : Costa Neto, P. L. de O. - Estatstica, Ed. Edgard
Blcher Ltda - 1977
1.2 Conceitos de Populao e Amostra
Populao ou Universo a totalidade dos objetos concebveis de uma certa classe
em considerao.
Amostra so os objetos selecionados da populao. Se esses objetos so selecionados
de tal maneira que cada objeto tem a mesma chance de ser selecionado do que o
outro, temos uma amostra aleatria
1.3 Tipos de Variveis
necessrio, inicialmente, que se dena qual(is) a(s) caractersticas dos elementos
que dever(o) ser vericada(s). Ou seja, no se trabalha estatisticamente com os
elementos existentes, mas com alguma(s) caracterstica(s) desses elementos. Por
exemplo, os elementos a serem estudados podem ser a populao de uma cidade,
mas estaremos interessados em alguma caracterstica como renda, idade, sexo, tipo
de moradia, etc. Trabalha-se portanto com os valores de uma varivel (que a
caracterstica de interesse), e no com os elementos originalmente considerados. A
escolha da varivel (ou variveis) de interesse depender dos objetivos do estudo
12
estatstico em questo. Esta caracterstica (varivel) poder ser qualitativa ou
quantitativa.
A varivel ser qualitativa quando resultar de uma classicao por tipos ou
atributos, como nos seguintes exemplos:
a) Populao: alunos de uma universidade
Varivel: sexo (masculino ou feminino).
b) Populao: moradores de uma cidade
Varivel: tipo de habitao (casa, apartamento, barraco, etc.).
c) Populao: peas produzidas por uma mquina
Varivel: qualidade (perfeita ou defeituosa).
d) bitos em um hospital, nos ltimos cinco anos
Varivel: causa mortis (molstia cardiovasculares, cnceres, etc)
e) Populao Brasileira
Varivel: cor da pele (branca, preta, amarela, vermelha, parda).
A varivel ser quantitativa quando seus valores forem expressos em nmeros. Pode
ser subdivida em:
1 - quantitativa discreta: pode assumir apenas valores pertences a um
conjunto enumervel;
2 - quantitativa contnua: pode assumir qualquer valor em um certo
intervalo de variao.
Alguns exemplos de variveis quantitativas discretas so:
a) Populao: habitaes de uma cidade.
Varivel: nmero de banheiros.
b) Populao: casais residentes em uma cidade.
Varivel: nmero de lhos.
13
c) Populao: aparelhos produzidos em uma linha de montagem.
Varivel: nmero de defeitos por unidade.
d) Populao: Bolsa de valores de So Paulo.
Varivel: nmero de aes negociadas.
Alguns exemplos de variveis quantitativas contnuas so:
a) Populao: estao meteorolgica de uma cidade.
Varivel: precipitao pluviomtrica durante um ms.
b) Populao: pregos produzidos por uma mquina.
Varivel: comprimento.
c) Populao: propriedades agrcolas do Brasil.
Varivel: produo de algodo.
d) Populao: indstrias de uma cidade.
Varivel: ndice de liquidez.
e) Populao: pessoas residentes em uma cidade.
Varivel: idade.
Para atingir os objetivos da Estatstica descritiva, os dados observados so muitas
vezes sintetizados e apresentados em formas de tabelas ou grcos, os quais iro
fornecer rpidas e seguras informaes a respeito das variveis em estudo. Uma
das tabelas mais utilizadas na estatstica a distribuio de freqncias. Os grcos
associados ela so o grco de freqncias (denominado histograma, para o caso de
variveis quantitativas contnuas), o polgono de freqncias, o grco de freqncia
acumulada e o polgono de freqncia acumulada.
1.4 Distribuies de Freqncia
Muitas vezes os grcos so elaborados utilizando-se as freqncias dos valores da
varivel. Para tal, necessitamos denir alguns conceitos importantes.
1.4.1 Freqncias e freqncias relativas
Denimos freqncia de um valor de uma varivel (qualitativa ou quantitativa)
como sendo o nmero de vezes que aquele valor se repete no conjunto de dados
14
experimentais. Usaremos a notao fi para representar a freqncia do i-simo valor
observado.
Sendo n o nmero total de valores observados e k o nmero de diferentes valores
obtidos, tem-se:
k

i=0
f
i
= n (1.1)
Exemplo
Seja o conjunto de dados abaixo (Tabela 1.1), que representa o nmero lhos de
funcionrios da empresa Fictcia S.A..
TABELA 1.1 Nmero de lhos dos 50 funcionrios da empresa Fictcia S.A.
Num.de Filhos Freqncia Freq. Relativa
0 15 0,30
1 10 0,20
2 13 0,26
3 6 0,12
4 3 0,06
5 3 0,06
Total 50 1,00
As freqncias so:
f
0
= 15 (corresponde ao valor 0)
f
1
= 10 (corresponde ao valor 1)
f
2
= 13 (corresponde ao valor 2)
f
3
= 6 (corresponde ao valor 3)
f
4
= 3 (corresponde ao valor 4)
f
5
= 3 (corresponde ao valor 5)
15
Chamamos de distribuio de freqncias associao das freqncias aos
respectivos valores observados. Portanto, a representao acima caracteriza uma
distribuio de freqncias. Do mesmo modo, podemos denir freqncia relativa de
um valor observado como sendo a relao:
p

i
=
f
i
n
(1.2)
Verica-se facilmente que:
k

i=0
p

i
= 1 (1.3)
1.5 Distribuio de freqncias e sua representao grca para
variveis quantitativas discretas
A Tabela 1.1 representa a distribuio de frquencias para a varivel discreta "nmero
de lhos". A representao grca de uma distribuio de freqncia de uma varivel
quantitativa discreta denominada grco de freqncias (Figura 1.2). Utilizando o
exemplo, temos o seguinte grco de frequencias
Fig. 1.2 Histograma de freqncia
Uma outra representao utilizada a do grco das freqncias acumuladas
16
e freqncias relativas acumuladas. Tomando-se os dados do exemplo anterior
podemos calcular as freqncias, freqncias acumuladas e freqncias relativas
acumuladas dos diversos valores. Esse clculo est ilustrado na Tabela 1.2.
TABELA 1.2 Freqncias, freqncias relativas e freqncias relativas acumuladas
Num.de Filhos Freqncia Freq. Relativa Freq. Relativa
Acumulada
0 15 0,30 0,30
1 10 0,20 0,50
2 13 0,26 0,76
3 6 0,12 0,88
4 3 0,06 0,94
5 3 0,06 1,00
Total 50 1,00 -
Com os dados acima podemos construir o grco de freqncias relativas (Figura
1.3) e freqncias relativas acumuladas (Figura 1.4).
Fig. 1.3 Histograma de freqncias relativas
17
Fig. 1.4 Histograma de freqncias relativas acumuladas
1.6 Distribuio de freqncias e sua representao grca para
variveis quantitativas contnuas
As variveis quantitativas contnuas diferem um pouco das discretas na sua forma
de representao grca. Para entender essa diferena temos que nos lembrar que
as variveis contnuas, por denio, tm os seus valores denidos num intervalo
contnuo dos nmeros reais. Portanto, no tem sentido falar em freqncia de
repetio de um determinado valor, pois os valores raramente se repetem. A Tabela
1.3 representa uma distribuio de freqncia para a varivel contnua "altura de
funcionrios".
TABELA 1.3 Altura (cm) dos 50 funcionrios da empresa Fictcia S.A.
Altura Freqncia Freq. Relativa
151 - 159 2 0,04
159 - 167 11 0,22
167 - 175 18 0,36
175 - 183 10 0,20
183 - 191 8 0,16
191 - 199 1 0,02
Total 50 1,00
Intervalos de classes: O smbolo que dene uma classe
18
Exemplo: 151 158
Limites da classe: Os nmeros extremos de cada intervalo
Exemplo: o limite inferior da 1
a
classe 151 e o limite superior da 1
a
classe 158
Ponto mdio de classe:ponto intermedirio do intervalo de classe
Exemplo: Ponto mdio da 1
a
classe 154, 5
Amplitude do intervalo de classe: a diferena entre os limites reais superior e
inferior
Exemplo: amplitude da 1
a
classe 8
Com os dados da Tabela 1.1 podemos construir o grco de freqncias do mesmo
modo que zemos para as variveis discretas. A diferena mais importante que,
agora, as freqncias so associadas a intervalos de valores (classes de freqncias)
e no mais a valores individuais da varivel em estudo.
Alm disto, o grco, neste caso, chamado de histograma (Figura 1.5) que consiste
em um conjunto de retngulos, com centro no ponto mdio e larguras iguais aos
intervalos das classes, e reas proporcionais s freqncias das classes.
A seguir est mostrado o histograma correspondente aos dados do exemplo acima,
e o polgono de freqncias, que o grco obtido unindo-se os pontos mdios dos
patamares do histograma.
Fig. 1.5 Histograma e Poligono de freqncia
19
O prximo grco o polgono de freqncias acumuladas. Ele construdo unindo-se
as freqncias acumuladas ao nal de cada classe de freqncias (Tabela 1.4). Pode
ser construdo tambm com as freqncias relativas acumuladas e, neste caso, ele se
chama polgono de freqncias relativas acumuladas. O primeiro est mostrado na
Figura 1.6.
TABELA 1.4 Altura (cm) dos funcionrios da Fictcia S.A.
Altura Num. de Funcionrios
< 151 0
< 159 2
< 167 13
< 175 31
< 183 41
< 191 50
Fig. 1.6 Histograma freqncia acumulada
1.6.1 Curvas de Freqncia
Tipos de curvas de freqncia: As curvas de freqncia aparecem, na prtica,
sob diversas formas caractersticas, como as indicadas na Figura 1.7
1.7 Medidas de Tendncia Central
As medidas mais comuns so: mdia, mediana, moda
20
Fig. 1.7 Histograma freqncia
1.7.1 Mdia
A mdia de um conjunto de N nmeros X
1
, X
2
, ..., X
N
representada por

X e
denida por:

X =
X
1
+X
2
+... +X
N
N
=

N
i=1
X
i
N
(1.4)
De modo geral, para dados agrupados, temos:

X

=
m

i=1
x
i
_
f
i
N
_
(1.5)
onde: x
i
o ponto mdio da classe i;
f
i
N
a freqncia relativa da classe i; e m
nmero de classes.
1.7.2 Mediana
A mediana de um conjunto de nmeros, ordenados em ordem de grandeza, o valor
mdio (N impar) ou a mdia aritmtica dos dois valores centrais (N par).
Exemplos:
{3, 4, 4, 5, 6, 8, 8, 8, 10} tem mediana 6
21
{5, 6, 7, 9, 11, 12, 13, 17} tem mediana 10
1.7.3 Moda
A moda o valor que ocorre com mais freqncia. A moda pode no existir e, mesmo
que exista, pode no ser nica.
Exemplos:
{1, 1, 3, 3, 5, 7, 7, 7, 11, 13} tem moda 7
{3, 5, 8, 11, 13, 18} no tem moda
{3, 5, 5, 5, 6, 6, 7, 7, 7, 11, 12} tem duas modas 5 e 7 (bimodal)
1.8 Medidas de Disperso
O grau ao qual os dados numericos tendem a dispersar-se em torno de um valor
mdio chama-se variao ou disperso dos dados.
As medidas mais comuns so: amplitude total, desvio mdio, desvio padro e
varincia.
1.8.1 Amplitude Total
a diferena entre o maior e o menor valor
Exemplos:
A amplitude total de {4, 7, 9, 11, 11, 15, 20} 16
1.8.2 Desvio Mdio
O desvio mdio de X
1
, X
2
, ..., X
N
pode ser obtido pela seguinte frmula
DM =

N
i=1
| X
i


X |
N
(1.6)
Exemplo:
O desvio mdio de {2, 3, 6, 8, 11} 2.8
22
Para dados agrupados (em tabelas de freqncia) o desvio padro computado por:
DM

=
1
N
m

i=1
| X
i


X | f
i
(1.7)
Onde: x
i
o ponto mdio da classe i, f
i
a freqncia da classe i, e m o nmero
de classes.
1.8.3 Coeciente de Variao
O efeito da variao ou disperso em relao mdia medido pela disperso
relativa, que denida por:
DR =
Disp. absoluta
Media
Se a disperso absoluta for o desvio padro, a disperso relativa denominada
coeciente de variao (CV ), que pode ser representado por:
CV =
s

X
(1.8)
Obs: O Coeciente de variao deixa de ser til quando o

X est prximo de zero.
1.8.4 Varincia (
2
)
o quadrado do desvio padro

2
=

N
i=1
(x
i


X)
2
N
(1.9)
Observao: O desvio padro corresponde aos dados de uma amostra em geral
calculado com o divisor (N 1) ao invs de N, para que se tornem estimadores
no tendenciosos. Neste caso geralmente utiliza-se as letras s e s
2
para representar
o desvio padro e a varincia, respectivamente.
23
1.8.5 Desvio Padro ()
O desvio padro de X
1
, X
2
, ..., X
N
dado por:
=

N
i=1
(x
i


X)
2
N
(1.10)
Para dados agrupados o desvio padro computado por:

m
i=1
(x
i


X)
2
f
i
N
(1.11)
1.9 Momentos, Assimetria e Curtose
1.9.1 Momentos
Se X
1
, X
2
, ..., X
N
so os N valores assumidos pela varivel X, dene-se momento
de ordem r por:
m

r
=
X
r
1
+X
r
2
+... +X
r
N
N
=

N
i=1
X
r
i
N
(1.12)
e o momento de ordem r centrado na mdia pela equao
m
r
=

N
i=1
_
X
i


X
_
r
N
(1.13)
Observao:

X = m

2
= m

_
m

1
_
2
m
1
= 0

2
= m
2
24
Para dados agrupados os momentos podem ser calculados por:
m
r
=

m
i=1
_
x
i


X
_
r
f
i
N
(1.14)
onde: x
i
o ponto mdio da classe i, f
i
a freqncia e m o nmero de classes.
1.9.2 Assimetria
o grau de desvio, ou afastamento da simetria, de uma distribuio.
Para distribuies assimtricas, a mdia tende a situar-se do mesmo lado da moda
que a cauda mais longa. Por isso, uma medida de assimetria proporcionada pela
diferena entre a mdia e a moda. Ela pode ser tomada sem dimenso atravs de
uma diviso por uma medida de disperso, como o desvio padro, resultando em:
Assimetria =

X moda
s
(1.15)
Uma outra medida importnte o coeciente do momento de assimetria, que
utiliza o 3
o
momento centrado, expresso sob a forma no dimensional, denida por
a
3
=
m
3
s
3
=
m
3
_
m
3
2
(1.16)
1.9.3 Curtose
o grau de achatamento de uma distribuio, e muitas vezes considerado em
relao a uma distribuio normal como as indicadas na Figura 1.8
Fig. 1.8 Exemplos de curtose
25
Uma medida de curtose o coeciente do momento de curtose denido por:
a
4
=
m
4
s
4
=
m
4
m
2
2
(1.17)
Para a distribuio normal, a
4
= 3. Por essa razo, a curtose freqntemente
denida por (a
4
3), que positivo para uma distribuio leptocrtica, e negativo
para uma platicrtica e nulo para uma normal.
26
CAPTULO 2
PROBABILIDADE
2.1 Denio de Probabilidade utilizando Freqncia Relativa
Uma da denies de probabilidade utiliza a freqncia relativa, j que as freqncias
relativas so estimativas de probabilidades. Podemos ento denir a probabilidade
como a proporo (ou freqncia relativa) em uma seqncia muito grande de
experimentos.
P(e
1
) =
lim
n
n
1
n
(2.1)
Onde:
e
1
o resultado;
n o nmero total de vezes que se repete o experimento;
n
1
o nmero de vezes que o resultado e
1
ocorre;
n
1
n
portanto a freqncia relativa de e
1
.
Observao: Se o experimento tiver N resultados possveis e
1
, e
2
, ..., e
N
ento:
0 P(e
i
) 1 i = 1, 2, ..., N
P(e
1
) + P(e
2
) + ... +P(e
N
) = 1 (2.2)
2.2 Experimentos aleatrios
Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios.
Os fenmenos determinsticos so aqueles em que os resultados so sempre os
mesmos, qualquer que seja o nmero de ocorrncias vericadas.
Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um
grande nmero de repeties do mesmo fenmeno. Por exemplo, se considerarmos
um pomar com centenas de laranjeiras, as produes de cada planta sero diferentes
e no previsveis, mesmo que as condies de temperatura, presso, umidade, solo,
etc. sejam as mesmas para todas as rvores.
Experimentos ou fenmenos aleatrios so aqueles que, mesmo repetidos vrias
vezes sob condies semelhantes, apresentam resultados imprevisveis.
27
Exemplos:
a) Lanamento de uma moeda honesta;
b) Lanamento de um dado;
c) Lanamento de duas moedas;
d) Retirada de uma carta de um baralho completo de 52 cartas;
e) Determinao da vida til de um componente eletrnico.
2.3 Espao Amostral
Deni-se espao amostral (S) ao conjunto de todos os resultados possveis de um
experimento.
Nos exemplos acima, os espaos amostrais so:
a) S = {c, r}
b) S = {1, 2, 3, 4, 5, 6}
c) S = {(c, r), (c, c), (r, c), (r, r)}
d) S = {A
o
, ..., K
o
, A
p
, ..., K
p
, A
c
, ..., K
c
, A
e
, ..., K
e
}
e) S = {t R/t 0}
Cada um dos elementos de S que corresponde a um resultado recebe o nome de
ponto amostral.
2.4 Eventos
Chamamos de evento (E) a qualquer subconjunto do espao amostral S de um
experimento aleatrio.
Assim, o evento aleatrio pode ser um nico ponto amostral ou uma reunio deles.
Qualquer que seja o evento E, se E S, ento E um evento de S.
Se E = S, E chamado evento certo.
Se E S e E um conjunto unitrio, E chamado evento elementar.
Se E = , E chamado evento impossvel.
28
Exemplos:
1. No lanamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
a) A = {2, 4, 6} S; logo A um evento de S;
b) B = {1, 2, 3, 4, 5, 6} S; logo B um evento certo de S (B = S);
c) C = {4} S; logo C um evento elementar de S;
d) D = S; logo D um evento impossvel de S.
Um evento sempre denido por uma sentena. Assim os eventos acima podem ser
denidos pelas sentenas: a) "Obter um nmero par"; b) "Obter um nmero menor
ou igual a seis"; c) "Obter um nmero maior que trs e menor que cinco"; d) "Obter
um nmero maior que seis".
2. Lanam-se dois dados. Enumerar os seguintes eventos:
a) Sada de faces iguais;
b) Sada de faces cuja soma seja igual a 10;
c) Sada de faces cuja soma seja menor que 2;
d) Sada de faces cuja soma seja menor que 15;
e) Sada de faces onde uma face o dobro da outra.
Neste caso, o espao amostral pode ser representado por uma tabela de dupla
entrada:
S =
D
2
1 2 3 4 5 6
D
1
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Os eventos pedidos so:
29
a) A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)};
b) B = {(4, 6), (5, 5), (6, 4)};
c) C = (evento impossvel);
d) D = S (evento certo);
e) E = {(1, 2), (2, 1), (2, 4), (3, 6), (4, 2), (6, 3)}.
2.5 Classe dos Eventos Aleatrios
Denio: o conjunto formado de todos os eventos (subconjuntos) do espao
amostral. Para efeito de exemplo, consideremos o espao amostral nito: S =
{e
1
, e
2
, e
3
, e
4
}. A classe dos eventos aleatrios :
F(S) =
_

{e
1
} , {e
2
} , {e
2
} , {e
4
} ,
{e
1
, e
2
} , {e
1
, e
3
} , {e
1
, e
4
} , {e
2
, e
3
} , {e
2
, e
4
} , {e
3
, e
4
} ,
{e
1
, e
2
, e
3
} , {e
1
, e
2
, e
4
} , {e
1
, e
3
, e
4
} , {e
2
, e
3
, e
4
} ,
{e
1
, e
2
, e
3
, e
4
}
_

_
2.6 Denio Clssica de Probabilidade
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que
todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S um
conjunto eqiprovvel.
Denimos probabilidade de um evento A (A S) ao nmero real P(A), tal que:
P(A) =
n
o
de resultados favoraveis a A
n
o
de resultados possiveis
=
n(A)
n(S)
(2.3)
Exemplo:
Considerando o lanamento de um dado, pede-se:
a) A probabilidade do evento A "obter um nmero par na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3.
Logo, P(A) =
3
6
=
1
2
.
30
b) A probabilidade do evento B "obter um nmero menor ou igual a 6 na
face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
B = {1, 2, 3, 4, 5, 6} n(B) = 6.
Logo, P(B) =
6
6
= 1.
c) A probabilidade do evento C "obter um nmero 4 na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
C = {4} n(C) = 1.
Logo, P(C) =
1
6
.
d) A probabilidade do evento D "obter um nmero maior que 6 na face
superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
D = n(D) = 0.
Logo, P(D) =
0
6
= 0.
Exerccios Complementares:
1 - No lanamento de dois dados, calcule a probabilidade de se obter soma
igual a 5.
2 - Qual a probabilidade de sair uma gura quando retiramos uma carta de
um baralho de 52 cartas?
3 - Retira-se uma carta de um baralho completo de 52 cartas.
a) Qual a probabilidade de sair uma carta de copas ou de ouros?
b) Qual a probabilidade de sair um rei ou uma carta de espadas?
4 - No lanamento de um dado, qual a probabilidade de se obter um nmero
no inferior a 5?
5 - So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual a probabilidade
de tiramos uma dama e um rei, no necessariamente nessa ordem?
31
6 - Dois dados so lanados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
2.7 Operaes com Eventos Aleatrios - Teoria dos Conjuntos
Consideremos um espao amostral nito S = {e
1
, e
2
, e
3
, ..., e
n
}. Sejam A e B dois
eventos de F(S). As seguintes operaes so denidas:
2.7.1 Unio de conjuntos
Denio: A B = {e
i
S / e
i
A ou e
i
B} , i = 1, . . . , n. Portanto, o
evento unio formado pelos pontos amostrais que pertenam a pelo menos um
dos conjuntos. A unio pode ser vista na Figura 2.1.
Fig. 2.1 Unio dos conjuntos A e B
Observao:
1) A B = B A
2) A A = A
3) A = A
4) Se A B A B = B (em particular A S = S).
32
A representao da unio de n eventos A
1
, A
2
, ..., A
n
(A
1
A
2
... A
n
) dada por:
n
_
i=1
A
i
(2.4)
2.7.2 Interseco de conjuntos
Denio: AB = {e
i
S / e
i
A e e
i
B} , i = 1, . . . , n. Portanto, o evento
interseco formado pelos pontos amostrais que pertenam simultaneamente aos
eventos A e B. A interseco pode ser vista na Figura 2.2.
Fig. 2.2 Interseco dos conjuntos A e B
Observao:
1) A B = B A
2) A A = A
3) A =
4) Se A B A B = A (em particular A S = A)
5) (A B) C = A (B C).
A representao da interseco de n eventos A
1
, A
2
, ..., A
n
(A
1
A
2
... A
n
) dada
33
por:
n

i=1
A
i
(2.5)
2.7.3 Complemento
Denio: S A = A = A
c
= {e
i
S / e
i
/ A} , i = 1, . . . , n. O complemento de
um evento A , portanto, o evento contendo todos os resultados no espao amostral
S que no pertenam a A. O complemento de A pode ser visto na Figura 2.3.
Observao:
Fig. 2.3 Complemento do conjunto A
1) (A
c
)
c
= A
2) A A
c
= S
3)
c
= S
4) A A
c
=
5) S
c
= .
2.7.4 Eventos Mutuamente Exclusivos ou Disjuntos
Denio: Dois eventos so ditos mutuamente exclusivos ou disjuntos se A e B
no puderem ocorrer juntos, ou seja a realizao de um exclui a realizao do outro.
Segue que A e B so disjuntos se A B = .
34
Exemplo: Lanam-se duas moedas. Sejam os eventos
A: sada de faces iguais e
B: sada de cara na primeira moeda.
Determinar os eventos:
A B, A B, A, B,(A B),(A B), (A B), (A B), B A, A B, A B, e
B A.
Resoluo:
S = {(c, c), (c, r), (r, c), (r, r)}
A = {(c, c), (r, r)}
B = {(c, c), (c, r)} .
A B = {(c, c), (c, r), (r, r)}
A B = {(c, c)}
A = {(c, r), (r, c)}
B = {(r, c), (r, r)}
(A B) = {(r, c)}
(A B) = {(c, r), (r, c), (r, r)}
(A B) = {(r, c)}
(A B) = {((c, r), (r, c), (r, r)}
B A = {(c, r)}
A B = {(r, r)}
A B = {(c, r)}
B A = {(r, r)} .
Obs: Note que (A B) = (A B) e (A B) = (A B)
2.8 Denio Axiomtica de Probabilidade
Para um dado experimento, necessrio atribuir para cada evento A no espao
amostral S um nmero P(A) que indica a probabilidade de A ocorrer. Para satisfazer
a denio matemtica de probabilidade, este nmero P(A) deve satisfazer trs
axiomas especcos:
Axioma 1: Para qualquer evento A, P(A) 0
Axioma 2: P(S) = 1
35
Axioma 3: Para qualquer seqncia innita de eventos disjuntos A
1
, A
2
, ...
P(

_
i=1
A
i
) =

i=1
P(A
i
) (2.6)
A denio matemtica de probabilidade pode agora ser dada como segue:
A distribuio de probabilidade, ou simplesmente a probabilidade, no espao
amostral S uma especicao de nmeros P(A) que satisfazem os axiomas 1, 2, e
3.
Teorema 1: P() = 0
Teorema 2: Para qualquer seqncia nita de eventos disjuntos A
1
, A
2
, ..., A
n
P(
n
_
i=1
A
i
) =
n

i=1
P(A
i
) (2.7)
Teorema 3: Para qualquer evento A,
P(A
c
) = 1 P(A) (2.8)
Teorema 4: Para qualquer evento A, 0 P(A) 1
Teorema 5: Se A B, ento P(A) P(B)
Teorema 6: Para qualquer dois eventos A e B
P(A B) = P(A) + P(B) P(A B) (2.9)
Observao:
1.
P(A
1
A
2
A
3
) = P(A
1
) +P(A
2
) + P(A
3
)
= [P(A
1
A
2
) +P(A
2
A
3
) + P(A
1
A
3
)]
= +P(A
1
A
2
A
3
) (2.10)
36
2. Se dois eventos so mutuamente exclusivos, ento P(A B) = P(A) +P(B).
2.9 Eventos Independentes
Suponha que dois eventos A e B ocorram independentes um do outro no sentido que
a ocorrncia ou no de um deles tenha nenhuma relao, e nenhuma inuncia na
ocorrncia ou na no ocorrncia do outro. Nessas condies
P(A B) = P(A) P(B) (2.11)
Denio: Dois eventos so independentes se P(A B) = P(A) P(B)
Teorema 1: Se dois eventos A e B so independentes, ento os eventos A e B
c
tambem so independentes.
Exerccios Complementares:
1 - De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta
do primeiro baralho e uma carta do segundo. Qual a probabilidade de a
carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus?
2 - Uma urna A contm 3 bolas brancas, 4 pretas, 2 verdes; uma urna B
contm 5 bolas brancas, 2 pretas, 1 verde; uma urna C contm 2 bolas
brancas, 3 pretas, 4 verdes. Uma bola retirada de cada urna. Qual a
probabilidade de as trs bolas retiradas da primeira, segunda e terceira
urnas serem respectivamente, branca, preta e verde?
3 - De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem
reposio. Qual a probabilidade de a primeira ser o s de paus e a segunda
ser o rei de paus?
4 - So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual a probabilidade
de tiramos uma dama e um rei, no necessariamente nessa ordem?
5 - Dois dados so lanados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
6 - A probabilidade de que um homem esteja vivo daqui a 30 anos 2/5; a
37
de sua mulher de 2/3. Determinar a probabilidade de que daqui a 30
anos:
a) ambos estejam vivos;
b) somente o homem esteja vivo;
c) somente a mulher esteja viva;
d) nenhum esteja vivo;
e) pelo menos um esteja vivo.
7 - Sejam A e B eventos tais que P(A) = 0,2; P(B) = p; P(A B) = 0,6.
Calcular p considerando A e B:
a) Mutuamente exclusivos
b) Independentes.
2.10 Anlise Combinatoria
Denio: Deni-se fatorial de n por n!
n! = n(n 1)(n 2)(n 3)...1
Por denio 0! = 1
2.10.1 Permutao
Amostra sem reposio: Uma permutao de n objetos diferentes, tomados r de
cada vez, um arranjo de r dos n objetos, levando-se em considerao a ordem de
sua disposio.
O nmero de permutaes de n objetos, tomados r de cada vez representado por
P
r
n
e calculado por
P
r
n
= n(n 1)(n 2)...(n r + 1) =
n!
(n r)!
(2.12)
Em particular P
n
n
= n!
O nmero de permutaes de n objetos distribuidos em grupos dos quais n
1
so
38
iguais, n
2
so iguais, ... n
k
so iguais, :
n!
n
1
!n
2
!...n
k
!
onde n
1
+n
2
+... +n
k
= n (2.13)
Amostragem com Reposio: Considere uma amostragem com reposio, como
por exemplo uma urna contendo n bolas e se selecione k bolas, uma de cada vez,
repondo a bola na urna aps o evento. O espao amostral S ser composto por n
k
elementos.
Exemplo:
1. Suponha que um clube possua 25 membros, e que um presidente e um secretrio
sero escolhidos entre os membros. De quantas maneiras estes cargos podem ser
preenchidos?
Soluo: Como as posies podem ser preenchidas, escolhendo-se primeiro o
presidente dentre os 25 membros, e depois o secretrio dentre os 24 restantes,
o nmero total de maneiras que os cargos podero ser preenchidos ser P
2
25
=
(25)(24) = 600.
2. Suponha que seis livros diferentes sero arrumados em uma estante. O nmero de
possveis permutaes dos livros 6! = 720.
3. O nmero de permutaes da palavra estatistica
11!
3!2!2!2!1!1!
= 831.600.
2.10.2 Combinaes
Uma combinao de n objetos tomados r de cada vez, uma escolha dos n objetos,
no se levando em considerao a ordem de sua posio. O nmero de combinaes
de n objetos, tomados k de cada vez, representado por C
k
n
ou
_
n
k
_
.
O clculo (ou frmula) para combinaes pode ser obtido atravs de uma permutao
que pode ser construida da seguinte maneira: Sabe-se que o nmero de permutaes
de n elementos tomados k de cada vez P
k
n
. Primeiro uma combinao particular de
k elementos selecionada. Cada diferente permutao desses k elementos levar
a uma permutao na lista. Como h k! permutaes desses k elementos, esta
combinao particular produzir k! permutaes na lista. Quando uma combinao
diferente de k elementos selecionada, k! outras permutaes na lista so obtidas.
Como cada combinao de k elementos produzir k! permutaes, o nmero total
39
de permutaes na lista ser de k! C
k
n
, isto P
k
n
= k! C
k
n
. Portanto
C
k
n
=
P
k
n
k!
=
n!
k!(n k)!
(2.14)
2.11 Probabilidade Condicional
Se A e B so dois eventos, a probabilidade de A ocorrer, depois de B ter
acontecido, representada por P(A/B) (probabilidade de A dado B) e denominada
probabilidade condicional de A, depois de B ter ocorrido.
Neste caso, a probabilidade do evento A muda aps se ter aprendido que o evento
B ocorreu. Como se sabe que o evento B ocorreu, ento sabemos que o resultado
do evento A ser um dos includos em B. Ento, para calcular a probabilidade
que A ocorrer, devemos considerar o conjunto dos possveis resultados de B que
tambm resultariam na ocorrncia de A. Este conjunto precisamente A B.
portanto natural denir-se a probabilidade condicional P(A/B) como a proporo
da probabilidade total P(B) que representadoa pela probabilidade P(A B).
Portanto, tem-se a seguinte denio:
P(A/B) =
P(A B)
P(B)
dado P(B) > 0 (2.15)
Se P(B) = 0 a P(A/B) no denida.
Probabilidade Condicional para Eventos Independentes
Se A e B forem independentes, ento P(A B) = P(A) P(B). Logo,
P(A/B) =
P(A) P(B)
P(B)
= P(A) (2.16)
Da mesma forma,
P(B/A) =
P(B) P(A)
P(A)
= P(B) (2.17)
Teorema: Suponha que A
1
, A
2
, ..., A
n
sejam quaisquer eventos tais que
40
P(A
1
) > 0, P(A
1
A
2
) > 0, ..., P(A
1
A
2
A
3
... A
n1
) > 0. Ento
P(A
1
A
2
... A
n
) =
= P(A
1
) P(A
2
/A
1
) P(A
3
/A
1
A
2
)...
P(A
n
/A
1
A
2
...A
n1
). (2.18)
Exemplo:
Suponha que 4 bolas sejam selecionadas, uma de cada vez, sem reposio, de uma
urna contendo v bolas vermelhas e a azuis. (v 2, a 2). Qual a probabilidade de
se obter uma sequncia de resultados vermelho, azul, vermelho, azul?
v
j
: uma bola vermelha retirada na j-sima vez
a
j
: uma bola azul retirada na j-sima vez
onde j=1,2,3,4
P(v
1
, a
2
, v
3
, a
4
) =
= P(v
1
) P(a
2
/v
1
) P(v
3
/v
1
a
2
) P(a
4
/v
1
a
2
v
3
)
=
v
v+a

a
v+a1

v1
v+a2

a1
v+a3
2.12 Probabilidade Total
Seja S o espao amostral de um experimento, e considere k eventos A
1
, A
2
, . . . , A
k
em S tal que A
1
, A
2
, . . . , A
k
sejam disjuntos e

n
i=1
A
i
= S. Diz-se, etno, que estes
eventos formam uma partio de S.
Se os eventos A
1
, A
2
, ..., A
k
formam uma partio de S, e B qualquer outro evento
em S, ento:
B = (A
1
B) (A
2
B) ... (A
k
B).
Como os k eventos do lado direito da equao acima so disjuntos:
P(B) =
k

j=1
P(A
j
B) (2.19)
41
Mas P(A
j
B) = P(A
i
) P(B/A
j
) onde j = 1, 2, ..., k. Ento
P(B) =
k

j=1
P(A
j
) P(B/A
j
) (2.20)
De forma a apresentar a frmula para a probabilidade total e a frmula de
Bayes, vamos supor que exista numa imagem duas classes de cobertura terrestre,
denominadas A
1
e A
2
, e que os pixels desta imagem sero classicados como
pertencentes a A
1
ou A
2
segundo o valor de alguma caracterstica (por exemplo,
nvel de cinza). Suponha qua a probabilidade de ocorrncia da classe A
1
seja P(A
1
)
e a probabilidade de ocorrncia da classe A
2
seja P(A
2
). Obviamente pixels da
classe A
1
podem ser erroneamente classicados como sendo da classe A
2
, e vice
versa. Designemos estas probabilidades, P(C
A
2
/A
1
) e P(C
A
1
/A
2
) respectivamente.
Suponha que seja tomado aleatoriamente um pixel desta imagem e classicado,
segundo o valor da caracterstica estudada. Deseja-se saber a probabilidade deste
pixel ser classicado como A
1
.
Aqui, temos que considerar o seguinte: o pixel pode ser classicado em A
1
(C
A
1
) e ser
realmente de A
1
ou pode ser classicado em A
1
(C
A
1
) e ser realmente de A
2
. Ento
podemos escrever que:
C
A
1
= (C
A
1
A
1
) (C
A
1
A
2
)
Logo,
P(C
A
1
) = P [(C
A
1
A
1
) (C
A
1
A
2
)]
como os eventos so mutuamente exclusivos, temos:
P(C
A
1
) = P(C
A
1
A
1
) + P(C
A
1
A
2
)
Uma vez que os eventos C
A
1
e A
1
(i = 1, 2) no so independentes, vem:
P(C
A
1
) = P(C
A
1
/A
1
)P(A
1
) + P(C
A
1
/A
2
)P(A
2
)
42
ou
P(C
A
1
) =

i
P(C
A
1
A
i
) =

i
P(C
A
1
/A
i
)P(A
i
) (2.21)
A expresso da equao 2.21 acima normalmente chamada de frmula para a
probabilidade total.
2.13 Teorema de Bayes
Sejam os eventos A
1
, A
2
, ..., A
k
que formam uma partio do espao S tal que
P(A
j
) > 0 para todo j = 1, 2, ..., k, e seja B qualquer evento tal que P(B) > 0.
Ento, para i = 1, 2, ..., k, temos:
P(A
i
/B) =
P(A
i
)P(B/A
i
)

k
j=1
P(A
j
)P(B/A
j
)
(2.22)
Prova: Pela denio de probabilidade condicional,
P(A
i
/B) =
P(A
i
B)
P(B)
(2.23)
O numerador da equao 2.22 igual a P(A
i
B) e o denominador igual a P(B)
(pela frmula para probabilidade total).
Imaginemos agora uma situao onde um pixel classicado como A
1
. Quer-se
saber qual a probabilidade dele ser realmente um pixel da classe A
1
. Note que aqui
fornecida uma informao sobre o resultado da classicao do pixel, isto , dito que
ele foi classicado como pertencente classe A
1
dado que o mesmo foi classicado
em A
1
.
Em outras palavras, quer-se
P(A
1
/C
A
1
) =
P(A
1
C
A
1
)
P(C
A
1
)
(2.24)
Note que o denominador da expresso 2.24 acima dado em 2.21, podendo-se
43
expressar
P(A
1
/C
A
1
) =
P(C
A
i
/A
1
)P(A
1
)

i
P(C
A
1
/A
i
)P(A
i
)
(2.25)
Esta formulao pode obviamente ser generalizada para uma situao onde os
eventos A
1
, A
2
, ..., A
n
formam um sistema completo de resultados de alguma
operao e onde K denota um resultado arbitrrio desta operao. Neste caso tem-se
que:
P(A
i
/K) =
P(A
i
K)
P(K)
=
P(K/A
i
)P(A
i
)

P(K/A
i
)P(A
i
)
(2.26)
que conhecida como a frmula de Bayes e que tem aplicaes diversas na rea de
sensoriamento remoto.
A seguir dada uma aplicao especca utilizada em Classicao.
2.13.1 Teoria de Bayes
Suponha que seja medida alguma caracterstica x de uma cena (por exemplo, o
nvel de cinza de cada pixel ) e que tenha que se decidir a qual de duas classes (por
exemplo, vegetao ou solo) um pixel pertence. Este um problema unidimensional,
de classicao em duas classes, no domnio de caracterstica da imagem. Se um
nmero grande de pixels est disponvel, que pode ser considerado representativo
de cada classe (isto , dados de treinamento) podemos calcular um histograma da
frequncia relativa da caracterstica para cada classe, conforme mostrado na Figura
2.4.
Considere-as como aproximaes das funes densidade de probabilidade (f.d.p.)
contnuas de uma amostra innita de dados. Essas funes densidade de
probabilidade condicionais, P(x/A
1
) e P(x/A
2
) tem rea unitria e descrevem a
probabilidade de um pixel ter valor x da caracterstica, dado que ele est na classe A
1
ou na classe A
2
, respectivamente. Cada f.d.p. pode ser delineada pela probabilidade
a priori P(A
i
) que a classe A
i
ocorra na rea de interesse na imagem.
Estas funes de probabilidade delineadas P(x/A
i
)P(A
i
) representam a
probabilidade que um pixel tenha o valor x na caracterstica e est na classe A
i
. Em
44
Fig. 2.4 A probabilidade a priori nas f.d.p. das classes
sensoriamento remoto, estas probabilidades a priori podem ser estimadas atravs de
fontes externas de informao sobre a cena, tais como pesquisas de campo, mapas
ou dados histricos.
Para se tomar uma deciso de classicao para um pixel, precisamos conhecer
as probabilidades a posteriori que o pixel pertena cada uma das classes de
treinamento, dado que o pixel tem valor x na caracterstica. Esta probabilidade
P(A
i
/x) pode ser calculada com a regra de Bayes
P(A
i
/x) =
P(x/A
i
)P(A
i
)
P(x)
(2.27)
Onde
P(x) =
2

1
P(x/A
i
)P(A
i
) (2.28)
Uma regra de deciso pode agora ser formada com as probabilidades a posteriori da
equao 2.27. Se um pixel tem valor x na caracterstica, uma abordagem intuitiva
satisfatria designar o pixel classe A
1
se P(A
1
/x) maior que P(A
2
/x).
Semelhantemente, o pixel seria designado classe A
2
se P(A
2
/x) maior que
P(A
1
/x). Sendo P(x) igual para as duas classes na equao 2.28 ela pode ser ignorada
numa comparao dos dois e podemos escrever a regra de deciso de Bayes
45
- um pixel pertence classe A
1
se P(x/A
1
)P(A
1
) > P(x/A
2
)P(A
2
)
- um pixel pertence classe A
2
se P(x/A
2
)P(A
2
) > P(x/A
1
)P(A
1
)
Numa situao atpica onde as duas probabilidades a posteriori so extamente iguais,
isto
P(A
1
/x) = P(A
2
/x)
ou
P(x/A
1
)P(A
1
) = P(x/A
2
)P(A
2
)
uma deciso no pode ser tomada a partir das probabilidades de classe. Um processo
de desempate deve ser empregado, tal como escolher aleatoriamente classe 1 ou
classe 2. Pode ser mostrado que a regra de deciso de Bayes minimiza a probabilidade
mdia de erro sobre todo o conjunto de dados classicados, se todas as classes tem
f.d.p. normal.
Na prtica, as probabilidades P(A
i
) so difceis de ser obtidas e consequentemente
supe-se que elas sejam iguais. Obviamente resultados mais exatos seriam obtidos se
elas pudessem ser estimadas a partir de dados externos. Se, por exemplo, o objetivo
determinar a proporo dos tipos de cultura plantados numa estao particular,
a partir de imagens do Landsat de uma rea agrcola, podemos sensatamente
estabelecer as probabilidades a priori iguais s estimativas histricas da porcentagem
de cada cultura na rea.
46
CAPTULO 3
VARIVEIS ALEATRIAS E DISTRIBUIES
3.1 Varivel Aleatria
Denio: Considere um experimento para o qual o espao amostral denotado
por S. Dene-se varivel aleatria como uma funo que associa um valor real a
cada elemento do espao amostral.
X : S
Representamos as variveis aleatrias por letras maisculas e suas ocorrncias por
letras minsculas.
Exemplo:
Suponha o experimento "lanar trs moedas". Seja X: nmero de ocorrncias da
face cara . O espao amostral do experimento :
S = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r, r)} .
Se X o nmero de caras, X assume os valores 0, 1, 2 e 3. Podemos associar
a esses nmeros eventos que correspondem a nenhuma, uma, duas ou trs caras
respectivamente, como segue:
X Evento Correspondente
0 A1 = {(r, r, r)}
1 A2 = {(c, r, r), (r, c, r), (r, r, c)}
2 A3 = {(c, c, r), (c, r, c), (r, c, c)}
3 A4 = {(c, c, c)}
3.2 Tipos de Variveis Aleatrias, Funo de Probabilidade e Funo
Densidade de Probabilidade
Denio: Seja X uma varivel aleatria (v.a.). Se o nmero de valores possveis
de X (isto o seu contradomnio), for nito ou innito enumervel, denominaremos
X de varivel aleatria discreta. Isto , existe um conjunto nito ou enumervel
{x
1
, x
2
, ...} tal que X(s) {x
1
, x
2
, ...} s S.
Denio: Seja X uma varivel aleatria discreta. Portanto, o contradomnio de
X ser formado por um nmero nito ou enumervel de valores x
1
, x
2
, . . . . A cada
47
possvel resultdo x
i
, associaremos um nmero p(x
i
) = P(X = x
i
), i = 1, 2, 3, ...,
denominado probabilidade de x
i
. Os nmeros p(x
i
) devem satisfazer s seguintes
condies:
a) p(x
i
) 0 i,
b)

i=1
p(x
i
) = 1
A funo p, denida acima, denominada funo de probabilidade da varivel
aleatria X. A coleo de pares [x
i
, p(x
i
)] i = 1, 2, . . . , denominada distribuio
de probabilidade de X.
Exemplos:
a) Lanam-se dois dados. Seja a v.a. X: soma das faces. Determinar a
distribuio de probabilidade da varivel aleatria X (Figura 3.1).
X 2 3 4 5 6 7 8 9 10 11 12
p(X)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Fig. 3.1 Grco de P(x) para dois dados
b) Considere o experimento no qual uma moeda jogada dez vezes e seja X
ser o nmero de caras que so obtidas. Neste experimento, os possveis
48
valores de X so 0,1, 2, ..., 10, e
P(X = x) =
_
n
x
_
1
2
10
, x = 0, 1, 2, . . . , 10. (3.1)
Denio: Seja X uma varivel aleatria. Suponha que
X
, o contradomnio de X,
seja um intervalo ou uma coleo de intervalos. Ento diremos que X uma varivel
aleatria contnua.
Denio: Seja X uma varivel aleatria contnua. A funo densidade de
probabilidade f, indicada abreviadamente por f.d.p., uma funo f que satisfaz
s seguintes condies:
a) f(x) 0 x
X
,
b)
_

X
f(x)dx = 1
Alm disso, denimos, para qualquer c < d (em
X
)
P(c < x < d) =
_
d
c
f(x)dx
Obs:
a) P(c < x < d) representa a rea sob a curva, como exemplicado no
grco da Figura 3.2, da f.d.p. f, entre x = c e x = d.
b) Constitui uma consequncia da descrio probabilstica de X que, para
qualquer valor especicado de X, digamos x
0
, teremos P(X = x
0
) = 0,
porque P(X = x
0
) =
_
x
0
x
0
f(x)dx = 0
Exemplo:
a) Suponhamos que a v.a. X seja contnua. Seja a f.d.p. f dada por:
f(x) =
_
2x 0 < x < 1,
0 caso contrrio.
49
Fig. 3.2 Grco de fdp de f
Evidentemente, f(x) 0 e
_

f(x)dx =
_
1
0
2xdx = 1. Para calcular
P(X 1/2) deve-se calcular
_ 1
2
0
(2x)dx =
1
4
.
b) Seja X a durao de vida (em horas) de um certo tipo de lmpada.
Admitindo que X seja uma varivel aleatria contnua, suponha que a
f.d.p. f de X seja dada por:
f(x) =
_
a
x
3
1500 x 2500,
0 caso contrrio.
Para calcular a constante a, recorre-se condio
_

f(x)dx = 1, que
signica, neste caso
_
2500
1500
a
x
3
dx = 1, obtendo-se a = 7.031.250.
3.3 Funo de Distribuio Acumulada
Denio: A funo de distribuio da varivel aleatria X, representada por F
X
ou simplesmente por F, denida por:
F
X
(x) = P(X x) (3.2)
Observao:
a) A funo de distribuio de X tambm frequentemente chamada de
funo de distribuio acumulada de X.
50
b) A funo F
X
(x) no-decrescente quando x aumenta, isto , se x
1
< x
2
,
ento F
X
(x
1
) F
X
(x
2
).
c) Para qualquer valor de x
P(X > x) = 1 F
X
(x) (3.3)
d) Para quaisquer valores x
1
e x
2
, tais que x
1
< x
2
,
P(x
1
< X x
2
) = F
X
(x
2
) F
X
(x
1
) (3.4)
Teoremas:
a) Se X for uma varivel aleatria discreta,
F
X
(x) =

j
p(x
j
),
onde o somatrio estendido a todos os ndices j que satisfaam
condio x
j
x.
b) Se X for uma varivel aleatria contnua com f.d.p. f,
F
X
(x) =
_
x

f(s)ds.
Exemplos:
a) Suponhamos que a v.a. X tome os trs valores 0,1, e 2, com probabilidades
1/3, 1/6 e 1/2, respectivamente. Ento:
F(x) =
_

_
0 se x < 0,
1
3
se 0 x < 1,
1
2
se 1 x < 2,
1 se 0 x 2.
O grco de F est apresentado na Figura 3.3.
51
Fig. 3.3 Grco F
b) Suponha que X seja uma varivel contnua com f.d.p.
f(x) =
_
2x 0 < x < 1,
0 caso contrrio.
Portanto, a f.d. dada por:
F(x) =
_

_
0 x 0,
_
x
0
(2s)ds = x
2
0 < x 1,
1 x > 1.
O grco est apresentado na Figura 3.4.
3.4 Distribuies Bivariadas
Em alguns experimentos, necessrio considerar as propriedades de 2 ou mais
variveis simultaneamente. A distribuio de probabilidade conjunta de duas v.a.
denominada uma distribuio bivariada.
3.4.1 Distribuies Conjuntas Discretas
Suponha que um certo experimento envolve duas v.a. X e Y , cada qual com uma
distribuio discreta.
A funo de probabilidade conjunta de X e Y denida pela funo p tal que
52
Fig. 3.4 Meyer, pgina 75.
qualquer ponto (x, y) no plano xy,
p(x, y) = P(X = x e Y = y) (3.5)
Observao:
a)

p(x
i
, y
i
) = 1.
b) Se X e Y forem independentes
p(x
i
, y
i
) = P(X = x
i
) P(Y = y
i
)
Exemplo:
Suponha que a varivel aleatria X possa assumir somente of valores 1, 2, e 3, que
a varivel aleatria Y possa assumir somente os valores 1, 2, 3 e 4, e que a funo
de probabilidade conjunta de X e Y seja dada pela tabela:
Y 1 2 3 4
X
1 0,1 0 0,1 0
2 0,3 0 0,1 0,2
3 0 0,2 0 0
A funo de probabilidade conjunto mostrada na Figura 3.5. Deseja-se determinar:
53
a) P(X 2 e Y 2);
b) P(X = 1).
Fig. 3.5 Degroot, pgina 93.
a) Somando-se p(x, y) para todos os valores de x 2 e y 2, tem-se:
P(X 2 e Y 2) = p(2, 2)+p(2, 3)+p(2, 4)+p(3, 2)+p(3, 3)+p(3, 4) =
0, 5
b) P(X = 1) =

4
y=1
p(1, y) = 0, 2.
3.4.2 Distribuies Conjuntas Contnuas
dito que duas v.a. X e Y possuem uma distribuio conjunta contnua se
existe uma funo f no negativa, denida sobre o plano xy, tal que para qualquer
subconjunto A do plano
P [(x, y) A] =
_
A
_
f(x, y)dxdy (3.6)
A funo f denominada funo densidade de probabilidade conjunta de X
e Y . Esta funo deve satisfazer
f(x, y) 0 para < x < e < y <
54
e
_

f(x, y)dxdy = 1 (3.7)


A probabilidade que o par (X, Y ) pertena a uma regio do plano xy pode ser
encontrada integrando a f.d.p. conjunta sobre esta regio. A Figura 3.5 mostra um
exemplo de f.d.p. conjunta.
Fig. 3.6 Degroot, pgina 95.
3.5 Distribuies Marginais
Denomina-se funo densidade de probabilidade marginal de X funo
densidade de probabilidade de X quando ela obtida atravs da f.d.p. conjunta
de X e Y .
Caso Discreto
Se X e Y so v.a. discretas com f.p. conjunta p(x, y), ento a f.p. marginal de X
obtida por:
P
X
(x) = P(X = x) =

y
p(x, y) (3.8)
55
Similarmente, a f.p. marginal de Y :
P
Y
(y) = P(Y = y) =

x
p(x, y) (3.9)
Exemplo:
Suponha que a varivel aleatria X possa assumir somente of valores 1, 2, e 3, que
a varivel aleatria Y possa assumir somente os valores 1, 2, 3 e 4, e que a funo
de probabilidade conjunta de X e Y seja dada pela tabela:
Y 1 2 3 4 Marginal
X de X
1 0,1 0 0,1 0 0,2
2 0,3 0 0,1 0,2 0,6
3 0 0,2 0 0 0,2
Marginal de Y 0,4 0,2 0,2 0,2 1,0
A f.p. marginal de X determinada somando-se os valores de cada linha da tabela,
e dada na ltima coluna da tabela. Analogamente a f.p. marginal de Y dada na
ltima linha da tabela.
Caso Contnuo
Se X e Y possuem uma distribuio conjunta com f.d.p. conjunta f(x, y), ento a
f.d.p. marginal f
X
(x) de X obtida por:
f
X
(x) =
_

f(x, y)dy (3.10)


Similarmente, a f.d.p. marginal de Y obtida por:
f
Y
(y) =
_

f(x, y)dx (3.11)


Observao
56
Se X e Y forem independentes
P(x, y) = P
X
(x) P
Y
(y) (Caso discreto)
f(x, y) = f
X
(x) f
Y
(y) (Caso contnuo)
Exemplo:
Suponha que X e Y possuam um distribuio contnua conjunta, cuja p.d.f. conjunta
seja denida por:
f(x, y) =
_
3
2
y
2
0 x 2 e 0 y 1,
0 caso contrrio.
a) Determine as p.d.f.s marginais de X e Y ;
b) X e Y so independentes?
c) Determine P(X
1
2
) e P(Y
1
2
)..
Soluo:
a) Tem-se que:
_
1
0
3
2
y
2
dy =
y
3
2
|
1
0
=
1
2
.
Logo, a p.d.f. marginal de X dada por:
f
X
(x) =
_
1
2
0 x 2
0 caso contrrio.
Tem-se que:
_
2
0
3
2
y
2
dx =
3
2
y
2
x |
2
0
= 3y
2
57
Logo, a p.d.f. marginal de Y dada por:
f
Y
(y) =
_
3y
2
0 y 1
0 caso contrrio.
b) Tem-se que f(x, y) = f
X
(x) f
Y
(y). Logo X e Y so independentes.
c)
P(X
1
2
) =
_
2
1
2
1
2
dx =
1
2
x |
2
1
2
=
1
2
_
2
1
2
_
=
3
4
.
P(Y
1
2
) =
_
1
1/2
3y
2
dy = y
3
x |
1
1/2
= 1
1
8
=
7
8
.
3.6 Esperana de Uma Varivel Aleatria
3.6.1 Distribuies Discretas
Suponha que uma varivel aleatria (v.a.) X possua uma distribuio discreta cuja
f.d.p. p(x). A esperana de X, denotada por E(X), um nmero denido por
= E(X) =

x
xp(x) (3.12)
Exemplo
Suponha que uma v.a. X possa assumir somente quatro valores: 2, 0, 1, e4, e que
P(X = 2) = 0.1; P(X = 0) = 0.4; P(X = 1) = 0.3; P(X = 4) = 0.2
Ento
E(x) = 2 (0.1) + 0 (0.4) + 1 (0.3) + 4 (0.2)
= 0.9
58
3.6.2 Distribuies Contnuas
Se uma varivel aleatria (v.a.) X possui uma distribuio contnua com f.d.p. f(x),
ento a esperana E(X) denida por
= E(X) =
_

xf(x)dx (3.13)
Exemplo
Suponha que a f.d.p. de uma v.a. X com uma distribuio contnua seja:
f(x) =
_
2x para 0 < x < 1
0 caso contrrio
Ento
E(X) =
_
1
0
x (2x)dx
=
_
1
0
2x
2
dx
=
2x
3
3
|
1
0
=
2
3
Observao
O nmero E(X) tambm denominado valor esperado de X, ou a mdia de X.
3.6.3 Propriedades da Esperana
P1.
Se a uma constante qualquer
E(X a) = E(X) a
P2.
59
Se a uma constante qualquer
E(aX) = a E(X)
P3.
Se X
1
, X
2
, ..., X
n
so n variveis aleatrias tais que E(X
i
) existe (i = 1, 2, ..., n),
ento
E(X
1
+X
2
+... +X
n
) = E(X
1
) +E(X
2
) + ... +E(X
n
)
P4.
Se X
1
, X
2
, ..., X
n
so n variveis aleatrias independentes, tais que E(X
i
) existe
(i = 1, 2, ..., n), ento
E
_
n

i=1
X
i
_
=
n

i=1
E(X
i
)
Exemplos:
a) Suponha que E(X) = 5. Ento:
E(3X 5) = 3E(X) 5 = 10 e
E(3X + 15) = 3E(X) + 15 = 0
b) Suponha que trs v.a. X
1
, X
2
e X
3
formem uma amostra aleatria de uma
distribuio para o qual a mdia 5. Determinar o valor de E(2X
1
3X
2
+
X
3
4)
E(2X
1
3X
2
+X
3
4) = 2E(X
1
) 3E(X
2
) + E(X
3
) 4
= 2(5) 3(5) + 5 4
= 10 15 + 5 4 = 4
c) Suponha que X
1
, X
2
e X
3
so v.a. independentes tais que E(X
i
= 0) e
60
E(X
2
i
= 1), para i = 1, 2, 3. Determinar E[X
2
1
(X
2
4X
3
)
2
]
E[X
2
1
(X
2
4X
3
)
2
] = E[X
2
1
]E[(X
2
4X
3
)
2
]
= E[X
2
1
]E[(X
2
2
8E(X
2
)E(X
3
) + 16E(X
2
3
)]
= 1[1 8(0)(0) + 16(1)] = 17
3.7 Varincia de uma Varivel Aleatria
Denio
Suponha que X uma v.a. com mdia = E(X). A varincia de x, representada
por V ar(X) denida por
V ar(X) = E
_
(x )
2

, onde = E(X) (3.14)


3.7.1 Variveis Aleatrias Discretas
Suponha que uma v.a. X possua uma distribuio discreta, cuja f.d.p. p(x). Ento
V ar(X) =

x
(x )
2
p(x)
=

x
x
2
p(x)
2
(3.15)
Exemplo:
Suponha que uma v.a. X possa assumir somente quatro valores: 2, 0, 1, e 4, e que
P(X = 2) = 0, 1; P(X = 0) = 0, 4; P(X = 1) = 0, 3; P(X = 4) = 0, 2
Como visto anteriormente, E(X) = 0, 9. Ento
V ar(X) =

x
(x )
2
p(x)
= (2 0, 9)
2
(0, 1) + (0 0, 9)
2
(0, 4) + (1 0, 9)
2
(0.3) + (4 0, 9)
2
(0, 2)
= 3, 09
61
ou
V ar(X) =

x
x
2
p(x)
2
= (2)
2
(0, 1) + (0)
2
(0, 4) + (1)
2
(0.3) + (4)
2
(0, 2) (0, 9)
2
= 0, 4 + 0, 3 + 3, 2 0, 81
= 3, 09
3.7.2 Variveis Aleatrias Contnuas
Suponha que uma v.a. X possua uma distribuio contnua, cuja f.d.p. f(x). Ento
V ar(X) =
_

(x )
2
f(x)dx
=
_

x
2
f(x)dx
2
(3.16)
Exemplo
Suponha que a f.d.p. de uma v.a. X com uma distribuio contnua seja:
f(x) =
_
2x para 0 < x < 1
0 caso contrrio
Como visto anteriormente, E(X) =
2
3
. Ento
V ar(X) =
_
1
0
x
2
(2x)dx
_
2
3
_
2
=
_
1
0
2x
3
dx
_
2
3
_
2
=
2x
4
4
|
1
0

_
2
3
_
2
=
2
4

4
9
=
2
36
3.7.3 Propriedades da Varincia
P1.
V ar(X) = 0 se e somente se existe uma constante c tal que P(X = c) = 1
62
P2.
V ar(aX) = a
2
V ar(X)
P3.
V ar(X +a) = V ar(X)
P4.
V ar(X) = E(X
2
) [E(X)]
2
P5.
Se X
1
, X
2
, ..., X
n
so v.a. independentes, ento
V ar(X
1
X
2
... X
n
) = V ar(X
1
) + V ar(X
2
) +... +V ar(X
n
)
Exemplo:
Seja uma v.a. com mdia e desvio padro . Calcular a mdia e varincia de:
a) Z = 3X 7
b) Z =
X7
2
c) Z =
X

a) E(Z) = 3 7
V ar(Z) = 9
2
b) E(Z) =

2

7
2
V ar(Z) =

2
4
c) E(Z) =

= 0
V ar(Z) =

2

2
= 1
3.8 Momentos
Denio
Para qualquer varivel aleatria (v.a.) X e qualquer inteiro positivo k, a esperana
E(X
k
) denominado k-simo momento de X, ou momento de ordem k
63
3.8.1 Momentos Centrais
Suponha que X seja uma v.a. com E(X) = . Para qualquer inteiro positivo k,
a esperana E
_
(X )
k
_
denominado k-simo momento central de X, ou
k-simo momento em torno da mdia.
Observao
Se a distribuio de X simtrica com respeito sua mdia , e se o momento
central E
_
(X )
k
_
existe para um dado k mpar, ento o valor de E
_
(X )
k
_
ser igual a zero.
3.8.2 Funo Geratriz de Momentos
Denio
Considere uma v.a. X, e para cada nmero real t, seja M
x
(t) a funo
M
x
(t) = E
_
e
tx

(3.17)
Esta funo denominada funo geratriz de momentos (f.g.m.)
A partir da f.g.m. pode-se gerar todos os momentos. Seja M
k
x
(t) a k-sima derivada
de M
x
(t). Ento:
M
1
x
(0) =
_
d
dt
E
_
e
tx
_
_
t=0
= E
__
d
dt
e
tx
_
t=0
_
= E
__
Xe
tx
_
t=0

= E(X) (3.18)
Analogamente, temos
M
k
x
(0) =
_
d
k
dt
k
E
_
e
tx
_
_
t=0
= E
__
d
k
dt
k
e
tx
_
t=0
_
= E
__
X
k
e
tx
_
t=0

= E
_
X
k

(3.19)
64
Portanto:
M
1
x
(0) = E(X), M
2
x
(0) = E(X
2
), M
3
x
(0) = E(X
3
), ...
Exemplo:
Suponha que X seja uma v.a. com f.d.p. dada por
f(x) =
_
e
x
para x > 0
0 caso contrario
Determine a f.g.m. de X, e a V ar(X).
Soluo:
M
x
(t) = E
_
e
tx

=
_

0
e
tx
dx =
_

0
e
(t1)x
dx =
e
(t1)x
t 1
|

0
A integral s ser nita se e somente se t < 1. Neste caso,
M
X
(t) =
1
1 t
M

X
(t) =
1
(1 t)
2
E(X) = 1
M

X
(t) =
2
(1 t)
3
E(X
2
) = 2
Logo, V ar(X) = 2 1
2
= 1
3.8.3 Propriedades das Funes Geradoras de Momentos
P1.
Seja X uma v.a. com f.g.m. M
X
, e seja Y = aX + b, onde a e b so constantes, e
seja M
Y
a f.g.m. de Y . Ento, para qualquer valor de t tal que M
X
(at) exista,
M
Y
(t) = e
bt
M
X
(at) (3.20)
P2.
Suponha que X
1
, X
2
, ..., X
n
sejam n v.a. independentes, e que M
i
(i = 1, 2, ..., n)
seja a f.g.m. de X
i
. Seja Y = X
1
+ X
2
+ ... + X
n
, e seja M
Y
a f.g.m. de Y . Ento
65
para qualquer valor de t tal que M
i
(t) exista,
M
Y
(t) =
n

i=1
M
i
(t) (3.21)
Exemplo:
Suponha que X e Y sejam independentes e identicamente distribuidas (i.i.d.) e que
a f.g.m. de cada uma seja dada por:
M(t) = e
t
2
3
< t < .
Encontre a f.g.m. de Z = 3X Y + 4.
Soluo:
Sejam
X
1
= 3X M
1
(t) = M(3t) = e
9t
2
3
X
2
= Y M
2
(t) = M(t) = e
t
2
3
M
Z
= M(X
1
+X
2
+ 4) = e
4t
M
1
(t)M
2
(t)
= e
4t
(e
9t
2
3
)(e
t
2
3
)
= e
10t
2
+4t6
3.9 Funes de uma Varivel Aleatria
3.9.1 Varivel com Distribuio Discreta
Suponha que uma v.a. X possua uma distribuio discreta, cuja funo de
probabilidade (f.p.) seja p(x), e que outra v.a. Y = r(X) seja denida como uma
certa funo de X. Ento a f.p. (g) de Y pode ser calculada de p de maneira direta:
g(y) = P(Y = y)
= P [r(X) = y]
=

x:r(x)=y
p(x) (3.22)
Exemplo:
Suponha que X seja uma v.a. com f.p. dada por:
P(X = 2) = 0, 2; P(X = 1) = 0, 1; P(X = 0) = 0, 3; P(X = 1) = 0, 2;
P(X = 2) = 0, 1 e P(X = 3) = 0, 1.
Suponha que Y seja outra v.a. tal que Y = 2X
2
3. Qual a f.p. de Y?
66
Soluo:
Como X s pode assumir os valores -2,1, 0, 2 e 3, ento Y = 2X
2
3 poder assumir
os valores -3 (quando X = 0), -1 (quando X = 1 ou 1), 5 (quando X = 2 ou 2),
e 15(quando X = 3).Logo, a f.p. de Y dada por:
P(Y = 3) = P(X = 0) = 0, 3; P(Y = 1) = P(X = 1) + P(X = 1) = 0, 3;
P(Y = 5) = P(X = 2) +P(X = 2) = 0, 3 e P(Y = 15) = P(X = 3) = 0, 1.
3.9.2 Varivel com Distribuio Contnua
Suponha que X seja uma v.a. com distribuio contnua, cuja f.d.p. seja f(x).
Suponha que Y seja outra v.a. denida com uma funo de X, isto , Y = r(X).
Para qualquer nmero y a funo de distribuio acumulada G(y) pode ser
calculada por
G(y) = P(Y y)
= P [r(X) y]
=
_
{x:r(x)y}
f(x)dx. (3.23)
Se a varivel Y tambem possuir uma distribuio contnua, sua funo densidade
de probabilidade g(y) tambem obtida por
g(y) =
dG(y)
dy
(3.24)
Exemplo:
Suponha que X possua uma distribuio uniforme no intervalo (-1,1), isto :
f(x) =
_
1
2
para 1 < x < 1
0 caso contrrio
Determine a f.d.p. de Y = X
2
.
Soluo:
67
Como Y = X
2
0 Y < 1. Ento para qualquer nmero y tal que 0 y < 1,
G(y) = P(Y y) = P(X
2
y) =
= P(

y x

y) =
=
_

y
f(x)dx =
_

y
1
2
dx =
=

y
Logo,
g(y) =
d(

y)
dy
=
1
2

y
para 0 y < 1
Observao:
Em alguns casos, para algumas funes r(X) a f.d.p. de Y pode ser calculada
diretamente, sem ter que derivar primeiro a sua funo de distribuio G(y). Para
tal, algumas condies devem ser satisfeitas, como enunciado abaixo:
Seja uma v.a. com f.d.p. f e para qual P(a < X < b) = 1. Seja Y = r(X),
e suponha que r(x) seja contnua e estritamente crescente ou estritamente
decrescrente para a < x < b. Suponha tambem que a < X < b se e
somente se < Y < , e seja X = s(Y ) a funo inversa para < Y <
Ento a f.d.p. de Y dada por
g(x) =
_
f [s(y)] |
ds(y)
dy
| para < y <
0 caso contrrio
Exemplo:
Suponha que X seja uma v.a. com distribuio exponencial, isto :
f(x) =
_
1

e
x/
para x > 0
0 caso contrrio
Determinar a f.d.p. de Y =

X.
Soluo:
68
Como Y =

X, ento X = Y
2
. Logo,
dx
dy
= 2y. Portanto,
f(y) =
1

e
y
2
/
2y.
Logo,
f(y) =
_
2y

e
y
2
/
para y > 0
0 caso contrrio
Esta distribuio denominada distribuio Rayleigh e muito utilizada em dados
de radar.
3.10 Algumas Distribuies Discretas
3.10.1 Distribuio Binomial
Suponha que certa mquina produza um item defeituoso com probabilidade p (0 <
p < 1) e produza um item no defeituoso com probabilidade q = 1 p. Suponha
que n itens independentes produzidos por essa mquina sejam examinados, e faa X
representar o nmero de itens que so defeituosos. A v.a. X ter uma distribuio
discreta, e os possveis valores de X sero 0, 1, 2, 3, ..., n.
A probabilidade de se obter uma sequncia particular dos n itens contando
exatamente x defeituosos e n x no defeituosos p
x
p
nx
. Como existem
_
n
x
_
sequncias diferentes desse tipo, segue que a funo de probabilidade de X ser:
p(x) = P(X = x) =
_
_
n
x
_
p
x
q
nx
para x = 0, 1, 2, 3, ..., n
0 caso contrrio
Exemplo:
a) Suponha que uma vlvula eletrnica, instalada em determinado circuito,
tenha probabilidade 0,2 de funcionar mais do que 500 horas. Se
ensaiarmos 20 vlvulas, qual ser a probabilidade de que delas,
exatamente k, funcionem mais que 500 horas, k = 0, 1, ..., 20?
Soluo:
Seja X a v.a. que representa o nmero de vlvulas que funcionam mais
69
de 500 horas. X possui uma distribuio binomial. Portanto,
P(X = k) =
_
20
k
_
(0, 2)
k
(0, 8)
20k
para k = 0, 1, 2, 3, ..., 20
Estas probabilidades podem ser encontradas em tabelas da distribuio
binomial. Os resultados so:
P(X = 0) = 0, 012 P(X = 4) = 0, 218 P(X = 8) = 0, 022
P(X = 1) = 0, 058 P(X = 5) = 0, 175 P(X = 9) = 0, 007
P(X = 2) = 0, 137 P(X = 6) = 0, 109 P(X = 10) = 0, 002
P(X = 3) = 0, 205 P(X = 7) = 0, 055 P(X = k) < 0, 001 (k 11)
b) Ser extraida uma amostra de 5 eleitores de uma grande populao, onde
60% votam no PSDB. Qual a probabilidade de:
exatamente 3 dos eleitores escolhidos votarem no PSDB?
pelo menos um dos eleitores votem no PSDB?
ao menos 3 (uma maioria) votem no PSDB?
Soluo: Se X a v.a. que representa o nmero de eleitores que votam no
PSDB, temos que X segue uma distribuio binomial, cuja probabilidade
de "sucesso" (votar no PSDB) em cada tentativa 0,60. Portanto,
P(X = 3) =
_
5
3
_
(0, 6)
3
(0, 4)
2
= 0, 3456
A probabilidade que pelo menos um vote no PSDB dada por
1 P(X = 0) = 1
_
5
0
_
(0, 4)
5
= 1 0, 0102 = 0, 9898
A probabilidade que a maioria votem no PSDB dada por P(X = 3) +
P(X = 4) +P(X = 5), ou seja:
_
5
3
_
(0, 6)
3
(0, 4)
2
+
_
5
4
_
(0, 6)
4
(0, 4)
1
+
_
5
5
_
(0, 6)
5
= 0, 6826
70
3.10.1.1 Mdia de uma v.a. com Distribuio Binomial
Clculo da mdia para distribuio binomial
E(X) =
n

x=0
x p(x)
=
n

x=1
x
n!
x!(n x)!
p
x
q
nx
=
n

x=1
x
n(n 1)!
x(x 1)!(n x)!
pp
x1
q
nx
= np
n

x=1
(n 1)!
(x 1)!(n x)!
p
x1
q
nx
(3.25)
Onde p(x) =
_
n
x
_
p
x
q
nx
Fazendo y = x 1 tem-se
E(X) = np
n1

y=0
_
n1
y
_
p
y
q
n1y
(3.26)
Mas, pela frmula binomial (ver por exemplo Wonnacott, pag. 153)
(p +q)
k
= q
k
+
_
k
1
_
pq
k1
+
_
k
2
_
p
2
q
k2
+. . . +p
k
=
k

i=0
_
k
i
_
p
i
q
ki
(3.27)
Portanto,
E(X) = np (p +q)
n1
(3.28)
Como p +q = 1, temos
E(X) = np (3.29)
71
3.10.1.2 Varincia de uma v.a. com Distribuio Binomial
Para o clculo da varincia ca mais fcil partir-se de
V ar(X) = E(X
2
)
_
E(X)
2
_
(3.30)
O valor de E(X
2
) pode ser encontrado atravs do clculo da esperana de
E {X(X 1)} que denida como:
E {X(X 1)} =

x(x 1)f(x)
=

x(x 1)
n(n 1)(n 2)!
x(x 1)(x 2)!(n x)!
p
2
p
x2
q
nx
= n(n 1)p
2

(n 2)!
(x 2)!(n x)!
p
x2
q
nx
(3.31)
Fazendo y = x 2, a expresso acima se reduz a
= n(n 1)p

(n 2)!
y!(n x)!
p
y
q
ny2
= n(n 1)p
2
(3.32)
Assim,
E {X(X 1)} = E(X
2
X)
= E(X
2
) E(X)
= n(n 1)p
2
(3.33)
72
Como:
V ar(X) = E(X
2
) E(X) + E(X) {E(X)}
2
= n(n 1)p
2
+np n
2
p
2
= np(1 p)
= npq (3.34)
De fato f(x) =
_
n
x
_
p
x
q
nx
de fato uma funo de probabilidade. Para tanto
temos que ter

_
n
x
_
p
x
q
n1
= 1 (3.35)
Como a expanso deste somatrio nada mais que
_
n
0
_
p
0
q
n
+
_
n
1
_
p
1
q
n1
+
_
n
2
_
p
2
q
n2
+... +
_
n
n
_
p
n
q
0
que por sua vez igual a (p +q)
n
, e como p +q = 1 ca demonstrado que f(x) de
fato uma funo de probabilidade.
Exemplo
Em 100 lances de uma moeda honesta, a mdia do nmero de caras
= Np = 100
1
2
= 50 (3.36)
Este o nmero esperado de caras em 100 lances da moeda. O desvio padro :
=
_
Npq =
_
100
1
2

1
2
= 5. (3.37)
Observao
A funo geratriz de momentos de uma distribuio binomial
M
x
(t) =
_
p e
t
+q
_
n
(3.38)
73
3.10.2 Distribuio Hipergeomtrica
Suponha que uma urna contenha A bolas verdes e B bolas azuis. Suponha que se
retire n bolas sem reposio. Seja X v.a. que indica o nmero de bolas verdes obtidas.
Ento
max {0, n B} X min{n, A} .
A funo de probabilidade de X ser:
P(X = x) =
_
A
x
_ _
B
nx
_
_
A+B
n
_ (3.39)
Dizemos que X possui uma distribuio hipergeomtrica. Pode-se provar que:
E(X) =
n A
A +B
(3.40)
V ar(X) =
nAB
(A +B)
2

A +B n
A +B 1
(3.41)
Exemplo:
Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que
uma remessa seja aprovada, um inspetor escolhe 5 desses motores e o inspeciona.
Se nenhum dos motores inspecionados for defeituosos, o lote aprovado. Se
um ou mais forem vericados defeituosos, todos os motores da remessa so
inspecionados. Suponha que existam, de fato, trs motores defeituosos no lote. Qual
a probabilidade de que a inspeo 100 por cento seja necessria?
Soluo:
Seja X a v.a. que representa o nmero de motores defeituosos enecontrado. A
inspeo de todo o lote ser necessria se X 1. Logo,
P(X 1) = 1 P(X = 0) = 1
_
3
0
_ _
47
5
_
_
50
5
_ = 0, 28
74
3.10.3 Distribuio Binomial Negativa
Suponha que em uma sequncia innita de experimentos independentes, o resultado
de cada experimento possa ser sucesso ou falha, e que a probabilidade de sucesso p
onde (0 < p < 1), e de falha q = 1 p.
Seja X a v.a. que denota o nmero de falhas que ocorrem antes que exatamente r
sucessos sejam obtidos. Ento:
P(X = x) =
_
r +x 1
x
_
p
r
q
x
x = 0, 1, 2... (3.42)
Dizemos que X possui uma distribuio binomial negativa.
E(X) =
rq
p
(3.43)
V ar(X) =
rq
p
2
(3.44)
Exemplo:
Suponha que a probabilidade de sair cara em uma moeda seja de 1/3. Suponha
tambm que esta moeda seja jogada at que apaream 5 caras.
a) Calcule a probabilidade de que a quinta cara aparea na dcima segunda
jogada.
b) Qual o nmero esperado de coroas que aparecero antes de se obter 5
caras?
Soluo:
Seja X a v.a. que representa o nmero de coroas que aparecem antes de que a quinta
cara aparea. X possui uma distribuio binomial negativa.
a)
P(X = 7) =
_
11
7
__
1
3
_
5
_
2
3
_
7
75
b)
E(X) =
5.
2
3
1
3
= 10
3.10.4 Distribuio Geomtrica
Dizemos que a v.a. X possui distribuio geomtrica, se X possui uma
distribuio binomial negativa com r = 1
A funo de probabilidade de X ser:
P(X = x) = pq
x
(3.45)
Pode-se provar que:
E(X) =
q
p
; (3.46)
V ar(X) =
q
p
2
(3.47)
Exemplos:
a) Em determinada localidade, a probabilidade da ocorrncia de uma
tormenta em algum dia durante o vero (nos meses de dezembro e janeiro)
igual a 0,1. Admitindo independncia de um dia para outro, qual a
probabilidade da ocrrncia da primeira estao de vero no dia 4 de
janeiro?
Soluo:
Chamando de X o nmero de dias (comeando em 1o. de dezembro) at
a primeira tormenta. Portanto, X possuir uma distribuio geomtrica,
e a probabilidade desejada :
P(X = 34) = (0, 9)
33
(0, 1) = 0, 003
76
b) O custo de realizao de um experimento de R$ 1500,00. Se o
experimento no tiver sucesso, h um custo adicional de R$ 400,00 para
que sejam executadas as correes necessrias. Suponha que as provas
sejam independentes, e que os experimentos sejam executados at que
o primeiro sucesso ocorra. Sendo a probabilidade de sucesso em uma
tentativa qualquer de 0,1, qual ser o custo esperado do procedimento
completo?
Soluo:
Seja X a v.a. que representa o nmero de provas necessrias para alcanar
o primeiro sucesso. Temos que X possuir uma distribuio geomtrica,
com mdia
E(X) =
q
p
=
0, 9
0, 1
= 9.
Seja C o custo de realizao do experimento:
C = 1500X + 400(X 1) = 1900X 400
Logo,
E(C) = 1900E(X) 400 = (1900)9 400 = R$16700, 00
3.10.5 Distribuio de Poisson
Seja X uma v.a. com distribuio discreta, e suponha que X assuma valores inteiros
no negativos. dito que X possui uma distribuio de Poisson com mdia
onde ( > 0) se a funo de probabilidade de X dada por:
P(X = x) = e

x
x!
x = 0, 1, 2, 3, ... (3.48)
Observao
O smbolo e representa uma constante que aproximadamente igual a 2, 7183. O
seu nome uma homenagem ao matemtico suio I. Euler, e constitui a base do
chamado logaritmo natural.
Para determinao da mdia e da varincia de uma v.a. de Poisson, preciso primeiro
77
determinar a sua funo geradora de momento (f.g.m.),
M(t) = E
_
e
tX

x=0
e
tx
e

x
x!
= e

x=0
(e
t
)
x
x!
= e

e
e
t
= e

(
e
t
1
)
Diferenciando teremos
M

(t) = e
t
e
{

(
e
t
1
)}
M

(t) =
_
e
t
_
2
e
{

(
e
t
1
)}
+e
t
e
{

(
e
t
1
)}
Para t = 0 temos
E(X) = m

(0) = (3.49)
V ar(X) = m

(0) (E [X])
2
=
2
+
2
= (3.50)
Portanto, a mdia e a varincia de uma v.a. de Poisson so iguais ao parmetro .
A v.a. de Poisson tem um amplo range de aplicaes em uma grande variedade
de reas, porque se emprega como uma aproximao para uma v.a. binomial com
parmetros (n, p) quando n grande e p pequeno. Supondo que X uma v.a.
78
binomial com parmetros (n, p) e seja = np. Ento
P(X = x) =
n!
(n x)!x!
p
x
(1 p)
nx
=
n!
(n x)!x!
_

n
_
x
_
1

n
_
nx
=
n(n 1)...(n x + 1)
n
x


x
x!

(1 /n)
n
(1 /n)
x
(3.51)
Agora, para n grande e p pequeno
_
1

n
_
n
e

n(n 1)...(n x + 1)
n
x
1
_
1

n
_
x
1
(3.52)
Assim que, para n grande e p pequeno,
P(X = x) e

x
x!
(3.53)
Quer dizer, ao se realizar n experimentos independentes, cada um dos quais tem
como resultado xito com probabilidade p, ento quando n grande e p pequeno, o
nmero de xitos que se apresentam aproximadamente uma v.a. de Poisson com
mdia = np.
Exemplos:
a) Se a probabilidade de um indivduio sofrer uma reao nociva, resultante
de ter tomado um certo soro 0,001, determinar a probabilidade de que,
entre 2000 indivduos:
1) exatamente trs sofrerem a reao;
2) mais do que dois sofrerem a reao.
79
Soluo:
Seja X a v.a. que representa o nmero de pessoas que sofrem a reao
nociva aps injerir o soro. Ento,
P(X = x) = e

x
x!
x = 0, 1, 2, 3, ..,
onde = 2000 0, 001 = 2. Logo,
1)
P(X = 3) = e
2
2
3
3!
= 0, 18
2)
P(X 3) = 1 {P(X = 0) +P(X = 1) +P(X = 2)}
= 1
_
e
2 2
0
0!
+e
2 2
1
1!
+e
2 2
2
2!
_
= 1
_
1
e
2
+
2
e
2
+
2
e
2
_
= 1
5
e
2
= 0, 323
OBS: Se usasse a distribuio binomial os cculos se tornariam
maiores. Por exemplo a primeira questo caria:
P(X = 3) =
_
2000
3
_
(0, 001)
3
(0, 999)
1997
b) Suponha que em um certo nal de semana, o nmero de acidentes num
cruzamento possua uma distribuio de Poisson com mdia 0,7. Qual a
probabilidade de que exista pelo menos trs acidentes no cruzamento
durante o nal de semana?
Soluo:
P(X = x) =
e
0,7
0, 7
x
x!
x = 0, 1, 2, 3, ..,
80
Logo,
P(X 3) = 1 {P(X = 0) + P(X = 1) + P(X = 2)}
= 1
_
e
0,7
+ 0, 7e
0,7
+
0,7
2
e
0,7
2
_
= 1 e
0,7
(1 + 0, 7 + 0, 245)
= 0, 341
c) Dez por cento das ferramentas produzidas por um certo processo de
fabricao revelaram-se defeituosas. Determinar a probabilidade de, em
uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas
sejam defeituosas, mediante o emprego de:
1) distribuio binomial
2) distribuio de Poisson
Soluo:
1)
P(X = 2) =
_
10
2
_
(0, 1)
2
(0, 9)
8
= 0, 1937
2)
= Np = 10(0, 1) = 1
P(X = 2) =
1
2
e
1
2!
=
1
2e
1
= 0, 1839
3.11 Algumas Distribuies Contnuas Importantes
3.11.1 Distribuio Normal
Denio
Dizemos que uma v.a. X possui uma distribuio Normal (ou Gaussiana) com
mdia e varincia
2
( < < e > 0) se X possuir uma distribuio
contnua com f.d.p. dada por:
f(x) =
1

2
e

1
2
(
x

)
2
para < x < (3.54)
81
Mdia
E(X) = (3.55)
Varincia
V ar(X) =
2
(3.56)
Funo Geratriz de Momentos
M
x
(t) = e
t+

2
t
2
2
< x < (3.57)
Teorema 1
Se X possui uma distribuio normal com mdia e varincia
2
, e se Y = aX +b,
onde a e b so constantes, com a = 0, ento Y ter uma distribuio normal com
mdia a +b e varincia a
2

2
Prova
A funo geratriz de momentos de Y ser
M
y
(t) = e
bt
M
x
(at)
= e
bt
e
at+
2
a
2 t
2
2
= e
_
(a+b)t+a
2

2 t
2
2
_
,
(3.58)
que a funo geratriz de momentos de uma distribuio com mdia a+b e varincia
a
2

2
.
3.11.2 Distribuio Normal Padro
A distribuio normal com mdia zero ( = 0) e varincia um (
2
= 1) denominada
distribuio normal padro (0, 1). A f.d.p. de uma distribuio normal padro
82
em geral representada por (x) e dada por
(x) =
1

2
e

x
2
2
< x < (3.59)
Segue do Teorema 1 que se uma varivel X tem uma distribuio normal com mdia
e varincia
2
, ento a varivel
Z =
X

(3.60)
ter uma distribuio normal padro.
As probabilidades para uma distribuio normal com qualquer mdia e varincia
podem ser determinadas atravs de Tabelas de uma distribuio normal padro.
Exemplos:
a) Supondo que a v.a. Z possua uma distribuio normal padro, ento:
i) P(Z > 1, 0) = 1 P(Z 1) = 1 0, 8413 = 0, 1587
ii) P(Z < 1, 0) = P(Z > 1, 0) = 0, 1587
iii) P(1, 0 < Z 1, 5) = P(Z 1, 5) P(Z 1, 0)
= 0, 9332 0, 8413 = 0, 0919
iv) P(1 Z 2) = P(Z 2) P(Z < 1)
= P(Z 2) P(Z > 1)
= P(Z 2) (1 P(Z 1))
= P(Z 2) + P(Z 1) 1
= 0, 9773 + 0, 8413 1 = 0, 8186
v) P(| Z | 2) = P(2 Z 2)
= P(Z 2) P(Z < 2)
= P(Z 2) P(Z > 2)
= P(Z 2) (1 P(Z 2))
= 2 P(Z 2) 1
= 2 0, 9773 1 = 0, 9546
83
b) Suponha que X possua uma distribuio normal com mdia 5 e desvio
padro 2. Ento:
P(1 X 8) = P(
15
2

X


85
2
)
= P(2 Z 1, 5)
= P(Z 1, 5) P(Z < 2)
= P(Z 1, 5) P(Z > 2)
= P(Z 1, 5) (1 P(Z 2))
= P(Z 1, 5) + P(Z 2) 1
= 0, 9332 + 0, 9772 1 = 0, 9104
c) Supor uma populao em que o peso dos indivduos seja distribuido
normalmente com mdia 68 kg e desvio padro 4 kg. Determinar a
proporo de indivduos
i) abaixo de 66 kg
ii) acima de 72 kg
iii) entre 66 e 72 kg
i) P(X < 66) = P(
X

<
6668
4
) = P(Z < 0, 5)
= 1 P(Z 0, 5) = 1 0, 6915 = 0, 3085
ii) P(X > 72) = P(
X

>
7268
4
) = P(Z > 1) = 0, 1587
iii) P(66 X 72) = P(
6668
4

X


7268
4
)
= P(0, 5 Z 1)
= P(Z 1) P(Z < 0, 5)
= 0, 8413 0, 3085 = 0, 5328
Teorema 2
Se as v.a. X
1
, X
2
, ..., X
k
so independentes e se X
i
normalmente distribuida com
mdia
i
e varincia
2
i
com (i = 1, 2, 3, ..., k), ento a soma X
1
+X
2
+... +X
k
ter
uma distribuio normal com mdia
1
+
2
+... +
k
e varincia
2
1
+
2
2
+... +
2
k
.
Prova:
Seja M
i
(t) a f.g.m. de X
i
para (i = 1, 2, ..., k) e seja M(t) a f.g.m. de X
1
+ X
2
+
84
... +X
k
. Como as variveis X
1
, X
2
, ..., X
k
so independentes, ento
M(t) =
k

i=1
M
i
(t)
=
k

i=1
e
_

i
t+

2
i
t
2
_
= e
(

k
i=1

i)
t+
1
2
(

k
i=1

2
i
)
t
para < x <
Esta f.g.m. pode ser identicada como a f.g.m. de uma distribuio normal com
mdia
_

k
i=1

i
_
e varincia
_

k
i=1

2
i
_
. Logo, essa a distribuio de X
1
+ X
2
+
... +X
k
Exemplo:
Suponha que a altura, em inches, de mulheres de uma certa populao segue uma
distribuio normal com mdia 65 e desvio padro 1, e que as alturas dos homens
segue uma distribuio normal com mdia 68 e desvio padro 2. Supor tambm que
uma mulher seja selecionada aleatoriamente e independentemente um homem seja
selecionado aleatoriamente. Determinar a probabilidade que a mulher seja mais alta
que o homem.
Soluo:
Sejam M e H as v.a. que representem as alturas da mulher e do homem,
respectivamente. Ento
M ~ N(65, 1
2
)
H ~ N(68, 2
2
)
Logo, (M H) ~ N(65 68, 1
2
+ 2
2
), isto , (M H) ~ N(3, 5).
Portanto Z =
MH+3

5
~ N(0, 1). Logo,
P(M > H) = P(M H > 0) = P
_
MH+3

5
>
3

5
_
= P
_
Z >
3

5
_
= P(Z > 1, 342) = 1 P(Z < 1, 342)
= 1 0, 9099 = 0, 09
85
Corolrio 1
Se as v.a. X
1
, X
2
, ..., X
k
so independentes, se X
i
possui uma distribuio normal
com mdia
i
e varincia
2
i
onde (i = 1, 2, ..., k), e se a
1
, a
2
, ..., a
k
e b so constantes
para as quais pelo menos um dos valores de a
1
, a
2
, ..., a
k
diferente de zero, ento
a varivel a
1
X
1
+ a
2
X
2
+ ... + a
k
X
k
+ b tem uma distribuio normal com mdia
a
1

1
+a
2

2
+... +a
k

k
+b e varincia a
2
1

2
1
+a
2
2

2
2
+... +a
2
k

2
k
Corolrio 2
Suponha que as v.a. X
1
, X
2
, ..., X
k
formem uma amostra aleatria de uma
distribuio com mdia e varincia
2
, e seja

X a mdia amostral. Ento

X ter
uma distribuio normal com mdia e varincia

2
n
Exemplo:
Suponha que em um certo exame de Matemtica Avanada, os estudantes da
Universidade A obtm notas normalmente distribudas com mdia 625 e varincia de
100, e que os estudantes da Universidade B obtm notas normalmente distribudas
com mdia 600 e varincia de 150. Se dois estudantes da Universidade A e cinco
estudantes da Universidade B fazem este exame, qual a probabilidade que a nota
mdia dos estudantes da Universidade A seja maior que a nota mdia dos estudantes
da Universidade B?
Soluo:
Temos que:

A
= 625
B
= 600

2
A
= 100
2
B
= 150
Portanto a mdia amostral de dois estudantes da Universidade A ( x
A
) normalmente
distribuda com mdia 625 e varincia
100
2
= 50. Analogamente, a mdia amostral de
trs estudantes da Universidade B ( x
B
) normalmente distribuda com mdia 600
e varincia
150
3
= 30, isto ,
x
A
~ N(625, 50)
x
B
~ N(600, 30)
Logo, ( x
A
x
B
) ~ N(625 600, 50 + 30), isto , ( x
A
x
B
) ~ N(25, 80).
Portanto,
P( x
A
> x
B
) = P( x
A
x
B
> 0) = P
_
x
A
x
B
25

80
>
025

80
_
= P
_
Z >
25

80
_
= P(Z > 2, 975) = P(Z < 2, 975) = 0, 9986
86
3.11.3 Teorema do Limite Central
Se as v.a. X
1
, X
2
, ..., X
n
formam uma amostra aleatria de tamanho n de uma certa
distribuio com mdia e varincia
2
onde (0 <
2
< ), ento para qualquer
nmero xado x
lim
n P
_

X
/

n
x
_
= (x), (3.61)
onde (x) a funo distribuio da normal padro.
A interpretao desse teorema a seguinte: Se uma grande amostra aleatria
tomada de qualquer distribuio com mdia e varincia
2
, no importando
se a distribuio discreta ou contnua, ento a distribuio da v.a.

X
/

n
ser
aproximadamente a distribuio normal padro. Portanto a distribuio de

X
ser aproximadamente uma distribuio normal com mdia e varincia

2
n
ou,
equivalentemente, a distribuio da soma

n
i=1
X
i
ser aproximadamente uma
normal com mdia n e varincia n
2
.
Exemplo:
Suponha que uma moeda honesta seja jogada 900 vezes. Qual a probabilidade de se
obter mais de 495 caras?
Soluo:
Para i = 1, 2, . . . , 900, seja X
i
= 1 se cara obtida na i-sima jogada e X
i
= 0 caso
contrrio (distribuio de Bernoulli).
Ento E(X
i
) =
1
2
e V ar(X
i
) =
1
4
. Portanto os valores X
1
, X
2
, X
3
, . . . , X
900
formam
uma amostra aleatria de tamanho n = 900 de um distribuio com mdia
1
2
e
varincia
1
4
. Segue, pelo Teorema do Limite Central, que a distribuio do nmero
de caras H =

900
i=1
X
i
ser aproximadamente uma normal com mdia e varincia
dadas respectivamente por
E(H) = 900
1
2
= 450
V ar(H) = 900
1
4
= 225 (e, consequentemente desvio padro igual a 15).
Portanto a varivel Z =
H450
15
ter aproximadamente uma distribuio normal
padro. Logo,
P(H > 495) = P
_
H450
15
>
495450
15
_
= P(Z > 3) = 0, 0013
87
Distribuio Amostral das Propores:
Admita-se que uma populao innita e que a probabilidade de ocorrncia de
um evento (denominado sucesso) p, enquanto a sua no ocorrncia q = 1 p.
Suponha que este experimento seja realizado n vezes e que para cada uma das
tentativas i, seja denido a v.a. X
i
, tal que X
i
= 1 se ocorrer sucesso na i-sima
tentativa e X
i
= 0 se ocorrer insucesso (i = 1, 2, . . . , n)(X
i
dito possuir uma
distribuio de Bernoulli, com mdia E(X
i
) = p e varincia V ar(X
i
) = pq). Seja P
a proporo de sucessos, isto :
P =

n
i=1
X
i
n
.
Para grandes valores de n segue, pelo Teorema Central do Limite, que P ser
aproximadamente normalmente distribudo com mdia e varincia dadas por:
E(P) = p
V ar(P) =
pq
n
.
Exemplo:
Suponha que a proporo de itens defeituosos em um grande lote de peas seja 0,1.
Qual o menor nmero de itens que deve ser retirado do lote para que a probabilidade
seja de pelo menos 0,99 que a proporo de itens defeituosos na amostra seja menor
que 0,13.
Soluo: Seja P a proporo de defeituosos na amostra. Para n grande tem-se que
P ser aproximadamente normalmente distribudo com mdia = 0, 1 e varincia

2
=
(0,1)(0,9)
n
=
0,09
n
. Quer-se determinar n para que
P(P < 0, 13) 0, 99
88
Portanto,
P
_
_
P

<
0, 13 0, 1
_
0,09
n
_
_
0, 99
Ou seja,
P
_
Z <
0, 03
0,3

n
_
= P
_
Z < 0, 1

n
_
0, 99
Logo, utilizando a tabela da distribuio normal padro, temos que
0, 1

n 2, 33 n 543
3.11.4 Distribuio Uniforme
Sejam e dois nmeros reais tais que ( < ), e considere um experimento no
qual um ponto X selecionado do intervalo S = {x : x } de tal maneira que
a probabilidade de que X pertena a qualquer subintervalo de S proporcional ao
comprimento desse intervalo. A distribuio da v.a. X denominada distribuio
uniforme no intervalo (, ) e dada por
f(x) =
_
1

para x
0 caso contrrio
Esta f.d.p. est representada pela Figura 3.7. Observe que a funo anterior satisfaz
os requisitos para ser uma f.d.p., j que
1

_

dx = 1 (3.62)
A probabilidade de que X esteja em qualquer subintervalo de [, ] igual a
comprimento do subintervalo dividido pelo comprimento do intervalo [, ]. Isso
89
Fig. 3.7 Grco de f(x) de uma funo uniforme
ocorre devido a que, quando [a, b] um subintervalo de [, ] (ver Figura 3.8).
P {a < X < b} =
1

_
b
a
dx
=
b a

(3.63)
Fig. 3.8 Probabilidade de uma varivel aleatria uniforme
90
Exemplo:
Um ponto escolhido ao acaso no segmento de reta [0,2]. Qual ser a a probabilidade
de que o ponto escolhido esteja entre 1 e 1,5?
Seja X a v.a. que representa a coordenada do ponto escolhido. Tem-se que a f.d.p.
de X dada por:
f(x) =
_
1
2
para 0 x 2
0 caso contrrio
Portanto,
P(1 X 1, 5) =
0, 5
2
=
1
4
Mdia
A mdia de uma v.a. uniforme [, ]
E(X) =
_

x

dx
=

2

2
2 ( )
=
( )( +)
2 ( )
(3.64)
ou
E(X) =
+
2
(3.65)
Ou, em outras palavras, o valor esperado de uma v.a. uniforme [, ] igual ao
ponto mdio do intervalo [, ].
Varincia
O clculo da varincia dado por:
V ar(X) = E[X
2
] (E[X])
2
91
mas
E[X
2
] =
1

_

x
2
dx
=

3

3
3 ( )
=
(
2
+ +
2
)
3
(3.66)
Assim
V ar[X] =
(
2
+ +
2
)
3

_
+
2
_
2
=
(
2
+
2
2)
12
=
( )
2
12
(3.67)
3.11.5 Distribuio Exponencial
dito que uma v.a. X possui uma distribuio exponencial com mdia onde
( > 0) se X possui uma distribuio contnua para a qual a f.d.p. f(x) dada por
f(x) =
_
1

para x > 0
0 para x 0
A funo distribuio acumulada da exponencial dada por:
F(x) = P(X x) =
_
x
0
1

= 1 e

para x 0.
Portanto, P(X > x) = e

.
A mdia e varincia de uma v.a. X com distribuio exponencial so dadas por:
E(X) = (3.68)
V ar(X) =
2
(3.69)
92
Observao
Se X possui uma distribuio exponencial ento a v.a. Y =

X possui uma
distribuio Rayleigh, cuja f.d.p. dada por:
f(y) =
2y

y
2

(3.70)
A qual tem mdia e varincia representadas por:
E(X) =
1
2

(3.71)
V ar(X) =
4
4
(3.72)
Exemplo:
Suponha que um fusvel tenha uma durao de vida X, a qual pode ser considerada
uma v.a. contnua com uma distribuio exponencial. Existem dois processos pelos
quais o fusvel pode ser fabricado. O processo I apresenta uma durao de vida
esperada de 100 horas, enquanto o processo II apresenta uma durao de vida
esperada de 150 horas. Suponha que o processo II seja duas vezes mais custoso
(por fusvel) que o processo I, que custa C dlares por fusvel. Admita-se, alm
disso, que se um fusvel durar menos que 200 horas, uma multa de K dlares seja
lanada sobre o fabricante. Qual processo deve ser empregado?
Soluao:
O custo esperado por fusvel para o processo I dado por:
C
I
=
_
C se X > 200
C +K se X 200
Logo,
E(C
I
) = CP(X > 200) + (C +K)P(X 200)
= Ce

200
100
+ (C +K)(1 e

200
100
)
= Ce
2
+ (C +K)(1 e
2
)
= C +K(1 e
2
)
Analogamente, o custo esperado por fusvel para o processo II dado por:
E(C
II
) = 2C +K(1 e

4
3
)
93
Portanto,
E(C
II
) E(C
I
) = C +K(e
2
e

4
3
) = C 0, 13K
Consequentemente, preferimos o processo I, visto que C > 0, 13K.
3.11.6 Distribuio Gama
dito que uma v.a. X possui uma distribuio Gama com parmetro e se X
possui uma distribuio contnua cuja f.d.p. dada por:
f(x) =
_

()
x
1
e
x
para x > 0
0 para x 0
A mdia e varincia de uma v.a. X que possui uma distribuio Gama so dadas
por:
E(X) =

(3.73)
V ar(X) =

2
(3.74)
Observao 1
A distribuio exponencial um caso particular da distribuio Gama, quando =
1.
Observao 2
Se as v.a. X
1
, X
2
, ..., X
k
so independentes e se X
i
possui uma distribuio Gama
com parmetros
i
e (i = 1, 2, ..., k), ento a soma de X
1
+ X
2
+ ... + X
k
possui
uma distribuio Gama com parmetros
1
+
2
+... +
k
e .
3.11.7 Distribuio Normal Bivariada
Diz-se que duas v.a. X
1
e X
2
possuem uma distribuio Normal Bivariada se a
f.d.p. conjunta de X
1
e X
2
for dada por:
f(x
1
, x
2
) =
1
2(1
2
)
1/2
e
_

1
2(1
2
)
_
_
x
1

1
_
2
2
_
x
1

1
__
x
2

2
_
+
_
x
2

2
_
2
__
(3.75)
94
onde:
E(X
1
) =
1
V ar(X
1
) =
2
1
E(X
2
) =
2
V ar(X
2
) =
2
2
e
=
Cov(X
1
,X
2
)

2
= Cor(X
1
, X
2
)
Observao
X
1
e X
2
so independentes se e somente se forem no correlacionadas.
3.11.8 Distribuio Normal Multivariada
Diz-se que:
X =
_

_
X
1
X
2
.
.
.
X
n
_

_
possue uma distribuio normal multivariada se a f.d.p. conjunta de
X
1
, X
2
, ..., X
n
for dada por:
f(X) =
1
(2)
n/2
|

|
1/2
e
_

1
2
(
X
)
T
1
(X)
_
(3.76)
onde:
o vetor mdias;

a matriz de covariancia;
1

a inversa de

; e
|

| o determinante de

.
95
e
= E(X)

= E
_
(X )(X )
T

ou seja:

i
= E(X
i
)

ij
= E [(X
i

i
)(X
j

j
)]
96
CAPTULO 4
INFERNCIA ESTATSTICA
4.1 Introduo
Um problema de inferncia estatstica um problema no qual os dados de uma
certa populao com uma distribuio de probabilidades desconhecida precisam ser
analizados, e algum tipo de inferncia sobre essa distribuio desconhecida precisa
ser feito. Essa inferncia feita atravs dos dados de uma amostra.
4.1.1 Parmetros de uma distribuio
Num problema de inferncia estatstica, qualquer caracterstica da distribuio
dos dados, tais como a mdia ou varincia
2
, denominada parmetro da
distribuio.
4.1.2 Estatstica
Denomina-se estatstica ao valor calculado inteiramente a partir da amostra.
Exemplos de estatsticas so

X,
2
, mediana, moda, desvio mdio, etc.
4.1.3 Estimao Pontual e por Intervalo
Suponha que alguma caracterstica dos elementos de uma populao seja
representada pela v.a. X, cuja f.d.p. f(x; ), onde a forma dessa densidade seja
conhecida, exceto pelo parmetro desconhecido, que se deseja estimar.
Suponha que os valores x
1
, x
2
, ..., x
k
de uma amostra aleatria X
1
, X
2
, ..., X
k
possam
ser observados. Com base nesses valores observados deseja-se estimar o valor
desconhecido de . A estimao pode ser obtida de duas maneiras: estimao
pontual eestimao por intervalo. Na estimao pontual determina-se uma
estatstica cujo valor representa, ou estima o parmetro . Na estimao por
intervalo, determina-se um intervalo para o qual a probabilidade que ele contenha
o valor possa ser determinado.
4.2 Estimao Pontual
Apresentamos aqui dois mtodos para se encontrar estimadores pontuais: mtodos
dos momentos e mtodo da mxima verossimilhana
97
4.2.1 Mtodo dos Momentos
Seja

r
= E(X
4
) o r-simo momento de X. Em geral,

r
ser uma funo conhecida
dos parmetros desconhecidos
1
,
2
, ...,
k
.
Seja m

r
o r-simo momento amostral,i.e.,
m

r
=
1
n
k

i=1
x
r
i
(4.1)
O mtodo dos momentos consiste em se resolver as k equaes
m

j
=

j
j = 1, 2, ..., k.
Obs: O primeiro momento amostral m

1
representado por x.
Exemplos:
a) Determinar o estimador pontual pelo mtodo dos momentos do
parmetro da distribuio Rayleigh.
Soluo:
Sabemos, pelo captulo 3, que se uma v.a. X possui distribuio Rayleigh
com parmetro , sua f.d.p. dada por:
f(x) =
2x

x
2

para x > 0
A mdia de X dada por:
E(X) =
1
2

Portanto, o estimador dos momentos de ser obtido igualando-se o


primeiro momento populacional ao primeiro momento amostral:
1
2
_
= x
Logo,
=
4 x

98
b) Determinar os estimadores dos momentos para os parmetros e
2
da
distribuio Normal.
Soluo
Sabemos que se uma v.a. X possui distriubio Normal com parmetros
e
2
, ento:
E(X) =
V ar(X) =
2
Como V ar(X) = E(X
2
) [E(X)]
2
, seu segundo momento ser
E(X
2
) =
2
+
2
Igualando-se os dois primeiros momentos populacionais aos dois primeiros
momentos amostrais tem-se:
= x

2
=

n
i=1
x
2
i
n
x
2
=

n
i=1
(x
i
x)
2
n
c) Determinar os estimadores dos parmetros e da distribuio Gama
pelo mtodo dos momentos. (Fazer na srie de exerccios)
4.2.2 Mtodo da Mxima Verossimilhana
Denio 1: Funo de Verossimilhana
A funo de verossimilhana de n v.a. X
1
, X
2
, ..., X
n
denida como sendo a
densidade conjunta das n v.a., f(x
1
, x
2
, ..., x
n
; ), que considerada como sendo
uma funo de . Em particular, se X
1
, X
2
, ..., X
n
uma amostra aleatria de uma
densidade f(x; ), ento a funo de verossimilhana
L(; x
1
, x
2
, ..., x
n
) = f(x
1
; )f(x
2
; )...f(x
n
; ).
Denio 2: Estimador de Mxima Verossimilhana
Seja L() = L(; x
1
, x
2
, ..., x
n
) a funo de verossimilhana das v.a. X
1
, X
2
, ..., X
n
.
Se

o valor de que maximiza L(), ento

(X
1
, X
2
, ..., X
n
) o estimador
de mxima verossimilhana de , e

(x
1
, x
2
, ..., x
n
) a estimativa de mxima
verossimilhana de para a amostra x
1
, x
2
, ..., x
n
.
99
Os casos mais importantes que consideraremos so aqueles que X
1
, X
2
, ..., X
n
formam uma amostra aleatria de uma densidade f(x; ), de tal modo que:
L() = f(x
1
; )f(x
2
; )...f(x
n
; ).
Ento, o estimador de mxima verossimilhana a soluo da equao
dL()
d
= 0 (4.2)
Alm disso, L() e log L() possuem seus mximos para o mesmo valor de , e muitas
vezes mais fcil encontrar o mximo do logaritmo da funo de verossimilhana.
Se a funo de verossimilhana contm k parmetros
1
,
2
, ...,
k
, os estimadores de
mxima verossimilhana sero a soluo das k-equaes
L(
1
,
2
, ...,
k
)

1
= 0
L(
1
,
2
, ...,
k
)

2
= 0
.
.
.
.
.
.
.
.
.
L(
1
,
2
, ...,
k
)

k
= 0
Exemplo:
Determinar os estimadores dos parmetros e
2
da distribuio Normal pelo
mtodo de Mxima Verossimilhana.
Soluo:
L(,
2
) = f(x
1
; ,
2
)f(x
2
; ,
2
)...f(x
n
; ,
2
).
=
1

2
e

1
2
(
x
1

)
2
1

2
e

1
2
(
x
2

)
2
. . .
1

2
e

1
2
(
x
n

)
2
=
1
(2
2
)
n/2
e

n
i=1
_

1
2
(
x
i

)
2
_
ln L(,
2
) =
n
2
ln
2

n
2
ln(2)
n

i=1
_
1
2
_
x
i

_
2
_
100
L(,
2
)

=
1

2
n

i=1
(x
i
) =

n
i=1
x
i
n

2
Igualando-se a zero a derivada acima, tem-se que o estimador de mxima
verossimilhana de ,
=

n
i=1
x
i
n
= x
Analogamente,
L(,
2
)

2
=
n
2
2
+

n
i=1
(x
i
)
2
2
4
=
n
2
+

n
i=1
(x
i
n)
2
2
4
= 0
Igualando-se a zero a derivada acima, e substituindo-se o estimador de encontrado
acima, tem-se que o estimador de mxima verossimilhana de
2

2
=

n
i=1
(x
i
x)
2
n
4.3 Estimadores No Tendenciosos
Um estimador

um estimador no tendencioso de um parmetro , se E(

) = ,
para todo possvel valor de . Em outras palavras, um estimador do parmetro
no tendencioso se sua esperana (ou mdia) igual ao verdadeiro valor
(desconhecido) de
Exemplo:
Vimos que os estimadores dos momentos e de mxima verossimilhana de e
2
da
distribuio normal so dados por:
= x

2
=

n
i=1
(x
i
x)
2
n
Provar que x um estimador no tendencioso de , mas

2
um estimador
tendencioso de
2
. Encontrar um estimador no tendencioso de
2
. (Fazer como
srie de exerccios).
101
4.4 A Distribuio
2
Uma distribuio Gama com =
n
2
e =
1
2
denominada distribuio
2
com n
graus de liberdade, e sua f.d.p. dada por
f(x) =
_
1
2
n/2
(
n
2
)
x
n
2
1
e

x
2
para x > 0
0 para x 0
A mdia e varincia de uma v.a. X que possui uma distribuio
2
so dadas por:
E(X) = n (4.3)
V ar(X) = 2n (4.4)
Teorema 1:
Se as variveis X
1
, X
2
, ..., X
k
so independentes e se X
i
possui uma distribuio
2
com n
i
graus de liberdade (i = 1, 2, ..., k), ento a soma X
1
+ X
2
+ ... + X
k
possui
uma distribuio
2
com n
1
, n
2
, ..., n
k
graus de liberdade.
Teorema 2:
Se as v.a. X
1
, X
2
, ..., X
k
so independentes e identicamente distribuidas, cada uma
delas com distribuio normal padro ento a soma X
2
1
+ X
2
2
+, ..., X
2
k
possui uma
distribuio
2
com k graus de liberdade.
Exemplo:
Suponha que X
1
, X
2
, ..., X
n
formem uma amostra aleatria de uma distribuio
normal com mdia e varincia
2
. Encontre a distribuio de
a)
n(

X )
2

2
b)

n
i=1
(X
i
)
2

2
.
Soluo
102
a) Sabemos que

X
/

n
~ N(0, 1)
Portanto,
(

X )
2

2
/n
~
2
1
b) Temos que
X
i

~ N(0, 1)
Portanto,
(X
i
)
2

2
~
2
1
Somando estas n v.a., tem-se que

n
i=1
(X
i
)
2

2
~
2
n
.
Observao:
1. Se for substituido por

X, ento temos que

n
i=1
(X
i


X)
2

2
~
2
n1
.
Ou seja,
(n 1)s
2

2
~
2
n1
, onde s
2
=

n
i=1
(X
i


X)
2
n 1
2. Pela esperana e varincia de uma v.a. com distribuio
2
, temos que:
E
_
(n 1)s
2

2
_
= n 1 E(s
2
) =
2
Ou seja, a varincia amostral, com divisor (n-1), um estimador no tendencioso
103
da varincia populacional. Alm disto,
V ar
_
(n 1)s
2

2
_
= 2(n 1)
(n 1)
2

4
V ar(s
2
) = 2(n 1) V ar(s
2
) =
2
4
n 1
Exemplo:
Suponha que X
1
, X
2
, ..., X
n
formem uma amostra aleatria de uma distribuio
normal com mdia e varincia
2
. Supondo que n = 16, determine of valores
das seguintes probabilidades:
a) P
_

2
2

1
n
n

i=1
(X
i
)
2
2
2
_
b) P
_

2
2

1
n
n

i=1
(X
i


X)
2
2
2
_
Soluo:
a) P
_

2
2

1
n
n

i=1
(X
i
)
2
2
2
_
= P
_
n
2

n
i=1
(X
i
)
2

2
2n
_
= P
_
8
2
16
32
_
= 0, 99 0, 05 = 0, 94
b) P
_

2
2

1
n
n

i=1
(X
i


X)
2
2
2
_
= P
_
n
2

n
i=1
(X
i


X)
2

2
2n
_
= P
_
8
2
15
32
_
= 0, 995 0, 10 = 0, 985
4.5 A Distribuio t-student
Considere duas v.a. independentes Y e Z tais que Y possua uma distribuio normal
padro, e Z possua uma distribuio
2
com n graus de liberdade. Suponha que uma
104
v.a. X seja denida por
X =
Y
_
Z
n
_1
2
(4.5)
Ento a distribuio de X denominada distribuio t-student com n graus
de liberdade.
4.5.1 Distribuio da Mdia Amostral
Suponha que X
1
, X
2
, ..., X
n
formem uma amostra aleatria de uma distribuio
normal com mdia e varincia
2
. Sabemos que

n
(0, 1)
e

n
(X
i


X)
2

2

2
n1
Logo,

n
_

n
(X
i


X)
2

2
(n1)
_1
2
=

n(

X )
s
t
n1
(4.6)
Exemplo:
Suponha que X
1
, X
2
, ..., X
n
formem uma amostra aleatria de uma distribuio
normal com mdia e varincia
2
desconhecidos. Sejam

X e s
2
respectivamente
a mdia e a varincia amostral dos X
i
s. Para um tamanho de amostra n = 16,
encontre o valor de k tal que:
P(

X > +ks) = 0, 05
P
_
(

X )

n
s
> k

n
_
= 0, 05
105
P(t
n1
> k

n) = P(t
15
> 4k) = 0, 05
Logo, 4k = 1, 753. Ou seja, k = 0, 438.
4.5.2 Distribuio da diferena de mdias amostrais
Considere duas amostras aleatrias
X
A
1
, X
A
2
, ..., X
A
n
A
X
B
1
, X
B
2
, ..., X
B
n
B
com n
A
e n
B
elementos, obtidas independentemente de duas populaes A e B,
normalmente distribudas com mdias
A
e
B
e varincias
2
A
=
2
B
=
2
,
respectivamente. Sejam:

X
A
=

n
A
i=1
X
A
i
n
A
e

X
B
=

n
B
i=1
X
B
i
n
B
as mdias respectivas das duas amostras.
Temos ento que:

X
A


X
B
~ N
_
_

B
,

2
A
n
A
+

2
B
n
B
_
_
Portanto,
(

X
A


X
B
) (
A

B
)
_

2
A
n
A
+

2
B
n
B
~ N(0, 1)
Temos tambm que:
(n
A
1)s
2
A

2
A
~
2
n
A
1
, e
(n
B
1)s
2
B

2
B
~
2
n
B
1
Logo,
(n
A
1)s
2
A

2
A
+
(n
B
1)s
2
B

2
B
~
2
n
A
+n
B
2
106
Pela denio da distribuio t-student, e considerando
2
A
=
2
B
=
2
, temos que:
(

X
A


X
B
)(
A

B
)
_
1
n
A
+
1
n
B
_
(n
A
1)s
2
A
+(n
B
1)s
2
B
n
A
+n
B
2
~ t
n
A
+n
B
2
4.6 Distribuio F
Considere duas v.a. independentes Y e Z tais que Y possua uma distribuio
2
com
m graus de liberdade, e Z possua uma distribuio
2
com n graus de liberdade.
Suponha que uma v.a. X seja denida por
X =
Y/m
Z/n
=
nY
mZ
(4.7)
Ento a distribuio de X denominada distribuio F com m e n graus de
liberdade.
Propriedade da distribuio F:
Se uma varivel aleatria X possui uma distribuio F com com m e n graus de
liberdade, ento 1/X possui uma distribuio F com com n e m graus de liberdade.
4.6.1 Distribuio da Razo entre duas Varincias Amostrais
Suponha que X
1
, X
2
, ..., X
n
formem uma amostra aleatria de m observaes de
uma distribuio normal com mdia
1
e varincia
2
1
desconhecidos, e suponha que
Y
1
, Y
2
, ..., Y
n
formem uma amostra aleatria de n observaes de uma distribuio
normal com mdia
2
e varincia
2
2
desconhecidos. Sabemos que

m
i=1
(X
i


X)
2

2
1
=
(m1)s
2
1

2
1

2
m1
e

n
i=1
(Y
i


Y )
2

2
2
=
(n 1)s
2
2

2
2

2
n1
107
Logo,
s
2
1
/
2
1
s
2
2
/
2
2
F
m1,n1
(4.8)
Se
2
1
=
2
2
, ento
s
2
1
s
2
2
F
m1,n1
(4.9)
Exemplo:
Suponha que uma amostra de tamanho 6 seja retirada de uma populao
normalmente distribuda com mdia
1
e varincia 30, e que uma amostra de
tamanho 3 seja retirada de uma outra populao normalmente distrbuda com
mdia
2
e varincia 76. Qual a probabilidade de s
2
1
> s
2
2
?
Soluo:
P(s
2
1
> s
2
2
) = P
_
s
2
1
s
2
2
> 1
_
= P
_
s
2
1
/
2
1
s
2
2
/
2
2
>

2
2

2
1
_
= P(F
5,29
>
76
30
) = P(F
5,29
> 2, 5) = 0, 05
4.7 Estimao por Intervalos - Intervalos de Conana
4.7.1 Intervalo de Conana para a Mdia Populacional
1 - Desvio Padro () conhecido
Como

X
/

n
(0, 1), (4.10)
podemos determinar, pela tabela da distribuio normal padro, o nmero z

2
tal
que P(Z > z

2
) =

2
, e portanto, :
P
_
z

X
/

n
z

2
_
= 1 ,
108
ou seja
P
_

X z

n


X +z

n
_
= 1 . (4.11)
Chamando de L
1
o limite inferior e L
2
o limite superior, isto :
L
1
=

X z

n
(4.12)
L
2
=

X +z

n
, (4.13)
dizemos que o intervalo (L
1
, L
2
) um intervalo de conana para com coeciente
de conana (1 ), ou em outras palavras, que cai no intervalo (L
1
, L
2
) com
conana .
Exemplo:
Suponha que se extraia uma amostra de tamanho 35 de uma populao com mdia
e desvio padro conhecido e iqual a 3,90. Suponha que a mdia amostral seja 44,8.
Determinar um intervalo com 95% de conana para .
Soluo:
Temos que:
L
1
= 44, 8 1, 96
3, 90

35
= 43, 51 (4.14)
L
2
= 44, 8 + 1, 96
3, 90

35
= 46, 09. (4.15)
Logo, o intervalo com 95% de conana para [43, 51; 46, 09]
2 - Desvio Padro () desconhecido
Como

X
s/

n
t
n1
, (4.16)
podemos determinar, pela tabela da distribuio t-student com n 1 g.l., o nmero
t

2
,(n1)
tal que P(T > t

2
,(n1)
) =

2
, e portanto, :
P
_
t

2
,(n1)

X
s/

n
t

2
,(n1)
_
= 1 ,
109
ou seja
P
_

X t

2
(n1)
s

n


X +t

2
(n1)
s

n
_
= 1 . (4.17)
Portanto o intervalo
_

X t

2
(n1)
s

n
,

X +t

2
(n1)
s

n
_
um intervalo de conana para com coeciente de conana (1 ).
Exemplo:
Suponha que se extraia uma amostra de tamanho 25 de uma populao com mdia
e desvio padro desconhecido. Suponha que a mdia amostral seja 4,004 e o desvio
padro amostral seja 0,366. Determinar intervalos com 95% e 99%de conana para
.
Soluo:
Temos que t
0,025; 24
= 2, 064:
L
1
= 4, 004 2, 064
0, 366

25
= 3, 853 (4.18)
L
2
= 4, 004 + 2, 064
0, 366

25
= 4, 155 (4.19)
(4.20)
Logo, o intervalo com 95% de conana para [3, 853; 4, 155].
Analogamente, temos que t
0,005; 24
= 2, 797:
L
1
= 4, 004 2, 797
0, 366

25
= 3, 799 (4.21)
L
2
= 4, 004 + 2, 797
0, 366

25
= 4, 209 (4.22)
(4.23)
Logo, o intervalo com 95% de conana para [3, 799; 4, 209].
110
4.7.2 Intervalo de Conana para a Varincia Populacional
2
Vimos que
(n 1)s
2

2

2
n1
. (4.24)
Logo, podemos determinar pela tabela da distribuio
2
com n1 g.l., os nmeros

2
(1

2
),[n1]
e
2

2
,[n1]
tal que:
P
_

2
(1

2
),[n1]

(n 1)s
2

2

2

2
,[n1]
_
= 1 ,
ou seja
P
_
(n 1)s
2

2
,[n1]

2

(n 1)s
2

2
(1

2
),[n1]
_
= 1 . (4.25)
Portanto o intervalo
_
(n 1)s
2

2
,[n1]
,
(n 1)s
2

2
(1

2
),[n1]
_
um intervalo de conana para
2
com coeciente de conana (1 ).
Exemplo:
Suponha que seja retirada uma amostra de tamanho cinco de uma populao
normalmente distribuida, e que se tenha encontrado uma varincia amostral de 13,52.
Construa um intervalo com 95% de conana para a varincia populacional.
Soluo:
Temos que
2
0,975; 4
= 0, 484 e
2
0,025; 4
= 11, 143. Portanto, os limites inferior e
superior do I.C. de 95% para
2
so:
L
1
=
(n 1)s
2

2
,[n1]
=
4(13, 52)
11, 143
= 4, 85
111
L
2
=
(n 1)s
2

2
(1

2
),[n1]
=
4(13, 52)
0, 484
= 111, 74
Portanto, P(4, 85
2
111, 74) = 0, 95.
4.7.3 Intervalo de Conana para a diferena de mdias de duas
Populaes
1 - Varincias
2
1
e
2
2
Conhecidas
Como

X
1

n
1
(0, 1)
e

X
2

n
2
(0, 1). (4.26)
Logo
(

X
1


X
2
) (
1

2
)
_

2
1
n
1
+

2
2
n
2
(0, 1) (4.27)
Portanto o intervalo de conana para
1

2
com coeciente de conana 1
dado por
_
_
(

X
1


X
2
) z
/2

2
1
n
1
+

2
2
n
2
, (

X
1


X
2
) + z
/2

2
1
n
1
+

2
2
n
2
_
_
2 -
2
1
e
2
2
Desconhecidas mas
2
1
=
2
2
Vimos que
( x
1
x
2
)(
1

2
)

1/n
1
+1/n
2
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
n
1
+n
2
2
t
n
1
+n
2
2
(4.28)
Logo, o intervalo de conana para
1

2
, quando
2
1
=
2
2
, com coeciente de
112
conana 1 dado por
_
_
( x
1
x
2
) t
/2,[n
1
+n
2
2]

(n
1
1)s
2
1
+ (n
2
1)s
2
2
n
1
+n
2
2

_
1
n
1
+
1
n
2
_
_
Exemplo:
Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia de
1400 horas e desvio padro de 120 horas. Uma amostra de 20 lmpadas eltricas,
da marca B, apresentou a vida mdia de 1200 horas e o desvio padro de 100 horas.
Supondo que
A
=
B
, determinar os limites de conana de a) 95% e b) 99% para
a diferena entre as vidas mdias das populaes das marcas A e B.
Soluo:
a) Para 1 = 0, 95 tem-se que t
0,025,28
= 2, 048. Portanto, o I.C. de 95% para

B
ser:
_
(1400 1200) 2, 048
_
9(120)
2
+ 19(100)
2
28

_
1
10
+
1
20
_
= (200 67, 77)
Ou seja,
P(132, 23
A

B
267, 77) = 0, 95
b) Analogamente, para 1 = 0, 99 tem-se que t
0,005,28
= 2, 763. Portanto, o I.C.
de 99% para
A

B
ser:
_
(1400 1200) 2, 763
_
9(120)
2
+ 19(100)
2
28

_
1
10
+
1
20
_
= (200 91, 43)
Ou seja,
P(108, 57
A

B
291, 43) = 0, 99
113
4.7.4 Intervalo de Conana para Razo das Varincias
2
1
/
2
2
Vimos que
s
2
2
/
2
2
s
2
1
/
2
1
F
n
2
1,n
1
1
(4.29)
Logo, podemos determinar pela tabela da distribuio F com n
2
1 e n
1
1 g.l.,
os nmeros F
(1/2),[n
2
1],[n
1
1]
e F
/2,[n
2
1],[n
1
1]
tal que:
P
_
F
(1/2),[n
2
1],[n
1
1]

s
2
2

2
1
s
2
1

2
2
F
/2,[n
2
1],[n
1
1]
_
1 (4.30)
ou
P
_
1
F
/2,[n
1
1],[n
2
1]

s
2
1
s
2
2


2
1

2
2
F
/2,[n
2
1],[n
1
1]

s
2
1
s
2
2
_
1 (4.31)
Exemplo:
Duas mquinas A e B produzem parafusos com o mesmo tamanho mdio. Duas
amostras de tamanho n
A
= 61 e n
B
= 41 dos parafusos de A e B foram analisadas
e os desvios padres amostrais foram s
2
A
= 3, 5 mm e s
2
B
= 4, 5 mm. Determine um
intervalo de 95% de conana para

2
A

2
B
.
Soluo:
Tem-se que F
0,975,40,60
= 1/F
0,025,60,40
= 1/1, 80 = 0, 556 e F
0,025,40,60
= 1, 74.Logo,
P
_
0, 556
3, 5
4, 5


2
A

2
B
1, 74
3, 5
4, 5
_
= 0, 95
P
_
0, 432

2
A

2
B
1, 353
_
= 0, 95
4.7.5 Intervalo de Conana para uma Proporo
Admita-se que uma populao innita e que a probabilidade de ocorrncia de um
evento (denominado de sucesso) seja p. Considerem-se todas as amostras possveis
de tamanho n extraidas da populao e, para cada amostra, determinaremos a
proporo p de sucessos.
114
Vimos que:
E( p) = p (4.32)
V ar( p) =
p(1 p)
n
(4.33)
Vimos tambem que para grandes valores de n, a distribuiop de p uma normal,
isto
p
_
p,
p(1 p)
n
_
(4.34)
Portanto, o intervalo de conana para p, com coeciente 1 dado por:
_
p z
/2
_
p(1 p)
n
, p +z
/2
_
p(1 p)
n
_
(4.35)
Para n grande, em geral substitui-se p por p, resultando em:
P
_
p z
/2
_
p(1 p)
n
p p +z
/2
_
p(1 p)
n
_
= 1
4.7.6 Intervalo de Conana para Diferena de Propores
Sejam duas propores p
1
e p
2
, e suas respectivas propores amostrais p
1
e p
2
,
baseadas em amostras de tamanhos n
1
e n
2
. Para grandes tamanhos de amostra
tem-se que:
p
1
p
2

_
p
1
p
2
,
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
(4.36)
Portanto, o intervalo de conana para p
1
p
2
, com coeciente de conana 1
dado por:
_
_
( p
1
p
2
) z
/2

p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
_
115
CAPTULO 5
TESTES DE HIPTESES
Consideraremos aqui problemas estatsticos envolvendo um parmetro cujo valor
desconhecido mas deve cair dentro de um certo domnio (isto , o conjunto
de todos os possveis valores de ). Vamos supor que possa ser particionado em
2 (dois) subconjuntos distintos
0
e
1
, e que o estatstico deva decidir se o valor
desconhecido de cai em
0
ou em
1
.
5.1 Hiptese Nula e Hiptese Alternativa
Seja H
0
a hiptese de que
0
e H
1
a hiptese de que
1
, isto :
H
0
:
0
H
1
:
1
Como
0
e
1
so disjuntos (
0

1
= ), somente umas das hipteses so
verdadeiras. O estatstico deve decidir se aceita H
0
ou se aceita H
1
. Um problema
desse tipo chamado um problema de teste de hipteses.
H
0
denominada hiptese nula, e
H
1
denominada hiptese alternativa
5.2 Regio Crtica do Teste
O procedimento adotado para decidir se ele aceita H
0
ou aceita H
1
denominado
procedimento do teste, ou simplesmente teste.
Suponha que antes de decidir se aceita ou no a hiptese nula, ele observa
uma amostra aleatria X
1
, X
2
, ..., X
n
. Seja S o espao amostral do vetor

X =
(X
1
, X
2
, ..., X
n
), isto , S o conjunto de todos os possveis resultados da amostra.
Num problema desse tipo o estatstico especica um procedimento de teste que
consiste em dividir o espao amostral em dois subconjuntos: um deles consiste dos
valores da amostra para o qual ele aceita H
0
, e o outro contem os valores para o
qual ele rejeita H
0
.
117
O subconjunto para o qual H
0
ser rejeitada chamada regio crtica do teste.
O complemento da regio crtica contem portanto todos os possveis valores para o
qual H
0
ser aceita.
5.3 Erros do Tipo I e Erros do tipo II
Quando estabelecemos um procedimento do teste, podemos incorrer em dois tipos
de erros:
a) O de rejeitar H
0
quando ela de fato verdadeira. Este erro denominado
erro do tipo I. A probabilidade () deste tipo de erro ocorrer
controlada pelo estatstico e denominada nvel de signicncia do
teste.
b) O de aceitar H
0
quando H
1
verdadeira. Este erro denominado erro
do tipo II. A probabilidade deste erro ocorrer representada por .
A Tabela 5.1 mostra os dois tipos de erros.
TABELA 5.1 Representao do erros do tipo I e II
. H
0
verdadeira H
0
falsa
aceita H
0
1 (Coef. de conana)
rejeita H
0
(nvel de signicncia) 1 (poder do Teste)
5.4 Teste da hiptese de que a mdia populacional tem um valor
especco
5.4.1 conhecido
H
0
: =
0
H
1
: =
0
118
1. Retira-se uma amostra de tamanho n e calcula-se

X.
2. Calcula-se o valor da estatstica
Z =

X
0
/

n
3. Sob a hiptese nula, tem-se que Z possui uma distribuio normal padro.
Portanto,
Rejeita-se H
0
se | Z |> Z
/2
(isto , se Z < Z
/2
ou Z > Z
/2
)
Aceita-se H
0
se | Z |< Z
/2
(isto , Z
/2
Z Z
/2
),
onde o nvel de signicncia do teste.
5.4.2 desconhecido
H
0
: =
0
H
1
: =
0
Calcula-se a estatstica
t =

X
0
s/

n
Sob a hiptese nula, tem-se que t possui uma distribuio t-Student com n1 graus
de liberdade. Portanto,
Rejeita-se H
0
se | t |> t
/2,[n1]
Aceita-se H
0
se | t | t
/2,[n1]
Observao
Se os testes das sees (5.4.1 e 5.4.2) tiverem uma hiptese alternativa unilateral
(i.e. se H
1
: >
0
, ou H
1
: <
0
) o teste dever rejeitar unilateralmente (i.e. se
t > t
,[n1]
, ou t < t
,[n1]
, respectivamente.)
119
Exemplos:
1. Uma mquina automtica para encher pacotes de caf enche-os segundo uma
distribuio normal, com mdia e varincia sempre igual a 400 g
2
. A mquina
foi regulada para = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes
para vericar se a produo est sob controle, isto , se = 500g ou no. Se uma
dessas amostras apresentasse uma mdia amostral de 492 g, voc pararia ou no a
produo para regular mquina, considerando o nvel de signicncia de 1%? Para
quais valores de mdia amostral a mquina ser regulada?
Soluo:
As hipteses so:
H
0
: = 500
H
1
: = 500
Pelos dados do problema a varincia sempre a mesma e igual a
2
= 400. A
estatstica a ser calculada :
z =

X
0
/

n
=
492 500
_
400/16
= 1, 6
Ao nvel de signicncia de 0,01, a regra de deciso :
Rejeita-se H
0
se | z |> z
0,005
= 2, 58
Aceita-se H
0
se | z |< 2, 58
Portanto, aceita-se H
0
, e a mquina no necessita ser parada. A mquina s sera
parada se
x <
0
z
0,005

n
= 500 2, 58
20
4
, isto , x < 487, 1, ou
x >
0
+z
0,005

n
= 500 + 2, 58
20
4
, isto , x > 512, 9
2. A tenso de ruptura dos cabos produzidos por um fabricante apresenta mdia
de 1800 kg e desvio padro de 100 kg. Mediante nova tcnica no processo de
fabricao, proclama-se que a tenso de ruptura pode ter aumentado. Para testar
esta declarao, ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tenso
mdia de ruptura de 1850 kg. Pode-se conrmar a declarao ao nvel de signicncia
de 0,01?
120
Soluo:
As hipteses so:
H
0
: = 1800 (no houve modicao da tenso de ruptura)
H
1
: > 1800 (houve modicao da tenso de ruptura)
Como supe-se que o desvio padro no se tenha modicado, temos que = 100. A
estatstica a ser calculada :
z =

X
0
/

n
=
1850 1800
100/

50
= 3, 55
Ao nvel de signicncia de 0,01, a regra de deciso :
Rejeita-se H
0
se z > z
0,01
= 2, 33
Aceita-se H
0
se z < 2, 33
Portanto, rejeita-se H
0
, e conrma-se a declarao.
3. Um fabricante arma que seus cigarros contm no mais que 30 mg de nicotina.
Uma amostra de 25 cigarros fornece mdia de 31,5 mg e desvio padro de 3 mg. Ao
nvel de 5%, os dados refutam ou no a armao do fabricante?
Soluo:
Neste caso, as hipteses so:
H
0
: = 30
H
1
: > 30
Como no se conhece a varincia populacional, e esta foi estimada pela amostra,
devemos utilizar a estatstica t:
t =

X
0
s/

n
=
31, 5 30
3/

25
= 2, 5
A regra de deciso dada por
Rejeita-se H
0
se t > t
,[n1]
= t
0,05,24
= 1, 711
Aceita-se H
0
se t < 1, 711
Portanto, rejeita-se H
0
, ou seja, h evidncias de que os cigarros contenham mais de
30 g de nicotina.
121
5.5 Controlando o erro tipo II ()
Vimos que o erro tipo I representa o erro de se rejeitar H
0
quando ela de fato
verdadeira. A probabilidade deste erro e xada e portanto controlada pelo
estatstico.
Temos tambm o erro tipo II (beta) que representa o erro de aceitar H
0
quando ela
falsa.
Quando rejeitamos H
0
, automaticamente estamos aceitando H
1
, isto , estamos
aceitando que o parmetro pertena ao espao denido pela hiptese H
1
. O erro tipo
II depender do verdadeiro valor do parmetro. Quanto mais afastado o verdadeiro
valor do parmetro estiver do valor especicado em H
0
, menor ser o erro tipo II.
Portanto, para calcular , temos que especicar este valor em H
1
, isto , ter-se as
hipteses denidas por:
H
0
: =
0
H
1
: =
1
Para exemplicar isto, considere o exemplo 2 dado anteriormente. Suponha que as
hipteses tenham sido denidas da seguinte maneira:
H
0
: = 1800
H
1
: = 1850
Vimos que o erro tipo I foi xado em 0,01, supondo que H
0
fosse verdadeira, isto ,
0, 01 = P(erro I) = P(Z 2, 33) = P
_

X
/

n
2, 33 | = 1800
_
=
= P
_

X 1800
100/

50
2, 33
_
= P
_

X 1800 + 2, 33
100

50
_
=
= P
_

X 1832, 95
_
122
Portanto, a probabilidade do erro tipo II ser:
= P(erro II) = P
_

X < 1832, 95 | = 1850


_
=
= P
_

X
/

n
<
1832, 95 1850
100/

50
_
= P(Z < 1, 206)

= 0, 1131
O clculo acima pode ser efetuado para vrios valores de . Considerando-se () a
probabilidade de aceitar H
0
como funo de , isto ,
() = P(aceitarH
0
| ) = P
_

X < 1832, 95 |
_
,
pode-se calcular a funo
() = 1 ().
Esta funo denominada funo poder do teste.
5.6 Teste da hiptese de que a varincia populacional tem um valor
especco
Suponha que uma varivel seja normalmente distribuida com uma varincia
desconhecida e se deseje efetuar o seguinte teste de hipteses:
H
0
:
2
=
2
0
H
1
:
2
=
2
0
Calcula-se a estatstica
X
2
=
(n 1)s
2

2
0
Rejeita-se H
0
se X
2
<
2
1/2,[n1]
ou X
2
>
2
/2,[n1]
Aceita-se H
0
se
2
1/2,[n1]
X
2

2
/2,[n1]
123
Observao
1. Se a hiptese alternativa fosse
H
1
:
2
>
2
0
,
H
0
seria rejeitada se X
2
>
2
,[n1]
.
2. Se a hiptese alternativa fosse
H
1
:
2
<
2
0
,
H
0
seria rejeitada se X
2
<
2
1,[n1]
.
Exemplo:
Uma das maneiras de manter sob controle a qualidade de um produto controlar
a sua variabilidade. Uma mquina de encher pacotes de caf est regulada para
ench-los com mdia de 500 g e desvio padro de 10 g. Colheu-se uma amostra de
16 pacotes e observou-se uma varincia s
2
= 169g
2
. Supondo que o peso de cada
pacote segue uma distribuio normal, voc diria que a mquina est desregulada
com relao varincia?
Soluo:
Deseja-se testar:
H
0
:
2
= 100
H
1
:
2
= 100
A estatstica a ser calculada :
X
2
=
(n 1)s
2

2
0
=
(15)(169)
100
= 25, 35
e o procedimento do teste : Aceita-se H
0
se
2
1/2,[n1]
X
2

2
/2,[n1]
,
isto ,
Aceita-se H
0
se 6, 262 X
2
27, 488,
e
Rejeita-se H
0
se X
2
< 27, 488 ou X
2
> 27, 488
Portanto, aceita-se H
0
, e conclumos que a mquina no est desregulada quanto
varincia.
124
5.7 Teste da razo de varincias
Suponha que se deseje testar:
H
0
:
2
1
=
2
2
H
1
:
2
1
=
2
2
(5.1)
ou, equivalentemente,
H
0
:

2
1

2
2
= 1
H
1
:

2
1

2
2
= 1
(5.2)
O procedimento do teste :
Calcula-se a estatstica
f =
s
2
1
s
2
2
(5.3)
Vimos que, sob a hiptese H
0
, a estatstica f possui uma distribuio F com n
1
1
e n
2
1 graus de liberdade. Portanto,
Aceita-se H
0
ao nvel de signicncia se
1
F
/2,[n
2
1],[n
1
1]
f F
/2,[n
1
1],[n
2
1]
(5.4)
Rejeita-se H
0
ao nvel de signicncia de se
f <
1
F
/2,[n
2
1],[n
1
1]
(5.5)
ou
f > F
/2,[n
1
1],[n
2
1]
(5.6)
125
Exemplo:
Uma das maneiras de medir o grau de satisfao dos empregados de uma mesma
categoria quanto poltica salarial por meio do desvio padro de seus salrios. A
fbrica A diz ser mais coerente na poltica salarial do que a fbrica B. Para vericar
essa armao, sorteou-se uma amostra de 10 funcionrios no especializados de A,
e 15 de B, obtendo-se os desvios padres s
A
= 1000 reais e s
B
= 1600 reais. Qual
seria a sua concluso?
Soluo:
A hiptese a ser testada :
H
0
:
2
A
=
2
B
H
1
:
2
A
=
2
B
(5.7)
Temos que:
f =
s
2
A
s
2
B
=
1000
1500
= 0, 667
Devemos aceitar H
0
ao nvel de signicncia = 0, 05 se
1
F
0,025,[14],[9]
f F
0,025,[9],[14]
(5.8)
ou seja, se
1
3, 77
f 3, 12
0, 27 f 3, 12
(5.9)
Como este o caso, aceitamos H
0
ao nvel de signicncia de 0,05, e conclumos que
as duas fbricas so igualmente homogneas.
126
5.8 Teste da hiptese da igualdade de duas mdias
Suponha que se tenha
H
0
:
1
=
2
H
1
:
1
=
2
5.8.1
2
1
e
2
2
conhecidas
Calcula-se a estatstica
Z =
x
1
x
2
_

2
1
n
1
+

2
2
n
2
(5.10)
Sabemos que, sob a hiptese H
0
, a varivel Z possui uma distribuio normal padro.
Portant, o procedimento do teste consiste em:
Rejeita-se H
0
se | Z |> Z
/2
Aceita-se H
0
se | Z | Z
/2
5.8.2
2
1
e
2
2
desconhecidas, mas
2
1
=
2
2
Suponha que a hiptese de igualdade de varincias no seja rejeitada. Ento podemos
supor que
2
1
=
2
2
, mas esta varincia comum no conhecida. Para efetuar o teste
de igualdade de mdias, neste caso, procedemos da seguinte maneira:
Calcula-se a estatstica
t =
x
1
x
2
_
1
n
1
+
1
n
2
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
n
1
+n
2
2
(5.11)
Como vimos anteriormente, esta estatstica possui ima distribuio t-Student com
n
1
+n
2
2 graus de liberdade. Portanto,
Rejeita-se H
0
se | t |> t
/2; n
1
+n
2
2
Aceita-se H
0
se | t | t
/2; n
1
+n
2
2
127
5.8.3
2
1
e
2
2
desconhecidas, mas
2
1
=
2
2
Suponha que a hiptese de igualdade de varincias tenha sido rejeitada. Neste caso,
devemos calcular a estatstica
t =
x
1
x
2
_
s
2
1
n
1
+
s
2
2
n
2
(5.12)
Pode-se provar que, sob a hiptese que H
0
verdadeira, a estatstica acima
aproxima-se de uma distribuio t de Student com graus de liberdade dado
aproximadamente por:
=
(A +B)
2
A
2
n
1
1
+
B
2
n
2
1
,
onde
A =
s
2
1
n
1
, e B =
s
2
2
n
2
.
Sendo este valor geralmente fracionrio, costuma-se arredondar para o inteiro mais
prximo para obter o nmero de graus de liberdade.
O procedimento do teste ento
Rejeita-se H
0
se | t |> t
/2
,
Aceita-se H
0
se | t | t
/2
,
Exemplos:
1. Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia
de 1400 horas e uma amostra de 20 lmpadas eltricas, da marca B, apresentou
a vida mdia de 1200 horas. Suponha que os desvios padres populacionais dos
tempos de vida das lmpadas das duas marcas sejam conhecidos e iguais a 120 e
100, respectivamente. Teste, ao nvel de signicncia de 99%, a hiptese que as duas
marcas produzem lmpadas com o mesmo tempo mdio de vida.
Soluo:
Queremos testar a hiptese:
H
0
:
A
=
B
H
1
:
A
=
B
128
Como estamos supondo que as varincias so conhecidas, podemos usar a estatstica
Z =
x
A
x
B
_

2
A
n
A
+

2
B
n
B
=
1400 1200
_
120
2
10
+
100
2
20
= 4, 54 (5.13)
O procedimento do teste consiste em:
Rejeita-se H
0
se | Z |> Z
0,005
= 2, 58
Aceita-se H
0
se | Z | 2, 58
Como a o valor da estatstica pertence regio de rejeio, concluimos que H
0

rejeitada e que as lmpadas no possuem o mesmo tempo mdio de vida.
2. Duas tcnicas de vendas so aplicadas por dois grupos de vendedores: a tcnica
A, por 12 vendedores, e a tcnica B, por 15 vendedores. Espera-se que a tcnica B
produza melhores resultados que a tcnica A. No nal de um ms, os vendedores
de A venderam uma mdia de 68 tens, com uma varincia de 50, enquanto que os
vendedores de B venderam uma mdia de 76 tens com uma varincia de 75. Testar,
ao nvel de signicncia de 5%, se a tcnica B realmente melhor que a tcnica A.
Soluo:
Supondo que as vendas sejam normalmente distribudas, vamos inicialmente testar
a hiptese de que as varincias so iguais:
H
0
:
2
A
=
2
B
H
1
:
2
A
=
2
B
Temos que:
f =
s
2
A
s
2
B
=
50
75
= 0, 667
Devemos aceitar H
0
ao nvel de signicncia = 0, 05 se
1
F
0,025,[14],[11]
f F
0,025,[11],[14]
(5.14)
ou seja, se aproximadamente
1
3, 52
f 3, 06
0, 28 f 3, 06
129
Logo, aceitamos H
0
ao nvel de signicncia de 0,05, e conclumos que as varincias
so iguais.
Portanto, agora podemos testar a hiptese de igualdade de mdias, sob a suposio
que as vendas pelas duas tcnicas possuem uma varincia comum, mas desconhecida:
H
0
:
A
=
B
H
1
:
A
<
B
Devemos calcular a estatstica
t =
x
A
x
B
_
1
n
A
+
1
n
B
_
(n
A
1)s
2
A
+(n
B
1)s
2
B
n
A
+n
B
2
=
6876

1
12
+
1
15
_
(11)(50)+(14)(75)
25
= 2, 56
O procedimento do teste ser:
Rejeita-se H
0
se t < t
0,05,[25]
= 1, 708
Aceita-se H
0
se t 1, 708
Como o valor encontrado pertence regio de rejeio, rejeitamos H
0
e conclumos
que a tcnica B produz melhores resultados que a tcnica A.
3. Queremos testar as resistncias de dois tipos de vigas de ao, A e B. Tomando-se
n
A
= 15 vigas do tipo A e n
B
= 20 vigas do tipo B, obtemos os valores da tabela
a seguir. Testar a hiptese que as resistncias mdias dos dois tipos de vigas so
iguais, ao nvel de signicnica de 5%.
Tipo Mdia Varincia
A 70,5 71,6
B 84,3 169,5
Soluo:
Vamos inicialmente testar a hiptese de que as varincias so iguais:
H
0
:
2
A
=
2
B
H
1
:
2
A
=
2
B
130
Temos que:
f =
s
2
A
s
2
B
=
71, 6
169, 5
= 0, 42
Devemos aceitar H
0
ao nvel de signicncia = 0, 10 se
1
F
0,05,[19],[14]
f F
0,05,[14],[19]
(5.15)
ou seja, se aproximadamente
1
2, 33
f 2, 20
0, 43 f 2, 20
Logo, rejeitamos H
0
ao nvel de signicncia de 0,10, e conclumos que as varincias
no so iguais.
Portanto, agora podemos testar a hiptese de igualdade de mdias:
H
0
:
A
=
B
H
1
:
A
=
B
A estatstica a ser utilizada deve ser:
t =
x
A
x
B
_
s
2
A
n
A
+
s
2
B
n
B
=
70, 5 84, 3
_
71,6
15
+
169,5
20
= 3, 79 (5.16)
O valor crtico deve ser encontrado pela tabela t-Student com graus de liberdade
dado por:
=
175, 51
1, 627 + 3, 780
= 32, 46

= 32,
O procedimento do teste ento
Rejeita-se H
0
se | t |> t
0,025
, 32

= 2, 042
Aceita-se H
0
se | t | 2, 042
Portanto, rejeitamos H
0
, e conclumos que h evidncias de que os dois tipos de
vigas possuem resistncias mdias diferentes.
131
5.9 Teste para proporo
Suponha que se deseje testar a hiptese:
H
0
: p = p
0
H
1
: p = p
0
Calcula-se a estatstica
Z =
p p
0
_
p
0
(1p
0
)
n
(5.17)
Rejeita-se H
0
se | Z |> Z
/2
Aceita-se H
0
se | Z | Z
/2
Exemplo:
Em uma experincia sobre percepo extra sensorial (PES), um indivduo em uma
sala solicitado a declarar a cor vermelha ou preta de uma carta escolhida, de
um baralho de 50 cartas, por outro indivduo colocado em outra sala. O indivduo
desconhece quantas cartas vermelhas ou pretas h no baralho. Se o sujeito identica
corretamente 32 cartas, determinar se os resultados so signicativos, ao nvel de
signicncia de 5% e 1%.
Soluo:
Queremos testar a hiptese:
H
0
: p = 0, 50 o indivduo no tem PES
H
1
: p > 0, 50 o indivduo tem PES
Temos que p =
32
50
= 0, 64. Calculamos a estatstica
Z =
p p
0
_
p
0
(1p
0
)
n
=
0, 64 0, 50
_
0,50
2
50
= 1, 98 (5.18)
Ao nvel de signicncia de 0,05 o procedimento do teste ser:
Rejeita-se H
0
se Z > Z
0,05
= 1, 645
Aceita-se H
0
se Z 1, 645
Portanto, ao nvel de signicncia de 0,05 rejeitamos H
0
, e conclumos que o
indivduo tem faculdades de PES.
132
Para o nvel de signicncia de 0,01 o valor crtico ser 2,33. Como o valor calculado
menor que o valor crtico, aceitamos H
0
, e conclumos que os resultados so devidos
ao acaso e que o indivduo no tem faculdades de PES.
5.9.1 Diferena entre propores
H
0
: p
1
= p
2
H
1
: p
1
= p
2
Como

p
1
p
2
= p
1
p
2
= 0 (sobH
0
) (5.19)
e

2
p
A
p
B
=
p
1
q
1
n
1
+
p
2
q
2
n
2
= pq(
1
n
1
+
1
n
2
) (sobH
0
) (5.20)
em que
P =
n
1
p
1
+n
2
p
2
n
1
+n
2
(5.21)
adotado como estimativa de p. Calcula-se
Z =
p
1
p
2

p
1
p
2
(5.22)
e aceita-se H
0
se | Z | Z
/2
Exemplo:
Doi grupos, A e B, so formados, cada um por 100 pessoas que tm a mesma
enfermidade. ministrado um soro ao grupo A, mas no ao B (denominado grupo de
controle); a todos os outros respeitos, os dois grupos so tratados de modo idntico.
Determinou-se que 75 e 65 pessoas dos grupos A e B, respectivamente, curaram-se da
enfermidade. Testar a hiptese de que o soro auxilia a cura da enfermidade, adotado
o nvel de signicncia de 0,01.
Soluo:
Denominando de p
A
e p
B
as propores populacionais curadas mediante o uso do
133
soro e sem o uso do soro, respectivamente, quereremos testar a hiptese
H
0
: p
A
= p
B
o soro no ecaz
H
1
: p
A
> p
B
o soro ecaz
Temos que p
A
= 0, 75 p
B
= 0, 65, e
P =
75 + 65
200
= 0, 70 (5.23)

2
p
1
p
2
= (0, 7)(0, 3)(
1
100
+
1
100
) = 0, 0042 (5.24)
A estatstica a ser calculada :
Z =
p
A
p
B

p
A
p
B
=
0, 75 0, 65

0, 0042
= 1, 543 (5.25)
Devemos aceitar H
0
se Z < Z
0,01
= 2, 33. Portanto, aceitamos H
0
, e conclumos que
os resultados so devidos ao acaso, e que o soro no ecaz.
5.10 Teste
2
da independncia
Uma tabela na qual cada observao classicada em dois ou mais modos
denominada tabela de contingncia.
Exemplo
Suponha que 200 estudantes sejam selecionados aleatoriamente em uma universidade
e que cada estudante seja classicado de acordo com a sua rea de estudo, e com
sua preferncia entre dois canditados para uma prxima eleio (ver Tabela 5.2).
TABELA 5.2 Canditados selecionados
Candidato
rea de
Estudo
A B Indeciso Totais
Engenharia 24 23 12 59
Humanas 24 14 10 48
Artes 17 8 13 38
Administrao 27 19 9 55
Totais 92 64 44 200
134
Quer-se tentar a hiptese de que as diferentes classicaes so independentes, isto
, que a preferncia a uma certo candidato independente da rea de estudo (i.e.
a probabilidade de estar na rea de estudo i e preferir o candidato j igual a
probabilidade de estar em i vezes a probabilidade de preferir j.
Em geral, conderamos uma tabela de contingncia contendo L linhas e C colunas.
Para i = 1, 2, 3, ..., L e j = 1, 2, 3, ..., C, seja P
ij
a probabilidade de que um individuo
selecionado aleatoriamente de uma dada populao seja classicado na i-sima linha
e na j-sima coluna. Alm disso, seja P
i
a probabilidade marginal que o individuo
seja classicado na i-sima linha, e seja P
j
a probabilidade marginal que o individuo
seja classicado na j-sima coluna.
P
i
=
C

j=1
P
ij
e P
j
=
L

i=1
P
ij
(5.26)
Observe que:
L

i=1
C

j=1
P
ij
=
L

i=1
P
i
=
C

j=1
P
j
= 1 (5.27)
Suponha agora que uma amostra de n individuos seja retirada da populao. Para
i = 1, 2, 3, ..., L, e j = 1, 2, 3, ..., C, seja N
ij
o nmero de individuos classicados
na i-sima linha e j-sima coluna. Alm disso, seja N
i
o nmero de individuos
classicados na i-sima linha e N
j
o nmero total de individuos classicados na
j-sima coluna.
N
i
=
C

j=1
N
ij
e N
j
=
L

i=1
N
ij
(5.28)
Observe que
L

i=1
C

j=1
N
ij
=
L

i=1
N
i
=
C

j=1
N
j
= n (5.29)
135
Com base nessas observaes, as seguintes hipteses sero testadas:
H
0
: P
ij
= P
i
P
j
H
1
: A hiptese H
0
no verdadeira.
O teste
2
pode ser usado para testar essa hiptese. Cada individuo na populao
deve pertencer a uma das L C celulas da tabela de contingncia. Sob a hiptese
H
0
, as probabilidades desconhecidas P
ij
dessas celulas foram expressas em funo
dos parmetros desconhecidos P
i
e P
j
. Como

L
i=1
P
i
= 1 e

C
j=1
P
j
= 1, o
nmero de parmetros desconhecidos a serem estimados quando H
0
verdadeiro
(L 1) + (C 1), ou L +C 2.
Para i = 1, 2, 3, ..., L, e j = 1, 2, 3, ..., C, seja

E
ij
o estimador quando H
0
verdadeira,
do nmero esperado de observaes classicadas na i-sima linha e j-sima coluna.
Portanto, a estatstica Q denida no teste
2
de aderncia dada por
Q =
L

i=1
C

j=1
(N
ij


E
ij
)
2

E
ij
(5.30)
Como a tabela de contingncia tem L C clulas, e como L+C2 parmetros tero
que ser estimados quando H
0
for verdadeiro, segue-se que quando H
0
for verdadeiro
e n , a distribuio de Q converge para uma
2
com L C 1 (L+C 2) =
(L 1)(C 1) graus de liberdade.
Consideraremos agora o estimador

E
ij
. O nmero esperado de observaes na i-sima
linha e j-sima coluna nP
ij
. Quando H
0
verdadeiro P
ij
= P
i
P
j
. Portanto,
se

P
i
e

P
j
so estimadores de P
i
e P
j
, segue-se que

E
ij
= n

P
i

P
j
. Como P
i
a probabilidade que uma observao seja classicada na i-sima linha,

P
i
a
proporo de observaes na amostra que so classicadas na i-sima linha, isto ,

P
i
=
N
i

n
. Da mesma maneira,

P
j
=
N
j
n
. Portanto,

E
ij
= n
_
N
i
n
__
N
j
n
_
=
N
i
N
j
n
(5.31)
A hiptese nula ser rejeitada quando Q > c

, onde c

obtido na tabela
2
com
(L 1)(C 1) graus de liberdade.
136
Para o exemplo dado, N
1
= 59; N
2
= 48, N
3
= 38; N
4
= 55 e N
1
= 92, N
2
= 64,
N
3
= 44.
Como n = 200, os valores (ver Tabela 5.3)

E
ij
so dados por
TABELA 5.3 Valores da

E
ij
27,14 18,88 12,98
22,08 15,36 10,56
17,48 12,16 8,36
25,30 16,60 12,10
O valor de Q ser Q = 6, 68. Como L = 4 e C = 3, o nmero de graus de liberdade
(L 1)(C 1) = 6.
Para = 0, 005, tem-se que c

= 12, 59, e portanto no h nenhuma evidncia que


H
0
no seja verdadeira.
137
CAPTULO 6
ANLISE DE VARINCIA
6.1 Introduo
A anlise de varincia um mtodo de se dividir a variao total dos dados
em componentes signicativos que medem diferentes fontes de variao. Assim,
considerando que nosso interesse esteja voltado para testar se diferentes variedades
de trigo produzem, em mdia quantidades iguais, isto , se:
H
0
:
1
=
2
=
3
= . . . =
k
H
1
: pelo menos duas mdias so diferentes
obtem-se duas componentes: uma devida ao erro experimental (incontrolvel) e outra
medindo a variao devida ao erro experimental mais qualquer variao devida s
diferentes variedades de trigo. Se a hiptese nula for verdadeira, as k espcies de trigo
produzem igualmente, em mdia, ento ambos componentes fornecem estimativas
independentes do erro experimental.
A anlise de varincia um mtodo para testar a hiptese H
0
acima, por meio da
anlise das varincias das diversas amostras. Este mtodo estende o mtodo visto
no captulo 5, onde a comparao envolvia somente duas mdias.
importante ressaltar que num experimento desta natureza importante se
ter controladas outras possveis fontes de variao: tipos diferentes de solo onde
se plantaro as variedades conduziro a uma estimativa tendenciosa do erro
experimental e consequentemente aumentar a probabilidade de se cometer um erro
do tipo II. Desta forma, uma variedade A, de pior qualidade que as outras variedades
sendo testadas, pode, se plantada em uma rea de melhor composio, fornecer, em
mdia, valores que no a tornem distinta das outras variedades. Assim, a hiptese
nula, de igualdade de todas as mdias das k variedades, pode ser aceita mesmo
no sendo verdadeira, isto , mesmo que uma das variedades sendo testada seja
inferior que as outras. Aqui, um fator no controlado (composio do solo) mascara
o verdadeiro resultado que seria obtido caso houvesse um controle mais rigoroso.
Portanto, em uma anlise de varincia estamos supondo que estamos variando
somente uma (ou algumas) varivel(eis) de interesse, e que todos os outros fatores
permaneam constantes.
139
Vamos estudar experimentos de um e de dois fatores (poderiam at ser mais do
que dois), em funo do nmero de variveis envolvidas no problema. Se alm das
diferentes variedades de trigo sendo testadas estivssemos tambm interessados em
investigar o efeito de diferentes tipos de de fertilizantes na produtividade, ento
deixaramos de ter um experimento de um s fator e passaramos a estar envolvidos
com um experimento de dois fatores.
Em resumo, a classicao de observaes com base em um nico critrio, tal como
variedade de trigo, chamada de anlise de varincia de um s fator, enquanto
que se as observaes forem classicadas de acordo com dois critrios, tal como
variedades de trigo e tipo de fertilizante, temos a chamada anlise de varincia
de dois fatores.
6.2 Anlise de Varincia de Um Fator
Como dito anteriormente, desejamos testar a hiptese:
H
0
:
1
=
2
=
3
= . . . =
k
H
1
: pelo menos duas mdias so diferentes
Para tal, amostras aleatrias de tamanho n so selecionadas de cada uma das k
populaes. Supe-se que as k populaes so independentes e normalmente
distribudas com mdias
1
,
2
,
3
, . . . ,
k
e com mesma varincia
2
.
Seja y
ij
a j-sima observao na i-sima populao (i = 1, 2, . . . , k e j = 1, 2, . . . , n).
Estes dados esto representados na tabela abaixo.
Tabela de arranjos dos dados em um experimento de um fator
Populao
1 2 3 ... i ... k
y
11
y
21
y
31
... y
i1
... y
k1
y
12
y
22
y
32
... y
i2
... y
k2
y
13
y
23
y
33
... y
i3
... y
k3
... ... ... ... ... ... ...
y
1n
y
2n
y
3n
... y
in
... y
kn
Total T
1
T
2
T
3
... T
i
... T
k
Mdia y
1
y
2
y
3
... y
i
... y
k
140
onde
T
i
=
n

j=1
y
ij
y
i
=

n
j=1
y
ij
n
.
T
i
e y
i
representam, respectivamente, o total e a mdia, de todas as observaes na
amostra da i-sima populao. Alm disto, podemos denir o total e a mdia das
n.k observaes por:
T

=
k

i=1
n

j=1
y
ij
=
k

i=1
T
i
y

k
i=1

n
j=1
y
ij
nk
=

k
i=1
y
i
k
.
Cada observao y
ij
pode ser escrita da seguinte forma:
y
ij
=
i
+
ij
(6.1)
onde
ij
representa o desvio da observao y
ij
da mdia populacional correspondente

i
(ou seja,
ij
o efeito aleatrio, no controlado, da observao j da populao
i). Alm disto, supomos que os
ij
so v.a. independentes, de mdia zero e mesma
varincia
2
. Note que estamos supondo que as varincias residuais das diferentes
populaes so iguais, isto :
V ar(
1j
) = V ar(
2j
) = . . . = V ar(
kj
) =
2
Esta propriedade denominada de homocedasticidade. As guras a seguir ilustram
isto para o caso em que as mdias so diferentes (Fig. 6.1) e para o caso em que as
mdias so iguais (Fig. 6.2). Note que E(y
ij
) =
i
, e que com esta suposio de
homocedasticidade, estamos tambm supondo que as observaes possuem varincia
iguais, j que:
V ar(y
ij
) = V ar(
i
+
ij
) = V ar(
ij
) =
2
141
Fig. 6.1 Distribuies normais com mesma varincia (
2
) para todas as
populaes
Fig. 6.2 Distribuies normais com mesma mdia () para todas as populaes
Uma forma alternativa para escrever a equao (6.1) obtida substituindo-se
i
por
+
i
, onde denida como sendo a mdia de todos os
i
.
Assim, podemos escrever y
ij
como:
y
ij
= +
i
+
ij
(6.2)
sujeito restrio de que

k
i=1

i
= 0. Refere-se
i
como sendo o efeito da
i-sima populao.
Uma forma alternativa, ento, de se expressar a hiptese nula e a hiptese
alternativa, faz uso dos
i
. Caso no haja efeito da i-sima populao (i=1,2, . . . ,k),
as mdias das mesmas so iguais (um tratamento no superior ao outro), e as
hipteses cam expressas como:
H
0
:
1
=
2
=
3
= . . . =
k
= 0
H
1
: pelo menos um dos
i
no zero.
Nosso teste se basear na comparao de duas estimativas independentes da
varincia populacional comum,
2
. Essas estimativas sero obtidas dividindo-se a
variabilidade total dos dados em duas componentes.
A varincia de todas as observaes agrupadas em uma nica amostra de tamanho
142
n.k dado pela frmula:
s
2
=
k

i=1
n

j=1
(y
ij
y

)
2
nk 1
O numerador de s
2
chamado de soma total dos quadrados (total sum of squares)
e mede a variabilidade total dos dados. O importante demonstrar que esta soma
total de quadrados pode ser particionada em duas componentes, por meio da seguinte
identidade:
Teorema:
k

i=1
n

j=1
(y
ij
y

)
2
= n
k

i=1
( y
i
y

)
2
+
k

i=1
n

j=1
(y
ij
y
i
)
2
conveniente identicar os termos da soma total de quadrados pela seguinte
notao:
SST = soma total de quadrados =

k
i=1

n
j=1
(y
ij
y

)
2
SSC = soma dos quadrados para as mdias das coluna = n

k
i=1
( y
i
y

)
2
SSE = soma dos quadrados dos erros =

k
i=1

n
j=1
(y
ij
y
i
)
2
.
Portanto:
SST = SSC + SSE
Muitos autores referem-se soma dos quadrados para as colunas como soma dos
quadrados dos tratamentos. Esta terminologia derivada do fato que as k diferentes
populaes so frequentemente classicadas de acordo com diferentes tratamentos.
Uma estimativa de
2
, baseada em (k 1) graus de liberdade dada por:
s
2
1
=
SSC
k 1
Se H
0
for verdadeira, ser demonstrado que s
2
1
um estimador no tendencioso de

2
. Entretanto, se H
1
for verdadeira, ento s
2
1
superestima
2
.
143
Uma segunda estimativa de
2
, baseada em k(n 1) graus de liberdade dada por:
s
2
2
=
SSE
k(n 1)
Mostraremos que s
2
2
sempre um estimador no tendencioso, independente de H
0
ser verdadeira ou no.
Vimos tambm que a varincia dos dados agrupados, com nk1 graus de liberdade,
:
s
2
=
SST
nk 1
interessante notar que a identidade da soma dos quadarados no somente
particiona a variabilidade total dos dados, mas tambm o nmero de graus de
liberdade:
nk 1 = (k 1) + k(n 1)
Vamos encontrar agora, o valor esperado das variaes expressas pelo Teorema.
Tomando a variao dentro das colunas (SSE), temos:
SSE =
k

i=1
n

j=1
(y
ij
y
i
)
2
=
k

i=1
(n 1)

n
j=1
(y
ij
y
i
)
2
n 1
Mas

n
j=1
(y
ij
y
i
)
2
n1
representa a varincia amostral do tratamento i (s
2
i
), que um
estimador no tendencioso de
2
i
. Assim,
SSE =
k

i=1
(n 1)s
2
i
e o valor esperado ser
E(SSE) = E
_
k

i=1
(n 1)s
2
i
_
= (n 1)
k

i=1
E(s
2
i
) = (n 1)
k

i=1

2
i
Entretanto, como se supe que as varincias dos k tratamentos so iguais, ento:
E(SSE) = (n 1)k
2
144
Ou seja,
E
_
SSE
(n 1)k
_
= E(s
2
2
) =
2
Assim sendo, s
2
2
=
SSE
(n1)k
um estimador no tendencioso de
2
.
Vamos analisar agora o valor esperado da variabilidade entre tratamentos (SSC)
SSC = n
k

i=1
( y
i
y

)
2
= n
k

i=1
y
2
i
2n y

i=1
y
i
+n
k

i=1
y
2

= n
k

i=1
y
2
i
2n y

i=1
y
i
+nk y
2

= n
k

i=1
y
2
i
2n y

k y

+nk y
2

= n
k

i=1
y
2
i
nk y
2

Portanto,
E(SSC) = E
_
n
k

i=1
y
2
i
nk y
2

_
= n
k

i=1
E
_
y
2
i
_
nkE
_
y
2

_
Como tem-se que, para qualquer v.a. X,
V ar(X) = E(X
2
) E
2
(X) = E(X
2
) = V ar(X) + E
2
(X)
podemos escrever que:
E(SSC) = n
k

i=1
_
V ar ( y
i
) + E
2
( y
i
)

nk
_
V ar ( y

) + E
2
( y

Sabemos tambm, da teoria de amostragem que


V ar ( y
i
) =

2
i
n
=

2
n
pois
2
i
=
2
para i = 1, 2, . . . , k.
Temos tambm que:
E ( y
i
) =
i
= +
i
145
V ar ( y

) =

2
nk
E ( y

) =
Ento
E(SSC) = n
k

i=1
_

2
n
+ ( +
i
)
2
_
nk
_

2
nk
+
2
_
= n
k

i=1
_

2
n
+
2
+ 2
i
+
2
i
_

2
nk
2
= k
2
+nk
2
+ 2n
k

i=1

i
+n
k

i=1

2
i

2
nk
2
=
2
(k 1) +n
k

i=1

2
i
Assim,
E
_
SSC
k 1
_
= E(s
2
1
) =
2
+n(k 1)
k

i=1

2
i
Ou seja, temos que s
2
1
=
SSC
k1
ser um estimador tendencioso de
2
, superestimando

2
, a no ser que a hiptese nula seja verdadeira, isto , se todos os
i
= 0.
Resumindo, s
2
1
um estimador tendencioso de
2
se H
0
no for verdadeira, e s
2
2
um
estimador no tendencioso de
2
independentemente de H
0
ser ou no verdadeira.
Se H
0
for verdadeira, a razo
f =
s
2
1
s
2
2
possui uma distribuio F com (k 1) e k(n 1) graus de liberdade. Uma vez que
s
2
1
superestima quando H
0
falsa, teremos um teste unilateral com a regio crtica
interamente na cauda direita da distribuio. A hiptese nula rejeitada ao nvel de
signicncia quando
f > F
,(k1),k(n1)
146
Em geral, calcula-se SST e SSC primeiro e da, fazendo uso da identidade da soma
dos quadrados obtem-se SSE = SST - SSC.
As frmulas denidas anteriormente para o cmputo de SST e SSC no so as mais
simples para se utilizar. Frmulas alternativas preferenciais elas so:
SST =
k

i=1
n

j=1
y
2
ij

T
2

nk
SSC =

k
i=1
T
2
i
n

T
2

nk
147
Os clculos para um problema de anlise de varincia de um fator so geralmente
sumarizados em forma de uma tabela, chamada Tabela ANOVA, como mostrado
abaixo:
TABELA ANOVA
Fonte Soma dos Graus de Quadrados f calculado
de Variao Quadrados Liberdade Mdios
Tratamento SSC k 1 s
2
1
=
SSC
k1
Resduo SSE k(n 1) s
2
2
=
SSE
k(n1)
f =
s
2
1
s
2
2
Total SST nk 1
Exemplo:
Os dados da tabela abaixo representam 5 amostras, cada uma de tamanho n=5,
tiradas de distribuies normais independentes com mdias
1
,
2
,
3
,
4
,
5
e
varincia comum
2
. Testar a hiptese de que as mdias so iguais, ao nvel de
signicncia de 5%.
Populao
A B C D E
5 9 3 2 7
4 7 5 3 6
8 8 2 4 9
6 6 3 1 4
3 9 7 4 7
Total 26 39 20 14 33 132
Mdia 5,2 7,8 4,0 2,8 6,6 5,28
Soluo:
Deseja-se testar a hiptese:
H
0
:
1
=
2
=
3
=
4
=
5
H
1
: pelo menos duas mdias so diferentes
148
Tem-se que:
SST =
k

i=1
n

j=1
y
2
ij

T
2

nk
= 5
2
+ 4
2
+. . . + 4
2
+ 7
2

132
2
25
= 834 696, 96 = 137, 040
(6.3)
SSC =

k
i=1
T
2
i
n

T
2

nk
=
26
2
+ 39
2
+ 20
2
+ 14
2
+ 33
2
5

132
2
25
= 776, 400 696, 960 = 79, 440
(6.4)
SSE = SST SSC = 37, 040 79, 470 = 57, 600
A Tabela ANOVA dada por:
Fonte Soma dos Graus de Quadrados f calculado
de Variao Quadrados Liberdade Mdios
Tratamento 79,440 4 19,860
Resduo 57,600 20 3,880 6,90
Total 137,040 24
A regio crtica dada por f > F
0,05,4,20
= 2, 87
Portanto, rejeita-se H
0
e conclui-se que as amostras provm de diferentes populaes.
Observao:
Quando os tamanhos de amostras so diferentes, isto , quando se tem k amostras
aleatrias com tamanhos n
1
, n
2
, . . . , n
k
, respectivamente e N =

k
i=1
n
i
, as frmulas
computacionais para SST e SSC so dadas por:
SST =
k

i=1
n

j=1
y
2
ij

T
2

N
SSC =
k

i=1
T
2
i
n
i

T
2

N
O valor de SSE encontrado por subtrao. Os graus de liberdade so particionados
da mesma maneira: N 1 g.l. para SST, k 1 para SSC e N k para SSE.
149
6.3 Teste para Igualdade de Vrias Varincias
Como a anlise de varincia supe que as varincias das populaes so iguais
(suposio de homocedasticidade) pode-se, antes de efetuar o teste de igualdade
de mdias, testar a hiptese:
H
0
:
2
1
=
2
2
=
2
3
= . . . =
2
k
H
1
: as varincias no so todas iguais
Um dos testes mais utilizados o teste de Bartlett, baseado em uma estatstica cuja
distribuio amostral aproximadamente
2
quando as k amostras aleatrias so
retiradas de populaes nomais independentes.
Primeiro calcula-se as k varincias amostrais, s
2
1
, s
2
2
, s
2
3
, . . . , s
2
k
das amostras de
tamanho n
1
, n
2
, n
3
, . . . , n
k
, com

k
i=1
n
i
= N. Depois disto combinam-se as
varincias amostrais para fornecer a estimativa:
s
2
p
=

k
i=1
(n
i
1)s
2
i
N k
Calcula-se tambm
b = 2, 3026
q
h
onde
q = (N k) log s
2
p

i=1
(n
i
1) log s
2
i
h = 1 +
1
3(k 1)
_
k

i=1
1
n
i
1

1
N k
_
b um valor da varivel aleatria B que possui uma distribuio
2
com k 1 graus
de liberdade. A quantidade q ser grande quando as varincias amostrais diferem
signicativamente, e ser igual a zero quando todas as varincias amostrais forem
iguais. Assim, rejeita-se H
0
ao nvel de signicncia quando
b >
2
,k1
150
Exemplo:
Use o teste de Bartlett para testar a hiptese de que as varincias das trs populaes
abaixo so iguais:
Amostra
A B C
4 5 8
7 1 6
6 3 8
6 5 9
3 5
4
Total 23 21 36 80
Soluo:
Deseja-se testar a hiptese:
H
0
:
2
1
=
2
2
=
2
3
H
1
: as varincias no so iguais
Tem-se que: n
1
= 4, n
2
= 6, n
3
= 5, N = 15, k = 3.
s
2
1
= 1, 583; s
2
2
= 2, 300; s
2
3
= 2, 700
Assim,
s
2
p
=
3(1, 583) + 5(2, 300) + 4(2, 700)
12
= 2, 254.
(6.5)
q = 12 log 2, 254 (3 log 1, 583 + 5 log 2, 300 + 4 log 2, 700)
= 12(0, 3530) (3(0, 1995) + 5(0, 3617) + 4(0, 4314)) = 0, 1034
h = 1 +
1
6
_
1
3
+
1
5
+
1
4

1
12
_
= 1, 1167
(6.6)
b =
(2, 3026)(0, 1034)
1, 1167
= 0, 213
Ao nvel de signicncia de 0,05, regio crtica dada por B > 5, 991.
Portanto, aceita-se H
0
e conclui-se que as varincias das trs populaes so iguais.
151
6.4 Anlise de Varincia de Dois Fatores
A anlise de varincia de dois fatores trata de problemas onde se investiga o efeito de
dois fatores. Analogamente anlise de varincia de um fator, fazemos as suposies
de independncia, normalidade e homocedasticidade das populaes.
Sob a suposio de aditividade dos efeitos dos fatores, isto , supondo que cada
mdia
ij
pode ser obtida pela adio dos respectivos efeitos dos fatores A e B
mdia global , o modelo para a anlise de dois fatores se torna:

ij
= +
i
+
j
(6.7)
onde i se refere ao nvel do fator A (i = 1, . . . , r), j se refere ao nvel do fator B
(j = 1, . . . , c), sujeito s restries de que

r
i=1

i
= 0 e

c
j=1

j
= 0. Refere-se

i
como sendo o efeito do i-simo nvel do fator A, e
j
como sendo o efeito
do j-simo nvel do fator B.
Quando as mdias de todos os tratamentos pode ser decomposta na forma da
expresso (6.7), dizemos que os fatores no interagem, ou que no existe
interao entre os fatores. O caso em que se supe interao entre os fatores
visto na prxima seo.
Assim como no caso da anlise de varincia de um fator, onde a soma total
de quadrados foi particionada em componentes, pode-de tambm efetuar este
particionamento para o caso da anlise de varincia de dois fatores, obtendo-se:
r

i=1
c

j=1
(y
ij
y

)
2
= c
r

i=1
( y
i
y

)
2
+r
c

j=1
( y
j
y

)
2
+
r

i=1
c

j=1
(y
ij
y
i
y
j
+ y

)
2
A demonstrao disto parte do princpio de que o termos esquerda da igualdade
acima pode ser escrito da seguinte forma:
r

i=1
c

j=1
(y
ij
y

)
2
=
r

i=1
c

j=1
[( y
i
y

) + ( y
j
y

) + (y
ij
y
i
y
j
+ y

)]
2
Pela expanso desta expresso chega-se identidade da soma de quadrados. A
identidade de quadrados pode ser representada simbolicamente por:
SST = SSR + SSC + SSE
152
onde
SST =

r
i=1

c
j=1
(y
ij
y

)
2
= soma total de quadrados
SSR = c

r
i=1
( y
i
y

)
2
= soma dos quadrados para as mdias das linhas (rows)
SSC = r

c
j=1
( y
j
y

)
2
= soma dos quadrados para as mdias das colunas(columns)
SSE =

r
i=1

c
j=1
(y
ij
y
i
y
j
+ y

)
2
= soma dos quadrados dos erros.
Um estimador de
2
, baseado em r 1 graus de liberdade dado por:
s
2
1
=
SSR
r 1
Se no houver efeito do fator A (efeitos das linhas), isto , se

1
=
2
= . . . =
r
= 0
ento s
2
1
um estimador no tendencioso de
2
. Entretanto se os efeitos das linhas
no so todos iguais a zero, SSR ter um valor numrico maior e s
2
1
superestima
2
.
Um segundo estimador de
2
, baseado em c 1 graus de liberdade dado por:
s
2
2
=
SSC
c 1
Este estimador no tendencioso se os efeitos das colunas (fator B) forem iguais a
zero, isto , se:

1
=
2
= . . . =
c
= 0
Caso contrrio, SSC tambm ter um valor numrico maior e s
2
2
superestima
2
.
Um terceiro estimador de
2
, baseado em (r 1)(c 1) graus de liberdade e
independente de s
2
1
e s
2
2
dado por:
s
2
3
=
SSE
(r 1)(c 1)
Este estimador sempre no tendencioso, independente de haver ou no efeito das
linhas ou colunas.
153
Para testar a hiptese nula de que os efeitos das linhas so todos zeros, isto :
H
0
:
1
=
2
= . . . =
r
= 0
H
1
: pelo menos um dos
i
no zero,
calculamos a estatstica
f
1
=
s
2
1
s
2
3
,
a qual uma v.a. possuindo uma distribuio F com (r 1) e (r 1)(c 1) g.l.,
quando H
0
for verdadeira. A hiptese nula rejeitada ao nvel de signicncia se
f
1
> F
; (r1); (r1)(c1)
.
Similarmente, para testar a hiptese nula de que os efeitos das colunas so todos
zeros, isto :
H
0
:
1
=
2
= . . . =
r
= 0
H
1
: pelo menos um dos
j
no zero,
calculamos a estatstica
f
2
=
s
2
2
s
2
3
,
a qual uma v.a. possuindo uma distribuio F com (c 1) e (r 1)(c 1) g.l.,
quando H
0
for verdadeira. A hiptese nula rejeitada ao nvel de signicncia se
f
2
> F
; (c1); (r1)(c1)
.
Para efetuar os clculos de uma anlise de varincia, em geral calculamos SST, SSR
e SSC, e obtemos SSE por subtrao:
SSE = SST - SSR - SSC
interessante observar que os graus de liberdade tambm so particionados,
fornecendo:
(r 1)(c 1) = (rc 1) (r 1) (c 1).
154
Frmulas alternativas para as quantidades SST, SSR e SSC so:
SST =
r

i=1
c

j=1
y
2
ij

T
2

rc
SSR =

r
i=1
T
2
i
c

T
2

rc
SSC =

c
j=1
T
2
j
r

T
2

rc
Os clculos para um problema de anlise de varincia de dois fatores, com apenas
uma observao por cela so geralmente sumarizados em forma de uma tabela,
chamada Tabela ANOVA, como mostrado abaixo:
TABELA ANOVA
Fonte Soma dos Graus de Quadrados f calculado
de Variao Quadrados Liberdade Mdios
Devido s
linhas
SSR r 1 s
2
1
=
SSR
r1
f
1
=
s
2
1
s
2
3
Devido s
colunas
SSC c 1 s
2
2
=
SSC
c1
f
2
=
s
2
2
s
2
3
Erro SSE (r 1)(c 1) s
2
3
=
SSE
(r1)(c1)
Total SST rc 1
Exemplo:
A tabela abaixo apresenta os resultados da safra mdia de trigo, para trs variedades
de trigo e quatro tipos de fertilizantes. Teste a hiptese H

0
de que no h diferena
na safra mdia de trigo quando diferentes tipos de fertilizantes so utilizados. Teste
tambm a hiptese H

0
de que no h diferena na safra mdia de trigo quando
diferentes variedades de trigo so utilizadas.
Variedades de Trigo
Fertilizante V
1
V
2
V
3
Total
F
1
64 72 74 210
F
2
55 57 47 159
F
3
59 66 58 183
F
4
58 57 53 168
Total 236 252 232 720
155
Soluo: Para testar se os fertilizantes tm efeitos diferentes sobre a safra mdia de
trigo, precisa-se testar a hiptese de que:
H

0
:
1
=
2
=
3
=
4
= 0
H

1
: pelo menos um dos
i
no zero,
Para testar se as variedades de trigo tm efeitos diferentes sobre a safra mdia,
precisa-se testar a hiptese de que:
H

0
:
1
=
2
=
3
= 0
H

1
: pelo menos um dos
j
no zero,
Os clculos da soma de quadrados so:
SST =
r

i=1
c

j=1
y
2
ij

T
2

rc
= 64
2
+ 55
2
+. . . + 53
2

720
2
12
= 662
SSR =

r
i=1
T
2
i
c

T
2

rc
=
210
2
+ 159
2
+ 183
2
+ 168
2
3

720
2
12
= 498
SSC =

c
j=1
T
2
j
r

T
2

rc
=
236
2
+ 252
2
+ 232
2
4

720
2
12
= 56
SSE = 662 498 56 = 108
TABELA ANOVA
Fonte Soma dos Graus de Quadrados f calculado
de Variao Quadrados Liberdade Mdios
Fertilizantes 498 3 166 9,22
Var. de trigo 56 2 28 1,56
Erro 108 6 18
Total 662 11
As regies crticas para H

0
f
1
> 4, 76 e para H

0
f
2
> 5, 14.
Portanto, conclumos que:
1. rejeitamos H

0
e conclumos que h diferena na safra mdia de trigo quando
diferentes tipos de fertilizantes so utilizados.
2. aceitamos H

0
e conclumos que no h diferena na safra mdia das trs variedades
de trigo.
156
6.5 Anlise de Varincia de Dois Fatores - Vrias observaes por cela
Na seo anterior foi suposto que os efeitos das linhas e colunas eram aditivos. Isto
equivalente a dizer que

ij

ij
=
i

j

i

ou

ij

i

j
=
ij

i

para qualquer valor i, i

, j, j

. Isto , a diferena entre as mdias populacionais das


colunas j e j

a mesma para cada linha e a diferena entre as mdias populacionais


para as linhas colunas i e i

a mesma para cada coluna. Referindo-se tabela do


exemplo anterior, isto implica que se a variedade V
2
produz em mdia 5 toneladas
de trigo por acre a mais que a variedade V
1
quando o fertilizante F
1
usado, ento
V
2
produzir em mdia 5 toneladas a mais que V
1
se os fertilizants F
2
, F
3
ou F
4
forem usados. Da mesma forma, se V
1
produz em mdia 3 toneladas a mais por
acre, quando o fertilizante F
4
utilizado ao invs de F
2
, ento V
2
ou V
3
produziro
em mdia 3 toneladas a mais por acre usando o fertilizante F
4
ao invs de F
2
. Isto
exemplicado nas Figuras 6.3 e 6.4 abaixo, quando notamos que as curvas so
paralelas.
Fig. 6.3 Efeitos de fertilizantes e variedades de trigo, sem interao
157
Fig. 6.4 Efeitos de fertilizantes e variedades de trigo, sem interao
Em muitos experimentos, a hiptese de aditividade no vlida e ananlise
feita anteriormente nos levar aconcluses errneas. Suponha, por exemplo, que a
variedade V
2
produza em mdia, 5 toneladas a mais de trigo por acre do que a
variedade V
1
quando F
1
, mas produza uma mdia de 2 toneladas por acre menos
que V
1
quando F
2
utilizado. As variedades de trigo e os tipos de fertilizantes so
ditos a interagir.
Obviamente, quando analisamos os dados de uma tabela, os grcos no so
perfeitamente paralelos. Isto pode ser devido a uma interao real, ou pode
ser simplesmente ao erro experimental. A anlise do exemplo anterior partiu do
pressuposto de que era simplesmente devido ao erro experimental.
Para testar as diferenas entre as mdias das linhas e colunas quando a interao
um fator importante, consideramos a variao de medidas tomadas sob situaes
semelhantes, ou seja consideramos a replicaes dos experimentos.
Para apresentar as frmulas gerais para a anlise de varincia usando observaes
repetidas (ou vrias observaes por cela), vamos considerar o caso de n replicaes.
Como antes, consoderaremos uma matriz regular consistindo de r linhas e c colunas.
Assim teremos rc celas, mas agora cada cela possui n observaes. Denotamos a
k-sima observao da i-sima linha na j-sima coluna por y
ijk
. Isto exemplicado
na tabela abaixo:
158
Tabela dos dados em um experimento com dois fatores, e replicaes
Linhas Colunas Total Mdia
1 2 ... c
y
111
y
121
... y
1c1
y
112
y
122
... y
1c2
1
.
.
.
.
.
.
.
.
.
.
.
. T
1
y
1
y
11n
y
12n
... y
1cn
... ... ... ...
... ... ... ...
... ... ... ...
y
r11
y
r21
... y
rc1
y
r12
y
r22
... y
rc2
r
.
.
.
.
.
.
.
.
.
.
.
. T
r
y
r
y
r1n
y
r2n
... y
rcn
Total T
1
T
2
... T
r
T

As observaes na cela (i, j) constituem uma amostra aleatria de tamnho n de uma


populao que se supe ser normalmente distribuda com mdia
ij
e varincia
2
.
Supe-se tambm que todas as rc populaes possuem a mesma varincia
2
. A
seguinte notao utilizada:
T
ij
=
n

k=1
y
ijk
(soma das observaes na cela (i, j))
T
i
=
c

j=1
n

k=1
y
ijk
(soma das observaes na i-sima linha)
T
j
=
r

i=1
n

k=1
y
ijk
(soma das observaes na j-sima coluna)
T

=
r

i=1
c

j=1
n

k=1
y
ijk
(soma de todas as rcn)
159
y
ij
=

n
k=1
y
ijk
n
=
T
ij
n
(mdia das observaes na cela (i, j))
y
i
=

c
j=1

n
k=1
y
ijk
cn
=
T
i
cn
(mdia das observaes na i-sima linha)
y
j
=

r
i=1

n
k=1
y
ijk
rn
=
T
j
rn
(mdia das observaes na j-sima coluna)
y
j
=

rn
=
T
j
rn
(mdia das observaes na j-sima coluna)
y

r
i=1

c
j=1

n
k=1
y
ijk
rcn
=
T

rcn
(mdia de todas as rcn)
Cada observao y
ijk
pode ser escrita da seguinte forma:
y
ijk
=
ij
+
ijk
(6.8)
onde
ijk
representa o desvio da observao y
ijk
da mdia populacional
correspondente
ij
. Alm disto, supomos que os
ij
so v.a. independentes, de mdia
zero e mesma varincia
2
.
Se denotarmos por
ij
o efeito de interao da i-sima linha e j-sima coluna, por
i
o efeito da i-sima linha, por
j
o efeito da j-sima coluna, e por a mdia global,
podemos escrever:

ij
= +
i
+
j
+
ij
e ento,
y
ijk
= +
i
+
j
+
ij
+
ijk
no qual impomos as seguintes restries:
r

i=1

i
= 0;
c

j=1

j
= 0;
r

i=1

ij
= 0;
c

j=1

ij
= 0;
160
As trs hipteses a serem testadas so:
H
0
:
1
=
2
= . . . =
r
= 0
H
1
: pelo menos um dos
i
no zero.
H

0
:
1
=
2
= . . . =
c
= 0
H

1
: pelo menos um dos
j
no zero.
H

0
:
11
=
12
= . . . =
rc
= 0
H

1
: pelo menos um dos
ij
no zero.
6.5.1 Identidade da Soma de Quadrados
Neste caso, a soma de quadrados pode ser particionada da seguinte maneira:
r

i=1
c

j=1
(y
ijk
y

)
2
= cn
r

i=1
( y
i
y

)
2
+rn
c

j=1
( y
j
y

)
2
+
+ n
r

i=1
c

j=1
( y
ij
y
i
y
j
+ y

)
2
+
r

i=1
c

j=1
n

k=1
(y
ijk
y
ij
)
2
Simbolicamente podemos escrever esta identidade como:
SST = SSR +SSC +SS(RC) +SSE
onde
SSR = cn
r

i=1
( y
i
y

)
2
= soma de quadrados das mdias das linhas
SSC = rn
c

j=1
( y
j
y

)
2
= soma de quadrados das mdias das colunas
SS(RC) = n
r

i=1
c

j=1
( y
ij
y
i
y
j
+ y

)
2
= soma de quadrados para a interao
de linhas e colunas
SSE =
r

i=1
c

j=1
n

k=1
(y
ijk
y
ij
)
2
= soma de quadrados dos erros
161
Os graus de liberdade so particionados segundo a relao:
rcn 1 = (r 1) + (c 1) + (r 1)(c 1) + rc(n 1)
Da mesma forma que antes, atravs da diviso das somas de quadrados pelos graus de
liberdade correspondentes obtm-se quatro estimativas independentes de
2
, todas
no tendenciosas desde que as hipteses H
0
, H

0
, e H

0
sejam verdadeiras.
Estas estimativas so:
s
2
1
=
SSR
r 1
; s
2
2
=
SSC
c 1
; s
2
3
=
SS(RC)
(r 1)(c 1)
; s
2
4
=
SSE
rc(n 1)
.
Para testar as hipteses H
0
, H

0
, e H

0
calculam-se as seguintes razes:
f
1
=
s
2
1
s
2
4
para H
0
; f
2
=
s
2
2
s
2
4
para H

0
; f
3
=
s
2
3
s
2
4
para H

0
;
e comparam-se com os respectivos valores de uma distribuio F, isto :
rejeita-se H
0
se f
1
> F
; (r1); rc(n1)
rejeita-se H

0
se f
2
> F
; (c1); rc(n1)
rejeita-se H

0
se f
3
> F
; (r1)(c1); rc(n1)
OBS: Frmulas alternativas para as quantidades SST, SSR e SSC so:
SST =
r

i=1
c

j=1
n

k=1
y
2
ijk

T
2

rcn
SSR =

r
i=1
T
2
i
cn

T
2

rcn
SSC =

c
j=1
T
2
j
rn

T
2

rcn
SS(RC) =

r
i=1

c
j=1
T
2
ij
n

r
i=1
T
2
i
cn

c
j=1
T
2
j
rn
+
T
2

rcn
SSE = SST SSR SSC SS(RC)
Os clculos para um problema de anlise de varincia com vrias observaes por
162
cela podem ser resumidos em uma tabela ANOVA, da seguinte maneira:
TABELA ANOVA
Fonte Soma dos Graus de Quadrados f calculado
de Variao Quadrados Liberdade Mdios
Devido s
linhas
SSR r 1 s
2
1
=
SSR
r1
f
1
=
s
2
1
s
2
4
Devido s
colunas
SSC c 1 s
2
2
=
SSC
c1
f
2
=
s
2
2
s
2
4
Devido
interao
SS(RC) (r 1)(c 1) s
2
3
=
SS(RC)
(r1)(c1)
f
3
=
s
2
3
s
2
4
Erro SSE rc(n 1) s
2
4
=
SSE
rc(n1)
Total SST rcn 1
Exemplo:
Utilizando os dados a seguir, teste as hipteses abaixo, utilizando nvel de
signicncia de 5%:
Exemplo:
Fertilizantes Variedades de Trigo
V
1
V
2
V
3
F
1
64 72 74
66 81 51
70 64 65
F
2
65 57 47
63 43 58
58 52 67
F
3
59 66 58
68 71 39
65 59 42
F
4
58 57 53
41 61 59
46 53 38
Soluo:
163
As trs hipteses a serem testadas so:
H
0
:
1
=
2
=
3
=
3
= 0
H
1
: pelo menos um dos
i
no zero.
H

0
:
1
=
2
=
3
= 0
H

1
: pelo menos um dos
j
no zero.
H

0
:
11
=
12
= . . . =
43
= 0
H

1
: pelo menos um dos
ij
no zero.
Pelos dados da Tabela, podemos construir o resumo abaixo, contendo os totais:
Fertilizantes Variedades de Trigo
V
1
V
2
V
3
Total
F
1
200 217 190 607
F
2
186 152 172 510
F
3
192 196 139 527
F
4
145 171 150 466
Total 723 736 651 2110
SST = 64
2
+ 66
2
+. . . + 38
2

2110
2
36
= 3779
SSR =
607
2
+ 510
2
+ 527
2
+ 466
2
9

2110
2
36
= 1157
SSC =
723
2
+ 736
2
+ 651
2
12

2110
2
36
= 350
SS(RC) =
200
2
+ 186
2
+. . . + 150
2
3
124826 124019 123669 = 771
SSE = 3779 1157 350 771 = 1501
164
Estes resultados so resumidos na tabela ANOVA:
TABELA ANOVA
Fonte Soma dos Graus de Quadrados f calculado
de Variao Quadrados Liberdade Mdios
Devido aos
fertilizantes
1157 3 385,67 6,17
Devido s
variedades de
trigo
350 2 175,00 2,80
Devido
interao
771 6 128,50 2,05
Erro 1501 24 62,54
Total 3779 35
Os procedimentos dos testes so dados por:
rejeita-se H
0
se f
1
> F
0,05; 3; 24
= 3, 01
rejeita-se H

0
se f
2
> F
0,05; 2; 24
= 3, 40
rejeita-se H

0
se f
3
> F
0,05; 6; 24
= 2, 51.
Portanto, a concluso :
a) rejeitar H
0
e concluir que existe uma diferena na safra mdia de trigo
quando diferentes tipos de fertilizantes so utilizados.
b) aceitar H

0
e concluir que no h diferena entre as diferentes variedades
de trigo.
c) aceitar H

0
e concluir que no h interao entre as diferentes variedades
de trigo e os diferentes tipos de fertilizantes.
165

Você também pode gostar