Você está na página 1de 165

MINISTRIO DA CINCIA E TECNOLOGIA

INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS

ESTATSTICA - CURSO 1

Dra. Corina da Costa Freitas


MSc. Camilo Daleles Renn
MSc. Manoel Arajo Sousa Jnior

Material de referncia para o curso 1 de estatstica.

INPE
So Jos dos Campos
Maro de 2003

SUMRIO
Pg.
LISTA DE FIGURAS
LISTA DE TABELAS
CAPTULO 1 INTRODUO . . . . . . . . . . . . . . . . . . . . .

11

1.1 O que Estatstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

1.2 Conceitos de Populao e Amostra . . . . . . . . . . . . . . . . . . . .

12

1.3 Tipos de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

1.4 Distribuies de Freqncia . . . . . . . . . . . . . . . . . . . . . . . .

14

1.4.1 Freqncias e freqncias relativas . . . . . . . . . . . . . . . . . . .

14

1.5 Distribuio de freqncias e sua representao grfica para variveis


quantitativas discretas . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

1.6 Distribuio de freqncias e sua representao grfica para variveis


quantitativas contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

1.6.1 Curvas de Freqncia . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

1.7 Medidas de Tendncia Central . . . . . . . . . . . . . . . . . . . . . . .

20

1.7.1 Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

1.7.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

1.7.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.8 Medidas de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.8.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.8.2 Desvio Mdio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.8.3 Coeficiente de Variao

. . . . . . . . . . . . . . . . . . . . . . . . .

23

1.8.4 Varincia ( 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

1.8.5 Desvio Padro () . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

1.9 Momentos, Assimetria e Curtose

. . . . . . . . . . . . . . . . . . . . .

24

1.9.1 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

1.9.2 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

1.9.3 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

CAPTULO 2 PROBABILIDADE

. . . . . . . . . . . . . . . . . .

27

2.1 Definio de Probabilidade utilizando Freqncia Relativa . . . . . . .

27

2.2 Experimentos aleatrios . . . . . . . . . . . . . . . . . . . . . . . . . .

27

2.3 Espao Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

2.4 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

2.5 Classe dos Eventos Aleatrios . . . . . . . . . . . . . . . . . . . . . . .

30

2.6 Definio Clssica de Probabilidade . . . . . . . . . . . . . . . . . . . .

30

2.7 Operaes com Eventos Aleatrios - Teoria dos Conjuntos . . . . . . .

32

2.7.1 Unio de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

2.7.2 Interseco de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . .

33

2.7.3 Complemento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

2.7.4 Eventos Mutuamente Exclusivos ou Disjuntos . . . . . . . . . . . . .

34

2.8 Definio Axiomtica de Probabilidade . . . . . . . . . . . . . . . . . .

35

2.9 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

2.10 Anlise Combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

2.10.1 Permutao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

2.10.2 Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

39

2.11 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . .

40

2.12 Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

2.13 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

2.13.1 Teoria de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

44

CAPTULO 3 VARIVEIS ALEATRIAS E DISTRIBUIES

47

3.1 Varivel Aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

3.2 Tipos de Variveis Aleatrias, Funo de Probabilidade e Funo


Densidade de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . .

47

3.3 Funo de Distribuio Acumulada . . . . . . . . . . . . . . . . . . . .

50

3.4 Distribuies Bivariadas . . . . . . . . . . . . . . . . . . . . . . . . . .

52

3.4.1 Distribuies Conjuntas Discretas . . . . . . . . . . . . . . . . . . . .

52

3.4.2 Distribuies Conjuntas Contnuas . . . . . . . . . . . . . . . . . . .

54

3.5 Distribuies Marginais

. . . . . . . . . . . . . . . . . . . . . . . . . .

55

3.6 Esperana de Uma Varivel Aleatria . . . . . . . . . . . . . . . . . . .

58

3.6.1 Distribuies Discretas . . . . . . . . . . . . . . . . . . . . . . . . . .

58

3.6.2 Distribuies Contnuas . . . . . . . . . . . . . . . . . . . . . . . . .

59

3.6.3 Propriedades da Esperana . . . . . . . . . . . . . . . . . . . . . . .

59

3.7 Varincia de uma Varivel Aleatria . . . . . . . . . . . . . . . . . . .

61

3.7.1 Variveis Aleatrias Discretas . . . . . . . . . . . . . . . . . . . . . .

61

3.7.2 Variveis Aleatrias Contnuas . . . . . . . . . . . . . . . . . . . . .

62

3.7.3 Propriedades da Varincia . . . . . . . . . . . . . . . . . . . . . . . .

62

3.8 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

3.8.1 Momentos Centrais . . . . . . . . . . . . . . . . . . . . . . . . . . . .

64

3.8.2 Funo Geratriz de Momentos . . . . . . . . . . . . . . . . . . . . . .

64

3.8.3 Propriedades das Funes Geradoras de Momentos . . . . . . . . . .

65

3.9 Funes de uma Varivel Aleatria . . . . . . . . . . . . . . . . . . . .

66

3.9.1 Varivel com Distribuio Discreta . . . . . . . . . . . . . . . . . . .

66

3.9.2 Varivel com Distribuio Contnua . . . . . . . . . . . . . . . . . . .

67

3.10 Algumas Distribuies Discretas . . . . . . . . . . . . . . . . . . . . . .

69

3.10.1 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . .

69

3.10.2 Distribuio Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . .

74

3.10.3 Distribuio Binomial Negativa . . . . . . . . . . . . . . . . . . . . .

75

3.10.4 Distribuio Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . .

76

3.10.5 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . .

77

3.11 Algumas Distribuies Contnuas Importantes . . . . . . . . . . . . . .

81

3.11.1 Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

3.11.2 Distribuio Normal Padro . . . . . . . . . . . . . . . . . . . . . . .

82

3.11.3 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . .

87

3.11.4 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . .

89

3.11.5 Distribuio Exponencial

. . . . . . . . . . . . . . . . . . . . . . . .

92

3.11.6 Distribuio Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

3.11.7 Distribuio Normal Bivariada . . . . . . . . . . . . . . . . . . . . .

94

3.11.8 Distribuio Normal Multivariada . . . . . . . . . . . . . . . . . . . .

95

CAPTULO 4 INFERNCIA ESTATSTICA . . . . . . . . . . . .

97

4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

4.1.1 Parmetros de uma distribuio . . . . . . . . . . . . . . . . . . . . .

97

4.1.2 Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

4.1.3 Estimao Pontual e por Intervalo . . . . . . . . . . . . . . . . . . .

97

4.2 Estimao Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

4.2.1 Mtodo dos Momentos . . . . . . . . . . . . . . . . . . . . . . . . . .

98

4.2.2 Mtodo da Mxima Verossimilhana . . . . . . . . . . . . . . . . . .

99

4.3 Estimadores No Tendenciosos

. . . . . . . . . . . . . . . . . . . . . .

101

4.4 A Distribuio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

102

4.5 A Distribuio t-student . . . . . . . . . . . . . . . . . . . . . . . . . .

104

4.5.1 Distribuio da Mdia Amostral . . . . . . . . . . . . . . . . . . . . .

105

4.5.2 Distribuio da diferena de mdias amostrais . . . . . . . . . . . . .

106

4.6 Distribuio F

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

107

4.6.1 Distribuio da Razo entre duas Varincias Amostrais . . . . . . . .

107

4.7 Estimao por Intervalos - Intervalos de Confiana . . . . . . . . . . .

108

4.7.1 Intervalo de Confiana para a Mdia Populacional . . . . . . . . .

108

4.7.2 Intervalo de Confiana para a Varincia Populacional

. . . . . . .

111

4.7.3 Intervalo de Confiana para a diferena de mdias de duas Populaes 112


4.7.4 Intervalo de Confiana para Razo das Varincias 12 /22 . . . . . . .

114

4.7.5 Intervalo de Confiana para uma Proporo . . . . . . . . . . . . . .

114

4.7.6 Intervalo de Confiana para Diferena de Propores . . . . . . . . .

115

CAPTULO 5 TESTES DE HIPTESES . . . . . . . . . . . . . . 117


5.1 Hiptese Nula e Hiptese Alternativa . . . . . . . . . . . . . . . . . . .

117

5.2 Regio Crtica do Teste

. . . . . . . . . . . . . . . . . . . . . . . . . .

117

5.3 Erros do Tipo I e Erros do tipo II . . . . . . . . . . . . . . . . . . . . .

118

5.4 Teste da hiptese de que a mdia populacional tem um valor especfico

118

5.4.1 conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

118

5.4.2 desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

119

5.5 Controlando o erro tipo II () . . . . . . . . . . . . . . . . . . . . . . .

122

5.6 Teste da hiptese de que a varincia populacional tem um valor especfico 123
5.7 Teste da razo de varincias . . . . . . . . . . . . . . . . . . . . . . . .

125

5.8 Teste da hiptese da igualdade de duas mdias . . . . . . . . . . . . . .

127

5.8.1
5.8.2

12
12
12

e
e

22
22
22

conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

127

desconhecidas, mas 12 = 22 . . . . . . . . . . . . . . . . . . .

127

12

22

. . . . . . . . . . . . . . . . . . .

128

5.9 Teste para proporo . . . . . . . . . . . . . . . . . . . . . . . . . . . .

132

5.9.1 Diferena entre propores . . . . . . . . . . . . . . . . . . . . . . . .

133

5.8.3

desconhecidas, mas

6=

5.10 Teste da independncia . . . . . . . . . . . . . . . . . . . . . . . . .

134

CAPTULO 6 ANLISE DE VARINCIA . . . . . . . . . . . . . . 139


6.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

139

6.2 Anlise de Varincia de Um Fator . . . . . . . . . . . . . . . . . . . . .

140

6.3 Teste para Igualdade de Vrias Varincias . . . . . . . . . . . . . . . .

150

6.4 Anlise de Varincia de Dois Fatores . . . . . . . . . . . . . . . . . . .


6.5 Anlise de Varincia de Dois Fatores - Vrias observaes por cela . . .
6.5.1 Identidade da Soma de Quadrados . . . . . . . . . . . . . . . . . . .

152
157
161

LISTA DE FIGURAS
Pg.
1.1

Figura tirada de : Costa Neto, P. L. de O. - Estatstica, Ed. Edgard


Blcher Ltda - 1977 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

1.2

Histograma de freqncia . . . . . . . . . . . . . . . . . . . . . . . . .

16

1.3

Histograma de freqncias relativas . . . . . . . . . . . . . . . . . . . .

17

1.4

Histograma de freqncias relativas acumuladas . . . . . . . . . . . . .

18

1.5

Histograma e Poligono de freqncia . . . . . . . . . . . . . . . . . . .

19

1.6

Histograma freqncia acumulada . . . . . . . . . . . . . . . . . . . . .

20

1.7

Histograma freqncia acumulada . . . . . . . . . . . . . . . . . . . . .

21

1.8

Exemplos de curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

2.1

Unio dos conjuntos A e B . . . . . . . . . . . . . . . . . . . . . . . . .

32

2.2

Interseco dos conjuntos A e B . . . . . . . . . . . . . . . . . . . . . .

33

2.3

Complemento do conjunto A . . . . . . . . . . . . . . . . . . . . . . . .

34

2.4

A probabilidade a priori nas f.d.p. das classes . . . . . . . . . . . . . .

45

3.1

Grfico de P (x) para dois dados . . . . . . . . . . . . . . . . . . . . . .

48

3.2

Grfico de f dp de f . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

3.3

Grfico F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52

3.4

Meyer, pgina 75. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

3.5

Degroot, pgina 93. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

3.6

Degroot, pgina 95. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

3.7

Grfico de f (x) de uma funo uniforme . . . . . . . . . . . . . . . . .

90

3.8

Probabilidade de uma varivel aleatria uniforme . . . . . . . . . . . .

90

6.1

Distribuies normais com mesma varincia ( 2 ) para todas as populaes 142

6.2

Distribuies normais com mesma mdia () para todas as populaes

142

6.3

Efeitos de fertilizantes e variedades de trigo, sem interao . . . . . . .

157

6.4

Efeitos de fertilizantes e variedades de trigo, sem interao . . . . . . .

158

LISTA DE TABELAS
Pg.
1.1

Nmero de filhos dos 50 funcionrios da empresa Fictcia S.A. . . . . .

15

1.2

Freqncias, freqncias relativas e freqncias relativas acumuladas . .

17

1.3

Altura (cm) dos 50 funcionrios da empresa Fictcia S.A. . . . . . . . .

18

1.4

Altura (cm) dos funcionrios da Fictcia S.A. . . . . . . . . . . . . . .

20

5.1

Representao do erros do tipo I e II . . . . . . . . . . . . . . . . . . .

118

5.2

Canditados selecionados . . . . . . . . . . . . . . . . . . . . . . . . . .

134

5.3

Valores da Eij . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

137

CAPTULO 1
INTRODUO
1.1

O que Estatstica?

Estatstica a cincia que investiga os processos de obteno, organizao e anlise


de dados sobre uma populao, e os mtodos de tirar concluses ou fazer predies
com base nesses dados.
Este conceito tem um significado mais amplo do que aquele que usualmente se
d palavra "estatstica", isto , o resultado de contagens sobre a ocorrncia de
determinados eventos e a sua representao atravs de grficos e tabelas, como,
por exemplo, as estatsticas de ocorrncia de chuvas numa certa poca do ano; as
estatsticas sobre os ganhadores de prmios de loteria; as estatsticas de renda mdia
por regio etc.
Em geral, este conceito mais popular de estatstica corresponde somente
organizao e descrio dos dados relativos a um determinado experimento ou
situao e no trata da anlise e interpretao desses dados. Ele est associado
parte da Estatstica que denominamos de Estatstica Descritiva. A Estatstica
Descritiva, portanto, a parte da Estatstica que se preocupa com a organizao e
descrio de dados experimentais.
Alm da Estatstica Descritiva h a Estatstica Indutiva ou Estatstica Inferencial
que consiste, fundamentalmente, das tcnicas de anlise e interpretao dos dados. A
partir de um conjunto restrito de dados, chamado de amostra, organizado e descrito
pela Estatstica Descritiva, a Estatstica Indutiva procura fazer inferncias ou, em
outras palavras, tirar concluses sobre a natureza desses dados e estender essas
concluses a conjuntos maiores de dados, chamados de populaes.
evidente que, para que a Estatstica Indutiva possa deduzir concluses vlidas,
necessrio que se tomem alguns cuidados para a escolha da amostra a ser utilizada.
Esses cuidados, mais propriamente chamados de critrios, so estabelecidos por uma
tcnica chamada de amostragem.
Contudo, para permitir que a Estatstica Indutiva proporcione concluses vlidas
no basta utilizar as tcnicas de organizao e descrio dos dados da Estatstica

11

Descritiva e as tcnicas corretas de amostragem. Fica ainda faltando uma ltima


ferramenta que o clculo de probabilidades. O clculo de probabilidades um
conjunto de tcnicas matemticas que visa determinar as chances de ocorrncia de
eventos regidos pelas leis do acaso.
A Figura 1.1 abaixo interrelaciona os conceitos citados:

Fig. 1.1 Figura tirada de : Costa Neto, P. L. de O. - Estatstica, Ed. Edgard


Blcher Ltda - 1977

1.2

Conceitos de Populao e Amostra

Populao ou Universo a totalidade dos objetos concebveis de uma certa classe


em considerao.
Amostra so os objetos selecionados da populao. Se esses objetos so selecionados
de tal maneira que cada objeto tem a mesma chance de ser selecionado do que o
outro, temos uma amostra aleatria
1.3

Tipos de Variveis

necessrio, inicialmente, que se defina qual(is) a(s) caractersticas dos elementos


que dever(o) ser verificada(s). Ou seja, no se trabalha estatisticamente com os
elementos existentes, mas com alguma(s) caracterstica(s) desses elementos. Por
exemplo, os elementos a serem estudados podem ser a populao de uma cidade,
mas estaremos interessados em alguma caracterstica como renda, idade, sexo, tipo
de moradia, etc. Trabalha-se portanto com os valores de uma varivel (que a
caracterstica de interesse), e no com os elementos originalmente considerados. A
escolha da varivel (ou variveis) de interesse depender dos objetivos do estudo

12

estatstico em questo. Esta caracterstica (varivel) poder ser qualitativa ou


quantitativa.
A varivel ser qualitativa quando resultar de uma classificao por tipos ou
atributos, como nos seguintes exemplos:
a) Populao: alunos de uma universidade
Varivel: sexo (masculino ou feminino).
b) Populao: moradores de uma cidade
Varivel: tipo de habitao (casa, apartamento, barraco, etc.).
c) Populao: peas produzidas por uma mquina
Varivel: qualidade (perfeita ou defeituosa).
d) bitos em um hospital, nos ltimos cinco anos
Varivel: causa mortis (molstia cardiovasculares, cnceres, etc)
e) Populao Brasileira
Varivel: cor da pele (branca, preta, amarela, vermelha, parda).
A varivel ser quantitativa quando seus valores forem expressos em nmeros. Pode
ser subdivida em:
1-

quantitativa discreta: pode assumir apenas valores pertences a um


conjunto enumervel;

2-

quantitativa contnua: pode assumir qualquer valor em um certo


intervalo de variao.

Alguns exemplos de variveis quantitativas discretas so:


a) Populao: habitaes de uma cidade.
Varivel: nmero de banheiros.
b) Populao: casais residentes em uma cidade.
Varivel: nmero de filhos.

13

c) Populao: aparelhos produzidos em uma linha de montagem.


Varivel: nmero de defeitos por unidade.
d) Populao: Bolsa de valores de So Paulo.
Varivel: nmero de aes negociadas.
Alguns exemplos de variveis quantitativas contnuas so:
a) Populao: estao meteorolgica de uma cidade.
Varivel: precipitao pluviomtrica durante um ms.
b) Populao: pregos produzidos por uma mquina.
Varivel: comprimento.
c) Populao: propriedades agrcolas do Brasil.
Varivel: produo de algodo.
d) Populao: indstrias de uma cidade.
Varivel: ndice de liquidez.
e) Populao: pessoas residentes em uma cidade.
Varivel: idade.
Para atingir os objetivos da Estatstica descritiva, os dados observados so muitas
vezes sintetizados e apresentados em formas de tabelas ou grficos, os quais iro
fornecer rpidas e seguras informaes a respeito das variveis em estudo. Uma
das tabelas mais utilizadas na estatstica a distribuio de freqncias. Os grficos
associados ela so o grfico de freqncias (denominado histograma, para o caso de
variveis quantitativas contnuas), o polgono de freqncias, o grfico de freqncia
acumulada e o polgono de freqncia acumulada.
1.4

Distribuies de Freqncia

Muitas vezes os grficos so elaborados utilizando-se as freqncias dos valores da


varivel. Para tal, necessitamos definir alguns conceitos importantes.
1.4.1

Freqncias e freqncias relativas

Definimos freqncia de um valor de uma varivel (qualitativa ou quantitativa)


como sendo o nmero de vezes que aquele valor se repete no conjunto de dados

14

experimentais. Usaremos a notao f i para representar a freqncia do i-simo valor


observado.
Sendo n o nmero total de valores observados e k o nmero de diferentes valores
obtidos, tem-se:
k
X

fi = n

(1.1)

i=0

Exemplo
Seja o conjunto de dados abaixo (Tabela 1.1), que representa o nmero filhos de
funcionrios da empresa Fictcia S.A..

TABELA 1.1 Nmero de filhos dos 50 funcionrios da empresa Fictcia S.A.


Num.de Filhos
0
1
2
3
4
5
Total

Freqncia
15
10
13
6
3
3
50

As freqncias so:

f0 = 15 (corresponde ao valor 0)
f1 = 10 (corresponde ao valor 1)
f2 = 13 (corresponde ao valor 2)
f3 = 6 (corresponde ao valor 3)
f4 = 3 (corresponde ao valor 4)
f5 = 3 (corresponde ao valor 5)

15

Freq. Relativa
0,30
0,20
0,26
0,12
0,06
0,06
1,00

Chamamos de distribuio de freqncias associao das freqncias aos


respectivos valores observados. Portanto, a representao acima caracteriza uma
distribuio de freqncias. Do mesmo modo, podemos definir freqncia relativa de
um valor observado como sendo a relao:
fi
n

(1.2)

pi = 1

(1.3)

pi =

Verifica-se facilmente que:


k
X

i=0

1.5

Distribuio de freqncias e sua representao grfica para


variveis quantitativas discretas

A Tabela 1.1 representa a distribuio de frquencias para a varivel discreta "nmero


de filhos". A representao grfica de uma distribuio de freqncia de uma varivel
quantitativa discreta denominada grfico de freqncias (Figura 1.2). Utilizando o
exemplo, temos o seguinte grfico de frequencias

Fig. 1.2 Histograma de freqncia

Uma outra representao utilizada a do grfico das freqncias acumuladas

16

e freqncias relativas acumuladas. Tomando-se os dados do exemplo anterior


podemos calcular as freqncias, freqncias acumuladas e freqncias relativas
acumuladas dos diversos valores. Esse clculo est ilustrado na Tabela 1.2.

TABELA 1.2 Freqncias, freqncias relativas e freqncias relativas acumuladas


Num.de Filhos

Freqncia

Freq. Relativa

0
1
2
3
4
5
Total

15
10
13
6
3
3
50

0,30
0,20
0,26
0,12
0,06
0,06
1,00

Freq. Relativa
Acumulada
0,30
0,50
0,76
0,88
0,94
1,00
-

Com os dados acima podemos construir o grfico de freqncias relativas (Figura


1.3) e freqncias relativas acumuladas (Figura 1.4).

Fig. 1.3 Histograma de freqncias relativas

17

Fig. 1.4 Histograma de freqncias relativas acumuladas


1.6

Distribuio de freqncias e sua representao grfica para


variveis quantitativas contnuas

As variveis quantitativas contnuas diferem um pouco das discretas na sua forma


de representao grfica. Para entender essa diferena temos que nos lembrar que
as variveis contnuas, por definio, tm os seus valores definidos num intervalo
contnuo dos nmeros reais. Portanto, no tem sentido falar em freqncia de
repetio de um determinado valor, pois os valores raramente se repetem. A Tabela
1.3 representa uma distribuio de freqncia para a varivel contnua "altura de
funcionrios".

TABELA 1.3 Altura (cm) dos 50 funcionrios da empresa Fictcia S.A.


Altura
151 - 159
159 - 167
167 - 175
175 - 183
183 - 191
191 - 199
Total

Freqncia
2
11
18
10
8
1
50

Intervalos de classes: O smbolo que define uma classe

18

Freq. Relativa
0,04
0,22
0,36
0,20
0,16
0,02
1,00

Exemplo: 151 158


Limites da classe: Os nmeros extremos de cada intervalo
Exemplo: o limite inferior da 1a classe 151 e o limite superior da 1a classe 158
Ponto mdio de classe:ponto intermedirio do intervalo de classe
Exemplo: Ponto mdio da 1a classe 154, 5
Amplitude do intervalo de classe: a diferena entre os limites reais superior e
inferior
Exemplo: amplitude da 1a classe 8
Com os dados da Tabela 1.1 podemos construir o grfico de freqncias do mesmo
modo que fizemos para as variveis discretas. A diferena mais importante que,
agora, as freqncias so associadas a intervalos de valores (classes de freqncias)
e no mais a valores individuais da varivel em estudo.
Alm disto, o grfico, neste caso, chamado de histograma (Figura 1.5) que consiste
em um conjunto de retngulos, com centro no ponto mdio e larguras iguais aos
intervalos das classes, e reas proporcionais s freqncias das classes.
A seguir est mostrado o histograma correspondente aos dados do exemplo acima,
e o polgono de freqncias, que o grfico obtido unindo-se os pontos mdios dos
patamares do histograma.

Fig. 1.5 Histograma e Poligono de freqncia

19

O prximo grfico o polgono de freqncias acumuladas. Ele construdo unindo-se


as freqncias acumuladas ao final de cada classe de freqncias (Tabela 1.4). Pode
ser construdo tambm com as freqncias relativas acumuladas e, neste caso, ele se
chama polgono de freqncias relativas acumuladas. O primeiro est mostrado na
Figura 1.6.

TABELA 1.4 Altura (cm) dos funcionrios da Fictcia S.A.


Altura
< 151
< 159
< 167
< 175
< 183
< 191

Num. de Funcionrios
0
2
13
31
41
50

Fig. 1.6 Histograma freqncia acumulada

1.6.1

Curvas de Freqncia

Tipos de curvas de freqncia: As curvas de freqncia aparecem, na prtica,


sob diversas formas caractersticas, como as indicadas na Figura 1.7
1.7

Medidas de Tendncia Central

As medidas mais comuns so: mdia, mediana, moda

20

Fig. 1.7 Histograma freqncia


1.7.1

Mdia

e
A mdia de um conjunto de N nmeros X1 , X2 , ..., XN representada por X
definida por:
= X1 + X2 + ... + XN
X
N
PN
i=1 Xi
=
N

(1.4)

De modo geral, para dados agrupados, temos:

X
=

m
X

xi

i=1

onde: xi o ponto mdio da classe i;

fi
N

fi
N

(1.5)

a freqncia relativa da classe i; e m

nmero de classes.
1.7.2

Mediana

A mediana de um conjunto de nmeros, ordenados em ordem de grandeza, o valor


mdio (N impar) ou a mdia aritmtica dos dois valores centrais (N par).
Exemplos:
{3, 4, 4, 5, 6, 8, 8, 8, 10} tem mediana 6

21

{5, 6, 7, 9, 11, 12, 13, 17} tem mediana 10


1.7.3

Moda

A moda o valor que ocorre com mais freqncia. A moda pode no existir e, mesmo
que exista, pode no ser nica.
Exemplos:
{1, 1, 3, 3, 5, 7, 7, 7, 11, 13} tem moda 7
{3, 5, 8, 11, 13, 18} no tem moda
{3, 5, 5, 5, 6, 6, 7, 7, 7, 11, 12} tem duas modas 5 e 7 (bimodal)
1.8

Medidas de Disperso

O grau ao qual os dados numericos tendem a dispersar-se em torno de um valor


mdio chama-se variao ou disperso dos dados.
As medidas mais comuns so: amplitude total, desvio mdio, desvio padro e
varincia.
1.8.1

Amplitude Total

a diferena entre o maior e o menor valor


Exemplos:
A amplitude total de {4, 7, 9, 11, 11, 15, 20} 16
1.8.2

Desvio Mdio

O desvio mdio de X1 , X2 , ..., XN pode ser obtido pela seguinte frmula


PN
DM =

i=1

|
| Xi X
N

Exemplo:
O desvio mdio de {2, 3, 6, 8, 11} 2.8

22

(1.6)

Para dados agrupados (em tabelas de freqncia) o desvio padro computado por:
m
1 X

| fi
DM =
| Xi X
N i=1

(1.7)

Onde: xi o ponto mdio da classe i, fi a freqncia da classe i, e m o nmero


de classes.
1.8.3

Coeficiente de Variao

O efeito da variao ou disperso em relao mdia medido pela disperso


relativa, que definida por:
DR =

Disp. absoluta
M edia

Se a disperso absoluta for o desvio padro, a disperso relativa denominada


coeficiente de variao (CV ), que pode ser representado por:
s
CV =
X

(1.8)

est prximo de zero.


Obs: O Coeficiente de variao deixa de ser til quando o X
1.8.4

Varincia ( 2 )

o quadrado do desvio padro


PN
2

i=1

2
(xi X)
N

(1.9)

Observao: O desvio padro corresponde aos dados de uma amostra em geral


calculado com o divisor (N 1) ao invs de N , para que se tornem estimadores
no tendenciosos. Neste caso geralmente utiliza-se as letras s e s2 para representar
o desvio padro e a varincia, respectivamente.

23

1.8.5

Desvio Padro ()

O desvio padro de X1 , X2 , ..., XN dado por:


s
=

PN
i=1

2
(xi X)
N

(1.10)

Para dados agrupados o desvio padro computado por:


s

1.9
1.9.1

Pm

i=1

fi
(xi X)
N

(1.11)

Momentos, Assimetria e Curtose


Momentos

Se X1 , X2 , ..., XN so os N valores assumidos pela varivel X, define-se momento


de ordem r por:
0

X1r + X2r + ... + XNr


N
PN
r
i=1 Xi
=
N

mr =

(1.12)

e o momento de ordem r centrado na mdia pela equao


PN
mr =

i=1

Observao:
= m0
X
1
0 2
0
2 = m2 m1
m1 = 0
2 = m2

24

Xi X
N

r
(1.13)

Para dados agrupados os momentos podem ser calculados por:


Pm
mr =

i=1

xi X
N

fi

(1.14)

onde: xi o ponto mdio da classe i, fi a freqncia e m o nmero de classes.


1.9.2

Assimetria

o grau de desvio, ou afastamento da simetria, de uma distribuio.


Para distribuies assimtricas, a mdia tende a situar-se do mesmo lado da moda
que a cauda mais longa. Por isso, uma medida de assimetria proporcionada pela
diferena entre a mdia e a moda. Ela pode ser tomada sem dimenso atravs de
uma diviso por uma medida de disperso, como o desvio padro, resultando em:
Assimetria =

moda
X
s

(1.15)

Uma outra medida importnte o coeficiente do momento de assimetria, que


utiliza o 3o momento centrado, expresso sob a forma no dimensional, definida por
a3 =

1.9.3

m3
m3
=p 3
3
s
m2

(1.16)

Curtose

o grau de achatamento de uma distribuio, e muitas vezes considerado em


relao a uma distribuio normal como as indicadas na Figura 1.8

Fig. 1.8 Exemplos de curtose

25

Uma medida de curtose o coeficiente do momento de curtose definido por:


a4 =

m4
m4
= 2
4
s
m2

(1.17)

Para a distribuio normal, a4 = 3. Por essa razo, a curtose freqntemente


definida por (a4 3), que positivo para uma distribuio leptocrtica, e negativo
para uma platicrtica e nulo para uma normal.

26

CAPTULO 2
PROBABILIDADE
2.1

Definio de Probabilidade utilizando Freqncia Relativa

Uma da definies de probabilidade utiliza a freqncia relativa, j que as freqncias


relativas so estimativas de probabilidades. Podemos ento definir a probabilidade
como a proporo (ou freqncia relativa) em uma seqncia muito grande de
experimentos.
lim

P (e1 ) =n

n1
n

(2.1)

Onde:
e1 o resultado;
n o nmero total de vezes que se repete o experimento;
n1 o nmero de vezes que o resultado e1 ocorre;
n1
n

portanto a freqncia relativa de e1 .

Observao: Se o experimento tiver N resultados possveis e1 , e2 , ..., eN ento:


0 P (ei ) 1

i = 1, 2, ..., N

P (e1 ) + P (e2 ) + ... + P (eN ) = 1

2.2

(2.2)

Experimentos aleatrios

Encontramos na natureza dois tipos de fenmenos: determinsticos e aleatrios.


Os fenmenos determinsticos so aqueles em que os resultados so sempre os
mesmos, qualquer que seja o nmero de ocorrncias verificadas.
Nos fenmenos aleatrios, os resultados no sero previsveis, mesmo que haja um
grande nmero de repeties do mesmo fenmeno. Por exemplo, se considerarmos
um pomar com centenas de laranjeiras, as produes de cada planta sero diferentes
e no previsveis, mesmo que as condies de temperatura, presso, umidade, solo,
etc. sejam as mesmas para todas as rvores.
Experimentos ou fenmenos aleatrios so aqueles que, mesmo repetidos vrias
vezes sob condies semelhantes, apresentam resultados imprevisveis.

27

Exemplos:
a) Lanamento de uma moeda honesta;
b) Lanamento de um dado;
c) Lanamento de duas moedas;
d) Retirada de uma carta de um baralho completo de 52 cartas;
e) Determinao da vida til de um componente eletrnico.
2.3

Espao Amostral

Defini-se espao amostral (S) ao conjunto de todos os resultados possveis de um


experimento.
Nos exemplos acima, os espaos amostrais so:
a) S = {c, r}
b) S = {1, 2, 3, 4, 5, 6}
c) S = {(c, r), (c, c), (r, c), (r, r)}
d) S = {Ao , ..., Ko , Ap , ..., Kp , Ac , ..., Kc , Ae , ..., Ke }
e) S = {t R/t 0}
Cada um dos elementos de S que corresponde a um resultado recebe o nome de
ponto amostral.
2.4

Eventos

Chamamos de evento (E) a qualquer subconjunto do espao amostral S de um


experimento aleatrio.
Assim, o evento aleatrio pode ser um nico ponto amostral ou uma reunio deles.
Qualquer que seja o evento E, se E S, ento E um evento de S.
Se E = S, E chamado evento certo.
Se E S e E um conjunto unitrio, E chamado evento elementar.
Se E = , E chamado evento impossvel.

28

Exemplos:
1. No lanamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
a) A = {2, 4, 6} S; logo A um evento de S;
b) B = {1, 2, 3, 4, 5, 6} S; logo B um evento certo de S (B = S);
c) C = {4} S; logo C um evento elementar de S;
d) D = S; logo D um evento impossvel de S.
Um evento sempre definido por uma sentena. Assim os eventos acima podem ser
definidos pelas sentenas: a) "Obter um nmero par"; b) "Obter um nmero menor
ou igual a seis"; c) "Obter um nmero maior que trs e menor que cinco"; d) "Obter
um nmero maior que seis".
2. Lanam-se dois dados. Enumerar os seguintes eventos:
a) Sada de faces iguais;
b) Sada de faces cuja soma seja igual a 10;
c) Sada de faces cuja soma seja menor que 2;
d) Sada de faces cuja soma seja menor que 15;
e) Sada de faces onde uma face o dobro da outra.
Neste caso, o espao amostral pode ser representado por uma tabela de dupla
entrada:
D2

(1, 1)

(1, 2)

(1, 3)

(1, 4)

(1, 5)

(1, 6)

(2, 1)

(2, 2)

(2, 3)

(2, 4)

(2, 5)

(2, 6)

(3, 1)

(3, 2)

(3, 3)

(3, 4)

(3, 5)

(3, 6)

(4, 1)

(4, 2)

(4, 3)

(4, 4)

(4, 5)

(4, 6)

(5, 1)

(5, 2)

(5, 3)

(5, 4)

(5, 5)

(5, 6)

(6, 1)

(6, 2)

(6, 3)

(6, 4)

(6, 5)

(6, 6)

D1

S=

Os eventos pedidos so:

29

a) A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)};
b) B = {(4, 6), (5, 5), (6, 4)};
c) C = (evento impossvel);
d) D = S (evento certo);
e) E = {(1, 2), (2, 1), (2, 4), (3, 6), (4, 2), (6, 3)}.
2.5

Classe dos Eventos Aleatrios

Definio: o conjunto formado de todos os eventos (subconjuntos) do espao


amostral. Para efeito de exemplo, consideremos o espao amostral finito: S =
{e1 , e2 , e3 , e4 }. A classe dos eventos aleatrios :

{e1 } , {e2 } , {e2 } , {e4 } ,


F (S) =
{e1 , e2 } , {e1 , e3 } , {e1 , e4 } , {e2 , e3 } , {e2 , e4 } , {e3 , e4 } ,

{e1 , e2 , e3 } , {e1 , e2 , e4 } , {e1 , e3 , e4 } , {e2 , e3 , e4 } ,

{e1 , e2 , e3 , e4 }
2.6

Definio Clssica de Probabilidade

Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que
todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S um
conjunto eqiprovvel.
Definimos probabilidade de um evento A (A S) ao nmero real P (A), tal que:
P (A) =

no de resultados f avoraveis a A
n(A)
=
o
n de resultados possiveis
n(S)

(2.3)

Exemplo:
Considerando o lanamento de um dado, pede-se:
a) A probabilidade do evento A "obter um nmero par na face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
A = {2, 4, 6} n(A) = 3.
Logo, P (A) =

3
6

= 12 .

30

b) A probabilidade do evento B "obter um nmero menor ou igual a 6 na


face superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
B = {1, 2, 3, 4, 5, 6} n(B) = 6.
Logo, P (B) =

6
6

= 1.

c) A probabilidade do evento C "obter um nmero 4 na face superior".


Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
C = {4} n(C) = 1.
Logo, P (C) = 16 .
d) A probabilidade do evento D "obter um nmero maior que 6 na face
superior".
Temos:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
D = n(D) = 0.
Logo, P (D) =

0
6

= 0.

Exerccios Complementares:
1 - No lanamento de dois dados, calcule a probabilidade de se obter soma
igual a 5.
2 - Qual a probabilidade de sair uma figura quando retiramos uma carta de
um baralho de 52 cartas?
3 - Retira-se uma carta de um baralho completo de 52 cartas.
a) Qual a probabilidade de sair uma carta de copas ou de ouros?
b) Qual a probabilidade de sair um rei ou uma carta de espadas?
4 - No lanamento de um dado, qual a probabilidade de se obter um nmero
no inferior a 5?
5 - So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual a probabilidade
de tiramos uma dama e um rei, no necessariamente nessa ordem?

31

6 - Dois dados so lanados conjuntamente. Determine a probabilidade de a


soma ser 10 ou maior que 10.

2.7

Operaes com Eventos Aleatrios - Teoria dos Conjuntos

Consideremos um espao amostral finito S = {e1 , e2 , e3 , ..., en }. Sejam A e B dois


eventos de F (S). As seguintes operaes so definidas:
2.7.1

Unio de conjuntos

Definio: A B = {ei S / ei A ou ei B} , i = 1, . . . , n. Portanto, o


evento unio formado pelos pontos amostrais que pertenam a pelo menos um
dos conjuntos. A unio pode ser vista na Figura 2.1.

Fig. 2.1 Unio dos conjuntos A e B

Observao:
1) A B = B A
2) A A = A
3) A = A
4) Se A B A B = B (em particular A S = S).

32

A representao da unio de n eventos A1 , A2 , ..., An (A1 A2 ... An ) dada por:


n
[

Ai

(2.4)

i=1

2.7.2

Interseco de conjuntos

Definio: A B = {ei S / ei A e ei B} , i = 1, . . . , n. Portanto, o evento


interseco formado pelos pontos amostrais que pertenam simultaneamente aos
eventos A e B. A interseco pode ser vista na Figura 2.2.

Fig. 2.2 Interseco dos conjuntos A e B

Observao:
1) A B = B A
2) A A = A
3) A =
4) Se A B A B = A (em particular A S = A)
5) (A B) C = A (B C).
A representao da interseco de n eventos A1 , A2 , ..., An (A1 A2 ... An ) dada

33

por:
n
\

Ai

(2.5)

i=1

2.7.3

Complemento

Definio: S A = A = Ac = {ei S / ei
/ A} , i = 1, . . . , n. O complemento de
um evento A , portanto, o evento contendo todos os resultados no espao amostral
S que no pertenam a A. O complemento de A pode ser visto na Figura 2.3.
Observao:

Fig. 2.3 Complemento do conjunto A

1) (Ac )c = A
2) A Ac = S
3) c = S
4) A Ac =
5) S c = .
2.7.4

Eventos Mutuamente Exclusivos ou Disjuntos

Definio: Dois eventos so ditos mutuamente exclusivos ou disjuntos se A e B


no puderem ocorrer juntos, ou seja a realizao de um exclui a realizao do outro.
Segue que A e B so disjuntos se A B = .

34

Exemplo: Lanam-se duas moedas. Sejam os eventos


A: sada de faces iguais e
B: sada de cara na primeira moeda.
Determinar os eventos:
A B, A B, A, B,(A B),(A B), (A B), (A B), B A, A B, A B, e
B A.
Resoluo:
S = {(c, c), (c, r), (r, c), (r, r)}
A = {(c, c), (r, r)}
B = {(c, c), (c, r)} .
A B = {(c, c), (c, r), (r, r)}
A B = {(c, c)}
A = {(c, r), (r, c)}
B = {(r, c), (r, r)}
(A B) = {(r, c)}
(A B) = {(c, r), (r, c), (r, r)}
(A B) = {(r, c)}
(A B) = {((c, r), (r, c), (r, r)}
B A = {(c, r)}
A B = {(r, r)}
A B = {(c, r)}
B A = {(r, r)} .
Obs: Note que (A B) = (A B) e (A B) = (A B)
2.8

Definio Axiomtica de Probabilidade

Para um dado experimento, necessrio atribuir para cada evento A no espao


amostral S um nmero P (A) que indica a probabilidade de A ocorrer. Para satisfazer
a definio matemtica de probabilidade, este nmero P (A) deve satisfazer trs
axiomas especficos:
Axioma 1: Para qualquer evento A, P (A) 0
Axioma 2: P (S) = 1

35

Axioma 3: Para qualquer seqncia infinita de eventos disjuntos A1 , A2 , ...


P(

Ai ) =

i=1

P (Ai )

(2.6)

i=1

A definio matemtica de probabilidade pode agora ser dada como segue:


A distribuio de probabilidade, ou simplesmente a probabilidade, no espao
amostral S uma especificao de nmeros P (A) que satisfazem os axiomas 1, 2, e
3.
Teorema 1: P () = 0
Teorema 2: Para qualquer seqncia finita de eventos disjuntos A1 , A2 , ..., An
P(

n
[

Ai ) =

i=1

n
X

P (Ai )

(2.7)

i=1

Teorema 3: Para qualquer evento A,


P (Ac ) = 1 P (A)

(2.8)

Teorema 4: Para qualquer evento A, 0 P (A) 1


Teorema 5: Se A B, ento P (A) P (B)
Teorema 6: Para qualquer dois eventos A e B
P (A B) = P (A) + P (B) P (A B)

(2.9)

Observao:
1.
P (A1 A2 A3 ) = P (A1 ) + P (A2 ) + P (A3 )
= [P (A1 A2 ) + P (A2 A3 ) + P (A1 A3 )]
= +P (A1 A2 A3 )

36

(2.10)

2. Se dois eventos so mutuamente exclusivos, ento P (A B) = P (A) + P (B).


2.9

Eventos Independentes

Suponha que dois eventos A e B ocorram independentes um do outro no sentido que


a ocorrncia ou no de um deles tenha nenhuma relao, e nenhuma influncia na
ocorrncia ou na no ocorrncia do outro. Nessas condies
P (A B) = P (A) P (B)

(2.11)

Definio: Dois eventos so independentes se P (A B) = P (A) P (B)


Teorema 1: Se dois eventos A e B so independentes, ento os eventos A e B c
tambem so independentes.
Exerccios Complementares:
1 - De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta
do primeiro baralho e uma carta do segundo. Qual a probabilidade de a
carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus?
2 - Uma urna A contm 3 bolas brancas, 4 pretas, 2 verdes; uma urna B
contm 5 bolas brancas, 2 pretas, 1 verde; uma urna C contm 2 bolas
brancas, 3 pretas, 4 verdes. Uma bola retirada de cada urna. Qual a
probabilidade de as trs bolas retiradas da primeira, segunda e terceira
urnas serem respectivamente, branca, preta e verde?
3 - De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem
reposio. Qual a probabilidade de a primeira ser o s de paus e a segunda
ser o rei de paus?
4 - So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma
carta do primeiro baralho e uma carta do segundo. Qual a probabilidade
de tiramos uma dama e um rei, no necessariamente nessa ordem?
5 - Dois dados so lanados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
6 - A probabilidade de que um homem esteja vivo daqui a 30 anos 2/5; a

37

de sua mulher de 2/3. Determinar a probabilidade de que daqui a 30


anos:
a) ambos estejam vivos;
b) somente o homem esteja vivo;
c) somente a mulher esteja viva;
d) nenhum esteja vivo;
e) pelo menos um esteja vivo.
7 - Sejam A e B eventos tais que P(A) = 0,2; P(B) = p; P(A B) = 0,6.
Calcular p considerando A e B:
a) Mutuamente exclusivos
b) Independentes.
2.10

Anlise Combinatoria

Definio: Defini-se fatorial de n por n!


n! = n(n 1)(n 2)(n 3)...1
Por definio 0! = 1
2.10.1

Permutao

Amostra sem reposio: Uma permutao de n objetos diferentes, tomados r de


cada vez, um arranjo de r dos n objetos, levando-se em considerao a ordem de
sua disposio.
O nmero de permutaes de n objetos, tomados r de cada vez representado por
Pnr e calculado por
Pnr = n(n 1)(n 2)...(n r + 1) =

Em particular

n!
(n r)!

(2.12)

Pnn = n!

O nmero de permutaes de n objetos distribuidos em grupos dos quais n1 so

38

iguais, n2 so iguais, ... nk so iguais, :


n!
n1 !n2 !...nk !

onde n1 + n2 + ... + nk = n

(2.13)

Amostragem com Reposio: Considere uma amostragem com reposio, como


por exemplo uma urna contendo n bolas e se selecione k bolas, uma de cada vez,
repondo a bola na urna aps o evento. O espao amostral S ser composto por nk
elementos.
Exemplo:
1. Suponha que um clube possua 25 membros, e que um presidente e um secretrio
sero escolhidos entre os membros. De quantas maneiras estes cargos podem ser
preenchidos?
Soluo: Como as posies podem ser preenchidas, escolhendo-se primeiro o
presidente dentre os 25 membros, e depois o secretrio dentre os 24 restantes,
2
o nmero total de maneiras que os cargos podero ser preenchidos ser P25
=
(25)(24) = 600.
2. Suponha que seis livros diferentes sero arrumados em uma estante. O nmero de
possveis permutaes dos livros 6! = 720.
3. O nmero de permutaes da palavra estatistica
2.10.2

11!
3!2!2!2!1!1!

= 831.600.

Combinaes

Uma combinao de n objetos tomados r de cada vez, uma escolha dos n objetos,
no se levando em considerao a ordem de sua posio. O nmero
n de combinaes
k
de n objetos, tomados k de cada vez, representado por Cn ou k .
O clculo (ou frmula) para combinaes pode ser obtido atravs de uma permutao
que pode ser construida da seguinte maneira: Sabe-se que o nmero de permutaes
de n elementos tomados k de cada vez Pnk . Primeiro uma combinao particular de
k elementos selecionada. Cada diferente permutao desses k elementos levar
a uma permutao na lista. Como h k! permutaes desses k elementos, esta
combinao particular produzir k! permutaes na lista. Quando uma combinao
diferente de k elementos selecionada, k! outras permutaes na lista so obtidas.
Como cada combinao de k elementos produzir k! permutaes, o nmero total

39

de permutaes na lista ser de k! Cnk , isto Pnk = k! Cnk . Portanto


Cnk

2.11

Pnk
n!
=
=
k!
k!(n k)!

(2.14)

Probabilidade Condicional

Se A e B so dois eventos, a probabilidade de A ocorrer, depois de B ter


acontecido, representada por P (A/B) (probabilidade de A dado B ) e denominada
probabilidade condicional de A, depois de B ter ocorrido.
Neste caso, a probabilidade do evento A muda aps se ter aprendido que o evento
B ocorreu. Como se sabe que o evento B ocorreu, ento sabemos que o resultado
do evento A ser um dos includos em B. Ento, para calcular a probabilidade
que A ocorrer, devemos considerar o conjunto dos possveis resultados de B que
tambm resultariam na ocorrncia de A. Este conjunto precisamente A B.
portanto natural definir-se a probabilidade condicional P (A/B) como a proporo
da probabilidade total P (B) que representadoa pela probabilidade P (A B).
Portanto, tem-se a seguinte definio:
P (A/B) =

P (A B)
P (B)

dado P (B) > 0

(2.15)

Se P (B) = 0 a P (A/B) no definida.


Probabilidade Condicional para Eventos Independentes
Se A e B forem independentes, ento P (A B) = P (A) P (B). Logo,
P (A/B) =

P (A) P (B)
= P (A)
P (B)

(2.16)

P (B/A) =

P (B) P (A)
= P (B)
P (A)

(2.17)

Da mesma forma,

Teorema: Suponha que A1 , A2 , ..., An sejam quaisquer eventos tais que

40

P (A1 ) > 0, P (A1 A2 ) > 0, ..., P (A1 A2 A3 ... An1 ) > 0. Ento
P (A1 A2 ... An ) =
= P (A1 ) P (A2 /A1 ) P (A3 /A1 A2 )...
P (An /A1 A2 ...An1 ).

(2.18)

Exemplo:
Suponha que 4 bolas sejam selecionadas, uma de cada vez, sem reposio, de uma
urna contendo v bolas vermelhas e a azuis. (v 2, a 2). Qual a probabilidade de
se obter uma sequncia de resultados vermelho, azul, vermelho, azul?
vj : uma bola vermelha retirada na j-sima vez
aj : uma bola azul retirada na j-sima vez
onde j=1,2,3,4
P (v1 , a2 , v3 , a4 ) =
= P (v1 ) P (a2 /v1 ) P (v3 /v1 a2 ) P (a4 /v1 a2 v3 )
v
v+a

2.12

a
v+a1

v1
v+a2

a1
v+a3

Probabilidade Total

Seja S o espao amostral de um experimento, e considere k eventos A1 , A2 , . . . , Ak


S
em S tal que A1 , A2 , . . . , Ak sejam disjuntos e ni=1 Ai = S. Diz-se, etno, que estes
eventos formam uma partio de S.
Se os eventos A1 , A2 , ..., Ak formam uma partio de S, e B qualquer outro evento
em S, ento:
B = (A1 B) (A2 B) ... (Ak B).
Como os k eventos do lado direito da equao acima so disjuntos:
P (B) =

k
X

P (Aj B)

j=1

41

(2.19)

Mas P (Aj B) = P (Ai ) P (B/Aj ) onde j = 1, 2, ..., k. Ento


P (B) =

k
X

P (Aj ) P (B/Aj )

(2.20)

j=1

De forma a apresentar a frmula para a probabilidade total e a frmula de


Bayes, vamos supor que exista numa imagem duas classes de cobertura terrestre,
denominadas A1 e A2 , e que os pixels desta imagem sero classificados como
pertencentes a A1 ou A2 segundo o valor de alguma caracterstica (por exemplo,
nvel de cinza). Suponha qua a probabilidade de ocorrncia da classe A1 seja P (A1 )
e a probabilidade de ocorrncia da classe A2 seja P (A2 ). Obviamente pixels da
classe A1 podem ser erroneamente classificados como sendo da classe A2 , e vice
versa. Designemos estas probabilidades, P (CA2 /A1 ) e P (CA1 /A2 ) respectivamente.
Suponha que seja tomado aleatoriamente um pixel desta imagem e classificado,
segundo o valor da caracterstica estudada. Deseja-se saber a probabilidade deste
pixel ser classificado como A1 .
Aqui, temos que considerar o seguinte: o pixel pode ser classificado em A1 (CA1 ) e ser
realmente de A1 ou pode ser classificado em A1 (CA1 ) e ser realmente de A2 . Ento
podemos escrever que:
CA1 = (CA1 A1 ) (CA1 A2 )

Logo,
P (CA1 ) = P [(CA1 A1 ) (CA1 A2 )]

como os eventos so mutuamente exclusivos, temos:


P (CA1 ) = P (CA1 A1 ) + P (CA1 A2 )

Uma vez que os eventos CA1 e A1 (i = 1, 2) no so independentes, vem:


P (CA1 ) = P (CA1 /A1 )P (A1 ) + P (CA1 /A2 )P (A2 )

42

ou
P (CA1 ) =

P (CA1 Ai ) =

P (CA1 /Ai )P (Ai )

(2.21)

A expresso da equao 2.21 acima normalmente chamada de frmula para a


probabilidade total.
2.13

Teorema de Bayes

Sejam os eventos A1 , A2 , ..., Ak que formam uma partio do espao S tal que
P (Aj ) > 0 para todo j = 1, 2, ..., k, e seja B qualquer evento tal que P (B) > 0.
Ento, para i = 1, 2, ..., k, temos:
P (Ai )P (B/Ai )
P (Ai /B) = Pk
j=1 P (Aj )P (B/Aj )

(2.22)

Prova: Pela definio de probabilidade condicional,


P (Ai /B) =

P (Ai B)
P (B)

(2.23)

O numerador da equao 2.22 igual a P (Ai B) e o denominador igual a P (B)


(pela frmula para probabilidade total).
Imaginemos agora uma situao onde um pixel classificado como A1 . Quer-se
saber qual a probabilidade dele ser realmente um pixel da classe A1 . Note que aqui
fornecida uma informao sobre o resultado da classificao do pixel, isto , dito que
ele foi classificado como pertencente classe A1 dado que o mesmo foi classificado
em A1 .
Em outras palavras, quer-se
P (A1 /CA1 ) =

P (A1 CA1 )
P (CA1 )

(2.24)

Note que o denominador da expresso 2.24 acima dado em 2.21, podendo-se

43

expressar
P (CAi /A1 )P (A1 )
P (A1 /CA1 ) = P
i P (CA1 /Ai )P (Ai )

(2.25)

Esta formulao pode obviamente ser generalizada para uma situao onde os
eventos A1 , A2 , ..., An formam um sistema completo de resultados de alguma
operao e onde K denota um resultado arbitrrio desta operao. Neste caso tem-se
que:
P (Ai /K) =

P (K/Ai )P (Ai )
P (Ai K)
=P
P (K)
P (K/Ai )P (Ai )

(2.26)

que conhecida como a frmula de Bayes e que tem aplicaes diversas na rea de
sensoriamento remoto.
A seguir dada uma aplicao especfica utilizada em Classificao.
2.13.1

Teoria de Bayes

Suponha que seja medida alguma caracterstica x de uma cena (por exemplo, o
nvel de cinza de cada pixel ) e que tenha que se decidir a qual de duas classes (por
exemplo, vegetao ou solo) um pixel pertence. Este um problema unidimensional,
de classificao em duas classes, no domnio de caracterstica da imagem. Se um
nmero grande de pixels est disponvel, que pode ser considerado representativo
de cada classe (isto , dados de treinamento) podemos calcular um histograma da
frequncia relativa da caracterstica para cada classe, conforme mostrado na Figura
2.4.
Considere-as como aproximaes das funes densidade de probabilidade (f.d.p.)
contnuas de uma amostra infinita de dados. Essas funes densidade de
probabilidade condicionais, P (x/A1 ) e P (x/A2 ) tem rea unitria e descrevem a
probabilidade de um pixel ter valor x da caracterstica, dado que ele est na classe A1
ou na classe A2 , respectivamente. Cada f.d.p. pode ser delineada pela probabilidade
a priori P (Ai ) que a classe Ai ocorra na rea de interesse na imagem.
Estas

funes

de

probabilidade

delineadas

P (x/Ai )P (Ai )

representam

probabilidade que um pixel tenha o valor x na caracterstica e est na classe Ai . Em

44

Fig. 2.4 A probabilidade a priori nas f.d.p. das classes


sensoriamento remoto, estas probabilidades a priori podem ser estimadas atravs de
fontes externas de informao sobre a cena, tais como pesquisas de campo, mapas
ou dados histricos.
Para se tomar uma deciso de classificao para um pixel, precisamos conhecer
as probabilidades a posteriori que o pixel pertena cada uma das classes de
treinamento, dado que o pixel tem valor x na caracterstica. Esta probabilidade
P (Ai /x) pode ser calculada com a regra de Bayes
P (Ai /x) =

P (x/Ai )P (Ai )
P (x)

(2.27)

P (x/Ai )P (Ai )

(2.28)

Onde
P (x) =

2
X
1

Uma regra de deciso pode agora ser formada com as probabilidades a posteriori da
equao 2.27. Se um pixel tem valor x na caracterstica, uma abordagem intuitiva
satisfatria designar o pixel classe A1 se P (A1 /x) maior que P (A2 /x).
Semelhantemente, o pixel seria designado classe A2 se P (A2 /x) maior que
P (A1 /x). Sendo P (x) igual para as duas classes na equao 2.28 ela pode ser ignorada
numa comparao dos dois e podemos escrever a regra de deciso de Bayes

45

- um pixel pertence classe A1 se P (x/A1 )P (A1 ) > P (x/A2 )P (A2 )


- um pixel pertence classe A2 se P (x/A2 )P (A2 ) > P (x/A1 )P (A1 )
Numa situao atpica onde as duas probabilidades a posteriori so extamente iguais,
isto
P (A1 /x) = P (A2 /x)

ou
P (x/A1 )P (A1 ) = P (x/A2 )P (A2 )

uma deciso no pode ser tomada a partir das probabilidades de classe. Um processo
de desempate deve ser empregado, tal como escolher aleatoriamente classe 1 ou
classe 2. Pode ser mostrado que a regra de deciso de Bayes minimiza a probabilidade
mdia de erro sobre todo o conjunto de dados classificados, se todas as classes tem
f.d.p. normal.
Na prtica, as probabilidades P (Ai ) so difceis de ser obtidas e consequentemente
supe-se que elas sejam iguais. Obviamente resultados mais exatos seriam obtidos se
elas pudessem ser estimadas a partir de dados externos. Se, por exemplo, o objetivo
determinar a proporo dos tipos de cultura plantados numa estao particular,
a partir de imagens do Landsat de uma rea agrcola, podemos sensatamente
estabelecer as probabilidades a priori iguais s estimativas histricas da porcentagem
de cada cultura na rea.

46

CAPTULO 3
VARIVEIS ALEATRIAS E DISTRIBUIES
3.1

Varivel Aleatria

Definio: Considere um experimento para o qual o espao amostral denotado


por S. Define-se varivel aleatria como uma funo que associa um valor real a
cada elemento do espao amostral.
X : S <
Representamos as variveis aleatrias por letras maisculas e suas ocorrncias por
letras minsculas.
Exemplo:
Suponha o experimento "lanar trs moedas". Seja X: nmero de ocorrncias da
face cara . O espao amostral do experimento :
S = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r, r)} .
Se X o nmero de caras, X assume os valores 0, 1, 2 e 3. Podemos associar
a esses nmeros eventos que correspondem a nenhuma, uma, duas ou trs caras
respectivamente, como segue:
X

Evento Correspondente

A1 = {(r, r, r)}

A2 = {(c, r, r), (r, c, r), (r, r, c)}

A3 = {(c, c, r), (c, r, c), (r, c, c)}

A4 = {(c, c, c)}

3.2

Tipos de Variveis Aleatrias, Funo de Probabilidade e Funo


Densidade de Probabilidade

Definio: Seja X uma varivel aleatria (v.a.). Se o nmero de valores possveis


de X (isto o seu contradomnio), for finito ou infinito enumervel, denominaremos
X de varivel aleatria discreta. Isto , existe um conjunto finito ou enumervel
{x1 , x2 , ...} < tal que X(s) {x1 , x2 , ...} s S.
Definio: Seja X uma varivel aleatria discreta. Portanto, o contradomnio de
X ser formado por um nmero finito ou enumervel de valores x1 , x2 , . . . . A cada

47

possvel resultdo xi , associaremos um nmero p(xi ) = P (X = xi ), i = 1, 2, 3, ...,


denominado probabilidade de xi . Os nmeros p(xi ) devem satisfazer s seguintes
condies:
a) p(xi ) 0
b)

P
i=1

i,

p(xi ) = 1

A funo p, definida acima, denominada funo de probabilidade da varivel


aleatria X. A coleo de pares [xi , p(xi )] i = 1, 2, . . . , denominada distribuio
de probabilidade de X.
Exemplos:
a) Lanam-se dois dados. Seja a v.a. X: soma das faces. Determinar a
distribuio de probabilidade da varivel aleatria X (Figura 3.1).
X

10

11

12

p(X)

1
36

2
36

3
36

4
36

5
36

6
36

5
36

4
36

3
36

2
36

1
36

Fig. 3.1 Grfico de P (x) para dois dados

b) Considere o experimento no qual uma moeda jogada dez vezes e seja X


ser o nmero de caras que so obtidas. Neste experimento, os possveis

48

valores de X so 0,1, 2, ..., 10, e


P (X = x) =

n 1
,
x 210

x = 0, 1, 2, . . . , 10.

(3.1)

Definio: Seja X uma varivel aleatria. Suponha que <X , o contradomnio de X,


seja um intervalo ou uma coleo de intervalos. Ento diremos que X uma varivel
aleatria contnua.
Definio: Seja X uma varivel aleatria contnua. A funo densidade de
probabilidade f, indicada abreviadamente por f.d.p., uma funo f que satisfaz
s seguintes condies:
a) f (x) 0
b)

R
<X

x <X ,

f (x)dx = 1

Alm disso, definimos, para qualquer c < d (em <X )


Z

P (c < x < d) =

f (x)dx
c

Obs:
a) P (c < x < d) representa a rea sob a curva, como exemplificado no
grfico da Figura 3.2, da f.d.p. f , entre x = c e x = d.
b) Constitui uma consequncia da descrio probabilstica de X que, para
qualquer valor especificado de X, digamos x0 , teremos P (X = x0 ) = 0,
Rx
porque P (X = x0 ) = x00 f (x)dx = 0
Exemplo:
a) Suponhamos que a v.a. X seja contnua. Seja a f.d.p. f dada por:
(
f (x) =

2x 0 < x < 1,
0 caso contrrio.

49

Fig. 3.2 Grfico de f dp de f


Evidentemente, f (x) 0 e

f (x)dx =
1
R
P (X 1/2) deve-se calcular 02 (2x)dx = 14 .

R1
0

2xdx = 1. Para calcular

b) Seja X a durao de vida (em horas) de um certo tipo de lmpada.


Admitindo que X seja uma varivel aleatria contnua, suponha que a
f.d.p. f de X seja dada por:
(
f (x) =

a
x3

1500 x 2500,
caso contrrio.

R
Para calcular a constante a, recorre-se condio f (x)dx = 1, que
R 2500
significa, neste caso 1500 xa3 dx = 1, obtendo-se a = 7.031.250.
3.3

Funo de Distribuio Acumulada

Definio: A funo de distribuio da varivel aleatria X, representada por FX


ou simplesmente por F , definida por:
FX (x) = P (X x)

(3.2)

Observao:
a) A funo de distribuio de X tambm frequentemente chamada de
funo de distribuio acumulada de X.

50

b) A funo FX (x) no-decrescente quando x aumenta, isto , se x1 < x2 ,


ento FX (x1 ) FX (x2 ).
c) Para qualquer valor de x
P (X > x) = 1 FX (x)

(3.3)

d) Para quaisquer valores x1 e x2 , tais que x1 < x2 ,


P (x1 < X x2 ) = FX (x2 ) FX (x1 )

(3.4)

Teoremas:

a) Se X for uma varivel aleatria discreta,


FX (x) =

p(xj ),

onde o somatrio estendido a todos os ndices j que satisfaam


condio xj x.
b) Se X for uma varivel aleatria contnua com f.d.p. f ,
Z

FX (x) =

f (s)ds.

Exemplos:

a) Suponhamos que a v.a. X tome os trs valores 0,1, e 2, com probabilidades


1/3, 1/6 e 1/2, respectivamente. Ento:

0 se

1 se
3
F (x) =
1

se

1 se

x < 0,
0 x < 1,
1 x < 2,
0 x 2.

O grfico de F est apresentado na Figura 3.3.

51

Fig. 3.3 Grfico F


b) Suponha que X seja uma varivel contnua com f.d.p.
(
f (x) =

2x 0 < x < 1,
0

caso contrrio.

Portanto, a f.d. dada por:

x 0,

0R
x
2
F (x) =
(2s)ds = x 0 < x 1,
0

1
x > 1.
O grfico est apresentado na Figura 3.4.

3.4

Distribuies Bivariadas

Em alguns experimentos, necessrio considerar as propriedades de 2 ou mais


variveis simultaneamente. A distribuio de probabilidade conjunta de duas v.a.
denominada uma distribuio bivariada.
3.4.1

Distribuies Conjuntas Discretas

Suponha que um certo experimento envolve duas v.a. X e Y , cada qual com uma
distribuio discreta.
A funo de probabilidade conjunta de X e Y definida pela funo p tal que

52

Fig. 3.4 Meyer, pgina 75.


qualquer ponto (x, y) no plano xy,
p(x, y) = P (X = x e Y = y)

(3.5)

Observao:

a)

p(xi , yi ) = 1.

b) Se X e Y forem independentes
p(xi , yi ) = P (X = xi ) P (Y = yi )
Exemplo:
Suponha que a varivel aleatria X possa assumir somente of valores 1, 2, e 3, que
a varivel aleatria Y possa assumir somente os valores 1, 2, 3 e 4, e que a funo
de probabilidade conjunta de X e Y seja dada pela tabela:
Y

0,1

0,1

0,3

0,1

0,2

0,2

A funo de probabilidade conjunto mostrada na Figura 3.5. Deseja-se determinar:

53

a) P (X 2 e Y 2);
b) P (X = 1).

Fig. 3.5 Degroot, pgina 93.

a) Somando-se p(x, y) para todos os valores de x 2 e y 2, tem-se:


P (X 2 e Y 2) = p(2, 2)+p(2, 3)+p(2, 4)+p(3, 2)+p(3, 3)+p(3, 4) =
0, 5
b) P (X = 1) =
3.4.2

P4
y=1

p(1, y) = 0, 2.

Distribuies Conjuntas Contnuas

dito que duas v.a. X e Y possuem uma distribuio conjunta contnua se


existe uma funo f no negativa, definida sobre o plano xy, tal que para qualquer
subconjunto A do plano
Z Z
P [(x, y) A] =

f (x, y)dxdy

(3.6)

A funo f denominada funo densidade de probabilidade conjunta de X


e Y . Esta funo deve satisfazer

f (x, y) 0

para

<x<

54

<y <

e
Z

f (x, y)dxdy = 1

(3.7)

A probabilidade que o par (X, Y ) pertena a uma regio do plano xy pode ser
encontrada integrando a f.d.p. conjunta sobre esta regio. A Figura 3.5 mostra um
exemplo de f.d.p. conjunta.

Fig. 3.6 Degroot, pgina 95.

3.5

Distribuies Marginais

Denomina-se funo densidade de probabilidade marginal de X funo


densidade de probabilidade de X quando ela obtida atravs da f.d.p. conjunta
de X e Y .
Caso Discreto
Se X e Y so v.a. discretas com f.p. conjunta p(x, y), ento a f.p. marginal de X
obtida por:
PX (x) = P (X = x) =

X
y

55

p(x, y)

(3.8)

Similarmente, a f.p. marginal de Y :


PY (y) = P (Y = y) =

p(x, y)

(3.9)

Exemplo:
Suponha que a varivel aleatria X possa assumir somente of valores 1, 2, e 3, que
a varivel aleatria Y possa assumir somente os valores 1, 2, 3 e 4, e que a funo
de probabilidade conjunta de X e Y seja dada pela tabela:

Marginal
de X

0,1

0,1

0,2

0,3

0,1

0,2

0,6

0,2

0,2

0,4

0,2

0,2

0,2

1,0

Marginal de Y

A f.p. marginal de X determinada somando-se os valores de cada linha da tabela,


e dada na ltima coluna da tabela. Analogamente a f.p. marginal de Y dada na
ltima linha da tabela.
Caso Contnuo
Se X e Y possuem uma distribuio conjunta com f.d.p. conjunta f (x, y), ento a
f.d.p. marginal fX (x) de X obtida por:
Z

fX (x) =

f (x, y)dy

(3.10)

Similarmente, a f.d.p. marginal de Y obtida por:


Z

fY (y) =

f (x, y)dx

Observao

56

(3.11)

Se X e Y forem independentes
P (x, y) = PX (x) PY (y)

(Caso discreto)

f (x, y) = fX (x) fY (y)

(Caso contnuo)

Exemplo:
Suponha que X e Y possuam um distribuio contnua conjunta, cuja p.d.f. conjunta
seja definida por:
(
f (x, y) =

3 2
y
2

0 x 2 e 0 y 1,

caso contrrio.

a) Determine as p.d.f.s marginais de X e Y ;


b) X e Y so independentes?
c) Determine P (X 12 ) e P (Y 12 )..
Soluo:
a) Tem-se que:
Z

1
0

3 2
y3 1 1
y dy =
|= .
2
2 0 2

Logo, a p.d.f. marginal de X dada por:


(
fX (x) =

1
2

0x2
0 caso contrrio.

Tem-se que:
Z

2
0

3 2
3
y dx = y 2 x |20 = 3y 2
2
2

57

Logo, a p.d.f. marginal de Y dada por:


(
fY (y) =

3y 2 0 y 1
0

caso contrrio.

b) Tem-se que f (x, y) = fX (x) fY (y). Logo X e Y so independentes.


c)
Z

1
P (X ) =
2

1
2

1
P (Y ) =
2
3.6
3.6.1

1
1
1
dx = x |21 =
2
2
2
2

1
1/2

1
2
2

3y 2 dy = y 3 x |11/2 = 1

3
= .
4

1
7
= .
8
8

Esperana de Uma Varivel Aleatria


Distribuies Discretas

Suponha que uma varivel aleatria (v.a.) X possua uma distribuio discreta cuja
f.d.p. p(x). A esperana de X, denotada por E(X), um nmero definido por
= E(X) =

xp(x)

(3.12)

Exemplo
Suponha que uma v.a. X possa assumir somente quatro valores: 2, 0, 1, e4, e que
P (X = 2) = 0.1; P (X = 0) = 0.4; P (X = 1) = 0.3; P (X = 4) = 0.2
Ento
E(x) = 2 (0.1) + 0 (0.4) + 1 (0.3) + 4 (0.2)
= 0.9

58

3.6.2

Distribuies Contnuas

Se uma varivel aleatria (v.a.) X possui uma distribuio contnua com f.d.p. f (x),
ento a esperana E(X) definida por
Z

= E(X) =

xf (x)dx

(3.13)

Exemplo
Suponha que a f.d.p. de uma v.a. X com uma distribuio contnua seja:
(
f (x) =

2x para 0 < x < 1


0

caso contrrio

Ento
Z

E(X) =

x (2x)dx
Z

0
1

2x2 dx

2x3 1
=
|
3 0
2
=
3
Observao
O nmero E(X) tambm denominado valor esperado de X, ou a mdia de X.
3.6.3

Propriedades da Esperana

P1.
Se a uma constante qualquer
E(X a) = E(X) a

P2.

59

Se a uma constante qualquer


E(aX) = a E(X)

P3.
Se X1 , X2 , ..., Xn so n variveis aleatrias tais que E(Xi ) existe (i = 1, 2, ..., n),
ento
E(X1 + X2 + ... + Xn ) = E(X1 ) + E(X2 ) + ... + E(Xn )

P4.
Se X1 , X2 , ..., Xn so n variveis aleatrias independentes, tais que E(Xi ) existe
(i = 1, 2, ..., n), ento
E

n
Y

!
Xi

i=1

n
Y

E(Xi )

i=1

Exemplos:

a) Suponha que E(X) = 5. Ento:


E(3X 5) = 3E(X) 5 = 10

E(3X + 15) = 3E(X) + 15 = 0

b) Suponha que trs v.a. X1 , X2 e X3 formem uma amostra aleatria de uma


distribuio para o qual a mdia 5. Determinar o valor de E(2X1 3X2 +
X3 4)
E(2X1 3X2 + X3 4) = 2E(X1 ) 3E(X2 ) + E(X3 ) 4
= 2(5) 3(5) + 5 4
= 10 15 + 5 4 = 4

c) Suponha que X1 , X2 e X3 so v.a. independentes tais que E(Xi = 0) e

60

E(Xi2 = 1), para i = 1, 2, 3. Determinar E[X12 (X2 4X3 )2 ]


E[X12 (X2 4X3 )2 ] = E[X12 ]E[(X2 4X3 )2 ]
= E[X12 ]E[(X22 8E(X2 )E(X3 ) + 16E(X32 )]
= 1[1 8(0)(0) + 16(1)] = 17

3.7

Varincia de uma Varivel Aleatria

Definio
Suponha que X uma v.a. com mdia = E(X). A varincia de x, representada
por V ar(X) definida por

V ar(X) = E (x )2 ,

3.7.1

onde

= E(X)

(3.14)

Variveis Aleatrias Discretas

Suponha que uma v.a. X possua uma distribuio discreta, cuja f.d.p. p(x). Ento
V ar(X) =

X
(x )2 p(x)
x

x2 p(x) 2

(3.15)

Exemplo:
Suponha que uma v.a. X possa assumir somente quatro valores: 2, 0, 1, e 4, e que
P (X = 2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) = 0, 2
Como visto anteriormente, E(X) = 0, 9. Ento
V ar(X) =

X
(x )2 p(x)
x

= (2 0, 9)2 (0, 1) + (0 0, 9)2 (0, 4) + (1 0, 9)2 (0.3) + (4 0, 9)2 (0, 2)


= 3, 09

61

ou
V ar(X) =

x2 p(x) 2

= (2)2 (0, 1) + (0)2 (0, 4) + (1)2 (0.3) + (4)2 (0, 2) (0, 9)2
= 0, 4 + 0, 3 + 3, 2 0, 81
= 3, 09

3.7.2

Variveis Aleatrias Contnuas

Suponha que uma v.a. X possua uma distribuio contnua, cuja f.d.p. f (x). Ento
Z

V ar(X) =

(x )2 f (x)dx

x2 f (x)dx 2

Exemplo
Suponha que a f.d.p. de uma v.a. X com uma distribuio contnua seja:
(
f (x) =

2x para 0 < x < 1


0

caso contrrio

Como visto anteriormente, E(X) = 23 . Ento


2
2
x (2x)dx
3
0
2
Z 1
2
2x3 dx
3
0
2
4
2
2x 1
|0
4
3
2 4
2
=
4 9
36

Z
V ar(X) =
=
=
=

3.7.3

Propriedades da Varincia

P1.
V ar(X) = 0 se e somente se existe uma constante c tal que P (X = c) = 1

62

(3.16)

P2.
V ar(aX) = a2 V ar(X)
P3.
V ar(X + a) = V ar(X)
P4.
V ar(X) = E(X 2 ) [E(X)]2
P5.
Se X1 , X2 , ..., Xn so v.a. independentes, ento
V ar(X1 X2 ... Xn ) = V ar(X1 ) + V ar(X2 ) + ... + V ar(Xn )
Exemplo:
Seja uma v.a. com mdia e desvio padro . Calcular a mdia e varincia de:

a) Z = 3X 7
b) Z =

X7
2

c) Z =

a) E(Z) = 3 7
V ar(Z) = 9 2
b) E(Z) =

V ar(Z) =

2
4

V ar(Z) =

c) E(Z) =

3.8

7
2

=0

=1

Momentos

Definio
Para qualquer varivel aleatria (v.a.) X e qualquer inteiro positivo k, a esperana
E(X k ) denominado k-simo momento de X, ou momento de ordem k

63

3.8.1

Momentos Centrais

Suponha que Xh seja umai v.a. com E(X) = . Para qualquer inteiro positivo k,
a esperana E (X )k denominado k-simo momento central de X, ou
k-simo momento em torno da mdia.
Observao
Se a distribuio
dei X simtrica com respeito sua mdia , e se oh momentoi
h
central E (X )k existe para um dado k mpar, ento o valor de E (X )k
ser igual a zero.
3.8.2

Funo Geratriz de Momentos

Definio
Considere uma v.a. X, e para cada nmero real t, seja Mx (t) a funo

Mx (t) = E etx

(3.17)

Esta funo denominada funo geratriz de momentos (f.g.m.)


A partir da f.g.m. pode-se gerar todos os momentos. Seja Mxk (t) a k-sima derivada
de Mx (t). Ento:

Mx1 (0)

d tx
=
E e
dt

t=0
d tx
= E
e
dt

t=0

= E Xetx t=0
= E(X)

(3.18)

Analogamente, temos

Mxk (0)

=
=
=
=

dk tx
E e
dtk
k t=0
d tx
E
e
dtk
k tx t=0

E X e t=0

E Xk

64

(3.19)

Portanto:
Mx1 (0) = E(X), Mx2 (0) = E(X 2 ), Mx3 (0) = E(X 3 ), ...
Exemplo:
Suponha que X seja uma v.a. com f.d.p. dada por
(
f (x) =

ex para x > 0
0

caso contrario

Determine a f.g.m. de X, e a V ar(X).


Soluo:

tx

Mx (t) = E e

tx

e dx =
0

e(t1)x dx =

e(t1)x
|
t1 0

A integral s ser finita se e somente se t < 1. Neste caso,


1
1t
1
0
MX (t) =
E(X) = 1
(1 t)2
2
00
MX (t) =
E(X 2 ) = 2
(1 t)3
MX (t) =

Logo, V ar(X) = 2 12 = 1
3.8.3

Propriedades das Funes Geradoras de Momentos

P1.
Seja X uma v.a. com f.g.m. MX , e seja Y = aX + b, onde a e b so constantes, e
seja MY a f.g.m. de Y . Ento, para qualquer valor de t tal que MX (at) exista,
MY (t) = ebt MX (at)

(3.20)

P2.
Suponha que X1 , X2 , ..., Xn sejam n v.a. independentes, e que Mi (i = 1, 2, ..., n)
seja a f.g.m. de Xi . Seja Y = X1 + X2 + ... + Xn , e seja MY a f.g.m. de Y . Ento

65

para qualquer valor de t tal que Mi (t) exista,


MY (t) =

n
Y

Mi (t)

(3.21)

i=1

Exemplo:
Suponha que X e Y sejam independentes e identicamente distribuidas (i.i.d.) e que
a f.g.m. de cada uma seja dada por:
M (t) = et

2 3

< t < .

Encontre a f.g.m. de Z = 3X Y + 4.
Soluo:
Sejam
2
X1 = 3X M1 (t) = M (3t) = e9t 3
2

X2 = Y M2 (t) = M (t) = et 3
MZ = M (X1 + X2 + 4) = e4t M1 (t)M2 (t)
2
2
= e4t (e9t 3 )(et 3 )
2 +4t6

= e10t
3.9
3.9.1

Funes de uma Varivel Aleatria


Varivel com Distribuio Discreta

Suponha que uma v.a. X possua uma distribuio discreta, cuja funo de
probabilidade (f.p.) seja p(x), e que outra v.a. Y = r(X) seja definida como uma
certa funo de X. Ento a f.p. (g) de Y pode ser calculada de p de maneira direta:
g(y) = P (Y = y)
= P [r(X) = y]
X
=
p(x)

(3.22)

x:r(x)=y

Exemplo:
Suponha que X seja uma v.a. com f.p. dada por:
P (X = 2) = 0, 2; P (X = 1) = 0, 1; P (X = 0) = 0, 3; P (X = 1) = 0, 2;
P (X = 2) = 0, 1 e P (X = 3) = 0, 1.
Suponha que Y seja outra v.a. tal que Y = 2X 2 3. Qual a f.p. de Y?

66

Soluo:
Como X s pode assumir os valores -2,1, 0, 2 e 3, ento Y = 2X 2 3 poder assumir
os valores -3 (quando X = 0), -1 (quando X = 1 ou 1), 5 (quando X = 2 ou 2),
e 15(quando X = 3).Logo, a f.p. de Y dada por:
P (Y = 3) = P (X = 0) = 0, 3; P (Y = 1) = P (X = 1) + P (X = 1) = 0, 3;
P (Y = 5) = P (X = 2) + P (X = 2) = 0, 3 e P (Y = 15) = P (X = 3) = 0, 1.
3.9.2

Varivel com Distribuio Contnua

Suponha que X seja uma v.a. com distribuio contnua, cuja f.d.p. seja f (x).
Suponha que Y seja outra v.a. definida com uma funo de X, isto , Y = r(X).
Para qualquer nmero y a funo de distribuio acumulada G(y) pode ser
calculada por
G(y) = P (Y y)
= P [r(X) y]
Z
=
f (x)dx.

(3.23)

{x:r(x)y}

Se a varivel Y tambem possuir uma distribuio contnua, sua funo densidade


de probabilidade g(y) tambem obtida por
g(y) =

dG(y)
dy

Exemplo:
Suponha que X possua uma distribuio uniforme no intervalo (-1,1), isto :
(
f (x) =

1
2

para 1 < x < 1


0 caso contrrio

Determine a f.d.p. de Y = X 2 .
Soluo:

67

(3.24)

Como Y = X 2 0 Y < 1. Ento para qualquer nmero y tal que 0 y < 1,


G(y) = P (Y y) = P (X 2 y) =

= P ( y x y) =

R y
R y
= y f (x)dx = y 21 dx =

=
y
Logo,

d( y)
dy
1

2 y

g(y) =
=

para 0 y < 1

Observao:
Em alguns casos, para algumas funes r(X) a f.d.p. de Y pode ser calculada
diretamente, sem ter que derivar primeiro a sua funo de distribuio G(y). Para
tal, algumas condies devem ser satisfeitas, como enunciado abaixo:

Seja uma v.a. com f.d.p. f e para qual P (a < X < b) = 1. Seja Y = r(X),
e suponha que r(x) seja contnua e estritamente crescente ou estritamente
decrescrente para a < x < b. Suponha tambem que a < X < b se e
somente se < Y < , e seja X = s(Y ) a funo inversa para < Y <
Ento a f.d.p. de Y dada por
(
g(x) =

f [s(y)] |
0

ds(y)
dy

| para < y <


caso contrrio

Exemplo:
Suponha que X seja uma v.a. com distribuio exponencial, isto :
(
f (x) =
Determinar a f.d.p. de Y =

ex/ para x > 0

caso contrrio

X.

Soluo:

68

Como Y =

dx
dy

X, ento X = Y 2 . Logo,
f (y) =

= 2y. Portanto,

1 y2 /
e
2y.

Logo,
(
f (y) =

2y

ey

2 /

para y > 0
caso contrrio

Esta distribuio denominada distribuio Rayleigh e muito utilizada em dados


de radar.
3.10
3.10.1

Algumas Distribuies Discretas


Distribuio Binomial

Suponha que certa mquina produza um item defeituoso com probabilidade p (0 <
p < 1) e produza um item no defeituoso com probabilidade q = 1 p. Suponha
que n itens independentes produzidos por essa mquina sejam examinados, e faa X
representar o nmero de itens que so defeituosos. A v.a. X ter uma distribuio
discreta, e os possveis valores de X sero 0, 1, 2, 3, ..., n.
A probabilidade de se obter uma sequncia particular dos n itens contando

exatamente x defeituosos e n x no defeituosos px pnx . Como existem nx
sequncias diferentes desse tipo, segue que a funo de probabilidade de X ser:
(
n
p(x) = P (X = x) =

px q nx para x = 0, 1, 2, 3, ..., n
caso contrrio

Exemplo:

a) Suponha que uma vlvula eletrnica, instalada em determinado circuito,


tenha probabilidade 0,2 de funcionar mais do que 500 horas. Se
ensaiarmos 20 vlvulas, qual ser a probabilidade de que delas,
exatamente k, funcionem mais que 500 horas, k = 0, 1, ..., 20?
Soluo:
Seja X a v.a. que representa o nmero de vlvulas que funcionam mais

69

de 500 horas. X possui uma distribuio binomial. Portanto,

P (X = k) =

20
k

(0, 2)k (0, 8)20k

para k = 0, 1, 2, 3, ..., 20

Estas probabilidades podem ser encontradas em tabelas da distribuio


binomial. Os resultados so:
P (X = 0) = 0, 012

P (X = 4) = 0, 218

P (X = 8) = 0, 022

P (X = 1) = 0, 058
P (X = 2) = 0, 137

P (X = 5) = 0, 175
P (X = 6) = 0, 109

P (X = 9) = 0, 007
P (X = 10) = 0, 002

P (X = 3) = 0, 205

P (X = 7) = 0, 055

P (X = k) < 0, 001 (k 11)

b) Ser extraida uma amostra de 5 eleitores de uma grande populao, onde


60% votam no PSDB. Qual a probabilidade de:

exatamente 3 dos eleitores escolhidos votarem no PSDB?


pelo menos um dos eleitores votem no PSDB?
ao menos 3 (uma maioria) votem no PSDB?

Soluo: Se X a v.a. que representa o nmero de eleitores que votam no


PSDB, temos que X segue uma distribuio binomial, cuja probabilidade
de "sucesso" (votar no PSDB) em cada tentativa 0,60. Portanto,

5
P (X = 3) =
(0, 6)3 (0, 4)2 = 0, 3456
3
A probabilidade que pelo menos um vote no PSDB dada por

5
1 P (X = 0) = 1
(0, 4)5 = 1 0, 0102 = 0, 9898
0
A probabilidade que a maioria votem no PSDB dada por P (X = 3) +
P (X = 4) + P (X = 5), ou seja:



5
5
5
3
2
4
1
(0, 6) (0, 4) +
(0, 6) (0, 4) +
(0, 6)5 = 0, 6826
3
4
5

70

3.10.1.1

Mdia de uma v.a. com Distribuio Binomial

Clculo da mdia para distribuio binomial


E(X) =

n
X

x p(x)

x=0

=
=

n
X
x=1
n
X
x=1

= np

n!
px q nx
x!(n x)!

n(n 1)!
ppx1 q nx
x(x 1)!(n x)!

n
X
x=1

(n 1)!
px1 q nx
(x 1)!(n x)!

(3.25)

n
Onde p(x) = x px q nx
Fazendo y = x 1 tem-se

n1
X
n1
y py q n1y
E(X) = np

(3.26)

y=0

Mas, pela frmula binomial (ver por exemplo Wonnacott, pag. 153)
k

(p + q)



k
k
k1
p2 q k2 + . . . + pk
pq
+
= q +
1
2
k
X
k
=
pi q ki
i
i=0
k

(3.27)

Portanto,
E(X) = np (p + q)n1

(3.28)

E(X) = np

(3.29)

Como p + q = 1, temos

71

3.10.1.2

Varincia de uma v.a. com Distribuio Binomial

Para o clculo da varincia fica mais fcil partir-se de

V ar(X) = E(X 2 ) E(X)2

(3.30)

O valor de E(X 2 ) pode ser encontrado atravs do clculo da esperana de


E {X(X 1)} que definida como:
E {X(X 1)} =

X
X

x(x 1)f (x)

n(n 1)(n 2)!


p2 px2 q nx
x(x 1)(x 2)!(n x)!
X
(n 2)!
= n(n 1)p2
px2 q nx
(x 2)!(n x)!
=

x(x 1)

(3.31)

Fazendo y = x 2, a expresso acima se reduz a


= n(n 1)p

X (n 2)!
py q ny2
y!(n x)!

= n(n 1)p2
(3.32)

Assim,
E {X(X 1)} = E(X 2 X)
= E(X 2 ) E(X)
= n(n 1)p2
(3.33)

72

Como:
V ar(X) = E(X 2 ) E(X) + E(X) {E(X)}2
= n(n 1)p2 + np n2 p2
= np(1 p)
= npq

De fato f (x) =
temos que ter

(3.34)

n
x px q nx de fato uma funo de probabilidade. Para tanto
X n
x px q n1 = 1

(3.35)

Como a expanso deste somatrio nada mais que


n
n
n
n
0
n
1
n1
2
n2
n pn q 0
p

q
+
p

q
+
p

q
+
...
+
0
1
2

que por sua vez igual a (p + q)n , e como p + q = 1 fica demonstrado que f (x) de
fato uma funo de probabilidade.
Exemplo
Em 100 lances de uma moeda honesta, a mdia do nmero de caras
= N p = 100

1
= 50
2

(3.36)

Este o nmero esperado de caras em 100 lances da moeda. O desvio padro :


=

r
N pq =

100

1 1
= 5.
2 2

(3.37)

Observao
A funo geratriz de momentos de uma distribuio binomial

n
Mx (t) = p et + q

73

(3.38)

3.10.2

Distribuio Hipergeomtrica

Suponha que uma urna contenha A bolas verdes e B bolas azuis. Suponha que se
retire n bolas sem reposio. Seja X v.a. que indica o nmero de bolas verdes obtidas.
Ento
max {0, n B} X min {n, A} .

A funo de probabilidade de X ser:


A
P (X = x) =

B
nx
A+B
n

(3.39)

Dizemos que X possui uma distribuio hipergeomtrica. Pode-se provar que:


E(X) =

V ar(X) =

nA
A+B

(3.40)

nAB
A+Bn

2
(A + B) A + B 1

(3.41)

Exemplo:
Pequenos motores eltricos so expedidos em lotes de 50 unidades. Antes que
uma remessa seja aprovada, um inspetor escolhe 5 desses motores e o inspeciona.
Se nenhum dos motores inspecionados for defeituosos, o lote aprovado. Se
um ou mais forem verificados defeituosos, todos os motores da remessa so
inspecionados. Suponha que existam, de fato, trs motores defeituosos no lote. Qual
a probabilidade de que a inspeo 100 por cento seja necessria?
Soluo:
Seja X a v.a. que representa o nmero de motores defeituosos enecontrado. A
inspeo de todo o lote ser necessria se X 1. Logo,
3 47
P (X 1) = 1 P (X = 0) = 1

50 5
5

74

= 0, 28

3.10.3

Distribuio Binomial Negativa

Suponha que em uma sequncia infinita de experimentos independentes, o resultado


de cada experimento possa ser sucesso ou falha, e que a probabilidade de sucesso p
onde (0 < p < 1), e de falha q = 1 p.
Seja X a v.a. que denota o nmero de falhas que ocorrem antes que exatamente r
sucessos sejam obtidos. Ento:

P (X = x) =

r+x1
x

pr q x x = 0, 1, 2...

(3.42)

Dizemos que X possui uma distribuio binomial negativa.


E(X) =

rq
p

V ar(X) =

(3.43)

rq
p2

(3.44)

Exemplo:
Suponha que a probabilidade de sair cara em uma moeda seja de 1/3. Suponha
tambm que esta moeda seja jogada at que apaream 5 caras.
a) Calcule a probabilidade de que a quinta cara aparea na dcima segunda
jogada.
b) Qual o nmero esperado de coroas que aparecero antes de se obter 5
caras?
Soluo:
Seja X a v.a. que representa o nmero de coroas que aparecem antes de que a quinta
cara aparea. X possui uma distribuio binomial negativa.
a)

P (X = 7) =

75

11
7

5 7
1
2
3
3

b)
E(X) =

3.10.4

5. 23
1
3

= 10

Distribuio Geomtrica

Dizemos que a v.a. X possui distribuio geomtrica, se X possui uma


distribuio binomial negativa com r = 1
A funo de probabilidade de X ser:
P (X = x) = pq x

(3.45)

q
E(X) = ;
p

(3.46)

Pode-se provar que:

V ar(X) =

q
p2

(3.47)

Exemplos:

a) Em determinada localidade, a probabilidade da ocorrncia de uma


tormenta em algum dia durante o vero (nos meses de dezembro e janeiro)
igual a 0,1. Admitindo independncia de um dia para outro, qual a
probabilidade da ocrrncia da primeira estao de vero no dia 4 de
janeiro?
Soluo:
Chamando de X o nmero de dias (comeando em 1o. de dezembro) at
a primeira tormenta. Portanto, X possuir uma distribuio geomtrica,
e a probabilidade desejada :
P (X = 34) = (0, 9)33 (0, 1) = 0, 003

76

b) O custo de realizao de um experimento de R$ 1500,00. Se o


experimento no tiver sucesso, h um custo adicional de R$ 400,00 para
que sejam executadas as correes necessrias. Suponha que as provas
sejam independentes, e que os experimentos sejam executados at que
o primeiro sucesso ocorra. Sendo a probabilidade de sucesso em uma
tentativa qualquer de 0,1, qual ser o custo esperado do procedimento
completo?
Soluo:
Seja X a v.a. que representa o nmero de provas necessrias para alcanar
o primeiro sucesso. Temos que X possuir uma distribuio geomtrica,
com mdia
E(X) =

q
0, 9
=
= 9.
p
0, 1

Seja C o custo de realizao do experimento:


C = 1500X + 400(X 1) = 1900X 400
Logo,
E(C) = 1900E(X) 400 = (1900)9 400 = R$16700, 00

3.10.5

Distribuio de Poisson

Seja X uma v.a. com distribuio discreta, e suponha que X assuma valores inteiros
no negativos. dito que X possui uma distribuio de Poisson com mdia
onde ( > 0) se a funo de probabilidade de X dada por:
P (X = x) = e

x
x!

x = 0, 1, 2, 3, ...

(3.48)

Observao
O smbolo e representa uma constante que aproximadamente igual a 2, 7183. O
seu nome uma homenagem ao matemtico suio I. Euler, e constitui a base do
chamado logaritmo natural.
Para determinao da mdia e da varincia de uma v.a. de Poisson, preciso primeiro

77

determinar a sua funo geradora de momento (f.g.m.),



M (t) = E etX

X
x
=
etx e
x!
x=0

x
X
(et )

= e

x=0
et

= e

x!

= e(e 1)
t

Diferenciando teremos
t
0
M (t) = et e{(e 1)}
2
t
t
00
M (t) = et e{(e 1)} + et e{(e 1)}

Para t = 0 temos
0

E(X) = m (0) =

(3.49)

00

V ar(X) = m (0) (E [X])2


= 2 + 2
=

(3.50)

Portanto, a mdia e a varincia de uma v.a. de Poisson so iguais ao parmetro .


A v.a. de Poisson tem um amplo range de aplicaes em uma grande variedade
de reas, porque se emprega como uma aproximao para uma v.a. binomial com
parmetros (n, p) quando n grande e p pequeno. Supondo que X uma v.a.

78

binomial com parmetros (n, p) e seja = np. Ento


n!
px (1 p)nx
(n x)!x!
x
nx
n!

=
1
(n x)!x! n
n
n(n 1)...(n x + 1) x (1 /n)n
=

nx
x! (1 /n)x

P (X = x) =

(3.51)

Agora, para n grande e p pequeno


n

1
e
n
n(n 1)...(n x + 1)
1
nx
x

1
1
n

(3.52)

Assim que, para n grande e p pequeno,


P (X = x) e

x
x!

(3.53)

Quer dizer, ao se realizar n experimentos independentes, cada um dos quais tem


como resultado xito com probabilidade p, ento quando n grande e p pequeno, o
nmero de xitos que se apresentam aproximadamente uma v.a. de Poisson com
mdia = np.
Exemplos:

a) Se a probabilidade de um indivduio sofrer uma reao nociva, resultante


de ter tomado um certo soro 0,001, determinar a probabilidade de que,
entre 2000 indivduos:
1) exatamente trs sofrerem a reao;
2) mais do que dois sofrerem a reao.

79

Soluo:
Seja X a v.a. que representa o nmero de pessoas que sofrem a reao
nociva aps injerir o soro. Ento,
P (X = x) = e

x
x = 0, 1, 2, 3, ..,
x!

onde = 2000 0, 001 = 2. Logo,

1)
P (X = 3) = e2

23
= 0, 18
3!

2)
P (X 3) = 1 {P
(X = 1)o+ P (X = 2)}
n (X 0= 0) + P
1
2
= 1 e2 20! + e2 21! + e2 22!

= 1 e12 + e22 + e22 = 1 e52


= 0, 323
OBS: Se usasse a distribuio binomial os cculos se tornariam
maiores. Por exemplo a primeira questo ficaria:

P (X = 3) =

2000
3

(0, 001)3 (0, 999)1997

b) Suponha que em um certo final de semana, o nmero de acidentes num


cruzamento possua uma distribuio de Poisson com mdia 0,7. Qual a
probabilidade de que exista pelo menos trs acidentes no cruzamento
durante o final de semana?
Soluo:

P (X = x) =

e0,7 0, 7x
x = 0, 1, 2, 3, ..,
x!

80

Logo,
P (X 3) = 1 {P
n (X = 0) + P (X = 1) +oP (X = 2)}
= 1 e0,7 + 0, 7e0,7 +

0,72 e0,7
2

= 1 e0,7 (1 + 0, 7 + 0, 245)
= 0, 341
c) Dez por cento das ferramentas produzidas por um certo processo de
fabricao revelaram-se defeituosas. Determinar a probabilidade de, em
uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas
sejam defeituosas, mediante o emprego de:
1) distribuio binomial
2) distribuio de Poisson
Soluo:
1)

P (X = 2) =

10
2

(0, 1)2 (0, 9)8 = 0, 1937

2)
= N p = 10(0, 1) = 1
12 e1
1
P (X = 2) =
= 1 = 0, 1839
2!
2e
3.11
3.11.1

Algumas Distribuies Contnuas Importantes


Distribuio Normal

Definio
Dizemos que uma v.a. X possui uma distribuio Normal (ou Gaussiana) com
mdia e varincia 2 ( < < e > 0) se X possuir uma distribuio
contnua com f.d.p. dada por:
1 x 2
1
f (x) = e 2 ( ) para < x <
2

81

(3.54)

Mdia
E(X) =

(3.55)

V ar(X) = 2

(3.56)

Varincia

Funo Geratriz de Momentos


Mx (t) = et+

2 t2
2

<x<

(3.57)

Teorema 1
Se X possui uma distribuio normal com mdia e varincia 2 , e se Y = aX + b,
onde a e b so constantes, com a 6= 0, ento Y ter uma distribuio normal com
mdia a + b e varincia a2 2
Prova
A funo geratriz de momentos de Y ser
My (t) = ebt Mx (at)
= ebt
eat+
h
= e

2 a2 t2
2
2

(a+b)t+a2 2 t2

,
(3.58)

que a funo geratriz de momentos de uma distribuio com mdia a+b e varincia
a2 2 .
3.11.2

Distribuio Normal Padro

A distribuio normal com mdia zero ( = 0) e varincia um ( 2 = 1) denominada


distribuio normal padro (0, 1). A f.d.p. de uma distribuio normal padro

82

em geral representada por (x) e dada por


x2
1
(x) = e 2
2

<x<

(3.59)

Segue do Teorema 1 que se uma varivel X tem uma distribuio normal com mdia
e varincia 2 , ento a varivel
Z=

(3.60)

ter uma distribuio normal padro.


As probabilidades para uma distribuio normal com qualquer mdia e varincia
podem ser determinadas atravs de Tabelas de uma distribuio normal padro.
Exemplos:
a) Supondo que a v.a. Z possua uma distribuio normal padro, ento:
i) P (Z > 1, 0) = 1 P (Z 1) = 1 0, 8413 = 0, 1587
ii) P (Z < 1, 0) = P (Z > 1, 0) = 0, 1587
iii) P (1, 0 < Z 1, 5) = P (Z 1, 5) P (Z 1, 0)
= 0, 9332 0, 8413 = 0, 0919
iv) P (1 Z 2) =
=
=
=

P (Z
P (Z
P (Z
P (Z

2) P (Z < 1)
2) P (Z > 1)
2) (1 P (Z 1))
2) + P (Z 1) 1

= 0, 9773 + 0, 8413 1 = 0, 8186


v) P (| Z | 2) =
=
=
=

P (2 Z 2)
P (Z 2) P (Z < 2)
P (Z 2) P (Z > 2)
P (Z 2) (1 P (Z 2))

= 2 P (Z 2) 1
= 2 0, 9773 1 = 0, 9546

83

b) Suponha que X possua uma distribuio normal com mdia 5 e desvio


padro 2. Ento:
P (1 X 8) = P ( 15
X
85
)
2

2
= P (2 Z 1, 5)
= P (Z 1, 5) P (Z < 2)
=
=
=
=

P (Z 1, 5) P (Z > 2)
P (Z 1, 5) (1 P (Z 2))
P (Z 1, 5) + P (Z 2) 1
0, 9332 + 0, 9772 1 = 0, 9104

c) Supor uma populao em que o peso dos indivduos seja distribuido


normalmente com mdia 68 kg e desvio padro 4 kg. Determinar a
proporo de indivduos
i) abaixo de 66 kg
ii) acima de 72 kg
iii) entre 66 e 72 kg
i) P (X < 66) = P ( X
< 6668
) = P (Z < 0, 5)

4
= 1 P (Z 0, 5) = 1 0, 6915 = 0, 3085
ii) P (X > 72) = P ( X
>

iii) P (66 X 72) =


=
=
=

7268
)
4

= P (Z > 1) = 0, 1587

P ( 6668
X
7268
)
4

4
P (0, 5 Z 1)
P (Z 1) P (Z < 0, 5)
0, 8413 0, 3085 = 0, 5328

Teorema 2
Se as v.a. X1 , X2 , ..., Xk so independentes e se Xi normalmente distribuida com
mdia i e varincia i2 com (i = 1, 2, 3, ..., k), ento a soma X1 + X2 + ... + Xk ter
uma distribuio normal com mdia 1 + 2 + ... + k e varincia 12 + 22 + ... + k2 .
Prova:
Seja Mi (t) a f.g.m. de Xi para (i = 1, 2, ..., k) e seja M (t) a f.g.m. de X1 + X2 +

84

... + Xk . Como as variveis X1 , X2 , ..., Xk so independentes, ento


M (t) =
=

k
Y

Mi (t)

i=1

k
Y

i=1
Pk

= e(

i t+

i=1

i2 t
2

P
i )t+ 12 ( ki=1 i2 )t

para < x <

Esta f.g.m.
P pode
ser identificada
P como a f.g.m. de uma distribuio normal com
k
k
2
mdia
i=1 i e varincia
i=1 i . Logo, essa a distribuio de X1 + X2 +
... + Xk
Exemplo:
Suponha que a altura, em inches, de mulheres de uma certa populao segue uma
distribuio normal com mdia 65 e desvio padro 1, e que as alturas dos homens
segue uma distribuio normal com mdia 68 e desvio padro 2. Supor tambm que
uma mulher seja selecionada aleatoriamente e independentemente um homem seja
selecionado aleatoriamente. Determinar a probabilidade que a mulher seja mais alta
que o homem.
Soluo:
Sejam M e H as v.a. que representem as alturas da mulher e do homem,
respectivamente. Ento
M ~ N (65, 12 )
H ~ N (68, 22 )
Logo, (M H) ~ N (65 68, 12 + 22 ), isto , (M H) ~ N (3, 5).
Portanto Z =

M H+3

~ N (0, 1). Logo,

3
P (M > H) = P (M H > 0) = P M H+3
>
5
5

= P Z > 5 = P (Z > 1, 342) = 1 P (Z < 1, 342)


= 1 0, 9099 = 0, 09

85

Corolrio 1
Se as v.a. X1 , X2 , ..., Xk so independentes, se Xi possui uma distribuio normal
com mdia i e varincia i2 onde (i = 1, 2, ..., k), e se a1 , a2 , ..., ak e b so constantes
para as quais pelo menos um dos valores de a1 , a2 , ..., ak diferente de zero, ento
a varivel a1 X1 + a2 X2 + ... + ak Xk + b tem uma distribuio normal com mdia
a1 1 + a2 2 + ... + ak k + b e varincia a21 12 + a22 22 + ... + a2k k2
Corolrio 2
Suponha que as v.a. X1 , X2 , ..., Xk formem uma amostra aleatria de uma
a mdia amostral. Ento X
ter
distribuio com mdia e varincia 2 , e seja X
uma distribuio normal com mdia e varincia

2
n

Exemplo:
Suponha que em um certo exame de Matemtica Avanada, os estudantes da
Universidade A obtm notas normalmente distribudas com mdia 625 e varincia de
100, e que os estudantes da Universidade B obtm notas normalmente distribudas
com mdia 600 e varincia de 150. Se dois estudantes da Universidade A e cinco
estudantes da Universidade B fazem este exame, qual a probabilidade que a nota
mdia dos estudantes da Universidade A seja maior que a nota mdia dos estudantes
da Universidade B?
Soluo:
Temos que:
A = 625

B = 600

A2

B2 = 150

= 100

Portanto a mdia amostral de dois estudantes da Universidade A (


xA ) normalmente
100
distribuda com mdia 625 e varincia 2 = 50. Analogamente, a mdia amostral de
trs estudantes da Universidade B (
xB ) normalmente distribuda com mdia 600
e varincia

150
3

= 30, isto ,

xA ~ N (625, 50)
xB ~ N (600, 30)
Logo, (
xA xB ) ~ N (625 600, 50 + 30), isto , (
xA xB ) ~ N (25, 80).
Portanto,

xB 25 > 025

P (
xA > xB ) = P (
xA xB > 0) = P xA
80
80

25

= P Z > 80 = P (Z > 2, 975) = P (Z < 2, 975) = 0, 9986

86

3.11.3

Teorema do Limite Central

Se as v.a. X1 , X2 , ..., Xn formam uma amostra aleatria de tamanho n de uma certa


distribuio com mdia e varincia 2 onde (0 < 2 < ), ento para qualquer
nmero fixado x

X
x = (x),
nP
/ n
lim

(3.61)

onde (x) a funo distribuio da normal padro.


A interpretao desse teorema a seguinte: Se uma grande amostra aleatria
tomada de qualquer distribuio com mdia e varincia 2 , no importando

se a distribuio discreta ou contnua, ento a distribuio da v.a. /


ser
n

aproximadamente a distribuio normal padro. Portanto a distribuio de X


2

ser aproximadamente uma distribuio normal com mdia e varincia n ou,


Pn
equivalentemente, a distribuio da soma
i=1 Xi ser aproximadamente uma
normal com mdia n e varincia n 2 .
Exemplo:
Suponha que uma moeda honesta seja jogada 900 vezes. Qual a probabilidade de se
obter mais de 495 caras?
Soluo:
Para i = 1, 2, . . . , 900, seja Xi = 1 se cara obtida na i-sima jogada e Xi = 0 caso
contrrio (distribuio de Bernoulli).
Ento E(Xi ) =

1
2

e V ar(Xi ) = 41 . Portanto os valores X1 , X2 , X3 , . . . , X900 formam

uma amostra aleatria de tamanho n = 900 de um distribuio com mdia

1
2

varincia 14 . Segue, pelo Teorema do Limite Central, que a distribuio do nmero


P
de caras H = 900
i=1 Xi ser aproximadamente uma normal com mdia e varincia
dadas respectivamente por
E(H) = 900

1
2

V ar(H) = 900

= 450
1
4

= 225 (e, consequentemente desvio padro igual a 15).

Portanto a varivel Z =
padro. Logo,

H450
15

ter aproximadamente uma distribuio normal

P (H > 495) = P H450


> 495450
15
15
= P (Z > 3) = 0, 0013

87

Distribuio Amostral das Propores:


Admita-se que uma populao infinita e que a probabilidade de ocorrncia de
um evento (denominado sucesso) p, enquanto a sua no ocorrncia q = 1 p.
Suponha que este experimento seja realizado n vezes e que para cada uma das
tentativas i, seja definido a v.a. Xi , tal que Xi = 1 se ocorrer sucesso na i-sima
tentativa e Xi = 0 se ocorrer insucesso (i = 1, 2, . . . , n)(Xi dito possuir uma
distribuio de Bernoulli, com mdia E(Xi ) = p e varincia V ar(Xi ) = pq). Seja P
a proporo de sucessos, isto :
Pn
P =

i=1

Xi

Para grandes valores de n segue, pelo Teorema Central do Limite, que P ser
aproximadamente normalmente distribudo com mdia e varincia dadas por:

E(P ) = p

V ar(P ) =

pq
.
n

Exemplo:
Suponha que a proporo de itens defeituosos em um grande lote de peas seja 0,1.
Qual o menor nmero de itens que deve ser retirado do lote para que a probabilidade
seja de pelo menos 0,99 que a proporo de itens defeituosos na amostra seja menor
que 0,13.
Soluo: Seja P a proporo de defeituosos na amostra. Para n grande tem-se que
P ser aproximadamente normalmente distribudo com mdia = 0, 1 e varincia
2 =

(0,1)(0,9)
n

0,09
.
n

Quer-se determinar n para que


P (P < 0, 13) 0, 99

88

Portanto,

P
0, 13 0, 1
P
< q
0, 99

0,09
n

Ou seja,

Z<

0, 03

0,3


= P Z < 0, 1 n 0, 99

Logo, utilizando a tabela da distribuio normal padro, temos que

0, 1 n 2, 33

3.11.4

n 543

Distribuio Uniforme

Sejam e dois nmeros reais tais que ( < ), e considere um experimento no


qual um ponto X selecionado do intervalo S = {x : x } de tal maneira que
a probabilidade de que X pertena a qualquer subintervalo de S proporcional ao
comprimento desse intervalo. A distribuio da v.a. X denominada distribuio
uniforme no intervalo (, ) e dada por
(
f (x) =

para x

caso contrrio

Esta f.d.p. est representada pela Figura 3.7. Observe que a funo anterior satisfaz
os requisitos para ser uma f.d.p., j que
1

dx = 1

(3.62)

A probabilidade de que X esteja em qualquer subintervalo de [, ] igual a


comprimento do subintervalo dividido pelo comprimento do intervalo [, ]. Isso

89

Fig. 3.7 Grfico de f (x) de uma funo uniforme


ocorre devido a que, quando [a, b] um subintervalo de [, ] (ver Figura 3.8).
1
P {a < X < b} =

ba
=

dx
a

Fig. 3.8 Probabilidade de uma varivel aleatria uniforme

90

(3.63)

Exemplo:
Um ponto escolhido ao acaso no segmento de reta [0,2]. Qual ser a a probabilidade
de que o ponto escolhido esteja entre 1 e 1,5?
Seja X a v.a. que representa a coordenada do ponto escolhido. Tem-se que a f.d.p.
de X dada por:
(
f (x) =

1
2

para 0 x 2
0 caso contrrio

Portanto,
P (1 X 1, 5) =

0, 5
1
=
2
4

Mdia
A mdia de uma v.a. uniforme [, ]
Z

x
dx

2 2
=
2 ( )
( )( + )
=
2 ( )

E(X) =

(3.64)
ou
E(X) =

+
2

(3.65)

Ou, em outras palavras, o valor esperado de uma v.a. uniforme [, ] igual ao


ponto mdio do intervalo [, ].
Varincia
O clculo da varincia dado por:
V ar(X) = E[X 2 ] (E[X])2

91

mas
Z
1
E[X ] =
x2 dx

3 3
=
3 ( )
( 2 + + 2 )
=
3
2

(3.66)
Assim
( 2 + + 2 )
V ar[X] =

3
( 2 + 2 2)
=
12
( )2
=
12
3.11.5

+
2

(3.67)

Distribuio Exponencial

dito que uma v.a. X possui uma distribuio exponencial com mdia onde
( > 0) se X possui uma distribuio contnua para a qual a f.d.p. f (x) dada por
(
f (x) =

x
1
e

para x > 0

para x 0

A funo distribuio acumulada da exponencial dada por:


Z

F (x) = P (X x) =
0

x
1 x
e = 1 e

para x 0.

Portanto, P (X > x) = e .
A mdia e varincia de uma v.a. X com distribuio exponencial so dadas por:
E(X) =
V ar(X) = 2

92

(3.68)
(3.69)

Observao

Se X possui uma distribuio exponencial ento a v.a. Y = X possui uma


distribuio Rayleigh, cuja f.d.p. dada por:
f (y) =

2y y2
e

(3.70)

A qual tem mdia e varincia representadas por:


1

2
4
V ar(X) =

4
E(X) =

(3.71)
(3.72)

Exemplo:
Suponha que um fusvel tenha uma durao de vida X, a qual pode ser considerada
uma v.a. contnua com uma distribuio exponencial. Existem dois processos pelos
quais o fusvel pode ser fabricado. O processo I apresenta uma durao de vida
esperada de 100 horas, enquanto o processo II apresenta uma durao de vida
esperada de 150 horas. Suponha que o processo II seja duas vezes mais custoso
(por fusvel) que o processo I, que custa C dlares por fusvel. Admita-se, alm
disso, que se um fusvel durar menos que 200 horas, uma multa de K dlares seja
lanada sobre o fabricante. Qual processo deve ser empregado?
Soluao:
O custo esperado por fusvel para o processo I dado por:
(
CI =

C
C +K

se X > 200
se X 200

Logo,
E(CI ) = CP (X > 200) + (C + K)P (X 200)
200
200
= Ce 100 + (C + K)(1 e 100 )
= Ce2 + (C + K)(1 e2 )
= C + K(1 e2 )
Analogamente, o custo esperado por fusvel para o processo II dado por:
4

E(CII ) = 2C + K(1 e 3 )

93

Portanto,
4

E(CII ) E(CI ) = C + K(e2 e 3 ) = C 0, 13K


Consequentemente, preferimos o processo I, visto que C > 0, 13K.
3.11.6

Distribuio Gama

dito que uma v.a. X possui uma distribuio Gama com parmetro e se X
possui uma distribuio contnua cuja f.d.p. dada por:
(
f (x) =

1 x
x e
()

para x > 0

para x 0

A mdia e varincia de uma v.a. X que possui uma distribuio Gama so dadas
por:

V ar(X) =
2
E(X) =

(3.73)
(3.74)

Observao 1
A distribuio exponencial um caso particular da distribuio Gama, quando =
1.
Observao 2
Se as v.a. X1 , X2 , ..., Xk so independentes e se Xi possui uma distribuio Gama
com parmetros i e (i = 1, 2, ..., k), ento a soma de X1 + X2 + ... + Xk possui
uma distribuio Gama com parmetros 1 + 2 + ... + k e .
3.11.7

Distribuio Normal Bivariada

Diz-se que duas v.a. X1 e X2 possuem uma distribuio Normal Bivariada se a


f.d.p. conjunta de X1 e X2 for dada por:
1
f (x1 , x2 ) =
e
2(1 2 )1/2

1
2(12 )

x1 1
1

94

x2 2
x2 2 2
x
+
2 1 1

(3.75)

onde:
E(X1 ) = 1 V ar(X1 ) = 12
E(X2 ) = 2 V ar(X2 ) = 22
e
Cov(X1 ,X2 )
1 2

=
=

Cor(X1 , X2 )

Observao
X1 e X2 so independentes se e somente se forem no correlacionadas.
3.11.8

Distribuio Normal Multivariada

Diz-se que:

X1
X2
..
.

X=

Xn
possue uma distribuio normal multivariada se a f.d.p. conjunta de
X1 , X2 , ..., Xn for dada por:
1
P 1/2 e
f (X) =
n/2
(2) |
|

12 (X)

P1

i
(X)

onde:
o vetor mdias;
X
a matriz de covariancia;
1
X

a inversa de

;e
X
| o determinante de
.

95

(3.76)

e
= E(X)
X

= E (X )(X )T

ou seja:
i = E(Xi )
ij = E [(Xi i )(Xj j )]

96

CAPTULO 4
INFERNCIA ESTATSTICA
4.1

Introduo

Um problema de inferncia estatstica um problema no qual os dados de uma


certa populao com uma distribuio de probabilidades desconhecida precisam ser
analizados, e algum tipo de inferncia sobre essa distribuio desconhecida precisa
ser feito. Essa inferncia feita atravs dos dados de uma amostra.
4.1.1

Parmetros de uma distribuio

Num problema de inferncia estatstica, qualquer caracterstica da distribuio


dos dados, tais como a mdia ou varincia 2 , denominada parmetro da
distribuio.
4.1.2

Estatstica

Denomina-se estatstica ao valor calculado inteiramente a partir da amostra.


2 , mediana, moda, desvio mdio, etc.
Exemplos de estatsticas so X,
4.1.3

Estimao Pontual e por Intervalo

Suponha que alguma caracterstica dos elementos de uma populao seja


representada pela v.a. X, cuja f.d.p. f (x; ), onde a forma dessa densidade seja
conhecida, exceto pelo parmetro desconhecido, que se deseja estimar.
Suponha que os valores x1 , x2 , ..., xk de uma amostra aleatria X1 , X2 , ..., Xk possam
ser observados. Com base nesses valores observados deseja-se estimar o valor
desconhecido de . A estimao pode ser obtida de duas maneiras: estimao
pontual eestimao por intervalo. Na estimao pontual determina-se uma
estatstica cujo valor representa, ou estima o parmetro . Na estimao por
intervalo, determina-se um intervalo para o qual a probabilidade que ele contenha
o valor possa ser determinado.
4.2

Estimao Pontual

Apresentamos aqui dois mtodos para se encontrar estimadores pontuais: mtodos


dos momentos e mtodo da mxima verossimilhana

97

4.2.1

Mtodo dos Momentos


0

Seja r = E(X 4 ) o r-simo momento de X. Em geral, r ser uma funo conhecida


dos parmetros desconhecidos 1 , 2 , ..., k .
0

Seja mr o r-simo momento amostral,i.e.,


k

1X r
x
mr =
n i=1 i
0

(4.1)

O mtodo dos momentos consiste em se resolver as k equaes


0

mj = 0 j j = 1, 2, ..., k.
0

Obs: O primeiro momento amostral m1 representado por x.


Exemplos:

a) Determinar o estimador pontual pelo mtodo dos momentos do


parmetro da distribuio Rayleigh.
Soluo:
Sabemos, pelo captulo 3, que se uma v.a. X possui distribuio Rayleigh
com parmetro , sua f.d.p. dada por:
f (x) =

2x x2
e

para x > 0

A mdia de X dada por:


E(X) =

Portanto, o estimador dos momentos de ser obtido igualando-se o


primeiro momento populacional ao primeiro momento amostral:
1p

= x
2
Logo,

98

4
x

b) Determinar os estimadores dos momentos para os parmetros e 2 da


distribuio Normal.
Soluo
Sabemos que se uma v.a. X possui distriubio Normal com parmetros
e 2 , ento:
E(X) =
V ar(X) = 2
Como V ar(X) = E(X 2 ) [E(X)]2 , seu segundo momento ser
E(X 2 ) = 2 + 2
Igualando-se os dois primeiros momentos populacionais aos dois primeiros
momentos amostrais tem-se:

= x

2 =

Pn
i=1

x2i

Pn
2

x =

i=1 (xi

x)2

c) Determinar os estimadores dos parmetros e da distribuio Gama


pelo mtodo dos momentos. (Fazer na srie de exerccios)
4.2.2

Mtodo da Mxima Verossimilhana

Definio 1: Funo de Verossimilhana


A funo de verossimilhana de n v.a. X1 , X2 , ..., Xn definida como sendo a
densidade conjunta das n v.a., f (x1 , x2 , ..., xn ; ), que considerada como sendo
uma funo de . Em particular, se X1 , X2 , ..., Xn uma amostra aleatria de uma
densidade f (x; ), ento a funo de verossimilhana
L(; x1 , x2 , ..., xn ) = f (x1 ; )f (x2 ; )...f (xn ; ).

Definio 2: Estimador de Mxima Verossimilhana


Seja L() = L(; x1 , x2 , ..., xn ) a funo de verossimilhana das v.a. X1 , X2 , ..., Xn .
1 , X2 , ..., Xn ) o estimador
Se o valor de que maximiza L(), ento (X
1 , x2 , ..., xn ) a estimativa de mxima
de mxima verossimilhana de , e (x
verossimilhana de para a amostra x1 , x2 , ..., xn .

99

Os casos mais importantes que consideraremos so aqueles que X1 , X2 , ..., Xn


formam uma amostra aleatria de uma densidade f (x; ), de tal modo que:
L() = f (x1 ; )f (x2 ; )...f (xn ; ).

Ento, o estimador de mxima verossimilhana a soluo da equao


dL()
=0
d

(4.2)

Alm disso, L() e log L() possuem seus mximos para o mesmo valor de , e muitas
vezes mais fcil encontrar o mximo do logaritmo da funo de verossimilhana.
Se a funo de verossimilhana contm k parmetros 1 , 2 , ..., k , os estimadores de
mxima verossimilhana sero a soluo das k-equaes
L(1 , 2 , ..., k )
= 0
1
L(1 , 2 , ..., k )
= 0
2
.. .. ..
. . .
L(1 , 2 , ..., k )
= 0
k
Exemplo:
Determinar os estimadores dos parmetros e 2 da distribuio Normal pelo
mtodo de Mxima Verossimilhana.
Soluo:

L(, 2 ) = f (x1 ; , 2 )f (x2 ; , 2 )...f (xn ; , 2 ).


1 x1 2
1 x2 2
1 xn 2
1
1
1
e 2 ( ) e 2 ( ) . . . e 2 ( )
=
2
2
2
Pn n 1 xi 2 o
1

e i=1 2 ( )
=
2
n/2
(2 )

X
n
n
ln L(, 2 ) = ln 2 ln(2)
2
2
i=1

100

(
2 )
1 xi
2

Pn
n
xi n
L(, 2 )
1 X
= 2
(xi ) = i=1 2

i=1

Igualando-se a zero a derivada acima, tem-se que o estimador de mxima


verossimilhana de ,
Pn
i=1

xi

= x

Analogamente,
L(, 2 )
n
= 2 +
2

Pn

i=1 (xi
2 4

)2

n 2 +

Pn

i=1 (xi
2 4

n)2

=0

Igualando-se a zero a derivada acima, e substituindo-se o estimador de encontrado


acima, tem-se que o estimador de mxima verossimilhana de 2
2 =

4.3

Pn

i=1 (xi

x)2

Estimadores No Tendenciosos

= ,
Um estimador um estimador no tendencioso de um parmetro , se E()
para todo possvel valor de . Em outras palavras, um estimador do parmetro
no tendencioso se sua esperana (ou mdia) igual ao verdadeiro valor
(desconhecido) de
Exemplo:
Vimos que os estimadores dos momentos e de mxima verossimilhana de e 2 da
distribuio normal so dados por:

= x

2 =

Pn

i=1 (xi

x)2

Provar que x um estimador no tendencioso de , mas 2 um estimador


tendencioso de 2 . Encontrar um estimador no tendencioso de 2 . (Fazer como
srie de exerccios).

101

4.4

A Distribuio 2

Uma distribuio Gama com = n2 e = 12 denominada distribuio 2 com n


graus de liberdade, e sua f.d.p. dada por
(
f (x) =

n
x
1
x 2 1 e 2
2n/2 ( n
)
2

para x > 0

para x 0

A mdia e varincia de uma v.a. X que possui uma distribuio 2 so dadas por:
E(X) = n

(4.3)

V ar(X) = 2n

(4.4)

Teorema 1:
Se as variveis X1 , X2 , ..., Xk so independentes e se Xi possui uma distribuio 2
com ni graus de liberdade (i = 1, 2, ..., k), ento a soma X1 + X2 + ... + Xk possui
uma distribuio 2 com n1 , n2 , ..., nk graus de liberdade.
Teorema 2:
Se as v.a. X1 , X2 , ..., Xk so independentes e identicamente distribuidas, cada uma
delas com distribuio normal padro ento a soma X12 + X22 +, ..., Xk2 possui uma
distribuio 2 com k graus de liberdade.
Exemplo:
Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio
normal com mdia e varincia 2 . Encontre a distribuio de

a)

)2
n(X
2

Pn
b)

i=1 (Xi
2

Soluo

102

)2

a) Sabemos que

X

/ n

N (0, 1)

Portanto,
)2
(X
2 /n

21

b) Temos que
Xi

N (0, 1)

Portanto,
(Xi )2
2

21

Somando estas n v.a., tem-se que


Pn

i=1 (Xi
2

)2

2n .

Observao:
ento temos que
1. Se for substituido por X,
Pn

i=1 (Xi
2

2
X)

2n1 .

Ou seja,
(n 1)s2
2

Pn
~

2n1 ,

onde

s =

2
X)
n1

i=1 (Xi

2. Pela esperana e varincia de uma v.a. com distribuio 2 , temos que:

(n 1)s2
2

=n1

E(s2 ) = 2

Ou seja, a varincia amostral, com divisor (n-1), um estimador no tendencioso

103

da varincia populacional. Alm disto,

V ar

(n 1)s2
2

= 2(n 1)

(n 1)2
2 4
2
2
V
ar(s
)
=
2(n

1)

V
ar(s
)
=
4
n1

Exemplo:
Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio
normal com mdia e varincia 2 . Supondo que n = 16, determine of valores
das seguintes probabilidades:

a)

b)

2
1X

(Xi )2 2 2
2
n i=1
n

1X
2
2 2 2

(Xi X)
2
n i=1

Soluo:

a)

2
1X

(Xi )2 2 2
2
n i=1

= P

Pn

i=1 (Xi
2

)2

2n

= P 8 216 32

= 0, 99 0, 05 = 0, 94

b)

2
1X
2 2 2

(Xi X)
2
n i=1

= P

Pn

i=1 (Xi
2

2
X)

2n

= P 8 215 32

= 0, 995 0, 10 = 0, 985

4.5

A Distribuio t-student

Considere duas v.a. independentes Y e Z tais que Y possua uma distribuio normal
padro, e Z possua uma distribuio 2 com n graus de liberdade. Suponha que uma

104

v.a. X seja definida por


Y
X = 1
Z 2

(4.5)

Ento a distribuio de X denominada distribuio t-student com n graus


de liberdade.
4.5.1

Distribuio da Mdia Amostral

Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio


normal com mdia e varincia 2 . Sabemos que

X

(0, 1)

e
Pn

2
(Xi X)
2n1
2

Logo,

Pn

21 =
2

(Xi X)
2 (n1)

)
n(X
tn1
s

(4.6)

Exemplo:
Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de uma distribuio
e s2 respectivamente
normal com mdia e varincia 2 desconhecidos. Sejam X
a mdia e a varincia amostral dos Xi s. Para um tamanho de amostra n = 16,
encontre o valor de k tal que:
> + ks) = 0, 05
P (X

(X ) n
P
> k n = 0, 05
s

105


P (tn1 > k n) = P (t15 > 4k) = 0, 05
Logo, 4k = 1, 753. Ou seja, k = 0, 438.
4.5.2

Distribuio da diferena de mdias amostrais

Considere duas amostras aleatrias


XA1 , XA2 , ..., XAnA

XB1 , XB2 , ..., XBnB


com nA e nB elementos, obtidas independentemente de duas populaes A e B,
normalmente distribudas com mdias A e B e varincias A2 = B2 = 2 ,
respectivamente. Sejam:
A =
X

P nA

i=1

XAi

nA

B =
X

PnB

i=1

XBi

nB

as mdias respectivas das duas amostras.


Temos ento que:

A X
B
X

s
A2

N A B ,

nA

B2

nB

Portanto,
A X
) (A B )
(X
qB 2
2
A
B
+
nA
nB

N (0, 1)

Temos tambm que:


(nA 1)s2A
A2

2nA 1 ,

(nB 1)s2B
B2

Logo,
(nA 1)s2A (nB 1)s2B
+
A2
B2

106

2nA +nB 2

2nB 1

Pela definio da distribuio t-student, e considerando A2 = B2 = 2 , temos que:


A X
)(A B )
(X
qB
1
+ n1
n

4.6

(nA 1)s2A +(nB 1)s2B


nA +nB 2

tnA +nB 2

Distribuio F

Considere duas v.a. independentes Y e Z tais que Y possua uma distribuio 2 com
m graus de liberdade, e Z possua uma distribuio 2 com n graus de liberdade.
Suponha que uma v.a. X seja definida por
X=

Y /m
nY
=
Z/n
mZ

(4.7)

Ento a distribuio de X denominada distribuio F com m e n graus de


liberdade.
Propriedade da distribuio F:
Se uma varivel aleatria X possui uma distribuio F com com m e n graus de
liberdade, ento 1/X possui uma distribuio F com com n e m graus de liberdade.
4.6.1

Distribuio da Razo entre duas Varincias Amostrais

Suponha que X1 , X2 , ..., Xn formem uma amostra aleatria de m observaes de


uma distribuio normal com mdia 1 e varincia 12 desconhecidos, e suponha que
Y1 , Y2 , ..., Yn formem uma amostra aleatria de n observaes de uma distribuio
normal com mdia 2 e varincia 22 desconhecidos. Sabemos que
Pm

i=1 (Xi
12

2
X)

(m 1)s21
2m1
12

e
Pn

i=1 (Yi
22

Y )2

(n 1)s22
=
2n1
2
2

107

Logo,
s21 /12
Fm1,n1
s22 /22

(4.8)

s21
Fm1,n1
s22

(4.9)

Se 12 = 22 , ento

Exemplo:
Suponha que uma amostra de tamanho 6 seja retirada de uma populao
normalmente distribuda com mdia 1 e varincia 30, e que uma amostra de
tamanho 3 seja retirada de uma outra populao normalmente distrbuda com
mdia 2 e varincia 76. Qual a probabilidade de s21 > s22 ?
Soluo:

2 2

s1 /1
22
s21
>1 =P
> 2
= P
s22
s22 /22
1
76
= P (F5,29 > ) = P (F5,29 > 2, 5) = 0, 05
30

P (s21

4.7
4.7.1

>

s22 )

Estimao por Intervalos - Intervalos de Confiana


Intervalo de Confiana para a Mdia Populacional

1 - Desvio Padro () conhecido


Como

X
(0, 1),
/ n

(4.10)

podemos determinar, pela tabela da distribuio normal padro, o nmero z 2 tal


que P (Z > z 2 ) = 2 , e portanto, :


X
z 2
P z 2
= 1 ,
/ n

108

ou seja

z X
+ z
P X
2
2
n
n

= 1 .

(4.11)

Chamando de L1 o limite inferior e L2 o limite superior, isto :


z
L1 = X
2
n

+ z ,
L2 = X
2
n

(4.12)
(4.13)

dizemos que o intervalo (L1 , L2 ) um intervalo de confiana para com coeficiente


de confiana (1 ), ou em outras palavras, que cai no intervalo (L1 , L2 ) com
confiana .
Exemplo:
Suponha que se extraia uma amostra de tamanho 35 de uma populao com mdia
e desvio padro conhecido e iqual a 3,90. Suponha que a mdia amostral seja 44,8.
Determinar um intervalo com 95% de confiana para .
Soluo:
Temos que:
3, 90
L1 = 44, 8 1, 96 = 43, 51
35
3, 90
L2 = 44, 8 + 1, 96 = 46, 09.
35

(4.14)
(4.15)

Logo, o intervalo com 95% de confiana para [43, 51; 46, 09]
2 - Desvio Padro () desconhecido
Como

X
tn1 ,
s/ n

(4.16)

podemos determinar, pela tabela da distribuio t-student com n 1 g.l., o nmero


t 2 ,(n1) tal que P (T > t 2 ,(n1) ) = 2 , e portanto, :

P t 2 ,(n1)


X
t 2 ,(n1) = 1 ,
s/ n

109

ou seja

t (n1) s X
+ t (n1) s
P X
2
2
n
n

= 1 .

(4.17)

Portanto o intervalo

+ t (n1) s
t (n1) s , X
X
2
2
n
n

um intervalo de confiana para com coeficiente de confiana (1 ).


Exemplo:
Suponha que se extraia uma amostra de tamanho 25 de uma populao com mdia
e desvio padro desconhecido. Suponha que a mdia amostral seja 4,004 e o desvio
padro amostral seja 0,366. Determinar intervalos com 95% e 99%de confiana para
.
Soluo:
Temos que t0,025; 24 = 2, 064:
0, 366
L1 = 4, 004 2, 064
= 3, 853
25
0, 366
L2 = 4, 004 + 2, 064
= 4, 155
25

(4.18)
(4.19)
(4.20)

Logo, o intervalo com 95% de confiana para [3, 853; 4, 155].


Analogamente, temos que t0,005; 24 = 2, 797:
0, 366
L1 = 4, 004 2, 797
= 3, 799
25
0, 366
L2 = 4, 004 + 2, 797
= 4, 209
25

(4.21)
(4.22)
(4.23)

Logo, o intervalo com 95% de confiana para [3, 799; 4, 209].

110

4.7.2

Intervalo de Confiana para a Varincia Populacional 2

Vimos que
(n 1)s2
2n1 .
2

(4.24)

Logo, podemos determinar pela tabela da distribuio 2 com n 1 g.l., os nmeros


2(1 ),[n1] e 2 ,[n1] tal que:
2

(n 1)s2
2
2
P (1 ),[n1]
,[n1] = 1 ,
2
2
2
ou seja
"

(n 1)s2
(n 1)s2
2

P
2 ,[n1]
2(1 ),[n1]
2

#
= 1 .

(4.25)

Portanto o intervalo

(n 1)s2 (n 1)s2
,
2 ,[n1] 2(1 ),[n1]
2

um intervalo de confiana para 2 com coeficiente de confiana (1 ).


Exemplo:
Suponha que seja retirada uma amostra de tamanho cinco de uma populao
normalmente distribuida, e que se tenha encontrado uma varincia amostral de 13,52.
Construa um intervalo com 95% de confiana para a varincia populacional.
Soluo:
Temos que 20,975; 4 = 0, 484 e 20,025; 4 = 11, 143. Portanto, os limites inferior e
superior do I.C. de 95% para 2 so:
L1 =

(n 1)s2
4(13, 52)
=
= 4, 85
2
,[n1]
11, 143
2

111

L2 =

(n 1)s2
4(13, 52)
=
= 111, 74
2
(1 ),[n1]
0, 484
2

Portanto, P (4, 85 2 111, 74) = 0, 95.


4.7.3

Intervalo de Confiana para a diferena de mdias de duas


Populaes

1 - Varincias 12 e 22 Conhecidas
Como
X1 1

(0, 1)

1
n1

X2 2

(0, 1).

2
n2

(4.26)

Logo
1 X
) (1 2 )
(X
q2 2
(0, 1)
1
22
+
n1
n2

(4.27)

Portanto o intervalo de confiana para 1 2 com coeficiente de confiana 1


dado por

1 X
2 ) z/2
(X

s
12
n1

22
n2

1 X
2 ) + z/2
, (X

12
n1

22
n2

2 - 12 e 22 Desconhecidas mas 12 = 22
Vimos que
(
x1
x2 )(1 2 )

1/n1 +1/n2

(n1 1)s21 +(n2 1)s22


n1 +n2 2

tn1 +n2 2

(4.28)

Logo, o intervalo de confiana para 1 2 , quando 12 = 22 , com coeficiente de

112

confiana 1 dado por

(
x1 x2 ) t/2,[n1 +n2 2]

(n1

1)s21

+ (n2
n1 + n2 2

1)s22

1
1
+
n1 n2

Exemplo:
Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia de
1400 horas e desvio padro de 120 horas. Uma amostra de 20 lmpadas eltricas,
da marca B, apresentou a vida mdia de 1200 horas e o desvio padro de 100 horas.
Supondo que A = B , determinar os limites de confiana de a) 95% e b) 99% para
a diferena entre as vidas mdias das populaes das marcas A e B.
Soluo:
a) Para 1 = 0, 95 tem-se que t0,025,28 = 2, 048. Portanto, o I.C. de 95% para
A B ser:

(1400 1200) 2, 048

9(120)2 + 19(100)2

28

1
1
+
10 20

!
= (200 67, 77)

Ou seja,
P (132, 23 A B 267, 77) = 0, 95
b) Analogamente, para 1 = 0, 99 tem-se que t0,005,28 = 2, 763. Portanto, o I.C.
de 99% para A B ser:

(1400 1200) 2, 763

9(120)2 + 19(100)2

28

1
1
+
10 20

Ou seja,
P (108, 57 A B 291, 43) = 0, 99

113

!
= (200 91, 43)

4.7.4

Intervalo de Confiana para Razo das Varincias 12 /22

Vimos que
s22 /22
Fn2 1,n1 1
s21 /12

(4.29)

Logo, podemos determinar pela tabela da distribuio F com n2 1 e n1 1 g.l.,


os nmeros F(1/2),[n2 1],[n1 1] e F/2,[n2 1],[n1 1] tal que:

P F(1/2),[n2 1],[n1 1]

s2 2
22 12 F/2,[n2 1],[n1 1]
s1 2

(4.30)

ou

1
F/2,[n1 1],[n2 1]

s2
2
s2
12 12 F/2,[n2 1],[n1 1] 12
s2
2
s2

(4.31)

Exemplo:
Duas mquinas A e B produzem parafusos com o mesmo tamanho mdio. Duas
amostras de tamanho nA = 61 e nB = 41 dos parafusos de A e B foram analisadas
e os desvios padres amostrais foram s2A = 3, 5 mm e s2B = 4, 5 mm. Determine um
intervalo de 95% de confiana para
Soluo:

2
A
.
2
B

Tem-se que F0,975,40,60 = 1/F0,025,60,40 = 1/1, 80 = 0, 556 e F0,025,40,60 = 1, 74.Logo,

A2
3, 5
3, 5
P 0, 556
2 1, 74
= 0, 95
4, 5
B
4, 5

A2
P 0, 432 2 1, 353 = 0, 95
B

4.7.5

Intervalo de Confiana para uma Proporo

Admita-se que uma populao infinita e que a probabilidade de ocorrncia de um


evento (denominado de sucesso) seja p. Considerem-se todas as amostras possveis
de tamanho n extraidas da populao e, para cada amostra, determinaremos a
proporo p de sucessos.

114

Vimos que:
E(
p) = p
p(1 p)
V ar(
p) =
n

(4.32)
(4.33)

Vimos tambem que para grandes valores de n, a distribuiop de p uma normal,


isto

p(1 p)
p p,
n

(4.34)

Portanto, o intervalo de confiana para p, com coeficiente 1 dado por:

p z/2

p(1 p)
, p + z/2
n

p(1 p)
n

!
(4.35)

Para n grande, em geral substitui-se p por p, resultando em:

4.7.6

p z/2

p(1 p)
p p + z/2
n

p(1 p)
n

!
=1

Intervalo de Confiana para Diferena de Propores

Sejam duas propores p1 e p2 , e suas respectivas propores amostrais p1 e p2 ,


baseadas em amostras de tamanhos n1 e n2 . Para grandes tamanhos de amostra
tem-se que:

p1 (1 p1 ) p2 (1 p2 )
+
p1 p2 p1 p2 ,
n1
n2

(4.36)

Portanto, o intervalo de confiana para p1 p2 , com coeficiente de confiana 1


dado por:

(p1 p2 ) z/2

p1 (1 p1 ) p2 (1 p2 )
+
n1
n2

115

CAPTULO 5
TESTES DE HIPTESES
Consideraremos aqui problemas estatsticos envolvendo um parmetro cujo valor
desconhecido mas deve cair dentro de um certo domnio (isto , o conjunto
de todos os possveis valores de ). Vamos supor que possa ser particionado em
2 (dois) subconjuntos distintos 0 e 1 , e que o estatstico deva decidir se o valor
desconhecido de cai em 0 ou em 1 .
5.1

Hiptese Nula e Hiptese Alternativa

Seja H0 a hiptese de que 0 e H1 a hiptese de que 1 , isto :


H0 : 0
H1 : 1

Como 0 e 1 so disjuntos (0 1 = ), somente umas das hipteses so


verdadeiras. O estatstico deve decidir se aceita H0 ou se aceita H1 . Um problema
desse tipo chamado um problema de teste de hipteses.
H0 denominada hiptese nula, e
H1 denominada hiptese alternativa
5.2

Regio Crtica do Teste

O procedimento adotado para decidir se ele aceita H0 ou aceita H1 denominado


procedimento do teste, ou simplesmente teste.
Suponha que antes de decidir se aceita ou no a hiptese nula, ele observa
~ =
uma amostra aleatria X1 , X2 , ..., Xn . Seja S o espao amostral do vetor X
(X1 , X2 , ..., Xn ), isto , S o conjunto de todos os possveis resultados da amostra.
Num problema desse tipo o estatstico especifica um procedimento de teste que
consiste em dividir o espao amostral em dois subconjuntos: um deles consiste dos
valores da amostra para o qual ele aceita H0 , e o outro contem os valores para o
qual ele rejeita H0 .

117

O subconjunto para o qual H0 ser rejeitada chamada regio crtica do teste.


O complemento da regio crtica contem portanto todos os possveis valores para o
qual H0 ser aceita.
5.3

Erros do Tipo I e Erros do tipo II

Quando estabelecemos um procedimento do teste, podemos incorrer em dois tipos


de erros:
a) O de rejeitar H0 quando ela de fato verdadeira. Este erro denominado
erro do tipo I. A probabilidade () deste tipo de erro ocorrer
controlada pelo estatstico e denominada nvel de signicncia do
teste.
b) O de aceitar H0 quando H1 verdadeira. Este erro denominado erro
do tipo II. A probabilidade deste erro ocorrer representada por .
A Tabela 5.1 mostra os dois tipos de erros.

TABELA 5.1 Representao do erros do tipo I e II

5.4

5.4.1

H0 verdadeira

H0 falsa

aceita H0

1 (Coef. de confiana)

rejeita H0

(nvel de significncia)

1 (poder do Teste)

Teste da hiptese de que a mdia populacional tem um valor


especfico
conhecido

H0 : = 0
H1 : 6= 0

118


1. Retira-se uma amostra de tamanho n e calcula-se X.
2. Calcula-se o valor da estatstica
Z=

0
X

/ n

3. Sob a hiptese nula, tem-se que Z possui uma distribuio normal padro.
Portanto,
Rejeita-se H0 se | Z |> Z/2 (isto , se Z < Z/2 ou Z > Z/2 )
Aceita-se H0 se | Z |< Z/2 (isto , Z/2 Z Z/2 ),
onde o nvel de significncia do teste.
5.4.2

desconhecido

H0 : = 0
H1 : 6= 0

Calcula-se a estatstica
t=

0
X

s/ n

Sob a hiptese nula, tem-se que t possui uma distribuio t-Student com n 1 graus
de liberdade. Portanto,
Rejeita-se H0 se | t |> t/2,[n1]
Aceita-se H0 se | t | t/2,[n1]
Observao
Se os testes das sees (5.4.1 e 5.4.2) tiverem uma hiptese alternativa unilateral
(i.e. se H1 : > 0 , ou H1 : < 0 ) o teste dever rejeitar unilateralmente (i.e. se
t > t,[n1] , ou t < t,[n1] , respectivamente.)

119

Exemplos:
1. Uma mquina automtica para encher pacotes de caf enche-os segundo uma
distribuio normal, com mdia e varincia sempre igual a 400 g 2 . A mquina
foi regulada para = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes
para verificar se a produo est sob controle, isto , se = 500g ou no. Se uma
dessas amostras apresentasse uma mdia amostral de 492 g, voc pararia ou no a
produo para regular mquina, considerando o nvel de significncia de 1%? Para
quais valores de mdia amostral a mquina ser regulada?
Soluo:
As hipteses so:
H0 : = 500
H1 : 6= 500
Pelos dados do problema a varincia sempre a mesma e igual a 2 = 400. A
estatstica a ser calculada :
z=

0
X
492 500
= p
= 1, 6
/ n
400/16

Ao nvel de significncia de 0,01, a regra de deciso :


Rejeita-se H0 se | z |> z0,005 = 2, 58
Aceita-se H0 se | z |< 2, 58
Portanto, aceita-se H0 , e a mquina no necessita ser parada. A mquina s sera
parada se
x < 0 z0,005 n = 500 2, 58 20
, isto , x < 487, 1, ou
4
x > 0 + z0,005 n = 500 + 2, 58 20
, isto , x > 512, 9
4
2. A tenso de ruptura dos cabos produzidos por um fabricante apresenta mdia
de 1800 kg e desvio padro de 100 kg. Mediante nova tcnica no processo de
fabricao, proclama-se que a tenso de ruptura pode ter aumentado. Para testar
esta declarao, ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tenso
mdia de ruptura de 1850 kg. Pode-se confirmar a declarao ao nvel de significncia
de 0,01?

120

Soluo:
As hipteses so:
H0 : = 1800

(no houve modificao da tenso de ruptura)

H1 : > 1800

(houve modificao da tenso de ruptura)

Como supe-se que o desvio padro no se tenha modificado, temos que = 100. A
estatstica a ser calculada :
z=

0
1850 1800
X

=
= 3, 55
/ n
100/ 50

Ao nvel de significncia de 0,01, a regra de deciso :


Rejeita-se H0 se z > z0,01 = 2, 33
Aceita-se H0 se z < 2, 33
Portanto, rejeita-se H0 , e confirma-se a declarao.
3. Um fabricante afirma que seus cigarros contm no mais que 30 mg de nicotina.
Uma amostra de 25 cigarros fornece mdia de 31,5 mg e desvio padro de 3 mg. Ao
nvel de 5%, os dados refutam ou no a afirmao do fabricante?
Soluo:
Neste caso, as hipteses so:
H0 : = 30
H1 : > 30
Como no se conhece a varincia populacional, e esta foi estimada pela amostra,
devemos utilizar a estatstica t:
t=

0
X
31, 5 30
=

= 2, 5
s/ n
3/ 25

A regra de deciso dada por


Rejeita-se H0 se t > t,[n1] = t0,05,24 = 1, 711
Aceita-se H0 se t < 1, 711
Portanto, rejeita-se H0 , ou seja, h evidncias de que os cigarros contenham mais de
30 g de nicotina.

121

5.5

Controlando o erro tipo II ()

Vimos que o erro tipo I representa o erro de se rejeitar H0 quando ela de fato
verdadeira. A probabilidade deste erro e fixada e portanto controlada pelo
estatstico.
Temos tambm o erro tipo II (beta) que representa o erro de aceitar H0 quando ela
falsa.
Quando rejeitamos H0 , automaticamente estamos aceitando H1 , isto , estamos
aceitando que o parmetro pertena ao espao definido pela hiptese H1 . O erro tipo
II depender do verdadeiro valor do parmetro. Quanto mais afastado o verdadeiro
valor do parmetro estiver do valor especificado em H0 , menor ser o erro tipo II.
Portanto, para calcular , temos que especificar este valor em H1 , isto , ter-se as
hipteses definidas por:
H0 : = 0
H1 : = 1

Para exemplificar isto, considere o exemplo 2 dado anteriormente. Suponha que as


hipteses tenham sido definidas da seguinte maneira:
H0 : = 1800
H1 : = 1850

Vimos que o erro tipo I foi fixado em 0,01, supondo que H0 fosse verdadeira, isto ,

X
2, 33 | = 1800 =
0, 01 = P (erro I) = P (Z 2, 33) = P
/ n

100
X 1800

2, 33 = P X 1800 + 2, 33
=
= P
100/ 50
50

1832, 95
= P X

122

Portanto, a probabilidade do erro tipo II ser:

< 1832, 95 | = 1850 =


= P (erro II) = P X

X
1832, 95 1850
<

= P
= P (Z < 1, 206)
= 0, 1131
/ n
100/ 50
O clculo acima pode ser efetuado para vrios valores de . Considerando-se () a
probabilidade de aceitar H0 como funo de , isto ,

< 1832, 95 | ,
() = P (aceitarH0 | ) = P X
pode-se calcular a funo
() = 1 ().
Esta funo denominada funo poder do teste.
5.6

Teste da hiptese de que a varincia populacional tem um valor


especfico

Suponha que uma varivel seja normalmente distribuida com uma varincia
desconhecida e se deseje efetuar o seguinte teste de hipteses:

H0 : 2 = 02
H1 : 2 6= 02

Calcula-se a estatstica
X2 =

(n 1)s2
02

Rejeita-se H0 se X 2 < 21/2,[n1] ou X 2 > 2/2,[n1]


Aceita-se H0 se 21/2,[n1] X 2 2/2,[n1]

123

Observao
1. Se a hiptese alternativa fosse
H1 : 2 > 02 ,
H0 seria rejeitada se X 2 > 2,[n1] .
2. Se a hiptese alternativa fosse
H1 : 2 < 02 ,
H0 seria rejeitada se X 2 < 21,[n1] .
Exemplo:
Uma das maneiras de manter sob controle a qualidade de um produto controlar
a sua variabilidade. Uma mquina de encher pacotes de caf est regulada para
ench-los com mdia de 500 g e desvio padro de 10 g. Colheu-se uma amostra de
16 pacotes e observou-se uma varincia s2 = 169g 2 . Supondo que o peso de cada
pacote segue uma distribuio normal, voc diria que a mquina est desregulada
com relao varincia?
Soluo:
Deseja-se testar:
H0 : 2 = 100
H1 : 2 6= 100
A estatstica a ser calculada :
X2 =
e o procedimento do teste :

(n 1)s2
(15)(169)
=
= 25, 35
2
0
100
Aceita-se H0 se 21/2,[n1] X 2 2/2,[n1] ,

isto ,
Aceita-se H0 se 6, 262 X 2 27, 488,
e
Rejeita-se H0 se X 2 < 27, 488 ou X 2 > 27, 488
Portanto, aceita-se H0 , e conclumos que a mquina no est desregulada quanto
varincia.

124

5.7

Teste da razo de varincias

Suponha que se deseje testar:


H0 : 12 = 22
H1 : 12 6= 22
(5.1)
ou, equivalentemente,
12
=1
22
2
: 12 6= 1
2

H0 :
H1

(5.2)
O procedimento do teste :
Calcula-se a estatstica
f=

s21
s22

(5.3)

Vimos que, sob a hiptese H0 , a estatstica f possui uma distribuio F com n1 1


e n2 1 graus de liberdade. Portanto,
Aceita-se H0 ao nvel de significncia se
1
F/2,[n2 1],[n1 1]

f F/2,[n1 1],[n2 1]

(5.4)

Rejeita-se H0 ao nvel de significncia de se


f<

1
F/2,[n2 1],[n1 1]

(5.5)

ou
f > F/2,[n1 1],[n2 1]

125

(5.6)

Exemplo:
Uma das maneiras de medir o grau de satisfao dos empregados de uma mesma
categoria quanto poltica salarial por meio do desvio padro de seus salrios. A
fbrica A diz ser mais coerente na poltica salarial do que a fbrica B. Para verificar
essa afirmao, sorteou-se uma amostra de 10 funcionrios no especializados de A,
e 15 de B, obtendo-se os desvios padres sA = 1000 reais e sB = 1600 reais. Qual
seria a sua concluso?
Soluo:
A hiptese a ser testada :
H0 : A2 = B2
H1 : A2 6= B2
(5.7)

Temos que:
f=

s2A
1000
=
= 0, 667
2
sB
1500

Devemos aceitar H0 ao nvel de significncia = 0, 05 se


1
F0,025,[14],[9]

f F0,025,[9],[14]

(5.8)

ou seja, se
1
f 3, 12
3, 77
0, 27 f 3, 12
(5.9)

Como este o caso, aceitamos H0 ao nvel de significncia de 0,05, e conclumos que


as duas fbricas so igualmente homogneas.

126

5.8

Teste da hiptese da igualdade de duas mdias

Suponha que se tenha


H 0 : 1 = 2
H1 : 1 6= 2

5.8.1

12 e 22 conhecidas

Calcula-se a estatstica
x1 x2
Z=q 2
1
22
+
n1
n2

(5.10)

Sabemos que, sob a hiptese H0 , a varivel Z possui uma distribuio normal padro.
Portant, o procedimento do teste consiste em:
Rejeita-se H0 se | Z |> Z/2
Aceita-se H0 se | Z | Z/2
5.8.2

12 e 22 desconhecidas, mas 12 = 22

Suponha que a hiptese de igualdade de varincias no seja rejeitada. Ento podemos


supor que 12 = 22 , mas esta varincia comum no conhecida. Para efetuar o teste
de igualdade de mdias, neste caso, procedemos da seguinte maneira:
Calcula-se a estatstica
t= q

1
x2
qx
1
1
+
n
n
1

(n1 1)s21 +(n2 1)s22


n1 +n2 2

(5.11)

Como vimos anteriormente, esta estatstica possui ima distribuio t-Student com
n1 + n2 2 graus de liberdade. Portanto,
Rejeita-se H0 se | t |> t/2; n1 +n2 2
Aceita-se H0 se | t | t/2; n1 +n2 2

127

5.8.3

12 e 22 desconhecidas, mas 12 6= 22

Suponha que a hiptese de igualdade de varincias tenha sido rejeitada. Neste caso,
devemos calcular a estatstica
x1 x2
t= q 2
s1
s2
+ n22
n1

(5.12)

Pode-se provar que, sob a hiptese que H0 verdadeira, a estatstica acima


aproxima-se de uma distribuio t de Student com graus de liberdade dado
aproximadamente por:
(A + B)2
= A2
2 ,
+ nB2 1
n1 1
onde
A=

s21
,
n1

B=

s22
.
n2

Sendo este valor geralmente fracionrio, costuma-se arredondar para o inteiro mais
prximo para obter o nmero de graus de liberdade.
O procedimento do teste ento
Rejeita-se H0 se | t |> t/2 ,
Aceita-se H0 se | t | t/2 ,
Exemplos:
1. Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia
de 1400 horas e uma amostra de 20 lmpadas eltricas, da marca B, apresentou
a vida mdia de 1200 horas. Suponha que os desvios padres populacionais dos
tempos de vida das lmpadas das duas marcas sejam conhecidos e iguais a 120 e
100, respectivamente. Teste, ao nvel de significncia de 99%, a hiptese que as duas
marcas produzem lmpadas com o mesmo tempo mdio de vida.
Soluo:
Queremos testar a hiptese:
H0 : A = B
H1 : A 6= B

128

Como estamos supondo que as varincias so conhecidas, podemos usar a estatstica


xA xB
1400 1200
Z=q 2
=q
= 4, 54
2
A
B
1202
1002
+
+
10
20
nA
nB

(5.13)

O procedimento do teste consiste em:


Rejeita-se H0 se | Z |> Z0,005 = 2, 58
Aceita-se H0 se | Z | 2, 58
Como a o valor da estatstica pertence regio de rejeio, concluimos que H0
rejeitada e que as lmpadas no possuem o mesmo tempo mdio de vida.
2. Duas tcnicas de vendas so aplicadas por dois grupos de vendedores: a tcnica
A, por 12 vendedores, e a tcnica B, por 15 vendedores. Espera-se que a tcnica B
produza melhores resultados que a tcnica A. No final de um ms, os vendedores
de A venderam uma mdia de 68 tens, com uma varincia de 50, enquanto que os
vendedores de B venderam uma mdia de 76 tens com uma varincia de 75. Testar,
ao nvel de significncia de 5%, se a tcnica B realmente melhor que a tcnica A.
Soluo:
Supondo que as vendas sejam normalmente distribudas, vamos inicialmente testar
a hiptese de que as varincias so iguais:
H0 : A2 = B2
H1 : A2 6= B2
Temos que:
f=

s2A
50
=
= 0, 667
2
sB
75

Devemos aceitar H0 ao nvel de significncia = 0, 05 se


1
F0,025,[14],[11]

f F0,025,[11],[14]

ou seja, se aproximadamente
1
f 3, 06
3, 52
0, 28 f 3, 06

129

(5.14)

Logo, aceitamos H0 ao nvel de significncia de 0,05, e conclumos que as varincias


so iguais.
Portanto, agora podemos testar a hiptese de igualdade de mdias, sob a suposio
que as vendas pelas duas tcnicas possuem uma varincia comum, mas desconhecida:
H0 : A = B
H1 : A < B

Devemos calcular a estatstica


t = q

A
xB
qx
1
+ n1
n
A

=q

(nA 1)s2A +(nB 1)s2B


nA +nB 2

6876
1
1
12

+ 15

(11)(50)+(14)(75)
25

= 2, 56

O procedimento do teste ser:


Rejeita-se H0 se t < t0,05,[25] = 1, 708
Aceita-se H0 se t 1, 708
Como o valor encontrado pertence regio de rejeio, rejeitamos H0 e conclumos
que a tcnica B produz melhores resultados que a tcnica A.
3. Queremos testar as resistncias de dois tipos de vigas de ao, A e B. Tomando-se
nA = 15 vigas do tipo A e nB = 20 vigas do tipo B, obtemos os valores da tabela
a seguir. Testar a hiptese que as resistncias mdias dos dois tipos de vigas so
iguais, ao nvel de significnica de 5%.
Tipo

Mdia

Varincia

A
B

70,5
84,3

71,6
169,5

Soluo:
Vamos inicialmente testar a hiptese de que as varincias so iguais:
H0 : A2 = B2
H1 : A2 6= B2

130

Temos que:
f=

s2A
71, 6
=
= 0, 42
2
sB
169, 5

Devemos aceitar H0 ao nvel de significncia = 0, 10 se


1
F0,05,[19],[14]

f F0,05,[14],[19]

(5.15)

ou seja, se aproximadamente
1
f 2, 20
2, 33
0, 43 f 2, 20
Logo, rejeitamos H0 ao nvel de significncia de 0,10, e conclumos que as varincias
no so iguais.
Portanto, agora podemos testar a hiptese de igualdade de mdias:
H0 : A = B
H1 : A 6= B
A estatstica a ser utilizada deve ser:
70, 5 84, 3
xA xB
=q
t= q 2
= 3, 79
2
sA
sB
71,6
169,5
+
+
15
20
nA
nB

(5.16)

O valor crtico deve ser encontrado pela tabela t-Student com graus de liberdade
dado por:
=

175, 51
= 32, 46
= 32,
1, 627 + 3, 780

O procedimento do teste ento


Rejeita-se H0 se | t |> t0,025 , 32
= 2, 042
Aceita-se H0 se | t | 2, 042
Portanto, rejeitamos H0 , e conclumos que h evidncias de que os dois tipos de
vigas possuem resistncias mdias diferentes.

131

5.9

Teste para proporo

Suponha que se deseje testar a hiptese:


H0 : p = p0
H1 : p 6= p0
Calcula-se a estatstica
p p0
Z=q

p0 (1p0 )
n

(5.17)

Rejeita-se H0 se | Z |> Z/2


Aceita-se H0 se | Z | Z/2
Exemplo:
Em uma experincia sobre percepo extra sensorial (PES), um indivduo em uma
sala solicitado a declarar a cor vermelha ou preta de uma carta escolhida, de
um baralho de 50 cartas, por outro indivduo colocado em outra sala. O indivduo
desconhece quantas cartas vermelhas ou pretas h no baralho. Se o sujeito identifica
corretamente 32 cartas, determinar se os resultados so significativos, ao nvel de
significncia de 5% e 1%.
Soluo:
Queremos testar a hiptese:

Temos que p =

32
50

H0 : p = 0, 50

o indivduo no tem PES

H1 : p > 0, 50

o indivduo tem PES

= 0, 64. Calculamos a estatstica


p p0
Z=q

p0 (1p0 )
n

0, 64 0, 50
q
= 1, 98
0,502
50

(5.18)

Ao nvel de significncia de 0,05 o procedimento do teste ser:


Rejeita-se H0 se Z > Z0,05 = 1, 645
Aceita-se H0 se Z 1, 645
Portanto, ao nvel de significncia de 0,05 rejeitamos H0 , e conclumos que o
indivduo tem faculdades de PES.

132

Para o nvel de significncia de 0,01 o valor crtico ser 2,33. Como o valor calculado
menor que o valor crtico, aceitamos H0 , e conclumos que os resultados so devidos
ao acaso e que o indivduo no tem faculdades de PES.
5.9.1

Diferena entre propores

H0 : p1 = p2
H1 : p1 6= p2
Como
p1 p2 = p1 p2 = 0

(sobH0 )

(5.19)

e
p2A pB =

p1 q1 p2 q2
1
1
+
= pq( + )
n1
n2
n1 n2

(sobH0 )

(5.20)

em que
P =

n1 p1 + n2 p2
n1 + n2

(5.21)

adotado como estimativa de p. Calcula-se


Z=

p1 p2
p1 p2

(5.22)

e aceita-se H0 se | Z | Z/2
Exemplo:
Doi grupos, A e B, so formados, cada um por 100 pessoas que tm a mesma
enfermidade. ministrado um soro ao grupo A, mas no ao B (denominado grupo de
controle); a todos os outros respeitos, os dois grupos so tratados de modo idntico.
Determinou-se que 75 e 65 pessoas dos grupos A e B, respectivamente, curaram-se da
enfermidade. Testar a hiptese de que o soro auxilia a cura da enfermidade, adotado
o nvel de significncia de 0,01.
Soluo:
Denominando de pA e pB as propores populacionais curadas mediante o uso do

133

soro e sem o uso do soro, respectivamente, quereremos testar a hiptese


H0 : pA = pB

o soro no eficaz

H1 : pA > pB

o soro eficaz

Temos que pA = 0, 75 pB = 0, 65, e


P =

75 + 65
= 0, 70
200

p21 p2 = (0, 7)(0, 3)(

(5.23)

1
1
+
) = 0, 0042
100 100

(5.24)

A estatstica a ser calculada :


Z=

pA pB
0, 75 0, 65
=
= 1, 543
pA pB
0, 0042

(5.25)

Devemos aceitar H0 se Z < Z0,01 = 2, 33. Portanto, aceitamos H0 , e conclumos que


os resultados so devidos ao acaso, e que o soro no eficaz.
5.10

Teste 2 da independncia

Uma tabela na qual cada observao classificada em dois ou mais modos


denominada tabela de contingncia.
Exemplo
Suponha que 200 estudantes sejam selecionados aleatoriamente em uma universidade
e que cada estudante seja classificado de acordo com a sua rea de estudo, e com
sua preferncia entre dois canditados para uma prxima eleio (ver Tabela 5.2).

TABELA 5.2 Canditados selecionados


rea de
Estudo
Engenharia
Humanas
Artes
Administrao
Totais

Candidato
B

Indeciso

Totais

24
24
17
27
92

23
14
8
19
64

12
10
13
9
44

59
48
38
55
200

134

Quer-se tentar a hiptese de que as diferentes classificaes so independentes, isto


, que a preferncia a uma certo candidato independente da rea de estudo (i.e.
a probabilidade de estar na rea de estudo i e preferir o candidato j igual a
probabilidade de estar em i vezes a probabilidade de preferir j.
Em geral, conderamos uma tabela de contingncia contendo L linhas e C colunas.
Para i = 1, 2, 3, ..., L e j = 1, 2, 3, ..., C, seja Pij a probabilidade de que um individuo
selecionado aleatoriamente de uma dada populao seja classificado na i-sima linha
e na j-sima coluna. Alm disso, seja Pi a probabilidade marginal que o individuo
seja classificado na i-sima linha, e seja Pj a probabilidade marginal que o individuo
seja classificado na j-sima coluna.
Pi =

C
X

Pij e Pj =

j=1

L
X

Pij

(5.26)

i=1

Observe que:
L X
C
X

Pij =

i=1 j=1

L
X

Pi =

i=1

C
X

Pj = 1

(5.27)

j=1

Suponha agora que uma amostra de n individuos seja retirada da populao. Para
i = 1, 2, 3, ..., L, e j = 1, 2, 3, ..., C, seja Nij o nmero de individuos classificados
na i-sima linha e j-sima coluna. Alm disso, seja Ni o nmero de individuos
classificados na i-sima linha e Nj o nmero total de individuos classificados na
j-sima coluna.
Ni =

C
X

Nij e Nj =

j=1

L
X

Nij

(5.28)

Nj = n

(5.29)

i=1

Observe que
L X
C
X
i=1 j=1

Nij =

L
X

Ni =

i=1

135

C
X
j=1

Com base nessas observaes, as seguintes hipteses sero testadas:


H0 : Pij = Pi Pj
H1 : A hiptese H0 no verdadeira.

O teste 2 pode ser usado para testar essa hiptese. Cada individuo na populao
deve pertencer a uma das L C celulas da tabela de contingncia. Sob a hiptese
H0 , as probabilidades desconhecidas Pij dessas celulas foram expressas em funo
PL
PC
dos parmetros desconhecidos Pi e Pj . Como
i=1 Pi = 1 e
j=1 Pj = 1, o
nmero de parmetros desconhecidos a serem estimados quando H0 verdadeiro
(L 1) + (C 1), ou L + C 2.
Para i = 1, 2, 3, ..., L, e j = 1, 2, 3, ..., C, seja Eij o estimador quando H0 verdadeira,
do nmero esperado de observaes classificadas na i-sima linha e j-sima coluna.
Portanto, a estatstica Q definida no teste 2 de aderncia dada por
L X
C
X
(Nij Eij )2
Q=
Eij

(5.30)

i=1 j=1

Como a tabela de contingncia tem L C clulas, e como L + C 2 parmetros tero


que ser estimados quando H0 for verdadeiro, segue-se que quando H0 for verdadeiro
e n , a distribuio de Q converge para uma 2 com L C 1 (L + C 2) =
(L 1)(C 1) graus de liberdade.
Consideraremos agora o estimador Eij . O nmero esperado de observaes na i-sima
linha e j-sima coluna nPij . Quando H0 verdadeiro Pij = Pi Pj . Portanto,
se Pi e Pj so estimadores de Pi e Pj , segue-se que Eij = nPi Pj . Como Pi
a probabilidade que uma observao seja classificada na i-sima linha, Pi a
proporo de observaes na amostra que so classificadas na i-sima linha, isto ,
N
Pi = Ni . Da mesma maneira, Pj = j . Portanto,
n

Eij = n

Ni
n

Nj
n

Ni Nj
n

(5.31)

A hiptese nula ser rejeitada quando Q > c , onde c obtido na tabela 2 com
(L 1)(C 1) graus de liberdade.

136

Para o exemplo dado, N1 = 59; N2 = 48, N3 = 38; N4 = 55 e N1 = 92, N2 = 64,


N3 = 44.
Como n = 200, os valores (ver Tabela 5.3) Eij so dados por

TABELA 5.3 Valores da Eij


27,14
22,08
17,48
25,30

18,88
15,36
12,16
16,60

12,98
10,56
8,36
12,10

O valor de Q ser Q = 6, 68. Como L = 4 e C = 3, o nmero de graus de liberdade


(L 1)(C 1) = 6.
Para = 0, 005, tem-se que c = 12, 59, e portanto no h nenhuma evidncia que
H0 no seja verdadeira.

137

CAPTULO 6
ANLISE DE VARINCIA
6.1

Introduo

A anlise de varincia um mtodo de se dividir a variao total dos dados


em componentes significativos que medem diferentes fontes de variao. Assim,
considerando que nosso interesse esteja voltado para testar se diferentes variedades
de trigo produzem, em mdia quantidades iguais, isto , se:
H0 : 1 = 2 = 3 = . . . = k
H1 : pelo menos duas mdias so diferentes
obtem-se duas componentes: uma devida ao erro experimental (incontrolvel) e outra
medindo a variao devida ao erro experimental mais qualquer variao devida s
diferentes variedades de trigo. Se a hiptese nula for verdadeira, as k espcies de trigo
produzem igualmente, em mdia, ento ambos componentes fornecem estimativas
independentes do erro experimental.
A anlise de varincia um mtodo para testar a hiptese H0 acima, por meio da
anlise das varincias das diversas amostras. Este mtodo estende o mtodo visto
no captulo 5, onde a comparao envolvia somente duas mdias.
importante ressaltar que num experimento desta natureza importante se
ter controladas outras possveis fontes de variao: tipos diferentes de solo onde
se plantaro as variedades conduziro a uma estimativa tendenciosa do erro
experimental e consequentemente aumentar a probabilidade de se cometer um erro
do tipo II. Desta forma, uma variedade A, de pior qualidade que as outras variedades
sendo testadas, pode, se plantada em uma rea de melhor composio, fornecer, em
mdia, valores que no a tornem distinta das outras variedades. Assim, a hiptese
nula, de igualdade de todas as mdias das k variedades, pode ser aceita mesmo
no sendo verdadeira, isto , mesmo que uma das variedades sendo testada seja
inferior que as outras. Aqui, um fator no controlado (composio do solo) mascara
o verdadeiro resultado que seria obtido caso houvesse um controle mais rigoroso.
Portanto, em uma anlise de varincia estamos supondo que estamos variando
somente uma (ou algumas) varivel(eis) de interesse, e que todos os outros fatores
permaneam constantes.

139

Vamos estudar experimentos de um e de dois fatores (poderiam at ser mais do


que dois), em funo do nmero de variveis envolvidas no problema. Se alm das
diferentes variedades de trigo sendo testadas estivssemos tambm interessados em
investigar o efeito de diferentes tipos de de fertilizantes na produtividade, ento
deixaramos de ter um experimento de um s fator e passaramos a estar envolvidos
com um experimento de dois fatores.
Em resumo, a classificao de observaes com base em um nico critrio, tal como
variedade de trigo, chamada de anlise de varincia de um s fator, enquanto
que se as observaes forem classificadas de acordo com dois critrios, tal como
variedades de trigo e tipo de fertilizante, temos a chamada anlise de varincia
de dois fatores.
6.2

Anlise de Varincia de Um Fator

Como dito anteriormente, desejamos testar a hiptese:


H0 : 1 = 2 = 3 = . . . = k
H1 : pelo menos duas mdias so diferentes
Para tal, amostras aleatrias de tamanho n so selecionadas de cada uma das k
populaes. Supe-se que as k populaes so independentes e normalmente
distribudas com mdias 1 , 2 , 3 , . . . , k e com mesma varincia 2 .
Seja yij a j-sima observao na i-sima populao (i = 1, 2, . . . , k e j = 1, 2, . . . , n).
Estes dados esto representados na tabela abaixo.
Tabela de arranjos dos dados em um experimento de um fator
Populao

Total
Mdia

1
y11
y12
y13
...

2
y21
y22
y23
...

3
y31
y32
y33
...

...
...
...
...
...

i
yi1
yi2
yi3
...

...
...
...
...
...

k
yk1
yk2
yk3
...

y1n

y2n

y3n

...

yin

...

ykn

T1
y1

T2
y2

T3
y3

...
...

Ti
yi

...
...

Tk
yk

140

onde
Ti =

n
X

yij

j=1

Pn
j=1

yi =

yij

Ti e yi representam, respectivamente, o total e a mdia, de todas as observaes na


amostra da i-sima populao. Alm disto, podemos definir o total e a mdia das
n.k observaes por:
T =

k X
n
X

yij =

k
X

i=1 j=1

Pk Pn
y =

i=1

j=1

Ti

i=1

yij

nk

Pk
=

i=1

yi

Cada observao yij pode ser escrita da seguinte forma:


yij = i + ij

(6.1)

onde ij representa o desvio da observao yij da mdia populacional correspondente


i (ou seja, ij o efeito aleatrio, no controlado, da observao j da populao
i). Alm disto, supomos que os ij so v.a. independentes, de mdia zero e mesma
varincia 2 . Note que estamos supondo que as varincias residuais das diferentes
populaes so iguais, isto :
V ar(1j ) = V ar(2j ) = . . . = V ar(kj ) = 2
Esta propriedade denominada de homocedasticidade. As figuras a seguir ilustram
isto para o caso em que as mdias so diferentes (Fig. 6.1) e para o caso em que as
mdias so iguais (Fig. 6.2). Note que E(yij ) = i , e que com esta suposio de
homocedasticidade, estamos tambm supondo que as observaes possuem varincia
iguais, j que:
V ar(yij ) = V ar(i + ij ) = V ar(ij ) = 2

141

Fig. 6.1 Distribuies normais com mesma varincia ( 2 ) para todas as


populaes

Fig. 6.2 Distribuies normais com mesma mdia () para todas as populaes
Uma forma alternativa para escrever a equao (6.1) obtida substituindo-se i por
+ i , onde definida como sendo a mdia de todos os i .
Assim, podemos escrever yij como:
yij = + i + ij
sujeito restrio de que

Pk
i=1

(6.2)

i = 0. Refere-se i como sendo o efeito da

i-sima populao.
Uma forma alternativa, ento, de se expressar a hiptese nula e a hiptese
alternativa, faz uso dos i . Caso no haja efeito da i-sima populao (i=1,2, . . . ,k),
as mdias das mesmas so iguais (um tratamento no superior ao outro), e as
hipteses ficam expressas como:
H0 : 1 = 2 = 3 = . . . = k = 0
H1 : pelo menos um dos i no zero.
Nosso teste se basear na comparao de duas estimativas independentes da
varincia populacional comum, 2 . Essas estimativas sero obtidas dividindo-se a
variabilidade total dos dados em duas componentes.
A varincia de todas as observaes agrupadas em uma nica amostra de tamanho

142

n.k dado pela frmula:


s2 =

k X
n
X
(yij y )2
nk 1
i=1 j=1

O numerador de s2 chamado de soma total dos quadrados (total sum of squares)


e mede a variabilidade total dos dados. O importante demonstrar que esta soma
total de quadrados pode ser particionada em duas componentes, por meio da seguinte
identidade:
Teorema:
k X
n
k
k X
n
X
X
X
2
2
(yij y ) = n
(
yi y ) +
(yij yi )2
i=1 j=1

i=1

i=1 j=1

conveniente identificar os termos da soma total de quadrados pela seguinte


notao:
SST = soma total de quadrados =

Pk Pn

j=1 (yij

i=1

y )2

SSC = soma dos quadrados para as mdias das coluna = n


SSE = soma dos quadrados dos erros =

Pk Pn
i=1

j=1 (yij

Pk

yi
i=1 (

y )2

yi )2 .

Portanto:
SST = SSC + SSE
Muitos autores referem-se soma dos quadrados para as colunas como soma dos
quadrados dos tratamentos. Esta terminologia derivada do fato que as k diferentes
populaes so frequentemente classificadas de acordo com diferentes tratamentos.
Uma estimativa de 2 , baseada em (k 1) graus de liberdade dada por:
s21 =

SSC
k1

Se H0 for verdadeira, ser demonstrado que s21 um estimador no tendencioso de


2 . Entretanto, se H1 for verdadeira, ento s21 superestima 2 .

143

Uma segunda estimativa de 2 , baseada em k(n 1) graus de liberdade dada por:


s22 =

SSE
k(n 1)

Mostraremos que s22 sempre um estimador no tendencioso, independente de H0


ser verdadeira ou no.
Vimos tambm que a varincia dos dados agrupados, com nk 1 graus de liberdade,
:
s2 =

SST
nk 1

interessante notar que a identidade da soma dos quadarados no somente


particiona a variabilidade total dos dados, mas tambm o nmero de graus de
liberdade:
nk 1 = (k 1) + k(n 1)
Vamos encontrar agora, o valor esperado das variaes expressas pelo Teorema.
Tomando a variao dentro das colunas (SSE), temos:
k X
n
k
X
X
2
SSE =
(yij yi ) =
(n 1)
i=1 j=1

Mas

Pn

yi )
j=1 (yij
n1

Pn

yi )2
n1

j=1 (yij

i=1

representa a varincia amostral do tratamento i (s2i ), que um

estimador no tendencioso de i2 . Assim,


SSE =

k
X

(n 1)s2i

i=1

e o valor esperado ser

E(SSE) = E

k
X
(n 1)s2i

!
= (n 1)

i=1

k
X

E(s2i )

i=1

= (n 1)

k
X

i2

i=1

Entretanto, como se supe que as varincias dos k tratamentos so iguais, ento:


E(SSE) = (n 1)k 2

144

Ou seja,

E
Assim sendo, s22 =

SSE
(n1)k

SSE
(n 1)k

= E(s22 ) = 2

um estimador no tendencioso de 2 .

Vamos analisar agora o valor esperado da variabilidade entre tratamentos (SSC)


SSC = n

k
X

(
yi y ) = n

i=1

= n
= n

k
X
i=1
k
X

k
X

yi2

2n
y

i=1

yi2 2n
y

k
X

k
X
i=1

yi + nk
y2 = n

k
X

i=1

yi + n

k
X

y2

i=1

yi2 2n
y k
y + nk y2

i=1

yi2 nk y2

i=1

Portanto,

E(SSC) = E

k
X

!
yi2

nk y2

=n

i=1

k
X



E yi2 nkE y2

i=1

Como tem-se que, para qualquer v.a. X,


V ar(X) = E(X 2 ) E 2 (X) = E(X 2 ) = V ar(X) + E 2 (X)
podemos escrever que:
E(SSC) = n

k
X

V ar (
yi ) + E 2 (
yi ) nk V ar (
y ) + E 2 (
y )

i=1

Sabemos tambm, da teoria de amostragem que


V ar (
yi ) =

2
i2
=
n
n

pois i2 = 2 para i = 1, 2, . . . , k.

Temos tambm que:


E (
yi ) = i = + i

145

V ar (
y ) =

2
nk

E (
y ) =
Ento
k 2
X

2
2
E(SSC) = n
+ ( + i ) nk
+
n
nk
i=1

k 2
X

2
2
= n
+ + 2i + i 2 nk2
n
i=1
2

= k + nk + 2n

k
X

i + n

i=1

= 2 (k 1) + n

k
X

k
X

i2 2 nk2

i=1

i2

i=1

Assim,

SSC
k1

Ou seja, temos que s21 =

SSC
k1

= E(s21 ) = 2 + n(k 1)

k
X

i2

i=1

ser um estimador tendencioso de 2 , superestimando

2 , a no ser que a hiptese nula seja verdadeira, isto , se todos os i = 0.


Resumindo, s21 um estimador tendencioso de 2 se H0 no for verdadeira, e s22 um
estimador no tendencioso de 2 independentemente de H0 ser ou no verdadeira.
Se H0 for verdadeira, a razo
s21
f= 2
s2
possui uma distribuio F com (k 1) e k(n 1) graus de liberdade. Uma vez que
s21 superestima quando H0 falsa, teremos um teste unilateral com a regio crtica
interamente na cauda direita da distribuio. A hiptese nula rejeitada ao nvel de
significncia quando
f > F,(k1),k(n1)

146

Em geral, calcula-se SST e SSC primeiro e da, fazendo uso da identidade da soma
dos quadrados obtem-se SSE = SST - SSC.
As frmulas definidas anteriormente para o cmputo de SST e SSC no so as mais
simples para se utilizar. Frmulas alternativas preferenciais elas so:
SST =

k X
n
X

yij2

i=1 j=1

Pk
SSC =

i=1

147

Ti2

T2
nk

T2
nk

Os clculos para um problema de anlise de varincia de um fator so geralmente


sumarizados em forma de uma tabela, chamada Tabela ANOVA, como mostrado
abaixo:
TABELA ANOVA
Fonte

Soma dos

Graus de

Quadrados

de Variao

Quadrados

Liberdade

Mdios

Tratamento

SSC

k1

Resduo

SSE

k(n 1)

Total

SST

nk 1

s21 =
s22 =

f calculado

SSC
k1

SSE
k(n1)

f=

s21
s22

Exemplo:
Os dados da tabela abaixo representam 5 amostras, cada uma de tamanho n=5,
tiradas de distribuies normais independentes com mdias 1 , 2 , 3 , 4 , 5 e
varincia comum 2 . Testar a hiptese de que as mdias so iguais, ao nvel de
significncia de 5%.

Total
Mdia

Populao
C

5
4
8
6

9
7
8
6

3
5
2
3

2
3
4
1

7
6
9
4

26
5,2

39
7,8

20
4,0

14
2,8

33
6,6

Soluo:
Deseja-se testar a hiptese:
H0 : 1 = 2 = 3 = 4 = 5
H1 : pelo menos duas mdias so diferentes

148

132
5,28

Tem-se que:
SST =

k X
n
X

yij2

i=1 j=1

T2
nk

= 5 2 + 4 2 + . . . + 42 + 72

1322
25

= 834 696, 96 = 137, 040


Pk

(6.3)
Ti2

T2
n
nk
262 + 392 + 202 + 142 + 332 1322
=

5
25
= 776, 400 696, 960 = 79, 440
i=1

SSC =

(6.4)
SSE = SST SSC = 37, 040 79, 470 = 57, 600
A Tabela ANOVA dada por:
Fonte
de Variao

Soma dos
Quadrados

Graus de
Liberdade

Quadrados
Mdios

Tratamento

79,440

19,860

Resduo
Total

57,600
137,040

20
24

3,880

f calculado

6,90

A regio crtica dada por f > F0,05,4,20 = 2, 87


Portanto, rejeita-se H0 e conclui-se que as amostras provm de diferentes populaes.
Observao:
Quando os tamanhos de amostras so diferentes, isto , quando se tem k amostras
P
aleatrias com tamanhos n1 , n2 , . . . , nk , respectivamente e N = ki=1 ni , as frmulas
computacionais para SST e SSC so dadas por:
SST =

k X
n
X

yij2

i=1 j=1

SSC =

k
X
T2
i

i=1

ni

T2
N

T2
N

O valor de SSE encontrado por subtrao. Os graus de liberdade so particionados


da mesma maneira: N 1 g.l. para SST, k 1 para SSC e N k para SSE.

149

6.3

Teste para Igualdade de Vrias Varincias

Como a anlise de varincia supe que as varincias das populaes so iguais


(suposio de homocedasticidade) pode-se, antes de efetuar o teste de igualdade
de mdias, testar a hiptese:
H0 : 12 = 22 = 32 = . . . = k2
H1 : as varincias no so todas iguais
Um dos testes mais utilizados o teste de Bartlett, baseado em uma estatstica cuja
distribuio amostral aproximadamente 2 quando as k amostras aleatrias so
retiradas de populaes nomais independentes.
Primeiro calcula-se as k varincias amostrais, s21 , s22 , s23 , . . . , s2k das amostras de
Pk
tamanho n1 , n2 , n3 , . . . , nk , com
i=1 ni = N . Depois disto combinam-se as
varincias amostrais para fornecer a estimativa:
Pk
s2p

1)s2i
N k

i=1 (ni

Calcula-se tambm
b = 2, 3026

q
h

onde
q = (N

k) log s2p

k
X

(ni 1) log s2i


i=1

" k
#
X 1
1
1
h=1+

3(k 1) i=1 ni 1 N k
b um valor da varivel aleatria B que possui uma distribuio 2 com k 1 graus
de liberdade. A quantidade q ser grande quando as varincias amostrais diferem
significativamente, e ser igual a zero quando todas as varincias amostrais forem
iguais. Assim, rejeita-se H0 ao nvel de significncia quando
b > 2,k1

150

Exemplo:
Use o teste de Bartlett para testar a hiptese de que as varincias das trs populaes
abaixo so iguais:

A
4

Total

Amostra
B
5

C
8

7
6
6

1
3
5
3
4

6
8
9
5

23

21

36

80

Soluo:
Deseja-se testar a hiptese:
H0 : 12 = 22 = 32
H1 : as varincias no so iguais
Tem-se que:

n1 = 4, n2 = 6, n3 = 5, N = 15, k = 3.
s21 = 1, 583;

s22 = 2, 300;

s23 = 2, 700

Assim,
s2p =

3(1, 583) + 5(2, 300) + 4(2, 700)


= 2, 254.
12
(6.5)

q = 12 log 2, 254 (3 log 1, 583 + 5 log 2, 300 + 4 log 2, 700)


= 12(0, 3530) (3(0, 1995) + 5(0, 3617) + 4(0, 4314)) = 0, 1034

1 1 1 1
1
h = 1+
+ +
= 1, 1167
6 3 5 4 12
(6.6)
b =

(2, 3026)(0, 1034)


= 0, 213
1, 1167

Ao nvel de significncia de 0,05, regio crtica dada por B > 5, 991.


Portanto, aceita-se H0 e conclui-se que as varincias das trs populaes so iguais.

151

6.4

Anlise de Varincia de Dois Fatores

A anlise de varincia de dois fatores trata de problemas onde se investiga o efeito de


dois fatores. Analogamente anlise de varincia de um fator, fazemos as suposies
de independncia, normalidade e homocedasticidade das populaes.
Sob a suposio de aditividade dos efeitos dos fatores, isto , supondo que cada
mdia ij pode ser obtida pela adio dos respectivos efeitos dos fatores A e B
mdia global , o modelo para a anlise de dois fatores se torna:
ij = + i + j

(6.7)

onde i se refere ao nvel do fator A (i = 1, . . . , r), j se refere ao nvel do fator B


P
P
(j = 1, . . . , c), sujeito s restries de que ri=1 i = 0 e cj=1 j = 0. Refere-se
i como sendo o efeito do i-simo nvel do fator A, e j como sendo o efeito
do j-simo nvel do fator B.
Quando as mdias de todos os tratamentos pode ser decomposta na forma da
expresso (6.7), dizemos que os fatores no interagem, ou que no existe
interao entre os fatores. O caso em que se supe interao entre os fatores
visto na prxima seo.
Assim como no caso da anlise de varincia de um fator, onde a soma total
de quadrados foi particionada em componentes, pode-de tambm efetuar este
particionamento para o caso da anlise de varincia de dois fatores, obtendo-se:
r X
c
X

(yij y ) = c

i=1 j=1

r
X

c
r X
c
X
X
2
(
yi y ) + r
(
yj y ) +
(yij yi yj + y )2
2

i=1

j=1

i=1 j=1

A demonstrao disto parte do princpio de que o termos esquerda da igualdade


acima pode ser escrito da seguinte forma:
r X
c
X
i=1 j=1

r X
c
X
(yij y ) =
[(
yi y ) + (
yj y ) + (yij yi yj + y )]2
2

i=1 j=1

Pela expanso desta expresso chega-se identidade da soma de quadrados. A


identidade de quadrados pode ser representada simbolicamente por:
SST = SSR + SSC + SSE

152

onde
P P
SST = ri=1 cj=1 (yij y )2 = soma total de quadrados
SSR = c
SSC = r
SSE =

Pr

yi
i=1 (

y )2 = soma dos quadrados para as mdias das linhas (rows)

Pc

yj
y )2
j=1 (

Pr
i=1

Pc

j=1 (yij

= soma dos quadrados para as mdias das colunas(columns)

yi yj + y )2 = soma dos quadrados dos erros.

Um estimador de 2 , baseado em r 1 graus de liberdade dado por:


s21 =

SSR
r1

Se no houver efeito do fator A (efeitos das linhas), isto , se


1 = 2 = . . . = r = 0
ento s21 um estimador no tendencioso de 2 . Entretanto se os efeitos das linhas
no so todos iguais a zero, SSR ter um valor numrico maior e s21 superestima 2 .
Um segundo estimador de 2 , baseado em c 1 graus de liberdade dado por:
s22 =

SSC
c1

Este estimador no tendencioso se os efeitos das colunas (fator B) forem iguais a


zero, isto , se:
1 = 2 = . . . = c = 0
Caso contrrio, SSC tambm ter um valor numrico maior e s22 superestima 2 .
Um terceiro estimador de 2 , baseado em (r 1)(c 1) graus de liberdade e
independente de s21 e s22 dado por:
s23 =

SSE
(r 1)(c 1)

Este estimador sempre no tendencioso, independente de haver ou no efeito das


linhas ou colunas.

153

Para testar a hiptese nula de que os efeitos das linhas so todos zeros, isto :
H0 : 1 = 2 = . . . = r = 0
H1 : pelo menos um dos i no zero,
calculamos a estatstica
f1 =

s21
,
s23

a qual uma v.a. possuindo uma distribuio F com (r 1) e (r 1)(c 1) g.l.,


quando H0 for verdadeira. A hiptese nula rejeitada ao nvel de significncia se
f1 > F; (r1); (r1)(c1) .
Similarmente, para testar a hiptese nula de que os efeitos das colunas so todos
zeros, isto :
H0 : 1 = 2 = . . . = r = 0
H1 : pelo menos um dos j no zero,
calculamos a estatstica
f2 =

s22
,
s23

a qual uma v.a. possuindo uma distribuio F com (c 1) e (r 1)(c 1) g.l.,


quando H0 for verdadeira. A hiptese nula rejeitada ao nvel de significncia se
f2 > F; (c1); (r1)(c1) .
Para efetuar os clculos de uma anlise de varincia, em geral calculamos SST, SSR
e SSC, e obtemos SSE por subtrao:
SSE = SST - SSR - SSC
interessante observar que os graus de liberdade tambm so particionados,
fornecendo:
(r 1)(c 1) = (rc 1) (r 1) (c 1).

154

Frmulas alternativas para as quantidades SST, SSR e SSC so:


SST =

r X
c
X

T2
rc

yij2

i=1 j=1

Pr

Ti2

T2
Pc c 2 rc
T2
j=1 Tj
SSC =

r
rc
SSR =

i=1

Os clculos para um problema de anlise de varincia de dois fatores, com apenas


uma observao por cela so geralmente sumarizados em forma de uma tabela,
chamada Tabela ANOVA, como mostrado abaixo:
TABELA ANOVA
Fonte

Soma dos

Graus de

Quadrados

de Variao

Quadrados

Liberdade

Mdios

Devido s
linhas

SSR

r1

s21 =

SSR
r1

f1 =

s21
s23

Devido s
colunas

SSC

c1

s22 =

SSC
c1

f2 =

s22
s23

Erro

SSE

(r 1)(c 1)

Total

SST

rc 1

s23 =

f calculado

SSE
(r1)(c1)

Exemplo:
A tabela abaixo apresenta os resultados da safra mdia de trigo, para trs variedades
0
de trigo e quatro tipos de fertilizantes. Teste a hiptese H0 de que no h diferena
na safra mdia de trigo quando diferentes tipos de fertilizantes so utilizados. Teste
00

tambm a hiptese H0 de que no h diferena na safra mdia de trigo quando


diferentes variedades de trigo so utilizadas.
Variedades de Trigo
Fertilizante

V1

V2

V3

Total

F1
F2
F3
F4

64
55
59
58

72
57
66
57

74
47
58
53

210
159
183
168

Total

236

252

232

720

155

Soluo: Para testar se os fertilizantes tm efeitos diferentes sobre a safra mdia de


trigo, precisa-se testar a hiptese de que:
0

H0 : 1 = 2 = 3 = 4 = 0
0

H1 : pelo menos um dos i no zero,


Para testar se as variedades de trigo tm efeitos diferentes sobre a safra mdia,
precisa-se testar a hiptese de que:
00

: 1 = 2 = 3 = 0

00

: pelo menos um dos j no zero,

H0

H1

Os clculos da soma de quadrados so:


r X
c
X

SST =

yij2

i=1 j=1

Pr

T2
7202
= 642 + 552 + . . . + 532
= 662
rc
12

Ti2

T2
2102 + 1592 + 1832 + 1682 7202

= 498
SSR =
3
12
Pc c 2 rc
T2
2362 + 2522 + 2322 7202
j=1 Tj
SSC =
=

= 56
r
rc
4
12
SSE = 662 498 56 = 108
i=1

TABELA ANOVA
Fonte
de Variao

Soma dos
Quadrados

Graus de
Liberdade

Quadrados
Mdios

f calculado

Fertilizantes

498

166

9,22

Var. de trigo
Erro
Total

56
108
662

2
6
11

28
18

1,56

00

As regies crticas para H0 f1 > 4, 76 e para H0 f2 > 5, 14.


Portanto, conclumos que:
0

1. rejeitamos H0 e conclumos que h diferena na safra mdia de trigo quando


diferentes tipos de fertilizantes so utilizados.
00

2. aceitamos H0 e conclumos que no h diferena na safra mdia das trs variedades


de trigo.

156

6.5

Anlise de Varincia de Dois Fatores - Vrias observaes por cela

Na seo anterior foi suposto que os efeitos das linhas e colunas eram aditivos. Isto
equivalente a dizer que
ij ij 0 = i0 j i0 j 0
ou
ij i0 j = ij 0 i0 j 0
0

para qualquer valor i, i , j, j . Isto , a diferena entre as mdias populacionais das


0

colunas j e j a mesma para cada linha e a diferena entre as mdias populacionais


0

para as linhas colunas i e i a mesma para cada coluna. Referindo-se tabela do


exemplo anterior, isto implica que se a variedade V2 produz em mdia 5 toneladas
de trigo por acre a mais que a variedade V1 quando o fertilizante F1 usado, ento
V2 produzir em mdia 5 toneladas a mais que V1 se os fertilizants F2 , F3 ou F4
forem usados. Da mesma forma, se V1 produz em mdia 3 toneladas a mais por
acre, quando o fertilizante F4 utilizado ao invs de F2 , ento V2 ou V3 produziro
em mdia 3 toneladas a mais por acre usando o fertilizante F4 ao invs de F2 . Isto
exemplificado nas Figuras 6.3 e 6.4 abaixo, quando notamos que as curvas so
paralelas.

Fig. 6.3 Efeitos de fertilizantes e variedades de trigo, sem interao

157

Fig. 6.4 Efeitos de fertilizantes e variedades de trigo, sem interao

Em muitos experimentos, a hiptese de aditividade no vlida e ananlise


feita anteriormente nos levar aconcluses errneas. Suponha, por exemplo, que a
variedade V2 produza em mdia, 5 toneladas a mais de trigo por acre do que a
variedade V1 quando F1 , mas produza uma mdia de 2 toneladas por acre menos
que V1 quando F2 utilizado. As variedades de trigo e os tipos de fertilizantes so
ditos a interagir.
Obviamente, quando analisamos os dados de uma tabela, os grficos no so
perfeitamente paralelos. Isto pode ser devido a uma interao real, ou pode
ser simplesmente ao erro experimental. A anlise do exemplo anterior partiu do
pressuposto de que era simplesmente devido ao erro experimental.
Para testar as diferenas entre as mdias das linhas e colunas quando a interao
um fator importante, consideramos a variao de medidas tomadas sob situaes
semelhantes, ou seja consideramos a replicaes dos experimentos.
Para apresentar as frmulas gerais para a anlise de varincia usando observaes
repetidas (ou vrias observaes por cela), vamos considerar o caso de n replicaes.
Como antes, consoderaremos uma matriz regular consistindo de r linhas e c colunas.
Assim teremos rc celas, mas agora cada cela possui n observaes. Denotamos a
k-sima observao da i-sima linha na j-sima coluna por yijk . Isto exemplificado
na tabela abaixo:

158

Tabela dos dados em um experimento com dois fatores, e replicaes


Linhas

Colunas

r
Total

...

y111

y121

...

y1c1

y112
..
.

y122
..
.

...
..
.

y1c2
..
.

y11n

y12n

...

y1cn

...
...

...
...

...
...

...
...

...

...

...

...

yr11
yr12
..
.

yr21
yr22
..
.

...
...
..
.

yrc1
yrc2
..
.

yr1n

yr2n

...

yrcn

T1

T2

...

Tr

Total

Mdia

T1

y1

Tr

yr

As observaes na cela (i, j) constituem uma amostra aleatria de tamnho n de uma


populao que se supe ser normalmente distribuda com mdia ij e varincia 2 .
Supe-se tambm que todas as rc populaes possuem a mesma varincia 2 . A
seguinte notao utilizada:
Tij =

n
X

yijk

(soma das observaes na cela (i, j))

yijk

(soma das observaes na i-sima linha)

k=1

Ti =

c X
n
X
j=1 k=1

Tj =

r X
n
X

yijk

(soma das observaes na j-sima coluna)

i=1 k=1

T =

r X
c X
n
X

yijk

(soma de todas as rcn)

i=1 j=1 k=1

159

Pn

Pn

j=1

k=1

yijk

cn
Pr

Pn

i=1

yj =

yijk

k=1

rn
PP

yj =

rn

Pr
y =

i=1

Tij
n

Pc
yi =

yijk

k=1

yij =

Ti
cn

(mdia das observaes na i-sima linha)

Tj
rn

Tj
rn

Pc

(mdia das observaes na cela (i, j))

(mdia das observaes na j-sima coluna)

(mdia das observaes na j-sima coluna)


Pn

j=1

k=1

yijk

rcn

T
rcn

(mdia de todas as rcn)

Cada observao yijk pode ser escrita da seguinte forma:


yijk = ij + ijk

(6.8)

onde ijk representa o desvio da observao yijk da mdia populacional


correspondente ij . Alm disto, supomos que os ij so v.a. independentes, de mdia
zero e mesma varincia 2 .
Se denotarmos por ij o efeito de interao da i-sima linha e j-sima coluna, por i
o efeito da i-sima linha, por j o efeito da j-sima coluna, e por a mdia global,
podemos escrever:
ij = + i + j + ij
e ento,
yijk = + i + j + ij + ijk
no qual impomos as seguintes restries:
r
X
i=1

i = 0;

c
X
j=1

j = 0;

r
X
i=1

160

ij = 0;

c
X
j=1

ij = 0;

As trs hipteses a serem testadas so:


H0 : 1 = 2 = . . . = r = 0
H1 : pelo menos um dos i no zero.

H0 : 1 = 2 = . . . = c = 0
0

H1 : pelo menos um dos j no zero.

00

: 11 = 12 = . . . = rc = 0

00

: pelo menos um dos ij no zero.

H0
H1

6.5.1

Identidade da Soma de Quadrados

Neste caso, a soma de quadrados pode ser particionada da seguinte maneira:


r X
c
X

(yijk y )

= cn

i=1 j=1

r
X

c
X
(
yi y ) + rn
(
yj y )2 +
2

i=1

+ n

r X
c
X

j=1
2

(
yij yi yj + y ) +

i=1 j=1

r X
c X
n
X

(yijk yij )2

i=1 j=1 k=1

Simbolicamente podemos escrever esta identidade como:


SST = SSR + SSC + SS(RC) + SSE
onde
r
X
(
yi y )2 = soma de quadrados das mdias das linhas
SSR = cn
i=1
c
X
SSC = rn
(
yj y )2 = soma de quadrados das mdias das colunas
j=1
r X
c
X
SS(RC) = n
(
yij yi yj + y )2 = soma de quadrados para a interao
i=1 j=1

de linhas e colunas
r X
c X
n
X
SSE =
(yijk yij )2 = soma de quadrados dos erros
i=1 j=1 k=1

161

Os graus de liberdade so particionados segundo a relao:


rcn 1 = (r 1) + (c 1) + (r 1)(c 1) + rc(n 1)
Da mesma forma que antes, atravs da diviso das somas de quadrados pelos graus de
liberdade correspondentes obtm-se quatro estimativas independentes de 2 , todas
0

00

no tendenciosas desde que as hipteses H0 , H0 , e H0 sejam verdadeiras.


Estas estimativas so:
s21 =

SSR
;
r1

s22 =

SSC
;
c1

s23 =

SS(RC)
;
(r 1)(c 1)

s24 =

SSE
.
rc(n 1)

00

Para testar as hipteses H0 , H0 , e H0 calculam-se as seguintes razes:


f1 =

s21
para H0 ;
s24

f2 =

s22
0
para H0 ;
2
s4

f3 =

s23
00
para H0 ;
2
s4

e comparam-se com os respectivos valores de uma distribuio F, isto :


rejeita-se H0 se f1 > F; (r1); rc(n1)

rejeita-se H0 se f2 > F; (c1); rc(n1)

00

rejeita-se H0 se f3 > F; (r1)(c1); rc(n1)


OBS: Frmulas alternativas para as quantidades SST, SSR e SSC so:
SST =

r X
c X
n
X

2
yijk

i=1 j=1 k=1


2
i=1 Ti

T2
rcn

Pr

T2
rcn
Pccn 2
T
T2
j=1 j

SSC =
PrrnPc rcn
Pc
Pr
2
2
2
T2
j=1 Tij
i=1
j=1 Tj
i=1 Ti
SS(RC) =

+
n
cn
rn
rcn
SSE = SST SSR SSC SS(RC)
SSR =

Os clculos para um problema de anlise de varincia com vrias observaes por

162

cela podem ser resumidos em uma tabela ANOVA, da seguinte maneira:


TABELA ANOVA
Fonte
de Variao

Soma dos
Quadrados

Graus de
Liberdade

Quadrados
Mdios

Devido s
linhas

SSR

r1

s21 =

SSR
r1

f1 =

s21
s24

Devido s
colunas

SSC

c1

s22 =

SSC
c1

f2 =

s22
s24

Devido
interao
Erro

SS(RC)

(r 1)(c 1)

SS(RC)
(r1)(c1)

f3 =

s23
s24

SSE

rc(n 1)

Total

SST

rcn 1

s23 =

s24 =

f calculado

SSE
rc(n1)

Exemplo:
Utilizando os dados a seguir, teste as hipteses abaixo, utilizando nvel de
significncia de 5%:
Exemplo:

Fertilizantes
V1

Variedades de Trigo
V2

V3

64
66

72
81

74
51

70

64

65

F2

65
63
58

57
43
52

47
58
67

F3

59
68

66
71

58
39

65

59

42

58
41
46

57
61
53

53
59
38

F1

F4

Soluo:

163

As trs hipteses a serem testadas so:


H0 : 1 = 2 = 3 = 3 = 0
H1 : pelo menos um dos i no zero.

H0 : 1 = 2 = 3 = 0
0

H1 : pelo menos um dos j no zero.

00

: 11 = 12 = . . . = 43 = 0

00

: pelo menos um dos ij no zero.

H0
H1

Pelos dados da Tabela, podemos construir o resumo abaixo, contendo os totais:


Fertilizantes

Variedades de Trigo
V1

V2

V3

Total

F1

200

217

190

607

F2

186

152

172

510

F3

192

196

139

527

F4

145

171

150

466

Total

723

736

651

2110

21102
SST = 64 + 66 + . . . + 38
= 3779
36
2

SSR =

6072 + 5102 + 5272 + 4662 21102

= 1157
9
36

SSC =

SS(RC) =

7232 + 7362 + 6512 21102

= 350
12
36

2002 + 1862 + . . . + 1502


124826 124019 123669 = 771
3
SSE = 3779 1157 350 771 = 1501

164

Estes resultados so resumidos na tabela ANOVA:


TABELA ANOVA
Fonte
de Variao

Soma dos
Quadrados

Graus de
Liberdade

Quadrados
Mdios

f calculado

Devido aos
fertilizantes

1157

385,67

6,17

Devido s
variedades de
trigo
Devido
interao

350

175,00

2,80

771

128,50

2,05

Erro

1501

24

62,54

Total

3779

35

Os procedimentos dos testes so dados por:

rejeita-se H0 se f1 > F0,05; 3; 24 = 3, 01

rejeita-se H0 se f2 > F0,05; 2; 24 = 3, 40

00

rejeita-se H0 se f3 > F0,05; 6; 24 = 2, 51.


Portanto, a concluso :
a) rejeitar H0 e concluir que existe uma diferena na safra mdia de trigo
quando diferentes tipos de fertilizantes so utilizados.
0

b) aceitar H0 e concluir que no h diferena entre as diferentes variedades


de trigo.
00

c) aceitar H0 e concluir que no h interao entre as diferentes variedades


de trigo e os diferentes tipos de fertilizantes.

165

Você também pode gostar